| | |
Summary: 3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-18(43)
· Unicode: einheitliches Codierungsschema für alle Zeichen aller Sprachen
16-bit-Codierung erlaubt zunächst 65 536 verschiedene Zeichen (,,Ebene 0"):
* 000016007F16: entsprechen dem 7-bit ASCII-Code
* 00801600FF16: entsprechen der ,,latin-1"-Erweiterung
* 03701603FF16: griechisch: 03B116 =
* 04001604FF16: kyrillisch
* 05901605FF16: hebräisch
* 30A01630FF16: Katakana (japanisch)
* . . . (diverse andere Sprachen)
* 22001622FF16: Operatoren: 220516 = /0
* . . . (Symbole aus verschiedenen Bereichen etc.)
3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-19(44)
Noch mehr Zeichen darstellbar, indem man
* entweder direkt 32-bit-Codierung für jedes Zeichen verwendet (,,UTF-32"),
z. B. 0001033016 = (gotischer Buchstabe ,,ahsa")
* einige der 16-bit-Codes reserviert, um damit auf weitere 16-bit-,,Ebenen" umzuschalten,
z. B. ,,ahsa" = D80016 (Umschalten auf ,,Supplementary Multilingual Plane"), gefolgt von
DF3016 (Position innerhalb der Ebene)
Derzeit sind ca. 100 000 Codes belegt: www.unicode.org.
|