| | |
Summary: 3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-17(42)
3.2.2 Codierung von Buchstaben und Sonderzeichen
Verbreitete Standards
· ASCII-Code; vgl. Bsp. 3.9, 3.
Problem: 7-Bit-Beschränkung lässt nur Codierung von 128 verschiedenen Zeichen zu
Zeichen vieler Sprachen (ä, à, , , . . . ) und viele Sonderzeichen (§, £, ©, . . . ) nicht dar-
stellbar
Abhilfe: (regional spezifische) 8-bit-Erweiterungen enthalten den 7-Bit-ASCII-Code (mit führendem
Bit 0) und zusätzlich Sonderzeichen und Buchstaben
westeuropäischer Länder (ä, à, £, §, . . . ): ISO-8859-1 (,,latin-1")
osteuropäischer Länder (c, a, . . . ): ISO-8859-2 (,,latin-2")
des griechischen Alphabets (, , . . . ): ISO-8859-7 (,,greek")
des hebräischen und jiddischen Alphabets (, . . . ): ISO-8859-8 (,,hebrew")
westeuropäischer Länder inkl. Euro (ä, à, £, §, C, . . . ): ISO-8859-15 (,,latin-9")
. . .
Problem: Zeichenvorräte nicht problemlos zusammen verwendbar
3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-18(43)
· Unicode: einheitliches Codierungsschema für alle Zeichen aller Sprachen
16-bit-Codierung erlaubt zunächst 65 536 verschiedene Zeichen (,,Ebene 0"):
* 000016007F16: entsprechen dem 7-bit ASCII-Code
|