Home

About

Advanced Search

Browse by Discipline

Scientific Societies

E-print Alerts

Add E-prints

E-print Network
FAQHELPSITE MAPCONTACT US


  Advanced Search  

 
3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-18(43) Unicode: einheitliches Codierungsschema fr alle Zeichen aller Sprachen
 

Summary: 3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-18(43)
· Unicode: einheitliches Codierungsschema für alle Zeichen aller Sprachen
­ 16-bit-Codierung erlaubt zunächst 65 536 verschiedene Zeichen (,,Ebene 0"):
* 000016­007F16: entsprechen dem 7-bit ASCII-Code
* 008016­00FF16: entsprechen der ,,latin-1"-Erweiterung
* 037016­03FF16: griechisch: 03B116 =
* 040016­04FF16: kyrillisch
* 059016­05FF16: hebräisch
* 30A016­30FF16: Katakana (japanisch)
* . . . (diverse andere Sprachen)
* 220016­22FF16: Operatoren: 220516 = /0
* . . . (Symbole aus verschiedenen Bereichen etc.)
3 Grundlagen der Darstellung und Verarbeitung von Information 3.2 Codes 3-19(44)
­ Noch mehr Zeichen darstellbar, indem man
* entweder direkt 32-bit-Codierung für jedes Zeichen verwendet (,,UTF-32"),
z. B. 0001033016 = (gotischer Buchstabe ,,ahsa")
* einige der 16-bit-Codes reserviert, um damit auf weitere 16-bit-,,Ebenen" umzuschalten,
z. B. ,,ahsa" = D80016 (Umschalten auf ,,Supplementary Multilingual Plane"), gefolgt von
DF3016 (Position innerhalb der Ebene)
­ Derzeit sind ca. 100 000 Codes belegt: www.unicode.org.

  

Source: Arndt, Holger - Fachgruppe Mathematik, Fachbereich Mathematik-Naturwissenschaften, Bergische Universität Wuppertal

 

Collections: Computer Technologies and Information Sciences