Unicode er en standard datamaskin utviklet av Unicode Consortium som mål å gi hver karakter av noe system for å skrive av språket en unik numerisk identifikator, og enhetlig måte, uavhengig av dataplattform eller programvare .
Unicode og ISO / IEC 10646-standarden gir hvert tegn et offisielt navn innenfor et felles enhetlig repertoar mellom alle språk og all bruk. Så snart det vanlige repertoaret er godkjent, blir tegn gruppert i blokker i henhold til deres bruk og støttede skript, og får en unik numerisk identifikasjon kalt et kodepunkt , vanligvis identifisert som "U + ...." (hvor "... . "representerer et heksadesimalt tall på 4 til 6 sifre, mellom U + 0000 og U + 10FFFF).
Følgende tabeller viser alle blokker av kodepunkter som er tildelt i denne planen i ISO / IEC 10646 og Unicode-standardene .
Legende om farger og stilkonvensjoner |
---|
Blokkene som vises på en lys bakgrunn er tildelt og inneholder synlige og standardiserte tegn. |
Blokker som vises på en lysegul bakgrunn, tildeles og inneholder synlige og normaliserte tegn for skriving fra høyre mot venstre (de krever toveis skrivestøtte for riktig gjengivelse. Noen av disse tegnene, men ikke alle, kan kreve speilpresentasjon i henhold til retningsforhold. ). |
Blokkene som vises på en grønn bakgrunn tildeles permanent og tildeles tegn for privat og gratis bruk, men ikke interoperable. |
Blokkene som vises på rød bakgrunn er permanent tildelt, men kodepunktene tildeles ikke tegn som kan vises (disse er spesial- eller kontrolltegn). |
Blokker som vises på grå bakgrunn er ennå ikke offisielt tildelt (i den nåværende Unicode 12.1-versjonen). Blant disse :
|
|
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 0000 | C0-kommandoer | grunnleggende latin | C1-kommandoer | latin - 1 | ||||||||||||
U + 0100 | Latin utvidet - A | Latin utvidet - B | ||||||||||||||
U + 0200 | Latin utvidet - B | internasjonalt fonetisk alfabet | modifikasjonsbokstaver med jakt | |||||||||||||
U + 0300 | diakritikere | Gresk og koptisk | ||||||||||||||
U + 0400 | Kyrillisk | |||||||||||||||
U + 0500 | Kyrillisk - supplement | Armensk |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 0500 | Hebraisk | |||||||||||||||
U + 0600 | Arabisk | |||||||||||||||
U + 0700 | Syrisk | Arabisk - supplement | thana | n'ko | ||||||||||||
U + 0800 | Samaritan | Mandean | Syrisk - supplement | - | Utvidet arabisk - A |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 0900 | devanâgarî | Bengali | ||||||||||||||
U + 0A00 | gourmoukhi | gujarati | ||||||||||||||
U + 0B00 | Oriya | tamil | ||||||||||||||
U + 0C00 | telugu | kannara | ||||||||||||||
U + 0D00 | malayalam | Singaporeansk | ||||||||||||||
U + 0E00 | Thai | lao | ||||||||||||||
U + 0F00 | tibetansk | |||||||||||||||
U + 1000 | Burmesisk | Georgisk |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 1100 | jamos hangeul | |||||||||||||||
U + 1200 | Etiopisk | |||||||||||||||
U + 1300 | Etiopisk - supplement | Cherokee | ||||||||||||||
U + 1400 U + 1500 |
Kanadiske innfødte pensum | |||||||||||||||
U + 1600 | ogam | runer |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 1700 | tagal | hanounóo | bouhid | tagbanoua | khmer | |||||||||||
U + 1800 | Mongolsk |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 1800 | pensum. utvidede innfødte kanadiere |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 1900 | limbu | Tai det | ny taï-lue | symb. Khmer | ||||||||||||
U + 1A00 | bougui | taï tham (eller lanna) | utvidede diakritikere | |||||||||||||
U + 1B00 | balinesisk | Sundanesisk | batak | |||||||||||||
U + 1C00 | lepcha | ol tchiki | cyril. og. - VS | utvidet georgisk | Sundanesisk | Vediske utvidelser |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 1D00 | fonetisk - supplement | utvidet fonetikk - supplement | diakritiske stoffer - supplement | |||||||||||||
U + 1E00 | Latin utvidet ytterligere | |||||||||||||||
U + 1F00 | utvidet gresk |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 2000 | generell tegnsetting | eksponenter og indekser | valutasymboler | Kombinatoriske tegn for symboler | ||||||||||||
U + 2100 | bokstavtype symboler | nummerskjemaer | piler | |||||||||||||
U + 2200 | matematiske symboler | |||||||||||||||
U + 2300 | forskjellige tekniske tegn | |||||||||||||||
U + 2400 | kontrollpiktogrammer | optisk gjenkjenning | sirklet alfanumerisk | |||||||||||||
U + 2500 | garn | brostein | geometriske former | |||||||||||||
U + 2600 | forskjellige symboler | |||||||||||||||
U + 2700 | kassett | diverse matematiske symboler - A | piler - supplement - A | |||||||||||||
U + 2800 | Punktskrift-kombinasjoner | |||||||||||||||
U + 2900 | piler - supplement - B | diverse matematiske symboler - B | ||||||||||||||
U + 2A00 | flere matematiske operatører | |||||||||||||||
U + 2B00 | forskjellige symboler og piler |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 2C00 | glagolitic | Latin utvidet - C | koptisk | |||||||||||||
U + 2D00 | Georgisk supplement | tifinaghe | Etiopisk utvidet | Cyrillic et. - AT | ||||||||||||
U + 2E00 | ekstra tegnsetting |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + 2E00 | sinogrammer - CJC-nøkler - tillegg | |||||||||||||||
U + 2F00 | sinogrammer - kinesiske nøkler til Kangxi | - | dsc. id. | |||||||||||||
U + 3000 | symboler og punktum. CJC | hiragana | katakana | |||||||||||||
U + 3100 | bopomofo | hangûl - kompatibilitet jamos | kanboun | utvidet bopomofo | sinogrammer - CJC-strøk | katakana - supplement | ||||||||||
U + 3200 | sirklet CJC-brev og måneder | |||||||||||||||
U + 3300 | CJC-kompatibilitetssinogrammer | |||||||||||||||
U + 3400 ... U + 4000 ... |
CJC-enhetlige sinogrammer - supplement A | |||||||||||||||
U + 4D00 | Hexagrammer av Yi Jing | |||||||||||||||
U + 4E00 ... U + 5000 ... U + 6000 ... U + 7000 ... U + 8000 ... U + 9000 ... U + 9FFF |
CJC forenet sinogrammer | |||||||||||||||
U + A000 ... |
fersk fjell yi pensum | |||||||||||||||
U + A400 | yi nøkler | lissou |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + A500 | vaï | |||||||||||||||
U + A600 | Utvidet kyrillisk - B | bamum | ||||||||||||||
U + A700 | bokstaver som endrer tonen din | Latin utvidet - D | ||||||||||||||
U + A800 | sylotî nâgrî | Indiske tallformer | phags pa | saurashtra | utvidet devanagari | |||||||||||
U + A900 | kayah li | rejang | hangul jamos - A | Javanesisk | Burmesisk utvidet - B | |||||||||||
U + AA00 | cham | Burmesisk utvidet - A | tai việt | meitei mayek utvidet | ||||||||||||
U + AB00 | Etiopisk utvidet - A | Latin utvidet - E | cherokî - supplement | meitei mayek | ||||||||||||
U + AC00 ... U + B000 ... U + C000 ... U + D000 ... |
forhåndskomponerte Hangul-stavelser | |||||||||||||||
U + D700 | utvidet hangul jamos - B |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + D800 ... |
høy indireksjon halvsone | |||||||||||||||
U + DB00 | halv-sone med høy retning for privat bruk | |||||||||||||||
U + DC00 ... U + DF00 |
lav indireksjon halvsone | |||||||||||||||
U + E000 ... U + F000 ... U + F800 |
privat bruksområde |
+00 | +10 | +20 | +30 | +40 | +50 | +60 | +70 | +80 | +90 | + A0 | + B0 | + C0 | + D0 | + E0 | + F0 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U + F900 U + FA00 |
CJC-kompatibilitetssinogrammer | |||||||||||||||
U + FB00 | enger former. alfabetisk | |||||||||||||||
U + FC00 | Arabiske presentasjonsformer - A | |||||||||||||||
U + FD00 | ikke-tegn | |||||||||||||||
U + FE00 | variantvelgere | f. nå. vertikal | halve diakritikere | CJC kompatibilitet former | små former | Arabiske presentasjonsformer - B | ||||||||||
U + FF00 | halv- og fullbreddeformer | spesialtilbud |