Et forhåndskomponert tegn eller sammensatt tegn eller nedbrytbart tegn er en Unicode- enhet som også kan defineres som en kombinasjon av mer enn to tegn. Et forhåndskomponert tegn kan typisk representere en bokstav med en aksent , for eksempel é (bokstav e med akutt aksent ). Teknisk er é (U + 00E9) et tegn som kan spaltes til dets unicode-ekvivalent basert på bokstaven e (U + 0065) og tegnet som kombinerer (in) akutt aksent (U + 0301). Likeledes ligaturer er precompositions av bokstaver eller grafemer som utgjør dem.
De forhåndskomponerte tegnene er en palliativ for representasjon av spesifikke tegn ved systemer og programvare uten komposisjonsmekanismer. I Unicode fortsetter de å tillate bruk av disse tegnene på programvare som delvis støtter Unicode.
Følgende eksempler er basert på etternavnet Åström - vanlig på svensk - som kan skrives med en av disse to konvensjonene. Her blir forhåndssammensatt tegnene er Å (U + 00C5) og ø (U + 00F6), og oppdelinger er A (U + 0,041) med sjef sirkel (U + 030A) og o (U + 006F) med umlaut (U + 0308). For å illustrere forskjellen vises de forhåndskomponerte tegnene her i grønt og de dekomponerte tegnene i svart. Avhengig av nettleser kan nedbrutte aksenter virke oransje eller svart.
Med unntak av fargene, er de to løsningene likeverdige og skal vises identisk. I praksis har imidlertid noen Unicode-implementeringer problemer med å håndtere dekomponerte tegn. I verste fall vises diakritikerne ikke eller vises ikke ordentlig.
Følgende eksempel viser gjenoppbyggingen av det indiskeuropeiske av det franske ordet hund :
I noen situasjoner kan de grønne forhåndskomponerte bokstavene k , u og o med aksent vises som andre tegn , eller deres typografiske utseende kan være veldig forskjellig fra den siste bokstaven n uten diakritiske skrifter. I den andre linjen skal bokstavene i det minste vises riktig selv om de kombinerende diakritikkene ikke blir håndtert riktig.