Unicode

Z Wikipedie, otevřené encyklopedie

Unicode je šestnáctibitová tabulka znaků všech existujících abeced. Jeho autorem je Unicode Consorcium. Je součástí oficiálního standardu ISO 10646. Pro češtinu je nejvhodnější jeho osmibitová reprezentace UTF-8.

Projekt Unicode začal v roce 1988 a byl dovršen v roce 1991 založením Unicode Consorcium. Od verze 97 Unicode používá pro vnitřní zápis znaků Microsoft Office; Windows od verze NT přes 2000 až po XP.

Na rozdíl od dřívějších osmibitových tabulek znaků jako je bratří Kamenických, Latin 2, Windows-1250 či ISO-8859-2 lze všechny znaky zobrazit zároveň; v jednom textu lze tedy kombinovat např. češtinu, ruštinu a řečtinu.

Některé poštovní programy jako např. Pegasus Mail 4 dosud UTF-8 nepodporují.

Tabulka českých znaků Unicode

znak HTML dec hex UTF-8 znak HTML dec hex UTF-8
Á Á &#193 Á %C3%81 á á á á %C3%A1
Č Č Č Č %C4%8C č č č č %C4%8D
Ď Ď Ď Ď %C4%8E ď ď ď ď %C4%8F
É É É É %C3%89 é é é é %C3%A9
Ě Ě Ě Ě %C4%9A ě ě ě ě %C4%9B
Í Í Í Í %C3%8D í í í í %C3%AD
Ň Ň Ň Ň %C5%87 ň ň ň ň %C5%88
Ó Ó Ó Ó %C3%93 ó ó ó ó %C3%B3
Ř Ř Ř Ř %C5%98 ř ř ř ř %C5%99
Š Š Š Š %C5%A0 š š š š %C5%A1
Ť Ť Ť Ť %C5%A4 ť ť ť ť %C5%A5
Ú Ú Ú Ú %C3%9A ú ú ú ú %C3%BA
Ů Ů Ů Ů %C5%AE ů ů ů ů %C5%AF
Ý Ý Ý Ý %C3%9D ý ý ý ý %C3%BD
Ž Ž Ž Ž %C5%BD ž ž ž ž %C5%BE

Externí odkazy