HyperText Markup Language

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání
{{{název}}}
HTML5 logo and wordmark
Vznikl v: 1990
Autor: Tim Berners-Lee, Robert Caillau
Vývojář: W3C, WHATWG
Poslední verze: 5.0 / 17. červen 2014
Poslední nestabilní verze: 5.1 Nightly / 17. červen 2014
Licence: copyright
Web: www.w3.org/html
.html, .htm
HTML
Přípona souboru .html, .htm
Typ internetového média text/html[1]
Type code TEXT
Rozšiřuje formát SGML
Rozšíření XHTML
Standard(y) ISO/IEC 15445, W3C HTML5
Otevřený formát? ano

HyperText Markup Language, označovaný zkratkou HTML, je značkovací jazyk pro hypertext. Je hlavním z jazyků pro vytváření stránek v systému World Wide Web, který umožňuje publikaci dokumentů na Internetu.

Jazyk je aplikací dříve vyvinutého rozsáhlého univerzálního značkovacího jazyka SGML (Standard Generalized Markup Language). Vývoj HTML byl ovlivněn vývojem webových prohlížečů, které zpětně ovlivňovaly definici jazyka.

Vývoj jazyka[editovat | editovat zdroj]

V roce 1989 spolupracovali Tim Berners-Lee a Robert Caillau na propojeném informačním systému pro CERN, výzkumné centrum fyziky poblíž Ženevy ve Švýcarsku. V té době se pro tvorbu dokumentů obvykle používaly jazyky TeX, PostScript a také SGML. Berners-Lee si uvědomoval, že potřebují něco jednoduššího a v roce 1990 byl tedy navržen jazyk HTML a protokol HTTP (HyperText Transfer Protocol – protokol pro přenos hypertextu). Zároveň také Tim Berners-Lee napsal první webový prohlížeč, který nazval WorldWideWeb.

V roce 1991 CERN zprovoznil svůj web. Současně organizace NCSA (National Center for Supercomputer Applications) vybídla Marca Andreessena a Erica Binu k vytvoření prohlížeče Mosaic; ten vznikl v roce 1993 ve verzích pro počítače IBM PC a Macintosh a měl obrovský úspěch. Byl to první prohlížeč s grafickým uživatelským rozhraním.

Následoval rychlý rozvoj webu, takže bylo nutné pro HTML definovat standardy.

Verze jazyka[editovat | editovat zdroj]

Verze 0.9 - 1.2
Byly vytvářeny postupně v letech 19911993. Na těchto verzích spolupracovali Tim Berners-Lee a Daniel Connolly. Nepodporují grafické rozhraní.
Původní specifikace (verze 1.1)
Původní specifikace (verze 1.2)
Verze 2.0
Byla vydána v listopadu 1995 komunitou IETF a zachycovala stav jazyka k červnu 1994[2]. Je to první verze, která zcela odpovídá syntaxi SGML. Přidává k původní specifikaci interaktivní formuláře a podporu grafiky.
Původní specifikace (verze 2.0)
Verze 3.2
Byla vydána 14. ledna 1997 komunitou W3C a zachycovala stav jazyka k počátku roku 1996[3]. Tato verze přidává k jazyku tabulky, zarovnávání textu a stylové prvky pro ovlivňování vzhledu. Původně připravovaná verze HTML 3.0 nebyla nikdy přijata jako standard, protože byla příliš složitá a žádná firma nebyla schopna naprogramovat její podporu[4].
Původní specifikace (verze 3.2)
Verze 4.0
Byla vydána 18. prosince 1997 komunitou W3C[5]. Do specifikace jazyka přibyly nové prvky pro tvorbu tabulek, formulářů a nově byly standardizovány rámy (frames). Tato verze se snaží dosáhnout původního účelu – prvky by měly vyznačovat význam (sémantiku) jednotlivých částí dokumentu, vzhled je ovlivňován připojovanými styly. Některé prezentační prvky byly zavrženy[6].
Původní specifikace (verze 4.0)
Zrevidovaná specifikace
Verze 4.01
Byla vydána 24. prosince 1999 komunitou W3C[7]. Tato verze opravuje některé chyby verze předchozí[8]. Podle původního předpokladu se mělo jednat o poslední verzi, po které by se přešlo na XHTML – následníkovi HTML, využívajícímu univerzální jazyk XML.
Původní specifikace (verze 4.01)
Pozastavení vývoje
Některým lidem se však vývoj okolo XHTML nezamlouval. Část z nich včetně některých tvůrců webových prohlížečů, jako například Mozilla Foundation, Opera Software či Apple, založila iniciativu WHATWG, jejíž cílem bylo připravit specifikace pro novou verzi HTML tak, aby je bylo možné schválit přímo W3C. 7. března 2007 nakonec W3C založilo novou pracovní skupinu HTML Working Group[9], jejímž cílem bylo v roce 2010 uvolnit specifikaci nové verze HTML. Po hlasování bylo určeno, že nová verze ponese označení „HTML5“ a že bude založena na specifikacích Web Applications 1.0 a Web Forms 2.0 z iniciativy WHATWG, které budou dále upravovány[10]. Skupinu pro XHTML 2.0 a XForms, které byly původně považovány za jediný budoucí směr vývoje, tedy 17. prosince 2010 W3C definitivně rozpustila[11].
Verze 5.0 (aktuální)
Bude vydána v posledním čtvrtletí roku 2014 pracovní skupinou HTML Working Group komunity W3C[12]. Od 17. června 2014 je specifikace ve fázi „Last Call Working Draft“ (vývojáři webových aplikací ji již mohou využívat, závěrečná fáze vývoje se již příliš lišit od aktuálního stavu nebude)[13]. Tato verze ukončuje závislost HTML na SGML opravuje mnoho chyb předešlé verze, vyřazuje mnoho zastaralých a již nepoužívaných prvků a přidává nové sémantické prvky[14].
Aktuální specifikace (verze 5.0)
Verze 5.1, 5.2
Podle „Plánu 2014“, uvedeného HTML Working Group 20. září 2012[15], budou nové verze vydávány zhruba ve dvouletých cyklech. Verze 5.1[16] bychom se tedy měli dočkat v posledním čtvrtletí roku 2016[12] a verze 5.2 pravděpodobně v roce 2018.
Připravovaná specifikace (verze 5.1)

Popis jazyka[editovat | editovat zdroj]

Koncepce jazyka[editovat | editovat zdroj]

Jazyk HTML je charakterizován množinou značek (tzv. tagů) a jejich vlastností (atributů) definovaných pro danou verzi. Tento zápis byl převzán ze SGML a dále upravován v závislosti na aktuálních trendech Internetu. Mezi značky se uzavírají části textu dokumentu a tím se určuje význam (sémantika) obsaženého textu. Názvy jednotlivých značek a jejich vlastností se uzavírají mezi úhlové závorky < a >. Část dokumentu tvořená otevírací značkou, nějakým obsahem a odpovídající ukončovací značkou tvoří prvek (element) dokumentu. Například <strong> je otevírací značka pro zvýraznění textu a <strong>Červená Karkulka</strong> je prvek obsahující zvýrazněný text. Součástí obsahu prvku mohou být další vnořené prvky.

Značky jsou obvykle párové, přičemž koncová značka je shodná se značkou počáteční, jen má před názvem znak lomítko. Příklad pro označení odstavce:

<p>Text odstavce</p>

Ukázka:

Text odstavce

Některé značky jsou nepárové – nemají žádný obsah a nepoužívají koncovou značku. Příklad pro vykreslení vodorovné čáry:

<hr>

Ukázka:


Značky mohou obsahovat vlastnosti, které o nich uvádějí určitou důležitou informaci. Koncové značky již vlastnosti nemají. Příkladem může být odkaz (značka <a>), jehož vlastnost href říká, kam se uživatel po kliknutí na něj dostane (v tomto příkladu na stránku http://example.com):

<a href="http://example.com">text odkazu</a>

Ke značkám je však možno přiložit i více vlastností. Můžeme si tak například vytvořit odkaz, který se otevře v novém okně/panelu:

<a href="http://example.com" target="_blank">text odkazu</a>

A nebo odkaz, který se otevře v novém okně/panelu, obsahuje titulek (zobrazí se obvykle po najetí kurzorem na daný prvek) a má přiřazenou třídu, kterou pak můžeme využít například v kaskádových stylech:

<a href="http://example.com" target="_blank" title="titulek" class="nazev_tridy">text odkazu</a>

Vzhledem k tomu, že zadávání odkazů tímto způsobem je na Wikipedii zakázané, nebude zde možné zobrazit ukázku.

Některé prohlížeče (např. Opera nebo Mozilla Firefox) dokonce umožňují „vytvářet“ vlastní značky a prvky a umožňují také jejich stylování pomocí kaskádových stylů. Tato funkce však u většiny webových prohlížečů není podporována. Jelikož se obsah neznámých prvků v prohlížečích, kde podpora této funkce chybí, zobrazí chybně a bez jakéhokoliv stylu, vlastní prvky se prakticky nepoužívají.

Dokument může mimo značkování obsahovat další prvky:

  • Direktivy – začínají znaky <!, jsou určeny pro zpracovatele dokumentu (prohlížeč).
  • Komentáře – pomocné texty pro programátora, nejsou součástí obsahu dokumentu a nezobrazují se (prohlížeč je ignoruje). Příklad komentáře je uveden níže.
  • Kód skriptovacích jazyků
  • Kaskádové styly

Struktura dokumentu[editovat | editovat zdroj]

Dokument v jazyku HTML má předepsanou strukturu[17]:

  • Doctype – úvod do dokumentu sdělující prohlížeči, že otevřel dokument HTML. Je povinný a zapisuje se <!DOCTYPE html>.
  • Kořenový element – prvek html (značky <html> a </html>) - reprezentuje celý dokument.
  • Hlavička dokumentu – prvek head (značky <head> a </head>) - obsahuje metadata, která se vztahují k celému dokumentu. Definuje např. kódování, název dokumentu, autora, popis, klíčová slova, titulek dokumentu nebo kaskádové styly.
  • Tělo dokumentu – prvek body (značky <body> a </body>) - zahrnuje vlastní obsah dokumentu[pozn. 1].

Příklad zdrojového kódu[editovat | editovat zdroj]

Příklad HTML dokumentu ve verzi 5:

<!DOCTYPE html>
<html>
 <head>
  <title>Titulek stránky</title>
 </head>
 <body>
  <h1>Nadpis stránky</h1>
  <p>Toto je <a href="http://example.com/">odkaz</a> v odstavci.</p>
  <!-- toto je komentář -->
 </body>
</html>

Druhy značek[editovat | editovat zdroj]

Značky lze z hlediska významu rozdělit na tři základní skupiny:

Strukturální značky
rozvrhují strukturu dokumentu, příkladem jsou třeba odstavce (<p>) nebo nadpisy (<h1>, <h2>). Dodávají dokumentu formu.
Popisné (sémantické) značky
popisují povahu obsahu prvku, příkladem je nadpis (<title>) nebo adresa (<address>). Současný trend je orientován právě na sémantické značky, které usnadňují automatizované zpracovávání dokumentů a vyhledávání informací v záplavě dokumentů na webu. Vyvrcholením této snahy je v současné době jazyk XML.
Stylistické značky
určují vzhled prvku při zobrazení, typickým příkladem je značka pro tučné písmo (<b>). Od tohoto druhu značek se postupně upouští, trendem je používání kaskádových stylů, které vzhled popisují odděleně od obsahu dokumentu. Mezi důvody pro neužívání těchto značek patří především to, že tyto značky jsou orientovány na prohlížení na obrazovce počítače, příliš se však nepočítá s používáním dokumentu jiným způsobem – alternativní prohlížeče pro postižené (čtečky pro slepce), v mobilních zařízeních a podobně. Kaskádové styly umožňují definovat rozdílné zobrazení pro různá zařízení.

Programy pro tvorbu HTML[editovat | editovat zdroj]

Programy pro snadnou tvorbu webových stránek se nazývají editory. Editorem HTML může být ve své podstatě jakýkoliv program pracující s textem. V praxi se však používají mnohem sofistikovanější programy.

Textové editory[editovat | editovat zdroj]

Běžný textový editor HTML zvládá barevnou syntaxi (barevně rozlišuje jednotlivé části kódu jako například HTML značky či vlastnosti a prostý text), dokáže napovídat značky, zná chytré tabulátory nebo zvládá validovat dokument podle předepsané specifikace. Takovými editory jsou například Notepad++, PSPad, Atom nebo Sublime Text.

WYSIWYG editory[editovat | editovat zdroj]

WYSIWYG je zkratka od anglického „What you see is what you get“, v překladu „Co vidíš, to dostaneš“. Editory tohoto typu pracují na opačném principu než textové editory – ve WYSIWYG editoru pracujete přímo s již hotovou stránkou a obecně neplatí, že by uživatel tohoto editoru musel znát jazyk HTML. Ve WYSIWYG editoru si může uživatel poskládat stránku, jak se mu zlíbí, a program následně vygeneruje požadovaný kód HTML. Takovými editory jsou například Adobe Dreamweaver nebo Microsoft Expression Web (novější verze Microsoft FrontPage).

Programy pro zpracování HTML[editovat | editovat zdroj]

Programy, jejichž účelem je prezentovat dokument na zobrazovacím zařízení – nejčastěji na obrazovce počítače, se nazývají webové prohlížeče.

Parsování v prohlížečích[18][editovat | editovat zdroj]

Postup zpracování HTML kódu a jeho vykreslení uživateli se nazývá parsování. Správný postup zpracování je u webových prohlížečů velice důležitý k tomu, aby se stránka uživateli vykreslila správně.

  • Dokument je nejprve prohlížečem načítán a rozkládán (tzv. syntaktická analýza) na jednotlivé prvky podle definic DTD (Document Type Definition) určujících značky a vlastnosti, které lze používat[pozn. 2].
  • Každému prvku je poté přiřazen styl (způsob zobrazení). Styly mohou být předepsány přímo programátorem ve zdrojovém kódu. Vlastnosti stylů, které nejsou předepsány, doplní prohlížeč podle implicitního stylu, který je předepsán ve specifikaci[20]. Některé prohlížeče umožňují uživateli implicitní styly definovat.
  • Na dokument je dále aplikován předepsaný kód skriptovacích jazyků. Jsou volány funkce, provedeny příkazy, je spuštěno sledování událostí, jejich volání, popřípadě provádění jejich smyčky.
  • Takto zpracovaný dokument je na závěr vykreslen uživateli. Moderní prohlížeče však podporují postupné vykreslování, díky čemuž je dokument postupně vykreslován v průběhu parsování. Uživateli se tak HTML stránka postupně rýsuje před očima.

Režimy prohlížečů[editovat | editovat zdroj]

Moderní prohlížeče pracují obecně ve dvou základních režimech[21]:

  • Standardní režim – režim snažící se dodržovat definované standardy;
  • Quirk mód – režim zaměřený na tzv. zpětnou kompatibilitu, i pokud takové chování není v souladu se standardy.

Tyto režimy chování zavedl Internet Explorer ve své páté verzi právě z důvodu zpětné kompatibility. Microsoft při vytváření nové verze prohlížeče chtěl, aby se v něm zobrazovaly správně stránky, které již existují, ale také stránky, které jsou psány podle nových standardů. To, jaký režim (a chování) prohlížeč zvolí, závisí především na uvedení direktivy <!DOCTYPE, protože většina starších stránek ji vůbec neobsahuje, popřípadě na použitých prvcích v porovnání se specifikacemi jednotlivých verzí. Později toto chování částečně převzaly další prohlížeče (např. Mozilla Firefox nebo Opera, kde však rozdíly mezi režimy nejsou natolik markantní. Existence nestandardního režimu je výsledkem vývoje, kdy si výrobci jednotlivých prohlížečů přizpůsobovali definici HTML podle svých potřeb a prohlížeče podporovaly nestandardní prvky a syntaxi. Řada těchto „vylepšení“ byla následně přejímána do standardů, některé však byly zase v dalších verzích vyřazeny.

Budoucnost HTML[editovat | editovat zdroj]

20. září 2012 HTML Working Group uveřejnila svůj záměr o prodloužení vývoje HTML minimálně do roku 2016 v tzv. Plánu 2014[12][15]. V něm si také stanovila nové cíle týkající se cyklu vydávání nových verzí HTML a milníky, jichž chce dosáhnout. Specifikace HTML5 by podle tohoto plánu měla vyjít v posledním čtvrtletí roku 2014[12]. Od 17. června 2014 je specifikace HTML5 je ve fázi „Last Call Working Draft“ (vývojáři webových aplikací ji již mohou využívat, závěrečná fáze vývoje se již příliš lišit od aktuálního stavu nebude)[13]. Během této i předešlé fáze vývoje HTML5 HTML Working Group:

  • stanoví, které prvky jsou vhodné ke splnění výstupních kritérí,2012
  • vytvoří specifikaci HTML5, která zahrnuje právě tyto vhodné prvky a která vynechává zbývající nevhodné prvky,2012
  • vytvoří návrh HTML 5.1. Nevhodné prvky z HTML5 a zamýšlené prvky mohou být v tomto návrhu začleněny.2013

... a cyklus se opakuje. HTML Working Group:

  • opět stanoví, které prvky jsou vhodné ke splnění výstupních kritérí,2014
  • vytvoří specifikaci HTML 5.1, která zahrnuje právě tyto vhodné prvky a která vynechává zbývající nevhodné prvky,2014
  • vytvoří návrh HTML 5.2. Nevhodné prvky z HTML 5.1 a zamýšlené prvky mohou být v tomto návrhu začleněny.2015

Odhaduje, že počáteční fáze návrhu HTML 5.2 by byla počátkem roku 2015.

Fáze vývoje jednotlivých verzí HTML[editovat | editovat zdroj]

(podle W3C Process Document[22][23])

Working Draft (WD nebo FPWD)
Pracovní verze dokumentu publikované ke zrevidování komunitou a veřejností během vypracovávání specifikace.
Last Call Working Draft (LC nebo LCWD)
Vydáním tohoto dokumentu pracovní skupina vyjadřuje, že považuje specifikaci za kompletní a všechny chyby za vyřešené. Tato specifikace se přesune do fáze Candidate Recommendation, jestliže se nenaleznou závažné chyby. Vyhrazená doba platnosti tohoto dokumentu je poslední šancí k nalezení chyb před přechodem k CR.
Candidate Recommendation (CR)
Dokument publikovaný k získání zkušeností pro implementaci, který již byl dostatečně upraven a splňuje technické požadavky pracovní skupiny k implementaci.
Proposed Recommendation (PR)
Vyspělá technická zpráva o provedení oprav, komplexního testování a schopnosti implementace odeslaná ke schválení.
Recommendation (REC)
Specifikace, standard nebo soubor směrnic, které byly schváleny. Je doporučeno její úplné nasazení a používání. Toto je poslední fáze vývoje, která již nesmí být nijak opravována nebo měněna.

Milníky budoucího vývoje HTML[editovat | editovat zdroj]

Plán budoucího vývoje shrnuje následující tabulka[12]:

Verze 2012 2013 2014 2015 2016
HTML 5.0 CR start …CR, LC Rec
HTML 5.1 FPWD LC + CR …CR Rec
HTML 5.2 FPWD

Poznámky[editovat | editovat zdroj]

  1. Kořenový element, hlavička a tělo dokumentu jsou povinné, ale otevírací a ukončovací značka samotná povinná není (pokud tyto značky nebudou v těle dokumentu uvedeny, prohlížeč si je sám doplní podle kontextu).
  2. Ve starších verzích HTML musel být odkaz na definici DTD pro prohlížeč uveden přímo v dokumentu[19].

Reference[editovat | editovat zdroj]

  1. HTML5 IANA considerations
  2. Hypertext Markup Language - 2.0
  3. HTML 3.2 Reference Specification
  4. HTML 3.0 Draft (Expired!) Materials
  5. HTML 4.0 Specification
  6. Changes between HTML 3.2 and HTML 4.0
  7. HTML 4.01 Specification
  8. Changes between HTML 4.0 and HTML 4.01 versions
  9. HTML Working Group
  10. W3C HTML WG: Results of HTML 5 text, editor, name questions
  11. XHTML2 Working Group (Closed) Home Page
  12. a b c d e HTML Working Group Plan 2014
  13. a b HTML5 Candidate Recommendation
  14. HTML5 Differences from HTML4
  15. a b Getting HTML5 to Recommendation in 2014
  16. HTML 5.1 Working Draft
  17. A quick introduction to HTML
  18. How browsers work
  19. HTML version information
  20. HTML: The Markup Language (an HTML language reference)
  21. DOCTYPE And Browser Modes
  22. W3C Process Document
  23. The W3C Process and CSS

Související články[editovat | editovat zdroj]

Externí odkazy[editovat | editovat zdroj]

Logo Wikimedia Commons
Wikimedia Commons nabízí obrázky, zvuky či videa k tématu