Učení s učitelem

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Učení s učitelem je metoda strojového učení pro učení funkce z trénovacích dat.

Trénovací data sestávají ze dvojic vstupních objektů (typicky vektorů příznaků) a požadovaného výstupu. Výstup funkce může být spojitá hodnota (při regresi) anebo může předpovídat označení třídy vstupního objektu (při klasifikaci). Úloha algoritmu učení je předpovídat výstupní hodnotu funkce pro každý platný vstupní objekt poté, co zpracuje trénovací příklady (tj. dvojice vstup a požadovaný výstup). Aby to dokázal, musí algoritmus zobecnit prezentovaná data na nové situace (vstupy) "smysluplným" způsobem (viz induktivní bias). (Porovnejte s učením bez učitele). Analogická úloha v lidské a zvířecí psychologii se často nazývá učení konceptů.

Přeučení[editovat | editovat zdroj]

Přeučení (overfitting) je stav, kdy je systém příliš přizpůsoben množině trénovacích dat, ale nemá schopnost generalizace a selhává na testovací (validační) množině dat. To se může stát např. při malém rozsahu trénovací množiny nebo pokud je systém příliš komplexní (např. příliš mnoho skrytých neuronů v neuronové síti. Řešením je zvětšení trénovací množiny, snížení složitosti systému nebo různé techniky regularizace jako je zavedení náhodného šumu (což v zásadě odpovídá rozšíření trénovací množiny), zavedení omezení na parametry systému, které v důsledku snižuje složitost popisu naučené funkce, nebo předčasné ukončení (průběžné testování na validační množině a konec učení ve chvíli, kdy se chyba na této množině dostane do svého minima).

Vstupní data[editovat | editovat zdroj]

Při učení se používají trénovací data (nebo trénovací množina), testovací data a často validační data. Tyto množiny mají být disjunktní.

Postup[editovat | editovat zdroj]

Pomocí trénovacích dat se naučí jeden nebo několik klasifikátorů, případně podle chování na validačních datech se z nich vybere nebo zkombinuje výsledný klasifikátor a jeho chování na testovací množině určuje, spíš odhaduje/aproximuje, celkovou úspěšnost přístupu a chování na nových, neznámých datech.

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Supervised learning na anglické Wikipedii.