Strojové učení

Z Wikipedie, otevřené encyklopedie
Skočit na: Navigace, Hledání

Strojové učení je podoblastí umělé inteligence, zabývající se algoritmy a technikami, které umožňují počítačovému systému 'učit se'. Učením v daném kontextu rozumíme takovou změnu vnitřního stavu systému, která zefektivní schopnost přizpůsobení se změnám okolního prostředí.

Strojové učení se značně prolíná s oblastmi statistiky a dobývaní znalostí a má široké uplatnění. Jeho techniky se využívají např. v biomedicínské informatice (tzv. systémy pro podporu rozhodování), rozlišení nelegálního užití kreditních karet, rozpoznávání řeči a psaného textu, či mnohé další.


Základní rozdělení algoritmů učení[editovat | editovat zdroj]

Algoritmy strojového učení lze podle způsobu učení rozdělit do následujících kategorií:

Podle způsobu zpracování lze algoritmy rozdělit na

  • dávkové: Všechny data požadují před začátkem výpočtu.
  • inkrementální: Dokážou se "přiučit", tj. upravit model, pokud dostanou nová data, bez přepočítání celého modelu od začátku

Základní druhy úloh[editovat | editovat zdroj]

  • Klasifikace rozděluje vstupní data do dvou nebo několika tříd.
  • Regrese odhaduje číselnou hodnotu výstupu podle vstupu
  • Klastrování zařazuje objekty do skupin s podobnými vlastnostmi, typicky při učení bez učitele

Další typy úloh jsou:

  • Ranking určuje pořadí datových bodů, výsledkem je částečné nebo úplné setřídění
  • Učení strukturovaných dat. Struktura může být například sekvence, strom, graf... Aplikace jsou např. učení syntaktických stromů ve zpracování přirozeného jazyka, zarovnání sekvencí proteinů v bioinformatice, hledání vhodné molekuly reprezentované jako graf v chemoinformatice...

Podoblasti strojového učení[editovat | editovat zdroj]

Software[editovat | editovat zdroj]

RapidMiner, KNIME, Weka, ODM, Shogun toolbox, Orange, Apache Mahout a scikit-learn jsou softwarové balíky, které obsahují různé algoritmy strojového učení.

Související články[editovat | editovat zdroj]

Data mining