Overfitting

Z Wikipedie, otevřené encyklopedie
(přesměrováno z Přeučení)
Zelená čára představuje model s nadměrným přizpůsobením a černá čára představuje regulovaný model. Zelená hranice sice nejlépe kopíruje tréninková data, ale je na nich příliš závislá a na nových nezobrazených datech bude mít pravděpodobně vyšší chybovost než černá hranice.

V matematickém modelování je pojem overfitting, volně jako nadměrné přizpůsobení, označován jako „jev, který vede k vytvoření analýzy, která se velice podobností blíží nebo přesně odpovídá určitému souboru dat, a proto může selhat při přizpůsobení se dalším datům nebo může zklamat při spolehlivé předpovědi budoucích pozorování.“[1] Jinak řečeno, statistický model přesně odpovídá svým trénovacím datům, algoritmus tedy nedokáže přesně pracovat s neznámými daty, což zmaří jeho účel.[2]

Overfitted model je matematický model, který obsahuje více parametrů, než lze odůvodnit daty.[3] Podstatou overfittingu je nevědomá extrakce části zbytkové variability (tj. šumu), jako by tato variabilita představovala základní strukturu modelu.[4]

Overfitting je jakousi chybou v modelování, k níž dochází, když je funkce příliš kompatibilní s omezenou sadou datových bodů. Overfitting ukazuje křivku s vyššími a nižšími body, zatímco správně nastavený model vykazuje hladkou křivku nebo lineární regresi.[5]

Odkazy[editovat | editovat zdroj]

Reference[editovat | editovat zdroj]

V tomto článku byl použit překlad textu z článku Overfitting na anglické Wikipedii.

  1. overfitting | Definition of overfitting in English by Oxford Dictionaries. web.archive.org [online]. 2017-11-07 [cit. 2022-10-27]. Dostupné v archivu pořízeném z originálu dne 2017-11-07. 
  2. What is Overfitting? | IBM. www.ibm.com [online]. [cit. 2023-08-23]. Dostupné online. (anglicky) 
  3. The Cambridge Dictionary of Statistics - B. S. Everitt - A. Skrondal - Libro in lingua inglese - Cambridge University Press - | IBS. www.ibs.it [online]. [cit. 2022-10-27]. Dostupné online. (italsky) 
  4. BURNHAM, Kenneth P.; ANDERSON, David R.; HUYVAERT, Kathryn P. AIC model selection and multimodel inference in behavioral ecology: some background, observations, and comparisons. Behavioral Ecology and Sociobiology. 2011-01-01, roč. 65, čís. 1, s. 23–35. Dostupné online [cit. 2022-10-27]. ISSN 1432-0762. DOI 10.1007/s00265-010-1029-6. (anglicky) 
  5. TRADESMART, Tým. Co je overfitting? Trading Terminologie! [online]. 2018-09-10 [cit. 2022-10-27]. Dostupné online. 

Externí odkazy[editovat | editovat zdroj]