Diskuse:Lineární regrese

Obsah stránky není podporován v jiných jazycích.
Přidat téma
Z Wikipedie, otevřené encyklopedie
Poslední komentář: před 8 lety od uživatele Hynas v tématu „Heteroskedascita vs. homoskedascita

Poděkování uživateli Jx[editovat zdroj]

Lineární regrese je jednou ze základních metod používaných v technické praxi. Tento článek ji definuje jednoduše, přehledně a matematicky srozumitelně i pro obyčejného absolventa techniky, není to pouhá akademická abstrakce, ale solidní kuchařka, pomocí které se dá leccos vypočítat. Jeden z nejlepších technických článků na české wiki. Poněkud mne překvapuje, kolik to vzbuzuje kontroverzí.

Třeba právě ty informace uvedené v bodě 2 jsem marně hledal na anglické wiki, protože česká wiki je většinou co se týče technicky zaměřených článků slabá. Když jsem to tam nenašel, tak jsem myslel že to nikde není a pustil jsem se do vlastního odvozování. Jelikož jsem už nějaký čas ze školy pryč, tak mi to trvalo půl dne než jsem se něčeho kloudného dopočítal. Světe div se, teď jsem zjistil, že ten výsledek je naservírovaný "na stříbrném podnose" na české wiki ... a to od samého založení článku panem Polanským!!! Ta hodnocení na začátku článku a v diskusi mi připadají vyloženě nespravedlivá, protože např. ve srovnání s anglickou verzí má česká verze hlavu a patu, je velice dobře použitelná. Méně někdy bývá více.

Rozšíření článku možná nejsou graficky učesaná, ale nepřipadá mi že by tomu nějak uškodila, spíše jsou to zase praktické informace. --Pteryx (diskuse) 5. 9. 2013, 10:35 (UTC)

Bod: obecná lineární regrese, bod druhý: způsob výpočtu[editovat zdroj]

tady jsou hrubé chyby, koukal jsem se na anglickou a tam nejsou, alespoň to označte, že to je nevěrohodné, nebo se z toho bude učit nějaký chudák bakalář a tohle je na vyhození od zkoušky. --78.80.18.239 19. 9. 2011, 12:17 (UTC)

Prosim budte tak laskav a ukazte, kde ty hrube chyby jsou. --Jx 19. 9. 2011, 13:27 (UTC)
Na základě vlastních výpočtů tvrdím, že tam žádné hrubé chyby nejsou, naopak zobecnění v bodě 2 je maximálně praktická záležitost. Jestli je to na "vyhození od zkoušky", tak je chyba v odlišné definici pojmů, pojem lineární regrese může být pro statistika definovaný trochu jinak, může být užší než je základní obecná definice, široce využívaná v technické praxi. --Pteryx (diskuse) 5. 9. 2013, 10:35 (UTC)

primka a chyba odhadu[editovat zdroj]

Anonym 62.240.180.1 vlozil do clanku nejake vzorecky, kdy se snazi aproximovat primkou a uvazuje pri tom i nejakou chybu aproximovanych hodnot. Tohle neznam. Dokazal by to nekdo posoudit, pripadne dodat zdroj? Jaka chyba je to \sigma_i, je to absolutni chyba, relativni chyba? Co treba znamena zapis <1>? --Jx 28. 11. 2009, 10:18 (UTC)

Aproximacia priamkou[editovat zdroj]

Nesedia mi vypocty koeficientov "a" a "b" podla tohto zdroja [1] by to malo byt inak. Vypocet podla odkazu mi sedi aj pri mojich vypoctoch (vypocet podla vzorca je zhodny s vypoctom z Excelu LINEST()195.80.166.225 19. 3. 2010, 10:07 (UTC)

V tech skriptech na MFF se mi nejak nezda to "n+1". --Jx 19. 3. 2010, 11:04 (UTC)
Tak ted jsem si znovu prosel odvozeni v clanku na wiki a je v poradku. Dokonce se to silne podoba druhemu zpusobu odvozeni v tebou odkazovanem clanku na MFF, az na to, ze oni tam najednou misto "n" vycaruji "n+1". I kdyz pozor, nekde tam maji poznamku, ze "n+1=6". Asi protoze jako spravni matfyzaci pocitaji od nuly. :) A samozrejme i Excelovske slope/intercept/linest dava stejny vysledek. Navic i kdyz si to rucne prepocitam podle popisu linest, tak mi vyjde to same. --Jx 20. 3. 2010, 20:36 (UTC)

wikifikovat a upravit[editovat zdroj]

Tento clanek je nutne upravit. Zatim to vypada vice jako seznam vzorcu nez encyklopedicky clanek. Problemy:

(1) Uvod -- tam by melo byt neco srozumitelne pro naprosteho laika, co to je, k cemu to je, kde se to pouziva. Rozhodne tam nepatri vety

Homoscedastičnost (homogenita ve varianci) dat je běžným jevem. Avšak její předpoklad může vést k přecenění korelačního koeficientu. V jistých případech je tedy nutné uvážit heteroscedastičnost a použít váženou regresi.

(Nehlede na to, ze je to pro laika nsrozumitelne, neni vubec jasne, jak to souvisi s definici pojmu "linearni regrese" a zni to jako "doporuceni", "jak neco spravne delat".)

(2) V clanku je primnoho vzorcu a primalo textu. V podstate to je jenom nekonecna rada vzorcu, ktera vypada jako tahak pro studenta. Jakekoliv encyklopedicke informace chybi -- historie, kdy a kde se to zacalo pouzivat, kde to ma vyuziti, souvislosti s jinymi matematickymi problemy, souvislost s linearni algebrou, co je pointa toho vseho. takto je to uplne necitelne.

(3) Sekce "výpočet na počítači" sem vubec nepatri!! Co je treba toto za vetu?

Výsledný vektor x se nachází ve vodorovné oblasti, přičemž jeho složky jsou umístěny v buňkách v opačném pořadí, tedy bk je v buňce nejvíce vlevo a b1 je nejvíce vpravo..

Wikipedie není návodem, průvodcem ani učebnicí -- tato pravidla (co wikipedie neni) prosla diskuzi a patri k zavaznym pravidlum wikipedie. Podobne Wikipedie není nástrojem propagace, v tomto pripade komercniho software Excel.

No nevím. Když je to prakticky zaměřené, tak to není dost encyklopedické? Nevidím nic špatného na odstavci, který naznačí, jak se dá regrese udělat v běžně používaných softwarech. V článcích o programování jsou taky algoritmy. Spíše by mi vadilo že tam není jak se to počítá když mají měřené body různou váhu. --193.165.212.242 2. 5. 2011, 13:18 (UTC)
Pokud tam pridate informace o te ruzne vaze bodu, urcite to bude fajn -- dik za to. Jinak podle meho vykladu a porozumeni pravidel wikipedie je v poradku, kdyz se nekdy uvede nejaky priklad za ucelem ilustrace nejake informace, ale nikoliv kdyz se to tvari jako vyukovy text (wikipedie neni ucebnice). Predstavuju si dobry clanek takto "Linearni regrese je fenomen, pouzivanej v statistice, ktery aproximuje... pouziva se.. Vynalezl ho.. Zabyvali se tim.. Ma takovou a makovou historii.. Vyrazne prizpeli i tyto cesti ucenci.. Ma tyto zobecneni .. souvisi s temato vecma.." pekne setridene do kapitol. Naopak v poradku neni opisovat kapitolu 15.23 ze skript,z kterych se prave nekdo uci na zkousku a uz vubec ne davat tam excelove navody. To mozna spise na wikiknihy. Franp9am 2. 5. 2011, 18:21 (UTC)

Vyzyvam kolegy wikipedisty statistiky, aby se nebali a odvazne smazali treba i velke casti textu. Dlouhodobe to takto stejne zustat nemuze. Franp9am 22. 3. 2011, 22:53 (UTC)

Tu pasaz o vypoctu na pocitaci jsem pridal ja [2]. On sice Matlab i Excel jsou komercni a wiki nema byt navod, ale holt to jsou dva vicemene standardy (jeden v akademicke sfere a druhy v praxi) a ostatni tvurci se od nich "inspiruji". Ale byt to v clanku nemusi. --Jx 27. 3. 2011, 20:25 (UTC)
Diky za reakci. Opravdu si myslim, ze to neni uplne vhodne. Poznamka
prakticke nastroje na vypocet linearni regrese jsou dnes implementovany ve vsech bezne pouzivanych komercnich statistickych softwarech, napriklad funkce linregrese v excelu a polyfit v matlabu
by byla na miste, ale ne tak, jak je to ted.. Zdravim Franp9am
Tvoje verze poznamky je dobra, pouze bych jeste zminil anglicky nazev excelovske funkce LINEST. --Jx 27. 3. 2011, 20:53 (UTC)

Heteroskedascita vs. homoskedascita[editovat zdroj]

Nejsem úplně odborník, ale nevede náhodou heteroskedascita k "podcenění" korelace (tedy v regresi množství vysvětleného rozptylu)? Mohu to opravit do přesně opačného významu? Kromě toho většina dat je naopak heteroskedastická, alespoň dle mé zkušenosti, věta "Homoscedastičnost (homogenita ve varianci) dat je běžným jevem. Avšak její předpoklad může vést k přecenění korelačního koeficientu. V jistých případech je tedy nutné uvážit heteroscedastičnost a použít váženou regresi." tak nedává příliš mnoho smyslu. --Hynas (diskuse) 16. 5. 2015, 00:26 (CEST)Odpovědět