P-hacking: Porovnání verzí

Z Wikipedie, otevřené encyklopedie
Smazaný obsah Přidaný obsah
Bez shrnutí editace
Bez shrnutí editace
Řádek 13: Řádek 13:
}}</ref>
}}</ref>


Získávání těchto výsledků se dosahuje například zahrnováním pouze těch dat z celého experimentu, která se hodí pro potvrzení hypotézy. Vypouští se tedy podstatná část všech získaných dat a tím  je ovlivňován zkoumaný vzorek. Další situace, kdy k P-hackingu dochází, nastává v případě, že se vypočtená [[P-hodnota]] všech zkoumaných dat výrazně blíží předem stanovené hranici P-hodnoty, ale nedostává se pod její hodnotu. Pouhé přidání dalšího množství dat do celkové analýzy často vede k pokoření této hranice a tedy zdánlivému zisku statisticky významného výsledku.
Získávání těchto výsledků se dosahuje například zahrnováním pouze těch dat z celého experimentu, která se hodí pro potvrzení hypotézy. Vypouští se tedy podstatná část všech získaných dat a tím  je ovlivňován zkoumaný vzorek. Další situace, kdy k P-hackingu dochází, nastává v případě, že se vypočtená [[P-hodnota]] všech zkoumaných dat výrazně blíží předem stanovené hranici P-hodnoty, ale nedostává se pod její hodnotu. Pouhé přidání dalšího množství dat do celkové analýzy často vede k pokoření této hranice a tedy zdánlivému zisku statisticky významného výsledku.<ref>{{Citace periodika
| příjmení = Nuzzo
| jméno = Regina
| titul = Scientific method: Statistical errors
| periodikum = Nature
| datum vydání = 2014-02-13
| ročník = 506
| číslo = 7487
| strany = 150–152
| issn = 0028-0836
| doi = 10.1038/506150a
| jazyk = en
| url = http://www.nature.com/articles/506150a
| datum přístupu = 2021-11-19
}}</ref>


== Definice na příkladu ==
== Definice na příkladu ==

Verze z 19. 11. 2021, 16:56

P-hacking, jinak známý jako data dredging, data fishing, data snooping, data butchery, significance chasing, significance questing nebo selective inference je užívání analýzy dat za účelem hledání výsledků či korelací, které se hodí pro původní hypotézu, ačkoliv nejsou objektivně statisticky významné. Tím se rapidně zvyšuje možnost tzv. falešně pozitivního výsledku zkoumání.[1]

Získávání těchto výsledků se dosahuje například zahrnováním pouze těch dat z celého experimentu, která se hodí pro potvrzení hypotézy. Vypouští se tedy podstatná část všech získaných dat a tím  je ovlivňován zkoumaný vzorek. Další situace, kdy k P-hackingu dochází, nastává v případě, že se vypočtená P-hodnota všech zkoumaných dat výrazně blíží předem stanovené hranici P-hodnoty, ale nedostává se pod její hodnotu. Pouhé přidání dalšího množství dat do celkové analýzy často vede k pokoření této hranice a tedy zdánlivému zisku statisticky významného výsledku.[2]

Definice na příkladu

Reference

  1. STARBUCK, William H. 60th Anniversary Essay: How Journals Could Improve Research Practices in Social Science. Administrative Science Quarterly. 2016, roč. 61, čís. 2, s. 165–183. Dostupné online [cit. 2021-11-19]. ISSN 0001-8392. 
  2. NUZZO, Regina. Scientific method: Statistical errors. Nature. 2014-02-13, roč. 506, čís. 7487, s. 150–152. Dostupné online [cit. 2021-11-19]. ISSN 0028-0836. DOI 10.1038/506150a. (anglicky)