Československá psychologie
Husova 4, 110 00 Praha 1, tel. (02) 24 220 979, l. 543
Diskuse
O význame p-hodnôt: reflexia na silnejúcu kritiku testov významnosti
Vo svetle aktuálnej krízy reprodukovateľnosti vedeckého poznania silnie kritika na adresu p- -hodnôt ako výstupu procedúry testovania významnosti nulovej hypotézy (tzv. NHST). Totiž intuitívne interpretácie významu p-hodnôt sú spravidla zavádzajúce, keďže p-hodnoty neposkytujú odpovede na otázky, ktoré sa výskumníci zvyknú pýtať, a ich úloha v kontexte štatistickej inferencie je preto výrazne preceňovaná. Príspevok poukazuje na najviac pervazívne nesprávne interpretácie p-hodnôt, ako aj na štatistické dôvody slabej reprodukovateľnosti zistení postavených na prekročení konsenzuálnej hladiny p < 0,05. Zároveň však ponúka kritickú reflexiu na argumenty proti používaniu p-hodnôt a prezentuje pragmatický, no stále rigorózny pohľad na logiku a užitočnosť p-hodnôt.
Klíčová slova: p-hodnoty, testovanie významnosti nulovej hypotézy, štatistická inferencia, testovanie hypotéz, kríza reprodukovateľnosti
Ivan Ropovik (2017). O význame p-hodnôt: reflexia na silnejúcu kritiku testov významnosti. Československá psychologie, 61(5), 502-516.

On the meaning of p-values: criticism of significance tests revisited
In the light of the reproducibility crisis, there is a growing criticism of null hypothesis significance testing (NHST) and its output, the p-values. In fact, the intuitive interpretations of p-values are usually misleading because the p-values do not answer the questions that researchers tend to ask and their role in the context of statistical inference is typically grossly overestimated. The aim of this article is to discuss the most pervasive misinterpretations of p-values as well as the statistical reasons for the weak reproducibility of findings based on crossing the p < .05 threshold. On the other hand, the article provides a reconsideration of the arguments against the p-values, while offering a pragmatic, but still rigorous perspective on their logic and usefulness.
Keywords: p-values, null hypothesis significance testing, statistical inference, hypothesis testing, reproducibility crisis