Replikovatelnost českého psychologického výzkumu
Kontakt:
vit.gabrhel@mail.muni.cz
Psychologické dny Olomouc 2016
8. 9. 2016
Autorský tým
Hynek Cígler,
Karolína Bernatová,
Hana Blažková,
Kitti Farkasová,
Světlana Farkašová,
Vít Gabrhel,
Jaroslav Gottfried,
Petr Palíšek,
Kateřina Prachařová,
Karel Rečka,
Anna Marie Rosická,
Tomáš Rudecký,
Klára Šmejkalová,
David Vašek
Edita Chvojková,
Anna Janů,
Stanislav Ježek,
Lenka Knapová,
Tomáš Kratochvíl,
Vojtěch Mýlek,
Ondřej Novák,
Východiska
Počet publikací českých docentů a profesorů psychologie jako hodnocení kvality jejich práce:
- Bezdíček, Preiss a Dočkalová (2009)
- Preiss a Mačudová (2012)
Počet studií však nic neříká o jejich kvalitě
-
Jedním z ukazatelů kvality výzkumu je jeho replikovatelnost
Replikovatelnost v kontextu naší studie:
- Počet statistických testů, které by při replikaci vyšly jako statisticky signifikantní
Replikační krize?
Co znamená replikační krize pro psychologii?
Social Priming (dle Aronson, Wilson, & Akert, 2014)
Proces, při kterém nedávná zkušenost zvyšuje pravděpodobnost aktivace určitého schématu či konceptu. S větší pravděpodobností bude aktivováno schéma, které se vyskytlo nedávno, nebo již v minulosti bylo použito. Jde o příklad automatického uvažování a dochází k němu neúmyslně.
- Změnu chování či úsudku mohou vyvolat i relativně subtilní vodítka jako výška židle (Sanna et al., 2011), teplota hrnku s kávou (Williams & Bargh, 2008) nebo barva vytištěného slova (Bertrams et al., 2014).
Opravdu tomu tak je?
- Očekávaný efekt nebyl replikován (Klein et al., 2014)
Implikace - terapie, manželské a rodinné poradenství:
- Pocit závazku ve vztahu (NE)vede k odpouštění (Cheung et al., accepted)
Open Science, 2015
"We conducted a large-scale, collaborative effort to obtain an initial estimate of the reproducibility of psychological science"
100 studií a výsledky jejich replikace
-
Psychological Science,
-
Journal of Personality and Social Psychology,
Journal of Experimental Psychology: Learning, Memory, and Cognition
Původní
Průměrná velikost účinku:
Mr = 0,403; SD = 0,188
Statistická signifikance:
97 % studií p < 0,05
Replikace
Průměrná velikost účinku:
Mr = 0,197; SD= 0,257
Statistická signifikance:
36 % studií p < 0,05
Hodnota velikostí účinku z původních studií se nacházela v 95% intervalu spolehlivosti při replikaci v 47 % případů.
Výzkumná otázka
Jaká je replikovatelnost českého psychologického výzkumu?
Design
Identifikace klíčových hypotéz a zápis relevantních údajů
Např. t (45.7) = 4.23, p = .001; d = .3
Vyhledání autorů/studií s afiliací k ČR (Československo...)
-
Provázání publikací s autory, aby bylo možné zjistit citační parametry autorů (IF) jednotlivých studií (snaha o provázání co nejvíce studií).
Analýza vybraných indikátorů
-
R-index, statistická síla, velikosti účinků atd.
Vzorek
1301 studií s celkem 3469 autory
Roky: 1996-2016
Před změnou ve WoS (1996) bylo dohledatelných méně než 50 % autorů
-
Alespoň jeden autor byl dohledán u 986 studií (76 %)
Kritéria pro zařazení
-
„Czech Republic“, „Czechoslovakia“, „article“, „psychology“ (zahrnuje i různé podoblasti).
Klíčová slova
-
social, applied, clinical, biological, educational, experimental, mathematical, developmental, psychoanalysis a multidisciplinary psychology
Metody
Replikovatelnost
Replicability index (R-index) (Schimmack, 2014)
- Ukazatel (nikoli přímý odhad) přesnější než síla testu, protože kompenzuje publikační zkreslení
- Kombinuje informace o statistické síle v původní studii spolu s inflací statistické síly vzhledem k publikačnímu zkreslení (tzv. publication bias).
- Inflation = Percentage of Significant Results – Median (Estimated Power)
- R-Index = Median Observed Power – Inflation
Statistická síla
-
Pravděpodobnost, že kdybychom výzkum replikovali stejně, identifikovali bychom signifikantní výsledek.
-
Pakliže by měl být hledaný efekt stejně velký jako ten v původní studii.
-
-
Studie se statistickou sílou 50 % by v případě 100 provedených analýz měla vést k 50 signifikantním a 50 nesignifikantním výsledkům
-
Publikační zkreslení - publikovány jsou v naprosté většině případů signifikantní výsledky
Metody
Scientometrie
Impact Factor (IF)
"Průměrný" počet citací "průměrného" článku v daném žurnálu ve vybraný rok. Takto definovaný IF je hodnocením dopadu žurnálu jako celku, ne však jednotlivých článků.
- Author Impact Factor (AIF) = "averages the number of citations received by all papers published by an author in a given time window" (Pan & Fortunato, 2014, p. 2)
Hirschův index (h-index) (Hirsch, 2005)
Nástroj pro současné určení produktivity a citačního dopadu daného autora
Kolik článků daného autora dosahuje citovanosti vyšší, než je pořadové číslo článku dle počtu citací.
f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3 → h-index=4
f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3 → h-index=3
Výsledky
Scientometrie
Výsledky
Souvislost R-indexu a IF
Výsledky
Souvislost R-indexu a h-indexu
Výsledky
R-index dle oblasti psychologie
Výsledky
Provedené testy s příslušným z-skórem
Interní validita: Shoda posuzovatelů
Shoda posuzovatelů byla ověřena na 27 náhodně vylosovaných zařazených studií, které ohodnotil další hodnotitel podruhé.
Z těchto 27 druhý hodnotitel 6 vyřadil
(4 netestovaly hypotézy, 1 byla "zmatená",
1 "jiné důvody").
R-index zbylých 21 studií Spearmanovo rho = 0,832, 95% CI [0,60; 0,92] (bootstrap)
Nelišil se ani průměrný R-index u posuzovaných studií (Wilcoxonův test p = 0,796).
Diskuze
Výsledky
Podstatná část českého psychologického výzkumu není citovaná vůbec nebo jen minimálně.
Celkový R-index = 0,7. Replikovali bychom tedy 70 % studií.
U českých psychologů citační indexy (AIF, h-index) nesouvisí s
R-indexem.
Výzkumníci nedodržují standardy při prezentaci statistik.
Diskuze
Reflexe sběru dat
Klíčové nedostatky
-
Chybějící informace o...
- Přesné hodnotě "p", zejména při non-signifikantním výsledku (kupř. "n.s."),
- Velikost účinku (d, r, atd.),
- Výsledek testu (F = ...),
- Počet případů (N) či stupně volnosti (df)
- Nesnadná identifikace klíčových hypotéz
- I přes deklarování explorační povahy bylo prováděno testování signifikance, doprovázené reportem vybraných (signifikantních) výsledků
- Absence korekce při vícenásobném srovnání na týchž datech (kupř. Bonferroniho metoda)
- Deskriptivní statistiky chyběly či obsahovaly jen část relevantních údajů
Řešení?
Dodržování APA formátu
(např. American Psychological Association, 2001; Morgan, Reichert, & Harrison, 2002)
Take home message
Replikovatelnost výzkumu jednotlivých autorů se liší, ale ne v závislosti na počtu jejich publikací, respektive na dopadu těchto publikací.
Děkuji za pozornost
American Psychological Association. (2001). Publication manual of the American Psychological Association (6th ed.). Washington, DC: Author.
Aronson, E., Wilson, T. D., & Akert, R. M. (2014). Social psychology. Harlow: Pearson.
Bertrams, A., Baumeister, R. F., Englert, C., & Furley, P. (2015). Ego depletion in color priming research: self-control strength moderates the detrimental effect of red on cognitive test performance.
Personality & Social Psychology Bulletin, 41(3), 311–22. doi:10.1177/0146167214564968
Bezdíček, O., Preiss, M., & Dočkalová, E. (2009). D Isregulation and R Esponse To O Piate B Lockers. Psychiatrie, 13(2-3), 108–113.
Hirsch, J. E. (2005). An index to quantify an individual’s scientific research output. Proc Natl Acad Sci U S A, 102(46), 16569–16572. doi:10.1073/pnas.0507655102
Cheung, I., Campbell, L., LeBel, E.,…Yong, J. C. (accepted). Registered Replication Report: Study 1 from Finkel, Rusbult, Kumashiro, & Hannon (2002). Perspectives on Psychological Science
Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., … & Nosek, B. A. (2014). Data from Investigating Variation in Replicability: A “Many Labs” Replication Project.Journal of Open Psychology Data, 2(1), e4.
Morgan, S. E., Reichert, T., Harrison, T. R. (2002). From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon.
Open Science (2015). Estimating the reproducibility of psychological science. 349 (6251), http://doi.org/10.1126/science.aac4716
Pan, R. K., & Fortunato, S. (2014). Author Impact Factor: tracking the dynamics of individual scientific impact. Scientific Reports, 4, 4880. doi:10.1038/srep04880
Preiss, M., & Mačudová, G. (2012). Publikační Aktivita a Citovanost Českých Docentů a Profesorů V Oboru Psychologie. E-Psychologie, 6(4).
Sanna, L. J., Chang, E. C., Miceli, P. M., & Lundberg, K. B. (2011). Rising up to higher virtues: Experiencing elevated physical height uplifts prosocial actions. Journal of Experimental Social Psychology, 47(2), 472–476. doi:10.1016/j.jesp.2010.12.013
Schimmack, U. (2014). Quantifying Statistical Research Integrity: The Replicability Index, 1–31. Retrieved from http://r-index.org/uploads/3/5/6/7/3567479/introduction_to_the_r-index__14-12-01.pdf
Williams, L. E., & Bargh, J. A. (2008). Science. October, 322(5901), 606–607. doi:10.1126/science.1162548.Experiencing
Zdroje
Otázky?
Replikovatelnost českého psychologického výzkumu
By Vít Gabrhel
Replikovatelnost českého psychologického výzkumu
- 1,796