Replikovatelnost českého psychologického výzkumu

Kontakt:

vit.gabrhel@mail.muni.cz

Psychologické dny Olomouc 2016

8. 9. 2016

Autorský tým

Hynek Cígler,

Karolína Bernatová,

Hana Blažková,

Kitti Farkasová,

Světlana Farkašová,

Vít Gabrhel,

Jaroslav Gottfried,

Petr Palíšek,

Kateřina Prachařová,

Karel Rečka,

Anna Marie Rosická,

Tomáš Rudecký,

Klára Šmejkalová,

David Vašek

Edita Chvojková,

Anna Janů,

Stanislav Ježek,

Lenka Knapová,

Tomáš Kratochvíl,

Vojtěch Mýlek,

Ondřej Novák,

Východiska

Počet publikací českých docentů a profesorů psychologie jako hodnocení kvality jejich práce:

  • Bezdíček, Preiss a Dočkalová (2009)
  • Preiss a Mačudová (2012)

Počet studií však nic neříká o jejich kvalitě

  • Jedním z ukazatelů kvality výzkumu je jeho replikovatelnost

Replikovatelnost v kontextu naší studie:

  • Počet statistických testů, které by při replikaci vyšly jako statisticky signifikantní

Replikační krize?

Co znamená replikační krize pro psychologii?

Social Priming (dle Aronson, Wilson, & Akert, 2014)

Proces, při kterém nedávná zkušenost zvyšuje pravděpodobnost aktivace určitého schématu či konceptu. S větší pravděpodobností bude aktivováno schéma, které se vyskytlo nedávno, nebo již v minulosti bylo použito. Jde o příklad automatického uvažování a dochází k němu neúmyslně.

  • Změnu chování či úsudku mohou vyvolat i relativně subtilní vodítka jako výška židle (Sanna et al., 2011),  teplota hrnku s kávou (Williams & Bargh, 2008) nebo barva vytištěného slova (Bertrams et al., 2014).

​​Opravdu tomu tak je?

  • Očekávaný efekt nebyl replikován (Klein et al., 2014)

Implikace  - terapie, manželské a rodinné poradenství:

  • Pocit závazku ve vztahu (NE)vede k odpouštění (Cheung et al., accepted)

Open Science, 2015

"We conducted a large-scale, collaborative effort to obtain an initial estimate of the reproducibility of psychological science"

100 studií a výsledky jejich replikace

  • Psychological Science,

  • Journal of Personality and Social Psychology,

  • Journal of Experimental Psychology: Learning, Memory, and Cognition

Původní

 Průměrná velikost účinku: 
 Mr = 0,403; SD = 0,188

 Statistická signifikance:

 97 % studií p < 0,05

Replikace

Průměrná velikost účinku:

Mr = 0,197; SD= 0,257

Statistická signifikance:

36 % studií p < 0,05

Hodnota velikostí účinku z původních studií se nacházela v 95% intervalu spolehlivosti při replikaci v 47 % případů.

Výzkumná otázka

Jaká je replikovatelnost českého psychologického výzkumu?

Design

Identifikace klíčových hypotéz a zápis relevantních údajů

  • Např. t (45.7) =  4.23, p = .001; d = .3

Vyhledání autorů/studií s afiliací k ČR (Československo...)

  • Provázání publikací s autory, aby bylo možné zjistit citační parametry autorů (IF) jednotlivých studií (snaha o provázání co nejvíce studií).

Analýza vybraných indikátorů

  • R-index, statistická síla, velikosti účinků atd. 

Vzorek

1301 studií s celkem 3469 autory

  • Roky: 1996-2016

  • Před změnou ve WoS (1996) bylo dohledatelných méně než 50 % autorů

  • Alespoň jeden autor byl dohledán u 986 studií (76 %)

Kritéria pro zařazení

  • Czech Republic“, „Czechoslovakia“, „article“, „psychology“ (zahrnuje i různé podoblasti).

Klíčová slova

  • social, applied, clinical, biological, educational, experimental, mathematical, developmental, psychoanalysis a multidisciplinary psychology

Metody

Replikovatelnost

Replicability index (R-index) (Schimmack, 2014)

  • Ukazatel (nikoli přímý odhad) přesnější než síla testu, protože kompenzuje publikační zkreslení
  • Kombinuje informace o statistické síle v původní studii spolu s inflací statistické síly vzhledem k publikačnímu zkreslení (tzv. publication bias).
    • Inflation  = Percentage of Significant Results – Median (Estimated Power)
    • R-Index = Median Observed Power Inflation

Statistická síla

  • Pravděpodobnost, že kdybychom výzkum replikovali stejně, identifikovali bychom signifikantní výsledek.

    • Pakliže by měl být hledaný efekt stejně velký jako ten v původní studii.

  • Studie se statistickou sílou 50 % by v případě 100 provedených analýz měla vést k 50 signifikantním a 50 nesignifikantním výsledkům

  • Publikační zkreslení - publikovány jsou v naprosté většině případů signifikantní výsledky

Metody

Scientometrie

Impact Factor (IF)

"Průměrný" počet citací "průměrného" článku v daném žurnálu ve vybraný rok. Takto definovaný IF je hodnocením dopadu žurnálu jako celku, ne však jednotlivých článků.

  • Author Impact Factor (AIF) = "averages the number of citations received by all papers published by an author in a given time window" (Pan & Fortunato, 2014, p. 2)

Hirschův index (h-index) (Hirsch, 2005)

Nástroj pro současné určení produktivity a citačního dopadu daného autora

Kolik článků daného autora dosahuje citovanosti vyšší, než je pořadové číslo článku dle počtu citací.

f(A)=10, f(B)=8, f(C)=5, f(D)=4, f(E)=3 → h-index=4

f(A)=25, f(B)=8, f(C)=5, f(D)=3, f(E)=3 → h-index=3

 

Výsledky

Scientometrie

Výsledky

Souvislost R-indexu a IF

Výsledky

Souvislost R-indexu a h-indexu

Výsledky

R-index dle oblasti psychologie

Výsledky

Provedené testy s příslušným z-skórem

Interní validita: Shoda posuzovatelů

Shoda posuzovatelů byla ověřena na 27 náhodně vylosovaných zařazených studií, které ohodnotil další hodnotitel podruhé.

 

Z těchto 27 druhý hodnotitel 6 vyřadil
(4 netestovaly hypotézy, 1 byla "zmatená",
1 "jiné důvody").

 

R-index zbylých 21 studií Spearmanovo rho = 0,832, 95% CI [0,60; 0,92] (bootstrap)

 

Nelišil se ani průměrný R-index u posuzovaných studií (Wilcoxonův test p = 0,796).

Diskuze

Výsledky

 

Podstatná část českého psychologického výzkumu není citovaná vůbec nebo jen minimálně.

 

Celkový R-index = 0,7. Replikovali bychom tedy 70 % studií.

 

U českých psychologů citační indexy (AIF, h-index) nesouvisí s
R-indexem.

 

Výzkumníci nedodržují standardy při prezentaci statistik.

Diskuze

Reflexe sběru dat

Klíčové nedostatky

  • Chybějící informace o...
    • Přesné hodnotě "p", zejména při non-signifikantním výsledku (kupř. "n.s."),
    • Velikost účinku (d, r, atd.),
    • Výsledek testu (F = ...),
    • Počet případů (N) či stupně volnosti (df)
  • Nesnadná identifikace klíčových hypotéz
  • I přes deklarování explorační povahy bylo prováděno testování signifikance, doprovázené reportem vybraných (signifikantních) výsledků
  • Absence korekce při vícenásobném srovnání na týchž datech (kupř. Bonferroniho metoda)
  • Deskriptivní statistiky chyběly či obsahovaly jen část relevantních údajů

Řešení?

Dodržování APA formátu

(např. American Psychological Association, 2001; Morgan,  Reichert,  & Harrison, 2002)

Take home message

Replikovatelnost výzkumu jednotlivých autorů se liší, ale ne v závislosti na počtu jejich publikací, respektive na dopadu těchto publikací.

Děkuji za pozornost

American Psychological Association. (2001). Publication manual of the American Psychological Association (6th ed.). Washington, DC: Author.

Aronson, E., Wilson, T. D., & Akert, R. M. (2014). Social psychology. Harlow: Pearson.

Bertrams, A., Baumeister, R. F., Englert, C., & Furley, P. (2015). Ego depletion in color priming research: self-control strength moderates the detrimental effect of red on cognitive test performance.

Personality & Social Psychology Bulletin, 41(3), 311–22. doi:10.1177/0146167214564968

Bezdíček, O., Preiss, M., & Dočkalová, E. (2009). D Isregulation and R Esponse To O Piate B Lockers. Psychiatrie, 13(2-3), 108–113.

Hirsch, J. E. (2005). An index to quantify an individual’s scientific research output. Proc Natl Acad Sci U S A, 102(46), 16569–16572. doi:10.1073/pnas.0507655102

Cheung, I., Campbell, L., LeBel, E.,…Yong, J. C. (accepted). Registered Replication Report: Study 1 from Finkel, Rusbult, Kumashiro, & Hannon (2002). Perspectives on Psychological Science

Klein, R. A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., … & Nosek, B. A. (2014). Data from Investigating Variation in Replicability: A “Many Labs” Replication Project.Journal of Open Psychology Data, 2(1), e4.

Morgan, S. E., Reichert, T., Harrison, T. R. (2002). From numbers to words. Reporting statistical results for the social sciences. Allyn & Bacon.

Open Science (2015). Estimating the reproducibility of psychological science. 349 (6251), http://doi.org/10.1126/science.aac4716

Pan, R. K., & Fortunato, S. (2014). Author Impact Factor: tracking the dynamics of individual scientific impact. Scientific Reports, 4, 4880. doi:10.1038/srep04880

Preiss, M., & Mačudová, G. (2012). Publikační Aktivita a Citovanost Českých Docentů a Profesorů V Oboru Psychologie. E-Psychologie, 6(4).

Sanna, L. J., Chang, E. C., Miceli, P. M., & Lundberg, K. B. (2011). Rising up to higher virtues: Experiencing elevated physical height uplifts prosocial actions. Journal of Experimental Social Psychology, 47(2), 472–476. doi:10.1016/j.jesp.2010.12.013

Schimmack, U. (2014). Quantifying Statistical Research Integrity: The Replicability Index, 1–31. Retrieved from http://r-index.org/uploads/3/5/6/7/3567479/introduction_to_the_r-index__14-12-01.pdf

Williams, L. E., & Bargh, J. A. (2008). Science. October, 322(5901), 606–607. doi:10.1126/science.1162548.Experiencing

 

Zdroje

Otázky?

Replikovatelnost českého psychologického výzkumu

By Vít Gabrhel

Replikovatelnost českého psychologického výzkumu

  • 1,673