Viktig og god medisinsk forskning blir ikke nødvendigvis publisert. Hvorfor?

18. august 2024

Epidemiologist,In,Office,Analyzing,Covid-19,Infection,Rate,Chart,coronavirus,Disease,Statistics,update

Viktig medisinsk forskning har blitt neglisjert, men skjer det i dag? Ja, og jeg illustrerer det med henvisning til empiri som sannsynliggjør hvorfor det nå er ulik dødelighet i europeiske land. Tross robuste funn har den blitt møtt med slakt. Hvis årsaken er svak metode, hvorfor falsifiserer ikke kritikerne funnene?

(Å falsifisere er å avkrefte, altså å vise eller finne ut at en påstand ikke er riktig. Uttrykket falsifisere brukes vanligvis i forbindelse med vitenskapelig forskning, der man kan falsifisere en foreløpig antagelse (hypotese) gjennom et eksperiment eller en annen empirisk undersøkelse. Store norske leksikon.)

Viktig forskning

La oss anta at en i ulike geografiske populasjoner observerer variasjon i dødelighet sammenlignet med en historisk referanseperiode. Siden referanseperiode benyttes kan variasjon i dødelighet henføres andre årsaker enn helsemessige forhold i utgangspunktet, men er det av medisinskfaglig og allmenn interesse å belyse hvorfor? Ja, tror jeg de fleste vil mene, og et PubMed-søk som viser mer enn 1,5 millioner treff på «mortality» (1), dvs. mer enn 4 prosent av alle 36 millioner bidrag, indikerer at den type forskning er viktig.

God forskning

La oss i fortsettelsen anta at det er påvist en signifikant sammenheng mellom en gitt variabel og variasjon i dødelighet i populasjonene. Siden de fleste enes om at forklaringer på dødelighet er viktig forskning, er dette et tilstrekkelig grunnlag for at funnene publiseres? Ikke nødvendigvis.

Ett kriterium er at sammenhengen ikke er triviell, dvs. at den ikke er åpenbart sannsynlig. Hvis noen geografiske populasjoner eksempelvis ble rammet av en naturkatastrofe blir ikke det viktigste forskningsspørsmålet om det har påvirket dødelighet, men omfang.

Et annet kriterium, i alle fall for publikasjon i toneangivende tidsskrifter, er at sammenhengen har en nyhetsgrad, dvs. at den ikke er påvist i mange andre studier.

Et tredje, kanskje ikke kriterium i seg selv, men som kan styrke studiens gjennomslagskraft, er om funnene har implikasjoner for få eller mange. For eksempel vil forskning på dødelighet i den allmenne befolkningen vies større oppmerksomhet enn forskning på dødelighet hos noen med en sjelden diagnose. Tilsvarende vil forskning som har avdekket en sammenheng mellom en gitt variabel og dødelighet ha større gjennomslagskraft i dess flere og større populasjoner den er observert.

Et femte kriterium er om en kan anta en kausal sammenheng, dvs. om den gitte variabelen henføres som forklaring på dødelighet. I det klassiske eksperimentet med randomisering av grupper eksponert for ulike stimuli, kan en med stor sannsynlighet hevde at signifikante sammenhenger også er kausale, dvs. at et gitt stimuli forårsaker en effekt. I populasjonsstudier er imidlertid randomisering umulig, og spesifikke kausalitetskriterier blir da nødvendig å vurdere. Ett, jf. John Stuart Mill, er å utelukke at dødelighet i vårt tilfellet ikke påvirker den gitte variabelen, dvs. motsatt kausal retning (2, sitert fra Cook og Campbell, s. 18-20). Et annet er å utelukke alternative forklaringer, dvs. at sammenhengen mellom variabelen vi har identifisert og dødelighet ikke forklares av andre variabler. (Det klassiske eksperimentet med randomisering oppfyller nevnte kausalitetskriterier. For å vurdere kausalitet er det også i noen tilfeller mulig å estimere med instrumentelle variabler, ofte spesifikt Mendelian randomisering i medisinsk forskning. Se f.eks. Burgess, Small and Thompson (3)).

God eller ei i lys av nivåfeilslutning

Robinson (4) illustrerte hvordan kausalitetsvurderinger kan være kritiske i populasjonsstudier. Han fant at leseferdigheter var høyere i amerikanske stater med høy innvandring enn i de med lav innvandring, dvs. en positiv korrelasjon på geografisk populasjonsnivå. Imidlertid fant han på individnivå en negativ korrelasjon, dvs. at immigranter hadde lavere leseferdigheter enn ikke-immigranter. Det som forklarte de motstridende funnene, omtalt som Robinson-paradokset, var at stater med høye leseferdigheter i utgangspunktet tiltrakk seg immigranter med lave leseferdigheter, og studien gir to viktige implikasjoner. Først illustrerer den behovet for å avdekke tidsasymmetri, dvs. tidsfastsettelsen av variabler en ønsker å analysere, for å unngå feil konklusjon om kausal retning. Dernest illustrerer den at forhold på statlig nivå ikke nødvendigvis reflekterer forhold hos immigranter som en minoritet. Hvis en uriktig i det aktuelle tilfellet antar at leseferdigheter på statlig nivå reflekterer individuelle immigranters leseferdigheter står en i fare for å gjøre en såkalt nivåfeilslutning, på engelsk «ecological fallacy» (5).

Simpson-paradokset (6, 7), beslektet med Robinson-paradokset, illustrerer også hvordan populasjonsstudier kan konkludere feil ved å ignorere alternative forklaringer. Eksempelvis indikerer Figur 1 på populasjonsnivå at inntak av en bestemt type næringsstoff fører til økt dødelighet. Grunnen er at individer i populasjonen høyest inntak også har høyest dødelighet. Imidlertid observerer en på individnivå innad i populasjonene at høyt inntak motsvarende reduserer dødeligheten, og forklaringen på dødelighet i populasjonen med høyt inntak må sannsynligvis være en annen, f.eks. høy dødelighet der i utgangspunktet. Derfor kan en igjen gjøre en såkalt nivåfeilslutning om en konkluderer at sammenhenger på populasjonsnivå gjenspeiler sammenhenger på individnivå, men som ikke alltid er tilfellet.

Ignorering og motstand

I lys av diskusjonen om kriterier for viktig og god forskning viser imidlertid historien at de ikke alltid har vært utslagsgivende for faglig aksept. Et kjent eksempel er Semmelweis’ (1818-1865) påvisning av sammenhengen mellom helsepersonells håndhygiene og reduksjon i dødelig barselfeber blant fødende, men som ble ignorert av samtiden (8, 9). «Even when mortality at his maternity clinic sextupled after his death … handwashing was still rejected», forteller litteaturen (8, s. e39).

Dr. Semmelweis’ (1818-1865) påvisning av sammenhengen mellom helsepersonells håndhygiene og reduksjon i dødelig barselfeber blant fødende ble ignorert av samtiden. «Even when mortality at his maternity clinic sextupled after his death … handwashing was still rejected».

Et norsk eksempel på faglig motstand, riktignok ikke fra medisin men geofysikk, er Storetvedt (1935-) ved Universitet i Bergen, som etter han forkastet kontinentaldriftsteorien ble anklaget for å så griller i hodene på studentene, ble presset ut av undervisningen og utsatt for telefonterror (10). Til slutt måtte han hemmeligholde reiser så familien kunne få fred. «Erkjennelsen om alvorlig feil i vitenskapen sitter normalt langt inne», medgir Storetvedt (10, s. 23), og «the history of science demonstrates that the acceptance of proposals … implying that a ‘world view’ everyone has embraced should be given up – has always been met by massive resistance» (11, s. 397).

Karsten M. Storetvedt, prof. em. i geofysikk ved UiB:

«Erkjennelsen om alvorlig feil i vitenskapen sitter normalt langt inne», og «the history of science demonstrates that the acceptance of proposals … implying that a ‘world view’ everyone has embraced should be given up – has always been met by massive resistance».

Hvorfor?

Hva er da årsakene til at viktig forskning ignoreres, og at aksept for nye – og forkastelse av etablerte teorier sitter langt inne? Storetvedts forklaring er at «naturvitenskap er en menneskelig aktivitet, og som sådan infiltrert av dagliglivets politiske og psykososiale mekanismer. Kampen bak kulissene – om ære, posisjoner og penger – gir dermed næring til det akademisk falskspillet» (10, s. 23).

Storetvedt:

«Naturvitenskap er en menneskelig aktivitet, og som sådan infiltrert av dagliglivets politiske og psykososiale mekanismer. Kampen bak kulissene – om ære, posisjoner og penger – gir dermed næring til det akademisk falskspillet».

Psykologiske forklaringer kan være «confirmation bias» hvor en selektivt søker bekreftende informasjon om meninger en i utgangspunktet har (12), kognitiv dissonans hvor en ignorerer eller bortforklarer ubehagelig informasjon som forstyrrer bestående oppfatning (13), forsterket forsvar for handlinger når en åpenbart har gjort feil (14) og gruppetenkning med illusjon av uangripelighet, enighet og moralsk overlegenhet samt sanksjonering av avvikende meninger og konformitetspress (15). En illustrasjon på at konformitetspress påvirker adferd er Aschs (16) eksperiment hvor forsøkspersoner i ett av tre tilfeller tilkjennega en åpenbar feilaktig respons i nærvær av andre som var instruert om å respondere uriktig.

I dag?

Popper argumenterer at vitenskapelige teorier har to egenarter (17). De må kunne utfordre, dvs. gå på tvers av aksepterte antagelser og bestående teorier. Dernest, som en demarkasjon fra pseudoforskning, må en kunne og være villig til å falsifisere, dvs. forkaste dem. Dette betyr ikke nødvendigvis at teorier bør eller må utfordre eller forkastes, men de må kunne ha disse egenartene, hvilket impliserer at aktører som agerer på tvers av samtidens konsensus ikke radbrekkes. I lys av Semmelweis og Storetvedts erfaringer har ikke Poppers tilnærming alltid har vært fremtredende i akademia, men møter utfordrende teorier (jf. Semmelweis) og forsøk på falsifikasjon av etablerte (jf. Storetvedt) også motstand i dag?

For å belyse spørsmålet henviser jeg til Figur 2 hvor den blå linja viser gjennomsnittlig dødelighet i 31 europeiske land, EU pluss EØS, mellom januar 2022 og mai 2023 målt i prosent sammenlignet med gjennomsnittlig dødelighet i de samme månedene mellom 2016 og 2019 som referanseperiode (data fra Eurostat (18) vektet for befolkningsstørrelse). De stiplede linjene viser 5- og 95-persentiler og den røde standardfeil av gjennomsnitt. Gjennom perioden har det vært overdødelighet, særlig i juli og desember 2022, med unntak av februar 2023. Spennet i de stiplede linjene indikerer særlig høy variasjon i dødelighet i måneder med høy gjennomsnittsdødelighet og reflekteres av standardfeilestimater.

Kovid-assosierte dødsfall falt i Europa på vårparten 2022 (19), så hva forklarer da overdødelighet samt variasjon i dødelighet mellom landene over tid, og er disse spørsmålene viktige? I tråd med innledende diskusjon er de viktige, og særlig når en i etterkant av høy dødelighet gjennom kovidpandemien kunne forvente lavere. Har da mange studier belyst spørsmålene? Nei, men to har med høy statistisk sannsynlighet påvist en forklaring uten lykkes med publikasjon i anerkjente tidsskrifter (20, 21). De har referert til relevant litteratur, benyttet anerkjente datakilder og statistiske metoder samt håndtert kausalitet, inkludert Robinson- og Simpson-paradoksene, så hvorfor avvisning? Kan det være fordi funnene bryter med gjeldende paradigmer, og derfor, i tråd med psykologiske forklaringer og Semmelweis og Storetvedts erfaringer, møter motstand? Jeg utelukker ikke det.

Slakt, men ingen falsifisering

«As much as 90 percent of the published medical information that doctors rely on is flawed», ifølge Stanford-epidemiologen Ioannidis. Tilsvarende hevder Smith, tidligere redaktør i BMJ, at «medical journals often contain poor science» «[where] most of what is published … is just plain wrong or nonsense».

Er da studiene uangripelige? Nei, knapt noen er det, og i likhet med annen forskning er også de eksponert for Poppers falsifikasjonskrav. Og om studiene mot formodning skulle bli falsifisert er de uansett i godt selskap siden «as much as 90 percent of the published medical information that doctors rely on is flawed», ifølge Ioannidis (22). Tilsvarende hevder Smith, tidligere redaktør i British Medical Journal, at «medical journals often contain poor science» (23, s. 115) «[where] most of what is published … is just plain wrong or nonsense» (24, for mer diskusjon se 25, 26).

Hvis forskningen er så feilaktig som opponentene mener, hvorfor falsifiserer de den da ikke?

At de kontroversielle studiene som forklarer dødelighet ikke har blitt publisert i anerkjente tidsskrifter betyr imidlertid ikke at forskningen har unngått oppmerksomhet. Den første har blitt presentert i to YouTube innslag sett over en million ganger (27, 28), nådd seks millioner X-brukere (29) og blitt sitert i det britiske parlamentet (30). Dette indikerer interesse, men forskningen har likefult blitt slaktet av norske helsebyråkrater (31), noe de selvsagt er i sin fulle rett til å gjøre. Imidlertid er det svak kritikk som lett tilbakevises (32), og hvis forskningen er så feilaktig som opponentene mener, hvorfor falsifiserer de den da ikke? Mistanken er at kritikerne lar være i frykt av at heller ikke de kan falsifisere kontroversielle funn, og i påvente av at også andre studerer forskningsspørsmålet jeg har diskutert finner jeg det å være den mest plausible forklaringen.

Referanser

1. PubMed – National Library of Medicine [Available from:

https://pubmed.ncbi.nlm.nih.gov

2. Cook TD, McCleary R, McCain LJ, Reichardt CS, Fankhauser G, Campbell DT. Quasi-experimentation : design & analysis issues for field settings. Boston: Houghton Mifflin Co.; 1979.

3. Burgess S, Small DS, Thompson SG. A review of instrumental variable estimators for Mendelian randomization. Statistical Methods in Medical Research. 2017;26(5):2333-55.

4. Robinson WS. Ecological Correlations and the Behavior of Individuals. Am Sociol Rev. 1950;15(3):351-7.

5. Hsieh JJ. Encyclopedia Britannica. Ecological fallacy 2017, September 4 [Available from: https://www.britannica.com/science/ecological-fallacy.

6. Simpson EH. The Interpretation of Interaction in Contingency Tables. Journal of the Royal Statistical Society: Series B (Methodological). 1951;13(2):238-41.

7. Blyth CR. On Simpson’s Paradox and the Sure-Thing Principle. J Am Stat Assoc. 1972;67(338):364-6.

8. Santos A, Morris DS, Rattan R, Zakrison T. Double-blinded manuscript review: Avoiding peer review bias. Journal of Trauma and Acute Care Surgery. 2021;91(1):e39-e42.

9. Funk DJ, Parrillo JE, Kumar A. Sepsis and septic shock: a history. Critical Care Clinics. 2009;25(1):83-101.

10. Hustad J. En bergensk kjetter. Forskerforum. 2006;6:21-3.

11. Storetvedt KM. Global Wrench Tectonics: Theory of Earth Evolution. Bergen: Fagbokforlaget; 2003.

12. Nickerson RS. Confirmation Bias: A Ubiquitous Phenomenon in Many Guises. Review of General Psychology. 1998;2(2):175-220.

13. Festinger LA. Theory of cognitive dissonance. Evanston, IL: Row, Peterson; 1957.

14. Staw BM. Knee-deep in the big muddy: a study of escalating commitment to a chosen course of action. Organizational Behavior and Human Performance. 1976;16(1):27-44.

15. Janis IL. Victims of groupthink: A psychological study of foreign-policy decisions and fiascoes. Oxford, England: Houghton Mifflin; 1972. viii, 277-viii, p.

16. Asch SE. Effects of group pressure upon the modification and distortion of judgement. In: Guetzkow H, editor. Groups, Leadership and Men. Pittsburgh: Carnegie Press; 1951.

17. Internet Encyclopedia of Philosphy. A Peer-Reviewed Academic Resource. Karl Popper: Philosophy of Science [Available from: https://iep.utm.edu/pop-sci/#:~:text=Popper’s%20falsificationist%20methodology%20holds%20that,might%20reveal%20to%20be%20false.

18. Eurostat. Excess mortality by month [Available from: https://ec.europa.eu/eurostat/databrowser/view/DEMO_MEXRT__custom_1210067/bookmark/table?lang=en&bookmarkId=fc27a3a9-082b-461d-830b-a4c7b36caf4f.

19. Our World in Data. Coronavirus (COVID-19) Vaccinations. [Available from: https://ourworldindata.org/covid-vaccinations.

20. Aarstad J, Kvitastein OA. Is there a Link between the 2021 COVID-19 Vaccination Uptake in Europe and 2022 Excess All-Cause Mortality? Preprints: Preprints; 2023.

21. Aarstad J. An Update on the Link between COVID-19 Vaccination and Mortality. Preprints: Preprints; 2023.

22. The Atlantic. Lies, Damned Lies, and Medical Science 2010 [November:[Available from: https://www.theatlantic.com/magazine/archive/2010/11/lies-damned-lies-and-medical-science/308269/.

23. Smith R. The trouble with medical journals. J R Soc Med. 2006;99(3):115-9.

24. Times Higher Education. Slay peer review ‘sacred cow’, says former BMJ chief 2015 [April 15:[Available from: https://www.timeshighereducation.com/news/slay-peer-review-sacred-cow-says-former-bmj-chief/2019812.article.

25. Ioannidis JP. Why most published research findings are false. PLoS medicine. 2005;2(8):e124.

26. Lose G, Klarskov N. Why published research is untrustworthy. International Urogynecology Journal. 2017;28(9):1271-4.

27. YouTube. Vaccination v excess deaths, correlation study 2023 [Available from:

https://www.youtube-nocookie.com/embed/iyo2UNQcdpQ?start=1s&rel=0&autoplay=0&showinfo=0&enablejsapi=0

28. YouTube. Vaccinated Countries Have Highest EXCESS DEATH Rates – New Study 2023 [Available from:

https://www.youtube-nocookie.com/embed/6G1SWjL7gmQ?rel=0&autoplay=0&showinfo=0&enablejsapi=0

29. Altmetric. Is there a Link between the 2021 COVID-19 Vaccination Uptake in Europe and 2022 Excess All-Cause Mortality? [Available from: https://www.altmetric.com/details/142758124/twitter.

30. YouTube. Vaccine damage, Sir Christopher Chope 2023 [Available from:

https://www.youtube-nocookie.com/embed/P_uUb6WM6bI?rel=0&autoplay=0&showinfo=0&enablejsapi=0

31. Dagbladet. Slakter norsk coronastudie 2023 [28. februar:[Available from: https://bergen.dagbladet.no/nyheter/slakter-norsk-coronastudie/78562462.

32. Jarle’s Substack. Nakstad og Folkehelseinstituttets slakt 2023 [Available from: https://jarle.substack.com/p/nakstad-og-folkehelseinstituttets.

Denne artikkelen ble publisert på Jarle Aarstads Substack.