Statistisk feil

En statistisk feil innebærer at man trekker en feilaktig statistisk konklusjon fra datamaterialet man har hatt til rådighet. I og med at statistikk handler om å estimere (beregne) ukjente størrelser ut ifra en stikkprøve som er mindre enn den totale populasjonen som man ønsker å vite noe om, er alle slike beregninger beheftet med en viss sannsynlighet for feil. De mest grunnleggende statistiske feilene kalles type-I- og -II-feil:

En type-I-feil eller forkastningsfeil er en statistisk feil som består i en feilaktig avvisning av nullhypotesen. Hvis man konkluderer at nullhypotesen er falsk, selv om den egentlig er sann, har man altså gjort en type-I-feil.^[1]
En type-II-feil eller godtakningsfeil er en statistisk feil som består i en feilaktig godtakelse av nullhypotesen. Hvis man konkluderer at nullhypotesen er sann, selv om den egentlig er falsk, har man altså gjort en type-II-feil.^[1]

Vanligvis er man ikke interessert i nullhypotesen, men i en alternativ forklaring. En type-I-feil innebærer dermed at man aksepterer en alternativ forklaring som ikke stemmer («godtroenhet»). En type-II-feil betyr på den andre siden at man forkaster en alternativ forklaring, selv om den egentlig stemmer («overforsiktighet»). Type I-feil kan også kalles «falsk positiv», mens type II-feil kan kalles «falsk negativ».

Vitenskapsteoretisk sett er det viktigst å unngå type-I-feil. Derfor «foretrekker» man vanligvis type-II-feil over type-I-feil, og ved å minske sjansen for type-I-feil øker man samtidig sannsynligheten for type-II-feil. Grunnen til dette er at «bevisbyrden» vanligvis ligger ved den alternative forklaringen, ikke ved nullhypotesen. En måte å kontrollere type-I-feil på, er ved hjelp av signifikansnivå. Jo lavere signifikansnivå man velger, desto mindre er sannsynligheten for type-I-feil, men desto mindre er også sannsynligheten for å oppdage at en alternativ forklaring er sann når den faktisk er det. Høyere signifikansnivå minsker altså sannsynligheten for type I-feil, men øker samtidig faren for type II-feil. Dette problemet kan statistisk sett ikke unngås, slik at valg av signifikansnivå alltid er en avveining mellom disse to målsettingene. Et mye brukt signifikansnivå er 5 %. Bruker man dette signifikansnivået, må man altså regne med å gjøre én type-I-feil per 20 statistiske tester.

Det fins likevel tilfeller der det er påkrevd å minimere faren for type-II-feil. Dette kan være tilfellet hvis den alternative forklaringen krever handling for å unngå et problem eller en farlig situasjon. Når man f.eks. får mistanke om en hittil ukjent alvorlig bivirkning av et nytt medikament, har minimaliseringen av type-II-feil av etiske grunner høyere prioritet enn minimaliseringen av type-I-feil. Nullhypotesen i dette eksempelet ville lyde «Medikamentet har ingen bivirkninger.» Å forkaste denne hypotesen når den er sann (dvs. å akseptere at medikamentet har bivirkninger, når det ikke har det – en type-I-feil), er uheldig sett fra et vitenskapsteoretisk perspektiv. Men å akseptere den når den er falsk (dvs. å anta at medikamentet ikke har bivirkninger, når slike fins – en type-II-feil), kan resultere i menneskelige lidelser. Derfor kan forskningsetikken i slike tilfeller tilsi at vitenskapsteoretiske overveininger settes til side, og at en liten mistanke om fare veier mer enn «god vitenskapelig praksis» (føre-var-prinsipp).

Tabellen under oppsummerer feilmulighetene:

Nullhypotesen (resp. den alternative forklaringen) ...
	... er sann (falsk) ...	... er falsk (sann) ...
... og aksepteres (forkastes)	ok korrekt godtakelse	type-II-feil feilaktig godtakelse
... og forkastes (aksepteres)	type-I-feil feilaktig avvisning	ok korrekt avvisning

Referanser

^ ^a ^b Wooldridge, Jeffrey M. (2013). Introductory Econometrics: A Modern Approach (5. utg.). South-Western. s. 780. ISBN 978-1-111-53104-1.

[:0-1] Wooldridge, Jeffrey M. (2013). Introductory Econometrics: A Modern Approach (5. utg.). South-Western. s. 780. ISBN 978-1-111-53104-1.

[1]