19 jan. 2015

Game of Trends

Kung Joffrey: "Eddard Stark, jag dömer dig till statistisk insignifikans genom halshuggning."
(Fritt efter HBO-serien "Game of Thrones" baserad på G.R.R. Martins böcker.)
I klimatdebatten hör man ibland påståenden i stil med "det finns ingen statistiskt signifikant uppvärmning sedan år x", där x typiskt är 1997 eller 1998. Den som säger det är vanligtvis en "klimatskeptiker". I det här inlägget så ska vi titta på vad en avsaknad av statistisk signifikans egentligen säger oss, och framför allt hur det hänger ihop med längden på den tidsperiod som man tittar på.

Vi börjar med att titta på en 10-årsperiod, från 1995 till 2004. Trenden är beräknad med Skeptical Science Temperature Trend Calculator. De globala temperaturanomalierna är från serien HADCRUT4.
.
Som vi ser så är trenden ganska stor (0,210 °C/decennium), men konfidensintervallet är ännu större (±0,282 °C/decennium). Trenden är alltså inte signifikant skild från 0.* Det betyder att det inte är säkert att det verkligen har blivit varmare: ökningen kan ha berott på en ren slump. Under en 10-årsperiod kan kortsiktiga variationer ha stor inverkan på trenden.

Nu tittar vi på en 20-årsperiod (1990-2009):

Trenden i sig är något mindre (0,180 °C/decennium), men konfidensintervallet har minskat mycket eftersom perioden är längre  (±0,099 °C/decennium). Därför är trenden för den här perioden signifikant skild från 0.  Generellt, ju längre period, ju smalare konfidensintervall.
Om trenden för  1990-2009 hade varit 0.09 eller mindre, så hade dock inte heller den här perioden givit statistisk signifikans. Ju mindre storlek på trenden, ju längre period krävs för att detektera den.

Här är en 15-årsperiod (1995-2009):

Jag valde den här perioden genom att utgå från perioden 1990-2009 och sedan ta bort år efter år medans konfidensintervallet blev allt bredare, tills jag fick en trend som inte var signifikant skild från 0. Det går alltid att hitta en sådan period, och hur lång den är beror på hur stor trenden är. Att det finns en sådan period betyder alltså i sig på intet sätt att vi har en "paus" i den globala uppvärmningen. För att påvisa en statistiskt signifikant "paus" så skulle man behöva visa en trend som är signifikant mindre än 0 eller något värde nära noll (t ex 0,01 °C/decennium). 

När en "klimatskeptiker" säger "det finns ingen statistiskt signifikant uppvärmning sedan år x" så har han/hon gjort samma sak som jag gjorde i den sista grafen: tagit bort år tills konfidensintervallet blivit tillräckligt stort för att innefatta 0. Det här är naturligtvis tvärt emot vad man brukar göra i vetenskapliga sammanhang: om man ligger nära men inte uppnår statistisk signifikans, så brukar det tolkas som att man behöver fler data för att kunna göra en mer exakt uppskattning.  När man planerar en statistisk studie, så försöker man säkerställa att man får tillräckligt många data för att ha en god chans att få statistisk signifikans ifall ens hypotes är riktig. Riktigt vetenskap strävar nämligen efter bättre kunskap. "Klimatskeptiker", däremot, verkar ofta söka okunskap.

*Egentligen borde man nog använda ensidiga konfidensintervall om man vill testa statistisk signifikans gentemot en 0-trend, men trendkalkylatorn stödjer tyvärr inte detta. Det förändrar i alla fall inte principen för mitt resonemang.

1 kommentar:

  1. På tal om trender så gör Tamino, sin vana trogen, det igen, en utomordentligt bra redogörelse om trendens betydelse (ni kunde kanske reposta detta blogginlägg) https://tamino.wordpress.com/2015/01/20/its-the-trend-stupid-3/

    SvaraRadera

Tips: Använd gärna signatur när du kommenterar. Det underlättar samtalet