Hoppa till innehållet

Galton-Watson processen

Från Wikipedia

Galton-Watson-processen är en stokastisk förgreningsprocesses som ursprungligen användes av Francis Galton och Henry William Watson under den andra halvan av 1800-talet för att undersöka hur familjenamn sprider sig genom generationer, och med vilka sannolikheter olika efternamn eventuellt dör ut[1]. I modellen så sprids efternamn från fader till son, där spridningen beror på hur många söner mannen får under en generation. Om mannen inte får några söner alls så har efternamnet dött ut.

Galton-Watson-processen kan användas för att beskriva många andra slags företeelser där det sker förgreningar mellan individer, exempelvis inom populationsforskning och sjukdomsspridning.

Matematisk beskrivning

[redigera | redigera wikitext]

Galton-Watson-processen är en Markovkedja, där storleken av en viss generation bara beror på storleken av den föregående generationen samt hur många barn som föds[2]. Låt beteckna antalet individer vid generation , med , det vill säga, populationen startar med en individ. Processen kan då beskrivas efter rekursionsformeln

Ett exempel på en Galton-Watson-process som börjar med en startindivid.

där är en stokastisk variabel som betecknar antalet barn som individ födde i generation , och som för alla är fördelad efter den så kallade reproduktionsfördelningen:

Varje individ ger alltså upphov till barn med samma sannolikhet .Följden beskriver då populationens storlek efter varje generation.

Förväntad generationsstorlek efter generationer

[redigera | redigera wikitext]

Låt beteckna reproduktionsfördelningens väntevärde, det vill säga det genomsnittliga antalet avkommor som varje individ ger upphov till. Väntevärdet av ges då av . Långsiktigt, då , kan vi se att det finns tre fall för den förväntade generationsstorleken:

De tre fallen , och benämns de subkritiska, kritiska respektive superkritiska fallen för processen[1]. Väntevärdet är alltså helt avgörande för populationens tillväxt och långsiktiga utseende. Som ett exempel, antag en Galton-Watson-process vars reproduktionsfördelning är

det vill säga att varje individ dör ut med sannolikhet eller förgrenas till två delar med sannolikhet . Denna fördelning är en uppskalad Bernoullifördelning. Då blir , och processen är subkritisk om , kritisk om samt superkritisk om . Vidare ges variansen av generationsstorlekar av

[1]

Som kan ses så är variansen oändlig det i kritiska och superkritiska fallet.

Utrotningssannolikhet

[redigera | redigera wikitext]

Det är möjligt att beräkna en Galton-Watson-process utrotningssannolikhet, , genom att använda sig av sannolikhetsgenererande funktioner[1]. Låt beteckna reproduktionsfördelningens sannolikhetsgenererande funktion, det vill säga

Då är lika med den minsta icke-negativa lösningen till ekvationen [1]. I det kritiska och subkritiska fallet så gäller det oavsett reproduktionsfördelningen att , det vill säga att populationen är garanterad att eventuellt dö ut. Däremot i det superkritiska fallet så kommer vi generellt att ha , så att processen fortsätter i all evighet. Tag åter reproduktionsfördelningen

som ett exempel. Denna fördelningens sannolikhetgenererande funktion är , vilket ger ekvationen , som har lösningarna och . Mycket riktigt så är endast när , vilket är ekvivalent med att .

För att betrakta långsiktigt beteende av Galton-Watson-processen kan det också vara relevant att betrakta upprepad applicering av sannolikhetsgenererande funktionen [1]. Här är LF-fördelningen användbar för att få den genererande funktionen på en enklare form, särskilt efter upprepad applikation av funktionen[3].

Totala antalet individer

[redigera | redigera wikitext]

Det totala antalet individer ges av , där alltså betecknar antal individer i generation . För en godtycklig Galton-Watson-process så är

där är reproduktionsfördelningens väntevärde[4]. Om , till exempel, så är . Notera att utrotningssannolikheten i kritiska fallet 100% men väntevärdet av totalt antal individer i kritiska fallet är oändligt. För variansen gäller följande:[4]

I det kritiska fallet är alltså både väntevärdet och variansen oändliga. Fortsättningsvis kan ett förhållande mellan den sannolikhetsgenererande funktionen för och reproduktionsfördelningens sannolikhetsgenererande funktionen härledas[4]. Vi får

Genom att sätta får vi ekvationen att lösa för att bestämma .