Repetition Processer Poisson Markovkedjor Tillstånd Föreläsning 16, Matematisk statistik Π + E Sören Vang Andersen 24 febuar 2015 Sören Vang Andersen - sva@maths.lth.se FMS012 F16 1/22 Repetition Processer Poisson Markovkedjor Tillstånd Multipel regression Skattningar Multipel regression Modellen yi = β0 + β1 xi1 + . . . + βk xik + εi , i = 1, . . . , n, εi ∈ N (0, σ) kan skrivas på matrisform som y = Xβ + ε där y och ε är n × 1-vektorer, β en 1 × (k + 1)-vektor och X en n × (k + 1)-matris y1 1 x11 · · · x1k β0 ε1 y2 1 x21 · · · x2k β1 .. y = . , X = . .. .. , β = .. ,ε = . .. .. .. . . . . εn yn 1 xn1 · · · xnk βk Sören Vang Andersen - sva@maths.lth.se FMS012 F16 2/22 Repetition Processer Poisson Markovkedjor Tillstånd Multipel regression Skattningar Skattning av parametrarna Skattning av β ML- och MK-skattningar av β0 , . . . , βk (elementen i β) blir β∗ = (XT X)−1 XT y βi∗ ∈ N (βi , D(βi∗ )) . D(βi∗ )2 ges av diagonalelementen i kovariansmatrisen V(β0∗ ) C(β0∗ , β1∗ ) · · · C(β0∗ , βk∗ ) C(β ∗ , β ∗ ) V(β1∗ ) · · · C(β1∗ , βk∗ ) 1 0 V(β∗ ) = σ2 (XT X)−1 = . .. .. .. .. . . . . ∗ ∗ ∗ ∗ ∗ C(βk , β0 ) C(βk , β1 ) · · · V(βk ) En väntevärdesriktig skattning av σ2 ges av (korrigerad ML) Q0 där Q0 = (y − Xβ∗ )T (y − Xβ∗ ) s2 = n − (k + 1) Sören Vang Andersen - sva@maths.lth.se FMS012 F16 3/22 Repetition Processer Poisson Markovkedjor Tillstånd Stokastisk process I En stokastisk process {X(t), t ∈ T} är en följd av stokastiska variabler, en ”slumpmässig funktion av t”. I För ett fixt t är X(t) en stokastisk variabel. I Beroende på vilka värden X(t) och t kan anta har vi följande fyra kombinationer Tid Process Diskret Kontinuerlig Diskret Kontinuerlig Sören Vang Andersen - sva@maths.lth.se FMS012 F16 4/22 Repetition Processer Poisson Markovkedjor Tillstånd Fördelning för ökningar En stokastisk process {X(t); t ∈ T} har I Oberoende ökningar om X(t2 ) − X(t1 ), X(t3 ) − X(t2 ), . . . , X(tn ) − X(tn−1 ) är oberoende för alla t1 < t2 < · · · < tn i T. I Stationära ökningar om fördelningen för X(t + h) − X(t) inte beror av t utan bara av h. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 5/22 Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess Poissonfördelning Beteckning: X ∈ Po(μ) Egenskaper: μk k = 0, 1, . . . k! V(X) = μ pX (k) = e−μ · E(X) = μ, I FX (x) finns i tabell 5 för några värden på μ. I Om X ∈ Po(μ1 ) och Y ∈ Po(μ2 ), ober. så är X + Y ∈ Po(μ1 + μ2 ) I Om μ ≥ 15 är X ungefär normalfördelad. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 6/22 Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess Poissonfördelning, X ∈ Po(μ) µ=1 µ=2 µ=5 0.4 0.2 0.04 0.3 0.15 0.03 0.2 0.1 0.02 0.1 0.05 0.01 0 0 20 40 0 µ = 10 5 0.01 0.005 0 20 20 −3 0.015 0 0 40 x 10 40 0 µ = 20 2.5 2 3 1.5 2 1 1 0.5 0 Sören Vang Andersen - sva@maths.lth.se 20 20 x 10 µ = 30 0 20 −3 4 0 0 40 FMS012 F16 0 40 40 7/22 Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess Poissonprocess En poissonprocess med intensiteten λ är en diskret s.p. med kontinuerlig tid {X(t), t ≥ 0} med följande egenskaper I Antalet händelser i icke överlappande intervall är oberoende, dvs oberoende ökningar. I X(t) ∈ Po(λ · t) I X(t) − X(s) ∈ Po(λ(t − s)), ökningar. I Tiden Y mellan ökningarna är Y ∈ Exp(λ). Sören Vang Andersen - sva@maths.lth.se 0 < s < t, dvs stationära FMS012 F16 8/22 Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess Realisering av poissonprocess, X(t) ∈ Po(λt) I Processen startar med värdet 0 då t = 0, dvs X(0) = 0 I Tidsavstånden mellan processens ökningar är Exp(λ)-fördelade. 3 tidsutvecklingar av en poissonprocess med λ = 1 10 Xi(t) 8 6 4 2 0 0 2 4 6 Sören Vang Andersen - sva@maths.lth.se 8 t 10 FMS012 F16 12 14 16 9/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Markovkedjor En markovkedja, {Xn , n = 0, 1, 2, . . .}, är en diskret stokastisk process med diskret tid. De värden processen antar kallas tillstånd och betecknas Ei eller bara i. En markovkedja uppfyller Markovvillkoret P (Xn+1 = in+1 |Xn = in , Xn−1 = in−1 , . . . , X0 = i0 ) = =P (Xn+1 = in+1 |Xn = in ) dvs sannolikheten att nästa värde skall vara in+1 beror bara på nuvarande värde. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 10/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Övergångssannolikheter Sannolikheterna pij = P (Xn+1 = j|Xn = i) kallas övergångssannolikheter och är slh att gå från tillstånd i till j i ett steg. Man brukar samla dem i en övergångsmatris p11 p12 · · · P = p21 p22 · · · .. .. .. . . . där t.ex p21 är slh att gå från tillstånd 2 till 1. Eftersom processen alltid måste gå till något tillstånd är radsummorna i P alltid 1. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 11/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Symmetrisk slumpvandring 7 6 5 X(n) 4 3 2 1 0 −1 −2 0 20 40 60 80 100 tid, n Sören Vang Andersen - sva@maths.lth.se FMS012 F16 12/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Totala antalet sexor 18 16 14 X(n) 12 10 8 6 4 2 0 0 20 40 60 80 100 tid, n Sören Vang Andersen - sva@maths.lth.se FMS012 F16 13/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Modellgraf Tillstånden och övergångssannolikheterna kan ritas i en modellgraf. För en markovkedja med tre tillstånd och nedanstående övergångsmatris blir grafen 0.1 0.6 0.6 0.4 0 P = 0.1 0.2 0.7 0.3 0 0.7 1 0.2 2 0.4 0.7 3 0.7 0.3 Sören Vang Andersen - sva@maths.lth.se FMS012 F16 14/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Övergångssannolikheter av högre ordning Övergångssannolikheterna av ordning m (m) pij = P(Xn+m = j | Xn = i) är slh att gå från i till j i m steg. Motsvarande övergångsmatris av ordning m bet. P(m) och räknas ut som P(m) = Pm . Sambandet P(m+n) = Pm Pn kallas ”Chapman-Kolmogorovs sats”. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 15/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Exempel — Övergångssannolikheter Vad är P (X2 = 2|X0 = 1) i Markovkedjan nedan? 0.1 0.6 0.6 0.4 0 P = 0.1 0.2 0.7 0.3 0 0.7 1 0.2 2 0.4 0.7 3 0.7 0.3 Sören Vang Andersen - sva@maths.lth.se FMS012 F16 16/22 Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter Absoluta sannolikheter Sannolikheterna att kedjan är i tillstånd i vid tiden n (n) pi = P(Xn = i) kan samlas i en sannolikhetsvektor (obs radvektor) (n) (n) p(n) = (p1 , p2 , . . .) Detta är alltså sannolikhetsfunktionen för Xn . Speciellt kallas p(0) för initialfördelning eller startvektor. Satsen om total sannolikhet och ”Chapman-Kolmogorovs sats” ger p(1) = p(0) P p(2) = p(1) P = p(0) P(2) p(n) = p(0) P(n) = p(n−1) P Sören Vang Andersen - sva@maths.lth.se FMS012 F16 17/22 Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning Beständiga och obeständiga tillstånd Låt fii (n) = P Återvända till tillstånd i för första gången efter n steg Då blir sannolikheten att någon gång återvända till tillstånd i fii = ∞ X fii (j) j=1 Om I fii = 1 sägs tillstånd i vara beständigt. I fii < 1 sägs tillstånd i vara obeständigt. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 18/22 Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning Kommunicerande tillstånd (r) I Om pij > 0 för något r = 1, 2, . . . sägs tillstånd i kommunicera med tillstånd j. I Om dessutom tillstånd j kommunicerar med i så kommunicerar tillstånden tvåsidigt. I Om två tillstånd kommunicerar tvåsidigt är antingen båda tillstånden beständiga eller båda obeständiga. I Om alla tillstånd kommunicerar tvåsidigt med varandra kallas Markovkedjan irreducibel, annars kallas den reducibel. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 19/22 Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning Exempel — Kommunicerande tillstånd 1. I följande Markovkedjor, vilka tillstånd är beständiga/obeständiga? 2. Är kedjorna reducibla/irreducibla? 0.3 P1 = 1 0.75 0.5 0 P3 = 0 0.5 0 0.7 0 0 0.25 0 0.5 0 0.5 0 0 0.2 0 0.8 P2 = 0.7 0 0.3 0 0 0.8 0 0.2 0.2 0.3 0 0.2 0 0.8 0 1 0 0.5 0 0 Sören Vang Andersen - sva@maths.lth.se FMS012 F16 20/22 Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning Stationär fördelning Låt π = (π1 , π2 , . . .) vara en sannolikhetsvektor. Om p(0) = π =⇒ p(n) = π, n = 1, 2, . . . kallas π en stationär fördelning. Samtliga stationära fördelningar till en markovkedja med övergångsmatris P fås som lösningarna till ekvationssystemet π = πP P tillsammans med bivillkoret πi = 1 och att 0 < πi < 1. Observera att ekvationssystemet är omvänt mot att hitta egenvektorer till egenvärde 1. Transponering ger standardfallet. PT πT = πT Sören Vang Andersen - sva@maths.lth.se FMS012 F16 21/22 Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning Asymptotisk fördelning Om p(n) → π för varje val av startvektor p(0) är π en asymptotisk fördelning. Om det existerar en asymptotisk fördelning så är den densamma som den enda stationära fördelningen. Sören Vang Andersen - sva@maths.lth.se FMS012 F16 22/22 Repetition Processer Poisson Markovkedjor Tillstånd 12 038 studenters väg genom LTH (1993-2006). % 1 2 3 4 5 6 7 8 9 Ex Av ?? Ut Uh 1 0.29 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.10 0.00 0.64 2 89.8 5.34 0.01 0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.26 0.00 1.96 3 0.01 78.9 9.16 0.02 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.28 0.00 3.56 4 0.02 0.04 83.7 8.69 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.29 0.00 2.92 5 0.00 0.00 0.30 76.4 12.2 0.01 0.01 0.03 0.00 0.00 0.00 0.43 0.14 9.15 6 0.00 0.00 0.00 0.22 79.6 17.7 0.03 0.00 0.05 0.00 0.00 0.49 1.44 4.58 7 0.00 0.00 0.00 0.01 0.44 63.6 21.9 0.03 0.02 0.00 0.00 0.56 5.91 5.23 8 0.00 0.00 0.00 0.00 0.02 0.42 68.3 19.7 0.02 0.00 0.00 0.84 14.8 1.50 9 0.00 0.00 0.00 0.00 0.00 0.05 0.26 50.6 42.2 0.00 0.00 1.60 23.2 1.05 Ex 0.00 0.00 0.00 0.02 0.05 0.53 3.30 16.2 38.7 100 0.00 1.99 5.23 0.34 Av 3.87 2.83 0.81 0.98 0.27 0.27 0.01 0.02 0.03 0.00 100 1.75 0.07 5.81 ?? 2.70 5.15 2.94 2.86 2.12 3.41 3.24 9.72 18.2 0.00 0.00 90.9 4.33 13.6 Ut 0.00 0.01 0.00 0.32 0.73 6.64 1.28 1.50 0.14 0.00 0.00 0.03 43.3 0.48 1–9: Terminsregistrerad på aktuell termin. Ex: Examen, Av: Anmält avbrott, ??: Försvunnit, Ut: Utlandsstudier, Uh: Studieuppehåll Sören Vang Andersen - sva@maths.lth.se FMS012 F16 23/22
© Copyright 2024