Föreläsning 16, Matematisk statistik +E

Repetition Processer Poisson Markovkedjor Tillstånd
Föreläsning 16, Matematisk statistik Π + E
Sören Vang Andersen
24 febuar 2015
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
1/22
Repetition Processer Poisson Markovkedjor Tillstånd Multipel regression Skattningar
Multipel regression
Modellen
yi = β0 + β1 xi1 + . . . + βk xik + εi , i = 1, . . . , n, εi ∈ N (0, σ)
kan skrivas på matrisform som
y = Xβ + ε
där y och ε är n × 1-vektorer, β en 1 × (k + 1)-vektor och X en
n × (k + 1)-matris




 
 
y1
1 x11 · · · x1k
β0
ε1
 y2 
1 x21 · · · x2k 
β1 
 


 
 .. 
y =  .  , X = .
..
..  , β =  ..  ,ε =  . 
..
 .. 
 ..
.
.
.
. 
εn
yn
1 xn1 · · · xnk
βk
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
2/22
Repetition Processer Poisson Markovkedjor Tillstånd Multipel regression Skattningar
Skattning av parametrarna
Skattning av β
ML- och MK-skattningar av β0 , . . . , βk (elementen i β) blir
β∗ = (XT X)−1 XT y
βi∗ ∈ N (βi , D(βi∗ )) .
D(βi∗ )2 ges av diagonalelementen i kovariansmatrisen


V(β0∗ )
C(β0∗ , β1∗ ) · · · C(β0∗ , βk∗ )
C(β ∗ , β ∗ )
V(β1∗ )
· · · C(β1∗ , βk∗ )
1 0


V(β∗ ) = σ2 (XT X)−1 = 
.
..
..
..
..


.
.
.
.
∗
∗
∗
∗
∗
C(βk , β0 ) C(βk , β1 ) · · ·
V(βk )
En väntevärdesriktig skattning av σ2 ges av (korrigerad ML)
Q0
där Q0 = (y − Xβ∗ )T (y − Xβ∗ )
s2 =
n − (k + 1)
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
3/22
Repetition Processer Poisson Markovkedjor Tillstånd
Stokastisk process
I
En stokastisk process {X(t), t ∈ T} är en följd av
stokastiska variabler, en ”slumpmässig funktion av t”.
I
För ett fixt t är X(t) en stokastisk variabel.
I
Beroende på vilka värden X(t) och t kan anta har vi
följande fyra kombinationer
Tid
Process
Diskret Kontinuerlig
Diskret
Kontinuerlig
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
4/22
Repetition Processer Poisson Markovkedjor Tillstånd
Fördelning för ökningar
En stokastisk process {X(t); t ∈ T} har
I
Oberoende ökningar om
X(t2 ) − X(t1 ), X(t3 ) − X(t2 ), . . . , X(tn ) − X(tn−1 )
är oberoende för alla t1 < t2 < · · · < tn i T.
I
Stationära ökningar om fördelningen för X(t + h) − X(t)
inte beror av t utan bara av h.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
5/22
Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess
Poissonfördelning
Beteckning: X ∈ Po(μ)
Egenskaper:
μk
k = 0, 1, . . .
k!
V(X) = μ
pX (k) = e−μ ·
E(X) = μ,
I
FX (x) finns i tabell 5 för några värden på μ.
I
Om X ∈ Po(μ1 ) och Y ∈ Po(μ2 ), ober. så är
X + Y ∈ Po(μ1 + μ2 )
I
Om μ ≥ 15 är X ungefär normalfördelad.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
6/22
Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess
Poissonfördelning, X ∈ Po(μ)
µ=1
µ=2
µ=5
0.4
0.2
0.04
0.3
0.15
0.03
0.2
0.1
0.02
0.1
0.05
0.01
0
0
20
40
0
µ = 10
5
0.01
0.005
0
20
20
−3
0.015
0
0
40
x 10
40
0
µ = 20
2.5
2
3
1.5
2
1
1
0.5
0
Sören Vang Andersen - sva@maths.lth.se
20
20
x 10
µ = 30
0
20
−3
4
0
0
40
FMS012 F16
0
40
40
7/22
Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess
Poissonprocess
En poissonprocess med intensiteten λ är en diskret s.p. med
kontinuerlig tid {X(t), t ≥ 0} med följande egenskaper
I
Antalet händelser i icke överlappande intervall är
oberoende, dvs oberoende ökningar.
I
X(t) ∈ Po(λ · t)
I
X(t) − X(s) ∈ Po(λ(t − s)),
ökningar.
I
Tiden Y mellan ökningarna är Y ∈ Exp(λ).
Sören Vang Andersen - sva@maths.lth.se
0 < s < t, dvs stationära
FMS012 F16
8/22
Repetition Processer Poisson Markovkedjor Tillstånd Poissonprocess
Realisering av poissonprocess, X(t) ∈ Po(λt)
I
Processen startar med värdet 0 då t = 0, dvs X(0) = 0
I
Tidsavstånden mellan processens ökningar är
Exp(λ)-fördelade.
3 tidsutvecklingar av en poissonprocess med λ = 1
10
Xi(t)
8
6
4
2
0
0
2
4
6
Sören Vang Andersen - sva@maths.lth.se
8
t
10
FMS012 F16
12
14
16
9/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Markovkedjor
En markovkedja, {Xn , n = 0, 1, 2, . . .}, är en diskret stokastisk
process med diskret tid. De värden processen antar kallas
tillstånd och betecknas Ei eller bara i.
En markovkedja uppfyller Markovvillkoret
P (Xn+1 = in+1 |Xn = in , Xn−1 = in−1 , . . . , X0 = i0 ) =
=P (Xn+1 = in+1 |Xn = in )
dvs sannolikheten att nästa värde skall vara in+1 beror bara på
nuvarande värde.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
10/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Övergångssannolikheter
Sannolikheterna
pij = P (Xn+1 = j|Xn = i)
kallas övergångssannolikheter och är slh att gå från tillstånd i
till j i ett steg.
Man brukar samla dem i en övergångsmatris


p11 p12 · · ·


P = p21 p22 · · ·
..
..
..
.
.
.
där t.ex p21 är slh att gå från tillstånd 2 till 1. Eftersom
processen alltid måste gå till något tillstånd är radsummorna i
P alltid 1.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
11/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Symmetrisk slumpvandring
7
6
5
X(n)
4
3
2
1
0
−1
−2
0
20
40
60
80
100
tid, n
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
12/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Totala antalet sexor
18
16
14
X(n)
12
10
8
6
4
2
0
0
20
40
60
80
100
tid, n
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
13/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Modellgraf
Tillstånden och övergångssannolikheterna kan ritas i en
modellgraf. För en markovkedja med tre tillstånd och
nedanstående övergångsmatris blir grafen
0.1
0.6


0.6 0.4 0
P = 0.1 0.2 0.7
0.3 0 0.7
1
0.2
2
0.4
0.7
3
0.7
0.3
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
14/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Övergångssannolikheter av högre ordning
Övergångssannolikheterna av ordning m
(m)
pij
= P(Xn+m = j | Xn = i)
är slh att gå från i till j i m steg. Motsvarande övergångsmatris
av ordning m bet. P(m) och räknas ut som P(m) = Pm .
Sambandet
P(m+n) = Pm Pn
kallas ”Chapman-Kolmogorovs sats”.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
15/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Exempel — Övergångssannolikheter
Vad är P (X2 = 2|X0 = 1) i Markovkedjan nedan?
0.1
0.6


0.6 0.4 0
P = 0.1 0.2 0.7
0.3 0 0.7
1
0.2
2
0.4
0.7
3
0.7
0.3
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
16/22
Repetition Processer Poisson Markovkedjor Tillstånd Modellgraf Övergångssannolikheter
Absoluta sannolikheter
Sannolikheterna att kedjan är i tillstånd i vid tiden n
(n)
pi
= P(Xn = i)
kan samlas i en sannolikhetsvektor (obs radvektor)
(n)
(n)
p(n) = (p1 , p2 , . . .)
Detta är alltså sannolikhetsfunktionen för Xn . Speciellt kallas
p(0) för initialfördelning eller startvektor.
Satsen om total sannolikhet och ”Chapman-Kolmogorovs sats”
ger
p(1) = p(0) P
p(2) = p(1) P = p(0) P(2)
p(n) = p(0) P(n) = p(n−1) P
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
17/22
Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning
Beständiga och obeständiga tillstånd
Låt
fii (n) = P
Återvända till tillstånd i
för första gången efter n steg
Då blir sannolikheten att någon gång återvända till tillstånd i
fii =
∞
X
fii (j)
j=1
Om
I
fii = 1 sägs tillstånd i vara beständigt.
I
fii < 1 sägs tillstånd i vara obeständigt.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
18/22
Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning
Kommunicerande tillstånd
(r)
I
Om pij > 0 för något r = 1, 2, . . . sägs tillstånd i
kommunicera med tillstånd j.
I
Om dessutom tillstånd j kommunicerar med i så
kommunicerar tillstånden tvåsidigt.
I
Om två tillstånd kommunicerar tvåsidigt är antingen båda
tillstånden beständiga eller båda obeständiga.
I
Om alla tillstånd kommunicerar tvåsidigt med varandra
kallas Markovkedjan irreducibel, annars kallas den
reducibel.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
19/22
Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning
Exempel — Kommunicerande tillstånd
1. I följande Markovkedjor, vilka tillstånd är
beständiga/obeständiga?
2. Är kedjorna reducibla/irreducibla?

0.3
P1 =  1
0.75

0.5
0
P3 = 
0
0.5

0
0.7
0
0
0.25 0


0.5 0 0.5 0
 0 0.2 0 0.8

P2 = 
0.7 0 0.3 0 
0 0.8 0 0.2

0.2 0.3 0
0.2 0 0.8

0
1
0
0.5 0
0
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
20/22
Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning
Stationär fördelning
Låt π = (π1 , π2 , . . .) vara en sannolikhetsvektor. Om
p(0) = π
=⇒
p(n) = π,
n = 1, 2, . . .
kallas π en stationär fördelning.
Samtliga stationära fördelningar till en markovkedja med
övergångsmatris P fås som lösningarna till ekvationssystemet
π = πP
P
tillsammans med bivillkoret
πi = 1 och att 0 < πi < 1.
Observera att ekvationssystemet är omvänt mot att hitta
egenvektorer till egenvärde 1. Transponering ger standardfallet.
PT πT = πT
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
21/22
Repetition Processer Poisson Markovkedjor Tillstånd Beständiga Kommunicerande Stationär fördelning
Asymptotisk fördelning
Om p(n) → π för varje val av startvektor p(0) är π en
asymptotisk fördelning.
Om det existerar en asymptotisk fördelning så är den
densamma som den enda stationära fördelningen.
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
22/22
Repetition Processer Poisson Markovkedjor Tillstånd
12 038 studenters väg genom LTH (1993-2006).
%
1
2
3
4
5
6
7
8
9
Ex
Av
??
Ut
Uh
1
0.29
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.10
0.00
0.64
2
89.8
5.34
0.01
0.01
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.26
0.00
1.96
3
0.01
78.9
9.16
0.02
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.28
0.00
3.56
4
0.02
0.04
83.7
8.69
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.29
0.00
2.92
5
0.00
0.00
0.30
76.4
12.2
0.01
0.01
0.03
0.00
0.00
0.00
0.43
0.14
9.15
6
0.00
0.00
0.00
0.22
79.6
17.7
0.03
0.00
0.05
0.00
0.00
0.49
1.44
4.58
7
0.00
0.00
0.00
0.01
0.44
63.6
21.9
0.03
0.02
0.00
0.00
0.56
5.91
5.23
8
0.00
0.00
0.00
0.00
0.02
0.42
68.3
19.7
0.02
0.00
0.00
0.84
14.8
1.50
9
0.00
0.00
0.00
0.00
0.00
0.05
0.26
50.6
42.2
0.00
0.00
1.60
23.2
1.05
Ex
0.00
0.00
0.00
0.02
0.05
0.53
3.30
16.2
38.7
100
0.00
1.99
5.23
0.34
Av
3.87
2.83
0.81
0.98
0.27
0.27
0.01
0.02
0.03
0.00
100
1.75
0.07
5.81
??
2.70
5.15
2.94
2.86
2.12
3.41
3.24
9.72
18.2
0.00
0.00
90.9
4.33
13.6
Ut
0.00
0.01
0.00
0.32
0.73
6.64
1.28
1.50
0.14
0.00
0.00
0.03
43.3
0.48
1–9: Terminsregistrerad på aktuell termin.
Ex: Examen, Av: Anmält avbrott, ??: Försvunnit, Ut: Utlandsstudier, Uh:
Studieuppehåll
Sören Vang Andersen - sva@maths.lth.se
FMS012 F16
23/22