Föreläsning 10, Matematisk statistik för M

Repetition Linjära modellen
Föreläsning 10, Matematisk statistik för M
Erik Lindström
27 april 2015
Erik Lindström - erikl@maths.lth.se
FMS035 F10
1/12
Repetition Linjära modellen
Repetition
Två Stickprov
Stickprov i par
Linjära modellen
Residualer
Erik Lindström - erikl@maths.lth.se
FMS035 F10
2/12
Repetition Linjära modellen
Två Stickprov Stickprov i par
Två Stickprov
Antag att man vill jämföra medelvärden μx och μy , då data ges
som observationer från X1 , . . . , Xnx ∈ N(μx , σ2 ) och
Y1 , . . . , Ynx ∈ N(μy , σ2 ). Vi har att
!
2
2
sigma
σ
y
¯ − Ȳ ∈ N x̄ − ȳ, x +
6X
nx
ny
Erik Lindström - erikl@maths.lth.se
FMS035 F10
3/12
Repetition Linjära modellen
Två Stickprov Stickprov i par
Stickprov i par
Vid många mätsituationer är det vanligt att man mäter före
och efter en “behandling” på n inbördes olika föremål.
Modell:
Före: Xi ∈ N μi , σ21
Efter: Yi ∈ N μi + Δ, σ22
Vi vill nu skatta effekten av behandlingen
(Δ). Bilda
Zi = Yi − Xi ∈ N Δ, σ21 + σ22 .
Erik Lindström - erikl@maths.lth.se
FMS035 F10
4/12
Repetition Linjära modellen
Residualer
Linjär modell
Standardmodellen ges av
yi = α + βxi + εi
= α + βxi + εi ± β x̄
(1)
= α̃ + β x̃i + εi
(3)
= (α + β x̄) + β(xi − x̄) + εi
Notera att
P
i x̃i
(2)
= 0.
Erik Lindström - erikl@maths.lth.se
FMS035 F10
5/12
Repetition Linjära modellen
Residualer
Anpassa parametrar
Parametrar anpassas genom att minimera
α̂, β̂ = arg min
N
X
i=1
(yi − α − βxi )2
Formler i boken/formelsamplingen Sxx , Sxy , Syy
Erik Lindström - erikl@maths.lth.se
FMS035 F10
6/12
I detta avsnitt kommer vi illustrera teorin med hjälp av två dataset: mätningarna från
Repetition Linjära modellen
Residualer
exempel 1.1 om
bensinförbrukning hos bilar samt
mätningar av SO2 -halt i luft.
Exempel
2.1. Inom miljöövervakningsprogrammet EMEP har man under en
Hoburgen
data
lång period mätt årsmedelhalter av SO (µg/m ) i Hoburgen på Gotland. I
3
2
figur 3 visas halterna under åren 1990-2001 (källa: IVL Svenska Miljöinstitutet
AB, www.ivl.se).
1.8
1.6
1.4
SO2−halt
1.2
1
0.8
0.6
0.4
0.2
0
1990
1992
1994
1996
1998
2000
2002
år
Figur 3: Mätningar vid Hoburgen på Gotland y = ”SO2 -halt” (µg/m3 ) är plottad mot
x = ”år”.
2.1
Intressanta frågeställningar
Det finns en mängd frågeställningar kring den beskrivna situationen som är intressanta:
Erik Lindström - erikl@maths.lth.se
FMS035 F10
7/12
Repetition Linjära modellen
Residualer
Bra residualer
Residualer mot x
10
5
5
0
0
e
e
Residualer
10
−5
−5
−10
0
10
20
30
−10
0
1:n
Erik Lindström - erikl@maths.lth.se
10
20
30
x
FMS035 F10
8/12
Repetition Linjära modellen
Residualer
Mer bra residualer
Probability
Normal Probability Plot
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
−5
0
Data
Erik Lindström - erikl@maths.lth.se
5
FMS035 F10
9/12
Repetition Linjära modellen
Residualer
Mindre bra residualer
Residualer, kvadratisk trend
Residualer mot x, variansen ökar med x
300
100
200
50
e
e
100
0
0
−100
−50
0
10
20
30
−200
0
1:n
Erik Lindström - erikl@maths.lth.se
10
20
30
x
FMS035 F10
10/12
Repetition Linjära modellen
Residualer
Moores lag - Ingen linjära modell
8
5
x 10
Skattat samband: y = 5.13⋅10−301⋅ e0.35 x
4.5
4
Antal transistorer
3.5
3
2.5
2
1.5
1
0.5
0
1970
1980
1990
2000
Lanseringsår
Erik Lindström - erikl@maths.lth.se
2010
FMS035 F10
2020
11/12
Repetition Linjära modellen
Residualer
Moores lag - Ingen linjära modell
Antal transistorer hos Intelprocessorer
9
10
Intel® Itanium® 2
Intel® Itanium®
8
10
Intel® Pentium® 4
Intel® Pentium® III
7
Antal transistorer
10
Intel® Pentium® II
Intel® Pentium®
Intel486TM
6
10
Intel386TM
5
286
10
8086
4
10
3
10
8080
8008
4004
2
10
1970
1980
1990
2000
Lanseringsår
Erik Lindström - erikl@maths.lth.se
2010
FMS035 F10
2020
12/12