Vaskeanvisningsskema

Kursus 02402
Introduktion til Statistik
Forelæsning 3: Kapitel 5: Kontinuerte fordelinger
Per Bruun Brockhoff
DTU Compute, Statistik og Dataanalyse
Bygning 324, Rum 220
Danmarks Tekniske Universitet
2800 Lyngby – Danmark
e-mail: perbb@dtu.dk
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
1 / 33
Oversigt
1
2
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Fordelingsfunktion
Middelværdi af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel
Eksempel
Eksempel
Eksempel
Eksempel
1
2
3
4
5: Approximation af binomialfordeling
Log-Normal fordelingen
Eksempel 6
Uniform fordelingen
Eksempel 7
3
R (R Note afsnit 4 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
2 / 33
Kontinuerte Stokastiske variable og fordelinger
Oversigt
1
2
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Fordelingsfunktion
Middelværdi af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel
Eksempel
Eksempel
Eksempel
Eksempel
1
2
3
4
5: Approximation af binomialfordeling
Log-Normal fordelingen
Eksempel 6
Uniform fordelingen
Eksempel 7
3
R (R Note afsnit 4 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
3 / 33
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Tæthedsfunktion
Tæthedsfunktionen for en stokastisk variabel betegnes
ved f (x)
f (x) siger noget om hyppigheden af udfaldet x for den
stokastiske variabel X
For kontinuerte variable svarer tætheden ikke til
sandsynligheden, dvs. f (x) 6= P (X = x)
Et godt plot af f (x) er et histogram (kontinuert)
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
4 / 33
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Tæthedsfunktion for en kontinuert variabel
For en kontinuert stokastisk variabel skrives
tæthedsfunktionen som:
f (x)
Der gælder:
f (x) > 0 for x ∈ S
f (x) = 0 for x ∈
/S
Z
∞
f (x)dx = 1
−∞
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
5 / 33
Kontinuerte Stokastiske variable og fordelinger
Fordelingsfunktion
Fordelingsfunktion
Fordelingsfunktion for en kontinuert stokastisk variabel
betegnes ved F (x).
Fordelingsfunktionen svarer til den kumulerede
tæthedsfunktion:
F (x) = P (X ≤ x)
Z
x
F (x) =
f (t)dt
t=−∞
Et godt plot for fordelingsfunktionen er den kumulative
fordeling
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
6 / 33
Kontinuerte Stokastiske variable og fordelinger
Middelværdi af en kontinuert stokastisk variabel
Middelværdi af en kontinuert stokastisk variabel
Middelværdien af en kontinuert stokastisk variabel beregnes
ved:
Z
x · f (x)dx
µ=
S
hvor S er udfaldsrummet for X
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
7 / 33
Kontinuerte Stokastiske variable og fordelinger
Varians af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Variansen af en kontinuert stokastisk variabel beregnes ved:
Z
2
σ = (x − µ)2 · f (x)dx
S
hvor S er udfaldsrummet for X
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
8 / 33
Konkrete Statistiske fordelinger
Oversigt
1
2
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Fordelingsfunktion
Middelværdi af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel
Eksempel
Eksempel
Eksempel
Eksempel
1
2
3
4
5: Approximation af binomialfordeling
Log-Normal fordelingen
Eksempel 6
Uniform fordelingen
Eksempel 7
3
R (R Note afsnit 4 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
9 / 33
Konkrete Statistiske fordelinger
Konkrete statistiske fordelinger
Der findes en række statistiske fordelinger, som kan
bruges til at beskrive og analysere forskellige
problemstillinger med
Vi betragter nu kontinuerte fordelinger
Normal fordelingen
Log-Normal fordelingen
Uniform fordelingen
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
10 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normalfordelingen
Normalfordeling
0.5
0.45
0.4
0.35
Taethed, f(x)
0.3
0.25
0.2
0.15
0.1
0.05
0
−5
−4
−3
Per Bruun Brockhoff (perbb@dtu.dk)
−2
−1
0
x
1
2
Introduktion til Statistik, Forelæsning 3
3
4
5
Foråret 2014
11 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normal fordelingen
X ∼ N (µ, σ 2 )
tæthedsfunktion: 2
(x−µ)
f (x) = σ√12π e− 2σ2
Middelværdi:
µ=µ
Varians:
σ2 = σ2
Tabel 3 for F (x)
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
12 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normalfordelingen
Normalfordeling N(0,12)
0.45
0.4
0.35
Taethed, f(x)
0.3
0.25
0.2
0.15
0.1
0.05
0
−3σ
−0.05
−5
−4
−3
Per Bruun Brockhoff (perbb@dtu.dk)
−2σ
−2
−σ
−1
µ
σ
2σ
3σ
0
x
1
2
3
Introduktion til Statistik, Forelæsning 3
4
5
Foråret 2014
13 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normalfordelingen
Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians
0.45
N(5,12)
N(0,12)
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
−0.05
−5
Per Bruun Brockhoff (perbb@dtu.dk)
0
5
Introduktion til Statistik, Forelæsning 3
10
Foråret 2014
14 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normalfordelingen
Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians
0.5
Taethed, f(x)
0.4
0.3
0.2
0.1
0
−10
−8
−6
Per Bruun Brockhoff (perbb@dtu.dk)
−4
−2
0
x
2
4
Introduktion til Statistik, Forelæsning 3
6
8
10
Foråret 2014
15 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Normal fordelingen
En normal fordeling med middelværdi 0 og varians 1, dvs
X ∼ N (0, 12 )
kaldes en standard normal fordeling
En vilkårlig normal fordelt variabel Y ∼ N (µ, σ 2 ) kan
standardiseres ved at beregne
X=
Per Bruun Brockhoff (perbb@dtu.dk)
Y −µ
σ
Introduktion til Statistik, Forelæsning 3
Foråret 2014
16 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 1
En vægt har en målefejl, E, der kan beskrives ved en
standard normalfordeling, dvs
E ∼ N (0, 12 )
dvs. middelværdi µ = 0 og spredning σ = 1 gram.
Vi måler nu vægten af ét emne
a) hvad er sandsynligheden for at vægten måler mindst 2
gram for lidt?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
17 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 1
b) hvad er sandsynligheden for at vægten måler mindst 2
gram for meget?
c) hvad er sandsynligheden for at vægten måler højst ±1
gram forkert?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
18 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 2
Det antages, at blandt en gruppe lærere i folkeskolen, at
lønnen kan beskrives ved en normalfordeling med
middelværdi µ = 280.000 og spredning σ = 10.000.
a) hvad er sandsynligheden for at en tilfældig udvalgt lærer
tjener mere end 300.000?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
19 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 3
Det antages, at blandt en gruppe lærere i folkeskolen, at
lønnen kan beskrives ved en normalfordeling med
middelværdi µ = 290.000 og spredning σ = 4.000.
a) hvad er sandsynligheden for at en tilfældig udvalgt lærer
tjener mere end 300.000?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
20 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 4
Det antages, at blandt en gruppe lærere i folkeskolen, at
lønnen kan beskrives ved en normalfordeling med
middelværdi µ = 290.000 og spredning σ = 4.000.
a) angiv det interval, der dækker over 95% af læreres løn
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
21 / 33
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel 5: Approximation af binomialfordeling
I et dosis-respons forsøg med 80 rotter antages at
sandsynligheden for at en rotte overlever forsøget er
p = 0.5.
a) hvad er sandsynligheden for at højst 30 rotter dør i
forsøget?
b) hvad er sandsynligheden for at mellem 38 og 42 rotter
dør i forsøget?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
22 / 33
Konkrete Statistiske fordelinger
Log-Normal fordelingen
Log-Normal fordelingen
X ∼ LN (α, β)
tæthedsfunktion:
(
f (x) =
2
2
√1 x−1 e−(ln(x)−α) /2β
β 2π
0
x > 0, β > 0
ellers
Middelværdi:
2
µ = eα+β /2
Varians:
2
2
σ 2 = e2α+β (eβ − 1)
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
23 / 33
Konkrete Statistiske fordelinger
Log-Normal fordelingen
Log-Normal fordelingen
Log−Normalfordeling LN(1,1)
0.25
0.2
LN(1,1)
Taethed, f(x)
0.15
0.1
0.05
0
0
5
Per Bruun Brockhoff (perbb@dtu.dk)
10
15
x
20
Introduktion til Statistik, Forelæsning 3
25
30
Foråret 2014
24 / 33
Konkrete Statistiske fordelinger
Log-Normal fordelingen
Log-Normal fordelingen
En log-normal fordelt variabel Y ∼ LN (α, β), kan
transformeres til en standard normal fordelt variabel X ved
X=
ln(Y ) − α
β
dvs.
X ∼ N (0, 12 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
25 / 33
Konkrete Statistiske fordelinger
Log-Normal fordelingen
Eksempel 6
Partikelstørrelsen (µm) i et stof kan antages at være
Log-Normal fordelt. Vi har observationerne
2.2 3.4 1.6 0.8 2.7 3.3 1.6 2.8 1.9
Vi tager logaritmen af data og får:
0.8 1.2 0.5 -0.2 1.0 1.2 0.5 1.0 0.6
Heraf beregnes x¯ = 0.733 og s = 0.44.
hvad er andelen af partikler med en størrelse i intervallet
[2; 3]
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
26 / 33
Konkrete Statistiske fordelinger
Log-Normal fordelingen
Eksempel 6
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
27 / 33
Konkrete Statistiske fordelinger
Uniform fordelingen
Uniform fordelingen
X ∼ U (α, β)
tæthedsfunktion:
f (x) =
1
β−α
Middelværdi:
µ = α+β
2
Varians:
1
σ 2 = 12
(β − α)2
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
28 / 33
Konkrete Statistiske fordelinger
Uniform fordelingen
Uniform fordelingen
Uniform fordeling U(4,5)
1
Taethed, f(x)
0.8
0.6
0.4
0.2
0
3.5
Per Bruun Brockhoff (perbb@dtu.dk)
4
4.5
x
Introduktion til Statistik, Forelæsning 3
5
5.5
Foråret 2014
29 / 33
Konkrete Statistiske fordelinger
Uniform fordelingen
Eksempel 7
Medarbejdere på en arbejdsplads ankommer mellem
klokken 8.00 og 8.30. Det antages, at ankomsttiden kan
beskrives ved en uniform fordeling.
Hvad er sandsynligheden for at en tilfældig udvalgt
medarbejder (Hans) ankommer mellem 8.20 og 8.30?
Hvad er sandsynligheden for at en tilfældig udvalgt
medarbejder (Martin) ankommer efter 8.30?
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
30 / 33
R (R Note afsnit 4 )
Oversigt
1
2
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Fordelingsfunktion
Middelværdi af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel
Eksempel
Eksempel
Eksempel
Eksempel
1
2
3
4
5: Approximation af binomialfordeling
Log-Normal fordelingen
Eksempel 6
Uniform fordelingen
Eksempel 7
3
R (R Note afsnit 4 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
31 / 33
R (R Note afsnit 4 )
R (R note afsnit 4)
R
norm
unif
lnorm
exp
Betegnelse
Normalfordelingen
Den uniforme fordeling
Log-normalfordelingen
Exponentialfordelingen
d Tæthedsfunktion f (x) (probability density function).
p Fordelingsfunktion F (x) (cumulative distribution function).
q Fraktil (quantile) i fordeling.
r Tilfældige tal fra fordelingen (Forelæsning 10).
Eksempel:
P (Z ≤ 2)
Per Bruun Brockhoff (perbb@dtu.dk)
pnorm(2)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
32 / 33
R (R Note afsnit 4 )
Oversigt
1
2
Kontinuerte Stokastiske variable og fordelinger
Tæthedsfunktion
Fordelingsfunktion
Middelværdi af en kontinuert stokastisk variabel
Varians af en kontinuert stokastisk variabel
Konkrete Statistiske fordelinger
Normalfordelingen
Eksempel
Eksempel
Eksempel
Eksempel
Eksempel
1
2
3
4
5: Approximation af binomialfordeling
Log-Normal fordelingen
Eksempel 6
Uniform fordelingen
Eksempel 7
3
R (R Note afsnit 4 )
Per Bruun Brockhoff (perbb@dtu.dk)
Introduktion til Statistik, Forelæsning 3
Foråret 2014
33 / 33