F1-slides

Introduktion Exempel Sannolikhetsteori
Statistiska metoder för säkerhetsanalys
Anna Lindgren – Matematisk statistik
31 augusti 2015
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Om kursen
▶
▶
▶
Kursen ger 7.5 hp och är obligatorisk på Riskhantering.
Förutsätter en grundläggande kurs i statistik/matematisk statistik.
Hemsida:
http://www.maths.lth.se/matstat/kurser/fms065/
Lärare
▶
▶
▶
▶
▶
▶
Anna Lindgren, MH:136, tel: 046-222 42 76, e-post:
anna@maths.lth.se.
Joakim Lübeck, MH:237C, tel: 046-222 49 56, e-post:
joa@maths.lth.se.
Behnaz Pirzamanbein (övn+lab)
Danial Ali Akbari (lab)
Kurssekreterare Maria Lövgren, marial@maths.lth.se, tel:
046-222 45 77, MH:225a–b.
Kursen består av
▶
▶
▶
föreläsningar (28 timmar vid 14 tillfällen),
övningar (14 timmar vid 7 tillfällen),
obligatoriska datorövningar (12 timmar vid 6 tillfällen)
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
▶
Välj övningsgrupp via kurshemsidan.
▶
Datorövningar i Matlab bokas via kurshemsidan.
Obligatorisk närvaro.
Kurslitteratur
▶
▶
▶
För att bli godkänd på kursen krävs
▶
▶
▶
Rychlik, Rydén: Probability and Risk Analysis, An Introduction for
Engineers, Springer 2006, ISBN: 978-3-540-24223-9. Finns som
e-bok.
deltagande vid samtliga sex datorövningar,
godkänd vid skriftlig tentamen.
Tillåtna hjälpmedel vid tentamen:
▶
▶
▶
Kursens formelsamling
Formelsamling i grundkurs i matematisk statistik/statistik
Miniräknare
Tentamen torsdag 29 oktober kl. 14.00–19.00 i Sparta:A+B.
Omtentamen måndag 4 januari 2016, 8.00–13.00 i MA:8A.
Omtentamen augusti 2016 vid behov.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Syfte:
Kursen presenterar begrepp och idéer för grunderna i statistisk
behandling av risker. Tyngdpunkten ligger på förståelsen av teorin och
metoderna. Därför fokuserar kursen på tillämpningar inom risk och
säkerhetsanalys.
Eftersom uppskattningen av risker kräver att man kombinerar
information från olika källor används Bayesianska metoder flitigt inom
detta område. Därför ägnas en väsentlig del av kursen åt sådana metoder.
För att kunna analysera och prediktera förekomst och frekvens av farliga
scenarier scenarios används moderna statistiska verktyg, såsom
Poisson-regression, deviationsanalys, extremvärdesteori och
tröskelmetoder. Kännedom om sådana metoder underlättar förståelsen
av den roll sannolikhetsteori spelar i riskanalys och hur man på bästa sätt
utnyttjar resultatet från datorkörningar.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Kursens mål
Kunskap och förståelse
För godkänd kurs skall studenten
▶
kunna skatta olycksintensiteten och modellera dess beroende av
några förklarande variabler
▶
kunna identifiera situationer där osäkerheten i de framräknade
resultaten inte kan försummas, ofta i situationer där mängden
tillgänglig information är begränsad,
▶
kunna inkludera olika typer av information i en riskuppskattning
med Bayesianska metoder.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Kursens mål
Färdighet och förmåga
För godkänd kurs skall studenten
▶
kunna läsa speciallitteratur inom området risk och säkerhet där
begrepp som intensitet, sannolikhet och säkerhetsindex ofta
används,
▶
kunna kvantifiera osäkerheten i ofta förekommande riskmått,
▶
kunna validera de modeller som använts för att beräkna riskmåtten.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Kursens mål
Värderingsförmåga och förhållningssätt
För godkänd kurs skall studenten
▶
visa en större förståelse för de koncept som används inom andra
kurser i riskuppskattning,
▶
vara medveten om den roll sannolikhet spelar i riskanalys och
kunna använda programpaket på ett riktigt sätt.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Kursinnehåll
▶
Repetition av de grundläggande begreppen inom sannolikhetsteori:
oberoende, betingad sannolikhet, stokastisk variabel, täthets- och
sannolikhetsfunktion, väntevärde, varians och kovarians.
▶
Introduktion och enkla tillämpningar av Bayes sats, Centrala
gränsvärdessatsen, Stora talens lag och Små talens lag.
▶
Klassisk statistisk inferens: ML-metoden, konfidensintervall,
hypotesprövning och anpassningstest. Introduktion till bootstrap
och delta-metoden för konstruktion av konfidensintervall.
▶
Introduktion till Bayesiansk inferens: prediktiv sannolikhet,
”conjugated priors”, ”credibility interval”.
▶
Skattning av intensiteter och Poissonregression
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Formalia Syfte och Mål
Kursinnehåll (forts)
▶
Några begrepp från säkerhets- och riskanalys: felintensitet,
säkerhetsindex, karaktäristiska värdet.
▶
Skattning av kvantiler med POT-metoden.
▶
Introduktion till extremvärdesanalys: skattning av designhändelsen,
t.ex. styrkan hos 100-årsstormen, samt uppskattning av osäkerheten
hos skattningarna.
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods
Exempel: ”Stormar”
Under perioden 1900–2005 hade Sverige 26 individuella stormar där skadorna översteg
en million m3 skog. Man har noterat tidperioden (dagar) mellan dessa svåra stormar.
10
9
8
7
frekvens
6
5
4
3
2
1
0
0
500
1000
1500
2000
2500
dagar
3000
3500
4000
4500
5000
▶ Fördelning (matematisk modell) för tidpunkten mellan stormar?
▶ Sannolikheten att det är mindre än 400 dagar mellan två stormar?
▶ Med vilken ”intensitet” kommer svåra stormar?
▶ Har intensiteten ändrats under tidsperioden?
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods
Exempel: ”Årligt maxflöde”
Figuerna visar maximala årliga flödet (ft3 /s) i Feather River under
perioden 1902 till 1960. Antag att 200 ft3 /s är en ”kritisk gräns”.
300
Flöde (ft3/s)
250
200
150
100
50
0
1900
1910
1920
50
100
1930
År
1940
1950
1960
150
200
250
300
12
10
8
6
4
2
0
0
Flöde (ft3/s)
▶
Fördelning för maximalt årsflöde? Vad är ”50-årsflödet?”
▶
Sannolikheten att flödet överstiger 200 ft3 /s? Baserad på samtliga
data eller enbart på ”höga flöden”?
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods
Exempel: ”Trafikdöda”
Nedan visas antalet döda i trafiken i Sverige under perioden 1986–2005. (Källa:
Vägverket)
Antal döda i trafiken
1000
800
600
400
200
0
1985
1990
1995
2000
2005
2010
2005
2010
År
Antal döda i trafiken
1000
800
600
400
200
0
1985
1990
1995
2000
År
▶ En ”enkel linjär regressionsmodell” där antal döda antas avta linjärt med tiden
räcker tydligen ej!
▶ En mer komplicerad modell för att beskriva hur antal döda varierar i tiden
inkluderar också andra variabler (t.ex. trafikindex, antal människor, antal bilar,
antal fordonskm). Vi introducerar s.k. Poissonregression. Hur ska vi avgöra vilka
variabler den ska innehålla?
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods
Exempel: ”Utsläpp”
I en dal finns två fabriker som båda, oberoende av varandra, vissa dagar
använder en kemisk process som ger upphov till att toxiska föroreningar
sprids i luften. Användandet beror inte på veckodag eller säsong. Fabrik
E1 använder den kemiska processen 150 dagar av de totalt 260
arbetsdagarna under ett år medan fabrik E2 gör det under 30 dagar.
(a) Vad är sannolikheten att fabrik E1 sprider föroreningen i dalen en
given arbetsdag?
(b) Vad är sannolikheten att den toxiska föroreningen sprids i dalen en
given arbetsdag?
(c) En viss dag visar mätningar att den toxiska föroreningen finns i
dalen, vad är sannolikheten att det var fabrik E1 som gjorde
utsläppet?
(d) Vad är sannolikheten att föroreningen inte sprids i dalen under en
arbetsvecka om fem dagar?
(e) Vad är sannolikheten att den toxiska föroreningen sprids i dalen
minst en dag under en arbetsvecka om fem dagar?
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Stormar Maxflöde Trafikdöda Utsläpp Fraktgods
Exempel: ”Fraktgods”
När ett företag skickar fraktgods till en återförsäljare sker detta antingen
med lastbil, tåg eller flyg. 50% fraktas med lastbil, 30% med tåg och
20% med flyg. Andelen transportskadat gods är 5% med lastbil, 10%
med tåg och 2% med flyg.
(a) Hur stor andel av godset kan man räkna med får transportskador?
(b) Om man mottar ett transportskadat gods hur stor är sannolikheten
att det skickats med tåg?
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Sannolikhetsteori — Grundläggande begrepp
Utfall
Vi har ett experiment (försök) vars utfall vi inte känner.
Ex: Kasta en tärning och notera resultatet
Ex: Betrakta en industri och se om den drabbas av utsläpp
Händelse
Händelsen A är ett uttalande om utfallet.
Ex: Kasta en tärning: A = ”minst femma”
Ex: Betrakta en industri en dag: B = ”utsläpp”
Sannolikhet
P(A) = sannolikheten för A
Ex: P(A) = sannolikheten att tärningen visar minst femma
Ex: P(B) = sannolikheten att industrin drabbas av utsläpp
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Egenskaper hos P(A)
▶
0 ≤ P(A) ≤ 1
▶
Om P(A) = 0 så inträffar A aldrig
▶
Om P(A) = 1 så inträffar A alltid
▶
P(inte A) = 1 − P(A)
Frekvenstolkning
Om vi upprepar experimentet många gånger, oberoende av varandra,
kan vi tolka P(A) som relativa frekvensen:
antal femmor och sexor
Ex: P(A) = P(minst femma) =
totalt antal kast
antal dagar med utsläpp
Ex: P(B) = P(utsläpp) =
totalt antal dagar
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Additionssatsen
P(A ∪ B) = P(A) + P(B) − P(A ∩ B) dvs
P(minst en av A och B inträffar) =
= P(A inträffar) + P(B inträffar) − P(både A och B inträffar)
Oberoende
▶
Om A och B är oberoende så är P(A ∩ B) = P(A) ⋅ P(B).
▶
Om P(A ∩ B) = P(A) ⋅ P(B) så är A och B är oberoende.
Betingad sannolikhet
Vi vet att A inträffade. Vad är då sannolikheten att B (också) inträffar?
P(B ∣ A) =
P(A ∩ B)
P(A)
A och B oberoende ger P(B ∣ A) = P(B).
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Satsen om total sannolikhet
Om händelserna A1 ,. . . ,An inte kan inträffa samtidigt och tillsammans
fyller upp hela utfallsrummet så gäller att
P(B) =
n
∑
P(B ∣ Ai ) ⋅ P(Ai )
i=1
Ex: Fraktgods (a)
P(lastbil) = 0.5, P(tåg) = 0.3, P(flyg) = 0.2,
P(skada ∣ lastbil) = 0.05, P(skada ∣ tåg) = 0.10,
P(skada ∣ flyg) = 0.02.
P(skada) = P(skada ∣ lastbil) ⋅ P(lastbil) + P(skada ∣ tåg) ⋅ P(tåg) +
+ P(skada ∣ flyg) ⋅ P(flyg)
= 0.05 ⋅ 0.5 + 0.10 ⋅ 0.3 + 0.02 ⋅ 0.2 = 0.059
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Bayes sats
Utnyttja att definitionen av betingad sannolikhet medför att
P(B ∣ A) ⋅ P(A) = P(B ∩ A) = P(A ∣ B) ⋅ P(B)
P(A ∣ B) =
P(B ∣ A) ⋅ P(A)
P(B)
Ex: Fraktgods (b)
P(skada ∣ tåg) ⋅ P(tåg)
P(skada ∩ tåg)
=
P(skada)
P(skada)
0.10 ⋅ 0.3
=
0.05 ⋅ 0.5 + 0.10 ⋅ 0.3 + 0.02 ⋅ 0.2
0.03
=
= 0.51
0.059
P(tåg ∣ skada) =
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Odds
För två händelser A1 och A2 är oddsen två positiva tal q1 och q2 så att
P(A1 )
q1
=
q2
P(A2 )
För flera uteslutande händelser A1 ,. . . ,An :
qi
P(Ai )
qi
=
P(Ai ) =
qj
P(Aj )
q1 + ⋅ ⋅ ⋅ + qn
Ex: Fraktgods
Vi har ett gods, vad är oddsen för lastbil, tåg resp. flyg?
P(lastbil)
0.5
5
=
= ,
P(tåg)
0.3
3
P(lastbil)
0.5
5
=
= ,
P(flyg)
0.2
2
Oddsen för lastbil : tåg : flyg är 5 : 3 : 2
Anna Lindgren - anna@maths.lth.se
P(tåg)
0.3
3
=
=
P(flyg)
0.2
2
eller 10 : 6 : 4 eller . . .
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Ex: Fraktgods (forts)
Antag nu att vi får ny information, nämligen att godset är skadat, vad är
då oddsen för lastbil, tåg resp. flyg?
Betingade sannolikheter!
P(lastbil)
P(skadat ∣ lastbil) ⋅ P(skadat)
P(lastbil ∣ skadat)
=
P(tåg)
P(tåg ∣ skadat)
P(skadat ∣ tåg) ⋅ P(skadat) )
=
P(skadat ∣ lastbil) P(lastbil)
⋅
P(skadat ∣ tåg)
P(tåg)
| {z }
gamla oddset 5:3
P(lastbil ∣ skadat)
= ...
P(flyg ∣ skadat)
Anna Lindgren - anna@maths.lth.se
P(tåg ∣ skadat)
= ...
P(flyg ∣ skadat)
Statistiska metoder för säkerhetsanalys
Introduktion Exempel Sannolikhetsteori
Grundläggande begrepp Odds
Ex: Fraktgods (forts)
Uppdaterade odds:
post
prior
qlastbil = P(skadat ∣ lastbil) ⋅ qlastbil = 0.05 ⋅ 5 = 0.25
post
prior
qtåg = P(skadat ∣ tåg) ⋅ qtåg = 0.10 ⋅ 3 = 0.30
post
prior
qflyg = P(skadat ∣ flyg) ⋅ qflyg = 0.02 ⋅ 2 = 0.04
Nya oddsen för lastbil : tåg : flyg är 25 : 30 : 4
A priori och a posteriori odds
Vi har sinsemellan uteslutande händelser A1 ,. . . ,An .
prior
prior
Gamla odds q1 , . . . , qn kallas a priori odds.
Nya odds, när vi fått information om att händelsen B har inträffat,
post
post
q1 , . . . , qn kallas a posteriori odds där
post
qi
prior
= P(B ∣ Ai ) ⋅ qi
Anna Lindgren - anna@maths.lth.se
Statistiska metoder för säkerhetsanalys