Todennäköisyyslaskenta Opintomoniste kurssille MAT-02500 Todennäköisyyslaskenta, Tampereen teknillinen yliopisto Antti Perttula, Kimmo Vattulainen, Tia Suurhasko Versio 9/2012 Sisältö 1 Todennäköisyys 1.1 Peruskäsitteitä . . . . . . . . . . . . . . 1.2 Tilastollinen ja klassinen todennäköisyys 1.3 Todennäköisyyslaskennan aksiomat . . . 1.4 Ehdollinen todennäköisyys . . . . . . . . 1.5 Kokonaistodennäköisyys ja Bayesin kaava 1.6 Tapahtumien riippumattomuus . . . . . 2 Todennäköisyysjakaumia 2.1 Empiirisen otoksen kuvailua . . . . . . . 2.2 Diskreetin satunnaismuuttujan jakauma 2.3 Jatkuvan satunnaismuuttujan jakauma . 2.4 Odotusarvo, varianssi ja keskihajonta . . 2.5 Satunnaismuuttujan funktiot . . . . . . . 2.6 Satunnaismuuttujan funktion odotusarvo 2.7 Tsebyshevin epäyhtälö . . . . . . . . . . 2.8 Momentit generoiva funktio . . . . . . . 2.9 Binomijakauma . . . . . . . . . . . . . . 2.10 Poisson jakauma . . . . . . . . . . . . . 2.11 Normaalijakauma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Yhteisjakaumat ja satunnaismuuttujien funktiot 3.1 Diskreetin satunnaisvektorin jakauma . . . . . . . 3.2 Jatkuvan satunnaisvektorin jakauma . . . . . . . 3.3 Marginaalijakaumat . . . . . . . . . . . . . . . . . 3.4 Satunnaismuuttujien riippumattomuus . . . . . . 3.5 Satunnaismuuttujien funktion odotusarvo . . . . . 3.6 Riippumattomien satunnaismuuttujien summa . . 3.7 Kovarianssi, korrelaatio ja summan varianssi . . . 3.8 Otoskeskiarvon jakauma . . . . . . . . . . . . . . 3.9 Keskeinen raja-arvolause . . . . . . . . . . . . . . 3.10 Tilastollinen testaaminen . . . . . . . . . . . . . . 3.11 χ2 -jakauma ja otosvarianssi . . . . . . . . . . . . 3.12 t- ja F-jakaumat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 5 9 12 13 15 . . . . . . . . . . . 18 18 20 25 28 31 34 36 37 39 42 45 . . . . . . . . . . . . 48 48 49 51 53 56 59 60 64 66 70 72 76 Liite 1. Todennäköisyysjakaumia 80 Liite 2. Jakaumataulukoita 93 2 1 1.1 Todennäköisyys Peruskäsitteitä Todennäköisyyslaskennan tavoitteena on kehittää satunnaisluonteisten ilmiöiden kuvaamiseen soveltuvia matemaattisia malleja. Mallintamisen kohde on satunnaisilmiöön liittyvä koe (satunnaiskoe) (random experiment), jonka lopputulosta ei saada selville laskemalla ja päättelemällä vaan tuloksen määrää ”sattuma”. Tavoitteena on malli, jolla voitaisiin mahdollisimman totuudenmukaisesti ennustaa kokeen tuloksia. Jotta mallintaminen on mahdollista, vaaditaan, että koe voidaan toistaa ja koetoistot ovat riippumattomia, ja että koetoistoissa esiintyy tilastollista säännönmukaisuutta; yksityisten tulosten suhteelliset frekvenssit näyttävät koetoistojen lukumäärän kasvaessa stabilisoituvan. Kokeen tulokset eivät välttämättä ole lukuja. Funktiota, joka liittää reaaliluvun tai reaalilukuvektorin jokaiseen koetulokseen, sanotaan satunnaismuuttujaksi (random variable). Tässä monisteessa satunnaismuuttujat usein ilmoitetaan suoraan kokeen numeerisena (numeeriseksi koodattuna) tuloksena, jolloin funktiotulkintaa ei käytetä. Satunnaismuuttujia merkitään isoilla kirjaimilla X, Y, . . . ja satunnaismuuttujan arvoja vastaavilla pienillä kirjaimilla x, y, . . . . Esimerkki 1.1.1. Olkoon rahanheitto satunnaiskoe. Kokeen tulos on päälle jäävä kolikon puoli, klaava tai kruunu. Koodataan klaava numeroksi 1 ja kruunu numeroksi 2. Näin saadaan satunnaismuuttuja X=rahanheitos tulos, jonka mahdollisia arvoja ovat 1 ja 2. Esimerkki 1.1.2. Satunnaisesti valitun henkilön ”ominaisvektori” (X1 , X2 , X3 ), missä X1 on sukupuoli (1=mies, 2= nainen), X2 on pituus (m) ja X3 on paino (kg), on satunnaisvektori (random vector). Sen komponentit ovat skalaarisia satunnaismuuttujia. Komponenteista X2 ja X3 riippuva ”painoindeksi” Z = X3 /X2 2 on myös satunnaismuuttuja. Kokeen mahdollista yksittäistä koetulosta sanotaan alkeistapaukseksi (sample point). Kaikkien mahdollisten alkeistapausten joukko on otosavaruus (sample space) Ω. Otosavaruuden osajoukko A ⊂ Ω on tapahtuma (event). Olkoon A ⊂ Ω. Sanotaan, että kokeessa realisoituu tapahtuma A, jos koetulos on A:n alkio. Myös otosavaruus Ω ja tyhjä joukko ∅ ovat otosavaruuden osajoukkoja ja siis tapahtumia. Otosavaruus Ω itse on ”varma tapahtuma”. ”Mahdotonta tapahtumaa” merkitään tyhjän joukon symbolilla ∅; onhan ∅ joukko, jossa ei ole ainuttakaan alkeistapausta. 3 Esimerkki 1.1.3. Olkoon satunnaiskoe nopanheitto ja kokeeseen liittyvä satunnaismuuttuja X=’päällimäiseksi jäävä silmäluku’. Sen otosavaruus Ω = {1, 2, 3, 4, 5, 6}. A = {2, 4, 6} = ’parillinen silmäluku’ on eräs tapahtuma. Jos heiton tulos X = 2, niin A realisoitui. Tästä samasta nopanheitosta voidaan muodostaa myös muita satunnaismuuttujia, esim. Y =’suurin näkyvissä olevista silmäluvuista’. Piiloon jää vain alapuolinen silmäluku, joten aina on näkyvissä 5 sivutahkoa. Silmäluku 6 on suurin paitsi, jos se on alapuolella. Silloin 5 on suurin. Satunnaismuuttujan Y otosavaruus on siis ΩY = {5, 6}. Usein haluttu tapahtuma täytyy esittää usean tapahtuman lausekkeena käyttämällä joukkoopin operaatioita. Kerrataan joukko-opin perusoperaatiot ja annetaan niille todennäköisyyslaskennan tapahtumakuvaus sekä graafinen esitys ns. Venn-diagrammeina. • Tapahtuman A komplementtitapahtuma A (complement, muita merkintöjä: A0 , AC , C(A)) A = Ω \ A = {x ∈ Ω : x ∈ / A} =”A ei realisoidu” Jos A ja B ovat tapahtumia, niin tapahtumia ovat myös • Tapahtumien A ja B yhdiste eli unioni (union) A ∪ B = {x ∈ Ω : x ∈ A tai x ∈ B}=”A tai B realisoituu” • Tapahtumien A ja B leikkaus (intersection) A ∩ B = {x ∈ Ω : x ∈ A, x ∈ B} =”A ja B realisoituu” • Tapahtumien A ja B erotus (difference) (muita merkintöjä: A − B) A \ B = A ∩ B = {x ∈ Ω : x ∈ A, x ∈ / B} =”A realisoituu mutta B ei” • Tapahtumien A ja B sanotaan olevan erillisiä (disjoint) eli toisensa poissulkevia (mutually exclusive), jos A:lla ja B:llä ei ole yhteisiä alkeistapauksia eli jos A ∩ B = ∅ 4 Esimerkki 1.1.4. Venn-diagrammien avulla voidaan todeta oikeiksi (harjoitustehtävänä) deMorganin lait A ∪ B = A ∩ B, A ∩ B = A ∪ B Kokeen mallintamisessa pyritään löytämään satunnaismuuttujan todennäköisyysjakauma (probability distribution), jolla voidaan ennustaa tapahtumien realisoituminen luvulla. Todennäköisyysjakaumista kerrotaan luvussa 2. Todennäköisyysmitta (probability measure) P on funktio, joka liittää jokaiseen tapahtumaan luvun väliltä [0, 1]. Todennäköisyysmitan arvo P (X ∈ A) tai vain lyhyesti P (A) on tapahtuman A todennäköisyys (probability). 1.2 Tilastollinen ja klassinen todennäköisyys Arkikielessä todennäköisyydestä voidaan puhua, vaikka taustalla ei olisikaan mitään toistettavissa olevaa koetta tai havaintoa. Tällöin kyse on lähinnä puhujan uskosta, millä todennäköisyydellä jokin tapahtuu, esim. ”99%:n todennäköisyydellä pääsen läpi tentistä”. Miten sitten voidaan määrittää tapahtuman todennäköisyys? Tässä kappaleessa määritellään kaksi todennäköisyyden määritelmää, jotka vastaavat hyvin sitä intuitiivista käsitystä, mitä sanalla todennäköisyys ymmärretään. Määritelmät eivät ole matemaattisesti täsmällisiä. Sellainen määritellään seuraavassa kappaleessa 1.3. Tilastollinen todennäköisyys Frekvenssitulkinta. Kun sama koe suoritetaan n kertaa samoissa olosuhteissa, puhutaan n-toistokokeesta. Merkitään fn (A):lla tapahtuman A realisoitumisen frekvenssiä n-toistokokeessa. Suhde fn (A) pn (A) = n on tapahtuman A suhteellinen frekvenssi (relative frequency). Frekvenssitulkinnassa määritellään tapahtuman A tilastollinen todennäköisyys (statistical probability) suhteellisen frekvenssin ”raja-arvona”, kun koetoistojen lukumäärä n kasvaa rajatta: P (A) = ” lim ” pn (A) n→∞ Frekvenssitulkinta todennäköisyysmitalle ei ole matemaattisesti tyydyttävä. Miten määritellään esim. äärettömän pitkä koetoistojen sarja tai suhteellisten frekvenssien muodostaman jonon suppeneminen? 5 Sovellutuksissa frekvenssitulkintaa voidaan käyttää. Reaalimaailmassa on runsaasti kokeita tai havaintoja, joissa tarkasteltavan tapahtuman suhteellinen frekvenssi ”tuntuu” suppenevan; n-toistokokeissa suurilla n:n arvoilla n1 , n2 , . . . , nk tapahtuman A suhteelliset frekvenssit pn1 (A), pn2 (A), . . . , pnk (A) poikkeavat toisistaan hyvin vähän. Soveltajan tehtävänä on arvioida suhteellisen frekvenssin ”raja-arvolle” mahdollisimman tarkka arvo. Raja-arvon arviointi helpottuu, jos koetta voidaan simuloida ja toistaa tietokoneilla. Monet käytännön elämän tapahtumien todennäköisyydet ovat juuri tilastollisia todennäköisyyksiä, sillä ne perustuvat havainnoista tehtyihin tilastoaineistoihin. Esim. jos väitetään, että kone rikkuu takuuaikanaan todennäköisyydellä 0.01, on tiedon perusteena tavallisesti pitkäaikainen seuranta, että keskimäärin yksi sadasta koneesta on rikkoontunut takuuaikanaan ja että jatkossakin oletetaan rikkoontumisen noudattavan tätä säännönmukaisuutta. Klassinen todennäköisyys Olkoon kokeen otosavaruudessa äärellinen määrä N alkeistapausta Ω = {a1 , a2 , . . . , aN }, jotka ovat kaikki yhtä mahdollisia. Tapahtuman A ⊂ Ω klassinen todennäköisyys on P (A) = card(A) N missä card(A) tarkoittaa A:n alkioiden lukumäärää (cardinality) eli tapahtumalle A suotuisten (favourable) alkeistapausten lukumäärää. Tapahtuman A todennäköisyys on siis A:lle suotuisten alkeistapausten lukumäärän ja kaikkien alkeistapausten lukumäärän suhde. Kun tätä klassisen todennäköisyyden määritelmää sovelletaan, on siis alkeistapausten määrän oltava äärellinen ja niiden tulee olla yhtä mahdollisia eli niinsanotusti symmetrisiä (symmetric). Havaitaan, että jokaisen alkeistapauksen ai todennäköisyys on tällöin P (ai ) = 1 N Sovellutuksissa satunnaiskokeiden alkeistapaukset eivät yleensä ole symmetrisiä eikä tällöin voida käyttää klassista määritelmää. Huomautus. Tarkkaan ottaen yllä olevaa ”määritelmää” ei voida pitää määritelmänä; mitä siinä sanonta ”yhtä mahdollista” oikein tarkoittaa, kun todennäköisyyttä vasta ollaan määrittelemässä? Klassisen todennäköisyyden ”määritelmässä” suotuisten ja kaikkien alkeistapausten lukumäärien laskeminen saattaa olla mutkikas kombinatorinen tehtävä; seuraavassa annetaan lyhyt tiivistelmä käyttökelpoisia kombinatorisia käsitteitä. 6 Tuloperiaate. Kuvitellaan (yhdistettyä) koetta, joka voidaan suorittaa p:ssä eri vaiheessa. Olkoon i:nnen kokeen tulosmahdollisuuksia Ni . Koko kokeessa on eri tulosmahdollisuuksia N = N1 N2 · · · Np = P Y Ni i=1 Esimerkki 1.2.1. Koe, jossa on N tulosmahdollisuutta, toistetaan p kertaa. Tässä ptoistokokeessa tulosmahdollisuuksia on N p kappaletta. Permutaatio, variaatio ja kombinaatio Joukon alkioiden asettamista eri järjestykseen sanotaan permutoinniksi. Jokainen näin saatu järjestetty joukko eli jono on permutaatio (permutation). n-alkioisella joukolla on tuloperiaatteen perusteella erilaisia permutaatioita n-kertoma kappaletta, n! = 1 · 2 · · · n Suurilla arvoilla n voit laskea n-kertomalle likiarvoja Stirlingin kaavalla : √ n! ≈ 2πn nn e−n Olkoon joukossa n alkiota. Joukon k-variaatio eli k-permutaatio (k ≤ n) on mikä tahansa joukon k:sta eri alkiosta muodostettu jono. Ensimmäinen alkio voidaan valita n:llä, toinen (n − 1):llä, kolmas (n − 2):lla jne., ja viimeinen (n − (k − 1)):llä tavalla. Täten n-alkioisella joukolla on erilaisia k-permutaatioita n(n − 1)(n − 2) · · · (n − (k − 1)) = n! (n − k)! Annetun n-alkioisen joukon k-kombinaatio on joukon k-alkioinen osajoukko. Nyt siis alkioiden järjestyksellä ei ole merkitystä. Lause 1.2.1. n-alkioisen joukon k-kombinaatioiden lukumäärä on binomikerroin n n! k = 0, 1, . . . , n, 0! = 1 = k k!(n − k)! Todistus. Merkitään k-kombinaatioiden lukumäärää x:llä. Koska jokaisella k-kombinaatiolla on k! erilaista permutaatioita, niin k-permutaatioiden lukumäärä on xk!, ja siis xk! = n! (n − k)! ⇔ 7 x= n! k!(n − k)! Esimerkki 1.2.2. Tutkitaan erilaisia ’sanoja’, jotka voidaan muodostaa kirjaimista a-z. Näitä on 26 kpl, joista vokaaleja on 6 ja konsonantteja 20. a) Erilaisia 5 kirjaimen sanoja tuloperiaatteen mukaan 26 · 26 · 26 · 26 · 26 = 265 = 11881376. Tässä siis jokainen kirjain voidaan valita useamman kerran. b) Sellaisia sanoja, joissa kirjaimet ovat järjestyksessä konsonantti + vokaali + konsonantti + sama kuin edellinen konsonantti + vokaali (siis esimerkiksi ’kello’) on tuloperiaatteen mukaan 20 · 6 · 20 · 1 · 6 = 14400. c) Jos yhden kirjaimen voi valita sanaan vain kerran, on kyse kirjainjoukon a-z permutaatioista. Nyt erilaisia 5 kirjaimen sanoja, joissa voi esiintyä yksi kirjain vain kerran on 26 · 25 · 24 · 23 · 22 = 7893600. d) Jos halutaan vaihtaa jonkin sanan kirjaimien järjestystä on kyse ns. anagrammista. Esim. sanan ’aitat’ eräs anagrammi on ’taiat’. Sanan ’aitat’ anagrammien lukumäärää laskettaessa tulee ottaa huomioon kirjaimien ’a’ ja ’t’ esiintyminen kahdesti. Kaikkiaan 5 eri kirjainta voidaan järjestää 5! = 120 eri tavalla. Näistä on sanan ’aitat’ kohdalla sama sana aina neljä kertaa: kaksi a-kirjainta voidaan järjestää 2!=2 eri tavalla samoin kaksi t-kirjainta. Siksi sanan ’aitat’ erilaisia anagrammeja on 5!/(2!2!) = 30 erilaista. e) Edellä on ollut kyse sanoista, joissa kirjainten järjestyksellä on merkitystä. Tutkitaan nyt erilaisia kirjainjoukkoja, joissa järjestyksellä ei ole merkitystä. 26 kirjaimesta voidaan valita erilaisia 5 kirjaimen joukkoja 26 26! 26 · 25 · 24 · 23 · 22 = = = 65780 5 5!21! 5! Edellä olevan yhtälöketjun toiseksi viimeisestä muodosta saadaan binomikertoimelle seuraava tulkinta. Erilaisten 5 alkion osajoukkojen määrä saadaan jakamalla 5-permutaatioiden määrä (= 26 · 25 · 24 · 23 · 22) erilaisilla 5 alkion järjestyksillä (= 5!). f ) Sellaisia 5 kirjaimen joukkoja, joissa on kaksi eri vokaalia ja kolme eri konsonanttia on tuloperiaatteen mukaan 6 20 6! 20! · = · = 17100 2 3 2!4! 3!17! g) Klassisia todennäköisyyksiä laskettaessa tutkitaan suotuisten alkeistapausten ja kaikkien alkeistapausten lukumäärien osamäärää. Esimerkiksi siis • Todennäköisyys, että 5 kirjaimen sanassa on 5 eri kirjainta on 7893600/11881376 = 0.664 (tapaukset a) ja c)). • Todennäköisyys, että 5 kirjaimen joukossa on kaksi eri vokaalia ja kolme eri konsonanttia on 17100/65780 = 0.260 (tapaukset e) ja f )). 8 1.3 Todennäköisyyslaskennan aksiomat Klassisella ja frekvenssitulkintaan perustuvalla todennäköisyydellä on omat rajoituksensa. Klassinen todennäköisyys edellyttää äärellisen määrän yhtä mahdollisia alkeistapauksia. Jos klassista todennäköisyyttä käytetään mallina, joudutaan satunnaiskokeelle olettamaan alkeistapaukset yhtä mahdollisiksi. Kuinka hyvin malli toimii, riippuu siitä, miten hyvin oletus sopii yhteen todellisuuden kanssa. Frekvenssitulkinnassa käytetään suhteellisen frekvenssin raja-arvoa. Tällaista raja-arvoa ei voida tarkalleen saavuttaa, koska äärettömiä koesarjoja ei voida toteuttaa. Frekvenssitulkintaa käytettäessä muodostetut todennäköisyydet ovat vain likiarvoja todellisille todennäköisyyksille. Kuten muukin matematiikka todennäköisyyslaskenta on aksiomatisoitu. Tällä on pyritty antamaan todennäköisyyslaskennalle matemaattisesti pitävä perusta. Todennäköisyysmitta P on otosavaruuden Ω osajoukkojen muodostamassa joukossa F määritelty reaaliarvoinen joukkofunktio P : F → R, joka toteuttaa seuraavat Kolmogorovin aksiomat : Aksioma 1. 0 ≤ P (A) ≤ 1 ∀A ∈ F Aksioma 2. Jos A1 , A2 , · · · ∈ F on (ääretön) jono pareittain erillisiä tapahtumia (pairwise disjoint events), so. Ai ∩ Aj = ∅ jos i 6= j, niin P (A1 ∪ A2 ∪ . . . ) = P (A1 ) + P (A2 ) + . . . Aksioma 3. P (Ω) = 1 ja P (∅) = 0 Jos otosavaruus on äärellinen, voidaan todennäköisyysmitan määrittelyjoukoksi F ottaa Ω:n kaikkien osajoukkojen joukko. Ajan, pituuden ym. jatkuvasti muuttuvien suureiden yhteydessä otosavaruus on useimmiten ääretön. Tällöin määrittelyjoukoksi ei voida ottaa Ω:n kaikkien osajoukkojen joukkoa, vaan vain tietyn ”σ-algebran” toteuttavat riittävän ”säännölliset” tapahtumat hyväksytään määrittelyjoukkoon F. Soveltajaa tämä ei haittaa, sillä reaalimaailmassa kokeen tapahtumat ovat ”säännöllisiä” ja muodostavat ”σ-algebran”. Todennäköisyyden ominaisuuksia. Olkoon P otosavaruuden Ω todennäköisyysmitta. Aksiomiin nojautuen johdetaan todennäköisyyksille eräitä hyödyllisiä laskusääntöjä. Lause 1.3.1. Jos A1 , A2 , . . . , An on kokoelma pareittain erillisiä tapahtumia, niin P (A1 ∪ A2 ∪ · · · ∪ An ) = P (A1 ) + P (A2 ) + · · · + P (An ) 9 Todistus. Laajennetaan kokoelma pareittain erillisten tapahtumien jonoksi asettamalla Ai = ∅, i = n + 1, n + 2, . . . . Nyt ! ! n ∞ n n [ [ X X Aks 2+3 P Ai = P Ai = P (Ai ) + 0 = P (Ai ) i=1 Seuraus. A∩B =∅ i=1 ⇒ i=1 i=1 P (A ∪ B) = P (A) + P (B) Lause 1.3.2. P (A) = 1 − P (A) Todistus. A ∩ A = ∅, A ∪ A = Ω Seur. ⇒ P (A) + P (A) = P (Ω) = 1 Esimerkki 1.3.1. Pelaaja heittää kahta noppaa. Hän suorittaa 24 pelikierrosta. Hän voittaa, jos hän saa ainakin kerran kuutosparin. Olkoon A = ”ainakin kerran kuutospari”, jolloin 24 A = ”ei kertaakaan kuutosparia”. Koska tuloperiaatteen mukaan P (A) = 35 , niin voitto36 todennäköisyys on 24 35 P (A) = 1 − P (A) = 1 − = 0.491 36 Lause 1.3.3. Yhteenlaskusääntö (Additive rule). Mielivaltaisille tapahtumille A ja B pätee P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Todistus. Annetaan A ja A ∪ B erillisten tapahtumien yhdisteenä: A = (A ∩ B) ∪ (A ∩ B) B A A ∪ B = B ∪ (A ∩ B) A ÇB Seurauksen nojalla P (A) = P (A ∩ B) + P (A ∩ B) P (A ∪ B) = P (B) + P (A ∩ B) mistä puolittain vähentämällä seuraa väite. 10 A ÇB Edellisen lauseen avulla voidaan todistaa (harjoitustehtävänä), että kolmen tapahtuman A1 , A2 , A3 yhdisteen todennäköisyydelle pätee yhteenlaskusääntö: P (A1 ∪ A2 ∪ A3 ) =P (A1 ) + P (A2 ) + P (A3 ) − P (A1 ∩ A2 ) − P (A1 ∩ A3 ) − P (A2 ∩ A3 ) + P (A1 ∩ A2 ∩ A3 ) Induktiotodistuksella yhteenlaskusääntö voidaan yleistää. Tapahtumien A1 , A2 , . . . , An yhdisteen todennäköisyydelle pätee kaava ! n n [ X XX P Ai = P (Ai ) − P (Ai ∩ Aj ) i=1 i=1 + XX i<j P (Ai ∩ Aj ∩ Ak ) − · · · + (−1)n+1 P n \ ! Ai i=1 i<j<k Huomautus. Koska joukko-opin Venn-diagrammilla piirrettyjen joukkojen pinta-alat täyttävät myös Kolmogorovin aksiomat, voidaan niiden avulla muistaa ja hahmotella, (mutta ei todistaa!) todennäköisyyslaskennan laskusääntöjä. Esimerkki 1.3.2. Pakasta vedetään yksi kortti. Millä todennäköisyydellä se on (a) pata tai ässä? (b) mustakortti, pata tai ässä? (a) Merkitään A = ”pata” ja B = ”ässä”. Nyt P (A) = 13 , 52 P (A ∪ B) = P (A) + P (B) − P (A ∩ B) = (b) Merkitään C = ”musta”. Nyt P (C) = 1 P (A ∩ B ∩ C) = 52 . Siis 26 , 52 P (B) = 4 52 ja P (A ∩ B) = 13 + 4 − 1 16 4 = = 52 52 13 P (A ∩ C) = 13 , 52 P (B ∩ C) = 2 52 P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A ∩ B) − P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C) 13 + 4 + 26 − 1 − 13 − 2 + 1 28 7 = = = 52 52 13 11 ja 1 . 52 Siis 1.4 Ehdollinen todennäköisyys Olkoon A ja B kaksi tapahtumaa, joista tapahtuman B tiedetään tapahtuneen. Ajatellaan nyt B otosavaruudeksi, jossa tarkastellaan tapahtuman A realisoitumista. Jos lisäksi myös A on tapahtunut, on tämä tapahtuma joukko A∩B. Nyt tapahtuman A todennäköisyys ehdolla, että tapahtuma B on realisoitunut, on tapahtuman A ∩ B ⊂ B todennäköisyys otosavaruudessa B. Tätä sanotaan A:n ehdolliseksi todennäköisyydeksi ehdolla B ja sitä merkitään P (A | B): Määritelmä 1.4.1. Olkoot A ja B tapahtumia ja olkoon P (B) > 0. Tapahtuman A ehdollinen todennäköisyys ehdolla B (conditional probability) on luku P (A | B) = P (A ∩ B) P (B) Esimerkki 1.4.1. Liikenneonnettomuuksista 55 % aiheutuu kuljettajan huonosta ajotaidosta, 12 % auton teknillisestä viasta ja 5 %:ssa on syynä sekä huono ajotaito että teknillinen vika. On tapahtunut liikenneonnettomuus ja on havaittu, että onnettomuuden aiheuttaneessa autossa on teknillinen vika. Millä todennäköisyydellä onnettomuuteen vaikutti myös kuljettajan huono ajotaito? Olkoon A = ”syynä huono ajotaito” ja B = ”syynä tekninen vika”. Nyt P (A) = 0.55, P (B) = 0.12 ja P (A ∩ B) = 0.05. Kysytty todennäköisyys on P (A | B) = 0.05 = 0.42. 0.12 Ehdollisen todennäköisyyden määritelmästä seuraa Kertolaskusääntö (Multiplicative rule). Jos P (B) > 0, niin P (A ∩ B) = P (B)P (A | B) Kolmen tapahtuman A1 , A2 , A3 leikkauksen todennäköisyydelle pätee kertolaskusääntö: P (A1 ∩ A2 ∩ A3 ) = P ((A1 ∩ A2 ) ∩ A3 ) = P (A1 ∩ A2 )P (A3 | A1 ∩ A2 ) = P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 ) edellyttäen, että P (A1 ∩ A2 ) > 0. Induktiolla voidaan todistaa 12 Kertolaskusäännön yleistys ! n \ P Ai = P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 ) · · · P An | i=1 n−1 \ ! Ai i=1 edellyttäen, että P (A1 ∩ A2 ∩ · · · ∩ An−1 ) > 0. Esimerkki 1.4.2. Ryhmässä on 30 henkilöä, joista 20:llä on DI-tutkinto. Valitaan satunnaisesti 3 henkilöä. Mikä on todennäköisyys, että kaikilla on DI-tutkinto? Tehtävä voidaan ratkaista suoraan kombinatorisesti: 20 3 30 3 P (”kaikilla DI”) = = 0.28 tai kertolaskusäännöllä: Ajatellaan henkilöt valituksi peräkkäin yksi kerrallaan ja merkitään Ai =”i:s on DI ja muut mitä tahansa”. Nyt P (”kaikilla DI”) = P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 | A1 )P (A3 | A1 ∩ A2 ) 20 19 18 = · · = 0.28 30 29 28 1.5 Kokonaistodennäköisyys ja Bayesin kaava Oletetaan, että otosavaruudessa Ω on ositus (partition) B1 , B2 , . . . , Bn eli tapahtumat Bi ovat pareittain erillisiä ja Ω = B1 ∪ B2 ∪ · · · ∪ Bn Tällöin tapahtuma A ⊂ Ω voidaan antaa pareittain erillisten tapahtumien A ∩ Bi , i = 1, . . . , n yhdisteenä A = (A ∩ B1 ) ∪ (A ∩ B2 ) ∪ · · · ∪ (A ∩ Bn ) joten lauseen 1.3.1 perusteella P (A) = n X P (A ∩ Bi ) i=1 Jos nyt P (Bi ) > 0, i = 1, . . . , n, saadaan tästä kertolaskusäännön nojalla 13 Tapahtuman A kokonaistodennäköisyyden kaava (theorem of total probability): P (A) = n X P (Bi )P (A | Bi ) i=1 Kaavalla voit laskea todennäköisyyden P (A), kun tunnet ositteiden Bi todennäköisyydet ja tapahtuman A todennäköisyydet ositteissa Bi . Ehdolliselle todennäköisyydelle P (Bk | A) = P (Bk ∩ A)/P (A) saadaan kertolaskusääntöä P (Bk ∩ A) = P (Bk )P (A | Bk ) ja kokonaistodennäköisyyden kaavaa käyttäen Bayesin kaava (Bayes’ rule). Jos B1 , B2 , . . . , Bn on otosavaruuden Ω ositus ja P (Bi ) > 0, i = 1, . . . , n, sekä P (A) > 0, niin P (Bk )P (A | Bk ) P (Bk | A) = Pn i=1 P (Bi )P (A | Bi ) Esimerkki 1.5.1. Tehtaan tuotannosta 1 % on viallisia (tapahtuma B1 ), 5 % huonoja (tapahtuma B2 ) ja 94 % hyviä (tapahtuma B3 ). Kehitettiin testauslaite, joka hylkää viallisen tuotteen todennäköisyydellä 0.90 ja huonon tuotteen todennäköisyydellä 0.70. Todennäköisyydellä 0.10 testi saattaa virheellisesti hylätä tuotteen, vaikka tuote olisi hyvä. Olkoon valittu satunnaisesti tuote ja testilaite on hylännyt sen. Mikä on todennäköisyys, että tämä tuote todella on viallinen? Annettujen tietojen perusteella P (B1 ) = 0.01, P (B2 ) = 0.05 ja P (B3 ) = 0.94. Olkoon A =”tuote hylätään”. Tällöin P (A | B1 ) = 0.90, P (A | B2 ) = 0.70, P (A | B3 ) = 0.10 ja P (B1 )P (A | B1 ) P (B1 )P (A | B1 ) + P (B2 )P (A | B2 ) + P (B3 )P (A | B3 ) 0.01 · 0.90 = ≈ 0.065 0.01 · 0.90 + 0.05 · 0.70 + 0.94 · 0.10 P (B1 | A) = Nimittäjässä oleva lauseke P (B1 )P (A | B1 ) + P (B2 )P (A | B2 ) + P (B3 )P (A | B3 ) on tuotteen hylkäämisen kokonaistodennäköisyys eli P (A) = 0.01 · 0.90 + 0.05 · 0.70 + 0.94 · 0.10 ≈ 0.138 14 Esimerkki 1.5.2. Testissä saadaan selville 95% dopingia käyttäneistä. 2% testatuista urheilijoista tulee ns. väärä positiivinen tulos eli heille testi on positiivinen, vaikka he ovatkin puhtaita. Oletetaan, että 1% urheilijoista käyttää dopingia. Jos satunnaisesti valitun urheilijan testitulos on positiivinen, millä todennäköisyydellä hän on käyttänyt dopingia? Määritellään tapahtumat D=’käyttää dopingia’ ja T =’tulos on positiivinen’. Tietojen perusteella P (D) = 0.01, P (D) = 0.99, P (T | D) = 0.95, ja P (T | D) = 0.02 Tapahtumat D ja D (käyttäjät ja ei-käyttäjät) muodostavat otosavaruuden osituksen ja kokonaistodennäköisyyden kaavalla P (T ) = P (T ∩ D) + P (T ∩ D) Kysytty todennäköisyys on P (D | T ). Ehdollisen todennäköisyyden määritelmän perusteella saadaan P (D | T ) = 1.6 P (T ∩ D) P (T ∩ D) = P (T ) P (T ∩ D) + P (T ∩ D) = P (D)P (T | D) P (D)P (T | D) + P (D)P (T | D) = 0.01 · 0.95 = 0.324 0.01 · 0.95 + 0.99 · 0.02 Tapahtumien riippumattomuus Määritelmä 1.6.1. Saman otosavaruuden tapahtumat A ja B ovat (tilastollisesti) riippumattomia ((statistically) independent), jos P (A ∩ B) = P (A)P (B) Määritelmästä saadaan seuraus: Jos P (B) > 0, niin A ja B ovat riippumattomia täsmälleen silloin, kun P (A | B) = P (A) Täten sanalla ”riippumaton” on sisältöä sikäli, että toisen tapahtuman realisoituminen ei vaikuta toisen tapahtuman todennäköisyyteen. 15 Esimerkki 1.6.1. Tapahtumien riippumattomuus saattaa olla hyvin muodollista; sille ei löydy selvää tulkintaa. Tarkastellaan nopanheittoa. Olkoot A = {1, 2} ja B = {”parillinen”} = {2, 4, 6}. Tapahtumat A ja B ovat määritelmän mukaan riippumattomia, sillä P (A ∩ B) = P ({2}) = 1 6 ja P (A)P (B) = 2 3 1 · = 6 6 6 Esimerkki 1.6.2. Osoitetaan, että jos A ja B ovat riippumattomia, niin myös A ja B ovat riippumattomia. Oletuksen mukaan siis P (A ∩ B) = P (A)P (B), jolloin P (A ∩ B) = P (A) − P (A ∩ B) = P (A) − P (A)P (B) = P (A)(1 − P (B)) = P (A)P (B). Siis myös A ja B ovat riippumattomia. Useamman kuin kahden tapahtuman riippumattomuus määritellään seuraavasti: Määritelmä 1.6.2. Tapahtumat A1 , . . . , An ovat riippumattomia, jos jokaiselle näiden tapahtumien joukon osajoukolle A(1) , A(2) , . . . , A(m) , m ≤ n pätee P (A(1) ∩ A(2) ∩ · · · ∩ A(m) ) = P (A(1) )P (A(2) ) · · · P (A(m) ) Esimerkki 1.6.3. Tapahtumat A1 , A2 ja A3 ovat riippumattomia, jos ne ovat pareittain riippumattomia ja P (A1 ∩ A2 ∩ A3 ) = P (A1 )P (A2 )P (A3 ). Huomautus 1. Tapahtumien riippumattomuus säilyy, jos jo(t)kin tapahtuma(t) korvataan komplement(e)illaan. Huomautus 2. Käytännössä, jos ei ole mitään näyttöä tapahtumien riippuvuudesta, oletetaan tapahtumat riippumattomiksi, jolloin siis tapahtumien leikkauksien todennäköisyys on tapahtumien todennäköisyyksien tulo. Esimerkki 1.6.4. Tarkastellaan toistokoetta. Toistot voidaan olettaa toisistaan riippumattomiksi. Olkoon A kokeen tapahtuma, jonka esiintymistä seurataan. Tällöin P (Aˆ1 ∩ Aˆ2 ∩ · · · ∩ Aˆn ) = P (Aˆ1 )P (Aˆ2 ) · · · P (Aˆn ) missä Aˆi voi olla joko n-toistokokeen tapahtuma ”i:nnessä toistossa realisoituu A” tai tapahtuma ”i:nnessä toistossa realisoituu A”. 16 Esimerkki 1.6.5. Olkoon laitteessa komponenttien Ki toiminta toisistaan riippumatonta. Olkoon Ai =”komponentti Ki toimii aikavälin ∆t” ja olkoon P (Ai ) = pi . Laske todennäköisyys, että laite toimii aikavälin ∆t, kun laite koostuu a) sarjaan b) rinnan kytketyistä komponenteista K1 , K2 , . . . , Km . c) Entä jos laite on oheisen kuvan mukainen? Olkoon A = ”laite toimii aikavälin ∆t”. a) Komponenttien ollessa kytketty sarjaan laite toimii, jos jokainen komponentti toimii P (A) = P (A1 ∩ A2 ∩ · · · ∩ Am ) = P (A1 )P (A2 ) · · · P (Am ) = m Y pi i=1 b) Rinnan kytkennässä taas riittää, että yksikin komponentti toimii. De Morganin säännöllä ! m Y P (A) = P (A1 ∪ A2 ∪ · · · ∪ Am ) = 1 − P (A1 ∩ A2 ∩ · · · ∩ Am ) = 1 − (1 − pi ) i=1 c) Nyt joko ylä- tai alasarjan täytyy toimia. Merkitään Ay =”yläsarja toimii” ja Aa =”alasarja toimii” P (A) = P (Ay ∪ Aa ) = 1 − P (Ay ∩ Aa ) = 1 − P (Ay )P (Aa ) ! ! m m Y Y =1− 1− pi 1− pi =1− =2 m Y i=1 i=1 m Y 1−2 pi − i=1 pi + i=1 m Y p2i i=1 17 m Y i=1 ! p2i 2 Todennäköisyysjakaumia Satunnaismuuttujia koskevan päätöksenteon pohjana on, että satunnaismuuttujan todennäköisyysjakauma tunnetaan. Tässä kappaleessa tutustutaan todennäköisyysjakaumiin yleisesti, niiden tunnuslukuihin sekä muutamiin tavallisimpiin jakaumiin. Käytännön sovelluksissa lähtökohtana on usein empiirinen havaintoaineisto, jolloin sen perusteella voidaan tehdä päätelmiä satunnaismuuttujan jakaumasta tai ainakin jakauman ns. parametreista, jos jakauma on jo etukäteen kiinnitetty, esim. normaalijakaumaksi. Kerrataan aluksi ns. kuvailevaa eli deskriptiivistä tilastotiedettä, jossa empiirisen otosta kuvaillaan tunnusluvuin ja tilastollisen grafiikan keinoin. 2.1 Empiirisen otoksen kuvailua Tavallisesti satunnaismuuttujan x todennäköisyysjakauman mallintamisessa aluksi koe toistetaan useita kertoja tai havainnoidaan satunnaismuuttujan arvoja muulla tavoin. Näin saadut satunnaismuuttujan havaintoarvot muodostavat (empiirisen) otoksen (sample). Tämän empiirisen otoksen perusteella voidaan tehdä johtopäätöksiä tästä satunnaismuuttujasta. Enemmän näiden johtopäätösten tekemisen perusteista ja itse johtopäätösten tekemisestä kerrotaan jatkokurssilla Tilastomatematiikka. Tässä lyhyesti määritetään empiirisistä otosta kuvaavia tunnuslukuja ja graafisia kuvioita. Käsitellään n :n alkion otosta, jonka oletetaan olevan peräisin satunnaismuuttujasta x. Empiirisen otoksen frekvenssijakaumassa (frequency distribution) otos järjestetään taulukkomuotoon, jossa luetteloidaan satunnaismuuttujan erisuuret arvot tai luokittelemalla saadut arvoluokat xi ja arvojen esiintymislukumäärät eli frekvenssit (frequency) fi . Usein on tarkoituksenmukaista käyttää frekvenssien sijasta suhteellisia frekvenssejä (relative frequency) pi = fi /n. Frekvenssijakaumaa voidaan havainnollistaa graafisesti esim. (frekvenssi)histogrammilla (frequency histogram). Jos käytetään tasavälistä luokittelua, histogrammin muoto havainnollistaa satunnaismuuttujan todennäköisyysjakaumaa. Kun lasketaan frekvenssien tai suhteellisten frekvenssien kumulatiivisia summia (cumulative sum) saadaan ns. summafrekvenssit Fi ja suhteelliset summafrekvenssit Fi /n Fi = i X j=1 i fj , i F i X fj X = = pj n n j=1 j=1 Nämä arvot vastaavat kysymykseen ”kuinka monta / kuinka suuri osa koetuloksista on tietyn arvon xi suuruisia tai sitä pienempiä”. Otosta voidaan kuvailla ns. tunnusluvuilla, jotka yhdellä luvulla kuvaavat jakauman sijaintia tai arvojen vaihtelua. Otosta x1 , x2 . . . , xn kuvaavista tunnusluvuista tärkeimpiä ovat 18 n keskiarvo (average, sample mean) : 1X xi x= n i=1 n 1 X (xi − x)2 n − 1 i=1 √ (otos)keskihajonta (sample standard deviation) : s = s2 (otos)varianssi (sample variance) : s2 = Jos otos on luokiteltu luokkakeskuksina xi ja frekvensseinä fi , i = 1, . . . , k, niin k k k X 1X 1 X 2 x= f i xi = p i xi ja s = fi (xi − x)2 n i=1 n − 1 i=1 i=1 P k i=1 fi = n , Keskihajonta mittaa havaintotulosten xi jakaantumista keskiarvon x molemmin puolin. Mitä suurempi on keskihajonta s sitä enemmän havaintoarvot xi (keskimäärin) poikkeavat x:sta. Esimerkki 2.1.1. Oletetaan, että elektronisen komponentin ikä (vuosia) on satunnaismuuttuja. On tutkittu 100 komponentin ikä ja on saatu seuraavat mittaustulokset: 0.24, .62, 0.66, 4.2, 0.54, 6.4, 5.4, 1.6, 2.2, 1.6, 0.30, 1.2, 0.80, 1.9, 0.60, 2.4, 5.4, 0.02, 0.96, 6.4, 0.80, 0.02, 0.96, 3.6, 2.4, 0.50, 1.6, 2.8, 2.2, 2.2, 1.8, 2.6, 0.17, 0.54, 0.30, 0.52, 6.4, 3.2, 2.6, 0.98, 0.02, 0.92, 1.4, 0.44, 0.80, 2.6, 1.2, 6.0, 0.66, 0.26, 7.8, 1.3, 3.8, 6.0, 1.8, 1.1, 0.19, 1.6, 2.6, 4.8, 1.4, 0.34, 1.8, 4.2, 1.2, 3.6, 0.34, 1.1, 4.4, 0.24, 0.74, 2.6, 0.34, 2.8, 3.0, 0.28, 1.2, 0.12, 4.0, 2.4, 2.6, 1.3, 1.1, 4.0, 4.4, 2.0, 0.66, 0.12, 0.44, 0.62, 0.66, 3.6, 0.80, 2.8, 0.08, 5.4 1.5, 1.2, 2.8, 2.6, Kun data luokitellaan luokkina 0 − 1, 1 − 2, . . . , 7 − 8 saadaan seuraava frekvenssitaulukko Luokka frekvenssi fi 0–1 1–2 2–3 3–4 4–5 5–6 6–7 7–8 39 21 18 6 7 3 5 1 suhteellinen frekvenssi fi /n 0.39 0.21 0.18 0.06 0.07 0.03 0.05 0.01 19 summafrekvenssi Fi 39 60 78 84 91 94 99 100 suhteellinen summafrekvenssi Fi /n 0.39 0.60 0.78 0.84 0.91 0.94 0.99 1.00 Otoksen keskiarvo x = 1.99, varianssi s2 = 3.18 ja otoskeskihajonta s = 1.78. Alla oleva frekvenssihistogrammi muistuttaa muodoltaan satunnaismuuttujan x todennäköisyysjakaumaa. 2.2 Diskreetin satunnaismuuttujan jakauma Satunnaismuuttuja X on diskreetti, jos se voi saada vain erillisiä arvoja. Siten sen otosavaruudessa Ω on äärellinen tai ääretön määrä alkeistapauksia, joiden todennäköisyydet ovat positiivisia, Ω = {x1 , x2 , . . . , xn , . . . } Diskreetin satunnaismuuttujan X todennäköisyysjakauma tunnetaan, kun vain tiedetään, millä todennäköisyydellä X saa eri arvot xi eli mitä on P (X = xi ). Tämä ilmoitetaan määrittelemällä satunnaismuuttujan tiheysfunktio: Funktio f : R → [0, 1] on diskreetin satunnaismuuttujan X, otosavaruutenaan Ω, tiheysfunktio (density function), jos 1. f (x) ≥ 0 P 2. f (x) = 1 x∈Ω 3. f (x) = P (X = x) Huomautus 1. Satunnaismuuttujan X tiheysfunktio f (x) on siis määritelty kaikilla reaaliluvuilla. Tavallisesti tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta itsestään selvä f (x) = 0, jos x ∈ / Ω. 20 Arvoja f (xi ) = P (X = xi ), missä xi ∈ Ω, kutsutaan pistetodennäköisyyksiksi. Diskreetin satunnaismuuttujan tiheysfunktiosta käytetäänkin myös nimitystä pistetodennäköisyysfunktio. Mielivaltaisen tapahtuman A ⊂ Ω todennäköisyys P (A) saadaan summaamalla yhteen A:n alkioiden pistetodennäköisyydet, X P (A) = f (x) x∈A Näin määritelty todennäköisyysmitta P toteuttaa Kolmogorovin aksiomat. Esimerkki 2.2.1. Satunnaismuuttujan X, jonka otosavaruus Ω = {1, 2, 3, . . . } ja P (X = x) = 1/2x , kun x ∈ N, jakauma ilmoitetaan tiheysfunktiolla f (x) = 1 , 2x kun x = 1, 2, . . . . Diskreetin satunnaismuuttujan X jakaumaa voi havainnollistaa graafisesti janadiagrammilla, jossa arvoon xi on liitetty f (xi )-pituinen jana. Lasketaan ehdollinen todennäköisyys P ({X > 2} ∩ {X < 4}) P (X = 3) = P (X < 4) P (X < 4) f (3) 1/8 1 = = = f (1) + f (2) + f (3) 1/2 + 1/4 + 1/8 7 P (X > 2 | X < 4) = Diskreetin satunnaismuuttujan X kertymäfunktio (cumulative distribution function) F (x) määritellään X F (x) = P (X ≤ x) = f (t), x ∈ R t≤x 21 Diskreetin satunnaismuuttujan kertymäfunktio on kasvava porrasfunktio (kohdassa x = xi on f (xi ):n suuruinen hyppäys) ja 0 ≤ F (x) ≤ 1, lim F (x) = 0, x→−∞ lim F (x) = 1 x→∞ Jos tunnet kertymäfunktion, voit helposti laskea tapahtumien todennäköisyyksiä, esimerkiksi P (a < X ≤ b) = F (b) − F (a) P (a ≤ X ≤ b) = F (b) − F (a) + P (X = a) Diskreetin satunnaismuuttujan tapahtuman todennäköisyyttä laskettaessa on tärkeää huomata kuuluvatko rajat mukaan tapahtumaan vai eivät. Esimerkki 2.2.2. Määrätään esimerkin 2.2.1 satunnaismuuttujan X kertymäfunktio. Arvolla x ∈ N on x X 1 geom. summa 1 F (x) = P (X ≤ x) = = 1− x t 2 2 t=1 joten kertymäfunktio on F (x) = ( 1− 1 , 2x 0, kun t ≤ x < t + 1 (t = 1, 2, . . . ) kun x < 1 Diskreetti satunnaismuuttuja X noudattaa diskreettiä tasajakaumaa, (discrete uniform distribution), jos sen otosavaruudessa Ω on äärellinen määrä n symmetrisiä=yhtä todennäköisiä alkeistapauksia. Tällöin X:n tiheysfunktio on f (x) = 1 , n kun x ∈ Ω Usein alkeistapaukset ovat kokonaislukuja Ω = {a, a + 1, a + 2, . . . , b}, joita on b − a + 1 kappaletta. Tällöin merkitään X ∼ Tasd(a, b) ja tiheysfunktio f (x) = 1 , b−a+1 kun x ∈ Ω = {a, a + 1, a + 2, . . . , b} 22 Esimerkki 2.2.3. Nopanheiton tuloksen X otosavaruus Ω = {1, 2, 3, 4, 5, 6} ja se noudattaa diskreettiä tasajakaumaa X ∼ Tasd(1, 6). Tiheysfunktio on 1 f (x) = , 6 kun x ∈ Ω. Esimerkki 2.2.4. Hypergeometrinen jakauma (hypergeometric distribution). Tiedetään että N kappaleen joukossa on m kappaletta tuotetta A. Poimitaan joukosta n kappaleen satunnaisotos ilman takaisinpanoa. Olkoon satunnaismuuttuja X =’Otoksessa olevien tuotteiden A lukumäärä’. Mitä on P (X = x)? Suotuisia tapahtumia, joissa x on tuotetta A ja n − x muita kuin tuotteita A, on tuloperiaat N −m N teen nojalla m kappaletta. Kaikkiaan n alkion otoksia on , joten x n−x n P (X = x) = m x N −m n−x N n Sanotaan, että satunnaismuuttuja X noudattaa hypergeometrista jakaumaa parametrein (N, m, n), merkitään X ∼ Hyperg(N, m, n). Sen otosavaruus Ω on kaikkien sellaisten kokonaislukujen x joukko, että max{0, n − (N − m)} ≤ x ≤ min{n, m} Laatikossa on m = 5 valkoista ja 7 mustaa palloa, yhteensä siis N = 12 palloa. Näistä valitaan palauttamatta n = 6 palloa. Valkoisten pallojen lukumäärä tässä 6 pallon otoksessa X ∼ Hyperg(12, 5, 6), Ω = {0, 1, 2, 3, 4, 5} ja sen tiheysfunktio on 7 5 f (x) = x 6−x 12 6 , x ∈ Ω = {0, 1, 2, 3, 4, 5} Nyt todennäköisyys, että otoksessa olisi vähintään 4 valkoista palloa on 5 7 5 7 5 · 21 1 · 7 P (X = 4) + P (X = 5) = f (4) + f (5) = 4 122 + 5 121 = + = 0.121 924 924 6 6 23 Esimerkki 2.2.5. Kurssilla on 5 harjoituskertaa=aihealuetta. Tentissä on 4 tehtävää satunnaisesti valitusta 4 aihealueesta, yksi kustakin. Kurssin 250 opiskelijaa valmistautuvat tenttiin opiskelemalla täydellisesti vain kahden aihealueen kaikki harjoitukset, jokainen siis valitsee omat 2 aihealuettaan. Kurssista pääsee läpi osaamalla puolet tehtävistä (2/4). Kuinka moni a) pääsee läpi 1. tenttikerralla b) ei pääse läpi 3 ensimmäisellä tenttikerralla a) 5 aihealueesta voidaan valita neljä 54 = 5 eri tavalla. Opiskelijan valitsemat kaksi aihealuetta sisältyvät kolmeen näistä eri kombinaatioista. Olkoon satunnaismuuttuja X = ’sen tentin järjestysnumero, jolloin opiskelija pääsee läpi’. Näin todennäköisyys, että hän pääsee läpi 1. tentistä on 3 P (X = 1) = = 0.6 5 ja 250 opiskelijasta pääsee läpi 0.6 · 250 = 150. b) Mikä on satunnaismuuttujan X tiheysfunktio? X on diskreetti satunnaismuuttuja, jonka otosavaruus Ω = {1, 2, 3, . . .} Jos henkilö pääsee läpi n. kerralla, on hänellä ensin n − 1 epäonnistumista ja sitten onnistuminen. Tiheysfunktio on siis f (x) = (0.4)x−1 · 0.6, kun x ∈ {1, 2, 3, . . .} ja b)-kohdan todennäköisyys on siis P (X > 3) = 1 − P (X ≤ 3) = 1 − [P (X = 1) + P (X = 2) + P (X = 3)] = 1 − (0.4)0 · 0.6 + (0.4)1 · 0.6 + (0.4)2 · 0.6 = 0.064 ja 3. tentin jälkeen reputtaneita on 0.064 · 250 = 16. Tämä todennäköisyysjakauma on ns. geometrinen jakauma (geometric distribution). Jos toistokokeessa on kaksi vaihtoehtoa 0 ja 1 niin satunnaismuuttuja X= ’millä toistokerralla ensimmäisen kerran tapahtuu vaihtoehto 1’ noudattaa geometrista jakaumaa Geom(p) , missä parametri p= vaihtoehdon 1 todennäköisyys. Sen tiheysfunktio ja otosavaruus ovat X ∼ Geom(p) : f (x) = p(1 − p)x−1 , x ∈ Ω = {1, 2, 3, . . .}, 0 ≤ p ≤ 1 Usein vaihtoehto 1 nimetään ’onnistumiseksi’ (success) ja vaihtoehto 0 ’epäonnistumiseksi’ (failure), Tässä esimerkissä X ∼ Geom(0.6). 24 2.3 Jatkuvan satunnaismuuttujan jakauma Satunnaismuuttujan X, jonka otosavaruus Ω on (äärellinen tai ääretön) reaalilukuväli tai välien yhdiste, sanotaan olevan jatkuva (continuous) tai jatkuvasti jakautunut (continuously distributed). Sen todennäköisyysjakaumaa tavallisesti mallinnetaan tiheysfunktiolla. Funktio f : R → [0, ∞) on jatkuvan satunnaismuuttujan X tiheysfunktio (density function), jos 1. f (x) ≥ 0, ∀x ∈ R 2. R∞ f (x) dx = 1 −∞ 3. P (a ≤ X ≤ b) = Rb f (x) dx, missä a ≤ b a Huomautus 1. Satunnaismuuttujan X tiheysfunktio f (x) on siis määritelty kaikilla reaaliluvuilla. Usein tiheysfunktion muoto kerrotaan vain otosavaruudessa ja jätetään mainitsematta itsestään selvä f (x) = 0, jos x ∈ / Ω. Tapahtuman {a ≤ X ≤ b} todennäköisyys lasketaan siis tiheysfunktion määrättynä integraalina Z b P (a ≤ X ≤ b) = f (x) dx a kaikilla a ≤ b ∈ R, myös kun a = −∞ ja/tai b = ∞. Määrätyn integraalin ominaisuuksien perusteella yllä määritelty todennäköisyysmitta P toteuttaa Kolmogorovin aksiomat. Huomautus 2. Jatkuvan satunnaismuuttujan yksittäisen muuttujan arvon todennäköisyys on nolla, Z a P (X = a) = P (a ≤ X ≤ a) = f (x) dx = 0 a Näin jatkuvalla satunnaismuuttujalla P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b) 25 Siis todennäköisyys sille, että satunnaismuuttuja saa tietyn arvon, on 0. Tässä ei kuitenkaan ole mitään ristiriitaa todellisuuden kanssa. Nimittäin jatkuvan satunnaismuuttujan arvoa ei voi mitata täysin tarkasti, vaan mittaustulos on aina jokin väli, jonka pituus riippuu mittaustarkkuudesta. Esimerkiksi, mitattakoon satunnaismuuttujan X arvot yhden desimaalin tarkkuudella. Tällöin todennäköisyys, että X:n arvoksi saadaan 5.2 on Z 5.25 f (x) dx P (5.15 ≤ X < 5.25) = 5.15 Tiheysfunktion intuitiivinen tulkinta. Olkoon jatkuvasta satunnaismuuttujasta X kerätty luokiteltu frekvenssijakauma. Piirretään tähän luokitukseen perustuva histogrammi siten että kunkin osavälin kohdalle piirretty pylväs pinta-alaltaan kuvaa kyseisen välin todennäköisyyttä eli todennäköisyyttä sille, että X saa arvon ko.väliltä (pylvään korkeus on välille osuneiden mittaus tulosten suhteellinen frekvenssi jaettuna luokitusvälin pituudella). Muuttujan X tiheysfunktion kuvaaja kulkee jostain pylväiden huippukohtien kautta. Jos tihennetään luokitusta rajatta samalla kun koetoistojen määrä kasvaa rajatta, lähestyy pylväiden huiput X:n tiheysfunktion kuvaajaa. Jatkuvan satunnaismuuttujan kertymäfunktio (cumulative distribution function) F määritellään samalla tavalla kuin diskreetille muuttujallekin Z x F (x) = P (X ≤ x) = f (t) dt, x ∈ R −∞ Kertymäfunktio on kasvava ja 0 ≤ F (x) ≤ 1, lim F (x) = 0, x→−∞ lim F (x) = 1 x→∞ Lause 2.3.1. Pisteissä x, joissa tiheysfunktio f (x) on jatkuva, on kertymäfunktiolla derivaatta F 0 (x) = f (x) 26 Todistus. Valitaan vakio a siten että välillä [a, x] on tiheysfunktio jatkuva. Nyt Z a Z x Z x f (t) dt = f (t) dt + f (t) dt ⇒ F 0 (x) = f (x) F (x) = −∞ a | −∞ {z } vakio Kertymäfunktion F avulla voi helposti esittää erilaisten tapahtumien todennäköisyydet, esimerkiksi P (a ≤ X ≤ b) = F (b) − F (a) P (X ≤ a) = F (a) P (X ≥ a) = 1 − F (a) Kaikissa epäyhtälöissä voi yhtäsuuruuden jättää myös pois. Esimerkki 2.3.1. Työpaikassa kahvitauon pituus X minuuteissa on satunnaismuuttuja, jonka tiheysfunktio on c (15 − x) kun 5 ≤ x ≤ 15 f (x) = 0 muulloin R∞ a) Määritetään aluksi vakio c. Koska f (x) dx oltava = 1 eli −∞ Z∞ Z15 1 15x − x2 2 5 5 1 1 2 2 2 = c 15 − · 15 − 15 · 5 + · 5 2 2 1 = 50c = 1 ⇒ c = 50 c(15 − x) dx = −∞ .15 c(15 − x) dx = c b) Kertymäfunktio, kun x on välillä [5, 15] on Zx x 1 1 . 1 F (x) = (15 − t) dt = 15t − t2 50 50 2 5 5 1 1 2 1 2 = 15x − x − 15 · 5 + · 5 50 2 2 1 2 3 5 = − x + x− 100 10 4 Kertymäfunktio määritellään paloittain kun x < 5 0 1 3 5 2 F (x) = − x + 10 x − 4 kun 5 ≤ x ≤ 15 100 1 kun x > 15 27 Satunnaismuuttuja T noudattaa eksponenttijakaumaa (exponential distribution) parametrina λ > 0, merkitään T ∼ Exp(λ), jos sen tiheysfunktio on f (t) = λe−λt , kun t ≥ 0 Kertymäfunktioksi saadaan arvoilla t ≥ 0: Z t F (t) = P (T ≤ t) = Z −∞ = .t t f (u) du = λe−λu du 0 −e−λu = 1 − e−λt 0 Esimerkki 2.3.2. Tietyn sähköisen komponentin elinajan T (vuosissa) tiedetään olevan eksponentiaalisesti jakautunut parametrinä λ = 2. Todennäköisyys sille, että komponentti kestää korkeintaan yhden vuoden, kun se on jo kestänyt kaksi vuotta, on ehdollinen todennäköisyys F (3) − F (2) P (2 < T < 3) = P (T > 2) 1 − F (2) −6 −4 (1 − e ) − (1 − e ) e−4 (−e−2 + 1) = = 1 − (1 − e−4 ) e−4 P (T < 2 + 1 | T > 2) = = 1 − e−2 Laskettaessa todennäköisyys P (T < 1) saadaan sama tulos P (T < 1) = 1 − e−2 . Eli todennäköisyys, että komponentti kestää vielä yhden vuoden on sama uudella komponentilla ja jo kaksi vuotta toimineella komponentilla. Jatkuva satunnaismuuttuja X noudattaa jatkuvaa tasajakaumaa (continuous uniform distribution) välillä [a, b], merkitään X ∼ Tas(a, b), jos X:n otosavaruus on väli [a, b] ja tiheysfunktio f (x) on vakio tällä välillä. Tällöin X:n tiheysfunktio on f (x) = 2.4 1 , b−a kun x ∈ [a, b] Odotusarvo, varianssi ja keskihajonta Vastaavasti kuin frekvenssijakaumia voidaan todennäköisyysjakaumia luonnehtia erilaisin tunnusluvuin. Pelkästään jakauman tyypin ja sen tunnuslukujen avulla voidaan tehdä tarkasteltavasta satunnaiskokeesta hyödyllisiä johtopäätöksiä. Tavallisimmat jakauman sijaintia kuvaavat tunnusluvut ovat odotusarvo, varianssi ja keskihajonta. Odotusarvo ilmoittaa jakauman keskikohdan, varianssi ja keskihajonta mittaavat jakauman hajaantumisen suuruutta. 28 Diskreetit satunnaismuuttujat Diskreetin satunnaismuuttujan X, jonka otosavaruus on Ω ja tiheysfunktio on f (x), odotusarvo, varianssi ja keskihajonta määritellään lukuina odotusarvo (mean, expected value) : E(X) = X merk. xf (x) = µ x∈Ω varianssi (variance) : Var(X) = X merk. 2 (x − µ) f (x) = σ 2 x∈Ω keskihajonta (standard deviation) : D(X) = p Var(X) = σ Huomautus. Jos otosavaruudessa on ääretön määrä alkioita, on tunnusluku olemassa vain kun sen määrittelevä sarja suppenee ja summa on termien järjestyksestä riippumaton. Diskreetin muuttujan odotusarvo on mahdollisten arvojen xi todennäköisyyksillään P (X = xi ) = f (xi ) painotettu keskiarvo. Varianssi taas on odotusarvosta laskettujen neliöityjen poikkeamien (xi − µ)2 todennäköisyyksillä painotettu keskiarvo. Fysikaalinen tulkinta. Jos ajatellaan, että yhden yksikön verran ”todennäköisyysmassaa” on jaettu x-akselin pisteisiin xi pistetodennäköisyyden f (xi ) verran, niin odotusarvo ilmoittaa massan painopisteen x-akselilla ja varianssi massan hitausmomentin painopisteen suhteen. Esimerkki 2.4.1. Arpanopan silmäluvun X odotusarvo ja varianssi ovat X 1 21 1 =3 E(X) = x f (x) = (1 + 2 + 3 + 4 + 5 + 6) · = |{z} 6 6 2 x∈Ω Var(X) = = 61 ∀x X (x − µ)2 f (x) x∈Ω 1 = 6 " −5 2 2 + −3 2 2 + −1 2 2 2 2 2 # 1 3 5 35 = + + + 2 2 2 12 Voidaan osoittaa (harjoitustehtävänä), että Diskreettiä tasajakaumaa noudattavan satunnaismuuttujan X ∼ Tasd(1, n) odotusarvo ja varianssi ovat n+1 n2 − 1 E(X) = ja Var(X) = 2 12 29 Jatkuvat satunnaismuuttujat Jos satunnaismuuttuja X on jatkuva ja sen tiheysfunktio on f (x), niin määritellään X:n odotusarvo ja varianssi diskreetin tapauksen summia vastaavilla integraaleilla (edellyttäen, että integraalit suppenevat), Z odotusarvo : varianssi : keskihajonta : ∞ merk. xf (x) dx = µ E(X) = Z Var(X) = −∞ ∞ merk. (x − µ)2 f (x) dx = σ 2 −∞ p D(X) = Var(x) = σ Fysikaalinen tulkinta. Jos ajatellaan, että yhden yksikön verran ”todennäköisyysmassaa” on tiivistynyt x-akselille viivatiheytenä tiheysfunktio f (x), niin odotusarvo on x-akselin painopiste ja varianssi on x-akselin hitausmomentti painopisteen suhteen. Esimerkki 2.4.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio on f (x) = 2x, kun 0 < x < 1. Satunnaismuuttujan X odotusarvo on Z ∞ E(X) = Z xf (x) dx = −∞ 1 2 2x dx = 0 .1 2 0 3 x3 = 2 3 ja varianssi 2 Z 1 2 8 8 Var(X) = x− f (x) dx = 2x3 − x2 + x dx 3 3 9 −∞ 0 .1 1 8 4 1 8 4 1 = x4 − x3 + x2 = − + = 2 9 9 2 9 9 18 Z ∞ 0 Voidaan osoittaa (harjoitustehtävänä), että Jatkuvaa tasajakaumaa noudattavan satunnaismuuttujan X ∼ Tas(a, b) odotusarvo ja varianssi ovat a+b (b − a)2 E(X) = ja Var(X) = 2 12 30 2.5 Satunnaismuuttujan funktiot Satunnaismuuttuja X määriteltiin kappaleessa 1.1 kuvaukseksi (funktioksi) otosavaruudesta reaalilukujen joukkoon. Jos muodostetaan satunnaismuuttujan reaaliarvoinen funktio Y = h(X) on kyseessä yhdistetty funktio, joka on myös satunnaismuuttuja. Tällä uudella satunnaismuuttujalla on oma otosavaruutensa ja tiheysfunktionsa. Esimerkki 2.5.1. Olkoon X diskreetti satunnaismuuttuja, jonka tiheysfunktio ja otosavaruus ovat x2 f (x) = , x ∈ ΩX = {−2, −1, 1, 2} 10 Muodostetaan uusi satunnaismuuttuja Y = h(X) = X 2 + 1. Kun x ∈ ΩX , voi Y saada arvoja h(−2) = h(2) = 5 ja h(−1) = h(1) = 2. Arvojen todennäköisyydet saadaan laskemalla alkuperäisten arvojen todennäköisyydet (−1)2 12 1 + = 10 10 5 4 (−2)2 22 + = P (Y = 5) = P (X = −2) + P (X = 2) = f (−2) + f (2) = 10 10 5 P (Y = 2) = P (X = −1) + P (X = 1) = f (−1) + f (1) = Nämä todennäköisyydet voidaan esittää myös funktiomuodossa ja näin saadaan satunnaismuuttujan y tiheysfunktioksi ja otosavaruudeksi g(y) = y−1 , y ∈ ΩY = {2, 5} 5 Yleisessä tapauksessa jos X on diskreetti, on myös Y diskreetti. Satunnaismuuttujan Y tiheysfunktio g(y) määrätään tavallisesti siten, että lasketaan todennäköisyydet Y :n otosavaruuden pisteissä: X X g(y) = P (Y = y) = P (h(X) = y) = P (X = xi ) = f (xi ) xi :h(xi )=y xi :h(xi )=y Siinä erikoistapauksessa, että funktiolla y = h(x) on käänteisfunktio, on voimassa Lause 2.5.1. Olkoon diskreetin satunnaismuuttujan X tiheysfunktio f (x) ja Y = h(X). Jos funktio y = h(x) on kääntyvä, y = h(x) ⇔ x = h−1 (y), niin Y :n tiheysfunktio on g(y) = f h−1 (y) Todistus. g(y) = P (Y = y) = P (h(X) = y) = P (X = h−1 (y)) = f (h−1 (y)) 31 Esimerkki 2.5.2. Olkoon satunnaismuuttujan X tiheysfunktio x−1 3 1 f (x) = , kun x = 1, 2, 3, . . . 4 4 Määrätään satunnaismuuttujan Y = X 2 tiheysfunktio g(y). Muuttujan Y otosavaruus on ΩY = {1, 4, 9, . . . }. Koska y = x2 = h(x) niin 3 √ g(y) = f ( y) = 4 ⇔ x= √y−1 1 , 4 √ y = h−1 (y) kun y = 1, 4, 9, . . . Tutkitaan seuraavaksi jatkuvaa satunnaismuuttujaa X. Nyt satunnaismuuttuja Y = h(X) voi olla diskreetti tai jatkuva, tai ei diskreetti eikä jatkuva. Tarkastellaan tilannetta, kun Y on jatkuva ja funktio y = h(x) on aidosti monotoninen. Lause 2.5.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio on f (x) ja Y = h(X). Olkoon funktio y = h(x) derivoituva ja aidosti monotoninen. Funktiolla y = h(x) on olemassa käänteisfunktio y = h(x) ⇔ x = h−1 (y) ja Y :n tiheysfunktio on d −1 −1 g(y) = f h (y) h (y) dy Todistus. Tiheysfunktio g(y) voidaan määrätä siten, että lasketaan ensin Y :n kertymäfunktio, joka sitten derivoidaan. Olkoon funktio y = h(x) aidosti kasvava. Tällöin myös sen käänteisfunktio on aidosti kasvava. Nyt Y :n kertymäfunktio voidaan määrätä X :n kertymäfunktion avulla FY (y) = P (Y ≤ y) = P (h(X) ≤ y) = P (X ≤ h−1 (y)) = FX (h−1 (y)) ja derivoimalla kertymäfunktio saadaan tiheysfunktio lauseen 2.3.1 mukaan d −1 d d d −1 −1 0 −1 −1 g(y) = FY (y) = FX (h (y)) = FX (h (y)) h (y) = f (h (y)) h (y) dy dy dy dy koska aidosti kasvavan funktion derivaatta d −1 h (y) dy 32 > 0. Jos funktio y = h(x) aidosti vähenevä, on sen käänteisfunktio myös aidosti vähenevä. FY (y) = P (Y ≤ y) = P (h(X) ≤ y) = P (X ≥ h−1 (y)) = 1 − FX (h−1 (y)) ja derivoimalla kertymäfunktio saadaan tiheysfunktio lauseen 2.3.1 mukaan d −1 d d d −1 −1 −1 −1 g(y) = FY (y) = 1 − FX (h (y) = −f (h (y)) h (y) = f (h (y)) h (y) dy dy dy dy sillä aidosti vähenevän funktion derivaatta d −1 h (y) dy < 0 ja d −1 h (y) dy d −1 = −| dy h (y)|. Esimerkki 2.5.3. Satunnaismuuttujan X tiheysfunktio on f (x) = e−x , x ∈ ΩX = [0, ∞). Määrätään satunnaismuuttujan Y = X 2 tiheysfunktio g(y). √ x = y = h−1 (y) (y ≥ 0), niin √ d −1 1 −1 g(y) = f h (y) h (y) = e− y √ , kun y ∈ ΩY = (0, ∞). dy 2 y Koska y = x2 = h(x) (x ≥ 0) ⇔ Esimerkki 2.5.4. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio f (x) = x , x ∈ ΩX = [1, 5] 12 Mikä on uuden satunnaismuuttujan Y = 2X − 3 tiheysfunktio g(y)? Koska y = 2x − 3 = h(x) on h−1 (y) = (y + 3)/2 ja d −1 h (y) dy = 1/2. Tiheysfunktio on d 1 (y + 3) 1 y+3 g(y) = f h−1 (y) h−1 (y) = · · = dy 12 2 2 48 Koska muunnosfunktio on aidosti kasvava, on Y :n otosavaruus ΩY = [h(1), h(5)] = [−1, 7]. 33 2.6 Satunnaismuuttujan funktion odotusarvo Miten voidaan laskea uuden satunnaismuuttujan Y = h(X) odotusarvo E(Y )? Jos pystyy määrittämään tiheysfunktion g(y) voi odotusarvon laskea kappaleen 2.4 tuloksilla. Odotusarvo E(Y ) voidaan kuitenkin määrittää käyttämällä satunnaismuuttujan X tiheysfunktiota f (x): Lause 2.6.1. Olkoon satunnaismuuttujan X otosavaruus ΩX ja tiheysfunktio f (x). Olkoon Y = h(X). a) Jos X on diskreetti, niin X E(Y ) = E(h(X)) = h(x)f (x) x∈ΩX b) Jos X on jatkuva ja y = h(x) on paloittain jatkuva, niin Z ∞ h(x)f (x) dx E(Y ) = E(h(X)) = −∞ Todistus. (a) E(Y ) = X yg(y) = = yP (h(x) = y) = X h(x)f (x) = y∈ΩY x:h(x)=y X y∈ΩY y∈ΩY y∈ΩY X X X y X f (x) x:h(x)=y h(x)f (x) x∈ΩX (b) Todistus on hankala; rajoitutaan tapaukseen, jossa y = h(x) on aidosti monotoninen ja kääntyvä, y = h(x) ⇔ x = h−1 (y). Tällöin Z ∞ Z ∞ sij. x = h−1 (y) d h(x)f (x) dx = y f h−1 (y) h−1 (y) dy dx = d h−1 (y) dy dy −∞ −∞ | {z } dy g(y) Z ∞ = yg(y) dy = E(Y ) −∞ Lauseesta seuraa käyttökelpoisia tuloksia. Voidaan osoittaa (todistus harjoitustehtävänä), että Lause 2.6.2. Satunnaismuuttujan X funktion Y = ag(X) + bh(X) odotusarvo E(Y ) = E(ag(X) + bh(X)) = aE(g(X)) + bE(h(X)) ja erityisesti E(aX + b) = aE(X) + b 34 Lause 2.6.3. Satunnaismuuttujan X varianssille pätee laskukaava: Var(X) = E(X 2 ) − [E(X)]2 Todistus. Merkitään E(X) = µ. Havaitaan, että Var(X) on funktion Y = (X − µ)2 odotusarvo, Var(X) = E (X − µ)2 = E(X 2 − 2µX + µ2 ) = E(X 2 ) − 2µE(X) + µ2 = E(X 2 ) − µ2 Esimerkki 2.6.1. Olkoon diskreetin satunnaismuuttujan X tiheysfunktio f (x) = x , 10 kun x = 1, 2, 3, 4 Nyt 2 3 4 1 +2· +3· +4· =3 10 10 10 10 1 2 3 4 E(X 2 ) = 1 · +4· +9· + 16 · = 10 10 10 10 10 Var(X) = 10 − 32 = 1 E(X) = 1 · Esimerkki 2.6.2. Olkoon X jatkuva satunnaismuuttuja, jonka tiheysfunktio f (x) = 2x, kun 0 < x < 1. Esimerkissä 2.4.2 on laskettu E(X) = 2/3 ja 2 Z E(X ) = 0 1 1 1 x 2x dx = , joten Var(X) = − 2 2 2 2 2 1 = 3 18 Lause 2.6.4. Var(aX + b) = a2 Var(X) Todistus. Var(aX + b) Lause 2.6.3 = E((aX + b)2 ) − [E(aX + b)]2 = E(a2 X 2 + 2abX + b2 ) − [aE(X) + b]2 Lause 2.6.2 = = a2 a2 E(X 2 ) + 2abE(X) + b2 − a2 [E(X)]2 − 2abE(X) − b2 E(X 2 ) − [E(X)]2 = a2 Var(X) 35 2.7 Tsebyshevin epäyhtälö Jos satunnaismuuttujan X tiheysfunktio tunnetaan, voidaan tapahtumien todennäköisyydet laskea tarkasti. Jos tiheysfunktio on tuntematon, voidaan todennäköisyyttä kuitenkin arvioida, jos satunnaismuuttujan X odotusarvo µ ja varianssi σ 2 tunnetaan. Varianssi on X:n jakauman hajaantumisen mitta; fysikaalista tulkintaa käyttäen varianssi ilmaisee x-akselille tiivistyneen ”todennäköisyysmassan” keskittymistä (kun σ 2 on pieni) tai leviämistä (kun σ 2 on suuri) odotusarvon ympärille. Tsebyshevin epäyhtälön nojalla voidaan sanoa, että todennäköisyysmassan valtaosa sijaitsee odotusarvon ympärillä muutaman σ:n pituisessa välissä. Lause 2.7.1. Tsebyshevin epäyhtälö P (|X − µ| ≥ t) ≤ σ2 t2 ⇔ P (|X − µ| < t) ≥ 1 − 1 k2 ⇔ σ2 t2 ∀t > 0 Erityisesti, jos t = kσ, niin P (|X − µ| ≥ kσ) ≤ P (|X − µ| < kσ) ≥ 1 − 1 k2 Todistus. Annetaan todistus jatkuvalle satunnaismuuttujalle X, jonka tiheysfunktio on f (x). Z Z (x − µ)2 P (|X − µ| ≥ t) = f (x) dx ≤ f (x) dx t2 } |X−µ|≥t |X−µ|≥t | {z ≥1 1 = 2 t Z 1 (x − µ) f (x) dx ≤ 2 t |X−µ|≥t 2 ∞ σ2 (x − µ)2 f (x) dx = 2 t | −∞ {z } Z =σ 2 Huomaa, että arvoilla t ≤ σ epäyhtälö ei kerro mitään. Jos t = 2σ, niin vähintään todennäköisyydellä 0.75 satunnaismuuttujan arvo osuu lähemmäksi odotusarvoa kuin 2σ. Jos taas t = 3σ, niin korkeintaan todennäköisyydellä 1/9 ≈ 0.11 satunnaismuuttujan arvo osuu välin (µ − 3σ, µ + 3σ) ulkopuolelle. Esimerkki 2.7.1. Kuulalaakereiden halkaisija X (mm) on satunnaismuuttuja, jonka odotusarvo ja tiheysfunktio ovat tuntemattomia. Varianssin tiedetään olevan σ 2 = 0.09. Määrätään Tsebyshevin epäyhtälöllä yläraja todennäköisyydelle, että satunnaisesti valitun kuulan halkaisija poikkeaa odotusarvosta ainakin 0.7: P (|X − µ| ≥ 0.7) ≤ σ2 0.09 = ≈ 0.184 2 0.7 0.72 36 2.8 Momentit generoiva funktio Määritelmä 2.8.1. Olkoon k positiivinen kokonaisluku. Satunnaismuuttujan X k. (origo)momentti (moment about the origin) on odotusarvo E(X k ) Satunnaismuuttujan X k. keskusmomentti (moment about the mean) on odotusarvo E((X − µ)k ) Odotusarvo E(X) on siis 1. origomomentti ja varianssi Var(X) on 2. keskusmomentti. Edellä olevia odotusarvoja ei voi aina muodostaa. Momentit ovat olemassa, jos odotusarvot voidaan laskea. Yksi tapa momenttien laskemiseksi on yrittää muodostaa satunnaismuuttujan ns. momentit generoiva funktio. Määritelmä 2.8.2. Satunnaismuuttujan X momentit generoiva funktio (momenttifunktio, moment generating function) on diskreetille satunnaismuuttujalle X M (t) = E(etX ) = etx f (x) x∈ΩX ja jatkuvalle satunnaismuuttujalle Z tX ∞ M (t) = E(e ) = etx f (x) dx −∞ M (0) = E(1) = 1, joten momentit generoiva funktio on määritelty ainakin arvolla t = 0. Momentit generoivalla funktiolla on seuraava ominaisuus, jolla voi tutkia miten satunnaismuuttuja on jakautunut (todistus sivuutetaan): Lause 2.8.1. Yksikäsitteisyysominaisuus. Jos satunnaismuuttujien X ja Y momentit generoivat funktiot ovat samoja: MX (t) = MY (t) jollakin arvon t = 0 sisältävällä avoimella välillä, niin muuttujat X ja Y ovat jakautuneet samalla tavalla. 37 Seuraavassa lauseessa on momentit generoivan funktion keskeinen ominaisuus, jota voi käyttää jakauman ominaisuuksien selvittämiseen. Sen mukaan momentit generoivan funktion derivaattafunktioiden avulla saadaan laskettua satunnaismuuttujan X origomomentit. Tästä johtuu nimitys momentit generoiva funktio. Lause 2.8.2. Momentit generoivan funktion k:s derivaatta arvolla t = 0 on satunnaismuuttujan X k. origomomentti M (k) (0) = E(X k ) Todistus. M (k) dk (t) = k E(etX ) = E dt dk tX e dtk (t=0) = E(X k etX ) = E(X k ) Seuraus. E(X) = M 0 (0) ja Var(X) = M 00 (0) − M 0 (0)2 Esimerkki 2.8.1. Olkoon X ∼ Exp(1) jolloin f (x) = e−x , kun x ≥ 0 Momentit generoiva funktio on olemassa vain arvoilla t < 1, sillä Z ∞ Z ∞ tx −x M (t) = e e dx = e(t−1)x dx 0 = .∞ 0 0 1 (t−1)x 1 e = , t−1 1−t kun t < 1 Nyt 1 2 00 ja M (t) = (1 − t)2 (1 − t)3 Seurauksen nojalla on E(X) = 1 ja Var(X) = 2 − 12 = 1. M 0 (t) = Lause 2.8.3. Olkoon MX (t) satunnaismuuttujan X momentit generoiva funktio. Tällöin satunnaismuuttujan Y = aX + b momentit generoiva funktio on MY (t) = ebt MX (at) Todistus. MY (t) = E(etY ) = E(etaX+tb ) = ebt E(e(at)X ) = ebt MX (at) 38 2.9 Binomijakauma Toistetaan samaa koetta n kertaa ja kussakin toistossa tarkastetaan realisoituuko tietty tapahtuma A vai A:n komplementti A. Tapahtuman A realisoitumiskertojen lukumäärä X tässä n-toistokokeessa on diskreetti satunnaismuuttuja, jonka mahdolliset arvot ovat 0, 1, . . . , n. Mitä on P (X = x)? Olkoon P (A) = p, jolloin P (A) = 1 − p Oletetaan toistot riippumattomiksi. Toistokokeen alkeistapauksen, jossa A realisoituu x kertaa ja A realisoituu n − x kertaa jossakin järjestyksessä, todennäköisyys on px (1 − p)n−x . Tällaisia alkeistapauksia on nx erilaista, joten n x P (X = x) = p (1 − p)n−x x Diskreetti satunnaismuuttuja X noudattaa binomijakaumaa (binomial distribution) parametrein (n, p), merkitään X ∼ Bin(n, p), jos X:n otosavaruus Ω = {0, 1, . . . , n} ja tiheysfunktio n x f (x) = b(x; n, p) = p (1 − p)n−x , kun x = 0, 1, . . . , n x Tiheysfunktion arvoja otosavaruuden pisteissä sanotaan binomitodennäköisyyksiksi. Käyttämällä binomikaavaa n X n x n−x a b = (a + b)n x x=0 binomitodennäköisyyksiin, saadaan n X x=0 b(x; n, p) = n X n x=0 x px (1 − p)n−x = (p + 1 − p)n = 1 39 Satunnaismuuttujan X ∼ Bin(n, p) kertymäfunktio on F (x) = P (X ≤ x) = bxc X b(t; n, p) t=0 missä bxc on suurin kokonaisluku, joka ≤ x. Taulukoista tai valmisohjelmista löydät binomijakautuneen muuttujan kertymäfunktion ja sen käänteisfunktion arvoja. Lause 2.9.1. Jos X ∼ Bin(n, p), niin M (t) = (pet + 1 − p)n , E(X) = np ja Var(X) = np(1 − p) Todistus. Merkitään q = 1 − p. Momentit generoiva funktio on n n x n−x X n e M (t) = E(e ) = p q = (pet )x q n−x x x x=0 x=0 tX bin. kaava ⇒ n X tx M (t) = (pet + q)n . Nyt M 0 (t) = n(pet + q)n−1 pet jolloin E(X) = M 0 (0) = n(p + q)n−1 p = np. Edelleen M 00 (t) = n(n − 1)(pet + q)n−2 pet pet + n(pet + q)n−1 pet ja siis M 00 (0) = n(n − 1)(p + q)n−2 p2 + n(p + q)n−1 p = n(n − 1)p2 + np = np((n − 1)p + 1), jolloin Var(X) = n(n − 1)p2 + np − n2 p2 = n2 p2 − np2 + np − n2 p2 = np(1 − p) 40 Esimerkki 2.9.1. Rahaa heitetään 5 kertaa. Satunnaismuuttuja X = ’kruunujen lukumäärä’ noudattaa binomijakaumaa parametrein n = 5, p = 0.5, X ∼ Bin(5, 0.5) tiheysfunktionaan 5 5 x 5−x f (x) = 0.5 (1 − 0.5) = 0.55 , kun x ∈ Ω = {0, 1, . . . , 5} x x Esitetään jakauma vielä pistetodennäköisyyksien taulukkona ja graafisesti: xi 0 1 2 3 4 5 5 0 5 1 5 2 5 3 5 4 5 5 f (xi ) · 0.55 = 0.0312 · 0.55 = 0.1562 · 0.55 = 0.3125 · 0.55 = 0.3125 · 0.55 = 0.1562 · 0.55 = 0.0312 Esimerkki 2.9.2. Erään tuottajan transistoreista on 5 % viallisia. Asiakas ostaa 6 transistoria. Olkoon X = viallisten lukumäärä, jolloin X ∼ Bin(6, 0.05) tiheysfunktionaan 6 f (x) = 0.05x 0.956−x =, kun x ∈ Ω = {0, 1, . . . , 6} x Todennäköisyys, että asiakas saa yhden tai kaksi viallista transistoria on 6 6 5 P (X = 1 tai X = 2) = · 0.05 · 0.95 + · 0.052 · 0.954 = 0.263 1 2 Todennäköisyys, että asiakas saa vähintään yhden viallisen transistorin on P (X ≥ 1) = 1 − P (X < 1) = 1 − P (X = 0) = 1 − 0.956 = 0.265 41 2.10 Poisson jakauma Diskreetti satunnaismuuttuja X, jonka otosavaruus on ei-negatiivisten kokonaislukujen joukko Ω = {0, 1, 2, . . . }, noudattaa Poisson-jakaumaa (Poisson distribution) parametrina λ > 0, merkitään X ∼ Poi(λ), jos sen tiheysfunktio f (x) = p(x; λ) = λx −λ e , x! kun x = 0, 1, 2, . . . t Lause 2.10.1. Jos X ∼ Poi(λ), niin M (t) = e−λ eλe , E(X) = λ ja Var(X) = λ Todistus. Muodostetaan momentit generoiva funktio: tX M (t) = E(e ) = ∞ X x=0 sillä ∞ P x=0 ux x! x tx λ −λ e x! e =e −λ ∞ X (λet )x x=0 x! = e−λ eλe t = eu . Derivoidaan tämä kerran ja kahdesti t :n suhteen M 0 (t) = λe−λ+t+λe t t t ja M 00 (t) = λ e−λ+t+λe + λe−λ+2 t+λe ja näin saadaan E(X) = M 0 (0) = λ ja Var(X) = M 00 (0) − (M 0 (0))2 = λ . Tietyissä tilanteissa Poisson-jakaumaa voidaan käyttää binomijakauman approksimoimiseen. Olkoon X ∼ Bin(n, p). Kiinnitetään np = λ vakioksi ja annetaan n → ∞, jolloin p = λ/n → 0. Tällöin λ lim b x; n, = p(x; λ) ∀x = 0, 1, . . . n→∞ n 42 sillä x n−x λ n λ λ b x; n, = 1− n x n n n −x λ λ n(n − 1) · · · (n − x + 1) λx 1− 1− = x! nx n n −x n 1 x−1 λ λ λx 1− ··· 1 − 1− 1− = x! n n n n x λ → e−λ , kun n → ∞, x! sillä 1 1− n −x x−1 λ ,··· , 1 − ja 1 − → 1 kun n → ∞ n n sekä eksponenttifunktion raja-arvomääritelmän mukaan raja-arvo n λ = e−λ lim 1 − n→∞ n Konvergointi on nopeata, kun λ << n. Siis: Kun n on suuri, p on pieni ja λ << n eli kyseessä on harvinainen tapahtuma hyvin monen toiston sarjassa, voidaan approksimoida Bin(n, p) ≈ Poi(λ), missä λ = np Esimerkki 2.10.1. Tiedetään, että sadasta signaalista keskimäärin yksi välittyy virheellisesti. Lähetetään 200 toisistaan riippumatonta signaalia. Lasketaan todennäköisyys sille, että ainakin kolme signaalia välittyy virheellisesti. Olkoon X = virhesignaalien lukumäärä ja A = ”signaali virheellinen”. Nyt P (A) = 0.01, ja lähetetään 200 signaalia. Siis X ∼ Bin(200, 0.01). Lasketaan todennäköisyys ensin tarkasti: P (X ≥ 3) = 1 − P (X < 3) 200 200 200 0 200 1 199 2 198 =1− 0.01 · 0.99 + 0.01 · 0.99 + 0.01 · 0.99 0 1 2 = 1 − [0.1340 + 0.2707 + 0.2720] = 0.3233 Laskettaessa sama todennäköisyys Poissonin approksimaatiota käyttäen saadaan 4 desimaalin tarkkuudella sama tulos 0 2 21 22 −2 P (X ≥ 3) = 1 − e + + = 1 − e−2 (1 + 2 + 2) = 0.3233 0! 1! 2! 43 Tärkeä Poisson-jakauman sovellutus on sen käyttö stokastisten prosessien käsittelyssä, kun ollaan kiinnostuneita tietyn tapahtuman A realisoitumisten lukumäärästä prosessissa tietyllä aikavälillä. Oletetaan prosessista: 1. Jos I1 , I2 , . . . , In ovat pistevieraita aikavälejä, niin tapahtuman A esiintymismäärät eri aikaväleillä ovat riippumattomia. 2. Tapahtuman A esiintymisten keskimääräistä lukumäärää aikayksikössä voidaan pitää vakiona q. 3. Todennäköisyys sille, että A realisoituu hyvin lyhyellä aikavälillä ∆t useammin kuin kerran, on likimain nolla. Jos prosessi toteuttaa nämä oletukset 1-3 ja X =”tapahtuman A esiintymisten lukumäärä aikavälillä (t1, t2)”, niin voidaan osoittaa X ∼ Poi(λ), missä parametri λ = q(t2 − t1 ) Esimerkki 2.10.2. Gramma radiumia lähettää keskimäärin 3.57 × 1010 α-hiukkasta sekunnissa. Lasketaan todennäköisyys sille, että yhden nanosekunnin (= 10−9 sek) aikana se lähettää (a) täsmälleen 35 α-hiukkasta (b) 27, 28 tai 29 α-hiukkasta. Voidaan otaksua prosessin toteuttavan ”Poisson-oletukset” 1)-3). Olkoon X α-hiukkasten lukumäärä nanosekunnissa. Tällöin X ∼ Poi(λ), missä λ = (3.57 × 1010 ) × 10−9 = 35.7 a) Täsmälleen 35 α-hiukkasta P (X = 35) = p(35; 35.7) = 35.735 −35.7 e = 0.0668 35! b) 27, 28 tai 29 α-hiukkasta. P (27 ≤ X ≤ 29) = 29 X x=27 p(x; 35.7) = 35.727 −35.7 35.728 −35.7 35.729 −35.7 e + e + e = 0.0924 27! 28! 29! Huomautus. Poisson-jakaumaa voit myös soveltaa satunnaiskokeisiin, joissa ollaan kiinnostuneita tapahtuman A realisoitumisten lukumäärästä tietyllä pituuden, pinta-alan tai tilavuuden osalla. Satunnaiskokeen tulee toteuttaa oletuksia 1)-3) vastaavat oletukset. 44 2.11 Normaalijakauma Tärkein jatkuvista jakaumista on normaalijakauma (normal distribution). Satunnaismuuttuja X, jonka otosavaruus on koko reaalilukujen joukko, on normaalijakautunut parametrein (µ, σ 2 ), merkitään X ∼ N(µ, σ 2 ), jos X:n tiheysfunktio on 1 x−µ 2 1 f (x) = n(x; µ, σ) = √ e− 2 ( σ ) σ 2π (−∞ < µ < ∞, σ > 0) Käyttämällä hyväksi epäoleellisten tasointegraalien teoriaa voidaan osoittaa, että R∞ n(x; µ, σ) dx = 1. Tiheysfunktion kuvaaja on symmetrinen suoran x = µ suhteen. −∞ Muuttuja Z ∼ N(0, 1) on standardoidusti normaalijakautunut. Sen tiheysfunktio on 1 2 1 φ(z) = √ e− 2 z 2π ja kertymäfunktio on 1 Φ(z) = P (Z ≤ z) = √ 2π Z z 1 2 e− 2 t dt −∞ Tiheysfunktion symmetrisyyden perusteella Φ(−z) = 1 − Φ(z), sillä Φ(−z) = P (Z ≤ −z) = P (Z ≥ z) = 1 − P (Z ≤ z) = 1 − Φ(z) Lause 2.11.1. Jos X ∼ N(µ, σ 2 ), niin M (t) = e E(X) = µ ja 45 µt+σ 2 t2 /2 , Var(X) = σ 2 . Todistus. Muodostetaan momentit generoiva funktio: Z ∞ 1 x−µ 2 1 tX M (t) = E(e ) = etx √ e− 2 ( σ ) dx σ 2π −∞ Z ∞ 1 1 2 2 et(µ+tσ +σy) √ = e− 2 (y+tσ) σ dy σ 2π −∞ Z ∞ 1 2 1 2 2 2 2 √ e− 2 y dy = eµt+t σ −t σ /2 2π {z } | −∞ 2 sij. y = x − µ − tσ , dy = dx σ σ 1 µt+t2 σ 2 /2 =e Nyt M 0 (t) = M (t)(µ + σ 2 t) ja M 00 (t) = M 0 (t)(µ + σ 2 t) + M (t)σ 2 ja siis E(X) = M 0 (0) = e0 µ = µ. Edelleen M 00 (0) = µ·µ+1·σ 2 ⇒ Var(X) = µ2 +σ 2 −µ2 = σ 2 . Lause 2.11.2. X ∼ N(µ, σ 2 ) Y = aX + b ∼ N(aµ + b, a2 σ 2 ) ⇒ Lause 2.8.3 2 2 2 σ 2 )t2 /2 Todistus. MY (t) = ebt MX (at) = ebt eµat+σ (at) /2 = e(µa+b)t+(a mistä seuraa lauseen 2.8.1 perusteella että Y ∼ N(aµ + b, a2 σ 2 ) Seuraus 1. Jos X ∼ N(µ, σ 2 ), niin Z = X −µ ∼ N(0, 1). σ Normaalijakauman kertymäfunktion arvoja et voi integroida suljetussa muodossa vaan arvot on laskettava numeerisesti. Valmisohjelmat antavat N(µ, σ 2 )-jakautuneen satunnaismuuttujan kertymäfunktion ja sen käänteisfunktion arvoja. Taulukoista löytyvillä (Liite 2) N(0, 1)jakauman kertymäfunktion Φ(z) arvoilla voit laskea myös N (µ, σ 2 )-jakautuneen muuttujan tapahtumien todennäköisyyksiä, sillä Seuraus 2. Muuttujan X ∼ N(µ, σ 2 ) kertymäfunktio on x−µ F (x) = Φ σ Todistus. F (x) = P (X ≤ x) = P X−µ σ ≤ x−µ σ =Φ 46 x−µ σ Esimerkki 2.11.1. Jos muuttujan X ∼ N(µ, σ 2 ) kertymäfunktio on F , niin b−µ a−µ P (a ≤ X ≤ b) = F (b) − F (a) = Φ −Φ σ σ Esimerkki 2.11.2. Suomalaisten täysikasvuisten naisten pituus X senttimetreissä noudattaa jakaumaa N(165.0, 6.52 ). Siis Z = X−165.0 ∼ N(0, 1). Todennäköisyys sille, että satunnaisesti 6.5 valitun naisen pituus mitattuna senttimetrin tarkkuudella on 165.0, on X − 165.0 165.5 − 165.0 164.5 − 165.0 ≤ ≤ P (164.5 ≤ X ≤ 165.5) = P 6.5 6.5 6.5 = P (−0.08 ≤ Z ≤ 0.08) = Φ(0.08) − Φ(−0.08) = Φ(0.08) − (1 − Φ(0.08)) = 2 Φ(0.08) −1 | {z } 0.5319 = 0.064 Todennäköisyys sille, että satunnaisesti valitun naisen pituus mitattuna senttimetrin tarkkuudella on välillä (155, 175), on 154.5 − 165.0 X − 165.0 175.5 − 165.0 P (154.5 ≤ X ≤ 175.5) = P ≤ ≤ 6.5 6.5 6.5 = 2 Φ(1.62) −1 | {z } 0.9474 = 0.8948 Lasketaan vielä mikä on se pituus c, jota pidempiä on 1 % suomalaisista naisista: P (X ≥ c) = 0.01 ⇔ ⇔ ⇔ ⇔ ⇔ P (X ≤ c) = 0.99 X − 165.0 c − 165.0 P ≤ = 0.99 6.5 6.5 c − 165.0 Φ = 0.99 = Φ(2.33) 6.5 c − 165.0 = 2.33 6.5 c = 6.5 · 2.33 + 165.0 = 180.1 cm Huomautus. Normaalijakaumaan palataan vielä luvun 3 lopussa, missä käsitellään keskeistä raja-arvolausetta. Voidaan osoittaa, että usean, mitä tahansa jakaumaa noudattavan satunnaismuuttujan summa noudattaa melko hyvin normaalijakaumaa. Tämän seurauksena saadaan tulos, että binomijakaumaa noudattavaa satunnaismuuttujaa X ∼ Bin(n, p) voidaan approksimoida normaalijakaumalla N(np, np(1 − p)), jos p on lähellä arvoa 0.5. 47 3 Yhteisjakaumat ja satunnaismuuttujien funktiot Sovelluksissa usein kokeen tuloksena saadaan havaintoarvot satunnaismuuttujille X1 , X2 , . . . , Xp eli satunnaisvektorille (X1 , X2 , . . . , Xp ). Koetta kuvaavan matemaattisen mallin rakentaminen edellyttää, että eri komponenttien todennäköisyysjakaumien lisäksi selvitetään komponenttien yhteisjakauma eli satunnaisvektorin jakauma. Tällöin tehtävänä on mallintaa (havaintoarvojen pohjalta) satunnaisvektorin eri tapahtumien todennäköisyydet. Todennäköisyysmitan tulee toteuttaa Kolmogorovin aksiomat. Kuten skalaarisessa tapauksessa myös satunnaisvektorin tapahtumien todennäköisyydet tavallisesti annetaan tiheysfunktion avulla. Seuraavassa tarkastellaan lähinnä 2-ulotteisia satunnaisvektoreita. Yleistys p-ulotteisille satunnaisvektoreille on monesti suoraviivainen; siirrytään p-ulotteisiin vektoreihin, jatkuvan jakauman tapauksessa 2-ulotteiset integraalit korvataan p-ulotteisilla. 3.1 Diskreetin satunnaisvektorin jakauma Satunnaisvektori (X, Y ) on diskreetti (discrete), jos sen molemmat komponentit ovat diskreettejä satunnaismuuttujia. Diskreetin satunnaisvektorin otosavaruus on tason äärellinen tai ääretön diskreetti osajoukko Ω = {(x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ), . . . }. Satunnaisvektorin (X, Y ) tiheysfunktio (density function) f (x, y) määritellään jokaisessa tason pisteessä (x, y) siten että f (x, y) = P (X = x, Y = y) Nyt f (x, y) = 0, jos (x, y) ∈ / Ω. Arvot f (x, y), missä (x, y) ∈ Ω, ovat pistetodennäköisyyksiä. Niiden summan on oltava X f (x, y) = 1 (x,y)∈Ω Tapahtuman A ⊂ Ω todennäköisyys lasketaan X P (A) = f (x, y) (x,y)∈A Satunnaisvektorin (X, Y ) kertymäfunktio (cumulative distribution function) F määritellään jokaisessa tason pisteessä (x, y) siten että X F (x, y) = P (X ≤ x, Y ≤ y) = f (r, s) (r,s): r≤x, s≤y 48 Esimerkki 3.1.1. Satunnaisvektorin (X, Y ) otosavaruus on Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja tiheysfunktio on muotoa kun (x, y) ∈ Ω f (x, y) = c(x + 2y), Ehdosta, että pistetodennäköisyyksien summa = 1, määräytyy vakio c: 1= X ⇒ c(x + 2y) = c(2 + 4 + 1 + 3 + 2) = c12 (x,y)∈Ω c= 1 12 Määritettäessä tapahtuman todennäköisyyttä lasketaan tapahtumaan kuuluvien alkeistapahtumien pistetodennäköisyydet yhteen, esimerkiksi 1 1 3 (1 + 2 · 0) + (2 + 2 · 0) = 12 12 12 1 4 1 P (X = 1) = f (1, 0) + f (1, 1) = (1 + 2 · 0) + (1 + 2 · 1) = 12 12 12 P (X > Y ) = f (1, 0) + f (2, 0) = 3.2 Jatkuvan satunnaisvektorin jakauma Satunnaisvektori (X, Y ) on jatkuva (continuous), jos sen komponentit ovat jatkuvia satunnaismuuttujia. Satunnaisvektorin otosavaruus Ω on xy-tason osajoukko. Sen todennäköisyysjakaumaa tavallisesti luonnehditaan tiheysfunktiolla. Jatkuvan satunnaisvektorin (X, Y ) tiheysfunktio (density function) on koko tasossa määritelty ei-negatiivinen funktio f (x, y), joka on = 0 otosavaruuden ulkopuolella, ja jonka avulla voidaan esittää tapahtuman (X, Y ) ∈ A} todennäköisyys tasointegraalina ZZ ZZ P (A) = P ((X, Y ) ∈ A) = f (x, y)dxdy = f (x, y)dxdy A A∩Ω Funktiota f (x, y) kutsutaan myös satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktioksi (the density function of the joint distribution). Jotta P (Ω) = 1, on sen toteutettava ehto ZZ ZZ f (x, y)dxdy = f (x, y)dxdy = 1 R2 Ω Tasointegraali yli koko tason R2 lasketaan raja-arvon avulla: ZZ Z ∞Z ∞ Z f (x, y)dxdy = f (x, y)dxdy = lim R2 −∞ t→∞ −∞ t −t Z t f (x, y)dxdy −t Tapahtuman todennäköisyys P (A) on geometrisesti tulkittuna pinnan f (x, y) ≥ 0 ja xy−tason väliin jäävän suoran sylinterikappaleen tilavuus, jonka pohjana on xy−tason joukko A. 49 Satunnaisvektorin (X, Y ) kertymäfunktio (cumulative distribution function) määritellään jokaisessa tason pisteessä (x, y) siten, että Z x Z y F (x, y) = P (X ≤ x, Y ≤ y) = f (r, s) ds dr −∞ −∞ missä f (x, y) on vektorin (X, Y ) tiheysfunktio. Pisteissä (x, y), joissa tiheysfunktio on jatkuva, pätee ∂2 F (x, y) = f (x, y) ∂y∂x Esimerkki 3.2.1. Satunnaisvektorin (X, Y ) tiheysfunktio on muotoa kun (x, y) ∈ Ω = {(x, y) : 0 < x < y, 0 < y < 1} f (x, y) = cxy, Määritetään vakio c: ZZ Z 1 Z y 1= f (x, y)dxdy = c xy dx dy 0 0 ! Z 1 Z 1 .y 1 3 1 2 yx dy = c y dy =c 2 0 2 0 Ω 0 .1 =c 0 1 4 1 y =c 8 8 ⇒ c=8 Lasketaan todennäköisyys P (X + Y < 1). Nyt integroimisjoukko on otosavaruuden ja joukon {(x, y) | x+y < 1} leikkausjoukko. Otosavaruus on kolmio, jonka kärkipisteet ovat (0, 0), (0, 1) ja (1, 1) ja tästä kolmiosta rajataan suoran y = 1 − x alapuolelle jäävä osa (kuva). 1 P (X + Y < 1) = P ({X + Y < 1} ∩ Ω) = P (0 < X < , X < Y < 1 − X) 2 ! Z 1 Z 1−x Z 1 1−x . 2 2 = 8xy dy dx = 4xy 2 dx 0 x 1 2 Z = 0 4x(1 − 2x + x2 ) − 4x3 dx 0 1 2 Z = (−8x2 + 4x)dx 0 1 .2 8 3 2 − x + 2x = 3 0 1 1 1 =− + = 3 2 6 50 x 3.3 Marginaalijakaumat Tarkastellaan koetta, jossa tuloksena saadaan havaintoarvo satunnaismuuttujille X ja Y eli satunnaisvektorille (X, Y ). Oletetaan tunnetuksi satunnaismuuttujien X ja Y yhteisjakauman eli satunnaisvektorin (X, Y ) tiheysfunktio f (x, y). Mikä on X:n tiheysfunktio, kun tarkkaillaan koetuloksia vain muuttujan X osalta? Tällainen tiheysfunktio löytyy ja sitä kutsutaan komponentin X (marginaalijakauman) tiheysfunktioksi (the density function (of the marginal distribution)). Sille käytetään merkintää f1 (x). Vastaavasti määritellään komponentin Y marginaalijakauman tiheysfunktio f2 (y). Nämä tiheysfunktiot ovat normaaleja yhden satunnaismuuttujan tiheysfunktioita, jotka ovat muodostetut yhteisjakaumasta. Äärellisessä diskreetissä tapauksessa marginaalijakaumat saadaan taulukoimalla ja laskemalla todennäköisyyksien rivi- ja sarakesummia seuraavan esimerkin mukaan. Esimerkki 3.3.1. Mitkä ovat esimerkin 3.1.1 komponenttien marginaalijakaumien tiheysfunktiot? Satunnaisvektorin (X, Y ) otosavaruus Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja tiheysfunktio 1 f (x, y) = (x + 2y), kun (x, y) ∈ Ω 12 Taulukoidaan nämä todennäköisyydet x 0 1 2 Σ 0 − 1/12 2/12 3/12 y 1 2/12 3/12 − 5/12 − 4/12 2 4/12 − Σ 6/12 4/12 2/12 12/12 = 1 Taulukon sarake- ja rivisummista saadaan marginaalijakaumien tiheysfunktiot. f1 (x) : Ωx = {0, 1, 2} f2 (y) : Ωy = {0, 1, 2} 6 , f1 (1) = 12 3 f2 (0) = , f2 (1) = 12 f1 (0) = 4 , f1 (2) = 12 5 , f2 (2) = 12 2 12 4 12 Jatkuvan satunnaismuuttujan kohdalla marginaalijakaumien tiheysfunktiot saadaan ’integroimalla toisen muuttujan vaikutus pois’ seuraavan lauseen mukaan. 51 Lause 3.3.1. Satunnaisvektorin (X, Y ), jonka tiheysfunktio on f (x, y), komponenttien X ja Y marginaalijakaumien tiheysfunktiot ovat Z ∞ Z ∞ f (x, y) dy ja f2 (y) = f (x, y) dx f1 (x) = −∞ −∞ Todistus. Annetaan todistus X:n tiheysfunktiolle. Selvästikin R:n tapahtuman {a ≤ X ≤ b} todennäköisyys on yhtäsuuri kuin R2 :n tapahtuman {a ≤ X ≤ b, Y voi olla mitä tahansa} todennäköisyys: P (a ≤ X ≤ b) = P (a ≤ X ≤ b, Y ∈ R) Z b Z ∞ f (x, y) dy dx = −∞ a b Z f1 (x) dx = a missä f1 (x) = tiheysfunktio. R∞ −∞ f (x, y) dy on tiheysfunktion määritelmän nojalla X:n marginaalijakauman Satunnaisvektorin (X, Y ) ∈ R2 sanotaan olevan tasajakautunut (uniformly distributed) joukossa Ω ⊂ R2 , merkitään (X, Y ) ∼ Tas(Ω), jos sen otosavaruus on Ω ja tiheysfunktio 1 , kun (x, y) ∈ Ω f (x, y) = a(Ω) missä a(Ω) on Ω:n pinta-ala. Jos A ⊂ Ω, niin P (A) = a(A)/a(Ω). Esimerkki 3.3.2. Olkoon satunnaisvektori (X, Y ) tasajakautunut kolmioon 0 ≤ x ≤ 1, 0 ≤ y ≤ x. Kolmion ala on 1/2, joten tiheysfunktio kun 0 ≤ x ≤ 1, 0 ≤ y ≤ x f (x, y) = 2, Lasketaan komponenttien tiheysfunktiot: Z ∞ Z f1 (x) = f (x, y) dy = −∞ Z ∞ f2 (y) = 2 dy = 2x, kun 0 ≤ x ≤ 1 0 Z 1 2 dx = 2(1 − y), f (x, y) dx = −∞ x y 52 kun 0 ≤ y ≤ 1 3.4 Satunnaismuuttujien riippumattomuus Määritelmä 3.4.1. Satunnaisvektorin (X, Y ) komponentit X ja Y ovat riippumattomia, jos kaikille A, B ⊂ R P (X ∈ A, Y ∈ B) = P (X ∈ A)P (Y ∈ B) Määritelmän mukaan komponentit X ja Y ovat riippumattomia, jos kaikille reaalilukujoukoille A ja B tapahtumat {X ∈ A} ja {Y ∈ B} ovat riippumattomia. Täten riippumattomilla satunnaismuuttujilla on, kuten intuitiivisesti pitääkin olla, seuraava oleellinen ominaisuus: Tieto toisen muuttujan saamasta arvosta ei saa vaikuttaa toiseen muuttujaan liittyviin todennäköisyyksiin. Esimerkiksi ihmisten pituus ja sosiaaliturvatunnuksen alkuosan 4 ensimmäistä merkkiä (miksi vain nämä?) voitaneen olettaa riippumattomiksi satunnaismuuttujiksi. Esimerkki 3.4.1. Ovatko esimerkin 3.1.1 komponentit riippumattomia? Satunnaisvektorin (X, Y ) otosavaruus Ω = {(0, 1), (0, 2), (1, 0), (1, 1), (2, 0)} ja tiheysfunktio f (x, y) = 1 (x + 2y), 12 kun (x, y) ∈ Ω Valitaan esimerkiksi joukot A = {0} ja B = {0}. Todennäköisyydet 1 6 1 (0 + 2 · 1) + (0 + 2 · 2) = 12 12 12 1 1 3 P (Y ∈ B) = P (Y = 0) = (1 + 2 · 0) + (2 + 2 · 0) = 12 12 12 P (X ∈ A, Y ∈ B) = P (X = 0, Y = 0) = 0 P (X ∈ A) = P (X = 0) = Näin on löydetty joukot A ja B, joille P (X ∈ A)P (Y ∈ B) = 6 3 · 6= P (X ∈ A, Y ∈ B) = 0 12 12 Koska riippumattomuuden määritelmän mukaan yhtäsuuruus pitäisi olla voimassa kaikilla joukoilla A ja B, niin komponentit X ja Y eivät ole riippumattomia. Tällä tavoin voidaan diskreeteissä tapauksissa osoittaa komponenttien riippuvuus, jos vain löydetään yksi joukkopari, jolle yhtäsuuruus ei päde. Riippumattomuuden osoittamiseksi pitäisi yhtäsuuruus osoittaa kaikille mahdollisille joukoille A ja B, joka pienissä otosavaruuksissa on mahdollista, joskin työlästä. Jatkuvien satunnaismuuttujien kohdalla riippumattomuuden pystyy selvittämään seuraavan lauseen avulla: 53 Lause 3.4.1. Satunnaisvektorin (X, Y ), jonka tiheysfunktio on f (x, y), komponentit ovat riippumattomia (independent), jos ja vain jos f (x, y) = f1 (x)f2 (y) missä f1 (x) ja f2 (y) ovat X:n ja Y :n marginaalijakauman tiheysfunktiot. Todistus. ”⇒” Oletetaan että satunnaismuuttujat X ja Y ovat riippumattomia. Silloin voidaan satunnaisvektorin (X, Y ) kertymäfunktio esittää muuttujien X ja Y kertymäfunktioiden F1 (x) ja F2 (y) tulona: F (x, y) = P (X ≤ x, Y ≤ y) = P (X ≤ x)P (Y ≤ y) = F1 (x)F2 (y) Tätä puolittain osittaisderivoimalla saadaan f (x, y) = ∂2 F (x, y) = F10 (x)F20 (y) = f1 (x)f2 (y) ∂y∂x ”⇐” Oletetaan että f (x, y) = f1 (x)f2 (y). Nyt kaikille A, B ⊂ R: Z Z P (X ∈ A, Y ∈ B) = f (x, y) dy dx A B Z Z = f1 (x)f2 (y) dy dx A B Z Z f2 (y) dy f1 (x) dx = A B = P (X ∈ A)P (Y ∈ B) joten X ja Y ovat riippumattomia. Huomautus 1. Jos riippumattomien satunnaismuuttujien X ja Y tiheysfunktiot f1 (x) ja f2 (y) tunnetaan, niin niiden yhteisjakauman tiheysfunktio on f (x, y) = f1 (x)f2 (y). Esimerkki 3.4.2. Satunnaiskoe, jonka mittaustuloksen X tiheysfunktio on g(x) = 2x, kun 0 ≤ x ≤ 1 toistetaan kahdesti. Mittaustulokset X ja Y ovat riippumattomia. Mitä on P (X + Y ≤ 1)? Nyt muuttujien X ja Y yhteisjakauman tiheysfunktio on ( 4xy, kun 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 f (x, y) = g(x)g(y) = 0, muulloin 54 ja Z 1 Z P (X + Y ≤ 1) = 1−x Z 1−x . 1 4xydy dx = 0 Z 0 0 1 3 2 (2x − 4x + 2x)dx = = 0 2xy 2 dx 0 .1 1 0 ! 4 x − x3 + x 2 2 3 4 1 4 1 = − +1= 2 3 6 Yleistetään riippumattomuuden määritelmä koskemaan useampaa kuin kahta muuttujaa: Määritelmä 3.4.2. Satunnaismuuttujat X1 , X2 , . . . , Xp ovat riippumattomia, jos kaikille A1 , A2 , . . . , Ap ⊂ R pätee: P (X1 ∈ A1 , X2 ∈ A2 , . . . , Xp ∈ Ap ) = P (X1 ∈ A1 )P (X2 ∈ A2 ) · · · P (Xp ∈ Ap ) Huomautus 2. Sovellutuksissa satunnaismuuttujien riippumattomuuden selvittäminen saattaa olla vaikeata; riippumattomaksi ne oletetaan, jos ei ole mitään näyttöä riippuvuudesta. Esitetään lopuksi tärkeä tulos riippumattomien satunnaismuuttujien funktioiden riippumattomuudesta. Lause 3.4.2. Olkoot satunnaismuuttujat X1 , X2 , . . . , Xp riippumattomia ja U1 = h1 (X1 ), U2 = h2 (X2 ), . . . , Up = hp (Xp ). Tällöin satunnaismuuttujat U1 , U2 , . . . , Up ovat riippumattomia. Todistus. P (U1 ∈ A1 , . . . , Up ∈ Ap ) = P (h1 (X1 ) ∈ A1 , . . . , hp (Xp ) ∈ Ap ) = P (X1 ∈ B1 , . . . , Xp ∈ Bp ) = P (X1 ∈ B1 ) · · · P (Xp ∈ Bp ) = P (h1 (X1 ) ∈ A1 ) · · · P (hp (Xp ) ∈ Ap ) = P (U1 ∈ A1 ) · · · P (Up ∈ Ap ), missä Bi = {Xi ∈ ΩXi | hi (Xi ) ∈ Ai }. Huomautus 3. Voidaan osoittaa, että jos riippumattomista satunnaismuuttujista X1 , X2 , . . . , Xp valitaan mikä tahansa määrä ja mitkä tahansa eri satunnaismuuttujat X(1) , X(2) , . . . , X(k) , (2 ≤ k ≤ p), niin nämä ovat riippumattomia. 55 3.5 Satunnaismuuttujien funktion odotusarvo Tarkastellaan satunnaismuuttujien X ja Y reaaliarvoista funktiota U = h(X, Y ). Näin saatu U on skalaarinen satunnaismuuttuja. Miten saadaan satunnaismuuttujan U odotusarvo E(U )? Muodostetaanko U :n tiheysfunktio ja käytetään sitten odotusarvon määritelmää? Näin ei tarvitse menetellä, sillä voidaan todistaa (vastaavasti kuin lause 2.6.1) Lause 3.5.1. Olkoon satunnaismuuttujien X ja Y yhteisjakauman eli satunnaisvektorin (X, Y ) tiheysfunktio f (x, y) ja otosavaruus Ω. Olkoon U = h(X, Y ). Tällöin, jos (X, Y ) on diskreetti, X E(U ) = E(h(X, Y )) = h(x, y)f (x, y) (x,y)∈Ω ja jos (X, Y ) on jatkuva, ZZ E(U ) = E(h(X, Y )) = h(x, y)f (x, y) dxdy Ω Esimerkki 3.5.1. Jatketaan esimerkkiä 3.2.1 ja lasketaan muuttujan U = XY odotusarvo. Satunnaisvektorin (X, Y ) tiheysfunktio ja otosavaruus ovat kun (x, y) ∈ Ω = {(x, y) : 0 < x < y, 0 < y < 1} f (x, y) = 8xy, Edellisen lauseen mukaan Z 1 Z E(XY ) = y Z xy8xy dx dy = 0 Z = 0 0 1 0 1 .y 8 0 3 ! x3 y 2 dy .1 8 8 5 4 y dy = y6 = 3 18 9 0 Lause 3.5.2. E(g(X, Y ) + h(X, Y )) = E(g(X, Y )) + E(h(X, Y )) 56 Todistus. Annetaan todistus tapauksessa, jossa muutujien X ja Y yhteisjakauma on jatkuva, tiheysfunktiona f (x, y) ja otosavaruutena Ω. Diskreetissä tapauksessa todistus on täysin analoginen; integraalien tilalla ovat summat. Nyt lauseen 3.5.1 ja tasointegraalin ominaisuuksien nojalla ZZ Lause 3.5.1 (g(x, y) + h(x, y)) f (x, y) dxdy E(g(X,Y ) + h(X, Y )) = Ω ZZ ZZ = g(x, y)f (x, y) dxdy + h(x, y)f (x, y) dxdy Ω Ω = E(g(X, Y )) + E(h(X, Y )) Asettamalla lauseessa 3.5.2 g(X, Y ) = a1 X ja h(X, Y ) = a2 Y saadaan tulos E(a1 X + a2 Y ) = a1 E(X) + a2 E(Y ). Tämä voidaan yleistää: Satunnaismuuttujien X1 , X2 , . . . , Xn lineaarisen lausekkeen odotusarvolla on lineaarisuusominaisuus E(a1 X1 + a2 X2 + · · · + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + · · · + an E(Xn ) Lause 3.5.3. Jos satunnaismuuttujat X ja Y ovat riippumattomia, niin E(XY ) = E(X)E(Y ) Todistus. Todistetaan tapaus, jossa muuttujien X ja Y yhteisjakauma on jatkuva, tiheysfunktiona f (x, y). Olkoon X:n ja Y :n tiheysfunktiot fi (x) ja f2 (y). Koska X ja Y ovat riippumattomia, on satunnaismuuttujien X ja Y yhteisjakauman tiheysfunktio f (x, y) = f1 (x)f2 (y). Täten Z ∞Z ∞ E(XY ) = xyf1 (x)f2 (y) dxdy −∞ −∞ Z ∞ Z ∞ = xf1 (x) dx yf2 (y) dy −∞ −∞ = E(X)E(Y ) 57 Esimerkki 3.5.2. Olkoon satunnaisvektorin (X, Y ) tiheysfunktio f (x, y) = x + y, kun 0 < x < 1, 0 < y < 1 Lasketaan odotusarvot E(X), E(Y ), E(X + Y ) ja E(XY ). Koska f (x, y) = x + y, 1 Z f1 (x) = x + y dy = 0 0 1 Z f2 (y) = 0 .1 1 1 xy + y 2 = x + 2 2 ja 1 x + y dx = y + . 2 Saadaan siis Z E(X) = 0 1 .1 1 1 1 1 1 7 x(x + )dx = x3 + x 2 = + = 2 3 4 3 4 12 0 ja Z E(Y ) = 0 1 1 7 y(y + )dy = . 2 12 Edelleen 7 14 7 7 + = = . 12 12 12 6 Tutkitaan vielä, ovatko X ja Y riippumattomia. Koska ZZ Z 1Z 1 E(XY ) = xy(x + y)dxdy = x2 y + xy 2 dy dx Ω 0 0 ! Z 1 .1 Z 1 1 2 2 1 3 1 2 1 = x y + xy dx = x + x dx 2 3 3 0 0 2 0 2 .1 1 1 2 1 7 3 = x + x = 6= = E(X)E(Y ), 6 6 3 12 E(X + Y ) = E(X) + E(Y ) = 0 niin X ja Y eivät ole riippumattomia. Huomaa kuitenkin, että vaikka E(XY ) olisi ollut = E(X)E(Y ), niin siitä ei kuitenkaan välttämättä seuraa se, että X ja Y olisivat olleet riippumattomia. Lauseen 3.5.3 avulla voidaan osoittaa vain satunnaismuuttujien riippuvuus. Riippumattomuuden osoittamiseen se ei sovellu. 58 3.6 Riippumattomien satunnaismuuttujien summa Tärkeä satunnaismuuttujien tyyppi on riippumattomien satunnaismuuttujien X1 , X2 , . . . , Xn summa Y = X1 +X2 +· · ·+Xn . Mikä on Y :n jakauma kun muuttujien Xi jakaumat tunnetaan? Usein Xi :t ovat samalla tavalla jakautuneita. Seuraavassa lauseessa on momentit generoivien funktioiden tärkeä ominaisuus. Sitä ja momentit generoivan funktion yksikäsitteisyysominaisuutta sekä induktioperiaatetta käyttämällä voidaan selvittää riippumattomien satunnaismuuttujien summan jakauma. Lause 3.6.1. Riippumattomien satunnaismuuttujien X1 ja X2 summan Y = X1 + X2 momentit generoiva funktio on muuttujien X1 ja X2 momentit generoivien funktioiden tulo: MY (t) = MX1 (t)MX2 (t) Todistus Koska X1 ja X2 ovat riippumattomia, niin lauseen 3.4.2 mukaan riippumattomia ovat myös muuttujien X1 ja X2 funktiot etX1 ja etX2 , missä t ∈ R. Täten MY (t) = E(etY ) = E(et(X1 +X2 ) ) = E(etX1 etX2 ) Lause 3.5.3 = E(etX1 )E(etX2 ) = MX1 (t)MX2 (t) Esimerkki 3.6.1. Olkoot X ∼ Bin(n, p) ja Y ∼ Bin(m, p) riippumattomia. Tällöin MX+Y (t) = MX (t)MY (t) Lause 2.8.1 ⇒ Lause 2.8.1 = (pet + 1 − p)n (pet + 1 − p)m = (pet + 1 − p)n+m X + Y ∼ Bin(n + m, p) Todistetaan tärkeä tulos: Riippumattomien normaalijakautuneiden satunnaismuuttujien lineaarikombinaatio on normaalijakautunut. Lause 3.6.2. Jos X1 , X2 , . . . , Xn ovat riippumattomia normaalijakautuneita satunnaismuuttujia, Xi ∼ N(µi , σi2 ), niin Y = a1 X 1 + a2 X 2 + · · · + an X n ∼ N(µY , σy2 ) missä µY = a1 µ1 + a2 µ2 + · · · + an µn ja σY2 = a21 σ12 + a22 σ22 + · · · + a2n σn2 59 Todistus. Käytetään induktiota. Näytetään ensin väite oikeaksi kun n = 2. Lauseen 2.11.2 mukaan ai Xi ∼ N(ai µi , a2i σi2 ). Lausetta 3.6.1 ja 2.11.1 soveltamalla saadaan: MY (t) = Ma1 X1 (t)Ma2 X2 (t) 2 2 2 /2 = ea1 µ1 t+a1 σ1 t 2 2 2 /2 · ea2 µ2 t+a2 σ2 t 2 2 2 2 2 /2 = e(a1 µ1 +a2 µ2 )t+(a1 σ1 +a2 σ2 )t Osoitetaan sitten, että jos väite pätee kun n = k, niin se pätee myös kun n = k + 1. Koska muuttujat X1 , X2 , . . . , Xk+1 ovat riippumattomia, niin ilmeisesti y = a1 X1 +a2 X2 +· · ·+ak Xk ja Xk+1 ovat riippumattomia, ja oletusten mukaan normaalisti jakautuneita. Yllä todistetun nojalla summa 2 Y + ak+1 Xk+1 ∼ N(µY + ak+1 µk+1 , σY2 + a2k+1 σk+1 ) missä µY = a1 µ1 + · · · + ak µk ja σY2 = a21 σ12 + · · · + a2k σk2 . 3.7 Kovarianssi, korrelaatio ja summan varianssi Olkoot X ja Y kaksi saman kokeen satunnaismuuttujaa. Esimerkiksi kokeessa realisoituvan satunnaisvektorin kaksi komponenttia. Halutaan selvittää, onko muuttujien X ja Y välillä (tilastollista) riippuvuutta. Jos keskinäistä riippuvuutta löytyy, niin mikä on riippuvuuden laatu ja voimakkuus. Seuraavassa rajoitutaan lineaariseen riippuvuuteen. Merkitään µX = E(X) ja µY = E(Y ) Satunnaismuuttujien X ja Y lineaarisen riippuvuuden voimakkuuden ilmaisee tulon (X − µX )(Y − µY ) odotusarvo, joka on nimeltään Satunnaismuuttujien X ja Y kovarianssi (covariance) merk. Cov(X, Y ) = E((X − µX )(Y − µY )) = σXY Määritelmästä nähdään, että Cov(X, X) = Var(X). Kovarianssille pätee laskukaava: Lause 3.7.1. Cov(X, Y ) = E(XY ) − E(X)E(Y ) Todistus. Cov(X, Y ) = E((X − µX )(Y − µY )) = E(XY − XµY − µX Y + µX µY ) E:n lin. = E(XY ) − E(X)µY − µX E(Y ) + µX µY = E(XY ) − µX µY 60 Lause 3.7.2. Jos X ja Y ovat riippumattomia, niin Cov(X, Y ) = 0. Todistus. Cov(X, Y ) = E(XY ) − E(X)E(Y ) Lause 3.5.3 = E(X)E(Y ) − E(X)E(Y ) = 0 Valitettavasti lausetta ei voi yleisesti kääntää. Vaikka Cov(X, Y ) = 0, se ei takaa satunnaismuuttujien X ja Y riippumattomuutta. Luvulla Cov(X, Y ) voidaan ilmaista vain lineaarista riippuvuutta. Jos Cov(X, Y ) > 0, ovat poikkeamat (X − µX ) ja (Y − µY ) arvoltaan yleisesti ottaen saman suuntaisia eli X:n arvojen kasvaessa myös Y :n arvot keskimäärin kasvavat. Kokeen koetoistoissa mitattujen muuttujien X ja Y havaintoarvoparien (x, y) arvot keskittyvät siihen xy-tason osaan, jossa (X − µX )(Y − µY ) > 0. p Kovarianssin suuruus riippuu osittain X:n ja Y :n keskihajonnoista Var(X) = σX ja p Var(Y ) = σY minkä johdosta Cov(X, Y ) ei ole hyvä mitta lineaarisen riippuvuuden voimakkuudelle. Tähän tarkoitukseen paremmin sopivan mitan antaa keskihajonnaltaan = 1 ˆ = X/σX ja Yˆ = Y /σY kovarianssi, normitettujen muuttujien X Cov(X, Y ) X µ Y µ 1 X Y ˆ Yˆ ) = E Cov(X, − − = E((X − µX )(Y − µY )) = {z } | σX σX σY σY σX σY σX σY Cov(X,Y ) Tämä suure on Satunnaismuuttujien X ja Y välinen (lineaarinen) korrelaatio (correlation): Cov(X, Y ) merk. = ρXY Corr(X, Y ) = p Var(X)Var(Y ) Esimerkki 3.7.1. Esimerkin 3.2.1 satunnaisvektorin (X, Y ) tiheysfunktio on f (x, y) = 8xy, kun 0 < x < y < 1. Lasketaan komponenttien X ja Y kovarianssi ja korrelaatio. Esimerkissä 3.5.1 saatiin E(XY ) = 94 . Nyt Z 1 Z E(X) = y Z x8xy dxdy = 0 Z = 0 0 1 0 1 .y 8 0 .1 8 8 4 8 y dy = y5 = 3 15 15 0 61 3 ! 3 x y dy Z 1 y Z E(Y ) = .y 1 Z y8xy dxdy = 0 Z 0 0 1 = 4y 4 dy = 0 .1 4 0 5 y5 = ! 4x2 y 2 dy 0 4 12 = 5 15 joten Cov(X, Y ) = E(XY ) − E(X)E(Y ) = 8 12 4 4 − · = 9 15 15 225 Korrelaatiota varten lasketaan ensin 1 Var(X) = E(X ) − (E(X)) = − 3 2 Var(Y ) = E(Y ) − (E(Y )) = − 3 2 2 8 15 2 = 11 225 = 6 225 ja 2 2 12 15 2 jolloin Corr(X, Y ) = p Cov(X, Y ) Var(X)Var(Y ) =q 4 225 11 225 q = 0.492 6 225 Korrelaation ominaisuuksia 1) −1 ≤ Corr(X, Y ) ≤ 1 2) 3) Corr(X, Y = aX + b) = Corr(X, Y ) = ( 1 −1 ( 1, jos a > 0 −1, ⇒ jos a < 0 P (Y = aX + b) = 1, missä ( a>0 a<0 Mitä suurempi |Corr(X, Y )| on, sen voimakkaammasta lineaarisesta riippuvuudesta on kyse, eli sitä tiiviimmin muuttujaparin (X, Y ) arvot osuvat erään suoran ympärille. Korrelaation arvot Corr(X, Y ) = ±1 kuvaavat täydellistä lineaarista riippuvuutta. Jos Corr(X, Y ) = 0 voidaan vain päätellä, että muuttujien X ja Y välillä ei ole lineaarista riippuvuutta. Sen sijaan muun luonteista riippuvuutta voi olla. 62 Korrelaatiokertoimen arvosta voidaan tehdä esimerkiksi seuraavanlaisia sanallisia tulkintoja. Lineaarinen riippuvuus on • voimakas, jos | ρ |≥ 0.8 • huomattava, jos 0.6 ≤| ρ |< 0.8 • kohtalainen, jos 0.3 ≤| ρ |< 0.6 • merkityksetön, jos | ρ |< 0.3 Kun korrelaatiota käytetään empiirisellä aineistolla, on aina suotavaa ensin muodostaa pisteparvi eli sirontakuvio (scatter plot), jossa mitatut satunnaismuuttujien X ja Y havaintoarvoparit (xi , yi ), i = 1, . . . , n merkitään xy-koordinaatistoon. Sirontakuvio saattaa paljastaa mahdollisen epälineaarisen riippuvuuden. Korrelaatio on suhteellisen herkkä poikkeaville arvoille ja myös nämä paljastuvat sirontakuviosta. Alla on kuvattu joitakin sirontakuvioita ja korrelaatiokertoimia. Regressioanalyysissa (regression analysis) tutkitaan havaintoaineiston muuttujien lineaarisia riippuvuuksia. Tätä aihetta käsitellään jatkokurssilla Tilastomatematiikka. Lause 3.7.3. Satunnaismuuttujien X ja Y lineaarisen lausekkeen varianssille pätee Var(aX + bY ) = a2 Var(X) + b2 Var(Y ) + 2ab Cov(X, Y ) Erityisesti, jos X ja Y ovat riippumattomia, niin Cov(X, Y ) = 0 ja Var(aX + bY ) = a2 Var(X) + b2 Var(Y ) Todistus. Määritelmän mukaan Var(aX + bY ) = E((aX + bY − µaX+bY )2 ) 63 Odotusarvon lineaarisuusominaisuuden nojalla µaX+bY = aµX + bµY , joten Var(aX + bY ) = E((a(X − µX ) + b(Y − µY ))2 ) = E(a2 (X − µX )2 + b2 (Y − µY )2 + 2ab(X − µX )(Y − µY )) E:n lin. = a2 E((X − µX )2 ) + b2 E((Y − µY )2 ) + 2abE((X − µX )(Y − µY )) = a2 Var(X) + b2 Var(Y ) + 2ab Cov(X, Y ) Lause 3.7.3 yleistyy useamman kuin kahden satunnaismuuttujan lineaarisille lausekkeille. Jatkossa tarvitaan seuraavaa tulosta Lause 3.7.4. Jos satunnaismuuttujat X1 , X2 , . . . , Xn ovat riippumattomia, niin Var(a1 X1 + a2 X2 + · · · + an Xn ) = a21 Var(X1 ) + a22 Var(X2 ) + · · · + a2n Var(Xn ) 2 = 2 ja σY2 = 4 ja kovarianssi σXY = −2, Esimerkki 3.7.2. Jos X:n ja Y :n varianssit ovat σX on satunnaismuuttujan U = 3X − 4Y + 8 varianssi σU2 = Var(3X − 4Y + 8) Lause 2.6.4 = Var(3X − 4Y ) 2 = 32 σX + (−4)2 σY2 + 2 · 3 · (−4)σXY = 130 3.8 Otoskeskiarvon jakauma Tarkastellaan koetta, jossa realisoituu satunnaismuuttujalle X arvo. Suoritetaan tämän kokeen n-toistokoe. Olkoon Xi i:nnen koetoiston satunnaismuuttuja. Koetoistojen satunnaismuuttujien X1 , X2 , . . . , Xn sanotaan olevan n:n kappaleen otos satunnaismuuttujasta X. Otoksessa satunnaismuuttujat Xi ovat riippumattomia ja noudattavat samaa jakaumaa kuin X. Täten E(Xi ) = E(X) ja Var(Xi ) = Var(X). n-toistokokeessa otoksen X1 , X2 , . . . , Xn (satunnaisvektori) saamia arvoja x1 , x2 , . . . , xn kutsutaan myös otokseksi. 64 Otoksesta X1 , X2 , . . . , Xn riippuvia otossuureita (statistics) käytetään X:n jakauman tuntemattomien parametrien, kuten odotusarvon ja varianssin, arviointiin ja parametreihin kohdistuvien väitteiden testaamiseen. Tällöin on tunnettava otossuureiden jakaumat. Tärkeimmät otossuureet ovat n otoskeskiarvo (sample mean) : X= n 1X 1X Xi tai x = xi n i=1 n i=1 n otosvarianssi (sample variance) : n 1 X 1 X (Xi − X)2 tai s2 = (xi − x)2 S = n − 1 i=1 n − 1 i=1 2 otoshajonta (sample standard deviation) : S tai s, joka on otosvarianssin neliöjuuri Otossuureet ovat otosmuuttujien Xi satunnaisuuden takia n-toistokokeen satunnaismuuttujia. Entä miten otoskeskiarvo on jakautunut? Satunnaismuuttujien X1 , X2 , . . . , Xn lineaarisen lausekkeen odotusarvolle pätee (odotusarvon lineaarisuus, kpl 3.5) E(a1 X1 + a2 X2 + · · · + an Xn ) = a1 E(X1 ) + a2 E(X2 ) + · · · + an E(Xn ) ja jos satunnaismuuttujat Xi ovat riippumattomia, niin varianssille pätee (lause 3.7.4) Var(a1 X1 + a2 X2 + · · · + an Xn ) = a21 Var(X1 ) + a22 Var(X2 ) + · · · + a2n Var(Xn ) Erityisesti, jos X1 , X2 , . . . , Xn on otos satunnaismuuttujasta X, niin E(Xi ) = E(X) ja Var(Xi ) = Var(X). Näin otoskeskiarvon odotusarvolle ja varianssille saadaan seuraava tulos. Lause 3.8.1. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X. Tällöin X:n otoskeskiarvon X odotusarvo on yhtäsuuri kuin X:n odotusarvo, E(X) = E(X) = µ ja otoskeskiarvon varianssi on ainoastaan n:s osa X:n varianssista, Var(X) = Var(X) σ2 = n n Otossuureen sanotaan olevan harhaton estimaattori (unbiased estimator) tietylle parametrille, jos otossuureen odotusarvo on yhtäsuuri kuin tämä parametri. Otossuureen realisaatio antaa tälle parametrille harhattoman estimaatin (unbiased estimate). Lauseen 3.8.1 mukaan satunnaismuuttujan X otoskeskiarvo on harhaton estimaattori X:n odotusarvolle. 65 Vastaavasti voidaan osoittaa (kpl 3.10), että X:n otosvarianssi on X:n varianssin harhaton estimaattori eli E(S 2 ) = Var(X) = σ 2 . Jos X on normaalisti jakautunut, niin Lauseen 3.6.2 mukaan X:n otoskeskiarvo on myös normaalisti jakautunut, siis Lause 3.8.2. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin otoskeskiarvo σ2 X ∼ N µ, n Otoskeskiarvon keskihajontaa kutsutaan keskiarvon keskivirheeksi (the standard error of the mean). q σ D(X) = Var(X) = √ n Otoksesta arvioitu satunnaismuuttujan X odotusarvo on tapana antaa muodossa otoskeskiarvo ± keskiarvon keskivirhe. Luotettavampi tapa on muodostaa odotusarvolle luottamusväli, joka ennalta sovitulla todennäköisyydellä sisältää odotusarvon. Luottamusvälejä tarkastellaan jatkokurssilla Tilastomatematiikka. 3.9 Keskeinen raja-arvolause Keskeinen raja-arvolause (central limit theorem) antaa perustelut normaalijakauman laajalle käytölle. Lause ilmaisee, että riippumattomien satunnaismuuttujien summan jakauma yhteenlaskettavien lukumäärän kasvaessa lähestyy normaalijakaumaa. Merkille pantavaa on, että tämä lähestyminen normaalijakaumaksi tapahtuu olivatpa yhteenlaskettavien jakaumat (eräitä vaatimattomia rajoituksia lukuunottamatta) millaisia tahansa, diskreettejä tai jatkuvia. Seuraavassa annetaan keskeinen raja-arvolause sen yksinkertaisimmassa muodossa. Lause 3.9.1. Keskeinen raja-arvolause. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X, jonka odotusarvo on µ ja varianssi σ 2 . Tällöin, kun n → ∞, standardoidun otoskeskiarvon X − µX X −µ ∗ √ X = = σX σ/ n kertymäfunktio F (t) lähenee N(0, 1)-jakauman kertymäfunktiota Φ(z), ∗ F (t) = P (X ≤ t) → Φ(z), 66 kun n → ∞ Käytännön tehtävissä keskeistä raja-arvolausetta sovelletaan muodossa: ∗ Standardoitu otoskeskiarvo X on suurilla n:n arvoilla likimain standardoidusti normaalijakautunut. Tälle niin sanotulle normaaliapproksimaatiolle käytetään merkintää ∗ . X ∼ N(0, 1) Yleensä normaaliapproksimaatiolla saadaan hyviä arvioita, jos n ≥ 30, olipa X:n jakauma millainen tahansa. Jos X:n jakauman tiedetään olevan lähellä normaalijakaumaa, voidaan normaaliapproksimaatiota soveltaa jo arvoa n = 30 pienemmillä arvoilla. Jos X on normaalijakautunut, niin silloin otoskeskiarvo on lauseen 3.8.2 mukaan täsmälleen normaalijakautunut kaikilla n:n arvoilla, eikä approksimaatiota tarvita. Seuraus. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X, jonka odotusarvo on µ ja varianssi σ 2 . Tällöin σ2 . otoskeskiarvo X ∼ N µ, n ja summa . X1 + X2 + · · · + Xn ∼ N(nµ, nσ 2 ) Esimerkki 3.9.1. Hissin varoitustaulun mukaan se voi kuljettaa korkeintaan 25 henkilöä tai 2000 kg. Henkilöpaino (kg) on satunnaismuuttuja, jonka odotusarvoksi oletetaan µ = 74 ja varianssiksi σ 2 = 100. Halutaan tietää millä todennäköisyydellä satunnaisesti valitun 25 henkilön kokonaispaino ylittää 2000 kg. Jos X =’ 25 henkilön kokonaispaino’, niin . X ∼ N(25 · 74, 25 · 100) = N(1850, 2500) Täten 2000 − 1850 X − 1850 √ √ ≤ 2500 2500 P (X > 2000) = 1 − P (X ≤ 2000) = 1 − P 2000 − 1850 √ ≈1−Φ = 1 − Φ(3) = 0.0013 2500 67 Esimerkki 3.9.2. Olkoon satunnaismuuttujan X varianssi σ 2 = 25. Todennäköisyys sille, että n = 50 kappaleen otoksen otoskeskiarvo X poikkeaa X:n odotusarvosta µ vähemmän kuin 2, on P (|X − µ| < 2) = P (−2 < X − µ < 2) X −µ σX | {z } −2 < =P σX 2 < σX √ σ 25 1 σX = √ = √ = √ n 50 2 norm.appr.∼N(0,1) √ √ ≈ Φ(2 2) − Φ(−2 2) √ = 2Φ(2 2) − 1 ≈ 0.995 Binomijakauman normaaliapproksimaatio Olkoon X ∼ Bin(n, p), missä parametri p on tarkasteltavana olevan tapahtuman A todennäköisyys. Satunnaismuuttuja X voidaan esittää summana X = Y1 + Y2 + · · · + Yn , missä Yi :t ovat riippumattomia ja Yi saa arvon 1, jos i:nnessä kokeessa A realisoituu ja arvon 0, jos A ei realisoidu. Siten Y1 , Y2 , . . . , Yn on otos muuttujasta Y ∼ Bin(1, p). Lauseen 2.9.1 mukaan Y :n odotusarvo µ = p ja varianssi σ 2 = p(1 − p), joten Satunnaismuuttujaa X ∼ Bin(n, p) voidaan normaaliapproksimoida . X ∼ N(np, np(1 − p)) Huomatus 1. Jos p on lähellä arvoa 0 tai 1, niin normaaliapproksimaatio saattaa antaa huonoja arvioita binomijakauman todennäköisyyksille. Jos taas p on lähellä arvoa 0.5, niin normaaliapproksimaatiolla saadaan hyviä arvioita jo pienillä arvoilla n. Ohjeena voidaan sanoa, että mikäli np ≥ 5 ja n(1 − p) ≥ 5, niin normaaliapproksimaation arviot ovat käyttökelpoisia. 68 Kun diskreettiä binomijakaumaa approksimoidaan jatkuvalla normaalijakaumalla, saadaan tarkempia tuloksia, kun suoritetaan jatkuvuuskorjaus. Jatkuvuuskorjauksessa tapahtuman rajoiksi muutetaan se reaalilukuväli, jolla olevat luvut pyöristettäisiin diskreetin jakauman kokonaisluvuiksi. Seuraavassa taulukossa on esimerkkejä jatkuvuuskorjauksista. Tapahtuma, Jatkuvuuskorjattu, jakauma Bin(n, p) jakauma N(np, np(1 − p)) P (X ≤ 3) P (X ≤ 3.5) P (X < 3) = P (X ≤ 2) P (X ≤ 2.5) P (X ≥ 4) P (X ≥ 3.5) P (X > 4) = P (X ≥ 5) P (X ≥ 4.5) Esimerkki 3.9.3. Heitetään kolikkoa 900 kertaa. Kruunujen esiintymismäärä on satunnais. muuttuja X ∼ Bin(900, 0.5). Sen normaaliapproksimaatio on X ∼ N(450, 225). Todennäköisyys, että kruunujen lukumäärä on yli 495 = P (X > 495), on jatkuvuuskorjauksella korjattuna P (X > 495.5) = 1 − P (X ≤ 495.5) 495.5 − 450 √ ≈1−Φ 225 = 1 − Φ(3.03) = 0.0012 Huomatus 2. Keskeisellä raja-arvolauseella on edellä esitettyjä paljon yleisempi versio. Olkoot X1 , X2 , . . . päättymätön jono riippumattomia satunnaismuuttujia, joiden jakaumista tiedetään vain odotusarvot µ1 , µ2 , . . . ja varianssit σ12 , σ22 , . . . . Määritellään summat Yn = X1 + X2 + · · · + Xn (n = 1, 2, . . . ) Nyt E(Yn ) = µ1 + µ2 + · · · + µn = µYn Var(Yn ) = σ12 + σ22 + · · · + σn2 = σY2n Varsin yleisin oletuksin, kun n → ∞, standardoidun satunnaismuuttujan Yn∗ = (Yn −µYn )/σYn kertymäfunktio lähenee N(0, 1)-jakauman kertymäfunktiota. Suurilla n:n arvoilla voidaan teh. dä normaaliapproksimaatio Yn∗ ∼ N(0, 1). Tästä seuraa, että . Yn = X1 + X2 + · · · + Xn ∼ N(µYn , σY2n ) Tässä on teoreettinen selitys sille, että mittausvirheet jakautuvat likimain normaalisti; mittausvirhe on lukuisten pienten satunnaisvirheiden summa. 69 3.10 Tilastollinen testaaminen Otossuureiden avulla voidaan testata jakauman parametrejä koskevia väitteitä. Tilastollisessa testaamisessa muodostetaan testisuureen jakauma, kun oletetaan testattavan väitteen olevan tosi ja tutkitaan kuinka tavallinen/harvinainen otoksesta laskettu testisuureen arvo on tässä jakaumassa. Tilastollisessa testaamisessa on seuraavat vaiheet. 1. Asetetaan testattava väite nollahypoteesi H0 ja tälle vaihtoehtoinen hypoteesi H1 . Tilastollisen testaamisen periaate on, että nollahypoteesi on voimassa, kunnes löytyy vahva näyttö siitä, ettei se todennäköisesti olekaan totta. Nollahypoteesi on jakauman parametria koskeva yhtälö esim. H0 : µ = 10. Vaihtoehtoinen hypoteesi on se väite, johon päädytään, jos nollahypoteesi hylätään. Vaihtoehtoiset hypoteesit ovat epäyhtälöitä esim. H1 : µ 6= 10, H1 : µ > 10 tai H1 : µ < 10. Vastahypoteesi määrää, mihin suuntaan olevat tarpeeksi suuret poikkeamat aiheuttavat nollahypoteesin hylkäämisen. 2. Valitaan testisuure, jonka jakauma tunnetaan, kun nollahypoteesin oletetaan olevan tosi. 3. Valitaan testin merkitsevyystaso eli riskitaso α. Merkitsevyystaso on ehdollinen todennäköisyys, että nollahypoteesi hylätään, vaikka se onkin tosi. Tavallisesti käytetään merkitsevyystasoja α = 0.05, 0.01, 0.005 tai 0.001. 4. Määritetään testisuureen harvinaisten arvojen joukko, ns. kriittinen alue, jonka todennäköisyys on merkitsevyystason α suuruinen. Tilanteessa, jossa vaihtoehtoinen hypoteesi on kaksisuuntainen eli on esim. muotoa H1 : µ 6= 10, kriittinen alue koostuu kahdesta reaalilukuvälistä jakauman reunoilla, jolloin kumpikin väli on todennäköisyydeltään α/2. Tällöin testi on kaksisuuntainen testi (two-tailed test). Jos vaihtoehtoinen hypoteesi on esim. muotoa H1 : µ > 10, kriittinen alue on yksiosainen, tässä tapauksessa vain jakauman oikeassa reunassa oleva reaalilukuväli, jonka todennäköisyys on merkitsevyystason α suuruinen. Tällöin testi on yksisuuntainen testi (one-tailed test). 5. Lasketaan testisuureen arvo otoksessa. 6. Jos testisuureen arvo osuu kriittiselle alueelle, nollahypoteesi hylätään ja vaihtoehtoinen hypoteesi valitaan. Jos testisuureen arvo osuu testisuureen tavallisten arvojen joukkoon, nollahypoteesi jää voimaan. 70 Edellä esitetty kriittisen alueen määrääminen ja testaus voidaan tehdä jakaumataulukoiden avulla. Monet tilastolliset ohjelmistot laskevat suoraan testiin liittyvän merkitsevyystason, ns. p−arvon (p−value) . Tämä on pienin merkitsevyystaso, joka johtaa nollahypoteesin hylkäämiseen. Jos p−arvo on käytössä, kriittisen alueen määräämistä ei tarvita. Nollahypoteesi hylätään, jos p−arvo on pienempi kuin etukäteen valittu merkitsevyysraja 0.05, 0.01 tms. Ohjelmistojen p−arvoja tulkittaessa täytyy ottaa huomioon testin yksi- tai kaksisuuntaisuus. Esimerkki 3.10.1. Seudun vuotuisen sademäärän X (cm) keskiarvoksi 100 vuoden ajalta oli saatu 106.0 ja keskihajonnaksi 15.3. Lisäksi voitiin olettaa, että X ∼ N(106.0, 15.32 ). Viimeisen 5 vuoden sademäärän keskiarvoksi oli saatu 89.3. Millä todennäköisyydellä näin paljon lukua 106.0 pienempi keskiarvo olisi odotettavissa, mikäli 5 viimeisen vuoden havainnot tulkitaan olevan otos jakaumasta N(106.0, 15.32 )? Onko seudun sääolosuhteissa tapahtunut pysyvänluonteinen muutos? Tässä testattava väite on, että sääolosuhteissa ei ole tapahtunut muutosta. Asetetaan nollahypoteesiksi H0 : µ = 106, missä µ on viiden vuoden sademäärien keskiarvo. Kun mittaustulos on 89.3, on luontevaa testata sademäärän pienenemistä, jolloin vaihtoehtoinen hypoteesi on H1 : µ < 106. Valitaan merkitsevyystasoksi α = 0.01. Koska vuoden sademäärä X ∼ N(106, 15.32 ), niin viiden vuoden sademäärän otoskeskiarvo 15.32 X ∼ N 106, = N(106, 46.818) = N(106, 6.8422 ). 5 Otoskeskiarvoa voidaan käyttää testisuureena ja sen jakauma H0 :n ollessa tosi, on N(106, 6.8422 ). Kriittinen alue on jakauman N(106, 6.8422 ) vasemmassa reunassa oleva reaalilukuväli, jonka 71 todennäköisyys on 0.01. Lasketaan kriittisen alueen yläraja c, jolla P (X ≤ c) = 0.01 c − 106 P (X ≤ c) = 0.01 ⇔ P Z < = 0.01 6.842 c − 106 ⇔ Φ = Φ(−2.33) 6.842 ⇔ c = −2.33 · 6.842 + 106 = 91.5 Nyt kriittinen alue on väli [0, 91.5] ja otoksesta laskettu arvo 89.3 osuu tälle välille. Näin ollen nollahypoteesi hylätään ja sademäärä on siis todennäköisesti pienentynyt. Tässä tapauksessa voitaisiin laskea myös tarkka todennäköisyys 89.3 − 106 = Φ(−2.441) = 1 − Φ(2.441) = 1 − 0.9927 = 0.0073 P (X < 89.3) = P Z < 6.842 Tämä luku on testin p-arvo. Nollahypoteesi siis hylätään, jos p-arvo on pienempi kuin valittu merkitsevyystaso, esim. 0.01. Monet ohjelmistot antavat tilastollisten testien yhteydessä juuri p-arvon. 3.11 χ2 -jakauma ja otosvarianssi Määritellään ensin ns. χ2 -jakauma. Oletetaan, että Zi ∼ N(0, 1), i = 1, 2, . . . , n ovat riippumattomia. Näiden satunnaismuuttujien neliösumma W = n X Zi2 = Z12 + Z22 + · · · + Zn2 ∼ χ2 (n) i=1 noudattaa χ2 -jakaumaa vapausastein n (χ2 distribution with n degrees of freedom). χ2 (n)-jakautuneen satunnaismuuttujan tiheysfunktio on f (w) = 1 2n/2 Γ(n/2) missä Γ on Eulerin gammafunktio Γ(t) = wn/2−1 e−w/2 , R∞ 0 e−x xt−1 dx. 72 kun w ≥ 0 χ2 (3) χ2 (6) 0.2 0.1 0.1 0 3 6 9 12 3 6 9 12 Laskuja varten satunnaismuuttujan W ∼ χ2 (n) kertymäfunktion Fχ2 (n) (w) = P (W ≤ w) ja sen käänteisfunktion arvoja on taulukoitu (monisteen lopussa) eri vapausasteen arvoilla. Myös monissa ohjelmissa on valmiita funktioita arvojen laskemiseen. Esimerkki 3.11.1. Olkoon W ∼ χ2 (14). Määrätään arvot w1 ja w2 siten, että P (W ≤ w1 ) = 0.1 ja P (W ≥ w2 ) = 0.1: P (W ≤ w1 ) = 0.1 ⇒ w1 = 7.790 P (W ≥ w2 ) = 0.1 ⇔ P (W ≤ w2 ) = 0.9 ⇒ w2 = 21.064 Lause 3.11.1. Satunnaismuuttujan W ∼ χ2 (n) odotusarvo ja varianssi ovat E(W ) = n Var(W ) = 2n ja Todistus. Harjoitustehtävänä. Tutkitaan sitten otosvarianssia ja sen jakaumaa. Lause 3.11.2. Olkoon X1 , X2 , . . . , Xn otos satunnaismuuttujasta X. X:n otosvarianssi n 1 X S = (Xi − X)2 n − 1 i=1 2 on X:n varianssin σ 2 harhaton estimaattori, E(S 2 ) = Var(X) = σ 2 73 Todistus. n 2 E(S ) = E =E 1 X (Xi − X)2 n − 1 i=1 1 n−1 1 = E n−1 1 = n−1 n 2 1 X =E (Xi − µ) − (X − µ) n − 1 i=1 ! n X 2 2 (Xi − µ) − 2(Xi − µ)(X − µ) + (X − µ) i=1 n X n X 2 (Xi − µ) − 2(X − µ) i=1 n X 1 = E n−1 1 = E n−1 ! i=1 n X (Xi − µ) + i=1 n X ! ! (X − µ) 2 i=1 ! 2 2 (Xi − µ) − 2(X − µ)(nX − nµ) + n(X − µ) ! 2 2 (Xi − µ) − n(X − µ) i=1 n X 2 E (Xi − µ) 2 − nE (X − µ) ! i=1 n 1 X = Var(X ) −n Var(X) | {z i} | {z } n−1 i=1 = σ2 σ 2 /n 1 (nσ 2 − σ 2 ) = σ 2 n−1 Tässä lauseessa on syy siihen, miksi otosvarianssin määritelmässä on n − 1 eikä n. Otosvarianssin odotusarvo on siis sama kuin varianssi. Oletetaan jatkossa, että X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ). Otosvarianssin S 2 jakauman sijaan tutkitaan otossuureen n (n − 1)S 2 1 X = (Xi − X)2 σ2 σ 2 i=1 jakaumaa. Todetaan ensin tulos, jonka mukaan kahden χ2 − jakautuneen satunnaismuuttujan summa on myös χ2 −jakautunut. Lause 3.11.3. Jos satunnaismuuttujat W1 ja W2 ovat riippumattomia ja W1 = n X Zi2 2 ∼ χ (n) ja W2 = i=1 m X Ui2 ∼ χ2 (m) i=1 niin muuttujat Z1 , . . . , Zn , U1 , . . . , Um ovat riippumattomia ja siten W1 + W2 ∼ χ2 (n + m) 74 Todistus. Sivuutetaan. Lause 3.11.4. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin a) X ja S 2 ovat riippumattomia b) (n − 1)S 2 ∼ χ2 (n − 1) 2 σ Todistus. (i) Sivuutetaan (ii) Täsmällinen todistus sivuutetaan, mutta idea on seuraava. 2 2 n (n − 1)S 2 X Xi − µ X −µ √ − = σ2 σ σ/ n i=1 2 2 n X Xi − µ (n − 1)S 2 X −µ √ = + 2 σ σ σ/ n | {z } |i=1 {z } 2 ⇔ ∼χ (1) ∼χ2 (n) Tässä oikealla puolella on a):n nojalla kahden riippumattoman satunnaismuuttujan summa. Summa on χ2 (n)-jakautunut ja summan jälkimmäinen termi on χ2 (1)-jakautunut. Lauseen 3.10.3 perusteella kahden riippumattoman χ2 -jakautuneen muuttujan summa on χ2 -jakautunut satunnaismuuttuja, ja myös vapausasteet toteuttavat yhtälön. Täten on ilmeistä, että (n − 1)S 2 /σ 2 on χ2 -jakautunut ja sen vapausasteet ovat n − 1. Esimerkki 3.11.2. Oletetaan, että mittaustulos X on normaalijakaumasta X ∼ N(µ, σ 2 ). Aikaisempien tulosten perusteella varianssiksi on arvioitu σ 2 = 1100. Nyt halutaan tietää, onko varianssi pysynyt ennallaan ja suoritetaan 11 mittausta ja saadaan mittaustulokset 453, 460, 351, 421, 339, 439, 402, 422, 470, 310 ja 416. Nyt nollahypoteesi H0 : σ 2 = 1100. Tämän otoksen otoskeskiarvo x = 407.5 ja otosvarianssi s2 = 2761.1. Tämän perusteella näyttäisi siltä, että jos varianssi on muuttunut, se on kasvanut. Varianssin pieneneminen on tavallisesti parempaan suuntaan tapahtuva muutos, sillä tällöin mittausten vaihtelu pienenee. Siksi jos epäilynä on juuri varianssin suureneminen, valitaan vaihtoehtoinen hypoteesiksi H1 : σ 2 > 1100. Valitaan merkitsevyystasoksi α = 0.01. Tähän tilanteeseen sopiva testisuure ja sen jakauma on (n − 1)s2 ∼ χ2 (n − 1) = χ2 (10) σ2 75 Kriittinen alue on jakauman oikeassa reunassa. χ2 − taulukosta (n = 10) saadaan tulos P (W > 23.2) = 0.01, joten kriittinen alue on väli [23.2, ∞). Otoksesta laskettu otossuure saa arvon (n − 1)s2 10 · 2761.1 = 25.1 = 2 σ 1100 joka osuu kriittiselle alueelle. Nollahypoteesi hylätään ja päätös on, että todellinen varianssi on todennäköisesti suurempi kuin 1100. 3.12 t- ja F-jakaumat Määritellään aluksi ns. t-jakauma (Studentin t-jakauma). Olkoon Z ∼ N(0, 1) ja W ∼ χ2 (n) riippumattomia. Satunnaismuuttujan Z T =p W/n jakauma on t-jakauma vapausastein n (t-distribution with n degrees of freedom), merkitään T ∼ t(n). t-jakauman tiheysfunktio on −(n+1)/2 t2 1+ n R∞ missä Γ on Eulerin gammafunktio Γ(t) = 0 e−x xt−1 dx. 1 Γ((n + 1)/2) f (t) = √ nπ Γ(n/2) (−∞ < t < ∞) Satunnaismuuttujan T tiheysfunktio on yksihuippuinen ja symmetrinen arvon 0 suhteen. Se muistuttaa normaalijakaumaa N(0,1) ja voidaan osoittaa, että t-jakauma lähenee jakaumaa N(0, 1), kun n → ∞. Taulukoista monisteen lopussa tai valmisohjelmista löydät satunnaismuuttujan t ∼ t(n) kertymäfunktion FT (n) (t) = P (T ≤ t) ja sen käänteisfunktion arvoja. Taulukosta ei löydy negatiivisia t:n arvoja. Nämä voidaan selvittää symmetrian nojalla: Ft(n) (−t) = 1 − Ft(n) (t) Esimerkki 3.12.1. Olkoon T ∼ t(18). Määrätään arvot t1 ja t2 siten, että P (|T | ≤ t1 ) = 0.9 ja P (T ≤ t2 ) = 0.01: P (|T | ≤ t1 ) = 0.9 ⇔ P (T ≤ t1 ) = 0.95 P (T ≤ t2 ) = 0.01 ⇔ P (T ≤ −t2 ) = 0.99 76 ⇒ ⇒ t1 = 1.734 −t2 = 2.552 ⇒ t2 = −2.552 t−jakaumaa tarvitaan normaalijakautuneeksi oletetun satunnaismuuttujan odotusarvon estimoinnissa, kun varianssi on tuntematon, seuraavan lauseen mukaan. Lause 3.12.1. Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N(µ, σ 2 ), niin T = X −µ √ ∼ t(n − 1) S/ n Todistus. U X −µ (n − 1)S 2 √ ∼ N(0, 1) ja W = , missä U = Nyt T = p ∼ χ2 (n − 1) σ2 σ/ n W/(n − 1) Lause 3.10.4:n nojalla U ja W ovat riippumattomia. Esimerkki 3.12.2. Tehtaan ilmoituksen mukaan venttilivarren halkaisija noudattaa normaalijakaumaa ja on keskimäärin 8.040 mm. Varaosia valmistava yritys ottaa tuotantoerästään 40 kappaleen otoksen tutkiakseen, onko tuotantoerän laatu yhtä hyvä kuin alkuperäisillä. Otoskeskiarvoksi saatiin x =8.038 mm ja otoskeskihajonnaksi s = 0.006 mm. Nollahypoteesi on H0 : µ = 8.040. Koska halutaan selvittää, onko halkaisija muuttunut, valitaan vaihtoehtoinen hypoteesiksi H1 : µ 6= 8.040. Valitaan merkitsevyystasoksi 0.05. Varianssi on tuntematon, joten käytetään otossuuretta t= X −µ √ ∼ t(n − 1) = t(39) S/ n Kriittinen alue koostuu kahdesta osasta, koska vaihtoehtoinen hypoteesi on muotoa H1 : µ 6= 8.040. Taulukosta (n = 40 kohdalta) saadaan tulos P (t > 2.021) = 0.025, joten t-jakauman symmetrisyyden perusteella kriittinen alue on välit (−∞, −2.021] ja [2.021, ∞) Testisuureen arvoksi saadaan tässä otoksessa saadaan 8.038 − 8.040 √ t= = −2.108 0.006/ 40 joka osuu kriittiselle alueelle. Tässä tapauksessa nollahypoteesi hylätään ja venttiilivarren halkaisija on muuttunut. Jos merkitsevyystasoksi valittaisiin α = 0.01, kriittinen alue olisi välit (−∞, −2.704] ja [2.704, ∞). Tällöin testisuureen arvo −2.108 ei kuuluisi kriittiselle alueelle ja nollahypoteesi jäisikin voimaan. Kahden χ2 −jakautuneen satunnaismuuttujan osamäärän avulla saadaan uusi jakauma ns. F -jakauma, josta käytetään myös nimityksiä Fisherin jakauma ja Snedecorin jakauma. 77 Olkoot satunnaismuuttujat W1 ∼ χ2 (n1 ) ja W2 ∼ χ2 (n2 ) riippumattomia. Satunnaismuuttuja W1 /n1 F = W2 /n2 on F -jakautunut vapausastein n1 , n2 , (F -distributed with n1 , n2 degrees of freedom) merkitään F ∼ F (n1 , n2 ). F-jakautuneen satunnaismuuttujan tiheysfunktio on n1 − n1 +n 2 2 2 Γ n1 +n n1 n1 2 n1 −2 2 1+ x f (x) = x 2 , kun x > 0 n2 Γ n21 Γ( n22 ) n2 R∞ ja f (x) = 0, kun x ≤ 0. Γ on Eulerin gammafunktio Γ(t) = 0 e−x xt−1 dx. Taulukoista monisteen lopussa tai valmisohjelmista löydät muuttujan F ∼ F (n1 , n2 ) kertymäfunktion FF (n1 ,n2 ) (x) = P (F ≤ x) ja sen käänteisfunktion arvoja. Esimerkki 3.12.3. Olkoon F ∼ F (10, 15). Tutkitaan mitä on x, kun P (F ≤ x) = 0.95 ja P (F ≥ x) = 0.01: P (F ≤ x) = 0.95 ⇒ x = 2.54 P (F ≥ x) = 0.01 ⇔ P (F ≤ x) = 0.99 Koska F ∼ F (n1 , n2 ) ⇒ x = 3.80 1 ∼ F (n2 , n1 ) F ⇒ siitä seuraa P (F ≤ x) = α ⇔ P 1 1 ≥ F x =α ⇔ P 1 1 ≤ F x =1−α Tämän nojalla taulukoilla voit laskea myös x:n arvoja, jotka liittyvät todennäköisyyksiin P (F ≤ x) = 0.05, P (F ≤ x) = 0.025 ja P (F ≤ x) = 0.01 Esimerkki 3.12.4. Jos F ∼ F (4, 3), niin 1 1 ≤ = 0.99 P (F ≤ x) = 0.01 ⇔ P F x 1 F ∼F (3,4) ⇔ 1 taul. = 16.69 x ⇔ x = 0.06 F-jakaumaa käytetään normaalijakautuneiksi oletettujen satunnaismuuttujien varianssien yhtäsuuruuden testaamiseen seuraavan tuloksen perusteella. 78 Lause 3.12.2. Olkoon 2 X1 , X2 , . . . , XnX otos satunnaismuuttujasta X ∼ N(µX , σX ) ja Y1 , Y2 , . . . , YnY otos satunnaismuuttujasta Y ∼ N(µY , σY2 ) 2 ja olkoot otokset riippumattomia. Jos SX ja SY2 ovat X:n ja Y :n otosvarianssit, niin otossuure S 2 /σ 2 F = X2 X ∼ F (nX − 1, nY − 1) SY /σY2 2 Todistus. Koska otokset ovat riippumattomia, ovat SX ja SY2 riippumattomia. Lause 3.10.4:n 2 2 mukaan (nX − 1)SX /σX ∼ χ2 (nX − 1) ja (nY − 1)SY2 /σY2 ∼ χ2 (nY − 1), joten 2 /σ 2 (nX −1)SX X nX −1 2 (nY −1)SY2 /σY nY −1 = 2 2 SX /σX ∼ F (nX − 1, nY − 1) SY2 /σY2 Esimerkki 3.12.5. Kurssin A tenttiin osallistui 51 opiskelijaa ja tulosten varianssi s2A = 478 ja toiseen rinnakkaisen kurssin B tenttiin osallistui 26 opiskelijaa varianssin ollessa s2B = 372. Voidaanko näissä otosvariansseissa havaittu ero tulkita todisteeksi siitä, että pistemäärien varianssit näillä rinnakkaisilla kursseilla ovat erisuuret. Pistemäärien jakaumat oletetaan normaaleiksi. 6 σB2 . Valitaan Nollahypoteesi on H0 : σA2 = σB2 ja vaihtoehtoinen hypoteesi H1 : σA2 = merkitsevyystasoksi α = 0.05. Testisuureeksi valitaan F −testisuure, joka nollahypoteesin ollessa tosi, eli kun σA2 = σB2 sievenee muotoon SA2 /σA2 SA2 F = 2 2 = 2 ∼ F (50, 25) SB /σB SB Kriittinen alue koostuu kahdesta välistä, joiden kummankin todennäköisyys on 0.05/2 = 0.025. Taulukosta saadaan tulos P (F ≤ 2.08) = 0.975, joten P (F > 2.08) = 0.025. Kriittisen alueen toinen osa on väli [2.08, ∞). Toisen osan yläraja on luku c, jolle P (F ≤ c) = 0.025. Jos F ∼ F (50, 25), niin 1 ∼F (25,50) 1 taul. 1 1 P (F ≤ c) = 0.025 ⇔ P ≤ = 0.975 F ⇔ = 1.92 ⇔ F c c c = 0.52 Kriittinen alue on siis välit [0, 0, 52] ja [2.08, ∞). Testisuureen arvo on F = 478/372 = 1.28 ja arvo ei osu kriittiselle alueelle. Kurssien tulosten variansseja voidaan siis pitää yhtäsuurina. 79 Liite 1. Todennäköisyysjakaumia Kurssilla esillä olleita todennäköisyysjakaumia. Jakaumista esitellään perustietoina tiheysfunktio, odotusarvo ja varianssi, momentit generoiva funktio, esimerkkikuvaajia ja lisätietoja. Diskreettejä todennäköisyysjakaumia 1. 2. 3. 4. 5. 6. Diskreetti tasajakauma Bernoullijakauma Binomijakauma Geometrinen jakauma Poisson jakauma Hypergeometrinen jakauma Jatkuvia todennäköisyysjakaumia 7. Jatkuva tasajakauma 8. Eksponenttijakauma 9. Normaalijakauma 10. χ2 -jakauma 11. t-jakauma 12. F-jakauma Liite 2. Jakaumataulukoita Normaalijakauman N(0,1) kertymäfunktion arvoja taulukoituna χ2 -jakauman kriittisiä pisteitä t-jakauman kriittisiä pisteitä F-jakauman kriittisiä pisteitä 80 1. Diskreetti tasajakauma, Tasd(a,b) Tiheysfunktio f (x) = 1 , x = a, a + 1, a + 2, . . . , b b−a+1 Odotusarvo ja varianssi E(X) = a+b (b − a + 1)2 − 1 , Var(X) = 2 12 Lisätietoja · Englanniksi: Discrete uniform distribution, Unifd(a,b) · Klassisen todennäköisyyden peruslähtökohta: symmetristen alkeistapausten todennäköisyydet noudattavat diskreettiä tasajakaumaa. · Nopanheiton tulos, rahanheiton tulos. · Tasd(0,1)=Ber(0.5). Tiheysfunktion kuvaaja Tasd(2,7) 0.17 2 3 4 5 6 7 81 2. Bernoullijakauma, Ber(p) Tiheysfunktio f (x) = px (1 − p)1−x , x = 0, 1 Odotusarvo ja varianssi E(X) = p, Var(X) = p(1 − p) Momentit generoiva funktio M (t) = pet + 1 − p Lisätietoja · Englanniksi: Bernoulli distribution · Satunnaismuuttujalla vain kaksi mahdollisuutta (koodattu 0 ja 1). Tapauksen X = 1 todennäköisyys = p. Riippumatta satunnaismuuttujasta tapaus X = 1 on nimetty usein onnistumiseksi (success) ja tapaus X = 0 on epäonnistuminen (failure). Esim. syntyvän lapsen sukupuoli (0=tyttö, 1=poika), tentissä onnistuminen. · Bernoullikokeella tarkoitetaan juuri bernoullijakaumaa noudattavan satunnaismuuttujan koetta. Kokeiden tulosten oletetaan olevan riippumattomia. · Tasd(0,1) = Ber(0.5), Ber(p) = Bin(1,p). Tiheysfunktion kuvaaja Ber(0.3) 0.7 0.3 0 1 82 3. Binomijakauma, Bin(n,p) Tiheysfunktio n x f (x) = p (1 − p)n−x , x = 0, 1, 2, . . . , n x Odotusarvo ja varianssi E(X) = np, Var(X) = np(1 − p) Momentit generoiva funktio M (t) = (pet + 1 − p)n Lisätietoja · Englanniksi: Binomial distribution · Onnistumisten (todennäköisyys = p) lukumäärä n:ssä bernoullikokeessa esim. kuinka monta klaavaa 5:ssä rahanheitossa. · Jos X1 ∼ Bin(n, p) ja X2 ∼ Bin(m, p) ovat riippumattomia, niin X1 + X2 ∼ Bin(n + m, p). · Ber(p) = Bin(1, p). · Bin(n, p) ≈ Poi(np), kun n on suuri, p on pieni ja np << n . · Bin(n, p) ≈ N(np, np(1 − p)), kun np ≥ 5 ja n(1 − p) ≥ 5. Tiheysfunktion kuvaajia Bin(5,0.3) Bin(7,0.8) 0.3 0.2 0.1 0 0.3 0.2 0.1 0 1 2 3 4 5 83 1 2 3 4 5 6 7 4. Geometrinen jakauma, Geom(p) Tiheysfunktio f (x) = p(1 − p)x−1 , x = 1, 2, . . . Odotusarvo ja varianssi 1 1−p E(X) = , Var(X) = p p2 Momentit generoiva funktio M (t) = pet 1 − (1 − p)et Lisätietoja · Englanniksi: geometric distribution · f (x) on todennäköisyys, että ’onnistuminen’ toistetussa bernoullikokeessa tapahtuu x.:llä kerralla, esimerkiksi millä todennäköisyydellä rahanheitossa saadaan ensimmäinen klaava viidennellä heitolla. Parametri p on ’onnistumisen’ todennäköisyys yksittäisessä kokeessa, Tiheysfunktion kuvaaja Geom(0.4) 0.4 0.2 0 4 8 84 5. Poisson jakauma, Poi(λ) Tiheysfunktio λx −λ f (x) = e , x = 0, 1, 2, . . . x! Odotusarvo ja varianssi E(X) = λ, Var(X) = λ Momentit generoiva funktio t M (t) = e−λ eλe Lisätietoja · Englanniksi: Poisson distribution · Harvinaisten tapahtumien todennäköisyysjakauma. Jos suoritetaan suuri määrä (n) bernoullikokeita, joissa onnistumisen todennäköisyys (p) on pieni, onnistumisten määrä noudattaa likimain Poisson jakaumaa ja parametri λ ≈ np. Poissonin prosessin oletukset (luentomoniste kpl. 2.9) täyttävässä prosessissa onnistumisten lukumäärä noudattaa likimäärin Poissonin jakaumaa. · Jos X1 ∼ Poi(λ1 ) ja X2 ∼ Poi(λ2 ) ovat riippumattomia, niin X1 + X2 ∼ Poi(λ1 + λ2 ). · Bin(n, p) ≈ Poi(np), kun n on suuri, p on pieni ja np << n. Tiheysfunktion kuvaaja Poi(3) 0.2 0.1 0 4 8 85 6. Hypergeometrinen jakauma, Hyperg(N,m,n) Tiheysfunktio f (x) = m x N −m n−x N n , max{0, n − (N − m)} ≤ x ≤ min{n, m}, x ∈ Z Odotusarvo ja varianssi E(X) = nm nm(N − m)(N − n) , Var(X) = N N3 − N Lisätietoja · Englanniksi: Hypergeometric distribution · Joukossa on N alkiota, joista m:llä on ominaisuus A ja lopuilla ei ole. Poimitaan palauttamatta n alkion otos. Kun x=’niiden alkioiden lukumäärä otoksessa, joilla on ominaisuus A’, niin X ∼ Hyperg(N, m, n). · Kun otoskoko n on pieni verrattuna kaikkien alkioiden lukumäärään N, palauttamatta suoritettu otanta ≈ palauttaen suoritettu otanta. Siksi hypergeometrista jakaumaa voidaan approksimoida binomijakaumalla: · Hyperg(N, m, n) ≈ Bin(n, m/N ), kun n ≤ N/10. Tiheysfunktion kuvaajia Hyperg(10,4,4) Hyperg(12,9,6) 0.4 0.4 0.2 0.2 0 1 2 3 4 86 1 2 3 4 5 6 7. Jatkuva tasajakauma, Tas(a,b) Tiheysfunktio f (x) = 1 , a≤x≤b b−a Odotusarvo ja varianssi E(X) = a+b (b − a)2 , Var(X) = 2 12 Momentit generoiva funktio ( M (t) = ebt −eat t(b−a) 1 kun t 6= 0 kun t = 0 Lisätietoja · Englanniksi: (continuous) uniform distribution Unif(a,b) tai U(a,b) · Monissa tietokoneohjelmissa satunnaisluvun (random number) käsite on luku X ∼ Tas(0, 1). Muiden jatkuvien satunnaislukujen generoinnin perusta algoritmeissa. Tiheysfunktion kuvaaja Tas(2,7) 0.2 0 1 2 3 4 5 6 7 87 8.Eksponenttijakauma , Exp(λ) Tiheysfunktio f (x) = λe−λx , x ≥ 0, λ > 0 Odotusarvo ja varianssi E(X) = 1 1 , Var(X) = 2 λ λ Momentit generoiva funktio M (t) = λ , t<λ λ−t Lisätietoja · Englanniksi: Exponential distribution · Eksponenttijakaumaa noudattavalla satunnaismuuttujalla on ’unohtuvaisuusominaisuus’ P (X > x1 + x2 | X > x1 ) = P (X > x2 ) · Elektronisen komponentin ikä Tiheysfunktion kuvaajia Exp(0.5) Exp(1) 0.4 0.8 0.2 0.4 0 3 6 0 9 12 88 3 6 9 12 9. Normaalijakauma, N(µ, σ 2 ) Tiheysfunktio 1 x−µ 2 1 f (x) = √ e− 2 ( σ ) , x ∈ R, µ ∈ R, σ > 0 σ 2π Odotusarvo ja varianssi E(X) = µ, Var(X) = σ 2 Momentit generoiva funktio 2 σ 2 /2 M (t) = eµt+t Lisätietoja · Englanniksi: normal distribution, Gaussian distribution, Norm(µ, σ 2 ) · Jos X ∼ N (µ, σ 2 ), niin aX + b ∼ N (aµ + b, a2 σ 2 ), a, b ∈ R · Jos X1 ∼ N (µ1 , σ12 ) ja X2 ∼ N (µ2 , σ22 ), niin X1 + X2 ∼ N (µ1 + µ2 , σ12 + σ22 ). · Keskeisen raja-arvolauseen perusteella usean satunnaismuuttujan summa ja siis myös otoskeskiarvo on likimain normaalisti jakautunut riippumatta alkuperäisten satunnaismuuttujien jakaumista. · Bin(n, p) ≈ N(np, np(1 − p)), kun np ≥ 5 ja n(1 − p) ≥ 5. Tiheysfunktion kuvaajia Norm(0,1) Norm(2,9) 0.4 0.1 0.2 –3 –2 –1 –7 –4 –1 2 5 8 11 1 2 3 89 10. χ2 -jakauma, χ2 (n) Tiheysfunktio f (x) = 1 x(n/2)−1 e−x/2 , x > 0, n ∈ Z+ 2n/2 Γ(n/2) missä Γ on Eulerin gammafunktio Z Γ(t) = ∞ e−x xt−1 dx 0 Odotusarvo ja varianssi E(X) = n, Var(X) = 2n Lisätietoja · Englanniksi: chi-square distribution, χ2 (df ) · Nimitys: muuttuja on χ2 -jakautunut vapausastein n (degrees on freedom, df). Kirjain χ lausutaan ’khii’. · Jos X1 , X2 , . . . , Xn ovat riippumattomia ja Xi ∼ N (µ, σ 2 ), niin (n − 1)s2 ∼ χ2 (n − 1) 2 σ P · Jos Zi ∼ N (0, 1) ja ovat riippumattomia, niin ni=1 Zi2 ∼ χ2 (n) χ2(3) χ2(6) 0.2 0.1 0.1 0 3 6 9 12 3 90 6 9 12 11. (Studentin) t-jakauma, t(n) Tiheysfunktio 1 Γ((n + 1)/2) f (x) = √ nπ Γ(n/2) x2 1+ n −(n+1)/2 , x ∈ R, n ∈ Z+ missä Γ on Eulerin gammafunktio Z ∞ e−x xt−1 dx Γ(t) = 0 Odotusarvo ja varianssi E(X) = 0, n > 1, Var(X) = n , n>2 n−2 Lisätietoja · Englanniksi: (Student’s) t-distribution, t(df) · Nimitys: muuttuja on t-jakautunut vapausastein n (degrees on freedom, df). · t-jakauma lähestyy N(0,1)-jakaumaa, kun n → ∞ · Jos X1 , X2 , . . . , Xn on otos muuttujasta X ∼ N (µ, σ 2 ), niin X −µ √ ∼ t(n − 1) s/ n Tiheysfunktion kuvaajia t(2) t(30) 0.4 0.35 –6 –3 3 –6 6 91 –3 3 6 12. F-jakauma, F(n1 ,n2 ), Fisherin jakauma, Snedecorin jakauma Tiheysfunktio f (x) = n1 +n2 2 n1 n Γ( 22 ) 2 Γ( Γ( ) n21 n1 n2 ) x n1 −2 2 1+ n1 x n2 − n1 +n 2 2 kun x > 0 kun x ≤ 0 0 missä Γ on Eulerin gammafunktio Z Γ(t) = ∞ e−x xt−1 dx 0 Odotusarvo ja varianssi E(X) = n2 2n22 (n1 + n2 − 2) , n2 > 2, Var(X) = , n2 > 4 n2 − 2 n1 (n2 − 2)2 (n2 − 4) Lisätietoja · Englanniksi: F-distribution · Nimitys: muuttuja on F-jakautunut vapausastein n1 ja n2 (degrees on freedom, df). · Jos X1 ∼ χ2 (n1 ) ja X2 ∼ χ2 (n2 ), niin F = X1 /n1 ∼ F (n1 , n2 ) X2 /n2 Tällöin 1/F ∼ F (n2 , n1 ) Tiheysfunktion kuvaajia F(6,6) F(2,6) 0.6 0.6 0.3 0.3 3 6 3 9 92 6 9 Normaalijakauman N(0,1) kertymäfunktion arvoja Φ ( x ) = P(Z < x) x 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713 0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.5040 0.5438 0.5832 0.6217 0.6591 0.6950 0.7291 0.7611 0.7910 0.8186 0.8438 0.8665 0.8869 0.9049 0.9207 0.9345 0.9463 0.9564 0.9649 0.9719 0.9778 0.9826 0.9864 0.9896 0.9920 0.9940 0.9955 0.9966 0.9975 0.9982 0.9987 0.9991 0.9993 0.9995 0.5080 0.5478 0.5871 0.6255 0.6628 0.6985 0.7324 0.7642 0.7939 0.8212 0.8461 0.8686 0.8888 0.9066 0.9222 0.9357 0.9474 0.9573 0.9656 0.9726 0.9783 0.9830 0.9868 0.9898 0.9922 0.9941 0.9956 0.9967 0.9976 0.9982 0.9987 0.9991 0.9994 0.9995 0.5120 0.5517 0.5910 0.6293 0.6664 0.7019 0.7357 0.7673 0.7967 0.8238 0.8485 0.8708 0.8907 0.9082 0.9236 0.9370 0.9484 0.9582 0.9664 0.9732 0.9788 0.9834 0.9871 0.9901 0.9925 0.9943 0.9957 0.9968 0.9977 0.9983 0.9988 0.9991 0.9994 0.9996 0.5160 0.5557 0.5948 0.6331 0.6700 0.7054 0.7389 0.7704 0.7995 0.8264 0.8508 0.8729 0.8925 0.9099 0.9251 0.9382 0.9495 0.9591 0.9671 0.9738 0.9793 0.9838 0.9875 0.9904 0.9927 0.9945 0.9959 0.9969 0.9977 0.9984 0.9988 0.9992 0.9994 0.9996 0.5199 0.5596 0.5987 0.6368 0.6736 0.7088 0.7422 0.7734 0.8023 0.8289 0.8531 0.8749 0.8944 0.9115 0.9265 0.9394 0.9505 0.9599 0.9678 0.9744 0.9798 0.9842 0.9878 0.9906 0.9929 0.9946 0.9960 0.9970 0.9978 0.9984 0.9989 0.9992 0.9994 0.9996 0.5239 0.5636 0.6026 0.6406 0.6772 0.7123 0.7454 0.7764 0.8051 0.8315 0.8554 0.8770 0.8962 0.9131 0.9279 0.9406 0.9515 0.9608 0.9686 0.9750 0.9803 0.9846 0.9881 0.9909 0.9931 0.9948 0.9961 0.9971 0.9979 0.9985 0.9989 0.9992 0.9994 0.9996 0.5279 0.5675 0.6064 0.6443 0.6808 0.7157 0.7486 0.7794 0.8078 0.8340 0.8577 0.8790 0.8980 0.9147 0.9292 0.9418 0.9525 0.9616 0.9693 0.9756 0.9808 0.9850 0.9884 0.9911 0.9932 0.9949 0.9962 0.9972 0.9979 0.9985 0.9989 0.9992 0.9995 0.9996 0.5319 0.5714 0.6103 0.6480 0.6844 0.7190 0.7517 0.7823 0.8106 0.8365 0.8599 0.8810 0.8997 0.9162 0.9306 0.9429 0.9535 0.9625 0.9699 0.9761 0.9812 0.9854 0.9887 0.9913 0.9934 0.9951 0.9963 0.9973 0.9980 0.9986 0.9990 0.9993 0.9995 0.9996 0.5359 0.5753 0.6141 0.6517 0.6879 0.7224 0.7549 0.7852 0.8133 0.8389 0.8621 0.8830 0.9015 0.9177 0.9319 0.9441 0.9545 0.9633 0.9706 0.9767 0.9817 0.9857 0.9890 0.9916 0.9936 0.9952 0.9964 0.9974 0.9981 0.9986 0.9990 0.9993 0.9995 0.9997 93 χ2-jakauman χ2(n) kriittisiä pisteitä c: F(c) = P(w < c) = 1 - α α n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 0.995 0.99 0.975 0.95 0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886 10.520 11.160 11.808 12.461 13.121 13.787 20.707 27.991 35.534 43.275 51.172 59.196 0.000 0.020 0.115 0.297 0.554 0.872 1.239 1.646 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.879 13.565 14.256 14.953 22.164 29.707 37.485 45.442 53.540 61.754 0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 24.433 32.357 40.482 48.758 57.153 65.647 0.004 0.103 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 26.509 34.764 43.188 51.739 60.391 69.126 0.9 0.1 0.05 0.025 0.01 0.005 0.016 2.706 3.841 5.024 6.635 7.879 0.211 4.605 5.991 7.378 9.210 10.597 0.584 6.251 7.815 9.348 11.345 12.838 1.064 7.779 9.488 11.143 13.277 14.860 1.610 9.236 11.070 12.833 15.086 16.750 2.204 10.645 12.592 14.449 16.812 18.548 2.833 12.017 14.067 16.013 18.475 20.278 3.490 13.362 15.507 17.535 20.090 21.955 4.168 14.684 16.919 19.023 21.666 23.589 4.865 15.987 18.307 20.483 23.209 25.188 5.578 17.275 19.675 21.920 24.725 26.757 6.304 18.549 21.026 23.337 26.217 28.300 7.042 19.812 22.362 24.736 27.688 29.819 7.790 21.064 23.685 26.119 29.141 31.319 8.547 22.307 24.996 27.488 30.578 32.801 9.312 23.542 26.296 28.845 32.000 34.267 10.085 24.769 27.587 30.191 33.409 35.718 10.865 25.989 28.869 31.526 34.805 37.156 11.651 27.204 30.144 32.852 36.191 38.582 12.443 28.412 31.410 34.170 37.566 39.997 13.240 29.615 32.671 35.479 38.932 41.401 14.041 30.813 33.924 36.781 40.289 42.796 14.848 32.007 35.172 38.076 41.638 44.181 15.659 33.196 36.415 39.364 42.980 45.559 16.473 34.382 37.652 40.646 44.314 46.928 17.292 35.563 38.885 41.923 45.642 48.290 18.114 36.741 40.113 43.195 46.963 49.645 18.939 37.916 41.337 44.461 48.278 50.993 19.768 39.087 42.557 45.722 49.588 52.336 20.599 40.256 43.773 46.979 50.892 53.672 29.051 51.805 55.758 59.342 63.691 66.766 37.689 63.167 67.505 71.420 76.154 79.490 46.459 74.397 79.082 83.298 88.379 91.952 55.329 85.527 90.531 95.023 100.425 104.215 64.278 96.578 101.879 106.629 112.329 116.321 73.291 107.565 113.145 118.136 124.116 128.299 94 t - jakauman t(n) kriittisiä pisteitä c: F(c) = P(t < c) = 1 - α α n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 80 120 ∞ 0.40 0.325 0.289 0.277 0.271 0.267 0.265 0.263 0.262 0.261 0.260 0.260 0.259 0.259 0.258 0.258 0.258 0.257 0.257 0.257 0.257 0.257 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.256 0.255 0.254 0.254 0.253 0.25 1.000 0.816 0.765 0.741 0.727 0.718 0.711 0.706 0.703 0.700 0.697 0.695 0.694 0.692 0.691 0.690 0.689 0.688 0.688 0.687 0.686 0.686 0.685 0.685 0.684 0.684 0.684 0.683 0.683 0.683 0.681 0.678 0.677 0.674 0.10 3.078 1.886 1.638 1.533 1.476 1.440 1.415 1.397 1.383 1.372 1.363 1.356 1.350 1.345 1.341 1.337 1.333 1.330 1.328 1.325 1.323 1.321 1.319 1.318 1.316 1.315 1.314 1.313 1.311 1.310 1.303 1.292 1.289 1.282 0.05 6.314 2.920 2.353 2.132 2.015 1.943 1.895 1.860 1.833 1.812 1.796 1.782 1.771 1.761 1.753 1.746 1.740 1.734 1.729 1.725 1.721 1.717 1.714 1.711 1.708 1.706 1.703 1.701 1.699 1.697 1.684 1.664 1.658 1.645 95 0.025 12.706 4.303 3.182 2.776 2.571 2.447 2.365 2.306 2.262 2.228 2.201 2.179 2.160 2.145 2.131 2.120 2.110 2.101 2.093 2.086 2.080 2.074 2.069 2.064 2.060 2.056 2.052 2.048 2.045 2.042 2.021 1.990 1.980 1.960 0.01 31.821 6.965 4.541 3.747 3.365 3.143 2.998 2.896 2.821 2.764 2.718 2.681 2.650 2.624 2.602 2.583 2.567 2.552 2.539 2.528 2.518 2.508 2.500 2.492 2.485 2.479 2.473 2.467 2.462 2.457 2.423 2.374 2.358 2.326 0.005 0.0005 63.657 636.619 9.925 31.599 5.841 12.924 4.604 8.610 4.032 6.869 3.707 5.959 3.499 5.408 3.355 5.041 3.250 4.781 3.169 4.587 3.106 4.437 3.055 4.318 3.012 4.221 2.977 4.140 2.947 4.073 2.921 4.015 2.898 3.965 2.878 3.922 2.861 3.883 2.845 3.850 2.831 3.819 2.819 3.792 2.807 3.768 2.797 3.745 2.787 3.725 2.779 3.707 2.771 3.690 2.763 3.674 2.756 3.659 2.750 3.646 2.704 3.551 2.639 3.416 2.617 3.373 2.576 3.291 F-jakauman kriittisiä pisteitä c: P(F<c)=0.95, kun F~F(n1, n2) n1 1 2 3 4 5 6 7 8 9 10 12 15 20 25 50 100 n2 1 2 3 4 5 6 7 8 9 10 12 15 20 25 50 100 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 243,91 245,95 248,01 249,26 251,77 253,04 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,46 19,48 19,49 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,63 8,58 8,55 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,70 5,66 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,52 4,44 4,41 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,83 3,75 3,71 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,40 3,32 3,27 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,11 3,02 2,97 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,89 2,80 2,76 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,73 2,64 2,59 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,50 2,40 2,35 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,28 2,18 2,12 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,07 1,97 1,91 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,84 1,78 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,73 1,60 1,52 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,85 1,77 1,68 1,62 1,48 1,39 F-jakauman kriittisiä pisteitä c: P(F<c)=0.975, kun F~F(n1, n2) n1 1 2 3 4 5 6 7 8 9 10 12 15 20 647,8 38,51 17,44 12,22 10,01 8,81 8,07 7,57 7,21 6,94 6,55 6,20 5,87 5,69 5,34 5,18 799,5 39,00 16,04 10,65 8,43 7,26 6,54 6,06 5,71 5,46 5,10 4,77 4,46 4,29 3,97 3,83 864,2 39,17 15,44 9,98 7,76 6,60 5,89 5,42 5,08 4,83 4,47 4,15 3,86 3,69 3,39 3,25 899,6 39,25 15,10 9,60 7,39 6,23 5,52 5,05 4,72 4,47 4,12 3,80 3,51 3,35 3,05 2,92 921,8 39,30 14,88 9,36 7,15 5,99 5,29 4,82 4,48 4,24 3,89 3,58 3,29 3,13 2,83 2,70 937,1 39,33 14,73 9,20 6,98 5,82 5,12 4,65 4,32 4,07 3,73 3,41 3,13 2,97 2,67 2,54 948,2 39,36 14,62 9,07 6,85 5,70 4,99 4,53 4,20 3,95 3,61 3,29 3,01 2,85 2,55 2,42 956,7 39,37 14,54 8,98 6,76 5,60 4,90 4,43 4,10 3,85 3,51 3,20 2,91 2,75 2,46 2,32 963,3 39,39 14,47 8,90 6,68 5,52 4,82 4,36 4,03 3,78 3,44 3,12 2,84 2,68 2,38 2,24 968,6 39,40 14,42 8,84 6,62 5,46 4,76 4,30 3,96 3,72 3,37 3,06 2,77 2,61 2,32 2,18 976,7 39,41 14,34 8,75 6,52 5,37 4,67 4,20 3,87 3,62 3,28 2,96 2,68 2,51 2,22 2,08 984,9 39,43 14,25 8,66 6,43 5,27 4,57 4,10 3,77 3,52 3,18 2,86 2,57 2,41 2,11 1,97 993,1 39,45 14,17 8,56 6,33 5,17 4,47 4,00 3,67 3,42 3,07 2,76 2,46 2,30 1,99 1,85 12 15 20 25 50 100 n2 1 2 3 4 5 6 7 8 9 10 12 15 20 25 50 100 998,1 1008,1 1013,2 39,46 39,48 39,49 14,12 14,01 13,96 8,50 8,38 8,32 6,27 6,14 6,08 5,11 4,98 4,92 4,40 4,28 4,21 3,94 3,81 3,74 3,60 3,47 3,40 3,35 3,22 3,15 3,01 2,87 2,80 2,69 2,55 2,47 2,40 2,25 2,17 2,23 2,08 2,00 1,92 1,75 1,66 1,77 1,59 1,48 F-jakauman kriittisiä pisteitä c: P(F<c)=0.99, kun F~F(n1, n2) n1 1 2 3 4 5 6 7 8 9 10 25 50 100 n2 1 2 3 4 5 6 7 8 9 10 12 15 20 25 50 100 4052,2 4999,5 5403,4 5624,6 5763,6 5859,0 5928,4 5981,1 6022,5 6055,8 6106,3 6157,3 6208,7 6239,8 6302,5 6334,1 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,48 99,49 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,58 26,35 26,24 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,91 13,69 13,58 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,45 9,24 9,13 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,30 7,09 6,99 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,06 5,86 5,75 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,26 5,07 4,96 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,71 4,52 4,41 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,31 4,12 4,01 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,76 3,57 3,47 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,28 3,08 2,98 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,84 2,64 2,54 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,60 2,40 2,29 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,56 2,42 2,27 2,17 1,95 1,82 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50 2,37 2,22 2,07 1,97 1,74 1,60 96 Hakemisto χ2 -jakauma, 72, 90 χ2 -jakauma, taulukko, 94 kokonaistodennäköisyys, 13 Kolmogorovin aksiomat, 9 kombinaatio, 7 komplementtitapahtuma, 4, 10 korrelaatio, 61 kovarianssi, 60 kriittinen alue, 70 odotusarvo, satunnaismuuttujan funktio, 56 alkeistapaus, 3 Bayesin kaava, 13 Bernoullijakauma, 82 binomijakauma, 39, 42, 83 binomijakauman normaaliapproksimaatio, 68 leikkaus, 4 lineaarikombinaatio, 59 marginaalijakauma, 51 marginaalijakauman tiheysfunktio, 51 merkitsevyystaso, 70 momentit generoiva funktio, 37, 59 momentti, 37 deMorganin lait, 5 diskreetti satunnaismuuttuja, 20 diskreetti tasajakauma, 22, 81 ehdollinen todennäköisyys, 12 eksponenttijakauma, 28, 88 erilliset joukot, 4 erotus, joukkojen, 4 estimaatti, 65 estimaattori, 65 Eulerin gammafunktio, 72 nollahypoteesi, 70 normaalijakauma, 45, 59, 66, 89 normaalijakauma, taulukko, 93 odotusarvo, 29, 30 odotusarvo, satunnaismuuttujan funktio, 34 origomomentti, 37 otosavaruus, 3 otoshajonta, 65 otoskeskiarvo, 65 otossuure, 65 otosvarianssi, 65 otosvarianssi, testaus, 79 otosvarianssin jakauma, 73 F-jakauma, 77, 92 F-jakauma, taulukko, 96 Fisherin jakauma, 77, 92 geometrinen jakauma, 24, 84 hypergeometrinen jakauma, 23, 86 jatkuva satunnaismuuttuja, 25 jatkuva tasajakauma, 28, 87 jatkuvuuskorjaus, 69 p-arvo, 71 permutaatio, 7 pistetodennäköisyysfunktio, 21 Poisson jakauma, 42, 85 kaksisuuntainen testi, 70 kertolaskusääntö, 12 kertymäfunktio, 21, 26, 48, 50 keskeinen raja-arvolause, 66 keskiarvon keskivirhe, 66 keskihajonta, 29, 30 keskusmomentti, 37 klassinen todennäköisyys, 6 riippumattomuus, satunnaismuuttujien, 53 riippumattomuus, tapahtumien, 15 satunnaiskoe, 3 satunnaismuuttuja, 3 satunnaismuuttujan funktio, 31 97 satunnaismuuttujien summa, 59 satunnaisvektori, 48 satunnaisvektori, jatkuva, 49 satunnaisvektorin jakauma, 48 Snedecorin jakauma, 77, 92 Stirlingin kaava, 7 Studentin t-jakauma, 76, 91 suhteellinen frekvenssi, 5 t-jakauma, 76, 91 t-jakauma, taulukko, 95 tapahtuma, 3 tasajakauma, diskreetti, 22, 81 tasajakauma, jatkuva, 28, 87 tasajakauma, satunnaisvektori, 52 tiheysfunktio, diskreetti satunnaismuuttuja, 20 tiheysfunktio, jatkuva satunnaismuuttuja, 25 tiheysfunktio, satunnaisvektori, 49 tilastollinen testaaminen, 70 tilastollinen todennäköisyys, 5 todennäköisyysmitta, 5, 9 Tsebyshevin epäyhtälö, 36 tuloperiaate, 7 unioni, 4 vaihtoehtoinen hypoteesi, 70 variaatio, 7 varianssi, 29, 30, 35, 63 yhdiste, 4 yhteenlaskusääntö, 10 yhteisjakauma, 48 yksisuuntainen testi, 70 98
© Copyright 2024