KAPITEL 2 TESTS 2.1 Statistik kontra sandsynlighedsregning Inden for sandsynlighedsregning opstiller vi en model, som vi kan benytte til at beskrive de hcendelser, som vi forventer kan indtrceffe. Vi kan ikke vcere sikre pa, at hcendelserne indtrceffer, men vi kan scette tal pa vore forventninger i form af sandsynligheder. Et klassisk eksempel er kast med en m0nt. Nar m0nten er "cerlig", er sandsynligheden 50 % for at fa krone og 50 % for at fa plat. Det betyder ikke, at hvert andet m0ntkast skal give krone, sa det vil ikke komme bag pa os, hvis tre kast med m0nten giver os 3 gange krone, men hvis 10 kast med m0nten giver 10 gange krone, vil vi for alvor begynde at betvivle m0ntens cerlighed. Kaster vi m0nten et start antal gange, vil vi forvente, at ca. halvdelen af kastene giver krone. Ved 10 kast med m0nten er 7 gange krone ikke uscedvanligt, men ved 100 000 kast er 70 000 gange krone meget uscedvanligt. Ved brug af sandsynlighedsregning kan vi beregne sandsynligheden for de data, vi observerer ved udf0rte eksperimenter. Sandsynlighedsregning henregner vi til en matematisk disciplin. Inden for statistik er udgangspunktet i stedet observerede data, og statistik gar ud pa at gcette/ give bud pa en sandsynlighedsmodel, som kan forklare de observerede data. Som eksempel pa data kan vi se pa en liste med kr, kr, kr. Som statistikere kan vi opstille en hypotese om, at data stammer fra et simpelt fors0g, hvor vi kaster en m0nt tre gange, og hvor sandsynligheden for bade plat og krone er 50 % ved hvert kast. Har vii stedet et datascet, der indeholder 10 gange krone, vii vi tage den f0rste hypotese op til revision og erstatte den med en hypotese om, at m0nten har krone 43 pa begge sider, dvs. at sandsynligheden for at sla krone er 100 %, og sandsynligheden for plat er 0 %. Hvis datascettet skiftevis bestar af krone, plat, krone, plat, krone, plat kan vi fastholde vor f0rste hypotese. Men hvis datascettet skiftevis bestar af krone og plat svarende til i alt 25 par, vil vi cendre vor hypotese. Data svarer da nceppe til et kast med en m0nt, men er bedre beskrevet ved et eksperiment, hvor vi systematisk vender m0nten. Hvis resultatet af en udf0relse af fors0get er krone, vil den nceste udf0relse af fors0get resultere i plat med 1 00 % sandsynlighed. Forskellen mellem sandsynlighedsregning og statistik er illustreret i figur 2.1. Sandsynlighedsregning Statistik Figur 2.1 Ved en statistisk test fors0ger vi at bekrcefte eller afkrcefte formodninger, sammenhcenge eller egenskaber ud fra indsamlede data. Udgangspunktet er nogle observerede vcerdier, som vi har skaffet os ved en unders0gelse f.eks. et eksperiment, en stikpmve eller en systematiske indsamling af data. De observerede vcerdier sammenligner vi med forventede vrerdier, som vi beregner ud fra en hypotese, som vi opstiller. Safremt der er god overensstemmelse mellem observerede og forventede vcerdier, kan denne sammenligning, som vi altsa kalder en test, f0re til, at vi accepterer hypotesen. At vi accepterer hypotesen svarer ikke til, at vi har bevist, at hypotesen er sand, men kun til at de observerede data ikke er "ekstreme" under hypotesen. Hvis vi ved sammenligningen rna forkaste hypotesen, har vi ikke bevist, at hypotesen er forkert. Det betyder sa blot, at de observerede data er sa ekstreme, at vi har rigtig god grund til at mene, at vor hypotese formodentlig er forkert. De data, vi ser pa, er ofte indsamlet for at pavise en bestemt sammenhceng. Vi opstiller sa en hypotese om mangel pa netop denne sammenhceng. Den s0gte sammenhreng far vi sa pavist ved at forkaste hypotesen. 44 KAPITEL TESTS 2.2 Hypotesetest Ved en statistisk test sammenligner vi observerede data med forventede data ud fra en hypotese, som vi har opstillet. Den hypotese, vi tester, betegner vi med H0 og kalder den nulhypotesen. En test af hypotesen f0rer nu til, at vi en ten accepterer hypotesen eller forkaster hypotesen. Eftersom en hypotese enten er sand eller falsk, vii vi i testsituationen kunne bega to typer af fejl. Hvis vi forkaster en sand hypotese, begar vi en type-1 fejl. Hvis vi accepterer en falsk hypotese, begar vi en type-2 fejl. OK Figur 2.2 At acceptere en hypotese svarer som mevnt ikke til at have vist, at hypotesen er sand, kun at data ikke giver anledning til, at vi kan afvise den. Vi opnar saledes kun ny viden ved at forkaste en hypotese, og derfor vii vi ofte formulere nulhypoteser, som indeholder en pastand, der er den omvendte af det, vi gerne vii konkludere. Saiedes vii nulhypoteser ofte rumme pastande om "ingen sammenhceng" mellem st0rrelser eller 11 ingen virkning" af f.eks. en medicinsk behandling. Nar vi har opstillet en nulhypotese, skal vi desuden opstille en alternativ hypotese Ha, som svarer til, hvad der rna gcelde, hvis H0 ikke er opfyldt. Den simpleste alternative hypotese Ha svarer til negationen af H 0 , som sjceldent er scerlig informativ. Den alternative hypotese er imidlertid vigtig, da den influerer pa, hvornar vi accepterer nulhypotesen. Ved selve testen tager vi udgangspunkt i nulhypotesen og beregner nogle sandsynligheder ved hjcelp af en teststorrelse X. Disse sandsynligheder benytter vi sa til at afg0re, i hvor h0j grad data passer til nulhypotesen H 0 • 45 EksempellS Ved 10 kast med en mont viser mont en krone 8 gange og plat 2 gange. Pa denne baggrund kan vi fa mistanke om, at monten ikke er helt symmetrisk og opstiller derfor nulhypotesen H 0 : Sandsynligheden for at sla krone er 50 % og den alternative hypotese Ha: Sandsynligheden for at sla krone er storre end 50% Som teststorrelse vrelger vi den b(10, i)-fordelte stokastiske variabel X, der angiver antallet af krone ved de 10 kast. Stolpediagrammet med teststorrelsens fordeling er vist pa figur 2.3 0, 20 - - - - - - - - 0,15 --- 0,10 ---- --- - - - - - - - - - - ---------- - 0,05 r~0 2 4 6 8 10 12 k Figur 2.3 M0ntkast De 8 gange krone svarer til den observerede vrerdi P(X Xobs =8 og =Xobs) =P(X = 8) =0,04395 = 4,395% P(X;::: Xobs) = P(X;::: 8) = 0,05469 = 5,469% Der er altsa mere end 5 % sandsynlighed for at fa mindst 8 gange krone med en redig mont. Hvis vi pa forhand har vedtaget at forkaste nulhypotesen, hvis monten viser krone mindst 8 gange, vil sandsynligheden for, at vi begar en type-1 fejl, vrere storre end 5%. 46 KAPITEL TESTS Vi er naturligvis interesseret i at begrrense risikoen for at forkaste en sand hypotese, dvs. bega en type-1 fejl. Derfor knytter vi en testsandsynlighed, som vi omtaler som p-vcerdien, til testen. p-vrerdien er sandsynligheden for den observerede vrerdi Xobs eller noget, der er vrerre under nulhypotesen, dvs. noget, der er mere ekstremt i forhold til nulhypotesen. p-vrerdien viser os, hvor rimeligt deter at tro pa, at data er fremkommet ved tilfreldigheder, nar nulhypotesen er sand, og jo mindre p-vrerdien er, jo mere tyder det pa, at H 0 ikke er sand. Vi rna derfor acceptere en vis sandsynlighed for at bega en type-1 fejl, ogdenne sandsynlighed fastsretter vi selv uafhrengigt af data, og vi omtaler den som testens signifikansniveau a. Hvis p-vrerdien er mindre end signifikansniveauet, forkaster vi nulhypotesen, og vi siger, at resultatet er signifikant pa signifikansniveau a. Vi siger ogsa, at resultatet er signifikant pa signifikansniveau p, nar p ::5 a. De hyppigst anvendte signifikansniveauer er a = 5 %, a = 1 % og a = 0, 1 %, og hvis p-vrerdien er under signifikansniveauet, forkaster vi nulhypotesen. Et signifikansniveau fastlregger en kritisk mcengde K, som bestar af de ekstreme vrerdier af testst0rrelsen, inden for hvilken vi forkaster nulhypotesen, samt en acceptmcengde A, inden for hvilken vi accepterer nulhypotesen. De ekstreme vrerdier kalder vi ogsa de kritiske vrerdier, og hvis de kritiske vrerdier alle er sma, eller alle er store, kalder vi testen ensidet. Hvis de kritiske vrerdier af testst0rrelsen bade kan vrere sma eller store bestar den kritiske mrengde af to dele, og vi kalder testen tosidet. I dette tilfrelde deler vi signifikansniveauet lige pa de to dele. Tode!t kritisk mrengde Hojre kritisk mrengde Venstre kritisk mrengde Figur 2.4 Kun store kritiske Figur 2.5 v<Erdier vrerdier Kun sma kritiske Figur 2. 6 Bade store og sma kritiske v<Erdier 47 Eksempel16 Ved 15 kast med en mont viser monten krone 13 gange og plat 2 gange. Padenne baggrund kan vi fa mistanke om, at monten ikke er helt symmetrisk, dvs. at sandsynligheden p for at fa krone ikke er !· Vi opstiller derfor nulhypotesen H 0··p-1 - 2 og den alternative hypotese Som teststorrelse vrelger vi den b(15, !)-fordelte stokastiske variabel X, der angiver antallet af krone ved de 15 kast, og de mulige vrerdier for X er I0, 1, 2, ... , 14, 15}. Vi tester nu hypotesen med et signifikansniveau pa 5 %. De sma vrerdier vil ogsa vrere ekstreme under den alternative hypotese, sa vi udforer en ensidet test med en hojresidet kritisk mrengde. Ved brug af binomialfordelingen med n P(X ~ =15 og p = ! finder vi nu 10) = 0, 9408 = 94,08% P(X = 11) = 0,0417 = 4,17% P(X:?: 12) = 0,0176 = 1,76% sa acceptmrengden A og den kritiske mrengde K bliver A= (0, 1,2, ... , 11} K = 112,13, 14, 15} Idet Xobs = 13 ligger i den kritiske mrengde, forkaster vi H0 , og resultatet er sig- nifikant pa 5 %-niveau. p-vrerdien finder vi til P(X:?: 13) = 0,0037 = 0,37% Resultatet er dermed endda signifikant pa 0,37% niveau. Eksempel17 I 1990'erne regnede man med, at forekomsten af born med autistiske tegn var 7 %, men man formoder nu, at denne andel har rendret sig igennem de senere ar. Ved en ny undersogelse af 384 born udviser 46 born tegn pa autisme. Pa baggrund heraf opstiller vi nu nulhypotesen H 0 : Forekomst af autistiske tegn blandt born er 7% og den alternative hypotese 48 Ha: Forekomst af autistiske tegn blandt b0rn er ikke 7% Vi udf0rer en test pa 5 %-niveau, og som testst0rrelse anvender vi den b(384, 0, 07)fordelte stokastiske varia bel X, der an giver antallet af b0rn med tegn pa autisme. Da bade et meget lille og et meget stort antal bmn med tegn pa autisme underst0tter den alternative hypotese, benytter vi en tosidet test med tilh0rende todelt kritisk ma:ngde. De to dele af den kritiske ma:ngde fastla:gger vi ved at kra:ve, at sandsynligheden for hver af delene ikke rna overstige 2,5 %. Idet =0,0247 =2,47% P(18::::; X::::; 37) = 0, 9546 =95,46% P(X ::::: 38) = 0, 0207 = 2, 07% P(X::::; 17) bliver den kritiske ma:ngde K og acceptma:ngden A K = {0, 1,2, ... , 17} U {38, 39, ... , 384} A= {18,19, ... ,36,37} Da Xobs =46 tilh0rer den kritiske ma:ngde, forkaster vi nulhypotesen, og resulta- tet er signifikant pa 5 % niveau. p-va:rdien finder vi i dette tosidede tilfa:lde som 2 gange den mindste af sandsynlighederne P(X ::::; Xobs) og P(X ::?: X0 b 5 ). Nuer P(X::::; 46) = 0, 9998 P(X ::::: 46) =0, 000293 sa p-va:rdien er 0,059 %. x2 -test for Goodness of Fit ( GOF) 2.3 Indtil videre har vi kun set pa teststorrelser, hvis fordelinger er binomialfordelinger. Vi vii nu se pa nogle tests, som vi kalder fordelinger er de kontinuerte 2.3.1 Ved x2 -tests, hvor teststorrelsernes x 2 -fordelinger. x2 -testst0rrelsen ogden kritiske vcerdi x 2 -testen er nulhypotesen H 0 , at de observerede data svarer til en kendt for- deling. Ved hjrelp af nulhypotesen kan vi sa beregne de tilsvarende forventede vrerdier, som vi sammenligner med data. Aile de forventede vrerdier skal vrere storre end 5. I forbindelse med x2 -test omtaler vi data som de observerede vcerdier. For at afgore om der er god eller darlig overensstemmelse mellem observerede og forventede vrerdier, udregner vi teststorrelsen x~eregn x2beregn-- \ L aile V!Erdier (observeret vrerdi- forventet vrerdi) 2 forventet vrerdi (2.1) Forme! (2.1) skriver vi med symboler 2 Xberegn = \ L aile i hvor o; (o;-J;)2 Ji1 (2.2) er en observeret vrerdi og fi er den tilsvarende forventede vrerdi. Hvis teststorrelsen X~eregn er lille, er der god overensstemmelse mellem de forventede og de observerede vrerdier, og vi vii acceptere nulhypotesen. Hvis teststorrelsen er star, vii vi i stedet forkaste nulhypotesen og acceptere den alternative hypotese Ha- x2 -fordelte. Det betyder, at vi vii vurdere X~eregn ved brug af sandsynligheder bestemt ved x2 -fordelinger. Disse forTeststorrelserne X~eregn er tilnrermelsesvis delinger er givet ved antallet af frihedsgrader r, som svarer til det antal vrerdier, vi kan nojes med at kende, for vi kender aile vrerdierne. Dette antal beskriver vi ogsa som antallet af frie valg. Til testens signifikansniveau svarer en kritisk vcerdi og en kritisk mrengde, som er fastlagt ved, at halesandsynligheden regnet fra den kritiske vrerdi skal vrere lig med signifikansniveauet. 50 Nar vi f.eks. s~tter signifikansniveauet til 5 %, er den kritiske v~rdi k5 % fastlagt ved, at 0,15 0,10 0,05 Figur 2.7 ogden kritiske m~ngde er intervallet [ k 5 %; oo[. Hvis teststorrelsen X~eregn ligger i den kritiske m~ngde, forkaster vi nulhypotesen. Eksempel18 Resultatet af 60 kast med en almindelig terning er vist i tabel 2.1 v~rdi 1 2 3 4 5 6 Hyppighed 15 8 7 5 7 18 Tabel 2.1 Observerede vrerdier Pa baggrund af tabellens tal kan vi fa en mistanke om, at terningen ikke er ~rlig, men hvor us~dvanlige de observerede v~rdier egentlig er, er ikke umiddelbart til at afgore. Vi starter med at opstille nulhypotesen H0 : Terningen er ~rlig Den alternative hypotese Ha er Ha : Terningen er u~rlig Vi g!1r ud fra, at nulhypotesen er sand. 51 Nar terningen er rerlig, vil vi forvente, at hvert ojental forekommer fs af gangene, som giver os tabel 2.2 med de forventede vrerdier. Vrerdi 1 2 3 4 5 6 Hyppighed 10 10 10 10 10 10 Tabel 2.2 Forventede vrerdier Den tilhorende teststorrelse X~eregn er X2 _ beregn - (15-10j2 (8-10j2 (7-10) 2 (5-10) 2 (7-10) 2 (18-10) 2 10 + 10 + 10 + 10 + 10 + 10 dvs. x~eregn = 13,6. Denne teststorrelse virker forholdsvis stor, hvilket vi ogsa forventer pa baggrund af forskellen mellem de observerede vrerdier og de forventede vrerdier, og vi vii nu udfore en x2 -test pa signifikansniveau 5 %. Ved de 60 kast med terningen er det nok at vide, hvor mange gange terningen har vist fra f.eks. 1 til 5, for sa rna terningen have vist 6 ide resterende kast. Altsa er antallet af frihedsgrader 5, og vi skal benytte ved x 2 -fordelingen med 5 frihedsgrader x2 -tests. Ved brug af CAS finder vi (se ogsa tabel 2.15 side 67), at P(x 2 ;::: 11,07) =o,o5 sa k 5 % = 11,07 med tilhorende kritisk mrengde [11, 07; oo[. Da teststorrelsen X~eregn = 13,6 tilhorer dette interval, forkaster vi nulhypotesen. Tester vi i stedet pa signifikansniveau 1 % giver CAS os (se ogsa tabel 2.15 side 67) P(x 2 ;::: 15,09) = o,o1 sa k 1 % = 15,09 med tilhorende kritisk mrengde [15,09; oo[. Da teststorrelsen X~eregn nulhypotesen. 52 = 13,6 ikke tilhorer dette interval, kan vi ikke forkaste I statistiske termer formulerer vi dette som "Data understotter, at terningen er r:erlig pa 1 % niveau." "Data viser, at terningen er signifikant ur:erlig pa 5 % niveau." Eksempel19 Vi kaster en almindelig m0nt 100 gange og Hir resultatet i tabel 2.3 Udfald plat krone Hyppighed 40 60 Tabel 2.3 Observerede vrerdier Vi antager, at m0nten er symmetrisk, dvs. vi opstiller hypotesen H0 : M0nten er symmetrisk Nar monten er symmetrisk, forventer vi at fa plat halvdelen af gangene, sa de forventede vrerdier af plat og krone er begge 50. Teststorrelsen bliver dermed x2 beregn 2 = (40-5of + (60-50) = 50 50 4 Her er teststorrelsen betydeligt mindre end i Eksempel 18. Nar vi ved, hvor mange gange vi har faet plat ved de 100 kast, ved vi ogsa, hvor mange gange vi har faet krone. Antallet af frihedsgrader er dermed 1, og vi skal bruge en x2 -fordeling med 1 frihedsgrad. Med CAS finder vi (se ogsa tabel 2.15 side 67) P(x 2 ~ 3,84) = 5% P(x 2 ~ 6,63) = 1% P(x 2 ~ 1 o, 83) = o, 1% sa de kritiske vrerdier er ks"lo = 3, 84 kl%:::: 6,63 ko,I%=10,83 Vi rna derfor forkaste hypotesen om, at monten er symmetrisk med et signifikansniveau pa 5 %. Pa signifikansniveau 1 % og 0, 1 % accepterer vi i stedet hypotesen om symmetri. 2.3.2 p-vcerdi Til en beregnet teststorrelse X~eregn svarer som nrevnt pa side 47 en testsandsynlighed, som vi kalder p-vrerdien. Sandsynligheden for at observere teststorrelser, der er mindst lige sa ekstreme, som den vi har faet, er givet ved og dermed er p-vrerdien halesandsynligheden bestemt ved x~eregn· Nar denne halesandsynlighed er mindre end signifikansniveauet, forkaster vi nulhypotesen. )o Figur 2.8 Nulhypotesen accepteres )o Figur 2.9 Nulhypotesen forkastes Eksempel20 I Eksempel18 beregnede vi x~eregn = 13, 6 ved at benytte en x2 -fordeling med 5 frihedsgrader. Hertil svarer p-vrerdien p = P(x 2 :::: 13,6) Da 1 % ~ 1, 84 % ~ = o,0184 = 1,84% 5 % forkaster vi hypotesen pa 5 %-niveau, men accepterer den pa 1 %-niveau. Eksempel21 Testsandsynligheden svarende til teststorrelsen x~eregn =4 i Eksempel 19 finder vi tilsvarende ved at benytte en grad til p = P(x 2 :::: 4) 54 = o,0455 = 4,55% KAPITEL 2. TESTS x2 -fordeling med 1 friheds- Eksempel22 Tabellen nedenfor viser fordelingen af unge ud fra deres foretrukne drik. Drik Kaffe Te Sodavand Mrelk Vand Juice Saft Frekvens 14% 12% 40% 6% 16% 8% 4% Tabel 2.4 En stikpnwe blandt 250 gymnasieelever gav folgende fordeling Drik Kaffe Te Sodavand Mrelk Vand Juice Saft Hyppighed 28 33 112 6 49 14 8 Tabel 2.5 Vi vil undersoge, om stikproveresultatet stemmer overens med fordelingen i tabel 2.4 pa signifikansniveau 1 %, sa nulhypotesen er H0 : Gymnasieeleverne foretrrekker drikke som i tabel 2.4 De forventede vrerdier udregner vi med procenterne i tabel 2.4. Drik Kaffe Te Sodavand Mrelk Vand Juice Saft Forvent. hyp. 35 30 100 15 40 20 10 Tabel 2.6 som giver teststorrelsen 2 X beregn = (28-35) 2 (33-30) 2 (112-100) 2 (6-15) 2 (49-40) 2 (14-20) 2 (8-10) 2 35 + 30 + 100 + _1_5_ + 40 + 20 + _1_0_ =12,765 Antallet af frihedsgrader er 6, og dermed finder vi p-vrerdien ved brug af x2 -fordelingen med 6 frihedsgrader. p = P(x 2 2:: 12, 765) =o,0469 = 4,69% Da p-vrerdien er storre end 1 %, accepterer vi vor hypotese. for of Fit 55 Eksempel23 Et firma lover, at dets olieboreteknologi, hvor man udforer fire samtidige boringer, vil sikre, at 60 % af de udforte boringer giver aktive oliekilder. Teknologien er blevet afprovet ved at udfore fire boringer og herefter optrelle antallet af aktive kilder. Dette blev gentaget 500 gange. Resultatet fremgar af tabel 2.7. Antal aktive kilder 0 1 2 3 4 Observeret hyppighed 21 72 152 197 58 Tabel 2.7 Vi opstiller nu hypotesen H0 : Antallet af aktive boringer er binomialfordelt med p = 0, 6 ved brug af den nye teknologi Vi vil teste denne hypotese pa signifikansniveau 1 %. De tilhorende binomialfordelingssandsynligheder er P(X = 0) = b(4, 0, 6, 0) = 0, 0256 P(X=1)=b(4, 0,6, 1)=0,1536 P(X=2)=b(4, 0,6, 2)=0,3456 P(X = 3) = b(4, 0,6, 3) = 0,3456 P(X = 4) = b(4, 0,6, 4) = 0,1296 Vi benytter sandsynlighederne som frekvenser, sa de forventede vrerdier er Antal aktive kilder Forventet hyppighed 0 1 2 3 4 12,8 76,8 172,8 172,8 64,8 Tabel 2.8 Teststorrelsen er xz - beregn - (21-12,8) 2 (72-76,8) 2 (152-172,8) 2 (197-172,8) 2 (58-64,8) 2 12,8 + 7 6,8 + 172,8 + 172,8 + 64,8 = 12,16 56 Vi skal benytte en 67) x2 -fordeling med 4 frihedsgrader. I denne er (se tabel 2.15 side ks% = 9,488, k1 % = 13,277 og k0, 1 % = 18,467 Dermed rna vi forkaste nulhypotesen pa 5 %-niveau og acceptere den pa 1 %niveau og 0, 1 %-niveau. 2.3 -test for Goodness of Fit 57 2.3.3 Oversigt til x2 -test Goodness of Fit ( GOF) Udgangspunkt er et datasret af kendt storrelse med data inddelt i kategorier Kategori 1 Kategori 2 obso vrerdi obso vrerdi 000 00 0 TriniGOF Trin 1 Formuler nulhypotesenH0 o Nulhypotesen in.deholderden fordeling, som forventeligt beskriver det observerede datamaterialeo Forn"luler e\rt:.·denalterJ1ative.hypbt~se Hao Trin 2 Udregn de. fot:~~tecle.ya;!rcli~J;vedJmlg .a£ forcielingeni.Eoo Aile deJorveiJ,t~dt7,V~J:di~r s:I<al vrere ~terre end 5: Trin 3 Udregn teststorrelsen Trin 4 Udregn antallet affrjhedsgra~er r =ariti:t.l kategorier ·:. .: 1 og beste:i:n tel)tSa11dSYJ:llig1tecie11 p ved brug af ;r 2 -fordelingen med ·r frihedsgrader Trin 5 Sammenlign.p-vrerdien;n1~d signifikansn~veauet. Hvis, p• er storre ¢nd signifikCl!lsniVeauet1 accepterer vi hulhypotesen og skriver f.eks. "[)afa understat.ter}I0 pd ... %-niveau." Hvis p er mindre ~nd signifikansniveauet,forkaster vi nulhypotesen og skriver f.eks. "Data forkaster H0 pa ... %-rtiveau." og/eller 1 58 ,Data understi!Jtter Ha signifikant pd ... %-niveau." KAPITEL 2. TESTS Hvis vi arbejder med kritiske vrerdier, skal vi erstatte trin 4 og trin 5 med trin 4* og trin 5* nedenfor Trin 4* Bestem antallet affrihedsgrader r og find den kritiske vrerdi he~ r.ende til signifikansl1iveauet ved btug elf x2 -fordelingen med r frihedsgrader. Trin ·5* San£:rienltgrrfestst'E'rrelsen'X~eregri 1lled deh kritiske vrerdi. Hvis X~eregn ermil1dreend denkritiske vrerdi, accepterer vi nulhrnoteseJJ.>Og skriv.e!. f.eks. "Data tmderstetter Hop~ ;.. %-'niveau." Hvis X~ereg~ erste~rre end den kritiskevrerdi, forkaster vi nulhy. potesen oiskriver f.eks. nDataforkastir Ho pa :.. %-niveau. II og/eller "Data understetter Ha signifjkant pd ... %-niveau." 2.3 for Goodness of Fit (GOF) 59 x2 -test for uafhcengighed 2.4 2.4.1 Test i 2 x 2-tabeller Af tabel 2. 9 fremg;h resultatet af en stikpmveundersogelse af 500 tilfreldigt udvalgte voksne, klassificeret efter kon og motionsvaner. Tabellen kalder vi en 2 x 2- krydstabel eller en kontingenstabel. Regelmressig motion Ikke regelmressig motion Sum Mrend 130 135 265 Kvinder 127 108 235 Sum 257 243 500 Tabel 2. 9 Observerede hyppigheder Vi vii undersoge, om vi ud fra tabellens data kan slutte en sammenhreng mellem de to variable: ,kon" og ,regelmressig motion". Det kunne der umiddelbart godt se ud til at vrere, da n~ = 54 % af kvinderne dyrker regelmressig motion, mens kun ~~~ = 49% af mrendene dyrker regelmressig motion. Nu stammer tabellens data imidlertid fra en stikprove, sa vi kan have vreret ,uheldige" og rent tilfreldigt have faet en svag overvregt af motionerende kvinder. De to variable kan derfor sagtens vrere uafhcengige, og det tester vi ved brug af en x2 -test med signifikansniveau 5 %. Uafhrengigheden formulerer vi som nulhypotesen H 0 : Andelen af mrend og kvinder, der dyrker regelmressig motion, er den samme og sretter vi PK = andelen blandt kvinder, der dyrker regelmressig motion PM= andelen blandt mrend, der dyrker regelmressig motion kan vi skrive nulhypotesen Ho: PK =PM 60 KAPITEL 2. TESTS Teststorrelsen X~eregn skal vi igen udregne som en sum xz = \ hj)2 (oij- (2.3) h. L beregn 1 aile celler 1 hvor oi er en observeret vcerdi, og .fi er den tilsvarende forventede vcerdi. For at beregne de forventede vcerdier, tager vi udgangspunkt i tabel 2.9, hvor vi overforer felterne med summer. Regelm<essig motion Ikke regelm..-essig motion Sum M..-end 265 Kvinder 235 257 Sum 243 500 Tabel 2.10 De motionerende personer udgor 257/500 af personerne, og da vi gar ud fra uafhcengighed, vii vi forvente, at 257/500 af savel mcendene som kvinderne dyrker regelmcessig motion, mens 243/500 af personerne ikke dyrker motion. Disse bmkdele benytter vi til at udfylde de tomme celler i tabellen med de forventede vcerdier. Ikke regelm..-essig motion Sum = 136,21 §66 .265 = 128, 79 265 Kvinder ~6&. 235 = 120,79 §66. 235 = 114,21 235 Sum 257 243 500 Regelm<essig motion M..-end . ~6& 265 Tabel 2.11 Forventede hyppigheder Tabellen kan vi ogsa nemt udfylde ved celle for celle at udregne . h d e fiorventet h yppzg 2.4 · sojlesum = rcekkesum l tota sum 61 Vi udregner nu teststorrelsen (130-136,21) 2 (135-128,79) 2 (127-120,79) 2 (108-114,21) 2 xberegn= 136,21 + 128,79 + 120,79 + 114,21 2 dvs. x~eregn = 1, 2395 Hvis vi kender vrerdien i en af cellerne i tabel 2.1 0, kan vi bruge summerne til at beregne vrerdierne i de ovrige celler. Vi har dermed en frihedsgrad, sa vi bestemmer testsandsynligheden ved at benytte x2 -fordelingen med 1 frihedsgrad. Denne giver p-vrerdien p = P(x 2 ~ 1,2395) =0,266 = 26,6% Denne sandsynlighed er storre end signifikansniveauet pa 5 %, sa vi accepterer vores nulhypotese. Dvs. at stikproven ikke viser nogen sammenhreng mellem kon og regelmressig motion pa 5 %-niveau. 62 KAPITEL TESTS 2.4.2 Test i n x m-tabeller Vi kan ogsa teste for uafhc.engighed i stmre krydstabeller. En krydstabel med n rc.ekker og m sojler kalder vi en n x m-krydstabel. Som eksempel ser vi pa 4x2-krydstabel tabel 2.12, der viser, ved hvilken praktisk korepmve 319 tilfc.eldigt udvalgte bilister erhvervede korekortet. Kvinder Mc.end 1. prove 37 56 2. prove 63 60 3. prove 47 43 4. prove 7 6 Tabel 2.12 Observerede hyppigheder Vi vii undersoge, om antallet af aflagte korepmver er uafhc.engigt af kon, sa vi opstiller nulhypotesen H0 : Antallet af aflagte korepmver er uafhc.engig af kon Som signifikansniveau benytter vi 5 %. Hvis vi forkaster nulhypotesen, accepterer vi den alternative hypotese Ha : Antallet af aflagte korepmver afhc.enger af kon Cellerne i tabellen Kvinder Mc.end Sum 1. prove 93 2. prove 123 3. prove 90 4. prove 13 Sum 154 165 319 Tabel2.13 udfylder vi med forventede hyppigheder, som vi pa baggrund af vor antagelse 2.4 for uafha:ngighed 63 om uafhrengighed kan udregne som . h d rrekkesum · sojlesum e = tota 1sum fiorventet hypp1g De forventede hyppigheder er Kvinder Mrend Sum 1. pmve 44,90 48,10 93 2. pmve 59,38 63,62 123 3. pmve 43,45 46,55 90 4. pmve 6,28 6,72 13 Sum 154 165 319 Tabel 2.14 Forventede hyppigheder som giver teststorrelsen xz = \ L_, beregn (oij- /ij)2 aile celler Antallet af frihedsgrader er 3, og testsandsynligheden p = 0, 28 f;1 . =3 83 ' 1 x 2 -fordelingen med 3 frihedsgrader giver OS =28 %. Dermed accepterer vi nulhypotesen og konkluderer, at undersogelsen understotter, at antallet af aflagte korepmver er uafhrengigt af kon. Generelt kan vi udregne antallet af frihedsgrader svarende til en n x m - krydstabel, hvor vi tester for uafhrengighed, som antallet af frihedsgrader = (antallet af rrekker- 1) · (antallet af sojler- 1) 64 TESTS 2.4.3 Oversigt til x2 -test af uafhrengighed Udgangspunkt er en n x m-krydstabel. Kat. 1 Kat. 2 ... Kat. m Niv. 1 Niv. n 65 Hvis vi arbejder med kritiske vrerdier, skal vi erstatte trin 4 og trin 5 med trin 4* og trin 5* nedenfor Trin.4* Be.stem ant<lllet af.frihedsgrader r.og fin~ den kritiske vrerdi h0rende til · sigrtifika:B~ni:v;eauetye~ br\lg jtf x2-fotdelin$eflirted r frihedsgrader. 66 KAPITEL 2. TESTS 2.4.4 Tabel over udvalgte kritiske vrerdier til x2 -test Kritiske vcerdier h0rende til signifikansniveauerne 5 %, 1 % og 0, 1 %for x2 - fordelinger. Tabel 2.15 Frihedsgrader Kritiske vrerdier 10,8276 13,8155 ,}!6)2662 18;;4668 34;8o5~ 19 20 36,1908 31,4104 3715662 45,3147 67
© Copyright 2024