Medicinsk statistik II (pdf 715,1 kB)

2015-11-04
Viktiga dimensioner vid val av test
(och även val av deskriptiv statistik)
Biostatistik II

- Hypotesprövning i teori och praktik



Urvalsstorlek
Mätnivå/skaltyp
Fördelning av data
Studiedesign
Frida Eek
frida.eek@med.lu.se
1
2
Studiedesign

En grupp (jämfört med referensvärde, eller 0)?
Samples size:
 Stort eller litet urval?
Två (eller flera) grupper –tvärsnittsjämförelse?
Oberoende -unpaired (independent) samples/
observations

Fördelning:
 Normalfördelat eller snedfördelat? (Symmetriskt eller
assymmetriskt)
Upprepade mätningar-två (eller flera) mätningar på
samma individer?
Beroende –paired (dependent) samples/ observations

3
4
Variablernas mät/skalnivå

Samples size:
 Stort eller litet urval?


Fördelning:
 Normalfördelat eller snedfördelat? (Symmetriskt eller
assymetriskt)


5
Kategorisk?
Binär?
Ordinalskala?
Metrisk/scale?
Kombinationen av oberoende och beroende
variabel (exponering och utfall) avgör test!
6
1
2015-11-04
Parametriska test:
Dimensioner att beakta




Förutsätter normalfördelning
Stora urval/sample
Ger både p-värde och effektmått
Tex t-test, ANOVA, pearson correlation
7
Test-karta
Icke-parametriska test

Kräver ej normalfördelning
Små sample OK

Ger p-värden

Ex Mann-whitney, spearman correlation

8
9
10
Situation 1:


Några vanliga test
2 grupper av möss: albino och icke-albino
Hur många har en specifik genetisk
mutation?
Vilket är IV resp DV?
Vilken typ av variabler (mätnivå) är de?
11
12
2
2015-11-04
Chi2-test



Chitvå (Chi2) setting
Två kategoriska variabler (binär, nominal eller
ordinal med relativt få kategorier)
Icke-parametriskt test
Testar om frekvensen (andelen) av utfallet är
den samma mellan olika grupper (jämför



observerade och förväntade frekvenser)



2 grupper av möss: albino eller icke-albino
Hur många har en specifik gen-mutation?
IV:
DV:
Oberoende mätningar
Ger p-värde
Talar inte om exakt vilka ”celler” som skiljer sig
åt, endast att fördelningen inte är den samma i
alla jämförda grupper.
13
14
15
16
Chitvå (Chi2)
Presentera resultat från Chi-två


17
P-värde
Deskriptivt: frekvens/andelsfördelning
18
3
2015-11-04
Situation 2:




T-test

2 grupper: normal diet och restricted caloriesdiet
Hur länge lever de? (Hur gamla blir de?)


Vilket är IV resp DV?
Vilken typ av variabler är de?



Parametriskt test
Jämför två medelvärden
Tvärsnitt (oberoende mätningar) eller
upprepade mätningar (före-efter) – olika t-test!
Independent- eller paired- samples)
Ger p-value
Ger medelvärdesskillnad och CI
Nackdel: går ej att justera för potentiella confounders.
Jämför endast två grupper/mättillfällen.
19
20
Independent sample t-test:




Två oberoende grupper –
2 grupper: normal diet och restricted calories
Skillnad i livslängd?
Punktskattningen
IV
DV

Man kan räkna ut ett
konfidensintervall för
skillnad i medelvärde

SEpooled är ett
sammanviktat standardfel

s2pooled är en
sammanviktad varians
KI  ( x A  x B )  c  SE pooled
 1
1 

SE pooled  s 2pooled  

 n A nB 
s 2pooled 
n A  1  s A2  nB  1  s B2
n A  1  nB  1
(n = antal observationer; x = medelvärde; s = standardavvikelse)
21
22
Antaganden bakom t-testet
(independent sample t-test)
Två versioner av t-testet beroende på om man kan anta att standardavvikelsen
är lika i båda grupperna
1.
Medelvärdet är ett bra sammanfattande mått
2.
Oberoende observationer (t.ex. ingen patient
förekommer mer än en gång) –om beroende
mätningar/grupper används paired sample t-test!
3.
Mätningarna är normalfördelade i båda grupperna
eller
Båda grupperna är stora
Levene’s test:
p-värde (”Sig.”) testar H0: Varians i A = Varians i B
23
24
4
2015-11-04
Situation 3:





Paired sample t-test 1
1 grupp: före och efter anabola steroider
Förändring i styrka? (tyngdlyftningstest)
Förändring i uthållighet?
1 grupp –pre och post
Metric/scale outcome. Normalfördelad
(differens)?
25
Paired sample t-test 2: endurance
(min in wheel)
26
Presentera resultat från t-test
(paired och/eller independent samples)


Medelvärdesskillnader med CI
P-värde?
27
28
Situation 4:
Antaganden bakom parat t-test
1. Parade stickprov, beroende inom paren, inget

beroende mellan paren

2. Medelvärde är ett relevant summerande
mått:
H0: Medelvärdesskillnaden = 0


3 groups: Normaldiet, restricted cal, LCHF
Skillnad i livslängd?
DV/IV?
Variabeltyper/mätnivå?
3. Skillnaderna mellan paren är
normalfördelade
eller
Det finns så många par att det inte gör något
att de inte är normalfördelade
29
30
5
2015-11-04









ANOVA (ANalysis Of VAriance)
ANOVA:
Parametriskt test
Jämför medelvärden mellan 2 eller flera grupper

(egentligen, varians inom/mellan grupperna!)
Tvärsnittsjämförelse/oberoende mätningar (”vanlig” ANOVA)
eller upprepade mätningar (repeated measures ANOVA)
Ger p-value
Parvisa post hoc test-möjligheter
Ger medelvärden med CI
Möjligt att inkludera flera olika IV/covariat –justera för
confounders
Möjligt atth testa interaktioner (effect modification)
(ANCOVA, MANOVA..)

3 grupper: Normal diet, restricted cal, LCHF
Skillnad i livslängd?

IV:
31
ANOVA
32
Post-hoc test
33
När ska icke-parametriska test
användas?
34
Icke-parametriska gruppjämförelser



Icke-parametriska test används när
förutsättningarna för parametriska test inte
uppfylls.
Vid små urval, eller skeva fördelningar (eller
ordinal(?)/nominaldata)


DV:

Då används icke-parametriska test.
De ställer inte samma krav på normalfördelning, mätnivå
etc.
35


T ex Mann-whitney, Wilcoxon, McNemar,
Kruskal Wallis, Friedmans ANOVA…
Modellen anges i SPSS (antal grupper, paired
eller independent samples, etc). SPSS kan
välja exakt test –men det är såklart bra att veta
vad som händer!
Ger p-värde
Jämförelser baseras generellt på rangordning
istället för exakta värden
36
6
2015-11-04
Mann-Whitneys U test
Situation:

8 albinoråttor och 8 icke-albinoråttor
Skillnad i serum vitamin D? (ng/mL)

IV/DV?

Små grupper, och/eller assymmetriska data


Rangordna alla observationerna från den
lägsta till den högsta

Beräkna summan av rangerna i grupp A
(W A) respektive grupp B (W B)

Ju större skillnad i medelrang, W A/nA och
W B/nB, ju lägre p-värde fås
37
Mann-whitney U
38
Presentera resultat från
Mann-Whitney U test

Deskriptiv statistik för de två grupperna




Median
Min och Max (eller lämpliga percentiler)
P-värde
Mediankonfidensintervall finns men används
inte så ofta
39
Situation:


40
Parade data
Icke-parametriskt test
8 möss, före och efter vitamin D tillskott
Förändring i serum vitamin D?



IV/DV?

41
Wilcoxons teckenrangtest
H0: Mediandifferenserna mellan metoderna är
noll, och positiva och negativa differenser har
samma fördelning
H1: Mediandifferenserna mellan metoderna är
inte noll, eller positiva och negativa
differenser har inte samma fördelning
42
7
2015-11-04
Wilcoxon signed rank
Fler icke-parametriska
gruppjämförelser:


Tvärsnittsjämförelse av mer än 2 grupper: KurskalWallis (med post-hoc)
Samma logik som för Mann-whitney U

Binär/dikotom (yes/no) variabel, upprepade
mätningar (t ex andelen av ”någonting” före och
efter en intervention): McNemar

Vad du primärt får ut: p-värden.
43
Situation:




44
Association?
32 möss, olika solljusexponering.
Olika nivåer av serum vitamin D
Finns det något samband mellan
solljusexponering och vitamin D-nivåer?
Vilken typ av variabler?
45
Korrelation





46
Korrelation
Parametrisk (pearson) eller icke-parametrisk
(spearman)
Beskriver association (linjär samvariation)
mellan två metriska variabler
Ger p-värde
Ger korrelationskoefficient ( r )
(Ger därmed även förklarad varians (r2))

47
Parametrisk (baserad på faktiska värden)
eller icke-parametrisk (baserad på
rangordning)?
48
8
2015-11-04
Presentera resultat från korrelation?
Linjär regression




r, eller rho
p-value
r2?
Om man antar att en variabel påverkar den andra,
kan sambandet beskrivas genom linjär regression
(OBS regressionen kan dock aldrig vare sig testa eller bevisa
faktisk kausalitet)




Om y alltid är samma som x kan man säga att y = x
Om y alltid är dubbelt så mycket som x kan man
säga y = 2x
y är beroende variabel
x är oberoende variabel
49
Linear regression
Linjär regression – formel 1








y = bx
β är lutningen, ”the slope”
Tolkningen av b är:

50

För varje enhet ökning i x, ökar y med b enheter
En individ med en enhet högre x, har b enheter
högre (predicted) y
β (beta) är standardiserad slope: för en sd ökning
i x, ökar y med β sd
β/b can kan vara negativ = y minskar för varje
ökning i x
Y=a + bx –inkluderar intercept (a)
51






Parametriskt test
Testar linjärt samband mellan två metriska/scale variabler
eller en binär (oberoende/IV) och en metrisk/scale
variabel (som beroende/DV)
Y= a + bx
Ger p-värde
Ger regressions coefficient ( b/β )
Ger förklarad varians (r2)
Flera prediktorvariabler/IV kan inkluderas (multipel linjär
regression), ökar förklarad varians/förbättrar prediktion
Tolkas som kausal påverkan från x på y, men bevisar
ingen kausalitet!
52
Linjär regression – Ex: Marathon och
VO2

Påverkar VO2max marathon-tid?

Marathontid = dependent/beroende variabel (den
som påverkas) = y

VO2max= independent /oberoende variabel (den
som påverkar) = x
53
54
9
2015-11-04


Variation
Y=a + bx
Linjär regression ger y = 414-4.46x

Vad säger interceptet?
”Vad är y, när x=0” –där linjen skär y-axeln

Negativ association= nät X ökar, så minskar y!

If VO2max increases with 1 ml/kg/min, then
marathon finishing time decreases with 4.5 minutes
b= -4.46 95% CI:-4,91; -4,02


55
Line with best fit
56
Variation – goodness of fit

Ju bättre modell, desto mindre residualer

Den andel av variansen som förklaras av
modellen: (R2)

Ju fler förklarande variabler(factors) i modellen,
desto högre R2
57
58




59
VO2max förklarar 45% av variationen I
marathontid (obs! Fiktivt exempel)
55% är fortfarande oförklarat!
Viss andel av variansen kommer alltid att
förbli oförklarad (individuella variationer).
Modellen kan dock förbättras genom
inkludering av fler prediktiva/förklarande
variabler!
60
10
2015-11-04
Presentera resultat från linjär
regression



Slope/b/beta-koefficient med CI
Förklarad varians
(Intercept?)
61
62
Linjär regression – villkor



För varje värde på x
måste y vara
normalfördelad
Samtliga
observationer måste
vara oberoende
Variansen ska vara
konstant
Dessa villkor måste vallideras!
AB 20111020
63
Modellvallidering




Sammanfattning
Residualerna ska vara

64

normalfördelade
oberoende
ha konstant varians
Val av test avgörs genom att beakta:
Variabeltyper (både beroende och oberoende)
Studiedesign
Urvalsstorlek
Fördelning av (metrisk) data
Detta undersöks med lämpliga figurer
65
66
11