Repraesentative undersoegelser

Bortfaldets betydning
i dag
og over tid
Belyst ved eksempler
Peter Linde
Interviewservice
pli@dst.dk
27. november 2013
Dagsorden
•
•
•
•
•
•
•
Hvad er en repræsentativ undersøgelse?
Definition af responsrate
Bortfald i Danmark
Reparation af bortfald
Effekt af de sidste interviews
Vægtning for non-response
Opsummering
Spørgsmål er velkomne undervejs
og diskussion tages til sidst – der skulle være tid
Den samlede fejl
Ingen indsamling er bedre end sit svageste led
Fire ting kan gå rigtigt galt:
1. Ufuldstændig population/ramme
2. En ikke repræsentativ stikprøve
3. Bortfaldet
4. Spørgsmålene, byrde og relevans
Fokus på 3, og lidt på 1 og 2.
Repræsentativitet (1)
• Udsnit kan tages på mange måder
fx de 114 der er tilmeldt her i dag
• Alle udsnit eller stikprøver heraf siger noget om
udsnittet selv
… men ikke alle udsnit/stikprøver kan generaliseres
Hvis tre krav er opfyldt kan en stikprøve generaliseres:
1. Alle man vil sige noget om i målpopulationen skal
kunne vælges
2. De skal udvælges ved lodtrækning med kendt
sandsynlighed for at blive valgt
3. Man skal vægte med den inverse sandsynlighed
sandsynligheden for at blive valgt
Repræsentativitet (2)
• Et tilfældigt udsnit der opfylder de tre krav har per
definition en række smukke egenskaber
• Det rigtige kan lige så godt være større som lavere
• I gennemsnit er det rigtigt
= Repræsentativt (afhænger kun af hvordan der er udvalgt – de tre krav)
Stikprøven har en statistisk usikkerhed
• Jo flere, jo mere sikkert bliver tallet
• Jo flere, jo mindre bliver sikkerhedsintervallet
• Matematikken siger, at man skal spørge fire gange så
mange, hvis man vil være dobbelt så sikker
= Sikkerhed (afhænger af stikprøvedesign og hvor mange der er udvalgt)
Repræsentativitet (3)
Tommelfingerregelen er, at usikkerheden højst er:
Der udvælges 100 enheder
Der udvælges 400 enheder
Der udvælges 1600 enheder
Osv.
 +/- 10 %
 +/- 5 %
 +/- 2,5%
med den sædvanlige statistiske sikkerhed = et sikkerhedsinterval på 95%
Er baseret på den centrale grænseværdisætning
http://onlinestatbook.com/stat_sim/sampling_dist/index.html
Repræsentativitet (4)
Vandret (rød): Bias (skævhed)
Sort kurve: Den rene tilfældige fejl
Grøn kurve: Den samlede fejl ( kvadratroden af mean square error)
Repræsentativitet (5)
En simpel tilfældig stikprøve
• Udvalgsramme=målpopulation
• Lodtrækning med kendt sandsynlighed
Er altid repræsentativ – alle variabler har kun en tilfældig fejl 
Grundskole
Ungdomsudd.
Korte videreg.
Mellemlange videreg.
Lange videreg.
Procent
Population
34,9
39,6
4,2
12,4
8,9
Stikprøve
34,0
39,3
4,0
13,2
9,5
Stikprøven er 1.800 og har en tilfældig fejl på 1-2%
Repræsentativitet (6)
Procent
Population
Stikprøve
Herkomst
Dansk oprindelse
Indvandre
Efterkommere
88,4
10,2
1,5
89,2
9,2
1,6
Familie
Enlig uden børn
Enlig med børn
Par uden børn
Par med børn
26,9
6,5
31,3
35,2
26,2
7,1
31,8
34,9
95% af alle tabeller vil have afvigelser på under 1-2%
Hvis man forhåndsstratificerer proportionalt kan man fjerne den
tilfældige fejl.
Repræsentativitet (7)
Hvis udvalgsramme er en del af målpopulation er der a priori en
skævhed. Fx
Kun dem med telefon  Aldersmæssigt og socialt skævt
Et e-mail panel fanget på internettet:
Selvrekrutteret  Speciel gruppe
Købt  kan være godt eller skævt
Kommer fra andre undersøgelse  overtager skævhed +
ny skævhed
Der kan korrigeres herfor, men det skal dokumenteres om det er
lykkedes. Specielt fordi første trinnet i udvælgelsen har en skævhed,
der skal lægges til.
Hvis der forhåndsstratificeres skal dette dokumenteres .
Definition af response rate - AAPOR
Interview
G
Gennemført interview
D
Delvist gennemført interview
Relevant (opfylder kriterier/kontakt) – ikke interview
N
Nægter eller afbryder
IM
Ikke muligt (fx aldrig tilgængelig)
A
Anden årsag (fx sygdom, sprogproblemer)
Ukendt relevans – ikke interview
IS
Ikke noget svar
UA
Ukendt andet (fx ikke noget telefonnummer eller forskerbeskyttelse)
e
andel ‘ukendt relevans’ der tilhører i population (e=1/0 er specialtilfælde)
Ikke relevant
IR
Udenfor population
Respons rate: RR1=G/(G+D)+(N+IM+A)+(IS+UA)*e
Bortfald i Dammark (1)
• En svarprocent på 75-80% var mulig i 80-erne
• Siden er det gået tilbage
• I dag har vi en svarprocent på
50-65%
Der er tre årsager:
1. Det er en generel trend i den vestlige verden
2. Det skyldes billigere dataindsamlinger
3. Og i Danmark også forskerbeskyttelsen, som
fritager for at deltage i undersøgelser baseret
på stikprøver, der bruger oplysninger fra CPR
Bortfald (2)
Omnibus
1992
2012
I alt
67% opnåelse
58% opnåelse
Mænd
Kvinder
66%
67%
56%
61%
16-29
30-39
40-49
50-64
65-74
62%
66%
73%
68%
67%
47%
58%
57%
61%
71%
år
år
år
år
år
Bortfald (3)
1992
2012
62%
67%
85%
83%
80%
51%
56%
73%
74%
70%
Uddannelse
Grundskole
Ungdomsuddannelse
Kort videregående
Mellemlang videregående
Lang videregående
Indkomst familie
Ingen registeret
1-200.000
200-350.000
350-500.000
500-750.000
750.000+
Indkomst
42%
45%
61%
61%
70%
69%
6% for høj
8% for høj
Bortfald (4)
Generelt er svarprocenten faldet mest de sidste
25 år for:
–
–
–
–
Mænd
De unge og yngre
Lavest uddannelse
Mindst indkomst
Tallene, der netop er vist, er fra dataindsamlingen.
I 2000 kom forskerbeskyttelsen, der er på 13%.
Dvs. opnåelsen i dag er 58% /1.13 =51%
For 25 år siden var vi normalt blandt de fem
europæiske lande med mindst bortfald – i dag er
vi blandt de fem med størst bortfald 
Bortfald (5)
• I 2000 blev muligheden for at opnå forhåndsfritagelse
(forskerbeskyttelse) indført på flytteblanketten
• I 2007 blev den i stedet en af de services man fx kan
finde på Internettet
• Godt 780.000 har i dag forskerbeskyttelse
Bortfald (6)
Tal om forskerbeskyttelsen 1. januar 2011
Alder
0-9 år
10-19
20-29
30-39
40-49
50-59
60-69
70+
8,5%
12,5%
21,2%
23,7%
14,4%
9,0%
6,5%
4,9%
Bortfald (7)
Socioøkonomisk status:
•
•
•
•
•
•
Selvstædig
Lønmodtager
Arbejdsløs
Uddannelse
Pensioneret
Uden arbejdsstyrken
12,1%
15,3%
21,4%
13,1%
7,5%
12,2%
Statsborgerskab:
• Dansk
13,0%
• EU, USA, Australien mv. 9,2%
• Andre
8,7%
Reparation for bortfald
Vægtning for skævt bortfald med registeroplysninger
Simpel efterstratifikation, fx en tre-vejstabel efter køn, 5
aldersgrupper og 5 indkomstintervaller – i alt 50 strata
I hvert stratum dannes vægten: Population/stikprøve=N/n
I den generelle situation inddrager man flere faktorer og
forskellige tabeller, der genskabes med vægten.
Vægt personi= N/n*Gi
Gi er korrektionen
Gi>1 hvis for få, fx lav indkomst
Gi<1 hvis for mange, fx høj uddannelse
Effekt af de sidste interviews
CATI
400
CAWI
350
300
250
200
150
100
50
0
1
3
5
7
9
11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
Vægtning (1)
DST’s forbrugsundersøgelse kan fx vægtes efter:
Statsborgerskab, beskæftigelsesstatus, socioøkonomisk
status, husstandsstørrelse, region og husstandstype,
uddannelsesgruppe samt:
Population
Opnået
Vægtet
Bolig
Eget hus
47%
57%
47%
Eget lejlighed
5%
5%
5%
Lejet hus
13%
10%
13%
Lejet lejlighed
33%
26%
33%
Uoplyst
2%
1%
2%
De vægtede tal passer (selvfølgelig) med populationen
Vægtning (2)
I forbrugsundersøgelsen vægter vi også for indkomst, men
hvis vi ikke gør det og alene vægter for de nævnte sociale
og demografiske faktorer, gælder:
Fam. indk.
Afvigelse
Population
Opnået
Vægtet
520.639
557.159
+7%
518.000
-½%
Indkomsten overvurderes med ca. 7%, hvis man ikke
vægter. Den samme bias var for 15 år siden ca. 3%
Vægtningen med de demografiske og sociale faktorer
reducerer biasen til ½%. Hvis vi også have vægtet for
indkomst havde biasen for indkomst være 0% (selvfølgelig)
Effekt af vægtning (3)
Vægtningen har tre virkninger:
1. Kontrollerer det der er muligt mht. non-response
– begrænser den største fejlkilde
2. Kan øge vægtningen af stikprøvevariansen lidt, hvis der
er meget skævt bortfald – nødvendigt hvis man vil
kontrollere biasen
3. Kan vinde stikprøvevarians svarende til graden af
forklaret variation – registervariabler kan fjerne
usikkerhed
Effekt af vægtning (4)
I eksemplet fra forbrugsundersøgelsen:
Vi måler andelen af husstande, der har et årligt forbrug på
over 300.000 – baseret på svaret i spørgeskemaet.
Andel over 300.000
Spredning
Uvægtet
46%
Vægtet
39%
Simpel
Kun punkt 2 Punkt 2+3
Naiv
Overvurderer
Rigtig/bedst
0.0098
0.0107
0.0070
Gevinsten er 1-(0.0098/0.0070)**2 = 97%
De 2.462 interviews svarer effektivt til 4.845.
Man har gratis fået 2.383 interviews + reduceret bias (1)
Vægtning (5)
Vægtning kan ikke fjerne alt bias. I undersøgelsen
Befolkningens brug af IT vægtes efter sociale- og
demografiske faktorer.
Procent medlemmer af Ældresagen
Udvalg
Opnåede svar
Pop Stikprøve
Uvægtet
Vægtet
16-74 år
75-89 år
10,0
43,8
9,9
41,8
14,7
48,1
11,1
49,2
Medlemmer af Ældresagen deltager signifikant oftere i
undersøgelser – også efter vægtning
Vægtning (6)
Arbejdskraftundersøgelsen
Indkomst
Hele populationen
175.367
Bortfald
161.677
Besvarelser
180.379
Vægtet for køn, alder og geo
180.982
Yderligere vægtet for udd. og job 176.928
Vægtning for køn, alder og geografi giver ikke
noget. Man skal også inddrage sociale forhold.
Opsummering
Bortfaldet er
• Stigende i omfang
• Har fortsat stor social bias
• Svagt øget social bias
• Vægtning for demografiske forhold løser
ikke problemet
• Vægtning for sociale forhold kan løse
meget
• Men ikke alt
Spørgsmål ?