Mobilt Testande* -en jämförelse av kognitiva testpoäng från mobil respektive icke-mobil enhet Handledare: Anders Sjöberg MASTERUPPSATS I PSYKOLOGI, 30 POÄNG 2016 Johan Wikström STOCKHOLMS UNIVERSITET PSYKOLOGISKA INSTITUTIONEN Mobilt Testande* -en jämförelse av kognitiva testpoäng från mobil respektive icke-mobil enhet Johan Wikström Ökad användning av mobila enheter, samt organisationers önskan att effektivt testa och engagera arbetssökande driver utvecklingen av mobilanpassade test framåt. Forskning kring mobila enheters inverkan på testresultat är tvetydig med positiva och negativa utfall. Mobila enheter verkar ha negativ inverkan på testpoäng från kognitiva test. En effekt som kan bero på de begränsningar (mindre skärm, pekskärm) som mobila enheter har. Mått på kognitiva förmågor används ofta vid urval, om olika enheter ger upphov till differens i testpoäng behöver detta utredas. I en experimentell studie (N=51) undersöktes huruvida mobila enheter har negativ inverkan på resultat från kognitiva test. I upprepade mätningar genomförde deltagarna kognitiva test på mobil och icke-mobil enhet. Studien visar att mobila enheter inte har en negativ påverkan på testresultatet. Diskussionen behandlar möjliga förklaringar till resultat utifrån urval och testdesign, tar upp begränsningar i studien samt siar om MT framtid. Internet har förändrat hur vi människor kommunicerar, gör affärer och lever våra liv. En förändring som även har påverkat organisationers rekryterings- och urvalsprocesser vare sig det gäller annonsering av vakanta platser, varumärkesbyggnad, webbaserade urvalstest eller användandet av oövervakade internet test (King, Ryan, Kantrowitz, Grelle, & Dainis, 2015). Utveckling som gjort det relativt enkelt och standardiserat för organisationer att genomföra både enklare och mer avancerade testsituationer (t.ex. adaptiva kognitiva test), med arbetssökande som befinner sig på vitt skilda platser både i tid och rum (Tippins, 2011). Detta har lett till ett större utbud av sökande, samt sänkt testkostnader då behovet av administratörer reducerats eller helt eliminerats genom användandet av oövervakade test (Fluckinger, Dudley, & Seeds, 2014; Tippins, 2009, 2011). Ökad tillgång till, och användning av smarta telefoner, surfplattor och mobilt internet, tillsammans med organisationers önskan att på ett mer effektivt sätt engagera och testa sökande driver idag testindustrin mot mobilanpassade test och urvalsprocesser (Findahl, 2015; Huff, 2015; Kantrowitz, 2014). Att utforma test som fungerar för olika medium kan skapa problem då det finns en risk att måttet (mätinstrumentet) förändras när det överförs från en enhet till en annan och inte är likvärdigt över medium (Schroeders & Wilhelm, 2010). Att ett mått inte är likvärdigt över medium gör att resultat mellan grupper vars data samlats in med olika metoder (t.ex. mobil vs. icke-mobil enhet) inte kan jämföras med varandra (Arthur, Doverspike, Muñoz, Taylor, & Carr, 2014; Horn & McArdle, 1992; Steenkamp, Jan-Benedict; Baumgartner, 1998; Vandenberg & Lance, 2000). Trots likvärdighet i mått över medium kan det uppstå medelvärdesskillnader i testpoäng då olika medium används, något som framförallt verkar vara sant för kognitiva test (Arthur et al., 2014; Morelli, *Tack till Anders Sjöberg för stöd och råd under arbetet med uppsatsen, och tack till Mats Englund på cut-e som ledde in mig på området, och gav värdefulla tips i ämnet. 2 Mahan, & Illingworth, 2014). Denna differens kan bero på Mode Effect, dvs. påverkan från det medium som testet administreras via (Leeson, 2006). Likvärdighet i mått och likvärdighet i resultat över medium är viktigt för att de slutsatser som görs utifrån observerade resultat ska vara valida (Binning & Barrett, 1989; Cronbach & Meehl, 1955; Vandenberg & Lance, 2000). Om arbetssökande ges möjligheten att välja mellan att genomföra en testsituation på en mobil eller icke-mobil enhet där resultat från test används som urvalskriterier, är det viktigt att kunna garantera och bevisa att resultat från test oavsett medium är likvärdiga, eller om så inte är fallet att det finns tydliga riktlinjer för tolkande av resultat som uppstått från olika medium (AERA, APA, & NCME, 2014; ISO 10667, 2013). Användning av mobila enheter vid psykometriska test är relativt outforskat och kan enligt Arthur et al., (2014) sägas bestå av tre delar (1) relationen mellan användare av mobila enheter och ändrat socialt beteende, (2) framväxten av mobila enheter som ett verktyg för att samla in data och (3) mobila enheters påverkan på test och testpoäng. Det är det tredje nämnda området som kommer vara fokus för denna studie. Forskning som har undersökt testande via mobila enheter är tvetydig, vissa studier visar på positiva utfall andra lyfter fram möjliga problem och risker (Arthur et al., 2014; Huff, 2015; Illingworth, Morelli, Scott, & Boyd, 2014; King et al., 2015; Morelli et al., 2014). Då det föreligger en ökad vilja att använda mobila enheter i testsituationer och det finns en tvetydighet kring utfallet av användandet av mobila enheter behövs mer forskning i ämnet. Studiens syfte är att undersöka om likvärdiga resultat uppnås på kognitiva test oavsett om testen genomförs med en mobil eller icke-mobil enhet. Först presenteras, i korthet, nyttan med att bedöma kognitiva förmågor vid urval. Varpå mobilt testande definieras samt potentiella fördelar och risker med mobilt testande lyfts. Därefter presenteras studiens hypotes samt tidigare forskning av mobilt testande. Urvalstestning & kognitivförmåga Den primära anledningen till att organisationer är intresserade av att låta arbetssökande genomgå testsituationer är för att predicera arbetsprestation (Sjöberg, 2014). Arbetsprestation kan definieras som mätbara, handlingar, beteenden och utfall hos anställda som är kopplade till och bidrar till en organisations mål (Viswesvaran & Ones, 2000). Kognitiv förmåga är kapaciteten att kunna lära, lösa problem och anpassa sig till rådande omgivning (Ones, Dilchert, Viswesvaran, & Salagado, 2010). Att bedöma kognitivförmåga hos arbetssökande som urvalssätt är lämpligt då kognitivförmåga varierar hos individer (Spearman, 1904) och är starkt positivt korrelerad till akademisk prestation, förmåga att lära och bemästra kunskaper samt arbetsprestation (Schmidt & Hunter, 1998). Validiteten i test som mäter kognitivförmåga varierar inte i någon stor grad mellan olika typer av organisationer eller för olika grupper av individer, vilket bidrar till att göra kognitivförmåga till den enskilt bästa faktorn för att predicera arbetsprestation (Ones et al., 2010). 3 Mobilt testande Definition Det första kognitiva test som utvecklades (1905) användes till att identifiera barn med inlärningsproblem (Toquam, Corpe, Dunnette, Rumsey, & Simutis, 1991). Utveckling av kognitiva test har skett sen dess, men det är en utveckling som snarare har rört hur testen administreras (kontrollerat, okontrollerat) och med vad för typ av medium (papper, dator) än vad för item som används för att mäta olika kognitiva förmågor (Arthur, Glaze, Villado, & Taylor, 2010; Pearlman, 2009). Det finns kognitiva test som är utvecklade direkt för datorer och mobila enheter (t.ex. cut-es Slst & Smt). Men många av de dator- och mobilanpassade kognitiva test som finns tillgängliga idag är ursprungligen utvecklade att utföras med papper och penna under kontrollerade former men som genom teknisk utveckling har överförts till nya medium (Mead & Drasgow, 1993). Ett problem då det psykologiska konstrukt som mätts kan komma att påverkas av det medium det administreras med (Leeson, 2006; Mead & Drasgow, 1993). I studien används termerna mobil och icke-mobil enhet samt mobilt testande och datoriserat testande. Mobil enhet vilket syftar till handhållna, trådlösa enheter t.ex. smarta telefoner och surfplattor, och icke-mobil enhet syftar till stationära och bärbara datorer. Definitionen av en mobil enhet är hämtad från med Chernyshenko och Stark (2015) som menar att en enhet ska vara portabel och användarvänlig/lättanvänd för att ses som mobil. Portabel anses en enhet vara som kan användas i princip i vilken kontext som helst, även när en person går. Användarvänlig/Lättanvänd anses en enhet vara som kan hållas och samtidigt användas med minimal ansträngning. Detta leder till att mobilt testande, i denna studie, definieras av vad för enhet deltagaren använder för att genomföra testet snarare än hur själva testet administreras (mobilt internet, WiFi eller fast uppkoppling). Detta innebär att använda en smarttelefon/läsplatta för att genomföra ett test ses som mobilt testande (MT). Och att använda en bärbar dator och en trådlösuppkoppling för att genomföra ett test ses som datorbaserat testande (DT). Fördelar med MT Potentiella fördelar som lyfts fram med testande via mobila enheter är t.ex. ett större och mer diversifierat urval och ett, för organisationer, stärkt varumärke (Arthur et al., 2014; Lahey, 2014). Ett större och mer diversifierat urval bygger på antagande om att MT ger möjligheten att nå ut till grupper som tidigare varit exkluderade pga. tekniska förutsättningar och grupper med låg socioekonomisk status, som ofta varit underrepresenterade i dessa rekryterings- och urvalsprocesser, beroende på låg tillgång till rätt teknik (Kende, 2015; Kontos, Emmons, Puleo, & Viswanath, 2010). Men även att MT skulle öka mångfalden generellt bland sökande vad det gäller etnisk bakgrund, kön och ålder. (Arthur et al., 2014; Chou, Hunt, Beckjord, Moser, & Hesse, 2009; Kontos et al., 2010; Pearlman, 2009). Mobilt internet ger arbetssökande en möjlighet att genomföra en testsituation ”när som helst, var som helst” (Lee, Kim, & Kim, 2005), vilket anses kunna stärka en organisations varumärke då det anses bidra till en positiv kandidatupplevelse av rekryteringsprocessen (Lahey, 2014). Sökandes uppfattning om en rekryteringsprocess är viktig då sökanden som upplever en rekryteringsprocess som positiv tenderar att se positivt på organisationen i stort och är mer benägna, att inte bara, tacka ja till jobberbjudanden men också rekommendera andra om organisationen (Hausknecht, Day, & Thomas, 2004). Studier visar dock att kandidater i stor utsträckning föredrar att genomföra en testsituation på icke-mobil 4 enhet före mobil enhet (Fursman & Tuzinski, 2015). MT anses ha ytterligare fördelar, utöver de som redan finns med dagens oövervakade webbaserade test, men är inte utan problematik. Risker med MT Potentiella risker för MT är t.ex. kontextuella aspekter om var test via mobila enheter utförs, avsaknad av likvärdighet i mått, demografiska skillnader samt begränsningar kopplade till enheten (små skärmar, avsaknad av tangentbord) vilka anses ha negativ påverkan på prestation (Arthur et al., 2014; King et al., 2015; Leeson, 2006; Morelli et al., 2014). Kontext Lee et al. (2005) beskriver hur kontext kan påverka användandet av mobila internet tjänster (t.ex. ett mobil-anpassat oövervakat kognitivt test). Författarna skiljer på personlig kontext (som beror på vilket tillstånd användaren är i) från den omgivande kontexten (som har med yttre påverkan på mobil användandet). Den personliga kontexten bryts ner i emotion, tid och rörelse. Aspekter som t.ex. påverkar beteende vid användandet av mobila internet tjänster, val av tjänst samt upplevelsen av en tjänst (Bies, Tripp, & Kramer, 1997; Dholakia & Dholakia, 2004; Spector & Fox, 2002). Den omgivande kontexten bryter Lee et al. (2005) ner i fem delar (fysisk plats, distraktion, trängsel, interaktion, avskildhet). Fysisk plats har med den geografiska platsen att göra, om en t.ex. är inomhus (klassrum, kontor, bibliotek, restaurang) eller utomhus (gatan, park, busstation). Distraktion rör graden av konkurrerande krav (oväsen, obekväm miljö, andra sysslor). Trängsel har med uppfattning av kontroll över omgivningen och kan t.ex. beröra huruvida andra kommer in där en gör ett test. Interaktion berör till vilken grad kommunikation med andra sker medan ett test genomförs (svar på inkommande, mail/sms/samtal, prata med vänner). Avskildhet definieras av om en är ensam eller med andra (tillgång till eget rum, eller delat utrymme) (Lee et al., 2005). En kontext där det är mer troligt att en mobil enhet används kan tänkas ha en större negativ påverkan på prestationen vid kognitiva test, då en sådan testsituation skulle innehålla mer störande och distraherande element (Arthur et al., 2014; King et al., 2015). Kontextuellt kan MT och DT skilja sig åt, men ett specifikt testtillfälle behöver nödvändigtvis inte göra det. Det är t.ex. möjligt att genomföra en testsituation på en mobil eller icke-mobil enhet i en offentligmiljö och samtidigt kommunicerar med andra, även om det är mer troligt att det görs på en mobil enhet. En testsituation kan också genomföras på en mobil enhet i en privat kontext helt utan distraktioner, rörelse och med liknande känslotillstånd som i vilken annan kontext som helst. Likvärdighet Att ett mått inte är likvärdigt över medium gör att resultat mellan grupper vars data samlats in med olika metoder (t.ex. mobil vs icke mobil enhet) inte kan jämföras med varandra (Arthur et al., 2014; Horn & McArdle, 1992; Steenkamp, Jan-Benedict; Baumgartner, 1998; Vandenberg & Lance, 2000). För personlighetstest och andra icke-kognitiva tester har likvärdighet i mått uppmäts för MT (Arthur et al., 2014; Illingworth et al., 2014; Morelli et al., 2014). Morelli et al. (2014), fann förvisso i sin studie även likvärdighet för en kognitivt laddad övning mellan mobil och icke-mobil enhet, men i övrigt tyder studier på att mobila enheter har en negativ inverkan på 5 prestation i testsituationer som mäter kognitiv förmåga (Arthur et al., 2014; King et al., 2015). Mode Effect Sammanfattande forskning av Leeson (2006) visar på ett antal faktorer som har visat sig bidra till att skapa differens i flera olika typer av psykologiska testsituationer över olika medium. Leeson, benämner detta som Mode Effect, och visar på hur olika demografiska aspekter (kön, etnicitet, ovana med teknik, kognitiv förmåga) samt aspekter som rör begränsningar i enhet (interaktivitet och läsbarhet i gränssnitt) influerar prestation (se tabell 1) i datorbaserade testsituationer jämfört med testsituationer där test görs på papper med penna (Leeson, 2006). Huff (2015), menar att Mode Effect förklarar varför vissa studier har funnit differenser i datorbaserade testsituationer (Bridgeman, Lennon, & Jackenthal, 2003; Mead & Drasgow, 1993; Schroeders & Wilhelm, 2010; Wästlund, Norlander, & Archer, 2008), medan andra inte har funnit några differenser (Mead & Drasgow, 1993; Templer & Lange, 2008) när ett test administreras på olika sätt. Tabell 1. Mode Effect Aspekt Mode Effect Deltagare aspekter Kön & Etnicitet Endast små skillnader för etnicitet, kvinnor presterar något sämre på datorbaserade test. Minne & förståelse Varierande resultat för effekter på kognitivt processande. Snabbhet Deltagare tar generellt längre tid på sig att läsa på en dator skärm. Förmåga Hög presterande studenters prestation verkar förstärkas av datorbaserade test. Datorvana Små skillnader i prestation mellan vana & ovana datoranvändare, differens som kan reduceras genom introduktion & testomgång. Gränssnitt-Läsbarhet Skärmupplösning Hög upplösning resulterar i ökad läsbarhet & reducerar trötthet. Skärmstorlek Subjektiva skillnader, deltagare upplevde det lättare att läsa text från stor skärm. Text storlek Påverkar läshastighet och effektivitet Gränssnitt-Interaktivitet Scrollande Har visat sig påverka prestation negativt pga. försämrad möjlighet till visuell markering & spatial lokalisering. Item presentation Presentation av ett item per sida tenderar att öka fel & påskynda svar, möjligheten till återblick reducerar den negativa effekten. Presentation av flera item per sida verkar ha en underlättande effekt, då det ger möjlighet till att hoppa över, scanna av & bygga vidare på tidigare given information. 6 Demografiska skillnader Det finns skillnader i prestation vid kognitiva test mellan specifika grupper (Gallagher, Bridgeman, & Cahalan, 2002; Klein, Dilchert, Ones, & Dages, 2015; Ployhart & Holtz, 2008), och då olika grupper av individer verkar vara olika benägna att genomföra MT (Arthur et al., 2014), är detta av intresse då det kan uppstå ogynnsamma testsituationer för vissa grupper. Ovana med den teknik som testet administreras via är också en demografisk faktor som kan påverka prestation negativt (Paek, 2005; Schroeders & Wilhelm, 2010), något som dock kan reduceras av att deltagare erbjuds en övningsomgång (Powers & O’Neill, 1993). Enhetens begränsningar Mindre skärmstorlek och låg skärmupplösning har visat sig ha negativ inverkan av läshastighet och effektivitet på textbaserade test, samt ökar trötthet i ögon vilket anses påverka prestation negativt (Bridgeman et al., 2003; Sanchez & Branaghan, 2011; Sanchez & Goolsbee, 2010; Ziefle, 1998). Scrollande samt textstorlek (vilka båda kan påverkas av skärmstorlek) är ytterligare aspekter som visat sig medför negativ påverkan av prestation i testsituationer (Bridgeman et al., 2003; Leeson, 2006; Morelli et al., 2014; Sanchez & Goolsbee, 2010; Wästlund et al., 2008). Scrollande som är den vanligaste förklaringen till differenser i testresultat mellan medium, antas bero på att det tar fokus från den faktiska uppgiften i en testsituation (Potosky, 2008). Inmatningsmetod (t.ex. tangentbord eller pekskärm) har visat sig påverka likvärdighet i mått över medium, där högre överensstämmelse i inmatningsmetod mellan medium bidrar till större likvärdighet i måttet (Overton, Taylor, Zickar, & Harms, 1996). En stor skillnad, kanske den mest uppenbara, mellan mobila och icke-mobila enheter är användargränssnitt. Icke-mobila enheter tenderar att ha stora tangentbord, mus eller styrplatta och relativt stora skärmar, något mobila enheter oftast inte har. Det är en viktig aspekt enligt Schroeders och Wilhelm (2010), då mobila enheter ställer andra perceptuella krav och kräver annan motorisk färdighet, än vad t.ex. en icke-mobil enhet gör. De perceptuella kraven som syftar till möjligheten att korrekt uppfatta innehållet som presenteras, berörs av skärmstorlek och skärmupplösning. Motorisk färdighet berör den fysiska interaktionen med ett testmedium, t.ex. användandet av pek-penna, finger, pekskärm, eller mus/styrplatta (Schroeders & Wilhelm, 2010). Vissa av dessa aspekter varierar inom medium, men även då det finns likvärdighet i mått över medium, så kommer det finnas skillnader mellan MT & DT. De som använder mobila enheter kan komma att uppleva begränsningar i skärmstorlek och inmatningsmetod, samt motoriska utmaningar i navigerande vilket kan leda till sämre prestation vid användandet mobila enheter. Mobila enheters inverkan på testpoäng Tidigare publicerad forskning för ämnet användning av mobila enheter vid psykometrisk testning är begränsad. Den som finns (Arthur et al., 2014; Huff, 2015; Illingworth et al., 2014; King et al., 2015; Morelli et al., 2014; Sanchez & Branaghan, 2011; Sanchez & Goolsbee, 2010) visar på att test och test poäng kan påverkas av vilken typ av enhet (mobil eller icke-mobil enhet) som används för att genomföra ett test och att denna påverkan skiljer sig beroende på vilket typ av test som görs (se tabell 2.). Dessa studier bidrar med värdefull information kring användandet av 7 mobila enheter vid urvalstestning, men är framförallt intressant för textbaserade kognitiva test samt icke-kognitiva test (personlighetstest & bio data). Av tidigare studier är det dessutom endast King et al. (2015) som är av experimentell design vilket gör att resultat från övriga studier kan ha svårt att skilja vilka effekter som faktiskt beror på testmedium och vad som kan bero på andra faktor. Ett problem, menar Huff (2015), är att tidigare forskning sällan tagit med den information Leeson (2006) redovisar i sina beräkningar, utan betraktar enheterna som används i en testsituation som likvärdiga om implementeringen av testet är likvärdigt över enheterna. Vilket leder till slutsatsen att skillnader i medium kan ge upphov till skillnader i testsituationen, men ger inga svar på hur eller varför (Huff, 2015). Utifrån tidigare forskning som visar att användandet av mobila enheter i testsituationer tendera att påverka testpoäng av kognitiva test negativt, samtidigt som det verkar finnas en tendens till ökad vilja hos både organisationer och arbetssökande att använda mobila enheter i rekryterings- och urvalsprocesser är det viktigt att fortsätta undersöka mobila enheters inverkan på testpoäng. Syftet med studien har varit att undersöka om testpoäng från kognitiva test utförda med mobil respektive icke-mobil enhet skiljer sig eller inte. För att undersöka detta har följande hypoteser ställts. Hypoteser: 1a Lägre testpoäng förväntas på det kognitiva test Slst i en testsituation då mobil enhet används jämfört med när en icke-mobil enhet används. 1b Lägre testpoäng förväntas på det kognitiva test Smt i en testsituation då mobil enhet används jämfört med när en icke-mobil enhet används. 8 Tabell 2. Mobila enheters inverkan på testpoäng 1(2) Ref Urval Beskrivning Resultat Arthur et al. 2014 3.575.207 arbetssökande (69.000 på mobil enhet), slutförde oövervakade internetadministrerade test som en del av en arbetsökan. Tjänster som söktes fanns framförallt inom detaljhandeln & besöksnäringen. Jämförde demografiska & testpoängs skillnader (personlighet, kognitivförmåga) bland arbetssökanden som genomfört ansökan på mobil enhet med de som genomfört ansökan på en icke-mobil enhet. Kvinnor, afroamerikaner, spansktalande & unga arbetssökande använde mobila enheter i något större utsträckning för att genomföra sin ansökan. Testpoäng för personlighetstester var likvärdiga över medium, men testpoäng för begåvning var klart lägre på mobila enheter. Huff, 2015 47 college studenter (M ålder=26, 40% män) slutförde i upprepade mätningar ett 5faktoriellt webbaserat personlighetstest samt lämnade demografisk information m. dator & smarttelefon. Studien undersökte om typ av enhet påverkar mängden fel, tid att genomföra test samt uppfattning om användarvänlighet av test som inte är optimerade för mobila enheter. Ingen skillnad i personlighetstest mellan enheter men det tog signifikant längre tid att fylla i enkäten på mobil enhet. Användarvänligheten av testet ansågs sämre på mobil enhet. Illingsworth et al. 2014 Arkivdata från arbetssökande som genomfört icke-kognitiva test på mobil (n=7.743) eller icke- mobil (n=929.341) enhet som en del av ansökningsprocess. Jämförde användnings, mät likvärdighet & potentiella utfallsskillnader mellan mobila & icke-mobila enheter vid en oövervakad icke-kognitiv testsituation. 1% av sökande använde mobilenhet vid genomförandet av testsituation. Faktoranalys indikerar på likvärdighet mellan medium, användande av mobil & icke-mobil enhet visade inga signifikanta skillnader i testpoäng eller mellan demografiska grupper. King et al. 2015 253 amerikanska universitets studenter (77% kvinnor, 29% etniska minoriteter, M=ålder 24, 49% hade anställning) deltog frivilligt mot extra kurspoäng. Deltagare genomförde, i upprepade mätningar (dator/mobil) övervakade testsituation av bl.a. kundorientering, kognitivförmåga & SJT för att undersöka om likvärdighet i måtten över medium fanns. Likvärdighet fanns för SJT men inte för kognitivförmåga. Indikationer på relation både mellan ångest & prestation & reaktioner till mobilt testande. Mer positiva reaktioner till testande på dator än testande på mobil enhet. Morelli et al. 2014 608.518 (24192 mobil) arbetssökande inom besöksnäringen genomförde oövervakade testsituationer av kognitivförmåga, biodata, multimedia arbetssimulering & SJT som en del av en urvalsprocess. Med multipel faktoranalys undersöktes likvärdigheten i testsituationen över medium för kognitivförmåga, biodata, multimedia arbetssimulation & SJT. Likvärdighet över medium förefaller finnas för alla testsituationer, men mobil användares medelvärden var en 1/2 Sd lägre på SJT jämfört med icke mobil användare. 9 Tabell 2 forts. Mobila enheters inverkan på testpoäng 2(2) Ref Urval Sanchez & Totalt 77 universitets studenter deltog i två Branaghan 2011 studier (S1=34, S2=33) i utbyte mot kurspoäng. Sanchez & Goolsbee 2010 39 universitets studenter (M ålder = 19, Kvinnor 56%) deltog i utbyte mot kurspoäng. Beskrivning Undersöker om deltagares förmåga att komma ihåg & resonera kring information som meddelats via enheter m. små skärmar försämras. Ospan simultantest användes för att undersöka arbetsminne. Resultat Försämrad förmåga att resonera i jämförelse med när stora skärmar används, genom att ändra till ett optimerat läge försvinner detta problem. Optimering verkar framför allt gynna de med låg arbetsminneskapacitet, då de dessa verkar ha problem med inlärning vid scrollande. Deltagare läste ett flertal texter på stor eller liten skärm. Storlek på text manipulerades för att undersöka hur möjligheten att minnas text påverkas av skärmstorlek & textstorlek. OSpan simultantest användes för att undersöka arbetsminne. Textstorlek ökade behovet att scrolla på små skärmar, vilket påverkade förmågan att komma ihåg text negativt. 10 Metod Design Studien använde sig av en inom individsdesign med upprepade mätningar, där deltagare genomförde två kognitiva test två gånger, ena gången på mobil enhet och ena gången på icke-mobil enhet. Deltagare slumpades till vilken enhet (mobil/ickemobil enhet) de skulle börja med när så var möjligt och användes för att kontrollera för ordnings- och inlärningseffekter. I ett försök att kontrollera för kontextuella aspekter som skulle kunna förklara skillnader i resultat skapades en statisk kontext. Testen genomfördes inomhus, utan distraktion eller interaktion men med potentiell påverkan av tidsaspekt, då deltagande skede under skol- arbetstid (Lee et al., 2005). För att motivera deltagare till att prestera sitt bästa erbjöds deltagare att få ta del av sitt resultat. Alla deltagare genomförde testen under övervakning, på egenmedhavd dator, smarttelefon/läsplatta. På detta sätt försöktes testsituationen göras så likvärdig och jämförbar som möjligt. Deltagare 60 (55 % kvinnor, M ålder = 26.2) personer anmälde sig frivilligt till studien, varav 51 personer genomförde båda testtillfällena. Av de 9 som inte deltog vid båda tillfällen var 6 från gruppen som genomförde testen på mobil enhet först och 3 var från gruppen som genomförde testen på icke-mobil-enhet först. Deltagare var studenter vid Stockholms universitets psykologiska institution, anställda vid en HR-avdelning (Org. 1) samt kontorsanställda vid ett detaljhandelsföretag (Org. 2). Studenter som deltog vid båda testtillfällena fick i utbytte mot sitt deltagande en timmes UD-tid (kurskrav vid institutionen). Övriga deltagare erbjöds fikabröd eller en lott för sitt deltagande. Deltagare som deltog vid båda testtillfällen fick en individuell resultatrapport av resultat från begåvningstesten som gjorde på icke-mobil enhet. Ingen muntlig återkoppling gavs av testresultatet då det inte handlade om att ta beslut med vägledning av testpoängen. Procedur Studenturval Studenterna (n=38) i studien rekryterades på plats vid psykologiska institutionen, via riktade mail med psykologiska institutionen som avsändare samt olika nät-forum där studenter vid psykologiska institutionen är närvarande. Alla föranmälda deltagare slumpades till att antingen börja med MT eller DT (19 deltagare slumpades inte). Varje deltagare informerades via mail vilken enhet de skulle ta med sig till sitt första testtillfälle samt om var och när de skulle infinna sig. På plats i givet klassrum, administrerades en web-länk till testen där ytterligare instruktioner för genomförandet fanns att tillgå. Vid inloggandet uppmanades deltagare att lämna information om kön, födelseår, land, utbildningsnivå, yrkeserfarenhet, för- och efter namn samt e-post. Deltagarnas e-post användes för att matcha respektive deltagares första och andra tillfälle och var tillsammans med namn de enda obligatoriska uppgifterna. Här informerades också deltagarna om att deras medverkan var frivillig samt att deras uppgifter behandlas i enlighet med personuppgiftslagen. Deltagare informerades även muntligen om att deras medverkan var frivillig samt att de när som helst kunde avbryta sitt deltagande. Vid varje tillfälle genomförde deltagarna två test (Slst & Smt). Vid starten av varje test fick deltagarna information om hur testet skulle genomföras (instruktioner för Smt-testet var på mobil enhet endast tillgängligt på engelska) samt möjligheten till att pröva testet innan det började på riktigt för att 11 förstå hur det fungerade. Deltagarna uppmanades att inte tala med varandra eller att surfa runt och uppmuntrades till att göra sitt bästa. Samma procedur upprepades vid det andra tillfället, som ägde rum ca (sju dagar) efter det första tillfället. Deltagare som inte redan hade bokat in ett andra tillfälle, blev efter testtillfället inbokade för nytt tillfälle. Alla deltagarna blev också efter testtillfället informerade om tid, plats samt vilken enhet de skulle ha med sig till nästa tillfälle, även ett påminnelse mail med denna information gick ut till deltagarna. Efter deltagarnas andra testtillfälle utdelades UD-tid (1 timme) till de studenter som ville ha det. Procedur Urval Anställda Deltagarna (n=13) rekryterades genom personliga kontakter inom respektive organisation, som i sin tur informerade och uppmuntrade anställda till att delta. I avskilda lokaler hos respektive organisation, på utsatt tid kom intresserade för att delta. Efter att deltagarna blivit slumpade till vilken enhet de skulle börja med administrerades en web-länk till test och instruktioner (som beskrivet tidigare). Tid för ett andra tillfälle bestämdes med personlig kontakt inom varje organisation som i sin tur informerade deltagarna. Pga. tekniska problem slumpades ingen av deltagarna i org. 2, där alla började med mobil enhet. För studenturvalet tillämpades tidsbokning samt möjlighet till drop-in, detta medförde att det för deltagarna i detta urval kunde komma in deltagare i rummet medan test utfördes. För samtliga deltagare gällde att när de genomfört testen och loggat ut från testsidan var de fri att resa på sig och lämna lokalen. Mått De två mått för att mäta kognitiv förmåga som används i studien är utvecklade av företaget cut-e. Båda testen är web-anpassade och konstruerade på ett sätt som gör det möjligt att administrera testen utan att ha en testadministratör närvarande. Båda testen är oberoende av specifik hårdvara vilket betyder att testen anpassar sig till det gränssnitt (storlek & upplösning på skärm) deltagaren använder sig av. Anpassningen gör att effekter av olika hårdvara eller internetuppkoppling undviks. Scales lst (Slst) Adaptivt test tänkt att mäta deduktiv slutledningsförmåga. Uppgiften i testet är att, under 6 min. bestämma och placera en av de givna symbolerna i den ruta som är märkt med ett frågetecken (bild 1.). Vid varje administration genereras ett individuellt test. Testet består av sex svårighetsnivåer vilka justeras adaptivt efter korrekt eller felaktigt svar. Lst korrelerar .48 p < .001 med den avancerade varianten (APM) av Ravens Progressive Matrices. α = .89 (Split-half, Spearman-Brown corrected). 12 Bild 1. Mobil & Icke-Mobil version av Slst Not.* Mobilversion till höger. Scales mt (Smt) Testet är tänkt att mäta förmågan att utföra flera uppgifter samtidigt. Uppgiften bestod i att under 5 minuters tid utföra tre stycken uppgifter simultant. 1. Avgöra åt vilket håll en pil pekar, 2. Avgöra om en matematisk uträkning är korrekt eller inte, 3. Avgöra om en serie med 7 siffror innehåller dubbletter eller inte (bild 2.). Varje uppgift hade lika stor påverkan på resultatet. Korrelationen för Smt med andra test inom Scales-serien är: E3 (koncentration) .32 p < .01, cls (logiskt resonerande) .21 p < .05. α = .91 (Split-half, Spearman-Brown corrected), α = .81 (re-test). Bild 2. Mobil & Icke-Mobil version av Smt Not.* Mobilversion till höger i bild. Resultat Hypoteserna prövades med parat t-test. Inga signifikanta skillnader fanns mellan testpoäng från mobil respektive icke-mobil enhet. Respektive test uppvisade 13 signifikant korrelation mellan de olika enheterna. Tabell 3 redovisar N, medelvärden, standardavvikelse och interkorrelation för respektive test och enhet. Hypotes 1a: Lägre testpoäng förväntas på det kognitiva testet Slst i en testsituation då mobil enhet används jämfört med när en icke-mobil enhet används. Det parade t-test (poäng icke-mobil, poäng mobil) som utfördes visade inte på någon signifikant skillnad i testpoäng för de olika enheterna t50 = .54, 95 % CI [-2.41, 4.17] p > .05. Hypotes 1b: Lägre testpoäng förväntas på det kognitiva testet Smt i en testsituation då mobil enhet används jämfört med när en icke-mobil enhet används. Det parade t-test som (poäng icke-mobil, poäng mobil) utfördes visade inte på någon signifikant skillnad i testpoäng för de olika enheterna t50 = .44, 95 % [-.95, 1.48] p > .05. Tabell 3 Medelvärde, standardavvikelse, korrelation Icke-Mobil Mobil Test N M SD N M SD r Slst 51 50.92 11.10 51 50.04 10.34 .41* Smt Not. * p < .005. 51 52.32 4.44 51 52.05 5.46 .63* Figur 1. Boxplot med Median & Konfidensintervall fördelat per test & enhet Kompletterande analys Då det varit problem med slumpandet av deltagarna till respektive enhet under datainsamlingen utfördes variansanalys med upprepade mätningar som kompletterande analys för att undersöka om det fanns skillnader mellan de två 14 grupperna. Resultat från kompletterande variansanalysen visade att deltagare som använde en icke-mobil enhet vid tillfälle ett (T1) presterade (oberoende av enhet eller tillfälle) bättre än den grupp med deltagare som använde en mobil enhet vid T1 (F(1,49) = 7.918, p < .01). Effekt av grupp samt ökning i medelvärde över tid (inlärningseffekt) illustreras i figur 2. Övergripande deskriptiv statistik (medelvärde, standardavvikelse & konfidensintervall) för respektive grupp fördelat per test och enhet vid T1 och T2 redovisas i tabell 4. Fig. 2 Gruppeffekt & Inlärningseffekt per grupp 56 Icke-Mobil M=55.04 55 Mobil 54 53 M=52.44 52 M=51.37 51 50 49 M=48.82 48 T1 T2 Not. M = Total testpoäng (Slst, Smt), enhet vid T1 & T2 skiljer sig för grupperna. Tabell 4. Deskriptiv statistik Slst & Smt Grupp (N) Mobil (32) Enhet & Tid Mobil T1 Test SD 95% CI Nedre Övre Slst 47.01 1.71 43.58 50.44 Icke-Mobil T2 Slst 49.81 1.96 45.86 53.76 Mobil T1 Smt 50.63 0.88 48.85 52.40 Icke-Mobil T2 Smt 52.92 0.70 51.51 54.33 50.09 1.31 Total Grupp Icke-Mobil (19) M Icke-Mobil T1 Slst 52.79 2.55 47.67 57.92 Mobil T2 Slst 55.15 2.21 50.71 59.60 Icke-Mobil T1 Smt 52.08 0.91 50.25 53.91 Mobil T2 Smt 54.92 1.14 52.62 57.22 Total Grupp 53.74 1.70 TOTAL (51) 51.91 .81 50.23 53.55 15 Diskussion Syftet med studien var att undersöka om användandet av en mobil enhet vid genomförande av kognitiva test påverkar testresultat i en negativ riktning. Studien redovisar även resultat för gruppeffekt och inlärningseffekt. Resultaten i studien visar på att mobila enheter inte påverkar testresultat negativt. Att det finns en skillnad i prestation mellan grupperna (mobil respektive icke-mobil enhet), där gruppen ickemobil överlag presterar bättre. Prestationen förbättras över tid för respektive grupp. Ingen skillnad i resultat mellan MT & DT kunde uppvisas. Antagandet var att testresultat skulle försämras när en mobil enhet användes på grund av mindre skärm, annorlunda inmatningsmetod och högre krav på motorisk färdighet. Att denna studie till skillnad från tidigare forskning t.ex. Arthur et al. (2014); King et al. (2015) och Morelli et al. (2014) inte uppvisade ett sådant resultat skulle kunna förklaras med att testen i denna studie har varit figurala. I tidigare studier har de kognitiva testen varit textbaserade. Detta skulle kunna ha betydelse då det är möjligt att textbaserade test i större utsträckning påverkas av skärmstorleken på sådant sätt att typsnitt blir mindre, vilket i sig påverkar läshastighet och effektivitet. Ett mindre typsnitt till följd av mindre skärm skulle också kunna leda till mer scrollande något som i sig är den vanligaste förekommande förklaringen till försämrad prestation på mobila enheter (Potosky, 2008). Scrollande har inte varit nödvändigt, vare sig på dator- eller mobilversion av testen in denna studie, då testen varit väl designade och optimerade till varje enhet. Avsaknaden av att behöva scrolla för att genomföra testen kan ha bidragit till att prestation över enheter är bibehållen. Väl optimerade test gynnar framförallt individer med lägre arbetsminneskapacitet (Sanchez & Branaghan, 2011), vilka i denna studie i sådana fall inte bör ha presterat sämre och därmed inte heller påverkat resultat på mobilversionen av testen negativt. Ytterligare förklaring till de, från tidigare forskning, avvikande resultaten skulle kunna vara att testen i denna studie från början är utvecklade för mobila enheter, detta är relevant då forskning och teori menar att ett mått riskerar att förändras när de överförs mellan medium (Schroeders & Wilhelm, 2010). En effekt som i denna studie i sådana fall skulle utebli. Att resultaten i denna studie skiljer sig från tidigare forskning kan även tänkas bero på att testen i denna studie är figurala, medan tidigare forskning framförallt fokuserat på textbaserade kognitiva test. Effekten av grupptillhörighet, som variansanalysen visar på, är förvånande och något svårtolkad. En förklaring är att fördelningen av deltagare till respektive grupp är skev. Detta beror på att det inte var möjligt att slumpa alla deltagare. Grupperna är små Mobil T1 (n=32), Icke-Mobil T1 (n=19), vilket potentiellt skulle kunna göra att några få individer inom en grupp ger stor effekt inom den gruppen. Det kan alltså både vara som så att några få individer i Mobil-gruppen underpresterar och sänker den gruppens medelvärde, men det kan också vara så att några individer i gruppen Icke-Mobil presterar väldigt högt och höjer då den gruppens medelvärde. Då det i studien saknas ytterligare variabler (t.ex. utbildningsnivå, vana med teknik) för att försöka på individuellnivå förklara vad skillnaden kan bero på ges nedan förslag på yttre och kontextuella distraktioner som kan ha påverkat. Gruppen Mobil har en högre andel icke slumpade deltagare. Framför allt så började alla deltagare (n=10) från Org.2 med mobil enhet. Det testtillfället var det tillfälle med flest deltagare vid ett och samma tillfälle, vilket gjorde att deltagare satt närmare 16 varandra, och det var fler tillfällen då deltagare som var klara rest sig för att lämna rummet än vid något annat testtillfälle, vilket enligt Lee et al. (2005) kan ses som källor till distraktion. Detta tillfälle föregicks också av ett tekniskt problem vilket gjorde att försök med att nå testsidan behövde startas om. Det var ingen som påbörjat själva testen, men avbrottet kan i sig ha gett upphov till frustration över teknik, något som kan påverka resultatet negativt då känslotillstånd påverkar beteende hos användare av olika internet tjänster (Bies et al., 1997; Potosky, 2008; Spector & Fox, 2002). Deltagarna förbättrade sina resultat över tid oberoende av vilken enhet de använde vid T2. En effekt som är väntad vid upprepade mätningar då det första tillfället fungerar som ett tillfälle för lärande (Carrier & Pashler, 1992). Att inlärningseffekten finns över tid för båda grupper skulle kunna användas som argument för att det inte finns någon negativ inverkan på testresultat av mobila enheter då gruppen Icke-Mobil i annat fall borde försämrats sin prestation vid T2. För att kunna kontrollera för inlärningseffekt skulle det behövas en design där deltagarna genomförde varje testsituation två gånger på respektive enhet, dvs. re-test sker inom respektive enhet. Coursaris, Hassanein, Head, och Bontis (2012) har visat på att distraktioner i form av ljud- och synintryck samt rörelse har negativ inverkan på hur effektivt och noggrant uppgifter utförs på mobil enhet. Detta är distraktioner som bör leda till ett sämre resultat vid MT i jämförelse med DT. I studien försöktes den typen av yttre distraktioner konstant hållas och bör där med inte ha någon påverkan i denna studie. Vad som inte kontrollerades för var förekomsten av inkommande samtal och/eller pop-upp notiser (sms, mail, applikationer, m.m.) under testsituationen. Något som borde upplevas som en distraktion i form av ljud- och synintryck. Det är tänkbart att distraktioner av den typen är mer frekvent förekommande för MT än DT då det kan vara så att användandet av pop-upp notiser är mer vanligt förekommande på mobila enheter än icke-mobila enheter. Oavsett om så är fallet eller inte, är det tänkbart att inkommande pop-notiser upplevs som mer störande vid MT än DT då den tar upp en större del av skärmutrymmet. Utöver yttre kontextuella distraktioner är det här är aspekter som organisationer bör ha i åtanke vid en möjlig implementering av MT i en rekryterings- och urvalsprocess. Potentiella begränsningar Urvalet till denna studie är litet och bestod främst av psykologistudenter vid Stockholms universitet. Detta är inte representativt för en global population, vad det gäller användandet av mobila enheter. Sverige är ett av de länder i världen där användandet av mobila enheter är som störst, speciellt i den åldersgrupp som urvalet till stor del består utav (Findahl, 2015). Det är möjligt att individer som lever där användandet av mobila enheter inte är lika utbrett, skulle prestera sämre. De skulle även kunna ha mer negativa attityder till MT på grund av lägre vana med mobila enheter. Lägre vana skulle även kunna vara sant för en äldre del av populationen, då dessa (i dagsläget) inte heller använder mobila enheter i lika stor utsträckning som yngre (Findahl, 2015). Som redan beskrivits fanns det problem med slumpandet av deltagare, vilket kan ha varit avgörande för utfallet, även om det endast går att spekulera på vilket sätt det har påverkat resultatet är det en begränsning för de slutsatser som görs utifrån resultatet. Studien undersöker heller inte möjliga underliggande variabler (kön, ålder, utbildningsnivå) som enligt Leeson (2006) skulle kunna ha påverkat resultat i studien. 17 Deltagare i studien är inte arbetssökande, vilket gör att de möjligen inte är lika motiverade till att prestera, eller bekymrade över hur en mobil enhet påverkar deras möjlighet till att prestera som de kanske skulle vara i en riktig urvalsprocess. Det skulle kunna ha en inverkan på resultat och testpoäng. Motivationen till att prestera skull dessutom kunna variera mellan tillfällena på grund av stressande tids aspekt, eller varierande vilja att använda de olika enheterna. Likvärdighet över medium för testen som använts i studien har inte analyserats. Detta kan vara ett problem för studiens upplägg och analys då likvärdighet i mått över medium är nödvändig för att jämförelse av testresultat från olika enheter ska vara möjlig (Vandenberg & Lance, 2000). Allmän diskussion Att mobilt testande ligger i tiden, är inte så konstigt med tanke på den senaste tidens kraftiga utveckling och användande av mobila enheter (Findahl, 2015). Mobilt testande ger som beskrivet en del tänkbara fördelar men dras även med en del problem (än så länge). Den fördel som enligt min uppfattning är av störst betydelse för att fortsätta driva utvecklingen av MT framåt är att det öppnar upp för individer som idag på grund av tekniska och/eller ekonomiska skäl står utanför arbetsmarknaden (Arthur et al., 2014). Testande av individuella differenser som urvalsmetod växer, vilket är bra, men om det på grund av hur det distribueras stänger ute vissa grupper av människor motverkas en av anledningarna till att test används, nämligen att de är objektiv bedömningar som minimerar risken för diskriminering i rekryteringsprocesser. MT kan ju inte i sig lösa alla de problem som finns kring diskriminering vid urval, men har ändå potentialen att förbättra förutsättningarna. På andra sidan av samma mynt finns det stora problemet med att utföra test, i vart fall kognitiva test, med mobila enheter. Det verkar nämligen ge upphov till försämrad prestation och lägre testpoäng (King et al., 2015; Morelli et al., 2014), även om den här studien är ett ljus i tunneln. Om då de grupper som kanske skulle gynnas mest av att organisationer erbjuder att genomföra rekryteringsprocesser på mobila enheter i slutändan ändå skulle missgynnas på grund av att de använder sig av MT är vi tillbaka på ruta ett i den frågan. Problemet med att det finns differenser mellan enheter kommer säkert reda ut sig. Men så länge det finns organisationer och oseriösa aktörer inom testindustrin som tror sig kunna dra nytta av nya och uppkommande urvalsmetoder som t.ex. MT är det ett problem. Framför allt för de kandidater som kan komma att missgynnas, men även för den organisation som inte får den bäst lämpade kandidaten, och för testindustrin i stort. De problem, oavsett om det gäller testpoängs differenser, likvärdighet i mått eller kontextuella problem som MT idag står framför kommer de behöva lösas. För det kommer inte vara möjligt att inte låta kandidater använda mobila enheter med tanke på dess spridning och användning i samhället. För att komma till rätt med problem kring likvärdighet är kanske lösningen inte att överföra ”gamla” test till nya enheter, utan utveckla test anpassade för de nya enheterna. Mobila enheter erbjuder ju här en del spännande tekniska fördelar över icke-mobila enheter, som t.ex. möjligheten till Virtual Reality (VR), vilket skulle kunna skapa intressanta sätt för arbetssimulering. Kontexten kan ju ge upphov till distraktioner (Lee et al., 2005), men den mobila enheten ger ju möjlighet att med geografisk positionering avgöra om en kontext för testande är godkänd eller inte. 18 Utöver andra tekniska möjligheter, är användnings området av mobila enheter långt mycket större än vad det är för icke-mobila enheter. Med appar som håller koll på vår hälsa, hur vi sover, var vi är, vad vi äter, vad vi gillar, ogillar, köp- och resebeteenden för att nämna en liten del. All data som mobila enheter kan samla in om en individ kan i sin sammanslagna form kallas för Big Data. Ett område som är omtvistat, av integritetsskäl. Den här typen av information används idag framför allt till marknadsföring, där reklam riktas specifikt till mig utifrån mina beteenden på internet. Ett test i en testsituation ger bara en ögonblicksbild av personen som testas (kognitiva förmåga är dock relativt stabilt över tid), just där just då. Testresultat och testpoäng påverkas också av olika fel varianser (t.ex. det medium test administreras med). Om analyser kunde göras på all den information som mobila enheter har möjligheten att samla in skulle vi kanske kunna få en mycket mer heltäckande och korrekt bild av en person, då det går att se vad en person faktiskt har gjort istället för att förlita sig på individers egna beskrivningar om vad de gjort. Big Data skulle kunna ge upphov till att prediktioner om beteenden sker utifrån faktiskt observerat beteende istället utifrån teorier om beteende. Det här är en intressant aspekt med mobila enheter och MT, men rymmer så klart en stor diskussion om integritet, vad som bör och inte bör mätas samt vem som äger informationen som samlas in. Innan organisationer väljer att implementera MT i sin rekryterings- och urvalsprocesser bör det läggs mer forskning kring kandidatupplevelsen av MT, både vad det gäller viljan till och uppfattning om att använda MT i rekryteringsprocesser för att säkerställa att upplevelsen av en rekryteringsprocess upplevs som effektiv och rättvis. Sammanfattning Resultaten tyder på att användandet av mobila enheter när en genomför figurala kognitiva test inte påverkar resultat negativt. Det finns en effekt av grupp, där de som börjat använda icke-mobil enhet, överlag presterar bättre. En effekt som troligen beror på problem med slumpande till grupperna. Oavsett grupp eller enhet som används vid T2 har prestationen förbättrats i jämförelse med T1, något som bör förstås som en inlärningseffekt mellan tillfällena, och kan vara till stöd för en tolkning av att användandet av mobila enheter inte ger upphov till skillnad i testpoäng. Referens AERA, APA, & NCME. (2014). Standards for educational and psychological testing. American Educational Research Association. Arthur, W., Doverspike, D., Muñoz, G. J., Taylor, J. E., & Carr, A. E. (2014). The Use of Mobile Devices in High-stakes Remotely Delivered Assessments and Testing. International Journal of Selection and Assessment, 22(2), 113–123. Arthur, W., Glaze, R. M., Villado, A. J., & Taylor, J. E. (2010). The Magnitude and Extent of Cheating and Response Distortion Effects on Unproctored Internet-Based Tests of Cognitive Ability and Personality. International Journal of Selection and Assessment, 18(1). Bies, R. J., Tripp, T. M., & Kramer, R. M. (1997). At the breaking point: Cognitive and social dynamics of revenge in organizations. In R. A. Giacalone & J. Greenberg (Eds.), Antisocial behavior in organizations (pp. 18–36). Sage Publications. Binning, J. F., & Barrett, G. V. (1989). Validity of personnel decisions: A conceptual analysis of the inferential and evidential bases. Journal of Applied Psychology, 74(3), 478–494. Bridgeman, B., Lennon, M. Lou, & Jackenthal, A. (2003). Effects of Screen Size, Screen Resolution, and Display Rate on Computer-Based Test Performance. Applied Measurement in Education, 16(3), 191–205. 19 Carrier, M., & Pashler, H. (1992). The influence of retrieval on retention. Memory & Cognition, 20(6), 633–642. Chernyshenko, O. S., & Stark, S. (2015). Mobile Psychological Assessment, 206–216. Chou, W. S., Hunt, Y. M., Beckjord, E. B., Moser, R. P., & Hesse, B. W. (2009). Social media use in the United States: implications for health communication. Journal of Medical Internet Research, 11(4), e48. Coursaris, C. K., Hassanein, K., Head, M. M., & Bontis, N. (2012). The impact of distractions on the usability and intention to use mobile devices for wireless data services. Computers in Human Behavior, 28(4), 1439–1449. Cronbach, L. J., & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin, 52(4), 281–302. Dholakia, R. R., & Dholakia, N. (2004). Mobility and markets: Emerging outlines of m-commerce. Journal of Business Research, 57(12 SPEC.ISS.), 1391–1396. Findahl, O. (2015). Svenskarna och Internet 2015. .Se, 67. Fluckinger, C. D., Dudley, N. M., & Seeds, M. (2014). Incremental Validity of Interactive Multimedia Simulations in Two Organizations. International Journal of Selection and Assessment, 22(1), 108–112. Fursman, M., & Tuzinski, A. (2015). Reactions to Mobile Testing From the Perspective of Job Applicants. Gallagher, A., Bridgeman, B., & Cahalan, C. (2002). The Effect of Computer-Based Tests on RacialEthnic and Gender Groups. Journal of Educational Measurement, 39(2), 133–47. 47 Hausknecht, J., Day, D. V, & Thomas, S. C. (2004). Applicant Reactions To Selection Procedures : an Updated Model and Meta-Analysis, 20. Horn, J. L., & McArdle, J. J. (1992). A practical and theoretical guide to measurement invariance in aging research. Experimental Aging Research, 18(3-4), 117–144. Huff, K. C. (2015). The comparison of mobile devices to computers for web-based assessments. Computers in Human Behavior, 49, 208–212. Illingworth, A. J., Morelli, N. A., Scott, J. C., & Boyd, S. L. (2014). Internet-Based, Unproctored Assessments on Mobile and Non-Mobile Devices: Usage, Measurement Equivalence, and Outcomes. Journal of Business and Psychology. ISO 10667. (2013). Svensk standard ss-iso 12107:2012. Kantrowitz, T. M. (2014). 2014 Global Assessment Trends Report. CEB. Retrieved from https://www.cebglobal.com/shl/images/uploads/GATR-042014-UKeng.pdf. Kende, M. (2015). Internet Society Global Internet Report 2015. King, D. D., Ryan, A. M., Kantrowitz, T., Grelle, D., & Dainis, A. (2015). Mobile Internet Testing: An analysis of equivalence, individual differences, and reactions. International Journal of Selection and Assessment, 23(4), 382–394. Klein, R., Dilchert, S., Ones, D., & Dages, K. (2015). Cognitive Predictors and Age-Based Adverse Impact Among Business Executives. J Appl Psychol, 100(5), 1497–1510. Kontos, E. Z., Emmons, K. M., Puleo, E., & Viswanath, K. (2010). Communication inequalities and public health implications of adult social networking site use in the United States. Journal of Health Communication, 15 Suppl 3, 216–35. Lahey, Z. (2014). Mobile Talent Acquisition: Adjusting to the Times. Lee, I., Kim, J., & Kim, J. (2005). Use contexts for the mobile internet: a longitudinal study monitoring actual use of mobile internet services. International Journal of Human-Computer …, 18(3), 269– 292. Leeson, H. V. (2006). The Mode Effect: A Literature Review of Human and Technological Issues in Computerized Testing. International Journal of Testing, 6(1), 1–24. Mead, A. D., & Drasgow, F. (1993). Equivalence of computerized and paper-and-pencil cognitive ability tests: A meta-analysis. Psychological Bulletin, 114(3), 449–458. Morelli, N. A., Mahan, R. P., & Illingworth, A. J. (2014). Establishing the Measurement Equivalence of Online Selection Assessments Delivered on Mobile versus Nonmobile Devices. International Journal of Selection and Assessment, 22(2), 124–138. Ones, D. S., Dilchert, S., Viswesvaran, C., & Salagado, J. F. (2010). Handbook of Employee Selection. (J. L. Farr & N. T. Tippins, Eds.). New York: Routledge Taylor and Francis Group. Overton, R. C., Taylor, L. R., Zickar, M. J., & Harms, H. J. (1996). The Pen-Based Computers as an Alternative Platform for Test Administration. Personnel Psychology, 49, 455–464. Paek, P. (2005). Recent Trends in Comparability Studies, (August), 1–34. Retrieved from http://www.pearsonassessments.com/NR/rdonlyres/5FC04F5A-E79D-45FE-848407AACAE2DA75/0/TrendsCompStudies_rr0505.pdf 20 Pearlman, K. (2009). Unproctored Internet testing: Practical, legal, and ethical concerns. Industrial and Organizational Psychology, 2(1), 14–19. Ployhart, R. E., & Holtz, B. C. (2008). The diversity-validity dilemma: Strategies for reducing racioethnic and sex subgroup differences and adverse impact in selection. Personnel Psychology, 61(1), 153–172. Potosky, D. (2008). A Conceptual Framework for the Role of the Administration Medium in the Personnel Assessment Process. Accademy of Management Review, 33(3), 629–648. Powers, D. E., & O’Neill, K. (1993). Inexperienced and anxious computer users: Coping with a computer-administered test of academic skills. Educational Assessment. Lawrence Erlbaum. Sanchez, C. A., & Branaghan, R. J. (2011). Turning to learn: Screen orientation and reasoning with small devices. Computers in Human Behavior, 27(2), 793–797. Sanchez, C. A., & Goolsbee, J. Z. (2010). Character size and reading to remember from small displays. Computers and Education, 55(3), 1056–1062. Schmidt, F. L., & Hunter, J. E. (1998). The Validity and Utility of Selection Methods in Personnel Psychology: Practical and Theoretical Implications of 85 Years of Research Findings. Psychological Bulletin, 124(2), 262–274. Schroeders, U., & Wilhelm, O. (2010). Testing reasoning ability with handheld computers, notebooks, and paper and pencil. European Journal of Psychological Assessment, 26(4), 284–292. Sjöberg, S. (2014). Utilizing research in the practice of personnel selection: General mental ability, personality, and job performance. Stockholm University, Sweden. Retrieved from http://www.diva-portal.org/smash/record.jsf?pid=diva2:706092 Spearman, C. (1904). “ General Intelligence ,” Objectively Determined and Measured. The American Journal of Psychology, 15(2), 201–292. Spector, P., & Fox, S. (2002). An emotion-centered model of voluntary work behavior: Some parallels between counterproductive work behavior and organizational citizenship behavior. Human Resource Management Review, 12, 269–292. Steenkamp, Jan-Benedict; Baumgartner, H. (1998). Copyright © 1998. All rights reserved. Journal of Consumer Research, 25(June), 78–90. Templer, K. J., & Lange, S. R. (2008). Internet testing: Equivalence between proctored lab and unproctored field conditions. Computers in Human Behavior, 24(3), 1216–1228. Tippins, N. T. (2009). Where Is the Unproctored Internet Testing Train Headed Now? Industrial and Organizational Psychology, 2(1), 69–76. Tippins, N. T. (2011). Overview of Technology-Enhanced Assessment of Talent. In N. T. Tippins & S. Adler (Eds.), Technology-Enhanced Assessment of Talent (pp. 1–18). John Wiley & Sons, Inc. Toquam, J. L., Corpe, V. A., Dunnette, M. D., Rumsey, M. G., & Simutis, Z. M. (1991). Literature Review : Cognitive Abilities- Theory , History , and Validity. Vandenberg, R. J., & Lance, C. E. (2000). A review and synthesis of the measurement invariance literature: Suggestions, practices, and recommendations for organizational research. Organizational Research Methods, 3(1), 4–70. Viswesvaran, C., & Ones, D. S. (2000). Perspectives on Models of Job Performance. International Journal of Selection and Assessment, 8(4), 216–226. Wästlund, E., Norlander, T., & Archer, T. (2008). The effect of page layout on mental workload: A dual-task experiment. Computers in Human Behavior, 24(3), 1229–1245. Zhang, H., P, & Feinzig, S. (2016). Looking for Top Talent ? Move to Mobile Recruiting. Ziefle, M. (1998). Effects of display resolution on visual performance. Human Factors, 40(4), 554– 568.
© Copyright 2024