Ett kompendium om grundläggande teorier och tekniker kring ämnet digital grafik Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Index 1 Lagring av digital media 1 1.1 Bitar och Bytes 1.2ASCII 1.3Enhetsbeteckningar 1 2 4 2 Digital grafik 5 2.1Pixlar 5 2.2Upplösning 5 2.3 Skärmdumpar (Screen shots)6 2.4 Bildskärmar och uppdateringsfrekvenser 6 2.5 Bildförhållanden och synfält 7 2.6 Pixelarea 7 2.7 Pixel- och punktdensitet (PPI och DPI) 8 3Färg 3.1 Ögats uppfattning 3.2 Additiv färgblandning (RGB) 3.3Sub-pixlar 3.4 Subtraktiv färgblandning (CMYK) 3.5Färgdjup 4Bildteknik 16 16 17 18 18 19 21 4.1Lager 21 4.2Bitmap 22 4.3 Vektorer 22 4.4 Rendering 25 4.5Pivotpunkter 27 4.6Transformeringar 28 4.7Transparens 30 4.8 Alpha värden 30 4.9 Maskning och friläggning 31 4.10 Aliasing och Anti-Aliasing 32 4.11 Aliasing och Anti-Aliasing - Fördjupning 34 4.12Bildformat (work in progress)35 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 1 Lagring av digital media Nedan följer en kort och förenklad text om bitar och Bytes. Texten ämnar ge en snabb inblick kring begrepp som kommer att förekomma senare i kompendiumet. 1.1 Bitar och Bytes I ett binärt (digitalt) system hanteras data i sin minsta beståndsdel i form av bits, eller bitar på svenska. En bits uppgift är att hålla reda på ett av två lägen, oftast beskrivna som ”1” eller ”0”, “på” eller ”av”. I bilden till höger kan ni se en reprensentation av en bits olika tillstånd. Genom att sätta ihop flera bitar, så att de hamnar i följd efter varandra, kan dessa bitar läsas som en s.k. bitsträng. Vilket tillstånd de individuella bitarna har i strängen utgör vad hela strängen har i värde. Bitsträngars värden kan i sin tur nyttjas av en datorer för att utfärda olika instruktioner. Om man t ex. kombinerar två bits i en sekvens kan man totalt producera fyra möjliga värden: ”00”, ”01”, ”10” och ”11”. Man kan se det som fyra olika koder som ett system, beroende på ändamål, kan nyttja till utfärda olika saker. Exempel på användningsområde följer. Exempel 1 - Att räkna decimalt med binära system Då datorsystem baseras på bitkoder, som gärna blir långa och komplexa vid mer avancerade instruktioner, har man funnit värde i att standardisera vissa koder så att de lättare kan användas av användare. En sådan standard, dvs. ett sätt att tolka bitkoder, är vid vid räkneskap av det decimala talsystemet. Se nedan. Vi börjar med att räkna från talet “noll”. I detta fall räcker det med att man har en bit, då en bit kan utgöra ett av två värden: (0 eller 1). En binär “0” motsvarar noll decimalt och således är “1” binärt ett decimalt. Om man vill räkna till två eller mer, då får man kombinera flera bitar i sekvens. Genom att t ex. kombinera två bitar kan man fortsätta räkna upp till tre. I detta fall skulle talet två bli “10” binärt och talet tre skulle då bli “11”. Fortsättningsvis skulle talet fyra kräva tre bitar och det skulle få bitsträngskoden “100“. Se tabellen til höger för fler exempel. Binärt 0 1 10 11 100 ... 1111 1110 1111 1111 Decimalt värde Bitar i sekvens 0 1 2 3 4 ... 254 255 1 1 2 2 3 ... 8 8 För lättare hantering av flera bits brukar man kombinera bitsekvenser i strängar om 8bits för att skapa en s.k. ”Byte”. En byte ger oss möjligheten att hålla reda på 256 olika värden. Fler exempel och förklaringar följer. Trivia: bit står för binary digit. 1 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Exempel 2: I bilden nedan har man slagit samman åtta stycken bitar för att bilda Byte-strängen ”0110 0001”, detta motsvarar i decimal talform talet “97”. Notera att talet behöver minst sju bitar, då sju bitar kan rymma upp till 128 möjliga olika värden (0 till 127). Sex bitar skulle i kontrast inte räcka till, då det endast håller reda på 64 möjliga värden. Antal bits i sekvens: Antal möjliga kombinationer: 1.2 ASCII ASCII är en teckenkodstandard som nyttjas för att skapa bokstäver och andra tecken. Detta fungerar genom att ASCII mappar (tolkar) olika bitsträngar till bokstäver och andra tecken. ASCII nyttjar 7st bits (128 olika värden) i enlighet med en tidig Amerikansk teckenkods-standard. Då andra länder behövt fler olika tecken har andra variationer av ASCII uppkommit, som t.ex. en svensk ASCIIstandard på 7bit där vi bl.a. inkluderar ”å”, ”ä” och ”ö”. Det finns även många andra teckenkods-standarder som t.ex. UTF-8 (åtta-bitars Unicode transformationsformat) eller UTF-16. Unicode är designad för att försöka binda ihop alla världsliga språk under en teckenkodning och med UTF-16 har man med 16bits möjlighet att lagra upp till 65’536 olika värden/tecken. Vad som är viktigt att notera är att de sju första biten i UTF-standarden mappar exakt mot ASCII-standarden. Det vill säga att en text som är skriven i ASCII kan läsas av UTF. Olika system stödjer olika teckenkodstandarder, men genom att de flesta system idag hanterar multipla teckenkodsstandarder kan en text som är skriven på en PC med windows visas upp på en MAC eller mobiltelefon mm. Detta förutsätter dock att rätt teckenkodning finns inom systemet och är vald vid uppvisningstillfället. Trivia: ASCII står för American Standard Code for Information Interchange. I de flesta systemsammanhang, kan en Byte refereras till som ”ett tecken”. Förenklat sätt, menar man på att det är den ungefärliga lagringsplatsen som ett specifikt tecken tar upp. Om man säger att en byte motsvarar ett tecken, då skulle en megabyte motsvara en miljon tecken. 2 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Exempel 3: När vi trycker ned tangenten “a” (lilla a) på tangentbordet, skickas instruktioner till datorn om vilken bokstav som blivit vald. Detta är möjligt genom att de olika tangenterna skickar signaler, som via ett operativsystem, mappas för bla. ASCIIs teckenkodning. Den valda tangenten, blir i ASCII bokstaven “a”, vilket i binär form, blir strängen ”0110 0001”. Skulle man läsa samma sträng i decimal form får man talet ”97”. binär bitsträng (8 bits) Med ASCII tolkas bitsträngen till vänster som ett “a“. a Notera att bilden och exemplet är en förenkling av en mer omfattande process. Observera! ASCII inte mappar 0-9 på samma vis som vid vanlig decimal inläsning. Siffran “tre” i ASCII har bitsträngen “00110011”, skulle man läsa samma bitsträng decimalt skulle man få ut talet “51”. I korthet. Olika digitala system läser bitsträngar som koder. Dessa kan, beroende på hur ett system är designat, tolkas av datorer, mobiltelefoner eller andra digitala enheter för att utfärda olika saker. 3 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 1.3 Enhetsbeteckningar Nedan följer en tabell på några dataenheters mått och storlek. Enhet bit byte kilobyte megabyte gigabyte terabyte beteckning b B kB MB GB TB Värde 1b 1B 1024B 10242B 10243B 10244B Exakt värde 1b (innehåller värdet 1 eller 0) 1B (8bits) 1 024B 1 048 576B 1 073 741 824B 1 099 511 627 776B Trivia: SI enheterna ”kilo”, ”mega”, ”giga” etc. stämmer inte in exakt för den digitala användningen av enheterna. ”kilo” betyder värdet ”1000” men en ”kilobyte” har värdet ”1024” (bytes). I detta fall har man valt att göra ett undantag. Andra standarder, som ”IEC 60027” (IEC, International Electronical Commisions) har angivelsen ”Ki” (kibi) för värdet ”1024”, ”Mi” (mebi) för värdet ”10242” och Gi (gibi) med värdet ”10243” etc. Detta medför att IEC 60027 är mer korrekt men SI vinner fortfarande i popularitet. Enligt en prognos från det stora nätverksföretaget “Cisco” (1 jun, 2011) kommer den globala Internettraffiken nå upp till ca en zettabyte per år, år 2015. CISCO, “Entering the Zettabyte Era” Hämtat från http://www.cisco.com/en/US/solutions/collateral/ns341/ns525/ns537/ns705/ns827/ VNI_Hyperconnectivity_WP.1 Åtkomst 6 augusti 2012 En zettabyte har ett värde av 1021, vilket betyder 1’000’000’000’000’000’000’000 bytes eller tusen, miljoner, miljoner, miljoner tecken. I en annan kontext skulle denna mängd information motsvara ca 4,7 miljarder kopior av hela Blu-Ray “HD-extended versionen av Sagan om Ringen triologin” som ligger på ca 212,5GB, utan extra material. 4 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 2 Digital grafik 2.1 Pixlar För att kunna rita ut en bild på en bildskärm, nyttjar dagens datorsystem en teknik där tätt intilliggande fyrkantiga punkter “pixlar” täcker upp ett två-dimensionellt plan (en bildskärmyta). Genom att manipulera färgen hos varje enskild pixel kan man via denna teknik bilda olika enkla mönster och/ eller rita ut komplexa bilder som t ex. fotografier. I huvudsak kan man definera detaljrikedom i en bild efter, antalet pixlar som gör upp bilden samt vilket färgdjup som pixlarna nyttjar. En vanlig bildskärm ritar ut pixlar genom att tillsätta ljus vid varje pixelposition. Vid fullt ljus utgör pixelns färg vitt, avsaknad av ljus gör pixel svart. Skärmar utgår således från svart som grund, dvs. avsaknad av ljus enligt en s.k. additiv färgmodell (se avsnitt 3.2 för mer information om hur man tillsätter färg per pixel). I en enkel bildfil kan två särskilda värden tas i beaktning. 1: Varje pixels position på bildskärmsytan. 2: Varje pixels individuella färgnyans. Lagring av denna information nyttjar en egen bitsträngs-tolkning som är förklarad för systemet via data i en bildfil. Vid uppläsning av en given bildfil behöver systemet i fråga kunna ha stöd för att läsa upp filen, vilket i vanligast fall görs av något bildläsningsprogram installerat på operativsystemet. Pixlars enhetsbetäckning anges enligt följande: PX, 1000px = tusen pixlar. 2.2 Upplösning Inom datorgrafik definieras upplösning som ett mått för att mäta detaljrikedom. Med detaljrikedom menas det antal pixlar som nyttjas på ett givet område. Det finns flera enhetsbegrepp för att definera upplösning. En vanlig måttangivelse för upplösning anges enligt: bildens bredd (W för width) följt av bildens höjd (H för Height) definerat i pixlar. Ett alternativt sätt att utrycka W och H är genom att ange X och Y. I kommande avsnitt anges flera exempel på olika upplösningsstandarder. Trivia: Man kan fråga sig varför olika upplösningar har så ”konstiga” mått. Som t.ex. 1024x768 som kan tyckas, kunde varit ”1000x700” för lättare ihågkommande. Men precis som med lagring av digital media hanteras data i binära system bäst (i det här fallet som 1024 och 768) då det är en multipel av talbasen 2. 1024 är densamma som 210 och 768 är 3/4 av 1024 vilket ger en upplösning som är anpassad efter ett 4:3 förhållande (se bildförhållande för mer information). De flesta upplösningsstandarder har definerats av VESA som står för “Video Electronics Standards Assocition”. VESA är en interationell standardform för datorgrafik som grundades 1989 av flera stora grafikkortstillverkare. 5 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 2.3 Skärmdumpar (Screen shots) När en användare t ex. nyttjar ett användargränssnitt som windows eller MAC OS, kan den visuella presentationen av gränssnittet fylla upp en bildyta med ett flertal olika grafiska objekt. Den bild som en användare ser vid ett givet tillfälle på en bildskärm, utrycks som skärmdump eller skärmbild (screen shot, ENG). En skärmdump kan ses som ett fotografi, taget vid ett specifikt tillfälle. När grafik skickas från en dator till en bildskärm, skickas den i form av en bild. Oavsett hur mycket olika grafiska objekt en skärmdump innehåller, hanteras denna bild, när den skickas till en uppvisningsenhet som en sammansatt bild. 2.4 Bildskärmar och uppdateringsfrekvenser När en uppvisningsenhet som t ex. en bildskärm tar emot en bild, kommer enheten att uppdatera bilden ett antal gånger per tidsenhet, detta mått utrycks som uppdateringsfrekvens. Uppdateringen möjliggör att ett innehåll kan förändras över tid och denna föränderlighet är en avgörande grundfaktor för att visa upp rörlig media samt interaktivitet bland digitala system. Bland tidiga TV-apparater, nyttjade dessa en elektronrörs-teknik (katodstrålrör) för att visa upp bild. Begränsningar med tekniken medförde att TV-apparaters uppdateringsfrekvenser behövde anpassas till elnätens uppdateringsfrekvenser. I Europa Innebar det att TVn behövde anpassa sig till en uppdateringsfrekvens på 50Hz medan det i t ex. USA innebar en frekvens på 60Hz. Hz eller Hertz är ett mått som utrycker ett antal händelser per sekund. När en bild skickas från en dator till en bildskärm, kommer bildskärmen, om den är inställd på 50hz, att uppdatera bilden 50 gånger per sekund. För att uppnå föränderlighet i bilden måste en ny bild/ skärmdump, med förändring i bilden, skickas ut till bildskärmen. Genom att skicka ut förändringar i bildmaterialet över tid kan illusionen om rörlighet uppnås. För TV-sändningar inom de olika regionerna (50Hz och 60Hz), standardiserades sändningen efter deras uppdateringsfrekvenser. Enligt den Europiska TV-sändnings-standarden PAL, sändes TV med 25 bilder per sekund medan det i USA sändes efter standarden NTSC som ligger på ca. 30 bilder per sekund. Generellt sätt har PALsändningar med sina färre antal bilder per sekund, högre upplösning än NTSC sändningar. PAL- sändningar sänds generellt med 576 s.k. linjers upplösning medan NTSC sände runt 480 linjer. Varje linje motsvarar ett enhetsmått där man enbart räknar den vertikala upplösningen. Istället för att räkna bredden gånger höjden, utrycker man breddens upplösning uttryckt som en linje och höjden avgör hur många horisontella linjer det finns vertikalt. Enhetsbegreppet för att utrycka ett antal-bilder-per-sekund är: “fps” (frames per second, Eng). bland 3D-applikationer används fps ofta som en måttangivelse för prestanda. se avsnitt 4.4 Rendering, för mer information. Trivia: Utvecklingen av de äldre uppdateringsstandarderna överträffas idag med andra frekvenser som 100hz, 120hz eller flera hundra Hertz. Även bildmaterial från t ex. datorer och andra sändningar börjar pressa det antal bilder per sekund som sänds ut till våra bildskärmar. 6 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 2.5 Bildförhållanden och synfält Då vi normalt ser mer i sidled än vad vi gör i höjdled anpassas bildskärmar och således bildmaterial efter detta fenomen. Vårt synfält sträcker sig till ca. 180° i bredd och ca. 100° i höjdled. Bland tidiga bildförhållandestandarder nyttjades ett s.k. ”4:3” förhållande. Vilket betyder att: om en bild var ”4” enheter bred så var den också ”3” enheter hög. Nyare standarder eftersträvar att vara mer ergonomiskt anpassade efter vårt synfält. För bildskärmar, TVn och projektorer blir det mer vanligt att dessa enheter anpassas efter 16:9 standarden. Mobila enheter kan däremot tendera att ha många olika typer av upplösningar och bildförhållanden och således avviker de ibland från 16:9 standarden. Användningsområdet som en uppvisningsenhet har tenderar att påverka dess funktionella utseende. Med mobila enheter, skilt från många stationära uppvisningsenheter, kan andra ergonomiska faktorer spela roll för enhets bildskärm. Saker som interaktion direkt mot bildskärmen, att den får plats i en byxficka, hur en enhet sitter i handen, kan alla påverka enhetens funktionella utseende och således bildförhållandet på enheten. 2.6 Pixelarea Pixelarea är ett enhetsbegrepp där man förenklat upplösning till ett värde. Skillt från utrycket “bredden gånger höjden” har man med pixelarea räknat ut vad resultatet av “bredden gånger höjden” blir. Bland enheter som t ex. digitalkameror uppkommer ofta angivelsen MegaPixels “MP“ (miljoner pixlar). Detta är ett enhetsmått som anger den totala mängden pixlar som förekommer i en bild, i detta fall utryckt i formen, antal miljoner pixlar. Pixelarea: PA = W x H Trivia: Angivelsen MP kan ses som extra praktisk bland digitalkameror då upplösningar tenderar att överstiga miljoner pixlar. Ett värde (MP), kan upplevas som lättare att minnas och således vara lättare att marknadsföra istället för att ange bredd x höjd i långa sifferföljder. Exempel: 1920x1080 eller 2MP. 7 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 2.7 Pixel- och punktdensitet (PPI och DPI) Om man anger en upplösning endast via en bredd gånger en höjd i pixlar, kan man inte veta hur stora pixlarna är mätta med fysiska mått. En pixel på en skärm kan vid ett sammanhang ha storleken en kvadratmillimeter och vid ett annat vara minst dubbelt så stor. Detta skulle ske om man t ex. hade en upplösning på två olika stora skärmar. Ett alternativt sätt att utrycka upplösning är att utrycka antalet pixlar som får plats på en bestämd yta. Se nedan. PPI Pixels Per Inch, ”pixlar per tum” på svenska, används primärt vid angivelse av pixeldensitet för digitala bilddokument, bildskärmar, mobila enheter och projektorer m.m. Att ha högre PPI innebär att man har högre upplösning, dvs. fler pixlar, på en specifik yta. Fler pixlar på en yta betyder alltså att pixlarnas fysiska storlek minskar. En tum motsvarar 2.54cm. Ett relevant exempel för att beskriva användningsområdet för PPI kan vara mellan olika mobila enheter. Nyare versioner av en mobiltelefonserie kan många gånger öka upplösningen men ändå behålla samma storlek på skärmen. Detta medför att den senare modellen får högre PPI. Nedan följer några exempel på skillnaden mellan hög och låg PPI. I bilderna kan vi se flera, lika “fysiskt“ stora, bilder på ett motiv som gradvist ökar i upplösning. Varje bild får således fler pixlar per yta dvs. högre PPI. 16x16px 32x32px 64x64px 128x128px 256x256px 512x512px Triva: Det har skett försök till att omvandla pixlar-per-tum standarden till/ efter SI-enheter dvs. pixlar-percentimeter men detta har ännu inte blivit någon utspridd standardisering. 8 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Att beräkna fram PPI Nedan följer ett vanligt förekommande och relativt nogrant räknesätt för att få fram ett PPIvärde. För att ta reda på en bildskärms PPI, behöver man först ta reda på två primära punkter: 1) Uppvisningsenhetens upplösning. 2) Uppvisningsenhetens storlek, dvs. den fysiska storleken på enhetens bildyta. För att kunna genomföra uträkningen behöver vi först ta fram två stycken s.k. diagonala värden för vardera punkt. När man har båda dessa “diagonala“-värden kan man dela dessa med varandra för att få fram PPIn. Storleken på en bildskärms bildyta definieras oftast via dess diagonala längd angivet i tum, “di“ (diagonal inches). Exempel: Med en 40“s skärm, (fyrtio tums skärm), menas att den är 40” räknat från ett hörn i en diagonal linje över till nästa hörn. Detta ger oss ett värde som uppfyller punkt 2 (se ovan). Om vi vet storleken på en skärm kvarstår det att räkna ut vad den diagonala värdet i pixlar är för en upplösning. Detta kan enkelt göras genom att utnyttja Pythagoras sats. En detaljerad beskrivning följer nedan. På nästa sida kan ni se exempel på hur man löser hela uppgiften. Pythagoras sats Pythagoras sats dikterar att kvadraten av kateterna har lika stor area som kvadraten av hypotenusan (se bild nedan). Med tanke på att en kvadrat alltid har lika stora sidor medför detta att om man mäter längden på en av hypotenusans kvadrats sidor motsvarar den, den diagonala linje som vi behöver för att uträtta punkt 1 (se ovan). Formeln: Vi börjar med att multiplicerat bredden med bredden och sedan adderar vi det med höjden multiplicerat med höjden. Dra sedan roten ur det utvunna värdet och detta kommer att ge oss det önskade enskilda värdet (hypotenusan). Area 3 = Area 1 + 2 Man kan nyttja denna formel för att få fram värden till båda punkterna (se ovan). Däremot kräver det att vi vet bredden och höjden per punkt, oavsett om det är pixlar eller tum. Area 1 Area 2 9 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Exempel: Om vi har en bildskärm som är 24” och den har upplösningen 1080p, dvs. 1920x1080, vad blir då PPIn? Uträkning ser ut så här: (19202 + 10802) √ = ger oss ett enskilt upplösningsvärde, 2202. Man kan också utrycka den i text på följande vis: Bredden “1920” gånger bredden “1920” plus höjden “1080” gånger höjden “1080“. Dra sedan roten ur det värdet och ni får fram det diagonala upplösningsvärdet 2202. Fortsättning: Då vi redan har ett enskilt fysiskt storleksvärde, dvs. 24” kan vi direkt dela detta med det diagonala upplösningsvärdet. 2202 delat i 24 och resultatet blir 91,75. Man kan säga att bildskärmen har en upplösning på ca 92PPI. Alternativa räknesätt: Det finns flera sätta att räkna ut PPI. Ett alternativt, mer förenklat sätt, är att direkt dela den fysiska bredden med upplösningsbredden och genom detta få ut ett PPIvärde. Exempel: upplösningensbredd 1920 delat med bildskärmens bredd 21” = ~91 (21” motsvarar den ungifärliga bredden på en 24”s bildskärm). Detta förutsätter dock att bildskärmen kör en upplösningsstandard som nyttjar kvadratiskt formade pixlar. Om du t ex. nyttjar en upplösning där bildförhållandet inte stämmer överens med bildförhållandet för bildskärmen kommer pixlarna på bildskärmen inte vara kvadratiska och därmed kommer inte PPIvärdet stämma. Formler: Pythagoras sats: X = √ (W2 + H2) Pixels Per Inch (PPI): Dela det diagonala värdet för pixlar med det diagonala värdet för en bildytas storlek. Antal cm i en tum: 2,54 10 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Nedan följer några olika upplösningsstandarder som är anpassade för webb och bildskärmar. Exempel: baserat på 15”s bildskärm. Upplösning 640x480 800x600 1024x768 1280x720 1920x1080 Bildförhållande 4:3 4:3 4:3 16:9 16:9 Pixelarea (MP) ~0.3 0.48 0.78 ~0.92 ~2.07 PPI ~53 ~67 ~85 ~98 ~147 Pixelarea (MP) ~0.3 0.48 0.78 ~0.92 ~2.07 PPI ~33 ~42 ~53 ~61 ~92 Exempel: baserat på en 24”s bildskärm. Upplösning 640x480 800x600 1024x768 1280x720 1920x1080 Bildförhållande 4:3 4:3 4:3 16:9 16:9 Trivia: 1280x720 är en s.k. HD-Ready standardupplösning och 1920x1080 är Full-HD standardupplösning. Det kan lätt bli oergonomiskt (för litet) att läsa texter när man har hög PPI. Av den anledningen kan det vara lämpligt att anpassa PPIn i t ex. ett operativsystem, så att den bättre matchar PPIn som bildskärmen kör. Detta betyder att operativsystemet lägger till fler pixlar, så att kompenserar för den mindre storleken av varje pixel. Fonter får således fler pixlar på skärmen men detta ändrar inte fontstorleken vid utskrifter. Med andra ord är en fontstorlek på 12punkter alltid lika stor vid utskrift oberoende av vad du har för inställning i t ex. windows. En vanligt förekommande storleksinställning för text och ikoner är 96 PPI. Om du t ex. kör 130 PPI på en bildskärm betyder det att den fysiska storleken på fonter och ikoner utgör ca: 73,8% mot vad de är designade för. 11 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 DPI Dots Per Inch, eller ”punkter per tum”, används för att beskriva upplösning vid utskrifter. Varje DPI-punkt har en egen färg och genom att kombinera flera punkter tätt intill varandra kan sammansättningen av dessa punkter representera pixlar i ett dokument. DPI-punkter kan ses som en typ av sub-pixlar (se avsnitt 3.3 sub-pixlar). Förhållandet mellan PPI och DPI är således inte 1:1 då det ofta, beroende på utskriftsteknik mm., behövs fler punkter för att korrekt representera varje given pixel. Det finns ett flertal faktorer som styr kvalitén vid utskrift. Nedan följer ett par exempel på saker som kan styra kvalitén. Hur hög DPI respektive PPI man behöver beror, i ergonomiska avseenden, primärt på hur pass nära man vill stå från det utskrivna materialet. En standardiserad upplösning är 300PPI/dokument, denna upplösning har ansetts fungera som en s.k. fotorealistisk standard. Detta mått överträffas idag av kameror, skrivare och scanners. Trotts detta designas vissa större affischer med lägre PPI. Detta fungerar just för att betraktningsavstånden för stora affischer ofta är längre bort än vid mindre utskrifter. Lägre upplösningar ställer även färre krav på materialet som t ex. storlek på bildfil, vilket fortfarande kan vara en tung prestandakrävande faktor för många datormiljöer idag. Användandet av fler punkter, dvs ökad DPIvärde, ökar även färgåtergivningen och således kvaliten på utskriften, detta sker dock upp till en gräns. Flera andra aspekter som t ex. papperskvalite spelar också roll för kvaliten. Normalt är en vanlig bläckstråleskrivare utrustad med minst fyra unika färger i bläck enligt tryckstandarden CMYK som står för: Cyan, Magenta, Yellow (gul) och Key-Color (svart) och det är genom att man blanda dessa färger tätt intill varandra som illusionen av flera färgnyanser uppnås. (se avsnitt 3.4 subtraktiv färgblandning för mer information). Olika papperstyper har olika kvalitativa egenskaper. Allt papper har inte tillräckligt bra yta för att korrekt återge den önskade kvalitén från höga DPI-utskrifter. Det kan också vara så att visst papper är särskilt anpassat till bläckstråleskrivare medan annat är anpassat för laserskrivare. Kvalitetsbenämningen på olika papperstyper brukar defineras i dels, namn på papperstyp och i, vikt per blad. Nedan följer några kända och vanligt förekommande papperstyper: • Vanligt kontorspapper Billigast av följande alternativen, det är ett tunnare, lättare i vikt, typ av papper. Utskrift kan ske på båda sidor av pappret. Detta papper klarar generellt av att korrekt återge upp till 300dpi. • Inkjet papper Ett relativt tunt papper som har finare fiberdensitet än föregående papper och är således bättre på att återge färger). Pappret har en specifik sida för utskrift. Pappret klarar generellt över 600dpi. • Fotopapper Ett tjockare typ av papper som finns med både glatt och matt utförande, denna papperstyp är generellt bäst på att återge färger. Pappret har en specifik sida för utskrift. Detta papper klarar generellt över 600dpi. 12 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Triva: Det förekommer ofta felaktiga utryck i och utanför branchen, där det sägs att ett dokument är på 300DPI istället för 300PPI. I realitet behöver inte mycket tanke läggas på vad skrivaren klarar för upplösning då de flesta skrivare idag, klarar av att återge dokument som är inställda på 300PPI. I ett fyrfärgssystem (CMYK) är utblandningen av färger begränsat när man vill eftersträva stort spektrum av olika färgnyanser. Detta har således lett till att olika printertillverkare utvecklat skrivare med fler färgpatroner utöver de fyra standardfärger som finns normalt. Högre DPI förbrukar mer färg vid utskrift. Det kan med andra ord ibland bli billigare att köpa papper med högre kvalité. Finare papper kan även öka kvalitén rejält. Fortsättning DPI, Tryck Vid tillfällen då man vill arbeta med tryck, dvs. utskrifter av digitalt material, behöver man ta hänsyn till olika aspekter för att uppnå ett optimalt resultat. Med optimalt resultat menas att man med ett dokument, uppnår vissa ergonomiska beprövade standarder. Dokumentets PPI, utskriftens DPI, val av papper, färgmättnad och ljusvärden i dokumentet mm. är alla faktorer som kan påverka utskriftskvalitén. Det kan vara svårt att veta exakt vad man ska tänka på per given situation. I Sverige finns dock organisationer som t ex. TU (Tidningsutgivarna), de är ett förbund som samlat ihop kunskap och erfarenhet från flera utgivare av olika slag. De har slagit samman sina erfaranheter och skapat dokument och böcker som innehåller fakta och tips kring tryckstandarder som är relevanta i Sverige. Fördelaktikligen är mycket av materialet gratis. Triva: När man jobbar mot tryckerier som sysslar med t ex. tidningstryck kan andra upplösningsmått komma på tal, som t ex. LPI (Lines per inch) dvs. linjer per tum på svenska. Normalt brukar man vilja eftersträva 1.5 till 2 gånger högre PPIvärde än LPIvärde för att få ut ett önskvärt resultat. Nyare standarder som t ex. DPCM eller LPCM, dvs. centimeter enhet istället för tum, eftersträvar att ersätta DPI och LPI men användningen av tum-angivelse är fortfarande ledande som standard. Bland skrivare är det inte helt ovanligt att det de kör med två olika DPIvärden. Nämligen ett DPIvärde för bredden och ett för höjden. Detta är dock ingenting som direkt behöver påverka eller märkas av, av användaren. 13 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Att beräkna fram PPI inför utskrift: Antag att vi vill skriva ut en bild som är tagen med en specifik upplösning och att vi vill skriva ut bilden på ett A4- samt ett A3papper. I nedanstående exempel tar vi reda på hur hög PPI vi får ut, per utskrift. Vi börjar med att ta reda på alla relevanta mått: Bilddokument: Bredd: 3456px Höjd: 2304px Pixelarea: ~8MP Liggande A4: Bredd: 29,7cm (~11.693”) (~7.795”) Höjd: 21,0cm Liggande A3: Bredd: 42,0cm (~16.535”) (~11.024”) Höjd: 29,7cm Fortsättningsvis nyttjar vi formeln som vi använde vid uträkning av PPI (se avsnitt: Att beräkna fram PPI). Genom att ta papprets dimensioner kan vi ta reda på vad det enskilda diagonala värdet av pappret är (hypotenusan för pappret). Därefter kan vi dela detta med det enskilda värdet som vi tar fram från upplösningen av bilddokumentet. Bild: √ ( 34562 + 23042) = 4153.595 dp (Antal pixlar på diagonala längden) A4: √ ( 11.6932 + 7.7952) = 14.0530 di (Antal tum på diagonala längden) A3: √ ( 16.5352 + 11.0242) = 19.8729 di (Antal tum på diagonala längden) A4: 4153px (dp) / 14” (di) = ~296.64Svar A4: ca: 297 PPI A3: 4153px (dp) / 20” (di) = ~207.65 Svar A3: ca: 208 PPI Resultat: En utskrift med en upplösning på ca. 8MP motsvarar nästan en hel A4 i fotokvalite (dvs. 300PPI) medan en utskrift med samma dokumentstorlek i A3storlek skulle ge en utrskrift på ca. 200PPI. Notera att den lägre upplösningen kan vara försumbar då den ökade storleken i A3 också lättare möjligör att betraktar kan stå på ett längre avstånd från utskriften. Trivia: Upplösningsmåttet är hämtat från systemkameran “Canon EOS 350D (~8MP)”. 14 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Nedan kan ni se ett några olika mått på pappersstandarder baserat för fotokvalitativa utskrifter. Exempel: Ett stående dokument i 300PPI. Pappersstorlek A6 A5 A4 A3 A2 A1 A0 Bredd papper (mm) 105 148 210 297 420 594 841 Höjd papper (mm) 148 210 297 420 594 841 1189 Bredd (pixlar) 1240 1748 2480 3508 4961 7016 9933 Höjd (pixlar) 1748 2480 3508 4961 7016 9933 14043 Trivia: Notera att det gärna blir väldigt höga upplösningar vid större storlekar på pappret när man kör 300PPI. I detta fall kan lägre PPI vara föredraget då det möjligen inte behöver vara fotokvalité på en sådan utskrift. Avståndet och användningsområdet är faktorer som man får ta i beräkning. Tänk också på att en arbetsfil i 300PPI och A0 storlek kan med ev. multipla lager och andra effekter bli extra tung att hantera. Genom att sänka DPIn på en utsrkift och istället höja kvalitén på papperstyp kan man spara in på färgförbrukning. Detta kan bli billigare samt ge bättre resultat i längden. Detta är dock något som måste optimeras fram vid utskriftstillfället och bör göras olika från fall till fall. 15 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 3 Färg 3.1 Ögats uppfattning Våra ögon uppfattar färg genom att tolka olika våglängder av ljus. Ljus som projiceras från solen, lampor och andra källor kan producera olika våglängder av ljus. Vanligtvis uppfattar ett mänskligt öga våglängder mellan 400nm till 700nm (detta refreras till som synligt ljus) och vi uppfattar dessa våglängder genom våra ögon via två olika typer av synreceptorer: Stavar: Ljuskänsliga pigment som möjligör uppfattning av svagt ljus (mörkerseende). Stavar har dock dålig synskärpa, dvs. att de är dåliga på att uppfatta detaljrikedom vilket är anledningen till att de inte kan urskilja mellan olika färger. Detta medför att vi har svårt att uppfatta färger i mörker. Tappar: Vi har tre olika typer av synceller som ger oss vårt färgseende. Färger uppfattas genom att de tre typerna reagerar på olika våglängder av ljus, huvudsakligen: lång (560 - 580 nm), mellan (530 - 540 nm) och kort (420 - 440nm). Dessa våglängder kan även refereras till färgerna Röd (lång), Grön (mellan) och Blå (kort) och de kallas primärfärger. Nedan kan ni se en tabell på hur våra ögon uppfattar olika våglängder av ljus. Högre frekvenser leder till bland annat Infrarött ljus och i det lägre spektrummet finner vi ultravioletta frekvenser. Allt utanför nedanstående spektrum betraktas som ej synligt ljus. Färg Infraröd (utanför synfältet) Våglängd (ljus) ~ 3000 - 700 nm* Röd ~ 700 - 635 nm Orange Gul Grön Blå Violet Ultraviolett (utanför synfältet) ~ 635 - 590 nm ~ 590 - 560 nm ~ 560 - 490 nm ~ 490 - 450 nm ~ 450 - 400 nm ~ 400 - 10 nm* Trivia: Det uppskattas att ett mänskligt öga kan uppfatta runt tio miljoner olika färgnyanser vilket våra digitala system och enheter har anpassats efter. Vid fel hos någon av tapptyperna bildas olika typer av färgblindhet. De olika våglängderna av ljus som uppfattas av våra tappar (kort, mellan och lång) skrivs i engelskan ut som S M L (Short, Medium and Long). 16 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 3.2 Additiv färgblandning (RGB) Enligt den trikromatiska färgteorin tolkar våra ögon färger genom att våra olika tappar stimuleras till olika grader. Stimulans av samtliga tre ljustyper (röd, grön och blå) uppfattas av våra hjärnor som vitt medan ingen stimulans uppfattas som svart. När tapparna stimuleras olika uppfattar vi olika nyanser av färger. Den additiva färgblandningsmodellen RGB (Red, Green, Blue) är särskilt anpassad efter den trikromatiska färgteorin. I enlighet med teorin utgår RGB-modellen från tre olika färgkanaler (en per primärfärg). Vid ingen styrka i någon av färgkanalerna syns svart medan full styrka på samtliga kanaler producerar vitt. Bilden nedan föreställer en grafisk reprensentation av RGBmodellen. Röd (Full styrka) Full styrka i samtliga färgkanaler: Vitt Ingen styrka i någon färgkanal: Svart Blå (Full styrka) Grön (Full styrka) RGB används främst vid hantering av digitala bilder eller vid projektion av bilder via elektroniska enheter som t ex. datorskärmar, tvn etc. Faktorer som påverkar hur vi uppfattar en bild (exkludera subjektiva värderingar), styrs av information i bildfilen, uppvisningsprogrammet och bildskärmen. Det finns ingen direkt definitiv säkerhet vid uppvisning av grafik mellan olika enheter. Olika bildskärmar producerar RGBskalan med varierande kvalité. Det finns flera olika standarder och s.k. färgprofiler på RGB, bla. “adobe RGB” eller den vanligare och bredare standarden “sRGB“ som står för “standard Red Green Blue”. Färgstandarden sRGB är anpassad efter normal kontors- och hemanvändning. Angivelse av färgprofil kan ställas in på dokument eller vid utmatningsenhet, som t ex. bildskärm eller genom en skrivare. 17 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 3.3 Sub-pixlar Inom datorgrafik är pixlar ofta ansedda som den minsta relevanta beståndsdelen för att rita ut grafik mot bildskärmar. Det finns dock i vissa fall, beroende på teknik, en bakomliggande teknik för att producera färger på pixlar. Varje pixel som projiceras mot t ex. en bildskärm är i sin tur uppdelad i tre stycken s.k. sub-pixlar i färgerna röd, grön och blå, detta i enlighet med den trikromatiska färgteorin. Då dessa sub-pixlar sitter tätt ihop, uppfattar våra ögon, kombinationen av dessa tre sub-pixlar till en pixel med en färgnyans i enlighet med den additiva färgmodell RGB. Trivia: Det finns olika tekniker för att producera sub-pixlar. Olika bildvisningsenheter kan således ha olika mönster på sina sub-pixlar. Bildexemplet är designat efter en LCD-skärm. 3.4 Subtraktiv färgblandning (CMYK) Subtraktiv färgblandning används främst vid hantering av utskrifter. Då färgen i en utskrift består av små punkter av färgpigment som inte avger något ljus, måste ljus från en annan källa träffa utskriften innan ljuset kan studsa (reflektera) rätt färg till våra ögon. Detta till skillnad från en bildskärm där varje pixel avger ljus som direkt kan uppfattas av våra ögon. Detta medför att CMYK och RGB får något motsatta egenskaper. I motsatts till RGB utgår CMYKs färgmodell utifrån vitt som grundfärg (tänk papper) och genom att applicera färg kan man nå mörkare toner. CMYK står för: Cyan, Magenta, Yellow (Gul) och Key-Color (Nyckelfärg = Svart). Som en subtraktiv färgmodell utgår CMYKs primära färger från RGBs sekundära färger, se nedan: CMYK- Cyan är en blandning av RGB-blå och RGB-grön. CMYK- Magenta är en blandning av RGB-blå och RGB-röd. CMYK- Yellow är en blandning av RGB-Grön och RGB-röd. Se CMYK-modellen på nästa sida. 18 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Nedan kan ni se en grafisk reprensentation av CMYK-modellen. Det finns tydliga kvalitétsskillnader mellan RGB och CMYK. RGB-standarden har bla. ett mycket högre färgspektrum än CMYK-standarden (se 3.5 färgdjup). Detta sker pga. skillnader mellan teknikerna. Notera att Röd, Grön och Blå inte har samma färgnyanser som de har i RGB-modellen på sidan 17. Blå (CMYK) Cyan (100%) Key Color (100%) Magenta (100%) Grön (CMYK) Yellow (100%) Röd (CMYK) Trivia: CMYKs färgvärden anges i procent till skillnad från RGB som ofta anges i värden som korrelerar med bitvärden. 3.5 Färgdjup I tidigare kapitel (Kap:1.1) nämner vi hur en byte (8bits) kan innehålla 256 olika värden. Inom digitala färgsammanhang kan en sådan värdestyp hanteras som antal färgnyanser i en bildfil. Denna värdestyp, dvs. antal färger (blandning av färgnyanser) har benämningen färgdjup. Färgdjup har olika enhetsutryck men ett vanligt förkommande begrepp är antal färger utryckt i bits. Exempel: 8bits färgdjup innebär 256 tillgängliga färger och denna notation kan även hänvisas till som en palett med 256 olika färgnyanser. Beroende på sammanhang kan 256 färgnyanser upplevas som otillräckligt, detta är särskild tydligt när man försöker arbeta med s.k. ”fotorealistiska” bilder. Detta har att göra med att våra ögon vanligtvis kan uppfatta upp till flera miljoner färgnyanser samtidigt. Därför har man anpassat våra system till att klara mer. En vanlig standard är att man nyttjar: 8bits per färgkanal, enligt RGB-modellen, så att man får 24bits färgdjup. Detta resulterar i “16 777 216” (224) möjliga färgnyanser och det är således tillräckligt för vad våra mänskliga ögon klarar av. 19 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 RGB I bilden nedan kan ni se en visualisering av olika RGBvärden i 24bitar. Varje färgruta har en färg som korrelerar med det värde som står i rutan. Exempel: R:128 är alltså vad man får om man väljer en RGB färgen: R:128, G:0, B:0. R: G: B: R+G+B: CMYK I bilden nedan kan ni se en visualisering av olika CMYKvärden angivet i procent. C: M: Y: K: 20 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4 Bildteknik Kapitel 4. går igenom flera grundläggande begrepp, teorier och tekniker för att skapa och manipulera digital grafik. 4.1 Lager Lager är inom grafiken, en teknik som möjlighör hantering av bildmaterial så att man kan placera/ projicera den “över och under” annat bildmaterial. Bland operativsystem som nyttjar grafiska användargränssnitt, som t ex. windows eller MAC OS, kan det vid flera tillfällen uppstå olika typer av grafiska objekt som fyller upp en bildskärmsyta. Exempel: När en musmarkör ritas ut, över en skrivbordsbakgrund, behöver ett system kunna räkna ut vart musmarkören ska ritas ut. Systemet behöver med andra ord hålla isär objekten innan den kan slå de samman till en skärmdump. Musmarkören har med andra ord isolerats från bakgrunden innan den visats upp mot bildskärmen. En musmarkör i eget lager kan hanteras som ett individuellt grafiskt objekt. Bakgrunden i ett eget lager. Den sammansatta bilden blir en skärmdump som skickas till bildskärmen. Skärmdumpen innehåller en musmarkör som ritas ut över en bakgrund. I ett system som nyttjar lager behöver ett djupled defineras, dvs. ett index (en ordning) som definerar vart ett lager ska ritas ut. Indexet avgör om ett lager ska ritas ut framför eller bakom ett annat lager. Ordningen defineras via ett s.k. Z-index, vars uppgift är att hålla reda på ordningen för ala individuella objekt i en lista. Ett annat tillämpningsområde för användandet av lager är bildprogram som t ex. Photoshop, där användandet av lager kan ses som en nyckelfaktor för programmets olika användningsområden. 21 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.2 Bitmap En bitmappad bild tillhör den grafiktyp som är den vanligast förekommande inom digitala sammanhang. Det är den grafik som bygger på olika längder av pixlar som inom ett två-dimensionellt plan bildar en bild eller s.k. rastergrafik. (Se även Kap 2: Digitala grafik). En bitmappad bild har ingen fysisk storlek (förutsatt att den inte är inställd efter en specifik PPI). Bitmappad grafik lämpar sig i kontrast till vektorgrafik extra bra till att lagra komplexa motiv med mycket detaljer som t ex. fotografier. Normala tillämpningsområden kan vara: inskanning av bilder eller lagring av digitala foton, ikoner mm. Det finns flera olika typer av bildformat som lagrar bitmappad grafik. I senare avsnittet (4.12 Bildformat) kan ni läsa mer om några vanligt förekommande format. Notera att det avsnittet ännu inte är komplett. 4.3 Vektorer En vektor är en matematisk form som ritas ut via linjer kopplade till punkter. Föreställ er en kvadratisk form, denna kan delas upp i fyra hörn och fyra väggar. I en vektorreprensentation av formen skulle varje hörn vara uppbyggt av en s.k. “ankarpunkt” och väggarna skulle representeras av raka linjer mellan ankarpunkterna. Skulle man istället vilja rita ut en cirkel skulle denna form också kunna utryckas med fyra punktern, däremot skulle man behöva ersätta de raka linjerna mot krökta linjer för att skapa bågar. Bland krökta bågar finner man ytterligare en komponent s.k. “viktningspunkter, dessa anger hur mycket en linje ska vara krökt. Se bildexempel nedan. Det kan vara värt att notera att det finns flertalet olika metoder och tekniker för att hantera kurvor. Däremot kommer vi i det här dokumentet inte att gå på djupet och förklara hur de teknikerna fungerar. 22 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Fortsättning vektorer, Innehåll Innehållet i en vektorform kan fyllas upp på olika sätt. En vektor fyllas med en färg, en skiftande färgtoning (mellan två eller flera färger) eller ha ett mönster (en textur) mm. Nedan följer några exempel på olika utfyllnader i en kvadratisk form. Solid färg (rött). En färgton (grönt till blått). Ett mönster (Textur) Via användandet av särskilda verktyg/ program kan olika former skapas, bland enklare former finns cirklar, tre- och fyrkantiga former. I mer komplexa former kan flera punkter respektive linjer uppdagas för att skapa mer avancerad geometri, detta kan även kombineras med mönster och effekter. Genom att rita flera vektorformer kan man producera relativt komplexa bilder. Fördelarna med vektorer i kontrast till bitmappad grafik är bland annat att vektorer är skalbara utan kompromiss på kvalite. Däremot tappar vektorer sin effektivitet bland riktigt komplexa bilder som t ex. fotografier då detaljrikedommen i den typen av bild ofta blir väldigt hög och således optimal för vektorer. Se bildexempel på nästkommande sida. Triva: Ett vanligt förekommande tillämpningsområde för vektorer är bland logotyper som ofta har enklare former och färger. Logotyper kan även ofta vara beroende av skalbarhet för t ex. trycktillämpningar. 23 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Nedan kan ni se två bilder, den första bilden är ett fotografi taget med digital-kamera, medan den andra bilden är en vektoriserad version av första bilden. Vektorbilden innehåller många olika vektorer i enkla former och genom att kombinera många olika ytor med olika effekter, som ljussättning och skuggning kan motivet i bilden uppnå en relativt hög komplexitet. Exempel 1. Bitmappad grafik: Foto tagen i DSVs lokaler. Exempel 2. Vektor-grafik: Bilden är skapad med olik -färgade vektorer i programverktyget Photoshop. 24 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.4 Rendering En renderingsprocess är den process som beräknar fram pixeldata. I det enklaste fallet kan det handla om att rita ut en pixel i en färg, medan det i mer komplexa fall kan finnas behov av att räkna ut mer avancerade beräkningar per pixel, för att skapa mer avancerade bilder. Vid utritning av t ex. vektorer måste varje pixel som tänkt representera ytan av vektorn renderas fram. I processen inkluderas vart varje pixel ska positioneras på skärmen samt vilket RGBvärde varje given pixel ska ha. Beroende på om vektorobjektet ska ha en solid färg, en färgtoning eller om det är ett mönster som ska renderas fram, blir beräkningen olika komplex. Det finns två huvudsakliga faktorer som påverkar renderingsprocessen, användandet av s.k. effekter samt transformeringar (beskrivs mer i kommande avsnitt). Användandet av någon av dessa faktorer bidrar till ökad komplexitetsgraden i renderingsprocessen och det kräver således mer prestanda från våra datorer. Generellt sätt kräver 3D-beräkningar ofta mycket mer prestanda än 2D-beräkningar, däremot anpassas olika hårdvaror ständigt för att hantera komplexare beräkningar, särskilt inom 3D. Terminologin “Rendering” kan delas upp i två kategorier: 1) Realtids-rendering (realtime, Eng). Realtids-rendering är en metod för att beräkna fram ett antal bilder per “kort” tidsenhet. Generellt sätt använder man enhetsbegreppet fps, frames per second (bilder per sekund). Metoden appliceras gärna inom spel och andra interaktiva miljöer. Exempel: Den visuella reprensentationen av en 3D-miljö uppstår när en kamera i 3D-världen fångar upp innehållet inom dess synfält skickar den datan vidare för beräkning. När beräkningen är klar, skickas det renderade materialet i form av en skärmdump till skärmen och det är genom att upprepa denna process flera gånger per sekund, som har möjlighet att uppleva “god rörlighet” i 3D-världen. Det betyder att samtliga beräkningar som görs på en bild, inte får ta så lång tid på sig att de hämmar en ergonomiskt tilltalande upplevelse. Hur många bilder som behövs per sekund är en fråga om applikation och ibland subjektivitet. 25 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 2) För-rendering (pre-rendering, Eng). Nyttjas mycket inom filmindustrin, där särskild fokus läggs på kvalité, per varje given bild (frame). I kontrast till realtids-rendering kan för-renderingen ta flera minuter om inte timmar för att framställa en enskild bild. När en komplex och tidskrävande bild renderats klart, kan bilden sparas och sättas ihop som en bild/frame ti ll filmen. Trivia: Både spel- och filmindustrin pressar konstant gränserna för komplexa grafiska beräkningar. I en intervju med Scott Farrar (VFXs chef för filmen Transformers 3 “Dark of the Moon”) berättar han för “The hollywood Reporter“: “It took a staggering 288 hours per frame to render the Driller along with the photoreal CG building that includes all those reflections in its glass.”. Giardina, Carolyn. 2011. “Transformers: Dark of the Moon’s’ Powerful Visual Effects...” Intervju hämtad från: http://www.hollywoodreporter.com/news/transformers-dark-moons-power ful-visual-208967 Åtkomst 3 augusti 2012. Rendering, fortsättning Olika individuella effekter och transformeringar, räknas ut som olika s.k. “uppgifter” av datorn. Exempel: I en komplex renderingsprocess kan flera uppgifter stå på tur, en sådan uppgift kan t ex. vara att gradvist öka ljuset i en bild med 10%, I det fallet behöver alltså varje pixel, oavsett färg, i bilden öka 10% från sitt tidigare värde. Om vi då har en pixel som är svart och vi vill öka ljuset så att pixeln blir lite ljusare, kan följande beräkning tillämpas. Från RGB: 0,0,0 (svart) till 10% av 255 = ca. 25, dvs. RGB: 25,25,25 (mörk grått). För att digitalt producera en bild, kan flera olika renderingsprocesser nyttjats för olika delar i bilden. Den skärmdump vi ser på skärmen kan t ex. var en sammansatt bild som krävt olika typer av 2D- och 3D-beräkningar. Det är viktigt att poängtera att oavsett vad vi ser på skärmen är slutresultatet alltid i form av s.k. rastrerad grafik. Det betyder att all grafik som ritas ut på skärmen (varje given frame/bild) är rastrerad, i form av en skärmdump, vid uppvisningstillfället. 26 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.5 Pivotpunkter En pivotpunkt är en centerpunkt som är specifikt kopplat till ett objekt. Pivotpunkten har kordinater inom en rymd (t ex. bildskärmsyta) och varje objekt har kordinater som är relativa till sin pivotpunkt. I bilderna nedan kan ni se hur pivotpunkten befinner sig på olika positioner relativt till motivet. Pivotpunkten sitter i den översta vänstra kanten av det grafiska objektet. Pivotpunkten sitter i mitten av det grafiska objektet. Fortsättningsvis kan vi i bilderna nedan se hur samma motiv ritas ut på olika vis. Om vi förutsätter att motivet ritas ut efter dess pivotpunkter kommer motivet i de två nedre bilderna ritas ut på olika platser. I nästa avsnitt (4.6 Transformeringar) får ni se mer om hur man kan utnyttja pivotpunkter för att manipulera objekt på olika vis. 27 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.6 Transformeringar I enlighet med tidigare exempel (4.1 Lager) kan behovet om att manipulera olika grafiska objekt uppstå, inte minst bland interaktiva system, som t ex. vid användandet av ett grafiskt bildprogram som photoshop eller bland spel. Manipuleringar som: “förflyttning”, “rotation” och “skalning” benämns i de flesta sammanhang som olika transformeringstekniker. Det finns även andra transformeringstekniker men dessa är de vanligast förekommande. För att man ska kunna utföra någon transformering behöver minst två värden anges till transformeringen, ett startvärde och ett slutvärde. Startvärdet anger vart transformeringen ska inleda (börja) och slutvärdet anger målet. Nedan följer några exempel. Förflyttning I bilden nedan ser vi exempel på en förflyttning som sker mellan två positioner, bildskärmsytan (rymden) har upplösningen 1920x1080. Förflyttningen sker mellan startvärdet “A” och avslutas på slutvärdet “B“. Startpunkten: “A” har kordinaterna (värdet) “0, 0”. Slutpunkten: “B” har kordinater “1280, 720”. Man kan sammanfatta att transformeringshandlingen skett mellan position A “Start“ till position B “Slut“. Vid transformering av ett grafiskt objekt kopplas det objektets pivotpunkt till start- och slutpunkterna i transformeringen. Beroende på hur motivet i det grafiska objektet förhåller sig till pivotpunkten blir utritningen av transformeringen annorlunda. Pivotpunkten sitter i mitten av det grafiska objektet. Pivotpunkten sitter i den vänstra översta delen av det grafiska objektet. 28 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Rotation I bilderna nedan kan vi se hur rotation-transformeringen påverkas av att ha olika pivotpositioner på de grafiska objekten. I första bilden har objektet sin pivotpunkt i mitten av motivet, således roterar motivet runt sin egen axel, medan det, i den andra bilden så har objektet sin pivotpunkten i översta vänstra hörnet, detta medför att objektet roterar i en bredare båge. Trivia: En liknelse till sammanhanget skulle kunna hämtas från vårt solsystem. Där solen, som har en centerpunkt i mitten av solsystemet roterar efter sin egen axel medan jorden och de andra planeterna roterar en längre bit ifrån centerpunkten, vilket skapar en anorlunda rotationsaxel. Skala Precis som i tidigare transformeringsexempel visar nedanstående bilder hur transformeringen fungerar på objekt vars pivotpunkter förhåller sig olika, i detta fall ser vi två exempel på hur en skalning ökar från 100% till 200%. 29 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.7 Transparens Transparens eller “genomskinlighet“ används för att definera olika grader av synlighet på t ex. grafiska objekt. Vanligtvis hanteras transparensvärdet inom grafiska program i form av procent, där 0% betyder fullt transparent (genomskinligt) och 100% betyder att något är helt solid (fullt synligt). Allting mellan 0% och 100% defineras som s.k. semi-transparens. Texten syns delvis igenom det semi-transparenta äppellagret. 4.8 Alpha värden För att beräkna och rita ut transparenta respektive solida pixlar behövs metadata (extra information) som anger hur pass transparent eller solid som en pixel ska vara. Som i fallet vid utritning av vanlig grafik ritas även transparensvärden i bilder på en “per pixelnivå”. I standarden RGBA har ytterligare en kanal “A“ (Alpha) lagts till för att hantera just denna metadata. Exempel: I en 32bits RGBA-bild har 24bits dedikerats till färg (8 per färgkanal) medan de resterande 8 bitsen hanterar transparensvärden via en gråskala. Precis som RGB-standarden beräknas transparensvärden i en skala från 0 (ingen styrka/ fullt transparent) till 255 (full styrka/ fullt synligt). Se bild. Fullt synlig (solid) R:255, G:0, B:0, A:255 Semi-transparent R:255, G:0, B:0, A:128 Transparent (genomskinlig) R:255, G:0, B:0, A:0 30 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.9 Maskning och friläggning Inom digital bildhantering, kan det ibland vara önskvärt att klippa ut eller kopiera ut en del ur en bild. En liknelse till sammanhanget skulle vara att klippa ut en figur från ett papper så att figuren separeras från bakgrunden (resten av pappret). Det finns flera olika tillvägagångssätt och verktyg för att separera olika delar ur en digital bild. Däremot härleder samtliga separeringsprocesser till en särskild teknik som heter Alpha-lager. Tekniken kan först utnyttjas när man applicerat ett s.k. Alpha-lager till en bild. Alpha-lagret har en svartvit skala (oftast på 8bit) som definerar hur de olika pixlarna i en bild sk projiceras (se 4.8 alphavärden). Detta görs genom att alphalagret innehåller olika värden av svart till vitt i en “per pixel nivå”. I bilden nedan kan vi se hur ett alpha-lager kopplat till en bild s.k. “frilägger” eller “maskar ut” delar av motiven från den gråa bakgrunden. Exempel 1. Originalbild, ett vanligt fotografi. Applicera “Alphalager” till orginalbilden med vit färg runt äpplena och svart färg för att märka ut bakgrunden. Resultatet, äpplen är frilagda från bakgrunden. Exempel 2. Originalbild, ett vanligt fotografi. Ett nytt Alpha-lager med nytt motiv. 31 En stjärnformad del av orginalbilden har klippts ut. Detta sker i enlighet med alphalagrets motiv. Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.10 Aliasing och Anti-Aliasing Aliasing är ett begrepp som utrycker att en pixelformation är kantig. Då pixlar är uppbyggda efter en fyrkantig form så är de naturligt dåligt anpassade för att skapa runda former. Exempel följer. Bild 1. Bilden nedan nyttjar inte Anti-Aliasing och pixelkanterna är således aliased. 32px 128px 512px Anti-Aliasing eller “AA” är i motsatts till Aliasing en teknik som försöker motverka pixelkantighet genom tona intilliggande pixelfärger mellan olika grafiska objekt och bakgrunders kanter. Genom att tona pixelfärgen mellan angränsande ytor (t ex. ett objekt och en bakgrund) kan en mjukare övergång upplevas då de angränsande pixlarna mellan objektet kan dela en jämnare färgövergång. Se bilden nedan. Bild 2. Bilden nedan nyttjar Anti-Aliasing och pixelkanterna får således en till synes jämnare övergång. 32px 128px 512px Bild 3. Bilden till höger visar hur Anti-Aliasing påverkas av färg. 32 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 En annan metod för att försöka motverka Aliasing (synligheten av kantiga pixelformationer) är att försöka öka upplösning. Nedan kan ni se exempel på ett vanligt förekommande problemområde, utritning av text. Bilderna visar vilka skillnader som uppstår när text ritas ut i olika upplösningar i samband med anti-aliasingtekniken på eller av. Bilderna är på 300 PPI. Ingen AA, uppskalad text Teckentorlek 12 Zoom +400% Zoom +1600% Med AA, uppskalad text Teckentorlek 12 Zoom +400% Zoom +1600% Ingen AA, ökad textstorlek (högre upplösning) Teckentorlek 12 Teckentorlek 48 Teckentorlek 196 Med AA, ökad textstorlek (högre upplösning) Teckentorlek 12 Teckentorlek 48 Teckentorlek 196 Notera att användandet av AA inte blir lika tydligt utmärkt vid högre upplösningar. 33 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 4.11 Aliasing och Anti-Aliasing - Fördjupning Anti-Aliasing går att applicera på både 2D- och 3Dgrafik. Olika verktyg och miljöer hanterar AA olika beroende på situation. Bland 2D-bildprogram kan det vara önskvärt att nyttja AA på enstaka grafiska- eller textuella objekt. I kontrast till det kan det vid rendering i 3D-program vara önskvärt att rendera AA på flera delar eller tom. på hela bilden. Uträkningen av AA sker nästan alltid i slutskedet av renderingsprocessen, efter det att andra beräkningar som effekter och transformeringar beräknats på bilden. Detta görs så att man får AA beräknat på resultatet av hela bildinnehållet dvs. att uträkning av AA sker på samtliga objekt samt dess effekter. Ibland kan de dock vara önskvärt att inte rendera AA på en given effekt. Ett sådant exempel kan vara vid användandet av effekten “oskärpa”, denna effekt interpolerar pixlar (blandar och jämnar ut färger på intilliggande pixlar) och detta medför att det kan det bli redundant att beräkna AA i det oskärpta lagret då AA också är en form av, men mer precis pixel-interpolering. Det kan med andra ord vara lämpligt att exkludera AA när oskärpa renderas då man potentiellt har väldigt lite att tjäna visuellt samtidigt som det blir mer beräkningskrävande. Notera att det fortfarande finns en poäng med att rendera AA på ett objekt (lager) som ritas ut över ett oskärpt lager då det objektets kanter kan tjäna på att få en mjukare övergång mot det oskärpta lagret. Det är viktigt att notera att Anti-Aliasing kräver extra beräkningskraft. Det är inte alltid lämpligt att använda AA då det kan innebära stora prestandaförluster. Inom realtidsrendering som t ex. spel kan användandet av AA kräva för mycket prestanda. I kontrast till detta kan det vara mer försumbart med prestanda när man arbetar i 2D-verktyg då man i detta fall hanterar grafiken i stilla form. I andra fall kan användandet av AA förkomma när man ser på text i ett operativsystem eller i en webbläsare. 34 Kursmaterial för Institutionen för Data- och Systemvetenskap, Stockholms universitet. Aware Mustafa Taher, 2012 v. 1.5 Bildformat (work in progress) BMP: Bmp är ett av standardformaten för bitmappad grafik inom Windowsmiljö. Formatet är designat av Microsoft och är ett okomprimerat format, vilket således gör att en bmp-fil kan bli väldigt stor i datastorlek. BMP är kort för bitmap. Då bmp innehåller en hel del redundant information fungerar extra bra att packa ner filerna med ickeförstörande (ej destruktiva) komprimeringsmetoder. JPG: I en standard RGB-bild har den additiva informationen, per pixel, delats upp i tre olika kanaler (röd, grön och blå) och genom att addera styrka till samtliga kanaler producerar man ljusare nyanser. Detta gör att en standard RGB-bild är beroende av data inom tre kanaler för att hantera färg och ljus. Se kap 3. Färg. JPG-formatets huvudsakliga funktion är att den delar upp data i två områden, ljus och färg. Anledningen till detta är att man genom att separera datan kan uttnytja våra ögons svagheter skillt från dess styrkor. Då våra ögon lättare ser skillnader på olika nivåer av ljusstyrka, separeras ljus datan till en egen kanal medan färgmättnad hanteras via två sammansatta kanaler. Genom att dela upp innehållet kan formatet utnyttja en s.k. kvantifieringsmetod för att samla ihop flera likfärgade pixelblock till större 2D områden (normalt förekommande är pixelblock om 8*8px), dessa färgblock komprimeras via en sammanställning av färgen till en färg per färgblock utan att ljusdatan påverkas. Formatet är således särskilt designat för att utnyttja våra ögons brister i att urskilja tätt intilliggande och närliggande likartade färgade pixlar. Den ger ofta hög kompressionsgrad med bibehållen god kvalitét när den används på bilder som inte innehåller höga kontraster eller långa raka linjer (subjektiv tolkning). Det vanligaste förekommande tillämpningsområdet är bland fotografier. Ni kan även fördjupa er kring ämnet och användandet av “HSL” (Hue, Saturation and Lightning) som kan ge en tydligare beskrivning om hur man i detalj utnyttjar färg skillt från ljus för att uppnå kompressioner. “jpg” eller “jpeg” som det ibland kallas, kommer från (Joint Photographic Experts Group) 35
© Copyright 2025