1 Biometrija Poglavje 1 MATRIČNI ZAPIS MODELA IN OSNOVE MATRIČNE OPERACIJE 1.1 Skalar Skalar je matrika reda 1 x 1. Skalarji so označeni z malimi ali velikimi navadnimi (neodebeljene) črkami kot npr. yi j (odvisna slučajna spremenljivka), ai jk (vpliv živali kot naključni vpliv), βi (eden od nivojev pri sistematskemu vplivu), b (regresijski koeficient), xi jk (neodvisna spremenljivka), xi j (element v matriki X) ali c (konstanta). V oklepaju je omenjena ena od možnosti, ki jih bomo srečali pri biometriji. Oznaka skalarja ni dovolj, da bi vedno prepoznali njegovo vlogo. Pomembno je, da so uporabljene oznake obrazložene v vsakem primeru posebej, čeprav lahko pri običajnih, pogostih primerih o pomenu skoraj zanesljivo sklepamo. 1.2 Vektor Definicija: Vektor je polje števil ali simbolov urejenih samo v eno vrstico in en stolpec. Vektorji so matrike, ki imajo eno samo vrstico (vrstični vektorji) oziroma en stolpec (stolpični vektor). Pisali jih bomo z malimi odebeljenimi črkami npr. y, u, a, x ali β. Tako bomo označili stolpične vektorje. Vrstični vektorji so pravzaprav transponirani stolpični vektorji (glej tudi 1.3.1) in jih bomo označili y0 , u0 , a0 , x0 ali β0 ali yT , uT , aT , xT ali βT . Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo lahko navadno pisavo, vektor pa podčrtamo z znakom ~, npr. y. 1.3 Matrika Definicija: Matrika je polje števil ali simbolov urejenih v vrstice in stolpce. Označevali jih bomo z velikimi, odebeljenimi črkami kot npr. X (matrika dogodkov za sistematske vplive), Q (matrika kvadratne oblike), A (matrika sorodstva), V fenotipskih matrika varianc in kovarianc. To je le nekaj matrik, ki bodo imele pri biometriji poseben pomen. Z oznakami A, B ali X pa lahko enostavno mislimo samo na matrike brey posebnega pomena. Tako kot pri vektorjih je tudi pri matrikah pomemben opis, kaj matrika predstavlja. Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo lahko navadno pisavo, oznako za matriko pa podčrtamo z znakom ~. Matrika A na sliki 1.1 ima dve vrstici in štiri stolpce. Vsebuje torej osem elementov. Matrika ima svoje elemente razvrščene v stolpce in vrstice. C= c11 c12 · · · c1c c21 c22 · · · c2c .. .. . . .. . . . . cr1 cr2 · · · crc B= b11 b12 b13 b14 b21 b22 b23 b24 [1.1] Matrika C ima r vrstic in c stolpcev (primer 1.1). Število vrstic in stolpcev določata red matrike. Red matrike C je r x c. Red matrike B je 2 x 4. Če želimo red matrike, ga navedemo v indeksu matrike (1.2). A2x4 , Crxc , B2x4 [1.2] 2 Biometrija A é2 3 5 1 ù = ê1 1 9 7 ú ë û stolpci vrstici element matrike 2 3 Biometrija Pri kvadratnih matrikah (glej 1.3.1) lahko navedemo samo eno vrednost. Matrika V (1.3) je matrika fenotipskih varianc in kovarianc, zato je kvadratna. Ima 10 vrstic in 10 stolpcev. V10 [1.3] Posamezna števila ali simboli so elementi matrike. Elemente matrike bomo poimenovali z malimi črkami bi j . Indeksa i in j določata vrstico in stolpec, katerima element pripada. Prvi indeks označuje vrstico, drugi stolpec brez ozira na črko. Pri matrikah določamo tudi rang matrike: število neodvisnih vrstic in stolpcev. 1.3.1 Posebne matrike a) Kvadratne matrike (primer 1.4) imajo toliko vrstic kot stolpcev. 5 1 2 3 8 4 0 2 7 [1.4] b) Simetrične matrike (primer 1.5) so kvadratne matrike, za katere velja ai j = a ji . 5 1 2 1 8 4 2 4 7 [1.5] c) Diagonalne matrike (primer 1.6) so simetrične matrike, ki imajo od 0 različne elemente samo na diagonali. Vsi nediagonalni elementi enake 0. 5 0 0 D= 0 8 0 0 0 7 [1.6] Diagonalno matriko lahko zapišemo tudi v obliki iz enačbe 1.7. D = {dii } [1.7] č) Identična matrika (primer 1.8) je diagonalna matrika, pri kateri so vsi diagonalni elementi enaki 1. Označimo jo z I, praviloma moramo omeniti oziroma določiti tudi red matrike. 1 0 0 I= 0 1 0 0 0 1 [1.8] d) Ničelna matrika ima vse elemente enake 0. Označimo jo z 0, praviloma moramo določiti tudi red matrike. 0= 0 0 0 0 0 0 0 0 [1.9] 3 4 Biometrija e) Blok-diagonalna matrika je matrika, ki imajo vzdolž diagonale nanizane matrike. Poglejmo si matriko R iz enačbe 1.10. Na diagonali imamo varianci za dve lastnosti, ki se izmenično izmenjujeta. Večina nediagonalnih elementov je enaka 0, samo med dvema zaporednima vrsticama je nakazana kovarianca za ostanek med obema lastnostima (σe1 e2 ). V nadaljevanju bomo nekoliko poenostavili poimenovanje za kovarianco (σe12 ). Obe oznaki jo zadostno opišeta. σ2e1 σe1 e2 R= σe1 e2 σ2e2 σ2e1 σe1 e2 σ2e2 σe1 e2 .. . σ2e1 σe1 e2 σe1 e2 σ2e2 = [1.10] Zamenjajmo torej zaradi enostavnosti oznako in poudarimo diagonalne matrike. Mala diagonalna matrika ima dve vrstici in dva stolpca. Je kvadratna in simetrična. Vsebuje 3 komponente kovariance. Matriko bomo poimenovali R0 . Vsebuje varianco za prv0 in drugo lastnost ter kovarianco, če sta meritvi opravljeni na isti živali. = σ2e1 σe12 σe12 σ2e2 σ2e1 R↑0 → σe12 σe12 σ2e2 ←↓ R0 .. . σ2e1 σe12 σe12 σ2e2 [1.11] Zaradi preglednosti lahko matriko 1.12 prepišemo tako, da namesto diagonalnih blokov navedemo kar matriko R0 . = R0 R0 .. . [1.12] R0 f) Transponirana matrika A0 (1.13) ima za stolpce vrstice iz matrike A. Za oznako transponirano uporabljamo tudi črko T v eksponentu (AT ). 2 3 5 1 1 1 9 7 T 2 3 = 5 1 1 1 9 7 [1.13] g) Idempotentna matrika M je kvadratna in za njo velja M2 = M. Idepotentne matrike bomo omenjali pri kvadratnih oblikah, ki nam predstavlljajo vsote kvadratov. 4 5 Biometrija h) Delne matrike (ang. submatrix). Matriko razcepimo na manjše matrike. Običajno to naredimo glede na strukturo matrik. Kasneje bomo spoznali zanimive matrike, kamor urejujemo informacije iz podatkov in porekla. Delitev matrik lahko nakažemo s pikčastimi črtami. A B C D [1.14] Kot primer navajamo matriko koeficientov (1.15) iz enačb mešanega modela. V zgornjem levem kotu so zbrane informacije o sistematskem delu modela (X0 X), v spodnjem desnem kotu bom našli naključni del (Z0 Z + Iσ2e σa−2 ), nediagonalna dela (X0 Z in Z0 X) pa povezujeta sistematski in naključni del. Pri našem delu bomo razčlenitev opravili predvsem zaradi preglednosti, čeprav je bolj pomembna pri izpeljavi posameznih enačb ali pri dokazih. X0 X Z0 X X0 Z 0 Z Z + Iσ2e σ−2 a [1.15] i) Trikotna matrika je kvadratna in ima od nič različne nediagonalne elemente samo nad ali pod diagonalo. Tako ločimo spodnjo trikotno matriko (ang. lower triangular matrix, 1.16) in zgornjo trikotno matriko (ang. upper triangular matrix, 1.17). 2 1 1 −1 2 3 [1.16] 2 1 −1 1 2 3 [1.17] j) Pozitivno definitne matrike so kvadratne, simetrične in imajo dominantno diagonalo. S Cholesky razčlevitvijo (ang. Cholesky decomposition) najdemo tako spodnjo trikotno matriko L, da je njen produkt s transponirano mariko L0 pozitivno definitna matrika A (ang. positive definit matrix). Diagonalni elementi v matriki L so pozitivni in večji od nič. A = LL0 [1.18] 4 2 −2 2 2 1 −1 2 2 1 = 1 1 1 2 −2 1 14 −1 2 3 3 [1.19] Vse matrike varianc in kovarianc morajo biti pozitivno definitne. Na diagonali so variance, na nediagonalnih elementih pa kovariance. Vzemimo, da je matrika A reda 1 x 1, torej je le skalar. V tem primeru je edini element v matriki A varianca σ2 , element v matriki L pa standardni odklon σ. k) Semi-pozitivno definitne matrike so zelo podobne pozitivno definitnim matrikam, le v matriki L je na diagonali dovoljena tudi vrednost 0. 4 2 −2 2 2 1 −1 2 2 1 = 1 1 1 2 −2 1 5 −1 2 0 0 5 [1.20] 6 Biometrija 1.4 Seštevanje matrik in vektorjev Definicija: A pxq + B pxq = C pxq [1.21] ci j = ai j + bi j [1.22] Matrike, ki jih seštevamo, morajo imeti isto število vrstic in isto število stolpcev. Vsoto matrik dobimo tako, da seštevamo istoležne elemente. Rezultat je istega reda kot matrike, ki jih seštevamo. 5 0 1+4 0+0 4 0 1 0 −1 2 + 2 1 = −1 + 2 2 + 1 = 1 3 1 3 3−2 4−1 −2 −1 3 4 [1.23] Osnovna pravila 1.5 MNOŽENJE MATRIK Definicija: A pxq ∗ Bqxr = C pxr [1.24] Matriki A in B iz enačbe pomnožimo tako, da pomnožimo i-to vrstico matrike A z j-ti stolpcem matrike B ter produkte posameznih parov seštejemo. Tako dobimo vrednost elementa na presečišču i-te vrstice in j-tega stolpca matrike C. cik = q X ai j ∗ b jk [1.25] j=1 Prva matrika mora zato imeti toliko v stolpcev kot druga matrika vrstic 2 0 −1 2 1 0 2 0 −1 2 −1 2 ∗ = −4 6 1 2 −1 3 0 2 2x4 2 12 −3 14 3x4 3 4 3x2 [1.26] Osnovna pravila 1.6 OPIS MODELA V MATRIČNI OBLIKI Modele v matrični obliki bomo srečali v literaturi, ki opisuje obdelavo podatkov pri selekciji živali in uravnavanju reje. Kot bomo kasneje videli, so zeli splošni in povedo sami zase brez dobrega dodatnega opisa zelo malo o strukturi podatkov. Lahko so dodatno opremljeni z modelom v skalarni obliki. Ker pa so splošni, so zelo primerni za prikaz metod, uporabljenih za reševanje sistemov enačb. Model v matrični obliki si oglejmo najprej kar na primeru. PRIMER: Vzemimo podatke iz tabele ?? in uporabimo naslednja modela v skalarni obliki in sicer za dnevni prirast (1.27) in debelino hrbtne slanine (1.28): yi jkl = µ + Pi + M j + Fk + ai jkl + ei jkl [1.27] yi jklm = µ + Pi + M j + Fk + bi xi jkl − x̄ + ai jkl + ei jklm [1.28] 6 7 Biometrija Model za dnevni prirast smo predstavili v enačbah1.29 in 1.30. Če bi obravnavali le eno lastnost, potem je lahko enačba povsem brez indeksov. Ker pa sta si modela za dnevni prirast in debelino tako zelo podobna, pa jih moramo ločiti z dodatnimi indeksi. Za indeks lahko uporabimo številko ali črko. y1 = X1 β1 + Z1 u1 + e1 [1.29] yD = XD βD + ZD uD + eD [1.30] kjer pomeni: y1 , y D - vektor opazovanj ali meritev (ang. observations) za dnevni prirast X1 , XD - matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects) Z1 , ZD - matrika dogodkov za naključne vplive (ang. random effects) β1 , βD - vektor parametrov za sistematske vplive (ang. vector of parameters) u1 , uD - vektor naključnih vplivov e1 , e D - vektor ostankov (residual). Sedaj ne bo težko napisati model še za debelino hrbtne slanine. V enačbi 1.31 smo za indeks uporabili številko 2, ki bo opozoril, da gre za drugo lastnost. Da bi se spomnili, da delamo s slanino, pa smo v enačbi 1.32 raje uporabili črko S. y2 = X2 β2 + Z2 u2 + e2 [1.31] yS = XS βS + ZS uS + eS [1.32] kjer pomeni: y2 , yS - vektor opazovanj ali meritev za debelino hrbtne slanine X2 , XS - matrike dogodkov za sistematske vplive Z2 , ZS - matrika dogodkov za naključne vplive β2 , βS - vektor parametrov za sistematskih vplivov u2 , uS - vektor naključnih vplivov e2 , eS - vektor ostankov. Do sedaj smo obdelali posebej dnevni prirast in nato še debelino hrbtne slanine. Uporabili smo enolastnostno analizo. Kot vir informacij smo uporabili samo moreritve za lastnost in poreklo. Nismo pa upoštevali, da sta lastnosti sicer povezani. Z večlastnostnimi analizami se ne bomo preveč ukvarjali. Omenili jih bomo le toliko, da bomo vedeli, da obstajajo in se predstavljali, kaj se pri njih dogaja. Proces pri reševanju sistemov enačb je povsem enak procesu, ko delamo z eno lastnostjo. Oba modela lahko sestavimo na način prikazan v (1.33) in zapišemo poenostavljeno kar v obliki prikazani v (1.34). Slednja oblika je praktična za izpeljavo metode, ne pove pa dosti o poizkusu. Tudi, ko 7 8 Biometrija se odločimo za matrično obliko zapisa modela, moramo navajati skalarno obliko enačb. Pričakovane vrednosti, strukturo varianc in kovarianc ter morebitne predpostavke pa prikažemo kar z matrikami. y= y1 y2 = X1 β1 0 0 X2 β2 + Z1 u1 0 0 Z2 u2 + e1 e2 y = Xβ + Zu + e [1.33] [1.34] kjer pomeni: y - vektor opazovanj ali meritev za obe lastnosti X - matrike dogodkov (ang. incidence matrix) za sistematske vplive (ang. fixed effects) Z - matrika dogodkov za naključne vplive (ang. random effects) β - vektor parametrov za sistematskih vplivov u - vektor naključnih vplivov (žival) e - vektor ostankov (residual) Seznanimo se najprej z vsebino matrik in vektorjev v modelih. 1.6.1 Vektorji opazovanj in vektorji parametrov Vektor opazovanj je stolpični vektor, ki ima toliko vrstic, kot smo opravili meritev za opazovano lastnost. Kot primer bomo obdelali podatke o preizkusu mladic v pogojih reje iz tabele ??. V našem primeru smo za dnevni prirast opravili 11 meritev in jih uvrstili v vektor y1 (ali yD ), pri debelini hrbtne slanine pa 22. Vrstni red navajanja podatkov je poljuben, vendar pa, ko ga enkrat izberemo, je sistem definiran in ga ne smemo v naslednjih postopkih menjati. Vektorja y2 in y∗2 (oziroma yS in y∗S ) za debelino hrbtne slanine vsebujeta iste meritve razporejene različno. Kljub temu, da vektorja nista enaka, pričakujemo 8 9 Biometrija iste rešitve. Razporeditev rešitev pa bo odvisna od vrstnega reda parametrov. 506 550 532 577 512 499 12 12 466 15 13 545 15 15 549 14 14 600 19 15 610 23 16 12 506 26 14 550 15 25 12 532 15 21 19 577 14 22 17 19 512 23 ∗ 23 ∗ y1 = 499 y2 = y2 = y = 23 y = 13 24 26 466 14 26 25 545 16 24 549 21 12 25 600 22 17 27 23 610 24 21 13 24 19 14 27 22 16 19 23 12 23 23 17 15 15 24 24 27 19 23 15 506 12 13 550 15 14 532 15 16 577 14 12 512 19 17 499 23 24 466 26 24 545 25 27 549 21 19 600 22 23 610 23 15 [1.35] Zadnja dva vektorja y in y∗vključujeta vse meritve za obe lastnosti. Oba vektorja imata natanko 33 opazovanj, razlikujeta pa se le v vrstnem redu opazovanj. Vektorji β1 , β2 , βD , βS in β vključujejo vse sistematske vplive. Ker sta modela za dnevni prirast in debelino hrbtne slanine podobna, je seznam parametrov podoben, le pri slanini je dodana neodvisna spremenljivka masa in odgovarjajoči regresijski koeficient bi kot parameter. Vektor parametrov za sistematske vplive pri dnevnem prirastu lahko predstavljata bodisi enačba 1.36 bodisi enačba 1.37. h i β01 = µ1 ... P11 P12 P13 ... M11 M12 ... F11 F12 F13 [1.36] h i β0D = µD ... PD1 PD2 PD3 ... MD1 MD2 ... F D1 F D2 F D3 [1.37] Sedaj pa sestavimo še vektor parametrov za debelino hrbtne slanine. Tudi tu lahko izberemo varianto, ko lastnost označimo s številko (enačba 1.38) ali črko (enačba 1.39). Praviloma se odločimo samo za eno varianto in se je vseskozi tudi držimo. h i β02 = µ2 ... P21 P22 P23 ... M21 M22 ... F21 F22 F23 ... b21 b22 b23 [1.38] 9 10 β0S = Biometrija h µS .. . . PS 1 PS 2 PS 3 .. MS 1 MS 2 .. . . FS 1 FS 2 FS 3 .. bS 1 bS 2 bS 3 i [1.39] Parametri niso isti pri različnih lastnostih, saj pričakujemo pri vsaki lastnosti drugačne rešitve (ocene oz. napovedi). Ne glede na to, ali sta modela enaka ali različna, potrebujemo za vsako lastnost druge parametre. Vzemimo za primer samo srednjo vrednost µ. Izračunati moramo dve srednji vrednosti: eno za srednjo vrednost za dnevni prirast µD in eno za debelino hrbtne slanine µS . Skupen rezultat ne bi imel nobenega pomena, sicer pa tako in tako ne moramo šestevati vrednosti za dnevni prirast (v g/dan) in vrednosti za debelino hrbtne slanine (v mm). Ponovitve pri debelini slanine smo opravljali le z namenom, da izboljšamo zanesljivost meritev, saj meritev slanine z ultrazvokom ni dovolj zanesljiva. Ponovitve tako ne vplivajo na število parametrov, ki jih želimo oceniti. Seveda pa to velja za ponovitve, ki jih lahko razglasimo kot paralelke. Drugače je v primeru, ko so meritve na isti živali (ali drugi opazovani enoti) opravljene v različnih časovnih razmikih, včasih tudi v različnem okolju. Kot primer naj navedemo analizo vzorcev mleka pri posameznih kontrolah, v različnih laktacijah, velikost gnezda pri posameznih kotitvah, tehtanja odraslih živali v različnih časovnih razmikih, lahko pa so to tudi rezultati kemičnih analiz, ko proučujemo zanesljivost metode. Tudi meritve debeline hrbtne slanine, merjene pri različnih masah, bi sodile v ta sklop. Meritve niso paralelke in enakovredne. Pri takih meritvah nas zanima ponovljivost, zato v model vključimo dodatni vpliv, ki ocenjuje skupno okolje, ki je meritvam na eni živali oz. kaki drugi opazovani enoti skupen. Število nivojev pri takem vplivu je običajno veliko, za vsako žival vsaj eno. V primeru meritev lastnosti mleka pa ločimo dve skupni okolji. Najprej je eno okolje, ki je skupno vsem meritvam pri samici (kravi, ovci, kozi...), in ga imenujemo kar permanentno okolje, saj traja vse življenje. Drugi del skupnega okolja pa je vezan na eno laktacijo: meritve znotraj laktacije so bolj primerljive, podobne, kot meritve med laktacijami. Imenujemo ga kar skupno okolje (v laktaciji). Nivojev pri tem vplivu pa je celo več: pri vsaki živali za vsako laktacijo eden. Torej jih je za eno žival toliko, kot ima žival laktacij. Pri speciesih z več mladiči v gnezdu (drobnica, prašiči, kunci...) predstavlja skupno okolje za velikost gnezda pri samici okolje, ki ga samica nudi vsem svojim potomcem. Lastnosti, ki bi podrobno opisovale to okolje, praviloma ne moremo zmeriti. Predstavljajo pa tako imenovane materinske lastnosti, kot npr. mlečnost pri samicah, obnašanje matere (agresivnost, nerodnost, požrtvovalnost....), pa tudi nekatere železne navade rejca, ki povzročajo razlike med samicami. Trajne posledice za plodnost pa imajo le tisti vplivi, ki so kreirali razvoj samice, torej okolje iz njene mladosti. Če so bili pogoji v mladosti optimalni, bodo tudi proizvodni rezultati lahko optimalni. Na te, materinske lastnosti vpliva lahko tako genotip (maternalni genetski vplivi) kot okolje (permanentno okolje). V vektorjih naključnih vplivov u1 (1.40), uD (1.41), u2 (1.42), uS (1.43) in u(1.44) so nanizani naključni vplivi, kot npr. aditivni genetski vpliv, pogosto imenovan kar preprosto “žival”. Tako smo posamene elemente vektorjev označili kar s črkami a, ki nas spominjajo na aditivni genetski vpliv. Meritve smo opravili na enajstih živalih, sorodstva pa pri njih nismo poznali. u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 [1.40] u0D = aD1 aD2 aD3 aD4 aD5 aD6 aD7 aD8 aD9 aD10 aD11 [1.41] u02 = a21 a22 a23 a24 a25 a26 a27 a28 a29 a210 a211 [1.42] u0B = aB1 aB2 aB3 aB4 aB5 aB6 aB7 aB8 aB9 aB10 aB11 [1.43] [1.44] u0 = u01 u02 V primeru, da imamo še dodatne živali iz porekla, za katere bi tudi radi napovedali plemensko vrednost (aditivni genetski vpliv), živali vstavimo v vektor. V našem primeru bomo 4 prednike živali v poskusu dodali na konec vektorja. Prikazali bomo le vektor u01 (1.45), ostali se prav tako ustrezno podaljšajo. u01 = a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 a112 a113 a114 a115 [1.45] 10 11 Biometrija 1.6.2 Matrike dogodkov Z matrikami dogodkov poskus natanko opišemo. Vse živali pripadajo celotnemu vzorcu in bodo pri oceni “enakopravno” sodelovale. Za sistematske vplive Matriko dogodkov za sistematske vplive X1 za dnevni prirast nastavimo tako, da pred matriko nastavimo vektor opazovanj y1 , da si s tem pomagamo pri nastavljanju vrstic. Nad stolpce pa si lahko napišemo vektor parametrov β01 . Če parameter, ki označuje stolpec, prisostvuje pri meritvi, ki jo v dani vrstici opisujemo, napišemo vrednost 1, v obratnem primeru pa 0. 0 β1 506 550 532 577 512 y1 → 499 466 545 549 600 610 → µ1 P11 P12 1 1 1 1 1 1 1 1 1 0 0 1 0 1 1 0 1 0 1 0 1 0 P13 0 0 0 0 0 0 0 0 1 0 1 0 1 0 0 1 0 1 0 1 0 1 M11 1 1 0 0 1 0 0 1 1 0 0 M12 0 0 1 1 0 1 1 0 0 1 1 F11 F12 F13 1 0 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 1 0 ← X1 [1.46] Tudi pri debelini hrbtne slanine ravnamo enako. Le pri regresijskih koeficientih vpišemo vrednost neodvisne spremenljivke x. Če model tako zahteva, jo korigiramo na konstantno vrednost ali povprečje. µ 2 β02 y2 → → 12 15 15 14 19 23 26 25 21 22 23 13 14 16 12 17 24 24 27 19 23 15 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 P21 P22 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 P23 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 1 1 1 1 11 M21 M22 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 1 1 0 0 0 1 0 0 1 0 1 0 1 1 0 0 0 1 0 0 1 0 F21 F22 F23 b21 b22 b23 0 0 2. 0 0 1 0 −2. 0 0 0 1 5. 0 0 0 0 3. 0 0 1 0 0 −4. 0 1 0 0 1. 0 0 1 0 3. 0 0 0 0 0 −1. 0 1 0 0 0. 0 1 0 0 −3. 1 0 0 0 2. ← X2 0 0 2. 0 0 1 0 −2. 0 0 0 1 5. 0 0 0 0 3. 0 0 1 0 0 −4. 0 1 0 0 1. 0 0 1 0 3. 0 0 0 0 0 −1. 0 1 0 0 0. 0 1 0 0 −3. 1 0 0 0 2. [1.47] 12 Biometrija y→ y1 y2 β0 → β01 β02 X1 0 ←X 0 X2 33x1 [1.48] Za naključne vplive 0 u1 → 506 550 532 577 512 y1 → 499 466 545 549 600 610 y2 → y→ u02 → 12 15 15 14 19 23 26 25 21 22 23 13 14 16 12 17 24 24 27 19 23 15 y1 y2 33x1 a11 a12 1 0 0 0 0 0 0 0 0 0 0 a13 a14 a15 a16 a17 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a21 a22 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 a18 0 0 0 0 0 0 0 1 0 0 0 a23 a24 a25 a26 a27 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 u0 → u01 u02 Z1 0 ←Z 0 Z2 a19 a110 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 a28 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0 a111 a29 a210 a211 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1 ← Z1 [1.49] ← Z2 [1.50] [1.51] 12 13 Biometrija 1.6.3 Matrike varianc in kovarianc Izpeljimo strukturo varianc in kovarianc za dnevni prirast y1 (fenotipske variance in kovariance). V1 = var (y1 ) = var X1 β1 + Z1 u1 + e1 = = cov X1 β1 , β01 X01 + cov Z1 u1 , β01 X01 + cov e1 , β01 X01 + cov X1 β1 , u01 Z01 + | {z } | {z } | {z } | {z } 0 0 0 0 [1.52] +cov Z1 u1 , u01 Z01 +cov e1, u01 Z01 + cov X1 β1 , e01 + cov Z1 u1 , e01 | {z } | {z } | {z } 0 0 0 +cov e1 , e01 = Z1 var (u1 ) Z01 + var (e1 ) = Z1 G1 Z01 + R1 Matrika varianc in kovarianc za ostanek (R) je pogosto enostavna (1.53) na diagonali so variance za ostanek, nediagonalni elementi, ki predstavljajo kovariance med dvema meritvama, pa so enake nič. 0 e1 → e11 e 12 e 13 e 14 e15 e1 → e16 e17 e18 e19 e110 e111 e11 e12 e13 e14 e15 e16 e17 e18 e19 e110 e111 σ2e1 0 0 0 0 0 0 0 0 0 0 0 σ2 0 0 0 0 0 0 0 0 0 e1 0 2 0 σ 0 0 0 0 0 0 0 0 e1 0 2 0 0 0 0 0 0 0 0 σe1 0 0 0 0 σ2e1 0 0 0 0 0 0 0 ← R1 = Iσ2e1 [1.53] 0 0 0 0 σ2e1 0 0 0 0 0 0 0 0 0 0 0 σ2e1 0 0 0 0 0 0 0 0 0 0 0 0 σ2e1 0 0 0 0 0 0 0 0 0 0 0 σ2e1 0 0 0 0 0 0 0 0 0 0 0 σ2e1 0 0 0 0 0 0 0 0 0 0 0 σ2e1 V izjemnem primeru, ko merimo na isti živali samo eno meritev in živali med seboj niso sorodne, je tudi matrika varianc in kovarianc za naključne vplive (G1 ) enostavna (1.54). Vedeti pa moramo, da je to prej izjema kot pravilo! 0 u1 → a11 a 12 a 13 a 14 a u1 → 15 a16 a17 a18 a19 a110 a111 a11 a12 a13 a14 a15 a16 a17 a18 a19 a110 a111 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2 0 0 0 0 0 0 0 0 0 a1 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2a1 0 0 0 0 0 0 0 2 0 0 0 0 σ 0 0 0 0 0 0 a1 ← G1 = Iσ2a1 [1.54] 0 0 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2a1 0 0 0 0 0 0 0 0 0 0 0 σ2a1 V tem izjemnem primeru je tudi matrika fenotipskih varianc in kovarianc V diagonalna matrika, posamezni diagonalni elementi pa so vsota okoliške (σ2e1 ) in genetske (σ2a1 ) komponente variance. V1 = Z1 G1 Z01 + R1 = I σ2a1 + σ2e1 = diag σ2a1 + σ2e1 [1.55] Za debelino hrbtne slanine imamo dvakrat toliko opazovanj: na vsaki živali po dve. Ker smo merili z istim aparatom, delo je opravljal isti delavec..., so meritve identično porazdeljene (imamo samo eno 13 14 Biometrija varianco za ostanek). Vendar pa meritvi na isti živali praviloma nista neodvisni - žival smo pitali pod istimi pogoji, zato je tudi okolje v enaki meri ponagajalo. Če se je žival zaradi tega bolj zredila, kot bi se pod strogimi pogoji testa, bomo namerili tudi debelejšo slanino pri obeh ponovitvah. Med ponovitvama na isti živali torej obstaja podobnost - kovarianca. Oblika matrike varianc in kovarianc za ostanek je odvisna od razporedive meritev v vekorju y. Če razvrstimo meritve tako, da najprej nanizamo prve meritve na vseh živalih in nato dodamo še druge meritve (prvi vektor za debelino hrbtne slanine v enačbah (1.31), dobimo matriko iz enačbe (1.42). Ko pa razvrstimo ponovitvi po parih - znotraj živali (drugi vektor za debelino hrbtne slanine v enačbah (1.31)), pa dobimo matriko iz enačbe (1.43) in (1.44). R2 = Iσ2e2 Iσe22 Iσe22 Iσ2e2 22x22 = σ2e2 σe22 σe22 σ2e2 ⊗ I11 = R0 ⊗ I11 2x2 14 [1.56] e21 1 e22 1 e23 1 .. . e29 1 e2101 e2 → e2111 ··· e21 2 e22 2 e 23 2 .. . e 29 2 e 2102 e2112 e02 → h e21 1 e22 1 e23 1 · · · e29 1 e2101 e2111 2 σe2 σ2e2 σ2e2 .. . σ2e2 σ2e2 σ2e2 ··· ··· ··· ··· ··· ··· ··· σ e22 σe22 σe22 .. . σe22 σe22 σe22 .. . e21 2 e22 2 e23 2 .. . σe22 .. . σe22 .. . σe22 .. . .. . .. . .. . .. . ··· ··· ··· .. . σ2e2 .. . σ2e2 .. . σ2e2 .. . .. . .. . .. . . .. . ··· .. σ2e2 ··· σe22 σ2e2 ··· σe22 σe22 ··· 2 σe2 · · · e29 2 e2102 e2112 i ← R2 [1.57] Biometrija 15 15 e2 → e211 e212 ······ e22 1 e22 2 ······ e23 1 e23 2 ······ .. . .. . ······ e29 1 e29 2 ······ e2101 e2102 ······ e2111 e2112 e02 → h 16 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· σe22 σe22 σ2e1 σ2e1 e211 e212 .. . . e22 1 e22 2 .. e23 1 .. .. . . .. .. . . .. . . · · · · · · .. · · · .. . . σ2e1 σe22 .. .. . . σe22 σ2e1 .. .. . . · · · · · · .. · · · .. .. . . σ2e1 .. .. . . σe22 .. . . · · · · · · .. · · · .. .. . . .. .. . . .. . . · · · · · · .. · · · .. .. . . .. .. . . .. . . · · · · · · .. · · · .. .. . . .. .. . . .. . . · · · · · · .. · · · .. .. . . .. .. . . .. . .e23 2 .. · · · · · · .. .. . . .. .. . . .. . · · · . · · · · · · .. .. .. . . .. .. . . .. .. ··· . ··· ··· . . .. σe22 .. . .. .. 2 σe1 . . .. . · · · . · · · · · · .. .. . . .. . . . .. . . .. . . . .. . · · · . · · · · · · .. .. .. . . .. .. . . .. . · · · . · · · · · · .. .. .. . . .. .. . . .. . · · · . · · · · · · .. .. .. . . .. .. . . .. . e29 1 e29 2 .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. . σ2e1 σe22 .. . σe22 σ2e1 .. . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . .. . e2101 e2102 .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. .. . .. . . · · · · · · .. . σ2e1 σe22 .. . σe22 σ2e1 .. . · · · · · · .. .. . .. . ··· σe22 σ2e1 σ2e1 σe22 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· i ← R2 .. . e2111 e2112 [1.58] 16 Biometrija 17 Biometrija R2 = I11 ⊗ σ2e2 σe22 σe22 σ2e2 = I11 ⊗ R0 [1.59] 2x2 Ker so živali nesorodne, za debelino hrbtne slanine pa želimo samo eno plemensko vrednost, je matrika varianc in kovarianc za direktni aditivni vpliv enostavna, kot jo prikazujemo v (1.60). G2 = I11 σ2a2 [1.60] Sedaj pa izračunajmo še matriko fenotipskih varianc in kovarianc V2 . Vzemimo primer, ko so nanizane najprej prve meritve in nato še ponovitve. Rezultat (1.61) je izjemoma, zaradi že omenjenih predpostavk, blokdiagonalna matrika. V2 = 2 σa2 = σ2a2 + R2 = σ2a2 ⊗ I11 + σ2a2 Z2 G2 Z02 I11 I11 I11 σ2a2 σ2e2 σe22 σe22 σ2e2 I11 I11 I11 I11 + R0 ⊗ I11 = σ2a2 + R0 ⊗ I11 = I I 11 11 2 [1.61] σa2 + σ2e2 σ2a2 + σe22 ⊗ I11 = ⊗ I11 = V0 ⊗ I11 σ2a2 + σe22 σ2a2 + σ2e2 Sedaj pa za vajo ponovimo še izračun kovariance med meritvami za dnevni prirast y1 in ostanki e1 ter med meritvami y1 in slučajnim vplivom u1 . cov y1 , e01 = cov X1 β1 + Z1 u1 + e1 , e01 = Z1 cov u1 , e01 + var (e1 ) = R1 [1.62] cov y1 , u01 = cov X1 β1 + Z1 u1 + e1 , u01 = cov X1 β1 , u01 + cov Z1 u1 , u01 + cov e1 , u01 [1.63] = Z1 cov u1 , u01 = Z1 var (u1 ) = Z1 G1 = C1 Pričakovane vrednosti ter variance in kovariance za slučajne vplive so pogosto predstavljene v združeni obliki. V nasednjih enačbah smo prikazali model (1.34) z obema lastnostima. u1 0 E e1 = 0 y1 X1 β1 u1 G1 var e1 = 0 y1 G1 Z01 [1.64] 0 R1 R1 G1 R1 0 Z1 G1 Z1 + R1 [1.65] Vajo ponovite še za debelino hrbtne slanine in za model z obema lastnostima skupaj! Potrebovali bomo še rezultate iz naslednje razpredelnice. Pripišite rezultate, da jih ne bomo kasneje iskali! Nato pa sestavite enačbo za pričakovane vrednosti po zgledu (1.62) in prikažite strukturo varianc in kovarianc po zgledu (1.63). cov y2 , e02 = cov y2 , u02 = cov (y, e0 )= cov (y, u0 )= cov y, e02 = cov y1 , u02 = cov y2 , e01 = cov y2 , u01 = cov y1 , y02 = cov y2 , y01 = 17 18 Biometrija Pri dvolastnostnem modelu splošno obliko enačb še razčlenite, da bodo vidne povezave med lastnostima. Izpopolnite naslednji dve enačbi! u1 ··············· u2 e1 · · · · · · · · · · · · · · · E e2 = · · · · · · · · · · · · · · · ··············· y1 ··············· y2 .. .. .. .. .. . . . . . .. .. .. .. .. ······ . ······ . ······ . ······ . ······ . ······ .. .. .. .. .. . . . . . .. .. .. .. .. ······ . ······ . ······ . ······ . ······ . ······ u1 .. .. .. .. .. u2 . . . . . e1 . . . . . var e2 = · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. .. .. .. .. y1 . . . . . . . . . . y2 · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. · · · · · · .. .. .. .. .. . . . . . · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · ... · · · · · · .. .. .. .. .. . . . . . 1.7 Determinanta 1.8 Inverzna matrika 1.9 Splošna inverza Vzemimo, da imamo sistem enačb Ax = r. Rešitev za vektor neznanih parametrov x dobimo tako, da od spredaj množimo z A−1 , kar lahko storimo ob pogoju, da ima matrika A poln rang. Vendar pa obstajajo številni primeri, ko to ne drži: rang matrike A je manjši od reda matrike, determinanta matrike je enaka nič. Sistem enačb v tem primeru nima ene same rešitve. Če ima rešitev, jih ima neskončno mnogo. Eno, izbrano rešitev pa lahko dobimo tako, da uporabimo splošno inverzo. Označili jo bomo z A− . Izbrali pa bomo tisto, pri kateri velja: AA− A = A. Praviloma pa niti AA− niti A− A nista enaka identični matriki I. Matrika A ima neskončno mnogo splošnih inverz, če ima vsaj eno. Pri vsaki možni rešitvi sistema uporabimo drugo splošno inverzo. Poglejmo pa si enostaven postopek, da najdemo prvo splošno inverzo. 2 3 −2 1 x1 −2 0 1 x2 = 1 1 −2 2 x3 3 [1.66] • v matriki A poiščite vse odvisne vrstice, jih napolnite z ničlami. Z ničlami napolnimo tudi stolpec. Pri simetričnih matrikah izberemo isto vrstico in isti stolpec. 3 −2 0 3 0 1 0 0 0 0 −2 1 3 0 1 −2 0 0 ali 0 0 0 ali 0 0 1 ali 0 0 1 ali −2 0 1 . . .[1.67] 0 0 0 1 0 2 0 −2 2 0 0 0 0 0 0 • ostane vam samo toliko neodvisnih vrstic in stolpcev, kot je rang sistema 18 19 Biometrija • iz neodvisnih vrstic in stolpcev nastavite podmatriko in poiščite njeno inverzo 3 −2 3 1 0 1 −2 1 3 1 ... −2 3 1 3 −2 −2 0 1 −2 1 1 − 4 0 2 2 3 1 5 2 −1 −1 3 1 2 −2 −1 2 0 1 − 2 1 −1 0 −2 1 5 1 −1 2 3 [1.68] ... [1.69] • inverzi dodajte izpuščene vrstice in stolpce, ki so polni samih ničel 0 2 0 2 0 −1 0 0 0 0 1 −1 1 0 −1 1 1 1 1 1 0 0 0 0 2 −1 0 0 −2 2 0 3 . . .[1.70] − 2 3 0 4 5 2 2 5 0 0 0 −1 0 3 0 2 3 0 0 0 0 0 0 Tako pripravljene inverze lahko uporabimo pri reševanju sistema enačb. Rešitev lahko dobimo neskončno mnogo, objavili pa bomo le tisto, kar je enako pri vseh rešitvah - ocenljive funkcije. 1.10 Direktna vsota A 0 A⊕B= 0 B [1.71] Možni so različni zapisi. k Σ⊕i Xi = Σ+i Xi = ⊕ Xi = Xi ⊕ Xi ⊕ · · · ⊕ Xi = i Xi 0 · · · 0 0 Xi · · · 0 .. .. . . . . .. . . 0 0 · · · Xi [1.72] Za vključene matrike sploh ni potrebno, da bi bile istega ranga. x0 0 0 x0 ⊕ X ⊕ z = 0 X 0 0 0 z [1.73] Za matrike odgovarjajočega ranga drži (A ⊕ B) + (C ⊕ D) = A 0 0 B + C 0 0 D = A+C 0 0 B+D =A+C⊕B+D [1.74] Če je Ai polnega ranga, velja naslednje: ⊕ −1 Σi Ai = Ai 0 · · · 0 0 Ai · · · 0 .. .. . . . . .. . . 0 0 · · · Ai −1 = A−1 0 ··· 0 i 0 A−1 ··· 0 i .. .. .. .. . . . . 0 0 · · · A−1 i = Σ⊕i A−1 i [1.75] Za determinanto pa velja: k ⊕ Y Σ Ai = |Ai | [1.76] i i=1 19 20 Biometrija 1.11 Kronecker produkt Vzemimo primer, kjer imamo dve lastnosti (y in z) za vsako od dveh živali. Če lahko zapise opišemo z linearnim modelom, imamo µy y1 z2 µz y3 = µy µz z4 ey1 uy1 uz1 ez1 + uy2 + ey2 ez2 uz2 [1.77] σa12 a12 σ2a1 a12 σa12 σ2a1 uy1 2 uz1 σa12 a12 σa12 a12 σ2a2 σa2 = var uy2 a12 σ2 σa12 a12 σa12 σ2a1 a1 2 a12 σa12 a12 σa2 σa12 σ2a2 uz2 2 σa1 σa12 σ2a1 σa12 a 1 1G0 a12 G0 σa12 σ2a2 12 σa12 σ2a2 = A ⊗ G0 = = a12 G0 1G0 σ2a1 σa12 σ2a1 σa12 1 a12 σa12 σ2a2 σa12 σ2a2 [1.78] [1.79] Matrika A predstavlja matriko sorodstva. Element a12 je koeficient sorodstva med obema živalima. Matrika G0 vsebuje genetske variance in kovariance med lastnostima, merjenima na isti živali. Poglejmo sedaj še varianco za ostanek (1.80)! Lastnosti merjene na isti živali so med se 2 ey1 σe1 σe12 0 0 ez1 σe12 σ2 0 0 e2 var ey2 = 0 0 σ2e1 σe12 ez2 0 0 σe12 σ2e2 σ2e1 σe12 0 1 σe12 σ2 e2 2 = σe1 σe12 1 0 σe12 σ2e2 [1.80] σ2e1 σe12 1R 0R σe12 σ2e2 0 0 = = I ⊗ R0 = R σ2e1 σe12 0R0 1R0 σe12 σ2e2 [1.81] Navedimo še nekaj lastnosti Kronecker produkta. Vzemimo matriki A pxq in Bmxn . A ⊗ B = C pm×qn [1.82] (A ⊗ B)0 = A0 ⊗ B0 [1.83] x0 ⊗ y = yx0 = x0 ⊗ x0 [1.84] k ⊗ A = kA = A ⊗ k [1.85] A1 A2 A⊗ ⊗B= A1 ⊗ B A2 ⊗ B [1.86] A ⊗ B1 A ⊗ B2 [1.87] B1 B2 , Če obstajajo produkti, velja: (A ⊗ B) (X ⊗ Y) = AX ⊗ BY [1.88] 20 21 Biometrija (A ⊗ B)−1 = A−1 ⊗ B−1 [1.89] rang (A ⊗ B) = rang (A) • rang (B) [1.90] tr (A ⊗ B) = tr (A) • tr (B) [1.91] |Mm×m ⊗ Nn×n | = |M|m |N|n [1.92] Lastna_vrednost (A ⊗ B) = Lastna_vrednost (A) • Lastna_vrednost (B) [1.93] (A ⊗ B) ⊗ C = A ⊗ (B ⊗ C) [1.94] kA ⊗ B = A ⊗ kB = k (A ⊗ B) [1.95] (A + B) ⊗ C = (A ⊗ C) + (B ⊗ C) [1.96] 1.12 Odvajanje matrik Pri odvajanju uporabimo splošni model (1.97), poljubno vrstico i pa bomo prikazovali na dva načina, kot (1.98) ali (1.99). y = Xβ + Zu + e [1.97] y1 = x0i β + z0i u + e0i [1.98] yi = p X xi j β j + j=1 1.12.1 q X zi j u j + ei [1.99] j=1 Odvod matrike po skalarju Vzemimo matriko Y reda m × n, katere elementi so funkcije skalarja z. Potem je: ∂Y = ∂z 1.12.2 ∂yi j ∂z red (Y) = m × n red (z) = 1 × 1 red (A) = m × n =A [1.100] Odvod skalarja po matriki Naj bo skalar h (X) funkcija matrike X. ∂h (X) ∂x11 ∂h (X) . .. = ∂X ∂h (X) ∂xm1 ··· ··· ∂h (X) ∂h (X) .. . ∂x1n ∂xmn red (X) = m × n red (h (X)) = 1 × 1 red (A) = m × n =A [1.101] [1.102] 21 22 Biometrija 1.12.3 Odvod vektorja po vektorju . . . i ∂y h ∂y ∂y ∂y · · · = = ∂z1 ∂z2 ∂zn ∂z0 . . . ∂y ∂y1 ∂y1 1 ··· .∂z1 .∂z2 .∂zn ∂y2 ∂y2 ∂y 2 ··· ∂z1 ∂z2 ∂zn = .. .. .. .. . . . . . . . ∂yk ∂yk ∂z1 ∂z2 ··· [1.103] [1.104] ∂yk ∂zn k×n red (z0 ) = 1 × n red (y) = k × 1 red (A) = k × n [1.105] Vzemimo sedaj model (1.97) in odvajajmo y najprej na β0 in nato še na β. . . . ∂y ∂y ∂y ∂y · · · = = ∂β p ∂β1 ∂β2 ∂β0 . . . ∂y1 ∂y1 ∂y 1 ··· ∂β1 x11 x12 · · · x1p .∂β2 .∂β p ∂y2 . ∂y2 x21 x22 · · · x2p · · · ∂y2 ∂β1 ∂β2 ∂β p = .. =X . . . . . . . . . .. . . . . .. .. .. . . . . xn1 xn2 · · · xnp ∂yn ∂yn · · · ∂yn ∂β1 ∂β2 [1.107] ∂β p red (y) = n × 1 red β0 = 1 × p red (X) = n × p [1.108] Poglejmo si tipični element matrike odvodov (1.109) in nato še primer za parameter v modelu (1.110). P Pq p ∂ x β + z u + e i j j i j j i j=1 j=1 ∂yi = = xik ∂βk ∂βk P Pq p ∂ x β + z u + e 1 j=1 1 j j j=1 1 j j ∂yi = = x12 ∂β2 ∂β2 . . . . ∂y1 ∂y2 ∂y · · · ∂yn .∂β1 ∂β ∂β x11 x12 .∂β1 ∂y1 . 1 ∂y2 . 1 ∂y ∂yn · · · x21 x22 ∂y ∂β2 ∂β2 ∂β2 = ∂β2 = = .. .. . . . . .. . ∂β .. .. .. . . ... . . ∂y ∂y . x p1 x p2 ∂y2 1 · · · ∂yn ∂β p [1.106] ∂β p ∂β p prvo opazovanje in drugi [1.109] [1.110] · · · x1n · · · x2n 0 .. = X [1.111] .. . . · · · x pn ∂β p red (y) = n × 1 red (β) = p × 1 red (X0 ) = n × p [1.112] ∂Zu = Z0 ∂u [1.113] 22 23 Biometrija 1.12.4 Odvajanje produkta matrik V skalarni algebri velja ∂uv = ∂x ∂u ∂x v+u ∂v ∂x [1.114] V skalarni algebri velja isto pravilo najdemo tudi v matrični algebri (1.115). Matrika U je reda m × n ter matrika V reda n × q. Elementi matrik so funkcije skalarne spremenljivke x. ∂UV = ∂x ∂U ∂x V+U ∂V ∂x [1.115] PRIMER: V sistemu normalnih enačb pri metodi najmanjših kvadratov (1.116) dobimo vsoto kvadratov za model z izrazom (1.117). b = X0 y X0 Xβ [1.116] b0 X0 Xβ b β [1.117] Odvajajmo vsoto kvadratov za model na eno izmed ocen (npr. βi ): b0 X0 Xβ b ∂β b0 X0 b ∂β b+β b0 X0 ∂Xβ = Xβ ∂β̂i ∂β̂i ∂β̂i [1.118] Poskusimo sedaj rešiti samo košček problema: x1i b ∂Xβ red (ti ) = n x2i = . = ti . i = 1, 2, . . . , p . ∂β̂i x4i [1.119] Sedaj bo pa že šlo: ∂β0 XXβ = ∂βi b +β b0 X0 ti = 2t0 Xβ b t0i Xβ i | {z } = | {z } skalar skalar [1.120] Še malo posplošimo: 0 Xβ b 2t 1 b X0 Xβ b ∂β .. = = 2 . b ∂β b 2t0 Xβ 0 p t01 .. Xβ 0 b . b = 2X Xβ t0p 23 [1.121] 24 Biometrija PRIMER: Skupno vsota kvadratov (total sum of square, TSS) za opazovanja lahko odvajamo na dva načina. TSS je skalar, vektor opazovanj y pa stolpični vektor reda n × 1, zato bo rezultat tudi stolpični vektor istega reda. Ker vemo, da je TSS vsota kvadratov za opazovanja, lahko uberemo naslednjo pot. P . ∂ y21 P .∂y1 2y1 ∂ y2 2y2 2 ∂y0 y ∂y2 = [1.122] = .. = 2y . . ∂y .. P 2. 2yn ∂ yn ∂yn Po postopku za odvajanje produkta matrik po sklarju, moramo odvod najprej razbiti tako, da dobimo v imenovalcu skalarje (1.123). Nato vsako vrstico odvajamo, kot to prikazuje (1.124). Pri tem si pomagamo še z enačbo (1.125). Dobljene vrednosti za posamezne vrstice vstavljamo nazaj v enačbo (1.123). Rezultat je podoben kot pri skalarni algebri. ∂y0 y = ∂y ∂y0 y ∂y1 ∂y0 y ∂y2 .. . ∂y0 y ∂yi .. . ∂y0 y ∂yn 2y1 2y2 .. . = 2y = 2yi . . . 2yn [1.123] ∂y ∂y0 y ∂y0 = y + y0 = t0i y + y0 ti = yi + yi = 2yi ∂yi ∂yi ∂yi [1.124] ∂y0 = 0 0 · · · 1i · · · 0 = t0i ∂yi [1.125] 1.12.5 Odvajanje inverze Vzemimo matriko M s polnim rangom in inverzno matriko M−1 . Hitro lahko ugotovimo, da velja (1.126), saj identična matrika ni funkcija skalarne spremenljivke z. ∂MM−1 ∂I = =0 ∂z ∂z [1.126] Če bi zadevo poskusili rešiti na način, ki smo ga obdelali v prejšnjem poglavju (1.127), nam ostane neznanka prav odvod inverzne matrike M−1 po skalarni spremenljivki z. Rezultat pa itak že poznamo. ∂MM−1 ∂M −1 ∂M−1 = M +M =0 ∂z ∂z ∂z [1.127] Sedaj pa nam ostane samo, da uganemo neznani odvod. Pravzaprav bomo (1.128) samo preoblikovali: poznani prvi člen bomo prenesli na drugo stran enačbe (pridobimo negativen predznak) in obe strani od spredaj množili z inverzno matriko M−1 . ∂M−1 ∂M −1 = −M−1 M ∂z ∂z [1.128] 24 25 Biometrija 1.12.6 Odvajanje splošne inverze Splošna inverza je vsaka matrika G, ki zadovolji: AGA = A [1.129] Matrika A je lahko katerakoli matrika, lahko je torej tudi vrstični ali stolpični vektor. Naj bosta matriki A in G funkciji skalarja x. Sedaj pa poiščimo odvod matrike A po x-u. ∂A ∂AGA ∂A ∂GA ∂A ∂G ∂A =− = GA + A = GA + A A + AG ∂x ∂x ∂x ∂x ∂x ∂x ∂x [1.130] Poskusimo sedaj množiti od spredaj z AG in od zadaj z GA. AG ∂A ∂A ∂G ∂A GA − AG GA = A A + AG GA ∂x ∂x ∂x ∂x 0=A A [1.131] ∂G ∂A A + AG GA ∂x ∂x [1.132] ∂G ∂A A = −AG GA ∂x ∂x [1.133] Rezultat je podoben kot (1.128), če je G = A−1 . 1.12.7 Odvajanje funkcije determinante Za matriko A s polnim rangom velja (Searle,1982) −1 ∂ |A| = |A| A0 ∂A [1.134] −1 ∂ln |A| 1 ∂ |A| |A| (A0 )−1 = • = = A0 ∂A |A| ∂A |A| [1.135] ∂ln |V| ∂ln|V| = tr ∂x = tr ∂ln|V| ∂V • ∂x | {z } ∂V ∂x = tr V−1 ∂V ∂x [1.136] skalar 1.12.8 1.13 Chain-ovo pravilo Sled matrike Definicija: Sled matrike (ang. trace) je vsota diagonalnih elementov matrike. X A = ai j ⇒ tr (A) = ai j [1.137] Zakon ciklične komutativnosti tr A pxn Bnxm Cmxp = tr Cmxp A pxn Bnxm = tr Bnxm Cmxp A pxn 25 [1.138] 26 Biometrija Sled skalarja je skalar. tr σ2e = σ2e [1.139] Sled vsote matrik tr (A + B) = tr (A) + tr (B) [1.140] Sled produkta matrike s skalarjem tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e [1.141] Matematično upanje in sled matrike E (tr (A)) = tr (E (A)) [1.142] tr (B) = V sota lastnih vrednosti (eigenvalues) matrike B [1.143] P ∂tr (B) ∂ ni=1 bii = =I ∂B ∂B [1.144] ∂tr (AB) ∂tr (BA) = = A, ∂B ∂B [1.145] ∂tr (ABC) ∂tr (BCA) = = A, C, ∂B ∂B [1.146] ∂tr (B, AB) = BA + A, B ∂B [1.147] A = A, ⇒ ∂tr (B, AB) = 2AB ∂B Etr (X) = E n X i=1 ! xii = n X [1.148] E (xii ) = trE (X) [1.149] i=1 26 27 Biometrija PRIMER: Opravili smo dve meritvi na dveh nesorodnih živalih. Rezultati so v naslednji tabeli. Nastavimo matriko varianc in kovarianc za aditivni genetski vpliv (G), ostanek (R) in opazovanja (V)! Pri tem predpostavimo naslednji model. Izračunajmo tudi sledi matrik G, R in V! a1 a2 y11 y21 y12 y22 yi j = µ + ai + ei j ai ∼ IID 0; σ2a ; ei j ∼ IID 0; σ2e 2 σe e11 e12 σ2e R = Var e21 = σ2e σ2e e22 G = Var a1 a2 = σ2a σ2a 2 y11 σe + σ2a σ2a 2 2 y12 σe + σ2a σa V = R + ZGZ, = Var (y) = Var = y21 σ2e + σ2a σ2a y22 σ2a σ2e + σ2a tr (R) = tr I4 σ2e = σ2e tr (I4 ) = 4σ2e tr (G) = X tr (V) = X σ2a = 2σ2a σ2e + σ2a = 4 σ2e + σ2a Slednje lahko izračunamo tudi po naslednjem postopku. tr (V) = tr (R + ZGZ, ) = tr (R) + tr (ZGZ, ) = 4σ2e + tr Z, ZI2 σ2a = 4σ2e + 4σ2a 27 28 Biometrija PRIMER: y = Xβ + Zu + e E (yi ) = xi β Var (yi ) = σ2e + σ2u Po definiciji je V = E (yy, ) − E (y) E (y, ) E (yy, ) = V + E (y) E (y, ) E (yy, ) = E (tr (yy, )) = E tr (yy, ) = tr E (yy, ) = ! β, X, Xβ , , = tr (V + Xββ X ) = tr (V) + tr | {z } skalar P = n σ2e + σ2u + β, X, Xβ = n σ2e + σ2u + β, X, Xβ E (yy, ) = E (Xβ+Zu + e) (Xβ+Zu + e), = E (Xβ+Zu + e) (β, X, + u, Z, + e, ) = E (Xββ, X, ) + E (Zuβ, X, ) + E (eβ, X) + E (Xβu, Z, ) + E (Zuu, Z, ) + +E (eu, Z, ) + E (Xβe, ) + E (Zue, ) + E (ee, ) = ZGZ, +R + Xββ, X, = V + Xββ, X, 1.14 KVADRATNE OBLIKE (QUADRATIC FORM) Splošna oblika kvadratne oblike (quadratic form) je y, Qy. Matriko Q imenujemo matriko kvadratne oblike. Predpostavimo lahko, da je simetrična. V primeru, da Q ni simetrična, lahko poiščemo drugo matriko kvadratne oblike po enačbi (1.150). Q + Q, 2 [1.150] Za odvisne spremenljivke (opazovanja) v vektorju y naj velja, da so porazdeljene po naslednjem porazdelitvenem zakonu: y ∼ (Xβ, V) [1.151] Pripravimo si še nekaj enačb V = var (y) = var (y − Xβ) = E (y − Xβ) (y − Xβ), = = E (yy, −yβ, X, −Xβy, + Xββ, X, ) = yy, − (Ey) β, X, − Xβ (Ey, ) + Xββ, X, = = yy, −Xββ, X, −Xββ, X, +Xββ, X, = yy, −Xββ, X, [1.152] yy, = V + Xββ, X, [1.153] E (yy, ) = E (V + Xββ, X, ) = E (V) + E (Xββ, X, ) = V + Xββ, X, [1.154] V statistiki kvadratne oblike predstavljajo matrični zapis za vsote kvadratov. Da ocenimo posamezne komponente variance, vsoto kvadratov izenačimo s pričakovano vrednostjo za vsoto kvadratov, zato si 28 29 Biometrija oglejmo, kako dobimo pričakovane vrednosti. E (y, Qy) | {z } skalar = E tr (y, Qy) = E tr (Qyy, ) = tr E (Qyy, ) = tr QE (yy, ) = = tr Q (V + Xββ, X, ) = tr (QV) + tr (QXββ, X, ) = (β, X, QXβ) = tr (QV) + tr | {z } = tr (QV) + β, X, QXβ skalar [1.155] To velja ne glede na to, ali je porazdelitev normalna. Če pa je porazdelitev normalna, pa velja tudi naslednje. 1. var (y, Qy) | {z } skalar 2. PRIMER: yi = µ + ei • Vsota kvadratov opazovanj X y2i = yy, Q = I; rank(Q) = n • Vsota kvadratov za model P 2 P 2 yi yi 1 1 nȳ = n = = y, 1 • 1, y = y, Jn y n n n n 2 Q= Jn ; n rank(Q) = 1 • Nepristranska ocena variance: P (yi − ȳ)2 = n−1 1 Q= n−1 P J I− n y2i − ( yi ) n−1 P ; n y, y − 1n y, Jn y 1 , J = = y I− y n−1 n−1 n rank(Q) = n − 1 29 30 Biometrija PRIMER: yi j = µ + A i + ei j ; i = 1, A; j = 1, N; n = NA y, = y,1 y,2 · · · y,A Vir variabilnosti µ Vpliv A Ostanek Skupaj Stopinje prostosti (d.f.) 1 A-1 A(N-1) AN Vsota kvadratov (SS) CF - za povprečje CBSS - med skupinami ESS - za ostanek TSS - skupna Povprečni kvadrat (SS/d.f.) CF/1 CBSS/(A-1) ESS/(A(n-1)) • Skupna vsota kvadratov TS S = XX i y2ji = y, y j Q = I; rank(Q) = AN • Vsota kvadratov za “povprečje” CF = Q= 1 , y JNA y AN JAN ; AN rank(Q) = 1 • Vsota kvadratov UBSS: = U BS S = = P A P N 1 N 1 N i = y, Q= i N j 2 = 1 N P N j y1 j 2 2 N y + j 2j y,A 1N · 1,N yA + P , y1 1N · 1,N y1 + y,2 1N ·1,N y2 + · · · + 1N · 1,N 1N · 1,N , , , y1 y2 · · · yA 1 N ⊕ X JN yi j P ⊕ JN i N .. . ··· + P N j yA j 1N · 1,N y1 y2 .. . 2 yA y ! rank(Q) = A ; • Vsota kvadratov CBSS: CBS S = U BS S − CF = y, ⊕ X JN i Q= ⊕ 1 X 1 JN − JAN N AN N ! 1 , y− y JAN y = y, AN ! ; rank(Q) = A − 1 i • Vsota kvadratov za ostanek ES S = T S S − MS S 30 ⊕ 1 X 1 JN − JAN N AN i ! y 31 Biometrija 1.15 CHOLESKY DEKOMPOZICIJA (KVADRATNI KOREN) 31
© Copyright 2025