Neliömuodoista, matriisin ominaisarvoista ja avaruuden kierroista Marko Moisio 1. Neliömuodoista ja matriisin ominaisarvoista Tarkastellaan toisen asteen tasokäyrän määräävää yhtälöä a, b, c, d ax2 + by 2 + 2cxy = d, missä ovat vakioita. Tässä vasemmalla puolella esiintyvää polynomia kutsutaan neli- ömuodoksi. Pyrimme sopivalla tason kierrolla saattamaan tämän yhtälön diagonaalimuo- αu2 + βv 2 = d. 2 2 Yhtälö ax + by + 2cxy = d toon voidaan kirjoittaa matriisimuodossa x (x y)A =d y (1) missä ac A= . cb Havaitaan, että Olkoon A on symmetrinen ts. P = (P1 P2 ) A = AT . 2 × 2-matriisi x u =P y v reaalinen ja säännöllinen ja sijoitetaan yhtälöön (1) jolloin yhtälön (1) vasen puoli on muotoa T u u u T AP = (u v)(P AP ) . P v v v P jolle P T AP = D, α0 D= , α, β ∈ R. 0β Tavoitteena on siis löytää sellainen matriisi missä Tällöin (1) saadaan diagonaalimuotoon αu2 + βv 2 = d. (2) P kuvauksena f : R2 → R2 , f (X) = P X , joka kuvaa ax2 + by 2 + 2cxy = d. Mikäli f on tason kierto, niin käyrä Voimme siis ajatella matriisia käyrän 2 αx2 + βy 2 = d 2 ax + by + 2cxy = d käyräksi voidaan ajatella käyräksi, joka saadaan kun käyrää kierretään origon suhteen kuvauksen P αx2 + βy 2 = d määräämän kulman verran. Käsittelemme kiertoja tarkemmin luvussa 2. Kysymystä neliömuodon diagonalisoimisesta voidaan tarkastella yleisemminkin. Jatkossa samaistamme n R . n×1-matriisin X = (x1 x2 . . . xn )T ja koordinaattivektorin (x1 , . . . , xn ) ∈ 2 Olkoon h(x1 , . . . xn ) neliömuoto eli homogeeninen astetta kaksi oleva polynomi ts. n X h(x1 , . . . xn ) = aij xi xj = (x1 x2 . . . xn )A(x1 x2 . . . xn )T , i,j=1 missä a11 a12 · · · a21 a22 · · · A= . .. ... . . . an1 an2 · · · on symmetrinen ts. A = AT . λ1 0 · · · 0 λ2 · · · D= . .. ... . . . 0 ··· 0 P jolle P T AP = D, missä 0 0 . . . . λn (x1 x2 . . . xn )T = P (u1 u2 . . . un )T Tällöin nimittäin muuttujan vaihdolla h(x1 , . . . , xn ) ann Tavoitteena on löytää matriisi neliömuoto a1n a2n . . . saadaan diagonaaliseksi neliömuodoksi h(u1 , . . . , un ) = λ1 u21 + · · · + λn u2n . Miten ts. P tulisi valita? Oletetaan, että P T P = I. P Tällöin P = (P1 P2 . . . Pn ) on ortonormaali n×n-matriisi on säännöllinen, P −1 = P T ja P T AP = D ⇐⇒ P −1 AP = D ⇐⇒ AP = DP ⇐⇒ AP1 = λ1 P1 , . . . , APn = λn Pn . Täten on voimassa seuraava tulos: Lemma 1. Jos yhtälöiden P P T = I, niin P T AP = D AX = λ1 X, . . . , AX = λn X jos ja vain jos λi ja vektorit Pi ovat vastaavasti jotkin ratkaisut joillakin reaaliluvuilla Osoittautuu, että myös käänteinen tulos pätee ts. jos massa reaaliluvut P1 , . . . , P n joille APi = λi Pi A kaikilla λ1 , . . . , λn . on symmetrinen, niin on ole- i = 1, . . . , n ja PPT = I kun P = (P1 P2 . . . Pn ). Miten luvut λ ja niitä vastaavat vektorit Xλ voidaan löytää? Kysymys on niin keskeinen, että asetamme seuraavan yleisen määritelmän. Määritelmä. Olkoon BX = λX B n × n-matriisi ja λ ∈ C. Jos yhtälöllä ratkaisu Xλ , sanotaan lukua λ matriisin B kompleksilukukertoiminen on jokin nollavektorista eroava ominaisarvoksi ja vektoria Xλ siihen kuuluvaksi ominaisvektoriksi. Edellinen kysymys voidaankin asettaa yleisemmässä muodossa: miten matriisin B omi- naisarvot ja niihin liittyvät ominaisvektorit voidaan löytää? Vastaus on (ainakin periaatteessa) helppo: koska X 6= 0, niin BX = λX ⇐⇒ (B − λI)X = 0 ⇐⇒ det(B − λI) = 0. 3 n-asteisen Täten ominaisarvot ovat naisarvoyhtälön) ratkaisut ja ominaisarvoon (B − λI)X = 0 t=λ Rajoitutaan nyt (hetkeksi) tapaukseen, missä A= A (eli B :n omi- kuuluvat ominaisvektorit ovat yhtälön X ∈ R2 \ {0̄}. ratkaisut Lause 2. Matriisin det(B − tI) = 0 polynomiyhtälön ac , cb A on reaalinen symmetrinen 2×2-matriisi c 6= 0. ominaisarvot ovat reaaliset ja erisuuret, ja niitä vastaavat ominais- vektorit ovat toisiaan vasten kohtisuorassa. Todistus. Nyt det(A − tI) = 0 ⇔ (a − t)(b − t) − c2 = 0 ⇔ t2 − (a + b)t + ab − c2 = 0. c 6= 0, Koska niin tämän yhtälön juuret α= a+b+ p (a − b)2 + 4c2 2 ja ovat reaaliset ja erisuuret. Koska matriisin on A:n β= A − λI a+b− p (a − b)2 + 4c2 2 rivit ovat lineaarisesti riippuvat jos λ ominaisarvo, niin c (A − λI)Xλ = 0 ⇐⇒ (a − λ)x1 + cx2 = 0 ⇐⇒ Xλ = s λ−a ∀s ∈ R. Täten Xα · Xβ = 0 ⇐⇒ c2 + (α − a)(β − a) = 0 ⇐⇒ c2 + αβ − (α + β)a + a2 = 0. α+β =a+b Koska ja αβ = ab − c2 , niin väite seuraa. Lemman 1 ja Lauseen 2 nojalla saamme menetelmän matriisin P konstruoimiseksi ja näin menetelmän yhtälön (1) diagonalisoimiseksi eli saattamiseksi muotoon (2): α ja β ominaisarvoyhtälön det(A − tI) = 0 ratkaisut. Olkoot Xα ja Xβ yhtälöryhmien (A − αI)X = 0 ja (A − βI)X = 0 nollavektorista (5) Olkoot (6) eroavia ratkaisuja. (7) P = (P1 P2 ), missä P1 = Xα ja ||Xα || P2 = Xβ . ||Xβ || Yhtälöistä (6) riittää ratkaista vain toinen. Nimittäin, jos esim. vektorien Xα ja Xβ kohtisuoruuden nojalla voidaan valita Xα = (x1 x2 )T , T Xβ = (−x2 x1 ) T niin . (−x2 x1 ) on välttämättä ominaisarvoon β kuuluva ominaisvektori, sillä (−x2 x1 )T 2 kuuluu Xα :n virittämän R :n aliavaruuden ortogonaalikomplementtiin, joka puolestaan on Nyt Xβ :n virittämä. Voidaan siis valita (ks. Lauseen 2 todistus): Xα = √ missä α= a+b+ (a−b)2 +4c2 ts. 2 1 α−a c ja Xβ = − α−a c , 1 4 1 √ |c| s + c s2 + 1 Xα = missä s= ja Xβ = −s − |c| c √ s2 + 1 1 , b−a . 2c Täten yhtälön (1) diagonalisoiva matriisi 1 P = ||Xα || jota vastaava lineaarikuvaus ī + (s + |c| c √ s2 + 1)j̄ s+ f 1 √ |c| c kiertää suuntainen ja A= √ s2 + 1 , 1 |c| c s2 + 1 xy -tason uv -tasoksi, v -akseli on vektorin −(s + Esimerkki 1. Diagonalisoidaan yhtälö Tämän yhtälön matriisi −s − u-akseli on vektorin √ 2 s + 1)ī + j̄ suuntainen. missä |c| c 5x2 + 4xy + 2y 2 = 1 ja tarkastellaan sen kuvaajaa. 2 5 , jonka ominaisarvot 2 2 α ja β ovat yhtälön det(A − tI) = (5 − t)(2 − t) − 4 = 0 juuret ts. α = 7+5 2 = 6, β = 2 Koska nyt s= suuntainen ja v -akseli = 1. 6u + v = 1 koordinaatistossa muotoa 2−5 4 7−5 2 2 = −3/4, niin on vektorin Täten yhtälö − 12 ī + j̄ on vektorin jonka ominaisarvot α ja β ī + (− 43 + q 9 16 + 1)j̄ = ī + 12 j̄ arctan(1/2) ≈ 26.57◦ x2 − 12xy + 6y 2 + x + y = 2 x2 − 12xy + 6y 2 A= uv - suuntainen. Kyseessä on siis tason kierto vastapäivään kulman kuvaajaa. Nyt neliömuodon on ja vastaava tasokäyrä on siis ellipsi. u-akseli Esimerkki 2. Diagonalisoidaan yhtälö 5x2 + 4xy + 2y 2 = 1 matriisi on 1 −6 −6 6 , ovat yhtälön det(A − tI) = (1 − t)(6 − t) − 36 = 0 verran. ja tarkastellaan sen 5 juuret ts. 5 − 12 − 13 12 α = 7+13 2 = 10, β = = − 18 = − 23 , 12 7−13 2 = −3. Nyt s = b−a 2c 5 = − 12 ja s+ |c| c √ 1 + s2 = joten Xα = 1 −3/2 ja 3/2 Xβ = 1 ja 2 P =√ 13 joka vastaa tason kiertoa kulman Täten yhtälö 1 =√ 13 arctan(3/2) ≈ 56.31◦ 1 3/2 −3/2 1 2 3 −3 2 , verran myötäpäivään. Lisäksi x u 1 2u + 3v =P =√ . y v 13 −3u + 2v x2 − 12xy + 6y 2 + 3x + 2y = 2 on uv -koordinaatistossa 3 2 10u2 − 3v 2 + √ (2u + 3v) + √ (−3u + 2v) = 2 13 13 13 ⇐⇒ 10u2 − 3v 2 + √ v = 2 13 ! √ 13 ⇐⇒ 10u2 − 3 v 2 − v =2 3 √ !2 13 11 13 =2− = ⇐⇒ 10u2 − 3 v − 6 12 12 √ !2 120 2 36 13 ⇐⇒ u − v− =1 11 11 6 muotoa Tätä yhtälöä vastaava käyrä on hyperbeli, jonka symmetriapisteen koordinaatit ovat √ (u, v) = (0, 13/6) eli (x, y) = (1/2, 1/3). Palataan sitten yleiseen tapaukseen missä A on reaalinen ja symmetrinen n × n-matriisi. 6 Jos n > 2, niin suurin muutos tapaukseen naisarvoyhtälöllä voi olla vähemmän kuin n n=2 verrattuna on se, että nyt A:n omi- erisuurta juurta. Toisaalta Lause 2 yleistyy Lauseiksi 3 ja 4: Lause 3. Matriisin Todistus. Olkoon vektorin X A ominaisarvot ovat reaaliset. λ ∈ C A:n ominaisarvo ts. kompleksikonjugaatti ts. AX = λX X · X = ||X||2 . jollakin X ∈ Cn \ {0̄}. Olkoon X Koska X · AX = X · λX = λX · X = λ||X||2 ja toisaalta T X · AX = X AX = (AT X)T X = AT X · X = AX · X = λ̄X · X = λ̄||X||2 , niin (λ − λ̄)||X||2 = 0. Lause 4. Matriisin A Koska X 6= 0, niin λ = λ̄ λ ∈ R. ts. eri ominaisarvoihin liittyvät ominaisvektorit ovat toisiaan vastaan kohtisuorassa. Todistus. Olkoot α ja β A:n ominaisarvoja, α 6= β . Koska AT = A, niin βXα · Xβ = Xα · βXβ = Xα · AXβ = AXα · Xβ = αXα · Xβ ja näin ollen (α − β)Xα · Xβ = 0. Seuraus. Matriisin A:n Koska α 6= β , niin Xα · Xβ = 0. A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta, jos ominaisarvot ovat pareittain erisuuret. Todistus. Algebran peruslauseen nojalla A:lla on n ominaisarvoa. Lauseen 3 nojalla ne ovat kaikki reaalisia ja oletuksen ja Lauseen 4 nojalla niitä vastaavat ominaisvektorit ovat pareittain toisiaan vastaan kohtisuorassa ja täten lineaarisesti riippumattomia. −2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1. −2x2 + 11y 2 + 5z 2 − 12xy + 12xz matriisi −2 −6 6 A = −6 11 0 , 6 0 5 Esimerkki 3. Diagononalisoidaan yhtälö ömuodon Neli- jonka ominaisarvoyhtälö on −2 − t −6 6 −6 6 + (5 − t) −2 − t −6 11 − t 0 = 6 0 = (A − tI) = −6 −6 11 − t 0 11 − t 6 0 5−t = −t3 + 14t2 + 49t − 686. Täten matriisin ominaisvektorit: A ominaisarvot ovat α = −7, β = 7, γ = 14. Lasketaan vastaavat 7 5 −6 6 x1 0 x1 6 (A−αI)X = 0 ⇐⇒ −6 18 0 x2 = 0 ⇐⇒ x2 = t 2 , t ∈ R. 6 0 12 x3 0 x3 −3 −9 −6 6 x1 0 x1 2 −6 4 0 x2 0 x2 (A−βI)X = 0 ⇐⇒ = ⇐⇒ = t 3 , t ∈ R, 6 0 −2 x3 0 x3 6 −16 −6 6 x1 0 x1 −3 (A−γI)X = 0 ⇐⇒ −6 −3 0 x2 = 0 ⇐⇒ x2 = t 6 , t ∈ R, 6 0 −9 x3 0 x3 −2 Täten neliömuodon diagonalisoivaksi matriisiksi P voidaan valita (ks. Lemma 2) esim. 6 2 3 1 P = 2 3 −6 . 7 −3 6 2 −2x2 + 11y 2 + 5z 2 − 12xy + 12xz = 1 määräämä pinta on hyperboloidin −7x2 + 7y 2 + 14z 2 = 1 kuva kuvauksessa f : R3 −→ R3 , f (X) = P (X). Luvussa 2 Siispä yhtälön näemme, että kuvaus ympäri kulman f vastaa avaruuden ◦ arccos(2/7) ≈ 73.4 2 2 R3 kiertoa (vektorin 2ī + j̄ suuntaisen suoran verran vastapäivään). 2 −2x +11y +5z −12xy+12xz = 1 määräämä pinta on uvw-koordinaatiston 2 2 2 hyperboloidi −7u +7v +14w = 1, kun u-akseli on vektorin 6ī+2j̄ −3k̄ , v -akseli vektorin Täten yhtälön 2ī + 3j̄ + 6k̄ ja w-akseli vektorin 3ī − 6j̄ + 2k̄ Tarkastellaan sitten yleistä tapausta, missä suuntainen. A:n ominaisarvot eivät olekaan välttämättä pareittain erisuuria. Silloinkin pätee seuraava tulos: Lause 5. Matriisin A ominaisvektoreista voidaan muodostaa Rn :n ortonormali kanta. Tämä on melko syvällinen tulos ja sen todistamiseksi kehittelemme vielä hivenen lineaarialgebran koneistoa. Olkoon V vektoriavaruuden jokin kanta. Olkoon suhteen ts. f Rn m-dimensioinen lineaarikuvaus f : V −→ V aliavaruus ja ja Mf V = {v̄1 , . . . , v̄m } kuvauksen f sen matriisi kannan V 8 f (v̄i ) = a1i v̄1 + a2i v̄2 + · · · + ami v̄m , i = 1, . . . , m, jos a11 a21 Mf = ... ··· ··· a12 a22 a1m a2m . . . . . . . am1 am2 · · · Jos nyt f : V → V lineaarikuvaus ja on jokin nollavektorista eroava ratkaisu ominaisarvoksi ja vektoria vain jos amm x̄ = x1 v̄1 +· · ·+xm v̄m ∈ V , niin selvästi f (x̄) = Mf X , missä X = (x1 x2 . . . xm )T . Määritelmä. Olkoon Koska niin x̄λ x̄λ ∈ V , λ ∈ R. Jos yhtälöllä sanotaan lukua λ f (x̄) = λx̄ lineaarikuvauksen f siihen kuuluvaksi ominaisvektoriksi. f (x̄) = Mf X , niin vektori x̄ on reaalilukuun λ kuuluva f :n ominaisvektori jos ja X on λ:aan kuuluva Mf :n ominaisvektori. Määritelmä. Lineaarikuvaus f :V →V on symmetrinen jos f (x̄) · ȳ = x̄ · f (ȳ) kaikilla x̄, ȳ ∈ V . Lemma 2. Olkoon kannan V f :V →V suhteen. Tällöin Todistus. Koska V f lineaarikuvaus ja Mf sen matriisi jonkin ortonormaalin on symmetrinen jos ja vain jos on ortonormaali, niin x̄ · ȳ = X · Y Mf kaikilla on symmetrinen. x̄, ȳ ∈ V . Täten f (x̄) · ȳ = x̄ · f (ȳ) ∀x̄, ȳ ∈ V ⇐⇒ Mf X · Y = X · Mf Y ∀X, Y ∈ Rm . ⇐⇒ (Mf X)T Y = X T Mf Y ∀X, Y ∈ Rm ⇐⇒ X T MtT Y = X T Mf Y ∀X, Y ∈ Rm ⇐⇒ X · MfT Y = X · Mf Y ∀X, Y ∈ Rm ⇐⇒ X · (MfT Y − Mf Y ) = 0 ∀X, Y ∈ Rm . MfT Y − Mf Y = 0 Täten kaikilla Y ∈ Rm eli (MfT − Mf )Y = 0 kaikilla Y ∈ Rm . Siispä MfT = Mf . Lause 4'. Olkoon sella f on m symmetrinen lineaarikuvaus, missä Mf kuvauksen F ominaisarvoa. Lemman 2 nojalla f :n Mf m, niin algebran peruslauseen nojalla sillä on m Mf :n ja on symmetrinen, joten Lauseen 4 nojalla ominaisarvot ovat reaalisia. Lauseen 5 todistus. Olkoon AX . Kuvauk- matriisi jonkin ortonormaalin kannan suhteen. Koska ominaisarvopolynomin aste on täten dim V = m. ominaisarvoa (eivät välttämättä erisuuria) ja ne ovat reaalisia. Todistus. Olkoon Mf :n f : V −→ V f A:n määräämä lineaarikuvaus ts. Lemman 2 ja Lauseen 4' nojalla f :llä on n f : Rn −→ Rn , f (X) = reaalista ominaisarvoa. 9 Olkoon ruus. Nyt U1 ominaisarvoon λ1 kuuluvan f :n ominaisvektorin ū1 virittämä Rn :n aliavaRn voidaan hajottaa suoraksi summaksi Rn = U1 ⊕ U1⊥ ja sille saadaan kanta {ū1 , v̄2 , . . . , v̄n } missä Osoitetaan, että v̄2 , . . . , v̄n ∈ U1⊥ . f (U1⊥ ) ⊆ U1⊥ . Olkoon v̄ ∈ U1⊥ . Nyt f :n symmetrisyyden nojalla ū1 · f (v̄) = f (ū1 ) · v̄ = λ1 ū1 · v̄ = 0, joten f (U1⊥ ) ⊆ U1⊥ . dim U1⊥ = n − 1 Koska nojalla sillä (ja siis f ja on symmetrinen myös rajoitettuna U1⊥ :lle, niin Lauseen 4' A:lla) on n − 1 reaalista ominaisarvoa joihin kuuluvat ominaisvektorit ∈ U1⊥ . Olkoon Nyt U2 ominaisarvoon λ2 kuuluvan ominaisvektorin ⊥ n R = U1 ⊕ U2 ⊕ (U1 + U2 ) ⊥ (U1 + U2 ) . Lisäksi f :n U2 )T ) ⊆ (U1 + U2 )T . ja sillä on kanta ū2 virittämä {ū1 , ū2 , v̄3 , . . . , v̄n }, U1⊥ :n missä aliavaruus. v̄3 , . . . , v̄n ∈ lineaarisuuteen nojautuen nähdään kuten edellä, että Jatkamalla prosessia saadaan Rn :lle lopulta A:n ominaisvektoreista f ((U1 + ū1 , ū2 , . . . , ūn orto- gonaalinen kanta. Esimerkki 4. Diagononalisoidaan yhtälö Neliömuodon 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1. 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz matriisi 58 −18 6 A = −18 85 −12 , 6 −12 53 jonka ominaisarvoyhtälö on 58 − t −18 6 0 = (A − tI) = −18 85 − t −12 = t3 − 196t2 + 12005t − 235298 6 −12 53 − t = (t − 49)2 (t − 98). Täten matriisin A ominaisarvot ovat α = 49, β = 49, γ = 98. Lasketaan vastaavat omi- naisvektorit käyttäen Lauseen 5 todistuksessa käytettyä menetelmää (vaikka ne voitaisiin toki laskea ilmankin sitä). Ensinnäkin 11 −18 6 x1 0 x1 2 (A−αI)X = 0 ⇐⇒ −18 36 −12 x2 = 0 ⇐⇒ x2 = t 3 , t ∈ R. 6 −12 4 x3 0 x3 6 Valitaan ū1 = 2ī + 3j̄ + 6k̄ . Jos kannaksi voidaan valita esim. f (X) = AX , rajoitetaan se U U1 on tämän vektorin virittämä aliavaruus, niin {v̄2 , v̄3 }, ⊥ missä v̄2 = 3ī − 2j̄ ja v3 = 3ī − k̄ . :lle ja lasketaan tämän rajoittuman matriisi = 210ī − 224j̄ + 42k̄ = 112v̄2 − 42v̄3 Olkoon nyt Mf . f (v̄2 ) = 3f (ī) − 2f (j̄) = 3(58ī − 18j̄ + 6k̄) − 2(−18ī + 85j̄ − 12k̄) U1⊥ :n Koska 10 ja f (v̄3 ) = 3f (ī) − f (k̄) = 3(58ī − 18j̄ + 6k̄) − (6ī − 12j̄ + 53k̄) niin Mf = U ⊥: koska = 168ī − 42j̄ − 35k̄ = 21v̄2 + 35v̄3 , 112 21 . Lasketaan ominaisarvoon β = 49 −42 35 (Mf − 49I)X = 0 ⇐⇒ 63 21 −42 −14 x1 x2 = 0 0 liittyvä ominaisvekori ⇐⇒ x1 x2 =t (U + , ū2 = −v̄2 + 3v̄3 = 6ī + 2j̄ − 3k̄ . Lopuksi valitsemme vektorin T ⊥ U ) , joten voidaan valita ū3 = 3ī − 6j̄ + 2k̄ . niin voidaan valita avaruudesta −1 3 ū2 ∈ P Näin ollen neliömuodon diagonalisoivaksi matriisiksi P = ū3 voidaan valita 6 2 3 1 2 3 −6 , 7 −3 6 2 joka sattuu olemaan täsmälleen sama matriisi kuin edellisessä esimerkissä. Täten yhtälön 58x2 + 85y 2 + 53z 2 − 36xy + 12xz − 24yz = 1 uvw-koordinaatiston ellipsoidi 6ī + 2j̄ − 3k̄ , v -akseli vektorin 2 2 2 49u + 49v + 98w = 1, missä jälleen 2ī + 3j̄ + 6k̄ vektorin ja w-akseli määräämä pinta on u-akseli on vektorin 3ī − 6j̄ + 2k̄ suuntainen. 11 2. Avaruuden Rn kierroista n × n-matriisit vastaavat avaruuden R kiertoja, kun n = 2, 3. Mitä on vaadittava esimerkiksi 2 × 2-matriisilta P , että Edellisessä luvussa väitimme, että tietyt ortonormaalit n R2 sitä vastaava lineaarikuvaus olisi tason kierto? Ainakin sen on säilytettävä vektorien pituudet ja niiden väliset kulmat. n positivinen kokonaisluku, P n×n-matriisi ja f : Rn −→ Rn , f (X) = kuvauksia f jotka toteuttavat seuraavat ehdot: Yleisemmin: olkoon P X. Tarkastellaan ||P X|| = ||X|| ∀X ∈ Rn , n kulmat ts. ] P X, P Y = ](X, Y ) ∀X, Y ∈ R . (1) f säilyttää vektorien pituudet ts. (2) f säilyttää vektorien väliset Osoittautuu, että ehdot (1) ja (2) toteutuvat jos ja vain jos matriisi ts. pystyrivit P1 , . . . , P n muodostavat ortonormaalin joukon ts. T T 2 det(P P ) = det(P ) det(P ) = det(P ) matriisin determinantti on aina Lause 1. Olkoon PX P P P T = I. Koska P i · Pj = 0 Koska 1 = , niin ehdot (1) ja (2) toteuttavan kuvauksen f ±1. P = (P1 P2 . . . Pn ) n×n-matriisi. Lineaarikuvaus f : Rn −→ Rn , f (X) = säilyttää vektorien pituudet ja niiden väliset kulmat jos ja vain jos Todistus. Olkoot on ortonormaali X, Y ∈ Rn , jos i 6= j , jolloin P X = x 1 P1 + · · · + x n P n ja P P T = I. P Y = y1 P1 + · · · + yn Pn . niin =1 =1 z }| { z }| { ||P X||2 = P X · P X = x21 ||P1 ||2 + · · · + x2n ||Pn ||2 = ||X||2 f eli säilyttää pituuden. Osoitetaan, että f säilyttää pistetulon: P :n ortonormaalisuuden nojalla P X · P Y = (x1 P1 + · · · + xn Pn ) · (y1 P1 + · · · + yn Pn ) = x1 y1 + · · · + xn yn = X · Y. Nyt ](P X, P Y ) = f eli säilyttää kulman. Oletetaan sitten, että f PX · PY X ·Y = = ](X, Y ) ||P X|| ||P Y || ||X|| ||Y || f säilyttää vektorien pituudet ja niiden väliset kulmat. Tällöin säilyttää pistetulon, joten X · Y = P X · P Y = (P X)T P Y = X T P T P Y = X · P T P Y ∀X, Y ∈ Rn ekvivalentisti X · (Y − P T P Y ) = 0 ∀X, Y ∈ Rn . Täten T Y − PTPY = 0 P P =I eli P f (ū) = cū, Y ∈ Rn eli (I − P T P )Y = 0 kaikilla Y ∈ Rn f : Rn+1 → Rn+1 joillakin ū ∈ R n+1 ja näin ollen on ortogonaalinen. Lemma 1. Olkoon Jos kaikilla lineaarikuvaus, jonka matriisi \ {0̄} ja c ∈ R, niin on olemassa P on ortonormaali. n+1 R :n kanta jonka 12 suhteen f :n Q matriisi on muotoa c 0 ··· 0 a11 · · · Q= .. ... ... . 0 an1 · · · 0 a1n , . . . ann missä A= a11 · · · . . . .. . an1 · · · a1n . . . ann on ortonormaali. Todistus. Täydennetään joukko {ū} avaruuden Rn+1 ortonormaaliksi kannaksi V = {ū, ū1 , . . . , ūn }. Nyt f (ū) = cū + 0 · ū1 + · · · + 0 · ūn f (ū1 ) = u1 ū + a11 ū2 + · · · + an1 ūn . . . f (ūn ) = un ū + a1n ū2 + · · · + ann ūn cuk = f (ū) · f (ūk ) = 0, kaikilla k = 1, . . . , n. Koska välttämättä c 6= 0, niin nyt u1 = · · · = un = 0. Nyt myös 0 = f (ūi ) · f (ūj ) = a1i a1j + · · · + Koska f ani anj kaikilla i 6= j , Täten Q ovat väitettyä muotoa. säilyttää kulmat, niin ja A Oletetaan että ja n = 2, 1 = ||f (ūj )|| = ||(a1j , . . . , anj )|| olkoon f koska f säilyttää myös pituudet. ehdot (1) ja (2) täyttävä lineaarikuvaus ja P = sen matriisi luonnollisen kannan a c b d {ī, j̄} suhteen. Koska P on ortogonaalinen, niin ac + bd = 0. Jotta (3) f f olisi tason kierto, vaadimme ehtojen (1) ja (2) lisäksi, että pätee ehto: säilyttää x- Esimerkki 1. Jos ja y -akselien P = 0 1 , niin sitä vastaava kuvaus 1 0 muttei ehtoa (3), sillä se vaihtaa peilaus suoran y=x keskinäisen järjestyksen. x-akselin y -akseliksi ja f toteuttaa ehdot (1) ja (2) y -akselin x-akseliksi kiertoa kiertona avaruudessa ja f (j̄) f on suhteen. Jotta saisimme laskennallisen kriteerin joka vastaa ehtoa (3), niin ajatellaan f (ī) eli ja vektori k̄ R3 : xy -tasoa kierretään z -akselin xy -tason ympäri niin, että vektorit muodostavat oikeankätisen systeemin ts. vektorien f (ī) ja f (j̄) 13 ristitulon on oltava vektorin k̄ ī j̄ k̄ f (ī) × f (j̄) = a b 0 c d 0 f Täten vain jos Täten f (ī) = aī + bj̄ ja f (j̄) = cī + dj̄ , = (ad − bc)k̄ = det(P )k̄. suuntainen. Koska f (ī) × f (j̄) det(P ) = 1. toteuttaa ehdon (3) jos ja vain jos det(P ) > 0 f on jos ja vain jos xy -tason P = a2 + b2 = 1. a = cos α Koska tällöin b = sin α ja 1 0 P = P = f suuntainen jos ja a −b b a a , niin b P on muotoa , f kiertää tasoa kulman α verran missä ts. Entäpä jos k̄ kierto eli toteuttaa ehdot (1), (2) ja (3) jos ja vain missä on vektorin niin cos α − sin α sin α cos α . toteuttaa ehdot (1) ja (2) muttei ehtoa (3) ts. det(P ) = −1? Nyt P on −1, joten se on muotoa a b 1 0 a −b P = = , b −a 0 −1 b a ortogonaalinen ja sen determinantti on missä a2 + b2 = 1. xy -tasoa kulman arccos(a) verran ja sitten peilaa sen x-akselin suhteen. Osoittautuu, kuitenkin että f voidaan ajatella pelkkänä peilauksena Täten suoran ` f on kuvaus, joka ensin kiertää suhteen, jonka yhtälö seuraavassa määritetään. Osoitetaan ensin, että f (ū) = ū jollakin ū ∈ R2 ts. PX = X jollakin X ∈ R2 . Ensinnä- kin P X = X ⇐⇒ (P − I)X = 0 ⇐⇒ Koska det(P − I) = −(a2 − 1) − b2 = 0, riippuvat, ja täten on olemassa x ja y toteuttavat suoran ` `: kanta {ū, v̄} f ū ∈ R y=0 (a − 1)x + by = 0 on peilaus suoran jonka suhteen (P − I):n f (ū) = ū. jolle f :n A= det(A) = det(P ) = −1, Täten on todistettu seuraava: ` jos jos vaakarivit ovat lineaarisesti Lisäksi P x y = x y jos ja vain jos niin c = −1. a = 1, a 6= 1. suhteen. Lemman 1 nojalla on olemassa matriisi Koska niin x 0 = . y 0 yhtälön, kun Osoitetaan sitten, että 2 a−1 b b −a − 1 1 0 0 c . 14 f : R2 → R2 Lause 2. Olkoon lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), P sen λ = det(P ). Tällöin a −b 1 0 cos α − sin α = . b a 0 λ sin α cos α matriisi luonnollisen kannan suhteen ja 1 0 0 λ P = (a) Jos λ = 1, (b) Jos λ = −1, niin f toteuttaa ehdon (3) ja on niin f xy -tason ei toteuta ehtoa (3) ja on kun `: y=0 (a − 1)x + by = 0 kierto kulman xy -tason jos jos α verran. peilaus suoran ` suhteen, a = 1, a 6= 1. xy -tasoa ensin kulman β verkulman α + β verran. Olkoon Tarkastellaan vielä kahta peräkkäistä kiertoa: kierretään ran ja sitten kulman fα , fβ ja fα+β α verran, jolloin tasoa on kierretty ko. kiertoja vastaavat lineaarikuvaukset. Koska fα+β = fα ◦ fβ , niin nyt Lauseen 2 nojalla cos(α + β) − sin(α + β) sin(α + β) cos(α + β) = cos α − sin α sin α cos α cos β − sin β sin β cos β . Täten saamme seuraavat tutut kosinin ja sinin yhteenlaskukaavat: cos(α + β) = cos α cos β − sin α sin β sin(α + β) = sin α cos β + cos α sin β. Oletetaan sitten, että Lemma 2. Olkoon jollakin 2 P X ∈ R \ {0̄} n = 3. ortonormaali ts. 3 × 3-matriisi. f (ū) = det(P )ū, Yhtälö 2 u∈R jollakin P X = det(P )X on ratkeava . λ = det(P ) = ±1. Riittää osoittaa, että det(P − λI) = 0. Ensinnäkin P (P − λI) = I − λP T = λ(λI − P T ) = λ(λI − P )T . Koska λ det(P T ) = Todistus. Olkoon havaitaan, että T λ det(P ) = λ2 = 1, niin det(P − λI) = λ det(P T ) det(P − λI) = λ det(P T (P − λI)) = λ det(λ(λI − P )T ) = λ4 det((λI − P )T ) = det(λI − P ) = −(P − λI), ja näin ollen Avaruuden det(P − λI) = 0. R3 kierrolla tarkoitamme kuvausta origon kautta kulkevan suoran eli kiertoakselin tainen vektori ja a c b d joka kiertää avaruuden ympäri ts. jos ū R3 jonkin on kiertoakselin suun- V = {ū, v̄, w̄} on jokin oikeakätinen ortonormaali joukko, niin f :n matriisi tämän kannan suhteen on missä u f, vastaa vw-tason 1 0 0 Q = 0 a c , 0 b d kiertoa. 15 Oletetaan, että olemassa 3 ū ∈ R f joukko. Jotta f on ehdot (1) ja (2) täyttävä lineaarikuvaus ja oletetaan, että on jolle f (ū) = ū. Olkoon R3 olisi avaruuden V = {ū, v̄, w̄} jokin oikeakätinen ortonormaali kierto, vaadimme nyt että ehtojen (1) ja (2) lisäksi pätee ehto: (3') f säilyttää joukon V oikeakätisyyden ts. Lemman 1 nojalla kuvauksen f Q matriisi {f (ū), f (v̄), f (w̄)} kannan V suhteen on oikeakätinen. on muotoa 1 0 0 0 a c , Q= 0 b d missä A= a c b d , on ortonormaali. Koska {f (ū), f (v̄), f (w̄)} on oikeakätinen, niin ristitulon f (v̄) × f (w̄) = (ad − bc)ū = det(A)ū on oltava vektorin f (ū) = ū suuntainen. Täten ehdon f (ū) = ū täyttävä lineaarikuvaus täyttää ehdon (3') jos ja vain jos det(A) = 1 jos ja vain jos det(P ) = det(Q) = 1. Toisaalta Lemman 2 ja Lauseen 1 nojalla jokaisella ehdot (1) ja (2) täyttävällä lineaarikuvauksella f : R3 −→ R3 f Entäpä jos on kiertoakseli ts. sellainen vektori että toteuttaa ehdot (1) ja (2) muttei ehtoa (3')? Nyt mojen 1 ja 2 nojalla on olemassa ortonormaali kanta Q ū {ū, v̄, w̄} f (ū) = ū. det(P ) = −1 ja Lem- f :n matriisi jonka suhteen on muotoa: 1 0 0 −1 0 0 −1 0 0 Q = 0 a c = 0 0 0 0 a c , 0 b d 0 0 0 0 b d missä A= a c b d on ortonormaali ja det(A) = 1. Täten on todistettu seuraava: Lause 3. Olkoon koon missä 3 ja ū ∈ R lineaarinen kuvaus joka toteuttaa ehdot (1) ja (2), ol- f (ū) = λū. Olkoon V = {ū, v̄, w̄} joukko. Silloin kannan V suhteen f :n matriisi on: λ 0 0 λ 0 0 Q = 0 a −b = 0 cos α − sin α , 0 b a 0 sin α cos α λ = det(P ) ortonormaali f : R3 → R3 , jolle jokin oikeakätinen f (v̄) = av̄ + bw̄. λ = 1, niin f toteuttaa myös ehdon (3') ja f ympäri kulman α verran. (a) Jos (b) Jos λ = −1, niin f ei toteuta ehtoa (3') ja (u, v, w) 7→ (−u, v, w) yhdistetty kuvaus. f on avaruuden R3 kierto u-akselin on (a)-kohdan kierron ja peilauksen 16 Esimerkki 2. Esimerkin 1 peilausta voidaan ajatella avaruuden f, f (k̄) = −k̄ . Täten kierron f √1 (ī 2 ū = missä kiertoakseli on vektorin matriisi P + j̄) suuntainen ts. luonnollisen kannan R3 180 asteen kiertona f (ī) = j̄ , f (j̄) = ī ja {ī, j̄, k̄} suhteen on 0 1 0 1 0 0 . P = 0 0 −1 Valitaan sitten v̄ = √1 (ī 2 − j̄) ortogonnormaali, ja lasketaan ja f :n w̄ = k̄ , matriisi jolloin joukko Q V = {ū, v̄, w̄} oikeakätinen ja tämän kannan suhteen. Koska f (ū) = ū, 1 1 1 f (v̄) = √ f (ī − j̄) = √ f (ī) − f (j̄) = √ j̄ − ī = −v̄, 2 2 2 niin 1 0 0 A = 0 −1 0 , 0 0 −1 joka tosiaankin vastaa avaruuden R3 180 asteen kiertoa vektorin u suuntaisen suoran ympäri. Esimerkki 3. Olkoon 6 2 3 1 P = 2 3 −6 7 −3 6 2 ja tarkastellaan sen määräämää lineaarikuvausta 1, joten PX = X jollakin X ∈ R3 . f : R3 → R3 , f (X) = P X . Nyt det(P ) = Nyt −1 2 3 x x 6 2 3 0 x 0 , y 2 −4 −6 y 2 3 −6 ⇐⇒ =7 y P X = X ⇐⇒ = −3 6 −5 z 0 −3 6 2 z z 1 1 ja täten voidaan valita (x, y, z) = (2, 1, 0) ts. ū = √ 2ī+ j̄ . Valitaan lisäksi v̄ = √ ī−2j̄ 5 5 ja w̄ = −k , Q tämän kannan suhteen. jolloin V = {ū, v̄, w̄} on ortonormaali ja oikeakätinen. Lasketaan f :n Koska 7 1 7f (v̄) = √ f (ī) − 2f (j̄) = √ (6ī + 2j̄ − 3k̄) − (4ī + 6j̄ + 12k̄) 5 5 1 = √ (2ī − 4j̄ − 15k̄), 5 niin 1 1 7f (v̄) = cv̄ + dw̄ ⇐⇒ √ (2ī − 4j̄ − 15k̄) = c √ (i − 2j̄) − dk̄ 5 5 √ ⇐⇒ c = 2 ja d = 3 5, matriisi 17 ja näin ollen f (v̄) = 72 v̄ + √ 3 5 w̄. Siispä 7 1 0 0 √ 2/7 −3 5/7 . Q= 0 √ 2/7 0 3 5/7 Täten kulman f ◦ arccos(5/14) ≈ 69.1 Olkoon ts. on kierto, joka kiertää avaruuden R3 vektorin ū suuntaisen suoran ympäri verran vastapäivään. S avaruuden R3 toisen asteen pinta, jonka määräävä yhtälö on diagonaalimuotoa S : ax2 + by 2 + cz 2 = 1, S : X T DX = 1, a 0 0 D = 0 b 0 . 0 0 c ekvivalentisti missä X = (x y z) ja Havainnollistetaan animaatioiden avulla tällaisten pintojen kiertoa jonkin kiertoakselin ympäri. Olkoon siis ū ∈ R3 ja fα avaruuden kiertoakselin ympäri. Olkoon R3 {ū, v̄, w̄}, kierto kulman α verran vektorin ū suuntaisen jokin ortonormaali oikeakätinen joukko. Tämän fα matriisi on 1 0 0 Qα = 0 cos α − sin α . 0 sin α cos α kannan suhteen lineaarikuvauksen Olkoon M kannavaihdon ū = M (0, 0, 1)T . Koska M {ī, j̄, k̄} → {ū, v̄, w̄} matriisi ts. ū = M (1, 0, 0)T , v̄ = M (0, 1, 0)T , on nyt ortonormaali, niin {ī, j̄, k̄} luonnollisen kannan M −1 = M T ja kierron fα matriisi suhteen on Pα = M Q α M T . U = Pα X jos ja vain jos X = PαT U , joten X T DX = 1 jos ja vain jos U T Pα DPαT U = 1. Täten fα on R3 :n kierto, joka kuvaa pinnan S pinnaksi Nyt Rα : X T Pα DPαT X = 1. Esimerkki 4. Olkoon vaikkapa √ 1 (11ī 266 ū = √1 (ī 14 + 2j̄ + 3k̄), v̄ = − 3j̄ + k̄) α S : x2 − 3y 2 + 5z 2 = 1 w̄ = kierretään ū suuntaisen kiertoakselin ympäri, kun −2 ≤ x, y, z ≤ 2 arvosta 0 arvoon 6.2 ≈ 2π askelpituudella 0.1. verran vektorin kulkee (toistuvasti) Tässä animaatiossa puolestaan kierretään kaksivaippaista hypeboloidia 5z 2 = 1 ja + 8j̄ − 9k̄). Tässä animaatiossa yksivaippaista hypeboloidia kulman √1 (3ī 19 ja α S : x2 − 3y 2 − saman kiertoakselin ympräri. Tässä animaatiossa taasen kierrettävä objekti on ellipsoidi −2 ≤ x, y, z ≤ 2 ja kiertoakseli on edelleen sama kuin edellä. S : 2x2 + 3y 2 + 5z 2 = 1, kun
© Copyright 2025