Download Report

Kertausta: ääriarvot yhden muuttujan tapauksessa
Funktiolla f : I ⊂ R → R on lokaali (paikallinen) maksimi pisteessä
a ∈ I , jos f (x) ≤ f (a) kaikilla x:n arvoilla jossakin a:n ympäristössä
(eli riittävän lähellä pistettä a).
MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI)
Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.
Vastaavasti lokaali minimi tarkoittaa sitä, että f (x) ≥ f (a) jossakin
a:n ympäristössä.
Antti Rasila
Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa
kaikilla x ∈ I .
Aalto-yliopisto
Ääriarvoja voi esiintyä: (i) Funktion f kriittisissä pisteissä f 0 (x) = 0,
(ii) pisteissä joissa f :n derivaatta ei ole määritelty, ja (iii)
määrittelyjoukon I reunalla.
Syksy 2015
Seuraavaksi yleistetään näitä ehtoja funktion f : D ⊂ Rn → R
tapaukseen.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
1 / 18
Ääriarvot ja usean muuttujan funktiot
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
2 / 18
Esimerkki 1
Funktiolla f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali maksimi, jos
f (x) ≤ f (x0 ) jossakin pisteen x0 ympäristössä.
Vastaavasti f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali minimi, jos
f (x) ≥ f (x0 ) pisteen x0 ympäristössä.
Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on
voimassa kaikilla x ∈ D.
Ääriarvoja voi esiintyä:
1
2
3
Funktion f kriittissä pisteissä eli gradientin nollakohdissa ∇f (x) = 0,
pisteissä joissa ∇f ei ole määritelty, sekä
määrittelyjoukon D reunalla.
Funktiolla f (x, y ) = 1 − x 2 − y 2 on lokaali maksimi f (0, 0) = 1 pisteessä
(0, 0). Tämä piste on funktion f kriittinen piste, koska
∇f (0, 0) = −2xi − 2y j
= 0.
Joukon D kriittistä pistettä x0 , joka ei ole maksimi tai minimi,
kutsutaan funktion f : D → R satulapisteeksi.
(0,0)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
3 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
Esimerkki 2
Esimerkki 3
Funktiolla f (x, y ) = y 2 − x 2 on satulapiste (0, 0). Tämä piste on funktion
f kriittinen piste, koska
∇f (0, 0) = −2xi + 2y j
= 0.
Kaikki pisteet suoralla x = 0 ovat funktion f (x, y ) = −x 3 satulapisteitä.
Huomaa, että
∇f (0, y ) = −3x 2 i
= 0 kaikilla y ∈ R.
(0,0)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
5 / 18
4 / 18
(0,y )
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
6 / 18
Esimerkki 4
Esimerkki 5
p
Funktiolla f (x, y ) = x 2 + y 2 on lokaali minimi f (0, 0) = 0 pisteessä
(0, 0). Funktio f on jatkuva, mutta sen gradientti ∇f ei ole määritelty
tässä pisteessä.
Funktiolla f (x, y ) = 1 − x ei ole paikallisia ääriarvoja, jos sen
määrittelyjoukko on koko taso D = R2 . Jos määrittelyjoukoksi kuitenkin
ajatellaan esimerkiksi kiekko D = {(x, y ) : x 2 + y 2 < 1}, niin sen reunalla
saadaan maksimi f (−1, 0) = 2 ja minimi f (1, 0) = 0.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
7 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
8 / 18
Ääriarvojen luokittelu: johdanto
Hessen matriisi
Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toisen kertaluvun
osittaisderivaatat.
Ääriarvojen luokittelu perustuu suureen ∆f = f (x + h) − f (x)
tarkasteluun kriittisessä pisteessä x ∈ D.
Funktion f luonnollinen derivaattakäsite on gradientti, joka itsessään
on vektoriarvoinen funktio ∇f : Rn → Rn .
Jos ∆f saa vain positiivisia arvoja (kun khk on pieni), on piste x
minimi ja negatiivisessa tapauksessa maksimi. Jos ∆f vaihtaa
merkkiä, niin piste x ei ole minimi eikä maksimi.
Tämä johtaa funktion f toisen derivaatan tarkasteluun kriittisessä
pisteessä. Yhden muuttujan tapauksessa:
1
2
3
Siten funktion f toinen derivaatta on matriisi, jota nimitetään Hessen
matriisiksi
 2

∂2
∂
∂2
2 f (x)
∂x2 ∂x1 f (x) . . .
∂xn ∂x1 f (x)
1
 ∂x

2
2
2
∂
 ∂ f (x)
f (x)
. . . ∂x∂n ∂x2 f (x)
 ∂x ∂x

∂x22
Hf (x) =  1 .2
.
..
..


..
.
.


∂2
∂2
∂2
f (x)
∂x1 ∂xn f (x) ∂x2 ∂xn f (x) · · ·
∂x 2
Jos f 00 (x) < 0, funktiolla f lokaali maksimi pisteessä x.
Jos f 00 (x) > 0, funktiolla f lokaali minimi pisteessä x.
Jos f 00 (x) = 0, testi ei anna vastausta, ja kysymys täytyy ratkaista
muulla tavoin.
n
Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan
funktiolle.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
Koska f on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä
voidaan vaihtaa, ja kyseinen matriisi on symmetrinen. Mutta mitä
tarkoittaa matriisin positiivisuus?
9 / 18
Matriisin definiittisyys
MS-A0202
Syksy 2015
10 / 18
Toisen derivaatan testi monen muuttajan tapauksessa
Symmetristä n × n-matriisia A sanotaan positiividefiniitiksi, jos
xT Ax > 0 kaikilla nollasta poikkeavilla vektoreilla x ∈ Rn . Tällaisilla
matriiseilla on monia samoja ominaisuuksia kuin positiivisilla
reaaliluvuilla.
Yhtäpitävästi voidaan määritellä, että matriisi on positiividefiniitti, jos
sen kaikki ominaisarvot ovat positiivisia.
Toinen yhtäpitävä ehto on Sylvesterin kriteerio: Kaikilla 1 ≤ m ≤ n
matriisin A vasemmasta yläkulmasta muodostettujen
m × m-matriisien determinantti on positiivinen (nolla ei käy).
Vastaavalla tavalla voidaan määritellä negatiividefiniitti matriisi.
Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat
nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi
negatiivinen ominaisarvo.
Matriisi on negatiividefiniitti, jos Sylvesterin kriteeriossa esiintyvistä
determinateista parittomat ovat negatiivisia ja parilliset positiivisia.
Muussa tapauksessa matriisi on indefiniitti.
Antti Rasila (Aalto-yliopisto)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
11 / 18
Esimerkki 6 1/2
Lause
Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toiset osittaisderivaatat
kriittisen pisteen x ∈ D ympäristössä. Tällöin:
a) Jos Hf (x) on positiividefiniitti, niin f :llä on lokaali minimi pisteessä x.
b) Jos Hf (x) on negatiividefiniitti, niin f :llä on lokaali maksimi pisteessä
x.
c) Jos Hf (x) on indefiniitti, niin f :llä on satulapiste pisteessä x.
d) Muussa tapauksessa testi ei anna tietoa funktiosta f .
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
12 / 18
Esimerkki 6 2/2
Etsitään ja luokitellaan funktion
Lasketaan Hessen matriisi:
f (x, y , z) = x 2 y + y 2 z + z 2 − 2x


2 2 0
Hf (1, 1, −1/2) = 2 −1 2 .
0 2 2
kriittiset pisteet.
Yhtälöt kriittisille pisteille ovat
Käytetään Sylvesterin kriteeriota:
0 = f1 (x, y , z) = 2xy − 2,
0 = f2 (x, y , z) = x 2 + 2yz,
2
2 > 0,
0 = f3 (x, y , z) = y + 2z.
Nämä yhtälöt ratkaisemalla nähdään, että funktion f ainoa kriittinen
piste on P = (1, 1, −1/2).
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
13 / 18
Sovellus: Lagrangen kertojien menetelmä 1/2
Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon
optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty
materiaali) f (h, r ) = 2πrh + 2πr 2 niin, että tilavuus V (r , h) = πr 2 h
on vakio.
Asetetaan tehtävä: Minimoi f (x, y ) ehdolla g (x, y ) = 0.
Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä
(a, b) vektorien ∇f ja ∇g on oltava samansuuntaisia.
Miksi? Koska muussa tapauksessa funktiolla f olisi nollasta poikkeva
suunnattu derivaatta käyrän g (x, y ) = 0 tangentin suuntaan pisteessä
(a, b), ja siis minimi ei voi olla pisteessä (a, b).
MS-A0202
= −6 < 0,
2 2 0
2 −1 2
0 2 2
= −20 < 0.
Siten funktiolla f on satulapiste pisteessä P = (1, 1, −1/2).
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
14 / 18
Sovellus: Lagrangen kertojien menetelmä 2/2
Usein optimointitehtävissä halutaan asettaa rajoitteita optimoitaville
muuttujille.
Antti Rasila (Aalto-yliopisto)
2 2
2 −1
Syksy 2015
15 / 18
Tästä voidaan päätellä, että mikäli optimipiste on olemassa, se on
Lagrangen funktion
L(x, y , λ) = f (x, y ) + λg (x, y )
kriittinen piste (eli gradientin nollakohta).
Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen
muuttujan tapauksessa Lagrangen funktio on
L(x, y , z, λ, µ) = f (x, y , z) + λg (x, y , z) + µh(x, y , z),
missä f on minimoitava funktio ja rajoite-ehdot ovat g (x, y , z) = 0
sekä h(x, y , z) = 0.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
16 / 18
Esimerkki 7 1/2
Esimerkki 7 2/2
Minimoidaan funktio f (x, y ) =
g (x, y ) = x 2 y − 16 = 0.
x2
+
y2
ehdolla
Muodostetaan Lagrangen funktio
Ensimmäisestä yhtälöstä saadaan x = 0 tai λy = −1, mutta x = 0 on
ristiriidassa kolmannen yhtälön kanssa.
L(x, y , λ) = x 2 + y 2 + λ(x 2 y − 16).
Siten
Yhtälöt kriittisille pisteille ovat
0 =
0 =
0 =
Antti Rasila (Aalto-yliopisto)
0 = 2y 2 + λyx 2 = 2y 2 − x 2 .
√
Tästä saadaan edelleen x = ± 2y , ja 2y 3 = 16 eli y = 2.
√
Minimejä on siis kaksi: (±2 2, 2).
∂L
= 2x(1 + λy ),
∂x
∂L
= 2y + λx 2 ,
∂y
∂L
= x 2 y − 16.
∂λ
MS-A0202
Syksy 2015
17 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
18 / 18