MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI) Luento 6

Kertausta: ääriarvot yhden muuttujan tapauksessa
Funktiolla f : I ⊂ R → R on lokaali (paikallinen) maksimi pisteessä
a ∈ I , jos f (x) ≤ f (a) kaikilla x:n arvoilla jossakin a:n ympäristössä
(eli riittävän lähellä pistettä a).
MS-A0202 Differentiaali- ja integraalilaskenta 2 (SCI)
Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.
Vastaavasti lokaali minimi tarkoittaa sitä, että f (x) ≥ f (a) jossakin
a:n ympäristössä.
Antti Rasila
Maksimi tai minimi on globaali, jos kyseinen epäyhtälö on voimassa
kaikilla x ∈ I .
Aalto-yliopisto
Ääriarvoja voi esiintyä: (i) Funktion f kriittisissä pisteissä f 0 (x) = 0,
(ii) pisteissä joissa f :n derivaatta ei ole määritelty, ja (iii)
määrittelyjoukon I reunalla.
Syksy 2015
Seuraavaksi yleistetään näitä ehtoja funktion f : D ⊂ Rn → R
tapaukseen.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
1 / 18
Ääriarvot ja usean muuttujan funktiot
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
2 / 18
Esimerkki 1
Funktiolla f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali maksimi, jos
f (x) ≤ f (x0 ) jossakin pisteen x0 ympäristössä.
Vastaavasti f : D ⊂ Rn → R on pisteessä x0 ∈ D lokaali minimi, jos
f (x) ≥ f (x0 ) pisteen x0 ympäristössä.
Ääriarvo on globaali eli absoluuttinen, jos kyseinen epäyhtälö on
voimassa kaikilla x ∈ D.
Ääriarvoja voi esiintyä:
1
2
3
Funktion f kriittissä pisteissä eli gradientin nollakohdissa ∇f (x) = 0,
pisteissä joissa ∇f ei ole määritelty, sekä
määrittelyjoukon D reunalla.
Funktiolla f (x, y ) = 1 − x 2 − y 2 on lokaali maksimi f (0, 0) = 1 pisteessä
(0, 0). Tämä piste on funktion f kriittinen piste, koska
∇f (0, 0) = −2xi − 2y j
= 0.
Joukon D kriittistä pistettä x0 , joka ei ole maksimi tai minimi,
kutsutaan funktion f : D → R satulapisteeksi.
(0,0)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
3 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
Esimerkki 2
Esimerkki 3
Funktiolla f (x, y ) = y 2 − x 2 on satulapiste (0, 0). Tämä piste on funktion
f kriittinen piste, koska
∇f (0, 0) = −2xi + 2y j
= 0.
Kaikki pisteet suoralla x = 0 ovat funktion f (x, y ) = −x 3 satulapisteitä.
Huomaa, että
∇f (0, y ) = −3x 2 i
= 0 kaikilla y ∈ R.
(0,0)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
5 / 18
4 / 18
(0,y )
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
6 / 18
Esimerkki 4
Esimerkki 5
p
Funktiolla f (x, y ) = x 2 + y 2 on lokaali minimi f (0, 0) = 0 pisteessä
(0, 0). Funktio f on jatkuva, mutta sen gradientti ∇f ei ole määritelty
tässä pisteessä.
Funktiolla f (x, y ) = 1 − x ei ole paikallisia ääriarvoja, jos sen
määrittelyjoukko on koko taso D = R2 . Jos määrittelyjoukoksi kuitenkin
ajatellaan esimerkiksi kiekko D = {(x, y ) : x 2 + y 2 < 1}, niin sen reunalla
saadaan maksimi f (−1, 0) = 2 ja minimi f (1, 0) = 0.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
7 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
8 / 18
Ääriarvojen luokittelu: johdanto
Hessen matriisi
Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toisen kertaluvun
osittaisderivaatat.
Ääriarvojen luokittelu perustuu suureen ∆f = f (x + h) − f (x)
tarkasteluun kriittisessä pisteessä x ∈ D.
Funktion f luonnollinen derivaattakäsite on gradientti, joka itsessään
on vektoriarvoinen funktio ∇f : Rn → Rn .
Jos ∆f saa vain positiivisia arvoja (kun khk on pieni), on piste x
minimi ja negatiivisessa tapauksessa maksimi. Jos ∆f vaihtaa
merkkiä, niin piste x ei ole minimi eikä maksimi.
Tämä johtaa funktion f toisen derivaatan tarkasteluun kriittisessä
pisteessä. Yhden muuttujan tapauksessa:
1
2
3
Siten funktion f toinen derivaatta on matriisi, jota nimitetään Hessen
matriisiksi
 2

∂2
∂
∂2
2 f (x)
∂x2 ∂x1 f (x) . . .
∂xn ∂x1 f (x)
1
 ∂x

2
2
2
∂
 ∂ f (x)
f (x)
. . . ∂x∂n ∂x2 f (x)
 ∂x ∂x

∂x22
Hf (x) =  1 .2
.
..
..


..
.
.


∂2
∂2
∂2
f (x)
∂x1 ∂xn f (x) ∂x2 ∂xn f (x) · · ·
∂x 2
Jos f 00 (x) < 0, funktiolla f lokaali maksimi pisteessä x.
Jos f 00 (x) > 0, funktiolla f lokaali minimi pisteessä x.
Jos f 00 (x) = 0, testi ei anna vastausta, ja kysymys täytyy ratkaista
muulla tavoin.
n
Seuraavaksi yritetään yleistää tätä ajatusta monen muuttujan
funktiolle.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
Koska f on kaksi kertaa jatkuvasti derivoituva, derivoinnin järjestystä
voidaan vaihtaa, ja kyseinen matriisi on symmetrinen. Mutta mitä
tarkoittaa matriisin positiivisuus?
9 / 18
Matriisin definiittisyys
MS-A0202
Syksy 2015
10 / 18
Toisen derivaatan testi monen muuttajan tapauksessa
Symmetristä n × n-matriisia A sanotaan positiividefiniitiksi, jos
xT Ax > 0 kaikilla nollasta poikkeavilla vektoreilla x ∈ Rn . Tällaisilla
matriiseilla on monia samoja ominaisuuksia kuin positiivisilla
reaaliluvuilla.
Yhtäpitävästi voidaan määritellä, että matriisi on positiividefiniitti, jos
sen kaikki ominaisarvot ovat positiivisia.
Toinen yhtäpitävä ehto on Sylvesterin kriteerio: Kaikilla 1 ≤ m ≤ n
matriisin A vasemmasta yläkulmasta muodostettujen
m × m-matriisien determinantti on positiivinen (nolla ei käy).
Vastaavalla tavalla voidaan määritellä negatiividefiniitti matriisi.
Matriisin sanotaan olevan indefiniitti, jos sen kaikki ominaisarvot ovat
nollasta poikkeavia ja sillä on vähintään yksi positiivinen sekä yksi
negatiivinen ominaisarvo.
Matriisi on negatiividefiniitti, jos Sylvesterin kriteeriossa esiintyvistä
determinateista parittomat ovat negatiivisia ja parilliset positiivisia.
Muussa tapauksessa matriisi on indefiniitti.
Antti Rasila (Aalto-yliopisto)
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
11 / 18
Esimerkki 6 1/2
Lause
Olkoon f : D ⊂ Rn → R funktio, jolla on jatkuvat toiset osittaisderivaatat
kriittisen pisteen x ∈ D ympäristössä. Tällöin:
a) Jos Hf (x) on positiividefiniitti, niin f :llä on lokaali minimi pisteessä x.
b) Jos Hf (x) on negatiividefiniitti, niin f :llä on lokaali maksimi pisteessä
x.
c) Jos Hf (x) on indefiniitti, niin f :llä on satulapiste pisteessä x.
d) Muussa tapauksessa testi ei anna tietoa funktiosta f .
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
12 / 18
Esimerkki 6 2/2
Etsitään ja luokitellaan funktion
Lasketaan Hessen matriisi:
f (x, y , z) = x 2 y + y 2 z + z 2 − 2x


2 2 0
Hf (1, 1, −1/2) = 2 −1 2 .
0 2 2
kriittiset pisteet.
Yhtälöt kriittisille pisteille ovat
Käytetään Sylvesterin kriteeriota:
0 = f1 (x, y , z) = 2xy − 2,
0 = f2 (x, y , z) = x 2 + 2yz,
2
2 > 0,
0 = f3 (x, y , z) = y + 2z.
Nämä yhtälöt ratkaisemalla nähdään, että funktion f ainoa kriittinen
piste on P = (1, 1, −1/2).
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
13 / 18
Sovellus: Lagrangen kertojien menetelmä 1/2
Tyypillinen esimerkki tällaisesta tehtävästä on peltipurkin muodon
optimointi: Halutaan minimoida purkin pinta-ala (eli käytetty
materiaali) f (h, r ) = 2πrh + 2πr 2 niin, että tilavuus V (r , h) = πr 2 h
on vakio.
Asetetaan tehtävä: Minimoi f (x, y ) ehdolla g (x, y ) = 0.
Havaitaan, että mikäli ongelmalla on ratkaisu, niin ratkaisupisteessä
(a, b) vektorien ∇f ja ∇g on oltava samansuuntaisia.
Miksi? Koska muussa tapauksessa funktiolla f olisi nollasta poikkeva
suunnattu derivaatta käyrän g (x, y ) = 0 tangentin suuntaan pisteessä
(a, b), ja siis minimi ei voi olla pisteessä (a, b).
MS-A0202
= −6 < 0,
2 2 0
2 −1 2
0 2 2
= −20 < 0.
Siten funktiolla f on satulapiste pisteessä P = (1, 1, −1/2).
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
14 / 18
Sovellus: Lagrangen kertojien menetelmä 2/2
Usein optimointitehtävissä halutaan asettaa rajoitteita optimoitaville
muuttujille.
Antti Rasila (Aalto-yliopisto)
2 2
2 −1
Syksy 2015
15 / 18
Tästä voidaan päätellä, että mikäli optimipiste on olemassa, se on
Lagrangen funktion
L(x, y , λ) = f (x, y ) + λg (x, y )
kriittinen piste (eli gradientin nollakohta).
Menetelmä yleistyy myös useammalle muuttujalle. Esimerkiksi kolmen
muuttujan tapauksessa Lagrangen funktio on
L(x, y , z, λ, µ) = f (x, y , z) + λg (x, y , z) + µh(x, y , z),
missä f on minimoitava funktio ja rajoite-ehdot ovat g (x, y , z) = 0
sekä h(x, y , z) = 0.
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
16 / 18
Esimerkki 7 1/2
Esimerkki 7 2/2
Minimoidaan funktio f (x, y ) =
g (x, y ) = x 2 y − 16 = 0.
x2
+
y2
ehdolla
Muodostetaan Lagrangen funktio
Ensimmäisestä yhtälöstä saadaan x = 0 tai λy = −1, mutta x = 0 on
ristiriidassa kolmannen yhtälön kanssa.
L(x, y , λ) = x 2 + y 2 + λ(x 2 y − 16).
Siten
Yhtälöt kriittisille pisteille ovat
0 =
0 =
0 =
Antti Rasila (Aalto-yliopisto)
0 = 2y 2 + λyx 2 = 2y 2 − x 2 .
√
Tästä saadaan edelleen x = ± 2y , ja 2y 3 = 16 eli y = 2.
√
Minimejä on siis kaksi: (±2 2, 2).
∂L
= 2x(1 + λy ),
∂x
∂L
= 2y + λx 2 ,
∂y
∂L
= x 2 y − 16.
∂λ
MS-A0202
Syksy 2015
17 / 18
Antti Rasila (Aalto-yliopisto)
MS-A0202
Syksy 2015
18 / 18