Ii. Funkcje Wielu Zmiennych

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 18

II.

FUNKCJE WIELU ZMIENNYCH

1. Zbiory w przestrzeni Rn

Ustalmy dowolne n ∈ N.
Definicja 1.1. Zbiór wszystkich uporzadkowanych układów (x1 , . . . , xn ) n liczb rzeczywistych,
nazywamy przestrzenią n-wymiarową i oznaczamy ją symbolem Rn . Czyli
def
Rn = {(x1 , . . . , xn ) : x1 , . . . , xn ∈ R} .

Elementy (x1 , . . . , xn ) ∈ Rn nazywamy punktami przestrzeni Rn , zaś liczby x1 , . . . , xn nazywamy


współrzędnymi kartezjańskimi (prostokątnymi) tych punktów.

Definicja 1.2. Odległość dwóch punktów P1 , P2 przestrzeni Rn oznaczamy symbolem d (P1 , P2 )


i określamy wzorem q
def
d (P1 , P2 ) = (y1 − x1 )2 + · · · + (yn − xn )2 ,
gdy P1 = (x1 , . . . , xn ), P2 = (y1 , . . . , yn ).

Definicja 1.3. Otoczeniem o promieniu r > 0 punktu P0 ∈ Rn nazywamy zbiór


def
O (P0 , r) = {P ∈ Rn : d (P0 , P ) < r} .

Uwaga 1.1. Otoczeniem punktu P0 w przestrzeni R2 (tzn. na płaszczyźnie) jest koło otwarte
o środku w punkcie P0 i promieniu r. Otoczeniem punktu P0 w przestrzeni R3 jest kula otwarta
o środku w punkcie P0 i promieniu r.

Definicja 1.4. Sąsiedztwem o promieniu r > 0 punktu P0 ∈ Rn nazywamy zbiór


def
S (P0 , r) = O (P0 , r) \ {P0 } .

Uwaga 1.2. Sąsiedztwem punktu P0 w przestrzeni R2 (tzn. na płaszczyźnie) jest koło otwarte
o środku w punkcie P0 i promieniu r bez środka. Sąsiedztwem punktu P0 w przestrzeni R3 jest kula
otwarta o środku w punkcie P0 i promieniu r bez środka.

Definicja 1.5. Zbiór A ⊂ Rn nazywamy ograniczonym, jeżeli jest zawarty w otoczeniu pewnego
punktu, tzn. istnieje taki punkt P0 ∈ Rn i promień r > 0, że

A ⊂ O (P0 , r) .

W przeciwnym przypadku mówimy, że zbiór A nie jest ograniczony.

Definicja 1.6. Niech A ⊂ Rn . Punkt P ∈ A nazywamy punktem wewnętrznym zbioru A, jeżeli


istnieje otoczenie tego punktu zawarte w tym zbiorze, tzn. istnieje taka liczba dodatnia r, że

O (P, r) ⊂ A.

1
Wnętrzem zbioru nazywamy zbiór wszystkich jego punktów wewnętrznych.

Definicja 1.7. Zbiór A ⊂ Rn nazywamy otwartym, jeżeli każdy punkt tego zbioru jest jego
punktem wewnętrznym.

Definicja 1.8. Niech A ⊂ Rn . Punkt P ∈ A nazywamy punktem brzegowym zbioru A, jeżeli


w każdym otoczeniu tego punktu można znaleźć punkty należące i punkty nie należące do tego zbioru,
tzn. dla każdej liczby dodatniej r zachodzi warunek

O (P, r) ∩ A 6= ∅ oraz O (P, r) ∩ A0 6= ∅.

Brzegiem zbioru nazywamy zbiór wszystkich jego punktów brzegowych.

Definicja 1.9. Niech A ⊂ Rn . Punkt P ∈ Rn nazywamy punktem skupienia zbioru A, jeżeli


w każdym sąsiedztwie tego punktu można znaleźć punkty ze zbioru A, tzn. dla każdej liczby dodatniej
r zachodzi warunek
S (P, r) ∩ A 6= ∅.

Definicja 1.10. Zbiór A ⊂ Rn nazywamy domkniętym, jeżeli zawiera swoje punkty skupienia.

Definicja 1.11. Niepusty podzbiór przestrzeni Rn nazywamy obszarem, jeżeli jest zbiorem
otwartym i każde dwa punkty tego zbioru można połączyć łamaną całkowicie zawartą w tym zbiorze.
Jeśli do obszaru dodamy jego brzeg, to taki zbiór nazywamy obszarem domkniętym.

2. Granica i ciągłość funkcji n-zmiennych

Ustalmy dowolne n ∈ N.

Definicja 2.1. Funkcją n zmiennych określoną na zbiorze A ⊂ Rn o wartościach w zbiorze R


nazywamy przyporządkowanie każdemu punktowi ze zbioru A dokładnie jednej liczby rzeczywistej.
Będziemy wówczas pisać
f : A → R.
Wartość funkcji f w punkcie (x1 , . . . , xn ) ∈ A oznaczamy przez f (x1 , . . . , xn ).

Definicja 2.2. Ciągiem punktów przestrzeni Rn nazywamy taką funkcję, która każdej liczbie
naturalnej przyporządkowuje dokładnie jeden punkt przestrzeni Rn . Wartość tego odwzorowania
 dla
k k
liczby naturalnej k nazywamy k-tym wyrazem ciągu i oznaczamy przez Pk = x1 , . . . , xn . Ciąg taki
oznaczamy symbolem (Pk )k∈N .

Definicja 2.3. Mówimy, że ciąg (Pk )k∈N punktów przestrzeni Rn jest zbieżny do punktu P0 ∈ Rn ,
jeżeli
lim d (Pk , P0 ) = 0.
k→∞

Piszemy wówczas
lim Pk = P0 .
k→∞

2

Twierdzenie 2.1. Ciąg (Pk )k∈N = xk1 , . . . , xkn k∈N punktów przestrzeni Rn jest zbieżny do
punktu P0 = (x01 , . . . , x0n ) ∈ Rn wtedy i tylko wtedy, gdy
^
lim xki = x0i .
k→∞
1≤i≤n


2k+5

k

Przykład 2.1. Ciąg (Pk )k∈N = 4k+2
, 3k + 5k punktów płaszczyzny R2 jest zbieżny do
k∈N
punktu P0 = 21 , 5 , bo


2k + 5 2 1 p
k
lim = = ∧ lim 3k + 5k = 5.
k→∞ 4k + 2 4 2 k→∞

Definicja 2.4. (Heinego)


Niech A będzie niepustym podzbiorem przestrzeni Rn . Załóżmy ponadto, że P0 jest punktem sku-
pienia zbioru A oraz f : A → R.

(i) Mówimy, że liczba g ∈ R jest granicą funkcji f w punkcie P0 , jeżeli

lim f (Pk ) = g,
k→∞

dla każdego ciągu (Pk )k∈N spełniającego warunki


^
(Pk ∈ A ∧ Pk 6= P0 ) oraz lim Pk = P0 .
k→∞
k∈N

Ponadto, piszemy wówczas


lim f (P ) = g,
P →P0

lub
lim f (x1 , . . . , xn ) = g,
(x1 ,...,xn )→(x01 ,...,x0n )

gdy P = (x1 , . . . , xn ) i P0 = (x01 , . . . , x0n ).


(ii) Mówimy, że funkcja f ma w punkcie P0 granicę niewłaściwą równą +∞ [−∞], co zapisujemy
 
lim f (P ) = +∞, lim f (P ) = −∞,
P →P0 P →P0

gdy h i
lim f (Pk ) = +∞, lim f (Pk ) = −∞,
k→∞ k→∞

dla każdego ciągu (Pk )k∈N spełniającego warunki


^
(Pk ∈ A ∧ Pk 6= P0 ) oraz lim Pk = P0 .
k→∞
k∈N

3
Dla funkcji wielu zmiennych zachodzi analogiczne twierdzenie o arytmetyce granic jak dla funkcji
jednej zmiennej. Podamy jego sformułowanie dla funkcji dwóch zmiennych.

Twierdzenie 2.2. Niech A będzie niepustym podzbiorem płaszczyzny R2 . Załóżmy ponadto, że


(x0 , y0 ) jest punktem skupienia zbioru A oraz f : A → R i g : A → R. Jeżeli funkcje f i g mają
w punkcie (x0 , y0 ) granice właściwe, to
(i) lim (f (x, y) + g (x, y)) = lim f (x, y) + lim g (x, y),
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

(ii) lim (f (x, y) − g (x, y)) = lim f (x, y) − lim g (x, y),
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

(iii) lim (c · f (x, y)) = c · lim f (x, y) dla dowolnego c ∈ R,


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

(iv) lim (f (x, y) · g (x, y)) = lim f (x, y) · lim g (x, y),
(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

lim f (x,y)
f (x,y) (x,y)→(x0 ,y0 )
(v) lim = , o ile lim g (x, y) 6= 0.
(x,y)→(x0 ,y0 ) g(x,y) lim
(x,y)→(x0 ,y0 )
g(x,y) (x,y)→(x0 ,y0 )

Przykład 2.2.
x−y x−y 1 1
lim 2 2
= lim = lim =
(x,y)→(1,1) x − y (x,y)→(1,1) (x − y)(x + y) (x,y)→(1,1) x + y 2

Definicja 2.5. (Heinego)


Niech A będzie niepustym podzbiorem przestrzeni Rn i niech f : A → R.

(i) Mówimy, że funkcja f jest ciągła w punkcie P0 ∈ A, jeżeli


lim f (Pk ) = f (P0 ) ,
k→∞

dla każdego ciągu (Pk )k∈N punktów należących do zbioru A zbieżnego do punktu P0 .
(ii) Mówimy, że funkcja f jest ciągła w zbiorze A, jeżeli jest ciągła w każdym punkcie tego zbioru.

Uwaga 2.1. Niech A będzie niepustym podzbiorem przestrzeni Rn . Jeżeli P0 ∈ A jest również
punktem skupienia zbioru A , to funkcja f : A → R jest ciągła w punkcie P0 wtedy i tylko wtedy,
gdy istnieje granica lim f (P ) i jest równa f (P0 ), tj.
P →P0

lim f (P ) = f (P0 ) .
P →P0

Twierdzenie 2.3. (O ciągłości sumy, różnicy, iloczynu i ilorazu funkcji )


f
Jeżeli funkcje f i g są ciągłe w punkcie P0 , to funkcje f + g, f − g, f · g oraz g
(o ile g (P0 ) 6= 0) są
ciągłe w punkcie P0 .

4
Twierdzenie 2.4. (Weierstrassa o ograniczoności i osiąganiu kresów )
Funkcja ciągła f określona na zbiorze domkniętym i ograniczonym D ⊂ Rn jest ograniczona i osiąga
swoje kresy.

3. Pochodna kierunkowa. Pochodne cząstkowe.

Ustalmy dowolne n ∈ N.

Definicja 3.1. Niech A będzie niepustym i otwartym podzbiorem przestrzeni Rn , f : A → R,


P0 = (x01 , . . . , x0n ) ustalonym punktem zbioru A, a v = (v1 , . . . , vn ) niech będzie dowolnym wersorem
(wektorem o długości 1) z przestrzeni Rn .
Jeżeli istnieje skończona granica
f (P0 + tv) − f (P0 )
lim ,
t→0 t
to nazywamy ją pochodną kierunkową funkcji f w punkcie P0 w kierunku wektora v i oznaczamy
symbolem ∇v f (P0 ). Zatem
f (P0 + tv) − f (P0 )
∇v f (P0 ) = lim .
t→0 t

Przykład 3.1. Wyznaczymy pochodną kierunkową funkcji f określonej wzorem

f (x, y) = x2 + y 2 − 2,

w punkcie P0 = (1, 1) w kierunku wektora v = (1, 0).


f ((1, 1) + t(1, 0)) − f (1, 1) f (1 + t, 1) − f (1, 1)
∇v f (1, 1) = lim = lim
t→0 t t→0 t
(1 + t)2 + 12 − 2 − 0 t2 + 2t t (t + 2)
= lim = lim = lim = lim (t + 2) = 2
t→0 t t→0 t t→0 t t→0

Niech dalej ei , gdzie i ∈ {1, 2, . . . , n}, oznaczają wektory bazy kanonicznej w przestrzeni Rn , czyli

ei = (0, . . . , 0, 1, 0, . . . , 0), i ∈ {1, 2, . . . , n} .


| {z } | {z }
i−1 n−i

Definicja 3.2. Niech A będzie niepustym i otwartym podzbiorem przestrzeni Rn ,


f : A → R, P0 = (x01 , . . . , x0n ) ustalonym punktem zbioru A. Pochodne kierunkowe ∇ei f (P0 ), gdzie
i ∈ {1, 2, . . . , n}, nazywamy pochodnymi cząstkowymi funkcji f w punkcie P0 i oznaczamy

∇ei f (P0 ) = ∂i f (P0 ) , i ∈ {1, 2, . . . , n} .

5
Pochodne cząstkowe wyższych rzędów

Definicja 3.3. Załóżmy, że funkcja f n-zmiennych ma pochodne cząstkowe ∂i f , dla każdego


i ∈ {1, 2, . . . , n}, w każdym punkcie pewnego zbioru otwartego A ⊂ Rn . Przy takim założeniu
każda z pochodnych cząstkowych ∂i f jest funkcją n-zmiennych. Pochodne cząstkowe pierwszego rzędu
funkcji ∂i f , wyznaczone względem j-tej zmiennej, gdzie j ∈ {1, 2, . . . , n}, nazywamy pochodnymi
cząstkowymi drugiego rzędu funkcji f i oznaczamy symbolem

∂ij2 f, i, j ∈ {1, 2, . . . , n} .

Pochodne cząstkowe drugiego rzędu funkcji f , otrzymane przez różniczkowanie tej funkcji wzglę-
dem różnych zmiennych, nazywamy pochodnymi cząstkowymi drugiego rzędu mieszanymi.

Uwaga 3.1. W szczególności funkcja f dwóch zmiennych ma cztery pochodne cząstkowe drugiego
rzędu
2 2 2 2
∂11 f, ∂12 f, ∂21 f, ∂22 f,
zaś funkcja f trzech zmiennych ma dziewięć pochodnych cząstkowych drugiego rzędu
2 2 2
∂11 f, ∂12 f, ∂13 f,

2 2 2
∂21 f, ∂22 f, ∂23 f,

2 2 2
∂31 f, ∂32 f, ∂33 f.

Uwaga 3.2. Przy obliczniu pochodnej cząstkowej względem jednej zmiennej pozostałe traktu-
jemy jak stałe. Do obliczania pochodnych cząstkowych można stosować reguły różniczkowania funkcji
jednej zmiennej, tj. wzory na pochodne sumy, różnicy, iloczynu, ilorazu oraz złożenia funkcji.

Przykład 3.2. Niech funkcja f : R2 → R będzie określona wzorem

f (x, y) = x2 + y 2 + 2xy + 3x − 4y + 7, (x, y) ∈ R2 .

Dla dowolnych (x, y) ∈ R2 mamy

∂1 f (x, y) = 2x + 2y + 3, ∂2 f (x, y) = 2y + 2x − 4,

oraz
2 2 2 2
∂11 f (x, y) = 2, ∂12 f (x, y) = 2, ∂21 f (x, y) = 2, ∂22 f (x, y) = 2.

Pochodne cząstkowe rzędu trzeciego, czwartego, . . . , definiujemy analogicznie jak pochodne cząst-
kowe rzędu drugiego.

Definicja 3.4. Niech k ∈ N, k ≥ 2. Pochodną cząstkową rzędu k funkcji f , nazywamy pochodną


cząstkową pierwszego rzędu z pochodnej cząstkowej rzędu k − 1 funkcji f .
Pochodną cząstkową rzędu k, określoną przez różniczkowanie względem co najmniej dwóch róż-
nych zmiennych, nazywamy pochodną cząstkową mieszaną rzędu k.

6
Twierdzenie 3.1. (Schwarza)
Niech funkcja f , n-zmiennych, określona w zbiorze otwartym A ⊂ Rn , ma w tym zbiorze wszystkie
możliwe pochodne cząstkowe do rzędu k − 1 włącznie i mieszane rzędu k, k ∈ N, k ≥ 2, wszystkie
ciągłe w zbiorze A. Wtedy pochodna cząstkowa mieszana rzędu k funkcji f nie zależy od porządku
w jakim zostało wykonane różniczkowanie.

Interpretacje geometryczne pochodnej kierunkowej i pochodnych cząstkowych

Podamy interpretacje w przypadku funkcji dwóch zmiennych.

Fakt 3.1. (Interpretacja geometryczna pochodnej kierunkowej )


Niech (x0 , y0 ) ∈ R2 i niech funkcja f będzie określona na pewnym otoczeniu O ((x0 , y0 ), r). Ponadto
niech γ oznacza kąt nachylenia do płaszczyzny xOy półstycznej do krzywej otrzymanej w wyniku
przekroju wykresu funkcji f półpłaszczyzną przechodzącą przez prostą x = x0 , y = y0 i równoległą
do wersora v. Wtedy
∇v f (x0 , y0 ) = tgγ.
Pochodna kierunkowa określa szybkość zmiany wartości funkcji f w kierunku wektora v.

Rysunek 1: Interpretacja geometryczna pochodnej kierunkowej funkcji

7
Fakt 3.2. (Interpretacja geometryczna pochodnych cząstkowych)
Niech (x0 , y0 ) ∈ R2 i niech funkcja z = f (x, y), określona na pewnym otoczeniu O ((x0 , y0 ), r), ma
pochodne cząstkowe pierwszego rzędu w punkcie (x0 , y0 ). Ponadto niech α oznacza kąt nachylenia
stycznej do krzywej otrzymanej w wyniku przekroju wykresu funkcji f płaszczyzną y = y0 w punkcie
(x0 , y0 , f (x0 , y0 )) do płaszczyzny xOy. Wtedy

∂1 f (x0 , y0 ) = tgα.

Rysunek 2: Interpretacja geometryczna pochodnej cząstkowej ∂1 f (x0 , y0 )

Pochodna cząstkowa ∂1 f (x0 , y0 ) jest miarą lokalnej zmiany szybkości wzrostu funkcji f względem
zmiennej x przy ustalonej wartości zmiennej y.
Podobnie, jeśli β oznacza kąt nachylenia stycznej do krzywej otrzymanej w wyniku przekroju
wykresu funkcji f płaszczyzną x = x0 w punkcie (x0 , y0 , f (x0 , y0 )) do płaszczyzny xOy, to

∂2 f (x0 , y0 ) = tgβ.

Rysunek 3: Interpretacja geometryczna pochodnej cząstkowej ∂2 f (x0 , y0 )

Pochodna cząstkowa ∂2 f (x0 , y0 ) jest miarą lokalnej zmiany szybkości wzrostu funkcji f względem
zmiennej y przy ustalonej wartości zmiennej x.

8
4. Różniczkowalność funkcji, różniczka zupełna, gradient funkcji

Niech A będzie otwartym podzbiorem przestrzeni Rn oraz niech P0 = (x01 , . . . , x0n ) będzie ustalo-
nym punktem zbioru A. Załóżmy też, że (x01 + ∆x1 , . . . , x0n + ∆xn ) ∈ A oraz f : A → R.

Definicja 4.1. Wyrażenie

∆f (P0 ) := f x01 + ∆x1 , . . . , x0n + ∆xn − f x01 , . . . , x0n


 

nazywamy przyrostem zupełnym funkcji f w punkcie P0 , odpowiadającym przyrostom ∆x1 , . . . , ∆xn .

Definicja 4.2. Mówimy, że funkcja f jest różniczkowalna w punkcie P0 = (x01 , . . . , x0n ) , jeżeli
istnieją takie stałe C1 , . . . , Cn oraz otoczenie punktu P0 , że dla punktów (x01 + ∆x1 , . . . , x0n + ∆xn )
z tego otoczenia przyrost ∆f (P0 ) można przedstawić w postaci

∆f (P0 ) = C1 ∆x1 + . . . + Cn ∆xn + r (∆x1 , . . . , ∆xn ) ,

przy czym
r (∆x1 , . . . , ∆xn )
lim q = 0.
(∆x1 ,...,∆xn )→(0,...,0)
(∆x1 )2 + . . . + (∆xn )2

Twierdzenie 4.1. Jeżeli funkcja f jest różniczkowalna w punkcie P0 , to istnieją w tym punkcie
skończone pochodne cząstkowe ∂i f (P0 ), dla każdego i ∈ {1, . . . , n}, funkcji f oraz
^
Ci = ∂i f (P0 ) ,
i∈{1,...,n}

a więc
∆f (P0 ) = ∂1 f (P0 ) ∆x1 + . . . + ∂n f (P0 ) ∆xn + r (∆x1 , . . . , ∆xn ) .

Twierdzenie 4.2. Jeżeli funkcja jest różniczkowalna w punkcie P0 , to jest w tym punkcie ciągła.

Twierdzenie 4.3. Jeżeli funkcja f ma pochodne cząstkowe pierwszego rzędu w każdym punkcie
pewnego otoczenia punktu P0 i te pochodne cząstkowe są ciągłe w punkcie P0 , to funkcja f jest
różniczkowalna w punkcie P0 .

Przykład 4.1. Rozważmy funkcję

f (x, y) = x2 y 3 + 2xy + 3, dla (x, y) ∈ R2 .

Wtedy dla (x, y) ∈ R2 mamy

∂1 f (x, y) = 2xy 3 + 2y, ∂2 f (x, y) = 3x2 y 2 + 2x.

Zauważmy więc, że pochodne cząstkowe są określone i ciągłe w każdym punkcie płaszczyzny R2 . Na


mocy ostatniego twierdzenia funkcja f jest różniczkowalna w każdym punkcie przestrzeni R2 .

Uwaga 4.1. Istnienie pochodnych cząstkowych funkcji f w punkcie P0 nie gwarantuje jej róż-
niczkowalności w tym punkcie.

9
Twierdzenie 4.4. Załóżmy, że funkcja f ma wszystkie pochodne cząstkowe pierwszego rzędu
w punkcie P0 . Funkcja f jest różniczkowalna w punkcie P0 wtedy i tylko wtedy, gdy
n
f (x01 + ∆x1 , . . . , x0n + ∆xn ) − f (x01 , . . . , x0n ) −
P
∂i f (P0 ) ∆xi
i=1
lim q = 0.
(∆x1 ,...,∆xn )→(0,...,0) 2 2
(∆x1 ) + . . . + (∆xn )

Przedstawimy teraz interpretację geometryczną różniczkowalności funkcji w punkcie w przypadku


funkcji dwóch zmiennych.

Fakt 4.1. (Interpretacja geometryczna różniczkowalności funkcji w punkcie)


Różniczkowalność funkcji f w punkcie P0 = (x0 , y0 ) oznacza istnienie płaszczyzny stycznej do wykresu
tej funkcji w punkcie (P0 , f (P0 )).

Rysunek 4: Płaszczyzna styczna do wykresu funkcji

Fakt 4.2. (Równanie płaszczyzny stycznej do wykresu funkcji )


Załóżmy, że funkcja dwóch zmiennych f ma ciągłe pochodne cząstkowe pierwszego rzędu w punkcie
P0 = (x0 , y0 ). Równanie płaszczyzny stycznej do wykresu funkcji f w punkcie (P0 , f (P0 )) ma postać

z − f (P0 ) = ∂1 f (P0 ) (x − x0 ) + ∂2 f (P0 ) (y − y0 ) .

Definicja 4.3. Niech P0 = (x01 , . . . , x0n ) będzie ustalonym punktem przestrzeni Rn i niech funkcja
f ma wszystkie pochodne cząstkowe pierwszego rzędu w punkcie P0 . Różniczką funkcji f w punkcie
P0 nazywamy funkcję określoną wzorem

dfP0 (∆x1 , . . . , ∆xn ) := ∂1 f (P0 )∆x1 + · · · + ∂n f (P0 )∆xn .

Różniczkę funkcji f oznacza się również symbolem df (P0 ) lub krótko df .

10
Fakt 4.3. (Zastosowanie różniczki funkcji do obliczeń przybliżonych)
Niech P0 = (x01 , . . . , x0n ) będzie ustalonym punktem przestrzeni Rn oraz niech funkcja f , określona
przynajmniej na pewnym otoczeniu punktu P0 , ma ciągłe pochodne cząstkowe pierwszego rzędu w
punkcie P0 . Wtedy

f x01 + ∆x1 , . . . , x0n + ∆xn ≈ f x01 , . . . , x0n + dfP0 (∆x1 , . . . , ∆xn ) .


 

Definicja 4.4. Niech P0 = (x01 , . . . , x0n ) ∈ Rn . Załóżmy, że funkcja f ma wszystkie pochodne


cząstkowe pierwszego rzędu w punkcie P0 . Gradientem funkcji f w punkcie P0 nazywamy wektor

(∂1 f (P0 ), . . . , ∂n f (P0 ))

i oznaczamy symbolem gradf (P0 ), czyli

gradf (P0 ) = (∂1 f (P0 ), . . . , ∂n f (P0 )) .

Twierdzenie 4.5. Niech P0 = (x01 , . . . , x0n ) będzie ustalonym punktem przestrzeni Rn oraz niech
funkcja f , określona przynajmniej na pewnym otoczeniu punktu P0 , ma ciągłe pochodne cząstkowe
pierwszego rzędu w punkcie P0 . Wtedy

∇v f (P0 ) = gradf (P0 ) · v,

dla każdego wersora v ∈ Rn .

Przykład 4.2. Niech f (x, y) = xy dla (x, y) ∈ R2 . Wtedy

∂1 f (x, y) = y, ∂2 f (x, y) = x, (x, y) ∈ R2 .

Stąd √ √ √ √
2 2 2 2 √
∇ √ 2
√ 
, 22
f (1, 1) = ∂1 f (1, 1) · + ∂2 f (1, 1) · =1· +1· = 2.
2 2 2 2 2

Twierdzenie 4.6. Jeżeli funkcja jest różniczkowalna w punkcie P0 , to ma w tym punkcie po-
chodne kierunkowe w kierunku dowolnego wersora v ∈ Rn .

11
Fakt 4.4. (Interpretacja geometryczna gradientu)

(i) Gradient funkcji w punkcie wskazuje kierunek jej najszybszego wzrostu w tym punkcie.

(ii) Gradient funkcji w punkcie jest prostopadły do poziomicy funkcji przechodzącej przez ten
punkt.

5. Ekstrema lokalne

Niech A ⊂ Rn będzie zbiorem otwartym, P0 = (x01 , . . . , x0n ) ∈ A oraz niech f : A → R.

Definicja 5.1.

(i) Powiemy, że funkcja f ma w punkcie P0 = (x01 , . . . , x0n ) minimum lokalne, jeżeli istnieje takie
sąsiedztwo S (P0 , r) punktu P0 , że dla wszystkich punktów P = (x1 , . . . , xn ) z tego sąsiedztwa
zachodzi warunek
f (P ) ≥ f (P0 ) .

12
(ii) Powiemy, że funkcja f ma w punkcie P0 = (x01 , . . . , x0n ) minimum lokalne właściwe, jeżeli istnieje
takie sąsiedztwo S (P0 , r) punktu P0 , że dla wszystkich punktów P = (x1 , . . . , xn )
z tego sąsiedztwa zachodzi warunek

f (P ) > f (P0 ) .

(iii) Powiemy, że funkcja f ma w punkcie P0 = (x01 , . . . , x0n ) maksimum lokalne, jeżeli istnieje takie
sąsiedztwo S (P0 , r) punktu P0 , że dla wszystkich punktów P = (x1 , . . . , xn ) z tego sąsiedztwa
zachodzi warunek
f (P ) ≤ f (P0 ) .

(iv) Powiemy, że funkcja f ma w punkcie P0 = (x01 , . . . , x0n ) maksimum lokalne właściwe, jeżeli
istnieje takie sąsiedztwo S (P0 , r) punktu P0 , że dla wszystkich punktów P = (x1 , . . . , xn )
z tego sąsiedztwa zachodzi warunek

f (P ) < f (P0 ) .

Twierdzenie 5.1. (Warunek konieczny istnienia ekstremum)


Jeżeli funkcja f ma w punkcie P0 ekstremum lokalne i istnieją w tym punkcie pochodne cząstkowe
pierwszego rzędu funkcji f , to

∂1 f (P0 ) = 0, ∂2 f (P0 ) = 0, ..., ∂n f (P0 ) = 0. (1)

Uwaga 5.1. Punkt P0 spełniający warunek (1) nazywamy punktem stacjonarnym funkcji f .

Uwaga 5.2. Twierdzenie odwrotne do Twierdzenia 5.1 nie jest prawdziwe.

Przykład 5.1. Rozważmy funkcję określoną wzorem f (x, y) = xy dla (x, y) ∈ R2 .


Wtedy
∂1 f (x, y) = y, ∂2 f (x, y) = x, (x, y) ∈ R2 .
Stąd
 
 ∂1 f (x, y) = 0  y=0
⇐⇒
∂2 f (x, y) = 0 x=0
 

Punkt (0, 0) jest jedynym punktem stacjonarnym funkcji f , jednak w punkcie (0, 0) funkcja f nie ma
ekstremum.
Istotnie, skoro f (0, 0) = 0, to gdyby funkcja f miała w punkcie (0, 0) ekstremum lokalne, to na
pewnym sąsiedztwie punktu (0, 0) funkcja f musiałaby być nieujemna bądź niedodatnia. Tymczasem
w dowolnym sąsiedztwie punktu (0, 0) funkcja f przyjmuje zarówno wartości  dodatnie jak i rujemne.
Wystarczy bowiem zauważyć, że dla dowolnie ustalonego r > 0 mamy 2 , 2 ∈ S ((0, 0) , r), 2 , −r
r r

2

S ((0, 0) , r) oraz
 r r  r2 
r −r

r2
f , = > 0, natomiast f , = − < 0.
2 2 4 2 2 4

13
W celu sformułowania warunków dostatecznych istnienia ekstremum lokalnego funkcji f : A → R,
określonej na zbiorze otwartym A ⊂ Rn , w punkcie P0 = (x01 , . . . , x0n ) ∈ A, załóżmy, że ma ona ciągłe
pochodne cząstkowe pierwszego i drugiego rzędu w pewnym otoczeniu punktu P0 . Ponadto niech
 
2 2 2
∂11 f (P0 ) ∂12 f (P0 ) . . . ∂1i f (P0 )
 
 
 ∂ 2 f (P0 ) ∂ 2 f (P0 ) . . . ∂ 2 f (P0 ) 
∆i (P0 ) = det  21 22 2i , i ∈ {1, 2, . . . , n} .
 .. .. . . 
 . . . 
2 2 2
∂i1 f (P0 ) ∂i2 f (P0 ) . . . ∂ii f (P0 )

Twierdzenie 5.2. (Warunek dostateczny istnienia ekstremum lokalnego)


Niech P0 będzie punktem stacjonarnym funkcji f : A → R, gdzie A ⊂ Rn jest zbiorem otwartym.
Załóżmy, że w pewnym otoczeniu punktu P0 funkcja f ma ciągłe pochodne cząstkowe pierwszego
i drugiego rzędu.

(i) Jeżeli ∆i (P0 ) > 0 dla i ∈ {1, 2, . . . , n}, to funkcja f ma w punkcie P0 minimum lokalne właściwe.
(ii) Jeżeli (−1)i ∆i (P0 ) > 0 dla i ∈ {1, 2, . . . , n}, to funkcja f ma w punkcie P0 maksimum lokalne
właściwe.
(iii) Jeżeli zachodzi jeden z warunków
(∆i (P0 ) ≥ 0 dla i ∈ {1, 2, . . . , n − 1} oraz ∆n (P0 ) = 0)
lub
((−1)i ∆i (P0 ) ≥ 0 dla i ∈ {1, 2, . . . , n − 1} oraz ∆n (P0 ) = 0),
to w punkcie P0 funkcja f może mieć ekstremum lokalne, ale nie musi; przypadek ten wymaga
dodatkowych rozważań.
(iv) Jeżeli nie zachodzi żaden z warunków (i) − (iii), to funkcja f nie ma ekstremum lokalnego
w punkcie P0 .

Przykład 5.2. Wyznaczyć ekstrema lokalne funkcji określonej wzorem

f (x, y) = x2 + y 2 + xy + 3x − 3y, D f = R2 .
Funkcja f jest różniczkowalna w każdym punkcie płaszczyzny, a więc posiada pochodne cząstkowe
pierwszego rzędu ze względu na każdą zmienną. Mianowicie

∂1 f (x, y) = 2x + y + 3, ∂2 f (x, y) = 2y + x − 3, (x, y) ∈ R2 .


Korzystając z warunku koniecznego istnienia ekstremum lokalnego mamy
 
2x + y + 3 = 0 x = −3
⇐⇒
2y + x − 3 = 0 y =3

Jedynym punktem stacjonarnym funkcji f jest punkt (−3, 3). Ponadto wszystkie pochodne cząstkowe
pierwszego rzędu są funkcjami ciągłymi w R2 oraz
2 2 2 2
∂11 f (x, y) = 2, ∂12 f (x, y) = 1, ∂21 f (x, y) = 1, ∂22 f (x, y) = 2, (x, y) ∈ R2 .

14
Zatem
 
2 2 1
∆1 (−3, 3) = ∂11 f (−3, 3) = 2 > 0, ∆2 (−3, 3) = det = 3 > 0,
1 2

a więc w punkcie (−3, 3) funkcja f ma minimum lokalne właściwe.

Przykład 5.3. Wyznaczyć ekstrema lokalne funkcji określonej wzorem

f (x, y, z) = x3 + y 2 + 2z 2 + xy − 2xz + 3y − 1, Df = R3 .

Funkcja f jest różniczkowalna w każdym punkcie przestrzeni R3 , a więc posiada pochodne cząst-
kowe pierwszego rzędu ze względu na każdą zmienną. Mianowicie, dla dowolnego (x, y, z) ∈ R3 ,

∂1 f (x, y, z) = 3x2 + y − 2z, ∂2 f (x, y, z) = 2y + x + 3, ∂3 f (x, y, z) = 4z − 2x.

Korzystając z warunku koniecznego istnienia ekstremum lokalnego mamy


 2  
 3x + y − 2z = 0  x = − 21  x =1
2y + x + 3 = 0 ⇐⇒ y = − 54 lub y = −2
1
4z − 2x = 0 z = −4 z = 12
  

Funkcja f posiada dokładnie dwa punkty stacjonarne: A = − 21 , − 54 , − 41 oraz B = 1, −2, 21 .


 

Wyznaczamy pochodne cząstkowe drugiego rzędu, aby sprawdzić warunek dostateczny istnienia
ekstremum lokalnego. Dla dowolnego (x, y, z) ∈ R3 mamy
2 2 2
∂11 f (x, y, z) = 6x, ∂12 f (x, y, z) = 1, ∂13 f (x, y, z) = −2,

2 2 2
∂21 f (x, y, z) = 1, ∂22 f (x, y, z) = 2, ∂23 f (x, y, z) = 0,

2 2 2
∂31 f (x, y, z) = −2, ∂32 f (x, y, z) = 0, ∂33 f (x, y, z) = 4.

Sprawdzamy warunek dostateczny w pierwszym punkcie stacjonarnym: A = − 12 , − 54 , − 14 .




 
  −3 1 −2
−3 1
∆1 (A) = det [−3] = −3, ∆2 (A) = det = −7, ∆3 (A) = det  1 2 0  = −36.
1 2
−2 0 4

Ponieważ ∆i (A) < 0, dla każdego i ∈ {1, 2, 3}, więc w punkcie A funkcja f nie ma ekstremum
lokalnego.
Sprawdzamy warunek dostateczny w drugim punkcie stacjonarnym: B = 1, −2, 21 .


 
  6 1 −2
6 1
∆1 (B) = det [6] = 6, ∆2 (B) = det = 11, ∆3 (B) = det  1 2 0  = 36.
1 2
−2 0 4

Ponieważ ∆i (B) > 0, dla każdego i ∈ {1, 2, 3}, więc w punkcie B funkcja f ma minimum lokalne
właściwe.

15
6. Ekstrema globalne funkcji

Załóżmy, że f : A → R, gdzie A ⊂ Rn .

Definicja 6.1. (Wartość najmniejsza i największa funkcji na zbiorze)


(i) Liczbę m ∈ R nazywamy wartością najmniejszą funkcji f na zbiorze D ⊂ A, jeżeli istnieje taki
punkt P0 ∈ D, że f (P0 ) = m oraz dla każdego punktu P ∈ D zachodzi warunek

f (P ) ≥ m.

Liczbę m nazywamy także minimum globalnym funkcji f na zbiorze D.


(ii) Liczbę M ∈ R nazywamy wartością największą funkcji f na zbiorze D ⊂ A, jeżeli istnieje taki
punkt P0 ∈ D, że f (P0 ) = M oraz dla każdego punktu P ∈ D zachodzi warunek

f (P ) ≤ M.

Liczbę M nazywamy także maksimum globalnym funkcji f na zbiorze D.

Uwaga 6.1. (Algorytm szukania ekstremów globalnych funkcji na zbiorze domkniętym)


Załóżmy, że zbiór D jest domkniętym i ograniczonym podzbiorem dziedziny funkcji f .
(i) Wyznaczamy punkty należące do wnętrza zbioru D, w których funkcja f może mieć ekstrema
lokalne.
(ii) Wyznaczamy punkty należące do brzegu zbioru D, w których funkcja może mieć ekstrema
warunkowe.
(iii) Porównujemy wartości funkcji w otrzymanych punktach i na tej podstawie wyznaczamy wartość
największą i wartość najmniejszą funkcji w zbiorze D.

Przykład 6.1. Wyznaczymy wartość najmniejszą i wartość największą funkcji f o wzorze

f (x, y) = x2 + 2xy − 4x + 8y

w zbiorze D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1 ∧ 0 ≤ y ≤ 2}.

Zauważmy najpierw, że dziedziną funkcji f jest cała płaszczyzna R2 , a zbiór D ⊂ R2 jest do-
mknięty i ograniczony. Ponadto funkcja f jest ciągła w zbiorze D, a więc (na mocy twierdzenia
Weierstrassa) jest ograniczona i osiąga w zbiorze D wartość najmniejszą i wartość największą.
Wyznaczymy teraz wszystkie punkty należące do wnętrza zbioru D, w których funkcja f może
mieć ekstrema lokalne, czyli punkty stacjonarne tej funkcji. W tym celu zauważmy, że

∂1 f (x, y) = 2x + 2y − 4, ∂2 f (x, y) = 2x + 8, (x, y) ∈ R2 .

Korzystając z warunku koniecznego istnienia ekstremum lokalnego otrzymujemy


 
 2x + 2y − 4 = 0,  x = −4,
⇐⇒
2x + 8 = 0, y = 6.
 

16
Zatem jedynym punktem stacjonarnym funkcji f jest punkt (−4, 6), jednak (−4, 6) ∈/ D, a więc
pomijamy go w dalszych badaniach. W konsekwencji oznacza to, że wewnątrz zbioru D funkcja f
nie osiąga żadnego ekstremum lokalnego.
W kolejnym kroku badamy zachowanie się funkcji f na brzegu obszaru D. Zauważmy, że zbiór D
jest prostokątem ograniczonym prostymi o równaniach

x = 0, x = 1, y = 0, y = 2.

• Dla x = 0 i y ∈ [0, 2] mamy

f (x, y) = f (0, y) = 8y := g1 (y).

Wystarczy zauważyć, że g1 jest funkcją liniową, a więc osiąga wartości ekstremalne na końcach
przedziału [0, 2]. Zatem, w odniesieniu do funkcji f interesować nas będę punkty (0, 0) oraz
(0, 2).

• Dla x = 1 i y ∈ [0, 2] mamy

f (x, y) = f (1, y) = 1 + 2y − 4 + 8y = 10y − 3 := g2 (y).

Ponownie zauważmy, że g2 jest funkcją liniową, a więc osiąga wartości ekstremalne na końcach
przedziału [0, 2]. Zatem, w odniesieniu do funkcji f interesować nas będę punkty (1, 0) oraz
(1, 2).

• Dla y = 0 i x ∈ [0, 1] mamy

f (x, y) = f (x, 0) = x2 − 4x := g3 (x).

Tym razem, aby wyznaczyć wartości największą i najmniejszą funkcji g3 na przedziale [0, 1]
zauważmy, że
g30 (x) = 0 ⇔ 2x − 4 = 0 ⇔ x = 2.
Jednak 2 ∈ / [0, 1]. Oznacza to, że funkcja g3 osiąga wartości ekstremalne na końcach przedziału
[0, 1]. Stąd wynika, że w odniesieniu do funkcji f interesować nas będę punkty (0, 0) oraz (1, 0).

• Dla y = 2 i x ∈ [0, 1] mamy

f (x, y) = f (x, 2) = x2 + 4x − 4x + 16 = x2 + 16 := g4 (x).

W celu wyznaczenia wartości największej i najmniejszej funkcji g4 na przedziale [0, 1] zauważmy,


że
g40 (x) = 0 ⇔ 2x = 0 ⇔ x = 0.
Ponadto 0 ∈ [0, 1], a więc funkcja g4 osiąga wartości ekstremalne na końcach przedziału [0, 1].
Stąd wynika, że w odniesieniu do funkcji f , ponownie dostajemy punkty (0, 2) oraz (1, 2).
Wyznaczamy teraz wartości funkcji f w wyznaczonych punktach, które jak się okazuje są wierz-
chołkami rozważanego prostokąta. Zatem

f (0, 0) = 0, f (0, 2) = 16, f (1, 0) = −3, f (1, 2) = 17.

Stąd wynika, że wartość najmniejsza funkcji f na zbiorze D wynosi −3, a wartość największa wynosi
17.

17
7. Różniczki wyższych rzędów, wzór Taylora

Definicja 7.1. (Różniczki wyższych rzędów )


Załóżmy, że P0 = (x01 , . . . , x0n ) jest ustalonym punktem przestrzeni Rn i funkcja f jest k-krotnie
różniczkowalna przynajmniej w pewnym otoczenie punktu P0 . Różniczką k-tego rzędu funkcji f w
punkcie P0 nazywamy różniczkę z różniczki rzędu k − 1, dla każdego k ∈ N, przy czym przyjmujemy,
że d0 f = f . Czyli
d2 f = d(df ), d3 f = d(d2 f ), . . . , dk f = d(dk−1 f ).

Przykład 7.1. (Wzory na różniczki drugiego i trzeciego rzędu dla funkcji dwóch zmiennych)
Załóżmy, że funkcja f jest 3-krotnie różniczkowalna w zbiorze A ⊂ R2 . Wtedy, korzystając z definicji
różniczki i twierdzenia Schwarza, mamy

d2 f = d(df ) = d (∂1 f ∆x1 + ∂2 f ∆x2 ) = (∂11


2 2
f ∆x1 + ∂21 2
f ∆x2 ) ∆x1 + (∂12 2
f ∆x1 + ∂22 f ∆x2 ) ∆x2

2
= ∂11 f (∆x1 )2 + 2∂21
2 2
f ∆x1 ∆x2 + ∂22 f (∆x2 )2 ,

d3 f = d(d2 f ) = ∂111
3
f (∆x1 )3 + 3∂112
3
f (∆x1 )2 ∆x2 + 3∂122
3
f ∆x1 (∆x2 )2 + ∂222
3
f (∆x2 )3 .

Twierdzenie 7.1. (Wzór Taylora)


Niech k ∈ N. Załóżmy, że funkcja f ma w otoczeniu punktu P0 = (x01 , . . . , x0n ) ciągłe pochodne
cząstkowe do rzędu k włącznie oraz, że P = (x1 , . . . , xn ) jest dowolnym punktem z tego otoczenia.
Wtedy na odcinku łączącym punkty P0 i P istnieje taki punkt Pc = (xc1 , . . . , xcn ), że

dfP0 (P − P0 ) d2 fP0 (P − P0 ) dk−1 fP0 (P − P0 ) dk fPc (P − P0 )


f (P ) = f (P0 ) + + + + .
1! 2! (k − 1)! k!

18

You might also like