A Variációszámítás Klasszikus Problémái

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 13

2.

fejezet

Variációszámítás

A variációszámítás klasszikus problémái különböző extrémum-feladatok vizsgálata során alakultak ki. Ezeknek
az extrémum-feladatoknak az a leglényegesebb közös tulajdonsága, hogy az extrémumot szolgáltató objek-
tumok — a klasszikus szélsőérték-feladatok esetében megszokottaktól eltérően — nem valamely véges dimen-
ziós tér pontjai, hanem általában valamely függvénytér elemei. Ennek megfelelően azoknak a függvényeknek,
amelyeknek a szélsőértékeit keressük, a változóik is függvények. Az ilyen „függvényváltozós függvények”,
úgynevezett „funkcionálok” szélsőértékszámításának során nem alkalmazhatók közvetlenül a többváltozós füg-
gvények esetében megismert, elsősorban a differenciálszámítás eszközeit felhasználó módszerek. Ezek pótlá-
sára új módszerek kialakítása szükséges, melyre a variációszámítás keretein belül nyílik lehetőség.

Néhány klasszikus probléma


Brachisztochron–probléma. Mindazon görbék között, amelyek két adott A és B pontot kötnek össze, határoz-
zuk meg azt, amely mentén haladva az A pontból zérus kezdősebességgel elinduló és a nehézségi erő
hatása alatt mozgó anyagi pont a legrövidebb idő alatt jut el a B pontba.†

A fény terjedése. Egy változó optikai sűrűségű átlátszó közegben adva van két pont, A és B. Határozzuk meg
az A pontból a B pontba haladó fénysugár pályáját.

A gömb geodetikusai. Határozzuk meg a gömbfelületen húzható, a gömbfelület két adott pontját összekötő
görbék közül azt, amelynek a hossza a legkisebb.

A legkisebb forgásfelület problémája. Mindazon y(x) görbék között, amelynek végpontjai adott A = (x0 , y0 )
és B = (x1 , y1 ) pontokban vannak, határozzuk meg azt, amelynek az x tengely körüli forgása útján a
legkisebb felület keletkezik.

A bolygók mozgása. Vegyünk két tömegpontot, amelyek az általános tömegvonzás törvénye szerint hatnak
egymásra. Tekintsük az egyik pontot mozdulatlannak és vizsgáljuk a másik pont mozgását.

A izoperimetrikus probléma. Az összes adott hosszúságú, önmagukat nem metsző zárt görbék között határoz-
zuk meg azt, amely a legnagyobb területet határolja.

2.1. Funkcionálok variációja


2.1.1. Definíció. Legyen X normált tér K ∈ {R, C} felett, D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : X →
K funkcionál. Azt mondjuk, hogy az f funkcionál differenciálható vagy lineárisan approximálható az x0

Itt természetesen feltesszük, hogy A és B nincsenek egyazon függőleges egyenesen. Ha A és B egy függőleges egyenesen
helyezkednének el, akkor a probléma megoldása ez az egyenes volna.

37
pontban, ha létezik egy olyan a : X → K lineáris funkcionál és egy olyan ε : X → K, melyre lim x→x0 ε(x) = 0,
úgy, hogy
f (x) − f (x0 ) = a (x − x0 ) + ε(x) kx − x0 k (x ∈ X) ,
más szóval,
f (x) − f (x0 ) − a (x − x0 )
lim =0
x→x0 kx − x0 k
teljesül.
2.1.1. Tétel (Egyértelműség). Legyen X normált tér K felett D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : X → K
funkcionál. Ha a1 , a2 : X → K olyan lineáris funkcionálok, melyekre
f (x) − f (x0 ) − ai (x − x0 )
lim =0 (i = 1, 2)
x−x0 kx − x0 k
teljesül, akkor
a1 (x) = a2 (x) (x ∈ X) .
2.1.1. Megjegyzés. Az előző tétel azt mondja ki, hogy ha az X normált tér egy D nemüres, nyílt részhalmazának
x0 pontjában az f : X → K funkcionál differenciálható, akkor a differenciálhatóság definíciójában megadott
a : X → K lineáris funkcionál egyértelműen meg van határozva. Ezt a folytonos lineáris funkcionált az f
funkcionál x0 pontbeli variációjának nevezzük és δ f (x0 )–lal jelöljük.
2.1.1. Állítás (Differenciálhatóság ⇒ folytonosság). Legyen X normált tér, D ⊂ X nemüres, nyílt halmaz,
x0 ∈ X, f : D → K funkcionál. Ha az f funkcionál differenciálható az x0 pontban, akkor ott folytonos is.
2.1.2. Állítás. Normált tér folytonos lineáris funkcionálja differenciálható, és variációja minden pontban ön-
maga.
Bizonyítás. Legyen f : X → K, ekkor minden x, x0 ∈ X esetén
f (x) − f (x0 ) = f (x − x0 ) ,
így δ f (x0 ) = f (x0 ) és ε(x) = 0 választással kapjuk, hogy f differenciálható az x0 pontban.

2.1.2. Tétel. Legyen X normált tér, D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : D → K funkcionál. Ha az f
funkcionál differenciálható az x0 pontban, akkor tetszőleges h ∈ X esetén
1
δ f (x0 ) (h) = lim f (x0 + λh) − f (x0 ) .

λ→0 λ

Bizonyítás. Tetszőleges λ ∈ K, λ , 0 esetén


1 1
f (x0 + λh) − f (x0 ) = lim δ f (x0 )(λh) + |λ| · khk ε(λh)
 
lim
λ→0 λ λ→0 λ
|λ|
= δ f (x0 )(h) + lim khk ε(λh) = δ f (x0 )(h).
λ→0 λ


2.1.2. Megjegyzés. Az előző tételben szereplő
1
f (x0 + λh) − f (x0 )

lim
λ→0 λ

határértéket – amennyiben létezik – az f funkcionál x0 pontbeli h iránymenti deriváltjának nevezzük. Az


előző tétel szerint tehát, ha az f funkcionál az x0 pontban differenciálható, akkor ott tetszőleges h irány mentén
differenciálható és az iránymenti deriváltja δ f (x0 )(h)–val egyezik meg. Megjegyezzük továbbá, hogy az állítás
megfordítása nem igaz.

38
Példák differenciálható funkcionálokra
2.1.1. Példa. Tekintsük az R normált teret az kxk = |x| normával. Ha D ⊂ R nemüres, nyílt halmaz, x0 ∈ D,
f : D → R függvény, akkor az f funkcionál (függvény) x0 pontbeli differenciálhatósága nyilván ekvivalens az
f függvény x0 pontbeli klasszikus értelemben vett differenciálhatóságával. Tehát, ha az f funkcionál differen-
ciálható az x0 pontban, akkor f variációja

δ f (x0 )(x) = f 0 (x0 ) · x (x ∈ D) ,

továbbá, ha h ∈ R, akkor az f funkcionál h iránymenti deriváltja az x0 pontban f 0 (x0 ) · h.

2.1.2. Példa. Legyen n ∈ N és tekintsük Rn –et az euklideszi normával. Ha D ⊂ Rn nemüres, nyílt halmaz,
x0 ∈ X és f : D → R függvény, akkor az f funkcionál x0 pontbeli differenciálhatósága ekvivalens az f , n–
változós függvény x0 -beli klasszikus értelemben vett differenciálhatóságával, azaz

δ f (x0 )(x) = hgrad f (x0 ), xi (x ∈ D) .

Ha h ∈ Rn , akkor az f funkcionál h iránymenti deriváltja az x0 pontban hgrad f (x0 ), hi, speciálisan, ha h = ei ,


akkor ez az iránymenti derivált éppen az f függvény i–edik változója szerinti parciális derivált az x0 pontban,
i = 1, . . . , n.

2.1.3. Példa. Legyen [a, b] ⊂ R valódi intervallum, ϕ : [a, b]×R → R folytonos függvény, és tekintsük a C([a, b])
normált téren a következő funkcionált
Z b
I( f ) = ϕ (x, f (x)) dx ( f ∈ C([a, b])) .
a

Megmutatjuk, hogy az I funkcionál differenciálható, feltéve, hogy a ϕ függvény folytonosan parciálisan differ-
enciálható a második változója szerint. Legyen f0 ∈ C([a, b]) tetszőleges, ekkor
"Z b Z b #
1
lim ϕ (x, f0 (x) + λ f (x)) dx − ϕ (x, f0 (x)) dx
λ→0 λ a a
Z b
1
= lim ϕ (x, f0 (x) + λ f (x)) − ϕ (x, f0 (x)) dx
 
λ→0 λ a
Z b
1
= lim ϕ (x, f0 (x) + λ f (x)) − ϕ (x, f0 (x)) dx

λ→0 a λ
Z b
= f (x) · ∂2 ϕ (x, f0 (x)) dx.
a

Így, a fenti funkcionál variációja csak


Z b
δI( f0 )( f ) = ∂2 ϕ (x, f0 (x)) · f (x)dx.
a

lehet. Azt, hogy I valóban differenciálható, az mutatja, hogy


R b
ϕ (x, f0 (x) + λ f (x)) − ϕ (x, f0 (x)) − ∂2 ϕ (x, f0 (x)) · f (x)dx
a
lim = 0.
k f k→0 kfk

39
2.2. Bilineáris és kvadratikus funkcionálok
2.2.1. Definíció. Legyen X normált tér, B : X × X → K. Azt mondjuk, hogy B bilineáris funkcionál, ha

(i) minden rögzített x0 ∈ X esetén az y 7→ B(x0 , y) leképezés lineáris funkcionál;

(ii) minden rögzített y0 ∈ X esetén az x 7→ B(x, y0 ) leképezés lineáris funkcionál,

azaz, B mindkét változójában lineáris. Azt mondjuk, hogy B szimmetrikus, ha tetszőleges x, y ∈ X esetén
B(x, y) = B(y, x) teljesül.

2.2.1. Példa. Legyenek a1 , a2 : X → K lineáris funkcionálok, ekkor a

B(x, y) = a1 (x)a2 (y) (x, y ∈ X)

módon megadott B : X × X → K leképezés egy bilineáris funkcionál, mely pontosan akkor szimmetrikus, ha a1
és a2 lineárisan függőek.

2.2.2. Definíció. Az X normált téren értelmezett Q : X → K funkcionált kvadratikus funkcionálnak mondjuk,


ha van olyan B : X × X → K szimmetrikus, bilineáris funkcionál, hogy

Q(x) = B(x, x) (x ∈ X)

teljesül. Ekkor a Q kvadratikus funkcionált a B szimmetrikus, bilineáris funkcionál polarizáltjának hívjuk.

2.2.1. Megjegyzés. Minden B szimmetrikus, bilineáris funkcionál esetén


fennáll a
1
B(x, y) = B(x + y, x + y) − B(x, x) − B(y, y) (x, y ∈ X)

2
úgynevezett polarizációs formula, melynek következtében minden szimmetrikus, bilineáris funkcionál egyértel-
műen meg van határozva a polarizáltja által.

2.2.1. Állítás. Az X normált tér B szimmetrikus, bilineáris funkcionálja pontosan akkor folytonos, ha létezik
egy olyan C > 0 konstans, hogy
|B(x, y)| ≤ C kxk · kyk (x, y ∈ X) .

2.2.2. Állítás. Az X normált tér Q kvadratikus funkcionálja pontosan akkor folytonos, ha létezik egy olyan
C > 0 konstans, hogy
|Q(x)| ≤ C kxk2 (x ∈ X) .

Példák bilineáris és kvadratikus funkcionálokra


2.2.2. Példa. Tekintsük az R normált teret az kxk = |x| normával. Ebben a térben a bilineáris és kvadratikus
funkcionálok teljesen leírhatóak. Nevezetesen minden B : R × R → R szimmetrikus, bilineáris funkcionál

B(x, y) = cxy (x, y ∈ R)

alakú valamely c ∈ R konstanssal. Továbbá, ha Q : R → R kvadratikus funkcionál, akkor

Q(x) = cx2 (x ∈ R)

teljesül valamely c ∈ R konstans esetén.

40
2.2.3. Példa. Legyen n ∈ N és tekintsük az Rn teret az euklideszi normával. Ezen tér minden B : Rn × Rn → R
bilineáris funkcionálja előáll
n X
X n
B(x, y) = ai, j xi y j (x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn )
i=1 j=1

n on
alakban, valamely A = ai, j n × n–es valós mátrix esetén. Továbbá, B pontosan akkor szimmetrikus, ha az
i, j=1
A mátrix szimmetrikus.

2.2.4. Példa. Legyen [a, b] ⊂ R valódi intervallum, α : [a, b] → R korlátos változású függvény. Ha f, g ∈
C([a, b]), akkor legyen Z b
B( f, g) = f (x)g(x)dα(x) ( f, g ∈ C([a, b])) .
a
Ekkor B : C([a, b]) × C([a, b]) → R egy bilineáris funkcionál.
Ha K : [a, b] × [a, b] → R korlátos függvény, akkor a
Z b
B ( f, g) =

f (x)g(y)K(x, y)dxdy ( f, g ∈ C([a, b]))
a

módon megadott B∗ : C([a, b]) × C([a, b]) → R leképezés szintén egy bilineáris funkcionált értelmez, mely pon-
tosan akkor szimmetrikus, ha K(x, y) = K(y, x) teljesül minden x, y ∈ [a, b] esetén.

2.3. Funkcionálok második variációja


2.3.1. Definíció. Legyen X normált tér, D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : X → K funkcionál. Azt
mondjuk, hogy az f funkcionál kétszer differenciálható az x0 pontban, ha létezik olyan a : X → K lineáris
funkcionál, q : X → K kvadratikus funkcionál és olyan ε : X → K függvény, melyre lim x→x0 ε(x) = 0 úgy, hogy

1
f (x) − f (x0 ) = a(x − x0 ) + q(x − x0 ) + ε(x) kx − x0 k2 (x ∈ X)
2
teljesül. Más szóval,
f (x) − f (x0 ) − a(x − x0 ) − 12 q(x − x0 )
lim = 0.
x→x0 kx − x0 k2

2.3.1. Megjegyzés. Nyilván, ha az f funkcionál kétszer differenciálható az x0 pontban, akkor f differenciálható


az x0 pontban és δ f (x0 ) = a. A fenti definícióban szereplő q kvadratikus funkcionál egyértelműen meg van
határozva, ezt az f funkcionál x0 pontbeli második variációjának nevezzük és δ2 f (x0 )–lal jelöljük.

Példák kétszer differenciálható funkcionálokra


2.3.1. Példa. Tekintsük az R normált teret az kxk = |x| normával. Ha D ⊂ R nemüres, nyílt halmaz, x0 ∈
D, f : D → R függvény, akkor az f funkcionál (függvény) x0 pontbeli kétszeri differenciálhatósága nyilván
ekvivalens az f függvény x0 pontbeli klasszikus értelemben vett kétszeri differenciálhatóságával. Tehát, ha az
f funkcionál kétszer differenciálható az x0 pontban, akkor f második variációja

δ2 f (x0 )(x) = f 00 (x0 ) · x (x ∈ D) ,

továbbá, ha h ∈ R, akkor az f funkcionál h iránymenti másodrendű deriváltja az x0 pontban f 00 (x0 ) · h2 .

41
2.3.2. Példa. Legyen n ∈ N és tekintsük Rn –et az euklideszi normával. Ha D ⊂ Rn nemüres, nyílt halmaz,
x0 ∈ X és f : D → R függvény, akkor az f funkcionál x0 pontbeli kétszeri differenciálhatósága ekvivalens az f ,
n–változós függvény x0 -beli klasszikus értelemben vett kétszeri differenciálhatóságával, azaz
δ2 f (x0 )(x) = hgrad f (x0 )x, xi (x ∈ D) .
Ha h ∈ Rn , akkor az f funkcionál h iránymenti másodrendű deriváltja az x0 pontban hgrad f (x0 )h, hi, speciáli-
san, ha h = ei , akkor ez az iránymenti derivált éppen az f másodrendű parciális deriváltjaiból képzett mátrix,
 ∂1 f (x0 ) ∂1 ∂2 f (x0 ) . . . ∂1 ∂n f (x0 ) 
 2 

f 00 (x0 ) =  .. .. ... ..


. . .
 

∂n ∂1 f (x0 ) ∂n ∂2 f (x0 ) . . . ∂n f (x0 )
2
 

2.3.3. Példa. Legyen [a, b] ⊂ R valódi intervallum, ϕ : [a, b]×R → R folytonos függvény, és tekintsük a C([a, b])
normált téren a következő funkcionált
Z b
I( f ) = ϕ (x, f (x)) dx ( f ∈ C([a, b])) .
a

Korábban már láttuk, hogy I differenciálható minden f0 ∈ C([a, b]) pontban, amennyiben ϕ folytonosan differ-
enciálható a második változója szerint, és I variációja
Z b
δI( f0 )( f ) = ∂2 ϕ (x, f0 (x)) · f (x)dx.
a

Ha a ϕ függvény kétszer folytonosan differenciálható a második változója szerint, akkor a fenti I funkcionál
kétszer differenciálható és Z b
δ I( f0 )( f ) =
2
∂2 ϕ (x, f0 (x)) · f (x)2 dx.
a

2.3.4. Példa. Legyen [a, b] ⊂ R valódi intervallum, és a C1 ([a, b]) normált téren tekintsük a
Z b
J( f ) = x f (x)2 + f 0 (x)3 dx
a

módon megadott funkcionált. Ekkor az előző példa szerint J kétszer differenciálható minden f0 ∈ C1 ([a, b])
pontban és Z bh i
δJ( f0 )( f ) = 2x f0 (x) f (x) + 3 f00 (x)2 f 0 (x) dx
a
valamint Z bh i
δ J( f0 )( f ) =
2
2x f (x)2 + 6 f00 (x) f 0 (x)2 dx.
a

2.4. Funkcionálok extrémuma


2.4.1. Definíció. Legyen X egy valós normált tér, D ⊂ X nemüres, nyílt halmaz, x0 ∈ D és f : D → R funkcionál.
Azt mondjuk, hogy az f funkcionálnak az x0 pontban lokális minimuma van, ha van olyan % > 0 szám, hogy ha
x ∈ X olyan, hogy kx − x0 k < %, akkor
f (x0 ) ≤ f (x).
Azt mondjuk, hogy az f funkcionálnak az x0 pontban lokális maximuma van, ha van olyan % > 0 szám, hogy
ha x ∈ X olyan, hogy kx − x0 k < %, akkor
f (x0 ) ≥ f (x).
Ha a fenti egyenlőtlenségek x , x0 esetén szigorúak, akkor szigorú lokális minimumról, illetve szigorú lokális
maximumról beszélünk.

42
2.4.1. Tétel (Lokális extrémum szükséges feltétele). Legyen X valós normált tér, D ⊂ X nemüres, nyílt hal-
maz, x0 ∈ D, f : D → R egy olyan funkcionál, mely differenciálható az x0 pontban. Ha az f funkcionálnak az
x0 pontban lokális extrémuma van, akkor δ f (x0 ) = 0.

Bizonyítás. Tegyük fel, hogy az f funkcionálnak lokális minimuma van az x0 pontban. Legyen % > 0 olyan,
hogy ha x ∈ X és kx − x0 k < %, akkor
f (x0 ) ≤ f (x).
Legyen h ∈ X olyan, hogy khk = %, ekkor tetszőleges λ ∈]−1, 1[ esetén x0 +λh ∈ D. Definiáljuk a Ψ : ]−1, 1[→ R
leképezést a
Ψ(λ) = f (x0 + λh) (λ ∈] − 1, 1[)
képlettel. Ekkor a Ψ függvénynek lokális minimuma van a λ = 0 pontban. Továbbá, Ψ differenciálható a λ = 0
pontban és
0 = Ψ0 (0) = δ f (x0 )(h).
Legyen most h ∈ X, h , 0 tetszőleges, ekkor

khk %h
!
δ f (x0 )(h) = f = 0,
% khk
hiszen
%h = %.

khk


2.4.1. Megjegyzés. Az előző tétel jelölései és feltételei mellett az x0 pontot az f funkcionál stacionárius helyé-
nek nevezzük, ha δ f (x0 ) = 0, azaz
δ f (x0 )(x) = 0
teljesül minden x ∈ X esetén.

A tétel azt sugallja, hogy normált terek funkcionáljai extrémumának keresésekor a többváltozós függvények
elméletéből ismert módszerekhez hasonlókat alkalmazhatunk. A lokális extrémumhelyek a stacionárius helyek
közül kerülnek ki. Az első variáció azonban egy folytonos lineáris funkcionál, azaz, egy függvény, melynek
eltűnése azt jelenti, hogy ez a függvény az értelmezési tartományának minden pontjában a nulla értéket veszi fel.
Az R egydimenziós normált téren, a folytonos lineáris funkcionálok, számmal jellemezhetőek, így eltűnésük
úgy írható le, hogy ez a szóban forgó valós szám nulla.
Az Rn n–dimenziós normált térben a folytonos lineáris funkcionálok egy Rn -beli vektorral jellemezhetőek.
Így, ezek eltűnése úgy fogható fel, mint n darab valós szám egyidejű eltűnése, ami úgy is felfogható, hogy a
stacionárius helyeket egy n egyenletből álló, n ismeretlent tartalmazó – általában nemlineáris – egyenletrendszer
megoldásai.
A variációszámítás szempontjából leginkább érdekes esetekben – amikor a funkcionálok értelmezési tar-
tománya nem véges dimenziós tér, hanem például egy függvénytér – a stacionárius helyek differenciálegyenletek
segítségével írhatóak le.

2.5. Az Euler–Lagrange-differenciálegyenletek
Az előzőekben már láttuk, hogy egy normált tér funkcionáljaival kapcsolatos extrémum-problémák tanulmányo-
zása során olyan feltételekkel kerülünk szembe, melyek teljesüléséhez egy adott folytonos lineáris funkcionál-
nak azonosan nullának kell lennie. Az általános esetben ennél többet nem lehet mondani, de azokban a speciális
esetekben, amelyek a klasszikus variációs problémák megoldásának érdekében az egész elmélet kialakulását
elősegítették, olyan konkrét funkcionálok szerepelnek, melyek variációjának eltűnése a legnevezetesebb ese-
tekben differenciálegyenletek fennállását jelenti.

43
Legyen [a, b] ⊂ R valódi intervallum, n ∈ N és ϕ : [a, b] × Rn+1 → R pedig olyan folytonos függvény, mely
az utolsó (n + 1) változója szerint folytonosan parciálisan differenciálható és legyen
Z b  
J( f ) = ϕ x, f (x), f 0 (x), . . . , f (n) (x) dx ( f ∈ Cn ([a, b])) .
a

Ekkor a J : Cn ([a, b]) → R funkcionál differenciálható és


Z bh  
δJ( f0 )( f ) = ∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (x)+
a
  i
· · · + ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (n) (x) dx.

Ahhoz tehát, hogy a J funkcionálnak az értelmezési tartománya egy f0 belső pontjában lokális extrémuma
legyen, szükséges, hogy a fenti δJ( f0 ) funkcionál azonosan nulla legyen, azaz, minden f ∈ Cn ([a, b]) esetén
δJ( f0 )( f ) = 0 teljesüljön. Célunk az, hogy ezt a követelményt egy olyan feltétellel helyettesítsük, melyben
csupán f0 szerepel.

2.5.1. Tétel (Lagrange-lemma). Legyen [a, b] ⊂ R valódi intervallum, n ∈ N, ψ : [a, b] → R olyan folytonos
függvény, hogy minden olyan f ∈ Cn ([a, b]) esetén, melyre f (k) (a) = f (k) (b) = 0, k = 0, 1, . . . , n − 1 fennáll az
Z b
ψ(x) f (x)dx = 0
a

egyenlőség. Ekkor ψ ≡ 0.

2.5.2. Tétel (Euler–Poisson-differenciálegyenlet). Legyen [a, b] ⊂ R valódi intervallum, n ∈ N, ϕ : [a, b] ×


Rn+1 → R folytonosan differenciálható függvény. Tekintsük a
Z b  
J( f ) = ϕ x, f (x), f 0 (x), . . . , f (n) (x) dx ( f ∈ Cn ([a, b])) .
a

módon megadott J : Cn ([a, b]) → R funkcionált. Ha a J funkcionálnak az f0 ∈ Cn ([a, b]) pontban lokális
extrémuma van, akkor az f0 függvényre az [a, b] intervallum minden x pontjában fennáll a
  d  
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) − ∂3 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) + · · ·
dx
dn  
+ (−1)n n ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) = 0
dx
úgynevezett Euler–Poisson–differenciálegyenlet.

Bizonyítás. A tételben szereplő J funkcionál differenciálható és tetszőleges f ∈ Cn ([a, b]) esetén


Z bh  
δJ( f0 )( f ) = ∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (x)+
a
  i
· · · + ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (n) (x) dx.

Ezért, ha a J funkcionálnak az f0 ∈ C(n) ([a, b]) pontban lokális extrémuma van, akkor
Z bh     i
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (x)+ · · · + ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (n) (x) dx
a

44
teljesül minden f ∈ Cn ([a, b]) esetén. Legyen most f ∈ Cn ([a, b]) olyan, hogy f (k) (a) = f (k) (b) = 0 minden
k = 0, 1, . . . , n − 1 esetén. Ha egymás után többször alkalmazzuk a parciális integrálás tételét, akkor azt kapjuk,
hogy
Z b   d  
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) − ∂3 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x)
a dx
n !
n d

+ · · · (−1) n ∂n+2 ϕ x, f0 (x), f0 (x), . . . , f0 (x) f (x)dx = 0,
0 (n)
dx
így a Lagrange-lemmát felhasználva adódik a tétel állítása. 

2.5.3. Tétel (Euler–Lagrange-differenciálegyenletek). Legyen [a, b] ⊂ R valódi intervallum, n ∈ N, ϕ :


[a, b] × Rn × Rn → R kétszer folytonosan differenciálható függvény. Definiáljuk a Jn : C1 ([a, b]) × · · · ×
C1 ([a, b]) → R funkcionált a
Z b
Jn ( f1 , . . . , fn ) = ϕ(x, f1 (x), f2 (x), . . . , fn (x), f10 (x), f20 (x), . . . , fn0 (x))dx
a
 
képlettel. Ha a Jn funkcionálnak a C1 ([a, b]) × · · · × C1 ([a, b]) tér egy e f1 , . . . , e
fn pontjában lokális szélsőértéke
van, akkor az [a, b] intervallum minden pontjában fennáll a
 0 0 
∂k+1 ϕ x, e f2 (x), . . . , e
f1 (x), e f1 (x), . . . , e
fn (x), e fn (x)
d  0 0 
− ∂n+k+1 ϕ x, e f2 (x), . . . , e
f1 (x), e f1 (x), . . . , e
fn (x), e fn (x) = 0
dx
k = 1, 2, . . . , n úgynevezett Euler–Lagrange-féle differenciálegyenlet-rendszer.

A fentiek alapján az a kérdés, hogy egy variációszámítási problémának mikor létezik egy egyértelműen
meghatározott megoldása, egy Cauchy-feladat egzisztencia és unicitás kérdésére redukálódik. Ezzel kapcsolat-
ban pedig a következő állítás érvényes.

2.5.4. Tétel (Bernstein). Legyen [a, b] ⊂ R és ϕ : [a, b]×R2 → R egy függvény. Tegyük fel, hogy a ϕ függvényre
teljesülnek az alábbiak.
(a) minden rögzített z ∈ R esetén a ϕ, ∂2 ϕ és ∂3 ϕ függvények folytonosak az [a, b] × R halmazon.
(b) léteznek olyan α, β : [a, b]×R folytonos, az értelmezési tartományuk minden korlátos részhalmazán korlátos
függvények és egy olyan κ > 0 konstans, hogy

∂2 ϕ(x, y, z) > κ és |∂3 ϕ(x, y, z)| ≤ α(x, y)z2 + β(x, y).

Ekkor minden A, B ∈ R esetén az 





 y00 = ϕ(x, y, y0 )
y(a) = A





y(b) = B

Cauchy-feladatnak létezik egy egyértelműen meghatározott megoldása.

Tekintsünk egy Z b
ϕ(x, y, y0 )dx
a
alakú funkcionált. Az előző állítások miatt az ennek a funkcionálnak az extremálisai megoldásai a
d
∂2 ϕ(x, y, y0 ) − ∂3 ϕ(x, y, y0 ) = 0
dx

45
Euler–Lagrange-egyenletnek, mely az y ismeretlen függvényre egy másodrendű egyenlet. A fenti funkcionál
extrémumai azonban egy bővebb osztályból a C1 ([a, b]) térből valóak. Így tehát előfordulhat, hogy ugyan
minden pontban teljesül az Euler–Lagrange-egyenlet, azonban az extremális görbe nem kétszer differenciálható.
Ezt mutatja a következő példa is.

2.5.1. Példa. Tekintsük a  R1





J(y) = −1 y2 (x) (2x − y0 (x))2 dx
y(−1) =0





y(1)

 =1
feladatot. Nyilván, a fenti funkcionálnak az a görbe az extremálisa, melynél J(y) = 0 teljesül, hiszen az inte-
grandus minden esetben nemnegatív. Legyen

0 ha x ∈ [−1, 0[

y(x) = 

 x2 ha x ∈ [0, 1]

Ekkor J(y) = 0, azonban az y függvény az x = 0 nem differenciálható kétszer. Mindazonáltal, ebben az


esetben
ϕ(x, y, z) = y2 (2x − z)2 ,
így
∂2 ϕ(x, y, z) = 2y(2x − z)2 és ∂3 ϕ(x, y, z) = −2y2 (2x − z).
Ebből azonnal adódik, hogy minden x ∈ [−1, 1] esetén

2y(x)(2x − y0 (x))2 = 0 és − 2y2 (x)(2x − y0 (x)) = 0,

amiből speciálisan az is adódik, hogy a [−1, 1] intervallum minden pontjában fennáll az Euler–Lagrange-
egyenlet.

2.5.5. Tétel. Legyen [a, b] ⊂ R és ϕ : [a, b] × R2 → R egy olyan függvény mely kétszer folytonosan parciálisan
differenciálható mindegyik változója szerint. Legyen y ∈ C1 ([a, b]) egy olyan függvény, melyre teljesül a
d
∂2 ϕ(x, y, y0 ) − ∂3 ϕ(x, y, y0 ) = 0
dx
Euler–Lagrange-egyenlet. Ekkor az y függvény az [a, b] intervallum minden olyan x pontjában kétszer differen-
ciálható, mely pontban
∂23 ϕ(x, y(x), y0 (x)) , 0
teljesül.

A fenti eredményből világosan látszik, hogy az Euler–Lagrange-egyenletnek kulcsfontosságú szerepe van


a variációszámításban. Ez a másodrendű differenciálegyenlet azonban néhány esetben egy elsőrendű differen-
ciálegyenletre redukálható. Az alábbiakban ezeket a speciális eseteket fogjuk tárgyalni.

46
1. eset (Az integrandus nem függ y-tól)
Legyen [a, b] ⊂ R intervallum és ϕ : [a, b] × R → R egy függvény és tekintsük a
Z b  
J(y) = ϕ x, y0 (x) dx y ∈ C1 ([a, b])

a

módon megadott J funkcionált. Ekkor az Euler–Lagrange-egyenlet


d
∂2 ϕ x, y0 (x) = 0,


dx
azaz,
∂2 ϕ x, y0 (x) = C


teljesül valamely C ∈ R konstans esetén.


2. eset (Az integrandus nem függ x-től)
Legyen [a, b] ⊂ R intervallum és ϕ : R2 → R egy függvény és tekintsük a
Z b  
J(y) = ϕ y(x), y0 (x) dx y ∈ C1 ([a, b])

a

módon megadott J funkcionált. Ekkor az Euler–Lagrange-egyenlet


d
∂1 ϕ(y(x), y0 (x)) − ∂2 ϕ(y(x), y0 (x)) = 0,
dx
azaz,
∂1 ϕ(y(x), y0 (x)) − ∂212 ϕ(y(x), y0 (x))y0 (x) − ∂222 ϕ(y(x), y0 (x))y00 (x) = 0.
Szorozzuk meg a differenciálegyenlet mindkét oldalát y0 (x)-szel,

∂1 ϕ(y(x), y0 (x))y0 (x) − ∂212 ϕ(y(x), y0 (x))(y0 (x))2 − ∂222 ϕ(y(x), y0 (x))y0 (x)y00 (x) = 0.

Vegyük észre, hogy ez azzal ekvivalens, hogy


d 
ϕ(y(x), y0 (x)) − ∂2 ϕ(y(x), y0 (x)) · y0 (x) = 0,

dx
azaz,
ϕ(y(x), y0 (x)) − ∂2 ϕ(y(x), y0 (x)) · y0 (x) = C
teljesül valamely C ∈ R konstanssal.
3. eset (Az integrandus nem függ y0 -től)
Legyen [a, b] ⊂ R intervallum, ϕ : [a, b] × R → R és tekintsük a
Z b
J(y) = ϕ (x, y(x)) dx (y ∈ C([a, b]))
a

módon megadott J funkcionált. Ekkor az Euler–Lagrange-egyenlet

∂2 ϕ(x, y(x)) = 0.

Figyeljük meg, hogy ebben az esetben az Euler–Lagrange-egyenlet nem egy differenciálegyenlet, hanem csak
egy függvényegyenlet.
4. eset
Legyen [a, b] ⊂ R intervallum, f : [a, b] × R → R és tekintsük a
Z b p  
J(y) = f (x, y(x)) · 1 + (y0 (x))2 dx y ∈ C1 ([a, b])
a

47
módon megadott J funkcionált, melyhez a
p d y0 (x)
∂2 f (x, y(x)) · 1 + (y0 (x))2 − f (x, y(x)) · p =0
dx 1 + (y0 (x))2
Euler–Lagrange-differenciálegyenlet tartozik. Ezt tovább alakítva,
p y0 (x)
∂2 f (x, y(x)) · 1 + (y0 (x))2 − ∂1 f (x, y(x)) · p
1 + (y0 (x))2
(y0 (x))2 y00 (x)
− ∂2 f (x, y(x)) · p − ∂2 f (x, y(x)) · = 0,
(1 + (y0 (x))2 ) 2
3
1 + (y0 (x))2
vagyis,
y00 (x)
" #
1
∂2 f (x, y(x)) − ∂1 f (x, y(x)) · y0 (x) − f (x, y(x)) · = 0,
1 + (y0 (x))2 1 + (y0 (x))2
p

azaz,
y00 (x)
∂2 f (x, y(x)) − ∂1 f (x, y(x)) · y0 (x) − f (x, y(x)) · = 0.
1 + (y0 (x))2
2.5.2. Példa. Tekintsük a
1 + (y0 (x))2
Z 2
p
 
J(y) = dx y ∈ C1 ([1, 2])
1 x
funkcionált az
y(1) = 0 és y(2) = 1
peremfeltételek mellett. Ekkor az integrandus nem tartalmazza y-t, így az Euler–Lagrange-egyenlet
d
∂2 ϕ x, y0 (x) = 0,


dx
azaz,
∂2 ϕ x, y0 (x) = C


alakú valamely C ∈ R konstanssal. Ebben az esetben ez az


y0 (x)
=C
x 1 + (y0 (x))2
p

differenciálegyenletet jelenti. Ebből, átalakítások után az


Cx
y0 (x) = √
1 − C 2 x2
differenciálegyenlet adódik, melynek általános megoldása
1√
y(x) = 1 − C 2 x2 + C 1 ,
C
azaz,
1
.
(y − C1 )2 + x2 =
C2
Végül, a C és C1 konstansok a peremfeltételekből határozhatóak meg

5
C= és C1 = 2,
5
azaz,
(y − 2)2 + x2 = 5.

48
2.5.3. Példa (A legkisebb forgástest). Legyenek (x0 , y0 ) és (x1 , y1 ) adott pontok a síkon. Az összes, az (x0 , y0 )
pontot az (x1 , y1 ) ponttal összekötő görbék közül határozzuk meg azt, melynek x-tengely körüli megforgatása
révén a legkisebb felszínű forgástest keletkezik.
Legyen y ∈ C1 ([x0 , x1 ]), ekkor az y görbe x-tengely körüli megforgatása révén keletkező forgástest felszíne a
Z x1 p
J(y) = y(x) 1 + (y0 (x))2 dx
x0

mennyiség 2π-szerese. Ekkor az Euler–Lagrange-egyenlet

ϕ(y(x), y0 (x)) − ∂2 ϕ(y(x), y0 (x)) · y0 (x) = C

alakú valamely C ∈ R konstanssal. Ebben az esetben ez az


p (y0 (x))2
y(x) 1 + (y0 (x))2 − y(x) p = C,
1 + (y0 (x))2
azaz, az p
y(x) = C 1 + (y0 (x))2
differenciálegyenlet, ami átalakítások után az
r
y2 (x) − C 2
y0 (x) = ,
C2
melynek általános megoldása az x + C 
1
y(x) = cosh
C
láncgörbe.

2.5.4. Példa. Tekintsük a Z b


J(y) = (x − y(x)2 )dx
a
funkcionált, ebben az esetben az Euler–Lagrange-egyenlet a

−2(x − y(x)) = 0

egyenlet, melynek az
y(x) = x (x ∈ [a, b])
függvény a megoldása.

49

You might also like