Professional Documents
Culture Documents
A Variációszámítás Klasszikus Problémái
A Variációszámítás Klasszikus Problémái
A Variációszámítás Klasszikus Problémái
fejezet
Variációszámítás
A variációszámítás klasszikus problémái különböző extrémum-feladatok vizsgálata során alakultak ki. Ezeknek
az extrémum-feladatoknak az a leglényegesebb közös tulajdonsága, hogy az extrémumot szolgáltató objek-
tumok — a klasszikus szélsőérték-feladatok esetében megszokottaktól eltérően — nem valamely véges dimen-
ziós tér pontjai, hanem általában valamely függvénytér elemei. Ennek megfelelően azoknak a függvényeknek,
amelyeknek a szélsőértékeit keressük, a változóik is függvények. Az ilyen „függvényváltozós függvények”,
úgynevezett „funkcionálok” szélsőértékszámításának során nem alkalmazhatók közvetlenül a többváltozós füg-
gvények esetében megismert, elsősorban a differenciálszámítás eszközeit felhasználó módszerek. Ezek pótlá-
sára új módszerek kialakítása szükséges, melyre a variációszámítás keretein belül nyílik lehetőség.
A fény terjedése. Egy változó optikai sűrűségű átlátszó közegben adva van két pont, A és B. Határozzuk meg
az A pontból a B pontba haladó fénysugár pályáját.
A gömb geodetikusai. Határozzuk meg a gömbfelületen húzható, a gömbfelület két adott pontját összekötő
görbék közül azt, amelynek a hossza a legkisebb.
A legkisebb forgásfelület problémája. Mindazon y(x) görbék között, amelynek végpontjai adott A = (x0 , y0 )
és B = (x1 , y1 ) pontokban vannak, határozzuk meg azt, amelynek az x tengely körüli forgása útján a
legkisebb felület keletkezik.
A bolygók mozgása. Vegyünk két tömegpontot, amelyek az általános tömegvonzás törvénye szerint hatnak
egymásra. Tekintsük az egyik pontot mozdulatlannak és vizsgáljuk a másik pont mozgását.
A izoperimetrikus probléma. Az összes adott hosszúságú, önmagukat nem metsző zárt görbék között határoz-
zuk meg azt, amely a legnagyobb területet határolja.
37
pontban, ha létezik egy olyan a : X → K lineáris funkcionál és egy olyan ε : X → K, melyre lim x→x0 ε(x) = 0,
úgy, hogy
f (x) − f (x0 ) = a (x − x0 ) + ε(x) kx − x0 k (x ∈ X) ,
más szóval,
f (x) − f (x0 ) − a (x − x0 )
lim =0
x→x0 kx − x0 k
teljesül.
2.1.1. Tétel (Egyértelműség). Legyen X normált tér K felett D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : X → K
funkcionál. Ha a1 , a2 : X → K olyan lineáris funkcionálok, melyekre
f (x) − f (x0 ) − ai (x − x0 )
lim =0 (i = 1, 2)
x−x0 kx − x0 k
teljesül, akkor
a1 (x) = a2 (x) (x ∈ X) .
2.1.1. Megjegyzés. Az előző tétel azt mondja ki, hogy ha az X normált tér egy D nemüres, nyílt részhalmazának
x0 pontjában az f : X → K funkcionál differenciálható, akkor a differenciálhatóság definíciójában megadott
a : X → K lineáris funkcionál egyértelműen meg van határozva. Ezt a folytonos lineáris funkcionált az f
funkcionál x0 pontbeli variációjának nevezzük és δ f (x0 )–lal jelöljük.
2.1.1. Állítás (Differenciálhatóság ⇒ folytonosság). Legyen X normált tér, D ⊂ X nemüres, nyílt halmaz,
x0 ∈ X, f : D → K funkcionál. Ha az f funkcionál differenciálható az x0 pontban, akkor ott folytonos is.
2.1.2. Állítás. Normált tér folytonos lineáris funkcionálja differenciálható, és variációja minden pontban ön-
maga.
Bizonyítás. Legyen f : X → K, ekkor minden x, x0 ∈ X esetén
f (x) − f (x0 ) = f (x − x0 ) ,
így δ f (x0 ) = f (x0 ) és ε(x) = 0 választással kapjuk, hogy f differenciálható az x0 pontban.
2.1.2. Tétel. Legyen X normált tér, D ⊂ X nemüres, nyílt halmaz, x0 ∈ D, f : D → K funkcionál. Ha az f
funkcionál differenciálható az x0 pontban, akkor tetszőleges h ∈ X esetén
1
δ f (x0 ) (h) = lim f (x0 + λh) − f (x0 ) .
λ→0 λ
2.1.2. Megjegyzés. Az előző tételben szereplő
1
f (x0 + λh) − f (x0 )
lim
λ→0 λ
38
Példák differenciálható funkcionálokra
2.1.1. Példa. Tekintsük az R normált teret az kxk = |x| normával. Ha D ⊂ R nemüres, nyílt halmaz, x0 ∈ D,
f : D → R függvény, akkor az f funkcionál (függvény) x0 pontbeli differenciálhatósága nyilván ekvivalens az
f függvény x0 pontbeli klasszikus értelemben vett differenciálhatóságával. Tehát, ha az f funkcionál differen-
ciálható az x0 pontban, akkor f variációja
2.1.2. Példa. Legyen n ∈ N és tekintsük Rn –et az euklideszi normával. Ha D ⊂ Rn nemüres, nyílt halmaz,
x0 ∈ X és f : D → R függvény, akkor az f funkcionál x0 pontbeli differenciálhatósága ekvivalens az f , n–
változós függvény x0 -beli klasszikus értelemben vett differenciálhatóságával, azaz
2.1.3. Példa. Legyen [a, b] ⊂ R valódi intervallum, ϕ : [a, b]×R → R folytonos függvény, és tekintsük a C([a, b])
normált téren a következő funkcionált
Z b
I( f ) = ϕ (x, f (x)) dx ( f ∈ C([a, b])) .
a
Megmutatjuk, hogy az I funkcionál differenciálható, feltéve, hogy a ϕ függvény folytonosan parciálisan differ-
enciálható a második változója szerint. Legyen f0 ∈ C([a, b]) tetszőleges, ekkor
"Z b Z b #
1
lim ϕ (x, f0 (x) + λ f (x)) dx − ϕ (x, f0 (x)) dx
λ→0 λ a a
Z b
1
= lim ϕ (x, f0 (x) + λ f (x)) − ϕ (x, f0 (x)) dx
λ→0 λ a
Z b
1
= lim ϕ (x, f0 (x) + λ f (x)) − ϕ (x, f0 (x)) dx
λ→0 a λ
Z b
= f (x) · ∂2 ϕ (x, f0 (x)) dx.
a
39
2.2. Bilineáris és kvadratikus funkcionálok
2.2.1. Definíció. Legyen X normált tér, B : X × X → K. Azt mondjuk, hogy B bilineáris funkcionál, ha
azaz, B mindkét változójában lineáris. Azt mondjuk, hogy B szimmetrikus, ha tetszőleges x, y ∈ X esetén
B(x, y) = B(y, x) teljesül.
módon megadott B : X × X → K leképezés egy bilineáris funkcionál, mely pontosan akkor szimmetrikus, ha a1
és a2 lineárisan függőek.
Q(x) = B(x, x) (x ∈ X)
2.2.1. Állítás. Az X normált tér B szimmetrikus, bilineáris funkcionálja pontosan akkor folytonos, ha létezik
egy olyan C > 0 konstans, hogy
|B(x, y)| ≤ C kxk · kyk (x, y ∈ X) .
2.2.2. Állítás. Az X normált tér Q kvadratikus funkcionálja pontosan akkor folytonos, ha létezik egy olyan
C > 0 konstans, hogy
|Q(x)| ≤ C kxk2 (x ∈ X) .
Q(x) = cx2 (x ∈ R)
40
2.2.3. Példa. Legyen n ∈ N és tekintsük az Rn teret az euklideszi normával. Ezen tér minden B : Rn × Rn → R
bilineáris funkcionálja előáll
n X
X n
B(x, y) = ai, j xi y j (x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) ∈ Rn )
i=1 j=1
n on
alakban, valamely A = ai, j n × n–es valós mátrix esetén. Továbbá, B pontosan akkor szimmetrikus, ha az
i, j=1
A mátrix szimmetrikus.
2.2.4. Példa. Legyen [a, b] ⊂ R valódi intervallum, α : [a, b] → R korlátos változású függvény. Ha f, g ∈
C([a, b]), akkor legyen Z b
B( f, g) = f (x)g(x)dα(x) ( f, g ∈ C([a, b])) .
a
Ekkor B : C([a, b]) × C([a, b]) → R egy bilineáris funkcionál.
Ha K : [a, b] × [a, b] → R korlátos függvény, akkor a
Z b
B ( f, g) =
∗
f (x)g(y)K(x, y)dxdy ( f, g ∈ C([a, b]))
a
módon megadott B∗ : C([a, b]) × C([a, b]) → R leképezés szintén egy bilineáris funkcionált értelmez, mely pon-
tosan akkor szimmetrikus, ha K(x, y) = K(y, x) teljesül minden x, y ∈ [a, b] esetén.
1
f (x) − f (x0 ) = a(x − x0 ) + q(x − x0 ) + ε(x) kx − x0 k2 (x ∈ X)
2
teljesül. Más szóval,
f (x) − f (x0 ) − a(x − x0 ) − 12 q(x − x0 )
lim = 0.
x→x0 kx − x0 k2
41
2.3.2. Példa. Legyen n ∈ N és tekintsük Rn –et az euklideszi normával. Ha D ⊂ Rn nemüres, nyílt halmaz,
x0 ∈ X és f : D → R függvény, akkor az f funkcionál x0 pontbeli kétszeri differenciálhatósága ekvivalens az f ,
n–változós függvény x0 -beli klasszikus értelemben vett kétszeri differenciálhatóságával, azaz
δ2 f (x0 )(x) = hgrad f (x0 )x, xi (x ∈ D) .
Ha h ∈ Rn , akkor az f funkcionál h iránymenti másodrendű deriváltja az x0 pontban hgrad f (x0 )h, hi, speciáli-
san, ha h = ei , akkor ez az iránymenti derivált éppen az f másodrendű parciális deriváltjaiból képzett mátrix,
∂1 f (x0 ) ∂1 ∂2 f (x0 ) . . . ∂1 ∂n f (x0 )
2
2.3.3. Példa. Legyen [a, b] ⊂ R valódi intervallum, ϕ : [a, b]×R → R folytonos függvény, és tekintsük a C([a, b])
normált téren a következő funkcionált
Z b
I( f ) = ϕ (x, f (x)) dx ( f ∈ C([a, b])) .
a
Korábban már láttuk, hogy I differenciálható minden f0 ∈ C([a, b]) pontban, amennyiben ϕ folytonosan differ-
enciálható a második változója szerint, és I variációja
Z b
δI( f0 )( f ) = ∂2 ϕ (x, f0 (x)) · f (x)dx.
a
Ha a ϕ függvény kétszer folytonosan differenciálható a második változója szerint, akkor a fenti I funkcionál
kétszer differenciálható és Z b
δ I( f0 )( f ) =
2
∂2 ϕ (x, f0 (x)) · f (x)2 dx.
a
2.3.4. Példa. Legyen [a, b] ⊂ R valódi intervallum, és a C1 ([a, b]) normált téren tekintsük a
Z b
J( f ) = x f (x)2 + f 0 (x)3 dx
a
módon megadott funkcionált. Ekkor az előző példa szerint J kétszer differenciálható minden f0 ∈ C1 ([a, b])
pontban és Z bh i
δJ( f0 )( f ) = 2x f0 (x) f (x) + 3 f00 (x)2 f 0 (x) dx
a
valamint Z bh i
δ J( f0 )( f ) =
2
2x f (x)2 + 6 f00 (x) f 0 (x)2 dx.
a
42
2.4.1. Tétel (Lokális extrémum szükséges feltétele). Legyen X valós normált tér, D ⊂ X nemüres, nyílt hal-
maz, x0 ∈ D, f : D → R egy olyan funkcionál, mely differenciálható az x0 pontban. Ha az f funkcionálnak az
x0 pontban lokális extrémuma van, akkor δ f (x0 ) = 0.
Bizonyítás. Tegyük fel, hogy az f funkcionálnak lokális minimuma van az x0 pontban. Legyen % > 0 olyan,
hogy ha x ∈ X és kx − x0 k < %, akkor
f (x0 ) ≤ f (x).
Legyen h ∈ X olyan, hogy khk = %, ekkor tetszőleges λ ∈]−1, 1[ esetén x0 +λh ∈ D. Definiáljuk a Ψ : ]−1, 1[→ R
leképezést a
Ψ(λ) = f (x0 + λh) (λ ∈] − 1, 1[)
képlettel. Ekkor a Ψ függvénynek lokális minimuma van a λ = 0 pontban. Továbbá, Ψ differenciálható a λ = 0
pontban és
0 = Ψ0 (0) = δ f (x0 )(h).
Legyen most h ∈ X, h , 0 tetszőleges, ekkor
khk %h
!
δ f (x0 )(h) = f = 0,
% khk
hiszen
%h
= %.
khk
2.4.1. Megjegyzés. Az előző tétel jelölései és feltételei mellett az x0 pontot az f funkcionál stacionárius helyé-
nek nevezzük, ha δ f (x0 ) = 0, azaz
δ f (x0 )(x) = 0
teljesül minden x ∈ X esetén.
A tétel azt sugallja, hogy normált terek funkcionáljai extrémumának keresésekor a többváltozós függvények
elméletéből ismert módszerekhez hasonlókat alkalmazhatunk. A lokális extrémumhelyek a stacionárius helyek
közül kerülnek ki. Az első variáció azonban egy folytonos lineáris funkcionál, azaz, egy függvény, melynek
eltűnése azt jelenti, hogy ez a függvény az értelmezési tartományának minden pontjában a nulla értéket veszi fel.
Az R egydimenziós normált téren, a folytonos lineáris funkcionálok, számmal jellemezhetőek, így eltűnésük
úgy írható le, hogy ez a szóban forgó valós szám nulla.
Az Rn n–dimenziós normált térben a folytonos lineáris funkcionálok egy Rn -beli vektorral jellemezhetőek.
Így, ezek eltűnése úgy fogható fel, mint n darab valós szám egyidejű eltűnése, ami úgy is felfogható, hogy a
stacionárius helyeket egy n egyenletből álló, n ismeretlent tartalmazó – általában nemlineáris – egyenletrendszer
megoldásai.
A variációszámítás szempontjából leginkább érdekes esetekben – amikor a funkcionálok értelmezési tar-
tománya nem véges dimenziós tér, hanem például egy függvénytér – a stacionárius helyek differenciálegyenletek
segítségével írhatóak le.
2.5. Az Euler–Lagrange-differenciálegyenletek
Az előzőekben már láttuk, hogy egy normált tér funkcionáljaival kapcsolatos extrémum-problémák tanulmányo-
zása során olyan feltételekkel kerülünk szembe, melyek teljesüléséhez egy adott folytonos lineáris funkcionál-
nak azonosan nullának kell lennie. Az általános esetben ennél többet nem lehet mondani, de azokban a speciális
esetekben, amelyek a klasszikus variációs problémák megoldásának érdekében az egész elmélet kialakulását
elősegítették, olyan konkrét funkcionálok szerepelnek, melyek variációjának eltűnése a legnevezetesebb ese-
tekben differenciálegyenletek fennállását jelenti.
43
Legyen [a, b] ⊂ R valódi intervallum, n ∈ N és ϕ : [a, b] × Rn+1 → R pedig olyan folytonos függvény, mely
az utolsó (n + 1) változója szerint folytonosan parciálisan differenciálható és legyen
Z b
J( f ) = ϕ x, f (x), f 0 (x), . . . , f (n) (x) dx ( f ∈ Cn ([a, b])) .
a
Ahhoz tehát, hogy a J funkcionálnak az értelmezési tartománya egy f0 belső pontjában lokális extrémuma
legyen, szükséges, hogy a fenti δJ( f0 ) funkcionál azonosan nulla legyen, azaz, minden f ∈ Cn ([a, b]) esetén
δJ( f0 )( f ) = 0 teljesüljön. Célunk az, hogy ezt a követelményt egy olyan feltétellel helyettesítsük, melyben
csupán f0 szerepel.
2.5.1. Tétel (Lagrange-lemma). Legyen [a, b] ⊂ R valódi intervallum, n ∈ N, ψ : [a, b] → R olyan folytonos
függvény, hogy minden olyan f ∈ Cn ([a, b]) esetén, melyre f (k) (a) = f (k) (b) = 0, k = 0, 1, . . . , n − 1 fennáll az
Z b
ψ(x) f (x)dx = 0
a
egyenlőség. Ekkor ψ ≡ 0.
módon megadott J : Cn ([a, b]) → R funkcionált. Ha a J funkcionálnak az f0 ∈ Cn ([a, b]) pontban lokális
extrémuma van, akkor az f0 függvényre az [a, b] intervallum minden x pontjában fennáll a
d
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) − ∂3 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) + · · ·
dx
dn
+ (−1)n n ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) = 0
dx
úgynevezett Euler–Poisson–differenciálegyenlet.
Ezért, ha a J funkcionálnak az f0 ∈ C(n) ([a, b]) pontban lokális extrémuma van, akkor
Z bh i
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (x)+ · · · + ∂n+2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) · f (n) (x) dx
a
44
teljesül minden f ∈ Cn ([a, b]) esetén. Legyen most f ∈ Cn ([a, b]) olyan, hogy f (k) (a) = f (k) (b) = 0 minden
k = 0, 1, . . . , n − 1 esetén. Ha egymás után többször alkalmazzuk a parciális integrálás tételét, akkor azt kapjuk,
hogy
Z b d
∂2 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x) − ∂3 ϕ x, f0 (x), f00 (x), . . . , f0(n) (x)
a dx
n !
n d
+ · · · (−1) n ∂n+2 ϕ x, f0 (x), f0 (x), . . . , f0 (x) f (x)dx = 0,
0 (n)
dx
így a Lagrange-lemmát felhasználva adódik a tétel állítása.
A fentiek alapján az a kérdés, hogy egy variációszámítási problémának mikor létezik egy egyértelműen
meghatározott megoldása, egy Cauchy-feladat egzisztencia és unicitás kérdésére redukálódik. Ezzel kapcsolat-
ban pedig a következő állítás érvényes.
2.5.4. Tétel (Bernstein). Legyen [a, b] ⊂ R és ϕ : [a, b]×R2 → R egy függvény. Tegyük fel, hogy a ϕ függvényre
teljesülnek az alábbiak.
(a) minden rögzített z ∈ R esetén a ϕ, ∂2 ϕ és ∂3 ϕ függvények folytonosak az [a, b] × R halmazon.
(b) léteznek olyan α, β : [a, b]×R folytonos, az értelmezési tartományuk minden korlátos részhalmazán korlátos
függvények és egy olyan κ > 0 konstans, hogy
Tekintsünk egy Z b
ϕ(x, y, y0 )dx
a
alakú funkcionált. Az előző állítások miatt az ennek a funkcionálnak az extremálisai megoldásai a
d
∂2 ϕ(x, y, y0 ) − ∂3 ϕ(x, y, y0 ) = 0
dx
45
Euler–Lagrange-egyenletnek, mely az y ismeretlen függvényre egy másodrendű egyenlet. A fenti funkcionál
extrémumai azonban egy bővebb osztályból a C1 ([a, b]) térből valóak. Így tehát előfordulhat, hogy ugyan
minden pontban teljesül az Euler–Lagrange-egyenlet, azonban az extremális görbe nem kétszer differenciálható.
Ezt mutatja a következő példa is.
amiből speciálisan az is adódik, hogy a [−1, 1] intervallum minden pontjában fennáll az Euler–Lagrange-
egyenlet.
2.5.5. Tétel. Legyen [a, b] ⊂ R és ϕ : [a, b] × R2 → R egy olyan függvény mely kétszer folytonosan parciálisan
differenciálható mindegyik változója szerint. Legyen y ∈ C1 ([a, b]) egy olyan függvény, melyre teljesül a
d
∂2 ϕ(x, y, y0 ) − ∂3 ϕ(x, y, y0 ) = 0
dx
Euler–Lagrange-egyenlet. Ekkor az y függvény az [a, b] intervallum minden olyan x pontjában kétszer differen-
ciálható, mely pontban
∂23 ϕ(x, y(x), y0 (x)) , 0
teljesül.
46
1. eset (Az integrandus nem függ y-tól)
Legyen [a, b] ⊂ R intervallum és ϕ : [a, b] × R → R egy függvény és tekintsük a
Z b
J(y) = ϕ x, y0 (x) dx y ∈ C1 ([a, b])
a
∂1 ϕ(y(x), y0 (x))y0 (x) − ∂212 ϕ(y(x), y0 (x))(y0 (x))2 − ∂222 ϕ(y(x), y0 (x))y0 (x)y00 (x) = 0.
∂2 ϕ(x, y(x)) = 0.
Figyeljük meg, hogy ebben az esetben az Euler–Lagrange-egyenlet nem egy differenciálegyenlet, hanem csak
egy függvényegyenlet.
4. eset
Legyen [a, b] ⊂ R intervallum, f : [a, b] × R → R és tekintsük a
Z b p
J(y) = f (x, y(x)) · 1 + (y0 (x))2 dx y ∈ C1 ([a, b])
a
47
módon megadott J funkcionált, melyhez a
p d y0 (x)
∂2 f (x, y(x)) · 1 + (y0 (x))2 − f (x, y(x)) · p =0
dx 1 + (y0 (x))2
Euler–Lagrange-differenciálegyenlet tartozik. Ezt tovább alakítva,
p y0 (x)
∂2 f (x, y(x)) · 1 + (y0 (x))2 − ∂1 f (x, y(x)) · p
1 + (y0 (x))2
(y0 (x))2 y00 (x)
− ∂2 f (x, y(x)) · p − ∂2 f (x, y(x)) · = 0,
(1 + (y0 (x))2 ) 2
3
1 + (y0 (x))2
vagyis,
y00 (x)
" #
1
∂2 f (x, y(x)) − ∂1 f (x, y(x)) · y0 (x) − f (x, y(x)) · = 0,
1 + (y0 (x))2 1 + (y0 (x))2
p
azaz,
y00 (x)
∂2 f (x, y(x)) − ∂1 f (x, y(x)) · y0 (x) − f (x, y(x)) · = 0.
1 + (y0 (x))2
2.5.2. Példa. Tekintsük a
1 + (y0 (x))2
Z 2
p
J(y) = dx y ∈ C1 ([1, 2])
1 x
funkcionált az
y(1) = 0 és y(2) = 1
peremfeltételek mellett. Ekkor az integrandus nem tartalmazza y-t, így az Euler–Lagrange-egyenlet
d
∂2 ϕ x, y0 (x) = 0,
−
dx
azaz,
∂2 ϕ x, y0 (x) = C
48
2.5.3. Példa (A legkisebb forgástest). Legyenek (x0 , y0 ) és (x1 , y1 ) adott pontok a síkon. Az összes, az (x0 , y0 )
pontot az (x1 , y1 ) ponttal összekötő görbék közül határozzuk meg azt, melynek x-tengely körüli megforgatása
révén a legkisebb felszínű forgástest keletkezik.
Legyen y ∈ C1 ([x0 , x1 ]), ekkor az y görbe x-tengely körüli megforgatása révén keletkező forgástest felszíne a
Z x1 p
J(y) = y(x) 1 + (y0 (x))2 dx
x0
−2(x − y(x)) = 0
egyenlet, melynek az
y(x) = x (x ∈ [a, b])
függvény a megoldása.
49