Download as pdf or txt
Download as pdf or txt
You are on page 1of 462

Óbudai Egyetem BGK Fejezetek a matematikából

Hanka László

Fejezetek a matematikából

Egyetemi jegyzet

Budapest, 2013

ÓE - BGK - 3041
Óbudai Egyetem BGK Fejezetek a matematikából

Szerző: Dr. Hanka László adjunktus (OE BGK)

Lektor: Hosszú Ferenc mestertanár (OE BGK)


Óbudai Egyetem BGK Fejezetek a matematikából

Fiamnak Boldizsárnak
Óbudai Egyetem BGK Fejezetek a matematikából
Óbudai Egyetem BGK Fejezetek a matematikából

Előszó
Ez az elektronikus egyetemi jegyzet elsősorban mérnökhallgatóknak szól. Kettős célt szolgál.
Egyrészt biztosítani szeretnénk a lehetőséget, hogy a BSc szak viszonylag csekély számú
matematika óráján el nem hangzott, de a műszaki tárgyak megértéséhez és feldolgozásához
elengedhetetlenül szükséges tananyagot a hallgató önállóan, vagy egy választható kurzus keretein
belül megtanulhassa. Ugyanakkor tankönyvként szolgálhat azon MSc szakos hallgatók számára
is, akik a feldolgozott fejezetek közül valamelyiket tanulmányaik során hallgatják.
A jegyzet elsősorban a gyakorlatra helyezi a hangsúlyt. Természetesen cél az, hogy a hallgatók
megismerjenek olyan fejezeteket a matematikából, amely az alapképzésbe vagy esetleg a
mesterképzés keretei közé sem fér be, de a mérnöki gyakorlat számára elengedhetetlen.
Szeretnénk szélesíteni a leendő mérnökök látókörét további matematikai ismeretekkel, bemutatni
különböző elméleteket és ezek módszereit, de elsősorban úgy, hogy az elmélet alkalmazását
példákon keresztül illusztráljuk. A 210 részletesen kidolgozott feladat és a 45 ábra segíti az
elmélet megértését. Természetesen a megfogalmazott állítások nagy részét bebizonyítjuk, de nem
mindegyiket. Nem matematikusok számára íródott ez a jegyzet, hanem mérnökök számára. Ezért
azokat az állításokat igazoljuk, amelyek elősegítik a témakör logikájának pontosabb megértését
és esetleg az alkalmazott ötletek segítséget nyújthatnak a gyakorlati problémák megoldásában. A
túlzottan bonyolult, szélsőségesen elméleti fejtegetéseket mellőztük, egy érdeklődő hallgató
igény szerint ezeknek utána tud nézni a jegyzet végén közölt szakirodalomban.
A feldolgozott témakörök a következők. Lineáris algebra és mátrixelmélet, differenciálegyenletek
és differenciálegyenlet rendszerek elmélete, sorelmélet, Taylor-sorok és valós valamint komplex
Fourier-sorok elmélete. Mindenütt igyekeztünk az alkalmazásokat nagy hangsúllyal szerepeltetni.
Külön kiemeljük, hogy a másodrendű differenciálegyenletek fejezetében részletesen tárgyaljuk a
harmonikus, csillapított és gerjesztett rezgések elméletét, amelynek ismerete egy mérnökember
számára nélkülözhetetlen.
Egy jól képzett mérnök természetesen állandóan képzi magát, ez a jegyzet természetesen nem
egy kimerítő tárháza a szüksége ismereteknek, de úgy gondoljuk, első lépésnek első lépésként
megfelelő, mert nagyon reméljük, hogy mindenkiben felmerül az önképzés, továbbképzés igénye.
Ebben a jegyzetben együtt gondolkodásra invitáljuk a tisztelt Olvasót, ezért a szöveg
megfogalmazása némileg különbözik a szokásos „száraz” matematikai fogalmazástól.
Megpróbáltunk „hangosan gondolkodni”, hogy az olvasó érezze, milyen új kérdések
fogalmazódnak meg egy elmélet kifejtése során, és azokra hogyan lehet válaszolni.
A jegyzet feldolgozásához, a matematika felfedezéséhez sok örömöt és sikerélményt kíván a

Szerző

Budapest, 2013. május. 31.

5
Óbudai Egyetem BGK Fejezetek a matematikából

6
Óbudai Egyetem BGK Fejezetek a matematikából

1. fejezet

Mátrixelmélet, Lineáris algebra

7
Óbudai Egyetem BGK Fejezetek a matematikából

8
Óbudai Egyetem BGK Fejezetek a matematikából

1. Lineáris algebra
1.1. A lineáris tér. Alapfogalmak
A lineáris algebra legfontosabb fogalmai közé tartozik a lineáris tér, vagy más néven a vektortér
fogalma. Ez bizonyos tulajdonságoknak, feltételeknek eleget tevő elemek, objektumok halmaza.
A lineáris tér legalapvetőbb fogalmai közé tartoznak a bázis, a dimenzió. A következőkben a
felsorolt fogalmak tisztázásával, majd a lineáris algebra apparátusának alkalmazásával
foglalkozunk. Célunk elsősorban az, hogy a későbbi fejezetekben részletesen tárgyalt
differenciálegyenlet rendszerek valamint a Fourier-sorok elméletét megalapozzuk.

A matematikában nagyon gyakori műveletek az összeadás és a számmal való szorzás. A vektortér


olyan elemhalmaz, amelyben ez a két művelet értelmezve van, és amely műveletektől
megköveteljük azokat a tulajdonságokat, amelyeket a matematika konkrét objektumainak
tanulmányozása során megismertünk.

1.1.Definíció: Legyenek az x, y, z, … elemek (általános értelemben vett „vektorok”) egy


bizonyos L halmaz elemei, α, β, γ,… pedig legyenek valós számok. Ekkor az (L, R) párt valós
lineáris térnek, vagy valós vektortérnek nevezzük, ha teljesülnek az alábbi axiómák. (A
továbbiakban egyszerűen az L szimbólummal hivatkozunk egy vektortérre. )

A) Az L halmaz bármely két xL és yL eleméhez egyértelműen hozzá van rendelve az L
halmaznak egy eleme, amelyet az x és y összegének nevezünk és x+y-nal jelölünk, és erre a
műveletre érvényesek az alábbi tulajdonságok:

1. x+y = y+x, tehát az összeadás kommutatív;


2. (x+y)+z = x+(y+z), tehát az összeadás asszociatív;
3. létezik L-ben úgynevezett nullelem (nullvektor), jele 0, amelyre igaz, hogy tetszőleges
xL esetén x+0 = x;
4. minden L-beli x-nek létezik ellentettje, jele –x; melyre teljesül, hogy x + (–x) = 0.

B) Az L halmaz bármely xL eleméhez és bármely αR valós számhoz egyértelműen hozzá van
rendelve az L halmaznak egy eleme, amelyet az α valós szám és xL szorzatának nevezünk és
α∙x-szel jelölünk, és erre a műveletre érvényesek az alábbi tulajdonságok:

1. az 1R valós számnak és az xL elemnek a szorzata éppen x, minden L-beli


x-re, azaz 1∙x = x;
2. tetszőleges αR és βR valós számok és tetszőleges xL esetén a szorzás asszociatív,
azaz α(βx) = (αβ)x;
3. a szorzás az összeadásra nézve disztributív művelet, azaz tetszőleges α, β valós számok és
tetszőleges x, yL elemek esetén(α+β)x = αx + βx, illetve α(x+y) = αx + αy.

9
Óbudai Egyetem BGK Fejezetek a matematikából

A fenti definícióban, mint látható valóban azok a műveletek és műveleti azonosságok


szerepelnek, amelyeket a matematika különböző területein, már megismertünk, mondhatnánk,
nem láttunk semmi újat. Nos a lényeg éppen ebben van. A lineáris algebra alapvető fogalma a
lineáris tér, éppen azokat a törvényszerűségeket, szabályokat keressük a lineáris algebrában,
amelyek a fenti tulajdonságok érvényesülése esetén biztosan teljesülnek, függetlenül attól, hogy
mik is annak a „misztikus”L halmaznak az elemei. Ebben éppen a matematika lényege
tükröződik, hogy tudniillik általánosít, általános tételeket keres, miközben elvonatkoztat a
konkrétumoktól, csak azokkal a részletekkel törődik, amelyek valóban fontosak.
Ennek megfelelően, ha lineáris térről vagy vektortérről beszélünk, akkor az L halmaz elemeit
általános értelemben vett „vektor”-nak nevezzük, még akkor is, ha az elemek nem a klasszikus
értelemben vett vektorok.A későbbiekben, mint eddig is tettük, a „vektorokat” vastag betűvel
írjuk, akkor is ha nem a klasszikus értelemben vett vektorokról van szó.
Az L halmaz elemeitől, tehát a vektoroktól való megkülönböztetésképpen, a valós számokat
skalároknak nevezzük.

1.1.Példa: Példák lineáris térre

1. A hagyományos, n valós komponensű vektorok halmaza, jele:Rn, a műveletek pedig a


hagyományos vektorösszeadás, és vektor számmal való szorzása. A „vektortér” elnevezés éppen
innen származik.
2. Egy adott [a, b] intervallumon értelmezett valós értékű függvények halmaza a szokásos
függvényösszeadásra és számmal való szorzásra vonatkozólag. Itt tehát a „vektor” egy függvény.
Ezzel a vektortérrel dolgozunk majd a Fourier-sorok elméletében.
3. Az n sorú és k oszlopú (tehát „n-szer k-as”) valós komponensű mátrixok halmaza, jele Rnxk, a
szokásos mátrixösszeadásra és számmal való szorzásra. Ez esetben a „vektor” egy mátrix.

A lineáris tér bizonyos részhalmazainak kitüntetett szerepe van. Ezek azok a részhalmazok,
amelyek önmagukban is vektorterek, tehát amelyekre teljesül a vektortér definíciójában szereplő
hét axióma.

1.2.Definíció: Az L lineáris tér L’ részhalmazát az L vektortér alterének (lineáris altér)


nevezzük, ha az L’ halmaz ugyancsak vektortér az L-ben értelmezett műveletekre, azaz
teljesülnek a vektortér axiómák.

Egyszerűen megfogalmazható egy feltétel arra vonatkozólag, hogy egy L’ részhalmaz altér
legyen.

1.1.Tétel: Az L lineáris tér L’ részhalmaza akkor és csak akkor altér, ha tetszőleges α és β


skalárok, valamint tetszőleges x, yL’ esetén teljesül, hogy αx + βyL’. Ez másképpen úgy
fogalmazható, hogy egy L’ részhalmaz pontosan akkor altér, ha a lineáris kombináció képzése
nem vezet ki az L’ halmazból.
Bizonyítás: A vektortér axiómák szerint elemek egy halmaza akkor vektortér, ha értelmezve van
egy összeadás és egy skalárral való szorzás, amelyre teljesül a hét műveleti tulajdonság. Mivel L’
részhalmaza L-nek és L-ben teljesülnek ezek az axiómák, nyilván igaz, hogy L’-ben is
teljesülnek. Kizárólag azt kell megkövetelnünk, hogy

10
Óbudai Egyetem BGK Fejezetek a matematikából

1. „Az L’ halmaz bármely két xL’ és yL’ eleméhez egyértelműen hozzá van rendelve az L’
halmaznak egy eleme, amelyet az x és y összegének nevezünk és x+ y-nal jelölünk.”
2. „Az L’ halmaz bármely xL’ eleméhez és bármely α R valós számhoz egyértelműen hozzá
van rendelve az L’ halmaznak egy eleme, amelyet az α valós szám és xL’ szorzatának nevezünk
és α∙x-szel jelölünk.”
Mivel megköveteltük, hogy a lineáris kombináció ne vezessen ki az L’-ből ez a két feltétel
nyilvánvalóan teljesül. ■

A tétel úgy is fogalmazható, hogy az L lineáris tér egy L’ részhalmaza pontosan akkor altér,
ha tetszőleges elemeinek összes lineáris kombinációját is tartalmazza.

1.3.Definíció: Azt a legszűkebb L’ lineáris teret, amely az x1, x2, x3, …xnL-beli vektorokat
tartalmazza az x1, x2, x3, …xn vektorok által generált altérnek (vektorok által kifeszített altérnek)
nevezzük.

Nyilvánvaló az alábbi állítás.

1.2.Tétel: Az x1, x2, x3, …xnL-beli vektorok által generált L’ altér nem más, mint az
x1, x2, x3, …xn vektorok összes lineáris kombinációinak halmaza. Tehát

L '  1x1  2 x2  ...  n xn 1, 2 ,..., n  R;

Bizonyítás: Egyrészt azt kell bizonyítani, hogy a lineáris kombináció nem vezet ki az L’-ből. Ez
nyilvánvaló, mert definíció szerint az összes lineáris kombinációt tartalmazza. Másrészt azt kell
igazolni, hogy ez a legszűkebb ilyen vektortér, de ez is nyilvánvaló, hiszen ha ennél szűkebb
lenne, már nem tartalmazhatná valamennyi lineáris kombinációt, így a lineáris kombináció
kivezetne L’-ből. ■

1.2.Példa: Példák lineáris altérre. Vektorterek lineáris altereire hozunk példákat. A fentiek szerint
egy részhalmaz akkor altér, ha zárt a lineáris kombináció képzésére. Ilyen halmazokat említünk.

1. Az R2-ben, tehát a síkban, altér minden olyan egyenes, amely az origóra illeszkedik, azaz
ha végiggondoljuk ez az altér az


L '  x x  R 2 ,   R ;
alakú elemek halmaza. Ez igaz általában Rn-ben is, csak n> 3 esetén az „egyenes”-nek már nincs
szemléletes tartalma, viszont éppen a fenti formulával értelmezhető.
Ha az egyenes nem illeszkedik az origóra, akkor nem altér, mert egy vektortérnek mindig eleme a
nullvektor.

2. Az R3-ban, tehát a térben, altér minden olyan sík, amely az origóra illeszkedik, tehát az

 
L '  1x1  2 x2 x1 , x2  R3 ; 1 , 2  R ;

11
Óbudai Egyetem BGK Fejezetek a matematikából

alakú elemek halmaza. Ez igaz általában Rn-ben is, csak n> 3 esetén a „sík”-nak már nincs
szemléletes tartalma, viszont éppen a fenti formulával értelmezhető.
Ha a sík nem illeszkedik az origóra, akkor nem altér, mert egy vektortérnek mindig eleme a
nullvektor.

3. Egy adott [a, b] intervallumon értelmezett valós értékű folytonos/differenciálható/integrálható


függvények halmaza a szokásos függvényösszeadásra és számmal való szorzásra vonatkozólag.
Ezek a bevezetőben említett 2. példabeli vektortér alterei.

4. Az n sorú és k oszlopú (tehát „n-szer k-as”) valós komponensű mátrixok Rnxk vektorterében
azon mátrixok, amelyekre igaz, hogy i>j esetén aij = 0. Ez szemléletesen azt jelenti, hogy a bal
felső sarokból induló átló alatt minden komponens zérus. stb.

12
Óbudai Egyetem BGK Fejezetek a matematikából

1.2.Vektorrendszerek és tulajdonságaik
1.4.Definíció: Legyenek x1, x2, x3, …xn L-beli vektorok, α1, α2, α3, …αn pedig legyenek valós
számok. Ekkor az

α1x1+ α2x2+ α3x3+ …+αnxn

összeget az x1, x2, x3, …xn vektorok lineáris kombinációjának nevezzük. A lineáris tér
definíciója szerint ez az összeg is eleme az L halmaznak!

Miért alapvető ez a fogalom? Azért, mert mint a vektortér definíciójában láttuk összesen két
művelet van értelmezve egy lineáris térben, így ha adva van egy { x1, x2, x3, …xn }
vektorrendszer, akkor a fenti kifejezés a lehető legáltalánosabb műveletet adja meg, amit ezzel a
vektorrendszerrel el lehet végezni.
Tisztázzuk miért is fontos ez. Vektortereket akarunk leírni, vizsgálni. A legtöbb gyakorlatban
fontos vektortérnek végtelen sok eleme van. De felmerül a kérdés. Ha meg akarunk adni egy
vektorteret, akkor ismernünk kell a vektortér összes elemét? A válasz nyilvánvalóan nem. Azért,
mert kezünkben van a lineáris kombináció fogalma, segítségével egy vektorrendszer
felhasználásával újabb L-beli vektorokat állíthatunk elő. Nyilvánvaló, hogy ha ismertnek
tekintjük vektorok egy x1, x2, x3, …xn rendszerét, akkor a belőlük lineáris kombináció útján
előállítható összes vektort is ismertnek tekinthetjük!
A kérdés most már az, hogy milyen tulajdonságú, és hány elemű kell, hogy legyena
vektorrendszer, hogy azt mondhassuk, lineáris kombinációikkal az összes L-beli vektort meg
tudjuk adni. Ennek a kérdéskörnek a tisztázásához van szükség az alábbi fogalmakra.

1.5.Definíció:Az L lineáris tér x1, x2, x3, …xn vektorrendszerét a lineáris tér generátor-
rendszerének nevezzük, ha ezen vektorok lineáris kombinációjaként az összes L-beli vektor
előállítható, azaz ha yL tetszőleges, akkor léteznek olyan α1, α2, α3, …αnR valós számok,
hogy teljesül az α1x1+ α2x2+ α3x3+ …+αnxn= yegyenlőség.

Világos, hogy egy vektortér megadásához ezek szerint elég a tér egy generátorrendszerét
megadni!

1.3.Példa: Példák generátorrendszerre.

1. A sík, azaz R2 megadásához például elegendő megadni két nem párhuzamos, nullvektortól
különböző vektort. Az elemi vektorgeometriából ugyanis ismert a paralelogramma szabály a
vektorok összeadására, és ennek fordítottja a vektorfelbontás módszere. Eszerint, ha adva van két
nem párhuzamos vektor a síkban, akkor tetszőleges síkbeli vektor felbontható a megadott két
vektorral párhuzamos összetevőkre. Tehát R2-nek generátorrendszere két nem párhuzamos
vektor. Természetesen kettőnél több vektor is generátorrendszer, ha van közöttük kettő nem
párhuzamos!

2. A „3-dimenziós tér”, azaz R3 generátorrendszere az előző gondolatmenet mintájára: bármely


olyan vektorrendszer, amely tartalmaz legalább 3 olyan vektort, amelyek nincsenek egy síkban.

13
Óbudai Egyetem BGK Fejezetek a matematikából

1.6.Definíció: Az L lineáris tér x1, x2, x3, …xn vektorrendszerét lineárisan függetlennek
nevezzük, ha az

α1x1+ α2x2+ α3x3+ …+αnxn= 0 (0L)

összefüggés csak α1= α2= α3= …=αn=0 (0R) esetén áll fenn.Ezt a lineáris kombinációt triviális
lineáris kombinációnak nevezzük.

1.7.Definíció: Az L lineáris tér x1, x2, x3, …xn vektorrendszerét lineárisan összefüggő-nek
nevezzük,ha az

α1x1+ α2x2+ α3x3+ …+αnxn= 0 (0L)

összefüggés úgy teljesül, hogy legalább egy j indexre αj ≠ 0.

Ez utóbbi definíciót fogalmazhattuk volna úgy is, hogy „az x1, x2, x3, …xnvektor-rendszer
lineárisan összefüggő, ha nem független”, hiszen nyilvánvaló, hogy két egymást kölcsönösen
kiegészítő tulajdonságról van szó!

Próbáljuk meg, amennyire lehet, szemléletessé tenni ezt a két fogalmat.

1. Mit jelent két vektor lineáris összefüggősége. Ha α1x1+ α2x2= 0 esetén példáulα1≠0 akkor

ebből az egyenletből x1 kifejezhető az alábbi módon: x1   2 x2 , tehát az egyik vektor a másik
1
vektornak valós számszorosa, más szóval skalárszorosa, ami pontosan annyit jelent, hogy az
egyik vektor párhuzamos a másik vektorral. Két vektor esetében a lineáris összefüggőség
egyenértékű a párhuzamossággal. Azaz, ha két vektor lineárisan független, akkor azok nem
párhuzamosak!

2. Mit jelent három vektor lineáris összefüggősége? Ha α1x1+ α2x2+ α3x3= 0esetén például
α1≠0 akkor ebből az egyenletből x1 kifejezhető az alábbi módon

2 
x1   x 2  3 x3 ;
1 1

tehát az egyik vektor a másik két vektor skalárszorosainak összege, tehát lineáris kombinációja.
Az elemi vektorgeometriából tudjuk, ez pontosan annyit jelent, hogy az x1 vektor benne fekszik
az x2ésx3 vektorok által kifeszített síkban. Három vektor esetében a lineáris összefüggőség
egyenértékű azzal, hogy a három vektor egy síkban van. Tehát, ha három vektor lineárisan
független, akkor azok szükségképpen nem egysíkúak.

A lineáris összefüggőség lényegét tisztázza az alábbi tétel.

1.3.Tétel: Az L lineáris tér x1, x2, x3, …xn vektorrendszere akkor és csak akkor lineárisan
összefüggő, ha létezik ezen vektorok között legalább egy olyan vektor, amely kifejezhető a többi
vektorok lineáris kombinációjaként.
14
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Tegyük fel elsőként, hogy az egyik vektor, például xj kifejezhető a többi lineáris
kombinációjakét
x j  1x1  ...   j 1x j 1   j 1x j 1  ...  n xn

ekkor nullára redukálva az egyenletet, azt kapjuk, hogy

1x1  ...   j 1x j 1  x j   j 1x j 1  ...  n xn  0;

és ebben az előállításban az xj együtthatója nem nulla, tehát előállítható a nullvektor a


nemtriviális lineáris kombinációval. Ez pontosan azt jelenti, hogy a rendszer lineárisan
összefüggő.
megfordítva, tegyük fel, hogy a rendszer lineárisan összefüggő. Azaz teljesül, hogy

1x1  ...   j 1x j 1   j x j   j 1x j 1  ...  n xn  0;

és például αj ≠ 0. Ekkor az egyenletből az xj vektor kifejezhető a következő módon

1  j 1  j 1 
xj   x1  ...  x j 1  x j 1  ...  n xn ,  j  0;
j j j j

Ez pedig pontosan azt jelenti, hogy az egyik vektor kifejezhető a többi vektorok lineáris
kombinációjaként. Ezt kellett igazolni. ■

Térjünk vissza ezek után a generátorrendszer szerepének vizsgálatára. A generátorrendszer


vektorainak lineáris kombinációjával a tér összes vektora előállítható. Tegyük fel, hogy a x1, x2,
x3,… , xk, …xn generátorrendszer lineárisan összefüggő, például azxk vektor előállítható a többi
n –1 db vektor lineáris kombinációjaként:

β1x1+ β2x2+…+ βk–1xk–1+ βk+1xk+1+ …+βnxn= xk;

Ha ezek után egy yL vektor előállításában az xk vektor szerepel

α1x1+ α2x2+ …+αkxk+ …+αnxn= y

akkor xk-t helyettesíthetjük a fenti összeggel, amely esetben a következőt kapjuk

α1x1+ α2x2+ …+αk(β1x1+ β2x2+…+ βk–1xk–1+ βk+1xk+1 …+βnxn)+ …+αnxn= y

Ez az előállítás pontosan azt jelenti, hogy az yL vektor azxkvektor elhagyásával megmaradó
vektorrendszer lineáris kombinációjaként is előáll. Ez másképpen is fogalmazható.
Voltaképpen igazoltunk egy tételt.

1.4.Tétel: Ha egy lineárisan összefüggő generátorrendszerből egyenként elhagyjuk azokat a


vektorokat, amelyek előállíthatók a rendszer többi vektorának lineáris kombinációjaként, akkor
továbbra is generátorrendszert kapunk.■
15
Óbudai Egyetem BGK Fejezetek a matematikából

Ezzel a módszerrel redukálhatjuk egy generátorrendszer elemszámát.Kérdés, hogy meddig lehet,


illetve meddig érdemes ezt az eljárást folytatni. Nyilván addig, amíg egy lineárisan független
generátorrendszerhez jutunk.

1.8.Definíció: Az L lineáris tér b1, b2, b3, …bn generátorrendszerét a lineáris tér bázisának
nevezzük, ha ez a vektorrendszer lineárisan független.

A bázis legfontosabb tulajdonságára világít rá az alábbi tétel.

1.5.Tétel: Ha ab1, b2, b3, …bnvektorrendszer bázis az L lineáris térben, akkor tetszőleges yL
vektor egyértelműen felírható a bázisvektorok lineáris kombinációjaként. Tehát léteznek olyan
α1, α2, α3, …αnRegyütthatók, melyekre

y = α1b1+ α2b2+ α3b3+ …+αnbn

továbbá az α1, α2, α3, …αnRegyütthatók egyértelműen meghatározottak.


Bizonyítás: A α1, α2, α3, …αnRegyütthatók létezése abból adódik, hogy a b1, b2, b3,
…bnvektorrendszer generátorrendszer. Az egyértelműséget indirekt bizonyítjuk. tegyük fel, hogy
létezik két különböző előállítás, azaz egyrészt

y  1b1  ...   j b j  ...  nbn ;

másrészt pedig

y  1b1  ...   j b j  ...  nbn ;

Képezzük most a felírt két egyenlőség különbségét

 1 1  b1  ...    j  j  b j  ...   n n  bn  0;

Tekintettel arra, hogy definíció szerint a bázis lineárisan független vektorok rendszere, azt
kaptuk, hogy a nullvektort előállítottuk egy lineárisan független rendszer lineáris
kombinációjával. Ez azonban csak a triviális lineáris kombináció lehet, azaz  j   j minden j
indexre, ami ellentmond az indirekt feltevésnek, tehát az előállítás valóban egyértelmű. ■

A tétel jelentősége a következőkben áll. Ha rögzítünk egy B = {b1, b2, b3, …bn } bázist az L
lineáris térben, akkor bármely yL vektor egyértelműen meghatároz egy (α1, α2, α3, …αn)
rendezett szám n-est. Fordítva nyilvánvaló, egy (α1, α2, α3, …αn) szám n-es egyértelműen
meghatároz egy yL vektort a fenti lineáris kombináció segítségével. Ez azt jelenti, hogy
rögzített bázis esetén az L-beli vektorok azonosíthatók valós számokból álló rendezett szám
n-esekkel, azaz klasszikus értelemben vett n-komponensű vektorokkal. Az egyértelműség
miatt bevezethetünk egy elnevezést.

16
Óbudai Egyetem BGK Fejezetek a matematikából

1.9.Definíció: Ha B = {b1, b2, b3, …bn } rögzített bázis az L vektortérben és

y = α1b1+ α2b2+ α3b3+ …+αnbn;

akkor az α1, α2, α3, …αn valós számokat az yL vektor B bázisra vonatkozó koordinátáinak
nevezzük.A koordináták felírására az alábbi jelölést alkalmazzuk:

 1 
 
 2
y . 
 
 . 
  n 
B

Tehát ha egy L-beli vektort megadunk a koordinátáival, akkor megegyezés szerint a


koordinátákat oszlopvektorban írjuk fel. A vektor melletti jobb alsó index utal a Bbázisra!

A bázis előállítása során elméletben kiindultunk egy generátorrendszerből, és ezt a rendszert


redukáltuk úgy, hogy a végeredmény egy független generátorrendszer legyen. De nyilván
sokféleképpen találhatunk egy generátorrendszert, ennek redukálása során egy másik bázishoz
juthatunk. Felmerül a kérdés, hogy van-e valami közös az L tér különböző bázisaiban. Erre ad
választ az alábbi, bizonyítás nélkül közölt tétel.

1.6.Tétel: Az L lineáris tér bármely két bázisának elemszáma azonos. ■

Eszerint akárhogyan is állítunk elő egy bázist az mindig ugyanannyi elemű lesz. Ez feljogosít
bennünket az alábbi fogalom értelmezésére:

1.10.Definíció: Az L lineáris tér bázisának elemszámát a vektortér dimenziójának nevezzük.

1.4.Példa: Lássunk néhány példát.


1. Az R2 vektortérben – amely azonosítható a síkkal – egy jól ismert bázis a következő

1  0
i   ; j  
0  1 

ez a vektorrendszer nyilván bázis, hiszen lineárisan független (nem párhuzamosak), és


generátorrendszer is, hiszen például az

 
y     R2
 

vektor tetszőleges α és β valós számok esetén nyilvánvalóan egyértelműen előállítható i és j


vektorok segítségével az alábbi módon

17
Óbudai Egyetem BGK Fejezetek a matematikából

1  0
y          ;
0  1 

Tehát a B0 = {i, j} vektorpár bázis R2-ben, és az α, β valós számok az y vektor B0 bázisra


vonatkozó koordinátái.
A könnyebb általánosítás kedvéért bevezetjük az e1 = iés az e2 = j jelöléseket és bevezetünk egy
elnevezést. Az R2vektortér B0 = { e1, e2 }bázisát standard bázisnak nevezzük, és megállapodunk
a következőben, ha mást nem említünk, akkor bázison mindig a standard bázist értjük. Az
előbbi definíció szerint R2tehát 2 dimenziós vektortér.

2. Hasonlóan gondolható végig az R3 vektortér esete az i, j és k vektorokra vonatkozólag, azzal a


különbséggel, hogy i, j és kazért függetlenek, mert nincsenek egy síkban. A standard B0 bázis
elemei az e1 = i,e2 = j, e3 = k vektorok, és így R3 egy 3-dimenziós lineáris tér.

3.Az előző két gondolatmenet könnyen általánosítható Rn-re.

1.11.Definíció: Az

1  0 0 0


0  1  0 0
       
e1  0  ; e2  0  ; e3  1  ;.....e n   0 ;
       
. . . .
0  0  0 1 

vektorrendszer bázis Rn-ben, amely bázist az előzőekhez hasonlóan Rnstandard bázisának


nevezünk, és amelynek a jele B0. Ismét felhívjuk a figyelmet a megállapodásra, miszerint ha
egyebet nem mondunk, bázison mindig a standard bázist értjük! A korábbiak szerint Rn tehát egy
n-dimenziós vektortér.

A korábbiak szerint már könnyen látható, de a módszerek gyakorlásaképpen igazoljuk az alábbi


alapvető állítást.

1.7.Tétel: A standard bázis valóban bázisa Rn-nek, tehát egy lineárisan független
generátorrendszer.
Bizonyítás: Először megmutatjuk általánosan, hogy a vektorrendszer lineárisan független. Állítsa
tehát elő a nullvektort az alábbi lineáris kombináció

1e1  ...   j e j  ...  nen  0;

azaz koordinátánként írva

18
Óbudai Egyetem BGK Fejezetek a matematikából

1 0 0 0  1  0,


... ... ... ...  ...
        
  0,
1  0   ...   j  1   ...   n  0    0  ; azaz  j
         ...
... ... ... ... 
 0   0   1   0  
 n  0,

Kaptuk tehát, hogy a nullvektort csak a triviális lineáris kombináció állítja elő. Ez éppen a
függetlenséget igazolja. Legyen ezek után azyRn tetszőleges vektor, koordinátákkal megadva

 1 
 
 2
y . 
 
 . 
  n 
B0

Teljesen világos, hogy ekkor teljesül az

 1  1 0 0


  ... ... ...
 2      
y   .   1  0   ...   j  1   ...   n  0   1e1  ...   j e j  ...   nen ;
       
 .  ... ... ...
 n   0   0   1 

egyenlőség, és az is hogy az együtthatók egyértelműen meghatározottak. Éppen ezt kellett


igazolni. ■

A bázis tehát egy nagyon különleges vektorrendszer egy lineáris térben, mindemellett a
legfontosabb vektorrendszer. Nem árt ha több szempontból is megvilágítjuk ezt a fogalmat.
Könnyű átgondolni, hogy az alábbi állítások mind a bázist határozzák meg.

1.8.Tétel:
1. Egy vektortérben a maximális elemszámú lineárisan független rendszer bázis.
2. Egy vektortérben a minimális elemszámú generátorrendszer bázis.
3. Egy n-dimenziós vektortérben bármely n db lineárisan független rendszer bázis.
4. Egy n-dimenziós vektortérben bármely n elemű generátorrendszer bázist alkot. ■

Ezt a tételt akkor célszerű alkalmazni, ha egy konkrét esetben bázist keresünk. Ha teljesül az
előbbi négy állítás valamelyike, akkor biztosak lehetünk afelől, hogy bázist találtunk.

19
Óbudai Egyetem BGK Fejezetek a matematikából

1.3. Elemi bázistranszformáció


Induljunk ki a következő problémából. Adott az R2 lineáris tér alábbi y vektora a standard B0
bázisban.

3
y 
 2  B0

Hogyan változnak meg az y koordinátái, ha a standard bázis egyik vektorát kicseréljük egy másik
vektorra, azaz áttrérünk egy másik bázisra. Például cseréljük ki az e1 vektort az u vektorra, ahol
az u koordinátái természetesen B0-ban, az alábbi vektorral adottak

1
u 
1 B0

Felmerül a kérdés, van-e ennek értelme. Mivel u nem párhuzamos e2-vel, így a B1 = {u,
e2}rendszer továbbra is lineárisan független generátorrendszere, mivel n = 2 elemű, lineárisan
független rendszer, tehát bázisa R2-nek. Megkérdezhetjük, hogy ebben a bázisban mely valós
számok az y vektor koordinátái. Ehhez csak arra kell válaszolni, hogy az y vektort az u és e2
vektorok mely lineáris kombinációja állítja elő.
A számítás a következő:y = 3e1+ 2e2, másrészt u = 1e1+1e2 = e1+ e2 ahonnan e1= u–e2. Ezt
behelyettesítjük az y előállításába, kapjuk, hogyy = 3(u–e2 ) + 2e2 = 3u–e2. Ami pontosan azt
jelenti, hogy megkaptuk az y vektor B1 = {u, e2}bázisra vonatkozó koordinátáit. Ezek a
következők

3
y 
 1 B1

Megváltoztak a koordináták, de ez természetes, hiszen megváltozott a bázis is. Jól jegyezzük meg
tehát, hogy egy vektor koordinátái nem abszolút értelemben léteznek, hanem mindig függenek a
bázistól. A fenti konkrét példában követett gondolatmenetet általánosítjuk.

1.12.Definíció: Legyen adott egy B = {b1, b2, b3,…, bk, …bn }bázis L-ben, továbbá adott egy
u-val jelölt vektor. Ha a B bázis egy vektorát, például a bk vektort kicseréljük az u vektorra, azaz
áttérünk a B1 = {b1, b2, b3,…,bk–1,u, bk+1, …bn }bázisra, akkor ezt a transzformációt elemi
bázistranszformációnak nevezzük.

A konkrét példával ellentétben tehát az elemi bázistranszformáció nem csak a standard bázisról
való áttérést jelenti, hanem bármely bázisból kiindulhatunk és készíthetünk új bázisokat. Mi a
feladat, ha áttértünk egy új bázisra. Mindig az, hogy kiszámítjuk bizonyos – egy adott probléma
kapcsán felmerülő – vektorok koordinátáit az új bázisban. Ez a módszer nagyon hatékony. A
későbbiekben látni fogjuk számos alkalmazását. Most csak címszavakban említjük meg mire
használható: lineáris függetlenség, lineáris összefüggőség vizsgálata, kompatibilitásvizsgálat,
homogén és inhomogén lineáris egyenletrendszerek megoldása, mátrixok invertálása,…stb.

20
Óbudai Egyetem BGK Fejezetek a matematikából

Annak érdekében, hogy a későbbiekben ezeket a problémákat egységes alapokon meg tudjuk
oldani, levezetjük a transzformációt általánosan.

Legyen adott egy B = {b1, b2, b3,…, bk, …bn }bázis L-bentovábbá legyen adott egy u-val jelölt
vektor, melynek B-beli előállítása a következő

u = β1b1+ β2b2+…+ βkbk+ …+βnbn;

és tegyük fel, hogy például βk ≠ 0. Legyen továbbá xL egy tetszőleges vektor, melynek
előállítása a B bázisban

x = α1b1+ α2b2+…+ αkbk+ …+αnbn;

Cseréljük ki a B bázis bk vektorát u-ra ha lehet, vizsgáljuk meg, hogy a kapott vektorrendszer
bázist alkot-e L-ben, és ha igen számítsuk ki x koordinátáit az új B1 = {b1, …, bk–1, u, bk+1, …bn}
bázisban. Mivel βk ≠ 0 ezért oszthatunk vele, tehát az u-t előállító egyenletből kifejezhető a bk
vektor

1   1  
bk   b1  2 b 2  ...  k 1 bk 1  u  k 1 b k 1  ...  n b n ;
k k k k k k

Ezt az összeget be tudjuk helyettesíteni az x-et előállító egyenletben a bk helyére

   1  
x  1b1  ...   k 1bk 1   k   1 b1  2 b2  ...  u  ...  n b n    k 1b k 1  ...   nb n ;
 k k k k 

rendezzük most ezt az összeget. Az adódik, hogy

            
x   1  1  k  b1  ...    k 1  k 1  k  bk 1  k u    k 1  k 1  k  bk 1  ...    n  n  k  bn ;
 k   k  k  k   k 

Megkaptuk amit kerestünk, az x vektor előállítását a B1 bázisban.Válaszoljunk a felmerült


problémákra is.

1. A B1 = {b1, …, bk–1, u, bk+1, …bn} vektorrendszer valóban bázis, hiszen generátorrendszer,


ugyanis az x ezen vektorok segítségével is előállítható. Továbbá n db vektort tartalmaz a
rendszer, és egy n dimenziós térben minden n elemű generátorrendszer bázis.
2. Felmerül a kérdés, hogy mi a csere feltétele. Az, hogy az u vektor kiindulási B bázisban
történő előállításában, a bk vektor βk együtthatója 0-tól különbözzön. A βk valós számot az elemi
bázistranszformáció generáló elemének nevezzük.

A báziscsere abból állt tehát, hogy az eredeti B bázis bk vektorát kicseréltük az u vektorra, így
előállítottunk egy új B1 bázist, és megkaptuk az x vektor B1-beli koordinátáit. Az u vektor
„belépett a bázisba”, a bk vektor pedig „kilépett a bázisból”. Vegyük észre, hogy
mellékeredményként még azt is megkaptuk, hogy a kilépő bk vektornak mik a koordinátái az új
21
Óbudai Egyetem BGK Fejezetek a matematikából

bázisban. Eredményeinket a könnyebb áttekinthetőség és egyszerűbb alkalmazhatóság kedvéért


táblázatba foglaljuk, annál is inkább, mert az elemi bázistranszformációt alkalmazó
számításoknál is mindig táblázatokkal dolgozunk majd.
A táblázat szerkezete a következő. Az első oszlopban mindig az aktuális bázisvektorok állnak, a
többi oszlopban pedig azon vektorok aktuális bázisra vonatkozó koordinátái, amelyeket be
akarunk vinni a bázisba, illetve amelyeknek keressük a koordinátáit az új bázisban. A fentiekben
egy vektort cseréltünk, és egy x vektornak számítottuk a koordinátáit. A táblázat azonban nem
csak egy x hanem még egy y vektor koordinátáinak transzformációját is mutatja azért, hogy
jobban átlássuk a transzformáció mikéntjét, ha egyszerre több vektort transzformálunk.

B … u … x y
b1 … β1 … α1 γ1
b2 … β2 … α2 γ2
… … … … … …
bk …  k  … αk γk
… … … … … …
bn … βn … αn γn

Táblázat. Az elemi bázistranszformáció induló táblázata

Ha feltesszük, hogy βk≠0 akkor kicserélhetjük az u és bk vektorokat. βk a transzformáció generáló


eleme. A transzformáció eredményét az alábbi táblázat tartalmazza:

B1 … bk … x y
  
b1 …  1 … 1  1  k 1  1  k
k k k
  
b2 …  2 … 2  2 k 2  2 k
k k k

… … … … … …
1 k k
u … …
k k k

… … … … … …
n n n
bn …  … n  k n  k
k k k

Táblázat. Az elemi bázistranszformáció táblázata

22
Óbudai Egyetem BGK Fejezetek a matematikából

Az egyes transzformációs lépéseket az alábbiakban fogalmazhatjuk meg:


1. A generáló elem helyére a reciprokát írjuk.
2. A generáló elem sorának többi elemét elosztjuk a generáló elemmel.
3. A generáló elem oszlopának többi elemét elosztjuk a generáló elem ellentettjével.
4. A táblázat többi részén a számítás a következő:
A generáló elem oszlopában kiszemelünk egygeneráló elemtől különböző értéket. Ezt
elosztjuk a generáló elemmel, a kapott hányadossal megszorozzuk a generáló elem sorának az
elemeit, és ezeket a szorzatokat rendre kivonjuk a „kiszemelt elem” sorának elemeiből. A
transzformációt tehát soronként végezhetjük.

23
Óbudai Egyetem BGK Fejezetek a matematikából

1.4. Az elemi bázistranszformáció alkalmazásai


Az elemi bázistranszformáció alkalmazása lényegében az alábbi eljárás. Adott egy
vektorrendszer, amelynek ismertek a koordinátái valamilyen bázisban, általában, ha mást nem
mondunk a standard bázisban, de ez nem lényeges kitétel. A vektorrendszer elemei közül ahányat
csak lehet, beviszünk a bázisba, persze egyesével, hiszen elemi bázistranszformációk
egymásutánját alkalmazzuk. Ezt az eljárást alkalmazzuk ameddig csak lehet, illetve ameddig
szükséges.
Az alkalmazások során szükségünk lesz néhány fogalomra, ezeket értelmezzük a továbbiakban.

1.13.Definíció: Azt mondjuk, hogy az x1, x2, x3, …xn vektorrendszer rangja k, ha van a
vektorrendszerben k db lineárisan független vektor, de bármely legalább k +1 elemű részrendszer
lineárisan összefüggő.

Egyszerűen fogalmazva a rang a rendszerből kiválasztható lineárisan független vektorok


maximális száma.

Kérdés, hogy hogyan vizsgáljuk meg egy vektorrendszer rangját elemi bázistranszformációval.
Úgy, hogy a vektorrendszer vektorai közül annyit viszünk be a bázisba, amennyit csak lehet,
ameddig még találunk βk≠0 generáló elemet. Mivel ezeket a vektorokat bevittük a bázisba, és a
bázis lineárisan független rendszer, a bevitt vektorok rendszere lineárisan független. Eszerint a
rang egyenlő azon vektorok számával ahányat a bázisba vittünk. Ezt a számítást a lineáris
egyenletrendszerek megoldása során fogjuk alkalmazni.

1.5.Példa: Határozzuk meg az a1 = [1, 3, 0, 1]T, a2 = [0, –1, 1, 0]T, a3 = [1, 2, –1, 3]T,
a4 = [1, –1, 2, 3]T vektorokból álló vektorrendszer rangját. Adjunk meg lineárisan független
vektorokat, és ha a rendszer lineárisan összefüggő, adjuk meg a köztük lévő lineáris kapcsolatot.

Alkalmazzunk elemi bázistranszformációt.

a1 a2 a3 a 4 a1 a3 a 4 a3 a 4 a 4 

 a1  1 0 1 1  1 1 1  1 1  0 
   3 1 2 1    2 2   
   3 1 1   0 
a 2  0 1 1 2   0 1 2   1 2  3
     
 a3   1 0 3 3   1 3 3   2 2  1 

A számítások eredménye a következő. A vektorrendszer rangja 3, mert három lineárisan


független vektor van a rendszerben, ez egyértelmű, független a generáló elemek választásától.
Ezek például az a1, a2 és a3 vektorok. Természetesen ez függ attól, hogy mely oszlopokban
választjuk a generáló elemeket. Az a4 vektorral együtt azonban már lineárisan összefüggő
rendszert alkotnak. A lineáris kapcsolat a táblázat utolsó oszlopából olvasható le, amely szerint

a4  0  a1  3  a2  1 a3 ;

24
Óbudai Egyetem BGK Fejezetek a matematikából

Ennek az egyenlőségnek a helyessége a vektorok koordinátái alapján azonnal látható.

1.14.Definíció: Azt mondjuk, hogy az yL vektor kompatibilis az x1, x2, x3,
…xnLvektorrendszerrel, ha y előállítható az x1, x2, x3, …xn vektorok lineáris kombinációjaként.
Ha nem állítható elő, akkor inkompatibilisnek nevezzük.

Kérdés, hogy hogyan vizsgálunk kompatibilitást elemi bázistranszformációval. Úgy, hogy a


vektorrendszer elemeit és az y-t is szerepeltetjük egy transzformációs táblázatban. Elvégzünk
annyi elemi transzformációt, amennyit csak lehet – vigyázva arra, hogy az y-t ne vigyük a
bázisba - amíg akad olyan xivektor, amit még be tudunk vinni a bázisba, és ezek után megnézzük
az y vektor koordinátáit. A koordináták megadják, hogy az y-t mely lineáris kombináció állítja
elő. Ha ebben csak az xi vektorok szerepelnek, akkor y kompatibilis, ha viszont van az
előállításban egy vektor az eredeti bázisból is akkor inkompatibilis.

1.6.Példa: Vizsgáljuk meg, hogy azy1 = [5, 8, 3, 2]T, y2 = [5, 0, 0, 5]T vektorok kompatibilisek-e
az x1 = [1, 0, 0, 2]T, x2 = [2, 1, 0, 0]T,x3 = [0, 2, 1, 0]T,x4 = [3, 3, 1, 2]T vektorokból álló
vektorrendszerrel.

Alkalmazzunk elemi bázistranszformációt.

 x1 x2 x3 x 4  y1 y 2  x 2 x3 x 4  y1 y 2   x 2 x 4   y1 y 2   x 4   y1 y 2 
 x1  1 2 0 3 5 5 2 0 3   5 5   2 3   5 5  1   1 5 
x   
 2 0 1 2 3  8 0  1
 2 3   8 0  1 1   2 0  1   2 0 
 x3  0 0 1 1 3 0 0 1 1   3 0   0 1   3 0  1   3 0 
           
 e4  2 0 0 2 2 5  4 0 4   8 5  4 4   8 5 0   0 5

A számítások eredménye a következő. Az y1 vektor kompatibilis a vektorrendszerrel, mert


előállítható csak a rendszerhez tartozó vektorok lineáris kombinációjaként. Az y2 vektor viszont
nem kompatibilis a vektorrendszerrel, mert előállításához szükség van még az e4 vektorra is. A
táblázatból leolvasható, hogy az előállítások a következők.

y1  1 x1  2  x2  3  x3 ; y 2  5  x1  5  e4 ;

Mellesleg a számításból az is kiderül, hogy az { x1, x2,x3,x4 } vektorrendszer rangja 3, például


lineárisan független vektorok az x1, x2,x3 vektorok, az x4 ezektől lineárisan függ, a táblázat
alapján az

x4  1 x1  1 x2  1 x3 ;

összefüggés szerint. Ha a rendszerhez hozzávesszük az y1 vektort, a rendszer rangja nem


növekszik, tehát az { x1, x2,x3,x4, y1 } vektorrendszer rangja is 3, azonban ha a rendszert az y2
vektorral bővítjük ki, akkor a rang növekszik, tehát az { x1, x2,x3,x4, y2} vektorrendszer rangja 4.

25
Óbudai Egyetem BGK Fejezetek a matematikából

Fontosabb alkalmazásokat látunk majd a későbbiekben lineáris egyenletrendszerek


megoldásánál és mátrixok inverzének meghatározásánál. De mielőtt számításokat végzünk,
szükségünk van a mátrix fogalmára.

26
Óbudai Egyetem BGK Fejezetek a matematikából

1.5. Mátrixok
1.15.Definíció: Valós számoknak az alábbi sémában való elrendezését mátrixnak nevezzük.

 a11 a12 ... a1k 


a a ... a2 k 
A   21 22
 ... ... ... ... 
 
 an1 an 2 ... ank 

Az A mátrix – a vektorhoz hasonlóan vastagon szedve –aij komponense a mátrix i-edik sorának j-
edik eleme, az indexek közül első tehát a sorindex, a második pedig az oszlopindex. Ennek a
mátrixnak n sora és k oszlopa van, szokás ezt „n-szer k-as”, jelöléssel n×k-as mátrixnak nevezni.
Az n×k méretű valós komponensű mátrixok halmazára használjuk az Rn×k jelölést. A mátrixokat
általában az "ABC" nyomtatott, vastagon szedett nagybetűivel jelöljük.
Sokszor hasznos az alábbi általános jelölés, amely utal arra, hogy hogyan jelöljük a mátrix
komponenseit. Ha ARn×k akkor

A   aij  vagy egyszerűen csak A   aij  ;


i 1...n , j 1...k

Az alábbiakban néhány speciális mátrixot értelmezünk.

1.16.Definíció: Azt a mátrixot, amelynek egyetlen oszlopa van oszlopvektornak nevezzük. Ez a


mátrix lényegében megegyezik a hagyományos értelemben vett n-komponensű vektorokkal, tehát
az Rn×1 halmazt azonosítjuk az Rn halmazzal.

 a1 
a 
a   2   R n  R n1
 ... 
 
 an 

1.17.Definíció: Azt a mátrixot, amelynek egyetlen sora van sorvektornak nevezzük. Ez a mátrix
lényegében megegyezik a hagyományos értelemben vett k-komponensű vektorokkal, tehát az
R1×khalmazt azonosíthatjuk az Rk halmazzal.

b  b1 b2 ... bk   R k "  " R1k

Világos azonban, hogy a vektor kifejezés ezek után félreértést okozhat, hiszen az előbbiek szerint
jelenthet oszlopvektort is és sorvektort is. Ezt elkerülendő jegyezzük meg a következő
megállapodást. A továbbiakban, ha „vektor”-t mondunk, akkor az mindig oszlopvektort
jelent. A fenti egyenlőségjel azért idézőjeles, mert bár az azonosítás jogos, de az említett

27
Óbudai Egyetem BGK Fejezetek a matematikából

megegyezés szerint az imént megfogalmazott azonosítás alapján értelmezzük a vektort és az Rn


halmazt.

1.18.Definíció: Kvadratikusnak vagy négyzetesnek nevezünk egy mátrixot, ha sorainak száma


egyenlő oszlopainak számával, ha tehát n = k.

 a11 a12 ... a1n 


a a ... a2 n 
B   21 22  R nn ;
 ... ... ... ... 
 
 an1 an 2 ... ann 

Egy kvadratikus mátrixnak van egy különleges „részhalmaza”, azon elemek, amelyeknek sor- és
oszlopindexe megegyezik. Ezt a részhalmazta mátrix főátlójának nevezzük. Az n×n-es mátrixot
szokás n-edrendű mátrixnak nevezni.
A kvadratikus mátrix főátlójában levő komponensek összegét a mátrix nyomának (trace) vagy
idegen szóval spurjának nevezzük. Ezt a fogalmat a sajátértékek elméletében fogjuk használni.

tr  B   a11  a22  ...  ann ;

1.19.Definíció: Alsó illetve felső háromszögmátrixnak nevezzük azt a kvadratikus mátrixot,


amelyben rendre a főátló felett illetve a főátló alatt minden komponens zérus. Ezek szokásos
jelölése L (lower) és U (upper)

 a11 0 ... 0   a11 a12 ... a1n 


a a ... 0   0 a ... a2 n 
L   21 22 R ; U  
nn 22
 R nn ;
 ... ... ... ...   ... ... ... ... 
   
 an1 an 2 ... ann  0 0 ... ann 

1.20.Definíció: Diagonális mátrixnak nevezzük azt a kvadratikus mátrixot, melyben a főátlón


kívül minden elem zérus.

 a11 0 ... 0 
0 a ... 0 
D 22
 R nn ;
 ... ... ... ... 
 
0 0 ... ann 

Ha egy a  R n vektorból képezünk diagonális mátrixot, akkor az azt jelenti, hogy egy olyan n-ed
rendű mátrixot értelmezünk, amelynek főátlójában állnak az a vektor komponensei. Az
alkalmazott jelölések bevezetésével

28
Óbudai Egyetem BGK Fejezetek a matematikából

 a1   a1 0 ... 0 
a  0 a ... 0 
a   2   R n ; esetén diag  a   a   2
 R nn
 ...   ... ... ... ... 
   
 an  0 0 ... an 

1.21.Definíció: Nullmátrixnak nevezzük azt a mátrixot, amelynek minden komponense 0 R.


Azaz

0 0 ... 0
0 0 ... 0 
0  R nk ;
... ... ... ...
 
0 0 ... 0

A nullmátrixnak nem kell szükségképpen kvadratikusnak lenni. A nullmátrix definiáló


tulajdonsága, hogy tetszőleges ARn×kesetén teljesül, hogy A + 0 = 0 + A = A. Az algebrában az
ilyen tulajdonságú objektumot nevezzük nullelemnek. A továbbiakban a mátrixok körében
végezhető műveletekkel foglalkozunk.

29
Óbudai Egyetem BGK Fejezetek a matematikából

1.6. Műveletek mátrixokkal


A mátrixok halmazában is értelmezünk műveleteket, az összeadást és a skalárral (tehát valós
számmal) való szorzást és mátrixok szorzatát. Az első két említett művelet felhasználásával
mátrixok halmaza is egy vektortér. Az osztás művelete nem értelmezhető közvetlenül. Az osztás
fogalmának az általánosítása a mátrix inverzének a fogalma. Ezeket a fogalmakat értelmezzük a
következőkben.

1.22.Definíció: Az A   aij  Rn×kmátrixnak és az αR valós számnak a szorzata a következő

  A    aij   R nk

Tehát egy mátrixot úgy szorzunk egy valós számmal, hogy a mátrix minden komponensét
megszorozzuk a valós számmal, továbbá egy n×k-as mátrix valós számszorosa is n×k-as mátrix.

1.7.Példa: Végezzük el az alábbi skalár-mátrix szorzást.

 2 0 1  8 0 4
4   3 5 1    12 20 4  ;
 2 4 7   8 16 28 

1.23.Definíció: Az A   aij  Rn×k és a B  bij  Rn×k mátrixok összege az az n×k méretű


mátrix, melyre

A  B  aij  bij   R nk

Tehát összeadni csak azonos méretű mátrixokat lehet, és két mátrixot úgy adunk össze, hogy a
„megfelelő helyen álló” komponenseit rendre összeadjuk. Az eredmény természetesen
ugyanolyan méretű mátrix, mint az összeg tagjai.

1.8.Példa: Végezzük el az alábbi összeadást.

 1 0 4 7   3 0 5 2   4 0 1 5 
 9 2 5 8    7 4 2 8    2 6 3 16  ;
     
 3 1 0 2  4 4 3 6  1 5 3 8 

Az összeadás és a szorzás műveleti tulajdonságaira igaz az alábbi állítás.

30
Óbudai Egyetem BGK Fejezetek a matematikából

1.9.Tétel: Mátrixok összeadása és skalárral való szorzása kommutatív és asszociatív művelet,


valamint a skalárral való szorzás az összeadásra nézve disztributív, azaz

a) A  B  B  A;  A  B   C  A  B  C  : A  B  C;
b) A  A;  A     A : A;
c)     Α  A  A;   A  B   A  B;

Bizonyítás: Az állítások a definíciók közvetlen következményei. ■

Látható tehát, hogy a valós számmal való szorzás és az összeadás során n×k méretű mátrixokból
indulunk ki, és az eredmény ugyanilyen típusú mátrix, ez a két művelet tehát „nem vezet ki” az
n×k-as mátrixok Rn×khalmazából.Világos, hogy a korábban értelmezett 0Rn×k nullmátrixra
tetszőleges ARn×k mátrix esetén teljesül, hogy A + 0 = 0 + A = A.A legutolsó tétel figyelembe
vételével, ha még hozzátesszük a tételbeli műveleti tulajdonságokhoz a nullmátrix fogalmát,
akkor látható, hogy az n×k-as mátrixok Rn×khalmaza valós vektortér a most definiált számmal
való szorzásra és összeadásra vonatkozólag. A kérdés, hogy mi ennek a vektortérnek egy bázisa
és mennyi a vektortér dimenziója. Könnyen ellenőrizhető, hogy az

 0 ... 0 ... 0
... ...

Bij   0 ... 1 ... 0  ; i  1, 2,3,..., n; j  1, 2,3,..., k ;
 
... ...
 0 ... 0 ... 0 

mátrixrendszer bázisa azRn×k vektortérnek, ahol Bij az a mátrix, amely i-edik sorának j-edik
komponense 1 a többi komponens zérus, amiből következik, hogy ez a vektortér n·k dimenziós.

1.24.Definíció: Az A   aij  Rn×k mátrix transzponáltja az az AT   aij'  Rk×n mátrix, melyre


teljesül, hogy  aij'    a ji  . Vagyis az AT transzponált mátrix i-edik sorának j-edik komponense
megegyezik az A mátrix j-edik sorának i-edik komponensével.

A transzponálás tehát azt jelenti, hogy a mátrix sorai és oszlopai „szerepet cserélnek”, tehát az
Ai-edik sorából lesz az ATi-edik oszlopa és fordítva. Ha a mátrix nem négyzetes, akkor a mátrix
és transzponáltja nem azonos méretűek.
Négyzetes mátrixok esetében mátrix és transzponáltja egyező méretűek, azaz ha ARn×n akkor
ATRn×n. Ebben az esetben a transzponálás egyenértékű a főátlóra történő tükrözéssel. A főátló
komponensei helyben maradnak, a többi elem pedig a főátlóra tükröződik.

31
Óbudai Egyetem BGK Fejezetek a matematikából

1.9.Példa: Transzponáljuk az alábbi mátrixokat.

 3 2 1 2 7  1 0 3 
 3 5 4 
A   5 0  ; AT   B  0 4 1 ; BT   2 4 9  ;
2 0 1 
;
 4 1   3 9 5  7 1 5 

A transzponálással kapcsolatosan alapvető a következő állítás.

1.10.Tétel:Az A mátrix transzponáltjának transzponáltja az A, tehát saját maga, összeget


tagonként lehet transzponálni, skalárszoros transzponáltja pedig a transzponált skalárszorosa,
vagyis

A   A  B T  AT  BT ;  A T  AT ;
T
T
 A;

Bizonyítás: Ezek az egyenlőségek a definíciók közvetlen következményei. ■

A transzponálás nagyon hasznos, ha vektorokról beszélünk. Egy vektor, ami megegyezés szerint
oszlopvektor, helytakarékosan írható, ha felhasználjuk a transzponálás műveletét. Világos, hogy
az

 a1 
a 
a   2  ; a   a1 a2 ... an  ; aT   a1 a2 ... an  ;
T
 ... 
 
 an 

jelölések ugyanazt az aRn vektort jelentik. A továbbiakban mi is alkalmazzuk ezt a jelölést, ha


oszlopvektorról van szó.

1.25.Definíció: Az ARn×n mátrixot szimmetrikusnak nevezzük, ha megegyezik a


transzponáltjával, azaz A szimmetrikus ha teljesül, hogy AT = A. Azt is mondhatjuk, hogy egy
szimmetrikus mátrix tükrös a főátlójára.
Az ARn×n mátrixot ferdén szimmetrikusnak nevezzük, ha transzponáltja a Amátrix ellentettje,
azaz ha teljesül, hogy AT = –A. Ebben az esetben, tekintettel arra, hogy a főátló komponensei
transzponálás során a helyükön maradnak, és csak a 0 az a valós szám, melynek ellentettje saját
maga, egy ferdén szimmetrikus mátrix főátlójában minden komponens zérus.

1.10.Példa: Az A mátrix szimmetrikus, a B mátrix ferdén szimmetrikus.

 1 5 1 7   0 2 1 3 
 5 2 2 1   
A  ; B   2 0 7 0  ;
 1 2 0 4   1 7 0 5
   
 7 1 4 3  3 0 5 0 

32
Óbudai Egyetem BGK Fejezetek a matematikából

Szimmetrikus és ferdén szimmetrikus mátrixok fogalmával kapcsolatban alapvető a következő


állítás.

1.11.Tétel: Minden ARn×n mátrix felbontható egy szimmetrikus és egy ferdén szimmetrikus
mátrix összegére.
Bizonyítás: Világos az alábbi azonosság

A  AT A  AT
A  ;
2 2

és könnyen ellenőrizhető, hogy az összeg első tagja szimmetrikus, a második tagja pedig ferdén
szimmetrikus, hiszen

   
T T
 A  AT 
T
AT  AT AT  A  A  AT 
T
AT  AT AT  A A  AT
    ;      ;
 2  2 2  2  2 2 2

Ezzel az állítást igazoltuk. ■

1.11.Példa: Alkalmazzuk az előző tételt. Legyen

 2 6 4  2 0 2 
A   0 1 4  ; ekkor A   6 1 8  ;
  T

 2 8 3  4 4 3

és nyilvánvaló, hogy az

 2 3 3  0 3 1
A  AT   A  AT 
  3 1 6 ;   3 0 2  ;
2 2
 3 6 3  1 2 0 

mátrixok rendelkeznek a kívánt tulajdonsággal és összegük az A mátrix.

Most rátérünk mátrixok szorzásának értelmezésére. Mátrixok szorzása egyszerűbben


definiálható, ha felidézzük a vektorok klasszikusskaláris szorzatának fogalmát.

1.26.Definíció: Az aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn vektorok aTb-vel jelölt
skaláris szorzata a következő valós szám

aTb = a1b1 + a2b2 + …+ anbn;

tehát a két n komponensű vektor „megfelelő koordinátái szorzatának összege”. Világos, hogy
csak akkor létezik a két vektor skaláris szorzata, ha a két vektor komponenseinek száma egyenlő.
A jelölésben is utalunk arra a lényeges momentumra, hogy egy sorvektort szorzunk

33
Óbudai Egyetem BGK Fejezetek a matematikából

oszlopvektorral. Ez lényeges, mert ilyen módon értelmezzük általánosan két mátrix szorzatát.
Ezek után definiálhatjuk általánosan mátrixok szorzatát.

A skaláris szorzatra bevezetünk egy más, gyakran előnyösebben alkalmazható jelölést. Az


aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn vektorok aTb skaláris szorzatát jelölje

aTb  a, b ;

A skaláris szorzattal kapcsolatosan fontos lerögzítenünk az alábbi műveleti tulajdonságokat.

1.12.Tétel: A skaláris szorzat tulajdonságai


a) szimmetrikus, azaz aTb  bTa, más jelöléssel a, b  b, a ;
b) homogén abban az értelemben, hogy a, b   a, b ,   R;
c) disztributív, tehát a  b, c  a, c  b, c ;
d) „pozitív definit”, azaz a, a  0; és pontosan akkor a, a  0 ha a  0;

Bizonyítás: Az a), b) és c) állítás a definíció közvetlen következménye, a d) állítást részletezzük


csak, azonban ez is nyilvánvaló. LegyenaT = [a1, a2, …an] Rn, ekkor

n
a, a  a1a1  a2 a2  ...  an an   ai2 ;
i 1

Innen az állítás következik, hiszen n db nem negatív szám összege nem lehet negatív, és egy
négyzetösszeg pontosan akkor zérus, ha minden tagja zérus. ■

Ha a skaláris szorzás fogalmát általánosítani szeretnénk komplex esetre, amely fogalmat mi


elméletben használunk majd a továbbiakban, akkor a következőképpen kell módosítanunk a
definíciót.

1.27.Definíció: Komplex skaláris szorzat fogalma. Az aT = [a1, a2, …an] Cn és


bT = [b1, b2, …bn ] Cn komplex vektorok skaláris szorzata definíció szerint

a, b : aTb; ;

Ami a valós esethez képest annyi módosítást jelent, hogy a második tényező komplex
konjugáltját kell venni, és az így kapott vektorral kell ugyanazt a műveletet elvégezni, tehát

a, b  a1b1  a2b2  ...  anbn ;

ahol a „vonás” szokás szerint a komplex konjugáltat jelöli. Természetesen, ha a vektorok valósak,
ez a definíció egybeesik a korábbival.Komplex skaláris szorzásra az előzővel analóg tétel
fogalmazható meg, melynek bizonyítását az olvasóra bízzuk.

34
Óbudai Egyetem BGK Fejezetek a matematikából

1.13.Tétel: A komplex skaláris szorzat tulajdonságai


a) „szimmetrikus”, azaz a, b  b, a ;
b) homogén abban az értelemben, hogy a, b   a, b ,   C; és a, b   a, b ,   C;
c) disztributív, tehát a  b, c  a, c  b, c ;
d) „pozitív definit”, azaz a, a  0; és pontosan akkor a, a  0 ha a  0;

A skaláris szorzással kapcsolatosan általánosítunk egy fogalmat és egy tételt, amely az analitikus
geometriában alapvető fontosságú. Ez a fogalom a merőlegesség, amelyet magasabb
dimenzióban és általánosabb körülmények között ortogonalitásnak nevezünk.

1.28.Definíció: Az aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rnvektorokat ortogonálisnak
nevezzük, ha skaláris szorzatuk zérus, azaz ha teljesül, hogy

aTb  a, b  0;

1.12.Példa: Az aT = [1, 2, –3, 5] R4 és bT = [3, –1, 7, 4 ] R4 négydimenziós vektorok


ortogonálisak, ugyanis

aTb  a, b  1 3  2 1  3  7  5  4  3  2  21  20  0;

Egy további általánosítást fogalmazunk meg, amely ugyancsak az analitikus geometriában


tapasztalt összefüggés megfelelője. Mivel egy három dimenziós aT = [a1, a2, a3] R3 vektor
hosszát az

a  a12  a22  a32 ;

összefüggéssel értelmezzük, ami nem más, mint az n-dimenzióbeli

n
a, a  a1a1  a2 a2  ...  an an   ai2 ;
i 1

skaláris szorzat négyzetgyökének speciális esete, ezért értelmezzük egy vektor hosszának
fogalmát.

1.29.Definíció: Az aT = [a1, a2, …an] Rnvektor hosszát az

n
a a, a  a1a1  a2 a2  ...  an an   ai2 ;
i 1

formulával értelmezzük. Ha egyeT = [e1, e2, …en] Rn vektorra e  1 teljesül, akkor
egységvektornak nevezzük.

35
Óbudai Egyetem BGK Fejezetek a matematikából

Ezek után rátérhetünk a mátrtixszorzás általános definíciójára.

1.30.Definíció: Mátrixok sor-oszlop szorzása

Az A   aij  Rn×k és B  b jr  Rk×m mátrixok C = AB szorzata az a C  cir  Rn×m mátrix


amely i-edik sorának r-edik eleme, tehát a cir komponens, az A mátrix i-edik sorának és a B
mátrix r-edik oszlopának skaláris szorzata, azaz

k
cir  ai1b1r  ai 2b2r  ...  aik bkr   aisbsr ;
s 1

ahol i = 1,2,…n; j = 1,2,…m tetszőleges egész számok.


Mivel az A mátrixnak n sora, a B-nek pedig m oszlopa van, összesen n∙m ilyen skaláris szorzást
kell elvégeznünk, ami azonnal indokolja is, hogy a szorzatmátrix miért n×m típusú mátrix, azaz
miért van n sora és m oszlopa. Mivel a skaláris szorzás csak akkor értelmes, ha a két vektornak
ugyanannyi komponense van, ezért világos, hogy két mátrix csak abban az esetben szorozható
össze, ha az első tényező soraiban ugyanannyi elem van, mint a második tényező oszlopaiban.
Másképpen fogalmazva ez azt jelenti, hogy az A mátrix oszlopainak száma meg kell egyezzen
a B mátrix sorainak számával. Ezért az A n×k-as a B pedig k×m-es mátrix. Célszerű
megjegyezni a „sor-oszlop szorzás” kifejezést, mert ez utal a definícióban foglaltakra.
A szorzás végrehajtásánál célszerű használni a „Falk-sémá”-nak nevezett elrendezést, amely az
alábbiakban látható

... ...
... b1r
... ...
... b2 r
 B
... ...
... ...
 
... ...
... bkr
 ... ... ... ...  ... ... ... ...
a a ... aik  ... ... c ...
A   i1 i 2  ir   AB
 ... ... ... ...  ... ... ... ...
   
 ... ... ... ...  ... ... ... ...

Ha az AB szorzatot kívánjuk kiszámítani, akkor a sémában a bal alsó sarokba írjuk az A mátrixot,
a jobb felső sarokba pedig a B mátrixot, a szorzatmátrix pedig a jobb alsó sarokba kerül,
mégpedig úgy, hogy az A mátrix i-edik sorának és a Bmátrixr-edik oszlopának a
„kereszteződésébe” írjuk a cir skaláris szorzatot. Ez az elrendezés megkönnyíti a szorzás
elvégzését, persze ha van elég rutinunk, a sémát mellőzhetjük.

A szorzás műveletének tulajdonságait tisztázza az alábbi állítás.

36
Óbudai Egyetem BGK Fejezetek a matematikából

1.14.Tétel: Mátrixok szorzása asszociatív művelet, továbbá a szorzás az összeadásra nézve


disztributiv, ugyanakkor a szorzás nem kommutatív. Azaz

a) (AB)C = A(BC) =:ABC


b) A(B + C) = AB + AC
c) AB ≠ BA

Bizonyítás: Az asszociativitás és a disztributivitás a szorzás definíciójának következménye. A


kommutativitással kapcsolatos állítás igazolására elég példát hoznunk arra, hogy a művelet nem
kommutatív. Több példát is mutatunk.
1. Legyen például AR2×3, BR3×4, ekkor AB értelmezett és ABR2×4, a BA szorzat azonban
nem értelmezett.
2. Ha például AR2×3, BR3×2 akkor bár az AB és a BA szorzat is értelmezett, de mégsem
egyenlők, hiszen ABR2×2, BAR3×3 és világos, hogy ha a mátrixok nem azonos méretűek,
akkor nem is lehetnek egyenlők.
3. Felmerül a kérdés, hogy kvadratikus mátrixok esetén, ahol AB és BA egyaránt értelmezett és
mindkettő azonos méretű, teljesül-e az egyenlőség. Egy egyszerű példa meggyőz bennünket,
hogy ekkor sem teljesül a kommutativitás. Legyen például

1 2  2 0 4 4 2 4
A  ; B  Ekkor: AB    ; BA   
0 1  1 2 1 2  1 4 

tehát valóban nem teljesül az egyenlőség. ■

Mátrixok szorzásával kapcsolatban felmerül még egy érdekes dolgog, amely például a valós
számok halmazában nem igaz. Egy példával illusztráljuk a mondandónkat.

1.13.Példa: Számítsuk ki az A és B mátrixok szorzatát ha

 2 3 5  1 3 5 
A   1 4 5  ; B   1 3 5 ;
 
 1 3 4   1 3 5 

Egyszerűszámolással adódik, például a Falk-séma alkalmazásával, hogy

0 0 0 
AB  0 0 0  ; de A  0 és B  0;
0 0 0 

Tehát mátrixok halmazában előfordulhat az a meglepő eredmény, hogy nem nulla mátrixok
szorzata a nullmátrix. Emlékezzünk vissza a valós számok halmazára, ahol az ab = 0 egyenletből
következik, hogy a = 0 vagy b = 0. Mátrixok körében ez a következtetés tehát nem igaz.

37
Óbudai Egyetem BGK Fejezetek a matematikából

A szorzással kapcsolatosan igazolunk egy alapvető fontosságú, de egyszerű állítást.

1.15.Tétel: Ha ARn×k valamint BRk×p, akkor teljesül, hogy

 AB T  BT AT ;
Bizonyítás: Megmutatjuk, hogy a két oldalon azonos méretű mátrixok szerepelnek, és azt, hogy
komponensenként megegyeznek.
Mivel ABRn×p ezért (AB)TRp×n. Másrészt ATRk×n valamint BTRp×k ahonnan következik,
hogy BTATRp×n tehát a méreteik valóban megegyeznek. Határozzuk meg az (AB)T mátrix
i-edik sorának j-edik komponensét. Ez megegyezik az AB mátrix j-edik sorának i-edik
komponensével, tehát ha az A mátrix j-edik sorát ajT jelöli, valamint a B mátrix i-edik oszlopát
bijelöli, akkor a kérdéses komponens éppen az ajTbi skaláris szorzattal egyezik meg. A jobboldali
szorzat i-edik sorának j-edik komponens pedig a BT mátrix i-edik sorának és az A mátrix j-edik
oszlopának skaláris szorzata, azaz biTaj mivel pedig a skaláris szorzás értelmezése szerint
nyilvánvalóan ajTbi = biTaj az állítást igazoltuk. ■

A későbbiekben hasznunkra lesz egy állítás, amely a szorzást a szimmetriával kapcsolja össze.

1.16.Tétel: Tetszőleges ARn×k mátrix esetén az AAT és az ATA mátrix szimmetrikus mátrix.
Bizonyítás: Igazoljuk, hogy AAT szimmetrikus, a másik állítás hasonlóan bizonyítható. Először
megmutatjuk, hogy a szorzatnak tetszőleges méretű, nem feltétlenül kvadratikus mátrix esetén
van értelme. Ha ARn×k akkor ATRk×n, így az AAT szorzat értelmezve van, hiszen az első
tényezőnek ugyanannyi oszlopa van ahány sora a második tényezőnek. Ebből az is következik,
hogy AATRn×n, tehát a szorzat minden esetben n-ed rendű kvadratikus mátrix. Már csak azt kell
igazolnunk, hogy a szorzat egybeesik a transzponáltjával. Ez is teljesül, ugyanis az előző tétel
alapján

 AA    A 
T T
T T
AT  AAT ;

Ezt kellett igazolni. ■

A továbbiakban a mátrixok szorzásának speciális eseteit vizsgáljuk.

1. Vektorok skaláris szorzata.Célszerű precízebben megfogalmazni ezek után a skaláris szorzás


definícióját, ugyanis a skaláris szorzás egy különleges mátrixszorzat. Miután a mátrixok szorzását
sor-oszlop szorzásként definiáltuk, világos, hogy a skaláris szorzásnál az első tényező sorvektor,
a második tényező pedig oszlopvektor kell, hogy legyen. Ezt hangsúlyoztuk már a skaláris
szorzás fenti definíciójában is. Ha felidézzük azt a megállapodásunkat, miszerint a vektor mindig
oszlopvektort jelent, és adottak az aRn és bRn vektorok, koordinátákkal felírva
aT = [a1, a2, …an] Rn és bT = [b1, b2, …bn ] Rn. Ekkor a skaláris szorzatuknak csak úgy van
értelme, hogy ha az a vektorból először egy sorvektort készítünk, azaz transzponáljuk és az
aRntranszponáltjának és a b-nek írjuk fel a sor-oszlop szorzatát. Eszerint, ha aRn×1 és

38
Óbudai Egyetem BGK Fejezetek a matematikából

bRn×1akkor aTR1×n és így már értelmezett az aTb mátrixszorzás. Eszerint az aRn és bRn
skaláris szorzata a következő

 b1 
b  n
aT b   a1 a2 ... an    2    ai bi
 ...  i 1
 
bn 

2. Mátrix szorzása oszlopvektorral. Erre a műveletre szükségünk lesz a lineáris egyenlet-

rendszerek megoldásánál, ezért emeljük ki külön. Legyen A   aij  Rn×k egy n×k-as mátrix és
x = [xj] Rk egy k-dimenziós vektor. Komponenseikkel felírva:

 a11 a12 ... a1k   x1 


a a22 
... a2 k  x 
A   21 és x   2  ;
 ... ... ... ...   ... 
   
 an1 an 2 ... ank   xk 

Mivel az An×k-as mátrix az x vektor pedig egy k×1-es mátrixnak tekinthető az Ax szorzat
értelmes, írjuk fel a szorzás eredményét.

 a11 a12 ... a1k   x1   a11 x1  a12 x2  ...  a1k xk 


a a ... a2 k   x2   a21 x1  a22 x2  ...  a2 k xk 
Ax   21 22   Rn ;
 ... ... ... ...   ...   ... 
    
 an1 an 2 ... ank   xk   an1 x1  an 2 x2  ...  ank xk 

Hangsúlyozzuk, hogy a szorzás eredménye ugyancsak egy n×1 méretű vektor, és ez a vektor nem
más, a szorzás értelmezése szerint, mint az A mátrix oszlopvektorainak lineáris kombinációja,
ahol az együtthatók éppen az x vektor koordinátái. Ugyanis gondoljuk végig, a szorzás során az
A mátrix első oszlopának komponenseit mindig az x1 koordinátával szorozzuk, a második
oszlopot x2-vel, stb.

Mivel a szorzás nem kommutatív, ki kell térnünk a fordított sorrendben vett mátrix-vektor
szorzásra is.

3. Sorvektor szorzása mátrixszal. Legyen A   aij  Rn×k egy n×k-as mátrix és x = [xj] Rn
egy n-dimenziós vektor. Ekkor értelmezve van az xTA vektor mátrix-szorzat

39
Óbudai Egyetem BGK Fejezetek a matematikából

T
 a11 a12 ... a1k   a11 x1  a21 x2  ...  an1 xn 
a a22 ... a2 k   a12 x1  a22 x2  ...  an 2 xn 
xT A   x1 x2 ... xn   21   R1k ;
 ... ... ... ...   ... 
   
 an1 an 2 ... ank   a1k x1  a2 k x2  ...  ank xn 

Hangsúlyozzuk, hogy a művelet eredménye egy k komponensű sorvektor, csak helytakarékossági


okokból írtuk oszlopvektor transzponáltjaként. Kiemeljük, hogy a művelet eredménye nem
más, mint az A mátrix sorvektorainak lineáris kombinációja, ahol a kombináció együtthatói
éppen az x vektor koordinátái.

Utolsóként egy nagyon különleges, elméleti szempontból nagyon jelentős szorzásműveletre


térünk ki.

4. Vektorok diadikus szorzata. Két vektort nem csak úgy szorozhatunk össze, hogy a sorrendet
hangsúlyozva, sorvektort szorzunk oszlopvektorral, amikor is a két vektor koordinátáinak száma
egyenlő, hanem úgy is szorozhatunk, hogy oszlopvektort szorzunk sorvektorral. Ebben az esetben
azonban nem szükséges, hogy a koordináták száma megegyezzen.

1.31.Definíció: Az aRn és bRk vektorok diadikus szorzata az abTRn×k mátrix, azaz

 a1   a1b1 a1b2 ... a1bk 


a  a b a b ... a2bk 
ab 
T  2
 ... 
 b1 b2 ... bk    2 1 2 2
 ... ... ... ... 
 R nk ;
   
 an   anb1 anb2 ... anbk 

Az abTRn×k mátrix neve diád.

5. Egységmátrix. Vessük fel a következő problémát. Keressük az n×n-es kvadratikus mátrixok


halmazában azt az E-vel jelölt mátrixot, amelyre tetszőleges ARn×n esetén teljesül, hogy

AE = EA = A

Gondoljunk a valós számok halmazának 1R elemére (ahol 1 a valós számok halmazának
„egységeleme”) erre tetszőleges aR esetén teljesül, hogy a∙1 = 1∙a = a. Ennek mintájára
nevezzük E-t egységmátrixnak az Rn×n halmazban. Kérdés, hogy mik az elemei. A szorzás
definícióját felhasználva könnyen ellenőrizhető, hogy az

1 0 ... 0
0 1 .. 0 
E ;
... ... ... ...
 
0 0 ... 1

40
Óbudai Egyetem BGK Fejezetek a matematikából

mátrix megfelel a követelményeknek. Az egységmátrix tehát az a négyzetes mátrix (minden n-re)


amelynek főátlójában 1-esek állnak, az összes többi eleme pedig zérus.
Ez a fogalom azon túl, hogy elméleti jelentősége van, számunkra is fontos, visszatérünk még rá
az inverzmátrix tárgyalásánál.

6. Permutáló mátrix.Permutáló mátrixnak nevezzük azt a mátrixot, amely az E egységmátrixból


úgy keletkezik, hogy sorainak vagy oszlopainak sorrendjét megváltoztatjuk, permutáljuk. Jele
általában P. A permutáló mátrixnak minden sorában és minden oszlopában pontosan 1 db 1-es
van a többi komponense pedig zérus.

1.14.Példa: Permutáló mátrix például az alábbi.

0 0 1 0
1 0 0 0 
P ;
0 0 0 1
 
0 1 0 0

Derítsük ki ennek a mátrixnak a „hatását” ha vele balról vagy jobbról megszorzunk egy
negyedrendű mátrixot. Legyen

1 3 2 5 
0 4 7 1
A ;
2 9 4 3
 
 1 5 0 2

és számítsuk ki a PA valamint AP szorzatokat. A szorzások eredménye a következő.

0 0 1 0  1 3 2 5 2 9 4 3
1 0 0 0   0 4 7 1  1 3 2 5 
PA    ;
0 0 0 1  2 9 4 3  1 5 0 2
    
0 1 0 0   1 5 0 2 0 4 7 1
1 3 2 5  0 0 1 0 3 5 1 2 
0 4 7 1 1 0 0 0   4 1 0 7 
AP    ;
2 9 4 3 0 0 0 1  9 3 2 4
    
 1 5 0 2  0 1 0 0  5 2 1 0 

Vegyük észre a következőket.

1. Ha balról szorzunk egy permutáló mátrixszal, akkor a szorzás eredménye a következő: Ha az


(i, j) pozícióban van egy 1-es, akkor a szorzás hatására a mögötte álló mátrix j-edik sorát az
i-edik sorba helyezi át.

41
Óbudai Egyetem BGK Fejezetek a matematikából

2. Ha jobbról szorzunk egy permutáló mátrixszal, akkor a szorzás eredménye a következő: Ha


az (i, j) pozícióban van egy 1-es, akkor a szorzás hatására az előtte álló mátrix i-edik
oszlopát a j-edik oszlopba helyezi át.

Ennek megértéséhez semmi mást nem kell tennünk, mint felidézni, hogy egy sorvektorral balról
szorozva egy mátrixot, a mátrix sorainak lineáris kombinációját kapjuk. Ha pedig egy
oszlopvektorral jobbról szorzunk egy mátrixot, akkor a mátrix oszlopainak lineáris kombinációját
kapjuk.

A permutáló mátrixok alkalmazásának speciális esete – amelyet egyenletrendszereknél


alkalmazunk majd – például két sor cseréje. Ez egyszerűen megvalósítható az alábbi módon. Ha
az i-edik és a j-edik sort szeretnénk felcserélni, akkor a permutáló mátrix az
egységmátrixból úgy születik, hogy annak i-edik és j-edik sorát felcseréljük.

1.15.Példa: Egy negyedrendű mátrix esetében, ha fel szeretnénk cserélni az 1. és 3. sort, akkor a
permutáló mátrix és a szorzás az előbbi példabeli A mátrixot használva a következő.

0 0 1 0  1 3 2 5   2 9 4 3
0 1 0 0   0 4 7 1  0 4 7 1
PA    ;
1 0 0 0  2 9 4 3  1 3 2 5 
    
0 0 0 1   1 5 0 2   1 5 0 2

42
Óbudai Egyetem BGK Fejezetek a matematikából

1.7. Kvadratikus mátrix determinánsa

1.32.Definíció: Legyen A   aij  Rn×n egy négyzetes mátrix. A-hoz az alábbi definícióval
hozzárendelünk egy valós számot, amelyet az A mátrix determinánsának nevezünk

I  P
det A  A    1 a11  a22  ...  ann
P

ahol az összegzés az 1,2,3,…n számok összes P permutációjára (összes lehetséges sorrendjére)


vonatkozik, az I(P) pedig az α1, α2, α3,…αn permutációban az inverziók („előzések”,
transzpozíciók) számát jelenti. Az n×n méretű mátrix determinánsát n-ed rendű determinánsnak
nevezzük.

1.16.Példa: Az 1,2,3,4,5 egész számok egy permutációja a 2,5,3,1,4 sorozat. Ebben az alábbi
párokat írhatjuk fel az adott sorrendnek megfelelően: 2-5, 2-3, 2-1, 2-4, 5-3, 5-1, 5-4, 3-1, 3-4,
1-4. Azokat a párokat, amelyek inverziót – tehát a természeteshez képest fordított sorrendet –
jelentenek aláhúztuk. Tehát ebben a példában I = 5. Az összegzést az 1,2,3,…n számok összes
lehetséges permutációjára ki kell terjeszteni, ezek száma n!, azaz „n faktoriális”,
(n! = 1∙2∙3∙…∙n), ami azt jelenti, hogy a fenti „szummában” n! számú tag van. Ez már kis n
esetén is nagy szám: 2! = 2, 3! = 6, 4! = 24, 5! = 120,…stb. Ez mutatja, hogy a determináns
kiszámítása már nem túl nagy méretek esetén is elég nehézkes, nagyon nagy n esetén még egy
számítógépnek is komoly feladat a számítás elvégzése. Mivel azonban néha gép nélkül is ki kell
tudnunk számolni egy determináns értékét ezért kidolgoztak olyan tételeket, amelyek
segítségével a számítás könnyebben kivitelezhető.

1.17.Példa: Először a definíció alapján kiszámítjuk a 2×2-es mátrix determinánsát.

a a 
Legyen A   11 12  . Ekkor detA = a11∙a22 – a12∙a21
 a21 a22 

Az összegzés az 1,2 számok összes lehetséges permutációjára kiterjed: P = {(1,2); (2,1)}. Nézzük
az elemek „második indexeit”. Az első tagban az indexek sorrendje 1,2 itt nincs inverzió, I = 0,
(–1)0=1, a másodikban pedig 2,1 itt az inverziók száma I = 1, (–1)1= –1. Ezzel igazoltuk a
„kifejtés” helyességét. A számítást könnyű megjegyezni: a főátlóbeli elemek szorzatából
kivonjuk a „mellékátló”-beli elemek szorzatát. Fontossága miatt egyszerűbb jelölésekkel is
felírjuk a determinánst.

a b
 ad  bc;
c d

1.18.Példa: Kézi számítások során gyakran találkozunk harmadrendű determinánssal. Számítsuk


ki ezt is. Mivel 3! = 6, ennek a determinánsnak a kifejtése során 6 tagot kell kapnunk. Ez a 6 tag a
következő

43
Óbudai Egyetem BGK Fejezetek a matematikából

a11 a12 a13


a21 a22 a23  a11a22 a33  a12 a23a31  a13a21a32  a11a23a32  a12 a21a33  a13a22 a31;
a31 a32 a33

Ha most a szorzatokban szereplő tényezők második indexeit vizsgáljuk, akkor ezek a következők:
(1,2,3); (2,3,1); (3,1,2); (1,3,2); (2,1,3); (3,2,1). Látható, hogy ezzel megkaptuk 3 db szám összes
lehetséges permutációit, és az is ellenőrizhető, hogy ezen permutációkban az inverziók száma
rendre a következő: 0, 2, 2, 1, 1, 3. Tehát az első három tag esetében páros számú a következő
három tag esetében pedig páratlan számú. Mivel a (–1) páros kitevőjű hatványa +1, páratlan
kitevőjű hatványa pedig –1, ez már indokolja is a determináns kifejtésében szereplő tagok
előjelét.

Kizárólag harmadrendű determináns kifejtése elvégezhető egy speciális módon, amelyet


Sarrus-szabályként ismerünk. Ehhez egészítsük ki a mátrixot még két oszloppal úgy, hogy a
mátrix után leírjuk még az első és a második oszlopot ebben a sorrendben,

a11 a12 a13 a11 a12


a21 a22 a23 a21 a22 ;
a31 a32 a33 a31 a32

majd a kapott sémát kifejtjük a következő módon. Az ábrán folytonos vonallal jelölt „átlók”
mentén álló komponenseket összeszorozzuk, majd a szorzatokat összeadjuk, majd ebből kivonjuk
a szaggatott vonalak mentén álló komponensek szorzatait. Ha a szorzásokat elvégezzük akkor jól
láthatóan rendre a definíció alapján adódó hat tagot kapjuk előjelhelyesen.

1.19.Példa: Számítsuk ki a következő harmadrendű determinánst a Sarrus-szabállyal.

1 3 2 1 3 2 1 3
2 1 3  2 1 3 2 1  6  36  20   8  15  36   19;
4 5 6 4 5 6 4 5

A kifejtést lehetővé tevő általános tétel megfogalmazásához szükség van még egy fogalomra.

1.33.Definíció: Az n-ed rendű

 a11 a12 ... a1n 


a a ... a2 n 
A   21 22 ;
 ... ... ... ... 
 
 an1 an 2 ... ann 

mátrix aij eleméhez tartozó előjeles aldeterminánst a következő módon értelmezzük.

44
Óbudai Egyetem BGK Fejezetek a matematikából

 a11 ... a1, j 1 a1, j 1 ... a1n 


 
 ... ... ... ... ... ... 
 ai 1,1 ... ai 1, j 1 ai 1, j 1 ... ai 1,n 
i j
Aij   1  det  ;
 ai 1,1 ... ai 1, j 1 ai 1, j 1 ... ai 1,n 
 
 ... ... ... ... ... ... 
a ... an, j 1 a1, j 1 ... ann 
 n1

Tehát azAij valós számot úgy kapjuk, hogy az A mátrixból elhagyjuk az i-edik sort és a j-edik
oszlopot, a kapott (n–1)-ed rendű mátrixnak (amelyet szokás almátrixnak vagy minornak
nevezni) kiszámítjuk a determinánsát, és azt megszorozzuk (–1) „annyiadik” hatványával
amennyi a sorindex és oszlopindex összege. Az előjeles aldeterminánst szokás
adjungáltaldeterminánsnak is nevezni.

Ez utóbbi előjel meghatározását könnyíti meg a „sakktábla szabály”. Ha megjegyezzük az


alábbi sémában az előjelek helyét, akkor az aldeterminánsok előjelezése egyszerűbb feladat.

   ...
   ...

   ...
 
... ... ... ...

A séma nyilván tetszőleges méretig általánosítható. A lényeg, hogy a bal felső sarokban + jel
van, a többi pedig a sakktábla sötét és világos mezőinek megfelelően váltakozik.Ezek után
következhet a determinánsok kiszámítására vonatkozó alaptétel.

1.17.Tétel: (Kifejtési tétel)

Az A   aij  Rn×n négyzetes mátrix determinánsa kiszámítható az alábbi összeggel.

n
kifejtés az i-edik sor szerint : det A   aij  Aij  ai1  Ai1  ai 2  Ai 2  ...  ain  Ain ;
j 1
n
kifejtés a j -edik oszlop szerint : det A   aij  Aij  a1 j  A1 j  a2 j  A2 j  ...  anj  Anj ;
i 1

A bizonyítást későbbre halasztjuk, amikor már a kezünkben van a determináns, néhány kifejtési
tételtől független tulajdonsága.

A tétel a következőt jelenti. Egy mátrix determinánsát kiszámíthatjuk az alábbi módon.


1. Kifejtés az i-edik sor szerint: Kiválasztjuk a mátrix i-edik sorát, ennek a sornak minden
komponensét megszorozzuk a hozzátartozó előjeles aldeterminánssal, és ezeket a szorzatokat
összegezzük.

45
Óbudai Egyetem BGK Fejezetek a matematikából

2. Kifejtés a j-edik oszlop szerint: Kiválasztunk egy tetszőleges oszlopot, ennek az oszlopnak
minden komponensét megszorozzuk a hozzátartozó előjeles aldeterminánssal és ezeket a
szorzatokat összegezzük.

A tételben benne van, hogy a számítás eredménye független attól, hogy melyik sort illetve
oszlopot választjuk, továbbá attól is, hogy sor vagy oszlop szerint fejtjük ki a determinánst.
Mindig úgy választunk, hogy a számítás a legegyszerűbb legyen.

1.20.Példa: Igazoljuk, hogy a 2×2-es mátrix determinánsára a kifejtési tétellel ugyanazt az


eredményt kapjuk mint a definíció alapján. Az első sor szerint kifejtve

a11 a12   
 a11 A11  a12 A12  a11a22  a12 a21 ; ugyanis a sakktábla  
a21 a22  

Ez valóban ugyanaz az eredmény.

1.21.Példa: Fejtsük ki a 3×3-as mátrix determinánsát az első sor szerint és mutassuk meg, hogy a
definícióval egyező eredményt kapunk.. Az előjelezésnél vegyük alapul a sakktábla szabályt.

a11 a12 a13


a a23 a a a a
a21 a22 a23  a11  22  a12  21 23  a13  21 22 
a32 a33 a31 a33 a31 a32
a31 a32 a33
 a11  a22  a33  a23  a32   a12  a21  a33  a23  a31   a13  a21  a32  a22  a31  
 a11  a22  a33  a11  a23  a32  a12  a21  a33  a12  a23  a31  a13  a21  a32  a13  a22  a31

Látható, hogy valóban a korábbival egyező eredményt kapunk, ugyanaz a 6 tag jelenik meg az
összegben csak esetleg más sorrendben.
A 3×3-as determináns kifejtésénél tehát felhasználtuk a már ismert 2×2-es determinánst, és így
tovább a 4×4-es determinánsnál fel kell használni, hogy ismerjük a 3×3-ast, hiszen egy 4×4-es
kifejtésénél adódik 4 db 3×3-as aldetermináns. A módszer innen világos, azonban mégsem
alkalmazzuk közvetlenül ezt a módszert. Ugyanis nagyon sok számítással jár, és különösen ha
fejben számolunk, sok a hibalehetőség. Egy 4×4 –es determináns kifejtésénél ugyanis szükség
van 4 db 3×3-as determninánsra, és mind a 4 db 3×3-as determinás esetén szükség van 3 db 2×2-
es determinánsra. Ennél „rosszabb” a helyzet, ha nagy méretű mátrixok determinánsát számítjuk
ki. Ezen probléma megkerülésére igazolunk az alábbiakban néhány tételt, amely megkönnyíti a
determinánsok kiszámítását.

1.18.Tétel: Az A mátrix determinánsa megegyezik AT transzponáltjának determinánsával.

 
det  Α   det AT
Bizonyítás:Azt kell igazolni, hogy

46
Óbudai Egyetem BGK Fejezetek a matematikából

I  P I Q 
det A    1 a11  a22  ...  ann    1 a11  a2 2  ...  ann  det AT
P Q

ahol P és Q az {1, 2, ..., n} halmaz egy-egy permutációját jelöli. Az egyenlőség azért igaz, mert a
bal oldali összeg minden tagjához hozzárendelhető a jobboldali összegnek pontosan egy tagja
előjelhelyesen. ■

Ennek a tételnek a haszna a következő. A következőkben elég a determinánsok soraira


vonatkozólag megfogalmazni a tételeket. Ezen tétel alapján következik, hogy az állítások
oszlopokra is igazak.

1.19.Tétel: Ha az A mátrix egy sorának minden komponense zérus, akkor a determinánsa zérus.
Bizonyítás: A determináns definíciója szerinti

det A  A    1 a11  a22  ...  ann


I

összeg minden egyes tagjában pontosan egy tényező szerepel az adott sorból, és ez a tényező
zérus, tehát az összeg zérus. ■

1.20.Tétel: Ha egy determináns két sorát felcseréljük, akkor a determináns előjelet vált.
Bizonyítás: Ha az i-edik és a j-edik sort felcseréljük (pl. i<j) akkor azt kell igazolnunk, hogy
teljesül a

I  P I  P '
  1 a11  ...  aii  ...  a j j  ...  ann    1 a11  ...  a j j  ...  aii  ...  ann
P P'

egyenlőség, ahol 
P  1,..., i ,...,  j ,..., n  és 
P '  1,...,  j ,..., i ,..., n .  Mindkét
összegben a szorzatokat tudjuk úgy párosítani, hogy a tényezői megegyeznek, de a szorzat
ellentétes előjelű. Ugyanis csak azt kell meggondolni, hogy az inverziók száma mindig páratlan
számmal változik, ugyanis a P-ből P'-t úgy kapjuk, hogy az i-edik és a j-edik elemeket
megcseréljük, azaz I(P') = I(P) + egy páratlan szám. ■

1.21.Tétel: Ha egy mátrixban két sor elemenként megegyezik, akkor a mátrix determinánsa
zérus.
Bizonyítás: Cseréljük fel a két sort. Ekkor az előző tétel szerint az előjelnek meg kell változni,
ugyanakkor nem változik, mert két azonos sort cseréltünk fel. Eszerint a determináns értéke csak
nulla lehet. ■

1.22.Tétel: Ha egy mátrix egy sorának minden elemét megszorozzuk ugyanazzal az α valós
számmal, akkor a mátrix determinánsa is α-val szorzódik. Azaz

47
Óbudai Egyetem BGK Fejezetek a matematikából

 a11 a12 ... a1n   a11 a12 ... a1n 


 ... ... ... ...  ... ... ... ... 
 
det ai1 ai 2 ... ain   det  ai1 ai 2
 ... ain  ;
   
 ... ... ... ...   ... ... ... ... 
 an1 an 2 ... ann   an1 an 2 ... ann 

Bizonyítás: Fejtsük ki a determinánst az adott sor szerint, ekkor minden tagban szerepel az α
szorzótényező, tehát a determináns valóban α-val szorzódik. ■

Ennek a tételnek egy következménye az alábbi állítás.

1.23.Tétel: Ha egy n-ed rendű A mátrixot szorzunk egy α skalárral, akkor a skalárszorzással
kapott mátrix determinánsa az eredeti determinánsnak és az α n-edik hatványának a szorzata,
azaz

Ha A  R nn akkor det  A   n det  A  ;

Bizonyítás: Alkalmazzuk az előző tételt minden sorra. Minden sor α-val történő szorzásakor a
determináns szorzódik α-val. Mivel ezt elismételjük mind az n db sorra, valóban azt kapjuk, hogy
a determináns αn-nel szorzódik.
Az állítást a determináns definíciója alapján úgy is igazolhatjuk, hogy a determináns kiszámítása
során az összeg minden tagját úgy kapjuk, hogy minden sorból és minden oszlopból veszünk
pontosan egy elemet és ezeket összeszorozzuk. Világos, hogy ha minden sort szorzunk α-val,
akkor a szorzatok αn-nel szorzódnak. ■

1.24.Tétel: Ha egy mátrixban egy sor elemei úgy állnak elő, hogy egy másik sor elemeit
szorozzuk ugyanazzal az α valós számmal, akkor a mátrix determinánsa zérus.
Bizonyítás: Az előző tétel szerint egy ilyen mátrixnak a determinánsa α-szorosa azon mátrix
determinánsának, amelyben két sor megegyezik, de ez utóbbiról tudjuk, hogy értéke zérus. ■

1.25.Tétel: Ha egy mátrix i-edik sorának minden eleme két tag összegeként áll elő, aij = a’ij + a”ij
akkor a mátrix determinánsa egyenlő két determináns összegével, melyek az i-edik sor
kivételével megegyeznek az eredeti determinánssal, i-edik sorukban pedig rendre az a’ij illetve az
a”ij elemek vannak. Azaz

 a11 a12 ... a1n   a11 a12 ... a1n   a11 a12 ... a1n 
 ... ... ... ...   ... ... ... ...    ... ... ... ... 
   
det  a 'i1  a "i1 a 'i 2  a "i 2 ... a 'in  a "in   det  a 'i1 a 'i 2 ... a 'in   det  a "i1 a "i 2 ... a "in  ;
     
 ... ... ... ...   ... ... ... ...   ... ... ... ... 
 an1 an 2 ... ann   an1 an 2 ... ann   an1 an 2 ... ann 

Bizonyítás: Fejtsük ki a determinánst az i-edik sora szerint, majd alkalmazzuk a valós számok
halmazában érvényes disztributív és kommutatív törvényt. ■

48
Óbudai Egyetem BGK Fejezetek a matematikából

1.26.Tétel: A determináns, bármelyik rögzített sorának lineáris függvénye. Azaz ha a mátrixot


úgy tekintjük mint n db sorvektorból álló „vektort”, akkor írhatjuk, hogy

 a1T  a1T   a1T 


     
 ...   ...   ... 
det ai  bi   det ai   det bTi  ;
 T T  T
     
 ...   ...   ... 
     T
 aTn  a n   a n 
T

Bizonyítás: Az előző két tétel következménye. ■

1.27.Tétel: Ha egy mátrix egyik sora a többi sorok lineáris kombinációja, akkor a mátrix
determinánsa zérus.
Bizonyítás: A linearitásból következik, hogy ebben az esetben a mátrix előáll annyi determináns
lineáris kombinációjaként, ahány tagú az adott sorbeli lineáris kombináció, és ezekben a
determinánsokban megegyezik két sor, tehát ezen determinánsok értéke külön-külön zérus. ■

1.28.Tétel: Egy determináns értéke nem változik meg, ha egy sorának α-szorosát (αR) egy
másik sorához adjuk. Tehát ha a j-edik sor α-szorosát az i-edik sorhoz adjuk, akkor

 a1T  a1T 
   
 ...  ... 
 aT  a T 
 j   j
det  ...   det  ...  ;
 T   
ai  aTj  aiT 
   
 ...   ... 
 aT  a T 
 n   n

Bizonyítás: Felhasználva a linearitást, valamint azt, hogy egy determináns zérus ha két sora
megegyezik, írhatjuk, hogy

 a1T  a1T  a1T  a1T  a1T 


         
 ...  ...  ...  ...  ... 
 aT  a T  a T  a T  a T 
 j   j  j  j  j
det  ...     
 det ...   det ...  det ...  0  det  ...  ;
 
 T     T    
ai  aTj  aiT  a j  aiT  aiT 
         
 ...   ...   ...   ...   ... 
 aT  a T  a T  a T  a T 
 n   n  n  n  n

49
Óbudai Egyetem BGK Fejezetek a matematikából

Ezt kellett igazolni. ■

A tétel tartalmára úgy hivatkozunk, hogy ún. sorekvivalens átalakításokat végzünk. Az


elnevezés arra utal, hogy a sorokkal végzett műveletek következtében a determináns értéke nem
változik meg. A determinánsok kiszámítása szempontjából talán ez tekinthető a legfontosabb
tételnek. Ennek alkalmazása során úgy járunk el, hogy kiválasztunk egy sort, és ennek
számszorosait úgy adjuk a többi sorhoz, hogy egy adott oszlopban egy elem kivételével minden
elem zérus legyen. Ha ezt elértük, akkor az adott oszlop szerint kifejtve a determinánst nyilván
könnyű dolgunk van, mert egy kivétellel minden aldetermináns zérussal szorzódik, tehát egy n-ed
rendű mátrix esetében n–1 db aldeterminánst ki sem kell számolni. A determináns rendjének
csökkentése ezzel a módszerrel folytatható. Egy másik eset az, hogy a mondott módszerrel olyan
mátrixhoz jutunk, amely a fenti tételek egyikében szerepel, és ekkor determinánsa nulla.

Az említett tételek birtokában már könnyen igazolhatjuk a kifejtési tételt. Hangsúlyozzuk, hogy a
fenti tételek bizonyítása során nem használtuk a kifejtési tételt, hanem a detrmináns definíciójára
támaszkidtunk.

A Kifejtési tétel bizonyítása: A determináns sor szerinti linearitására támaszkodva, egy n-ed
rendű determináns esetében nyilvánvaló a következő egyenlőség

a11 a12 ... a1n a11 a12 ... a1n a11 a12 ... a1n a11 a12 ... a1n
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
ai1 ai 2 ... ain  ai1 0 ... 0  0 ai 2 ... 0  ...  0 0 ... ain ;
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
an1 an 2 ... ann an1 an 2 ... ann an1 an 2 ... ann an1 an 2 ... ann

Ha itt figyelembe vesszük az előjeles aldetermináns fogalmának értelmezését akkor látjuk, hogy
kifejtve az egyes determinánsokat majd ezeket összeadva éppen a

n
det A   aij  Aij  ai1  Ai1  ai 2  Ai 2  ...  ain  Ain
j 1

egyenlőséget kapjuk, ezzel a kifejtési tételt igazoltuk. ■

1.22.Példa: Számítsuk ki kifejtési tétellel két különböző módon az alábbi harmadrendű


determinánst.

2 3 1
4 0 3 ?
2 3 6

Fejtsük ki a determinánst két különböző módon is.

50
Óbudai Egyetem BGK Fejezetek a matematikából

Az első sor szerint kifejtve, figyelembe véve a sakktábla szabályt kapjuk, hogy

2 3 1
0 3 4 3 4 0
4 0 3 2   3   1  2  0  9   3  24  6    12  0   120;
3 6 2 6 2 3
2 3 6

A második oszlop szerint kifejtve, azt adódik, hogy

2 3 1
4 3 2 1 2 1
4 0 3    3 0   3  3  24  6   0  6  2   3  6  4   120;
2 6 2 6 4 3
2 3 6

A két eredmény természetesen egyenlő. A második példában, a teljesség kedvéért kiírtuk a zérus
tagot is, de természetesen erre nincs szükség. A két kifejtés összehasonlításával azt szeretnénk
hangsúlyozni, hogy ha a kifejtési tételt alkalmazzuk és a determinánsban vannak nulla
komponensek, akkor célszerű olyan sor vagy oszlop szerint kifejteni a determinánst amelyben a
legtöbb nulla komponens van.

1.23.Példa: Számítsuk ki sor ekvivalens átalakításokkal az alábbi negyedrendű determinánst.

1 2 1 3 1 2 1 3
1 6 8 0 13 12
2 3 4 2 0 1 6 8
  4 2 4  0 26 20 
1 2 3 1 0 4 2 4
1 7 4 1 7 4
3 7 4 5 0 1 7 4
13 12
  13  20   12    26   52;
26 20

A számítások a következők voltak: az első lépésben az első sornak rendre a 2, (–1) és 3-szorosát
levontuk a 2., 3. és 4. sorból. Ennek eredménye, hogy az első oszlopban egy kivétellel minden
komponens zérus lett. Ezután kifejtettük a determinánst az első oszlop szerint. A kapott
harmadrendű determinást is így alakítottuk tovább. A harmadik sort változatlanul hagyva, ezen
sor rendre (–1) és 4-szeresét kivontuk rendre az 1. és 2. sorból, így ismét az első oszlopban, egy
kivétellel minden komponens zérus lett. A kapott determinánst kifejtettük az első oszlop szerint.
Ez már csak egy másodrendű determináns, amelyet közvetlenül kiszámítottunk.

1.24.Példa: Határozzuk meg az alábbi determináns értékét elemi sor- és oszlopátalakításokkal.

2 1 3 1 2 1 3 1
2 2 4
0 1 1 1 2 2 4 0
  1 3 1 5 
1 0 2 1 3 1 5 0
5 0 5
1 2 1 2 5 0 5 0

51
Óbudai Egyetem BGK Fejezetek a matematikából

4 06
4 6
 3 15    20  30  10
5 5
5 0 5

Ebben az esetben a műveletek „megfejtését” az Olvasóra bízzuk. A módszer hatékonysága


azonban fokozható. Igaz ugyanis a következő állítás.

1.29.Tétel: Egy háromszög mátrix (alsó vagy felső háromszögmátrix) determinánsa a főátlóbeli
komponensek szorzata. Tehát

 a11 0 ... 0   a11 a12 ... a1n 


a a ... 0   0 a ... a2 n 
det  21 22  det  22
 a  a  ...  ann ;
 ... ... ... ...   ... ... ... ...  11 22
   
 an1 an 2 ... ann  0 0 ... ann 

Bizonyítás: A determináns értéke definíció szerint olyan szorzatok összege, amely szorzatok úgy
adódnak, hogy minden sorból és oszlopból kiválasztunk pontosan egy komponenst, majd ezeket
összeszorozzuk. Azt állítjuk, hogy egy háromszögmátrix determinánsának kifejtése során az n!
szorzat közül n! – 1 db zérus, és csak egy tag különbözik 0-tól, mégpedig az a tag, amely a
főátlóbeli komponenseket tartalmazza. Valóban, egy felső háromszögmátrix esetén induljunk az
utolsó sorból. Ebben csak egy tag különbözik zérustól, az ann komponens, válasszuk tehát ki ezt.
Ha ennek sorát és oszlopát elhagyjuk, akkor a maradék almátrixból ismét csak a jobb alsó
sarokbeli elemet választhatjuk, mert csak ez különbözik zérustól, tehát szorzunk an–1,n–1 elemmel.
Így folytatva tovább, valóban a főátló elemeinek szorzatát kapjuk. Ha alsó háromszögmátrixunk
van ugyanezt az eljárást követjük de a bal felső sarokból indulva. ■

1.25.Példa: Számítsuk ki az alábbi negyedrendű determináns értékét sorekvivalens


átalakításokkal úgy, hogy háromszögmátrix alakra hozzuk.

1 2 1 0 1 2 1 0 1 2 1 0
2 5 3 4 0 1 1 4 0 1 1 4
   11 3  (6)  18;
1 1 5 1 0 3 6 1 0 0 3 11
2 3 1 2 0 1 1 2 0 0 0 6

A műveletek a következők voltak. Először az első sor 2, (–1) és (–2)-szeresét levontuk rendre a
2., 3. és 4. sorból. Ezután a 2. sor 3 és 1-szeresét levontuk rendre a 3. és 4. sorból. A kapott
mátrix felső háromszögmátrix. determinánsa a főátlóbeli komponensek szorzata.

1.30.Tétel: Determinánsok szorzástétele


Ha A és B n-ed rendű mátrixok, akkor szorzatuk determinánsa egyenlő determinánsaik
szorzatával

det(AB) = detA∙detB.

52
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás:legyen C = AB és jelölje cj a C mátrix j-edik oszlopvektorát. Ekkor nyilvánvalóan


n
igaz, hogy c j   bij ai , j = 1, 2, ..., n esetén. Ekkor a linearitás miatt aCmátrix determinánsa
i 1

I Q 
det C    1 b11  b2 2  ...  bnn  det A  det B  det A
Q

Ezt kellett igazolni. ■

A későbbiekben bevezetendő inverzmátrix kiszámításához van szükség az alábbi fogalomra és az


azt követő állításra.

1.34.Definíció: Determináns „ferde kifejtése”


Ha az A mátrix i-edik sorának komponenseit megszorozzuk a j-edik sorához tartozó előjeles
aldeterminánsokkal, akkor a kapott összeget a determináns ferde kifejtésének nevezzük.

n
 aik  Ajk  ai1  Aj1  ai 2  Aj 2  ...  ain  Ajn ; i  j
k 1

A ferde kifejtéssel kapcsolatos alapvető eredmény a következő.

1.31.Tétel: A ferde kifejtés értéke zérus. Azaz

n
 aik  Ajk  ai1  Aj1  ai 2  Aj 2  ...  ain  Ajn  0; ha i  j
k 1

Bizonyítás: A ferde kifejtés definíciójában szereplő összeget akkor kapunk, ha egy olyan mátrix
determinánsát fejtjük ki az i-edik sor szerint, amelyben az i-edik és a j-edik sor megegyezik.
Valóban mivel két sor megegyezik a determináns értéke egyrészt nulla, másrészt ha kifejtjük a
j-edik sor szerint írhatjuk, hogy

... ... ... ... ... ... ... ... ... ...
ai1 ai 2 ai 3 ... ain ai1 ai 2 ai 3 ... ain
n n
0  ... ... ... ... ...  ... ... ... ... ...   a jk  A jk   aik  A jk
ai1 ai 2 ai 3 ... ain a j1 a j 2 a j 3 ... a jn k 1 k 1

... ... ... ... ... ... ... ... ... ...

ugyanis a j-edik sor elemei rendre ugyanazok, mint az i-edik sor komponensei. Ha ennek a
mátrixnak a determinánsát kifejtjük a j-edik sor szerint az éppen azt jelenti, hogy az i-edik sor
komponenseivel szorozzuk a j-edik sorhoz tartozó aldeterminánsokat, ami azt jelenti, hogy
valóban egy ferde kifejtést kapunk. ■

53
Óbudai Egyetem BGK Fejezetek a matematikából

Mátrixok inverzének számításánál, lineáris egyenletrendszerek megoldásánál szükség van az


alábbi különleges konstrukcióra.

1.35.Definíció: Az ARn×n mátrix adjungáltja az az adjA-val jelölt n-ed rendű mátrix, amely i-
edik sorának j-edik eleme megegyezik az A mátrix aji eleméhez, tehát j-edik sora i-edik eleméhez
tartozó előjeles aldeterminánssal (tehát az adjungált aldeterminánssal)

T
 A11 A12 ... A1n   A11 A21 ... An1 
A A22 
... A2 n  A A22 ... An 2 
adjA   21   12 ;
 ... ... ... ...   ... ... ... ... 
   
 An1 An 2 ... Ann   A1n A2 n ... Ann 

Az adjungálttal kapcsolatosan a következő alapvetően fontos tételt kell igazolnunk.

1.32.Tétel: Az adjungált mátrix determinánsa egyenlő az eredeti A mátrix determinánsának


(n–1)-edik hatványával.

det(adjA) = (detA)n–1

Bizonyítás: Képezzük az A mátrix és az adjungált mátrix szorzatának determinánsát. A


determinánsok szorzástétele szerint, igaz, hogy det(A  adjA)  det A  det  adjA  , másrészt
viszont a kifejtési tétel és a ferde kifejtésre vonatkozó tétel szerint

 a11 a12 ... a1n   A11 A21 ... An1   A 0 ... 0


a  
a22 ... a2 n   A12 A22 ... An 2   0 A ... 0
A  adjA   21  A   det A 
n n

 ... ... ... ...   ... ... ... ...   ... ... ... ... 
    
 an1 an 2 ... ann   A1n A2 n ... Ann   0 0 ... A 

ugyanis, ha az i-edik sort szorozzuk a j-edik oszloppal úgy hogy i ≠ j akkor éppen egy ferde
kifejtést kapunk, ami zérus, ha viszont az i-edik sort szorozzuk az i-edik oszloppal akkor a
determináns kifejtését kapjuk. A kapott mátrix egy háromszögmátrix, melynek determinánsa a
főátlóbeli komponensek szorzata. Ebből már következik az állítás, ugyanis

det(A  adjA)  det A  det  adjA    det A  ; ahonnan det  adjA    det A 
n n1
;

ezt kellett igazolni. ■

Lineáris egyenletrendszerek megoldásának vizsgálatát és a szereplő tételek megfogalmazását


könnyíti meg az alábbi fogalom.

54
Óbudai Egyetem BGK Fejezetek a matematikából

1.36.Definíció: Az ARn×kmátrixdeterminánsrangja r, ha a mátrixban van olyan r-ed rendű


kvadratikus almátrix, amelynek determinánsa nem zérus, de minden legalább (r +1)-ed rendű
almátrix determinánsa zérus.

A determinánsrang tehát a legnagyobb el nem tűnő aldetermináns rendje.

1.37.Definíció: Az ARn×kmátrixoszloprangja r, ha az oszlopvektor-rendszerből kiválasztható r


db lineárisan független vektor, de minden legalább (r +1) elemű vektorrendszer lineárisan
összefüggő.

Az oszloprang tehát a lineárisan független oszlopvektorok maximális száma.

1.38.Definíció: Az ARn×kmátrixsorrangja r, ha a sorvektor-rendszerből kiválasztható r db


lineárisan független vektor, de minden legalább (r +1) elemű vektorrendszer lineárisan
összefüggő.

A sorrang tehát a lineárisan független sorvektorok maximális száma.

1.33.Tétel: Bármely ARn×k mátrix determinánsrangja, oszloprangja és sorrangja egyenlő.


Bizonyítás: Nem bizonyítjuk. ■

Ez a tétel lehetőséget ad arra, hogy bevezessünk egy jelölést a mátrix rangjára, hiszen mindegyik
fogalom ugyanazt az értéket adja: Az A mátrix rangjátρ(A) jelöli.
Az elemi bázistranszformáció kiváló lehetőséget biztosít egy mátrix rangjának
meghatározására. A legegyszerűbb, ha az oszloprangot kérdezzük. A mátrix oszlopvektorai közül
annyit, amennyit csak lehet, egyenként beviszünk a bázisba, a rang egyenlő azon vektorok
számával, amelyeket bevittünk a bázisba.

1.39.Definíció: Az ARn×nn-ed rendű kvadratikus mátrixot szingulárisnak nevezzük, ha


ρ(A)<n.

Az ARn×nn-ed rendű négyzetes mátrix tehát szinguláris, ha n-nél kevesebb a lineárisan


független oszlopvektorok (sorvektorok) maximális száma, illetve ha detA = 0.

1.40.Definíció: Az ARn×nn-ed rendű négyzetes mátrix nemszinguláris (vagy más szóval


reguláris) ha a lineárisan független sorvektorok illetve oszlopvektorok száma egyaránt n, vagy
ha detA ≠ 0.

Mindhárom fogalom használható az általános esetben is, amikor a mátrix sorainak száma nem
egyezik meg az oszlopok számával.

55
Óbudai Egyetem BGK Fejezetek a matematikából

1.8. Kvadratikus mátrix inverze


A címben szereplő jelző hangsúlyozása arra utal, hogy létezik a vizsgálandó fogalom olyan
mátrixok esetében is, amelyek nem négyzetesek, de ez mind az elmélet mind a gyakorlat számára
elhanyagolható fontossággal bír, ezért mi csak a négyzetes mátrixokkal foglalkozunk.

Induljunk ki a következő problémából. Oldjuk meg a valós számok halmazán az


b
a∙x = b (a, bR, a ≠ 0) egyenletet. A megoldás nyilván: x   b  a 1  a 1  b . A valós számok
a
halmazában értelmeztük az osztás műveletét, de a mátrixok halmazában ez nem lehetséges.
Ezért írtuk fel a megoldást hatványalakban is, ahol a–1 az aR, a≠0 valós szám „inverz eleme”.
Az egyenlőséglánc végén azt is hangsúlyoztuk, hogy a valós számok szorzása kommutatív, de
tudjuk, hogy mátrixokra ez nem igaz.

Általánosítsuk a problémát mátrixokra. Megoldandó az A∙X = B mátrixegyenlet, ahol tehát


ARn×n,BRn×n adott mátrixok és XRn×n az a mátrix, amely kielégíti a felírt egyenletet, nyilván
X-et keressük, X az egyenletben az ismeretlen. Tegyük fel, hogy létezik egy A–1 jelű,
n-ed rendű négyzetes mátrix, amelyre igaz, hogy A–1∙A = E, ahol E az n-ed rendű egységmátrix.
Szorozzuk meg ezzel az egyenletet balról. Azért „balról”, mert tudjuk, hogy a szorzás nem
kommutatív.

A∙X = B
A–1∙A∙X = A–1∙B
E∙X = A–1∙B
X = A–1∙B

A mátrixegyenletet megoldottuk. Felhasználtuk, hogy E∙X = X, tetszőleges Xmátrix esetén,


hiszen E az egységmátrix.
Aprobléma lényege a következő. Adott,n-ed rendű A mátrixhoz keressük azt a C mátrixot,
amellyel C∙A = E.De megkérdezhetjük azt is, hogy létezik-e olyan D mátrix, amellyel AD = E.
Ez utóbbi más kérdés, hiszen ismét hangsúlyozzuk, hogy a szorzás nem kommutatív.

1.41.Definíció: Adott az ARn×n négyzetes mátrix. Ha létezik olyan CRn×n mátrix amelyre
CA = E teljesül, akkor C-t az A mátrix baloldali inverzének nevezzük.

1.42.Definíció:Adott az ARn×n négyzetes mátrix. Ha létezik olyan DRn×n mátrix amelyre


AD = E teljesül, akkor D-t az A mátrix jobboldali inverzének nevezzük.

Mivel a szorzás nem kommutatív, azt gondolhatnánk, hogy ha létezik ilyen C és D akkor azok
különböznek. De a válasz nemleges.

1.34.Tétel: Ha az ARn×n mátrixnak létezik jobboldali (baloldali) inverze, akkor létezik baloldali
(jobboldali) inverze is, és azok egyenlők: C = D.

56
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Tegyük fel, hogy létezik C baloldali inverz és D jobboldali inverz, azaz teljesül,
hogyCA = E és AD = E. Szorozzuk meg az első egyenlőséget jobbról a D mátrixszal a másodikat
pedig balról a C mátrixszal. Azt kapjuk, hogy

CAD = ED = D és CAD = CE = C

Mivel a bal oldalak egyenlők, a jobb oldalaknak is egyenlőknek kell lenni, tehát C = D. Mivel
egyenlők, ha az egyik létezik, nyilván létezik a másik is. ■

Ez a tétel lehetőséget ad arra, hogy bevezessünk egy jelölést és egy elnevezést.

1.43.Definíció: Az ARn×n négyzetes mátrix inverzének nevezzük, és A–1 szimbólummal jelöljük


azt a mátrixot, amely eleget tesz az alábbi követelményeknek

A–1A = AA–1 = E

Az inverzmátrix létezésének feltételét adja meg az alábbi állítás.

1.35.Tétel: Az ARn×n mátrixnak pontosan akkor létezik inverze, ha az A mátrix nemszinguláris,


tehát ha detA ≠ 0.
Bizonyítás: A determinánsok szorzástétele szerint, mivel AA–1 = E, kapjuk, hogy

det(AA–1) = detA·detA–1 = detE = 1;

Ebből adódik, hogy detA = 0 nem lehetséges, tehát ha az A mátrixnak létezik inverze, akkor
szükségképpen detA ≠ 0. Másképpen fogalmazva ha detA = 0, akkor nem létezik inverz, vagyis
szinguláris mátrix nem invertálható. A detA ≠ 0 feltétel elégségessége pedig a későbbiek során
derül ki, amikor ezen feltétel mellett konstruktív eljárást adunk az inverz meghatározására. ■

Az igazolt tétel fontos következménye az alábbi állítás.

1.36.Tétel: Ha A reguláris mátrix, akkor inverzének determinánsa az A determinánsának


reciproka. Azaz

 
det A 1 
1
det  A 
;

Bizonyítás: Az állítás az előző tétel bizonyítása során felírt detA·detA–1 = detE = 1 egyenlőség
közvetlen következménye. ■

Egy fontos és alapvető műveleti tulajdonságra világít rá az alábbi tétel.

1.37.Tétel: Ha az ARn×n és BRn×n nemszinguláris mátrixok, akkor szorzatuknak is létezik


inverze, és teljesül, hogy

(AB)–1 = B–1A–1

57
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Világos, hogy A és B regularitása miatt det(AB) = detA·detB ≠ 0, másrészt

(AB)(AB)–1 = (AB)(B–1A–1) = A(BB–1)A–1= AEA–1= AA–1= E.

Ezt kellett igazolni, ■

Ezek után rátérhetünk az inverzmátrix meghatározására. Több módszert mutatunk.

Mátrixinverzét kiszámíthatjuk például determinánsok segítségével. Legyen A   aij  Rn×nn-ed


rendű mátrix és tegyük fel, hogy detA = │A│≠ 0. Idézzük fel az adjungált mátrix fogalmát.
T
adjA   Aij    Aji  R
n×n
, és használjuk fel, hogy a determináns kifejtéséről mondottak
szerint egyrészt a determináns kifejtése

n
 aij  Aij  ai1  Ai1  ai 2  Ai 2  ...  ain  Ain  A
j 1

másrészt a ferde kifejtése

n
 aij  Akj  ai1  Ak1  ai 2  Ak 2  ...  ain  Akn  0
j 1

Szorozzuk most az A mátrixot az adjungált mátrixszal.

 a11 a12 ... a1n   A11 A21 ... An1   A 0 ... 0


a  
a22 ... a2 n   A12 A22 ... An 2   0 A ... 0
A  adjA    21 
 ... ... ... ...   ... ... ... ...   ... ... ... ... 
    
 an1 an 2 ... ann   A1n A2 n ... Ann   0 0 .... A 

Az eredmény a következőképpen magyarázható. Ha az i-edik sort az i-edik oszloppal szorozzuk,


akkor az eredmény detA, mert kifejtjük a determinánst (”kifejtés”), ha viszont az i-edik sort a
j-edik oszloppalszorozzuk, akkor az eredmény 0 („ferde kifejtés”). Innen világos, hogy haa
második tényezőt elosztjuk detA-val, épp az inverz mátrixot kapjuk, mert ebben az esetben a
szorzás eredménye az egységmátrix.

1.38.Tétel: Ha az ARn×n négyzetes mátrix nemszinguláris, tehát detA ≠ 0, akkor létezik inverze
és az előállítható az alábbi alakban

1 1
A 1    adjA     adjA 
det A A

58
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Az előző gondolatmenet alapján tehát írhatjuk, hogy

 a11 a12 ... a1n   A11 A21 ... An1 


 ... a2 n   A12 ... An 2 
1 1  a21 a22 A22
A adjA  
det A det A  ... ... ... ...   ... ... ... ... 
  
 an1 an 2 ... ann   A1n A2 n ... Ann 
A 0 ... 0  1 0 0
...
 
1 0 A ... 0   0 1 ... 0 
   E;
A  ... ... ... ...  ... ... ... ...
   
 0 0 .... A   0 0 .... 1 

Ezzel azt is bizonyítottuk, hogy a regularitás (detA ≠ 0) elégséges az inverz létezéséhez. ■

1.26.Példa: Számítsuk ki a következő mátrix inverzét.

 2 3
A ;
 4 8

Először meg kell győződnünk a regularitásról. Mivel detA = 16 – 12 = 4 ≠ 0, a mátrix reguláris,


létezik inverze. Az adjungált mátrix felírásához szükség van az előjeles aldeterminánsokra. Ezek
a következők

A11  8 A12  4
;
A21  3 A22  2

ahonnan az adjungált mátrix a következő

T
 8 4  8 3
adjA     ;
 3 2   2 2 

A kapott képlet alapján a mátrix inverze innen már adódik.

1 1  8 3  2 0, 75


A 1   adjA   
4  2 2   0,5 0,5 
 ;
det A

Mivel 2×2 méretű mátrixok gyakran előfordulnak a gyakorlatban, célszerű általánosan is felírni
egy másodrendű mátrix inverzét.

59
Óbudai Egyetem BGK Fejezetek a matematikából

a b 
1.27.Példa: Határozzuk meg általánosan az A    mátrix inverzét. Tegyük fel, hogy a
c d 
mátrix reguláris, azaz determinánsa det A  ad  bc  0 . Ekkor létezik inverz. Az adjungált
mátrixhoz először előállítjuk az előjeles aldeterminánsokat. Ezek a következők

A11  d A12  c
;
A21  b A22  a

innen az adjungált mátrix már felírható

T
 d c   d b 
adjA     ;
 b a   c a 

Ebből következően

a b  1 1  d b 
Ha A     , ha ad  bc  0;
ad  bc  c a 
akkor A
c d 

1.28.Példa: Határozzuk meg az alábbi harmadrendű mátrix inverzét.

 1 2 1
A   0 3 2  ;
 2 4 5 

Először kiszámítjuk az A determinánsát a kifejtési tétellel. Az első oszlop szerint kifejtve

1 2 1
3 2 2 1
det A  0 3 2  1  2  15  8   2  4  3  7;
4 5 3 2
2 4 5

A mátrix tehát reguláris, létezik inverze. Az adjungált mátrixhoz szükség van kilenc darab
előjeles aldeterminánsra. Ezek a következők

3 2 0 2 0 3
A11  7 A12    4 A13  6
4 5 2 5 2 4
2 1 1 1 1 2
A21    14 A22  3 A23    8
4 5 2 5 2 4
2 1 1 1 1 2
A31  7 A32    2 A33  3
3 2 0 2 0 3

60
Óbudai Egyetem BGK Fejezetek a matematikából

Az előjeles aldeterminánsokból kapjuk az adjungált mátrixot

T
 7 4 6   7 14 7 
adjA   14 3 8   4 3 2  ;
 
 7 2 3   6 8 3 

Ebből pedig már következik, hogy az inverz mátrix az alábbi

 7 14 7 
   4 3 2  ;
1 1
A
7
 6 8 3 

A következőkben, az egyenletrendszerek elméletében még mutatunk más módszert mátrix


inverzének meghatározására.

61
Óbudai Egyetem BGK Fejezetek a matematikából

1.9. Lineáris egyenletrendszerek


Egy lineáris egyenletrendszer a legáltalánosabb alakban az alábbi formában írható.

a11 x1  a12 x2  ...  a1k xk  b1


a21 x1  a22 x2  ...  a2 k xk  b2
...
an1 x1  an 2 x2  ...  ank xk  bn

ahol az aijR valós számok az „együtthatók”, a biR valós számok a „jobboldalak”, és xj-k
pedig az ismeretlenek(i = 1,2,…n; j = 1,2,…k). Az általános esetben tehát van n db egyenlet és
ebben szerepel k db ismeretlen. Vezessünk be néhány jelölést és elnevezést. Legyen

 a11 a12 ... a1k   x1   b1 


a a ... a2 k  x  b 
A   21 22 ; x   2 ; b   2 ;
 ... ... ... ...   ...   ... 
     
 an1 an 2 ... ank   xk  bn 

Az ARn×k mátrixot együtthatómátrixnak nevezzük, az xRk vektor tartalmazza az


ismeretleneket, a bRn pedig a jobboldal.
Mielőtt rátérünk az egyenletrendszer megoldására, írjuk fel a fenti egyenletrendszert mátrix- és
vektorműveletek segítségével is. a mátrixok szorzásának értelmezésénél külön kitértünk arra az
esetre, hogyan szorzunk mátrixot vektorral. Ezek alapján azonnal látható, hogy a lineáris
egyenletrendszer klasszikus alakja pontosan megegyezik az alábbi mátrix szorzattal.

Ax = b

Ez a felírás azon túl, hogy egyszerűbb, mint az eredeti, ötletet ad a megoldás módjára is. De
mielőtt ehhez hozzákezdünk, még egy elnevezés következik.

1.44.Definíció: Az Ax = b lineáris egyenletrendszert homogénnek nevezzük ha b = 0, azaz ha


mindegyik egyenlet jobboldala 0, és inhomogén, ha b ≠ 0, azaz van legalább egy olyan egyenlet,
amelynek a jobboldala nem 0.

I. eset: Az együtthatómátrix kvadratikus

Elsőként azzal az esettel foglalkozunk, amikor az egyenletrendszer együtthatómátrixa négyzetes


mátrix, másképpen fogalmazva, az egyenletek száma megegyezik az ismeretlenek számával.
Ebben az esetben több módszert is mutatunk a megoldásra.

1.39.Tétel: Tegyük fel, hogy az ARn×n együtthatómátrix nemszinguláris, azaz létezik A–1
inverze. Ekkor az Ax = b lineáris egyenletrendszer megoldása x = A–1b.

62
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Ez az összefüggés a korábbiakban már vizsgált mátrixegyenlet speciális esete. Tehát

Ax = b
A–1Ax = A–1b
Ex = A–1b
x = A–1b

Ezt kellett igazolni. ■

Felhívjuk azonban a figyelmet arra, hogy ez a módszer csak nagyon korlátozott körben, az alábbi
feltételek teljesülése esetén alkalmazható:
1. Az egyenletrendszerben ugyanannyi az ismeretlenek száma, mint az egyenleteké.
2. Az együtthatómátrix nemszinguláris, tehát létezik inverze.
Ezek a feltételek azonban biztosítják is a megoldhatóságot, és ekkor a megoldás egyértelmű.

1.29.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert mátrix inverzének felhasználásával.

 1 2 1  x1   7 
 0 3 2   x    14  ;
  2  
 2 4 5   x3   7 

Az együtthatómátirx inverzét éppen az előző példában számítottuk ki.

 7 14 7 
   4 3 2  ;
1 1
A
7
 6 8 3 

Innen azonnal adódik a megoldás az x =A–1b megoldóképlet segítségével.

 x1   7 14 7   7   7 14 7   1  28


 
x   x2     4 3 2  14   4 3 2  2    8  ;
1
7
 x3   6 8 3   7   6 8 3   1   19

1.30.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert mátrix inverzének felhasználásával.

 x1  2 x2  3x3  x4  2
 3x  2 x  2 x  3
 1 2 4

 x1  3x2  2 x3  x4  1
 x1  x2  x4  0

63
Óbudai Egyetem BGK Fejezetek a matematikából

Elsőként ellenőriznünk kell, hogy az együtthatómátrix reguláris-e. Kiszámítjuk a determinánsát.

1 2 3 1 1 1 3 0
1 1 3
3 2 0 2 3 1 0 5 1 3
  5 1 4 2  5  50  0;
1 3 2 1 1 4 2 0 4 2
1 0 0
1 1 0 1 1 0 0 0

Tehát létezik inverz. Szorzással ellenőrizhető, hogy az inverzmátrix a következő

 8 10 12 0 
 10 0 15 25
1
A 1    ;
50  20 0 5 25 
 
 2 10 3 25 

Az egyenletrendszer megoldása az alábbi szorzattal adódik.

 8 10 12 0  2   58
 10   
0 15 25  3   
1 1  1  35 
xA b  ;
50  20 0 5 25   1 50  45
    
 2 10 3 25   0   23

Mint korábban láttuk, ezzel a módszerrel mátrixegyenleteket is meg tudunk oldani.

1.31.Példa: Oldjuk meg az alábbi mátrixegyenletet mátrix inverzének felhasználásával.

 1 1 2  19 0 
AX  B; ahol A   0 2 3  ; B   19 19  ; X  ?
  
 2 1 4  38 38

Elsőként kiszámítjuk az A mátrix determinánsát.

1 1 2 1 1 2
2 3
det( A)  0 2 30 2 3  19  0;
1 8
2 1 4 0 1 8

Az együtthatómátrix tehát reguláris, létezik inverze. Szorzással ellenőrizhető, hogy az


inverzmátrix a következő.

64
Óbudai Egyetem BGK Fejezetek a matematikából

 5 6 7 
  6 8 3 ;
1 1 
A
19
 4 1 2 

Ennek ismeretében, a korábbiak szerint, már adódik a mátrixegyenlet megoldása.

 5 6 7   19 0   15 20 
X  A B   6 8 3  19 19    20 14  ;
1 1   
19
 4 1 2   38 38  7 3

Ugyanezen feltételek teljesülése esetén létezik még egy másik klasszikus módszer az
egyenletrendszer megoldására. Ezt mondja ki a következő állítás.

1.40.Tétel: (Cramer-szabály)
Tegyük fel, hogy az ARn×n együtthatómátrix nemszinguláris, azaz detA ≠ 0. Ekkor az Ax = b
lineáris egyenletrendszer megoldható a következő módon.Jelöljük azA együtthatómátrix
determinánsát D-vel, tehát detA = D, a feltevés szerintD ≠ 0, továbbá jelölje Dj annak a
mátrixnak a determinánsát amelyet az A együtthatómátrixból úgy kapunk, hogy abban aj-edik
oszlop helyére a jobboldal b vektorának komponenseit írjuk. Ekkor az egyenletrendszer
egyértelmű megoldása a következő

Dj
xj  ; j 1, 2,...n
D

Bizonyítás: A Cramer szabály igazolása ugyancsak a determinánsok elméletén alapul,


felhasználjuk a determinánsok kifejtését és a ferde kifejést. Az egyszerűség érdekében írjuk fel
csak az egyenletrendszer i-edik egyenletét

ai1x1  ai 2 x2  ...  aij x j  ...  ain xn  bi ; i  1, 2,..., n;

Szorozzuk meg az i-edik egyenletet minden i-re az Aij előjeles aldeterminánssal. Ekkor azt
kapjuk, hogy

ai1 Aij x1  ai 2 Aij x2  ...  aij Aij x j  ...  ain Aij xn  bi Aij ; i  1, 2,..., n;

Összegezzük most a kapott n db egyenletet. Összegzés és az xj ismeretlen kiemelése után adódó


összeg éppen az együtthatómátrix determinánsa. Ha azonban k ≠ j esetén az xk ismeretlen
kiemelése után adódó összeget vizsgáljuk, látható, hogy az éppen egy ferde kifejtés, ami zérus

n n n n n
x1  ai1 Aij  x2  ai 2 Aij  ...  x j  aij Aij  ...  xn  ain Aij   bi Aij ;
i 1 i 1 i 1 i 1 i 1

tehát a mondottak szerint az adódik, hogy

65
Óbudai Egyetem BGK Fejezetek a matematikából

n
0  x1  0  x2  ...  det A  x j  ...  0  xn   bi Aij ;
i 1

A jobb oldal is emlékeztet bennünket egy determináns kifejtésére. Ez annak a mátrixnak az i-edik
oszlop szerinti kifejtése, amely A-ból úgy adódik, hogy annak i-edik oszlopa helyére a jobboldalt
írjuk. A bevezetett jelölésekkel tehát azt kapjuk, hogy Dx j  D j ; j  1, 2,..., n. Éppen ezt kellett
igazolni. ■

Ez a módszer – az előzőhöz hasonlóan – csak nagyon korlátozott körben, az alábbi feltételek


teljesülése esetén alkalmazható:
1. Az egyenletrendszerben ugyanannyi az ismeretlenek száma, mint az egyenleteké.
2. Az együtthatómátrix reguláris, tehát D = detA ≠ 0.
Ezek a feltételek – mint korábban – biztosítják is a megoldhatóságot, és ekkor a megoldás
egyértelmű.

1.32.Példa: Oldjuk meg az alábbi lineáris egyenletrendszert Cramer-szabállyal.

 3x1  2 x2  x3  5

 2 x1  3x2  x3  1
2 x  x  3x  11
 1 2 3

Kiszámítjuk a szükséges determinánsokat. A bevezetett jelölésekkel

3 2 1 5 2 1 3 5 1 3 2 5
D  2 3 1  12; D1  1 3 1  24; D2  2 1 1  24; D  2 3 1  36;
2 1 3 11 1 3 2 11 3 2 1 11

Ahonnan az egyenletrendszer egyértelmű megoldása a következő.

D1 24 D 24 D 36
x1    2; x2  2   2; x3  3   3;
D 12 D 12 D 12

Helyettesítéssel ellenőrizhetjük a megoldás helyességét.

II.eset: Az egyenletrendszer megoldása az általános esetben, amikor az együtthatómátrix


nem kvadratikus

Ebben a pontban tehát választ adunk a legáltalánosabb kérdésre, nem korlátozzuk semmilyen
módon az egyenletek és ismeretlenek számát. Először általánosan az inhomogén egyenletrendszer
megoldásával foglalkozunk, majd külön kitérünk a homogén rendszer megoldására.

A) Az inhomogén egyenletrendszer megoldása

66
Óbudai Egyetem BGK Fejezetek a matematikából

Ehhez az egyenletrendszert olyan alakban írjuk fel, amely a jelen vizsgálatokhoz jobban
megfelel. Ha felidézzük vektornak számmal való szorzásáról, valamint vektorok összeadásáról
tanultakat akkor világos, hogy az Ax = blineáris egyenletrendszer a következő ekvivalens
alakban is írható

 a11   a12   a1k   b1 


a  a   a  b 
x1   21 
x   22 
 ...  xk   2 k    2  ;
 ...  2  ...   ...   ... 
       
 an1   an 2   ank  bn 

Ha most az együtthatómátrix oszlopvektoraira bevezetjük az alábbi jelöléseket:

 a11   a12   a1k 


a  a  a 
a1   21 
;a   22 
;........; a k   2 k  ;
 ...  2  ...   ... 
     
 an1   an 2   ank 

Akkor az egyenletrendszer ekvivalens alakja a következő

x1a1 + x2a2 + …xkak = b;

Az egyenletrendszer megoldhatóságának problémája ezzel a jelölésselátfogalmazható az alábbi


módon.

1. Létezik-e az együtthatómátrix a1, a2, …ak oszlopvektorainak olyan lineáris kombinációja,


amely előállítja a b vektort?
Tehát: Megoldható-e az egyenletrendszer?
2. Ha létezik, akkor csak egyértelműen állítható elő vagy többféle módon?
Tehát: Egyértelmű a megoldás vagy létezik több megoldás?

A megoldhatóság feltétele azonnal megfogalmazható a felírt egyenlőségből.

1.41.Tétel: Az Ax = b lineáris egyenletrendszer akkor és csak akkor oldható meg, ha a b vektor


kompatíbilis az együtthatómátrix oszlopvektor rendszerével, azaz ha létezik az
oszlopvektoroknak olyan lineáris kombinációja, amely előállítja a b vektort.
Bizonyítás: Az állítás a kompatibilitás definíciójából következik. ■

Ezt a tételt most átfogalmazzuk egy szokásosabb formára. Tegyük fel hogy az együtthatómátrix
rangja r, tehát ρ(A) = r. Ez azt jelenti, hogy az oszlopvektorok közül kiválasztható r db lineárisan
független vektor. Ha a jobboldal előállítható az oszlopvektorok lineáris kombinációjával, akkor
előállítható az r db lineárisan független vektor lineáris kombinációjával is. Ha ekkor az r db
oszlopvektorhoz hozzávesszük a b vektort, a kapott (r + 1) elemű vektorrendszer lineárisan
összefüggő lesz, tehát az r+ 1 elemű vektorrendszer rangja szintén r. Jelölje (A│b) azt a k + 1

67
Óbudai Egyetem BGK Fejezetek a matematikából

oszlopú mátrixot, amelyet úgy kapunk, hogy az A mátrixhoz utolsó oszlopként hozzávesszük a b
vektort. Ezt a mátrixot kibővített mátrixnak nevezzük. Igazoltuk a következő állítást.

1.42.Tétel: Az Ax = b lineáris egyenletrendszer akkor és csak akkor oldható meg, ha a kibővített


mátrix rangja egyenlő az együtthatómátrix rangjával, azaz ha ρ(A│b) = ρ(A). ■
Nyilvánvalóan általában ρ(A│b) ≥ ρ(A) teljesül, hiszen ha egy mátrixnak, oszlopok hozzá
vételével, tehát kibővítéssel több oszlopvektora lesz, az oszloprangja vagy nem változik, vagy
növekszik. Aρ(A│b) > ρ(A) esetben az egyenletrendszernek nincs megoldása, ekkor a
jobboldal b vektora nem kompatibilis a vektorrendszerrel.

Térjünk most rá a megoldás előállításának módjára. Megoldandó tehát az

 a11   a12   a1k   b1 


a  a   a  b 
x1   21 
 x2   22 
 ...xk   2 k    2  ;
 ...   ...   ...   ... 
       
 an1   an 2   ank  bn 

inhomogén lineáris egyenletrendszer. Az egyenletek száma n, az ismeretlenek száma k, és az


együtthatómátrix rangja legyen r. Nyilván teljesül, hogy r ≤ min{n, k}.
Az általánosság megszorítása nélkül feltehetjük, hogy az együtthatómátrix első roszlopvektora
lineárisan független, ezt oszlopcserékkel elérhetjük. Tegyük fel tehát, hogy ρ(A│b) = ρ(A)
teljesül, azaz a jobb oldal kompatibilis az oszlopvektorok rendszerével. Ekkor az a1, a2, …ar
oszlopvektorok segítségével mind az ar+1, …ak vektorok, mind a b vektor előállíthatók. Ha az
első r db oszlopvektorból képezett n×r méretű mátrixot A1 jelöli akkor az A mátrix nyilván
felírható az alábbi szorzat alakban

A = A1∙[Er │ D]

Ahol Er az r-ed rendű egységmátrix, a D pedig az ar+1, …ak vektorok előállításában szereplő
együtthatókat tartalmazza. Hasonló logikával,b is felírható az a1, a2, …ar oszlopvektorok
segítségével

d1a1 + d2a2 + …drar = b

alakban. Ha d vektor jelöli az iménti előállításban szereplő együtthatók vektorát, a b vektor


előállítható az alábbi szorzással

b = A1d

Most már az egyenletrendszer megoldása nagyon egyszerű. Az Ax = begyenletrendszer


egyenértékű az

A1[Er │ D]x = A1d

egyenletrendszerrel, amiből

68
Óbudai Egyetem BGK Fejezetek a matematikából

[Er │ D]x = d

következik. Bontsuk fel az x vektort két részre. Az első r komponens vektora legyen xr, a
maradék s = k – r komponens vektora pedig xs. Ezzel a jelöléssel az előző egyenlet az
Erxr+ Dxs = d

alakot ölti. Mivel Erxr = xr, ezért átrendezéssel adódik az inhomogén egyenletrendszer
megoldása, más szóval a megoldóképlet

xr = d – Dxs

Ez a képlet a következőt fejezi ki. Ha a mátrix r rangja kisebb, mint az ismeretlenek k száma
akkor s = k – r db ismeretlen szabadon választható, tehát ebben az esetben az
egyenletrendszernek végtelen sok megoldása van. Az s db ismeretlen, amely szabadon
választható a szabad ismeretlenek, a többi r db ismeretlen pedig a kötött ismeretlenek. Az s
egész számot az egyenletrendszer szabadságfokának nevezzük.Ha r = k, akkor s = 0, és ez azt
jelenti, hogy az egyenletrendszer megoldása egyértelmű.

A megoldás technikája a következő. Az egyenletrendszert legegyszerűbb elemi


bázistranszformációval megoldani. Az együtthatómátrix oszlopvektoraiból és a jobboldalból
készítünk egy induló transzformációs táblázatot, az oszlopvektorokat egyesével bevisszük a
bázisba, annyi transzformációs lépést végzünk, amennyit csak lehet, amíg tudunk újabb
oszlopvektort a bázisba vinni anélkül, hogy egy bázisban lévő oszlopvektor kilépjen a bázisból.
A kötött ismeretlenek azoknak az oszlopvektoroknak a szorzói, amelyeket bevittünk a bázisba. A
szabad ismeretlenek azoknak az oszlopvektoroknak a szorzói,amelyek nem léptek be a bázisba. A
D mátrix oszlopvektorai az az s db vektor, amelyek nem léptek be a bázisba.
Általános megoldásnak nevezzük az

xr = d – Dxs

alakot. Ha ebben az egyenletben a szabad ismeretleneknek értéket adunk és a kötött


ismeretleneket ezekből az egyenletekből kiszámítjuk, akkor kapjuk a partikuláris megoldást,
amelyből s>0 esetben végtelen sok van.

1.33.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert.

x + y + z + t = 10
x – y + 2z – t = 1
x + 3y + 3z =19
3x + y + 4z + t = 21

Írjuk az együtthatókat és a jobb oldalt egy mátrixba, és végezzünk elemi bázistranszformációt.

69
Óbudai Egyetem BGK Fejezetek a matematikából

B  x y z t b  y z t b  y t b  y b 
x  1 1    
    1 1 10   1 1 1 10   3 3 19   3 8
 z   1 1 2 1 1   2 1 2 9   2 2 9   2 9 
     
t  1 3 3 0 19   2 2 1 9   6 3 27   2 9 
   3 1 4 1 21  2 1 2 9   0 0 0   0 0 

Az egyenletrendszernek létezik megoldása. Az utolsó egyenlet 0 = 0 alakban adódott, ami azt


jelenti, hogy a 4. egyenlet következménye az első három egyenletnek, tehát elhagyható a
rendszerből. Az utolsó mátrixból leolvasható a redukált egyenletrendszer

x – 3y = –8;
z + 2y = 9;
t + 2y = 9;
yR tetszőleges.

Innen látható, hogy az egyenletrendszernek végtelen sok megoldása van, y a szabad ismeretlen
x, z, t pedig a kötött ismeretlenek. Ha a redukált egyenletrendszert átrendezzük a kötött
ismeretlenekre akkor kapjuk az általános megoldást

x = 3y – 8;
z = – 2y + 9;
t = – 2y + 9;
yR tetszőleges.

Az általános megoldást gyakran írjuk vektori alakban.

 x   3u  8   8 3
 y  u   0   
      u  1 ; uR
 z   2u  9  9   2
       
 t   2u  9  9   2

Áttekintve a megoldást, látható, hogy az ismeretlenek száma k = 4, az együtthatómátrix rangja


r = ρ(A) = 3, teljesül a ρ(A│b) = ρ(A) feltétel, azaz a jobboldal kompatibilis az
oszlopvektorokkal, tehát létezik megoldás, továbbá a szabadságfok s = k – r = 4 – 3 = 1. Valóban
egy ismeretlent választottunk szabadon. Ebből következik, hogy az egyenletrendszernek végtelen
sok megoldása van.

Adjunk meg egy partikuláris megoldást. Legyen most például y = 3. Ekkor kapjuk a
következőpartikuláris megoldást: x=1, y=3, z=3, t=3.

Könnyen azonosíthatjuk az előző általános gondolatmenetben szereplő vektorokat, mátrixokat is,


ezek a következők

xr = [x, z, t]T, d = [–8, 9, 9]T, D = [3, –2, –2]T, és xs = [y].

70
Óbudai Egyetem BGK Fejezetek a matematikából

1.34.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert.

 x1  x2  4 x4  3
 x  x  3x  1
 2 3 4

 x1  2 x2  3x3  5 x4  0
 3x1  x2  4 x3  5

Az elemi bázistranszformáció táblázata a következő.

 B   x1 x2 x3 x4 b   x2 x3 x4 b   x3 x4 b 
 x   1 1 0 4 3  1 0  
 1     4 3   1 1 2
 x2   0 1 1 3 1   1 1 3 1   1 3 1  ;
    
   1 2 3 5 0   3 3 9 3  0 0 0 
   3 1 4 0 5   4 4 12 4   0 0 0 

Teljesül a ρ(A│b) = ρ(A) feltétel, azaz a jobboldal kompatibilis az oszlopvektorokkal, tehát


létezik megoldás. Szemléletesen ez úgy látható, hogy a 3. és 4. egyenlet a 0 = 0 egyenletre
redukálódott, ami azt jelenti, hogy az utolsó két egyenlet az első két egyenlet következménye,
tehát a rendszerből elhagyható.Az eredetivel ekvivalens, legegyszerűbb alakú, tehát redukált
rendszer a táblázat utolsó egysége alapján a következő.

 x1  x3  x4  2

 x2  x3  3x4  1

Ami a megoldás megadása előtt kijelenthető. Az együtthatómátrix rangja 2, azaz két lineárisan
független oszlopvektora van, ezek például az a1 és a2 oszlopvektorok. Mivel az ismeretlenek
száma k = 4, és a rang ρ = 2, a rendszer szabadságfoka s = 4 – 2 = 2, tehát két ismeretlent
szabadon választhatunk. A fentiek szerint a szabad ismeretlenek ebben az esetben az x3 és x4
ismeretlenek, az x1 és x2 pedig a kötött ismeretlenek. Az általános megoldást akkor kapjuk, ha a
redukált rendszerből kifejezzük a kötött ismeretleneket a szabad ismeretlenekkel. Eszerint az
általános megoldás

 x1  2  x3  x4
 ; x3 , x4  R
 x2  1  x3  3 x4

Adjuk meg az általános megoldást vektori alakban is.

 2  u  v  2  1  1


1  u  3v  1  1  3
x      u    v   ; u, v  R
 u  0 1 0
       
 v  0 0 1

71
Óbudai Egyetem BGK Fejezetek a matematikából

Adjunk meg egy partikuláris megoldást is. Legyen például u = 2, v = –1. Ekkor

 2  1  1  1 
1   1   3  6 
xp     2       ;
0 1 0 2
       
0  0   1   1

Helyettesítéssel ellenőrizhető, hogy ez valóban kielégíti az egyenletrendszert.

1.35.Példa: Oldjuk meg elemi bázistranszformációval az alábbi egyenletrendszert.

 5 x1  x2  2 x3  x4  7

 2 x1  x2  4 x3  2 x4  1
 x  3x  6 x  5 x  0
 1 2 3 4

Az elemi bázistranszformáció táblázata a következő.

 B   x1 x2 x3 x4 b   x1 x3 x4 b   x1 x3 b 
 x   5 1 2 1 7   7
 4  6  1 8   7 6 8  ;
 x2   2 1 4 2 1   2 4 2 1   12 8 15
    
 e3   1 3 6 5 0   7 6 1 3   0 0 5 

Értékeljük a számítások eredményét. A táblázat utolsó egységéből látszik, hogy a jobboldal nem
kompatibilis az együtthatómátrix oszlop vektorterével, tehát az egyenletrendszernek nem
létezik megoldása. Szemléletesen azt látjuk, hogy a 3. egyenlet alakja 0 = –5, ami nyilván nem
igaz. Konkrétabban az együtthatómátrix rangja 2, azaz r = ρ(A) = 2, azonban, ha a mátroxot
kibővítjük a b vektorral, akkor a kibővített mátrix rangja 3, vagyis ρ(A│b) = 3, nem teljesül tehát
a ρ(A│b) = ρ(A) feltétel. Az A együtthatómátrix a2 és a4 oszlopvektora lineárisan független, az
a1 és a3 ezektől lineárisan függ, a kapcsolat a táblázat alapján az

a1  12a2  7a4 ; a3  8a2  6a4 ;

összefüggésekkel adható meg. Azonban a jobboldal előállításához szükség van a standard bázis
e3 egységvektorára is. A táblázat alapján

b  15a2  8a4  5e3 ;

72
Óbudai Egyetem BGK Fejezetek a matematikából

B) A homogén lineáris egyenletrendszer megoldása

Megoldandó az

 a11   a12   a1k   0 


a  a  a   0 
x1   21   x2   22   ...  xk   2 k    
 ...   ...   ...  ...
       
 an1   an 2   ank   0 

lineáris egyenletrendszer. Az előző pont minden megállapítása érvényes erre az esetre is, így
nincs más dolgunk, mint az általános eredményt megfogalmazni erre a speciális alakú
egyenletrendszerre.

Először is vegyük észre, hogy a homogén lineáris egyenletrendszernek mindig létezik


megoldása az együtthatóktól függetlenül. Ez másképpen azt jelenti, hogy az ρ(A│0) > ρ(A) eset
nem fordulhat elő.Látható, hogy x1 = x2 = … = xk = 0 megoldás. Ezt triviális megoldásnak
nevezzük.

1. Hak = r akkor a megoldás egyértelmű, ezért ebben az esetben az egyenletrendszer megoldása a


triviális megoldás.
2. Ha k>r akkor végtelen sok megoldás létezik, s = k – r db változó szabadon választható, és az
általános megoldás alakja a következő

xr = – Dxs

A triviálistól eltérő partikuláris megoldást úgy kaphatunk, hogy a szabad ismeretlenek közül
legalább egynek 0-tól különböző értéket adunk, és az általános megoldás egyenleteiből a kötött
ismeretleneket kiszámítjuk.

1.36.Példa: Oldjuk meg elemi bázistranszformációval az alábbi homogén lineáris


egyenletrendszert.

 3x1  4 x2  5 x3  7 x4  0
 2 x  3x  3x  2 x  0
 1 2 3 4

4 x1  11x2  13x3  16 x4  0
 7 x1  2 x2  x3  3x4  0

Az elemi bázistranszformáció táblázatában a jobboldali zérusokat nem szokás feltüntetni, hiszen


azok a transzformációk során nem változnak.

73
Óbudai Egyetem BGK Fejezetek a matematikából

 B   x1 x2 x3 x4   x2 x3 x4   x3 x4 
  3  
4 5 7  17 2 19 2  
10   0 0 
 
 x1   2 3 3 2   3 2 3 2 1  3 17 13 17  ;
    
 x2   4 11 13 16   17  19 20   19 17 20 17 
   7 2 1 3  17 2 19 2 10   0 0 

A számítások eredménye a következő. Az együtthatómátrix rangja ρ = 2, például az első két


oszlopvektora lineárisan független. Mivel az ismeretlenek száma k = 4, a szabadságfok
s = k – ρ = 2, tehát a rendszernek végtelen sok megoldása van, vagyis a rendszernek létezik
nemtriviális megoldása. Az 1. és 4. egyenlet (melyek 0 = 0 alakban adódtak) elhagyásával
adódó redukált rendszer az alábbi.

 3 13
 x1  x3  x4  0
 17 17
 ; x3 , x4  R
 x  19 x  20 x  0


2
17
3
17
4

A két szabad ismeretlen az x3 és x4, a kötött ismeretlenek pedig az x1 és x2. Megoldva a felírt
egyenleteket a kötött ismeretlenekre, kapjuk az általános megoldást.

 3 13
 x  x  x4
 1
17
3
17
 ; x3 , x4  R
19
x  x  20
x4


2
17
3
17

Ha a szokásosabb vektoros formában írjuk a megoldást, akkor a következő alak adódik.

3 13  3  13 
 17 u  17 v  17    17 
     
 19 20   19   20 
x   u  v   u    v    ; u, v  R
17 17 17 17
     
 u   1  0 
 v   0   1 

Egy nemtriviális partikuláris megoldást kapunk, ha a szabad ismeretleneknek értéket adunk.


Legyen például u = 17, v = 34. Ekkor

74
Óbudai Egyetem BGK Fejezetek a matematikából

3  13 
17    17   23
   
 19   20   21
x p  17     34     ; u, v  R
17 17   17 
     
1  0   34 
 0   1 

Behelyettesítéssel igazolható, hogy ez a rendezett 4-es valóban kielégíti a rendszert.

Az egyenletrendszerek elméletét felhasználhatjuk az mátrix inverzének előállítására. Az


ARn×n négyzetes mátrix inverzét az

AX = E

mátrixegyenlet XRn×nmegoldásaként definiáljuk. Írjuk fel ezt a mátrixegyenletet


koordinátákkal. Ekkor az adódik, hogy

 a11 a12 ... a1n   x11 x12 ... x1n   1 0 ... 0


a ... a2 n   x21 ... x2 n   0 0 
 21 a22 x22

1 ...
 ... ... ... ...   ... ... ... ...  ... ... ... ...
    
 an1 an 2 ... ann   xn1 x2 n ... xnn   0 0 .... 1

Ha az X mátrix i-edik oszlopát xi vektor jelöli, továbbá használjuk az i-edik egységvektorra a


szokásos ei jelölést, akkor ez a mátrixegyenlet voltaképpen egyenértékű n db inhomogén lineáris
egyenletrendszerrel:

Axi = ei; i = 1, 2, …n

Kérdés, hogy mi a megoldhatóság feltétele. Mivel minden n-re meg kell oldanunk Axi = ei
egyenletrendszert, minden ei-nek kompatibilisnek kell lenni az A mátrix oszlopvektor-
rendszerével. Mivel az ei (i = 1, 2, …n) vektorok lineárisan függetlenek és n db van belőlük,
pontosan akkor oldható meg mindegyik egyenletrendszer, ha az A mátrix rangja ρ(A) = n
(a szabadságfok s = n – r = 0), tehát a mátrix nemszinguláris (detA ≠ 0). Ugyanazt a feltételt
kaptuk tehát, mint korábban. Ekkor egyértelmű a megoldás, tehát pontosan egy inverzmátrix
létezik.

Ezt az n db lineáris egyenletrendszert egyszerre is megoldhatjuk elemi bázistranszformációval.


Az n db jobboldalt egymás mellé írva a transzformációs táblázatba, tulajdonképpen az
egységmátrixot írjuk az A mátrix mellé. Az A mátrix oszlopvektorait egymás után bevisszük a
bázisba. Mivel a ρ(A) = n az összes oszlopvektort be lehet, és be is kell vinnünk. Ha ezzel készen
vagyunk, sorcseréket alkalmazunk, hogy a bázisvektorok az indexek természetes növekvő
sorrendjében kövessék egymást, és már elő is állt az inverz mátrix.

75
Óbudai Egyetem BGK Fejezetek a matematikából

1.37.Példa: Határozzuk meg az alábbi A mátrix inverzét elemi bázistranszformációval.

1 2 1
A  1 1 5 ; A 1  ?
 2 3 1

   a1 a 2 a3  a1 a2 a3  a1 a 2 a3 
a   1 2  1 1 0 0   1 0 
 1    1 1 0 0  1 1 3 0 2 
2

 a3   1 1 5 0 1 0  0 1 4 1 1 0   0 0 5 1 1 1
    
a 2   2 3 1 0 0 1   0  1 1 2 0 1   0 1 1 2 0 1 
  a1 a 2 a3 
a   1 0 0 14 5 1 5 9 5 

 1
 a3   0 0 1 15 1 5 1 5 
  
a 2   0 1 0 9 5 1 5 4 5

Innen a 2. és 3. sor cseréjével megkapjuk a keresett inverz mátrixot.

 14 1 9 
   9 1 4  .
1 1 
A
5
 1 1 1

76
Óbudai Egyetem BGK Fejezetek a matematikából

1.10. Gauss elimináció, mátrixok LU-felbontása


Mind gyakorlati, mind elméleti jelentősége miatt kitérünk egy klasszikus módszer tárgyalására, a
Gauss-féle eliminációs eljárásra, amely numerikus szempontból és mátrixelméleti vonatkozásai
miatt nagyon fontos. A legtöbb számítógépes szoftver, amely lineáris egyenletrendszer
megoldására felhasználható, az alább ismertetett módszerrel oldja meg az egyenletrendszert, sőt
ha egy mátrix determinánsának kiszámítását kérjük, akkor is ezt a módszert alkalmazza a relatíve
kis számításigény miatt. Térjünk rá a módszer ismertetésére.

I. Reguláris együtthatómátrixú egyenletrendszerek megoldása.

Elsőként foglalkozzunk azzal az esettel, amikor az együtthatómátrix kvadratikus, és


oszlopvektorai lineárisan független rendszert alkotnak. Megoldandó az Ax = b lineáris rendszer,
ahol az A n-ed rendű mátrix, és a rendszer ugyancsak n db ismeretlent tartalmaz.

 a11 a12 ... a1n   x1   b1 


a a 
... a2 n   x2  b 
A   21 22 ; x  ; b   2 ;
 ... ... ... ...   ...   ... 
     
 an1 an 2 ... ann   xn  bn 

Az elemi bázistranszformációs táblázathoz hasonlóan olyan sémát alkalmazunk, amely


lényegében csak az együtthatókat tartalmazza, hiszen világos, hogy egy rendszer megoldása csak
ezektől függ. Induljunk el az

 a11 a12 a13 ... a1n b1 


 
 a21 a22 a23 ... a2 n b2 
 A b    a31 a32 a33 ... a3n b3  ;

 ... ... ... ... ... ... 
a an3 ... ann bn 
 n1 an 2

kibővített mátrixból. Az oszlopvektorok felett az ismeretlenek jelét nem tüntettük fel, világos,
hogy ezek rendre x1, x2, …, xn. Ezek feltüntetésére csak akkor van szükség, ha úgy adódik, hogy
oszlopcserére van szükség. Mivel azonban ez könnyen hibához vezethet, ha elfelejtjük az
ismeretleneket átrendezni, nem javasoljuk. Sorcserére azonban bármikor sor kerülhet, hiszen
ez csak annyit jelent, hogy megváltoztatjuk a rendszer egyenleteinek a sorrendjét, ami
nyilvánvalóan nem változtatja meg a megoldást. Induljunk ki a mátrix főátlójának első eleméből,
az a11 együtthatóból, ennek az elemnek a neve pivot elem. Tegyük fel, hogy ez nem zérus, ha
igen akkor sorcserével elérhetjük, hogy a bal felső sarokban nem nulla együttható álljon. Ezt az
együtthatót, és vele együtt az első sort, tehát az első egyenletet megtartjuk változatlan
formában, esetleg megszorozhatjuk egy nullától különböző számmal ha szükség van rá, és ennek
az egyenletnek, tehát az első lépésben az első sornak a többszöröseit levonjuk az összes többi
egyenletből, úgy hogy az első oszlopban minden együttható nullává váljon. Ez lényegében az
elimináció vagy más szóval kiküszöbölés. Ez ebben a lépésben annyit jelent, hogy az első

77
Óbudai Egyetem BGK Fejezetek a matematikából

egyenletben megtartjuk az x1 ismeretlent és az összes többi egyenletből kiküszöböljük azt. Az


eredmény tehát a következő.

 a11 a12 a13 ... a1n b1 


 1 1 
... a2 n b2  
1 1
 0 a22 a23
 1 1 1 
... a3 n b3   ;
1
 0 a32 a33
 ... ... ... ... ... ... 
 
 0 an12 1 1 1 
an3 ... ann bn 

Az alkalmazott jelölésben az (1) felső index azt jelenti, hogy az első lépésben kapott eredményt
adtuk meg. Az első sorban nem alkalmaztunk jelölésmódosítást, hiszen az első egyenletet
megtartottuk változatlanul. Kérdés, hogy hogyan juthatunk el ehhez a táblázathoz. Az ai1
a
(i = 2, 3, …, n)együtthatóból úgy lesz zérus, ha első egyenlet hi1  i1 -szeresét kivonjuk az
a11
i-edik (i = 2, 3, …, n) egyenletből. Ennek következménye az, hogy az együtthatók és
természetesen a jobb oldal is, az első lépés után a következőképpen alakulnak.

aij   aij  a1 j  aij  hi1a1 j ; bi   bi  hi1b1; i  2,3,..., n; j  1, 2,..., n;


1 ai1 1
a11

Folytassuk az eljárást. Lépjünk át a főátló következő elemére. Ha ez zérus, akkor sorcserével


elérhetjük, hogy a 2.sor 2. komponense nem zérus. Ha a mátrix oszlopvektorai lineárisan
 1
függetlenek, azaz rangja n, akkor ez mindig elérhető. Jelölje tehát a főátló második elemét a22 ,a
második lépében ez az elem a pivot. Most azt fogjuk tenni, hogy a pivot alatt levő, tehát csak a
2-nél nagyobb indexű sorokból, tehát egyenletekből kiküszöböljük vagyis elimináljuk az x2
ismeretlent. Az eredmény a következő.

 a11 a12 a13 ... a1n b1 


 1  
a2 n b2  
1 1 1
 0 a22 a23 ...
   2 
a3 n b3   ;
2 2
0 0 a33 ...
 ... ... ... ... ... ... 
 
0 an 3 ...  2  2 
2
 0 ann bn 

Mint látható, ebben a lépésben sem az első sem a második sorban nem történt változás. A felső
(2) index arra utal, hogy az eliminációs algoritmus második lépésében kapott eredményeket
tartalmazza a mátrix. Hogyan érhető el ez az eredmény. Úgy, hogy képezzük a második egyenlet
ai2
1
hi 2  1 -szeresét (i = 3, 4, …, n) és ezt kivonjuk az i-edik (i = 3, 4, …, n) egyenletből.
a22
Összefoglalva, a transzformáció a következő.

78
Óbudai Egyetem BGK Fejezetek a matematikából

1
aij   aij   i21 a2 j  aij   h2i a2 j ; bi   bi   hi 2b2  ; i  3, 4,..., n; j  2,3,..., n;
2 1 a 1 1 1 2 1 1

a22

  2
Hasonlóan folytatjuk az eljárást. A következő pivot az a33 , ha ez nulla, akkor sorcserével
  2
elérjük, hogy a főátló harmadik eleme zérustól különbözzön és azt tekintjük a33 -nak. Ezzel a
pivottal elérjük, hogy az x3 ismeretlen ne szerepeljen a 3-nál nagyobb indexű sorokban, tehát
elimináljuk az x3 ismeretlent a pivot alatti sorokból. És így tovább folytatjuk az eljárást addig,
amíg a főátló alatt minden együttható zérus nem lesz. Az eleimináció az n-edik lépés után tehát a
következő eredményt adja.

 a11 a12 a13 ... a1n b1 


 1  
a2 n b2  
1 1 1
 0 a22 a23 ...
   2 
a3 n b3   ;
2 2
0 0 a33 ...
 ... ... ... ... ... ... 
 
0 n n 
 0 0 ... ann bn 

Ezzel az eliminációs fázis végére is értünk. Ha az együtthatómátrix rangja n, akkor mindig


elérhető egy olyan állapot, amikor az elimináció eredménye egy olyan felső háromszögmátrix,
amelyben tehát a főátló alatt minden elem zérus, a főátlóban pedig éppen a pivotok állnak.
Ezután következik a visszahelyettesítési fázis. Ez abból a felismerésből adódik, hogy az utolsó
egyenlet csak egy ismeretlent tartalmaz, az xn ismeretlent. Ezt azonnal ki is számíthatjuk.

b 
n
n
xn  bn  ; ahonnan xn  n n  ;
n
ann
ann

Ennek az osztásnak mindig van értelme, hiszen a pivot nulla nem lehet. Ha az xn ismeretlent
megkaptuk, akkor felfelé haladva a kapott háromszögmátrixban, az utolsó előtti egyenletből
megkapjuk az xn–1 ismeretlent.

bn 1  an 1,n


n 1 n 1
 n1  n1  n1
an1,n1 xn1  an1,n xn  bn1 ; ahonnan xn1   n1   n1 xn ;
an1,n1 an1,n1

Folytatva az eljárást, megkaphatjuk az összes ismeretlent. Illusztráljuk a mondottakat példákkal.

79
Óbudai Egyetem BGK Fejezetek a matematikából

1.38.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-eliminációval.

1 1 2   x1   1
 2 1 2   x    4  ;
  2  
 4 1 4   x3   2 

A szokásos jelöléseket alkalmazva, a következőt írhatjuk.

1 1 2 1 1 1 2 1 1 1 2 1


     
 2 1 2 4  ~ 0  3 2 2  ~ 0 3 2 2  ;
 4 1 4 2  0 3 4 2  0 0  2 4 
Az eliminációt elvégeztük, megkaptuk a felső háromszögmátrixot. Sorcserére nem volt szükség,
mert a főátló aktuális eleme minden lépésben zérustól különbözött. A műveletek a következők
voltak. A pivotokat minden lépésben szögletes zárójelbe tettük. Az első lépésben, amikor a pivot
1, a második illetve harmadik egyenletből kivontuk az első egyenlet rendre kétszeresét illetve
négyszeresét. A következő lépésben, amikor a pivot –3, a harmadik egyenletből kivontuk a
második egyenlet 1-szeresét. Ezután következhet a visszahelyettesítési fázis. A harmadik
egyenletből indulunk, majd a második egyenletet használjuk fel, végül az elsőt.

2 x3  4;  x3  2;
3x2  2 x3  2; azaz  3x2  4  2;  x2  2;
x1  x2  2 x3  1; azaz x1  2  4  1;  x1 =1;

Megkaptuk tehát a rendszer megoldását.

1.39.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-eliminációval.

1 1 2 3   x1   1 
 3 1 1 2   x   4 
   2   ;
 2 3 1 1  x3   6 
    
1 2 3 1  x4   4 

A megoldás a következő.

1 1 2 3 1  1 1 2 3 1 1 1 2 3 1
     
 3 1 1 2 4 ~ 0 4 7 11 7  2. és 4. sorcsere 0 1 1 4 5  ~
 2 3 1 1 6 0 1 5 7 8  0 1 5 7 8 
     
 1 2 3 1 4 0 1 1 4 5  0 4 7 11 7 

80
Óbudai Egyetem BGK Fejezetek a matematikából

1 1 2 3 1  1 1 2 3 1 
   4 
0 1 1 4 5  0 1 1 5 
~ ~ ;
0 0  6 3 3  0 0 6 3 3 
   
0 0 3 27 27  0 0 0  25,5 25,5
Az eliminációs fázis véget ért, megkaptuk a felső háromszög mátrixot. A műveletek a következők
voltak. Az első lépésben, az első egyenlet 3-szorosát, 2-szeresét és 1-szeresét rendre levontuk a
2., 3. és 4. sorokból. Ezután alkalmaztunk egy sorcserét, mert a –4 bár elvileg tökéletes, de kézi
számításokhoz nem volt ideális pivot elem, egyszerűbb egyessel számolni. Ezután, a második
lépésben az második egyenlet 1-szeresét és –4-szeresét kivontuk rendre a 3. és 4. egyenletből.
Majd végül a 3. egyenlet 0,5-szeresét kivontuk a 4. egyenletből.
Következhet a visszahelyettesítési fázis. Ismét az utolsó, tehát most a 4. egyenlettel kezdünk,
fokozatosan haladunk felfelé és az 1. egyenletbe helyettesítünk utolsóként.

51 51
 x4   ;  x4  1;
2 2
6 x3  3x4  3; azaz  6 x3  3  3;  x3  0;
x2  x3  4 x4  5; azaz x2  4  5;  x2  1;
x1  x2  2 x3  3x4  1; azaz x1  1  3  1;  x1  1;

Megkaptuk tehát a rendszer megoldását.

A Gauss elimináció módosított változata a Gauss-Jordan algoritmus. Ez a következőkben


különbözik a klasszikus eliminációtól.

1. Minden lépésben a pivot elemek sorait elosztjuk a pivot elemmel, így a főátlóban egyesek
lesznek.
2. Nem csak a pivot alatti, hanem a pivot fölött levő egyenletekből is kiküszöböljük az
ismeretleneket.
3. Az 1. és 2. lépés következtében nincs szükség visszahelyettesítési fázisra. Mivel az elimináció
eredménye abban az esetben, amikor a mátrix rangja megegyezik az ismeretlenek számával, egy
egységmátrix, így a megoldás azonnal leolvasható, ugyanis a kapott jobboldal komponensei
pontosan a megoldások.

1.40.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-Jordan algoritmussal.

1 3 5 7   x1  12 
3
 5 7 1   x2   0 
 ;
5 7 1 3   x3   4 
    
7 1 3 5   x4  16 

A megoldás a következő.

81
Óbudai Egyetem BGK Fejezetek a matematikából

1 3 5 7 12 1 3 5 7 12  1 3 5 7 12  1 0 1 8 15


       
3 5 7 1 0  0 4 8 20 36  0
~ ~
1 2 5 9  0 1 2
~
5 9 
~
5 7 1 3 4  0 8 24 32 56  0 1 3 4 7  0 0 1 1 2 
       
 7 1 3 5 16 0 20 32 44 68 0 5 8 1117  0 0 2 14 28 
1 0 0 9 17  1 0 0 9 17  1 0 0 0 1  x1   1 
   0 7 13  0   x   1
0 1 0 7 13  0 1 1 0 0 1
~ ~ ~ ; azaz  2     ;
0 0 1 1 2  0 0 1 1 2  0 0 1 0 0  x3   0 
         
0 0 0 16 32  0 0 0 1 2  0 0 0 1 2   x4   2 

A megoldást ezzel megkaptuk. A műveletek a következők voltak. Az első lépésben az 1. egyenlet


3-szorosát, 5-szörösét és 7-szeresét kivontuk rendre a 2., 3. és 4. egyenletből. Ezután a 2., 3. és 4.
egyenletet rendre elosztottuk –4-gyel, –8-cal és –4-gyel. A második lépésben a második egyenlet
3-szorosát, 1-szeresét és 5-szörösét rendre kivontuk az 1., 3. és 4. egyenletekből. A harmadik
lépésben a 3. egyenlet –1-szeresét, 2-szeresét és –2-szeresét rendre kivontuk az 1., 2. és 4.
egyenletekből. Ezután a 4. egyenletet osztottuk –16-tal, majd pedig a 4. egyenlet –9szeresét,
7-szeresét és –1-szeresét rendre kivontuk az 1., 2. és 3. egyenletekből. A pivotokat minden
lépésben megjelöltük.

II. Gauss-elimináció alkalmazása abban az esetben, amikor az együtthatómátrix


kvadratikus de szinguláris, illetve amikor az együtthatómátrix nem kvadratikus.

A címben említett két eset elvileg lényegében nem tér el egymástól, a lényeg abban áll, hogy a
mátrix rangja kisebb, mint az ismeretlenek száma. Ezekre az esetekre alkalmazható a klasszikus
Gauss-elimináció de használható a Gauss-Jordan eljárás is. A Gauss-elimináció alkalmazása
esetén az eliminációs fázis végeredménye általában az alábbi mátrix.

 a11 a12 a13 ... a1k ... a1n b1 


 1  
a2 k a2 n b2  
1 1 1 1
 0 a22 a23 ... ...
   2 
a3 k  a3 n b3  
2 2 2
0 0 a33 ... ...
 ... ... ... ... ... ... ... ... 
 
0  k 1  k 1  k 1 
0 0 ... akk ... akn bk
 
0 0 0 ... 0 ... 0 0 
 ... ... ... ... ... ... ... ... 
 
 0 0 0 ... 0 0 0 0 

A lényeges különbség, hogy bár n db ismeretlen van, csak k db pivotelemet tudunk választani,
mindegy, hogy eredetileg hány egyenlet volt a rendszerben, az első k db marad meg – ezt persze
megelőzhetik sorcserék, az utána következő egyenletek mind eltűnnek, következményei az első k
db egyenletnek. Úgy is fogalmazhatunk, hogy a mátrix első k db sora lineárisan független, az
utána következő sorok az első k db sortól viszont lineárisan függenek. Az együtthatómátrix fenti

82
Óbudai Egyetem BGK Fejezetek a matematikából

alakját sorredukált alaknak nevezzük. Ebben az esetben a rendszernek végtelen sok


megoldása van, k db kötött ismeretlen van, amelyek célszerűen a pivotok oszlopaihoz tartozó
ismeretlenek, a többi pedig a szabad ismeretlen. Lássunk példákat a mondottakra.

1.41.Példa: Oldjuk meg az alábbi homogén lineáris egyenletrendszert Gauss-eliminációval.

 3x1  2 x2  5 x3  4 x4  0;

 3x1  x2  3x3  3x4  0;
3x  5 x  13x  11x  0;
 1 2 3 4

A szokásos jelölésekkel kapjuk, a mátrix sorredukált alakját.

3 2 5 4  3 2 5 4  3 2 5 4 
  
 3 1 3 3 ~ 0  3 8 7  ~ 0 3 8 7  ;
 3 5 13 11  0 3 8 7  0 0 0 0 

A rendszerben 4 ismeretlen van, de csak két pivot választására volt lehetőségünk. Ez azt jelenti,
hogy a mátrix rangja ρ = 2, és így a szabadságfok is s = 4 – 2 = 2.Mivel van szabad ismeretlen, az
x3 és x4, az egyenletrendszernek végtelen sok megoldása van, tehát van nemtriviális megoldás is.
A kötött ismeretlenek az x1 és x2 ismeretlenek, mivel a pivotok az 1. és 2. oszlopból lettek
kiválasztva. Ismét alulról felfelé haladva, kapjuk a rendszer általános megoldását. A különbség,
hogy a visszahelyettesítéses fázisban nem csak konstansokat helyettesítünk, hanem olyan
kifejezéseket, amelyek függenek a szabad változóktól.

8 7
3x2  8 x3  7 x4  0;  x2  x3  x4 ;
3 3
8 7  1 2
3x1  2 x2  5 x3  4 x4  0; azaz 3x1  2  x3  x4   5 x3  4 x4  0;  x1   x3  x4 ; x3 , x4  R
3 3  9 9

Ezzel megkaptuk a rendszer általános megoldását. Ha a szabad ismeretlenek legalább egyikének


0-tól különböző értéket adunk, kapunk egy nemtriviális megoldást. Legyen például x3 = 9 és
x4 = 0. Ekkor a nemtriviális megoldás, helyettesítéssel adódik: x1 = –1, x2 = 24, x3 = 9
x4 = 0.

1.42.Példa: Oldjuk meg az alábbi lineáris rendszert Gauss-Jordan algoritmussal.

1 2 3 4   x1   4 
0 1 1 1   x   3
   2   ;
1 3 0 3  x3   1 
    
0 7 3 1   x4   3

A megoldás a következő.

83
Óbudai Egyetem BGK Fejezetek a matematikából

1 2 3 4 4  1 2 3 4 4  1 0 12 2 
     
 0 1 1 1 3 ~ 0 1 1 1 3 ~ 0 1 1 1 3 
~
 1 3 0 3 1  0 5 3 1 3 0 0 2 4 12 
     
 0 7 3 1 3 0 7 3 1 3 0 0 4 8 24 
1 0 12 2  1 0 0 0 8
   
0 1 1 1 3  0 1 0 1 3 
~ ~ ;
0 0 1 2 6  0 0 1 2 6 
   
0 0 4 8 24  0 0 0 0 0 

A rendszer négy ismeretlent tartalmaz, de csak három pivotot tudtunk választani, ami azt jelenti,
hogy a mátrix rangja ρ = 3. Ebből következően a szabadságfok s = 4 – 3 = 1. Egy szabad
ismeretlen van, ami célszerűen az x4, az első három oszlophoz tartozó ismeretlenek, tehát az x1, x2
és x3 a kötött ismeretlenek, mivel ezekből az oszlopokból választottuk a pivotokat.
A kapott sorredukált alakból felírható az általános megoldás.

x1  8;  x1  8;
x2  x4  3;  x2  3  x4 ; x4  R
x3  2 x4  6;  x3  6  2 x4 ;

Ha a szabad ismeretlent rögzítjük kapunk egy partikuláris megoldást. Legyen például x4 = 2,


ekkor a partikuláris megoldás x1 = –8, x2 = 5, x3 = 10, x4 = 0.

III. Reguláris mátrixok LU-felbontása

A továbbiakban a Gauss-elimináció módszerét alkalmazva, csak egy kvadratikus, sőt reguláris


mátrixra koncentrálva, előállítjuk a mátrix olyan szorzat alakját, amelyben az első tényező egy
aló-, a második tényező pedig egy felső háromszögmátrix. Ez mind az elmélet, mind a numerikus
matematika szempontjából alapvető fontosságú faktorizáció.

Mielőtt általánosan felírnánk a kérdéses alakot, egy konkrét példát vizsgáljunk meg.
Alkalmazzuk a Gauss-elimináció algoritmusát az

 1 2 3
A   2 5 2  ;
 3 1 2 

A fentiekben részletesen bemutatott módszert alkalmazva több elemi lépésre bontva, megkapjuk
a sorredukált alakot, amely reguláris esetben felső háromszögmátrix.

84
Óbudai Egyetem BGK Fejezetek a matematikából

1 2 3  1 2 3  1 2 3  1 2 3 
      
 2 5 2  ~  0 1 4  ~ 0 1 4  ~ 0 1 4  ;
 3 1 2   3 1 2  0 7 11  0 0 39
A számítás során a pivotokat megjelöltük, a főátló utolsó elemét is pivotnak tekintve.

Ebben a pontban újdonságként kerül elő, hogy az eliminációs lépések mátrixszorzással is


elvégezhetők. Megmutatjuk, hogy az imént részletezett három transzformációs lépés egyenértékű
három egymást követő mátrixszorzással, természetesen megfelelő sorrendben. Ennek
megértéséhez csak annyit kell felidézni a mátrixok szorzásával kapcsolatban, hogy ha egy
sorvektorral balról szorzunk egy mátrixot, akkor eredményként a mátrix sorainak lineáris
kombinációját kapjuk. Ezt a gondolatot felhasználva kapjuk az eliminációs lépéseknek megfelelő
mátrixokat.
Például, az első lépésben azt tettük, hogy az első egyenlet 2-szeresét levontuk a második
egyenletből. Azt állítjuk, hogy ez egyenértékű az alábbi L21-jelű, elemi transzformációs
mátrixszal történő szorzással.

 1 0 0
L 21   2 1 0  ;
 0 0 1 

Ellenőrizzük, hogy a fenti sorban a második mátrixot kapjuk. Valóban igaz

 1 0 0  1 2 3  1 2 3 
L 21A   2 1 0  2 5 2    0 1 4  ;
 0 0 1   3 1 2   3 1 2 

Ugyanis könnyen látható, hogy ha a 2.sorvektornak és az A mátrixnak a szorzatát képezzük,


akkor valóban az eliminációnak megfelelő műveletet kapjuk, azaz –2-szer az 1. sornak és a
második sornak az összegét. Vegyük észre hogy ez az L21 elemi transzformációs mátrix
invertálható, hiszen alsó háromszögmátrix lévén, determinánsa a főátlóbeli elemek szorzata, azaz
1. Inverzét pedig könnyen előállíthatjuk. Nem szükséges az adjungált mátrix, egyszerűen abból
kell kiindulni, hogy milyen transzformációt végez az L21 mátrix. Ezt a műveletet kell fordítva
elvégezni. Eszerint az L21 mátrix inverze nem lehet más, mint az

1 0 0 
L211   2 1 0  ;
 0 0 1 

Erről könnyen meggyőződhetünk, ha összeszorozzuk a két mátrixot. A szorzat

85
Óbudai Egyetem BGK Fejezetek a matematikából

 1 0 0   1 0 0  1 0 0 
L 21L211   2 1 0   2 1 0   0 1 0  ;
 0 0 1  0 0 1  0 0 1 

valóban az egységmátrix. Ebből a példából már kitalálhatjuk, hogy az A mátrix eliminációjának


sorában a következő két transzformáció az alábbi elemi transzformációs mátrixokkal történő
szorzással érhető el.

1 0 0  1 0 0 
L31  0 1 0 ; L32  0 1 0  ;
 

 3 0 1  0 7 1 

A szorzás sorrendje pedig nyilvánvalóan a következő.

L32L31L21A  U;

Ahol U jelöli az elimináció eredményét, a felső (upper) háromszög mátrixot. Konkrétan a


következőt írhatjuk

1 0 0  1 0 0   1 0 0   1 2 3  1 2 3 
0 1 0 0 1 0  2 1 0  2 5 2  0 1 4  ;
      
0 7 1  3 0 1   0 0 1   3 1 2  0 0 39 

Mielőtt tovább lépünk, vegyük észre, hogy ha például az L31 és L21 mátrixokat ebben a
sorrendben szorozzuk, akkor azt kapjuk, hogy

1 0 0   1 0 0   1 0 0 
L1  L31L 21  0 1 0  2 1 0   2 1 0 ;
3 0 1   0 0 1   3 0 1 

Ebben a szorzatban benne vannak az elimináció során alkalmazott szorzók, a szorzás során nem
jelent meg sehol egyetlen további komponens sem. Ez azt jelenti, hogy ezzel a szorzatmátrixszal
leírható az egész első oszlopot érintő eliminációs lépéssorozat. Ennek a mátrixnak az inverzét
ismét úgy kapjuk, hogy minden műveletet fordítva hajtunk végre, tehát minden főátló alatti
komponens előjelét megváltoztatjuk. Valóban igaz, hogy

 1 0 0   1 0 0  1 0 0 
L1L11   2 1 0   2 1 0  0 1 0 ;
 3 0 1   3 0 1  0 0 1 

86
Óbudai Egyetem BGK Fejezetek a matematikából

Térjünk rá ezután az LU-felbontásra. Induljunk ki az L32L31L21A  U egyenlőségből, majd


szorozzuk meg ezt balról rendre az L32, L31 és L21 mátrixok inverzével. A következőt kapjuk.

A  L211 L311 L321 U;

Végezzük el a jobboldali első három tényező szorzását.

 1 0 0   1 0 0  1 0 0   1 0 0 
L L211 L311 L321   2 1 0  0 1 0 0 1 0   2 1 0 ;
0 0 1   3 0 1  0 7 1   3 7 1 

A kapott mátrix egy alsó háromszögmátrix, amelynek főátlójában egyesek vannak, és


amelyben a főátló alatti komponensek éppen a Gauss-eliminációnál alkalmazott
hányadosok, pozícióhelyesen. Kapjuk tehát az A mátrix szorzat alakú előállítását, más szóval
faktorizációját.

A  LU;

A fenti konkrét példában ez a felbontás a következő.

 1 2 3   1 0 0  1 2 3 
 2 5 2   2 1 0 0 1 4  ;
    
 3 1 2  3 7 1  0 0 39 

Ismét hangsúlyozzuk a következőket, az LU-felbontás lényegét.

A kvadratikus és reguláris A mátrixot felbonthatjuk egy alsó L (lower), és egy felső U (upper)
háromszögmátrix szorzatára, ahol az alsó háromszögmátrix főátlójában egyesek állnak, azi-edik
sor j-edik eleme i>j esetén éppen a gauss eliminációnál alkalmazott hányados ellentettje, a főátló
felett minden komponens zérus. A felső háromszögmátrix pedig egy olyan mátrix melynek a
főátlójában éppen a pivot elemek állnak, a főátló alatt pedig minden komponens zérus.

1.43.Példa: Végezzük el az

1 1 2 
A   2 1 2  ;
 4 1 4 

mátrix LU felbontását.
Ezzel az együtthatómátrixszal, az 1.38. példában már megoldottunk korábban egy lineáris
egyenletrendszert a Gauss-elimináció alkalmazása során. A példában az eliminációs lépéseknek
megfelelő elemi transzformációs mátrixok a következők voltak.

87
Óbudai Egyetem BGK Fejezetek a matematikából

 1 0 0  1 0 0 1 0 0 
L 21   2 1 0 ; L31   0 1 0  ; L32  0 1 0  ;
   
 0 0 1   4 0 1  0 1 1 

Ebből következik, hogy a felbontásban szereplő alsó háromszögmátrix a következő.

1 0 0 
L   2 1 0  ;
 4 1 1 

Felidézve a mátrix sorredukált alakját, kapjuk az LU-felbontást.

 1 0 0  1 1 2   1 1 2 
LU  A; azaz  2 1 0  0 3 2    2 1 2  ;
 4 1 1  0 0 2  4 1 4

1.44.Példa: Végezzük el az

1 1 2 3 
 3 1 1 2 
A ;
 2 3 1 1
 
1 2 3 1

mátrix LU-felbontását. Ezzel az együtthatómátrixszal már ugyancsak megoldottunk egy


egyenletrendszert a Gauss-elimináció alkalmazása során. De egy apróságra oda kell figyelnünk,
ha a korábbi eredményeinket szeretnénk használni. Végrehajtottunk ugyanis egy sorcserét. Tehát
ha a megoldásban szereplő sorredukált alakot, azaz felső háromszögmátrixot szeretnénk
használni, az A mátrix faktorizációjához, akkor a sorcserét figyelembe kell venni. A korábbiak
szerint tudjuk, hogy a sorcserét egy permutáló mátrixszal való szorzással lehet figyelembe venni.
Mivel a 2. és a 4. sort cseréltük fel, ezért nyilvánvalóan a

1 0 0 0
0 0 0 1 
P ;
0 0 1 0
 
0 1 0 0

permutációs mátrixszal kell először megszorozni az A mátrixot. Az idézett példa alapján


voltaképpen a PA mátrixot tudjuk faktorizálni PA =LU alakban. Először előállítjuk a PA
mátrixot.

88
Óbudai Egyetem BGK Fejezetek a matematikából

1 0 0 0  1 1 2 3  1 1 2 3 
0 0 0 1   3 1 1 2  1 2 3 1
PA    ;
0 0 1 0   2 3 1 1  2 3 1 1
    
0 1 0 0  1 2 3 1  3 1 1 2 

Hajtsuk végre az eliminációt a PA mátrixon.

1 1 2 3  1 1 2 3  1 1 2 3  1 1 2 3 
      4 
 1 2 3 1 ~ 0 1 1 4  ~ 0 1 1 4  0 1 1
~ ;
 2 3 1 1 0 1 5 7  0 0  6 3  0 0 6 3 
 
    
 3 1 1 2  0 4 7 11 0 0 3 27  0 0 0  25,5
Ha most figyelembe vesszük a sorcseréket az eliminációs lépéseknél alkalmazott hányadosok
meghatározásánál, akkor kapjuk a PA mátrix LU-felbontását.

1 0 0 0  1 1 2 3  1 1 2 3 
1 1 0 0  0 1 1 4  1 2 3 1
LU  PA; azaz   ;
2 1 1 0  0 0 6 3   2 3 1 1
    
 3 4 0,5 1  0 0 0 25,5  3 1 1 2 

ha figyelembe vesszük, hogy a P permutációs mátrix ortogonális, akkor azonnal tudjuk, hogy
inverze a transzponáltja. Így kapjuk az A mátrix előállítását

A  PTLU

alakban. Mivel természetesen PT is egy permutációs mátrix, természetesen írhatjuk a fenti


előállítást A  PLU alakban is, csak arra kell tekintettel lennünk, hogy nyilván ez a P egy másik
permutációs mátrix. Ebben a példában önkényesen írtunk elő egy sorcserét, elvileg nem volt rá
szükség, csak kényelmi szempontok miatt történt a sorcsere. Az eredeti A mátrix is faktorizálható
lenne LU alakban, de az L és U mátrixok nyilván különböznének attól, amelyet itt állítottunk elő.

Azonban vannak esetek, amikor elkerülhetetlen a sorcsere, mert a pivot elem helyén nulla áll, ami
nem lehetséges. Ilyenkor sorcserével tudjuk csak folyatatni az eliminációt. Lássunk egy ilyen
példát.

1.45.Példa: Végezzük el az

2 4 5 
A   4 8 12  ;
 6 13 18

89
Óbudai Egyetem BGK Fejezetek a matematikából

mátrix LU felbontását. Először is hozzuk az A mátrixot felső háromszög alakra.

 2 4 5   2 4 5   2 4 5
     
 4 8 12  ~ 0 0 2  2. és 3. sorcseréje 0 1 3 ;
 6 13 18 0 1 3   0 0  2
Mint látható, ebben az esetben elkerülhetetlen a jelzett sorcsere, mert az első lépés után a főátló
második eleme zérus, ami nem lehet pivot, ezért kellett sort cserélni. Ezen csere után már meg is
kaptuk a felső háromszögmátrixot. Ekkor szükségképpen alkalmazni kell tehát A soraira egy
permutációt, amelynek mátrixa

1 0 0 
P  0 0 1  ;
0 1 0 

Előállítjuk elsőként a PA mátrixot.

1 0 0   2 4 5   2 4 5 
PA  0 0 1   4 8 12  6 13 18 ;
0 1 0  6 13 18  4 8 12

Ezután jöhet a felső háromszögmátrix alakra történő transzformálás.

2 4 5  2 4 5
6 13 18 ~ 0 1 3  ;
   
 4 8 12  0 0 2 

Figyelembe véve az alkalmazott szorzótényezőket, a PA mátrix LU-felbontása a következő.

1 0 0   2 4 5   2 4 5 
 3 1 0  0 1 3   6 13 18 ;
    
 2 0 1  0 0 2   4 8 12 

Innen az A mátrix faktorizált alakja az alábbi.

1 0 0   1 0 0   2 4 5   2 4 5 
P LU  A;azaz 0 0 1   3 1 0 0 1 3  6 13 18 ;
T

0 1 0  2 0 1  0 0 2  4 8 12

90
Óbudai Egyetem BGK Fejezetek a matematikából

Ebben az esetben azonban az A nem bontható fel közvetlenül LU alakra, csak a sorcserékkel
kapott PAmátrix.

Általánosan is felírhatjuk az LU-felbontás képletét. Ha a reguláris n-ed rendű A mátrixot


felbontjuk egy alsó és egy felső háromszögmátirx szorzatára, akkor – az esetleges sorcserék
figyelembe vételével –, a szorzat alak a következő.

 a11 a12 a13 ... a1n   1 0 0 ... 0   a11 a12 a13 ... a1n 
 1 1 1 
a   0   0 a22 a23 ... a2 n 
 21 a22 a23 ... a2 n   h21 1 0 ...
   2 
PA  P  a31 a32 a3n    h31 h32 0  0 a3 n   LU;
2
a33 ... 1 ... 0 a33 ...
   
 ... ... ... ... ...   ... ... ... ... ... ... ... ... ... ... 
 an1 an 2  
an3 ... ann   hn1 hn 2 hn3 ... 1   0 n 
 0 0 ... ann 

Ahol P a sorcseréket tekintetbe vevő permutáló mátrix, a hij konstansok, pedig a Gauss-
elimináció témakörében definiált hányadosok.

A fentiekben bemutatott LU-felbontás általánosítható téglalap-alakú mátrixokra is, ebben a


tekintetben a Tisztelt Olvasónak a szakirodalom tanulmányozását javasoljuk.

Az LU-felbontás elméleti és gyakorlati fontossága például abban nyilvánul meg, hogy


megkönnyíti lineáris egyenletrendszerek és mátrixegyenletek megoldását.

a) Lineáris egyenletrendszerek megoldása LU-felbontással.


Tekintsük például az Ax = b lineáris egyenletrendszert. Tegyük fel, hogy az A mátrix felbontható
LU alakban. Ekkor az egyenletrendszer egyenértékű az LUx = b rendszerrel. Ez pedig két
független rendszerre bontható.

Ly = b,Ux = y

és ezek a rendszerek egyszerűen megoldhatók, csupán visszahelyettesítéseket kell alkalmazni.

b) Mátrixegyenlet megoldása LU-felbontással.


Az a) ponthoz hasonlóan az AX = B mátrixegyenlet is egyszerűen megoldható, ha az A-nak
létezik LU-felbontása. Ugyanis ekkor a mátrixegyenlet LUX = B alakkal egyenértékű, amely
helyettesíthető az

LY = B, UX = Y

mátrixegyenletekkel. Ezek ugyancsak egyszerűen megoldhatók, mert az együtthatómátrixuk


háromszögmátrix.
Speciális esetként megemlítjük, az LU-felbontás inverz mátrix meghatározására is
használható. Ekkor az előbbi mátrixegyenletben B az egységmátrix, tehát az inverz
meghatározása egyenértékű az

91
Óbudai Egyetem BGK Fejezetek a matematikából

LY = E, UX = Y

egyenletrendszerek megoldásával.

1.46.Példa: Határozzuk meg az alábbi mátrix inverzét LU-felbontással.

1 1 2 
A   2 1 2  ;
 4 1 4 

Egy korábbi példában már meghatároztuk ezen mátrix LU-felbontását.

 1 0 0  1 1 2   1 1 2 
 2 1 0 0 3 2    2 1 2 ;
    
 4 1 1  0 0 2  4 1 4

Az inverz előállításához egyrészt meg kell oldani az LY = E egyenletet.

1 0 0  y11 y12 y13  1 0 0  y11 y12 y13   1 0 0


 2 1 0  y y22 y23   0 1 0 ;  y y22 y23    2 1 0 ;
   21  21
 4 1 1   y31 y32 y33  0 0 1   y31 y32 y33   2 1 1 

másrészt pedig az UX = Y egyenletet.

1 1 2   x11 x12 x13   1 0 0   x11 x12 x13   6 2 4 


0 3 2  x x22 x23    2 1 0 ;   x21
   x22 
x23    0 4 2  ;
1
   21 6
0 0 2  x31 x32 x33   2 1 1   x31 x32 x33   6 3 3

Ezzel megkaptuk a mátrix inverzét. Mindkét rendszer megoldása egyszerűbb, mint a szokásos
esetben, mert az együtthatómátrix háromszögmátrix.

Az LU-felbontással kapcsolatosan ki kell emelnünk szimmetrikus a mátrixok LU-felbontását.


Természetesen a faktorizáció ebben a speciális esetben is elvégezhető, de a szimmetriából
adódóan a felbontás speciális módon végezhető el.

Elsőként alakítsuk át az U felső háromszög mátrixot úgy, hogy a diagonálisában az L-hez


hasonlósan szintén mindenütt 1-es álljon. Ez egy egyszerű mátrixszorzással elérhető. Könnyen
látható, hogy az alábbi átalakítás helyes.

92
Óbudai Egyetem BGK Fejezetek a matematikából

 u u1n 
 1 12 ...
 d1 u12 ... u1n   d1 0 ... 0 d1 d1 
0 d  
... u2 n   0 d 2 ... 
0  u2 n 
U 2
 0 1  DU;
d 2 
...
 ... ... ... ...   ... ... ... ...  
   
0 0 ... d n   0 0 ... d n  ... ... ... ... 
 
0 0 ... 1 

Amint látható, a második tényező az eredeti U mátrixból úgy adódik, hogy annak i-edik sorát
elosztjuk az i-edik sorban álló pivot elemmel. Az egyszerűség kedvéért nem vezetünk be új
jelölést, a kapott háromszögmátrixot ugyancsak U jelöli. Elértük tehát a következőt, az U felső
háromszögmátrix faktorizálható úgy, hogy az első tényező egy diagonális mátrix, melynek
főátlójában éppen a pivotok állnak, a második tényező pedig egy olyan felső háromszögmátrix,
amelyben a főátlóban minden komponens 1-es. Ezzel az LU-felbontást a következő ekvivalens
alakban írhatjuk fel.

A = LDU;

A továbbiakban fontos szerepe van annak, hogy ez a három tényezős felbontás egyértelmű a
következő feltételek mellett.

1.43.Tétel: Ha L1D1U1 = L2D2U2 úgy teljesül, hogy a D1 és D2 olyan diagonális mátrixok,


melyeknek főátlójában nem szerepel a zérus, továbbá Li és Ui olyan alsó illetve felső
háromszögmátrixok, amelyek főátlójában minden elem 1-es, akkor L1 = L2, D1 = D2 és U1 = U2,
tehát ez a faktorizáció egyértelmű.
Bizonyítás: Mivel a feltétel szerint az Li és Ui olyan háromszög mátrixok, melyek determinánsa
1, ezért mindannyian invertálhatók. Szorozva a megfelelő inverzekkel a következő adódik.

L2–1L1D1 = D2U2 U1–1;

Mivel egy alsó háromszögmátrix inverze ugyancsak alsó háromszögmátrix – ennek megértéséhez
utalunk a Gauss-elimináció mátrixos leírásánál tapasztaltakra –, és ugyanez igaz egy felső
háromszög mátrixra adódik, hogy bal oldalon állóL2–1L1 tényező alsó háromszögmátrixok
szorzata, ugyancsak olyan alsó háromszögmátrix, melynek főátlójában 1-esek állnak. Ha ezt
szorozzuk egy diagonális mátrixszal ugyancsak alsó háromszögmátrixot kapunk. Hasonlóan igaz
ez a jobb oldalra azzal a különbséggel, hogy ott felső háromszögmátrix áll. Ezek csak akkor
lehetnek egyenlők, ha mindkét oldalon csak a diagonálisban állnak nullától különböző elemek, ez
csak akkor következhet be ha a diagonális mátrixot egységmátrixszal szorozzuk, azaz teljesül,
hogy L2–1L1 = U2 U1–1 = E, ebből pedig egyrészt az következik, L1 = L2 és U1 = U2, ezek
következménye továbbá, hogy D1 = D2. ■

Ebből a tételből egy fontos állítást tudunk levezetni szimmetrikus mátrixok faktorizációjára
vonatkozólag.

93
Óbudai Egyetem BGK Fejezetek a matematikából

1.44.Tétel: (Szimmetrikus mátrixok LU felbontása)


Ha szimmetrikus mátrix, akkor egyértelműen bontható fel

A = LDLT;

alakban, ahol L olyan alsó háromszög mátrix, amelynek főátlójában egyesek állnak, a D pedig
egy diagonális mátrix, melynek főátlójában a pivotok állnak.
Bizonyítás: Egyrészt világos, hogy ez a szorzat valóban szimmetrikus mátrixot értelmez.
Ugyanis

AT = (LDLT)T =(LT)TDTLT = LDTLT = LDLT = A;

Ugyanis egy diagonális mátrix transzponáltja saját maga. Az előző tétel szerint ha létezik ilyen
előállítás, akkor az egyértelmű. Már csak azt kell igazolni, hogy U = LT. Ha A szimmetrikus,
akkor LDU felbontása is szimmetrikus mátrixot ad. Eszerint

A = LDU = UTDLT = AT;

A felbontás egyértelműségéből, következik, hogy U = LT, ezt kellett igazolni. ■

1.47.Példa: Bontsuk fel az alábbi szimmetrikus mátrixot LDLT alakban.

 2 4 2 
A   4 6 8  ;
 2 8 0 

Először is végezzük el az szükséges eliminációs lépéseket.

 2 4 2   2 4 2  2 4 2 
    
 4 6 8  ~ 0  2 12  ~ 0 2 12  ;
 2 8 0  0 12 2  0 0 70
Tekintettel az eliminációs lépésekre – a 2. sorból kivontuk az 1. sor 2-szeresét, a 3. sorhoz
hozzáadtuk az 1. sor 1-szeresét, majd a 3. sorhoz hozzáadtuk a 2. sor 6-szorosát –, az LDU-
felbontás a kezünkben van. A pivotokat minden lépésben szokás szerint megjelöltük.

 2 4 2  1 0 0  2 4 2  1 0 0  2 0 0  1 2 1


A   4 6 8    2 1 0  0 2 12    2 1 0  0 2 0  0 1 6  LDU;
 2 8 0   1 6 1   0 0 70   1 6 1   0 0 70 0 0 1 
Látható, hogy az alsó és felső háromszög mátrix valóban egymás transzponáltja, és a D
diagonális mátrix főátlójában valóban a pivotok állnak.

94
Óbudai Egyetem BGK Fejezetek a matematikából

1.11. Mátrix sajátértéke, sajátvektora

1.45.Definíció: Az ARn×n mátrix sajátvektorának nevezzük az sRn, s ≠ 0 vektort, ha létezik


olyan λR valós vagy λC komplex szám, amelyre teljesül, hogy

As = λs.

A λ valós számot az s sajátvektorhoz tartozó sajátértéknek nevezzük.

Szavakkal megfogalmazva ez annyit jelent, hogy s sajátvektora A-nak, ha az As szorzatvektor az


s vektornak skalárszorosa. Szemléletesen ez azt jelenti, hogy az Asvektor párhuzamos az s
vektorral,az A mátrixszal való szorzás tehát egy nyújtás vagy zsugorítás, vagy esetleg ezek
egyike egy tükrözéssel együtt, ha λ < 0.

A sajátvektor és a sajátérték meghatározása a következő módon történik. Induljunk ki a


definícióban szereplő As = λs egyenletből. Rendezzük egy oldalra a tagokat kapjuk, hogy
As – λs = 0. Itt most kiemelhetnénkaz s vektort, de a kiemelés után egy mátrixnak és egy valós
számnak a különbsége állna, ami nyilván értelmetlen. Ezen segíthetünk, ha felhasználjuk az
Es = s egyenlőséget, ahol E az n-ed rendű egységmátrix. Ennek helyettesítésével olyan
egyenletet kapunk, amelybőls már valóban kiemelhető

(A – λE)s= 0;

Így kaptunk egy homogén lineáris egyenletrendszert az ismeretlen s sajátvektorra


vonatkozólag. Hangsúlyoztuk, hogy a sajátvektor csak nullvektortól különböző vektor lehet.
Ez annyit jelent, hogy keressük ennek a homogén lineáris egyenletrendszernek a nemtriviális
megoldását. Mi a feltétele annak, hogy létezzen nemtriviális megoldás. Az, hogy az
együtthatómátrix szinguláris legyen, tehát determinánsa nulla, azaz

det(A – λE) = 0

Ez az egyenlet amely szolgáltatja azokat a valós λ értékeket, amelyekre az (A – λE) mátrix


szinguláris. Ezek a valós számok a sajátértékek.Az (A – λE) mátrix a karakterisztikus mátrix.

 a11 a12 ... a1n  1 0 ... 0   a11   a12 ... a1n 


a a 
... a2 n  0 1 ...  
0   a21 a22   ... a2 n 
A  E   21 22   ;
 ... ... ... ...  ... ... ... ...  ... ... ... ... 
     
 an1 an 2 ... ann  0 0 .... 1   an1 an 2 ... ann   

A det(A – λE) = 0 egyenletet az A mátrix karakterisztikus egyenletének nevezzük. Ha az A


n-ed rendű mátrix, akkor ez az egyenlet egy n-ed fokú egyenlet a λ sajátértékre vonatkozólag. Az
egyenlet bal oldala a λ határozatlan n-ed fokú polinomja. Ezt a k(λ) = det(A – λE) polinomot az
A mátrix karakterisztikus polinomjának nevezzük.

95
Óbudai Egyetem BGK Fejezetek a matematikából

Ezek után következzenek a számítások. A számítások az előbbi logikához képest fordított


sorrendben követik egymást.

1. lépés: Megoldjuk a det(A – λE) = 0 sajátérték-egyenletet. Ez egy n-ed fokú algebrai egyenlet
az ismeretlen λ-ra. A megoldások a sajátértékek.

2. lépés: A kapott λ sajátértékeket behelyettesítjük az (A – λE)s = 0egyenletrendszerbe – minden


λ-ra egy egyenletrendszer –, és azokat megoldjuk az s ismeretlenekre. Ezek lesznek az adott λ
sajátértékekhez tartozó sajátvektorok.

Mielőtt hozzákezdenénk számítási feladatokhoz, a sajátértékekkel kapcsolatosan két egyszerű, de


nagyon fontos állítást igazolunk.

1.45.Tétel: Ha s a λ sajátértékhez tartozó sajátvektora az A mátrixnak akkor tetszőleges α


konstans esetén αs is a λ sajátértékhez tartozó sajátvektor.
Bizonyítás: A definíció alapján, felhasználva hogy α egy skalár írhatjuk, hogy

mivel As  s ezért As  As  s  s;

Ezt kellett igazolni. ■

Ez a tétel azért fontos, mert a számítások eredményeképpen mindig végtelen sok megoldást
kapunk az s sajátvektorra vonatkozólag. Ezek egy konstans szorzóban különbözhetnek
egymástól. A tétel alapján ezek közül kiválaszthatunk egy tetszőlegeset és azt tekinthetjük
sajátvektornak az alkalmazások során.

Az előző állításnál azonban több is igaz.

1.46.Tétel: Egy adott λ sajátértékhez tartozó sajátvektorok lineáris alteret alkotnak Rn-ben.
Bizonyítás: Az 1.1. pont szerint azt kell igazolnunk, hogy sajátvektorok tetszőleges lineáris
kombinációja is sajátvektor. Legyen tehát s1 és s2 a λ sajátértékhez tartozó sajátvektor, és
legyenek α és β tetszőleges skalárok. Megmutatjuk, hogy ekkor s1  s2 is sajátvektor. Valóban,
mivel As1  s1 és As2  s2 ezért a disztributív törvény szerint

A  s1  s2   As1  As2  As1  As2  s1  s2    s1  s2  ;

Ezt kellett igazolni. ■

1.46.Definíció: Az A mátrix λ sajátértékhez tartozó sajátvektorai által kifeszített altér a λ


sajátértékhez tartozó sajátaltér. A sajátaltér dimenziója, tehát a λ sajátértékhez tartozó
lineárisan független sajátvektorok száma a λ sajátérték geometriai multiplicitása.
Ha a multiplicitás fogalma előkerül, akkor ki kell térnünk a λ sajátérték algebrai
multiplicitására.

96
Óbudai Egyetem BGK Fejezetek a matematikából

1.47.Definíció: Ha a λ sajátérték a karakterisztikus polinomnak p-szeres gyöke, akkor a


sajátérték algebrai multiplicitásap.

Vizsgáljuk meg, milyen lehet az alakja a karakterisztikus polinomnak. Ha kifejtjük a


karakterisztikus mátrix determinánsát, akkor formálisan a következőt kapjuk

a11   a12 ... a1n


a21 a22   ... a2 n
det  A  E     1    1  1     2  2  ...      m  m ;
n p p p

... ... ... ...


an1 an 2 ... ann  

ahol természetesen teljesül, hogy p1  p2  ...  pm  n . Ez a gyöktényezős alak tehát azt jelenti,
hogy az A mátrixnak van m db különböző sajátértéke, és a λi sajátérték a karakterisztikus
egyenletnek pi-szeres gyöke, más szóval a λi sajátérték algebrai multiplicitása pi. Az algebrai
multiplicitások összege természetesen n, a polinom foka, ugyanis az algebra alaptétele szerint egy
n-ed fokú polinomnak pontosan n db gyöke van a komplex számok halmazában. A gyökök, tehát
a sajátértékek lehetnek komplexek is, de multiplicitással számolva pontosan n db sajátérték van.

Több kérdés felmerül a vizsgált problémával kapcsolatban. Először is, az, hogy van-e valami
kapcsolat az algebrai és a geometriai multiplicitás között. Bizonyítás nélkül megfogalmazzuk az
ide vonatkozó alapvető eredményt.

1.47.Tétel: A λ sajátérték geometriai multiplicitása legfeljebb akkora lehet, mint az algebrai


multiplicitása. Más szóval, ha a sajátérték a karakterisztikus polinomnak p-szeres gyöke, akkor a
lineárisan független sajátvektorok száma kisebb vagy egyenlő, mint p, számuk p-nél nagyobb
nem lehet.

Ez a tétel valamelyes segít a probléma áttekintésében, de nem árt, ha összefoglaljuk a


lehetőségeket. Hangsúlyozzuk, hogy vizsgálatainkban mindenütt valós komponensű mátrixok
szerepelnek, azaz ARn×n. Mielőtt azonban a lehetőségeket felsorolnánk, néhány alapvetően
fontos tételt igazolunk, elsőként azt, amely különböző sajátértékekhez tartozó sajátvektorokról
szól.

1.48.Tétel: Az n-ed rendű A mátrix különböző sajátértékeihez tartozó sajátvektorok lineárisan


függetlenek.
Bizonyítás: Az állítást a sajátértékek száma szerinti teljes indukcióval bizonyítjuk.
a) Ha egy sajátértéket tekintünk, akkor az állítás nyilvánvaló, ugyanis a sajátvektor nem lehet
nullvektor, így lineárisan független rendszer.
b) Tegyük fel, hogy van n db különböző sajátérték  1 ,  2 ,...,  n  , amelyekhez tartozó
sajátvektorok  s1, s2 ,..., sn  lineárisan függetlenek. Tehát 1s1  ...  nsn  0 esetén
szükségképpen 1  ...  n  0 . Vegyük hozzá ehhez a rendszerhez az eddigiektől különböző
λn+1 sajátértéket és a hozzá tartozó sn+1 sajátvektort. Indirekt tegyük fel, hogy az n + 1 db
sajátvektor lineárisan összefüggő rendszert alkot. Ekkor 1s1  ...  nsn  n1sn1  0 esetén

97
Óbudai Egyetem BGK Fejezetek a matematikából

létezik nullától különböző együttható, legyen például β1 ≠ 0. Szorozzuk meg ezt a lineáris
kombinációt az A mátrixszal balról. Az adódik, hogy

A 1s1  ...  nsn  n1sn1   0;

Mivel sajátvektorokról van szó, a disztributív törvény szerint írhatjuk, hogy

A1s1  ...  Ans n  An 1s n 1 


 1As1  ...  n As n  n1Asn1 
 11s1  ...  n  ns n  n1 n1s n1  0;

Szorozzuk most meg az indirekt feltevést jelenő lineáris kombinációt a λn+1 sajátértékkel és
vonjuk ki egymásból a kapott két egyenletet. Azt kapjuk, hogy

 n1 1s1  ...  nsn  n1sn1   11s1  ...  n  nsn  n1 n1sn1  
 1   n1  1  s1  ...  n   n1   n  s n  0;

A feltevés szerint a sajátértékek különbözők, és β1 ≠ 0, ami azt jelenti, hogy a nullvektort


előállítja az  s1, s2 ,..., sn  sajátvektor rendszer egy nemtriviális lineáris kombinációja, ami
ellentmond annak, hogy ez a rendszer a feltevés szerint lineárisan független. Ez pontosan azt
jelenti, hogy az indirekt feltevés hamis. Az állítást igazoltuk. ■

Egy valós együtthatójú algebrai egyenletnek lehetnek komplex sajátértékei. Ekkor azonban
tudjuk, mivel valós együtthatójú az egyenlet, hogy a komplex gyökök párosával lépnek fel,
komplex gyök és konjugáltja. Ha tehát a  C komplex sajátérték, akkor  C is megoldás.
Világos, hogy ha a sajátértékek komplexek, akkor a sajátvektor meghatározására vonatkozó
egyenletrendszer komplex együtthatójú, tehát a sajátvektorok is komplexek. Kérdés, hogy van-e
valami kapcsolat ekkor a sajátvektorok között is. A válasz pozitív.

1.49.Tétel: Ha  C komplex sajátérték és s  Cn a hozzá tartozó sajátvektor, akkor a  C


sajátértékhez tartozó sajátvektor az s vektor komplex konjugáltja azaz s  Cn .
Bizonyítás: Mivel az A mátrix valós komponensű, és s a λ sajátértékhez tartozó sajátvektor
írhatjuk, hogy As = λs. Képezve ennek az egyenletnek a komplex konjugáltját, tekintettel arra,
hogy szorzat konjugáltját tényezőnként képezhetjük kapjuk, hogy

As  s; azaz As   s ; tehát As   s ;

ami éppen az állítást igazolja. ■

Ez az állítás megkönnyíti a dolgunkat akkor, ha komplex sajátérték adódik, hiszen ha egy


sajátvektort meghatároztunk, a konjugált sajátértékhez tartozó sajátvektor már adódik, mert nem
más mint a már meghatározott komplex sajátvektor komplex konjugáltja.

98
Óbudai Egyetem BGK Fejezetek a matematikából

Részletesen kifejtve a komplex sajátérték esetét a következőt mondhatjuk. Tegyük fel, hogy az A
mátrixnak a λ = α + iβ komplex sajátértéke. Mivel a mátrix valós, azonnal következik, hogy a
 = α – iβ is sajátérték. Legyen s = u + iv a λ sajátértékhez tartozó komplex sajátvektor. A
bizonyított tétel szerint ekkor a  sajátértékhez tartozó sajátvektor az s = u – iv komplex vektor.

A differenciálegyenlet rendszerek elméletében szükségünk van az alábbi eredményre.

1.50.Tétel: Ha s = u + ivaz A mátrix komplex sajátvektora, akkor azs komplex vektor valós és
képzetes része, tehát azuRn és vRn vektorok lineárisan függetlenek.
Bizonyítás: Mivel λ és  különböző sajátértékek, ezért a hozzájuk tartozó s és s vektorok
lineárisan függetlenek. Mivel s = u + ivtovábbá s = u – iv ezért igaz, hogy

s s s s
u ; és v  ;
2 2i

Láttuk, hogy két vektor lineáris összefüggősége egyenértékű azzal, hogy az egyik vektor
konstansszorosa a másiknak. Ebből már következik az állítás, hiszen látható, hogy az u és v
vektorokra ez nem igaz, egyik nem számszorosa a másiknak, tehát függetlenek. ■

Foglaljuk tehát össze milyen lehetőségeink vannak a sajátértékek számát és algebrai illetve
geometriai multiplicitását illetően. Tegyük fel, hogy ARn×n.

1. eset: Az A mátrixnak n db különböző sajátértéke van. Ekkor tudjuk, hogy minden egyes
sajátértékhez tartozik egy sajátvektor, és ezek lineárisan függetlenek. Ebben az esetben tehát van
n db lineárisan független sajátvektor. Minden sajátérték algebrai és geometriai multiplicitása
egyaránt 1.

2. eset: Az A mátrixnak vannak olyan sajátértékei, amelyeknek az algebrai multiplicitása


nagyobb mint 1, azaz van többszörös sajátérték, tehát a különböző sajátértékek száma kisebb,
mint n. Ekkor két eset fordulhat elő.

a) A sajátérték algebrai multiplicitása megegyezik a geometriai multiplicitásával. Ez azt


jelenti, hogy ekkor egyetlen sajátértékhez több lineárisan független sajátvektort is rendelhetünk,
és a többszörös sajátértékhez tartozó sajátaltér dimenziója megegyezik a sajátérték algebrai
multiplicitásával. Ebben az esetben is meg tudunk adni n db lineárisan független sajátvektort.

b)A sajátérték algebrai multiplicitása kisebb, mint a geometriai multiplicitás. Ez azt jelenti,
hogy ekkor egyetlen sajátértékhez kevesebb lineárisan független sajátvektor tartozik, mint a
sajátérték multiplicitása. A többszörös sajátértékhez tartozó sajátaltér dimenziója tehát kisebb a
sajátérték algebrai multiplicitásánál. Ebben az esetben nem létezik n db lineárisan független
sajátvektor.

A képet színesíti, hogy a sajátértékek és sajátvektorok lehetnek komplexek is.

A továbbiakban minden említett esetre mutatunk példát.

99
Óbudai Egyetem BGK Fejezetek a matematikából

1.48.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.

5 1 
A ;
 3 3

A karakterisztikus mátrix

5 1   1 0  5   1 
A  E      
3   
;
3 3 0 1   3

A karakterisztikus polinom a

5   1 
k     det  A  E   det     5    3     3   2  8  12
 3 3  

másodfokú polinom. A karakterisztikus egyenlet tehát a következő

det(A  E)   5    3     3   2  8  12  0

A megoldóképlettel kapjuk a megoldásokat: λ1 = 2, λ2 = 6 a két sajátérték. A sajátértékek


ismeretében meghatározhatjuk a sajátvektorokat. Ehhez az

5   1   s1  0

 3 3     s2  0
;

egyenletrendszert kell megoldani mindkét λ esetén.


1.eset: λ1 = 2. Ekkor az egyenletrendszer a következő

5  2 1   s1  3 1  s1  0
 
 3 3  2  s2  3 1  s2  0
;

látszik, hogy a mátrix valóban szinguláris, a két sora megegyezik, tehát rangja 1.
Koordinátánként írva mindkét egyenlet ugyanaz, 3s1  s2  0, azaz s2  3s1 .Tehát az s1
sajátvektor a következő

 t  1
s1    , t  R \ 0 ; például s1    ;
 3t   3

2.eset: λ2 = 6. Ekkor az egyenletrendszer az alábbi

100
Óbudai Egyetem BGK Fejezetek a matematikából

5  6 1   s1   1 1   s1  0
 
 3 3  6  s2   3 3  s2  0
;

Ismét látszik, hogy a kapott mátrix szinguláris, mert a második sor az első sor számszorosa, a
sorvektorok lineárisan összefüggenek, tehát a reng 1. Koordinátánként írva, egy állandó szorzótól
eltekintve, mindkét egyenlet ugyanaz, s1  s2  0, azaz s2  s1 .Tehát az s2 sajátvektor a
következő

t  1
s2    , t  R \ 0 ; például s 2    ;
t  1

Ebben a példában kaptuk tehát, hogy a sajátértékek egyszeres algebrai multiplicitásúak, továbbá a
geometriai multiplicitásuk is 1, a sajátalterek egy dimenziósak. Az s1 és s2 sajátvektorok
lineárisan függetlenek.

1.49.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.

5 3
A ;
 3 1

A karakterisztikus mátrix

5 3 1 0 5   3 
A  E       ;
 3 1  0 1   3 1   

A karakterisztikus polinom a

5   3 
k     det  A  E   det     5    1     9    4  4
2

  3 1   

másodfokú polinom. A karakterisztikus egyenlet tehát a következő

det(A  E)   2  4  4     2   0
2

Azt kapjuk hogy egyetlen kétszeres gyök van, λ = 2 az egyetlen sajátérték. Az algebrai
multiplicitás tehát 2, kérdés, hogy mennyi a geometriai multiplicitás, mennyi a lineárisan
független sajátvektorok száma, azaz a sajátaltér dimenziója. A sajátérték ismeretében
meghatározhatjuk a sajátvektorokat. Ehhez az

5   3   s1  0
 3 1     s   0 ;
  2  

101
Óbudai Egyetem BGK Fejezetek a matematikából

egyenletrendszert kell megoldani a kapott egyetlen λ esetén. λ1 = 2 helyettesítésével az


egyenletrendszer a következő

5  2 3   s1   3 3   s1  0
 3 1  2  s    3 3  s   0 ;
  2   2  

látszik, hogy a mátrix valóban szinguláris, egyik sora a másik sor ellentettje, tehát rangja 1. Mivel
két ismeretlen van és a rang 1, a szabadságfok is 1. Ez azt jelenti, hogy a sajátaltér egy
dimenziós. Koordinátánként írva a rendszert, mindkét egyenlet ugyanazt az összefüggést adja,
3s1  3s2  0, azaz s2  s1 . Tehát az egyetlen lineárisan független s sajátvektor a következő

t  1
s    , t  R \ 0 ; például s    ;
 t   1

és több független sajátvektor nem létezik. Ebben a példában kaptuk tehát, hogy a sajátérték
algebrai multiplicitása 2, továbbá a geometriai multiplicitásacsak 1, a sajátaltér egy dimenziós.
Az saz egyetlen lineárisan független sajátvektor.

1.50.Példa: Határozzuk meg az alábbi mátrix sajátértékeit és sajátvektorait.

 1 2
A ;
 1 3

A karakterisztikus mátrix

 1 2 1 0 1   2 
A  E       ;
 1 3 0 1   1 3   

A karakterisztikus polinom a

1   2 
k     det  A  E   det    1    3     2   2  4  5;
 1 3   

másodfokú polinom. A karakterisztikus egyenlet tehát a következő

det(A  E)  2  4  5  0;

A megoldóképlettel kapjuk a megoldásokat: λ = λ1 = 2 + i,  = λ2 = 2 – i a két konjugált


komplex sajátérték. A sajátértékek ismeretében meghatározhatjuk a sajátvektorokat. A korábbiak
szerint elég csak az egyik sajátvektort meghatározni, a másik sajátvektor ennek konjugáltja lesz.
Ehhez az

102
Óbudai Egyetem BGK Fejezetek a matematikából

1   2   s1  0
 1 3     s   0 ;
  2  

egyenletrendszert kell megoldani λ = 2 + i esetén. Az egyenletrendszer konkrétan a következő

1  2  i 2   s1   1  i 2   s1  0
 
 1 3  2  i   s2   1 1  i   s2  0
;

Látszik, hogy a mátrix valóban szinguláris, az első sor a második sor (1 + i)-szerese, tehát rangja
1, a rendszerből ezért például az első egyenlet elhagyható. A második egyenletetmegtartva azt
kapjuk, hogy s1  1  i  s2  0, azaz 1  i  s2  s1 . Tehát az s sajátvektor a következő

1  i  t  1  i  1  1


s1  s    , t  R \ 0 ; például s     u  iv     i   ;
 t   1  1  0 

A másik,  = λ2 = 2 – i sajátértékhez tartozó sajátvektor ebből azonnal felírható

1  i  t  1  i  1  1


s2  s    , t  R \ 0 ; például s     u  iv     i   ;
 t   1  1  0 

Kaptuk tehát a következőt. Az A mátrixnak két konjugált komplex sajátértéke van. Ehhez tartozik
két konjugált komplex sajátvektor. Mindkét sajátérték algebrai és geometriai multiplicitása 1. A
későbbiek kedvéért kiemeljük, hogy a komplex sajátvektorok valós és képzetes része, tehát az

1  1
u    és v   
1 0

vektorok lineárisan független vektorrendszert alkotnak, hiszen nem párhuzamosak. Ezt


általánosan is igazoltuk, azonban ebben a konkrét esetben jól látható tulajdonság.

A kidolgozott példák után célszerű 2×2-es mátrix esetében általánosan is megvizsgálni a


sajátérték problémát. Legyen tehát

a b 
A ;
c d 

és határozzuk meg ezen paraméterekkel a sajátértékeket. A karakterisztikus egyenlet a következő

a   b 
det  A  E   det    a    d     bc  0;
 c d   

103
Óbudai Egyetem BGK Fejezetek a matematikából

Vizsgáljuk kicsit részletesebben a kapott másodfokú egyenletet. Rendezve a λ ismeretlen


hatványai szerint, azt kapjuk, hogy

2   a  d     ad  bc   0;

Itt két dolgot kell észrevenni. Egyrészt a konstans tag az A mátrix determinánsa, másrészt az
elsőfokú tag együtthatója a mátrix nyomának (a főátlóbeli elemek összege) ellentettje. Tehát a
másodrendű esetben a karakterisztikus egyenlet a következő

k     2  trA   det A  0;

Idézzük most fel a másodfokú egyenlet gyökei és együtthatói közti összefüggéseket. Ha a


karakterisztikus polinom gyöktényezős alakja

k        1     2  ;

akkor az említett összefüggésekből adódik, hogy a gyökök összege illetve szorzatára igaz a
következő.

1.51.Tétel: Másodrendű mátrix esetén a sajátértékek összege a mátrix nyoma, a sajátértékek


szorzata a mátrix determinánsa. Azaz

1  2  trA  a  d ; 1  2  det A  ad  bc;

Bizonyítás: Az idézett Viéte-formulák szerint az x2  px  q  0 egyenlet x1 és x2 gyökére igaz,


hogy x1  x2   p; x1  x2  q . A fenti jelöléseket figyelembe véve éppen ezt kellett igazolni. ■

1.51.Példa: Gondoljuk át, hogy az előző három példában teljesül ez a két egyenlőség. Az 1.48.
példában

5 1 
A ;
3 3

és láttuk, hogy λ1 = 2, λ2 = 6. A sajátértékek összege λ1 + λ2 = 2 + 6 = 8 valóban a mátrix nyoma,


mert trA = 5 + 3 = 8. Másrészt a sajátértékek szorzata λ1· λ2 = 2 · 6 = 12 valóban a mátrix
determinánsa, mert detA = 5·3 – 3·1 = 15 – 3 = 12. A tisztelt Olvasóra bízzuk, hogy a másik két
példában is ellenőrizze ezen összefüggéseket.

Ez az állítás könnyen általánosítható n-ed rendű mátrixra.

104
Óbudai Egyetem BGK Fejezetek a matematikából

1.52.Tétel: Ha az ARn×n mátrixsajátértékei λ1, λ2, …, λn, akkor a sajátértékek összege a mátrix
nyoma, a sajátértékek szorzata pedig a mátrix determinánsa, azaz

1   2  ...   n  trA;
1   2  ...   n  detA;

Bizonyítás: Az A mátrix karakterisztikus polinomjának gyöktényezős alakja

det  A  E    1    1       2   ...      n  ;


n

Ha ebben az egyenletben λ = 0-t helyettesítünk, azt kapjuk, hogy

det A  det  A  0E    1  1     2   ...    n    1 1  2  ...  n  1  2  ...  n ;


n 2n

A determinánsra vonatkozó állítást ezzel igazoltuk. Mellesleg megjegyezzük, hogy a determináns


nyilvánvalóan a karakterisztikus polinom konstans tagja. A nyomra vonatkozó állítás a
következőképpen adódik. Egyrészt a gyöktényezős alakból adódik, hogy (–1)nλn–1 együtthatója
éppen a sajátértékek összegének ellentettje. Másrészt, ha kifejtjük az

 a11   a12 ... a1n 


 a a22   ... a2 n 
 21
 ... ... ... ... 
 
 an1 an 2 ... ann   

karakterisztikus mátrix determinánsát, más szóval meghatározzuk a k(λ) karakterisztikus


polinomot, akkor a
k      a11    a22    ...  ann     kn2    ;

alakot kapjuk, ahol a kn–2(λ) jelölés arra utal, hogy a determináns kifejtése során a főátló
elemeinek szorzása után egy legfeljebb n – 2-ed fokú polinomot kaphatunk, azaz a fenti összeg
második tagjában a λ legfeljebb n – 2 hatványkitevőn szerepelhet. Ez azért igaz, mert ha a
főátlóban nem szereplő elemhez tartozó előjeles aldeterminást számítjuk, akkor ez utóbbi
definíciója szerint el kell hagynunk a mátrixból az elem sorát és oszlopát. Mivel ez az elem nem
szerepel a főátlóban, elhagyunk a mátrixból két olyan tagot, amely aii– λ alakú, egyet a sor egyet
pedig az oszlop elhagyásával, tehát ezen aldeterminánsok kifejtésében valóban csak n – 2 db aii–
λ alakú tényező szerepel. Ebből pedig az következik, hogy λn–1 alakú hatvány csak a k(λ)
felírásában szereplő első tag, tehát az n-tényezős szorzat felbontásával adódik. Ebben pedig a λn–1
hatvány együtthatója nyilván (–1)n–1(a11 + a22 + … + ann). A két eredmény összevetéséből a

  1  1  2  ...   n    1  a11  a22  ...  ann  ;


n1
azaz 1   2  ...   n  tr  A 
n

egyenlőség adódik, ez pedig éppen a bizonyítandó állítás. ■

105
Óbudai Egyetem BGK Fejezetek a matematikából

Következményként adódik egy fontos kapcsolat a sajátértékek és a mátrix regularitása illetve


szingularitása között.

1.53.Tétel: Az n-ed rendű A mátrix pontosan akkor szinguláris, ha a 0 valós szám sajátértéke.
Bizonyítás: Egy mátrix pontosan akkor szinguláris, ha determinánsa zérus. Az előző állítás
szerint a determináns egyenlő a sajátértékek szorzatával, azaz

1 2  ...  n  detA

Ebből már következik, hogy a determináns pontosan akkor zérus, ha legalább egy sajátérték
zérus. ■

1.52.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait.

 2 1 1 
A  1 2 1 ;
1 1 2 

Azonnal felírhatjuk a karakterisztikus egyenletet.

2   1 1
det A  E  1 2 1      1   2    3  0;
1 1 2

Ennek gyökei, tehát a sajátértékek a következők 1  1, 2  2, 3  3 . Meghatározzuk


mindhárom sajátértékhez tartozó sajátvektort. Ehhez az alábbi homogén lineáris
egyenletrendszereket kell megoldani.

 2  1 1 1   s1  0  1 1 1   s1  0 
1  1:  1 2  1 1   s2   0  ; azaz 1 1 1  s   0  ;
  2  
 1 1 2  1  s3  0  1 1 1   s3  0 

Világos, hogy az együtthatómátrix szinguláris, hiszen a 3. sor ugyanaz mint az 1 sor. Az 1. és 2.


sor viszont lineárisan független, hiszen ezek két sor nem egymás számszorosa, tehát az
együtthatómátrix rangja 2. Ezért s = k – ρ = 3 – 2 = 1 a szabadságfok, egy ismeretlen választható
szabadon. Legyen például s3 = t. Ekkor a harmadik egyenlet elhagyásával adódó redukált
egyenletrendszer a következő

 s1  s2  t  0; s  0;
 azaz  1 t  R \ 0 ;
 s1  s2  t  0;  s2  t ;

tehát a megfelelő sajátvektor az alábbi

106
Óbudai Egyetem BGK Fejezetek a matematikából

0  0
s1   t  ; t  R \ 0 ; például s1  1  ;
 
 t  1 

Hasonlóan adódnak a többi sajátértékhez tarozó sajátvektorok.

 2  2 1 1   s1  0 0 1 1   s1  0 

2  2 :  1 2  2 1   s2   0 ; azaz 1 0 1  s   0  ;
  2  
 1 1 2  2  s3  0 1 1 0   s3  0

Az együtthatómátrix ebben az esetben is szinguláris, hiszen a 3. sor az 1. és 2. sor összege,


viszont az első két sor lineárisan független, tehát a rang ismét 2. A szabadságfok pedig ugyancsak
1. Legyen ismét s3 = t. Ekkor ugyancsak a harmadik egyenlet elhagyásával adódó redukált
egyenletrendszer a következő

 s2  t  0;  s  t;
 azaz  1 t  R \ 0 ;
 s1  t  0; s2  t ;

adódik tehát, hogy a sajátvektor

t  1
s 2  t  ; t  R \ 0 ; például s 2  1 ;
 
t  1

Végül a harmadik sajátérték esetében

 2  3 1 1   s1  0  1 1 1   s1  0 

3  3 :  1 2  3 1   s2   0 ; azaz  1 1 1  s   0  ;
  2  
 1 1 2  3  s3  0  1 1 1  s3  0 

A kapott mátrix szinguláris, mert a 2. és 3. sor megegyezik. Az első két sorvektor azonban
független, hiszen egyik a másiknak nem konstans szorosa, így a mátrix rangja 2, tehát a
szabadságfok 1. Válasszuk ismét az s3 ismeretlent szabad ismeretlennek, így kapjuk, hogy a
független egyenletek a következők

 s1  s2  t  0; s  0;
 azaz  2 t  R \ 0 ;
 s1  s2  t  0;  s1  t;

amelyből a harmadik sajátvektor

107
Óbudai Egyetem BGK Fejezetek a matematikából

t  1 
s3  0 ; t  R \ 0 ; például s3  0  ;
 
 t  1 

Bár általánosan bebizonyítottuk, ebben a speciális esetben is könnyen látható, hogy a kapott
sajátvektorok lineárisan függetlenek, hiszen ezekből, mint oszlopvektorokból képezett mátrix
determinánsa nem nulla. Valóban

0 1 1 0 0 1
1 1 0  1 1 0  1  0;
1 1 1 1 0 1

Ebben a példában tehát három egyszeres algebrai multiplicitású valós sajátértéket kaptunk, amely
mindegyikéhez tartozik egy egydimenziós sajátaltér, tehát minden sajátérték geometriai
multiplicitása is egy. Ellenőrizzük továbbá, hogy a sajátértékek összege valóban a mátrix nyoma
valamint azt, hogy a sajátértékek szorzata valóban a mátrix determinánsa.
Egyrészt

1  2  3  1  2  3  6  2  2  2  tr  A  ;

másrészt

2 1 1 0 0 1
3 1
det A  1 2 1  3 1 1   3  3  6  1 2  3  1   2   3 ;
3 1
1 1 2 3 1 2

Valóban igaz.

1.53.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait.

2 1 0
A   1 3 1 ;
 1 2 3 

A karakterisztikus egyenletet a következő

2 1 0
det A  E  1 3  
1      2   2  6  10  0;
1 2 3

108
Óbudai Egyetem BGK Fejezetek a matematikából

Itt a második tényező, tehát a másodfokú polinom nem bontható fel valós együtthatójú elsőfokú
tényezők szorzatára, hiszen a diszkriminánsa negatív. Ezért az egyenlet gyökei, tehát a
sajátértékek a következők 1  2, 2,3  3  i . Tehát egy valós és két konjugált komplex
sajátérték adódott. Határozzuk meg a sajátvektorokat. A sajátérték egyenlet az első esetben

2  2 1 0   s1  0   0 1 0   s1  0 

1  2 :  1 3  2 1   s2   0  ; azaz  1 1 1  s   0  ;
  2  
 1 2 3  2   s3  0   1 2 1   s3  0

A kapott mátrix azért szinguláris, mert ha az első sor háromszorosából kivonjuk a 2. sort, éppen a
3. sort kapjuk, viszont az első két sor lineárisan független. Tehát a mátrix rangja 2 és
elhagyhatjuk a 3. egyenletet. A szabadságfok k – ρ = 3 – 2 = 1. Ismét az s3 ismeretlent tekintve
szabad változónak a redukált rendszer a következő

 s2  0;  s  0;
 azaz  2 t  R \ 0 ;
 s1  s2  t  0;  s1  t ;

ahonnan a λ1 = 2 sajátértékhez tartozó sajátvektor a következő

t  1 
s1  0 ; t  R \ 0 ; például s1  0  ;
 
 t  1 

Következzenek a komplex sajátértékek. Tudjuk, hogy számolni csak az egyikkel szükséges.

2  3  i 1 0   s1  0   1  i 1 0   s1  0 

2  3  i :  1 33i 1   s2   0  ; azaz  1
 i 1  s2   0  ;
 1 2 3  3  i   s3  0   1 2 i   s3  0 

Könnyen látható, hogy ha az 1. sorhoz hozzáadjuk a 2. sor i-szeresét, a 3. sort kapjuk. A


sorvektorok tehát lineárisan összefüggenek, a mátrix szinguláris. Az első két sor azonban
független, mert egyik sor a másiknak nem konstansszorosa. A rang így ρ = 2, tehát a
szabadságfok ismét s = k – ρ = 1, ami azt jelenti, hogy a sajátaltér egy dimenziós. A sajátvektort
megkapjuk, ha például az 1. egyenlet elhagyásával adódó redukált rendszert megoldjuk. Legyen
ismét s3 = t, ekkor kapjuk, hogy

 s1  is2  t  0;  5s   2  i  t ;

 azaz  1 t  R \ 0 ;
 s1  2s2  it  0; 5s2  1  3i  t;

Tehát a λ2 = 3 + i sajátértékhez tartozó sajátvektor a következő

109
Óbudai Egyetem BGK Fejezetek a matematikából

 2i 
 5 t
  2i   2  1 
1  3i 
s2   t ; t  R \ 0 ; például s 2  1  3i   u  iv  1   i  3 ;
 
 5 
   5   5  0
 t 
 

Ennek a sajátvektornak a komplex konjugáltja a λ3 = 3 – i sajátértékhez tartozó sajátvektor

 2i 
 5 t
  2i   2  1 
1  3i 
s3   t ; t  R \ 0 ; például s3  1  3i   u  iv  1   i  3 ;
 
 5 
   5   5  0 
 t 
 

megkaptuk tehát a sajátértékeket és a sajátvektorokat. Ebben a példában tehát a mátrixnak három


egyszeres algebrai multiplicitású sajátértéke van, amelyek között két sajátérték komplex, és
mindegyik sajátérték geometriai multiplicitása is egy, minden sajátaltér egy dimenziós.

Most rátérünk a többszörös gyökök vizsgálatára.

1.54.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait.

 3 2 1
A   3 4 3 ;
 2 4 0 

A karakterisztikus egyenletet a következő

3 2 1
3      5    2   0;
2
det A  E  3 4  
2 4 

A gyökök 1  5, 2,3  2 . Tehát két valós sajátérték van, a λ1 = –5 sajátérték algebrai
multiplicitása 1, a λ2,3 = 2 sajátérték algebrai multiplicitása 2. Kérdés, hogy mennyi a sajátalterek
dimenziója. Ehhez meghatározzuk a sajátvektorokat. A sajátérték egyenlet λ1 = –5 esetben

3  5 2 1  s1  0 8 2 1  s1  0



1  5 :  3 4  5 3  s2   0 ; azaz  3 1 3  s   0 ;
  2  
 2 4 5   s3  0  2 4 5   s3  0

110
Óbudai Egyetem BGK Fejezetek a matematikából

Könnyen ellenőrizhető, hogy a 2. sor kétszeresének és a 3. sornak az összege az 1. sor, de a 2. és


3. sor függetlenek, tehát, a mátrix szinguláris, rangja 2. Ebből következik, hogy az
egyenletrendszer szabadságfoka ismét 1. Legyen s3 = t, ekkor az 1. egyenlet elhagyásával kapjuk,
hogy

 3s1  s2  3t  0;  2s  t;
 azaz  1 t  R \ 0 ;
2s1  4s2  5t  0; 2s2  3t;

ahonnan λ1 = –5 sajátértékhez tartozó sajátvektor

t 
2
  1 
 ; t  R \ 0 ; például s1   3  ;
3t 
s1 
2
t   2 
 
 

Vizsgáljuk meg a kétszeres algebrai multiplicitású sajátérték esetét. A sajátérték egyenlet

3  2 2 1  s1  0  1 2 1  s1  0 

1  2 :  3 4  2 3  s2   0  ; azaz  3 6 3  s   0  ;
  2  
 2 4 2   s3  0  2 4 2  s3  0

Azt kaptuk, hogy a mátrix 2. sora az 1. sor 3-szorosa, a 3. sor pedig az 1. sor kétszerese. Tehát a
mátrix rangja csak 1. Ebből következik, hogy a rendszer s szabadságfoka s = k – ρ = 3 – 1 = 2,
tehát a sajátaltér két dimenziós, két lineárisan független sajátvektor feszíti ki az alteret. Ha a
három egyenletből megtartjuk az 1. egyenletet, akkor azt kapjuk, hogy

s1  2s2  s3  0;

Legyenek a szabad ismeretlenek s2 = u, s3 = v. Ekkor a kötött ismeretlen s1  2u  v, u, v R ,


azaz a sajátvektorok a következő formulával adottak

 2u  v   2 1   2 1 
s   u   u 1   v 0 ; u, v  R \ 0 ; például s 2  1  ; s3  0
       
 v   0  1   0  1 

kaptunk tehát két lineárisan független sajátvektort, amelyek mindketten a λ = 2 sajátértékhez


tartoznak. Ezt ellenőrizhetjük is

111
Óbudai Egyetem BGK Fejezetek a matematikából

 3 2 1  2  4  2  3 2 1 1   2  1 
 3 4 3 1    2  2  1  ; másrészt 3 4 3 0   0   2  0  ;
             
 2 4 0  0  0  0   2 4 0  1   2 1 

valóban sajátvektorok. a lineáris függetlenség pedig abból látszik, hogy a két vektor nem
párhuzamos, egyik sem konstansszorosa a másiknak.
Ebben a példában tehát azt láttuk, hogy a mátrixnak van egy egyszeres algebrai multiplicitású
sajátértéke és ennek a geometriai multiplicitása is 1, tehát a hozzá tartozó sajátaltér egy
dimenziós, ezen kívül van egy kétszeres algebrai multiplicitású sajátértéke és az ehhez tartozó
sajátaltér is két dimenziós, tartozik hozzá két lineárisan független sajátvektor, tehát a sajátérték
geometriai multiplicitása is kettő.

A helyzet azonban általában nem olyan impozáns, mint ahogyan az, az eddigi példák alapján
látszik. Előfordul, hogy nincs annyi független sajátérték, mint a mátrix rendje.

1.55.Példa: Határozzuk meg az alábbi harmadrendű mátrix sajátértékeit és sajátvektorait.

1 1 1 
A  1 1 1 ;
0 1 2 

A karakterisztikus egyenletet a következő

1   1 1
1      2    1  0;
2
det A  E  1 1  
0 1 2

A gyökök 1  2, 2,3  1 . Tehát két valós sajátérték van, a λ1 = 2 sajátérték algebrai


multiplicitása 1, a λ2,3 = 1 sajátérték algebrai multiplicitása 2. Kérdés, hogy mennyi a sajátalterek
dimenziója. Ehhez meghatározzuk a sajátvektorokat. A sajátvektort meghatározó egyenlet λ1 = 2
esetben

1  2 1 1   s1  0  1 1 1   s1  0
1  2 :  1 1  2 1   s2   0  ; azaz
  1 1 1  s   0  ;
  2  
 0 1 2  2  s3  0  0 1 0   s3  0 

Világos, hogy az 1. és 2. sorvektorok összege a 3. sorvektor kétszerese, tehát a sorvektorok


lineárisan összefüggenek, de az első két sor független, tehát a mátrix rangja 2. Ebből következően
a szabadsági fok s = k – ρ = 3 – 2 = 1. Tartsuk meg az 1. és 3. egyenletet. Ekkor s3 = t
választással adódik, hogy

112
Óbudai Egyetem BGK Fejezetek a matematikából

 s1  s2  t  0; s  0;
 azaz  2 t  R \ 0 ;
  s2  0;  s1  t;

A λ1 = 2 sajátértékhez tartozó sajátvektor tehát

t  1 
s1  0 ; t  R \ 0 ; például s1  0  ;
 t  1 

Térjünk át a kétszeres sajátérték vizsgálatára. A sajátvektort meghatározó homogén lineáris


rendszer a következő

1  1 1 1   s1  0 0 1 1   s1  0 
 2,3  1:  1 1  1 1   s2   0  ; azaz
 1 0 1  s   0  ;
  2  
 0 1 2  1  s3  0  0 1 1   s3  0 

A mátrix 1. és 3. sora megegyezik, de az 1. és 2. sor lineárisan független, tehát a mátrix rangja 2.


A szabadságfok tehát ismét csak s = k – ρ = 3 – 2 = 1. tehát annak ellenére, hogy a sajátérték
algebrai multiplicitása 2, a sajátaltér dimenziója csak 1, tehát nem tudunk megadni egynél több
lineárisan független sajátvektor. A 3. egyenlet elhagyásával és s3 = t választással adódik, hogy

 s2  t  0;  s  t;
 azaz  1 t  R \ 0 ;
 s1  t  0; s2  t ;

A λ2,3 = 1 sajátértékhez tartozó sajátvektor tehát

t  1
s 2  t  ; t  R \ 0 ; például s 2  1 ;
 

t  1

Ebben a példában tehát azt láttuk, hogy a λ = 1 sajátérték algebrai multiplicitása szigorúan
nagyobb, mint a geometriai multiplicitása, a lineárisan független sajátvektorok száma kisebb,
mint a mátrix rendje.

Mivel a geometriai multiplicitás nagyobb nem lehet, mint az algebrai multiplicitás, minden
lehetséges esetre mutattunk példát.

A sajátértékek elméletét a 2.3 fejezetben jelentős mértékben kiegészítjük, amikor


differenciálegyenlet rendszerek megoldásának lehetőségeit vizsgáljuk. A jelzett pontban
értelmezzük majd az általánosított sajátvektor fogalmát.

113
Óbudai Egyetem BGK Fejezetek a matematikából

1.12. Kvadratikus mátrixok hatványozása


Kvadratikus mátrixok esetén értelmezzük mátrix pozitív egész kitevőjű hatványait.

1.48.Definíció: Ha n ≥ 2, és ARn×nakkor legyen az A mátrix n-edik hatványa a következő.

An  A  A  ...  A

ahol a jobb oldalon egy n-tényezős szorzat áll. Ha azt szeretnénk, hogy a hatványozás
azonosságai érvényben maradjanak, akkor természetesen értelmezhetjük a 0 kitevőjű és az 1
kitevőjű mátrixhatványt is a következő módon: A0  E, A1  A , ahol E természetesen az n-ed
rendű egységmátrix.

Eszerint A2 = AA, A3 = A2A, … stb. Az világos, hogy ez a szorzás tetszőleges négyzetes mátrix
és tetszőleges egész kitevő esetén értelmezett, hiszen minden szóba kerülő mátrix n-ed rendű
négyzetes mátrix.

1.56.Példa: Számítsuk ki az alábbiA és B mátrix harmadik hatványát.

 1 2 3 
 1 2
A  ; B   3 0 4  ;
 2 3   1 3 2 

A mátrixok hatványai–az Olvasó ellenőrizheti a Falk-séma alkalmazásával – rendre a


következők.

1 0  1  1 2  2  1 2   1 2   3 8
A0    ; A   2 ;A   
0 1   3   ;
 2 3   2 3   8 5
 3 8  1 2  19 18 
A3   
5  2 3   18 1
;
 8

1 0 0  1 2 3 1 2 3   1 2 3   4 7 1
B  0 1 0 ; B   3
0   1
0 4 ; B   3
 2
0 4   3 0 4    7 18 1 ;
   
0 0 1   1 3 2  1 3 2   1 3 2   12 8 13 
 4 7 1   1 2 3   18 5 42 
B   7
3
18 1  3 0 4    60 11 49  ;
 12 8 13   1 3 2  49 63 22

Felhívjuk a figyelmet arra, hogy a 3. hatvány kiszámításához ismerni kell a 2. hatványt. Ezzel a
példával egy esetleges súlyos hiba lehetőségét szeretnénk kiküszöbölni. Egy mátrix hatványa
általában nem egyenlő a mátrix komponenseinek hatványozásával kapott mátrixszal. Ez

114
Óbudai Egyetem BGK Fejezetek a matematikából

csak egy speciális esetben igaz, csak akkor ha a mátrix diagonális. Ezt megfogalmazzuk egy
állítás formájában.

1.54.Tétel: Egy diagonális mátrix n-edik hatványát úgy kapjuk, hogy a diagonálisban álló
elemeket
n-edi hatványra emeljük, a nullák pedig változatlanul maradnak. Azaz

 a11 0 .. 0 
n
 a11
n
0 .. 0 
0 a  
 .. 0   0 a22
n
.. 0 
22
 ;
 .. .. .. ..  .. .. .. .. 
   
0 0 .. akk   0 0 n 
.. akk 

Bizonyítás: A bizonyítás a mátrix szorzásának definíciójából azonnal adódik. Ha a második


hatványt számítjuk, akkor sor-oszlop szorzással nyilvánvalóan adódik, hogy

0   a11 0 0 
2 2
 a11 0 .. 0   a11 0 .. 0   a11 0 .. ..
0 a  0 a  
 .. 0  .. 0   0 a22 .. 0   0 a222
.. 0 
22
 22
 ;
 .. .. .. ..   .. .. .. ..   .. .. .. ..  .. .. .. .. 
      
0 0 .. akk  0 0 .. akk   0 0 .. akk   0 2 
 0 .. akk 

Ha harmadik hatványt számolunk, akkor felhasználhatjuk a kapott eredményt, és így tovább


adódik a tétel minden n egész számra. ■

1.57.Példa: Számítsuk ki a

1 0 0 0
0 2 0 0 
D ;
0 0 3 0
 
0 0 0 5

diagonális mátrix, második és ötödik hatványát. A tétel alapján adódik az eredmény.

1 0 0 0 1 0 0 0 
0 4 0 0  5 0 32 0 0 
D2   ;D  ;
0 0 9 0 0 0 243 0 
   
0 0 0 25 0 0 0 3125

Egy lényeges különbség szembeszökő. Ha diagonális mátrixot hatványozunk, az n-edik


hatvány kiszámításához nincs szükség az n – 1-edik hatványismeretére, mint a korábbi
példában, amikor nem diagonális mátrixot hatványoztunk. Levonhatjuk a következtetést,
diagonális mátrixot „könnyű hatványozni”. A sajátértékek elméletének birtokában ezt a tényt
115
Óbudai Egyetem BGK Fejezetek a matematikából

kihasználjuk majd arra, hogy egy egyszerű eljárást adjunk nem diagonális mátrixok
hatványozására.

Most vizsgáljuk meg, van-e valami kapcsolat egy négyzetes mátrix és hatványai sajátértékei és
sajátvektorai között.

1.55.Tétel: Ha az An-ed rendű mátrix sajátértéke a λ, és a λ-hoz tartozó sajátvektor s, akkor


tetszőleges nem negatív egész n esetén λn az An mátrix sajátértéke és ehhez ugyancsak az s
sajátvektor tartozik.
Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Ebből következik, hogy

A2s = Aλs = λAs = λλs= λ2s;

Innen teljes indukcióval adódik, hogy ha n-re igaz az állítás, akkor

An+1s = A Ans = Aλns =λnAs = λnλs= λn+1s;

Az állítást igazoltuk. ■

Nem tekintjük az inverz mátrixot hatványnak, de formálisan ugyanolyan állítás igaz az inverzre
mint az n-edik hatványra.

1.56.Tétel: Ha a reguláris A mátrix sajátértéke λ, és a λ-hoz tartozó sajátvektor s, akkor az A–1


1
inverz mátrix sajátértéke és ehhez ugyancsak az s sajátvektor tartozik.

Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Mivel A reguláris, létezik inverze.
Szorozzuk meg ezt az egyenlőséget az inverz mátrixszal balról. Kapjuk, hogy

A–1As = A–1λs, azazs =λA–1s;

Mivel reguláris mátrixnak a 0 nem lehet sajátértéke, ezért a λ-val oszthatjuk az egyenletet. Ekkor
az adódik, hogy

1
A 1s  s;

Ez pedig éppen a bizonyítandó összefüggés. ■

A hatványozás szempontjából különlegesen viselkednek azok a kvadratikus mátrixok, amelyek


egy bizonyos kitevőjű hatvány a nullmátrix.

1.49.Definíció: Azt mondjuk, hogy az N mátrix nilpotens, ha létezik olyan n pozitív egész szám,
melyre teljesül, hogyNn–1 ≠ 0és Nn = 0.

116
Óbudai Egyetem BGK Fejezetek a matematikából

1.58.Példa: Mutassuk meg, hogy az alábbi mátrixok nilpotensek.

 4 5 4 
2 4  
a) N    ; b) M   3 3 3  ;
 1 2   1 2 1 

Valóban, számítással ellenőrizhető, hogy

 3 3 3 0 0 0
0 0    
N 
2
 ; b) M   0 0 0  ; M   0 0 0  ;
2 3

 0 0 
 3 3 3 0 0 0

Ez ugyanolyan meglepő tulajdonság, mint amit korábban már láttunk, hogy AB = 0


egyenlőségből nem következik az, hogy akár csak az egyik tényező a nullmátrix lenne. Ez
hasonló, mert arról van szó, hogy egy nullától különböző mátrixot hatványozva előbb-utóbb a
nullmátrixot kapjuk. Kérdés, hogy van-e valami kapcsolat a regularitás és ezen tulajdonság
között. A választ a következő állítás jellemzi.

1.57.Tétel: Ha az N mátrix nilpotens, akkor minden sajátértéke zérus.


Bizonyítás: Legyen s az N mátrix λ sajátértékhez tartozó sajátvektora. Ekkor igaz, hogy Ns = λs.
Mivel az N nilpotens, létezik olyan n pozitív egész szám melyre teljesül, hogyNn–1 ≠ 0és Nn = 0.
Szorozzuk meg az Ns = λs egyenlet mindkét oldalát balról az Nn–1 nem nulla mátrixszal. Ekkor a
nilpotencia miatt

0 = 0s = Nns = Nn–1Ns =Nn–1 λs = λNn–1s;

Mivel sajátvektor nem lehet nullvektor, továbbá a feltétel szerint Nn–1 ≠ 0, ezért a kapott szorzat
csak akkor lehet nullvektor, ha λ = 0, azaz a sajátérték zérus. ■

A nilpotnes mátrixok ezen tulajdonsága lehetőséget ad egy további jellemzésre. Mivel a


korábbiakból tudjuk, hogy a sajátértékek összege a mátrix nyoma, valamint a sajátértékek
szorzata a mátrix determinánsa, ezért egy nilpotens mátrix determinánsa is zérus, továbbá a
főátlóbeli elemek összeges is zérus.

Igazoltuk korábban, hogy egy mátrix pontosan akkor szinguláris ha a 0 valós szám sajátértéke.
Mivel a tétel szerint egy nilpotens mátrix minden sajátértéke zérus, egy nilpotens mátrix nem
lehet reguláris, azaz reguláris mátrixszal nem fordulhat elő, hogy egy pozitív egész kitevőjű
hatványa a nullmátrix. További érdekes kapcsolat van azonban a nilpotens mátrixok és a
regularitás között.

1.58.Tétel: Ha N nilpotens, Nn–1 ≠ 0és Nn = 0, akkor E – N reguláris, és E– N inverze a


következő formulával kapható.

(E– N)–1 = E + N + N2 + … + Nn–1 ;

117
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Végezzük el az alábbi szorzást.

(E– N)(E + N + N2 + … + Nn–1) = E + N + N2 + … + Nn–1 – N2 – … – Nn–1 – Nn = E – Nn = E

Ezzel az állítást igazoltuk. ■

Kvadratikus mátrixok hatványának értelmezése lehetőséget ad arra, hogy egy adott polinom
esetén a helyettesítési értéket úgy számítsuk, hogy a határozatlan helyére egy kvadratikus
mátrixot írunk.

1.50.Definíció: Legyen p( x)  an xn  an1x n1  ...  a2 x 2  a1x  a0 egy n-ed fokú polinom, és A
egy kvadratikus mátrix. A p(x) polinom A mátrix-helyen vett helyettesítési értékén a
következő mátrixot értjük.

p(A)  an An  an1An1  ...  a2 A2  a1A  a0E;

ahol E az egységmátrix.
 1 2
1.59.Példa: Számítsuk ki a p(x) = 3x2 – 5x + 2 polinom A    mátrix helyen vett
 3 4
 5 10 
helyettesítési értékét. Mivel A 2    ezért a helyettesítés a következő mátrixot adja.
 15 10

 5 10  1 2 1 0  18 20


p( A)  a2 A2  a1A  a0E  3   5  2  ;
 15 10  3 4 0 1   30 12 

Mátrixok és polinomok közötti kapcsolatra vonatkozó legalapvetőbb eredmény az alábbi tétel.

1.59.Tétel: (Cayley-Hamilton)
Minden kvadratikus A mátrix kielégíti a karakterisztikus egyenletét, azaz a helyettesítési érték a
nullmátrix. Tehát ha k(x) jelöli a karakterisztikus polinomot, akkor az állítás az, hogy

k(A) = 0;

Bizonyítás: Csak a másodrendű esetre végezzük el a bizonyítást, az általánosn-ed rendű eset iránt
érdeklődőknek a szakirodalmat javasoljuk.
a b 
Legyen tehát A    a másodrendű mátrix. Már korábban felírtuk erre az általános
c d 
másodrendű esetre a karakterisztikus polinom alakját. A határozatlant λ helyett x-szel jelölve ez a
következő.

k  x   x2   a  d  x   ad  bc  ;

Végezzük el a mátrix helyettesítéséta polinomba. A


118
Óbudai Egyetem BGK Fejezetek a matematikából

2
a b  a b  1 0
k  A     a  d      ad  bc   
c d  c d  0 1
 a 2  bc ab  bd   a 2  ad ab  bd   ad  bc 0  0 0
    
ad  bc  0 0 
;
 ac  cd bc  d   ac  cd ad  d 2   0
2

egyenlőség nyilvánvalóan teljesül. ■

1.60.Példa: Mutassuk meg, hogy az alábbi A mátrix kielégíti a karakterisztikus egyenletét.

1 1 1 
A  1 1 1 ;
0 1 2 

Egy korábbi példa szerint a karakterisztikus polinom a következő

k  x   det A  xE    x  2 x  1   x3  4 x 2  5x  2;
2

Helyettesítsük ebbe az A mátrixot. A következő adódik.

3 2
1 1 1  1 1 1  1 1 1  1 0 0 
k  A    A  4A  5A  2E   1 1 1  4 1 1 1  5 1 1 1  2 0 1 0  ;
3 2      
0 1 2  0 1 2  0 1 2  0 0 1 

Ha elvégezzük a hatványozásokat akkor kapjuk az alábbi egyenlőséget.

 3 7 11   0 3 4  1 1 1  1 0 0   0 0 0
k  A     3 1 3  4  2 1 2   5 1 1 1  2 0 1 0   0 0 0 ;
     
 4 7 12   1 3 5  0 1 2  0 0 1  0 0 0

Koordinátánként ellenőrizhető, hogy az egyenlőség valóban teljesül.

119
Óbudai Egyetem BGK Fejezetek a matematikából

1.13. Speciális mátrixok tulajdonságai


I. Háromszögmátrixok

Nagyon egyszerű állítást fogalmazhatunk meg háromszögmátrixok sajátértékeire vonatkozólag.

1.60.Tétel: Egy háromszögmátrix sajátértékei megegyeznek a főátlóbeli komponensekkel, azaz


λi = aii tetszőleges i = 1, 2, …, n esetén.
Bizonyítás: Részletezzük a felső háromszögmátrix esetét, az alsó háromszögmátrixra vonatkozó
bizonyítás nyilvánvaló módosítással ebből következik. Legyen tehát

 a11 a12 ... a1n 


0 a ... a2 n 
U 22
;
 ... ... ... ... 
 
0 0 ... ann 

egy felső háromszögmátrix. Ennek a mátrixnak a karakterisztikus polinomja nyilván úgy adódik,
hogy a karakterisztikus mátrix főátlóbeli elemeit összeszorozzuk, tehát a karakterisztikus
egyenlet a következő

 a11   a12 ... a1n 


 0 a22   ... a2 n 
det  U  E   det    a11      a22     ...   ann     0;
 ... ... ... ... 
 
 0 0 ... ann   

ugyanis a determináns kifejtésében szereplő n! számú tag között ez az egyetlen nullától


különböző. Ebből az egyenletből pedig már következik az állítás, hiszen nyilvánvaló, hogy a
gyökök éppen a főátló elemei. ■

1.61.Példa: A bizonyított tétel szerint, az

1 1 1 
A  0 3 1 ;
0 0 4 

mátrix sajátértékei a következők: 1  1, 2  3, 3  4 .

II. Szimmetrikus és ferdén szimmetrikus mátrixok

Elsőként másodrendű mátrixokkal kapcsolatosan teszünk észrevételeket, amelyek általánosan is


igazak, de a másodrendű esetben is célszerűnek tartjuk részletezni a bizonyítást.

120
Óbudai Egyetem BGK Fejezetek a matematikából

1.61.Tétel: Egy másodrendű szimmetrikus mátrix sajátértékei valósak, egy másodrendű ferdén
szimmetrikus mátrix sajátértékei tisztán imagináriusak.
Bizonyítás: Mint láttuk, az

a b 
A ;
c d 

mátrix karakterisztikus egyenlete a 2   a  d     ad  bc   0 másodfokú egyenlet. Állítsuk


elő ennek a gyökeit.

 a  d    a  d 2  4  ad  bc   a  d   a 2  2ad  d 2  4ad  4bc


1,2   
2 2
a  d   a 2  2ad  d 2  4bc  a  d    a  d 2  4bc
 
2 2

Ha a mátrix szimmetrikus, akkor értelmezés szerint b = c tehát a diszkrimináns

D   a  d   4b2 ;
2

nem negatív való szám, tehát az egyenletnek szükségképpen valós gyökei vannak.
Ha a mátrix ferdén szimmetrikus, akkor definíció szerint a = d = 0 és c = –b, tehát a
diszkrimináns D = –4b2, ahonnan a gyökök

4b2
1,2   ib
2

tisztán imagináriusak. ■

Természetesen a tétel csak elégséges feltétel és nem szükséges. A korábbiakban több olyan
mátrixot is láttunk, amelyek nem szimmetrikusak, sajátértékeik mégis valósak.

1.62.Példa: Határozzuk meg az alábbi másodrendű szimmetrikus mátrix sajátértékeit és


sajátvektorait.

4 2
A ;
2 1

Ellenőrizhető, hogy a két sajátérték, λ1 = 0 és λ2 = 5, tényleg valósak, a hozzájuk tartozó


sajátvektorok pedig a következők.

121
Óbudai Egyetem BGK Fejezetek a matematikából

 t  1  2t   2
s1    , t  R \ 0 ; például s1    ; s2    , t  R \ 0 ; például s2    ;
 2t   2 t  1

Két tényt kell hangsúlyoznunk. Egyrészt, hogy sajátérték lehet nulla. Sajátvektor definíció
szerint nem lehet nullvektor, de sajátérték lehet zérus is.
Másrészt pedig vegyük észre, hogy a kapott két sajátvektor ortogonális. Valóban

 1   2
s1 , s2    ,    2  2  0;
 2 1 

Ez abból adódik, hogy a mátrix szimmetrikus. Ez a szimmetrikus mátrixok általános


tulajdonsága. Szimmetrikus mátrixok esetében az ortogonalitásra és a sajátértékek valós voltára
vonatkozólag általános tételt igazolunk, de előtte bevezetünk néhány hasznos fogalmat.

Igen gyümölcsöző következményei vannak, ha összekapcsoljuk a mátrixokat a skaláris szorzat


fogalmával. Erre a kapcsolatra épülő vizsgálatok következnek az alábbiakban. Először
megvilágítjuk a szimmetrikus mátrixok és a skaláris szorzat kapcsolatát.

1.62.Tétel: Az ARn×n mátrix pontosan akkor szimmetrikus, azaz pontosan akkor teljesül, hogy
AT = A ha teljesül, hogy tetszőleges x, yRn esetén

Ax, y  x, Ay ;

Bizonyítás: Tegyük fel először, hogy AT = A. Ekkor a skaláris szorzat definíciója szerint igaz,
hogy

egyrészt Ax, y   Ax  y  xT AT y; másrészt x, Ay  xT  Ay   xT Ay;


T

innen az AT = A feltevésből az Ax, y  x, Ay egyenlőség már következik. Fordítva ha


feltesszük, hogy Ax, y  x, Ay , akkor ebből az előbbi gondolatmenet megismétlésével az
következik, hogy

xT AT y  xT Ay;

Kifejtve a bal és jobb oldalon álló háromtényezős szorzatokat, azt kapjuk, hogy egyrészt

 a11 a12 ... a1n   y1 


a a ... a2 n   y2  n n
xT Ay   x1 x2 ... xn   21 22   x a y ;
 ... ... ... ...   ...  i 1 j 1 i ij j
  
 an1 an 2 ... ann   yn 

122
Óbudai Egyetem BGK Fejezetek a matematikából

másrészt pedig

 a11 a21 ... an1   y1 


a a22 ... an 2   y2  n n
xT A T y   x1 x2 ... xn   12   x a y ;
 ... ... ... ...   ...  i 1 j 1 i ji j
  
 a1n a2 n ... ann   yn 

A két szorzat pontosan akkor lehet egyenlő tetszőleges x, yRn esetén, ha minden i, j = 1, 2, …,
n esetén teljesül, hogy aij = aji, azaz ha AT = A. ■

Felmerül a kérdés, hogy hogyan alakul a tételbeli egyenlőség az általános esetben, amikor nem
szimmetrikus a mátrix. Erre ad választ az alábbi állítás.

1.63.Tétel: Tetszőleges n-ed rendű kvadratikus mátrix és tetszőleges x, yRn esetén teljesül,
hogy

Ax, y  x, AT y ;

Bizonyítás: A skaláris szorzat definíciója szerint adódik, hogy egyrészt

Ax, y   Ax  y  xT AT y;
T

másrészt pedig a definíció alapján közvetlenül adódik, hogy

x, AT y  xT AT y;

A két skaláris szorzat valóban egyenlő. ■

A szimmetrikus mátrixokra igazolt tétellel analóg állítás fogalmazható meg ferdén szimmetrikus
mátrixokra.

1.64.Tétel: Az ARn×n mátrix pontosan akkor ferdén szimmetrikus, azaz pontosan akkor teljesül,
hogy AT = –A ha teljesül, hogy tetszőleges x, yRn esetén

Ax, y   x, Ay ;

Bizonyítás: Az állítás igazolása lényegében az előző gondolatmenet megismétlését igényli, azzal


a különbséggel, hogy itt azaij = aji feltételt helyettesíteni kell az aij = – aji feltétellel, és máris
kapjuk az állítást. ■

Ezek után igazolhatjuk a másodrendű esetre már bizonyított tételt az általános esetben.

123
Óbudai Egyetem BGK Fejezetek a matematikából

1.65.Tétel: Egy szimmetrikus mátrix sajátértékei valós számok.


Bizonyítás: Legyen tehát ARn×n szimmetrikus, azaz tegyük fel, hogy AT = A. Az előző tétel
szerint ez ekvivalens az Ax, y  x, Ay egyenlőség fennállásával, tetszőleges x és y esetén.
Tegyük fel, hogy λ az A mátrix egy sajátértéke és s a hozzá tartozó sajátvektor. Ekkor egyrészt
igaz, hogy

As, s  s, s   s, s ;

másrészt a komplex skaláris szorzat tulajdonságai alapján az is igaz, hogy

s, As  s, s   s, s ;

Mivel a feltétel szerint As, s  s, As , a számításokból következik, hogy

 s, s   s, s ; azaz   ;

és éppen ezt kellett igazolni, mert egy komplex szám pontosan akkor egyezik meg a
konjugáltjával, ha valós. ■

Az másodrendű esetben igazoltuk e tétel ferdén szimmetrikus mátrixokra vonatkozó párját. Ez is


igaz általánosan.

1.66.Tétel: Egy ferdén szimmetrikus mátrix sajátértékei tiszta imaginárius számok.


Bizonyítás: Az előző bizonyítás gondolatmenetén annyit kell változtatni, hogy figyelembe
vesszük a (–1) szorzót, tehát adódik, hogy

 s, s   s, s ; azaz      s, s  0;

Mivel sajátvektor nem lehet nullvektor, s, s  0 tehát szükségképpen     0 azaz    , ez


pedig pontosan akkor igaz, ha λ tisztán imaginárius. ■

Egy korábbi példában láttuk, hogy egy szimmetrikus mátrix sajátvektorai ortogonálisak voltak.
Ez a tulajdonság általánosan is igaz.

1.67.Tétel: Egy szimmetrikus mátrix különböző sajátértékeihez tartozó sajátvektorok


ortogonálisak.
Bizonyítás: Legyen A szimmetrikus azaz teljesüljön az Ax, y  x, Ay egyenlőség, ezen kívül
legyen λi és λj két különböző sajátérték és legyen si és sj rendre a két sajátértékhez tartozó
sajátvektor. Ekkor, mivel a sajátértékek valósak, felhasználva a szimmetriát és a skaláris szorzás
tulajdonságait írhatjuk, hogy

i si , s j  isi , s j  Asi , s j  si , As j  si ,  j s j   j si , s j ; i  j;

124
Óbudai Egyetem BGK Fejezetek a matematikából

Ebből az következik, hogy  i   j  si , s j  0 . Mivel a feltétel szerint a sajátértékek


különbözőek, adódik, hogy si , s j  0 , ami egyenértékű az állítással. ■

Ellenőrizzük ezeket az eredményeket konkrét esetekben.

1.63.Példa: Határozzuk meg az alábbi szimmetrikus mátrix sajátértékeit és sajátvektorait.


Igazoljuk a sajátvektorok ortogonalitását.

1 2 4 
A   2 2 2  ;

 4 2 1 

A korábbiakban mutatott módszerekkel adódik, hogy a mátrix sajátértékei a következők: λ1 = 6


egyszeres sajátérték és λ2,3 = –3 kétszeres sajátérték. A kétszeres algebrai multiplicitású sajátérték
geometriai multiplicitása is 2, így van három lineárisan független sajátvektor. Ezek rendre a
következők.

 2t  2  u  1  4v   4
s1   t  , t  0, pl.: s1   1  ; s 2   2u  , u  0, pl.: s 2   2  ; s3  2v  , v  0, pl.: s3  2  ;
         
 2t   2  0   0   5v   5 

A sajátértékek valóban mind valós számok. A sajátvektorok pedig valóban páronként


ortogonálisak, ugyanis könnyen látható, hogy teljesülnek az s1, s2  s1, s3  s2 , s3  0
egyenlőségek.

1.64.Példa: Határozzuk meg az alábbi ferdén szimmetrikus mátrix sajátértékeit és


sajátvektorait.

 0 2
A ;
 2 0 

Egyszerű számítással adódik, hogy a sajátértékek a λ1,2 = ± 2i konjugált komplex, ám valóban


tisztán imaginárius számok. A sajátvektorok pedig rendre a következők.

 it   i  iu  i 
s1    , t  0, pl.: s1    ; s2    , u  0, pl.: s2    ;
 t  1 u  1

125
Óbudai Egyetem BGK Fejezetek a matematikából

III. Ortogonális mátrixok

A skaláris szorzat felhasználásával definiálhatjuk mátrixok egy nagyon fontos osztályát.

Definíció: A QRn×n kvadratikus mátrixot ortogonálisnak nevezzük, ha oszlopvektorai


páronként ortogonálisak és minden oszlopvektor saját magával képezett skaláris szorzata 1, azaz
minden oszlopvektor egységvektor.Tehát haqiRn jelöli a Q mátrix i-edik oszlopvektorát, vagyis
a Q mátrix a

Q  q1 q2 ... qn  ;

alakban írható, ahol teljesül, hogy qi Tq j  0 ha i  j és qi Tqi  1, i  1, 2,..., n .

Ezt a tulajdonságot a következő módon is szokás írni.

1 ha i  j;
qi Tq j  ij  
0 ha i  j;

A δijszimbólum az ún. Kronecker-delta.

Vizsgáljuk meg ezen definíció következményeit. Képezzük az ortogonális Q mátrix


transzponáltját és szorozzuk meg Q-val. A páronkénti ortogonalitás és az oszlopvektorok
egységvektor mivoltának következtében kapjuk, hogy

q1T  1 0 ... 0 
 T 0
q 2  1 ... 0 
Q Q    q1 q 2 ... q n   
T
 E  R nn ;
... ... ... ... ...
   
qTn  0 0 ... 1 

Adódik tehát, hogy QTQ  E , amely egy nagyon fontos tulajdonsága az ortogonális
mátrixoknak.

1.68.Tétel: Ortogonális mátrix inverze megegyezik a transzponáltjával, azaz

Q1  QT

Bizonyítás: Az előző gondolatmenettel kaptuk, hogy QTQ  E . Definíció szerint azonban


Q1Q  E . Mivel reguláris kvadratikus mátrix inverze egyértelműen létezik ezért valóban igaz,
hogy Q1  QT . ■

A továbbiakban egy ortogonális mátrix determinánsára vonatkozólag fogalmazunk meg egy


állítást.
126
Óbudai Egyetem BGK Fejezetek a matematikából

1.69.Tétel: Egy ortogonális mátrix determinánsának abszolút értéke 1.


Bizonyítás: A determinánsok szorzástétele szerint

   
det QTQ  det QT det  Q   det E  1;

Másrészt viszont egy mátrix determinánsa egyenlő transzponáltjának determinánsával, tehát


 
det QT  det  Q  . Et figyelembe véve az előző egyenlőség  det Q 2  1 alakba írható, ami
igazolja az állítást. ■

Az ortogonális mátrixok és a skaláris szorzat kapcsolatát írja le az alábbi állítás.

1.70.Tétel: Ha Q ortogonális mátrix, akkor tetszőlegesx, yRn esetén teljesül, hogy

x, y  Qx, Qy ;

Bizonyítás: Használjuk fel a minden A mátrixra igaz, és a korábbiakban bizonyított összefüggést,


mely szerint Ax, y  x, AT y . Alkalmazzuk ezt egy ortogonális Q mátrixra. Felhasználva,
hogy QTQ  E , teljesül, hogy

Qx, Qy  x, QTQy  x, Ey  x, y ;

Ezt kellett igazolni. ■

Következményként megfogalmazhatjuk a tétel speciális esetét, amely a következő

x, x  Qx, Qx ;

ami azt jelenti, hogy az x és Qx vektorok hossza megegyezik. Tehát ha egy vektort egy
ortogonális mátrixszal szorozzuk, akkor a hossza nem változik meg.

Hasonlóan egyszerűen igazolható az ortogonális mátrixok sajátértékeire vonatkozó tétel.

1.71.Tétel: Egy ortogonális mátrix sajátértékeinek abszolút értéke 1.


Bizonyítás: Legyen λ a Q mátrix sajátértéke és s a hozzá tartozó sajátvektor. Ekkor Qs = λs.
Ebből következően

s, s  Qs, Qs  s, s   s, s ;

2 2
A komplex algebrából tudjuk, hogy    , az adódik, hogy   1 , ezt kellett igazolni. ■

127
Óbudai Egyetem BGK Fejezetek a matematikából

Egy ortogonális mátrix oszlopvektorainak rendszere nagyon különleges tulajdonságú. Ez a


tulajdonság alapvetően fontos a lineáris algebrában ezért elnevezést vezetünk be erre
vonatkozólag.

1.51.Definíció: A q1, q2, … , qn vektorrendszert ortogonális rendszernek nevezzük, ha teljesül,


hogy qi Tq j  0 ha i  j , azaz ha a vektorok páronként ortogonálisak.
Ha még az is teljesül, hogy a vektorok mindannyian egységvektorok, tehát teljesülnek a
qi Tqi  1, i  1, 2,..., n feltételek is, akkor a vektorrendszert ortonormált rendszernek nevezzük.

Ezen definíció szerint egy ortogonális Q mátrix oszlopvektorai ortonormált rendszert


alkotnak. De felmerülhet a kérdés, hogy ez a tulajdonság teljesül-e a sorvektorokra is. A válasz
pozitív.

1.72.Tétel: Egy ortogonális Q mátrix sorvektorai is ortonormált rendszert alkotnak.


Bizonyítás: A Q ortogonalitását úgy definiáltuk, hogy előírtuk, az oszlopvektorok skaláris
szorzataira teljesüljön a qi Tq j  0 ha i  j és qi Tqi  1, i  1, 2,..., n feltételrendszer. Ez
egyenértékű a QTQ  E egyenlőség fennállásával. Ha a sorvektorokra szeretnénk egy hasonló
állítást igazolni, nem kell mást tennünk, mint megvizsgálni a QQT szorzatot. Ha ez is egyenlő az
egységmátrixszal, akkor teljesül az állítás. Ez azonban igaz, ugyanis Q1  QT miatt

QQT  QQ1  E;

Ez pedig igazolja az állítást. ■

Mielőtt példákkal illusztrálnánk a mondottakat világítsunk rá az ortogonális vektorrendszer egy


alapvetően fontos tulajdonságára amely különösen a szimmetrikus mátrixok témakörében nagyon
fontos alkalmazásra talál.

1.73.Tétel: Egy ortonormált vektorrendszer vektorai lineárisan függetlenek.


Bizonyítás: Tegyük fel, hogy a q1, q2, … , qn vektorrendszer ortonormált, azaz teljesül, hogy
qi Tqi  1, i  1, 2,..., n valamint qi Tq j  0 ha i  j . Állítsuk elő a nullvektort ezen vektorok
lineáris kombinációjaként.
1q1  ...  iqi  ...  nqn  0;

Meg kell mutatnunk, hogy minden αi együttható zérus. Szorozzuk meg ennek érdekében az
egyenletet skalárisan a qi vektorral. Az ortogonalitás miatt n – 1 db skaláris szorzat zérus, csak
egy tag marad a bal oldalon
i qiTqi  qiT 0  0; i  1, 2,..., n;

ebből pedig következik, hogy minden αi együttható zérus, mert qi Tqi  1, i  1, 2,..., n . ■
Az igazolt tételből következik, hogy egy n-ed rendű ortogonális mátrix oszlopvektorai
szükségképpen lineárisan függetlenek, tehát egy n-ed rendű ortogonális mátrix rangja n.

128
Óbudai Egyetem BGK Fejezetek a matematikából

Ezek után lássunk példákat ortogonális mátrixokra. Ellenőrizzük, hogy teljesülnek-e a fent igazolt
tételekben szereplő tulajdonságok.

1.65.Példa: Mutassuk meg, hogy az alábbi mátrix ortogonális, határozzuk meg a sajátértékeket és
sajátvektorokat.

 1 1 
 2 2 
Q ;
 1 1 
 
2 2 

Világos, hogy az oszlopvektorok és a sorvektorok is ortonormált rendszert alkotnak, hiszen

2 2
 1   1  1 1 1 1 1  1 
     2  2  1; másrészt      0;
 2  2 2 2 2 2

A Q mátrix tehát ortogonális. Egyszerű számítással ellenőrizhető, hogy det(Q) = –1, a


sajátértékek λ1 = –1 és λ2 = 1, ezekben az esetekben az A – λE mátrix szinguláris, determinánsa
zérus. Mivel ez a mátrix ráadásul szimmetrikus is Q  QT , adódik, hogy Q1  QT  Q , tehát
ezen mátrix inverze saját maga. Teljesül, hogy QQ  E . Mivel a mátrix szimmetrikus, a
sajátvektorok ortogonális rendszert alkotnak. Ez valóban igaz, hiszen a sajátvektorok rendre az


s1  
t   
 1 2 t 
 , t  R \ 0 ; s 2    , t  R \ 0 ;

  1  2 t   t 

amelyek valóban ortogonálisak. Ennek a ténynek egyébként következménye, hogy ha kapott


sajátvektorokban úgy választjuk meg a t értékét, hogy azok egységvektorok legyenek, akkor
ezekből, mint oszlopvektorokból képezett mátrix ugyancsak ortogonális mátrix. Mivel
 
2
12  1  2  4  2 2 ezért a


 1 1  2  
 42 2 42 2 
Q1   ;


 1 2  1 

 4  2 2 4  2 2 

mátrix is ortogonális.

129
Óbudai Egyetem BGK Fejezetek a matematikából

1.66.Példa: A szimmetrikus mátrixok tanulmányozása során meghatároztuk az

1 2 4 
A   2 2 2  ;
 4 2 1 
mátrix sajátvektorait. Ezek a következők.

2 1  4
s1   1  ; s 2   2  ; s3   2 ;
   
 2  0   5 

Már ellenőriztük, hogy ezen vektorok páronként vett skaláris szorzata zérus. Ha minden vektort
elosztunk az abszolút értékével, akkor ortonormált rendszert kapunk. Az abszolút értékek a
következők.

s1  4  1  4  3; s2  1  4  5; s3  16  4  25  45  3 5;

Ezen eredményekből, következik, hogy a

 2 1 4 
 3 
 5 3 5
 1 2 2 
Q  ;

3 5 3 5 
 2 5 
 3 0
3 5 

mátrix ortogonális. Ennek oszlopvektorai tehát lineárisan függetlenek, azaz a Q mátrix rangja 3.
Számítsuk még ki a determinánsát.

2 1 4 2 1 4
3 5 3 5 3 5 3 5 5 2 5
1 2 2 5 10 1 3 3 1 5 5 4 5 
det Q    0       1;
3 5 3 5 3 3 5 5 2 5 5  9 9 

2 5 2 5 3 3
 0  0
3 3 5 3 3 5

Ahogyan azt egy korábbi állításban igazoltuk.

Speciális esetként megjegyezzük, hogy a permutáló mátrixok, és ezzel együtt az egységmátrix


is, ortogonális mátrixok. Ennek oka, hogy egy permutáló mátrixban minden oszlopban pontosan
egy 1-es van, de ez igaz minden sorra is, így ha két oszlop skaláris szorzatát képezzük, az 1-es

130
Óbudai Egyetem BGK Fejezetek a matematikából

biztosan 0-val szorzódik, tehát a skaláris szorzat zérus. Másfelől világos, hogy az oszlopvektorok
mind egységvektorok. Ebből következik, az alábbi egyszerű állítás.

1.74.Tétel: Egy permutáló mátrixok inverze egyenlő a transzponáltjával. Azaz ha P permutáló


mátrix, akkor P–1 = PT. ■

Csak érdekességként jegyezzük meg, az alábbi nyilvánvaló további következményt.

1.75.Tétel: Ha egy ortogonális mátrix szimmetrikus akkor inverze saját maga. ■

1.67.Példa: Az alábbi permutáló mátrix szimmetrikus, így inverze saját maga.

1 0 0 0
0 0 0 1  T
P ; P  P;  P 1  P;
0 0 1 0
 
0 1 0 0

131
Óbudai Egyetem BGK Fejezetek a matematikából

1.14. Ortogonális projekciók. Lineáris egyenletrendszer legjobban


közelítő megoldása, a legkisebb négyzetek módszere
Az alábbiakban a merőleges vetítés általánosításával és érdekes következményeivel foglakozunk.
Tegyük fel, hogy a P mátrix egy vektort vetít egy egyenesre, síkra, lineáris altérre. Ha a vetületre
alkalmazzuk ismét a P mátrixot, akkor onnantól az már a helybenhagyást jelenti. Ha tehát a b
vektort vetíti a P mátrix, akkor Pb a vetület. Ha azonban a vetületet vetítjük, akkor kapjuk, hogy

PPb = Pb, azaz P2 = P.

Ez természetesen magasabb kitevőjű hatványokra is igaz, tehát ha P vetít, akkor igaz, hogy
Pn= P ha n> 1. Ez az oka az alábbi definíciónak.

1.52.Definíció: A kvadratikus P mátrixot projektor mátrixnak (projekció mátrixnak) nevezzük,


ha teljesül, hogy P2 = P.

Az alábbiakban néhány esetben előállítjuk a projektor mátrixot, de előtte egy két egyszerű
tulajdonságot megvizsgálunk.

Először is nyilvánvaló, hogy az E egységmátrix projektor mátrix, továbbá a nullmátrix is


projektor mátrix, hiszen mindkettőre nyilván teljesül a P2 = Pegyenlőség, ugyanis nyilván igaz,
hogy E2 = E és 02 = 0. Az első esetben az E projektor mátrix sajátértéke az 1, a nullmátrix
sajátértéke pedig nyilván a nulla és mindkét sajátérték multiplicitása n. A helyzet az, hogy más
eset nem fordulhat elő.

1.76.Tétel: Egy projektormátrix sajátértéke vagy 0 vagy 1.


Bizonyítás: Legyen s a λ sajátértékhez tartozó sajátvektor. Ekkor teljesül, hogy Ps = λs.
Szorozzuk meg az egyenlet mindkét oldalát P-vel balról.Mivel P2 = P ezért azt kapjuk, hogy

P2s = Pλs = λPs = λλs = λ2s

Másrészt ugyancsak a P2 = P egyenlőségből következik, hogy P2s = Ps, ahonnan azt kapjuk,
hogy λ2s = λs. Azaz (λ2 – λ)s = 0. Mivel sajátvektor nem lehet nullvektor, kapjuk, hogy
λ2 – λ = 0, ahonnan következik az állítás. ■

Korábban igazoltuk, hogy egy mátrix pontosan akkor szinguláris ha a 0sajátértéke. Eszerint a
projektor mátrixok egy része szinguláris. Kérdés, melyek a reguláris projektorok. Erre válaszol az
alábbi állítás.

1.77.Tétel: Az egyetlen reguláris projektor mátrix az egységmátrix.


Bizonyítás: Legyen a P projektor mátrix. Ekkor P2 = P. Átrendezve azt kapjuk, hogy P2 – P = 0.
Kiemelve P-t az adódik, hogy P(P – E) = 0. Tegyük fel, hogy P reguláris, azaz létezik P–1
inverze. Szorozzuk meg vele az egyenletet. Azt kapjuk, hogy

P–1P(P – E) = 0;E(P – E) = 0; P – E = 0 tehátP = E.

132
Óbudai Egyetem BGK Fejezetek a matematikából

Ezt kellett igazolni. ■

Ezek szerint, az alkalmazások szempontjából érdektelen egységmátrix kivételével, minden


projektor mátrix szinguláris.

Ezek után előállítjuk konkrét esetekben a projekciót megvalósító mátrixot.

I. Merőleges vetítés egyenesre.

Tűzzük ki a következő feladatot. Adott egy a vektor és egy vele nem párhuzamos b vektor.
Állítsuk elő a b vektor a-val párhuzamos összetevőjét. A keresett vektor természetesen a b vektor
a-irányú merőleges vetülete.

b – xa b – xa ┴xa

a
xa

A vetületet azzal a feltétellel határozzuk meg, hogy a b vektornak és vetületének különbsége a


merőleges vetítés értelmezése szerint merőleges az a vektorra. Fejezzük ki b vetületét úgy, mint
az a vektor konstansszorosa, azaz xa, alkalmas x valós szám esetén. Kérdés, mi az x értéke.Ennek
meghatározásához a feltétel az, hogy b – xa ortogonális a-ra, tehát skaláris szorzatuk zérus.

b  xa, a  0; azaz  b  xa  a  0; tehát bTa  xaTa  0;


T

Ebből pedig adódik a keresett x skalár és a vetületvektor.

bT a bTa
x  T ; másrészt a vetületvektor xa  T a;
a a a a

1.68.Példa: Határozzuk meg a b = [1 2 –3]T vektor a = [–1 3 1]T irányú merőleges vetületét.
Alkalmazzuk a kapott összefüggést. Kiszámítjuk a szükséges skaláris szorzatokat.

bTa = –1 + 6 – 3 = 2; aTa = 1 + 9 + 1 = 11;

Ebből adódóan a merőleges vetület a következő.

T
2 2  2 6 2 
a   1 3 1  
T
xa  ;
11 11  11 11 11

„mellékeredményként” kiszámíthatjuk a b – xa vektort – a következő pontban erre is szükség lesz


–. A vetület felhasználásával adódik, hogy

133
Óbudai Egyetem BGK Fejezetek a matematikából

T T
2  2 6 2  13 16 35 
a  1 2 3  
T
b  xa  b    ;
11  11 11 11 11 11 11 

Ellenőrizhetjük, hogy a két vektor valóban ortogonális.

T
13 16 35   2 6 2  26  96  70
b  xa, a        0;
11 11 11   11 11 11 121

A számítások eredménye a következő. Felbontottuk a b vektort a-irányú és a-ra ortogonális


komponensek összegére.

Általánosítsuk a problémát, de ne csak a két dimenziós síkra, hanem általánosan egy altérre.

II. Merőleges vetítés lineáris altérre.

Tegyük fel, hogy egy n-dimenziós L lineáris térben adva van egy L’ altér, amelynek egy bázisa az
a1, a2, …, ar vektorrendszer. Foglaljuk össze ezeket a vektorokat egy A mátrixba úgy, hogy ezen
vektorok legyenek az A mátrix oszlopvektorai. Az A mátrixról tehát az alábbiakat mondhatjuk,
mérete n×r, mert r db n dimenziós oszlopvektor alkotja, és a feltételek szerint rangja ρ = r, hiszen
az r db oszlopvektor lineárisan független. Tegyük fel, hogy az L-beli b vektor nincs benne az A
mátrix oszlopvektorai által kifeszített altérben, tehát L’-ben. Határozzuk meg a b vektor
ortogonális vetületét az L’ altérre vonatkozólag. Ehhez azonban szükség van egy definícióra.

1.53.Definíció: Azt mondjuk, hogy az y vektor ortogonális az L’ altérre, ha ortogonális az altér


minden vektorára.

Az ortogonalitás vizsgálatához azonban nem szükséges az összes vektort figyelembe venni.

1.78.Tétel: Egy y vektor ortogonális az L’ altérre, ha ortogonális az L’ valamely bázisának


minden vektorára.
Bizonyítás: Legyen L’ egy bázisa a b1, b2, …, br vektorrendszer. Mivel ez bázis, az altér minden
x vektora előáll ezen vektorok lineáris kombinációjakét. Legyen ez az előállítás a következő

x  1b1  2b2  ...  r br ;

képezzük ennek a skaláris szorzatát az y vektorral A skaláris szorzat disztributivitása miatt


írhatjuk, hogy

x, y  1 b1, y  2 b2 , y  ...  r br , y ;

Ez az összeg valóban zérus, ha minden bázisvektorra teljesül, hogy bi , y  0; i  1, 2,..., r . ■


Ezek után a logika pontosan az, amit az egyenesre vonatkozó vetítésnél követtünk.

134
Óbudai Egyetem BGK Fejezetek a matematikából

b
b – Ax
b – Ax ┴ Ax
ar
Ax
a1

A b vektor vetülete egyrészt nyilván felírható a bázis, vagyis az A oszlopvektorainak lineáris


kombinációjaként, tehát a vetület Ax alakú. A b vektornak és a vetületnek a különbsége definíció
szerint ortogonális az altérre, így ortogonális az A oszlopvektoraira. Írjuk fel az ortogonalitás
feltételeit.

a1T  b  Ax   0; aT2  b  Ax   0; ..., aTr b  Ax   0;

Ez az r db egyenletrendszer egyetlen mátrixegyenletté foglalható össze.

AT  b  Ax   0;

Ha elvégezzük a zárójel felbontását és rendezzük az egyenletet, azt kapjuk, hogy

AT Ax  ATb;

Ezt az egyenletet Gauss-féle normálegyenletnek nevezzük. Ennek a megoldása szolgáltatja azt


az x vektort, amely a vetület lineáris kombinációjának együtthatóit tartalmazza. Ha az An×r
méretű mátrix, akkor transzponáltja r×n méretű, így az ATA szorzatnak mindig van értelme,
ráadásul mindig kvadratikus mátrix, mérete r×r.
Kérdés, hogy megoldható-e a Gauss-féle normálegyenlet az x vektorra. Nyilvánvalóan igen, ha az
ATA szorzat reguláris mátrix, azaz ha rangja r, mert ekkor invertálható. Ez azonban igaz, ha az A
mátrix rangja r. A tétel megfogalmazása előtt bevezetünk egy elnevezést.

1.54.Definíció: Az ATAmátrixotGram-féle mátrix-nak nevezzük.

Vegyük észre, hogy a Gram-féle mátrix komponensei a mátrix oszlopvektorainak skaláris


szorzatai „az összes lehetséges módon párosítva” az oszlopvektorokat. Tehát, ha az A mátrix
oszlopvektorait szokás szerint ai (i = 1, 2, …, r) jelöli, akkor a Gram-féle mátrix a következő.

a1T   a1 , a1 a1 , a 2 ... a1 , a r 
 T  
a 2  a ,a a2 , a2 ... a2 , ar 
A A    a1 a 2 ... a r    2 1
T
;
...  ... ... ... ... 
   
aTr   a r , a1 ar , a2 ... a r , a r 

A Gram-féle mátrix determinánsát Gram-determinánsnak nevezzük.


135
Óbudai Egyetem BGK Fejezetek a matematikából

a1 , a1 a1 , a 2 ... a1 , a r
a 2 , a1 a2 , a2 ... a2 , ar
G  a1 , a 2 ,..., a r   ;
... ... ... ...
a r , a1 ar , a2 ... ar , ar

A Gram-determináns nagyon hasznos fogalom. Lehetővé teszi, hogy egyszerű módon eldöntsük,
hogy egy vektorrendszer lineárisan összefüggő vagy lineárisan független. Igaz ugyanis az alábbi
állítás.

1.79.Tétel: A G  a1, a2 ,..., ar  Gram-determináns értéke akkor és csak akkor zérus, ha az


a1, a2 ,..., ar vektorok lineárisan összefüggenek.
Bizonyítás: Az a1, a2 ,..., ar vektorrendszer az értelmezés szerint akkor és csak akkor lineárisan
összefüggő, ha teljesül, hogy

x1a1  x2a2  ...  xr ar  0

esetén legalább az egyik xj együttható nem nulla. Szorozzuk most meg ezt az egyenletet
skalárisan az ai vektorral minden i = 1, 2, …, r esetén. Azt kapjuk, hogy

x1 a1, ai  x2 a2 , ai  ...  xr ar , ai  0; i  1, 2,..., r;

Amit kaptunk, egy r db egyenletből álló homogén lineáris egyenletrendszer, melynek


determinánsa éppen a Gram-determináns. Az egyenletrendszerek elméletéből pedig tudjuk, hogy
pontosan akkor létezik triviálistól eltérő megoldás, ha a determináns zérus. Éppen ezt kellett
igazolni. ■

1.80.Tétel: Ha az n×r méretű A mátrix rangja r, akkor az ATAGram-féle mátrix reguláris.


Bizonyítás: Az előző tételből következik, hogy ha az A oszlopvektorai lineárisan függetlenek,
akkor ATA determinánsa nem zérus. Ha nem zérus a determináns, akkor viszont létezik inverz,
tehát a Gram-mátrix valóban reguláris. A lineáris függetlenség pedig a rang definíciójából
következik, hiszen feltettük, hogy az A mátrix rangja r, tehát az r db oszlopa lineárisan független.

Tudjuk tehát, hogy az inverz mátrix létezik. Ekkor szorozzuk meg ezzel a Gauss-féle
normálegyenletet balról. Azt kapjuk, hogy a megoldás

 
1
x  AT A ATb;

másrészt kapjuk a vetületvektort is. Ugyanis a vetületvektor nem más, mint Ax tehát

136
Óbudai Egyetem BGK Fejezetek a matematikából

 
1
Ax  A AT A ATb;

 
1
Kaptuk tehát, hogy a b vektor vetülete az A mátrix oszlopvektor-terére az A AT A A Tb
vektor. Eszerint a b vektort egy projektor mátrixszal szorozzuk. Igazoljuk ezt az állítást.

 
1
1.81.Tétel: A P  A AT A AT mátrix projektor mátrix.
Bizonyítás: Azt kell igazolnunk, hogy P2 = P. Ez valóban teljesül. Az asszociativitás miatt
ugyanis

     A A  A A     
2
P 2   A AT A AT   A AT A
1 1 1 1 1
T T
AT  A AT A EAT  A AT A AT ;
 

Valóban projektor mátrix, tehát egy merőleges vetítést határoz meg. ■

Korábban igazoltuk, hogy az egyetlen reguláris projektor mátrix az egységmátrix. Ebből


 
1
következik, hogy az n×n méretű A AT A AT mátrix szinguláris.

A Gauss-féle normálegyenlet segítségével egy további problémát is meg tudunk oldani.Tegyük


fel, hogy feladat az Ax = b lineáris egyenletrendszer megoldása abban az esetben, amikor b nem
kompatibilis az A mátrix oszlopvektoraival, azaz nincs benne az oszlopvektorok által kifeszített
altérben. Ez a leggyakrabban akkor fordul elő, ha a rendszer „túlhatározott” azaz több az
egyenlet, mint az ismeretlenek száma. Ebben az esetben természetesen nincs egzakt megoldás.
Kérdés, hogy akkor ebben az esetben milyen módon definiáljuk a „megoldás”-t. Ebben a
szituációban az ún. legjobban közelítő megoldást keressük. Mivel olyan x vektor nincs amelyre
Ax = b teljesülne, keressük azt az x vektort, amelyre az Ax  b eltérés minimális.

1.55.Definíció: Az Ax = b,ARn×k, bRn lineáris egyenletrendszer azon xRk megoldását,


melyre teljesül, hogy az Ax  b eltérés minimális, az egyenletrendszer legjobban közelítő
megoldásának nevezzük.

Ha áttérünk a vektorok koordinátáira, illetve figyelembe veszsük az A mátrix komponenseit,


akkor a szokásos jelölésekkel azt kapjuk, hogy a legjobban közelítő megoldás az

2 2
 k  n  k 
   Ax i  bi 
n 2 n
    aij x j  bi   min     aij x j  bi   min;
i 1 i 1  j 1  i 1  j 1 

formulával van definiálva. A legjobban közelítő megoldás tehát a legkisebb négyzetek


feladatával egyenértékű.

Világos, hogy ha b benne van az A oszlopvektor terében, akkor a rendszer megoldható, tehát
létezik olyan x amelyre egzaktul teljesül, hogy Ax = b. Ekkor természetesen az Ax  b eltérés

137
Óbudai Egyetem BGK Fejezetek a matematikából

zérus. A felvetett probléma pontosan akkor „érdekes” amikor a rendszernek nem létezik egzakt
megoldása. A legjobban közelítő megoldás előállítása a Gauss-féle normálegyenlet megoldásával
állítható elő.

1.82.Tétel: Az Ax = b,ARn×k, bRn lineáris egyenletrendszer legjobban közelítő megoldását az

AT Ax  ATb;

Gauss-féle normálegyenlet megoldása szolgáltatja.


Bizonyítás: A fentiekben megmutattuk, hogy a Gauss-féle normálegyenlet megoldása pontosan a
b vektor merőleges vetülete az A mátrix oszlopterére. Ebből következik, hogy a b – Ax vektor
ortogonális az oszloptérre, erről pedig nyilvánvaló, hogy a minimális távolságot jelenti a b vektor
és az oszloptér között. ■

Összefoglalva, azt mondhatjuk tehát, hogy ha az Ax = b egyenletrendszernek nem létezik


megoldása, akkor megoldjuk az AT Ax  ATb Gauss-féle normálegyenletet, és megkapjuk a
rendszer legjobban közelítő megoldását.

A fentieket alkalmazzuk a legkisebb négyzetek feladatának lineáris algebrai apparátussal történő


megoldására.

A probléma a következő. Mérési adatpárok, megfigyeléssel kapott értékpárok esetén valamely


függvénykapcsolatot keresünk az összetartozó értékek között. A függvénykapcsolat gyakran
elsőfokú függvény, tehát egyenes, néha másodfokú polinom, esetleg magasabb fokú polinom.
Tudjuk, hogy n + 1 db alappont esetén egyértelműn létezik egy n-ed fokú interpolációs polinom,
amely illeszkedik az alappontokra. A gyakorlatban azonban nem két pontra illesztünk egyenest,
és nem három pontra illesztünk másodfokú polinomot, stb, mert a megfigyelésből kapott adatok
száma több, mint ami az egyértelműséghez szükséges. Azt mondhatjuk tehát, hogy egy
túlhatározott probléma előtt állunk, több az egyenlet mint az ismeretlen. Ekkor keressük azt az,
első, másod, stb. fokú polinomot, amely a „legjobban illeszkedik” a méréssel, megfigyeléssel
kapott pontokra. Ez a legkisebb négyzetek feladata. Az alábbiakban konkrétan megvizsgálunk
két problémát.

I. Egyenes illesztése a legkisebb négyzetek módszerével

Tűzzünk ki egy konkrét problémát.

1.69.Példa: Keressük meg az (1,1), (2,2), (3,2) pontokra a legkisebb négyzetek feladata szerint
legjobban illeszkedő egyenes egyenletét. Az egyszerű és áttekinthető számítások kedvéért
választottunk ilyen kevés pontot. Azonban a pontok száma több, mint kettő, tehát egyértelműen
nem illeszthető rájuk egyenes, és az is világos, hogy a három pont nem kollineáris. Keressük az
egyenes egyenletét y = ax + b alakban. Keressük az a és b együtthatókat. A megoldandó
egyenletrendszer a következő.

138
Óbudai Egyetem BGK Fejezetek a matematikából

 1a  b  1; 1 1 1  1 1 1 
   a        a 
2a  b  2; azaz 2 1    2  ; jelöléseink : A  2 1 ; b  2  ; x    ;
3a  b  2; b    b 
  3 1 2  3 1  2 

Világos, hogy a rendszer túlhatározott, mert csak két ismeretlen van de három egyenlet, és az is
világos, hogy a rendszernek nincs egzakt megoldása, ami szemléletes azt jelenti, hogy a három
pont nincs egy egyenesen. Keressük tehát a legjobban közelítő megoldást. Ehhez, mint azt
fentebb igazoltuk, a Gauss féle normálegyenletet kell megoldani. Ehhez szükségesek az alábbi
számítások.

1 1
1 2 3 T 14 6
A   2 1 ; A T    ;A A  
6 3
;
 3 1 1 1 1 

Világos, hogy az A rangja kettő, mert oszlopvektorai lineárisan függetlenek, és az is látható, hogy
ATA reguláris, mert determinánsa 42 – 36 = 6 ≠ 0. Tehát a Gauss-féle normálegyenlet
megoldható invertálással.

1  3 6 1  3 6 1 2 3 1  3 0 3 
 A A  
1 1
T
   ; AT A AT   
6  6 14  1 1 1 6  8 2 4 
;
6  6 14 

Innen pedig már adódik a normálegyenlet megoldása.

1   1 
a  1  3 0 3     2 
 
1
x     AT A ATb   2   ;
b  6  8 2 4    2 
 2 
 3 
Azt kaptuk tehát, hogy a három pontra legjobban illeszkedő egyenes egyenlete a következő.

1 2
y x ;
2 3

A problémát általánosan is megfogalmazzuk. Tegyük fel, hogy adottak az  xi , yi  , i  1, 2,..., n


alappontok. Ezekre szeretnék egy y = ax + b alakú egyenest illeszteni úgy, hogy az eltérések
négyzeteinek összege minimális legyen. Az egyenletrendszerek nyelvén fogalmazva,
meghatározandó az Ax = b rendszer legjobban közelítő megoldása, ahol

 x1 1   y1 
x  y 
1 a 
A 2  R n2 ; b   2   R n ; x     R 2 ;
... ... ...  b 
   
 xn 1   yn 

139
Óbudai Egyetem BGK Fejezetek a matematikából

Az egyenes két paraméterét az

a 
 
1
x     AT A ATb;
b 

formula szolgáltatja.

II. Parabola illesztése a legkisebb négyzetek módszerével

Tűzzük ki most azt a problémát, hogy méréssel kapott pontokra – melyek száma nagyobb, mint
három – illesszünk parabolát a legkisebb négyzetek módszerével.

1.70.Példa: Ismét csak az egyszerűség kedvéért válasszunk 4 db pontot, legyenek ezek


(0,1), (2,0), (3,0) és (4,1). Illesszük legjobban közelítő parabolát ezekre. Keressük az egyenletet
y = ax2 + bx + c alakban. Meghatározandók az a, b és c együtthatók. A pontok száma nagyobb,
mint három, tehát egyértelműen nem illeszthető parabola a pontokra. Az egyenletrendszer
amelyet felírhatunk a következő.

 a  02  b  0  c  1; 0 0 1 1  0 0 1 1 
 4  a    4  0  a 
a  2  b  2  c  0;
2
2 1   0 
; x   b  ;
2 1
 azaz  b  ; jelöléseink : A   ;b   
 a  3  b  3  c  0;
2 9 3 1   0 9 3 1 0
    c         c 
 a  4 2
 b  4  c  1; 16 4 1 1  16 4 1 1 

Oldjuk meg a Gauss-féle normálegyenletet.

0 0 1
4 0 4 9 16  353 99 29
1 T 
; A  0 2 3 4  ; A A   99 29 9  ;

2
A T
9 3 1
  1 1 1 1   29 9 4 
16 4 1

Szükségünk van a Gram-féle mátrix inverzére.

 0, 0795 0,3068 0,1136 


 A A   0,3068 1, 2977 0, 6955 ;
1
T

 0,1136 0, 6955 0,9909 

A még elvégzendő műveletek az alábbiak.

140
Óbudai Egyetem BGK Fejezetek a matematikából

 0, 0795 0,3068 0,1136  0 4 9 16 


A A A   0,3068 1, 2977 0, 6955 0 2 3 4  
T 1 T

 0,1136 0, 6955 0,9909  1 1 1 1 


 0,1136 0,1818 0, 0909 0,1591 
  0, 6955 0, 6727 0, 4364 0, 4136  ;
 0,9909 0, 0545 0, 0727 0, 0273 

Innen pedig már adódik a parabola három együtthatója.

1 
a   0,1136 0,1818 0, 0909 0,1591     0, 2727 

x   b   AT A  A Tb   0, 6955 0, 6727 0, 4364 0, 4136      1,1091 ;
1 0
0 
 c   0,9909 0, 0545 0, 0727 0, 0273     1, 0182 
1 

Kaptuk tehát, hogy az alappontokat négyzetesen legjobban közelítő parabola egyenlete a


következő.

y  0, 2727 x2  1,1091x  1,0182;

A parabola illesztés feladatát megfogalmazzuk általánosan is. Legyenek adottak az


 xi , yi  , i  1, 2,..., n alappontok. Ezekre szeretnék egy y = ax2 + bx + c alakú parabolát illeszteni
úgy, hogy az eltérések négyzeteinek összege minimális legyen. A kérdés az a, b és c együtthatók
értéke. Az egyenletrendszerek nyelvén fogalmazva, meghatározandó az Ax = b rendszer
legjobban közelítő megoldása, ahol

 x12 x1 1  y1 
 2    a 
x x2 1 
 R ; b     R ; x   b   R 3 ;
n3 y
A 2 
2 n
... ... ... ... 
     c 
 xn2 xn 1   yn 

A parabola három paraméterét az

a 

x   b   AT A 
1
A Tb;
 c 

formula szolgáltatja.

141
Óbudai Egyetem BGK Fejezetek a matematikából

1.15. Gram-Schmidt-féle ortogonalizáció. Reguláris mátrixok


QR-felbontása
Gyakran van szükség ortogonális sőt ortonormált vektorrendszerre. Az alábbiakban azt
vizsgáljuk, hogyan lehet egy lineárisan független vektorrendszerből, vagy még konkrétabban
bázisból ortogonális bázist előállítani. Az eljárást Gram-Schmidt-féle ortogonalizációnak
nevezzük. Felhasználjuk az előző pontban tárgyalt ortogonális projekció módszerét.

Tegyük fel, hogy a b1, b2, …, bn vektorrendszer bázis, de a bázisvektorok nem ortogonálisak.
Állítsunk elő ebből egy olyan q1, q2, …, qn bázist, amelyre teljesül, hogy qiTqj = 0 ha i ≠ j, tehát
az új bázis vektorai páronként ortogonálisak.

Az ortogonális bázis vektorait lépésenként határozzuk meg.

1. lépés: Legyen az első lépésben q1 = b1.

2. lépés: A második vektort úgy határozzuk meg, hogy képezzük a b2 vektor q1 = b1 irányú
ortogonális vetületét, és q2 a b2 és a vetület különbsége lesz. Ez értelmezés szerint ortogonális a
q1 = b1 vektorra. Legyen tehát a

q2 = b2 – α12q1

vektor ortogonális a q1 vektorra. Ez lehetőséget ad az α12 kiszámítására. Ugyanis

b2 , q1
q 2 , q1  b 2 , q1  12 q1 , q1  0; ahonnan 12  ;
q1 , q1

Ezzel megkaptuk a q2 vektort, amely merőleges a q1 vektorra.

3. lépés: Folytatjuk az eljárást. Ebben a lépésben a b3 vektort cseréljük le egy olyan vektorra,
amely ortogonális a q1 és q2 vektorok mindegyikére. Ennek érdekében vetítjük a b3 vektort a q1
és q2 vektorok által kifeszített altérre majd képezzük a b3 és a vetület különbségét, amely
ortogonális az altérre. Legyen tehát a

q3 = b3 – α13q1– α23q2

vektor ortogonális a q1 és q2 vektorokra, azaz megköveteljük, hogy teljesüljenek a

b3 , q1
q3 , q1  b3 , q1  13 q1 , q1  0; ahonnan 13  ;
q1 , q1
b3 , q 2
q3 , q 2  b3 , q 2   23 q 2 , q 2  0; ahonnan  23  ;
q2 , q2

142
Óbudai Egyetem BGK Fejezetek a matematikából

feltételek. A számítások során figyelembe vettük, hogy a q1 és q2 vektorok ortogonálisak, így


skaláris szorzatuk zérus.
Hasonlóan képezzük a további vektorokat.

n. lépés: Ha az előző logika ismétlésével feltesszük, hogy már előállítottuk a q1, q2, …, qn–1
páronként ortogonális vektorokat, akkor a qn vektor előállítása a következőképpen történik. A bn
vektort ortogonálisan vetítjük a q1, q2, …, qn–1 vektorok által kifeszített altérre, majd képezzük a
vektor és a vetület különbségét. Megköveteljük tehát, hogy a

qn = bn – α1nq1– α2nq2 –…–αn–1,nqn–1

vektor ortogonális legyen a q1, q2, …, qn–1 vektorok mindegyikére. Tekintettel arra, hogy ezek a
vektorok már páronként ortogonálisak, a merőlegességi feltételek a következőre redukálódnak.

b n , q1
q n , q1  b n , q1  1n q1 , q1  0; ahonnan 1n  ;
q1 , q1
bn , q2
q n , q 2  b n , q 2   2 n q 2 , q 2  0; ahonnan  2 n  ;
q2 , q2
...
b n , q n 1
q n , q n 1  b n , q n 1   n 1,n q n 1 , q n 1  0; ahonnan  n 1,n  ;
q n1 , q n1

Megkaptuk tehát a keresett együtthatókat, az ortogonális bázist előállítottuk.

A korábbiak fényében könnyen látható, hogy a kapott vektorrendszer valóban bázis, ha a


kiindulási vektorrendszer bázis volt. Egy n-dimenziós térben ugyanis bármely n-db lineárisan
független vektorból álló vektorrendszer bázis. A vektorok száma n, csak azt kell megmutatni,
hogy a vektorrendszer lineárisan független. Ehhez felírjuk a Gram-determinánst. Ennek értéke a
páronkénti ortogonalitás miatt

q1 , q1 q1 , q 2 ... q1 , q n q1 , q1 0 ... 0
q 2 , q1 q2 , q2 ... q2 , qn 0 q2 , q2 ... 0
G  q1 , q 2 ,..., q n    
... ... ... ... ... ... ... ...
q n , q1 qn , q2 ... qn , qn 0 0 ... qn , qn
n
  qi , qi  0;
i1

valóban nem nulla, tehát az ortogonalizációval kapott vektorrendszer lineárisan független, tehát
ha bázisból indultunk ki, akkor bázist kapunk.
Gyakran fontos, hogy az ortogonális bázis egyben ortonormált, tehát az ortogonális bázis
minden vektora egységnyi hosszúságú legyen. Ez könnyen elérhető, ha tudjuk, hogy a bázis
ortogonális. Nem kell mást tenni, minden egyes bázisvektort el kell osztani az abszolút értékével.

143
Óbudai Egyetem BGK Fejezetek a matematikából

qi
Tehát az ortonormált bázis vektorai a qi0  ; i  1, 2,..., n; vektorok. Ezekre teljesül, hogy
qi
qi0 , q0j  0 ha i ≠ j és qi0 , q0j  1 ha i = j. Ebből következik, hogy egy ortonormált bázis
Gram-féle mátrixa az egységmátrix, a Gram-determináns értéke pedig 1.

q10 , q10 0 ... 0


1 0 ... 0
q02 , q02
 
0 ... 0 0 1 ... 0
G q10 , q02 ,..., q0n    1;
... ... ... ... ... ... ... ...
0 0 ... 1
0 0 ... q0n , q0n

1.71.Példa: Ortogonalizáljuk Gram-Schmidt ortogonalizációs eljárással az R3 alábbi bázisát.

1  1  0
b1  0 ; b 2  1  ; b3  1  ;
   
1  0  1 

Könnyen látható, hogy ez a három vektor bázist alkot R3-ban. Képezzük ugyanis a Gram-
determinánst. Ehhez kellenek a következő skaláris szorzatok.

b1, b1  b2 , b2  b3 , b3  2; b1, b2  b1, b3  b2 , b3  1;

Ezek alapján a determináns a következő.

2 1 1
G  b1 , b 2 , b3   1 2 1  4  0;
1 1 2

Ez különbözik 0-tól tehát a vektorok lineárisan függetlenek, tehát a vektorrendszer valóban bázis.
ortogonalizáljuk ezt a vektorrendszert.

1. lépés: Legyen q1  b1  1 0 1 ;
T

b 2 , q1
2. lépés: Legyen q2 = b2 – α12q1 ahol 12  . Figyelembe véve, hogy q1  b1 kapjuk,
q1 , q1
b 2 , q1 b 2 , b1 1
hogy 12    . Ebből következően
q1 , q1 b1 , b1 2

144
Óbudai Egyetem BGK Fejezetek a matematikából

1  1  T
1   1   1 1
q 2  b 2  q1  1   0   1   ;
2 2 2 2
0 1 

b3 , q1 b3 , q 2
3. lépés: Legyen q3 = b3 – α13q1– α23q2 ahol 13  ,  23  . Számítsuk ki a
q1 , q1 q2 , q2
szükséges skaláris szorzatokat.

1 1 3 1 1
q1 , q1  2; b3 , q1  1; q2 , q2   1   ; b3 , q 2  0  1   ;
4 4 2 2 2

Innen kapjuk az ortogonális bázis harmadik vektorát.

 1 
0 1   2 
   2
T
2
q3  b3  q1  q 2  1   0   1    
1 1 1 1 2
;
2 3 2 3   3 3 3 
1  1  1
 
 2

A számítások eredményei szerint az ortogonális bázis a következő.

T T
1 1  2 2 2
q1  1 0 1 ; q2  
T
1   ; q3    ;
2 2  3 3 3 

Jól látható, hogy a páronként vett skaláris szorzatok valóban zérussal egyenlők.

A Gram-Schmidt-féle ortogonalizációs eljárás során kapott összefüggések lehetőséget adnak arra,


hogy a reguláris és kvadratikus mátrixot, melynek tehát n-db lineárisan független oszlopvektora
van felírjuk szorzat alakban. Ennek a szorzatnak az első komponense egy olyan mátrix melynek
oszlopvektorai páronként ortogonálisak, a második tényező pedig egy felső háromszögmátrix.
Ennek belátásához írjuk fel az ortogonalizációs eljárás során kapott egyenleteket a következő
alakban.

b1= q1
b2 = α12q1+q2
b3 = α13q1+ α23q2 +q3

bn = α1nq1+ α2nq2 +…+αn–1,nqn–1+ qn

Ezek az egyenletek mátrixalakban írva a következő mátrixszorzással egyenértékűek.

145
Óbudai Egyetem BGK Fejezetek a matematikából

 1 12 13 ... 1n 


0 1  23 ...  2 n 

b1 b2 b3 ... b n   q1 q 2 q3 ... q n   0 0 1 ... 3n  ;
 
... .... ... ... ... 
 0 0 0 ... 1 

Ebben a felbontásban az első tényező jele szokásosan Q, amely tehát olyan mátrix melynek
oszlopvektorai páronként ortogonálisak, a második tényező jele R, melynek komponensei éppen
az ortogonalizációs eljárás során kapott együtthatók. Ezt felbontást nevezzük QR-felbontásnak.

1.72.Példa: Az előbbi számítások eredményének figyelembe vételével előállíthatjuk a

1 1 0 
B  0 1 1  ;
1 0 1 

mátrix szorzat alakját. Figyelembe véve a kapott ortogonális vektorrendszert valamint a számított
együtthatókat írhatjuk, hogy

 1 2  1 1
1 2   1
3 2 2  1 1 0 
  
1 
QR  0 1  0 1 1   B;
2 
0 1
 3  3
   1 0 1 
1  1 2  0 0 1 
 2 3   

A két mátrix szorzásával ellenőrizhető, hogy a szorzat valóban megadja a B mátrixot. Azonban
mind elméleti, mind gyakorlati szempontból fontosabb az az eset, amikor a Q mátrix oszlopai
ortonormált rendszert alkotnak, azaz a vektorok hossza egységnyi. Tulajdonképpen azt a
felbontást nevezzük QR felbontásnak, ha a Q mátrix a definíció értelmében ortogonális mátrix,
tehát oszlopvektorai a páronkénti ortogonalitás mellett még egységvektorok is.

Ha megköveteljük, hogy a Q mátrix ortogonális legyen, azaz oszlopai egységvektorok legyenek,


akkor a felbontás némileg különbözik az előző példa megoldása során kapott felbontástól. Erre a
különbségre a következő példa megoldása során mutatunk rá.

1.73.Példa: Végezzük el az alábbiB mátrix QR-felbontását.

 1 1 0
B   1 0 2  ;
 0 2 1 

146
Óbudai Egyetem BGK Fejezetek a matematikából

Mivel det(B) = –1, ezért az oszlopvektorok lineárisan függetlenek, tehát bázist alkotnak R3-ban.
Ortogonalizáljuk ezt a bázist úgy, hogy eredményként ortonormált bázist kapjunk, majd
végezzük el a B mátrix QR-felbontását.

1. lépés: Legyen q1  b1  1 1 0 ; Most azonban ezzel nem elégedhetünk meg, a kapott


T

vektort normálnunk is kell. Ezért elosztjuk a hosszával.

T
1
1 1 0T   
q 1 1
q10  1  0 ;
q1 2  2 2 

Megkaptuk tehát az ortonormált bázis első vektorát.

b 2 , q10
2. lépés: Legyen q2  b2  12q10 ahol 12   b 2 , q10 , mivel a nevezőben egy normált
q10 , q10
vektor hosszának négyzete szerepel. Ennek az együtthatónak az értéke

T
 1 1  1
12  b 2 , q10  1 0 2  0  ;
 2 2  2

Innen adódik a q2 vektor.

T T
1  1 1  1 1 
q2  b2  12q10  1 0 2 
T
0   2 ;
2  2 2  2 2 

1 1 9 3
Ezt a vektort még normálni kell. Mivel q2 , q2    4  , ezért q 2  , tehát a második
4 4 2 2
normált vektor az ortonormált bázisban a következő.

T
q 2 1 1 
T
 2 2 2 2
q02  2  2    ;
q2 3  2 2   6 6 3 

b3 , q10
3. lépés: Legyen q3  b3  13q10  23q02 ahol egyrészt 13   b3 , q10 , másrészt
q10 , q10

b3 , q02
 23   b3 , q02 , mert a nevezőkben egységvektorok hosszának négyzete áll.
q02 , q02
Számítsuk ki a szükséges skaláris szorzatokat.

147
Óbudai Egyetem BGK Fejezetek a matematikából

T
 1 1 
13  b3 , q10  0 2 1  0    2;
 2 2 
T
 2 2 2 2
 23  b3 , q02   0 2 1    2;
 6 6 3 

Innen kapjuk a q3 vektort.

 1   2   2 
 2   
 6   3 
0    
   1   2   2 
q3  b3  13q1   23q 2   2   2  
0 0
 2  ;
2  6   3 
1     
 0  2 2   1
    
 3   3 

Könnyen látható, hogy az eredményként kapott vektor „véletlenül” éppen egységvektor, tehát
nem kell normálni, automatikusan teljesül, hogy q30  q3 . Felírhatjuk tehát a B mátrix
oszlopvektoraiból ortogonalizációval kapott ortonormált bázist.

 1   2   2 
 2     3 
   6   
 1  0  2  0  2 
q1   
0
; q2    ; q3    ;
2  6  3
   
 0  2 2   1 
     3 
 3 

A páronkénti skaláris szorzatok kiszámítása mutatja, hogy a kapott vektorok valóban páronként
ortogonálisak, a normáltság a képzésből pedig következik.
A QR-felbontás ebből úgy következik, hogy megvizsgáljuk az eredeti bázisvektorok mely
lineáris kombinációja szolgáltatja az ortonormált bázisvektorokat. Írjuk fel az egyenleteket.

q1 b1
q10   ;;
q1 q1
q2 b2  12q10 1 
q02    b 2  12 q10 ;
q2 q2 q2 q2
q3 b3  13q10  23q02 1  
q30    b3  13 q10  23 q02 ;
q3 q3 q3 q3 q3

148
Óbudai Egyetem BGK Fejezetek a matematikából

Fordítsuk meg most ezeket az egyenleteket, fejezzük ki ezekből az eredeti bázis vektorait. Azt
kapjuk, hogy

b1  q1 q10 ;
b2  12q10  q2 q02 ;
b3  13q10  23q02  q3 q30 ;

Az n-dimenziós esetre vonatkozó összefüggések innen már láthatók. Ha ezeket az egyenleteket


egyetlen mátrixegyenlettel fejezzük ki, akkor a következő szorzatot írhatjuk fel.

 q1 b 2 , q10 b3 , q10 
 q1 12 13   
0   0  0 
b1 b 2 b3   q10 q02 q3   0 q2  23   q10 q 02 
q3  0 q2 b3 , q 2 ;
 
 0 0 q3  0 0 q3 
 

Pontosan ez a szorzat alak a keresett QR-felbontás. Ez a felbontás annyiban különbözik a


korábban tárgyalt esettől, amikor nem írtuk elő azt hogy a Q mátrix oszlopvektorai normáltak
legyenek, hogy a felső háromszögmátrix főátlójában általában nem 1-esek állnak, hanem az
ortogonalizáció során kapott vektorok abszolút értékei.

Alkalmazzuk ezt a konkrét esetre. A B mátrix következő felbontását kapjuk.

 1 2 2  1 
  2  2
 2 6 3  2
   1 1 0
 1 2  
2    1 0 2   B;
2 3
QR     0
 2 6 3  2
   0 2 1 
 2 2 2   0 0 1  
 0  
 3 3  

A Gram-Schmidt-féle ortogonalizációs eljárás eredményeinek ismeretében, megfogalmazhatjuk


az alábbi állítást.

1.83.Tétel: (QR-felbontás)
Ha a BRn×n, kvadratikus mátrix reguláris, akkorfelbontható egy ortogonális mátrix (Q) és egy
felső háromszögmátrix (R) szorzatára, ahol a Q oszlopai a B oszlopvektoraiból képzett
ortonormált bázisvektorok, az R mátrix pedig az áttérés lineáris kombinációinak az együtthatót
tartalmazza.

149
Óbudai Egyetem BGK Fejezetek a matematikából

1.16. Hasonló mátrixok. Diagonalizáció


A hasonló mátrixok a kvadratikus mátrixok halmazát osztályokra bontja, az egy osztályba tartozó
mátrixok több lényeges szempontból egyező tulajdonságokat mutatnak. Lássuk az értelmezést.

1.56.Definíció: A kvadratikus n-ed rendű A és B mátrixokat hasonló mátrixoknak nevezzük, ha


létezik olyan n-ed rendű reguláris S mátrix, mellyel teljesül a

B  S1AS;

egyenlőség.

Mindenek előtt tisztázzuk, hogy ez a reláció szimmetrikus, ami azt jelenti, hogy ha A hasonló
B-hez, akkor B is hasonló A-hoz. Ezért nem is kellett a definícióban ennyire szélsőségesen
fogalmazni, egyszerűen mondhatjuk, hogy A és B hasonlóak. Valóban, ha teljesül, hogy
B  S1AS , akkor átrendezve azt kapjuk, hogy A  SBS1 . Mivel S reguláris, az inverze is az.
Legyen S1  S0 . Ekkor írhatjuk, hogy A  S01BS0 , tehát valóban szimmetrikus reláció.

Most vizsgáljuk meg, hogy milyen szempontból egyeznek meg a hasonló mátrixok. Két fontos
állítást fogalmazhatunk meg determinánsokra és sajátértékekre.

1.84.Tétel: Hasonló mátrixok determinánsa egyenlő, azaz ha B  S1AS akkor

det B  det A;

Bizonyítás: Felhasználva a determinánsok szorzástételét valamint az inverzmátrix


determinánsára vonatkozó összefüggést kapjuk, hogy

 
det B  det S1AS  det S1  det A  det S 
1
det S
 det A  det S  det A;

Ezt kellett igazolni. ■

A sajátértékekre hasonló tétel igaz. De előbb egy karakterisztikus polinomra vonatkozó tételt
igazolunk.

1.85.Tétel: Hasonló mátrixok karakterisztikus polinomjai megegyeznek.


Bizonyítás: Legyen B  S1AS . Megmutatjuk, hogy B karakterisztikus polinomja megegyezik az
A karakterisztikus polinomjával. Valóban

k B     B  E  S 1AS  E  S 1AS  S 1S  S 1  AS  S  


1
 S 1  A  E  S  A  E S  A  E  k A   
S

150
Óbudai Egyetem BGK Fejezetek a matematikából

Ezt kellett igazolni. ■

Ennek a tételnek egyenes következménye az alábbi állítás.

1.86.Tétel: Hasonló mátrixok sajátértékei megegyeznek.


Bizonyítás: Mivel a sajátértékek a karakterisztikus polinom gyökei, és mivel a karakterisztikus
polinomok megegyeznek, az állítást igazoltuk. ■

Természetes módon merül fel a kérdés, hogy mit mondhatunk a sajátvektorokról. Erre ad választ
az alábbi állítás.

1.87.Tétel: Ha az A mátrix λ sajátértékhez tartozó sajátvektora s, akkor a B  S1AS összefüggés


szerint az A-hoz hasonló B mátrix λ sajátértékhez tartozó sajátvektora az S 1s vektor.
Bizonyítás: A feltétel szerint teljesül, hogy As = λs. Tudjuk, hogy λ sajátértéke a B-nek is, ezért
valamely s’-re teljsül, hogy Bs’ = λs’. Fejtsük ezt ki részletesen.

Bs '  S1ASs '  s '; ahonnan SS1ASs '  Ss '; azaz ASs '  Ss ';

ami azt jelenti, hogy Ss’ az A mátrix λ sajátértékhez tartozó sajátvektora, azaz s = Ss’. Ez
egyenértékű az állítással. ■

Az alábbi példába ellenőrizzük, hogy teljesülnek a fenti tételekben megfogalmazott


tulajdonságok.

1.74.Példa: Legyen

4 7
A ;
 2 5

Az A mátrix karakterisztikus polinomja a következő.

4 7
k A     det  A  E     2    6;
2 5  

Ennek gyökei a sajátértékek, λ1 = –3, λ2 = 2. A sajátvektorok pedig rendre a következők.

1 7
s1    ; s 2    ;
 1  2

Legyen ezután

1 3 
S ;
1 2 

151
Óbudai Egyetem BGK Fejezetek a matematikából

Ez az S mátrix valóban reguláris, hiszen determinánsa –1. Az inverze pedig

 2 3 
S 1   ;
 1 1

Ezek után kapjuk a B  S1AS mátrixot, amely hasonló A-hoz.

 2 3   4 7  1 3  14 29 1 3  43 100


B  S1AS      
12  1 2  18 42 
;
 1 1  2 5 1 2  6

Azt kaptuk tehát, hogy a

 43 100
B
42 
;
 18

mátrix és az A mátrix hasonlóak. Ellenőrizzük, hogy teljesülnek-e a fent bizonyított tételek.

 43 100
egyrészt det B  det   1806  1800  6;
 18 42 
4 7
másrészt det A  det    20  14  6;
 2 5

valóban egyenlők. A B mátrix karakterisztikus polinomja

43   100
kB     det  B  E     43    42     1800   2    6;
18 42  

ugyancsak megegyezik az A karakterisztikus polinomjával. Ebből következik, hogy a B mátrix


sajátértékei szintén λ1 = –3, λ2 = 2. Végül határozzuk meg a B sajátvektorait. A tétel szerint a B
mátrix s’ sajátvektoraira s '  S1s teljesül. Számítsuk ki ezeket és ellenőrizzük az eredményeket.
Egyrészt

 2 3   1   5
s1 '  S 1s1         ; és valóban
 1 1  1  2 
 43 100  5  215  200 15   5
Bs1 '            3    ;
 18 42   2   90  84   6 2

másrészt

152
Óbudai Egyetem BGK Fejezetek a matematikából

 2 3   7   14  6   20 
s 2 '  S 1s 2         ; és valóban
 1 1  2   7  2   9 
 43 100  20  860  900   40  20
Bs 2 '           2  ;
 18 42   9   360  378  18   9 

Az igazolt tételekben fogalmazott tulajdonságok tehát valóban teljesülnek.

A továbbiakban a hasonlóságnak egy nagyon speciális, az elmélet és a gyakorlat számára


egyaránt legfontosabb esetét vizsgáljuk, azt amikor egy mátrix egy diagonális mátrixhoz hasonló.
Ugyanis, egy diagonális mátrixnak a determinánsa a főátlóbeli komponensek szorzata, a
sajátértékei éppen a főátló elemei, könnyen hatványozható, könnyen invertálható, egy diagonális
együtthatómátrixú egyenletrendszer megoldása azonnal leolvasható, stb. egyszóval egy
diagonális mátrixszal könnyű dolgozni. Ezért keressük a módszert, hogy milyen módon kapunk
egy adott A mátrixhoz hasonló diagonális mátrixot. A válasz a sajátértékek elméletén alapszik. A
most megfogalmazott állítás a lineáris algebra egyik legfontosabb tétele.

1.88.Tétel: (Mátrix diagonalizálhatósága)


Tegyük fel, hogy az n-ed rendű A mátrixnak létezik n-db lineárisan független sajátvektora. Ekkor
hasonló ahhoz a diagonális mátrixhoz, melynek főátlójában a sajátértékek állnak. A hasonlóságot
az a reguláris S mátrix adja, melynek oszlopvektorai a lineárisan független sajátvektorok.
Bizonyítás: Mivel az S mátrix oszlopvektorai, a sajátvektorok, a feltétel szerint lineárisan
függetlenek, ezért az S mátrix rangja n, valóban reguláris, létezik az inverze. Legyenek a – nem
feltétlenül különböző – sajátértékek λi és a megfelelő – szükségképpen páronként különböző,
hiszen lineárisan független – sajátvektorok si, i = 1, 2, …, n. Ekkor teljesül, hogy Asi = λisi , i = 1,
2, …, n. Vegyük észre, hogy ez az n db egyenlőség felírható mátrixszorzás segítségével is.

1 0 ... 0 
0  ... 0 
A s1 s 2 ... s n    1s1  2s 2 ...  ns n   s1 s 2 ... s n   2
;
 ... ... ... ... 
 
0 0 ...  n 

Ha a sajátértékeket tartalmazó diagonális mátrixot Λ jelöli, a sajátvektorokból, mint


oszlopvektorokból képezett reguláris mátrixot pedig S, akkor ez az egyenlőség az egyszerűbb

AS  SΛ;

alakban írható. ha ezt megszorozzuk balról az S mátrix inverzével, akkor azt kapjuk, hogy

1 0 ... 0 
0  ... 0 
S AS  Λ  
1 2
;
 ... ... ... ... 
 
0 0 ...  n 

153
Óbudai Egyetem BGK Fejezetek a matematikából

Az A mátrix tehát valóban hasonló egy diagonális mátrixhoz. ■

Az alkalmazások során fontos szerep jut a fordított kapcsolatnak is.

A  SΛS1;

Tehát az A mátrix előállítható egy reguláris mátrix és egy diagonális mátrix segítségével a fenti
szorzat alakjában.

A tételben szereplő S mátrix szerepének fontossága miatt nevet is kapott.

1.57.Definíció: Azt a kvadratikus mátrixot, melynek oszlopvektorai az A mátrix lineárisan


független sajátvektorai modálmátrixnak nevezzük.

A vizsgált eljárást is egyetlen szóval fejezzük ki.

1.58.Definíció: Az A mátrixot diagonalizálhatónak nevezzük, ha hasonló egy diagonális


mátrixhoz.

1.75.Példa: Hozzuk az alábbi harmadrendű mátrixot diagonális alakra egy hasonlósági


transzformációval.

 3 2 1
A   3 4 3 ;
 2 4 0 

Egy korábbi példában már előállítottuk ezen mátrix sajátértékeit. Ezek a következők
1  5, 2,3  2 . Tehát két valós sajátérték van, a λ1 = –5 sajátérték algebrai multiplicitása 1, a
λ2,3 = 2 sajátérték algebrai multiplicitása 2. Meghatároztuk a sajátértékekhez tartozó
sajátvektorokat is. Ezek rendre a következők.

1  2 1 
s1   3  ; s 2  1  ; s3  0  ;
   
 2  0  1 

Az A mátrixnak tehát van 3 db lineárisan független sajátvektora, tehát diagonalizálható. Az


előbbiekből következik, hogy az A mátrixhoz tartozó modálmátrix és annak inverze az alábbi.

1 2 1   1 2 1 
S   3 1 0  ; S   3 1 3 ;
  1 1
7
 2 0 1   2 4 5 

Ezzel már fel is írhatjuk az A mátrix diagonális alakját magadó szorzatot.

154
Óbudai Egyetem BGK Fejezetek a matematikából

 1 2 1   3 2 1 1 2 1   5 0 0 
S AS  Λ; azaz ;  3 1 3 3 4 3 3 1 0    0 2 0  ;
1 1
7
 2 4 5   2 4 0   2 0 1   0 0 2 

Ez az összefüggés azonban megfordítva is nagyon fontos.

 3 2 1 1 2 1   5 0 0   1 2 1 
A  SΛS ; azaz ; 3 4 3   3 1 0   0 2 0   3 1 3 ;
 
1 1
7
 2 4 0   2 0 1   0 0 2   2 4 5 

Annak ellenőrzését, hogy a felírt egyenlőségek valóban teljesülne, az Olvasóra bízzuk.

A bemutatott példában az A mátrixnak csak két különböző sajátértéke van, de van három
lineárisan független sajátvektora. Ha viszont a különböző sajátértékek száma megegyezik a
mátrix rendjével sokkal egyszerűbb a helyzet.

1.89.Tétel: Ha az A mátrixnak létezik n db különböző sajátértéke, akkor diagonalizálható.


Bizonyítás: Ha n db páronként független sajátérték van, akkor létezik n db lineárisan független
sajátvektor, ugyanis korábban igazoltuk, hogy különböző sajátértékekhez lineárisan független
sajátvektorok tartoznak. Ez pedig az előző tétel alapján már igazolja az állítást. ■

1.76.Példa: Diagonalizáljuk az alábbi mátrixot.

 2 1 1 
A  1 2 1 ;
1 1 2 

Korábban már meghatároztuk ezen mátrix sajátértékei és sajátvektorait. A sajátértékek a


következők, 1  1, 2  2, 3  3 . Az A mátrix harmadrendű és létezik 3 db különböző
sajátérték, tehát A diagonalizálható. a sajátvektorok rendre a következők.

0 1 1 
s1  1  ; s 2  1 ; s3  0 ;
   
1  1 1 

Innen következik, hogy a modálmátrix és inverze az alábbi.

0 1 1   1 0 1 
S  1 1 0  ; S   1 1 1 ;
  1

1 1 1   0 1 1 

155
Óbudai Egyetem BGK Fejezetek a matematikából

Ebből adódik az A mátrix diagonális alakjának előállítása.

 1 0 1   2 1 1  0 1 1  1 0 0 
S 1AS  Λ; azaz ;  1 1 1 1 2 1 1 1 0   0 2 0  ;
 0 1 1  1 1 2  1 1 1  0 0 3

valamint megfordítva

 2 1 1  0 1 1  1 0 0   1 0 1 
A  SΛS ; azaz ; 1 2 1  1 1 0  0 2 0   1 1 1 ;
1

1 1 2  1 1 1  0 0 3  0 1 1 

A szorzat kiszámítását és az ellenőrzést ismét az Olvasóra bízzuk.

Kaptuk tehát, hogy ha egy n-ed rendű kvadratikus mátrixnak létezik n db különböző sajátértéke,
vagy ha nem létezik n db különböző sajátérték, de létezik n db lineárisan független sajátvektor,
akkor diagonalizálható. Ha azonban a sajátértékek száma kisebb, mint n és ezzel együtt nem
létezik n db lineárisan független sajátvektor, akkor a mátrix nem diagonalizálható. Ebben
az esetben az ún. Jordan-féle alakra lehet hozni, amely a lineáris algebra egyik legnehezebb
tételén alapszik. Az érdeklődő olvasónak a szakirodalom tanulmányozását javasoljuk.

1.77.Példa: Vizsgáljuk meg, hogy az alábbi A mátrix diagonalizálható-e.

1 1 1 
A  1 1 1 ;
0 1 2 

Korábban láttuk, hogy a sajátértékek a következők, a λ1 = 2 sajátérték algebrai multiplicitása 1, a


λ2,3 = 1 sajátérték algebrai multiplicitása 2. Meghatároztuk a sajátvektorokat is. Ezek rendre a
következők.

1  1
s1  0  ; s 2  1 ;
 
1  1

A λ2,3 = 1 sajátérték algebrai multiplicitása 2, a sajátaltér dimenziója azonban csak 1, tehát nem
tudunk megadni egynél több lineárisan független sajátvektort ehhez a sajátértékhez. Összesen
tehát mindössze két lineárisan független sajátvektor létezik, tehát ez a mátrix nem
diagonalizálható, nem hasonló egy diagonális mátrixhoz.

A diagonalizáció mellékesen megkönnyíti egy diagonalizálható A mátrix pozitív egész


kitevőjű hatványának a kiszámítását.

156
Óbudai Egyetem BGK Fejezetek a matematikából

Határozzuk meg egyszerű számítással az A mátrix n-edik hatványát úgy, hogy felhasználjuk a
diagonalizálhatóságot, vagyis az A  SΛS1 összefüggést. Ekkor ugyanis

    
An  SΛS1 SΛS1 ... SΛS1  SΛS1SΛS1...SΛS1  SΛnS1 ;

elég tehát egy diagonális mátrixot hatványozni. Arra az eredményre jutottunk tehát, hogy

Ha A  SΛS1; akkor An  SΛnS1; ;

Mutassunk erre egy példát.

1.78.Példa: Számítsuk ki az alábbi mátrix ötödik hatványát.

 4 8
A ;
 2 6

Könnyen ellenőrizhető, hogy a sajátértékek 1  2, 2  4 , a hozzájuk tartozó sajátvektorok


pedig rendre a következők.

 4 1
s1    ; s 2    ;
1  1

Innen kapjuk a modálmátrixot és inverzét.

 4 1 1 1  1 1
S  ; S  3  1 4  ;
 1 1  

Ahonnan az A mátrix szorzat alakja az alábbi.

1  4 1  2 0   1 1
A  SΛS 1; azaz ; A  
3 1 1 0 4  1 4 
;

Innen az ötödik hatvány könnyen adódik a diagonális mátrix ötödik hatványának kiszámításával.

5
1  4 1  2 0   1 1 1  4 1 32 0   1 1 384 1408
A  
5
  
3 1 1 0 4  1 4  3 1 1  0 1024   1 4  352 1376 
       ;

A formula alkalmazása magasabb kitevőjű hatványoknál még több művelet megtakarítását


jelenti.

A diagonalizálhatóságra vonatkozó tétel különleges módon teljesül szimmetrikus mátrixokra. Az


alább megfogalmazott állítás a lineáris algebra egyik alaptétele.
157
Óbudai Egyetem BGK Fejezetek a matematikából

1.90.Tétel: (Szimmetrikus mátrixok diagonalizásása)


Ha A szimmetrikus mátrix, akkor ortogonális mátrixszal diagonalizálható, azaz mindig létezik
olyan ortogonális Q mátrix, melyre igaz, hogy

Q1AQ  Λ;

ahol Λ az a diagonális mátrix melynek főátlójában az A mátrix sajátértékei állnak.


Bizonyítás: Azt már igazoltuk, hogy egy szimmetrikus mátrix sajátértékei valósak, és a
különböző sajátértékekhez tartozó sajátvektorok ortogonálisak. Ha a sajátvektorok ortogonálisak,
akkor minden sajátvektort osztva az abszolút értékével, azaz lenormálva egy ortonormált
sajátvektor rendszert kapunk.

a) Ha az A mátrixnak van n db páronként különböző sajátértéke, akkor ez azt jelenti, hogy


az ortonormált sajátvektor rendszer n-elemű. Ezekből a vektorokból, mint oszlopvektorokból
képezhetünk egy S modálmátrixot. Mivel az oszlopvektorrendszer ortonormált a modálmátrix
ortogonális mátrix. Alkalmazhatjuk tehát a szokásos Q = S jelölést. Ekkor a korábban igazolt
általános tétel szerint igaz az

1 0 ... 0 
0  ... 0 
S AS  Q AQ  Λ  
1 1 2
; ahol i   j ha i  j;
 ... ... ... ... 
 
0 0 ...  n 

összefüggés.

b) Ha az A mátrixnak n-nél kevesebb különböző sajátértéke van, akkor ez azt jelenti, hogy
vannak olyan sajátértékek, amelyeknek algebrai multiplicitása legalább 2. Itt nem részletezzük a
bizonyítást, csak megjegyezzük, hogy ha az A mátrix szimmetrikus, akkor minden egyes
sajátérték algebrai multiplicitása egyenlő a geometriai multiplicitással. Ez azt jelenti, hogy ha
n-nél kevesebb sajátérték van, akkor is meg lehet adni n-db lineárisan független sajátvektort, azaz
minden sajátaltér dimenziója megegyezik a megfelelő sajátérték algebrai multiplicitásával, azaz
minden legalább két dimenziós sajátaltérben meg lehet adni annyi lineárisan független
sajátvektort amennyi a sajátérték algebrai multiplicitása. Ha ezek nem ortogonálisak, akkor a
Gram-Schmidt-féle ortogonalizációs eljárással elő lehet állítani ortonormált sajátvektorokat. A
bizonyítás helyett inkább egy példán mutatjuk be az eljárást. Tehát ha a szimmetrikus A
mátrixnak vannak többszörös sajátértékei, akkor is létezik n db ortonormált sajátvektora, tehát
ugyancsak igaz az S1AS  Q1AQ  Λ összefüggés, annyi különbséggel, hogy most a diagonális
mátrix főátlójában lehetnek azonos elemek is. ■

Mivel a Q mátrix ortogonális, egy korábbi tétel alapján tudjuk, hogy inverze megegyezik a
transzponáltjával, azaz Q–1 = QT. Ebből következik, hogy szimmetrikus mátrixok
diagonalizációja az alábbi egyszerűbb összefüggéssel is megadható.

QT AQ  Λ; vagy A  QΛQT ;

158
Óbudai Egyetem BGK Fejezetek a matematikából

Ahol tehát a Q modálmátrix ortogonális mátrix.

Felmerülhet a kérdés, hogy van-e olyan mátrix amely nem szimmetrikus és ortogonális
mátrixszal diagonalizálható. A válasz nemleges ez a tulajdonság a szimmetrikus mátrixok
privilégiuma.

1.91.Tétel: Ha egy A mátrix ortogonális mátrixszal diagonalizálható, akkor az szimmetrikus.


Bizonyítás: Tegyük fel, hogy egy A mátrixra teljesül, hogy QT AQ  Λ; azaz A  QΛQT . Meg
kell mutatnunk, hogy ekkor AT = A. Felhasználva a faktorizációt és a szorzat transzponálására
vonatkozó összefüggést, kapjuk, hogy

   Q 
T T
AT  QΛQT T
ΛTQT  QΛTQT  QΛQT  A;

mivel egy diagonális mátrix transzponáltja saját maga. ■

1.79.Példa: Diagonalizáljuk az alábbi szimmetrikus mátrixot.

4 2
A ;
2 1

Korábban már kiszámítottuk, hogy a két sajátérték, λ1 = 0 és λ2 = 5, tehát létezik két különböző
sajátérték, a hozzájuk tartozó sajátvektorok pedig rendre a következők.

1  2
s1    ; s 2    ;
 2 1 

Azt is ellenőriztük már, hogy a sajátvektorok ortogonálisak. A diagonalizációhoz azonban


ortonormált rendszerre van szükség, tehát a sajátvektorokat normálni kell.

 1   2 
 5  5
s1  1  4  5; s10    ; s 2  4  1  5; s02    ;
 2   1 
 5  5
   

Ebből az ortonormált rendszerből megszületik az ortogonális modálmátrix és inverze.

 1 2   1 2 
 5   5 
5 5
SQ  ; S 1  Q 1  QT   ;
 2 1   2 1 
 5   5 5 
 5 

Ezek alapján pedig felírhatjuk a szimmetrikus A mátrix diagonalizációját jelentő szorzatot.


159
Óbudai Egyetem BGK Fejezetek a matematikából

 1 2   1 2 
 
5 5  4 2  5
 5  0 0
QT AQ       Λ;
 2 1   2 1   2 1  0 5 
 5   5 5 
 5 

Valamint a fordított összefüggés.

 1 2   1 2 

4 2  5 5 0 0  5
 5
A   
1  0 5  2
  QΛQT ;
2 1  2 1 
 5 5   5 5 
 

Ebben a példában a diagonális Λ mátrix főátlójában is van zérus elem, de ez lehetséges, hiszen a
sajátértékek egyike zérus.

1.80.Példa: Diagonalizáljuk az alábbi szimmetrikus mátrixot.

1 2 2 
A   2 1 2  ;
 2 2 1 

A karakterisztikus egyenlet a következő.

1  2 2
det  A  E   2 1   2      5    1  0;
2

2 2 1 

Kapjuk, hogy a sajátértékek a következők, λ1 = 5, egyszeres sajátérték, λ2,3 = –1 kétszeres


sajátérték. Ellenőrizhető, hogy a λ1 = 5 sajátértékhez tartozó sajátvektor az

t  1
s1  t  ; t  R \ 0 ; például s1  1 ;
 
t  1

vektor. A kétszeres algebrai multiplicitású sajátértékhez tartozó sajátaltér viszont két dimenziós, a
sajátvektorok a következő módon adhatók meg.

160
Óbudai Egyetem BGK Fejezetek a matematikából

 u  v   1  1  1  1


s   u   u  1   v  0  ; u, v  R \ 0 ; például s 2   1  ; s3   0 
       
 v   0   1   0   1 

Ez utóbbi sajátaltérben kaptunk tehát két lineárisan független sajátvektort, amelyek láthatóan
ortogonálisak s1-re, de mivel s2 , s3  1 ezek a sajátvektorok nem ortogonálisak egymásra.
Tartsuk meg az q2 = s2 vektort változatlanul, s3 helyett pedig keressünk egy olyan második
bázisvektort a sajátaltérben, amely ortogonális q2-re. Ezt a Gram-Schmidt-féle ortogonalizációval
végezzük. Keressük a q3 vektort q3 = s3 – α23q2 alakban úgy, hogy q2 , q3  0 teljesüljön.

1
q2 , q3  q2 , s3  23 q2 , q2  0; azaz 1  223  0; ahonnan 23  ;
2

A kiszámított együttható felhasználásával kapjuk a q2-re ortogonális harmadik sajátvektort.

 1  1 T
  1   1 1 
q3  s3   23q 2   0    1      1 ;
2  2 2 
 1   0 

Kaptunk tehát egy ortogonális sajátvektor rendszert.

T
 1 1 
q1  1 1 1 ; q2   1 1 0 ; q3  
T T
 1 ;
 2 2 

Minden sajátvektort osztva az abszolút értékével, ortonormált sajátvektor rendszert kapunk.

T
 1 1 1 
T
 1 1 
T
 1 1 2
q10   ; q2  
0
0 ; q30      ;
 3 3 3  2 2   6 6 3

Ebből az ortonormált rendszerből előáll az ortogonális modálmátrix és inverze.

 1 1 1   1 1 1 
     
 3 2 6  3 3 3
 1 1 1  1 1
 1 1 
SQ   ; S  Q  Q  
T
0 ;
 3 2 6  2 2 
 1 2   1 1 2 
 0  
 3 3   6 6 3 

A modálmátrix ismeretében pedig felírhatjuk a diagonalizációt jelentő faktorizációt

161
Óbudai Egyetem BGK Fejezetek a matematikából

 1 1 1   1 1 1 
     
 3 3 3 1 2 2  3 2 6 5 0 0
   
 1   1 1  
0   2 1 2   
1 1
Q AQ   
T
   0 1 0   Λ;
 2 2  2 2 1   3 2 6
0 0 1
 
 1
 1 2   1 2 
 0
 6 6 3   3 3 

valamint a fordított összefüggést

 1 1 1   1 1 1 
     
 
3 2 6 5 0 0  3 3 3
 1 2 2  
 1   1 
A   2 1 2   
 1 1 1
  0 1 0    0   QΛQT ;
 2 2 1  
6
0 0 1  
3 2 2 2
   2 
 1
0
2   1 
1
 3 3   6 6 3 

162
Óbudai Egyetem BGK Fejezetek a matematikából

1.17. Kvadratikus alakok. Pozitív definit mátrixok


Az alkalmazások szempontjából fontosak az olyan többhatározatlanú polinomok, amelyekben az
ismeretlenek vagy második hatványai vagy kéttényezős szorzatai szerepelnek. Ezeket az algebra
kvadratikus alakoknak nevezi, és tanulmányozásuk nagyon hatékonyan elvégezhető a lineáris
algebra eszközeivel, különös tekintettel a sajátértékek és a determinánsok elméletére.

1.59.Definíció: Legyen az ARn×n szimmetrikus mátrixés xRn egy n-komponensű vektor.


Ekkor a

 a11 a12 ... a1n   x1 


a a22 ... a2 n   x2  n n
Q  x   xT Ax   x1 x2 ... xn   12  a x x ;
 ... ... ... ...   ...  i 1 j 1 ij i j
  
 a1n a2 n ... ann   xn 

szorzatot kvadratikus alaknak nevezzük.

Nézzük meg konkrétan n = 2 és n = 3 esetben, hogyan is néz ki egy ilyen kvadratikus alak. Két
dimenzióban az általános alakja a következő.

a a12   x1  2 2
Q  x   xT Ax   x1 x2   11      aij xi x j  a11x12  2a12 x1x2  a22 x22 ;
 a12 a22   x2  i 1 j 1

Három dimenzióban pedig az alábbi módon írható.

 a11 a12 a13   x1 


x3   a12 a23   x2     aij xi x j 
3 3
Q  x   x Ax   x1
T
x2 a22
i 1 j 1
 a13 a23 a33   x3 
 a11 x12  a22 x22  a33 x32  2a12 x1 x2  2a13 x1 x3  2a23 x2 x3 ;

Hangsúlyozzuk, hogy a kvadratikus alakot szimmetrikus mátrix esetén értelmeztük. Elvileg


értelmezhető lenne tetszőleges kvadratikus mátrix esetén is, azonban egy példa meggyőz arról,
hogy elég a szimmetrikus mátrixok esetét vizsgálni.

5 2  5 3
1.81.Példa: Legyen A    valamint B    és írjuk fel mindkét mátrixhoz tartozó
2 3 1 1 
kvadratikus alakot a fenti definíció szerint.
Egyrészt

5 2  x1 
Q  x   xT Ax   x1 x2     x   5 x1  2 x1 x2  2 x2 x1  3x2  5x1  4 x1 x2  3x2 ;
2 2 2 2

 2 3  2

163
Óbudai Egyetem BGK Fejezetek a matematikából

másrészt pedig

5 3  x1 
Q  x   xT Bx   x1 x2       5 x12  3x1 x2  x2 x1  3x22  5x12  4 x1x2  3x22 ;
1 3  x2 

Tehát a két mátrix ugyanazt a kvadratikus alakot határozza meg. Mi a kapcsolat a szimmetrikus
B  BT
A és a nem szimmetrikus B mátrix között? Nyilván az, hogy A  . Ez általában is igaz.
2

B  BT
1.92.Tétel: HaB nem szimmetrikus mátrix, akkor az A  szimmetrikus mátrix ugyanazt
2
a kvadratikus alakot határozza meg, mint a B.
Bizonyítás: Képezzük a B mátrixszal a kvadratikus alakot. Ha felhasználjuk a mátrixok
szorzásának disztributív tulajdonságát, valamint azt a tényt, hogy a valós számok szorzásának
kommutativitása miatt a BT nyilván ugyanazt a kvadratikus alakot határozza meg, mint B kapjuk,
hogy

B  BT
Q  x   xT Bx 
1 T
2
1 1

x Bx  xT BT x  xT B  BT x  xT
2 2

2
x  xT Ax;

ami éppen a bizonyítandó állítás. ■

Elég tehát kizárólag szimmetrikus mátrixokhoz rendelni kvadratikus alakot. Ennek fő oka az,
hogy a szimmetrikus mátrixok az előző pontokban igazolt tételek alapján a legelőnyösebb
tulajdonságokkal rendelkeznek.

A kvadratikus alakokat az alkalmazások szempontjából úgy érdemes jellemezni, hogy milyen


előjelű valós értékeket vesznek fel. Alkalmazási területként megemlítjük az analitikus geometriát,
ahola másodrendű görbék és másodrendű felületek osztályozásában van alapvető szerepe,
valamint a többváltozós függvények analízisét ahol a szélsőérték vizsgálatában játszik
nélkülözhetetlen szerepet. Erre vonatkozik az alábbi definíció.

1.60.Definíció: Legyen A szimmetrikus mátrix. Azt mondjuk, hogy az A mátrix


a) Pozitív definit, ha tetszőleges nullvektortól különböző xRn esetén xT Ax  0 .
b) Negatív definit, hatetszőleges nullvektortól különböző xRn esetén xT Ax  0 .
c) Pozitív szemidefinit, ha tetszőleges xRn esetén xT Ax  0 .
d) Negatív szemidefinit, ha tetszőleges xRn esetén xT Ax  0 .
e) Indefinit, ha xT Ax pozitív és negatív előjelű értéket is felvesz.

Megjegyezzük, hogy az a) és b) pontokban azért zártuk ki a definícióból a nullvektort, mert ha


x = 0 akkor nyilván xT Ax  0 teljesül.

164
Óbudai Egyetem BGK Fejezetek a matematikából

A szimmetrikus mátrixok „definitsége” kiválóan tanulmányozható a sajátértékek és a


determinánsok elméletének alkalmazásával. Mielőtt az általános tételt megfogalmazzuk és
bizonyítjuk, példákkal illusztráljuk a definiált fogalmakat.

1.82.Példa: A definícióban foglalt minden típusra mutatunk egy-egy példát.

4 2
a) Az A    mátrix pozitív definit, ugyanis
2 3

 4 2  x1 
xT Ax   x1 x2    4 x12  4 x1 x2  3x22   2 x1  x2   2 x22  0;
2
  
 2 3  x2 

és nyilván csak a nullvektor esetén lesz zérus.

 1 1 
b) A B    mátrix negatív definit, ugyanis
 1 3

 1 1   x1 
xT Bx   x1 x2     x12  2 x1x2  3x22    x1  x2   2 x22  0;
2
  
 1 3  x2 

és nyilván csak a nullvektor esetén zérus.

8 4 
c) A C    mátrix pozitív szemidefinit, ugyanis
4 2

8 4  x1 
2
 1 
x Cx   x1
T
x2       8 x1  8 x1 x2  2 x2  8  x1  2 x2   0;
2 2

 4 2  x2   

de nyilván nem csak a nullvektorhoz rendel nulla értéket. Legyen például x  1 2 . Látható
T

hogy a helyettesítési érték zérus.

 1 3
d) A D    mátrix negatív szemidefinit, ugyanis
 3 9

 1 3  x1 
xT Dx   x1 x2     x12  6 x1 x2  9 x22    x1  3x2   0;
2
  
 3 9  x2 

és jól láthatóan nem csak a nulla vektorhoz rendel nulla értéket. Például az x  3 1
T

vektorhoz a nulla értéket rendeli.

165
Óbudai Egyetem BGK Fejezetek a matematikából

 2 1 
e) Az F    mátrix indefinit, ugyanis
 1 4

 2 1   x1 
xT Fx   x1 x2       2 x12  2 x1 x2  4 x22 ;
 1 4  x2 

és itt nincs szükség a további alakításra, ugyanis helyettesítéssel adódik, hogy például az
x  1 0 vektorhoz –2-t tehát negatív értéket, az x  0 1
T T
vektorhoz pedig +4-et, tehát
pozitív értéket rendel.

Vizsgáljuk meg elsőként egy speciális esetben, a másodrendű szimmetrikus mátrix esetében, mi a
feltétele annak, hogy az pozitív illetve negatív definit legyen. Legyen tehát

a b
A ;
b c 

egy másodrendű szimmetrikus mátrix. Vizsgáljuk meg általánosan ezen mátrixhoz rendelt
kvadratikus alak előjelviszonyait. Teljes négyzetté kiegészítéssel és azonos átalakítással a
kvadratikus alak a következő formát ölti.

 a b   x1 
2
 b  ad  b2 2
Q  x   xT Ax   x1 x2      ax1
2
 2bx x
1 2  cx2
2
 a  1
x  x2  x2 ;
b c   x2   a  a

Első kérdés az, hogy milyen feltételek mellett teljesül, hogy A pozitív definit. Világos, hogy ha
teljesül, hogy a> 0 és ad– b2> 0 akkor az A pozitív definit mátrix. Ez a feltétel fordítva is nyilván
igaz, azaz ha A pozitív definit, akkor ennek a két egyenlőtlenségnek teljesülnie kell. Vegyük
észre, hogy az első feltétel az, hogy a bal felső sarokaldeterminánsa pozitív, a második feltétel
pedig az, hogy a determinánsa pozitív. E kettő tehát elégséges feltétel arra, hogy A pozitív
definit legyen. További kérdésként megfogalmazódik, hogy van-e valami kapcsolat a definitség
és a sajátértékek között. Hogy ezt kiderítsük, határozzuk meg a szimmetrikus másodrendű mátrix
sajátértékeit is. A karakterisztikus egyenlete a következő.

a b
A  E    2   a  d    ad  b2  0;
b c

A sajátértékek elméletéből tudjuk, hogy 12  ad  b2 valamint 1  2  a  d . Ha feltesszük,


hogy a mátrix pozitív definit, azaz teljesül, hogy a> 0 és ad– b2> 0, akkor ad>b2 miatt az is igaz,
hogy d> 0, ebből pedig következik, hogy a + d > 0. Ha pedig teljesül, hogy 12  ad  b2  0 és
az is, hogy 1  2  a  d  0 akkor ezekből következik, hogy mindkét sajátérték
szükségképpen pozitív. A gondolatmenet fordított irányban is végigvezethető. Ha mindkét
sajátérték pozitív, akkor teljesül, hogy ad  b2  0 és az is hogy a  d  0 . Ekkor a

166
Óbudai Egyetem BGK Fejezetek a matematikából

szükségképpen pozitív, mert ha negatív lenne, akkor d-nek is negatívnak kellene lennie, hogy
ad>b2 teljesülhessen, de ekkor a + d < 0 lenne. Igazoltuk tehát a következőt.

1.93.Tétel: A másodrendű szimmetrikus A mátrix akkor és csak akkor pozitív definit ha mindkét
sajátértéke pozitív, továbbá akkor és csak akkor pozitív definit, ha a determinánsa és a bal felső
sarokaldeterminánsa is pozitív. ■

Ez a tétel általánosan is igaz, ennek igazolása következik most. Azonban a rövidség érdekében
egybefogalmazunk két tételt.

1.94.Tétel: A szimmetrikus A mátrix akkor és csak akkor pozitív (negatív) definit, ha minden
sajátértéke pozitív (negatív).
Bizonyítás: Először tegyük fel, hogy az A mátrix pozitív (negatív) definit. Ekkor tetszőleges
nullvektortól különböző xRn esetén xT Ax  0 ( xT Ax  0 ). Ez természetesen igaz az
ortonormált sajátvektorokra is. Azaz tetszőleges si , (i = 1, 2, ..., n) sajátvektorra igaz, hogy

2
siT Asi  siT i si  i siTsi  i si  i  0; i  1, 2,..., n;
2
( siT Asi  siT i si  i siTsi  i si  i  0; i  1, 2,..., n; )

amiből nyilvánvalóan következik, hogy minden sajátérték pozitív (negatív).


Fordítva tegyük fel, hogy minden sajátérték pozitív (negatív). Mivel a sajátvektorok ortonormált
rendszere bázis Rn-ben, ezért tetszőleges xRn előállítható, méghozzá egyértelműen a
sajátvektorok lineáris kombinációjaként.

x  1s1  2s2  ...  nsn ;

Ebben az esetben, felhasználva a mátrixszorzás disztributív tulajdonságát, valamint azt, hogy a


sajátvektorok ortonormált rendszert alkotnak adódik, hogy

xT Ax   1s1   2s 2  ...   ns n  A  1s1   2s 2  ...   ns n  


T

  1s1   2s 2  ...   ns n   1As1   2 As2  ...   n Asn  


T

  1s1   2s 2  ...   ns n   11s1   2 2s 2  ...   n ns n  


T

 121   22 2  ...   n2 n

amely összeg pozitív ha a sajátértékek pozitívok (negatív ha a sajátértékek negatívok). ■

Ebből az alaptételből már következik, hogy ha a sajátértékek között van negatív is és pozitív is
akkor a mátrix indefinit, ha pedig a sajátértékek pozitívok és nullák akkor a mátrix pozitív
szemidefinit, ha negatívok és nullák akkor negatív szemidefinit. A sajátértékekkel tehát
kiválóan le lehet írni szimmetirkus mátrixok definit tulajdonságait.

167
Óbudai Egyetem BGK Fejezetek a matematikából

1.83.Példa: Mutassuk meg, hogy az alábbi mátrix pozitív definit.

3 2 0 
A   2 4 2  ;
 0 2 5 

Számítással ellenőrizhető, hogy a mátrix sajátértékei λ1 = 1, λ2 = 4 és λ3 = 7. Mindhárom


sajátérték pozitív, ezzel igazoltuk, hogy a mátrix pozitív definit. A hozzájuk tartozó ortonormált
sajátvektorok pedig rendre a következők.

 2 2  1

 3 3  3 
     
s1   2 
;s   1
; s    ;
2
 3  2 3 3  3
     
 1  2  2 
 3   3   3 

Ezekre csak a későbbiekben lesz szükségünk. De ha már a kezünkben vannak a sajátértékek, és


tudjuk, hogy A pozitív definit, mutassuk meg, hogy a kvadratikus alak valóban pozitív értéket
vesz fel minden nullától különböző vektor esetén.Valóban, teljes négyzetté kiegészítéssel azt
kapjuk, hogy

 3 2 0   x1 
x Ax   x1
T
x2 x3   2 4 2   x2   3x12  4 x22  5 x32  4 x1 x2  4 x2 x3 
 0 2 5   x3 
2 2
 2  8 3  7
 3  x1  x2    x2  x3   x32 ;
 3  3 4  2

ami közvetlenül is igazolja, hogy A pozitív definit.

A pozitív definit tulajdonsággal kapcsolatban egy olyan állítást igazolunk, amely hasznos a
Gauss-féle normálegyenlet szempontjából. Emlékeztetünk rá, ez az egyenlet az amely a legkisebb
négyzetek módszere esetén oldandó meg. Ebben szerepel az ATA mátrix. Erre a mátrixra
vonatkozik a következő állítás.

1.95.Tétel: Legyen ARn×k tetszőleges mátrix. Ekkor az ATA mátrix pozitív szemidefinit. Ha
még az is teljesül, hogy az A rangja k, akkor az ATA mátrix pozitív definit.
Bizonyítás: Azt már korábban igazoltuk, hogy az ATA mátrix kvadratikus és szimmetrikus.
képezzünk ezzel a mátrixszal egy kvadratikus alakot. Legyen xRk tetszőleges. A mátrixszorzás
asszociativitása valamint a szorzat transzponálására vonatkozó összefüggés szerint azt írhatjuk,
hogy

168
Óbudai Egyetem BGK Fejezetek a matematikából

   
xT AT A x  xT AT  Ax    Ax 
T
 Ax   Ax 2  0;

Ez pedig pontosan azt jelenti, hogy az ATA mátrix pozitív szemidefinit.


Tegyük most fel, hogy ρ(A) = k. Ekkor az Ax = 0 homogén lineáris egyenletrendszernek csak a
triviális megoldása létezik, hiszen a rang megegyezik az ismeretlenek számával, ρ(A) = k, ekkor
a szabadságfok zérus, tehát egyértelmű a megoldás. Ezt azt jelenti, hogy a fenti kvadratikus alak
csak a nullvektorhoz rendel 0 értéket. Ez pontosan azt jelenti, hogy az ATA mátrix ρ(A) = k
esetben pozitívdefinit. ■

1.84.Példa: Mutassuk meg, hogy az ATA mátrix pozitív definit, ha

1 2 
A   2 1 ;
1 0 

vegyük észre, hogy ρ(A) = 2, ugyanis az A oszlopvektorai lineárisan függetlenek. Számítsuk ki


az ATA szorzatot.

1 2 
1 2 1     6 0  ;
A A
T
 2 1 0 5 
 2 1 0     
 1 0

Mivel a szorzat diagonális mátrix, a főátlóban éppen a sajátértékek állnak, amelyek mind
pozitívok, tehát az ATA szorzat valóban pozitív definit mátrix.

A továbbiakban a determinánsok elméletével is kapcsolatba hozzuk a pozitív és negatív definit


mátrixok vizsgálatát. Az egyszerűbb szóhasználat érdekében szükség van az alábbi elnevezés
bevezetésére.

1.61.Definíció: A kvadratikus A mátrix főminormátrixainak nevezzük azokat a kvadratikus


mátrixokat amelyeket úgy kapunk az A mátrixból, hogy annak utolsó n – k sorát és utolsó n – k
oszlopát elhagyjuk A-ból. Ilyen módon k-ad rendű kvadratikus mátrixokat kapunk, amelyből van
n db. Tehát a főminormátrixok a következők.

 a11 a12 ... a1n 


 a11 a12 a13  a
a a12  ... a2 n 
; A3   a21 a22  a
A1   a11  ; A 2   11  a23  ; ...; A n   21 22 ;
 a21 a22   ... ... ... ... 
 a31 a32 a33   
 an1 an 2 ... ann 

Ezen mátrixok determinánsát főminoroknak nevezzük, vagy kevésbé elegáns kifejezéssel "bal
felső sarokaldeterminánsok"-nak.

169
Óbudai Egyetem BGK Fejezetek a matematikából

A definitség leírható a főminorok segítségével is, ezt fogalmazzuk meg az alábbi állításban.

1.96.Tétel: A szimmetrikus A mátrix esetében az alábbi állítások ekvivalensek.


1. Az A pozitív definit.
2. Az A összes főminorja pozitív.
3. Ha Gauss eliminációval LU szorzat alakban írjuk fel az A-mátrixot, akkor az összes pivot
pozitív.
Bizonyítás: Már bizonyítottuk, hogy az A pontosan akkor pozitív definit, ha minden sajátértéke
pozitív. Ezt most felhasználjuk.
Legyen tehát A pozitív definit. Ekkor minden nullvektortól különböző vektorra teljesül, hogy
xT Ax  0 . Válasszuk meg az xRn vektort úgy, hogy az utolsó n – k koordinátája zérus legyen.
Mivel ezekre is igaz az egyenlőtlenség kapjuk, hogy

A ...  xk 
xT Ax   xk 0n  k   k     xTk A k xk  0;
 ... ... 0nk 

Ahol az A mátrix bal felső sarkában, éppen a k-ad rendű főminormátrix kap csak szerepet a
szorzásban. Ez az egyenlőtlenség azt jelenti, hogy az Akmátrix is pozitív definit. Mivel egy
pozitív definit mátrix minden sajátértéke pozitív, így Ak minden sajátértéke is pozitív. A
determináns pedig a sajátértékek szorzata. Pozitív számok szorzata pedig pozitív. Ez pontosan azt
jelenti, hogy minden k-ra a k-ad rendű főminor pozitív.
Most igazoljuk, hogy ha a főminorok pozitívok, akkor a pivotok is pozitívok. Az elimináció
során az A mátrix a következő módon alakul.

 a11 a12 a13 ... a1n   a11 a12 a13 ... a1n 
   1 
a a2 n   0 a2 n 
1 1
a22 a23 ... a22 a23 ...
 21    2 
A   a31 a3n  ~  0 a3 n  ;
2
a32 a33 ... 0 a33 ...
 
 ... ... ... ... ...   ... ... ... ... ... 
 an1  
an 2 an3 ... ann   0  n 
 0 0 ... ann 

Az elimináció során alkalmazott lépések nem változtatják meg sem az A mátrix sem az
Akfőminormátrixok determinánsát. Ebből következik, hogy a főminorok a következő mátrixok
determinánsai.

 a11 a12 a13 ... a1n 


 1 1 1 
 a11 a12 a13   0 a22 a23 ... a2 n 
 a11 a12   1 1   2 
A1   a11  ; A 2   1 
; A3   0 a22 a23  ; ...; A n   0 0  
a33
2
... a3 n  ;
 0 a22    2   ... ... ... ... ... 
0 0 a33   
 0  n 
0 0 ... ann 

170
Óbudai Egyetem BGK Fejezetek a matematikából

Mivel a kapott főminormátrixok háromszög mátrixok, ezek determinánsa, tehát a főminorok a


főátlóbeli elemek szorzata. Ebből következik, hogy teljesül az

 k 1
det Ak  det Ak 1  akk ; k  1, 2,..., n

összefüggés. Mivel a feltétel szerint a főminorok pozitívok, ebből nyilvánvalóan következik,


 
k 1
hogy a pivotok, tehát a akk ; k  1, 2,..., n komponensek mind pozitívok.
Már csak azt kell igazolnunk, hogy ha a pivotok pozitívok, akkor a mátrix pozitív definit. Ehhez
pedig felhasználjuk a szimmetrikus mátrixok LDLT felbontását. Ha ezzel felírjuk a kvadratikus
alakot, – voltaképpen ezzel elvégeztünk egy teljes négyzetté kiegészítést –, akkor az adódik, hogy

  D L x ;
T
xT Ax  xT LDLT x  LT x T

Ezzel, ha bevezetjük az y = LTx jelet, akkor azt kapjuk, hogy a kvadratikus alak egy teljes
négyzet, és az együtthatók éppen a pivotok. Ebből már következik az A mátrix pozitív definit
tulajdonsága. Ezzel az állítást bizonyítottuk.■

Fontos tisztázni az előző tétel negatív definit mátrixokra vonatkozó megfelelőjét, mert van egy
nem nyilvánvaló különbség a két tételben.

1.97.Tétel: A szimmetrikus A mátrix esetében az alábbi állítások ekvivalensek.


1. Az A negatív definit.
2. Az A főminorjai váltakozó előjelűek, a páratlan rendű főminorok negatívok, a páros rendű
főminorok pozitívok.
3. Ha Gauss eliminációval LU szorzat alakban írjuk fel az A-mátrixot, akkor az összes pivot
negatív.
Bizonyítás: Az előző tétel bizonyítása értelemszerű módisítással átvihető erre az esetre. Egyedül
a főminorok váltakozó előjelére mutatunk rá. Ha minden pivot negatív, akkor negatív az a11 pivot

is. Mivel a másodrendű főminor értéke det A2  a11a22
1
és a feltétel szerint az összes pivot

 0 is teljesül, tehát det A2  0 mert két negatív szám szorzata. a
1
negatív, így az a22
  
harmadrendű főminor értéke det A3  a11a22
1 2
a33 három negatív szám szorzata, ezért negatív.
Hasonlóan adódik az állítás minden páros és páratlan rendű főminorra. ■

1.85.Példa: Mutassuk meg, hogy az A mátrix pozitív definit, és ellenőrizzük ennek összes, fenti
tételekben leírt következményét.

 2 1 1
A   1 2 1  ;
 1 1 2 

Vizsgáljuk meg először a főminorokat.

171
Óbudai Egyetem BGK Fejezetek a matematikából

2 1 1
2 1
det A1  2; det A 2   3; det A3  1 2 1  4;
1 2
1 1 2

Tehát mindegyik főminor pozitív. A sajátértékek λ1 = 4, λ2,3 = 1, ugyancsak pozitívok. A


továbbiak kedvéért megadjuk az ortonormált sajátvektorokat is. Ezek rendre a következők.

 1   1   1 
     
 3  2  6
 1   1   1 
s1    ; s 2    ; s3   ;
 3   2  6 
 1   0   2 
     
 3     6

Végezetül határozzuk meg a pivotokat.

   
 2 1 1  2 1 1 
 2 1 1    
   3 1   3 1 
 1 2 1  ~ 0  2  2  ~ 0 2 2 
;
 1 1 2       
  3  4
 0 0   
1
 0 2 
2    3 

Tehát a pivotok is pozitívok.

1.86.Példa: Mutassuk meg, hogy az A mátrix negatív definit, és ellenőrizzük ennek összes, fenti
tételekben leírt következményét.

 2 2 2 
A   2 5 4  ;
 2 4 5

Vizsgáljuk meg először a főminorokat.

2 2 2
2 2
det A1  2; det A 2   6; det A3  2 5 4  10;
2 5
2 4 5

Ezek valóban váltakozó előjelűek, a páratlan rendűek negatívok a páros rendű pozitív.
Határozzuk meg a sajátértékeket. Ezek a következők λ1 = –10, λ2,3 = –1, valóban mind negatívok.
A későbbiek kedvéért megadjuk a hozzájuk tartozó ortonormált sajátvektorokat is. Ezek rendre a
következők.

172
Óbudai Egyetem BGK Fejezetek a matematikából

 1   2   2 
 3   5   
    3 5 
 1   4 
s1    ; s 2   
2
 3   ; s3   ;
   5 3 5 
 2   0   5 
 3     
  3 5 

Végül határozzuk meg a pivotokat.

 2 2 2   2 2 2   2 2 2 
    
 2 5 4  ~  0  3 2  ~  0 3 2 ;
 2 4 5  0 2 3  0 0  2, 6  
  

Ezek is mind negatívok.

A továbbiakban a kvadratikus alakok elméletének és a szimmetrikus mátrixok ortogonális


diagonalizálhatóságának együttes következményeit vizsgáljuk. Ez a témakör a kvadratikus
alakok négyzetösszeggé alakítása, amelynek különösen az analitikus geometriában, a
másodrendű görbék és másodrendű felöletek osztályozásában alapvető szerepe van.

Induljunk ki abból, hogy a szimmetrikus A mátrix ortogonális Q mátrixszal diagonalizálható az


A  QΛQT formula szerint, ahol Q tehát ortogonális mátrix, Λ pedig diagonális mátrix, melynek
főátlójában a sajátértékek vannak. Képezzünk az A mátrixszal egy kvadratikus alakot, és vegyük
figyelembe a felírt faktorizációt. Azt kapjuk, hogy

 
T
xT Ax  xTQΛQT x  QT x ΛQT x;

Alkalmazzunk egy koordinátatranszformációt. Vezessük be az yRn vektort az y  QT x


definícióval. Ekkor az előző egyenlőség egyenértékű a következővel.

1 0 ... 0   y1 
0  ... 0   y2  n
xT Ax  y T Λy   y1 y2 ... yn   2
  i yi2 ;
 ... ... ... ...   ...  i 1
  
0 0 ...  n   yn 

Azt kaptuk tehát, hogy ha az ortogonális Q mátrix segítségével az y  QT x transzformációval


áttérünk az x vektorról az y vektorra, akkor a kvadratikus alak négyzetösszeggé alakul. Igazoltuk
a következő állítást.

173
Óbudai Egyetem BGK Fejezetek a matematikából

1.98.Tétel: Ha A szimmetrikus mátrix, és Q az A mátrix ortonormált sajátvektoraiból, mint


oszlopvektorokból képezett ortogonális mátrix, akkor az y  QT x transzformációval értelmezett
vektorok alkalmazásával az xT Ax kvadratikus alak négyzetösszegként írható fel
n
y T Λy   i yi2 alakban, ahol a másodfokú tagok együtthatói éppen a sajátértékek. ■
i 1

1.87.Példa: Alakítsuk négyzetösszeggé a Q  x   2 x12  2 x1x2  2 x22 kvadratikus alakot. Világos a


definíciók szerint, hogy ez egyenértékű az

 2 1   x1 
Q  x   xT Ax   x1 x2     ;
1 2  x2 

szimmetrikus A mátrixszal adott kvadratikus alakkal. Határozzuk meg az A sajátértékeit és


sajátvektorait. Ellenőrizhető, hogy a sajátértékek λ1 = 1, λ2= 3, – pozitív számok, tehát az A
mátrix pozitív definit – , valamint a hozzájuk tartozó ortonormált sajátvektorok rendre a
következők.

 1   1 
 2   2
s1    ; s2    ;
 1   1 
  2   2 

Ebből következően az ortogonális Q modálmátrix és inverze – amely megegyezik a


transzponáltjával – az alábbi.

1  1 1 T 1 1 1
Q  1 1 ; Q   ;
2  2 1 1 

Ebből egyrészt kapjuk az A mátrix diagionalizációját

1 1 1  2 1  1  1 1 1 0
QT AQ         Λ;
2 1 1  1 2 2  1 1 0 3

illetve az A faktorizációját

 2 1  1  1 1 1 0 1 1
A   2  1 1 0 3 1 1   QΛQ ;
T

 1 2     

Hajtsuk most végre a koordinátatranszformációt.

174
Óbudai Egyetem BGK Fejezetek a matematikából

1 1 1  x1  1  x1  x2   y1 
y  QT x          ;
2 1 1   x2  2  x1  x2   y2 

Ezek felhasználásával adódik a kvadratikus alak négyzetösszeggé alakított formája.

1 0 1  x1  x2 
2 2
1 x x  x x 
x Ax  y Λy 
T T
 x1  x2 x1  x2       1  1 2   3   1 2  ;
2 0 3 2  x1  x2   2   2 

Egyszerűbb alakban írva tehát a kvadratikus alak négyzetösszeg formában a következő.

1 3
Q  x   x1  x2 2    x1  x2 2 ;
2 2

1.88.Példa: Alakítsuk négyzetösszeggé a Q  x   2 x12  2 x22  2 x32  2 x1x2  2 x1x3  2 x2 x3


kvadratikus alakot. Világos, hogy ez a kvadratikus alak egyenértékű a

 2 1 1  x1 
Q  x   x Ax   x1
T
x2 x3   1 2 1   x2  ;
 1 1 2   x3 

szimmetrikus mátrixszal adott kvadratikus alakkal. Ennek a szimmetrikus mátrixnak már


meghatároztuk a sajátértékeités az ortonormált sajátvektor rendszerétaz 1.85. példában. A
sajátértékek λ1 = 4, λ2,3 = 1, – tehát a mátrix, mint korábban láttuk pozitív definit –. Az
ortonormált sajátvektorok rendre a következők.

 1   1   1 
   2  
 3     6
 1   1   1 
s1    ; s 2    ; s3   ;
 3   2  6 
 1   0   2 
     
 3     6

Ebből adódik az ortogonális modálmátrix és inverze.

 1 1 1   1 1 
    1 
 3 2 6  3 3
3 
 1 1 1  T  1 1 
Q ; Q   0 ;
 3 2 6   2 2
2 
 1 0 2   1 1  
    6
 3 6  6 6 

Ezekből egyrészt következik a szimmetrikus A mátrix diagonalizációja.

175
Óbudai Egyetem BGK Fejezetek a matematikából

 1 1   1 1 1 
 1   

 3 3
3   2 1 1 
3 2 6
4 0 0
 1 1    1 1 1   
Q AQ  
T
0   1 2 1      0 1 0   Λ;
 2 2
2   1 1 2  
3 2 6 
 0 0 1 
 1 1    1 0 2  
 6   
 6 6   3 6

Illetve az A faktorizációja.

 1 1 1   1 1 
    1 
3 2 6 4 0 0  3 3
 2 1 1    3 
 1 1   1 
A   1 2 1   
1 1
 0 1 0  2 0   QΛQT ;
3 2 6  2
 1 1 2    0 0 1   2 
 1 0 2   1 1  
    6
 3 6  6 6 

végezzük most el a szükséges koordinátatranszformációt.

 1 1   1 1 1 
 1   x1  x2  x3 
 3 3
3   x1   3 3 3 
 y1 
 1 1    1 1   
y  QT x   0   x2    x1  x2    y2  ;
 2 2
2   x3  
2 2  y 
 1 1    1 1 2   3
 6  x1  x2  x3 
 6 6   6 6 6 

Ezekkel az új koordinátákkal a kvadratikus alak négyzetösszeggé válik a következő módon.

 4 0 0   y1 
x Ax  y Λy   y1
T T
y2 y3   0 1 0   y2  
 0 0 1   y3 
2 2 2
 1 1 1   1 1   1 1 2 
 4  x1  x2  x3   1  x1  x2   1   x1  x2  x3  ;
 3 3 3   2 2   6 6 6 

Ezzel a négyzetösszeggé alakítást elvégeztük.

Lineáris algebrai vizsgálataink utolsó lépéseként a fentiek egy további fontos következményét
említjük meg, amely spektráltétel néven ismeretes. A spektráltétel segítségével a szimmetrikusA
mátrixot nem faktorizáljuk, azaz nem szorzatként állítjuk elő, hanem összegként, felbontjuk
eleminek tekinthető, egyszerű szerkezetű mátrixok összegére.

Induljunk ki a diagonalizáció során felírt alakból.

176
Óbudai Egyetem BGK Fejezetek a matematikából

A  QΛQT ;

ahol Q a modálmátrix, amely a szimmetrikus A mátrix ortonormált sajátvektoraiból, mint


oszlopvektorokból képezett mátrix, a Λ pedig az a diagonális mátrix, amely az A sajátértékeit
tartalmazza a főátlóban. Tekintsünk most erre az egyenlőségre más szemüvegen keresztül.
Végezzük el a jobb oldali QΛQT szorzat kiszámítását, tekintetbe véve, hogy a középső tényező
egy diagonális mátrix. Áttekinthető módon írva a szorzatot azt kapjuk, hogy

1 0 0  s1 
T
...
0   
... 0  sT2 
A  QΛQT  s1 s 2 ... s n   2
;
 ... ... ... ...   ... 
  
0 0 ...  n  sT 
 n

Elvégezve a szorzást azt kapjuk, hogy

A  1s1s1T  2s2sT2  ...   nsnsTn ;

Felhívjuk a figyelmet, hogy a jobb oldalon, nem skaláris szorzatok hanem diadikus szorzatok
állnak. A diádok az ortonormált sajátvektorok saját magukkal képezett diadikus szorzatai, az
együtthatók pedig a sajátértékek. Igazoltuk tehát a következő tételt.

1.99.Tétel: (Szimmetrikus mátrixok spektráltétele)


Minden n-ed rendű szimmetrikus A mátrix előállítható n db diád lineáris kombinációjaként, ahol
a lineáris kombináció együtthatói az A mátrix sajátértékei, a diádok pedig az A mátrix
ortonormált sajátvektorainak saját magukkal képezett diadikus szorzatai. ■

Mielőtt példákon szemléltetjük a felbontást, vegyük észre a következőt. Az si siT diádok


projektor mátrixokat definiálnak. Emlékeztetünk, hogy egy P mátrix projektor mátrix, ha
négyzete saját maga, azaz ha P2 = P. Igazoljuk, hogy a Pi  si siT diád minden i-re projektor
mátrix. Valóban a sajátvektorok ortonormáltságának és a szorzás asszociativitásának
következtében
 
2
Pi2  sisiT  sisiTsisiT  si 1 siT  sisiT  Pi ;

A fenti tétel tehát a következő módon is fogalmazható.

1.100.Tétel: (Szimmetrikus mátrixok spektráltétele)


Minden n-ed rendű szimmetrikus A mátrix előállítható n db projektor mátrix lineáris
kombinációjaként, ahol a lineáris kombináció együtthatói az A mátrix sajátértékei, a projektorok
pedig az A mátrix ortonormált sajátvektorainak saját magukkal képezett diadikus szorzatai. Azaz

A  1P1  2P2  ...   n Pn ;

177
Óbudai Egyetem BGK Fejezetek a matematikából

1.89.Példa: Határozzuk meg az alábbi mátrix spektrális előállítását.

2 1
A ;
 1 2 

Az 1.87.példában már maghatároztuk a sajátértékeket, λ1 = 1, λ2= 3, valamint a hozzájuk tartozó


ortonormált sajátvektorokat, amelyek rendre a következők.

 1   1 
 2   2
s1    ; s2    ;
 1   1 
  2   2 

Innen már számíthatjuk a spektráltételbeli diádokat.

 1   1 1  1  1 1
 2  1    
1   2 2 ; P  s sT   2   1 1  2 2;
P1  s1s1T       2 2 2  
 1  2 2   1 1   1  2
 2   1 1
  2  
 2 2   2   2 2 

Ahonnan a spektrális felbontás a következő.

 1 1 1 1
 2   2
2 2  2 1
A  1s1s1T   2s 2sT2  1    3  
1  1 2 
;
 1 1  1
 2 2   2 2 

1.90.Példa: A témakör utolsó példájaként határozzuk meg az alábbi mátrix spektrális felbontását.

 2 2 2 
A   2 5 4  ;
 2 4 5

Az 1.86. példából már tudjuk, hogy a sajátértékeket a következők λ1 = –10, λ2,3 = –1. A hozzájuk
tartozó ortonormált sajátvektorok pedig rendre az alábbiak.

 1   2   2 
 3   5   
    3 5 
 1   4 
s1    ; s 2   
2
 3   ; s3   ;
 5   3 5
 
 2   0   5 
 3     
  3 5 

178
Óbudai Egyetem BGK Fejezetek a matematikából

Képezzük most a diadikus szorzatokat.

 1   1 2 2  2   4 2 
 3   9    5   5  0
9 9   5
     
T  2  1 2  2 4 T  1  2   2
0 ;
2 4 1 1
P1  s1s1     ; P2  s 2s 2      0  
 3   3 3  9 9   5 
 5 5
3 9 5 5
     
 2   2 
4 4   0   0 0 0
 3   9 9     
9  
 2  4 8 10 
   45
3 5  45 45 
 
 4  2 4 5  8 16 20 
P3  s3s3T     ;
3 5  3 5 3 5 3 5   45 45 45 
 
 5   10 20 25 
   45 45 45 
3 5 

Ezen részeredmények alapján az A mátrix spektrális felbontása a következő összeg.

A  1s1s1T   2s2sT2  3s3s3T 

 1 2 2  4 2  4 8 10 
 9    5  0  45
9 9 5 45 45   2 2 2 
     
20  
10      1  0  1   2 5 4  ;
2 4 4 2 1 8 16
 9 9 9  5 5   45 45 45  
       2 4 5
 2 4 4   0 0 0  10 20 25  

 9 9 9     45 45 45 

A lineáris algebra további tanulmányozásához valamint alkalmazásához további eredményes


munkát kívánunk!

179
Óbudai Egyetem BGK Fejezetek a matematikából

2. fejezet

Differenciálegyenletek

180
Óbudai Egyetem BGK Fejezetek a matematikából

181
Óbudai Egyetem BGK Fejezetek a matematikából

2.1. Elsőrendű differenciálegyenletek


2.1.1. Bevezető példák
Mielőtt az általános vizsgálatokba belekezdenénk, néhány olyan fizikai problémát ismertetünk,
amely megoldása differenciálegyenletre vezet, és amely egy ilyen egyenletnek a megoldását
igényli.

2.1.1.Példa: Tegyük fel, hogy egy pékműhelyben a pék T0 = 200°C-os hőmérsékletű kenyeret
vesz ki a kemencéből. A műhely hőmérséklete legyen Tk = 35°C. Határozzuk meg, hogy a kenyér
"milyen módon hűl ki", azaz határozzuk meg, hogy T(t) hőmérséklete hogyan függ a t időtől! A
kihűlés folyamatát leíró fizikai törvény a Newton-féle kihűlési törvény, mely szerint

dT  t 
 k T  t   Tk 
dt

A kihűlési sebesség tehát arányos a hőmérséklet különbséggel és természetesen negatív, mert a


kenyér hőmérséklete csökken. A k arányossági tényező egy anyagi minőségtől függő állandó. A
probléma tehát egy olyan egyenletre vezetett, amelyben az ismeretlen egy függvény, és az
egyenletben szerepel ennek az ismeretlen függvénynek a deriváltja is.

2.1.2.Példa: Tegyük fel, hogy egy R ellenállást és egy C kapacitást tartalmazó, kezdetben nyitott
áramkörünk van. Az áramkörbe, nyitott kapcsolóállásnál, beiktatunk egy egyenáramú
áramforrást, melynek konstans elektromotoros ereje U0. Határozzuk meg, hogy az áramkör
zárását követően hogyan változik a kondenzátor Q töltése az időben, azaz állítsuk elő a Q = Q(t)
függvény analitikus alakját, feltéve, hogy az áramkör zárását megelőzően a kondenzátor töltése
zérus, azaz Q(0) = 0. A problémát leíró fizikai törvény nyilván a huroktörvény, mely szerint az
egyes áramköri elemeken eső feszültségek összege egyenlő az elektromotoros erővel. Eszerint az
egyenlet a következő:
Q t 
 I (t )  R  U 0
C

Nyilvánvalóan a körben folyó I = I(t) áramerősség nem állandó, hanem függ a kondenzátor Q(t)
dQ  t 
töltésétől. Ha felhasználjuk azt a definíciót mely szerint I  t   , akkor kapjuk a problémát
dt
leíró egyenletet.
dQ  t  1
R  Q t   U0
dt C

Ismét egy olyan egyenletet kaptunk, amelyben az ismeretlen egy függvény, és az egyenletben
szerepel a függvény deriváltja is. A későbbiekben meghatározzuk ezen egyenletek megoldását, de
előtte ezek kapcsán értelmezzük a differenciálegyenletek elméletének tárgyalásához szükséges
alapvető fogalmakat.

182
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.2. A differenciálegyenlet fogalma


Differenciálegyenleten olyan egyenletet értünk, amelyben az ismeretlen egy függvény, amely
lehet egy- vagy többváltozós, az egyenlet tartalmazza a függvényt, ennek az ismeretlen
függvénynek első és esetleg magasabb rendű deriváltjait esetleg parciális deriváltjait, valamint
szerepelhet még az egyenletben a függvény változója, többváltozós esetben a változói.
A differenciálegyenletet közönségesnek nevezzük, ha az ismeretlen függvény egyváltozós
y(x) függvény. Ha az ismeretlen függvény többváltozós, akkor az egyenletet parciális
differenciálegyenletnek nevezzük. Egy differenciálegyenlet n-ed rendű, ha a benne szereplő
legmagasabb rendű derivált rendje n.
Egy differenciálegyenlet explicit, ha az egyenletből kifejezhető a legmagasabb rendű derivált,
és implicit, ha nem. Ez utóbbi esetben 0-ra redukált alakban szokás az egyenletet felírni. Ennek
fényében egy implicit közönséges elsőrendű differenciálegyenlet általános alakja:

F(x, y, y’) = 0

egy implicit közönséges másodrendű differenciálegyenlet általános alakja pedig:

F(x, y, y’, y”) = 0

Ahol y = y(x) az ismeretlen függvény, x a „független változó”, y’ és y” pedig az ismeretlen


függvény deriváltjai. Ha a fenti egyenletek megoldhatók y’-re illetve y”-re akkor kapjuk az
expilcit közönséges elsőrendű

y’ = f(x, y)

illetve az expilcit közönséges másodrendű

y” = f(x, y, y’)

differenciálegyenletet. Ebben a jegyzetben, műszaki és természettudományos jelentőségénél


fogva elsősorban az utóbbi két típus vizsgálatával foglalkozunk.

183
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.3. Explicit közönséges elsőrendű differenciálegyenlet


A bevezetett fogalmak ismertetése után nyilvánvalóan merül fel a kérdés: Mit jelent az, hogy
megoldunk egy differenciálegyenletet? Mit nevezünk megoldásnak? Hány megoldás van?

Foglalkozzunk részletesen az y '  x   f  x, y  x   explicit, közönséges elsőrendű differenciál-


egyenlettel. Az egyenlet jobb oldalán egy kétváltozós f(x, y) függvény szerepel. Tegyük fel, hogy
ennek a függvénynek az értelmezési tartománya a T  R 2 síkbeli tartomány. Ezt tekinthetjük a
differenciálegyenlet értelmezési tartományának abban az értelemben, hogy a megoldások
szempontjából csak olyan  x, y  x   rendezett párok jöhetnek szóba, amelyek ebben a T
tartományban benne vannak.

2.1.1.Definíció: Azt mondjuk, hogy a valós számok halmazának I intervallumán értelmezett y(x)
függvény megoldása a differenciálegyenletnek, ha elvégezve a deriválásokat és a helyettesítést az
egyenlet tetszőleges xI esetén teljesül, tehát az egyenlet az I intervallumon azonosság! Szokás
mondani ekkor, hogy az y(x) függvény kielégíti a differenciálegyenletet. Ha egy y(x) függvény
megoldása a differenciálegyenletnek, akkor a függvény grafikonját a differenciálegyenlet
integrálgörbéjének nevezzük.

Az elnevezés abból adódik, hogy egy differenciálegyenlet megoldása integrálás útján adódik
(még akkor is ez a helyzet, ha egyes speciális esetekben ténylegesen nem végzünk integrálást). A
határozatlan integrál elméletéből ismeretes, hogy a primitív függvény meghatározása során
születik egy C integrációs állandó, egy konstans. Egy elsőrendű differenciálegyenlet megoldása
során tehát az integrálás következtében mindenképpen adódik egy C integrációs konstans, ami
„benne van a megoldásban”, ha y-t kifejezzük, a „másik oldalon” szerepel a C. Így a megoldás
sohasem egyetlen függvény y = y(x), hanem végtelen sok függvény y = y(x, C), azaz egy
függvénysereg, szokás mondani ebben az esetben, hogy egyparaméteres függvénysereg. Ezt az
egyparaméteres függvénysereget nevezzük a differenciálegyenlet általános megoldásának. Az
általános megoldás tehát egy végtelen sok függvényt tartalmazó függvényhalmaz. Természetesen
teljesülnie kell annak, hogy a függvénysereg bármely elemének grafikonja részhalmaza a
fentiekben definiált T tartománynak, más szóval az integrálgörbék T-ben haladnak. Ennek
minden egyes eleme kielégíti a differenciálegyenletet a fent említett értelemben.

A megoldásokat, de magát a differenciálegyenletet is szemléltethetjük a következő módon.


Tekintsük az y’ = f(x, y) egyenletet a derivált definíciójára való hivatkozással a következő módon.
A T tartomány minden (x, y) pontjában az f függvény felvesz egy értéket, amely az egyenlet
szerint éppen egyenlő a megoldásfüggvény adott x abszcisszához tartozó érintőjének a
meredekségével. Ez azt jelenti, hogy olyan megoldásokat kell előállítanunk, amelyeknek minden
pontjára igaz, hogy a meredekséget az f függvény adott pontbeli értéke adja. Ehhez elsőként
vegyünk fel a T tartomány minden pontjában egy kis egyenes szakaszt az ún. vonalelemet,
melynek meredeksége éppen f(x, y). Ha ezt elvégezzük a T tartomány minden pontjában, akkor
ezzel kitüntetünk egy ún. iránymezőt. A megoldások, vagy más szóval az integrálgörbék pedig
szükségképpen olyan görbék, amelyek minden pontban érintik ezeket az egyenes szakaszokat.

A mondottak illusztrálására lássunk két egyszerű példát.

184
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.3. Példa: Szemléltessük az iránymezőt és az általános megoldás integrálgörbéit az alábbi két


differenciálegyenlet esetén:

1 xy ' y  0; illetve  2 yy ' x  0

Explicitté téve az egyenleteket, ott ahol x  0 illetve y  0 az előzőekkel ekvivalens alakot


kapjuk:
y x
1 y '  ; illetve  2  y '  
x y

Helyettesítéssel könnyen igazolható, hogy az (1) egyenlet általános megoldása az y(x) = Cx


függvénysereg, ahol C tetszőleges valós állandó. A (2) egyenlet általános megoldása pedig az
y  x   C  x 2 egyparaméteres függvénysereg, ahol C tetszőleges nem negatív állandó. A 2.1.1.
ábrán mindkét differenciálegyenlet iránymezőjét szemléltetjük a sík pontjaihoz rendelt
vonalelemekkel, valamint megrajzoltunk néhány integrálgörbét, amelyek jól láthatóan
illeszkednek az iránymezőhöz.

a) b)
2.1.1. Ábra. A2.1.3. példabeli (1) és (2) differenciálegyenletek iránymezője, és
az egyenletek néhány integrálgörbéje

Szemléletesen is érzékelhető, hogy az (1) egyenlet integrálgörbéi origón áthaladó egyenesek,


kivéve az y-tengely egyenesét. Az y-tengely mentén ugyanis x = 0, tehát az egyenletnek ezen
egyenes mentén nincs értelme, ennek az egyenesnek a meredeksége végtelen lenne. Ha
helyettesítjük azx = 0 feltételt az (1) egyenletbe, az adódik, hogy y = 0, ami ebben az esetben azt
jelenti, hogy az origón végtelen sok integrálgörbe halad át. A sík többi pontjára azonban pontosan
egy integrálgörbe illeszkedik. A (2) egyenlet iránymezőjének vizsgálata azt érzékelteti, hogy az
integrálgörbék körök, pontosabban nyílt félkörök, az alsó és felső félsíkban, ugyanis ez az
egyenlet y = 0 esetén értelmetlen. Ugyanis y = 0 esetén az egyenlet jobb oldala végtelen, vagyis
az integrálgörbék függőleges irányú érintőkkel rendelkeznének az x-tengely pontjaiban.

185
Óbudai Egyetem BGK Fejezetek a matematikából

Az (1) és (2) egyenletek megoldását egyelőre csak szemléltettük. Az alábbiakban megadjuk majd
azokat az általános módszereket, amelyek segítségével ezen egyenletek megoldása konstruktív
úton előállítható.

Nyilvánvaló azonban, hogy egy konkrét fizikai, műszaki probléma megoldása sohasem végtelen
sok függvény, hanem egyetlen pontosan meghatározott függvény, az általános megoldáshoz
tartozó függvénysereg egy eleme. Ezt az egy függvényt valamilyen feltétellel ki kell választanunk
a függvényseregből. Ezt a feltételt a hagyományok szerint kezdeti feltételnek nevezzük, még
akkor is, ha az ismeretlen y(x) függvény változója nem a „t” idő! Ezt a kezdeti feltételt általában a
következő módon adjuk meg: előírjuk, hogy az integrálgörbe haladjon át egy
(x0, y0) T ponton, tehát, hogy teljesüljön az y(x0) = y0 feltétel. Egy konkrét probléma tehát
tartalmaz egy differenciálegyenletet és a differenciálegyenlethez tartozó kezdeti feltételt. Ezt a
két egyenletet együtt kezdeti érték problémának (k.é.p.) vagy Cauchy-féle feladatnak
nevezzük. Tehát egy explicit közönséges elsőrendű differenciálegyenletre vonatkozó kezdeti
érték probléma az alábbi:

y’ = f(x, y), y(x0) = y0

Ennek a feladatnak a megoldása már egyértelmű, azaz egyetlenegy függvény, amennyiben létezik
megoldás. Ezt a függvényt a differenciálegyenlet adott kezdeti feltételt kielégítő partikuláris
megoldásának nevezzük.

186
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.4. Az y’= f(x, y) differenciálegyenlet megoldhatósága, a megoldás


egyértelműsége (egzisztencia és unicitás)
Mielőtt hozzákezdünk a differenciálegyenletek egyes osztályainak vizsgálatához, tisztáznunk
kell, hogy mi a megoldás létezésének (egzisztencia) és egyértelműségének (unicitás) a feltétele.
Egy olyan tételt fogalmazunk elégséges feltételként, amely a műszaki gyakorlat szempontjából
teljességgel kielégítő, és amely feltétel teljesülése könnyen ellenőrizhető.

2.1.1.Tétel: (Egzisztencia és unicitási tétel)


Tegyük fel, hogy az y’ = f(x, y) differenciálegyenlet jobb oldala a T  R 2 síkbeli tartományon van
értelmezve, legyen továbbá (x0, y0)T a tartomány egy tetszőleges belső pontja.
a) Ha az f(x, y)függvény folytonos az (x0, y0) pont egy δ sugarú k  x0 , y0  környezetében, tehát a
T tartományhoz tartozó, (x0, y0) középpontú δ sugarú nyílt körlapon;
b) továbbá az f(x, y) függvény második változó szerinti f ' y  x, y  parciális deriváltja korlátos
ebben a k  x0 , y0  környezetben akkor az y’ = f(x, y) differenciálegyenletnek létezik olyan y(x)
megoldása, amely kielégíti az y(x0) = y0 feltételt, és ez a megoldás a k  x0 , y0  környezetben
egyértelmű.
Ha az a) és b) feltételek nem csak egy környezetben, hanem a teljes T tartományon teljesülnek,
akkor az y(x0) = y0 feltételt kielégítő megoldás az egész T tartományon egyértelműen létezik,
továbbá a megoldás (integrálgörbe) a T tartomány határától a T tartomány határáig halad. ■

A tétel elégséges feltétel, de nem szükséges. Ez annyit jelent, hogy előfordulhat, hogy az a) és b)
feltételek egyike nem, vagy egyike sem teljesül, és ennek ellenére a differenciálegyenletnek
egyértelműen létezik megoldása.
1
2.1.4.Példa: Vizsgáljuk meg az y '   2 differenciálegyenletet. Ekkor a jobb oldal folytonos
y
2
függvény, amely azonban y = 0 esetén nincs értelmezve, továbbá f ' y  x, y   3 , így ez a
y
parciális derivált nem korlátos, ha y → 0, tehát az x-tengely pontjaiban. Az elégséges feltétel a
folytonosságra vonatkozó a) része és a korlátosságra vonatkozó b) része nem teljesül az x-tengely
mentén, azonban az egyenletnek mégis egyértelműen létezik megoldása bármely (x0, 0) kezdeti
feltétel esetén. Helyettesítéssel könnyen ellenőrizhető, hogy az egyenlet ezen kezdeti feltételt
kielégítő megoldása az y  3 3  x0  x  függvény, és ezen a ponton áthaladó más megoldás nem
létezik, tehát a megoldás annak ellenére egyértelmű, hogy a parciális derivált nem korlátos. (A
Tisztelt Olvasó később konstruktívan is meg fogja tudni oldani ezt az egyenletet, mert ez egy
szeparálható differenciálegyenlet, amelyet az alábbiakban részletesen tárgyalunk.) A sík
x-tengelytől különböző bármely pontjára vonatkozólag teljesülnek a tétel feltételei, tehát minden
más kezdeti feltétel esetén a megoldás létezése és egyértelműsége az elégséges feltételből
következik.
2.1.5. Példa: Vizsgáljuk meg az y '  3  3 y 2 differenciálegyenlet megoldásait az egyértelműség
szempontjából. Az egyenletet nyilván kielégíti az y = 0 azonosan nulla függvény, továbbá az
egyenlet általános megoldása az

187
Óbudai Egyetem BGK Fejezetek a matematikából

y  x   x  C 
3

függvénysereg, tetszőleges valós C konstans esetén. Erről helyettesítéssel azonnal


meggyőződhetünk, egyrészt deriválással kapjuk, hogy y '  x   3  x  C  , másrészt a jobb oldal
2

2
 3
3  3  x  C    3  x  C  , tehát valóban azonosságot kaptunk. A 2.1.2. ábrán szemléltetjük a
2
 
differenciálegyenlet iránymezőjét, az általános megoldást és a konstans nulla megoldást is.

2.1.2. Ábra. A2.1.5. példabeli differenciálegyenlet iránymezője, ésaz egyenlet néhány integrálgörbéje
és az azonosan nulla megoldás

Vizsgáljuk meg a megoldásokat az egzisztencia és unicitási tétel feltételeinek teljesülése


szempontjából. Egyrészt világos, hogy az egyenlet jobb oldala folytonos függvény. Azonban a
jobb oldal y-változó szerinti parciális deriváltja az y = 0 hely környezetében nem korlátos, hiszen

1
 2 
f ' y  x, y    3  3 y 2   3  y 3 
2
y   3 3y

tehát valóban a végtelenhez tart, ha y → 0. Ami annyit jelent, hogy nem teljesül az unicitási tétel
egyik feltétele, a parciális derivált korlátossága. Nézzük meg konkrétan ennek következményét.
Válasszuk ki az y = 0 egyenes, tehát az x-tengely egy tetszőleges x0 pontját. Ezen a ponton át a
differenciálegyenletnek végtelen sok integrálgörbéje halad át. Ugyanis ha x1 ≤ x0 akkor x ≤ x1
esetén megoldás az y  x    x  x1  harmadfokú függvény – ennek a függvénynek az „alsó”
3

konkáv szakasza –, ha x2 ≥ x0 akkor az x ≥ x2 félegyenes mentén ugyancsak az y  x    x  x2 


3

harmadfokú függvény a megoldás – ennek a függvénynek a „felső” konvex szakasza –, és az


[x1, x2] intervallumon pedig a konstans nulla függvény. Ezt a konstrukciót nyilván végtelen
sokféle módon meg tudjuk valósítani, tehát az y(x0)=0 kezdeti feltételt végtelen sok megoldás
kielégíti. Az y = 0 azonosan nulla megoldás tehát olyan, hogy minden egyes pontján át az
egyenletnek végtelen sok integrálgörbéje halad át. Az ilyen megoldást szinguláris megoldásnak
nevezzük.

188
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.5. Közvetlenül integrálható differenciálegyenletek


Mielőtt az elsőrendű differenciálegyenletek általános osztályainak megoldását bemutatnánk, két
nagyon egyszerű, közvetlenül integrálható egyenlettípussal kezdjük a tárgyalást. Tegyük fel,
hogy a differenciálegyenlet alakja

 I . y '  f  x  ; illetve  II . y '  k  f  y 

alakú, ahol f(x) illetve f(y) folytonos függvények. Azt mondhatjuk, hogy az (I.) esetben az
egyenletben explicit módon nem szerepel az y, a (II.) egyenletben pedig nem szerepel az x
változó. Ekkor a megoldás egyetlen integrálással adódik. A (I.) esetben az integrálás eredménye
közvetlenül adja a megoldásfüggvényt, míg a (II.) esetben az integrálást követően a kapott
implicit függvényt meg kell oldani y(x)-re. A megoldások tehát:

y ' x 1
 I . y  x    f  x dx; illetve  II .  f  y  x   dx   kdx; vagy formálisan  f  y  dy  kx  C

Illusztráljuk ezeket az egyenleteket néhány példával.

2.1.6. Példa: Határozzuk meg egy „lánchíd” tartókötelének az alakját azzal a feltételezéssel, hogy
az útpálya vízszintes és homogén tömegeloszlású, valamint tegyük fel, hogy a tartókötél tömege
az útpálya tömegéhez képest elhanyagolható. Készítsünk ábrát, amelynek alapján felállíthatjuk a
probléma differenciálegyenletét. Helyezzük el a kérdéses görbét egy alkalmasan választott
koordináta rendszerben, amelynek során kihasználjuk a szimmetriát.
A 2.1.3. ábra jelöléseit alkalmazva tegyük fel, hogy a meghatározandó függvény analitikus alakja
az y(x) függvény. A probléma egy statikai feladat, mely szerint a vízszintes és függőleges erők
összege külön-külön zérus. A könnyebb összegzés érdekében az FB érintő irányú erőt
felbontottuk vízszintes és függőleges erők összegére. Az erők egyensúlya a következő
egyenletekkel adható meg: FA = F2= FBcosα, valamint mg = F1 = FBsinα, ahol m az útpálya
tömegét jelenti a [0, x] szakaszon. A két egyenlet hányadosát képezve azt kapjuk, hogy

sin  mg
tg   
cos  FA

Használjuk fel, hogy tgα éppen a keresett y(x) függvény x-pontbeli deriváltja, használjuk fel,
továbbá, hogy az útpálya a feltételek szerint homogén tömegeloszlású. Eszerint az m tömeg
arányos az x abszcisszával, m = βx. Mindezeket figyelembe véve kapjuk a görbe
differenciálegyenletét.

g
y ' x  x
FA

189
Óbudai Egyetem BGK Fejezetek a matematikából

y
y(x)
F1
FB

F2

FA
útpálya
x
mg x

2.1.3. Ábra. Egy „lánchíd” tartókötele alakjának meghatározásához

A kapott egyenlet láthatóan a (I.) kategóriába tartozik. Megoldása a következő:

g g x 2
y  x    xdx   C
FA FA 2

A válasz tehát az, hogy a mondott feltételek mellett egy „lánchíd” tartókötelének alakja parabola.
A 2.1.4. ábrán az egyenlet integrálgörbéit és az iránymezőtszemléltetjük

2.1.4. Ábra. Egy „lánchíd” tartókötelének alakját megadó parabolák

2.1.7.Példa: Itt visszatérünk a 2.1.1. példában szereplő differenciálegyenlet megoldásához,


előállítjuk a megoldást, majd szemléltetjük az iránymezőt és néhány integrálgörbét. A
megoldandó egyenlet a Tk = 35°C adat figyelembe vételével, ha feltesszük, hogy k = 0,01 a
következő

190
Óbudai Egyetem BGK Fejezetek a matematikából

dT  t 
 0, 01 T  t   35
dt

Világos, hogy ez az egyenlet a (II.) kategóriába tartozik. Rendezzük át és integráljunk.

1 1
dT  0, 01dt;  dT    0, 01dt; ln T  35  0, 01 t  ln C
T  35 T  35

Az implicit megoldást ezzel elő is állítottuk. Ha az implicit egyenletet rendezzük T(t)-re, kapjuk a
hőmérséklet időfüggését.

T (t )  35  Ce0,01t

Ha most figyelembe vesszük a kezdeti feltételt, akkor kapjuk a C állandó értékét, valamint a
kezdeti feltételt kielégítő partikuláris megoldást. T(0) = 200 °C adat alapján adódik, hogy
C = 165. Tehát a partikuláris megoldás a következő.

T (t )  35  165e0,01t

A 2.1.5. ábrán szemléltetjük az iránymezőt, az általános megoldást néhány integrálgörbével,


valamint a keresett partikuláris megoldást. A megoldások alapján azt mondhatjuk tehát, hogy a
hőmérséklet exponenciális módon csökken, és a kenyér hőmérséklete csak határértékben t → ∞
esetén éri el a környezet hőmérsékletét.

2.1.5. Ábra. A 2.1.1. példabeli differenciálegyenlet iránymezője, az egyenlet néhány integrálgörbéje,


valamint a kezdeti feltételt kielégítő partikuláris megoldás

Az ábrán jól látható, hogy az integrálgörbék valóban minden pontban illeszkednek az


iránymezőhöz. Az ábrán szerepel az egyparaméteres függvényseregből négy különböző
megoldás.

191
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.8.Példa: Megoldjuk a bevezető 2.1.2. példájában szereplő differenciálegyenletet. Ez az


egyenlet is a (II.) kategóriába tartozik. Ha a jelöléseink egyszerűsítése érdekében alkalmazzuk az
R = 1Ω, C = 1F, U0 = 10V adatokat – ezzel az integrálgörbék jellegét nem változtatjuk meg, csak
a szereplő konstansokkal az egyenlet alakja egyszerűbb –, akkor az egyenlet átrendezéssel majd
az integrál kijelölésével a következő.

1 1
Q '  t   Q  t   10; Q '  t   10  Q  t  ; dQ  1dt ;  dQ   1dt
10  Q 10  Q

Az integrálást elvégezve, majd a kapott egyenletet rendezve Q(t)-re a következőt kapjuk:

 ln 10  Q  t  c; ln 10  Q  t  K ; 10  Q  e K et ; Q(t )  10  C  et

Az általános megoldást tehát előállítottuk. Ha figyelembe vesszük a Q(0) = 0 kezdeti feltételt,


akkor ebből 0 = 10 – C adódik, ahonnan C = 10. Tehát a kezdeti feltételt kielégítő partikuláris
megoldás a következő.


Q(t )  10  10  et  10 1  et 
Azt kaptuk tehát, hogy a kondenzátor töltése exponenciális függvény szerint növekszik, és t → ∞
esetén éri el a 10 egységnyi töltést. A 2.1.6 ábrán szemléltetjük az egyenlet iránymezőjét, néhány
integrálgörbét és a partikuláris megoldást.

2.1.6. Ábra. A 2.1.2. példabeli differenciálegyenlet iránymezője, az egyenlet néhány integrálgörbéje,


valamint a kezdeti feltételt kielégítő partikuláris megoldás

192
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.6. Szétválasztható változójú (szeparálható) differenciálegyenlet


2.1.2.Definíció: Az elsőrendű explicit közönséges differenciálegyenletet szétválasztható
változójúnak vagy szeparálhatónak nevezzük, ha ekvivalens átalakításokkal az

y’ = f(x)∙g(y)

alakra hozható. (Ez annyit jelent, hogy az egyenletet y’-re rendezve a jobb oldal egy olyan
szorzatként írható, melynek egyik tényezője csak x-től, a másik tényezője pedig csak y-tól függ.
Ez utóbbi, implicit módon természetesen függ az x változótól is.)

A megoldhatóságot biztosítja az alábbi állítás.

2.1.2.Tétel: Ha az f függvény az [a, b] intervallumon folytonos, a g függvény a [c, d]


intervallumon folytonos, továbbá g sehol sem 0, akkor az ]a, b[ × ]c, d[ nyílt téglalap minden
pontján áthalad a differenciálegyenletnek pontosan egy integrálgörbéje. ■

A differenciálegyenlet megoldása. A megoldási módszer („kvadratura”) abban áll, hogy az


egyenletben szétválasztjuk a változókat. A felírt alakból kiindulva ez annyit jelent, hogy a bal
oldalra rendezzük az y-t tartalmazó tényezőket, a jobb oldalra pedig az x változót tartalmazó
tényezőket

y ' x
 f  x
g  y  x 

Majd az egyenlet mindkét oldalát integráljuk az x változó szerint.

y ' x
 g  y  x  dx   f  x  dx

Itt elvégezzük az integrálást, és a kapott egyenletből, ha lehet, kifejezzük az y(x) függvényt.


Ezután pedig, ha partikuláris megoldásra van szükség, figyelembe vesszük a kezdeti feltételt.
Egy formális megoldás. Az előzőekben ismertetett algoritmus helyett gyakran alkalmazzuk a
dy
következő eljárást. Az y’ helyébe -et írunk (ez tisztán formális átalakítás, mégis helyes
dx
eredményre vezet). Ez után átrendezzük az egyenletet úgy, hogy szorzunk dx-szel és osztunk
g(y)-nal (g(y) ≠ 0). Ekkor az egyenlet ekvivalens alakjai a következők:

dy 1
 f ( x)  g ( y); dy  f  x  dx;
dx g  y

Ezekkel a műveletekkel a változókat szétválasztottuk, majd az egyenlet mindkét oldalát


integráljuk:

193
Óbudai Egyetem BGK Fejezetek a matematikából

1
 g ( y) dy   f ( x)dx
A lényeges különbség a korábbihoz képest, hogy itt a bal oldalon az integrációs változó az y és
nem az x. Az integrálásokat elvégezve, és ha lehetséges, az y(x) függvényt kifejezve, megkapjuk
az egyenlet általános megoldását explicit alakban. Ha az y(x) függvény a kapott egyenletből nem
fejezhető ki, akkor implicit alakú megoldás adódik.
Az f(x) és g(y) konkrét ismerete nélkül az egyenlet megoldásáról többet nem mondunk. Ezért
lássunk egy konkrét illusztráló példát.

2.1.9.Példa: Oldjuk meg a következő kezdeti érték problémát:


 
cos y  1  e x sin y  y '  0; y  0  
4

A differenciálegyenlet valóban szeparálható, ugyanis, ha az egyenletet rendezzük y’-re, akkor azt


kapjuk, hogy
1 cos y
y'   x
 ;
1 e sin y

A jobb oldal valóban egy x-től és egy y-tól függő tényező szorzata. A formális átalakításokat
elvégezve válasszuk szét a változókat és integráljunk

sin y 1
  cos y dy   1  e x dx;

A jobb oldal integrálása előtt célszerű az integrandust bővíteni ex-szel, így a következőt kapjuk

sin y ex
 cos y
dy   x
e 1
dx;

Elvégezve az integrálást, az integrációs állandót célszerűen logaritmusos alakban felvéve, a


következő adódik
ln cos y  ln e x  1  ln C

ahonnan az általános megoldás implicit illetve explicit alakja a következő

   
cos y  C  e x  1 ; azaz y  x   arccos C  e x  1 ;
Ha a kezdeti feltételt is figyelembe vesszük, akkor kapjuk a C konstans értékét.

194
Óbudai Egyetem BGK Fejezetek a matematikából


cos
4

 C  e0  1 ;2
2
 C 1  1 ; ahonnan C 
4
2

Tehát a kezdeti feltételt kielégítő partikuláris megoldás a következő:

 2 
y  x   arccos 
4
 ex 1 
 

A 2.1.7. ábrán szemléltetjük a differenciálegyenlet iránymezőjét, néhány integrálgörbét, valamint


a kezdeti feltételt kielégítő partikuláris megoldást.

2.1.7. Ábra: A 2.1.9. példabeli szeparálható egyenlet iránymezője, néhány integrálgörbe és


a kezdeti feltételt kielégítő partikuláris megoldás

A következő pontban egy olyan egyenlettípust vizsgálunk, amely közvetlenül nem szeparálható,
de egy transzformáció segítségével szétválasztható változójú egyenletté alakítható.

195
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.7. Homogén differenciálegyenlet


A homogén differenciálegyenlet egy olyan egyenlet, amely megfelelő átalakításokkal
visszavezethető szétválasztható változójú egyenletre. Az ok, amiért ezzel az egyenlettípussal
foglalkozunk az, hogy megoldása során látunk egy olyan módszert, amely általános módszer
differenciálegyenletek megoldása esetén. Ez pedig az új ismeretlen függvény bevezetése.

2.1.3.Definíció:Az elsőrendű explicit közönséges differenciálegyenletet homogén


differenciálegyenletnek nevezzük, ha ekvivalens átalakításokkal az

 y
y  f  
x

alakra hozható. (Ez annyit jelent, hogy az egyenletet y’-re rendezve a jobb oldalon az y ismeretlen
függvény és az x változó hányadosa, ennek a hányadosnak hatványai illetve függvényei
szerepelnek.) Az elnevezés okára világítunk rá az alábbi fogalommal:

2.1.4.Definíció: A kétváltozós f(x, y) függvényt k-ad fokú homogén függvénynek nevezzük, ha


tetszőleges αR valós szám esetén teljesül, hogy

f(αx, αy) = αk∙f(x, y).

Homogén differenciálegyenlet esetén, ha az egyenletet y’ = f(x, y) alakra hozzuk akkor ez az


 y   y
összefüggés f(αx, αy) = f(x, y) alakban, hiszen nyilván f    f   tehát az egyenlet k = 0
 x  x
esetén teljesül, azaz a homogén differenciálegyenletben f(x, y) egy 0-ad fokú homogén függvény.

2.1.10.Példa: Vizsgáljuk meg, hogy homogén függvény-e a következő

x 4  3xy3
f  x, y   ;
xy  y 2

Azt állítjuk, hogy ez a függvény egy másodfokú homogén függvény. A definíció szerint ugyanis

f  x , y  
 x   3x  y 
4

4
3  x  3xy

4 3
  2 x4  3xy3  2 f  x, y 
xy   y   2  xy  y 2 
2
xy  y 2

 y
A differenciálegyenlet megoldása.Az y  f   egyenlet megoldásához vezessünk be egy új
x
ismeretlen függvényt az

196
Óbudai Egyetem BGK Fejezetek a matematikából

y  x
u  x 
x

definícióval. Transzformáljuk az eredeti egyenletet úgy, hogy abban az u(x) függvény legyen az
ismeretlen. Ehhez átrendezzük ezt az egyenletet: y(x) = u(x) ∙ x, majd deriváljuk az x változó
szerint

y’(x) = u’(x) ∙x + u(x)

Ezt behelyettesíthetjük az eredeti egyenletbe

u’(x) ∙x + u(x) = f(u(x))

vagy egyszerűbb jelöléssel

u’x + u = f(u)

Ez pedig az u(x) ismeretlen függvényre vonatkozólag szétválasztható változójú egyenlet

u 
1
x
 f u   u 
du
Valóban, a jobb oldal egy x-től és egy u-tól függő tényező szorzata. Bevezetve u’ helyére a
dx
formális hányadost, azt kapjuk, hogy

  f u   u 
du 1
dx x

feltéve, hogy f  u   u  0 , a változókat szétválasztva és az integrálást kijelölve az alábbi


egyenletet kapjuk

1 1
 f (u)  u du   x dx
Ha itt kiszámítjuk az integrálokat, már meg is kaptuk az u-ra vonatkozó egyenlet általános
megoldását. Ha felidézzük az y(x) = u(x) ∙ x definíciót, és a kapott megoldásban u(x) helyére
y  x
behelyettesítjük az hányadost, akkor előállt az eredeti differenciálegyenlet általános
x
megoldása implicit alakban. Ha ebből kifejezhető y(x) akkor az explicit megoldást kapjuk.

2.1.11.Példa: Határozzuk meg az


y
xy '  xe  y
x

197
Óbudai Egyetem BGK Fejezetek a matematikából

elsőrendű közönséges differenciálegyenlet általános megoldását. Legyen például x> 0. Ha


elosztjuk az egyenletet az x változóval látható, hogy az egyenlet homogén
y
y
y'  e 
x
x

Most vezessük be az u(x) függvényt az y(x) = u(x)∙x definícióval, ezután helyettesítsük az


y’(x) = u’(x) ∙x + u(x) összefüggést, és rendezzük az egyenletet. Ekkor a következőt kapjuk

u ' x  u  eu  u, tehát u ' x  eu

ez pedig szétválasztható változójú egyenlet. Szétválasztás után a következő egyenlet adódik

1
eu du  dx
x

Integrálás után kapjuk a megoldást u(x)-re

du   dx; eu  ln x  C; u   ln  C  ln x 
u 1
e x

Mivel y(x) = u(x)∙x ezért az eredetileg kitűzött differenciálegyenlet általános megoldása:

y( x)   x  ln  C  ln x 

A 2.1.8. ábrán illusztráljuk a differenciálegyenlet iránymezőjét és ábrázoltunk néhány


integrálgörbét.

2.1.8. Ábra: A 2.1.11. példabeli homogén differenciálegyenlet iránymezője


és az egyenlet néhány integrálgörbéje

198
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.8. Elsőrendű lineáris differenciálegyenlet


2.1.5.Definíció: Az elsőrendű közönséges differenciálegyenletet elsőrendű lineáris
differenciálegyenletnek nevezzük, ha ekvivalens átalakításokkal az

y ' x  f  x  y  x  g  x

alakra hozható, ahol f(x) és g(x) egy adott [a, b] intervallumon folytonos függvények.
Ha g(x) = 0 tetszőleges x[a, b] esetén, tehát a differenciálegyenlet jobb oldala azonosan zérus,
akkor az egyenletet homogén lineárisnak nevezzük, ellenkező esetben az egyenlet inhomogén
lineáris.
A továbbiak során kiderül, hogy az inhomogén lineáris differenciálegyenlet általános
megoldásához külön-külön meg kell oldani a homogén és az inhomogén egyenletet. Az
alábbiakban ennek megfelelően részletezzük a megoldás módszereit.

2.1.8.1.Homogén lineáris differenciálegyenlet


Elsőként megfogalmazzuk az egzisztencia és unicitási tétel következményét az adott esetre
vonatkozólag.

2.1.3.Tétel: Ha az f(x) függvény az [a, b] intervallumon folytonos, akkor tetszőleges x0[a, b]


esetén az
y '  x   f  x   y  x   0; y  x0   y0

kezdeti érték probléma egyértelműen megoldható, és a megoldás értelmezve van a teljes [a, b]
intervallumon.

Először is vegyük észre, hogy a differenciálegyenletet kielégíti az y(x) = 0, x[a, b] azonosan


nulla függvény. Ezt nevezzük triviális megoldásnak. A nemtriviális megoldás előállításához
vegyük észre, hogy a homogén lineáris differenciálegyenlet egy speciális szétválasztható
változójú egyenlet

dy
y ' f  x  y  0; y '   f  x  y;   f  x y
dx

A változókat szétválasztva, majd minkét oldalon integrálva a következőt kapjuk

1
 y dy   f ( x)dx

a bal oldalon álló integrál kiszámítható, a primitív függvény ln│y│, a jobb oldal azonban csak
akkor számítható ki, ha ismerjük az f(x) függvényt. A jobb oldalon az integrációs állandót
célszerű logaritmusos alakban felírni, ahol C ≠ 0.

199
Óbudai Egyetem BGK Fejezetek a matematikából

ln y   f ( x)dx  ln C ; ln y  ln e   ln C ; ln y  ln Ce 
 f ( x ) dx  f ( x ) dx
;

A kapott egyenletből y kifejezhető:

yhá ( x)  C  e 
 f ( x ) dx

ez a homogén lineáris differenciálegyenlet általános megoldása. Ha figyelembe vesszük, hogy


a konstans nulla függvény is megoldás, akkor itt írhatjuk, hogy C  R . Az y(x0) = y0kezdeti
feltételből a konstans értéke meghatározható. De azonnal felírhatjuk a kezdeti feltételt kielégítő
partikuláris megoldást is:

x
  f t dt
yhá ( x)  y0  e x0

A homogén lineáris differenciálegyenlet megoldásával kapcsolatosan az alábbi elméleti


jelentőségű tételt említjük.

2.1.4.Tétel: Ha az y(x), x[a, b] függvény az y’ + f(x)∙y = 0 differenciálegyenlet egy nem triviális


megoldása, akkor tetszőleges CR esetén a C∙y(x) függvény is megoldás, és az egyenlet
tetszőleges megoldása előállítható C∙y(x), x[a, b] alakban.
Bizonyítás: Egyrészt, hogy egy megoldás konstansszorosa is megoldás, egyszerűen következik a
deriválási szabályokból:

Cy  ' f  x  Cy  Cy ' f  x  Cy  C  y ' f  x  y   C  0  0

Másrészt az, hogy minden megoldás előáll C∙y(x) alakban abból, következik, hogy folytonos f(x)
esetén a Cauchy-féle feladat egyértelműen megoldható, azaz alkalmazható az általános
egzisztencia és unicitási tétel. ■

2.1.12.Példa: Határozzuk meg az alábbi homogén lineáris differenciálegyenlet általános


megoldását.

y 'sin x  y cos x  0 .

Az egyenlet valóban homogén lineáris, ugyanis, ott ahol sin x  0 a következő standard alakra
hozható.
cos x
y ' y0
sin x

Ha szétválasztjuk a változókat és integrálunk, a következő adódik

200
Óbudai Egyetem BGK Fejezetek a matematikából

1 cos x 1 cos x
dy  dx;  dy   dx; ln y  ln sin x  ln C  ln C sin x
y sin x y sin x

ahonnan a homogén egyenlet általános megoldása

yhá  x   C sin x

A 2.1.9. ábrán szemléltetjük a differenciálegyenlet iránymezőjét és néhány integrálgörbét.

2.1.9. Ábra: A 2.1.12. példabeli homogén lineáris differenciálegyenlet iránymezője


és az egyenlet néhány integrálgörbéje

2.1.8.2.Inhomogén lineáris differenciálegyenlet


A megoldás létezésére és egyértelműségére vonatkozólag a következőképpen konkretizálhatjuk
az általános tételt.

2.1.5.Tétel: Ha az f(x) és g(x) függvények az [a, b] intervallumon folytonosak, akkor tetszőleges


x0[a, b] esetén az
y '  x   f  x   y  x   0; y  x0   y0

kezdeti érték probléma egyértelműen megoldható, és a megoldás értelmezve van a teljes [a, b]
intervallumon.

Az inhomogén egyenlet vizsgálatánál fontos szerepe van annak az egyenletnek, amelyet úgy
kapunk, hogy az inhomogén egyenlet jobboldalán a g(x) függvény helyére az azonosan nulla
függvényt írjuk. Így kapjuk az inhomogén lineáris egyenlethez tartozó homogén lineáris
egyenletet.
Az inhomogén lineáris differenciálegyenlet megoldásainak szerkezetét adja meg az alábbi
tétel.

201
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.6.Tétel: Tegyük fel, hogy yhá(x) az inhomogén lineáris egyenlethez tartozó homogén lineáris
egyenletet nem triviális megoldása, yip(x) pedig az inhomogén egyenlet egy tetszőleges
partikuláris megoldása. Ekkor tetszőleges CR állandó esetén a

yiá  x   Cyhá  x   yip  x 

függvény az inhomogén lineáris differenciálegyenlet megoldása, és minden megoldás előállítható


ebben az alakban. Ezt a megoldást nevezzük az inhomogén lineáris egyenlet általános
megoldásának.
Bizonyítás: Egyrészt az, hogy a tételben szereplő függvény valóban megoldása az inhomogén
egyenletnek egyszerűen következik a deriválási szabályokból:

Cyhá  x   yip  x   f  x  Cyhá  x   yip  x   


'

 C  y 'há  x   f  x  yhá  x     y 'ip  x   f  x  yip  x    0  g  x   g  x 

tehát valóban kielégíti az inhomogén differenciálegyenletet. Másrészt pedig tegyük fel, hogy φ(x)
az inhomogén egyenlet egy tetszőleges megoldása, és yip(x) az inhomogén egyenlet egy
partikuláris megoldása. Ekkor megmutatjuk, hogy a φ(x) – yip(x) különbség a homogén lineáris
egyenlet megoldása. Helyettesítve és deriválva, mivel mindkét függvény az inhomogén egyenlet
megoldása, kapjuk, hogy
   x   yip  x   f  x     x   yip  x  
'

   '  x   f  x    x     y 'ip  x   f  x  yip  x    g  x   g  x   0

tehát valóban kielégíti a homogén lineáris egyenletet. A homogén lineáris differenciálegyenlet


megoldása a tétel szerint pedig előáll Cyhá(x) alakban, ezzel az állítást igazoltuk. ■

2.1.8.3.Az állandó variálásának módszere


Mivel a homogén lineáris egyenlet általános megoldását elő tudjuk állítani, arra a kérdésre kell
csak válaszolnunk, hogy milyen módszerrel állítjuk elő az inhomogén egyenlet egy tetszőleges
partikuláris megoldását? Erre szolgál az állandó variálásának módszere. Ennek lényege a
következő: Az yip(x) partikuláris megoldást ugyanolyan alakban keressük, mint a homogén
lineáris egyenlet általános megoldása, csak az abban szereplő C konstans helyére egy C(x)
függvényt írunk.

yip ( x)  C  x   e 
 f ( x ) dx

Kérdés az, hogy mi a C(x) függvény, ha ez az yip(x) kielégíti az inhomogén differenciál-


egyenletet. A C(x)-et úgy határozzuk meg, hogy ezt függvényt behelyettesítjük az inhomogén
egyenletbe. Elvégezve a deriválást és a helyettesítést, az alábbi egyenletet kapjuk.

202
Óbudai Egyetem BGK Fejezetek a matematikából

C  x   e   C  x  e   f  x  f  x C  x  e 
 f ( x ) dx  f ( x ) dx  f ( x ) dx
 g  x

Mint látható az f(x) konkrét alakjától függetlenül ebből az egyenletből a középső két tag összege
zérus, tehát az egyenlet bal oldalán csak az a tag marad meg, amelyik a C’(x) derivált függvényt
tartalmazza:
C  x   e 
 f ( x ) dx
 g  x

Ebből átrendezéssel C’(x)-re az alábbi egyenlet adódik:

C  x   g  x   e
f ( x ) dx

Integrálással kapjuk C(x)-et:

C  x     g  x   e
f ( x ) dx 
dx
 

Ennél az integrálásnál is születik elvileg egy integrációs állandó! De most csak egyetlen
partikuláris megoldás előállítása a feladat, ezért nem szükséges kitenni egy tetszőleges állandót,
illetve az állandót úgy határozhatjuk meg, hogy az a leginkább megfeleljen a feladat
kívánalmainak.
Ha ezt a C(x)-et behelyettesítjük az yip(x)-et megadó összefüggésbe, akkor előállítottuk az
inhomogén egyenlet egy partikuláris megoldását:

yip  x     g  x   e 
f ( x ) dx 
dx  e 
 f ( x ) dx
 

Ha ezt a függvényt hozzáadjuk a homogén lineáris differenciálegyenlet általános megoldásához,


akkor megkaptuk az inhomogén lineáris differenciálegyenlet általános megoldását.

2.1.13.Példa: Oldjuk meg az alábbi inhomogén lineáris differenciálegyenletre vonatkozó


Cauchy-féle feladatot:
 2
y 'sin x  y cos x  1; y    .
4 2

Ahol a szinusz függvény nem nulla, az egyenlet ekvivalens az alábbi standard alakú inhomogén
lineáris egyenlettel.
cos x 1
y ' y
sin x sin x

A megfelelő homogén lineáris differenciálegyenlet általános megoldását már előállítottuk a


2.1.12. példában, mely szerint yhá  x   C sin x . Eszerint egyetlen feladat maradt, elő kell állítani

203
Óbudai Egyetem BGK Fejezetek a matematikából

az inhomogén lineáris differenciálegyenlet egy tetszőleges partikuláris megoldását. Ehhez


alkalmazzuk az állandó variálásának módszerét. Keressük tehát a megoldást

yip  x   C  x  sin x

alakban. Az ismeretlen C(x) függvényt az inhomogén egyenletbe történő helyettesítéssel


határozzuk meg. Ehhez szükség van a deriváltra:

y 'ip  x   C '  x  sin x  C  x  cos x

Ezt most helyettesítjük az inhomogén lineáris egyenletbe:

cos x 1
C '  x  sin x  C  x  cos x  C  x  sin x 
sin x sin x

Látható ebben a konkrét esetben is, hogy a bal oldalon csak az ismeretlen C(x) függvény
deriváltja marad meg. Összevonás, rendezés és integrálás után azt kapjuk, hogy:

1 1 1
C '  x  sin x  ; C ' x  2
; C  x    2 dx   ctg x
sin x sin x sin x

Helyettesítve a kapott primitív függvényt a partikuláris megoldás általános alakjába, adódik az


inhomogén egyenlet egy megoldása

yip  x   C  x  sin x   ctg x  sin x   cos x

A részeredményekből pedig már összegzéssel adódik az inhomogén lineáris differenciálegyenlet


általános megoldása.

yiá  x   yhá  x   yip  x   C sin x  cos x

Végül vegyük figyelembe a kezdeti feltételt. Eszerint

2   2 2
 C sin  cos  C  ; ahonnan C  2
2 4 4 2 2

Tehát a kezdeti feltételt kielégítő partikuláris megoldás a következő

y  x   2sin x  cos x

A 2.1.10. ábrán szemléltetjük a példabeli inhomogén lineáris differenciálegyenlet iránymezőjét,


néhány integrálgörbét, és a kezdeti feltételt kielégítő partikuláris megoldást.

204
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.10. Ábra: A 2.1.13. példabeli inhomogén lineáris differenciálegyenlet iránymezője, néhány integrálgörbe és
a kezdeti feltételt kielégítő partikuláris megoldás

Az integrálgörbéket szemléltető ábráról kiderül, hogy a differenciálegyenlet az x  k ; k  Z


helyeken, tehát a szinusz függvény zérus helyein szinguláris. Itt nem teljesül az unicitás, tehát a
megoldás egyértelműségének feltétele. Ezeken a helyeken a differenciálegyenlet a k egész szám
paritásától függően az y  1 egyenletre redukálódik, ami azt jelenti, hogy a
(2n, 1) és a  2n  1 ,1 ; n  Z koordinátájú pontokra végtelen sok integrálgörbe illeszkedik.

2.1.9. A Bernoulli-féle differenciálegyenlet


Ebben a pontban egy olyan differenciálegyenletet vizsgálunk, amely egy alkalmas
transzformációval elsőrendű lineáris differenciálegyenletté alakítható.

2.1.6.Definíció: Legyenek az f(x) és g(x) függvények az [a, b] intervallumon folytonosak, és


legyen α  R, α ≠ 0, 1 tetszőleges valós szám. Ekkor az

y '  x   f  x   y  x   g  x   y  x 

differenciálegyenletet Bernoulli-féle differenciálegyenletnek nevezzük.

Ez a differenciálegyenlet egy alkalmas transzformációval visszavezethető elsőrendű lineáris


differenciálegyenletre. Legyen ugyanis y(x) a Bernoulli-féle differenciálegyenlet egy megoldása
és szorozzuk meg az egyenletet (1 – α)∙y–α –val. Ekkor az egyenlet a következő alakot ölti

1    y ' y   1    f  x   yy   1    g  x   y y 
1    y ' y   1    f  x   y1  1    g  x 
Vezessük be a következő jelöléseket.

205
Óbudai Egyetem BGK Fejezetek a matematikából

u(x) = y1–α(x), F(x) = (1 – α)f(x) és G(x) = (1 – α)∙g(x)

Könnyen ellenőrizhető, hogy ekkor u’(x) = (1 – α)∙y’(x)∙y–α(x). Ezzel az észrevétellel és a


bevezetett jelölésekkel az egyenlet a következő alakban írható

u’(x) + F(x) ∙ u(x) = G(x)

ami az u(x) függvényre vonatkozólag egy elsőrendű inhomogén lineáris differenciálegyenlet. Az


egyenlet megoldása tehát a következő módon történik: Meghatározzuk az u(x)-re vonatkozó
inhomogén lineáris differenciálegyenlet általános megoldását, majd a fenti transzformációt
visszafelé alkalmazzuk, vagyis ha

u  x   y1  x 

akkor u(x) ismeretében y(x) az alábbi alakban állítható elő:

1
y  x u 1
 x
Ezzel a Bernoulli-féle differenciálegyenlet általános megoldását meghatároztuk.

2.1.14.Példa: Határozzuk meg a 2xy’ – 2y + x4y3 = 0 elsőrendű közönséges differenciálegyenlet


általános megoldását! Ha az x  0 feltétel mellett az egyenletet átrendezzük, az alábbi
differenciálegyenletet kapjuk
1 x3
y ' y   y 3
x 2

Ez pedig α = 3 esetén egy Bernoulli-féle differenciálegyenlet. Végezzük el a szükséges


transzformációt, szorozzunk (–2)∙y–3 tényezővel. Ekkor bevezetve az u(x) = y–2(x) jelölést, a
következő egyenlet adódik.
2
u ' u  x3
x

Ez egy elsőrendű inhomogén lineáris egyenlet. Először megoldjuk az

2
u ' u  0
x

homogén egyenletet. Mint tudjuk, ez szeparálható egyenlet. Ha szétválasztjuk a változókat és az


integrálokat kijelöljük azt kapjuk, hogy

206
Óbudai Egyetem BGK Fejezetek a matematikából

1 2
 u du   x dx

Ennek integrálásával a következőre jutunk.

ln u  2ln x  ln C

Ebből u-t kifejezve kapjuk a homogén általános megoldást.

C
uh 
x2

A partikuláris megoldás előállításához az állandó variálásának módszerét alkalmazzuk.

1
u p ( x)  C ( x) 
x2

Ezt most deriváljuk

1 2
u p '( x)  C '( x)  2
 C ( x)  3
x x

ha ezt behelyettesítünk az inhomogén egyenletbe, rendezés után a következő adódik.

x6
C '( x)  x ; C ( x) 
5
6

Ezt felhasználva adódik a partikuláris megoldás

1 x6 1 x 4
u p ( x)  C ( x)  2   2 
x 6 x 6

Az uh és up megoldások összege adja a lineáris egyenlet általános megoldását.

1 x4
u ( x)  C  
x2 6

A Bernoulli-féle differenciálegyenlet y(x) megoldása az u(x) = y–2(x) egyenlet átrendezésével


adódik.

1
y ( x) 
1 x4
C 2 
x 6

207
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.11. Ábra: A 2.1.14. példabeli Bernoulli-féle differenciálegyenlet iránymezője, és néhány integrálgörbe

A 2.1.11. ábra alapján is világos, de már az első lépésben végrehajtott átalakításból is következik,
hogy az x = 0 helyen a differenciálegyenlet szinguláris. Az x = 0 feltétel helyettesítésével az
eredeti egyenletből is következik, hogy y = 0, tehát az origón végtelen sok integrálgörbe halad át.
Ezen a helyen nem teljesülnek a megoldás egyértelműségének a feltételei.

2.1.10. Egzakt differenciálegyenlet


Ebben a pontban egy bizonyos szempontból általánosabb szerkezetű elsőrendű egyenletet
tanulmányozunk. Az általános jelző értelmére a pont végén visszatérünk.

2.1.7.Definíció: Legyen a T tartomány a síknak, tehát R2-nek egy részhalmaza, továbbá tegyük
fel, hogy az F(x, y) kétváltozós függvény parciális deriváltjai folytonosak a T tartományon. Azt
mondjuk, hogy az F(x, y) függvény, a T tartományon folytonos P(x, y) és Q(x, y) függvénypár
primitív függvénye, ha F’x(x, y) = P(x, y) és F’y(x, y) = Q(x, y). Tehát az F primitív függvény, ha
F első változó szerinti parciális deriváltja a P, a második változó szerinti parciális deriváltja a Q.
Felmerül a kérdés, hogy egy P(x, y), Q(x, y) függvénypárnak milyen feltételek mellett létezik
primitív függvénye? Erre ad választ az alábbi tétel:

2.1.7.Tétel: Tegyük fel, hogy a P(x, y), Q(x, y) kétváltozós függvények és aP’y(x, y), Q’x(x, y)
parciális derivált függvények folytonosak. Ilyen feltételek mellett a P(x, y), Q(x, y)
függvénypárnak a T tartományon akkor és csak akkor létezik primitív függvénye, ha

P’y(x, y) = Q’x(x, y)

Bizonyítás: Egyrészt tegyük fel, hogy létezik primitív függvény, azaz létezik F(x, y) függvény, a
T tartományon olyan, hogy

208
Óbudai Egyetem BGK Fejezetek a matematikából

F F
 x, y   P  x, y  ;  x, y   Q  x, y  ;
x y

Ekkor a másodrendű vegyes parciális deriváltak a következők

2 F P 2F Q
 
x, y   
x , y ;  x, y    x , y  ;
yx y xy x

Mivel definíció szerint a másodrendű deriváltak folytonosak, a Young-tétel szerint a vegyes


parciális deriváltak egyenlők, tehát teljesül P és Q elsőrendű deriváltjaira vonatkozó feltétel.
Megfordítva tegyük fel, hogy teljesül a P’y(x, y) = Q’x(x, y) feltétel. Megmutatjuk, hogy ekkor
létezik primitív függvény, sőt konstruktív úton elő is állítjuk azt. Tegyük fel tehát, hogy az F(x, y)
a keresett primitív függvény. Ekkor a primitív függvény definíciója szerint teljesülnie kell a
következőnek
F
 x, y   P  x, y 
x

Integráljuk most ezt az egyenletet az x-változó szerint.

F ( x, y)   P  x, y dx  h  y 

ahol h(y) az y-változó tetszőleges függvénye, ez ugyanis az x-szerinti deriváláskor eltűnik.


Vegyük figyelembe, hogy teljesülnie kell a

F
 x, y   Q  x , y 
y

feltételnek is. Az F(x, y) kapott előállításából az adódik, hogy

F ( x, y) 
P  x, y dx  h '  y   Q  x, y 
y 

y

ahonnan a h(y) függvény meghatározható

   
h '  y   Q  x, y    P  x, y dx; azaz h  y     Q  x, y    P  x, y dx dy
y  y 

Innen pedig kapjuk a primitív függvény következő előállítását

  
F ( x, y)   P  x, y dx    Q  x, y    P  x, y dx dy
 y 

Könnyen ellenőrizhető az

209
Óbudai Egyetem BGK Fejezetek a matematikából

F 'x  x, y   P  x, y  , F ' y  x, y   Q  x, y 

Feltételek teljesülése. Ezzel a függvénypár primitív függvényét tehát előállítottuk. ■

2.1.8.Definíció: Tegyük fel, hogy a P(x, y), Q(x, y) kétváltozós függvények a T tartományon
folytonosak. A

P(x, y) + Q(x, y)∙y’(x) = 0

differenciálegyenletet egzaktnak nevezzük, ha a P(x, y) és Q(x, y) függvénypárnak a T


tartományon létezik primitív függvénye. Az előző tétel szerint, ha az említett folytonossági
feltételek teljesülnek, az egzaktság egyenértékű azzal, hogy teljesül a

P’y(x, y) = Q’x(x, y)

egyenlet. Az egzakt differenciálegyenlet alakja egy kissé szokatlan a korábbiakhoz képest, ezért
más ekvivalens formában is felírjuk. Tegyük fel, hogy a T tartományban a Q(x, y) függvény sehol
sem zérus. Ekkor az egzakt differenciálegyenlet felírható az alábbi megszokottabb alakban

P  x, y 
y  x   
Q  x, y 

Az egzakt differenciálegyenlet megoldásáról szól az alábbi tétel.

2.1.8.Tétel: Tegyük fel, hogy az F(x, y) függvény a T tartományon differenciálható és a parciális


deriváltjai folytonosak, és tegyük fel továbbá, hogy F(x, y) a P(x, y), Q(x, y) függvénypár primitív
függvénye, továbbá Q(x, y) ≠ 0 ha (x, y)T. Ekkor a

P(x, y) + Q(x, y)∙y’(x) = 0

egzakt differenciálegyenlet megoldásai azonosak az

F(x, y) = C

implicit módon megadott függvénnyel, ahol C tetszőleges valós szám az F(x, y) függvény
értékkészletéből.
Bizonyítás: Tegyük fel, hogy az F(x, y) = C egyenlet által meghatározott implicit függvény az
y= y(x) függvény. Képezzük az F(x, y) = C egyenlet x-változó szerinti deriváltját. Az összetett
függvény deriválási szabályát felhasználva kapjuk, hogy

F 'x  x, y   F ' y  x, y   y '  x   0

210
Óbudai Egyetem BGK Fejezetek a matematikából

Ha alkalmazzuk az F’x(x, y) = P(x, y) és F’y(x, y) = Q(x, y) jelöléseket, akkor az adódik,, hogy az


y(x) függvény kielégíti a P(x, y) + Q(x, y)∙y’(x) = 0 differenciálegyenletet. Éppen ezt kellett
bizonyítani. ■

Egyetlen kérdés maradt tehát. Hogyan állítható elő egy P(x, y), Q(x, y) függvénypár primitív
függvénye? A válasz a következő, meg kell oldani az

1 F 'x  x, y   P  x, y  
 2  F ' y  x, y   Q  x, y 

parciális differenciálegyenlet-rendszert. Ennek megoldása a tétel bizonyítása során követett


gondolatmenet megismétlését igényli. Elsőként például integráljuk az (1) egyenletet az x változó
szerint

F ( x, y)   P  x, y dx  h  y 

itt a primitív függvény tartalmaz egy „állandót” amely az x-változó szerinti deriváláskor eltűnik,
ilyen módon ez lehet az y változónak egy tetszőleges függvénye: h(y). A kapott F(x, y) függvényt
deriváljuk az y-változó szerint

F 
P  x, y dx  h '  y 
y 
( x, y) 
y

és behelyettesítjük a (2) egyenletbe.

 
Q( x, y )   P  x, y dx  h '  y  ; azaz h '  y   Q( x, y )   P  x, y dx;
y y

Ebben szerepel h’(y), tehát ez egy egyszerűen integrálható differenciálegyenlet h(y)-ra


vonatkozólag. Ha ennek megoldását előállítottuk, behelyettesítjük F(x, y) fenti előállításába és a
primitív függvényt megkaptuk. Lássuk, hogyan történik ez egy konkrét esetben.

2.1.15.Példa: Határozzuk meg a

 1
 3x e
2 y

 3sin x   x3e y   y '  0
 y

elsőrendű differenciálegyenlet általános megoldását. Vezessük be a

 1
 
P( x, y)  3x 2e y  3sin x ; Q( x, y)   x3e y  
 y

jelöléseket. A parciális deriváltak kiszámításával eldől, hogy az egyenlet egzakt-e.

211
Óbudai Egyetem BGK Fejezetek a matematikából

P ' y ( x, y)  3x2e y ; Q 'x ( x, y)  3x 2e y

Ezek a deriváltak egyenlők, tehát az egyenlet egzakt. Létezik tehát egy F(x, y) függvény, amelyre
teljesülnek az alábbi egyenletek

1 F 'x ( x, y)  3x 2e y  3sin x ;


 3 y 1 
 2  F ' y ( x, y )   x e   
 y 

F(x, y) előállítható például az első egyenlet integrálásával:

 
F ( x, y)   3x 2e y  3sin x dx  x3e y  3cos x  h( y)

ahol h(y) az y változónak egyelőre tetszőleges függvénye, ugyanis x-változó szerinti deriváláskor
valóban eltűnik. A h(y) meghatározásához deriváljuk F-et az y-változó szerint és vessük össze a
(2) egyenlettel
1
F ' y ( x, y)  x3e y  h '( y)  x3e y  ;
y
1
Ebből látszik, hogy h '( y )  , tehát h  y   ln y . Meghatároztuk tehát az F(x, y) primitív
y
függvényt.
F ( x, y)  x3e y  3cos x  ln y

Innen a differenciálegyenlet általános megoldása implicit alakban a következő.

x3e y  3cos x  ln y  C .

A 2.1.12. ábrán szemléltetjük az egzakt differenciálegyenlet általános megoldását.

2.1.12. Ábra: A 2.1.15. példabeli egzakt differenciálegyenlet iránymezője, és néhány integrálgörbe

212
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.11. Integráló tényező


Természetesen nem teljesül minden esetben, hogy a differenciálegyenlet egzakt, tehát nem
teljesül a

P’y(x, y) = Q’x(x, y)

egyenlőség. Ekkor felmerül a kérdés, hogy nem lehet-e az egyenletet egzakttá tenni. A válasz az,
hogy bizonyos esetekben igen. Szorozzuk meg a

P(x, y) + Q(x, y)∙y’(x) = 0

egyenletet egy olyan m(x, y) függvénnyel, amely a T tartományban sehol sem 0.

m(x, y)∙P(x, y) + m(x, y)∙Q(x, y)∙y’(x) = 0

2.1.9.Definíció: Ha az m(x, y) függvény olyan, hogy az m(x, y)∙P(x, y), m(x, y)∙Q(x, y)
függvénypárnak létezik primitív függvénye, akkor az m(x, y) függvényt a differenciálegyenlet
integráló tényezőjének vagy multiplikátorának nevezzük.

Az általános esetben a multiplikátor meghatározása parciális differenciálegyenletek megoldását


igényli, ezért nem szólunk róla általánosan, csak abban a két speciális esetben, amikor a
multiplikátor egyváltozós függvény. Kitűzzük tehát feladatként, hogy keressünk csak x-től függő
m(x) vagy csak y-tól függő m(y) integráló tényezőt.

2.1.10.Példa: Keressünk integráló tényezőt az

y 2  1   xy  1 y '  0

differenciálegyenlethez. Elsőként vizsgáljuk meg, hogy az egyenlet egzakt-e. Legyen

P  x, y   y 2  1; Q  x, y   xy  1

Ekkor P ' y  x, y   2 y; Q 'x  x, y   y . Ezek a parciális deriváltak nem egyenlők, tehát az egyenlet
nem egzakt.
a) Keressünk csak az x-változótól függő m(x) multiplikátort. Ekkor az egyenlet alakja a
következő
 
m  x  y 2  1  m  x  xy  1 y '  0

az a kérdés, létezik-e olyan m(x) függvény, amely esetén teljesül az egzaktság feltétele. A
szükséges parciális deriváltak a következők

  
y 
 
m  x  y2 1   2 y  m  x  ; m  x  xy  1   m '  x  xy  1  y  m  x  ;
x 

213
Óbudai Egyetem BGK Fejezetek a matematikából

ezek egyenlősége az egzaktság feltétele, tehát

m ' x y
m  x  2 y  m '  x  xy  1  m  x  y; azaz 
m  x  xy  1

Ez m(x)-re vonatkozólag egy szeparálható differenciálegyenlet. Látható azonban, hogy a


megoldás nem független y-tól, tehát a differenciálegyenletnek nem létezik csak x-től függő
multiplikátora.

b) Próbálkozzunk csak y-tól függő integráló tényező keresésével. Ekkor az egyenlet alakja

 
m  y  y 2  1  m  y  xy  1 y '  0

A parciális deriváltak a következők

  
y      
m  y  y2 1   m '  y  y2 1  2 y  m  y  ; m  y  xy  1   y  m  y 
x 

Az egzaktság feltétele pedig a következő

m ' y y
 
m '  y  y 2  1  2 y  m  y   y  m  y  ; azaz  2
m  y  y 1

Ez ismét egy szeparálható differenciálegyenlet az ismeretlen m(y) függvényre vonatkozólag, és


ezúttal eredményes a próbálkozás, mert a megoldás valóban csak az y-tól függ. Az egyenlet
megoldása az alábbi.

dm

1 2y
2 y 1
2
1
 
dy; ln m  y    ln y 2  1 ; ahonnan m  y  
1
m 2 y2 1

Ezzel tehát megkaptuk az integráló tényezőt. Ellenőrizzük, hogy valóban egzakt egyenletet
kaptunk-e. Az egyenlet alakja most

y2 1 
 xy  1 y '  0
y2 1

Ellenőrizzük az egzaktság feltételét.

 y   xy  1 y
y2 1  ;  ;
y y 2  1 x y 2  1 y2 1

Az egyenlet tehát valóban egzakt. A megoldás a korábbiak szerint innen már meghatározható.
214
Óbudai Egyetem BGK Fejezetek a matematikából

A példában követett gondolatmenetet könnyen általánosíthatjuk, és az eredményt


megfogalmazhatjuk egy tétel formájában is.

2.1.9.Tétel: Tegyük fel, hogy a P(x, y) + Q(x, y)∙y’(x) = 0 differenciálegyenletnek létezik csak x
változótól függő m(x) multiplikátora. Ekkor teljesül az

P ' y  x, y   Q 'x  x, y 
ln m  x    dx
Q  x, y 

összefüggés. Hasonlóan, ha a differenciálegyenletnek létezik csak y változótól függő m(y)


multiplikátora akkor teljesül az

Q 'x  x, y   P ' y  x, y 
ln m  y    dy
P  x, y 

összefüggés. A multiplikátor ezekből az egyenletekből az integrál kiszámítása útján


meghatározható.
Bizonyítás: Tegyük fel, hogy létezik csak x-től függő multiplikátor. Ekkor a differenciálegyenlet
alakja a következő
m  x  P  x, y   m  x  Q  x, y  y '  0

Az egzaktság feltétele a

 P  x, y   Q  x, y 
 m  x  P  x, y    m  x  ; m  x  Q  x, y   m '  x  Q  x, y   m  x 
y y x x

parciális deriváltak egyenlősége, azaz teljesülnie kell, hogy

P  x, y  Q  x, y 
m  x  m '  x  Q  x, y   m  x 
y x

Ez m(x)-re vonatkozólag egy szeparálható differenciálegyenlet. Egyszerűbb jelölésekkel

m '  x  P ' y  x, y   Q 'x  x, y 


 
m '  x  Q  x, y   m  x  P ' y  x, y   Q 'x  x, y  ; azaz
m  x

Q  x, y 

Ennek az egyenletnek a megoldása pedig a következő egyenlőséggel adható meg:

P ' y  x, y   Q 'x  x, y 
ln m  x    dx
Q  x, y 

215
Óbudai Egyetem BGK Fejezetek a matematikából

Az állítást ezzel igazoltuk. Hasonlóan, értelemszerű módosításokkal adódik a csak y-tól függő
multiplikátorra vonatkozó integrálképlet. ■

Az egzakt egyenletek és egyben az elsőrendű differenciálegyenletek témájának lezárásaként


vizsgáljuk meg, hogy milyen szempontból általánosabb az egzakt differenciálegyenlet, mint a
megelőző pontokban vizsgált egyenletek.

Elsőként megmutatjuk, hogy a szeparálható differenciálegyenlet egzakt differenciálegyenlet,


másképpen mondva tehát a szeparálható egyenlet egy speciális egzakt egyenlet. Ez könnyen
látható, ha a szeparálható egyenletet átrendezzük a következő módon

1
y '  f  x g  y; f  x  y' 0
g  y

Az egzaktság feltétele pedig a következő parciális deriváltak egyenlősége. Mivel


  1
f  x   0; másrészt  0 , ezek valóban azonosan egyenlők, tehát a szeparálható
y x g  y 
differenciálegyenlet egzakt. Mivel a homogén lineáris differenciálegyenlet szeparálható, azonnal
következik, hogy a homogén lineáris differenciálegyenlet is egzakt differenciálegyenlet.

Vizsgáljuk meg végezetül, hogy az inhomogén lineáris differenciálegyenlet egzakt-e. Ehhez írjuk
fel az egyenletet az ekvivalens

f  x y  g  x  y '  0

alakban. Innen azonnal látható, hogy az egyenlet nem egzakt. Kérdés, hogy létezik-e integráló
tényező. Keressünk csak x-től függő multiplikátort

m  x   f  x  y  g  x   m  x  y '  0

Az egzaktság feltétele a következő parciális deriváltak egyenlősége

 
m  x   f  x  y  g  x   m  x  f  x  ; m  x   m '  x 
y x

az inhomogén lineáris differenciálegyenlet tehát egzakttá tehető, ha teljesül az


m  x  f  x   m '  x  egyenlőség, amely szeparálható egyenlet m(x)-re. Innen integrálással kapjuk,
hogy
f  x dx
m  x   e

Megkaptuk tehát az x-től függő integráló tényezőt. Az inhomogén lineáris differenciálegyenlet

216
Óbudai Egyetem BGK Fejezetek a matematikából

f  x dx f  x dx
e   f  x  y  g  x    e  y' 0

ekvivalens alakja tehát egzakt differenciálegyenlet.

217
Óbudai Egyetem BGK Fejezetek a matematikából

2.2. Másodrendű differenciálegyenletek


2.2.1.Bevezető példák
2.2.1.Példa: Tekintsünk egy m tömegű anyagi pontot, melyet egy D rugóállandójú rugóhoz, a
rugó másik végét pedig egy függőleges falhoz rögzítjük. A tömegpont vízszintes síkban
súrlódásmentesen mozoghat. Határozzuk meg a rugó helyét az idő függvényében. Jelölje a
helykoordinátát y, amelyet ebben az esetben kitérésnek nevezünk. Helyezzük el a
koordinátatengelyt úgy, hogy a rugó nyújtatlan helyzetében, tehát az egyensúlyi helyzetben, az m
tömegű tömegpont az y = 0 helykoordinátánál van. Ezek után tehát feladat az y = y(t) függvény
analitikus alakjának meghatározása. Induljunk ki a dinamika alaptörvényéből, mely szerint
ma = ΣF. A gyorsulást a mondott feltételek mellett csak az F = –Dyrugóerő határozza meg, így a
mozgásegyenlet a következő: ma = –Dy. Ha a tömegpontot úgy hozzuk mozgásba, hogy
egyszerűen csak kitérítjük, és utána magára hagyjuk, akkor a mozgás egyenes mentén történik,
így az előbbi vektori egyenlet skaláris egyenletté redukálódik. Tehát a mozgásegyenlet ma = –
Dy. Ha felhasználjuk, hogy a pillanatnyi gyorsulás a helykoordináta második deriváltja, akkor
kapjuk a következő differenciálegyenletet.

my " t    Dy  t  ;

ahol m és D rögzített állandók. A probléma egy olyan differenciálegyenletre vezetett, amelyben


az ismeretlen függvény második deriváltja is szerepel az ismeretlen függvény mellett. Ez tehát
egy másodrendű differenciálegyenlet. A tömegpont adott feltételek mellett kialakuló mozgását
harmonikus rezgőmozgásnak nevezzük. ha alkalmazzuk a fizikában szokásos jelölést, és
D
bevezetjük az 2  jelölést, akkor kapjuk a harmonikus rezgés differenciálegyenletét a
m
szokásos alakban

y " 2 y  0

2.2.2.Példa: Egészítsük ki az előző példabeli problémát azzal, hogy az m tömegű tömegpont nem
súrlódásmentesen mozog, hanem ellenálló közegben, és tegyük fel, hogy a közegellenállás
arányos a pillanatnyi sebességgel. Tehát hangsúlyozzuk, hogy nem súrlódási erő hat a
tömegpontra, hanem közegellenállási erő. Legyen a közegellenállási erő alakja F= –kv. Ekkor a
tömegpont mozgására vonatkozólag a dinamika alaptörvénye a következő: ma = –Dy – kv. Ha
kitérítés után magára hagyjuk a tömegpontot a mozgás egyenes pályán történik, így ismét skaláris
egyenletet kapunk: ma = –Dy– kv. Ha felhasználjuk, hogy a pillanatnyi sebesség a helykoordináta
első deriváltja, akkor a következő differenciálegyenletet kapjuk:

my " t    Dy  t   ky '  t  ;

218
Óbudai Egyetem BGK Fejezetek a matematikából

Ebben az egyenletben az ismeretlen függvény mellett szerepel annak első és második deriváltja
is, de ismételten másodrendű differenciálegyenletet kaptunk. A harmonikus és közegellenállási
erő együttes hatására kialakuló mozgást csillapított rezgőmozgásnak nevezzük. Ha alkalmazzuk a
D k
fizikában megszokott jelöléseket, azaz bevezetjük az 2  , 2  jelöléseket, akkor kapjuk a
m m
csillapított rezgés differenciálegyenletét

y " 2y ' 2 y  0

2.2.3.Példa: Tegyük fel, hogy a csillapított rezgő rendszerre egy periodikus gerjesztő erő is hat,
amely egy harmonikus rezgést kényszerít a tömegpontra. Legyen ennek a gerjesztésnek a
körfrekvenciája Ω, ekkor a gerjesztő erő az F = F0sinΩt analitikus formában adható meg. Ekkor a
mozgásegyenlet alakja a következő: ma = –Dy– kv+ F0sinΩt. Használjuk fel az előző példában
F
bevezetett jelöléseket és vezessük be továbbá a fizikában megszokott f 0  0 jelölést. Ekkor
m
kapjuk gerjesztett vagy kényszerített (és csillapított) rezgés differenciálegyenletét

y " 2y ' 2 y  f0 sin t

Ismét olyan differenciálegyenletet kaptunk, amely az ismeretlen függvényen és annak első


deriváltján kívül a második deriváltat is tartalmazza. A különbség az első két példa egyenletéhez
képest az, hogy ebben szerepel egy y-tól független tag is.
Az alábbiakban, az elmélet kifejtése után alkalmazásképpen megoldjuk majd ezeket a
másodrendű differenciálegyenleteket.

2.2.2. Explicit közönséges másodrendű differenciálegyenlet


Egy explicit közönséges másodrendű differenciálegyenlet általános alakja a következő:

y " x   f  x, y  x  , y '  x  

ahol a jobb oldal, az f függvény az R3, tehát a háromdimenziós tér egy T tartományában van
értelmezve. A továbbiakban alkalmazni fogjuk az y = y(x) egyszerűsítő jelölést.
Először is tisztázzuk mit értünk általában egy ilyen másodrendű differenciálegyenlet megoldásán.
Egy másodrendű differenciálegyenlet megoldása során elvileg két alkalommal integrálunk, még
akkor is, ha ezt konkrétan egyes esetekben nem kell elvégeznünk, tehát adódik a megoldás során
két integrációs konstans: C1 és C2. Így az általános megoldás ugyancsak végtelen sok függvény,
de ezek a függvények két szabad paramétertől függenek, y = y(x, C1, C2), tehát ebben az esetben
az általános megoldás egy kétparaméteres függvénysereg.

Egy konkrét probléma megoldásaként ennek a függvényseregnek csak egy eleme jöhet szóba, ezt
úgy választjuk ki, hogy a C1 és C2 konstansokat bizonyos feltételekből meghatározzuk. Mivel itt
két konstans szerepel nyilván két kezdeti feltételre van szükség. Ezek standard alakja a

219
Óbudai Egyetem BGK Fejezetek a matematikából

következő: y(x0) = y0 és y’(x0) = y1. Ez annyit jelent, hogy előírjuk, hogy az integrálgörbe
haladjon át az (x0, y0) ponton, és ebben a pontban az integrálgörbe meredeksége legyen y1.

2.2.1.Definíció: Egy explicit közönséges másodrendű egyenletre vonatkozó kezdetiérték


probléma vagy Cauchy-feladat az alábbi.

y” = f(x, y, y’), y(x0) = y0, y’(x0) = y1

Ennek a kezdeti érték problémának a megoldását a differenciálegyenlet adott kezdeti feltételeket


kielégítő partikuláris megoldásának nevezzük.

Természetesen felmerül a kérdés, hogy milyen feltételek mellett létezik megoldás, és milyen
esetben egyértelmű ez a megoldás. Az elsőrendű differenciálegyenletek elméletében adott
feltételt általánosítjuk, tehát ragaszkodunk egy egyszerűen ellenőrizhető, a mérnöki gyakorlatban
kielégítő feltétel megadásához.

2.2.1.Tétel: (Egzisztencia és unicitási tétel)


Tegyük fel, hogy az y” = f(x, y, y’ ) differenciálegyenlet jobb oldala a T  R3 térbeli tartományon
van értelmezve, legyen továbbá (x0, y0, y1) T a tartomány egy tetszőleges belső pontja.
a) Ha az f(x, y, y’)függvény folytonos az (x0, y0, y1) pont egy δ sugarú k  x0 , y0 , y1 
környezetében, tehát a T tartományhoz tartozó, (x0, y0, y1) középpontú δ sugarú nyílt gömbben,
f
b) továbbá az f(x, y,y’) függvény második változó szerinti  x, y, y ' és harmadik változó
y
f
szerinti  x, y, y ' parciális deriváltja korlátos ebben a k  x0 , y0 , y1  környezetben akkor az
y '
y” = f(x, y, y’) differenciálegyenletnek létezik olyan y(x) megoldása, amely kielégíti az y(x0) = y0
és y’(x0) = y1 kezdeti feltételeket, és ez a megoldás a k  x0 , y0 , y1  környezetben egyértelmű.
Ha az a) és b) feltételek nem csak egy környezetben, hanem a teljes T tartományon teljesülnek,
akkor az y(x0) = y0, y’(x0) = y1 kezdeti feltételeket kielégítő megoldás az egész T tartományon
egyértelműen létezik, továbbá a megoldás (integrálgörbe) a T tartomány határától a T tartomány
határáig halad.

A mondottak szerint tehát az integrálgörbék adott kezdeti feltételek mellett egyértelműen létező
térbeli görbék. Ez a szemléltetést némileg megnehezíti, mert a megoldásokat térben kellene
ábrázolni. Ezért, azt tesszük, hogy az integrálgörbék (x,y)-síkra vonatkozó vetületét ábrázoljuk,
ezzel illusztrálva a megoldásokat. Ebben az esetben azonban már nem teljesül az egyértelműség
abban az értelemben, hogy a T háromdimenziós térbeli tartomány (x, y)-síkra vonatkozó T’
vetületének egy (x0, y0) pontján át nem pontosan egy, hanem végtelen sok megoldás halad át.
Ugyanis végtelen sok integrálgörbe vetülete illeszkedik erre a pontra, hiszen az y’(x0) = y1 feltétel
végtelen sokféle módon megválasztható a rögzített y(x0) = y0 feltétel mellett. Ez szemléletesen a
következőt jelenti: az y(x0) = y0 kezdeti feltétel azt jelenti, hogy az y(x) megoldás illeszkedik az
(x0, y0) pontra, az y’(x0) = y1 pedig azt jelenti, hogy az adott pontra illeszkedő y = y(x) görbe adott
pontbeli meredeksége y1, ami végtelen sokféle módon megválasztható.

220
Óbudai Egyetem BGK Fejezetek a matematikából

A továbbiakban különböző típusú, kvadraturával megoldható differenciálegyenlet típusokat


vizsgálunk. Két osztályt vizsgálunk részletesen. Az első kategória olyan egyenleteket tartalmaz,
amelyek elsőrendű egyenletre visszavezethetők, ezek lesznek a hiányos egyenletek. A másik
kategória a műszaki és természettudományos szempontból legfontosabb lineáris és ilyenre
visszavezethető egyenleteket tárgyalja.

2.2.3. Hiányos másodrendű differenciálegyenletek

2.2.2.Definíció: Az explicit közönséges másodrendű y " x   f  x, y  x  , y '  x  


differenciálegyenletet hiányosnak nevezzük, ha az egyenletben nem szerepel explicit módon az
x-változó, vagy az y ismeretlen függvény, vagy az ismeretlen függvény y’ első deriváltja, vagy
ezek egyszerre hiányoznak valamilyen kombinációban.

Természetesen az egyenletből nem hiányozhat az y” második derivált, hiszen akkor az egyenlet


nem másodrendű, tehát nem tartozik ebbe a fejezetbe. Az elnevezést módosíthatnánk úgy, hogy
hiányos egyenlet helyett, „a differenciálegyenlet rendjének csökkentését lehetővé tevő
egyenletek”-ről beszélnénk, hiszen mint látjuk, minden esetben visszavezetjük a megoldást
elsőrendű differenciálegyenletek megoldására.

A hiányos egyenletek a megoldás szempontjából három osztályba sorolhatók.


a) Az egyenletből hiányzik y és y’, tehát az egyenlet alakja y” = f(x).
b) Az egyenletből hiányzik y, tehát az egyenlet alakja y” = f(x, y’).
c) Az egyenletből hiányzik x, tehát az egyenlet alakja y” = f(y, y’).

Az alábbiakban ezt a felsorolást követve tárgyaljuk az egyes egyenletek megoldását.

a) Az egyenletből hiányzik y és y’, tehát az egyenlet alakja y” = f(x).

Ez a legegyszerűbb eset, a megoldás lényegében abból áll, hogy a jobboldali f(x) függvényt
egymás után kétszer integráljuk. Azaz

y "  f  x  ; y '   f  x  dx  C1; y     f  x  dx  dx  C1x  C2 ;


Ezzel az egyenlet megoldását meg is határoztuk. A megoldás módszeréből viléágos, hogy
voltaképpen két elsőrendű egyenlet megoldását határoztuk meg. Ha előírunk kezdeti feltételeket,
akkor a C1 és C2 állandók meghatározhatók.

2.2.4.Példa: Ebbe a kategóriába tartozó egyik legegyszerűbb ugyanakkor legfontosabb példa, egy
tömegpont állandó erő hatására kialakuló mozgásállapotának meghatározása. Legyen tehát
F
ma = F = állandó, azaz a   állandó . Ekkor a megoldandó differenciálegyenlet a következő
m
y "  a; a R

221
Óbudai Egyetem BGK Fejezetek a matematikából

Követve a bemutatott gondolatmenetet, azaz kétszer integrálva, kapjuk az általános megoldást

t2
y '  t   v  t   at  C1; y  t   a  C1t  C2 .
2

megkaptuk tehát a pillanatnyi sebességet és a helykoordinátát, mint az idő függvényét. Ha


előírunk kezdeti feltételeket, a tömegpont helyét és sebességét a kezdeti t = 0s időpontban, azaz
megköveteljük, hogy y(0) = y0 és y’(0) = v0 teljesüljön, akkor adódik a két integrációs állandó
értéke. Könnyen ellenőrizhetően a partikuláris megoldás a következő

a 2
y '  t   v  t   at  v0 ; y  t   t  v0t  y0 .
2

Megkaptuk tehát az egyenletesen gyorsuló tömegpont, fizikából ismert kinematikai egyenleteit.

b) Az egyenletből hiányzik y, tehát az egyenlet alakja y” = f(x, y’).

Ebben az esetben egy olyan módszer teszi lehetővé a megoldást, amely nagyon gyakran
alkalmazható a differenciálegyenletek megoldása során, és amelyet már az elsőrendű egyenletek
tárgyalása során is bemutattunk, ez pedig az új ismeretlen függvény bevezetése.
Legyen u(x) = y’(x) az új ismeretlen függvény. Ekkor nyilvánvalóan teljesül, hogy u’(x) = y”(x),
tehát az egyenlet alakja a következő:

1 u '  f  x, u  ;  2 y '  u azaz y   u  x  dx


Kaptunk tehát két elsőrendű differenciálegyenletből álló rendszert. A megoldás módja a
következő: Elsőként maghatározzuk az (1) elsőrendű differenciálegyenlet megoldását, az u(x)
függvényt, melynek során születik egy C1 integrációs állandó. Majd ezt követően megoldjuk a (2)
egyenletet, tehát integráljuk az u(x) függvényt, melynek során születik egy C2 integrációs
konstans, ezzel előáll y(x) mint egy kétparaméteres függvénysereg, tehát az általános megoldás.

2.2.5.Példa: Tegyük fel, hogy egy m tömegű motorcsónak egy tóban állandó v0 sebességgel
egyenes pályán halad. t = 0s-kor kikapcsoljuk a motort. Tegyük fel továbbá, hogy a
motorcsónakra a pillanatnyi sebességgel egyenesen arányos, és azzal ellentétes irányú
közegellenállási erő hat a vízben. Határozzuk meg a motorcsónak helyét az idő függvényében a
motor kikapcsolását követően, ha a kezdeti feltételek a következők: y(0) = 0, y’(0) = v(0) = v0. A
csónak mozgásegyenlete a következő: ma = –kv. Ha a szokásos módon áttérünk a deriváltakra,
akkor kapjuk az

my "  ky '; y  0  0; y '  0   v0 ;

hiányos másodrendű differenciálegyenletre vonatkozó Cauchy-feladatot. Az egyenlet valóban


hiányos, és ebbe a kategóriába tartozik, ugyanis az egyenletben nem szerepel az y(t) ismeretlen
függvény explicit módon.

222
Óbudai Egyetem BGK Fejezetek a matematikából

k
Vezessük be az új ismeretlen függvényt az u(x) = y’(x) definícióval. Ekkor, az   0
m
egyszerűsítő jelölés bevezetésével a következő elsőrendű, szétválasztható változójú egyenletet
kapjuk

u '  u

A változókat szétválasztva és integrálva a következő adódik.


1 1
du  dt;  du    dt; ln u  t  ln C1 ; ln u  ln et  ln C1 ; y '  t   u  t   C1e t ;
u u

Ahol C1 tetszőleges 0-tól különböző valós szám. Ezzel meg is kaptuk az y’ derivált függvény,
tehát a sebesség időfüggésének analitikus alakját: y '  t   v  t   C1et . Ennek integrálásával
kapjuk a hely időfüggését.

C1 t C
y  t    C1et dt  e  C2  C2  1 et
 

Az általános megoldást ezzel előállítottuk. Vegyük most figyelembe a kezdeti feltételeket. Az


y’(0) = v(0) = v0 feltételből következik, hogy C1 = v0. Az y(0) = 0 kezdeti feltételből pedig az
C
adódik, hogy C2  1 . ha figyelembe vesszük az α értelmezését, akkor kapjuk a kezdeti

feltételeket kielégítő partikuláris megoldást, tehát a motorcsónak mozgását leíró kinematikai
egyenleteket.

v m  t
k
v  t   v0e t
; y  t   0 1  e m 
k  

Azt kaptuk tehát, hogy mind a sebesség, mind a hely az idő exponenciális függvénye szerint
változik.

223
Óbudai Egyetem BGK Fejezetek a matematikából

a) b)

2.2.1.Ábra. A 2.2.5. példabeli Cauchy feladat megoldása. a) a sebesség, b) a hely időfüggése

A 2.2.1. ábrán szemléltettük a Cauchy-feladat megoldását α = 0,1 és v0 = 5m/s konstansok


esetében. Helyettesítéssel látható, de a görbékről is leolvasható, hogy t → ∞ esetén, tehát
határértékben a sebesség tart 0-hoz, a megtett út hossza pedig közelít az 50m-hez.

2.2.6.Példa: Határozzuk meg, hogy egy homogén tömegeloszlású lánc (kötél, zsinór, stb.)
kizárólag a saját súlyának a hatására, a gravitációs térben milyen alakot vesz fel. Azaz feladatként
tűzzük ki a „láncgörbe” analitikus alakjának meghatározását.

F2 FB
y(x)

α
F1

FA

mg x
2.2.2.Ábra. A „láncgörbe” meghatározásához tartozó statikai probléma diagramja

Alkalmazzuk az ábra jelöléseit. A görbének nyilván van egy abszolút minimuma, ahol az érintője
vízszintes. Helyezzük el úgy a görbét a koordináta rendszerben, hogy ennek a pontnak az
abszcisszája a 0 pontba kerüljön, majd vizsgáljuk a görbét a [0, x] intervallumon. Az ábra a lapján
világos, hogy egy olyan statikai problémával állunk szemben, melyben az FA erő az FB erő
224
Óbudai Egyetem BGK Fejezetek a matematikából

vízszintes komponensével tart egyensúlyt, az FB erő függőleges komponense pedig egyenlő a


lánc [0, x] intervallumba eső darabjának mg súlyával. Az egyensúlyi egyenletek tehát a
következők: FA  F1  FB cos  , másrészt pedig mg  F2  FB sin  . Ha képezzük a két egyenlet
F sin 
hányadosát, figyelembe véve, hogy 2   tg   y '  x  , kapjuk, hogy a statikai probléma
F1 cos 
mg
az y '  x   egyenletre vezet. A jobb oldal ebben az esetben az m tömegen keresztül függ az x
FA
helykoordinátától. Mivel a feltevés szerint a lánc homogén tömegeloszlású, az m tömeg arányos
az s ívhosszúsággal. Ez utóbbit az analízisből ismert módon, az alábbi formula szolgáltatja.

x
s  x    1   y '  t   dt
2

ha az arányossági tényezőt β jelöli, azaz m = βs, akkor kapjuk a következő egyenletet az y(x)
függvényre vonatkozólag

g g x x
y ' x 
s  x      1   y '  t   dt
2 2

FA 
FA 0
1  y ' t dt  K 
0
Ahol K egy állandó. Ez még nem „igazi differenciálegyenlet”, hiszen az ismeretlen függvény egy
integrandusban is szerepel. Ez a probléma eltűnik, ha egyszer deriváljuk ezt az egyenletet.

y " x   K 1   y '  x  
2

Ez pedig már valóban egy hiányos másodrendű differenciálegyenlet, amelyből hiányzik az y.


Vezessük be az u(x) = y’(x) jelöléssel az új ismeretlen függvényt. Ekkor az egyenlet alakja

u '  K 1 u2

amely elsőrendű, szétválasztható változójú differenciálegyenlet. Válasszuk szét a változókat és


integráljunk.

1 1
du  Kdx;  du   Kdx; arsh u  x   Kx  C1; u  x   sh  Kx  C1 
1 u 2
1 u2

Ha figyelembe vesszük, hogy milyen módon helyeztük el a görbét a koordinátarendszerben,


akkor világos, hogy y’(0) = u(0) = 0, ahonnan C1 = 0 következik. Ismételt integrálással kapjuk az
y(x) függvény analitikus alakját ebben a speciális illetve az általános esetben.

1 1
y  x    u  x  dx   sh  Kx  dx  ch  Kx   C2 ; általánosan y  x   ch  Kx  C1   C2
K K

225
Óbudai Egyetem BGK Fejezetek a matematikából

Kaptuk tehát, hogy egy lánc alakja a saját súlyának hatására egy koszinusz hiperbolikusz
függvény görbéje. Ezért nevezzük az említett függvény grafikonját láncgörbének.

a) b)

2.2.3.Ábra. A láncgörbedifferenciálegyenletének megoldása különböző kezdeti feltételek esetén.

A 2.2.3. ábrán látható a láncgörbe differenciálegyenletének megoldása különböző kezdeti


feltételek esetén. Az a) ábrán az y(0) = 0, y’(0) = 0, a b) ábrán pedig y(0) = 2, y’(0) = 1 feltételek
mellett. Ez utóbbi eset szemléletesen azt is jelentheti, hogy a lánc két végét különböző
magasságban rögzítjük. Ekkor a lánc alakja nem szimmetrikus, hanem a b) ábrán látható alakú.

c) Az egyenletből hiányzik x, tehát az egyenlet alakja y” = f(y, y’).

Ebben az esetben az y ismeretlen függvényt úgy tekintjük, mint „független változót”, az y’ és y”


deriváltakat közvetlenül nem az x hanem az y függvényének tekintjük. Közvetett módon
természetesen mindekét derivált az x-változó függvénye. Ezt a gondolatot azonban fel tudjuk
használni arra, hogy csökkentsük az egyenlet rendjét. Itt is egy új ismeretlen függvény bevezetése
vezet eredményre, csak kissé körültekintőbben kell eljárni, mint az a) és b) esetekben.
Vezessük be az új ismeretlen függvényt az u  y  x    y '  y  x   vagy egyszerűbben az
u  y   y '( y) definícióval. A kérdés az, hogyan írható fel ekkor az y” második derivált függvény
az u függvény segítségével. Az összetett függvény deriválási szabályát alkalmazva, írhatjuk,
hogy

du du dy du du
y"  u '    y'  u
dx dy dx dy dy

ahol az u = u(y) ismeretlen függvényt hangsúlyozottan az y-változó függvényének tekintjük, és a


fenti átalakításban a deriválást az y-változó szerint kell elvégezni. Ezért is alkalmaztuk a
klasszikus jelölést az egyszerűbb „vessző” helyett, hogy ezt egyértelművé tegyük. A másodrendű
differenciálegyenlet alakja az alkalmazott transzformációval a következő

226
Óbudai Egyetem BGK Fejezetek a matematikából

 du 
y "  f  y, y ' helyett u '  f  y, u 
 dy 

amely egyenlet elsőrendű differenciálegyenlet az u = u(y) függvényre vonatkozólag, és ismét


hangsúlyozzuk, hogy az ismeretlen függvény az y-változótól függ. Ha ezt a megoldást
előállítottuk, akkor második lépésben meghatározzuk az

y '  x   u  y  x 

ugyancsak elsőrendű differenciálegyenlet megoldását, melyben már szokásos módon az x-et


tekintjük változónak.

2.2.7.Példa: Határozzuk meg az yy "  y '  0; y  0   e; y '  0   e kezdeti érték probléma


2

megoldását. A differenciálegyenlet valóban másodrendű hiányos egyenlet, hiányzik az


egyenletből az x változó. Kövessük a fentiekben leírt gondolatmenetet.
du
Elvégezzük az u  y   y '; y "  u helyettesítést. Ekkor a következő differenciálegyenlet
dy
adódik.
du
y u  u2  0
dy

Világos, hogy ennek az egyenletnek egyrészt megoldása az u = 0, azonosan nulla függvény.


Innen visszatérve az eredeti ismeretlen függvényre, adódik, hogy y '  x   0; y  x   C , tehát a
konstans függvények megoldásai a differenciálegyenletnek. Azonban a kitűzött Cauchy-
feladatnak nem megoldása a konstans függvény, mert az nem tehet eleget a második kezdeti
feltételnek. Tegyük fel tehát, hogy u ≠ 0, és osszuk az egyenletet u-val. Ekkor egy szeparálható
differenciálegyenletet kapunk, melynek megoldása a következő

du 1 1 1 1
y  u; du  dy;  du   dy; ln u  ln y  ln C1 ; u  y   C1 y
dy u y u y

Most visszatérhetünk az eredeti ismeretlen függvényre és eredeti változóra.

dy 1 1
u  y   C1 y; y '  C1 y;  C1 y; dy  C1dx;  dy   C1dx; ln y  C1x  C2 ; y  x   eC1x C2
dx y y

A differenciálegyenlet általános megoldását megkaptuk. Ha figyelembe vesszük a kezdeti


feltételeket, adódik, hogy C1 = C2 = 1. A kezdeti feltételeket kielégítő partikuláris megoldás tehát
az y  x   e x1 függvény.

227
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.8.Példa: Határozzuk meg az yy "ln y   y '  0 hiányos másodrendű differenciálegyenlet


2

általános megoldását. Az egyenlet a c) kategóriába tartozik, hiányzik az egyenletből az x változó.


Ebben az esetben is végrehajtjuk az u  y   y ' transzformációt és elvégezzük az y " 
du
u
dy
helyettesítést. Ekkor a következő egyenletre jutunk:

du
y u ln y  u 2  0
dy

Ezt az egyenletet is kielégíti az u = 0 azonosan nulla függvény, tehát minden y(x) = C konstans
függvény megoldása az egyenletnek. Tegyük most fel, hogy u ≠ 0 és osszuk el vele az egyenletet.
Ekkor kapunk egy szeparálható egyenletet, melynek megoldása a következő

du 1 1 C
y ln y  u  0; du   dy; ln u   ln ln y  ln C1 ; u  1
dy u y ln y ln y

Itt áttérünk az eredeti ismeretlen függvényre és x változóra. Így a következő ugyancsak


szeparálható egyenletet kapjuk, melynek megoldása

C1
y'  ; ln ydy  C1dx;  ln ydy   C1dx; y ln y  y  C1x  C2 ;
ln y

Ezzel előállítottuk a hiányos differenciálegyenlet általános megoldását implicit alakban. Ennek a


megoldás függvénynek nem is létezik explicit alakja, tehát a megoldást ebben a formában kell
elfogadnunk.
A 2.2.4. ábrán, különböző kezdeti feltételek mellett számítógép segítségével ábrázoltunk az
implicit alakban adott megoldást különböző kezdeti feltételek mellett.

2.2.4.Ábra. A 2.2.8. példabeli hiányos másodrendű differenciálegyenlet néhány megoldása


különböző kezdeti feltételek esetén..

228
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.4. Másodrendű lineáris differenciálegyenletek


Ebben a pontban általánosan megvizsgáljuk az elméleti és gyakorlati szempontból egyaránt
legfontosabb lineáris differenciálegyenleteket. A tárgyalás és az alkalmazások során ragaszkodni
fogunk a másodrendű lineáris egyenlet vizsgálatához, bár már most hangsúlyozzuk, hogy a
tárgyalás során ismertetett tételek és módszerek értelemszerű módosítással átültethetők magasabb
rendű lineáris differenciálegyenletekre. Ez utóbbi témakört itt nem részletezzük, hanem utalunk a
2.3 fejezetre, ahol lineáris differenciálegyenlet rendszereket vizsgálunk majd, mely témakörnek
speciális eseteként adódnak az eredmények a magasabb rendű lineáris egyenletekre vonatkozólag
is.
Elsőként az általános, függvény együtthatójú lineáris egyenleteket tanulmányozzuk. Előre kell
bocsátanunk már most, hogy az általános esetben nem létezik módszer az ilyen egyenletek
megoldásának előállítására, mindössze azt mondhatjuk, hogy ha a birtokunkban van egy
megoldás, akkor ennek ismeretében előállíthatunk további megoldásokat. Ezen negatív
megállapítás ellenére vizsgáljuk ezeket az egyenleteket, mert fontos megállapításokat tehetünk a
megoldások szerkezetére vonatkozólag.
Később speciális esetként részletesen tanulmányozzuk az állandó együtthatójú lineáris
differenciálegyenleteket, ugyanis ebben a különleges esetben létezik kvadratura a megoldások
előállítására.

2.2.3.Definíció: Tegyük fel, hogy az f1(x), f2(x) és a g(x) függvények folytonosak a valós számok
halmazának egy korlátos és zárt I = [a, b] intervallumán. Az explicit közönséges másodrendű
differenciálegyenletet lineárisnak nevezzük, ha ekvivalens átalakítások útján az alábbi alakra
hozható

y " f1  x  y ' f 2  x  y  g  x  ; vagy y "   f1  x  y ' f 2  x  y  g  x  ;

Az elsőrendű esethez hasonlóan az egyenlet homogén lineáris, ha g(x) = 0, xI, tehát ha a jobb
oldal azonosan 0 az [a, b] intervallumon, ellenkező esetben az egyenlet inhomogén lineáris.
Felmerül a megoldás létezésének és egyértelműségének a kérdése. Ennek a kérdésnek a
vizsgálatához az általános érvényű 2.2.1. tételt alkalmazzuk.

2.2.2.Tétel: Ha az f1(x), f2(x) és a g(x) függvények folytonosak a valós számok halmazának egy
korlátos és zárt I = [a, b] intervallumán, akkor tetszőleges x0  a, b , y0  R, y1  R esetén az

y " f1  x  y ' f 2  x  y  g  x  ; y  x0   y0 ; y '  x0   y1

Cauchy-féle feladatnak egyértelműen létezik megoldása a teljes [a, b] intervallumon.


Bizonyítás: Megmutatjuk, hogy ilyen feltételek mellett teljesülnek az általános 2.2.1. tétel
feltételei. Valóban az y "  f  x, y, y '   f1  x  y ' f 2  x  y  g  x  jelölés alkalmazásával a
jobboldal folytonos függvény az egész [a, b] intervallumon, továbbá az f függvény második és
harmadik változó szerinti parciális deriváltjai is korlátosak ezen az intervallumon, hiszen

229
Óbudai Egyetem BGK Fejezetek a matematikából

f f
 x, y, y '   f2  x  ;  x, y, y '   f1  x  ;
y y '

és a feltételek szerint ezek a függvények folytonosak a korlátos és zárt [a, b] intervallumon, ebből
következően korlátosak is, tehát a parciális deriváltak korlátosak. Az egzisztenciát és unicitást
biztosító elégséges feltételek tehát teljesülnek. ■

A továbbiakban külön-külön foglalkozunk a homogén és az inhomogén lineáris


differenciálegyenlet megoldásával.

2.2.4.1. Másodrendű homogén lineáris differenciálegyenlet


Mielőtt rátérnénk az egyenlet megoldhatóságára, megoldására, szükséges tisztáznunk néhány
fogalmat. Mint látni fogjuk, a lineáris algebra fogalmait ültetjük át függvények bizonyos
osztályára, és az is kiderül majd, hogy a lineáris algebra apparátusát fogjuk alkalmazni a
megoldás során.

2.2.4.Definíció: Az I intervallumon értelmezett y1(x), y2(x),….yn(x) függvények lineáris


kombinációjának nevezzük az

α1∙y1(x) + α2∙y2(x) + …+ αn∙yn(x)

összeget, ahol α1, α2,…αnR valós számok, de elvileg megengedhetjük azt is, hogy az
együtthatók komplexek legyenek.
A most következő értelmezéssel lényegében egy egyszerűsítő jelölést vezetünk be, amellyel a
későbbiekben egyszerűbb jelölés- és tárgyalásmódra nyílik lehetőség.

2.2.5.Definíció: Legyen az L operátor – függvényhez függvényt rendelő leképezés – az [a, b]


intervallumon értelmezett kétszer deriválható függvények osztályán értelmezve a következő
definícióval

L  y  : y " f1  x  y ' f 2  x  y

Ez az operátor tehát előállítja a homogén lineáris differenciálegyenlet bal oldalát egy adott y
függvényre alkalmazva. Elsőként bizonyítjuk ezen operátor legfontosabb tulajdonságait.

2.2.3.Tétel: Az L operátor lineáris, azaz


a) additív: L  y1  y2   L  y1   L  y2  ;
b) homogén: L y   L  y  ;  R vagy  C .

230
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Mindkét állítás a deriválási szabályokon múlik.


a)
L  y1  y2  :  y1  y2  " f1  x  y1  y2  ' f 2  x  y1  y2  
  y1 " f1  x  y1 ' f 2  x  y1    y2 " f1  x  y2 ' f 2  x  y2   L  y1   L  y2 
b)
L y  :  y  " f1  x  y  ' f 2  x  y     y " f1  x  y ' f 2  x  y   L  y 

Ezzel az operátor linearitását bizonyítottuk. ■

A bevezetett operátor egyik haszna, hogy segítségével a homogén lineáris differenciálegyenlet a


nagyon egyszerű L[y] = 0, az inhomogén egyenlet pedig az L[y] = g(x) jelöléssel adható meg.

A linearitás közvetlen következménye az alábbi állítás.

2.2.4.Tétel: Ha az y1(x), y2(x),….yn(x) függvények az I intervallumon megoldásai az

L[y] = y” + f1(x)∙y’ + f2(x)∙y = 0

homogén lineáris differenciálegyenletnek, akkor ezen függvények tetszőleges

α1∙y1(x) + α2∙y2(x) + …+ αn∙yn(x)

lineáris kombinációja is megoldása ennek az egyenletnek, tetszőleges valós vagy komplex


együtthatók esetén.
Bizonyítás: A linearitás miatt írhatjuk, hogy

n   n   n 
L   i yi     i L    yi     i   0  0
 i 1   i 1   i 1 

Tehát a lineáris kombináció valóban kielégíti az egyenletet. Ezt kellett bizonyítani. ■

A linearitásnak van egy további fontos következménye, amelyet az állandó együtthatójú


egyenletek témakörében fel fogunk használni.

2.2.5.Tétel: Ha a valós változójú, komplex értékű y  x   u  x   iv  x  függvény megoldása az


L[y] = 0 egyenletnek, akkor a komplex értékű függvény u(x) valós része is és v(x) képzetes része
is megoldása az egyenletnek.
Bizonyítás: A linearitás miatt, felhasználva, hogy a konstans szorzók akár komplexek is
lehetnek, kapjuk, hogy
L  y   L u  iv  L u   iL v   0  i0  0

Mivel a 0 valós része is és képzetes része is 0, szükségképpen teljesül, hogy L[u] = 0 és L[v] = 0.
Ezt kellett igazolni. ■

231
Óbudai Egyetem BGK Fejezetek a matematikából

A bizonyított tétel a lineáris algebra nyelvén a következő módon fogalmazható. Az L[y] = 0


homogén lineáris egyenlet megoldásai alteret alkotnak az [a, b] intervallumon értelmezett kétszer
deriválható függvények lineáris terében. Felmerül a kérdés, hogy hány különböző függvényt kell
meghatároznunk ahhoz, hogy előállíthassuk a homogén lineáris differenciálegyenlet összes
megoldását, más szóval az a kérdés, hogy ez az altér hány dimenziós. Ennek a kérdésnek
tisztázását segíti elő az alábbi értelmezés.

2.2.6.Definíció: Az I intervallumon értelmezett y1(x) és y2(x) függvényeket lineárisan


függetlennek nevezzük, ha az

α1∙y1(x) + α2∙y2(x) = 0, x[a, b] (α1, α2Rvagy C )

egyenlőség minden x[a, b] esetén csak akkor áll fenn, ha α1 = α2= 0. Ellenkező esetben azt
mondjuk, hogy az y1(x) és y2(x) függvények az [a, b] intervallumon lineárisan összefüggő
rendszert alkotnak.

Hogyan dönthető el egy függvényrendszerről, hogy lineárisan összefüggő-e. Ennek a kérdésnek a


vizsgálata újabb fogalom értelmezését követeli meg.

2.2.7.Definíció: Az [a, b] intervallumon értelmezett deriválható y1(x) és y2(x) függvények


Wronski-determinánsán az alábbi determinánst értjük.

y1  x  y2  x 
W  y1  x  , y2  x   
y1  x  y2  x 

Három függvény esetében az I intervallumon értelmezett, kétszer deriválhatóy1(x), y2(x)ésy3(x)


(xI) függvények Wronski-determinánsán az alábbi determinánst értjük.

y1 y2 y3
W  y1 , y2 , y3   y1 y2 y3
y1 y2 y3

A lineáris függetlenség és a Wronski-determináns kapcsolatát tisztázzák az alábbi állítások.

2.2.6.Tétel: Ha az y1(x) és y2(x) deriválható függvények az [a, b] intervallumon lineárisan


összefüggenek, akkor a W(y1(x), y2(x)) Wronski-determináns az [a, b] intervallumon azonosan
nulla.
Bizonyítás: Tegyük fel, hogy az y1(x) és y2(x) függvények az [a, b] intervallumon lineárisan
összefüggenek. Ez azt jelenti, hogy ha teljesül az

α1∙y1(x) + α2∙y2(x) = 0, x[a, b]

232
Óbudai Egyetem BGK Fejezetek a matematikából

azonosság, akkor legalább az egyik együttható különbözik zérustól, például α1 ≠ 0. Ezen



feltétellel az y1 függvény kifejezhető az y2 függvény segítségével: y1   2 y2 . Ekkor a
1
Wronski-determináns a következő

2
 y2 y2
y  x y2  x  1  2 y2 y2
W  y1  x  , y2  x    1   0
y1  x  y2  x  2 1 y2 y2
 y2 y2
1

hiszen a determináns két oszlopa megegyezik. ■

A bizonyított tétel szó szerint igaz n> 2 számú függvény esetére is, a bizonyítás is átvihető erre
az esetre értelemszerű módosítással.

2.2.9.Példa: Igazoljuk a bizonyított tétel alapján, hogy az 1, cos2x, cos2x függvények lineárisan
összefüggenek. A három függvény Wronski-determinánsa

1 cos 2 x cos 2 x
2sin 2 x  sin 2 x
W  y1 , y2 , y3   0 2sin 2 x 2 cos x sin x  
4 cos 2 x 2 cos 2 x
0 4 cos 2 x 2sin x  2 cos x 2 2

 4sin 2 x cos 2 x  4 cos 2 x sin 2 x  0;

valóban azonosan nulla a teljes számegyenesen, tehát a függvények lineárisan összefüggenek. Ezt
a tényt egy ismert trigonometrikus azonosság alapján is tudjuk. Eszerint

1  cos 2 x 1 1
cos2 x  ; azaz  cos 2 x  cos 2 x  0;
2 2 2

valóban elő lehet állítani az azonosan nulla függvényt nem kizárólag zérus együtthatókkal.

2.2.10.Példa: Igazoljuk a bizonyított tétel alapján, hogy az ex, e–x, shx függvények lineárisan
összefüggenek. A három függvény Wronski-determinánsa

ex e x sh x ex e x sh x
W  y1 , y2 , y3   e x e  x ch x  0 2e  x ch x  sh x  0
ex e x sh x 0 0 0

a teljes számegyenesen, tehát a három függvény valóban lineárisan összefügg. Ezt azonban már a
hiperbolikus függvény definíciója alapján is tudjuk, mely szerint

233
Óbudai Egyetem BGK Fejezetek a matematikából

e x  e x 1 1
sh x  ; azaz e x  e x  sh x  0;
2 2 2

és az együtthatók nem mind zérusok, sőt egy sem zérus.

Az előbbi állításnak közvetlen következménye az alábbi tétel.

2.2.7.Tétel: Ha az y1(x) és y2(x) deriválható függvények W(y1(x), y2(x)) Wronski-determinánsa az


[a, b] intervallumon nem azonosan nulla, akkor az y1(x) és y2(x) függvények az [a, b]-n
lineárisan függetlenek.
Bizonyítás: Indirekt tegyük fel, hogy az y1(x) és y2(x) függvények az [a, b]-n lineárisan
összefüggenek. Ekkor az előző tétel szerint a Wronski-determinánsuk azonosan nulla. Ezzel
ellentmondásra is jutottunk. ■

Ha feltesszük, hogy az y1(x) és y2(x) függvények megoldásai az L[y] = 0 differenciálegyenletnek,


akkor a Wronski-determinánsról sokkal több is állítható.

2.2.8.Tétel: Ha az y1(x) és y2(x) kétszer deriválható függvények lineárisan független megoldásai


az L[y] = 0 homogén lineáris differenciálegyenletnek, akkor a W(y1(x), y2(x)) Wronski-
determináns az [a, b] intervallumon sehol sem lehet nulla.
Bizonyítás: Tegyük fel az állítással ellentétben, hogy a Wronski-determináns egy x0 pontban
eltűnik. Vizsgáljuk az α1 és α2 ismeretlenekre vonatkozó alábbi homogén lineáris
egyenletrendszert

 1 y1  x0    2 y2  x0   0


1 y '1  x0    2 y '2  x0   0

Ennek az egyenletrendszernek a determinánsa éppen a W(y1(x0), y2(x0)) Wronski-determináns,


amely a feltétel szerint zérus. Ekkor a homogén lineáris egyenletrendszerek elméletéből ismert,
hogy van a rendszernek nemtriviális megoldása. Legyen α1 és α2 egy olyan megoldás, melyre
legalább az egyik αi ≠ 0. A korábbiak szerint tudjuk, hogy ekkor az y(x) = α1∙y1(x) + α2∙y2(x)
lineáris kombináció is megoldása az L[y] = 0 homogén lineáris differenciálegyenletnek, és a
feltételek szerint ez a megoldás kielégíti az y(x0) = 0, y’(x0) = 0 kezdeti feltételeket. Ezeket a
feltételeket azonban a triviális, azonosan nulla megoldás is kielégíti. Használjuk most fel, hogy a
megoldás bármely kezdeti feltétel szerint egyértelműen létezik. Eszerint az y(x) csak az azonosan
nulla megoldás lehet:

y  x   1 y1  x   2 y2  x   0;

ahol legalább az egyik αi ≠ 0, ami azt jelenti, hogy az y1(x) és y2(x) függvények lineárisan
összefüggenek. Ez ellentmond a tétel azon feltételének, hogy ezek a függvények lineárisan
függetlenek. ■

Ez a tétel is általánosítható kettő helyett több függvényre és a bizonyítás is átvihető erre az


általános esetre értelemszerű módosítással.

234
Óbudai Egyetem BGK Fejezetek a matematikából

A bizonyított tételek következménye, ha tetszik összefoglalása az alábbi tétel.

2.2.9.Tétel: Az L[y] = 0 homogén lineáris differenciálegyenlet y1, y2, …, yn megoldásai az [a, b]


intervallumon akkor és csak akkor lineárisan függetlenek, ha a W(y1, y2, …, yn) Wronski-
determináns az [a, b] intervallumon sehol sem tűnik el. ■

A pont elején feltett kérdésre a következő alapvető tétel adja a választ.

2.2.10.Tétel: Az y” + f1(x)∙y’ + f2(x)∙y = 0 (x[a, b]) másodrendű, homogén lineáris


differenciálegyenlet bármely három y1(x), y2(x)ésy3(x) (x[a, b]) megoldása az [a, b]
intervallumon lineárisan összefüggő.
Bizonyítás: Legyen x0[a, b] egy tetszőlegesen rögzített pont az intervallumban, és vizsgáljuk az
L[y] = 0, y(x0) = 0, y’(x0) = 0 Cauchy-féle feladatot. Az egzisztencia tétel szerint ennek
egyértelműen létezik megoldása, és ez a megoldás nyilván az azonosan nulla függvény.
Vizsgáljuk ezután az α1, α2, α3 ismeretlenekre vonatkozó alábbi homogén lineáris algebrai
egyenletrendszert:
 1 y1  x0   2 y2  x0   3 y3  x0   0;

1 y '1  x0    2 y '2  x0   3 y '3  x0   0;

Ebben a rendszerben az ismeretlenek száma nagyobb, mint az egyenletek száma, tehát végtelen
sok megoldás van, azaz létezik olyan megoldás is, amelyben legalább az egyik αi ≠ 0. Mivel
megoldások tetszőleges lineáris kombinációja is megoldás, tehát az 1 y1  x   2 y2  x   3 y3  x 
függvény is megoldás, a megoldás egyértelműsége miatt azonban

1 y1  x   2 y2  x   3 y3  x   0; x  a, b

ami pontosan azt jelenti, hogy a három megoldás lineárisan összefüggő. ■

Ezzel a tétellel analóg tétel igazolható n-ed rendű lineáris differenciálegyenletre, mely szerint egy
n-ed rendű lineáris egyenlet bármely n + 1 db megoldása lineárisan összefüggő. Mint azt a
lineáris algebrában is láttuk, ha egy rendszer lineárisan összefüggő, akkor a rendszerből
egyenként elhagyhatók mindazok a függvények, amelyek előállíthatók a többi függvény lineáris
kombinációjával, ekkor a rendszer által előállítható függvények lineáris tere nem változik, a
maradék lineárisan független rendszer ugyanazt a lineáris teret generálja. Ebből következik, hogy
a másodrendű homogén lineáris differenciálegyenlet megoldása során elég meghatároznunk két
lineárisan független megoldást.

2.2.8.Definíció: Az y1(x), y2(x) (x[a, b]) függvénypárt az [a, b] intervallumon a homogén


lineáris differenciálegyenlet egy alaprendszerének nevezzük, ha lineárisan függetlenek és
mindkét függvény megoldása az y” + f1(x)∙y’ + f2(x)∙y = 0 (x[a, b]) differenciálegyenletnek.
Felmerül a kérdés, létezik-e egyáltalán alaprendszer és ha igen, hogyan lehet előállítani. A
létezést biztosítja az alábbi tétel.

235
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.11.Tétel: Az L[y] = 0 másodrendű lineáris differenciálegyenletnek létezik végtelen sok


alaprendszere.
Bizonyítás: Legyenek az a11, a12 , a21, a22 valós számok olyanok, hogy rájuk vonatkozólag teljesül
az a11a22  a12a21  0 feltétel. Ezek után legyen x0[a, b] tetszőleges, és tegyük fel, hogy az
y1(x), y2(x) függvények rendre megoldásai az

L  y   0; y1  x0   a11; y1 '  x0   a21;


L  y   0; y2  x0   a12 ; y2 '  x0   a22 ;

kezdeti érték problémának. Ennek a két megoldásnak a Wronski-determinánsa

a11 a12
W  y1  x  , y2  x     a11a22  a12 a21  0
a21 a22

nullától különbözik. Ez pontosan azt jelenti, hogy az y1(x), y2(x) függvények alaprendszert
alkotnak. Mivel az aij konstansok végtelen sokféle módon megválaszthatók úgy, hogy a
determináns nullától különbözzön, valóban végtelen sok alaprendszer létezik. ■

A másodrendű homogén lineáris differenciálegyenlet általános megoldásáról szól a következő


állítás.

2.2.12.Tétel: Tegyük fel, hogy az y1(x) és y2(x) függvények az I intervallumon alaprendszerét


képezik az y” + f1(x)∙y’ + f2(x)∙y = 0 (xI) differenciálegyenletnek. Ekkor tetszőleges C1, C2R
állandók esetén a

C1∙ y1(x) + C2∙ y2(x)

függvény a differenciálegyenlet megoldása, és fordítva a differenciálegyenlet minden megoldása


előállítható ilyen alakban.
Bizonyítás: A tétel állításának azon része, hogy megoldások lineáris kombinációja is megoldás,
következik a korábbiakból. Csak azt kell igazolnunk, hogy minden megoldás előállítható egy
alaprendszer lineáris kombinációinak segítségével.
Legyen h(x) egy tetszőleges megoldás. Tetszőleges x0[a, b] esetén a h(x) függvény nyilván
egyértelmű megoldása az

L  y   0; y  x0   h  x0  ; y '  x0   h '  x0  ;

Cauchy-feladatnak. Vizsgáljuk most az

 1 y1  x0    2 y2  x0   0;


1 y1 '  x0    2 y2 '  x0   0;

236
Óbudai Egyetem BGK Fejezetek a matematikából

homogén lineáris egyenletrendszert. Ennek determinánsa éppen a W(y1(x0), y2(x0)) Wronski-


determináns, amely különbözik nullától, hiszen az y1(x) és y2(x) függvények alaprendszert
alkotnak. Ezért ennek az egyenletrendszernek egyértelműen létezik megoldása, jelölje ezt α1, α2.
Ekkor természetesen az 1 y1  x   2 y2  x  függvény is megoldása a differenciálegyenletnek.
Mivel azonban a megoldás egyértelmű, 1 y1  x   2 y2  x   h  x  . Ezzel az állítást igazoltuk. ■

A tétel állítása azt jelenti tehát, hogy a differenciálegyenlet általános megoldásának előállításához
meg kell határozni a differenciálegyenlet két lineárisan független megoldását. Egy probléma van
azonban, az általános, függvény együtthatójú esetben erre nincs módszer. Azt tehetjük, hogy az
f1(x) és f2(x) függvények konkrét alakjától függően próbafüggvényeket alkalmazunk,
megpróbálunk az egyenletbe helyettesíteni egy polinom függvényt, exponenciális függvényt,
racionális törtfüggvényt, trigonometrikus függvények lineáris kombinációját,…stb, és ha
szerencsénk van, létezik ilyen alakú megoldás.

2.2.11.Példa: Határozzuk meg az alábbi másodrendű lineáris differenciálegyenlet általános


megoldását.

 2 x  1 y " 4 xy ' 4 y  0;
Mivel az említettek szerint általános módszer nincs a megoldás előállítására, próbafüggvényekkel
juthatunk célhoz.
Egy megoldást próbáljunk keresni elsőfokú polinom formájában, azaz legyen y1  x   Ax  B .
Helyettesítéssel a következőt kapjuk.

 2 x  1  0  4 x  A  4  Ax  B   0;
Ez az egyenlőség azonosan teljesül, ha B = 0, és A tetszőleges valós szám. Válasszuk ez utóbbit a
legegyszerűbben, legyen A = 1. Kaptuk tehát, hogy y1  x megoldása a differenciálegyenletnek.
A második, lineárisan független megoldást keressük exponenciális függvény alakjában, legyen
tehát y2  x   eax . Ismét helyettesítve az egyenletbe azt kapjuk, hogy

 2 x  1 a2eax  4 xaeax  4eax  0; azaz  2 xa2  a2  4 xa  4 eax  0

Ez az egyenlőség azonosan teljesül, ha 2a2 + 4a = 0 és a2 – 4 = 0. Ez pedig akkor igaz, ha a = –2.


kaptuk tehát, hogy a differenciálegyenlet egy második megoldása az y2  x   e2 x függvény. Még
meg kell vizsgálnunk, hogy a kapott két megoldás lineárisan független-e. Ehhez kiszámítjuk a
Wronski-determinánsukat.

e2 x
  1
x
W x, e 2 x
 2 xe2 x  e2 x    2 x  1 e2 x
2 x
2e

237
Óbudai Egyetem BGK Fejezetek a matematikából

 1  1 
ez pedig különbözik nullától a  ,   ;   ,   intervallumon bármelyikén. Ezek szerint
 2  2 
megkaptuk a differenciálegyenlet alaprendszerét a megjelölt intervallumokon. Innen már
következik, hogy a differenciálegyenlet általános megoldása a következő.

yhá  x   C1x  C2e2 x ; C1, C2 R

A megoldás előállításával kapcsolatban egy pozitív eredményt azonban tudunk említeni. Az


alábbi tételből kiderül, hogy ha már ismert egy megoldás, akkor egy elsőrendű
differenciálegyenlet megoldásával elő lehet állítani egy másik megoldást, ami az ismert
megoldással együtt alaprendszert képez. Ezt biztosítja az alábbi állítás.

2.2.13.Tétel: (Liouville-tétele)
Ha y1(x) és y2(x) függvények az I intervallumon megoldásai az y” + f1(x)∙y’ + f2(x)∙y = 0 (xI)
differenciálegyenletnek, akkor a W(y1(x), y2(x)) Wronski-determináns az I intervallumon eleget
tesz az

y’ + f1(x)∙y = 0

elsőrendű homogén lineáris differenciálegyenletnek.


Bizonyítás: Képezzük a Wronski-determináns deriváltját:

y1  x  y2  x  y  x y2  x  y1  x  y2  x 
W '  y1  x  , y2  x     1 
y1  x  y2  x  y "1  x  y "2  x  y "1  x  y "2  x 

Hiszen az első determináns két sora megegyezik. Vegyük most figyelembe a homogén lineáris
egyenlet explicit alakját. Ekkor kapjuk, hogy

y1 y2 y1 y2
W '  y1 , y2    
y "1 y "2  f1  x  y1 ' f 2  x  y1  f1  x  y2 ' f 2  x  y2

y1 y2 y y2 y y2
  f1  x   f2  x  1   f1  x  1   f1  x W  y1 , y2 
y '1 y '2 y1 y2 y '1 y '2

Tekintsük az egyenlőséglánc elejét és végét. Átrendezve éppen a bizonyítandó egyenlőséget


kapjuk. ■

Az elsőrendű lineáris egyenletek témakörében elállítottuk ennek az egyenletnek az általános


megoldását.

y ( x)  C  e  1
 f ( x ) dx

238
Óbudai Egyetem BGK Fejezetek a matematikából

Tehát ha az y(x) helyére a W(y1(x), y2(x)) Wronski-determinánst helyettesítjük, akkor a


W  y ( x), y  x    C  e  1
 f ( x ) dx
1 2

egyenletet kapjuk. Ez az összefüggés lehetőséget biztosít egy ismert megoldás birtokában arra,
hogy egy másik, lineárisan független megoldást is előállítsunk. Legyen ugyanis az ismert
megoldás y1(x). Ekkor az

y1  x  y
 C e  1 ; azaz y1  x  y ' y '1  x  y  C  e  1
 f ( x ) dx  f ( x ) dx
;C0
y '1  x  y'

elsőrendű inhomogén lineáris differenciálegyenletből meghatározott y(x) a Liouville-féle tétel


szerint C ≠ 0 esetén a differenciálegyenlet lineárisan független megoldása, hiszen ekkor a
determináns nem lehet zérus, így a kapott y(x) megoldás az y1(x) függvénnyel együtt
alaprendszert alkot.
Ez a differenciálegyenlet egy elsőrendű inhomogén lineáris differenciálegyenlet, így az elsőrendű
egyenletek elméletének ismeretében megoldható. Azonban van egyszerűbb módszer is. Osszuk el
ezt az egyenletet az y1(x) függvény négyzetével. Ekkor az adódik, hogy

y1  x  y ' y '1  x  y
e  1
C  f ( x ) dx

y12  x y12  x
y
A kapott egyenlet bal oldalát vizsgálva vegyük észre, hogy az éppen az hányados
y1  x 
deriváltja. Ennek figyelembe vételével az egyenlet megoldása nagyon egyszerű

 y   C  f ( x ) dx 
e  1 e  1
C  f ( x ) dx

 y1  x 
  2
 y1  x 
; ahonnan y2  x   y1  x     2
y
 1  x 
 dx

Explicit módon előállítottuk tehát az egyenlet lineárisan független második megoldását.

2.2.12.Példa: Határozzuk meg az alábbi másodrendű lineáris differenciálegyenlet általános


megoldását.

1 1
x 2 ln xy " xy ' y  0; standard alakban y " y ' 2 y0
x ln x x ln x

Könnyen látható, hogy az y1  x   x függvény megoldása a differenciálegyenletnek. Azonban


második megoldást nem találunk sem polinom, sem exponenciális függvény formájában. Ezért a
Liouville-tételhez folyamodunk. Egy ismert megoldás birtokában előállítunk egy másik
megoldást. A tétel szerint az

239
Óbudai Egyetem BGK Fejezetek a matematikából

1 1
x y   dx   dx
 1 e x ln x ; azaz xy ' y  e x ln x ;
1 y'
differenciálegyenlet megoldását kell meghatároznunk. A C konstanst, célszerűségi okokból
–1-nek választottuk. Felhívjuk a figyelmet, hogy az f1(x) függvényt a differenciálegyenlet
standard alakjáról olvassuk le, amikor is az y” második derivált függvény együtthatója 1. Ha nem
így járunk el, természetesen hibát követünk el. Ez, mint említettük egy elsőrendű inhomogén
lineáris differenciálegyenlet, ám némileg speciális. Megoldása során kihasználjuk azt az
észrevételt, amelyet a Liouville-tétel bizonyítása utáni megjegyzésben tettünk. Eszerint az
egyenlet felírható az alábbi ekvivalens alakban

 y 
1
1  x ln x dx
  2 e     2 ln x
1 ln ln x 1
   2 e
x x x x

Ebből az egyenletből az y integrálással majd x-szel történő szorzással adódik. Parciálisan


integrálva kapjuk, hogy

y 1 ln x 1 ln x 1
   2 ln xdx    2 dx   ; ahonnan y2  x   ln x  1
x x x x x x

Előállítottuk tehát a differenciálegyenlet egy második megoldását. Kérdés, hogy a két megoldás
lineárisan független-e. Ennek eldöntéséhez kiszámítjuk a Wronski-determinánst.

x ln x  1
W  x, ln x  1  1  1   ln x  1   ln x
1
x

Ez pedig különbözik nullától a 0,1; 1,  intervallumok bármelyikén. Eszerint bármely említett
intervallumon a differenciálegyenlet általános megoldása a következő

yhá  x   C1x  C2  ln x  1 ; C1, C2  R

2.2.13.Példa: Igazoljuk, hogy az

 
e x  1 y " 2 y ' e x y  0; standard alakban y "
2
ex 1
y '
ex
ex 1
y0

másodrendű homogén lineáris differenciálegyenletnek megoldása az y1  x   e x  1 függvény,


majd állítsuk elő az általános megoldást.
Helyettesítéssel meggyőződhetünk, hogy ez a függvény valóban megoldása az egyenletnek,
ugyanis

240
Óbudai Egyetem BGK Fejezetek a matematikából

e x
    
 1 y " 2 y ' e x y  e x  1 e x  2e x  e x e x  1  e2 x  e x  2e x  e 2 x  e x  0

valóban azonosan teljesül. A második, lineárisan független megoldást keressük a Liouville-


tétellel, mely szerint egy másik megoldás kielégíti az

2 2
ex 1    e x 1dx
 
y dx
 C e e x 1 ; tehát az e  1 y ' e y  Ce
x x
;
ex y'

differenciálegyenletet. Vegyük figyelembe, hogy a bal oldal, az egyenlet (ex – 1)2-nel történő
osztása után egy hányados deriváltja. Az integrandus célszerű átalakításával a következőt kapjuk.

x
e
 y  C 2  dx
e x 1 
C 2ln  e x 1 C Ce2 x
 x   e e  
 e 1         e 
2 2 2 2 2
ex 1 ex 1 e x  1 e x  1 2x
1

Ez az egyenlet könnyen integrálható, az integrálás eredménye a következő

y Ce2 x C 1 1
  dx   ; ahonnan y2  x   x
e 1
 
2 e 1 e 1
x 2 2x
e2 x  1

Itt a konstansnak a C = –2 értéket adtuk. Kaptunk tehát egy második megoldást. Az általános
tételből következik, hogy a két megoldás lineárisan független, de azért megmutatjuk ebben a
konkrét esetben is, hogy ez igaz. Kiszámítjuk a Wronski-determinánst

1
ex 1
 1  e 1
x
2e2 x
W  e x  1, x  ex  0
 e 1 
 
2
ex  ex 1
 e  1
2
x

sehol sem zérus, így a kapott két függvény a differenciálegyenlet alaprendszerét képezi a teljes
számegyenesen. Az általános megoldás ezért a következő


yhá  x   C1 e x  1  C2  1
e 1
; C1 , C2  R
x

A továbbiakban rátérünk az inhomogén lineáris differenciálegyenletek megoldásának


vizsgálatára.

241
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.4.2. Másodrendű inhomogén lineáris differenciálegyenlet


Idézzük fel, hogy a feltételek szerint f1(x), f2(x) és a g(x) függvények folytonosak a valós számok
halmazának egy I intervallumán. Megoldandó az

y” + f1(x)∙y’ + f2(x)∙y = g(x)

másodrendű inhomogén lineáris differenciálegyenlet. A megoldások szerkezetét tisztázza az


alábbi állítás.

2.2.14.Tétel: Tegyük fel, hogy az hogy az y1(x) és y2(x) függvények az I intervallumon


alaprendszerét képezik az L  y   0 (xI) homogén lineáris differenciálegyenletnek. Az yip(x)
függvény pedig legyen az L  y   g  x  (xI) inhomogén lineáris differenciálegyenlet egy
tetszőleges partikuláris megoldása. Ekkor tetszőleges C1, C2R állandók esetén a

C1∙ y1(x) + C2∙ y2(x) + yip(x)

függvény az inhomogén differenciálegyenlet megoldása, és fordítva a differenciálegyenlet


minden megoldása előállítható ilyen alakban.
Bizonyítás: Az L operátor linearitásából adódik, hogy ez a függvény megoldása az inhomogén
egyenletnek. Valóban

L C1 y1  C2 y2  yip   C1L  y1   C2 L  y2   L  yip   0  0  g  x   g  x 

Már csak azt kell megmutatni, hogy bármely megoldás előáll ilyen alakban. Legyen h(x) egy
tetszőleges megoldása az inhomogén egyenletnek. Ekkor ugyancsak az L operátor linearitása
miatt, kapjuk, hogy

L h  yip   L  h  L  yip   g  x   g  x   0

Ami azt jelenti, hogy a h(x) – yip(x) függvény megoldása a homogén lineáris egyenletnek. A
homogén lineáris egyenlet általános megoldása pedig előáll az alaprendszer lineáris
kombinációjaként, azaz teljesül, hogy alkalmas C1 és C2 állandókkal

h  yip  C1 y1  C2 y2 ; azaz h  C1 y1  C2 y2  yip

Éppen ezt kellett bizonyítani. ■

A tétel szerint, ha birtokunkban van a homogén lineáris egyenlet egy alaprendszere, akkor
az általános megoldáshoz egyetlen partikuláris megoldás előállítására van csak szükség! Ha
ismert az alaprendszer, akkor ez a probléma is megoldható. A megoldást ebben az esetben is az
állandók variálásának módszere jelenti. Most többes számot használtunk, hiszen a homogén
egyenlet általános megoldásában két állandó szerepel, C1 és C2. Keressük tehát az inhomogén
egyenlet partikuláris megoldását az alábbi alakban.

242
Óbudai Egyetem BGK Fejezetek a matematikából

yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x)

Meghatározandók a C1(x) és C2(x) függvények. Az állandók variálásának módszerét tisztázza a


következő tétel.

2.2.15.Tétel: Tegyük fel, hogy az hogy az y1(x) és y2(x) függvények az I intervallumon


alaprendszerét képezik L  y   0 (xI) homogén lineáris differenciálegyenletnek. Ekkor az
L  y   g  x  (xI) inhomogén lineáris differenciálegyenlet partikuláris megoldása előállítható

yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x)

alakban ahol a C1(x) és C2(x) függvényeket az alábbi formulák szolgáltatják.

W1  x  W2  x 
C1  x    dx, C2  x    dx
W  y1  x  , y2  x   W  y1  x  , y2  x  

Az integrandusokban szereplő W1(x) és W2(x) függvények pedig a Wronski-determinánsból


származtathatók az alábbi módon.

0 y2  x  y  x 0
W1  x   ; W2  x   1
g  x y2  x  y1  x  g  x 

Bizonyítás: A formulában szereplő ismeretlen függvényeket az egyenletbe történő


helyettesítéssel számítjuk. Ehhez szükség van a partikuláris megoldás első és második
deriváltjára. Egyszerűsítő jelölésekkel

yip  C1 y1  C2 y2
y 'ip   C1 y '1  C2 y '2    C '1 y1  C '2 y2 
y "ip   C1 y "1  C2 y "2    C '1 y '1  C '2 y '2    C '1 y1  C '2 y2  '

A két ismeretlen függvény meghatározásához két feltételre van szükség. Legyenek ezek a
következők.

 C '1  x  y1  x   C '2  x  y2  x   0


C '1  x  y '1  x   C '2  x  y '2  x   g  x 

Ha ugyanis ezeket a feltételeket előírjuk, akkor az yip(x) függvény valóban megoldása az


inhomogén lineáris differenciálegyenletnek. Szorozzuk meg ugyanis az előbbi egyenletrendszer
első egyenletet f2(x)-szel, a másodikat f1(x)-szel, a harmadikat pedig 1-gyel, majd adjuk össze a
három egyenletet. Ekkor azt kapjuk, hogy

243
Óbudai Egyetem BGK Fejezetek a matematikából

L  yip   C1L  y1   C2 L  y2   g  x   0  0  g  x   g  x 

tehát valóban megoldás. Ezek után az ismeretlen függvények az utóbbi egyenletrendszerből


meghatározhatók például a Cramer-szabállyal. Először arra mutatunk rá, hogy az
egyenletrendszer együtthatómátrixának determinánsa éppen az alaprendszer Wronski-
determinánsa, amely nem zérus, tehát a Cramer-szabály alkalmazható. Eszerint a megoldás a
következő

0 y2  x  y1  x  0
g  x y2  x  y1  x  g  x 
C '1  x   ; C '2  x  
y1  x  y2  x  y1  x  y2  x 
y1  x  y2  x  y1  x  y2  x 

Ezek integrálásával kapjuk a keresett függvényeket. Éppen ezt kellett igazolni. ■

2.2.14.Példa: Határozzuk meg az alábbi másodrendű inhomogén lineáris differenciálegyenlet


általános megoldását.

4x 4
 2 x  1 y " 4 xy ' 4 y   2 x  12 ; standard alakban y " y ' y   2 x  1 ;
 2 x  1  2 x  1
Korábban már előállítottuk a megfelelő homogén lineáris differenciálegyenlet egy alaprendszerét.
Ez a következő: y1  x   x; y2  x   e2 x . Ezek felhasználásával már elő lehet állítani az
inhomogén egyenlet egy partikuláris megoldását. Alkalmazva a tétel jelöléseit

e2 x
  1
x
W x, e 2 x
   2 x  1 e2 x ;
2 x
2e
0 e2 x x 0
W1  x      2 x  1 e2 x ; W2  x     2 x  1 x;
2 x  1 2e2 x 1 2x 1

Ezek felhasználásával adódik, hogy

W1  x    2 x  1 e2 x
C1  x    dx   dx   1dx  x;
W  y1  x  , y2  x     2 x  1 e2 x

C2  x   
 2 x  1 x dx   xe2 x dx  e2 x  1  x  ;
  2 x  1 e2 x
 
4 2

Innen pedig már adódik az inhomogén egyenlet egy partikuláris megoldása.

244
Óbudai Egyetem BGK Fejezetek a matematikából

1 x x 1
yip  x   x  x  e2 x e2 x     x 2  
4 2 2 4

Végezetül adódik az inhomogén egyenlet általános megoldása

x 1
yiá  x   C1x  C2e2 x  x 2   ; C1 , C2  R
2 4

2.2.15.Példa: Igazoljuk, hogy az

( x  1) 1
xy " ( x  1) y ' y  x 2e x ; standard alakban az y " y ' y  xe x
x x

másodrendű lineáris differenciálegyenletnek az y1  e x ; y2  ( x  1) függvények alaprendszerét


képezik, majd határozzuk meg az inhomogén differenciálegyenlet általános megoldását!
Egyszerűen helyettesítéssel meg lehet győződni arról, hogy mindkét függvény megoldása a
homogén egyenletnek.

xe x   x  1 e x  e x  0; másrészt x  0   x  1   1   x  1  0;

Valóban megoldások. Kérdés, hogy lineárisan függetlenek-e. Ehhez ki kell számítani Wronski-
determinánsukat.

ex ( x  1)
W ( y1; y2 )   e x  ( x  1)e x  xe x
e x
1

Ez a determináns nem nulla az R+ halmazon, de az R– halmazon is különbözik nullától. Az y1, y2


függvények mindkét intervallumon alaprendszerét képezik a homogén lineáris differenciál-
egyenletnek. A homogén egyenlet általános megoldása tehát

yhá = C1∙ex + C2∙(x + 1)

A partikuláris megoldást pedig az

yip = C1(x)∙ex + C2(x)∙(–x – 1)

alakban keressük. Az ismeretlen C1(x) és C2(x) kiszámításához szükség van az alábbi


determinánsokra

0 ( x  1) ex 0
W1   x( x  1)e x ; W2   xe2 x
xe x
1 e x
xe x

245
Óbudai Egyetem BGK Fejezetek a matematikából

Most már kiszámíthatjuk a C1(x) és C2(x) függvényeket

W1  x  x( x  1)e x x2
C1 ( x)   dx   dx   ( x  1)dx  x
W  y1 , y2  xe x 2
W2  x  xe2 x
C2 ( x)   dx   x dx   e x dx  e x
W  y1 , y2  xe

Ezeket a helyettesítve yip képletébe, kapjuk a partikuláris megoldást

 x2 
yip    x  e x    x  1 e x
 2 

Végül yhá és yip összege adja az általános megoldást

 x2 
y  C1e x  C2 ( x  1)    x  e x    x  1 e x
 2 

246
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.5.Másodrendű állandó együtthatójú lineáris differenciálegyenlet


Lényegesen különböző eredmények adódnak abban az esetben, ha a másodrendű lineáris
differenciálegyenletben az ismeretlen függvénynek és deriváltjainak az együtthatói valós számok,
azaz állandó függvények. Innen ered az elnevezés is. Ebben az esetben ugyanis konstruktív
módon elő tudjuk állítani a homogén egyenlet egy alaprendszerét. Feladatul tűzzük ki tehát az

a∙y” + b∙y’ + c∙y = g(x)

másodrendű állandó együtthatójú lineáris differenciálegyenlet megoldását, ahol a,b,cR, a ≠ 0, a


g(x), xI pedig folytonos függvény.

Mindenekelőtt hangsúlyozzuk, hogy az előző 2.2.4. pontban, az általános, „függvény-


együtthatójú” esetben megfogalmazott tételek változtatás nélkül igazak. A 2.2.4. pontban igazolt
tételekre fogunk hivatkozni, miközben előállítjuk a homogén egyenlet egy alaprendszerét,
továbbá az inhomogén egyenlet egy partikuláris megoldását. Ennek megfelelően ezen egyenlet
megoldását is két pontban tárgyaljuk.

2.2.5.1. Másodrendű állandó együtthatójú homogén lineáris


differenciálegyenlet
Megoldandó tehát az

a∙y” + b∙y’ + c∙y = 0, a,b,cR, a ≠ 0

másodrendű homogén lineáris differenciálegyenlet. Az általános tétel szerint meg kell határozni
az egyenlet egy alaprendszerét, vagyis két lineárisan független megoldást. Mint látni fogjuk az
állandó együtthatójú esetben ez tetszőleges a, b, cR esetén nagyon könnyen megoldható feladat.
A megoldás alapgondolata az, hogy elsőként megvizsgáljuk az állandó együtthatójú elsőrendű
homogén lineáris egyenletet:

y’ + a∙y = 0, aR

Ezt abban az esetben is könnyen meg tudjuk oldani, amikor az a konstans helyén egy folytonos
f(x) függvény áll. Mint láttuk a megoldás az állandó szorzótól eltekintve

y ( x)  e 
 f ( x ) dx

helyettesítsünk itt az f(x) helyére konstans a-t, ekkor kapjuk, hogy

y( x)  e ax

247
Óbudai Egyetem BGK Fejezetek a matematikából

Tehát a megoldás egy exponenciális függvény. Felmerül a kérdés, hogy vajon a másodrendű
egyenletnek van-e ilyen alakú megoldása. Próbálkozzunk meg a másodrendű egyenletet
kielégíteni egy

y( x)  ex

alakú „próbafüggvénnyel”. A kérdés nyilván az, hogy létezik-e olyan λ valós vagy komplex
szám, amelyre ez a függvény megoldása a homogén egyenletnek. Ezt a legegyszerűbben úgy
lehet eldönteni, hogy behelyettesítjük a függvényt az egyenletbe. Ehhez a próbafüggvényt kétszer
kell deriválni:

y( x)  ex ; y '( x)    ex ; y "( x)   2  ex

Ha ezeket a deriváltakat behelyettesítjük az

a∙y” + b∙y’ + c∙y = 0, a,b,cR, a ≠ 0

differenciálegyenletbe, és az egyenletet elosztjuk a nullától különböző eλx tényezővel, akkor az


alábbi algebrai másodfokú egyenletet kapjuk.

a∙λ2 + b∙λ + c = 0

Ezt az egyenletet a homogén lineáris differenciálegyenlet karakterisztikus egyenletének


nevezzük. A másodfokú egyenlet megoldásával kapcsolatban három esetet különböztetünk meg,
aszerint, hogy a D = b2 – 4ac diszkrimináns pozitív, nulla illetve negatív. Ennek megfelelően a
differenciálegyenlet megoldását is három esetre bontva tárgyaljuk.

1.eset: D> 0.Ekkor a karakterisztikus egyenletnek két különböző valós megoldása van:

b  D b  D
1  ; 2  ;
2a 2a

Ez azt jelenti, hogy az

y1 ( x)  e1x ; y2 ( x)  e2 x

függvények a homogén egyenlet megoldásai. Kérdés, hogy lineárisan függetlenek-e. Ehhez


kiszámítjuk a Wronski-determinánst.

e1x e 2 x
W  y1  x  , y2  x    1x 2 x
   2  1   e1x  e2 x
1e  2e

Mivel az exponenciális függvény sehol sem zérus, és a feltevés miatt a λ1 – λ2 különbség sem
zérus a Wronski-determináns nem nulla. Ez pontosan azt jelenti, hogy az y1(x) és y2(x)

248
Óbudai Egyetem BGK Fejezetek a matematikából

függvények lineárisan függetlenek, tehát alaprendszert képeznek. Ebből adódóan a homogén


lineáris differenciálegyenlet általános megoldása:

y( x)  C1  e1x  C2  e2 x ; C1, C2  R

2.2.16.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris


differenciálegyenlet általános megoldását.

y " 5 y ' 6 y  0;

A karakterisztikus egyenlet a következő 2  5  6  0 . Ennek diszkriminánsa D = 25–24 = 1


pozitív valós szám. A két valós megoldás: 1  2, 2  3 . Az egyenlet általános megoldása tehát

y( x)  C1  e2x  C2  e3x ; C1, C2  R

2.eset: D = 0. Ekkor a karakterisztikus egyenletnek egyetlen valós – de úgy is fogalmazhatunk,


hogy két egybeeső, vagyis kétszeres multiplicitású – megoldása van, λ.

b

2a

Ez azt jelenti, hogy ezzel a módszerrel a D = 0 esetben egyetlen megoldást találtunk.

y1 ( x)  ex

Ehhez még keresni kell egy olyan megoldást, ami ezzel együtt alaprendszert alkot. Ehhez
felhasználhatjuk a Liouville-féle tételt, ami éppen ezt a célt szolgálja. Az említett tétel szerint a
keresett másik megoldás kielégíti az

e x y b
  dx
 C e a
 e x y'

differenciálegyenletet. Itt hangsúlyozzuk, hogy az integrandust az egyenlet standard alakjából


b c b
kell helyettesíteni, vagyis az y " y ' y  0 alakból. Mivel   2 , ezért a megoldandó
a a a
egyenlet a korábbiak szerint így írható:

 y  C  2dx  C  e2x  C; azaz y  C x; tehát y  x   C x ex


 x   2 x  e
e 2 x e x
2
e  e

249
Óbudai Egyetem BGK Fejezetek a matematikából

Megkaptuk tehát a differenciálegyenlet egy másik megoldását. Erről egyébként egyszerűen úgy is
meggyőződhetünk, ha ezt a függvényt kétszer deriváljuk és a D = 0 feltételt felhasználva
behelyettesítjük az egyenletbe.

    
a 2ex  x 2ex  b ex  xex  cxex  xex a 2  b  c  2aex  bex  
  b  
 xex  0  ex  2a     b   0
  2a  

Valóban megoldás. Már csak azt kell igazolnunk, hogy az

y2 ( x)  x  ex

függvény és az y1(x) függvény lineárisan független megoldások. A Wronski-determináns értéke


igazolja, hogy a két függvény valóban alaprendszer

ex xex
 x
W e , xe x
  e x x
e  xe x
 e2x 1  x  x   e2x  0

Tehát a két függvény a teljes számegyenesen alaprendszerét képezi a homogén egyenletnek.


Ebben az esetben tehát a homogén lineáris egyenlet általános megoldása:

y( x)  C1  ex  C2  x  ex  ex   C1  C2  x  ; C1, C2  R

2.2.17.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris


differenciálegyenlet általános megoldását.

y " 4 y ' 4 y  0;

A karakterisztikus egyenlet a következő 2  4  4  0 . Ennek diszkriminánsa D = 16 – 16 = 0.


A két egybeeső valós megoldás:   2 . Az egyenlet általános megoldása tehát

y( x)  C1  e2x  C2  x  e2x  e2x   C1  C2  x  ; C1, C2  R

3.eset: D < 0. Ha a diszkrimináns negatív, akkor a másodfokú egyenletnek két konjugált komplex
megoldása van.

b  D b  1 D b  i D
12       i 
2a 2a 2a

Itt felhasználtuk, hogy a │D│ pozitív valós szám, így van valós négyzetgyöke. Ekkor tehát
komplex szám szerepel az exponenciális függvény kitevőjében

250
Óbudai Egyetem BGK Fejezetek a matematikából

y ( x)  ex  e
i  x
 ex  eix  ex  cos x  i  sin x  
 ex cos x  i  ex sin x

Itt felhasználtuk az eiβx= cosβx + i∙sinβx Euler-féle összefüggést. Az ilyen módon előállított y(x)
függvény valós változójú de komplex értékű. Mivel az egyenlet valós együtthatójú, ezért
elvárjuk, hogy a megoldás is valós függvény legyen. Ehhez egyrészt azt kell észrevenni, hogy az
y(x) komplex értékű függvény valós része is és képzetes része is valós-valós függvény.

y1  x   Re y  x   ex cos x
y2  x   Im y  x   ex sin x

Kérdés, hogy ezek a függvények megoldásai-e a homogén differenciálegyenletnek, és ha


megoldások akkor lineárisan függetlenek-e. Az első kérdésre a választ már megadtuk egy
korábbi tételben, melyet az L operátor linearitásának kapcsán igazoltunk. Eszerint, ha egy
komplex függvény megoldása egy lineáris differenciálegyenletnek, akkor megoldás a valós rész
és megoldás a képzetes rész is. A lineáris függetlenség pedig a Wronski-determináns
kiszámításával adódik.

ex cos x ex sin x



W ex cos x, ex sin x   ex cos x  ex sin x ex sin x  ex cos x


 e2x  cos x sin x   cos 2 x   cos x sin x   sin 2 x  e 2x  0 
Ami azt jelenti, hogy az y1 és y2 függvények a teljes számegyenesen alaprendszerét képezik a
differenciálegyenletnek. Ezzel előállítottuk a homogén lineáris egyenlet általános megoldását a
D< 0 esetben is.

y  x   C1ex cos x  C2ex sin x  ex C1 cos x  C2 sin x  ; C1, C2  R

2.2.18.Példa: Határozzuk meg az alábbi másodrendű, állandó együtthatójú, homogén lineáris


differenciálegyenlet általános megoldását.

y " 4 y ' 29 y  0;

A karakterisztikus egyenlet a következő 2  4  29  0 . Ennek diszkriminánsa


D = 16 – 116 = –100. A két konjugált komplex megoldás:   2  5i; azaz   2;   5 . Az
egyenlet általános megoldása tehát

y  x   C1e2 x cos5x  C2e2 x sin 5x  e2 x  C1 cos5x  C2 sin 5x  ; C1, C2  R

251
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.5.2. Másodrendű állandó együtthatójú inhomogén lineáris


differenciálegyenlet
Ebben a pontban keressük az

a∙y” + b∙y’ + c∙y = g(x), a,b,cRa ≠ 0 (xI)

inhomogén lineáris differenciálegyenlet általános megoldását. Ebben a speciális esetben is


természetes módon érvényesek azok az általános tételek, amelyeket az inhomogén egyenletek
megoldásával kapcsolatosan a 2.2.4.2. pontban megfogalmaztunk és alkalmaztunk. Ezek szerint
az inhomogén egyenlet általános megoldása egyrészt a homogén egyenlet általános
megoldásának és az inhomogén egyenlet egy partikuláris megoldásának összegeként adódik. A
homogén egyenletet megoldottuk a 2.2.5.1. pontban, így nem marad más hátra, mint egy
partikuláris megoldás előállítása. Ehhez elvileg minden esetben alkalmazhatjuk az állandók
variálásának általános módszerét. Ismétlésképpen ismét felírjuk a szükséges összefüggéseket. A
hivatkozott pont szerint az inhomogén lineáris differenciálegyenlet partikuláris megoldása
előállítható

yip(x) = C1(x)∙ y1(x) + C2(x)∙ y2(x)

alakban ahol a C1(x) és C2(x) függvényeket az alábbi formulák szolgáltatják.

W1  x  W2  x 
C1  x    dx, C2  x    dx
W  y1  x  , y2  x   W  y1  x  , y2  x  

Az integrandusokban szereplő W1(x) és W2(x) függvények pedig a Wronski-determinánsból


származtathatók az alábbi módon.

0 y2  x  y  x 0
W1  x   ; W2  x   1
g  x y2  x  y1  x  g  x 

2.2.19.Példa: Határozzuk meg az

y " 2 y ' 8 y  3e2 x

inhomogén egyenlet általános megoldását. A homogén egyenlethez tartozó karakterisztikus


egyenlet 2  2  8  0 , melynek megoldásai 1  2; 2  4 . A homogén egyenlet általános
megoldása tehát

yhá  x   C1 y1  x   C2 y2  x   C1e2 x  C2e4 x ; C1, C2  R

Az állandó variálásához elő kell állítanunk a Wronski-determinánst és a W1(x) és W2(x)


függvényeket.

252
Óbudai Egyetem BGK Fejezetek a matematikából

e2 x e4 x
W  x   4e2 x  2e2 x  6e2 x ;
4 x
2e 2x
4e
0 y2  x  0 e4 x
W1  x     3e2 x ;
g  x y2  x  3e2 x 4e 4 x

y1  x  0 e2 x 0
W2  x     3e4 x ;
y1  x  g  x  2e2 x 3e 2x

Ezek után a szükséges integrálok már kiszámíthatók.

W1  x  3e2 x 1
C1  x    dx   dx  x;
W  y1  x  , y2  x   6e 2 x
2
W2  x  3e4 x 1 6x e6 x
C2  x    dx   dx   2
 e dx   ;
W  y1  x  , y2  x   6e2 x 12

Ezen eredmények felhasználásával már adódik a partikuláris megoldás

1 2 x 1 6 x 4 x  1 1
yip  x   C1  x  y1  x   C2  x  y2  x   xe  e e   x   e 2 x
2 12 2 12 

Az inhomogén egyenlet általános megoldása tehát

1 1
yiá  x   C1e2 x  C2e4 x   x   e2 x ; C1 , C2  R
2 12 

2.2.20.Példa: Határozzuk meg az

1
y " y 
cos x

inhomogén lineáris egyenlet általános megoldását. A homogén egyenlethez tartozó


karakterisztikus egyenlet 2  1  0 melynek megoldásai   i  0  1 i , ahonnan a homogén
egyenlet általános megoldása

yhá  x   C1 y1  x   C2 y2  x   C1 cos x  C2 sin x; C1, C2 R

A partikuláris megoldás előállításához kiszámítjuk a szükséges determinánsokat

253
Óbudai Egyetem BGK Fejezetek a matematikából

cos x sin x
W  x   cos2 x  sin 2 x  1;
 sin x cos x
0 sin x
0 y2  x  sin x
W1  x    1  ;
g  x y2  x  cos x cos x
cos x
cos x 0
y1  x  0
W2  x    1  1;
y1  x  g  x   sin x
cos x

Amely eredmények alapján a szükséges integrálok

W1  x   sin x
C1  x    dx   dx  ln cos x ;
W  y1  x  , y2  x   1 cos x
W2  x  1
C2  x    dx   dx   1dx  x;
W  y1  x  , y2  x   1

A partikuláris megoldás tehát a következő

yip  x   C1  x  y1  x   C2  x  y2  x   cos x  ln cos x  x  sin x

Az inhomogén egyenlet általános megoldása ezek szerint tehát

yiá  x   C1 cos x  C2 sin x  cos x  ln cos x  x  sin x; C1, C2  R

Az előző példákban illusztrált módszer, tehát az állandók variálásának a módszere a


legáltalánosabb, elvileg minden esetben alkalmazható eljárás.
Némileg egyszerűbben – legalábbis integrálás nélkül – juthatunk el a partikuláris megoldáshoz
bizonyos esetekben, amikor az inhomogén egyenlet jobb oldalán szereplő g(x) függvény
meghatározott függvényosztályokhoz tartozik. Ezek a függvényosztályok a következők: hatvány
illetve polinom függvények, exponenciális függvények, szinusz- és koszinusz függvények,
valamint ezek összege és/vagy szorzata. Ezekben az esetekben előállíthatjuk a partikuláris
megoldást az állandók variálása nélkül is, az úgynevezett kísérletező módszerrel, vagy más
néven a próbafüggvény módszerével. Ezekben az esetekben a megoldást a g(x) függvény
konkrét alakjától függően, bizonyos meghatározott általános, szabad konstans paramétereket
tartalmazó alakban kereshetjük úgy, hogy a próbafüggvényt helyettesítjük a
differenciálegyenletbe és annak feltételezésével, hogy a helyettesítés azonosságot szolgáltat, az
ismeretlen konstansokat meghatározzuk. Az alábbiakban minden említett esetre vonatkozólag
pontosan megadjuk a próbafüggvény alakját és a mondottakat példákkal illusztráljuk.

254
Óbudai Egyetem BGK Fejezetek a matematikából

1. A jobb oldalon egy polinom függvény áll, azaz g(x) = pn(x) egy n-ed fokú polinom.

Keressük tehát a partikuláris megoldását az

ay " by ' cy  an xn  an1xn1  ...  a1x  a0 ; a, an  0

inhomogén lineáris differenciálegyenletnek. A partikuláris megoldás alakja függ a bal oldal


alakjától is.

a) Tegyük fel, hogy c  0 , ami egyenértékű azzal a kijelentéssel, hogy a 0 valós szám nem
gyöke a homogén egyenlet k     a 2  b  c karakterisztikus polinomjának. Ekkor létezik
az egyenletnek n-ed fokú polinom alakú partikuláris megoldása, tehát kereshető a megoldás

yip  x   qn  x   An xn  An1xn1  ...  A1x  A0

alakban, ahol az Ai valós számok az egyelőre határozatlan együtthatók. Könnyen látható, hogy
valóban létezik ilyen alakú megoldás, ugyanis ha ezt az n-ed fokú polinomot helyettesítjük az
egyenletbe, akkor először elő kell állítani az elsőrendű deriváltját, amely egy n – 1-ed fokú
polinom, majd a második deriváltját, amely egy n – 2-ed fokú polinom. Ha ezeket helyettesítjük
az inhomogén egyenletbe, akkor a bal oldalon egy n-ed fokú polinomot kapunk, a jobb oldal
ugyanakkor szintén egy n-ed fokú polinom. Alkalmazzuk az együttható összehasonlítás
módszerét, vagyis a polinomok megfelelő hatványainak együtthatóit rendre egyenlővé tesszük.
Így kapunk egy n + 1 db egyenletből álló lineáris egyenletrendszert, hiszen a konstans tag, az első
hatvány, a második hatvány, stb. az n-edik hatvány együtthatóinak száma éppen ennyi. Ha végül
figyelembe vesszük, hogy a próbafüggvény is n + 1 db ismeretlen együtthatót tartalmaz, akkor
világos, hogy a probléma egyértelműen megoldható.

2.2.21.Példa: Keressük meg az

y " 3 y ' 4 y  3x2  5

differenciálegyenlet egy partikuláris megoldását. A 0 valóban nem gyöke a k      2  3  4


karakterisztikus polinomnak, tehát kereshetjük a partikuláris megoldást másodfokú polinom
alakjában. A deriváltakkal együtt ez a következő

yip  x   q2  x   Ax2  Bx  C; y 'ip  x   2 Ax  B; y "ip  x   2 A;

Helyettesítve az inhomogén egyenletbe azt kapjuk, hogy

 
2 A  3  2 Ax  B   4 Ax 2  Bx  C  3x 2  5;

Rendezve az egyenletet az x csökkenő hatványai szerint

255
Óbudai Egyetem BGK Fejezetek a matematikából

4 Ax2   6 A  4B  x   2 A  3B  4C   3x 2  0 x  5

Az együtthatók összehasonlításával a következő lineáris egyenletrendszert kapjuk

4 A  3;  6 A  4B  0; 2 A  3B  4C  5;

3 9 25
melynek megoldása A  ; B  ; C   , tehát a keresett partikuláris megoldás a következő
4 8 8

3 2 9 25
yip  x   x  x ;
4 8 8

b) Tegyük most fel, hogy a 0 valós szám gyöke a homogén egyenlet k     a 2  b  c


karakterisztikus polinomjának. Az összes lehetséges esetet tárgyaljuk, ezért legyen r a 0 mint
gyök multiplicitása, azaz lehet r = 1 és r = 2. Ebben az esetben már nem biztos, hogy létezik n-ed
fokú polinom alakú megoldás, de a problémát visszavezetjük az a) pontban vizsgált esetre.
Tegyük fel tehát hogy a 0 valós szám r multiplicitású gyök, ekkor az egyenlet alakja az r = 1 és
r = 2 esetekben rendre a következő

ay " by '  an x n  an1x n1  ...  a1x  a0 ; a, an  0


ay "  an x n  an1x n1  ...  a1x  a0 ; a, an  0

Tekintettel arra, hogy az együttható összehasonlítás módszere, az a) pont szerint akkor vezet
egyértelmű eredményre, ha az egyenlet mindkét oldalán n-ed fokú polinom áll, ezt a helyzetet
célszerű elérni a próbafüggvénnyel. Figyelembe véve, hogy egy k-ad fokú polinom első deriváltja
k – 1-ed fokú, a második deriváltja pedig k – 2-ed fokú polinom, világos, hogy az r = 1 esetben
próbafüggvényként egy n + 1-ed fokú, az r = 2 esetben pedig egy n + 2-ed fokú polinom
alkalmazása vezet célra. Ha tehát a jobb oldalon egy n-ed fokú polinom áll, akkor az r = 1 illetve
r = 2 esetben rendre az

yip  x   An1 x n1  An x n  An 1x n1  ...  A1x  A0 ;


yip  x   An 2 x n 2  An1 x n1  An x n  An 1x n1  ...  A1x  A0 ;

polinomok az alkalmas próbafüggvények. Vegyük azonban figyelembe, hogy az r = 1 esetben a


polinom első és második deriváltja szerepel a bal oldalon, ami azt jelenti, hogy az A0 együttható
nem szerepel az egyenletben, értéke tetszőleges, célszerű 0-nak választani. Az r = 2 esetben
azonban a próbafüggvénynek csak a második deriváltja szerepel, ez pedig nem tartalmazza az A0
és A1 együtthatókat, ami azt jelenti, hogy ezek értéke ugyancsak tetszőleges, célszerű mindkettőt
0-nak választani. Ezek szerint a próbafüggvények legegyszerűbb alakja r = 1 esetben

 
yip  x   An1x n1  An xn  An1x n1  ...  A1x  x An1x n  An x n1  An1x n2  ...  A1  xqn  x  ;

256
Óbudai Egyetem BGK Fejezetek a matematikából

tehát egy n-ed fokú polinomnak és x-nek a szorzata, r = 2 esetben pedig

yip  x   An 2 x n 2  An1 x n1  An x n  An1x n1  ...  A2 x 2 

 
 x 2 An 2 x n  An1 x n1  An x n2  ...  A2  x 2 qn  x  ;

tehát egy n-ed fokú polinomnak és x2-nek a szorzata. Ha ezeket helyettesítjük az inhomogén
egyenletbe, az együttható összehasonlítással ismét egyértelmű eredményt kapunk, hiszen mindkét
esetben ugyancsak n + 1 db határozatlan együttható van az egyenletben, amelyre felírható egy
n + 1 db egyenletből álló lineáris rendszer.

2.2.22.Példa: Határozzuk meg az

y " 2 y '  x2  3x

differenciálegyenlet egy partikuláris megoldását. A k      2  2 karakterisztikus egyenletnek


a gyökei 1  0; 2  2 , a 0 tehát egyszeres multiplicitású gyök. Eszerint a partikuláris
megoldást harmadfokú polinom alakjában kell keresnünk. Ez a deriváltakkal együtt a következő

 
yip  x   x  q2  x   x Ax 2  Bx  C  Ax3  Bx 2  Cx;

y 'ip  x   3 Ax 2  2 Bx  C; y "ip  x   6 Ax  2 B;

helyettesítéssel a következő egyenlet adódik

 
6 Ax  2B  2 3 Ax 2  2 Bx  C  x 2  3x;

Rendezve az egyenletet csökkenő hatványok szerint azt kapjuk, hogy

6 Ax2   6 A  4B  x   2B  2C   x 2  3x  0;

Együttható összehasonlítást végezve az együtthatókra kapott lineáris rendszer a következő

6 A  1; 6 A  4B  3; 2B  2C  0;

1 1 1
melynek megoldása A  ; B  ; C   , az egyenlet egy partikuláris megoldása tehát
6 2 2

1 3 1 2 1
yip  x   x  x  x
6 2 2

257
Óbudai Egyetem BGK Fejezetek a matematikából

2. A jobb oldalon egy polinom függvénynek és egy exponenciális függvénynek a szorzata áll,
azaz g(x) = pn(x)eαx.

Keressük tehát a partikuláris megoldását az

 
ay " by ' cy  pn  x  ex  an xn  an1x n1  ...  a1x  a0 ex ; a, an  0

inhomogén lineáris differenciálegyenletnek. Tegyük fel, hogy létezik ugyanilyen alakú


partikuláris megoldás, tehát a próbafüggvény egy polinomnak és a jobb oldalon szereplő
exponenciális függvénynek a szorzata. Egyelőre nem határozzuk meg a próbafüggvényben
szereplő polinom fokszámát, az majd a vizsgálat során kiderül. Legyen tehát

yip  x   q  x  ex

ahol q(x) egy polinom függvény. Helyettesítsük ezt a próbafüggvényt az inhomogén egyenletbe.
Ehhez szükségesek a deriváltak

y 'ip  x   q '  x  ex  q  x  ex ;


y "ip  x   q "  x  ex  2q '  x  ex  q  x   2ex ;

Helyettesítéssel a következő adódik

   
a q " x  ex  2q '  x  ex  q  x  2ex  b q '  x  ex  q  x  ex  cq  x  ex  pn  x  ex ;

Világos, hogy az egyenlet elosztható a sehol sem nulla exponenciális tényezővel. Rendezés után
az adódik, hogy

 
aq "  x    2a  b  q '  x   a2  b  c q  x   pn  x  ;

Az adott függvénnyel tehát akkor elégíthető ki az inhomogén egyenlet, ha ez a polinomok azonos


egyenlőségét kifejező egyenlet teljesül. A jobb oldal a feltétel szerint egy n-ed fokú polinom. A
kérdés, hogy mekkora legyen a q(x) polinom fokszáma, hogy ez az egyenlet valóban azonosság
legyen.

a) Az exponenciális függvény α kitevője nem gyöke a homogén egyenlet k     a 2  b  c


karakterisztikus polinomjának, azaz k     a2  b  c  0 . Ekkor az azonosságot jelentő
egyenlet mindkét oldalán akkor és csak akkor áll n-ed fokú polinom, ha a q(x) n-ed fokú polinom.
Ezt a kérdést már részletesen tárgyaltuk az 1. pontban. Kaptuk tehát az eredményt, hogy abban az
esetben ha az α kitevője nem gyöke a karakterisztikus polinomnak, akkor a partikuláris megoldás
alakja a következő

258
Óbudai Egyetem BGK Fejezetek a matematikából

 
yip  x   qn  x  ex  An x n  An1x n1  ...  A1x  A0 ex

2.2.23.Példa: Állítsuk elő az

y " 5 y ' 4 y  2 xe6 x

differenciálegyenlet egy partikuláris megoldását. A k      2  5  4 karakterisztikus


egyenletneka gyökei 1  1; 2  4 , az α = 6 valós szám tehát nem gyöke a karakterisztikus
egyenletnek, ami azt jelenti, hogy a partikuláris megoldást az

yip  x   q1  x  e6 x   Ax  B  e6 x

alakban kereshetjük. A próbafüggvény deriváltjai a következők

y 'ip  x   Ae6 x   Ax  B  6e6 x ;


y "ip  x   6 Ae6 x  A6e6 x   Ax  B  36e6 x ;

Helyettesítve az inhomogén egyenletbe, azt kapjuk, hogy

 6 Ae 6x
  
 6 Ae6 x   Ax  B  36e6 x  5 Ae6 x   Ax  B  6e6 x  4  Ax  B  e6 x  2 xe6 x

Osztva az exponenciális tényezővel majd rendezve az egyenletet az x csökkenő hatványai szerint,


adódik, hogy

 36 A  30 A  4 A x   6 A  6 A  36B  5 A  30B  4B   2 x  0;
azaz 70 Ax  17 A  70B   2 x  0;

Ez pontosan akkor azonosság, ha teljesül, hogy

az x együtthatói : 70 A  2;
a konstans tagok : 17 A  70 B  0;

1 17
Ennek megoldása a következő A  ; B ; , ami azt jelenti, hogy az inhomogén
35 2450
egyenlet egy partikuláris megoldása a következő

 1 17  6 x
yip  x    x  e
 35 2450 

259
Óbudai Egyetem BGK Fejezetek a matematikából

b) Az exponenciális függvény α kitevője egyszeres vagy kétszeres gyöke a homogén egyenlet


k     a 2  b  c karakterisztikus polinomjának. Ezt az esetet szokás exponenciális
rezonanciaként emlegetni. Ha egyszeres gyök, akkor a karakterisztikus polinom szorzat alakja
k     a2  b  c  a         2  és  2   , és ebben az esetben teljesül, hogy
a2  b  c  0 . Ha pedig kétszeres gyök, akkor a karakterisztikus polinom a
k     a2  b  c  a      alakban írható. Ez utóbbi esetben a karakterisztikus polinom
2

deriváltja a k '     2a  b  2a      alakot ölti. Mely szerint az α konstans a karakterisztikus


polinom deriváltjának is gyöke, azaz teljesül, hogy 2a  b  0 . Könnyen látható, hogy ha az α
csak egyszeres gyök, akkor nem gyöke a derivált polinomnak, hiszen ekkor
k '     2a  b  a     2   a       0 ha    2 . Azt kaptuk tehát, hogy ha az
exponenciális függvény α kitevője egyszeres illetve kétszeres gyöke a karakterisztikus
polinomnak, akkor az yip  x   q  x  ex próbafüggvény alkalmazásával r = 1 illetve r = 2
multiplicitású gyök esetén rendre a következő azonosságokat kell kielégítenünk

 
aq "  x    2a  b  q '  x   a 2  b  c q  x   aq "  x    2a  b  q '  x   pn  x  ;

aq "  x    2a  b  q '  x    a 2


 b  c  q  x   aq "  x   p n  x;

Ezt a kérdést részletesen megvizsgáltuk az 1.b) pontban. Azt mondhatjuk tehát, hogy az r = 1
illetve r = 2 multiplicitású esetben a q(x) polinom foka rendre n + 1 illetve n + 2, kiegészítve
azzal, hogy az r = 1 esetben a polinom konstans tagja tetszőleges, így célszerűen 0-nak
választjuk, míg az r = 2 esetben a polinom konstans és első fokú tagja tetszőleges így ezeket is
0-nak választjuk. Kaptuk tehát, hogy a vizsgált esetben az inhomogén egyenletnek rendre az r = 1
illetve r = 2 esetben létezik


yip  x   x  qn  x  ex  x  An x n  An1x n1  ...  A1x  A0 ex ; 

yip  x   x 2  qn  x  ex  x 2  An x n  An1x n1  ...  A1x  A0 ex 
alakú partikuláris megoldása.

2.2.24.Példa: Állítsuk elő az

y " 6 y ' 9 y  e3 x

differenciálegyenlet egy partikuláris megoldását. A k     2  6  9


karakterisztikusegyenletnekkét egybeeső, más szóval egy kétszeres multiplicitású gyöke a   3
valós szám. Az α = 3 valós szám tehát kétszeres gyöke a karakterisztikus polinomnak (kétszeres
rezonancia), továbbá az általános esetbeli pn(x) polinom most konstans, azaz nulladfokú
polinom, ami azt jelenti, hogy a partikuláris megoldást az

260
Óbudai Egyetem BGK Fejezetek a matematikából

yip  x   Ax 2e3x

alakban kereshetjük. A próbafüggvény deriváltjai a következők

y 'ip  x   2 Axe3 x  3 Ax2e3 x ; y "ip  x   2 Ae3 x  6 Axe3 x  6 Axe3 x  9 Ax 2e3 x ;

Helyettesítve ezeket a deriváltakat az inhomogén egyenletbe, azt kapjuk, hogy

 2 Ae3x
  
 12 Axe3 x  9 Ax 2e3 x  6 2 Axe3 x  3 Ax 2e3 x  9 Ax 2e3 x  e3 x ;

1
Az összevonás eredménye a 2 Ae3 x  e3 x egyenlet, amelyből A  következik. A partikuláris
2
megoldás tehát a következő
1 2 3x
yip  x   xe
2

3. A jobb oldalon egy polinom függvénynek, egy exponenciális függvénynek és egy


koszinusz függvénynek vagy egy szinusz függvénynek a szorzata áll, azaz
g(x) = pn(x)eαxcosβx vagyg(x) = pn(x)eαxsinβx.

Keressük tehát a partikuláris megoldását az

 
ay " by ' cy  pn  x  ex cos x  an x n  an1x n1  ...  a1x  a0 ex cos x; a, an  0;

ay " by ' cy  pn  x  ex sin x   a x


n
n
 an1x n1  ...  a x  a  e
1 0
x
sin x; a, an  0

inhomogén lineáris differenciálegyenleteknek. Speciális esetként ebben természetesen benne van


az a lehetőség, hogy α = 0, amikor e0 = 1, tehát a jobb oldalon egy polinomnak és egy koszinusz
vagy szinusz függvénynek a szorzata áll.
Erre az esetre az eredmények egyszerűen következnek a 2. pont eredményeiből, ugyanis a
hivatkozott pontban sehol sem használtuk fel azt, hogy az exponenciális függvény α kitevője
valós szám, tehát a mondottak érvényesek komplex α kitevőre is. Alkalmazzuk az Euler-féle
összefüggést, mely szerint a trigonometrikus függvények kifejezhetők exponenciális
függvényekkel

eix  eix eix  eix


cos x  ; sin x 
2 2i

Helyettesítsük ezeket a törteket az egyenletekben a trigonometrikus függvények helyére. A


következő adódik

261
Óbudai Egyetem BGK Fejezetek a matematikából

eix  eix pn  x   i  x pn  x   i  x


ay " by ' cy  pn  x  e cos x  pn  x  e
x
 x
e  e ;
2 2 2
eix  eix pn  x   i  x pn  x   i  x
ay " by ' cy  pn  x  ex sin x  pn  x  ex  e  e ;
2i 2i 2i

tehát a jobb oldal olyan függvények összege, melyek egy n-ed fokú polinomnak és egy
exponenciális függvénynek a szorzataként írhatók fel. Vizsgálva a jobb oldalakat világos, hogy
két esetet kell megkülönböztetni.
a) Az   i illetve   i komplex szám nem gyöke a homogén egyenlet k     a 2  b  c
karakterisztikus polinomjának. Ebben az esetben a 2. pontbeli vizsgálatok eredményére
támaszkodva mondhatjuk, hogy létezik az egyenletnek

yip  x   qn  x  e  ex  qn  x  cos x  i sin x   sn  x  cos x  i sin x   ;


i x
 sn  x  e
i  x

azaz

yip  x   ex  q
 x   sn  x   cos x  i  qn  x   sn  x   sin x  
n

 ex  Qn  x  cos x  iRn  x  sin x  ;

alakú partikuláris megoldása, ahol Qn(x) és Rn(x) szintén n-ed fokú polinomok. Ez a függvény
formálisan komplex értékű. Ha azonban valós együtthatójú az egyenlet, elvárjuk, hogy valós
megoldásai legyenek, ezért komplex értékű függvényt nem fogadunk el megoldásként. Azonban
valós együtthatójú esetben ez a függvény valóban csak „formálisan” komplex, hiszen valós
együtthatójú polinomot helyettesítve és az együtthatókat összehasonlítva sehol sem kerülnek elő
komplex számok. Ez tehát azt jelenti, hogy a vizsgált esetben az inhomogén egyenlet partikuláris
megoldása előáll

yip  x   ex  Qn  x  cos x  Rn  x  sin x 

alakban, ahol Qn(x) és Rn(x) n-ed fokú polinomok.

2.2.25.Példa: Állítsuk elő az

y " 2 y ' y  e2 x cos3x

differenciálegyenlet egy partikuláris megoldását. A k      2  2  1 karakterisztikus egyenlet


megoldásai a 1,2  1 kétszeres multiplicitású való gyök. A 2  3  i komplex számok tehát nem
gyökei a karakterisztikus egyenletnek, az általános vizsgálatban szereplő pn(x) polinom pedig
konstans, azaz 0-ad fokú, tehát kereshetjük a megoldást

yip  x   e2 x  A cos3x  B sin 3x 

262
Óbudai Egyetem BGK Fejezetek a matematikából

alakban. A próbafüggvény deriváltjai a következők

y 'ip  x   2e2 x  A cos 3x  B sin 3x   e2 x  3 A sin 3x  3B cos 3x  ;


y "ip  x   4e2 x  A cos 3x  B sin 3x   2  2e2 x  3 A sin 3x  3B cos 3x   e 2 x  9 A cos 3x  9 B sin 3 x  ;

Helyettesítve az inhomogén egyenletbe a következő adódik

4e2 x  A cos 3x  B sin 3x   2  2e2 x  3 A sin 3x  3B cos 3x   e2 x  9 A cos 3x  9 B sin 3 x  

 
2 2e2 x  A cos 3x  B sin 3x   e2 x  3 A sin 3x  3B cos 3x   e2 x  A cos 3x  B sin 3 x   e 2 x cos 3 x;
Az egyenletet eloszthatjuk a nem nulla exponenciális tényezővel. Az osztás után rendezve az
egyenletet a koszinusz és szinusz függvények szerint, az adódik, hogy

 4 A  12B  9 A  4 A  6B  A cos3x   4B 12 A  9B  4B  6 A  B  sin 3x  1 cos3x  0  sin 3x


Összehasonlítva a két oldalon a koszinusz és szinusz függvények együtthatóit, a következő
lineáris egyenletrendszer adódik

cos3x együtthatói :  8 A  6 B  1;
sin 3x együtthatói :  6 A  8B  0;

4 3
Ennek megoldása A   ; B  ahonnan a keresett partikuláris megoldás
50 50

 4 3 
yip  x   e2 x   cos 3x  sin 3x  ;
 50 50 

b) Az   i illetve   i komplex szám gyöke a homogén egyenlet k     a 2  b  c


karakterisztikus polinomjának. Tekintettel arra, hogy valós együtthatójú egyenleteket
vizsgálunk elsősorban, ki kell hangsúlyoznunk, hogy egy komplex szám nem lehet kétszeres
gyöke a karakterisztikus egyenletnek. Egy másodfokú polinomnak, ha diszkriminánsa negatív,
akkor két konjugált komplex gyöke van, és ekkor mindkét komplex szám egyszeres komplex
gyök. Ebben a vizsgált esetben tehát az   i illetve   i komplex számok egyszeres gyökei a
karakterisztikus polinomnak.
Ebben az esetben felhasználjuk mindazokat a megállapításokat, amelyeket az 1. és 2. eset
vizsgálata kapcsán valamint a 3. eset bevezetésében és ennek a) pontjában tettünk. Eszerint ha az
  i illetve   i komplex számok egyszeres gyökei a karakterisztikus polinomnak, akkor az
inhomogén egyenletnek létezik

yip  x   x  ex  Qn  x  cos x  Rn  x  sin x 

alakú partikuláris megoldása, ahol Qn(x) és Rn(x) n-ed fokú polinomok.

263
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.26.Példa: Állítsuk elő az

y " 9 y  5sin 3x

differenciálegyenlet egy partikuláris megoldását. A k      2  9 karakterisztikus polinom


gyökei a 1,2  3i konjugált komplex számok. A jobb oldalra tekintve látható, hogy ebben az
esetben az   i  0  3i konjugált komplex számok szerint kell vizsgálni a problémát. Ezek
éppen gyökei a karakterisztikus polinomnak (szinuszos rezonancia). A fentiek szerint, mivel a
jobb oldalon szereplő pn(x) polinom konstans, tehát 0-ad fokú, a partikuláris megoldást
kereshetjük az

yip  x   x  A cos3x  B sin 3x 

alakban. Szükség van a próbafüggvény első és második deriváltjára is

y 'ip  x   1  A cos3x  B sin 3x   x  3 A sin 3x  3B cos3x  ;


y "ip  x    3 A sin 3x  3B cos3x   1  3 A sin 3x  3B cos3x   x   9 A cos3x  9 B sin 3x  ;

Helyettesítve az egyenletbe következő adódik

2   3 A sin 3x  3B cos3x   x   9 A cos3x  9B sin 3x   9 x  A cos3x  B sin 3x   5sin 3x;

Ha itt elvégezzük az összevonásokat, azt kapjuk, hogy

6 A sin 3x  6B cos3x  5sin 3x  0  cos3x;

5
Ebből következik, hogy A   ; B  0 tehát a partikuláris megoldás a következő
6

5
yip  x    x cos3x
6

264
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.6.Rezgések elmélete
Ebben a pontban a másodrendű lineáris differenciálegyenletek fizikai alkalmazásaként megoldjuk
a bevezető 2.2.1., 2.2.2. és 2.2.3. példájában említett differenciálegyenleteket.

2.2.6.1. Harmonikus oszcillátor


A 2.2.1. példában már felállítottuk a harmonikus rezgés differenciálegyenletét. Ez a szokásos
jelölésekkel a következő

y " 2 y  0;

D
ahol alkalmaztuk az 2  egyszerűsítő jelölést, D a rugóállandó, m az anyagi pont tömege. Ez
m
az egyenlet egy állandó együtthatójú másodrendű, homogén lineáris differenciálegyenlet.
Megoldásához szükség van a karakterisztikus egyenletre. Ez az alábbi

2  2  0

Mivel ω valós szám, ennek az egyenletnek valós megoldása nincs. A komplex gyökök pedig a
következők: 1,2  i , ahol i az imaginárius egység. Ha alkalmazzuk a 2.2.5.1. pontbeli 3. eset
jelöléseit, akkor az írhatjuk, hogy 1,2  i    i ahonnan adódik, hogy α = 0, β = ω. Így a
hivatkozott pont alapján azonnal felírhatjuk az egyenlet általános megoldását

y  t   et  C1 cos t  C2 sin t   e0 C1 cos t  C2 sin t   C1 cos t  C2 sin t

A harmonikus rezgőmozgás differenciálegyenletének általános megoldása tehát a következő:

y  t   C1 cos t  C2 sin t;; C1, C2  R

A C1 és C2 állandókat a kezdeti feltételekből határozzuk meg.

Elsőként vegyük fel a legegyszerűbb és legszokásosabb kezdeti feltételt, vagyis legyen


y  0   0; y '  0   v0 , ami azt jelenti, hogy az időmérés kezdetén a tömegpont éppen az
egyensúlyi helyzeten halad át és sebessége v0. Ha ezeket figyelembe vesszük, akkor azt kapjuk,
hogy

y  0   C1 cos 0  C2 sin 0  1 C1  0  C2  0; azaz C1  0

Ennek figyelembe vételével

265
Óbudai Egyetem BGK Fejezetek a matematikából

v0
y '  t   C2 cos t; ahonnan y '  0   C2 cos 0  C2  v0 ; azaz C2 

ami azt jelenti, hogy a kezdeti feltételeket kielégítő partikuláris megoldás a következő függvény.

v0
y t   sin t

Ha figyelembe vesszük, hogy a szinusz függvény értékkészlete a [–1, 1] intervallum, akkor


azonnal adódik, hogy az y(t) kitérés idő függvénynek van maximuma és minimuma, éspedig
 v v  v
y  t     0 , 0  . Ha bevezetjük a témakörben szokásos A  0 jelölést a maximális kitérésre
   
és ezt elnevezzük amplitúdónak, akkor kapjuk a Cauchy-feladat megoldását még ismertebb
alakban.

y  t   A sin t

Ha szükséges a harmonikus rezgést végző tömegpont sebessége illetve gyorsulása akkor nincs
más dolgunk, mint a kapott kitérés-idő függvény első és második deriváltját előállítani. Így a
sebesség-idő és gyorsulás-idő függvény az alábbi.

v  t   A cos t; a t   a2 sin t  2 y t 

Példaként a 2.2.5. ábrán illusztráljuk annak az egyenletnek a megoldását, amelyben ω = 2, és a


kezdeti feltételek y  0   0; y '  0   3 .

2.2.5. Ábra. A harmonikus rezgés differenciálegyenletének megoldása ω = 2 esetén


y  0  0; y '  0  3 kezdeti feltételekkel

266
Óbudai Egyetem BGK Fejezetek a matematikából

Tűzzük ki most a Cauchy feladatot a lehető legáltalánosabb kezdeti feltételekkel.

y " 2 y  0; y  0   y0 ; y '  0   v0 ;

tehát az időmérés kezdetén a tömegpontnak már van 0-tól különböző y0 kitérése, ahol a
pillanatnyi sebessége v0. Az általános megoldást alapul véve

y  t   C1 cos t  C2 sin t ;
y '  t   C1 sin t  C2 cos t ;

ahonnan

y0  C1 cos 0  C2 sin 0  C1; azaz C1  y0


v0
v0  C1 sin 0  C2 cos 0  C2; azaz C2 

Tehát a kezdeti feltételeket kielégítő partikuláris megoldás

v0
y  t   y0 cos t  sin t ;

Ez a megoldásfüggvény azonban jobban áttekinthető alakra hozható. Bővítsük a függvényt úgy,


hogy a trigonometrikus tagok együtthatóinak négyzetösszege 1 legyen. Ezt elérjük a következő
módon
 v0 
2  
v0 
y  t   y0  2
2 y0
cos t   sin t  ;
  2 2 
 y02  v0 v0
y0  2
2 
 2  

Mivel az együtthatók négyzetösszege 1, ezért létezik olyan φ0 szög melynek a két együttható
rendre szinusza és koszinusza, azaz teljesül, hogy

v0
y0
 sin 0 ;   cos 0
v2 v2
y02  02 y02  02
 

Ilyen φ0 szög valóban létezik, hiszen a két definiáló egyenlőség hányadosából az következik,
hogy

267
Óbudai Egyetem BGK Fejezetek a matematikából

y0  y 
tg 0  ; ahonnan 0  arctg  0 
v0  v0 

v02
Ezzel a szöggel és az A  y02  jelölés bevezetésével a kezdeti feltételeket kielégítő
2
partikuláris megoldás alakja egy addíciós tétel felhasználásával

y  t   A  sin 0 cos t  cos 0 sin t   A sin  t  0 

Tehát ismét egy szinusz függvény. A különbség a korábbi megoldáshoz képest csak annyi, hogy
az argumentumban szerepel a φ0 konstans, ami egyrészt annyit jelent, hogy a korábban kapott
megoldásból ez a megoldás egy időtengely mentén alkalmazott eltolással kapható, tehát
lényegében ugyanaz a megoldás. Másrészt a φ0 konstans jelentése akkor látható, ha alkalmazzuk
az argumentumban a t = 0 helyettesítést. Ez azt jelenti, hogy az időmérés kezdetén a tömegpont
helyzetéhez már tartozik egy φ0 szög, amit kezdőfázisnak nevezünk. Ezt a fogalmat általánosan
is használjuk. A megoldásban szereplő trigonometrikus függvény argumentumát, tehát az
  t  0  mennyiséget általánosan a rezgés fázisának nevezzük.
A 2.2.6. ábrán illusztráljuk az egyenlet megoldását az általános kezdeti feltételek esetén. Az
ábrán érzékelhető, hogy a megoldás lényegében valóban nem függ a kezdeti feltételektől, a 2.2.5.
ábra megoldásfüggvényéhez képest a különbség valóban csak egy eltolás.

2.2.6. Ábra. A harmonikus rezgés differenciálegyenletének megoldása ω = 2 esetén


y  0  1; y '  0  2,5 kezdeti feltételekkel

Hangsúlyozzuk, hogy az utóbb bevezetett A konstans jelentése pontosan az, ami a korábbi
esetben, a maximális kitérést, tehát az amplitúdót jelenti az általánosabb kezdeti feltételek esetén.

268
Óbudai Egyetem BGK Fejezetek a matematikából

Az ω jelentését is könnyen megfejthetjük. A harmonikus rezgés periodikus mozgás, jelölje T a


periódusidőt. Definíció szerint periódusidővel később a kitérések egyenlők, tehát

A sin  t  0   A sin    t  T   0 

Ekkor nyilván igaz, hogy az argumentumok különbsége 2π, hiszen az időben és fázisban
legközelebbi olyan pontot keressük, amikor a kitérések megegyeznek, tehát

2
t  2    t  T  ; ahonnan 2  T ; tehát   ;
T

Az ω kvantitatív értelmezését tehát megadtuk. A mennyiség neve körfrekvencia, dimenziója


1 radián 1 1
pedig    . Ha felhasználjuk a frekvencia szokásos f  definícióját, akkor
s s T
adódik a frekvencia és körfrekvencia közötti szokásos összefüggés:   2f . Számításainkból
mellékeredményként adódik a körfrekvencia függése a tömegtől és a rugóállandótól. Mivel
D D 1 D
2  ezért kapjuk az   , vagy áttérve a frekvenciára az f  összefüggést.
m m 2 m

2.2.6.2. Csillapított harmonikus oszcillátor


A 2.2.2. példában felállítottuk a csillapított harmonikus rezgés differenciálegyenletét. Ez
kiegészítve a szokásos kezdeti feltételekkel a következő Cauchy-féle feladatot jelenti

y " 2y ' 2 y  0;


y (0)  0;
y '  0   v0 ;

D k
ahol alkalmaztuk az 2  , 2  jelöléseket. A D rugóállandó a rugó erősségére jellemző, a k
m m
konstans pedig a csillapítás erősségét méri. A felírt kezdeti érték probléma egy másodrendű,
állandó együtthatójú, homogén lineáris differenciálegyenletre vonatkozó Cauchy-feladat.
Megoldásához elő kell állítani a karakterisztikus egyenlet megoldásait. A karakterisztikus
egyenlet a következő

2  2  2  0 .

Ennek megoldásait a diszkrimináns előjelének függvényében három különböző esetben kell


előállítanunk. (A diszkriminánsra itt nem használjuk a D jelet, hogy ne tévesszük össze a
rugóállandóval.)

269
Óbudai Egyetem BGK Fejezetek a matematikából

a) A diszkrimináns pozitív, azaz 42  4 2  0 , tehát 2   2  0, 2   2 . A csillapítás


k2 D
eszerint meghalad egy bizonyos küszöbértéket, 2
 vagyis k  2 mD . Ekkor a
4m m
karakterisztikus egyenletnek két különböző valós gyöke van. Ezek a gyökök a következők

2  2 2  2
1,2     2  2
2

Felírhatjuk tehát az egyenlet általános megoldását

  2 2  t   2 2  t


   
y  t   C1e 1 t
 C2e 2 t
 C1e  
 C2e  
; C1 , C2  R

A konstansokat ismét a kezdeti feltételekből kapjuk.

y  0   C1e0  C2e0  C1  C2  0;
y '  t   C11e1 t  C2 2e 2 t miatt
y '  0   C11e0  C2 2e0  C11  C2 2  v0

Ennek az egyenletrendszernek a megoldása a következő

v0 v0
C2  C1; C11  C1 2  v0 ; C1  ; C2  
1   2 1   2

Tehát a kezdeti feltételeket kielégítő partikuláris megoldás az alábbi függvény

y t  
v0
1   2

e1 t  e2 t 
Ha itt figyelembe vesszük a gyökök konkrét alakját, akkor a következő módon írható a megoldás

 2 2 t   2 2 t


   
v0    2 2 t   2 2 t
   v0  
 e 
t e
y t    e 
e    e .
2  
2   
2
 2  2 2

Az utolsó törtben felismerhetjük a szinusz hiperbolikusz függvényt. A megoldás végső alakja így

y t  
 2
v0
2
et sh  
2  2  t

270
Óbudai Egyetem BGK Fejezetek a matematikából

Elemezzük a kapott megoldást. Mivel az exponenciális függvény mindenütt pozitív, a


hiperbolikus függvény pedig pozitív t időpontok esetén pozitív, adódik, hogy a kitérés minden t
időpontban pozitív. A mozgás tehát nem periodikus, a kezdeti sebességnek köszönhetően a
kitérés egy darabig növekszik, majd t → ∞ esetén tart a zérushoz, de negatív sosem lesz. Ez tehát
egy aperiodikus mozgás. Így működik például egy ideális lengéscsillapító.

A 2.2.7. ábrán látható a csillapított rezgőmozgás differenciálegyenletének megoldása


y  0   0; y '  0   3 kezdeti feltételek mellett abban az esetben, amikor ω = 2 és β = 3, amikor
tehát ω < β, tehát viszonylag erős a csillapítás.

2.2.7. Ábra. A csillapított harmonikus rezgés differenciálegyenletének megoldása


ω = 2,β = 3tehát ω < β esetén, y  0  0; y '  0  3 kezdeti feltételekkel

b) Tegyük fel, hogy a diszkrimináns zérus, azaz 42  4 2  0 , tehát 2   2  0, 2   2 . A


k2 D
csillapítás eszerint éppen egy bizonyos küszöbértékkel egyenlő, 2
 vagyis k  2 mD .
4m m
Ekkor a karakterisztikus egyenletnek két egybeeső valós gyöke van. Ez a kétszeres valós gyök a
következő

2  0
1,2   
2

Ekkor a 2.2.5. pont szerint az egyenlet általános megoldása a következő

y  t   C1e t  C2te t   C1  C2t  e t  C1  C2t  e t ; C1 , C2  R

Ha a kezdeti feltételeket figyelembe vesszük, adódnak a következő összefüggések

271
Óbudai Egyetem BGK Fejezetek a matematikából

y  0   C1e0  C2 0e0  C1  0;


y '  t   C2te t   C e
2
t
 C2t e t ; miatt

y '  0   C2e0  C2 0e0  C2  v0

Innen a Cauchy-feladat megoldása az alábbi függvény.

y  t   v0te t

Ez a megoldás sem periodikus, a kitérés minden pozitív t-re pozitív és t → ∞ esetén tart a
zérushoz. Ezt a speciális esetet nevezzük aperiodikus határesetnek.

A 2.2.8. ábra egy aperiodikus határesetnek megfelelő megoldást ábrázol y  0   0; y '  0   3


kezdeti feltételek mellett abban az esetben, amikor ω = β = 2. Az ábrát összevetve a 2.2.10.
ábrával, azt mondhatjuk, hogy lényeges különbség nincs a két aperiodikus mozgás lefolyása
között.

2.2.8. Ábra. A csillapított harmonikus rezgés differenciálegyenletének megoldása az aperiodikus határesetben,


amikor ω = β = 2, y  0  0; y '  0   3 kezdeti feltételekkel

c) Tegyük fel végül, hogy a diszkrimináns negatív, azaz 42  4 2  0 , tehát


2
k D

2   2  0, 2   2 . A csillapítás eszerint nem ér el egy bizonyos küszöbértéket,
2
4m m
vagyis k  2 mD . Ekkor a karakterisztikus egyenletnek két különböző komplex gyöke van.
Ezek a gyökök a következők

272
Óbudai Egyetem BGK Fejezetek a matematikából

2  2i 2  2
1,2     i 2  2
2

Ekkor a 2.2.5. pont szerint az általános megoldás a következő


y  t   et C1 cos  
2  2 t  C2 sin  
2  2 t ; C1 , C2  R

Vegyük most tekintetbe a kezdeti feltételeket

y  0   e0  C1 cos 0  C2 sin 0   C1  0;

y '  t   et C2 sin  


2  2 t  e t  2  2 C2 cos   
2  2 t ; ahonnan

y '  0   e0C2 sin 0  e0  


2  2 C2 cos 0  C2 2  2  v0 ; azaz C2 
v0
2  2

A Cauchy-feladat megoldása eszerint

y  t   et
v0
 
2 2
sin  2  2 t
A megoldás tehát egy szigorúan monoton csökkenő exponenciális függvény és egy periodikus
függvény szorzata. Ha összehasonlítjuk ezt a megoldásfüggvényt a harmonikus rezgés kitérés-idő
függvényével, akkor kvalitatíve azt mondhatjuk, hogy a rezgés, amelyet a periodikus tényező ír
le, exponenciálisan csökkenő amplitúdójú csillapított rezgés.

2.2.9. Ábra. A csillapított harmonikus rezgés kitérés-idő függvénye relatíve gyenge csillapítás mellett,
ω = 2,β = 0,15 konstansok esetén, y  0  0; y '  0   3 kezdeti feltételekkel

273
Óbudai Egyetem BGK Fejezetek a matematikából

A 2.2.9. ábrán látható függvény a csillapított rezgőmozgás egyenletének megoldása


y  0   0; y '  0   3 kezdeti feltételek mellett abban az esetben, amikor ω = 2 és β = 0,15, amikor
tehát ω > β, tehát viszonylag gyenge a csillapítás.
v0
Az amplitúdó függvény az A  t   et formulával adható meg. Ha csak a periodikus
2  2
tényezőt hasonlítjuk össze a harmonikus rezgés kitérés-idő függvényével, akkor azt látjuk, hogy a
csillapított esetben a körfrekvencia, tehát a 2  2 mennyiség kisebb, mint a harmonikus
esetben, 2  2   , tehát egy kisebb frekvenciájú, azaz a csillapítatlan esethez képest egy
2
nagyobb periódusidejű rezgőmozgás adódik. A periódusidő a T  formulával, a
2  2
2  2
frekvencia pedig az f  formulával számítható. Ha most tetszőleges t időponthoz
2
hozzáadjuk a T periódusidőt, és számítjuk a kitérések ezen időpontokban, majd tekintjük ezek
arányát, akkor a következő adódik

y t  T  e

 t T 
sin    t  T   e
2 2
T

k
 T

sin       t
e m
y t  et 2 2

A kapott hányados konstans, független az időtől, ami azt jelenti, hogy bármely t időpont esetén,
majd T idővel később mérve a kitéréseket, a későbbi és korábbi kitérés hányadosa állandó. Ezt az
állandót, amely a számítások szerint eT -vel egyenlő, csillapítási hányadosnak nevezzük. Ezt
az eredményt úgy is fogalmazhatjuk, hogy a kitérések, T-időtartamonként, csökkenő mértani sor
szerint követik egymást.
Tovább vizsgálva a kapott partikuláris megoldást, mivel a szinusz függvény korlátos, az
exponenciális függvény pedig zérushoz tart ha t → ∞, ezért a kitérés-idő függvény t → ∞ esetén
ugyancsak tart a zérus kitéréshez, amint az a 2.2.12. ábrán is jól látható.

2.2.6.3. Gerjesztett és csillapított harmonikus oszcillátor


A 2.2.3. példában felállítottuk a gerjesztett és csillapított rezgés differenciálegyenletét. Ebben az
esetben általános megoldást keresünk, azaz keressük az

y " 2y ' 2 y  f0 sin t;

differenciálegyenlet általános megoldását. Ez egy másodrendű, állandó együtthatójú, inhomogén


lineáris differenciálegyenlet. Ennek általános megoldásához egyrészt meg kell határozni a
megfelelő homogén lineáris differenciálegyenlet általános megoldását, másrészt pedig elő kell
állítani az inhomogén egyenlet egy partikuláris megoldását. A homogén egyenlet általános
megoldását éppen az előző 2.2.6.2. pontban állítottuk elő. Így mindössze annyi a feladatunk,

274
Óbudai Egyetem BGK Fejezetek a matematikából

hogy az inhomogén egyenlet egy partikuláris megoldását előállítjuk. Ehhez a 2.2.5.2. pontban
tárgyalt próbafüggvény módszerét alkalmazzuk. Eszerint a partikuláris megoldást kereshetjük a
következő alakban

yip  t   A sin t  B cos t

Az ismeretlen A és B együtthatók meghatározásához szükség van a próbafüggvény első és


második deriváltjára. Átmenetileg egyszerűsítve a jelöléseket írhatjuk, hogy

y '  A cos t  B sin t; y "   A2 sin t  B2 cos t;

Ezeket a deriváltakat helyettesítjük az egyenletbe

y " 2y ' 2 y 


 
  A2 sin t  B2 cos t  2  A cos t  B sin t   2  A sin t  B cos t   f 0 sin t ;

Ha rendezzük a kapott egyenletet a trigonometrikus függvények szerint, adódik, hogy

 A     B2 sin t   A2  B     cos t  f sin t  0  cos t


2 2 2 2
0

Az együttható összehasonlítás módszerét alkalmazva kapunk egy lineáris egyenletrendszert az


ismeretlen A és B együtthatókra

 
 A 2  2  B 2  f 0


 A2  B     0
2 2
 
Ennek az egyenletrendszernek a megoldása a következő

2  2 2
A  f0 ; B   f0
   
2 2
2
 2  422 2
 2  422

Tehát az inhomogén egyenlet egy partikuláris megoldása a következő

2  2 2
yip  t   f 0 sin t  f 0 cos t ;
   
2 2
2  2  422 2  2  422

Ismét alkalmazzuk azt a fogást, amit a harmonikus rezgések esetén már bemutattunk. A
trigonometrikus függvények együtthatóit úgy alakítjuk, hogy négyzetösszegük 1 legyen.

275
Óbudai Egyetem BGK Fejezetek a matematikából

 
f0  2  2 2 
yip  t    sin t  cos t  ;
 
2 2
 2 2
  
2 2  2
    4 
2 2
  4  2 2
2   2  42 2 
 

Ha most bevezetjük a φ0 állandót a

2  2 2
 cos 0 ;  sin 0 ;
   
2 2
2
 2
 4  2 2 2
 2
 4 
2 2

2
definícióval, ahol tehát tg 0  , akkor egy addíciós tétel felhasználásával azt kapjuk,
  2
2

hogy
f0
yip  t    cos 0 sin t  sin 0 cos t 
 
2
2
 2
 4  2 2

tehát a partikuláris megoldás az egyszerűbb

f0
yip  t   sin  t  0  ;
 
2
2
 2
 4  2 2

alakban írható. Erről a megoldásról a következőt mondhatjuk. A partikuláris megoldás egy Ω


körfrekvenciájú harmonikus rezgőmozgás. Ez azt jelenti, hogy a rezgő tömegpont felveszi a
kényszerítő erő Ω körfrekvenciáját, de nincs azonos fázisban a gerjesztéssel, hanem azt φ0
fáziskéséssel követi. A létrejövő rezgés amplitúdóját az

f0
A=
 
2
2
 2  422

formulával adhatjuk meg, a fáziskésést pedig a

 2 
0  arctg  2 2 
   

képlettel számíthatjuk. Ha ezek után felírjuk a gerjesztett rezgés differenciálegyenletének


általános megoldását, akkor a gyakorlat szempontjából legfontosabb 2.2.6.2. c) esetnek megfelelő
esetben az általános megoldás a következő

276
Óbudai Egyetem BGK Fejezetek a matematikából


yhá  t   et C1 cos  
2  2 t  C2 sin  
2  2 t 
f0
sin  t  0  ;
 
2
2
 2
 4 
2 2

A homogén egyenlet megoldásáról az idézett pontban megmutattuk, hogy a végtelenben zérushoz


tart, ami azt jelenti, hogy az általános megoldás azon része, amely a homogén egyenletet elégíti
ki, tehát az első tag, t → ∞ esetén eltűnik, ezt nevezzük tranziens jelenségnek, és megmarad az
inhomogén egyenlet partikuláris megoldása amely egy egzakt harmonikus rezgőmozgás.
A mondottakat illusztrálja a 2.2.10. ábra. Mind az a) mind a b) ábrán egy gerjesztett rezgés
kitérés-idő függvénye látható a már többször alkalmazott y  0   0; y '  0   3 kezdeti feltételek
mellett ω = 2, Ω = 2,5, f0 = 5 konstansok esetén. A két ábra között a különbség annyi, hogy az a)
ábrán a csillapításra jellemző adat β = 0,15, a b) ábrán pedig β = 0,75. Az a) esetben tehát
gyengébb csillapítást alkalmaztunk. Összehasonlítva a két kitérés-idő függvényt, az a legjobban
szembetűnő különbség, hogy gyenge csillapítás esetén a tranziens jelenség nagyjából t = 25-30s
elteltével tűnik el, erős csillapítás esetén pedig már t = 5-10s időintervallumon belül eltűnik az
exponenciálisan csökkenő része a megoldásnak. Ezen tranziensek "lecsengése" után egy egzakt
szinusz függvény marad kitérés-idő függvényként Ω körfrekvenciával.

a) "gyenge" csillapítás: β = 0,15 b) "erős" csillapítás: β = 0,75

2.2.10. Ábra. A gerjesztett és csillapított harmonikus rezgés kitérés-idő függvénye különböző csillapítások mellett,
ω = 2,Ω = 2,5, f0 = 5 konstansok esetén, y  0  0; y '  0   3 kezdeti feltételekkel

A témakör lezárásaképpen vizsgáljuk meg a tranziens jelenségek eltűnése után megmaradó


harmonikus rezgés amplitúdóját. Számításaink szerint az amplitúdót az alábbi formula
szolgáltatja

277
Óbudai Egyetem BGK Fejezetek a matematikából

f0
A0  A0    
 
2
2
 2  422

amely amplitúdót az Ω körfrekvencia függvényének tekintünk. Annak érdekében, hogy a


gerjesztés Ω körfrekvenciáját megkülönböztessük a harmonikus rezgés ω körfrekvenciájától, ez
utóbbit a rezgés sajátfrekvenciájának nevezünk. Azt a kérdést tesszük fel, hogy hogyan függ az
A0 amplitúdó a gerjesztési frekvenciától. Keressük ennek maximumát adott ω sajátfrekvencia és β
csillapítás esetén. Az egyszerűség kedvéért úgy tekintjük, hogy az A0 amplitúdó az Ω2 változónak
a függvénye, mert ebben az esetben egyszerűbb meghatározni az amplitúdó függvény
szélsőértékét. Ez utóbbi érdekében előállítjuk a kérdéses függvény deriváltját az Ω2 változó
szerint és keressük ennem zérus helyét

dA0
 f0

 2  2  22  0
d 2  
3

 
2

2
 2  422 
 
Ennek az egyenletnek a megoldása

2  2  22  0; azaz 2  2  22 ; tehát   2  22

Adott csillapítás és sajátfrekvencia esetén a gerjesztett rezgés amplitúdója eszerint akkor


maximális, ha a gerjesztési frekvenciára teljesül, hogy   2  22 . Tehát, a félreértések
eloszlatása végett, a csillapított esetben a maximális amplitúdójú rezgést létrehozó gerjesztési
frekvencia nem egyezik meg a sajátfrekvenciával, csak annak a közelében van. Ez a frekvencia a
rezonanciafrekvencia. Ezen belül, abban a speciális esetben, amikor a rezgő rendszer nincs
csillapítva, azaz β = 0, azt kapjuk, hogy az amplitúdó az

f0 f0
A0  A0     
  2  2
2
2
 2

formula által adott módon függ a gerjesztés frekvenciájától. Ebben az esetben, a fenti számítások
eredményének ismerete nélkül is azonnal látható, hogy az amplitúdó Ω → ω esetén nem korlátos,
azaz A0 → ∞, a maximális kitérés tehát nem korlátos. Ezt az esetet nevezzük rezonancia
katasztrófának. A csillapított esettel ellentétben tehát a csillapítatlan esetben, rezonancia akkor
adódik, ha a gerjesztési frekvencia pontosan megegyezik a sajátfrekvenciával. A 2.2.11. ábrán az
amplitúdó gerjesztési frekvenciától való függését ábrázoltuk különböző β csillapítások esetén.

278
Óbudai Egyetem BGK Fejezetek a matematikából

2.2.11. Ábra. A gerjesztett harmonikus rezgés amplitúdójának függése a gerjesztési frekvenciától, ω = 20 és


különböző csillapítások esetén. A görbék mentén fentről lefelé haladva a β értéke rendre 0,02; 0,03; 0,05; 0,07; 0,09.

279
Óbudai Egyetem BGK Fejezetek a matematikából

280
Óbudai Egyetem BGK Fejezetek a matematikából

2.3. Elsőrendű lineáris


differenciálegyenlet rendszerek
2.3.1. Bevezető példák
Bevezetőként lássunk példákat olyan fizikai problémákra, amelyek leírása olyan differenciál-
egyenletekkel történik, amelyekben több ismeretlen függvény szerepel, és ezek az egyenletek
nem függetlenek egymástól.

2.3.1.Példa: Elsőként vizsgáljuk két induktív módon csatolt rezgőkört. Az egyik rezgőkörben
legyen egy periodikusan változó U(t) = U0sinωt elektromotoros erő, egy R1 ohmikus ellenállás és
egy L1 önindukciós együtthatójú tekercs. Ez a tekercs induktív módon csatolva van egy L2
önindukciós együtthatójú tekercshez, amely egy olyan áramkörben van, amelyben nincs
áramforrás és amelynek eredő ohmikus ellenállása R2. Legyen a két tekercs együttesének
kölcsönös indukciós együtthatója L12. Kérdés, hogy az első és második áramkörben folyó
áramerősségek hogyan változnak az idő függvényében, tehát meghatározandók az I1(t) és I2(t)
függvények.

Az áramerősségek meghatározására a huroktörvényt tudjuk alkalmazni, amely a két áramkörre


rendre a következő összefüggéseket adja

 dI  t  dI  t 
 I1  t  R1  1 L1  2 L12  U 0 sin t ;
 dt dt

 I t R  dI 2  t  L  dI1  t  L  0;
 2  2

2 12
dt dt

Világos, hogy az L12 kölcsönös indukciós együttható miatt a két egyenlet nem független
egymástól, az I1(t) áramerősség pillanatnyi értéke függ az I2(t) függvény deriváltjának pillanatnyi
értékétől és fordítva. Amit kaptunk, az tehát egy differenciálegyenlet rendszer. Mivel az
ismeretlen függvényeknek csak első deriváltjai vannak az egyenletekben ez egy elsőrendű
differenciálegyenlet rendszer.

2.3.2.Példa: Következőként vizsgáljunk egy mechanikai problémát, a csatolt rezgések


problémáját. Tekintsünk két fonálingát, amelyek egy kényszerrel egymáshoz vannak kapcsolva
(2.3.1. ábra).

Ha y1(t)és y2(t) jelöli az egyes m tömegű tömegpontok kitérését, akkor a dinamika


alaptörvényének felhasználásával, tekintettel arra, hogy mindkét fonálinga kitérése függ a másik
fonálinga kitérésétől, hiszen a kitérések meghatározzák a fellépő erőhatásokat, ezáltal a
gyorsulásokat, feltéve továbbá, hogy kis kitérések esetén az erők arányosak a kitéréssel, az alábbi
mozgásegyenleteket írhatjuk fel a két tömegpontra vonatkozólag

281
Óbudai Egyetem BGK Fejezetek a matematikából

 ma1   Dy1  k  y2  y1  ;


ma2   Dy2  k  y2  y1  ;

m m

y1 y2
2.3.1. ábra. Csatolt mechanikai rezgések

Ha felhasználjuk, hogy a gyorsulás a hely-idő függvény második deriváltja, valamint bevezetünk


egyszerűsítő jelöléseket, akkor az alábbi differenciálegyenleteket kapjuk az y1(t) és y2(t) kitérés-
idő függvények meghatározására.

 
 y1"  t    2   2 y1  t    2 y2  t  ;

 " 2 2
 2

 y2  t    y1  t      y2  t  ;

D 2 k
ahol alkalmaztuk az 2  ,   jelöléseket. Ez a két differenciálegyenlet sem független
m m
egymástól, az y1(t) és y2(t) függvények pillanatnyi értékek kölcsönösen befolyásolják egymást.
Tehát a két egyenlet egy differenciálegyenlet rendszert képez. Mivel az ismeretlen függvények
második deriváltja szerepel ezekben az egyenletekben, ez egy másodrendű differenciálegyenlet
rendszer.

Ebben a fejezetben a 2.3.1. és 2.3.2. példákban említett és ezekhez hasonló matematikai


problémák megoldásával foglalkozunk. Mint az a bevezető két példából kiderül,
differenciálegyenlet rendszerek megoldásával foglalkozunk. Némileg speciálisabb alakú
rendszerekkel mint a bevezető két példa rendszere, de megmutatjuk majd, hogy az említett két
példa visszavezethető a következőkben vizsgált típusra.

282
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.2. Elsőrendű lineáris differenciálegyenlet rendszer fogalma


Ebben a pontban általánosan definiáljuk a differenciálegyenlet rendszer fogalmát. A megoldási
módszerek és igazolt illetve csak megfogalmazott tételek körét tekintve korlátozódunk az
elsőrendű lineáris rendszer vizsgálatára. Azonban ez nem jelent olyan mértékű megszorítást, mint
ahogyan első olvasatra tűnik. A 2.2. fejezetben másodrendű lineáris differenciálegyenletek
vizsgálatával foglakoztunk. Ebben a fejezetben kiderül, hogy a magasabb rendű lineáris
differenciálegyenletek visszavezethetők elsőrendű rendszerekre, így a rendszerek megoldási
módszereinek és elméletének birtokában már megoldhatunk harmad, negyed, stb. n-ed rendű
lineáris differenciálegyenleteket is. A kifejtett elmélet jelentős mértékben támaszkodik az 1.
fejezetben tárgyalt lineáris algebrai ismeretekre, különös tekintettel a sajátértékek és
sajátvektorok elméletére.

2.3.1.Definíció: Legyen adott egy I = ]a, b[ nyitott intervallum, továbbá tegyük fel, hogy az
aij : I  R; t aij  t  és a gi : I  R; t gi  t  (i, j = 1, 2, 3, …, n) függvények mind
folytonosak az I intervallumon. Ezen feltételekkel az xi(t), i = 1, 2, …, n ismeretlen függvényekre
vonatkozó

x '1  a11  t  x1  a12  t  x2  ...  a1n  t  xn  g1  t 


x '2  a21  t  x1  a22  t  x2  ...  a2 n  t  xn  g 2  t 
...
x 'n  an1  t  x1  an 2  t  x2  ...  ann  t  xn  g n  t 

egyenletrendszert normál alakú, elsőrendű lineáris differenciálegyenlet rendszernek


nevezzük (mostantól: d.e.r.). A felírásnál alkalmaztuk a szokásos xi= xi(t) egyszerűsítő jelölést.

Már a bevezetőben említettük, hogy a lineáris algebra és a mátrixelmélet fogalmait fogjuk


használni a megoldás és a vizsgálatok során. Célszerű ezért jelölésekben is áttérni a
mátrixelmélet jelölésmódjára. Látni fogjuk, hogy ezzel jelentős mennyiségű helyet és energiát
takarítunk meg, mert sokkal egyszerűbbé válnak a jelölések és a definíciók valamint a tételek is, a
bizonyításokkal együtt.

2.3.2.Definíció: Vezessük be az előző definícióban szereplő d.e.r. függvényeinek összefoglaló


jelölésére a következőket

 a11  t  a12  t  ... a1n  t    g1  t    x1  t  


     
 a21  t  a22  t  ... a2 n  t    g2 t   x2  t  
A t   ; g t   ; x t   ;
 ... ... ...     
     
 an1  t  an 2  t  ... ann  t    g n  t    xn  t  

ahol az A(t) négyzetes mátrix az együtthatómátrix, ami ugyancsak az I intervallumon értelmezett


mátrix értékű függvény, a g(t) vektor-skalár függvény szintén az I intervallumon van értelmezve.
Az x(t) vektor-skalár függvény pedig az ismeretlen függvényeket tartalmazó vektor.

283
Óbudai Egyetem BGK Fejezetek a matematikából

Ha a szokásos módon megállapodunk abban, hogy egy vektorfüggvény deriváltja értelmezés


szerint a koordinátafüggvényeinek deriválását jelenti, és figyelembe vesszük a bevezetett
jelöléseket, valamint felidézzük a mátrixok szorzásának definícióját, akkor az előző definícióban
szereplő d.e.r. az alábbi módon is értelmezhető.

2.3.3.Definíció: Normál alakú elsőrendű lineáris differenciálegyenlet rendszernek nevezzük az

x ' t   A t  x t   g t 

egyenletet. A rendszert homogén lineárisnak nevezzük, ha az I intervallumon a g(t) vektor-


skalár függvény azonosan nulla, tehát ha g(t) ≡ 0. Ellenkező esetben a rendszer inhomogén
lineáris.

A rendszert azért nevezzük normál alakúnak, mert minden egyenlet rendezve van az egyik
ismeretlen függvény deriváltjára, és ennek együtthatója minden egyenletben 1. A továbbiakban, a
lineáris egyenletek mintájára külön vizsgáljuk majd először a homogén, azután az inhomogén
rendszer megoldhatóságát. A megoldások esetében különbséget teszünk általános és partikuláris
megoldás között a megszokott értelemben. Ezeket pontosan megfogalmazzuk, de az világos,
hogy a partikuláris megoldás előállításához szükség van kezdeti feltételre. Tisztázzuk, hogy
ebben az esetben mit értünk kezdeti érték problémán.

2.3.4.Definíció: Az x '  t   A  t  x  t   g  t  d.e.r-re vonatkozó kezdeti érték problémán a


következőt értjük. A rendszerhez kapcsolunk kezdeti feltételeket, pontosabban, ha a vektoriális
írásmódot alkalmazzuk, akkor egy kezdeti feltételt. Előírjuk, hogy az x(t) vektor skalár függvény
az I intervallum valamely t0 pontjában áthaladjon az Rn tér egy x0 pontján. Azaz kezdeti
feltételként az x(t0) = x0 egyenlőség teljesülését írjuk elő. Ezzel a kezdeti érték probléma a
következő módon van értelmezve

x '  t   A  t  x  t   g  t 



 x  t0   x 0

Nyilvánvalóan merül fel a kérdés, hogy milyen feltételek esetén létezik megoldás. Ezt tisztázza
az alapvető fontosságú, bizonyítás nélkül megfogalmazott alábbi tétel.

2.3.1.Tétel: (Egzisztencia és unicitás)


Tegyük fel, hogy az aij : I  R; t aij  t  és a gi : I  R; t gi  t  (i, j = 1, 2, 3, …, n)
függvények folytonosak az I = ]a, b[ intervallumon. Legyen továbbá t0  a, b és x0  R n
tetszőleges. Ekkor az

x '  t   A  t  x  t   g  t 



 x  t0   x 0

284
Óbudai Egyetem BGK Fejezetek a matematikából

kezdeti érték problémának egyértelműen létezikx(t) megoldása, és ez a megoldás a teljes I


intervallumon értelmezve van.
Bizonyítás: A tételt nem bizonyítjuk, de az alkalmazások szempontjából betöltött fontos szerepe
miatt meg kellett fogalmaznunk. Az érdeklődő olvasónak a szakirodalmat ajánljuk. ■

A továbbiakban azt vizsgáljuk általánosan, milyen a szerkezete az x '  t   A  t  x  t   g  t 


lineáris rendszer megoldásainak. Elsőként a homogén, azután az inhomogén rendszer általános
vizsgálatát végezzük el.

Mielőtt belekezdünk az elmélet kifejtésébe, két példán keresztül megmutatjuk, hogy a vizsgált
típusú, tehát elsőrendű, normál alakú rendszer nem annyira erős megszorítás, mint az esetleg
gondolható. Ennek érdekében megmutatjuk, hogy a 2.3.1 és 2.3.2. példákban felállított
rendszerek átalakíthatók elsőrendű normál alakú rendszerré.

2.3.3.Példa: Az induktív módon csatolt rezgőkörökre a 2.3.1. példában felírt d.e.r. elsőrendű de
nem normál alakú. A két egyenlet rendezésével azonban elérhető, hogy az normál alakúvá váljon.
Ehhez nem kell mást tenni, mint az I1(t) és I2(t) függvények deriváltjára meg kell oldani a felírt
rendszert. Ez egy egyszerű algebrai feladat. Az említett deriváltakat ismeretlennek tekintve, a
felírt rendszer lineáris, melynek megoldása a következő

 dI1  t  R1L2 R2 L12 U 0 L2


2 1 
  I t  I2 t   sin t ;
 dt L1L2  L12 L1L2  L12
2
L1L2  L12
2


 dI 2  t   R1L12 I t  R2 L1 I t  U 0 L12 sin t ;
 dt 2 1  2 
 L1L2  L12 L1L2  L12
2
L1L2  L12
2

Ez pedig valóban egy elsőrendű, normál alakú, inhomogén lineáris d.e.r.

2.3.4.Példa: A 2.3.2. példában a csatolt rezgésekre felállított d.e.r. nem elsőrendű, hanem
másodrendű rendszer. Azonban egy általános módszer segítségével, amelyet később a magasabb
rendű egyenletek megoldása kapcsán fogunk alkalmazni, a rendszert át lehet alakítani elsőrendű
rendszerré. Ennek természetesen van ára, mégpedig az, hogy az ismeretlen függvények száma
megszaporodik, kettőről négyre növekszik.
Vezessünk be új ismeretlen függvényeket a következő definícióval. Legyen x1 = y1 és legyen
x2 = x1’. Ekkor természetesen x2’ = y1”. Hasonlóan legyen x3 = y2 és legyen x4 = x3’. Ekkor
természetesen x4’ = y2”. Ezzel a négy ismeretlen függvénnyel a 2.3.2. példában felírt rendszer a
következő, négy egyenletből álló ekvivalens alakra hozható

 x1 '  t   x2  t  ;

 2

 x2 '  t       x1  t    x3  t  ;
2 2


 x3 '  t   x4  t  ;

 4   1  
 x ' t   2 x t  2   2 x t ;
 3 

285
Óbudai Egyetem BGK Fejezetek a matematikából

ha alkalmazzuk a bevezetett mátrix jelöléseket is, akkor a differenciálegyenlet a sokkal


áttekinthetőbb

 0 1 0 0
 x1 '  t      x1  t  
 
   2   2
 x2 '  t    
 0 2 0  x  t 
 ;
2
 x3 '  t    0 0 0 1  x3  t  

    
 x4 '  t   

2 
0  2   2  0   x4  t  

alakban írható, amely már jól láthatóan egy elsőrendű, normál alakú, állandó együtthatójú
homogén lineáris differenciálegyenlet rendszer.

286
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.3. Elsőrendű homogén lineáris differenciálegyenlet rendszer


Foglalkozzunk tehát az

x ' t   A t  x t 

rendszer megoldásának általános vizsgálatával. A megoldások szerkezetének tanulmányozásához


szükség van a Wronski-determináns fogalmára, amelyet a 2.2 pontban a másodrendű lineáris
egyenletek témakörén belül már értelmeztünk. (A két fejezet között sok más hasonlóság is van.
Javasoljuk a Tisztelt Olvasónak, hogy hasonlítsa össze az ismertetett tételeket a 2.2. és 2.3.
fejezetekben, nagyon sok rokonságot talál majd a két elmélet között.)

2.3.5.Definíció: Az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár függvényeket az


I intervallumon lineárisan függetleneknek nevezzük, ha az

1x1  t   2 x2  t   ...  n xn  t   0

az I intervallum minden pontjában csak akkor állhat fenn, ha


1  2  ...  n  0; (i  R, i  1, 2,..., n) . A függvényrendszer lineárisan összefüggő, ha nem
független, azaz létezik legalább egy olyan αk együttható, amely zérustól különbözik, de a fenti
egyenlőség fennáll az I intervallum minden pontjában.

2.3.6.Definíció: Az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár függvények


Wronski-determinánsának nevezzük a következő n-ed rendű determinánst

x11  t  x21  t  ... xn1  t 


x12  t  x22  t  ... xn 2  t 
W  x1  t  , x 2  t  ,..., x n  t   
... ... ...
x1n  t  x2 n  t  ... xnn  t 

A Wronski-determinánst tehát a következő módon kapjuk: az xi(t) vektor-skalár függvényekből


úgy képezünk egy determinánst, hogy annak i-edik oszlopába írjuk az xi(t) vektorfüggvény
koordinátafüggvényeit. A definícióban alkalmazott jelölésben tehát xij(t) nem más, mint az xi(t)
vektor függvény j-edik koordináta függvénye.

Szoros kapcsolat van a vektor-skalár függvények lineáris függetlensége és a Wronski-


determináns értéke között. Ezt a kapcsolatot tisztázzák az alábbi tételek.

2.3.2.Tétel: Ha az x1(t), x2(t), … xn(t) vektor-skalár függvények lineárisan összefüggők az I


intervallumon, akkor Wronski-determinánsuk azonosan nulla I-n.

287
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: A függetlenség és összefüggőség definíciója szerint létezik egy olyan αk együttható,


amely zérustól különbözik és az I intervallumon azonosan teljesül, hogy

1x1  t   2 x2  t   ...  n xn  t   0; t  I

Vegyük észre, hogy ez egy algebrai, homogén lineáris egyenletrendszer az α1, α2, …, αn
ismeretlenekre, mely rendszerben az együtthatók az x1(t), x2(t), … xn(t) vektor-skalár függvények
koordinátafüggvényei, tehát a rendszer együtthatómátrixa éppen a W  x1  t  , x2  t  ,..., xn  t  
Wronski-determináns. A feltevés szerint a rendszernek minden t-re van nemtriviális megoldása,
hiszen αk ≠ 0. Ez pedig csakis akkor lehetséges, ha a rendszer determinánsa az I intervallum
minden pontjában zérus. ■

A mondottakat illusztráljuk egy példával.

2.3.5.Példa: Nevezetes azonosságok alapján tudjuk, hogy az

 et   e  t   sh t 
 t   t 
x1  t    e  ; x2  t    e  ; x3  t   ch t  ;
 2   2   0,5 
sin t  cos t 

1 1
függvények lineárisan összefüggenek, ugyanis nyilván igaz, hogyx1  t   x2  t   x3  t   0 .
2 2
Megmutatjuk, hogy a három függvény Wronski-determinánsa azonosan zérus. Valóban, egyszerű
számításokkal adódik, hogy

et et sh t et e  t sh t
W  x1  t  , x 2  t  , x3  t    e t
e t
ch t  0 2e t
ch t  sh t 
sin 2 t cos 2 t 0,5 sin 2 t cos 2 t 0,5

   
 et et  cos 2 t  ch t  sh t   sin 2 t e t  ch t  sh t   1  cos 2 t  sin 2 t  0

A tétel közvetlen megfordítása nem igaz, tehát a Wronski-determináns nulla értékéből nem
következik a függetlenség. Ezt igazolja a következő egyszerű példa.

2.3.6.Példa: Definiáljuk az x1(t), x2(t) vektor-skalár függvényeket az alábbi módon

t 3  t 2 
x1  t     ; x2  t     ; t  I  R
t 
2
t 

288
Óbudai Egyetem BGK Fejezetek a matematikából

Világos, hogy ez a két vektorfüggvény lineárisan független, hiszen 1x1  t   2 x2  t   0


vektoregyenletből következik egyrészt, hogy 1t 2  2t  0; t  I . Egy másodfokú polinom
azonban csak abban az esetben lehet egy intervallumon azonosan zérus, ha az együtthatói mind
nullák. Ezzel megmutattuk, hogy a két vektorfüggvény valóban lineárisan független. Másrészt
viszont a Wronski-determinánsa

t3 t2
W  x1  t  , x2  t     t 4  t 4  0; t  I
2
t t

valóban eltűnik az I intervallumon mindenütt.


Felmerül a kérdés, hogy milyen járulékos feltétellel lehet biztosítani azt, hogy a tétel
megfordítható legyen. Ezen járulékos feltétel tételbeli megfogalmazása előtt igazolnunk kell egy
állítást, amely szerint homogén lineáris rendszer megoldásainak tetszőleges lineáris kombinációja
is megoldás. Erről szól az alábbi állítás.

2.3.3.Tétel: Tegyük fel, hogy az x1(t), x2(t), … xn(t) függvények megoldásai az x '  t   A  t  x  t 
homogén lineáris rendszernek, és legyenek α1, α2, …, αn tetszőleges valós (vagy akár komplex)
állandók. Ekkor az

n
x  t     i xi  t 
i 1

függvény is megoldása a homogén rendszernek.


Bizonyítás: Ellenőrizni kell, hogy ez a függvény kielégíti-e az x '  t   A  t  x  t  rendszert. Mivel
az xi(t) függvények megoldásai a homogén rendszernek, a mátrixszorzás disztributivitása
valamint differenciálási szabályok szerint írhatjuk, hogy

n n
 n 
x '  t    i x 'i  t    i A  t  xi  t   A  t    i xi  t    A  t  x  t 
i 1 i 1  i 1 

Ezt kellett igazolni. ■

Ezek után megfogalmazhatjuk az előbbi tétel megfordítását.

2.3.4.Tétel: Tegyük fel, hogy az I intervallumon értelmezett x1(t), x2(t), … xn(t) vektor-skalár
függvények megoldásai az x '  t   A  t  x  t  homogén lineáris rendszernek, továbbá tegyük fel,
hogy létezik olyan t0  I , hogy

W  x1  t0  , x2  t0  ,..., xn  t0    0;

Ekkor az x1(t), x2(t), … xn(t) függvények lineárisan összefüggenek az I intervallumon.

289
Óbudai Egyetem BGK Fejezetek a matematikából

Bizonyítás: Mivel a Wronski-determináns zérus, ezért az

1x1  t0   2 x2  t0   ...  n xn  t0   0

homogén lineáris algebrai egyenletrendszernek létezik nem triviális megoldása. Legyen ez a


megoldás β1, β2, …, βn. Képezzük ezekkel a konstansokkal az

n
x  t    i xi  t 
i 1

lineáris kombinációt. Az előző tétel szerint ez a függvény megoldása a homogén rendszernek,


továbbá a feltétel miatt kielégíti az x  t0   0 kezdeti feltételt. Ilyen megoldás természetesen
létezik, az azonosan nulla függvény, tehát az x  t   0 függvény megoldása a kezdeti érték
problémának. A megoldás egyértelműsége miatt azonban ez azt jelenti, hogy a fenti lineáris
kombináció az azonosan nulla függvény, tehát

n
 i xi  t   0
i 1

Ez pedig pontosan azt jelenti, hogy az x1(t), x2(t), … xn(t) függvények lineárisan összefüggenek
az I intervallumon. ■

Az igazolt tételek nyilvánvaló következményeként megfogalmazhatunk egy tételt, amely az


x '  t   A  t  x  t  homogén lineáris rendszer megoldásainak a függetlenségét jellemzi.

2.3.5.Tétel: Az x '  t   A  t  x  t  homogén lineáris rendszer x1(t), x2(t), … xn(t) megoldásai akkor
és csak akkor lineárisan függetlenek, ha létezik olyan t0  I , amelyre teljesül, hogy

W  x1  t0  , x2  t0  ,..., xn  t0    0

Bizonyítás: Az előző tételek nyilvánvaló következménye. ■

A bizonyított tételek birtokában már előállíthatjuk a homogén lineáris rendszer általános


megoldását. Ezt alapozza meg a következő értelmezés.

2.3.7.Definíció: Az x '  t   A  t  x  t  homogén lineáris rendszer x1(t), x2(t), … xn(t)


megoldásainak halmazát alaprendszernek nevezzük az I intervallumon, ha az x1(t), x2(t), … xn(t)
függvények az I intervallumon lineárisan függetlenek.

Az első kérdés, ami felmerül, hogy létezik-e egyáltalán alaprendszer. A válasz pozitív.

290
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.6.Tétel: Az x '  t   A  t  x  t  homogén lineáris rendszernek létezik végtelen sok


alaprendszere.
Bizonyítás: Legyen B  R nn egy tetszőleges reguláris mátrix, amelyre tehát teljesül, hogy
det(B) ≠ 0. Nyilván végtelen sok ilyen mátrix létezik. Legyen továbbá szokás szerint t0  I
tetszőleges. Határozzuk meg a homogén rendszernek azokat a megoldásait, amelyek rendre
kielégítik az

x1  t0   b1; x2  t0   b2 ; ... ; xn  t0   bn ;

kezdeti feltételeket. Azt állítjuk, hogy az így meghatározott x1(t), x2(t), … xn(t) megoldások
alaprendszert alkotnak, ugyanis a lineáris függetlenségről szóló tétel szerint, ha létezik olyan
t0  I , amelyre W  x1  t0  , x2  t0  ,..., xn  t0    0 akkor az x1(t), x2(t), … xn(t) megoldások
lineárisan függetlenek. Márpedig

W  x1  t0  , x2  t0  ,..., xn  t0    det(B)  0

tehát a Wronski-determináns az adott pontban valóban különbözik 0-tól. ■

Az alaprendszer fogalmának fontosságát tisztázza a következő állítás.

2.3.7.Tétel: Legyen x1(t), x2(t), … xn(t) az x '  t   A  t  x  t  homogén lineáris rendszer egy
alaprendszere. Legyen továbbá x(t) a rendszer egy tetszőleges megoldása. Ekkor egyértelműen
léteznek α1, α2, …, αn konstansok úgy, hogy

n
x  t     i xi  t 
i 1

Tehát egy alaprendszer birtokában bármely megoldás előállítható, méghozzá egyértelműen, az


alaprendszer függvényeinek lineáris kombinációjaként.
n
Bizonyítás: Már igazoltuk, hogy a  i xi  t  lineáris kombináció is megoldása a homogén
i 1
lineáris rendszernek. Legyen x(t) a rendszer egy tetszőleges megoldása, legyen továbbá t0  I és
vizsgáljuk az

1x1  t0   2 x2  t0   ...  n xn  t0   x  t0 

inhomogén lineáris algebrai egyenletrendszert az αi ismeretlenekre vonatkozólag. Mivel ennek a


rendszernek a determinánsa éppen a W  x1  t0  , x2  t0  ,..., xn  t0    0 Wronski-determináns,
amely tehát különbözik 0-tól, ezért az egyenletrendszernek létezik egyértelmű megoldása. Jelölje

291
Óbudai Egyetem BGK Fejezetek a matematikából

n
ezt a megoldást β1, β2, …, βn. Tekintsük most ezekkel a konstansokkal a  i xi  t  megoldást.
i 1
n
Erre teljesül, hogy x  t0    i xi  t0  . A megoldás egyértelműsége miatt ez azt jelenti, hogy
i 1
n
x  t    i xi  t 
i 1

ami éppen azt jelenti, hogy a tetszőleges x(t) megoldás előáll az alaprendszer függvényeinek
lineáris kombinációjaként. Már csak az egyértelműséget kell igazolnunk. Tegyük fel, hogy
n
létezik két különböző előállítás. Azaz tegyük fel, hogy x(t) előáll x  t     i xi  t  alakban is.
i 1
Ekkor képezve a két előállítás különbségét azt kapjuk, hogy

n
 i  i  xi  t   0
i 1

Mivel az alaprendszer függvényei lineárisan függetlenek, az azonosan nulla függvény csak a


triviális módon, csupa zérus együtthatóval állítható elő, ami azt jelenti, hogy i  i ; i  1, 2,..., n.
Ezzel az egyértelműséget is bizonyítottuk. ■

Az igazolt tétel alapján értelmezhetjük az általános megoldás fogalmát.

2.3.8.Definíció: Legyen x1(t), x2(t), … xn(t) az x '  t   A  t  x  t  homogén lineáris rendszer egy
alaprendszere. Ekkor a rendszer összes megoldásainak

n 
 i xi  t  i  R; i  1, 2,..., n 
 i 1 

halmazát, tehát ezt az n-paraméteres függvénysereget, a homogén lineáris rendszer általános


megoldásának nevezzük.

A bizonyított tételek és a most megfogalmazott definíció alapján tehát nyilvánvaló, hogy egy
homogén lineáris rendszer megoldásához elő kell állítani egy alaprendszerét. Azonban az a
helyzet, hogy az általános, „függvényegyütthatós” esetben az alaprendszer előállítására nincs
általános módszer. Az alaprendszert csak akkor tudjuk konstruktív úton előállítani, ha a
differenciálegyenlet rendszer együtthatói állandók. Erre a témára visszatérünk, de annak
érdekében, hogy a jelzett esetben kimerítően le tudjuk írni a megoldásokat, szükség van egy
praktikus definícióra amely megkönnyíti a kezdeti érték probléma megoldását. Ezután még
megvizsgáljuk az inhomogén rendszer megoldhatóságának problémáját.

A megoldások lineáris függetlensége könnyedén eldönthető egy egyszerű feltétel alapján, amely
a kezdeti feltételekhez kötődik. Ezt fogalmazzuk meg az alábbi állításban.

292
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.8.Tétel: Legyenek az x1(t), x2(t), … xn(t) függvények olyan megoldásai az x '  t   Ax  t 


homogén lineáris rendszernek, amelyek az xi  t0   yi ;  i  1, 2,..., n  kezdeti feltételekhez
tartoznak. Ekkor az x1(t), x2(t), … xn(t) függvények pontosan akkor lineárisan függetlenek az I
intervallumon, ha az y1, y2, …, yn vektorok lineárisan függetlenek.
Bizonyítás: Képezzünk az yi vektorokból, mint oszlopvektorokból egy n-ed rendű determinánst.
Vegyük észre, hogy ez a determináns éppen az megoldásfüggvények t0 helyen vett Wronski-
determinánsa. Ez pedig a feltételként előírt lineáris függetlenség miatt

det  x1  t0  , x2  t0  ,..., xn  t0    det  y1, y 2 ,..., y n   0

különbözik nullától, ami pontosan azt jelenti, hogy az x1(t), x2(t), … xn(t) megoldások lineárisan
független rendszert alkotnak. ■

2.3.9.Definíció: Legyen x1(t), x2(t), … xn(t) az x '  t   A  t  x  t  homogén lineáris rendszer egy
alaprendszere. Ekkor azt a Φ  t  mátrix-függvényt, amelynek i-edik oszlopvektora az
alaprendszer xi(t) megoldásfüggvénye, a homogén lineáris rendszer alapmátrixának nevezzük.
Az alapmátrix tehát a következő

 x11  t  x21  t  ... xn1  t  


 
 x12  t  x22  t  ... xn 2  t  
Φ  t    x1  t  , x 2  t  ,..., x n  t   
 ... ... ... 
 
 x1n  t  x2 n  t  ... xnn  t  

Az alapmátrixnak a lineáris algebrai ismeretek alapján megfogalmazhatjuk néhány fontos


tulajdonságát, amelyek a definícióból illetve a mátrixok elméletéből adódnak.

2.3.9.Tétel: Ha a Φ  t  mátrix alapmátrixa az x '  t   A  t  x  t  homogén lineáris rendszernek,


akkor
a) Φ  t  oszlopvektorai lineárisan függetlenek;
b) a Φ  t  mátrix rangja n;
c) a Φ  t  mátrix reguláris, azaz det Φ  t   0; t  I ;
d) tetszőleges t  I esetén Φ  t  invertálható, azaz létezik a Φ1  t  inverz mátrix;
e) a Φ  t  kielégíti az X '  t   A  t  X  t  mátrix differenciálegyenletet.

Bizonyítás: Csak az e) pont szorul bizonyításra, a többi állítás nyilvánvaló. Ehhez bevezetőként
csak annyit kell megjegyeznünk, hogy egy mátrix függvény deriváltját úgy értelmezzük, hogy
minden komponensét deriváljuk. A Φ '  t   A  t  Φ  t  pedig abból következik, hogy az
alapmátrix i-edik oszlopvektora értelmezés szerint az xi(t) megoldásfüggvény, amelyre teljesül,
hogy xi '  t   A  t  xi  t  . A mátrixegyenlet pedig ezt az n db differenciálegyenlet rendszert

293
Óbudai Egyetem BGK Fejezetek a matematikából

„foglalja össze” úgy, hogy a bal oldal i-edik oszlopa egyenlő a jobb oldal i-edik oszlopával. Ezzel
az állítást igazoltuk. ■

Az alapmátrix segítségével egyszerűbb formában is kifejezhetjük azt a tényt, hogy megoldások


tetszőleges lineáris kombinációja is megoldás. Már igazoltuk, hogy ha x1(t), x2(t), … xn(t) az
n
x '  t   A  t  x  t  homogén lineáris rendszer megoldásai, akkor az x  t    i xi  t  függvény is
i 1

megoldás. Vezessük be a konstansok összefoglalására a c  1, 2 ,..., n   R n konstans


T

vektort. Ekkor a felírt lineáris kombináció, a mátrixok sor-oszlop szorzásának definíciója szerint
egyenértékű az x  t   Φ  t  c művelet eredményével. Igazoltuk tehát a következőt.

2.3.10.Tétel: Ha Φ  t  az x '  t   A  t  x  t  homogén lineáris rendszer alapmátrixa, akkor


tetszőleges c  R n konstans vektor esetén az x  t   Φ  t  c függvény is megoldása a rendszernek.

A homogén rendszer vizsgálatát tekintve hátra van még a kezdeti érték probléma megoldásának
előállítása. ■

2.3.11.Tétel: Legyen Φ  t  az x '  t   A  t  x  t  homogén lineáris rendszer alapmátrixa, legyen


továbbá t0  I és x0  R n tetszőleges. Ekkor a rendszer x  t0   x0 kezdeti feltételt kielégítő
partikuláris megoldása a következő

x  t   Φ  t  Φ1  t0  x0

Bizonyítás: Már igazoltuk, hogy az alapmátrix reguláris, tehát létezik inverze, a felírt
kifejezésnek tehát minden esetben van értelme. Világos, hogy ez a függvény x  t   Φ  t  c alakú,
ahol c  Φ1  t0  x0 konstans vektor. Az előzőek szerint ez azt jelenti, hogy valóban megoldása a
homogén lineáris rendszernek. Már csak azt kell igazolni, hogy kielégíti az x  t0   x0 kezdeti
feltételt. Ez egyszerű helyettesítéssel azonnal adódik

x  t0   Φ  t0  Φ1  t0  x0  Ex0  x0

ahol E  R nn az n-ed rendű egységmátrix. Ezt kellett bizonyítani. ■

A homogén rendszer vizsgálatát ezzel befejeztük. Rátérhetünk az inhomogén rendszer


megoldásának előállítására.

294
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.4. Elsőrendű inhomogén lineáris differenciálegyenlet rendszer


Ebben a pontban leírjuk, milyen szerkezetű az

x ' t   A t  x t   g t 

inhomogén lineáris rendszer általános megoldása. Továbbra is élünk a 2.3.2. pont feltevéseivel,
mely szerint az egyenletben szereplő függvények folytonosak az I intervallumon. Elsőként
kapcsolatot teremtünk az inhomogén és a homogén rendszer között az alábbi értelemben.

2.3.12.Tétel: Tegyük fel, hogy az x1(t), x2(t) függvények megoldásai az x '  t   A  t  x  t   g  t 


inhomogén lineáris rendszernek. Ekkor az x1(t) – x2(t) különbség megoldása az x '  t   A  t  x  t 
homogén lineáris rendszernek.
Bizonyítás: A feltétel szerint teljesül, hogy

x1 '  t   A  t  x1  t   g  t 
x2 '  t   A  t  x2  t   g  t 

Képezzük most a két egyenlet különbségét. Azt kapjuk, hogy

x1 '  t   x2 '  t   A  t  x1  t   A  t  x2  t  ; azaz  x1  t   x2  t   '  A  t   x1 t   x2 t  

Éppen ezt kellett igazolni. ■

Erre az egyszerű állításra alapozva már megfogalmazhatjuk azt a tételt, amely leírja az
inhomogén rendszer általános megoldásának szerkezetét.

2.3.13.Tétel: Legyen az x1(t), x2(t), … xn(t) az x '  t   A  t  x  t  homogén lineáris rendszer egy
alaprendszere, és xip(t) az x '  t   A  t  x  t   g  t  inhomogén rendszer egy tetszőleges
partikuláris megoldása. Ekkor az inhomogén rendszer tetszőleges x(t) megoldása felírható

n
x  t    i xi  t   xip  t 
i 1

alakban.
Bizonyítás: Az előző tétel szerint az x  t   xip  t  különbség a homogén lineáris rendszer egy
megoldása. Azt már korábban igazoltuk, hogy ez utóbbi tetszőleges megoldása egyértelműen
n
felírható  i xi  t  alakban alkalmas α1, α2, …, αn konstansokkal. Eszerint egyértelműen
i 1
léteznek olyan konstansok, melyekkel teljesül, hogy

295
Óbudai Egyetem BGK Fejezetek a matematikából

n
x  t   xip  t    i xi  t 
i 1

Ennek átrendezésével éppen a bizonyítandó állítást kapjuk. ■

Az igazolt tétel alapján értelmezhetjük az általános megoldás fogalmát.

2.3.10.Definíció: Legyen x1(t), x2(t), … xn(t) az x '  t   A  t  x  t  homogén lineáris rendszer egy
alaprendszere, xip(t) az x '  t   A  t  x  t   g  t  inhomogén rendszer egy tetszőleges
partikuláris megoldása. Ekkor az inhomogén rendszer összes megoldásainak

n 
 i xi  t   xip  t  i  R; i  1, 2,..., n 
 i 1 

halmazát, tehát ezt az n-paraméteres függvénysereget, az inhomogén lineáris rendszer


általános megoldásának nevezzük.

Az igazolt tételek és a definíció alapján tehát azt kaptuk, hogy – az első és másodrendű
inhomogén lineáris differenciálegyenletek megoldásához hasonlóan – az inhomogén lineáris
rendszer általános megoldását úgy kapjuk, hogy a homogén rendszer általános
megoldásához hozzáadjuk az inhomogén rendszer egy tetszőleges partikuláris megoldását.

Nem maradt más hátra, mint az inhomogén rendszer egy partikuláris megoldásának előállítása.
Erre egy jól bevált eljárást általánosítunk. Alkalmazzuk az állandó variálásának módszerét.
Ennek lényege, hogy az inhomogén rendszer egy partikuláris megoldását olyan alakban keressük,
mint a homogén rendszer általános megoldása, azaz x  t   Φ  t  c , csak az abban szereplő
c  R n konstans vektor helyére egy t c  t  vektor skalár függvényt helyettesítünk, és
megvizsgáljuk, hogy milyen c(t) függvény esetén megoldása az inhomogén rendszernek.
Keressük tehát az inhomogén rendszer egy megoldását x  t   Φ  t  c  t  alakban. Ennek létezését
biztosítja az alábbi tétel.

2.3.14.Tétel: (Az állandó variálásának módszere)


Ha Φ  t  az x '  t   A  t  x  t  homogén lineáris rendszer alapmátrixa, akkor létezik olyan
c : I  R n differenciálható vektor-skalár függvény, amely esetén az

xip  t   Φ  t  c  t 

függvény az x '  t   A  t  x  t   g  t  inhomogén rendszer megoldása.


Bizonyítás: A bizonyítás során nem csak ennek a c(t) függvénynek a létezését igazoljuk, hanem
megadjuk a módszert a függvény konstruktív előállítására is. Helyettesítsük be ezt a függvényt az
inhomogén egyenletbe.

296
Óbudai Egyetem BGK Fejezetek a matematikából

Φ t  c t  '  A t  Φ t  c t   g t 
a deriválási szabályok alkalmazásával kapjuk ebből, hogy

Φ ' t  c t   Φ t  c ' t   A t  Φ t  c t   g t 

átrendezve adódik, hogy

Φ ' t   A t  Φ t  c t   Φ t  c ' t   g t 
Itt a bal oldal első tagja azonosan zérus, hiszen Φ  t  a homogén rendszer alapmátrixa, tehát
azonosan teljesül, hogy Φ '  t   A  t  Φ  t  . A kapott összefüggés az ismeretlen c(t)-re egy
egyszerű szerkezetű differenciálegyenlet

Φ t  c ' t   g t 

amelyből az ismeretlen függvény két lépésben határozható meg. Elsőként szorozzuk az egyenlet
mindkét oldalát balról az alapmátrix inverzével

Φ1  t  Φ  t  c '  t   Φ1  t  g  t  ; azaz c '  t   Φ1  t  g  t 

Innen a keresett függvény már egy integrálással a kezünkben van. Csak abban kell
megállapodnunk, hogy egy mátrixfüggvényt úgy integrálunk, hogy minden komponensét külön-
külön integráljuk. A megoldás tehát

c  t    Φ1  t  g  t dt

Megkaptuk tehát a c(t) függvényt. Ezzel az inhomogén egyenlet egy partikuláris megoldása a
következő módon írható fel

xip  t   Φ  t   Φ1  t  g  t dt

Az állítást ezzel igazoltuk. ■

Összefoglalva az eddigieket, megállapíthatjuk, hogy az inhomogén rendszer általános


megoldása a következő alakban írható

xiá  t   Φ  t  c  Φ  t   Φ1  t  g  t dt

ahol c  R n egy tetszőleges konstans vektor.

297
Óbudai Egyetem BGK Fejezetek a matematikából

A témakör lezárásaképpen felírjuk az inhomogén lineáris rendszerre vonatkozó kezdeti érték


probléma megoldását. Ehhez felhasználjuk a homogén rendszerre vonatkozó eredményt.

2.3.15.Tétel: Legyen Φ  t  az x '  t   A  t  x  t  homogén lineáris rendszer alapmátrixa, legyen


továbbá t0  I és x0  R n tetszőleges. Ekkor az x '  t   A  t  x  t   g  t  inhomogén lineáris
rendszer x  t0   x0 kezdeti feltételt kielégítő partikuláris megoldása a következő

t
x  t   Φ  t  Φ1  t0  x0  Φ  t   Φ1    g    d 
t0

Bizonyítás: Ez a megoldás pontosan olyan alakú, mint az általános megoldás, abban különbözik,
hogy a konstans vektort c  Φ1  t0  x0 alakban vettük fel, a primitív függvényt pedig a t0
ponthoz tartozó integrálfüggvénnyel helyettesítettük. Ez utóbbiról az analízisből tudjuk, hogy
ugyancsak primitív függvény. A felírt függvény tehát valóban megoldása az inhomogén
rendszernek. Már csak azt kell megmutatni, hogy kielégíti a kezdeti feltételt. Ez helyettesítéssel
ellenőrizhető

t0
x  t0   Φ  t 0  Φ 1
 t0  x0  Φ  t0   Φ1    g    d   Ex0  0  x0
t0

Ezt kellett igazolni. ■

A tétel tehát ad egy „megoldóképletet” a problémára. Ha azonban nem szeretnénk adott ponthoz
tartozó integrálfüggvényt számolni akkor megoldhatjuk a kezdeti érték problémát úgy is, hogy a

x  t0   Φ  t0  c  Φ  t0   Φ1  t  g  t dt  x0

egyenletrendszerben szereplő c  R n ismeretlen konstans vektor komponenseit a kapott algebrai


lineáris egyenletrendszerből kiszámítjuk. Az alábbiakban mutatunk példát mindkét módszer
alkalmazására.

Ezen viszonylag hosszú és kimerítő elméleti bevezető után rátérhetünk az elmélet alkalmazására.
Mint már említettük alapvető kérdés a homogén lineáris rendszer Φ  t  alapmátrixának
előállítása. Ennek birtokában tudjuk meghatározni mind a homogén, mind az inhomogén rendszer
általános megoldását valamint mindkét rendszer esetében a kezdeti érték probléma megoldását.
Azonban az általános esetben nem létezik konstruktív módszer az alapmátrix előállítására, csak
akkor, ha a rendszer együtthatói állandók. Ennek a problémának a vizsgálatára térünk rá a
következő pontban. A megoldások szerkezetével kapcsolatosan új tételeket megfogalmaznunk
nem szükséges, hiszen minden tételt megfogalmaztunk és igazoltunk, amire szükség van, ezeket
természetesen alkalmazhatjuk a speciális esetben is. Egyetlen feladatunk marad, az alaprendszer
előállítása.

298
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.5. Elsőrendű állandó együtthatójú homogén lineáris


differenciálegyenlet rendszer
Alkalmazzuk a 2.3.2. és 2.3.3. pontokban leírtakat arra az esetre, amikor az A(t) együttható
mátrix komponensei állandók.

2.3.11.Definíció: Legyenek, az aijR (i, j = 1, 2, …, n) együtthatók valós számok. Ekkor az


alábbi n db egyenletből álló, n db ismeretlen függvényt tartalmazó

x '1  a11 x1  a12 x2  ...  a1n xn


x '2  a21 x1  a22 x2  ...  a2 n xn
...
x 'n  an1 x1  an 2 x2  ...  ann xn

egyenletrendszert, normál alakú állandó együtthatójú homogén lineáris differenciál-


egyenletrendszernek nevezzük.

Vezessünk be a szokásos egyszerűsítő jelöléseket. Legyen

 a11 a12 ... a1n   x1  t  


a   
 a22 ... a2 n   x2  t  
A 21
 R ; x t  
n
;
 ... ... ...   
   
 an1 an 2 ... ann   xn  t  

Az ARn×nkonstans mátrixot együtthatómátrixnak nevezzük, az x(t) vektor-skalár függvény


szokás szerint az ismeretlen függvények vektora. Ezekkel a mátrixjelölésekkel az
egyenletrendszer nagyon egyszerűen felírható:

x '  t   Ax  t 

Fogalmazzuk meg erre a rendszerre vonatkozólag a kezdeti érték problémát is. Az x '  t   Ax  t 
rendszerhez kapcsolunk egy kezdeti feltételt. Előírjuk, hogy az x(t) vektor-skalár függvény az
I = R intervallum (ld. az egzisztencia és unicitási tétel adott esetre vonatkozó alkalmazását a
következő bekezdésben) valamely t0 pontjában áthaladjon az Rn tér egy x0 pontján. Azaz kezdeti
feltételként az x(t0) = x0 egyenlőség teljesülését írjuk elő. Ezzel a kezdeti érték probléma a
következő módon van értelmezve

x '  t   Ax  t 

 x  t0   x0

299
Óbudai Egyetem BGK Fejezetek a matematikából

Az egzisztencia és unicitási tétel szerint, mivel a konstans függvények az egész számegyenesen


folytonosak, a fenti kezdeti érték problémának tetszőleges kezdeti feltételek esetén egyértelműen
létezik megoldása a teljes számegyenesen.

A 2.3.3. pont szerint egyetlen feladatunk az x '  t   Ax  t  homogén lineáris rendszer egy
alaprendszerének előállítása. Ebben a problémakörben felhasználjuk a lineáris algebrában
(1. fejezet) tárgyalt sajátértékek és sajátvektorok elméletét. A sajátértéke multiplicitása és valós
illetve komplex volta szerint különböző eseteket vizsgálunk.

1. eset: Az ARn×n együttható mátrixnak n db páronként különböző, tehát n db egyszeres


multiplicitású valós sajátértéke van.

Emlékeztetőül felidézzük, mit jelent az, hogy egy polinomnak csupa egyszeres multiplicitású
valós gyöke van. Ez a k(λ) karakterisztikus polinom esetében azt jelenti, hogy a polinom felírható
n db különböző (elsőfokú) gyöktényező szorzataként. Tehát a karakterisztikus polinom szorzat
alakja

k      1    1     2  ...     n  ;
n
i  R; i   j ha i  j 
Ebben az esetben az alábbi tétel alapján könnyen megadható egy alaprendszer.

2.3.16.Tétel: Tegyük fel, hogy az ARn×negyütthatómátrixnak n db páronként különböző valós


sajátértéke van, legyenek ezek: λ1, λ2, …λn. És legyenek s1, s2, …sn rendre ezen sajátértékekhez
tartozó sajátvektorok. Tekintsük ezután az

xi  t   eit si ; i  1, 2,..., n

függvényeket. Ekkor tetszőleges C1, C2, …CnR állandókkal az

n n
x  t    Ci xi  t    Ci eit si
i 1 i 1

vektorfüggvény a homogén differenciálegyenlet-rendszer megoldása és minden megoldás előáll


ilyen alakban. Úgy is fogalmazhatunk, hogy az xi  t   eit si ; i  1, 2,..., n függvények a homogén
lineáris differenciálegyenlet-rendszer egy alaprendszerét képezik. Az alapmátrix tehát az a
mátrix, melynek i-edik oszlopvektora az xi  t   eit si függvény.

Φ  t   e1t s1, e2t s2 ,..., ent sn 

Bizonyítás: Két dolgot kell igazolnunk. Egyrészt azt, hogy az xi  t   eit si függvények a
homogén lineáris rendszer megoldásai, másrészt azt, hogy ez az n db függvény lineárisan
független rendszert alkot.

300
Óbudai Egyetem BGK Fejezetek a matematikából

Legyen λ az A mátrix sajátértéke és s a hozzá tartozó sajátvektor, ekkor definíció szerint teljesül,
hogy As = λs. Ha ezek után x  t   et s , akkor kapjuk, hogy

  
 
x '  t   et s  et s  et s  et As  A et s  Ax

Az x  t   et s függvény tehát valóban megoldása a homogén lineáris rendszernek, ha λ egy


tetszőleges sajátérték és s a hozzá tartozó sajátvektor. Már csak azt kell megmutatnunk, hogy az
xi  t   eit si ; i  1, 2,..., n függvények lineárisan függetlenek. Itt egy a lineáris algebrában igazolt
tételre tudunk hivatkozni. Az 1. fejezetben megmutattuk, hogy különböző sajátértékekhez tartozó
sajátvektorok lineárisan függetlenek. Mivel feltevéseink szerint az A mátrixnak n db páronként
különböző sajátértéke van, ez azt jelenti, hogy az s1, s2, …, sn vektorok lineárisan függetlenek.
Mivel az eit ; i  1, 2,..., n értékek nullától különböző valós vagy komplex szorzótényezők, a
sajátvektorokat ezekkel szorozva ugyancsak lineárisan független rendszert kapunk. Igazoltuk
tehát, hogy az xi  t   eit si ; i  1, 2,..., n függvényrendszer az x '  t   Ax  t  homogén lineáris
rendszer egy alaprendszere. ■

2.3.7.Példa: Oldjuk meg az alábbi homogén lineáris differenciálegyenlet rendszert.

 x '  5x  y

 y '  3x  3 y

5 1 
Elsőként határozzuk meg az A    együtthatómátrix sajátértékeit és sajátvektorait. Felírjuk
3 3
az A mátrix karakterisztikus egyenletét

5 1
k     det  A  E     2  8  12  0
3 3

Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 2, λ2 = 6. A sajátvektorokat


megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket

5  2 1   s1  0 3 1  s1  0
1  2 :    ; tehát 3s1  s2  0;
3  2  s2  0 3 1  s2  0
;
 3
5  6 1   s1  0  1 1   s1  0
2  6 :    ; tehát s1  s2  0;
3  6  s2  0  3 3  s2  0
;
 3

Eszerint a sajátvektorok rendre például a következők

301
Óbudai Egyetem BGK Fejezetek a matematikából

1 1
s1    ; s 2    ;
 3 1

Az alapmátrix eszerint a következő

 e 2t e 6t 
Φ t    
 3e e6t 
2t

Ezek alapján az általános megoldás az alábbi vektor-skalár függvény.

 x(t )   C1  2t  1  6t 1
 y (t )     t  C   C1  e  3  C2  e 1
   2   

ahol C1 és C2 tetszőleges valós állandók. A megoldást koordinátánként írva az általános megoldás


alakja

x(t )  C1e2t  C2e6t


y (t )  3C1e2t  C2e6t

2.3.8.Példa: Oldjuk meg az alábbi homogén lineáris differenciálegyenlet rendszerre vonatkozó


kezdeti érték problémát.

 x '  5x  y  x  0   1 
 ; x  0    
 y '  3x  3 y  y  0  2

1. megoldás: A rendszer alapmátrixát már meghatároztuk az előző példában. A partikuláris


megoldás előállításához alkalmazzuk a

x  t   Φ  t  Φ1  t0  x0

formulát. Ehhez tehát szükség van a Φ  t  mátrix inverzére a t0 helyen. Elsőként kiszámítjuk az
alapmátrix helyettesítési értékét a t0 = 0 pontban.

 e0 e0   1 1
Φ  t0   Φ  0     
 3e
0
e0   3 1

Ennek inverze

302
Óbudai Egyetem BGK Fejezetek a matematikából

1 1 1
Φ1  t0   Φ1  0  
4 3 1 

Ahonnan a kezdeti feltételt kielégítő partikuláris megoldás a következő

 e 2t e6t  1 1 1 1  1  e2t e6t   1


x  t   Φ  t  Φ  t0  x 0  
1
       
 3e e6t  4 3 1   2 4  3e2t e6t   5 
2t

Koordinátánként írva

1 5 3 5
x(t )   e2t  e6t ; y(t )  e2t  e6t ;
4 4 4 4

2. megoldás: Az ismeretlen C1 és C2 konstansokat egy lineáris egyenletrendszerből is


meghatározhatjuk. Az előírt kezdeti feltétel szerint teljesül, hogy

 x(0)  C1e0  C2e0  C1  C2  1




 y (0)  3C1e  C2e  3C1  C2  2
0 0

Ennek a rendszernek a megoldását megkapjuk, ha például az első egyenletből kivonjuk a


1
második egyenletet. Ebből 4C1  1; C1   adódik. Ezt helyettesítve az első egyenletbe,
4
5
azonnal kapjuk a C2  megoldást. Ez a két konstans természetesen pontosan megegyezik az
4
első megoldás során kapott állandókkal.

2.3.9.Példa: Határozzuk meg az alábbi homogén lineáris rendszerre vonatkozó kezdeti érték
probléma megoldását.

 x1 '  3x1  4 x2  2 x3  x1  0    4 
  
 x2 '  x1  x3 ; x  0    x2  0     2 
 x '  6 x  6 x  5x  x3  0    3 
 3 1 2 3

Elsőként meg kell határoznunk az együtthatómátrix sajátértékeit és sajátvektorait. Ehhez felírjuk


a karakterisztikus egyenletet

3   4 2
k     det  A  E   1  1  3  2 2    2  0
6 6 5  

303
Óbudai Egyetem BGK Fejezetek a matematikából

Keressük ennek a harmadfokú egyenletnek a megoldását. Ezt most kétféle módon tehetjük.
Egyrészt próbálgatással kapjuk, hogy λ = 1 megoldás, tehát a polinomot eloszthatjuk a λ – 1
gyöktényezővel. (A próbálgatással kapcsolatban megjegyezzük, hogy egész megoldás csak a
konstans tag osztói közül kerülhet ki.) Így kapunk egy másodfokú egyenletet. A megoldások,
tehát a sajátértékek a következők: λ1 = 1, λ2 = 2, λ3 = –1. Egy másik módszer ebben az esetben
az, hogy észrevesszük, az első két tagból kiemelhető – λ2 , így a karakterisztikus polinom
 
szorzattá alakítható: 3  22    2   2    2      2   1   2    2  . Ebből a felsorolt
gyökök azonnal adódnak. Ezek után kiszámítjuk a sajátvektorokat. A megoldandó homogén
lineáris rendszerek a következők

 3  1 4 2   s1  0  4 4 2   s1  0 

1  1:  1 1 1   s2   0  ;  1 1 1   s   0  ;
  2  
 6 6 5  1  s3  0  6 6 4   s3  0 

Itt a harmadik egyenlet az első két egyenlet következménye, az első egyenlet ellentettjének és a
második egyenlet kétszeresének az összege, így elhagyható. Az első két egyenletből álló rendszer
szabadságfoka 1, legyen ezért például s3 = u, u ≠ 0. Helyettesítéssel kapjuk, hogy

4s1  4s2  2u 4s1  4s2  2u


 ; ; ahonnan u  0; tehát s1  s2 ;
 s1  s2  u 4s1  4s2  4u

A λ1 = 1 sajátértékhez tartozó sajátvektor eszerint

t  1 
s1   t  ; t  0; például s1  1  ;
 
0 0

hasonlóan kapjuk a többi sajátvektort is. A számításokat nem részletezzük, csak az eredményeket
közöljük.

0 0  t   1


 2  2 : s 2   t  ; t  0; például s 2  1  ; 3  1: s3   0  ; t  0; például s3   0  ;
     
 2t   2  t   1 

Ezen eredmények alapján az alaprendszer a következő

1  0  1
x1  t   e 1  ; x2  t   e 1  ; x3  t   e  0  ;
t   2t   t 

0  2  1 

ahonnan azonnal kapjuk az alapmátrixot

304
Óbudai Egyetem BGK Fejezetek a matematikából

 et 0 e  t 
 
Φ  t    et e 2t 0 
 
 0 2e2t et 

Az alaprendszer illetve mátrix birtokában az általános megoldás már felírható

 x1  t    C1  e et   C1   C1et  C3et 


t
0
  C    e t   
0  C2    C1et  C2e 2t  ; C1 , C2 , C3  R
x
 2   t   Φ  t   2  e 2t
 x3  t   C3   0 2e2t
  
et  C3   2C2e2t  C3et 


Már csak a kezdeti feltételeket kell kielégítenünk alkalmas konstansokkal.

1. megoldás: Ehhez elsőként alkalmazzuk az x  t   Φ  t  Φ1  t0  x0 formulát. Kiszámítjuk az


alapmátrixot a t0 = 0 helyen

 e0 0 e0  1 0 1
 
Φ  t0   Φ  0    e 0 e0 0   1 1 0 
 
 0 2e0 e0  0 2 1 
a kapott mátrixot invertáljuk

 1 2 1
Φ  t0   Φ  0    1 1 1  ;
1 1

 2 2 1

Ennek birtokában pedig kapjuk a kezdeti feltételt kielégítő partikuláris megoldást

 et 0 et   1 2 1  4  et 0 et   11


   
x  t   Φ  t  Φ1  t0  x0  et e 2t 0   1 1 1   2   et e 2t 0   9 
   
 0 2e2t et   2 2 1  3   0 2e2t et   15

Azaz koordinátánként írva a partikuláris megoldás a következő

 x1  t    11e  15e 
t t

   
x
 2   t    11e t
 9e 2t

 x3  t   18e2t  15et 

 

305
Óbudai Egyetem BGK Fejezetek a matematikából

2. megoldás: Az ismeretlen konstansokat kiszámíthatjuk közvetlenül egy lineáris


egyenletrendszer megoldásával is.

 C1e0  C3e0   C  C   4 
   1 3
  
 1 C e 0
 C2 e 0

  1 C  C2    2 
 0    
 2C2e  C3e   2C2  C3   3 
0

ennek megoldása pedig könnyen ellenőrizhetően valóban a C1 = –11, C2 = 9, C3 = –15


számhármas. Ugyanazt kaptuk tehát mint az 1. megoldás során.

2. eset: Az ARn×n együttható mátrixnak van egyszeres komplex sajátértéke

A karakterisztikus polinom szorzat alakja ebben az esetben formálisan ugyanaz, mint az első
esetben, tehát

k      1    1     2  ...     n  ;
n
i   j ha i  j; és létezik p és q hogy  p   q 
a különbség csak annyi, hogy a gyökök között előfordulnak komplex értékek is. Mivel valós
problémákat vizsgálunk, valós együtthatójú a karakterisztikus polinom. Ebben az esetben pedig a
komplex gyökök csakis párosával léphetnek fel, minden komplex gyök mellett annak konjugáltja
is gyöke a polinomnak.

Tegyük fel tehát hogy a karakterisztikus egyenlet egyik komplex gyöke, tehát az egyik komplex
sajátérték     i , ahol i az imaginárius egység. Az ehhez tartozó komplex sajátvektor az
s  u  iv  Cn vektor, ahol az u  R n valós vektor tartalmazza a vektor valós komponenseit, a
v  R n valós vektor pedig a képzetes komponenseket. A gyökökről mondottak szerint ekkor
sajátérték az előbbi sajátérték komplex konjugáltja is     i . A lineáris algebrából tudjuk,
hogy az ehhez tartozó sajátvektor a λ komplex sajátvektorhoz tartozó s vektor komplex
konjugáltja s  u  iv  Cn .

A feladat ebben az esetben is egy alaprendszer, tehát n db lineárisan független megoldás


előállítása. Abban a tételben, melyben igazoltuk, hogy az x  t   et s függvény megoldása az
x '  t   Ax  t  homogén lineáris rendszernek, nem használtuk ki, hogy a sajátérték vagy a
sajátvektor valós, a tétel tehát igaz komplex esetben is. Ebből adódik, hogy az

x  t   et s  e
i t
u  iv 
komplex értékű függvény megoldása a homogén rendszernek. Az Euler-formula alkalmazásával
fejtsük ki ezt a szorzatot a következő módon

306
Óbudai Egyetem BGK Fejezetek a matematikából

x  t   e
i  t
 u  iv   et  cos t  i sin t  u  iv  
 et  u cos t  v sin t  i  v cos t  u sin t  

Ez a komplex értékű függvény tehát megoldása a homogén lineáris rendszernek. Ekkor azonban
külön a valós rész és külön a képzetes rész is megoldása a homogén rendszernek, hiszen ha
x  t   x1  t   ix2  t  komplex értékű megoldás, akkor írhatjuk, hogy

Ax  t   A  x1  t   ix2  t    Ax1  t   iAx2  t   x '  t   x '1  t   ix '2  t  ; t  R

ahonnan szükségképpen következik a valós és képzetes részek egyenlősége, tehát


Ax1  t   x '1  t  ; Ax2  t   x '2  t  ami éppen az állításunk igazolását jelenti. Ebből következik,
hogy egyszeres multiplicitású konjugált komplex sajátértékek esetén két megoldást kapunk,
a komplex megoldás valós és képzetes részét

x1  t   et  cos tu  sin tv  ;


x2  t   et  cos tv  sin tu  ;

Ahhoz hogy ez a két függvény része lehessen egy alaprendszernek, már csak azt kell
megmutatnunk, hogy lineárisan függetlenek. Ehhez egyrészt felidézzük azt a lineáris algebrában
igazolt tételt, mely szerint ha s  u  iv  Cn komplex sajátvektor, akkor az u és v valós vektorok
lineárisan függetlenek. A komplex értékű megoldás valós és képzetes része rendre kielégíti az
x1  0   u; x2  0   v; kezdeti feltételeket. A 2.3.8. tétel valamint u és v lineáris függetlensége már
garantálja, hogy az x1(t), x2(t) valós és képzetes rész lineárisan függetlenek. Igazoltuk tehát az
alábbi tételt.

2.3.17.Tétel: Tegyük fel hogy a valós együtthatójú karakterisztikus egyenlet egyik komplex
sajátértéke     i , a hozzá tartozó komplex sajátvektor pedig a s  u  iv  Cn komplex
vektor. Ekkor a valós együtthatójú x '  t   Ax  t  homogén lineáris rendszer két lineárisan
független megoldása a következő

x1  t   et  cos tu  sin tv  ;


x2  t   et  cos tv  sin tu  ;

2.3.10.Példa: Határozzuk meg az

 x1 '  x1  x2  x3  x1  0   1 
    
 x2 '  x1  x2 ; x  0    x2  0     2 
 x '  3x  x  x3  0   0 
 3 1 3

307
Óbudai Egyetem BGK Fejezetek a matematikából

kezdeti érték probléma megoldását. Kiszámítjuk a sajátértékeket és a sajátvektorokat. A


karakterisztikus egyenlet

1   1 1
k     det  A  E   1 1    
0  1     2  2  5  0
3 0 1 

A sajátértékek innen a következők: λ1 = 1; λ2,3 = 1 ± 2i. A karakterisztikus egyenletnek tehát van


két konjugált komplex, egyszeres sajátértéke. Határozzuk most meg a sajátvektorokat. Kezdjük
az egyszerűbb valós esettel. A megoldandó lineáris rendszer a következő:

0 1 1  s1  0
1  1: 1 0 0   s2   0  ; ahonnan s1  0;  s2  s3  0;
3 0 0   s3  0

Innen a λ1 = 1 sajátértékhez tartozó sajátvektor a következő

0 0
s1   t  ; t  0; például s1   1 ;
 
 t   1 

Térjünk rá a komplex sajátérték esetére. Világos, hogy elég az egyik esetben kiszámítani a
sajátvektort, a másik esetben ennek a komplex konjugáltja az eredmény. A megoldandó rendszer
a következő

 2i 1 1   s1  0 
 2  1  2i :  1 2i 0   s2   0  ;
 3 0 2i   s3  0 

Ha itt az első egyenletet megszorozzuk 2i-vel, akkor világos, hogy a kapott egyenlet a második és
harmadik egyenlet összege. Ezért az első egyenletet elhagyhatjuk a rendszerből. A maradék
rendszer a következő

 s1  2is2

3s1  2is3

A rendszer egy szabadságfokú. Legyen például s1 = 2it. Ekkor nyilvánvalóan s2 = t, s3 = 3t. A


sajátvektorok tehát a következők

308
Óbudai Egyetem BGK Fejezetek a matematikából

 2it   2i   2it   2i 


 2  1  2i : s2   t  ; t  0; pl. s2   1  ; 3  1  2i : s3  s2   t  ; t  0; pl. s3   1  ;
     
 3t   3   3t   3 

Alkalmazva a korábban bevezetett u és v jelet a sajátvektorok valós és képzetes részére, azt


kapjuk, hogy a sajátvektorok a következőképpen írhatók

 2it   0   2t  0  2
 2,3  1  2i : s2,3   t   u  iv   t   i  0  ; t  0; pl. s 2  u  iv  1   i 0  ;
     
 3t  3t   0   3  0 

Ezen eredmények birtokában már felírhatjuk az általános megoldást. Az alaprendszer a


következő három függvényből áll

0  0  2 
t 
x1  t   e  1 ; x 2  t   e  cos tu  sin tv   e  cos 2t 1   sin 2t 0   ;
t   t  
 1    3  0  

 2 0  
 
x3  t   e  cos tv  sin tu   e  cos 2t 0   sin 2t 1   ;
t t  
  0   3 

Ahonnan az általános megoldás már felírható.

0  0  2    2 0 


t  t 
x  t   C1e  1  C2e  cos 2t 1   sin 2t  0    C3e  cos 2t  0   sin 2t 1   ;
t       
   
 1    3  0     0   3 

Koordinátánként írva a szokásos alakban kapjuk az általános megoldást.

x1  t   et  2C2 sin 2t  2C3 cos 2t  ;


x2  t   et  C1  C2 cos 2t  C3 sin 2t  ;
x3  t   et  C1  3C2 cos 2t  3C3 sin 2t  ;

Befejezésképpen határozzuk meg a kezdeti feltételt kielégítő partikuláris megoldást. Most


egyszerűbbnek tűnik a lineáris egyenletrendszer megoldása. A t0 = 0 helyettesítésével kapjuk,
hogy

309
Óbudai Egyetem BGK Fejezetek a matematikából

 x1  0    2C3  1 
 
x  0    x2  0     C1  C2    2 ;
 x3  0    C1  3C2   0 

3 1 1
aminek megoldása C1   ; C2  ; C3  . Innen a partikuláris megoldás a következő
2 2 2
3 1 1 
x1  t   et   sin 2t  cos 2t  ; x2  t   et   cos 2t  sin 2t  ;
2 2 2 
 3 3 3 
x3  t   et    cos 2t  sin 2t  ;
 2 2 2 

Ezzel a kitűzött Cauchy-feladatot megoldottuk.

A továbbiakban rátérünk azon esetek vizsgálatára, amikor a karakterisztikus egyenletnek


többszörös gyökei is vannak.

3. eset: Az ARn×n együttható mátrixnak van többszörös valós gyöke, és a többszörös valós
gyök algebrai multiplicitása megegyezik a geometriai multiplicitással

Tegyük fel, hogy a λi sajátérték a k(λ) karakterisztikus polinomnak pi-szeres gyöke. Ez a lineáris
algebrában bevezetett szóhasználattal azt jelenti, hogy a λi sajátérték algebrai multiplicitása pi.
Ebben a 3. esetben feltesszük, hogy ennek a sajátértéknek a geometriai multiplicitása ugyancsak
pi, ami azt jelenti, hogy ehhez a λi sajátértékhez tartozik pi db lineárisan független sajátvektor,
tehát a sajátaltér dimenziója pi. A karakterisztikus polinom szorzat alakja ebben az esetben a
következő

kn        i  i Qn pi    ;
p

ahol a karakterisztikus polinom kn(λ) jelölésében az n index arra utal, hogy egy n-ed fokú
polinomról van szó. A szorzat alak második tényezőjével kapcsolatban a Qn–pi(λ) jelölés csak arra
utal, hogy egy n – pi-ed fokú polinomról van szó. Ez utóbbit ugyancsak szorzattá kell bontanunk,
amelyben lehetnek egyszeres és többszörös gyökök. Mi a továbbiakban egy adott ilyen
többszörös gyök vizsgálatával foglalkozunk.
Ha tehát a λi sajátérték algebrai és geometriai multiplicitása ugyancsak pi akkor a geometriai
multiplicitás definíciója szerint létezik pi db lineárisan független sajátvektor, jelölje ezeket
si  , si  ,..., si i  , melyekre teljesül, hogy
1 2 p

Asi   isi  , Asi   isi  ,..., Asi i   isi i  ;


1 1 2 2 p p

hiszen mindannyian a λi sajátértékhez tartozó sajátvektorok. Ebben az esetben a λi sajátértékhez


tartozó lineárisan független megoldások a következők

310
Óbudai Egyetem BGK Fejezetek a matematikából

xi   t   eit si  , xi   t   eit si  ,..., xi i   t   eit si i  ;
1 1 2 2 p p

Tegyük most fel, hogy van m db különböző sajátérték, amelyek algebrai multiplicitása rendre
p1, p2, …, pm. Nyilván teljesül, hogy p1 + p2 + … + pm = n. Az előzőekben mutatott
gondolatmenetet elismételve minden sajátértékre pontosan n db lineárisan független sajátvektort
tudunk előállítani, hiszen különböző sajátértékekhez tartozó sajátvektorok többszörös
multiplicitás esetén is lineárisan függetlenek, így kapunk n db lineárisan független megoldást,
tehát egy alaprendszert. A mondottakat egy példán illusztráljuk.

2.3.11.Példa: Határozzuk meg az

 x1 '  4 x1  x2  x3

 x2 '  x1  2 x2  x3 ;
x '  x  x  2x
 3 1 2 3

rendszer általános megoldását. Elsőként írjuk fel a karakterisztikus egyenletet. Ez a következő

4   1 1
k     det  A  E   1 1      2    3  0
2
2
1 1 2

Ebből már látható, hogy λ1 = 2 egyszeres algebrai multiplicitású, λ2 = 3 kétszeres algebrai


multiplicitású gyök. Keressük meg a sajátvektorokat.

 4  2 1 1   s1  0  2 1 1  s1  0 

1  2 :  1 2  2 1   s2   0  ; 1 0 1  s   0  ;
  2  
 1 1 2  2  s3  0 1 1 0   s3  0

Erről látható, hogy a 2. és a 3. egyenlet összege az 1. egyenlet, így az 1. egyenlet elhagyható.


kapjuk, hogy a megoldandó rendszer a következő

 s1  s3  0  s1  s3
 ; ; tehát s1  s2  s3 ;
 s1  s2  0  s1  s2

A λ1 = 2 sajátértékhez tartozó sajátvektor eszerint

t  1
s1  t  ; t  0; például s1  1 ;
t  1

311
Óbudai Egyetem BGK Fejezetek a matematikából

Folytassuk a számításokat a kétszeres algebrai multiplicitású λ2 = 3 sajátértékkel. Ebben az


esetben elő kell állítanunk két lineárisan független sajátvektort. A megoldandó rendszer a
következő

 4  3 1 1   s1  0 1 1 1  s1  0



1  3:  1 2  3 1   s2   0  ; 1 1 1  s   0  ;
  2  
 1 1 2  3  s3  0 1 1 1  s3  0

Azt látjuk, hogy a rendszer három egyenlete megegyezik. Ez azt jelenti, hogy egy egyenletet
kaptunk a három ismeretlenre. Másképpen fogalmazva az együttható mátrix rangja ρ = 1, mert
1 db lineárisan független sorvektora van, az ismeretlenek száma viszont k = 3. Ez azt jelenti,
hogy a rendszer szabadságfoka k – ρ = 2, tehát 2 ismeretlen szabadon választható. A megoldandó
egyenlet

s1  s2  s3  0;

A szabad változók legyenek például s2 és s3. Ezeket úgy kell megválasztani, hogy két lineárisan
független megoldást kapjuk. Legyen ezért egyrészt s2 = 1 és s3 = 0, amikor s1 = 1 másrészt pedig,
s2 = 0 és s3 = 1, amikor ugyancsak s1 = 1. Innen a λ2 = 3 sajátértékhez tartozó sajátvektorok a
következők

1  1 
1
s2    2  
 1  ; valamint s 2  0  ;
0 1 

Mivel ezek a vektorok nem párhuzamosak, egyik nem konstans szorosa a másiknak, ezért
lineárisan függetlenek. Ezzel megkaptuk a rendszer általános megoldását. Általános jelölésekkel
ez a következő

x  t   C1e1t s1  C2e2t s2   C3e2t s2  ; C1, C2 , C3  R


1 2

konkrétan pedig az alábbi vektor-skalár függvény

1 1  1 
  3t   3t  
x  t   C1e 1  C2e 1   C3e 0  ; C1 , C2 , C3  R;
2t

1 0 1 

312
Óbudai Egyetem BGK Fejezetek a matematikából

4. eset: Az ARn×n együttható mátrixnak van többszörös valós gyöke, és a többszörös valós
gyök algebrai multiplicitása nagyobb, mint a geometriai multiplicitás

Tegyük fel, hogy a λi sajátérték algebrai multiplicitása pi. A karakterisztikus polinom szorzat
alakja így ugyanaz, mint a 3. esetben, tehát

kn        i  i Qn pi    ;
p

A különbség a 3. esethez képest annyi, hogy ha a λi sajátérték a k(λ) karakterisztikus polinomnak


pi-szeres gyöke akkor ehhez a λi sajátértékhez nem tartozik pi db lineárisan független sajátvektor,
hanem a független sajátvektorok száma kevesebb, mint pi, tehát a sajátaltér dimenziója kisebb,
mint pi. A megoldandó feladat ebben az esetben lényegében ugyanaz, mint a 3. pontban. A λi
sajátértékhez elő kell állítani pi db lineárisan független vektort, amelyből a p1 + p2 + … + pm = n
feltétel figyelembe vételével megszületik egy alaprendszer.
Mielőtt általánosan megfogalmaznánk egy tételt erre az esetre, egy példán keresztül mutatjuk be
milyen problémák merülnek fel, és azokat hogyan lehet megoldani.

2.3.12.Példa: Határozzuk meg az

 x1 '   x1  x2  2 x3

 x2 '  4 x1  x2 ;
 x '  2x  x  x
 3 1 2 3

homogén lineáris differenciálegyenlet rendszer általános megoldását. A rendszer karakterisztikus


egyenlete a következő

1   1 2
k     det  A  E   4      1   1  0
2
1  0
2 1 1  

Ahonnan adódik, hogy λ1 = 1 egyszeres algebrai multiplicitású, λ2 = –1 kétszeres algebrai


multiplicitású gyök. Ezután meghatározzuk a sajátvektorokat. λ1 = 1 esetén a megoldandó
egyenletrendszer a következő

 1  1 1 2   s1  0  2 1 2  s1  0



1  1:  4 11 0   s2   0  ;  4 0 0   s   0  ;
  2  
 2 1 1  1  s3  0  2 1 2  s3  0

A 2. egyenletből azonnal következik, hogy s1 = 0. A megmaradó két egyenlet egybeesik

s2  2s3  0;azaz s2  2s3 ;

313
Óbudai Egyetem BGK Fejezetek a matematikából

Innen kapjuk a λ1 = 1 sajátértékhez tartozó sajátvektort

0 0
s1   2t  ; t  0; például s1   2  ;
 t  1 

Térjünk át a kétszeres algebrai multiplicitású λ2 = –1 sajátérték esetére. Elő kell állítanunk két
független megoldást. Ehhez először megoldjuk azt a lineáris egyenletrendszert, amely a
sajátvektort adja meg

 1  1 1 2   s1  0  0 1 2   s1  0 

1  1:  4 11 0   s2   0  ;  4 2 0   s   0  ;
  2  
 2 1 1  1  s3  0   2 1 0   s3  0 

Világos, hogy a 2. egyenlet a 3. egyenlet kétszerese, tehát a rendszerből a 2. egyenlet elhagyható,


azonban az 1. és 3. sora az együtthatómátrixnak lineárisan független, hiszen a 3. sor nem
többszöröse az 1. sornak. Ez azt jelenti, hogy az együtthatómátrix rangja ρ = 2, az ismeretlenek
száma k = 3, ami azt jelenti, hogy a szabadságfok k– ρ = 1. Tehát csak egy ismeretlen választható
szabadon, a λ2 = –1 sajátértékhez tartozó sajátaltér csak 1 dimenziós. Ennek fényében
megoldjuk a megmaradt egyenletrendszert.

s2  2s3  0  s2  2s3


 ; ; tehát s1   s3 , s2  2s1;
 2s1  s2  0 s2  2s1

A λ2 = –1 sajátértékhez tartozó egyetlen sajátvektor eszerint

 t   1
s 2   2t  ; t  0; például s 2   2  ;
 
 t   1 

A 3. esetben tapasztaltaktól ellentétben azonban most nem tudunk előállítani egy s2 vektortól
lineárisan független sajátvektort. Azonban szükség van még egy lineárisan független megoldásra,
hiszen egyelőre csak két lineárisan független megoldást, az

0  1
x1  t   e s1  e  2 ; x2  t   e s 2  e  2  ;
1t 
t   2t t 

1   1 

függvényeket kaptuk, az alaprendszer pedig három lineárisan független megoldásból áll. A


probléma megoldásához az ötletet a másodrendű lineáris differenciálegyenletek elméletéből
vesszük. Ott láttuk, hogy ha λ a karakterisztikus egyenlet kétszeres való gyöke, akkor a hozzá

314
Óbudai Egyetem BGK Fejezetek a matematikából

tartozó általános megoldás et  C1t  C2  alakú. Ebből kiindulva megpróbáljuk az egyenletet
kielégíteni egy ehhez hasonló szerkezetű függvénnyel, amely a vizsgált probléma természetéből
adódóan némileg általánosabb. Ha alkalmazzuk az s2   s2 jelölést, utalva arra, hogy a λ2 = –1
1

sajátértékhez tartozó „első” megoldást adó sajátvektorról van szó, keressünk megoldást

x  t   te2t s2   e2t s2 


1 2

alakban, ahol s2  egyelőre ismeretlen vektor. Kérdés, hogy létezik-e olyan s2  vektor, amelyre
2 2

a felírt függvény megoldása az x '  t   Ax  t  homogén lineáris rendszernek. Helyettesítéssel


kapjuk, hogy pontosan akkor megoldás, ha azonosan teljesül, hogy

x '  t   e2t s2   2te2t s2   2e2t s2   Ate2t s2   Ae2t s2   Ax  t 
1 1 2 1 2

Ez az egyenlőség pontosan akkor azonosság, ha a jobb és bal oldalon az e2t és te2t függvények
együtthatói rendre megegyeznek. Rendezve az egyenletet ezen szempontok szerint kapjuk, hogy

 2

e2t s2    2s2   te2t  2s2   e2t As2   te2t As2  ;
1 1 2 1

Az egyenlőség eszerint azonosság, ha teljesül az alábbi két egyenlőség

 As1   s1
2 2 2
  2  2 1
;
 2
As   s
2 2  s 2

Azt kaptuk tehát, hogy az s2  vektor az A mátrix λ2 = –1 sajátértékhez tartozó sajátvektora,
1

s2 
2
ahogyan azt eddig is tudtuk, az vektor azonban nem sajátvektor, hanem az
As2    2s2   s2 
2 2 1
egyenlet által van meghatározva. Az ilyen vektort általánosított
sajátvektornak nevezzük. A fogalmat a későbbiekben pontosan definiáljuk. Feladatunk tehát egy
As2    2s2   s2  egyenletnek eleget tevő s2  vektor előállítása, ahol s2  már ismert
2 2 1 2 1

sajátvektor. A megoldandó egyenlet egyenértékű az

 A  2E s22  s21

egyenlettel. A konkrét esetben ez az egyenletrendszer a következő

0 1 2   s1   1
4 2 0   s    2  ;
  2  
 2 1 0   s3   1 

315
Óbudai Egyetem BGK Fejezetek a matematikából

Itt szintén igaz, hogy a 2. egyenlet a 3. egyenlet kétszerese, így a 2. egyenlet elhagyható a
rendszerből. Az 1. és 3. egyenletből álló rendszer pedig a következő

 s2  2s3  1 1  s2  2s3
 ; azaz  ;
 2s1  s2  1 1  s2  2s1

Ennek a rendszernek a szabadságfoka 1, például az s2 szabadon választható. Legyen s2 = 1. Ekkor


s1 = 0 és s3 = 1. Tehát a rendszer egy megoldása

0
 2
s2  1  ;
1 

Azonnal látható, hogy a kapott s2  és az s2  vektorok lineárisan függetlenek, hiszen egyik a
2 1

másiknak nem konstans szorosa. A korábbiak szerint tehát azt kapjuk, hogy az

 1 0
x3  t   te2t s2 
1  2t
 e s2  2 t  t  
 te  2   e 1  ;
 1  1 

függvény megoldása az x '  t   Ax  t  rendszernek, amelyről egyébként egyszerű helyettesítéssel


is könnyen meggyőződhetünk. Azt állítjuk tehát, hogy a megoldandó homogén lineáris rendszer
egy alaprendszere a következő három függvényből álló rendszer

0  1  1 0


x1  t   e1t s1  et  2 ; x2  t   e2t s 2  et  2  ; x3  t   te2t s 2  e2t s 2  te t  2   e t 1  ;
     
1 1 2

1   1   1  1 

Azt már tudjuk, hogy ezek a függvények valóban megoldások, már csak ezek függetlenségét kell
igazolnunk. A függetlenség abból a tételből következik, amely szerint egy függvényrendszer
pontosan akkor lineárisan független, ha lineárisan független kezdeti feltételekhez tartoznak.
Márpedig világos, hogy t = 0-ban

0  1 0


  1    2  
x1  0   s1   2 ; x2  0   s 2   2  ; x3  0   s 2  1  ;
1   1  1 

lineárisan független rendszert kapunk, ezt már megvizsgáltuk, de erről meggyőz bennünket az is,
ha kiszámítjuk a három vektorból képezett mátrix determinánsát

316
Óbudai Egyetem BGK Fejezetek a matematikából

0 1 0
2 2 1 1 0;
1 1 1

amely nem zérus, tehát a három vektor független. Összefoglalva az eddigieket, a rendszer
általános megoldása

0  1   1 0 


 
x  t   C1et  2  C2et  2   C3  te t  2   e t 1   ; C1 , C2 , C3  R;
1   1    1  1  

Vonatkoztassunk most el a konkrét példától és fogalmazzuk meg általánosan, amit a


megoldáshoz tudnunk kell.

2.3.18.Tétel: Tegyük fel, hogy az x '  t   Ax  t  homogén lineáris rendszer A mátrixának λ


sajátértéke kétszeres gyök, tehát algebrai multiplicitása 2, azonban a geometriai multiplicitása
csak 1. Ekkor létezik az As   s  egyenletet kielégítő s  sajátvektor mellett egy olyan s 
1 1 1 2

vektor, amely a sajátvektorral együtt lineárisan független rendszert alkot, és amely esetén az

x   t   et s  ; és x   t   tet s   et s 


1 1 2 1 2

függvények lineárisan független megoldásai a homogén lineáris rendszernek.


Bizonyítás: Az állítás igazolása a konkrét feladatbeli gondolatmenet általános megismétlése.
Tudjuk az elméletből, hogy a rendszernek egy megoldása az

x   t   et s  ;
1 1

Tegyük fel, hogy az x '  t   Ax  t  homogén lineáris rendszernek létezik

x   t   tet s   et s 
2 1 2

alakú megoldása. Kérdés, hogy milyen feltételeket elégít ki az s  vektor. Ennek a kérdésnek a
2

megválaszolásához behelyettesítünk az x '  t   Ax  t  egyenletbe.

et s   tet s   et s   Atet s   Aet s  ;


1 1 2 1 2

Rendezve az egyenletet et és tet függvények szerint, kapjuk, hogy


1 2

tet s   et s   s   tet As   et As  ;
1 1 2

317
Óbudai Egyetem BGK Fejezetek a matematikából

Ez az egyenlőség pontosan akkor azonosság, ha a két oldalon az et és tet függvények


együtthatói rendre megegyeznek, azaz teljesül, hogy

 As1  s1
  2 1  2
;
 As  s   s

Az első egyenlet pontosan azt jelenti, amit már eddig is tudtunk, hogy az s  az A mátrix λ
1

sajátértékhez tartozó sajátvektora. A második egyenlet azonban arra szolgál, hogy abból ismert
s  sajátvektor esetén az s  vektort meghatározzuk. A fenti két egyenlet ekvivalens az alábbi
1 2

két egyenlettel

  A  E  s1  0
  2 1
;
 A  E  s  s

Igazoltuk tehát, hogy létezik a kívánalmaknak megfelelő s  vektor. Már csak azt kell igazolni,
2

hogy s  és s  lineárisan függetlenek. Mivel két vektor esetén a lineáris összefüggőség


1 2

pontosan azt jelenti, hogy egyik vektor a másik konstans szorosa, ha lineárisan összefüggenének,
akkor s   Cs  lenne. De ekkor
2 1

 A  E s 2   A  E Cs1  C  A  E s1  0


  
lenne, de  A  E  s  s  0 ugyanis s  sajátvektor. Ez pedig ellentmondás, tehát a két
2 1 1

vektor független. Ebből már adódik a tételbeli x(1)(t) és x(2)(t) lineáris függetlensége, hiszen a
1 1  2  2
t = 0 pontban x  0   s ; és x  0   s , tehát lineárisan független kezdeti feltételekhez
tartozó megoldások. Ezt kellett igazolni. ■

A tételbeli gondolatmenet alapján bevezetünk egy új fogalmat.

2.3.12.Definíció: Legyen s  az A mátrix λ sajátértékhez tartozó sajátvektora. Ekkor azt az s 


1 2

vektort amely kielégíti az

As   s   s  ;
2 2 1

vagy az ezzel egyenértékű

 A  E s 2  s1

egyenletrendszert, az A mátrix λ sajátértékhez tartozó általánosított sajátvektorának nevezzük.

318
Óbudai Egyetem BGK Fejezetek a matematikából

Mint azt a fenti példában láttuk, amikor a sajátérték algebrai multiplicitása nagyobb, mint a
geometriai multiplicitás, a megoldás előállításához szükség van az általánosított sajátvektorok
előállítására is. Azonban még nem tisztáztunk minden lehetséges esetet. A kérdés az, hogy ha
például az algebrai és geometriai multiplicitás közötti különbség nem csak 1, mint az előbbi
példában, hanem legalább 2, akkor hogyan kapunk megoldást. Ezt vizsgáljuk az alábbiakban.

Kövessük az előző logikát. Tűzzünk ki egy feladatot, és annak kapcsán tisztázzuk az elméletet.

2.3.13.Példa: Határozzuk meg az

 x1 '  4 x1  x2

 x2 '  3x1  x2  x3 ;
 x ' x x
 3 1 3

homogén lineáris differenciálegyenlet rendszer általános megoldását. A rendszer karakterisztikus


egyenlete a következő

4   1 0
k     det  A  E   3 1      2   0;
3
1 
1 0 1 

Kapjuk tehát egyrészt, hogy λ = 2 az egyetlen sajátérték, valamint olyan sajátérték, amelynek
algebrai multiplicitása 3. Elő kell tehát állítanunk 3 db lineárisan független megoldást. Kezdjük
a sajátvektorok meghatározásával. A megoldandó rendszer a következő.

 4  2 1 0   s1  0  2 1 0   s1  0 

  2:  3 1  2 1   s2   0  ;  3 1 1  s   0  ;
  2  
 1 0 1  2   s3  0  1 0 1  s3  0

Látható, hogy az 1. sor és a 3. sor összege a 2. sor. Tehát a rendszerből a 2. egyenlet elhagyható.
A maradék sorvektorok azonban lineárisan függetlenek, tehát az együtthatómátrix rangja ρ = 2.
Az ismeretlenek száma k = 3, tehát a szabadságfok k – ρ = 3 – 2 = 1. A redukált rendszer

2s1  s2  0  s  2s1
 ; azaz  2 ;
 s1  s3  0  s3  s1

Mivel a szabadságfok 1, ezért a sajátaltér 1 dimenziós. A λ= 2 sajátértékhez tartozó egyetlen


sajátvektor eszerint

t  1 
1
  2t  ; t  0; például s    2  ;
1
s
 t  1 

319
Óbudai Egyetem BGK Fejezetek a matematikából

Ennek alapján egy megoldás az

1 
x 1
t   e t 1
s  e2t  2  ;
1 

Szükségünk van azonban még két lineárisan független megoldásra. Egy második megoldás
előállítására alkalmazhatjuk a az előző tételbeli eredményt illetve gondolatmenetet. Keresünk egy
s  általánosított sajátvektort. Ez kielégíti az As   s   s  tehát az  A  E  s   s 
2 2 2 1 2 1

lineáris egyenletrendszert. A konkrét esetben ez a következő

 4  2 1 0   s1  1   2 1 0   s1  1 
 3
 1  2 1   s2    2 ;  3 1 1  s    2 ;
  2  
 1 0 1  2  s3  1  1 0 1  s3  1 

A korábbi számításokhoz hasonlóan a 2. egyenlet ismét elhagyható a rendszerből, ezért a redukált


rendszer az alábbi

2s1  s2  1 s  2s1  1
 ; azaz  2 ;
 s1  s3  1  s3  s1  1

Mivel a rang 2, az ismeretlenek száma 3, a szabadságfok ismét 1. Célszerűen az s1 ismeretlent


tekintjük szabad változónak. Legyen s1 = 1, ekkor s2 = 1 és s3 = 0. Egy általánosított sajátvektor
tehát például a következő

1 
s  2
 1  ;
0 

Jól látható, hogy s  és s  lineárisan függetlenek. A számítások eredményét felhasználva az


1 2

előbbi tétel szerint az

1  1  1 
1 t 1    2 t 1 t  2  2t   2t  
x t   e s  e  2 ; x  t   te s  e s  te  2  e 1  ;
2t

1  1  0

függvények lineárisan független megoldások. Ez azonban még midig csak 2 db lineárisan


független megoldás, szükség van egy harmadikra is. Ehhez általánosítjuk az előzőekben
alkalmazott gondolatmenetet. Keresünk egy újabb, az előbbi két megoldástól független
megoldást az

320
Óbudai Egyetem BGK Fejezetek a matematikából

2 t 12
3 
x   t   et s   tet s   et s   et  s   ts   s   ;
3 t 1 2 3 2
2 2 

alakban. Kérdés, hogy létezik-e ilyen s  vektor. Ennek a kérdésnek az eldöntéséhez


3

helyettesítsünk az x '  t   Ax  t  homogén lineáris rendszerbe. Azt kapjuk, hogy

 t 2 1  3 

t  t
 3 
2
 2 1  2
t t
e  s  ts  s   e ts  s  Ae  s   ts   s   ;
1 2

2  2 

Ez az egyenlőség egy azonosság a t változót tekintve. Ez pontosan akkor teljesül, ha a két


oldalon a megfelelő függvények együtthatói rendre megegyeznek. Rendezve ezen szempont
szerint az egyenletet, az adódik, hogy

t 2 t 1
2
 1
 3
2 t2
2
1

e s  tet s   s   et s   s   et As   tet As   et As  ;
2 2 3

Ha itt együttható összehasonlítást végzünk, akkor azt kapjuk, hogy az s  , s  és s 


1 2 3

vektoroknak ki kell elégíteni az

 As1  s1

 2  2 1
 As  s  s ;
  3  3  2
 As  s  s

illetve az ezekkel ekvivalens

  A  E  s1  0

  2 1
  A  E  s  s ;

 A  E  s    s  
3 2

egyenleteket. Itt az első egyenlet ismét azt jelenti, hogy az s  vektor sajátvektora az A
1

mátrixnak. Ez tökéletes összhangban van a korábbiakkal. Az s  vektor a már definiált


2

értelemben általánosított sajátvektora az A mátrixnak. A harmadik egyenlet azonban új, de az


s  vektor logikailag pontosan úgy kapcsolódik a már ismert s  vektorhoz, ahogyan Az s 
3 2 2

vektor előáll az s  vektor felhasználásával. Ilyen módon az s  vektort is általánosított


1 3

sajátvektornak fogjuk nevezni, de megkülönböztetésül, az s  vektort elsőrendű, az s  vektort


2 3

pedig másodrendű sajátvektornak nevezzük.

321
Óbudai Egyetem BGK Fejezetek a matematikából

s  vektort. A mondottak szerint kielégíti az


3
Állítsuk elő a konkrét feladatban az
 A  E s3  s 2 egyenletet, tehát az

 4  2 1 0   s1  1   2 1 0   s1  1 
 3
 1  2 1   s2   1  ;  3 1 1  s   1  ;
  2  
 1 0 1  2  s3  0 1 0 1  s3  0 

egyenletrendszert. Ismét teljesül, hogy az 1. és 3. egyenlet összege a 2. egyenlet, így a 2. egyenlet


elhagyható a rendszerből. A maradék két sorvektor azonban lineárisan független, ezért az
együttható mátrix rangja ρ = 2. Mivel k = 3 ismeretlen van, ismét 1 a szabadságfok. A redukált
rendszer a következő

2s1  s2  1 s  2s1  1
 ; azaz  2 ;
 s1  s3  0  s3  s1

Ha szabad változónak az s1 ismeretlent választjuk, akkor s1 = 1 választással kapjuk a másodrendű


általánosított sajátvektort

1
s  3
 1 ;
1

Ebből az eredményből adódik, hogy az

 2 1  1  1 
 3  t 2 1  2  3  2t  t  2   t 1   1  ;
x  t   e  s  ts  s   e 
t
     
2  2 1  0 1 

A három vektor lineáris függetlenségéről meggyőz bennünket a belőlük, mint oszlopvektorokból


képezett determináns értéke is

1 1 1 1 1 1 0 1 1
2 1 1  1 0 0  1 0 0  1  0;
1 0 1 1 0 1 0 0 1

A kapott három megoldás lineárisan független, ugyanis a t = 0 kezdeti értékhez tartozó kezdeti
feltételek rendre az s  , s  és s  vektorok, amelyekről éppen most mutattuk meg, hogy
1 2 3

lineárisan függetlenek. Ebből pedig egy korábbi tétel szerint már következik a
megoldásfüggvények lineáris függetlensége. Ez azt jelenti, hogy a fentiekben valóban
alaprendszert állítottunk elő. A rendszer általános megoldása tehát a következő

322
Óbudai Egyetem BGK Fejezetek a matematikából

1    1  1    2 1  1  1 
  2t       2t  t  2  t 1   1  ;
x  t   C1e  2  C2e  t   2  1    C3e 
2t
     
1   1  0  2 1  0 1 
     

A példában alkalmazott gondolatmenet általánosan is elvégezhető egy lineáris rendszer


vizsgálatánál. A számítások során kiderült, hogy szükség van új fogalmak értelmezésére is.
Elsőként ezt adjuk meg, utána pedig általánosan megfogalmazzuk az ide vonatkozó tételt.

2.3.13.Definíció: Induljunk ki abból, hogy s  az A mátrix λ sajátértékhez tartozó sajátvektora,


1

azaz teljesül, hogy

As   s  ;   A  E s1  0;


1 1

Az s  legyen általánosított, pontosabban elsőrendű általánosított sajátvektor. Ekkor teljesül,


2

hogy

As   s   s  ;   A  E s 2  s1 ;


2 2 1

Ha a sajátérték algebrai és geometriai dimenziója közötti különbség kettő, akkor szükség van az
s  másodrendű általánosított sajátvektorra is amely eleget tesz az
3

As   s   s  ;   A  E s3  s 2 ;


3 3 2

összefüggéseknek. Ha az algebrai és geometriai dimenzió különbsége nagyobb, mint 2 akkor


szükséges a fogalom további általánosítása. Rendre kapjuk a harmad-, negyed-,…, p-ed rendű
általánosított sajátvektorokat, jelük s  , s  ,…, s  , amelyek rendre eleget tesznek a
4 5 p1

következő egyenleteknek

As   s   s  ;   A  E s 4  s3 ;


4 4 3

As   s   s  ;   A  E s5  s 4 ;


5 5 4

……………………………………………..
 p 1
 s   s  ;   A  E  s   s  ;
p 1 p p 1 p
As

Érdekes összefüggéseket kapunk, ha az  A  E s p1  s p  egyenletet megszorozzuk az


 A  E  pmátrixszal. Azt kapjuk, hogy a másod, harmad, negyed, …, p-ed rendű általánosított
sajátvektorokra rendre teljesül, hogy

323
Óbudai Egyetem BGK Fejezetek a matematikából

 A  E A  E s 2   A  E2 s 2   A  E s1  0;


 A  E2  A  E s3   A  E3 s3   A  E2 s 2  0;
 A  E3  A  E s 4   A  E4 s 4   A  E3 s3  0;

 A  E  A  E s p1   A  E p1 s p1   A  E p s p   0;
p

Ha az utolsóként felírt általános alakú egyenletet úgy írjuk fel, hogy

 A  E  A  E p s p1   0;

akkor azonnal látható, hogy az  A  E p s p1 vektor sajátvektora az A mátrixnak, tehát
teljesül, hogy  A  E p s p1  0 , hiszen sajátvektor nem lehet nullvektor, azonban az is igaz,
s
p 1 p 1
hogy  A  E   0 . A fentiek szerint szükség van az alábbi értelmezésre.

Az s  vektort az A mátrix λ sajátértékhez tartozó p-ed rendű általánosított sajátvektorának


p1

nevezzük, ha teljesül, hogy

 A  E p1 s p1  0; azonban  A  E p s p1  0;


Egy differenciálegyenlet rendszer megoldása során, amikor a karakterisztikus polinomnak
vannak többszörös gyökei és ezek algebrai multiplicitása nagyobb, mint a geometriai
multiplicitás, szükség van az általánosított sajátvektorokra. Az alábbi tétel összefoglalja ezek
alkalmazásának módját az általános esetben.

2.3.18.Tétel: Legyen λ az A mátrix sajátértéke és s  az A mátrix λ sajátértékhez tartozó


1

sajátvektora. Ebben az esetben az

tp 1 t p 1  2 t p  2  3 t 2 p 1 p 1 
x  t   et  s   s  s  ...  s   ts   s  
p

 p!  p  1!  p  2 ! 2! 

függvény pontosan akkor megoldása az x '  t   Ax  t  lineáris rendszernek, ha teljesülnek az


As   s  ;   A  E s1  0;
1 1

As   s   s  ;   A  E  s   s  ;
2 2 1 2 1

As   s   s  ;   A  E  s   s  ;
3 3 2 3 2

……………………………………………..
 p 1
 s   s  ;   A  E  s   s  ;
p 1 p p 1 p
As

324
Óbudai Egyetem BGK Fejezetek a matematikából

egyenlőségek. A felsorolt egyenleteknek eleget tevő s  s  , s  ,…, s  vektorokat az A


1 2 3 p1

mátrix λ sajátértékéhez tartozó sajátvektor szériának (sajátvektor sorozat, sajátvektor lánc)


nevezzük.
Bizonyítás: A tétel igazolása egyszerűen a rendszerbe történő behelyettesítéssel adódik. Egyrészt
a linearitás miatt

tp t p 1 t p 2 t2 p 1 
Ax  t   et  As   As   As   ...  As   tAs   As   ;
1 2 3 p 1 p

 p!  p  1!  p  2 ! 2! 

másrészt, a deriválási szabályok szerint

tp 1 t p 1  2 t p  2  3 t 2 p 1 p 1 
x '  t   et  s   s  s  ........  s   ts   s   
p

 p!  p  1!  p  2 ! 2! 
 t p 1 1 t p 2  2 t p 3  3  p 
s  ...  ts   s  
p 1
 et  s  s 
  p  1!  p  2 !  p  3! 

ha a kapott függvényeket egyenlővé tesszük és az exponenciális függvény és hatvány szorzója


szerinti együttható összehasonlítást végzünk, éppen a tételbeli egyenleteket kapjuk. ■

Többé-kevésbé szemléletessé téve a tételbeli összefüggést a következőt mondhatjuk. Ha a


karakterisztikus egyenlet egy λ gyökének multiplicitása r, akkor elő kell állítanunk egy r db
lineárisan független függvényből álló megoldásrendszert. Tegyük fel, hogy a sajátaltér 1
dimenziós, tehát 1 db lineárisan független sajátvektor van. Ekkor szükség van még p = r – 1 db
lineárisan független, első-, másod-, …, p-ed rendű általánosított sajátvektorra. Ezeket a tételbeli
p db egyenletrendszer szolgáltatja. Ezek megoldása után a p + 1 db lineárisan független
megoldás, tehát az alaprendszer a következő módon írható fel.

Összefoglalva eddigi eredményeinket, az alábbi állítást fogalmazhatjuk meg.

2.3.19.Tétel: A karakterisztikus egyenlet többszörös gyökei esetén, ha a sajátértékek algebrai


multiplicitása nagyobb, mint a geometriai multiplicitás, az x '  t   Ax  t  homogén lineáris
rendszer egy alaprendszere a következő függvényekből állítható össze

x1  t   et s 
1


x2  t   et ts   s 
1 2

 t2 1 3 
x 3  t   e  t  s    ts    s   
2

 2! 
t 1 t 2
3 2
4 
x4  t   et  s   s   ts   s  
3

 3! 2! 

325
Óbudai Egyetem BGK Fejezetek a matematikából

 t p 1 1 t p 2  2 t p 3 3 p 
x p  t   et  s  ...  ts   s  
p 1
s  s 
  p  1!  p  2 !  p  3! 
tp 1 t p 1  2 t p  2  3 t 2 p 1 p 1 
x p 1  t   et  s   s  s  ...  s   ts   s  
p

 p!  p  1!  p  2 ! 2! 

Bizonyítás: Azt az előző tétel bizonyítja, hogy ezek a függvények valóban megoldások. Már csak
a függetlenséget kell igazolnunk. Ez utóbbi abból következik, hogy ezek a megoldások az
xi  0   s  ; i  1, 2,..., p  1 kezdeti feltételekhez tartoznak. Az si  ; i  1, 2,..., p  1 vektorok
i

azonban lineárisan független rendszert alkotnak. Ha ugyanis s  lineárisan függ s  -től, akkor
2 1

 2 1 1
teljesül, hogy s   C  s  . De ekkor  A  E  s   A  E  C  s  C  A  E  s  0 ez
2 1

azonban ellentmond annak, hogy  A  E s 2  s1 és s  sajátvektor, tehát nem lehet
1

nullvektor. Kapjuk tehát, hogy s  és s  lineárisan független. Ha feltesszük, hogy s 


1 2 3

lineárisan függ az s  és s  vektoroktól, akkor teljesül, hogy s   C1s   C2s  . Ekkor


1 2 3 1 2

 3  2
azonban egyrészt igaz, hogy  A  E  s  s másrészt pedig az, hogy

 A  E  C1s1  C2s 2   C1  A  E s1  C2  A  E s 2  C2  A  E  s 2  s 2

De az is teljesül, hogy  A  E s 2  s1 amiből az következne, hogy s  és s  lineárisan


1 2

összefüggenek, de azt már igazoltuk, hogy s  és s  lineárisan függetlenek, ismét


1 2

ellentmondásra jutottunk. A gondolatmenet folytatásával igazolhatjuk, hogy az


s  ; i  1, 2,..., p  1 vektorok lineárisan független rendszert alkotnak. ■
i

5. eset: Az ARn×n együttható mátrixnak léteziktöbbszörös komplex gyöke

Ezzel az esettel részletesen nem foglalkozunk, csak utalunk rá, hogy a 2., 3. és 4. esetben
részletesen bemutatott módszerek alapján egy alaprendszer ebben az esetben is előállítható. Ilyen
szituáció csak akkor fordulhat elő, ha n legalább 4. Ilyen méretű rendszer megoldásával általában
nem foglalkozunk, bár jelezzük, hogy a korábbiakhoz képest csak a számítások mennyisége
szaporodik, az elvi háttér nem módosul. Egyedüli nehézséget az jelenthet, hogy a karakterisztikus
egyenlet negyedfokú, amelynek a megoldásait esetleg probléma lehet előállítani. Egy ilyen esetet
bemutatunk a 2.3.20. példában a fejezet végén.

326
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.6. Elsőrendű állandó együtthatójú inhomogén lineáris


differenciálegyenlet rendszer
Ebben a pontban csak a 2.3.4. pontban kifejtett elmélet eredményeit alkalmazzuk állandó
együtthatójú rendszerekre. Új tételeket igazolnunk nem szükséges, hiszen az általános tételek
változtatás nélkül alkalmazhatók az állandó együtthatójú esetre. A 2.3.4. pontbeli vizsgálatokhoz
képest annyi az „előny” hogy a 2.3.5 pont eredményei szerint elő tudjuk állítani a homogén
rendszer egy alaprendszerét, tehát a Φ(t) alapmátrixot, és így alkalmazni tudjuk az állandó
variálásának módszerét. Megoldandó tehát az

x ' t   A t  x t   g t 

inhomogén lineáris rendszer. Feladatul tűzzük ki ebben a pontban ezen rendszer általános
megoldásának a meghatározását elsősorban az állandó variálásának módszerét alkalmazva. Ehhez
felhasználjuk tehát a 2.3.4. pontban igazolt

xiá  t   Φ  t  c  Φ  t   Φ1  t  g  t dt

összefüggést az általános megoldás előállítására.

2.3.14.Példa: Határozzuk meg az


 x1 '  x1  x2  e
3t
 x1 '  1 1   x1  e3t 
 ; mátrix jelölésekkel:  x '  3 1  x    

 2
x '  3 x1  x2  t  2    2  t 

inhomogén lineáris rendszer általános megoldását. Kezdjük a homogén rendszer alapmátrixának


előállításával. A karakterisztikus egyenlet

1  1
k     det  A  E    2  4  0
3 1  

Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 2, λ2 = –2. A sajátvektorokat


megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket

 1 1   s1  0
1  2 :        ; tehát  s1  s2  0; s1  s2 ;
 3 3  s2  0
3 1  s1  0
 2  2 :        ; tehát 3s1  s2  0; s2  3s1;
3 1  s2  0

Innek kapjuk a sajátvektorokat és az alapmátrixot

327
Óbudai Egyetem BGK Fejezetek a matematikából

1 1  e 2t e2t 


s1    ; s 2    ; Φ  t    ;
1  3 e
2t
3e2t 

Ezek alapján a homogén rendszer általános megoldása az alábbi

 x (t )  e e2t   C1 
2t
xhá  t   Φ  t  c   1      ;
 x2 (t )  e
2t
3e2t  C2 

ahol C1 és C2 tetszőleges valós állandók. Ezek után rátérünk az inhomogén rendszer egy
partikuláris megoldásának előállítására.

1. megoldás: Elsőként az általánosan alkalmazható, állandó variálásának módszerét alkalmazzuk.


Ez a korábbiak szerint a következő

xip  t   Φ  t   Φ1  t  g  t dt

Szükség van tehát az alapmátrix inverzére. Emlékeztetünk arra, hogy egy 2×2 méretű mátrix
inverzét a következő módon számoljuk

a b  1  d b 
ha A    ; akkor A 1  ha det A  ad  bc  0
c d  ad  bc  c a 

Itt csak arra hívjuk fel a figyelmet, hogy az alapmátrix komponensei függvények és nem
konstansok. Az alapmátrix determinánsa nem más, mint a Wronski-determináns

e 2t e2t
det Φ  t   W  x1  t  , x2  t     3  1  4;
e 2t 3e2t

ahonnan az alapmátrix inverze a következő

1  3e e2t 
2t
Φ t    
1
;
4  e2t e2t 

Ezek alapján már számítható az integrandus

1  3e e2t  e3t  1  3e  te 


2t t 2t
Φ1  t  g  t          ;
4  e2t e2t   t  4  e5t  te2t 

Megállapodás szerint, egy vektort úgy integrálunk, hogy minden koordinátafüggvényét


integráljuk.

328
Óbudai Egyetem BGK Fejezetek a matematikából

Eszerint

 t 2t 1 2t 
3e t
 e  e 
1
 Φ  t  g  t dt   4  1 5t t 2t 1 2t  ;
1 2 4
 e  e  e 
 5 2 4 

Végül szorzással kapjuk a partikuláris megoldást

 t 1 
 3et  e2t  e2t 
1 e 
2t 2t
e
xip  t   Φ  t   Φ  t  g  t dt   
1 2 4
  ;
4 e2t 3e2t    1 e5t  t e2t  1 e2t 
 5 2 4 

Elvégezve a műveleteket adódik, hogy

 4 3t t 
 5e 4 
xip  t    ;
 3 e3t  t  1 
 5 4 4 

A homogén rendszer általános és inhomogén rendszer partikuláris megoldásának összege adja az


inhomogén rendszer általános megoldását

 4 3t t 
e2t   e   5e 4 
2t
xiá  t   C1    C2    ; C1 , C2  R
2t
e   3e   3 e3t  t  1 
2t

 5 4 4 

2. megoldás: Az inhomogén rendszer egy partikuláris megoldását előállítjuk más módszerrel is.
A másodrendű állandó együtthatójú differenciálegyenleteknél alkalmaztuk a próbafüggvény
módszerét. Ez ebben az esetben is működik, ha a jobb oldalon egyszerű szerkezetű függvények
állnak, tehát, hatvány, polinom, exponenciális illetve trigonometrikus, vagy ezek szorzata. A
korábbiak szerint keressük a megoldást

 x1 p (t )   Ae3t  Bt  C 
    3t ;
 x2 p (t )   De  Et  F 

alakban. Elvégezve a deriválást és a helyettesítést az inhomogén rendszerbe, a következő


egyenletrendszert kapjuk

329
Óbudai Egyetem BGK Fejezetek a matematikából

 3 Ae  B   A  D  e   B  E  t   C  F   e ;
 3t 3t 3t


3De  E   3 A  D  e   3B  E  t   3C  F   t ;
3t 3t

Ha mindkét egyenletben együttható összehasonlítást végzünk, akkor kapjuk az együtthatókra az


alábbi lineáris egyenletrendszert

3 A  A  D  1;
 B  E  0;

 B  C  F;

 3D  3 A  D;
 3B  E  1  0;

 E  3C  F ;

Helyettesítéssel meggyőződhetünk róla, hogy ennek a rendszernek a megoldása a következő

4 1 3 1 1
A  ; B   ; C  0; D  ; E  ; F   ;
5 4 5 4 4

Ez a megoldás pedig pontosan egybeesik az 1. módszerrel kapott megoldással.

2.3.15.Példa: Határozzuk meg az

 x1 '  4 x1  3x2  sin t  x '   4 3  x1   sin t 


 ; mátrix jelölésekkel:  1      ;
 x2 '  2 x1  x2  2cos t  x2 '  2 1  x2   2cos t 

inhomogén lineáris rendszer általános megoldását. Kezdjük a homogén rendszer alapmátrixának


előállításával. A karakterisztikus egyenlet

4 3
k     det  A  E       1   2   0;
2 1  

Ennek az egyenletnek a megoldásai, tehát a sajátértékek λ1 = 1, λ2 = 2. A sajátvektorokat


megkapjuk, ha megoldjuk az alábbi homogén lineáris rendszereket

3 3  s1  0
1  1:   ; tehát 3s1  3s2  0; s1  s2 ;
2 2  s2  0
2 3  s1  0
2  2 :   ; tehát 2s1  3s2  0;3s2  2s1;
2 3  s2  0

Innek kapjuk a sajátvektorokat és az alapmátrixot

330
Óbudai Egyetem BGK Fejezetek a matematikából

1  3  et 3e2t 
s1    ; s 2    ; Φ  t    ;
1  2 e
t
2e2t 

Ezek alapján a homogén rendszer általános megoldása az alábbi

 x (t )  e 3e2t   C1 
t
xhá  t   Φ  t  c   1      ;
 x2 (t )  e 2e2t  C2 
t

Az inhomogén rendszer partikuláris megoldását most is két módszerrel állítjuk elő.

1. megoldás: Az állandó variálásával. Az alapmátrix determinánsa a Wronski-determináns

et 3e2t
det Φ  t   W  x1  t  , x2  t     2e3t  3e3t  e3t ;
t 2t
e 2e

ahonnan az alapmátrix inverze a következő

1  2e2t 3e2t   2et 3et 


Φ  t    3t
1
 t  ;
e  e et   e2t e2t 

Ha ezt az inverz mátrixot szorozzuk a g(t) vektor-skalár függvénnyel kapjuk az integrandust

 2et 3et   sin t   2et sin t  6et cos t 


Φ t  g t   
1
  ;
 e
2t
e2t   2cos t   e2t sin t  2e2t cos t 

Ezt a vektort koordinátánként integráljuk. A primitív függvény előállításához használjuk fel az


alábbi két összefüggést, amelyek két-két parciális integrálással adódnak

eat eat
 e sin tdt 
at
 a sin t  cos t ;  e cos tdt 
at
 sin t  a cos t ;
1  a2 1  a2

Ezek alapján adódik, hogy

et  2sin t  4cos t  


 Φ  t  g  t dt  
1
;
 e2t cos t 

Végül elvégezve a szorzást az alapmátrixszal, kapjuk a partikuláris megoldást

331
Óbudai Egyetem BGK Fejezetek a matematikából

et 3e2t  et  2sin t  4cos t   cos t  2sin t 


xip  t   Φ  t   Φ1  t  g  t dt     ;
e 2e2t   e2t cos t   2cos t  2sin t 
t

Az eredményeink összegzésével adódik az inhomogén egyenlet általános megoldása

et   3e2t   cos t  2sin t 


xiá  t   Φ  t  c  Φ  t   Φ1  t  g  t dt  C1    C2    ; C1 , C2  R
e   2e   2cos t  2sin t 
t 2t

2. megoldás: A partikuláris megoldást előállítjuk a próbafüggvény módszerével is. Keressük a


megoldást

 x1 p (t )   A cos t  B sin t 
  ;
 x2 p (t )  C cos t  D sin t 

alakban. Elvégezve a deriválást és a helyettesítést az inhomogén rendszerbe, a következő


egyenletrendszert kapjuk

 A sin t  B cos t  4 A cos t  4B sin t  3C cos t  3D sin t  sin t ;



C sin t  D cos t  2 A cos t  2B sin t  C cos t  D sin t  2cos t ;

A két egyenletben együttható összehasonlítást végezve, az alábbi lineáris egyenletrendszert


kapjuk az ismeretlen együtthatókra
 B  4 A  3C ;
 A  4 B  3D  1;


 D  2 A  C  2;
 C  2 B  D;

Ennek megoldása pedig A = 1, B = –2, C = 2, D = –2, mint arról helyettesítéssel könnyen


meggyőződhetünk. Ez a megoldás azonban pontosan megegyezik az 1. módszerrel, tehát az
állandó variálásával kapott megoldással.

2.3.16.Példa: Határozzuk meg az


 x1 '  x2  tg t  1
2
 x1 '   0 1   x1   tg 2 t  1
 ; mátrix jelölésekkel:  x '   1 0  x    ;

 2 x '   x1  tg t  2     2   tg t 

inhomogén lineáris rendszer általános megoldását. Szokás szerint kezdjük a homogén rendszer
alapmátrixának előállításával. A karakterisztikus egyenlet

332
Óbudai Egyetem BGK Fejezetek a matematikából

 1
k     det  A  E     2  1  0;
1 

Ennek az egyenletnek is konjugált komplex megoldásai vannak, tehát a sajátértékek a


következők: λ1 = i, λ2 = –i. Emlékeztetünk azonban arra, hogy ha konjugált komplex sajátértékek
adódnak, akkor elég az egyik sajátértékhez tartozó sajátvektort előállítani, a konjugált komplex
sajátértékhez a konjugált sajátvektor tartozik. A megoldandó homogén lineáris rendszer

 i 1   s1  0
1  i :        ; tehát  is1  s2  0; s2  is1;
 1 i   s2  0

Ebben az esetben az első egyenlet –i-szerese a második egyenlet, így ez utóbbi a rendszerből
valóban elhagyható.Kapjuk tehát a sajátvektorokat

1 1  0  1  1 0


s1        i   ; s2        i   ;
 i   0  1   i  1 1

A lineárisan független megoldásokat ismét az

1  1   0  
x  t   eit     cos t  i sin t     i    ;
i    0  1  

komplex megoldás valós és képzetes része adja. Ezeket megkapjuk ha elvégezzük a szorzást

 1  0   1  0 
x  t    cos t    sin t     i  sin t    cos t    ;
 0 1    0 1  

Az alapmátrix tehát a következő


 cos t sin t 
Φ t    ;
  sin t cos t 

Ahonnan adódik a homogén lineáris rendszer általános megoldása

 cos t   sin t 
xhá  t   Φ  t  c  C1    C2  ;
  sin t  cos t 

Tekintettel az inhomogenitást jelentő g(t) vektorfüggvény alakjára, az inhomogén rendszer


partikuláris megoldásának előállítására ismét csak az állandó variálásának módszere marad.
Ehhez számítjuk az alapmátrix determinánsát

333
Óbudai Egyetem BGK Fejezetek a matematikából

cos t sin t
det Φ  t    cos2 t  sin 2 t  1;
 sin t cos t

Ebből kapjuk az alapmátrix inverzét

1 cos t  sin t  cos t  sin t 


Φ1  t    
1  sin t cos t   sin t cos t 
;

A kapott inverz és a g(t) vektor szorzata lesz az integrandus

cos t  sin t   tg 2 t  1   cos t    cos t 


Φ1  t  g  t         2    2 ;
 sin t cos t   tg t  sin t cos t  sin t cos t  sin t 
3

Koordinátafüggvényenként integrálva kapjuk, hogy

  sin t 
 Φ  t  g  t dt   1  cos t  ;
1

 cos t 

Elvégezve az alapmátrixszal való szorzást, adódik a partikuláris megoldás

  sin t 
 cos t sin t      tg t  ;
xip  t   Φ  t   Φ  t  g  t dt  
1
  cos t   2 
1
  sin t cos t  
 cos t 

A homogén általános és inhomogén partikuláris megoldás összege adja a rendszer általános


megoldását

 cos t   sin t   tg t 
xiá  t   Φ  t  c  Φ  t   Φ1  t  g  t dt  C1    C2      ; C1 , C2  R
  sin t  cos t   2 

2.3.17.Példa: Határozzuk meg az

 1  1 
 x1 '  x1  x2   x1 '  1 1  x1   
 cos t ; mátrix jelölésekkel:       x    cos t  ;
  2  
x ' 2 1 2
 x2 '  2 x1  x2  0 

inhomogén lineáris rendszer általános megoldását. Szokás szerint kezdjük a homogén rendszer
alapmátrixának előállításával. A karakterisztikus egyenlet

334
Óbudai Egyetem BGK Fejezetek a matematikából

1  1
k     det  A  E     2  1  0;
2 1  

Ennek az egyenletnek konjugált komplex megoldásai vannak, tehát a sajátértékek λ1 = i, λ2 = –i.


Ismét elég csak az egyik sajátértékhez tartozó sajátvektort meghatározni. A sajátvektorokat
megkapjuk, ha megoldjuk a következő homogén lineáris rendszert

1  i 1   s1  0
1  i :        ; tehát 1  i  s1  s2  0; s2  1  i  s1;
 2 1  i   s2  0

Könnyen látható, hogy az első egyenlet (1 + i)-szerese a második egyenlet, tehát ez utóbbi
valóban elhagyható a rendszerből. Innek kapjuk a sajátvektorokat

 1  1  0   1  1  0 
s1        i   ; s2       i  ;
1  i  1  1 1  i  1  1

Az alapmátrixban csak a valós megoldások lehetnek, ezt a kapott komplex megoldás valós és
képzetes része szolgáltatja. A komplex megoldás egyrészt az

 1  1  0  
x  t   eit     cos t  i sin t     i    ;
1  i  1  1 

függvény valamint ennek komplex konjugáltja. Szorzással kapjuk a valós és képzetes részt

 1  0   1  0 
x  t    cos t    sin t     i  sin t    cos t    ;
 1  1   1  1 
Ahonnan az alapmátrix már felírható

 cos t sin t 
Φ t    ;
cos t  sin t sin t  cos t 

A homogén lineáris rendszer általános megoldása ezzel a kezünkben van

 cos t   sin t 
xhá  t   Φ  t  c  C1    C2  ;
cos t  sin t  sin t  cos t 

Az inhomogén egyenlet partikuláris megoldásának előállítására azonban most nem alkalmazható


a próbafüggvény módszere, marad az állandó variálása. Ehhez elsőként az alapmátrix
determinánsát számítjuk

335
Óbudai Egyetem BGK Fejezetek a matematikából

cos t sin t
det Φ  t    cos t sin t  cos 2 t  cos t sin t  sin 2 t  1;
cos t  sin t sin t  cos t

Innen az inverz már egyszerűen adódik

1  sin t  cos t  sin t  cos t  sin t sin t 


Φ1  t   
1   cos t  sin t cos t  cos t  sin t  cos t 
;

Ezt a mátrixot szorozva a g(t) vektorral adódik az integrandus

 1 
cos t  sin t sin t   1  tg t 
Φ t  g t    cos t   
1
 ;
cos t  sin t  cos t   0  1  tg t 
 

Ezek után koordinátánként integrálva adódik, hogy

t  ln cos t 
 Φ  t  g  t  dt  t  ln cos t  ;
1

 

Az alapmátrixszal szorozva balról adódik a partikuláris megoldás

 cos t sin t  t  ln cos t 


xip  t   Φ  t   Φ1  t  g  t dt    ;
cos t  sin t sin t  cos t  t  ln cos t 

Elvégezve a szükséges műveleteket adódik, hogy

 t cos t sin t  t  cos t  sin t    cos t  sin t  ln cos t 


xip  t     ;
cos t  sin t sin t  cos t   2t sin t  2cos t ln cos t 

Összegezve az általános és partikuláris megoldást, kapjuk az inhomogén rendszer általános


megoldását

 cos t   sin t  t  cos t  sin t    cos t  sin t  ln cos t 


xiá  t   C1    C2    ; C1 , C2  R
cos t  sin t  sin t  cos t   2t sin t  2cos t ln cos t 

A rendszer megoldását tehát előállítottuk. Ha rátekintünk az inhomogén rendszer partikuláris


megoldására valamint a g(t) vektor koordinátáira, látható miért nem alkalmazható a
próbafüggvény módszere. Ezek a függvények még csak nem is hasonlítanak egymásra.

336
Óbudai Egyetem BGK Fejezetek a matematikából

2.3.7. n-ed rendű állandó együtthatójú lineáris differenciálegyenlet, az


átviteli elv
Ebben a pontban, a lineáris rendszerek elméletének alkalmazásaképpen megmutatjuk, hogyan
lehet megoldani az n-ed rendű állandó együtthatójú lineáris differenciálegyenletet. A 2.2.
fejezetben kizárólag másodrendű egyenletekkel foglalkoztunk, itt általánosítjuk a problémakört, a
lineáris rendszerek elméletének alkalmazásával lehetőség nyílik magasabb rendű egyenletek
megoldására is. Kiderül, hogy egy n-ed rendű lineáris differenciálegyenlet átalakítható úgy, hogy
egy elsőrendű, normál alakú, lineáris rendszer legyen belőle, amelyben n db ismeretlen függvény
szerepel. Ezt a módszert nevezzük átviteli elvnek.

Induljunk tehát ki egy n-ed rendű állandó együtthatójú lineáris differenciálegyenletből.


Legyenek az an–1, an–2, …, a2, a1, a0 valós együtthatók, a g  t  , t  I egy nyitott intervallumon
folytonos függvény. A bevezetett jelölésekkel az

y   an1 y   an2 y   ...  a2 y " a1 y ' a0 y  g t  ;


n n1 n2

differenciálegyenlet, illetve explicit alakban a

y   an1 y   an2 y   ...  a2 y " a1 y ' a0 y  g  t  ;


n n1 n2

megoldását keressük. Feltettük, hogy az n-ed rendű derivált együtthatója 1, ami nem jelent
megszorítást, hiszen nyilván teljesül, hogy an ≠ 0, hiszen ha zérus lenne, az egyenlet nem lenne
n-ed rendű. ha pedig nem nulla, akkor az egyenletet oszthatjuk vele. A felírt egyenlet legyen az,
amelyet az an együtthatóval történő osztás után kapunk.
Bebizonyítjuk, hogy ez az egyenlet egyenértékű egy elsőrendű lineáris rendszerrel. Ehhez a
következőt kell tennünk. Bevezetünk új ismeretlen függvényeket, pontosan n db-ot, a következő
definícióval. Legyen

x1  t   y  t  ; x2  t   x1 '  t   y ' t  ; x3 t   x2 ' t   y " t  ;...; xn t   x 'n1 t   y 


n1
t  ;

Ha ezekből a definiáló egyenlőségekből kifejezzük a deriváltakat, a következő


differenciálegyenlet rendszer adódik

x1 '  t   x2  t   y '  t  ;
x2 '  t   x3  t   y "  t  ;
x3 '  t   x4  t   y "'  t  ;
...
xn1 '  t   xn  t   y    t  ;
n 1

xn '  t   y    t  ;
n

337
Óbudai Egyetem BGK Fejezetek a matematikából

Az utolsó egyenletet a korábbiak figyelembe vételével célszerűen az

xn '  t   a0 y  a1 y ' a2 y " ...an2 y 


n2 
 an1 y 
n 1
 g t  
 a0 x1  t   a1 x2  t   a2 x3  t   ...an2 xn1  t   an1xn t   g t 

alakban írva, a kapott rendszer, mátrixos jelölésekkel, a következő standard formára hozható.

 x1 '  t    0 1 0 0 ... 0   x1  t    0 
      
 x2 '  t    0 0 1 0 ... 0   x2  t    0 
 x3 '  t    0 0 0 1 ... 0   x3  t    0 
    ;
 ...   ... ... ... ... ... ...   ...   ... 
 x '  t   0 0 0 0 ... 1   xn1  t    0 
 n 1      
 xn '  t    a0 a1 a2 a3 ... an 1   xn  t    g  t  

Ez a rendszer tehát egyenértékű az eredeti n-ed rendű egyenlettel abban az értelemben, hogy
minden n-ed rendű, állandó együtthatójú differenciálegyenlethez, hozzárendelhető ez az
elsőrendű, normál alakú rendszer, mely x(t) megoldásának, tehát a vektor-skalár függvénynek az
első koordinátafüggvénye az n-ed rendű differenciálegyenlet megoldása, tehát x1  t   y  t  . Ezt
nevezzük átviteli elvnek.

Fogalmazzuk meg konkrét esetekre az átviteli elvet. Másodrendű lineáris differenciálegyenlet


esetében, ez a következőt jelenti. Az

y " a1 y ' a0 y  g  t  ;

differenciálegyenlet egyenértékű az

 x1 '   0 1   x1   0 
 x '    a  ;
a1   x2   g  t  
 2   0

rendszerrel. A harmadrendű

y "' a2 y " a1 y ' a0 y  g  t  ;

egyenlet egyenértékű az

 x1 '   0 1 0   x1   0 
 x '   0  
 2   0 1   x2    0  ;
 x3 '   a0 a1 a2   x3   g  t  

338
Óbudai Egyetem BGK Fejezetek a matematikából

rendszerrel. A magasabb rendű differenciálegyenlet megoldása minden esetben az y  t   x1  t 


függvény. Az átviteli elvet illusztráljuk példákkal.

2.3.18.Példa: Határozzuk meg első példaként az

y " 4 y ' 5 y  0;

homogén lineáris egyenlet általános megoldását az átviteli elv segítségével. Áttérünk az


elsőrendű rendszerre. A mondottak szerint ez a következő

 x1 '   0 1   x1 
 x '   5 4  x  ;
 2    2

Innen a szokásos módon következik a sajátértékek és sajátvektorok meghatározása. A


karakterisztikus egyenlet a következő

 1
k     det  A  E     2  4  5  0;
5 4  

Ennek az egyenletnek konjugált komplex megoldásai vannak, a sajátértékek λ1 = 2 + i, λ2 = 2 – i.


Ismét elég csak az egyik sajátértékhez tartozó sajátvektort meghatározni. A sajátvektorokat
megkapjuk, ha megoldjuk a következő homogén lineáris rendszert

 2  i 1   s1  0
1  i :        ; tehát   2  i  s1  s2  0; s2   2  i  s1;
 5 2  i   s2  0

Könnyen látható, hogy az együtthatómátrix szinguláris, mert az első egyenlet (2 – i)-szerese a


második egyenlet, így ez utóbbi elhagyható. Innek kapjuk a konjugált sajátvektorokat

 1  1  0   1  1  0 
s1        i   ; s2       i  ;
 2  i   2  1   2  i   2  1 

Az alapmátrixban csak a valós megoldások lehetnek, ezt a kapott komplex megoldás valós és
képzetes része szolgáltatja. A komplex megoldás egyrészt az

 1  2t  1  0  
x  t   e
2i t
 2  i   e  cos t  i sin t   2  i 1   ;
      

függvény valamint ennek komplex konjugáltja. Szorzással kapjuk a valós és képzetes részt

 1  0   1   0 
x  t   e2t  cos t    sin t     ie2t  sin t    cos t    ;
  2 1     2 1  

339
Óbudai Egyetem BGK Fejezetek a matematikából

A két lineárisan független valós megoldás a következő

 1  0   1  0 
x1  t   e2t  cos t    sin t    ; x2  t   e2t  sin t    cos t    ;
  2 1     2 1  

A rendszer általános megoldása az x  t   C1x1  t   C2 x2  t  ; C1 , C2  R . Ennek a vektor-skalár


függvénynek az első koordinátafüggvénye a másodrendű egyenlet általános megoldása. A
keresett megoldás tehát az

y  t   C1e2t cos t  C2e2t sin t; C1, C2  R

függvény. Az egyenletet tehát megoldottuk az átviteli elv segítségével.

2.3.19.Példa: Határozzuk meg az

y "' 2 y " 4 y ' 8 y  0;

harmadrendű lineáris differenciálegyenlet általános megoldását az átviteli elv segítségével. A


fentiek szerint ez az egyenlet egyenértékű az

 x1 '  0 1 0   x1 
 x '   0 0 1   x2  ;
 2  
 x3 '  8 4 2   x3 

elsőrendű homogén lineáris rendszerrel. A karakterisztikus egyenlet a következő

 1 0
k     det  A  E   0  1  
     2   2  4  0;
8 4 2  

Kapjuk tehát egyrészt, hogy λ1 = 2 az egyetlen valós sajátérték. Ezen kívül van még két
konjugált komplex sajátérték, λ2,3 = ±2i. Elő kell állítanunk 3 db lineárisan független megoldást.
Kezdjük a sajátvektorok meghatározásával. A megoldandó rendszer egyrészt a következő.

 2 1 0   s1  0 
1  2 :  0 2 1   s2   0  ;
 8 4 0   s3  0 

Látható, hogy az 1. sor –4-szerese a 3. sor, tehát ez utóbbi a rendszerből elhagyható. A maradék
sorvektorok azonban lineárisan függetlenek, tehát az együtthatómátrix rangja ρ = 2. Az
ismeretlenek száma k = 3, tehát a szabadságfok k – ρ = 3 – 2 = 1. A redukált rendszer

340
Óbudai Egyetem BGK Fejezetek a matematikából

 2s1  s2  0  s2  2s1
 ; azaz  ;
2s2  s3  0  s3  2s2

A λ1 = 2 sajátértékhez tartozó sajátvektor tehát például a következő s1  1 2 4 , az első


T

megoldás tehát az x1  t   e2t 1 2 4 függvény. A λ2,3 = ±2i konjugált sajátértékekhez tartozó


T

konjugált sajátvektorok az alábbi homogén lineáris rendszer megoldásából adódnak

 2i 1 0   s1  0 

1  2i :  0 2i 1   s2   0  ;
 8 4 2  2i   s3  0

Könnyen ellenőrizhető, hogy ez a mátrix is szinguláris, az 1. egyenlet 4i-szeresének és a 2.


egyenlet (2 – 2i)-szeresének összege a 3. egyenlet, így ez utóbbit a rendszerből elhagyjuk. A
redukált rendszer így a következő

 2is1  s2  0  s2  2is1
 ; azaz  ;
 2is2  s3  0  s3  2is2

Innen adódnak a konjugált komplex sajátvektorok

 1  1 0  1   1  0


s 2   2i    0   i  2  ; s3   2i    0   i  2 ;
     
 4   4   0   4   4  0 

Ezek ismeretében már megadható két lineárisan független valós megoldás, a kapott

 1   1   0  
x t   e  2i   cos 2t  i sin 2t   0   i  2  ;
        
2it

 4    4  0  
    

konjugált komplex megoldások valós és képzetes része

1 0 1 0


x2  t   cos 2t  0   sin 2t  2 ; x3  t   sin 2t  0   cos 2t  2 ;
     
 4  0   4  0 

A lineáris rendszer általános megoldása az x  t   C1x1  t   C2 x2  t   C3x3  t  ; C1 , C2 , C3  R . Az


átviteli elv szerint ennek a vektor-skalár függvénynek az első koordinátafüggvénye a
harmadrendű egyenlet megoldása, amely tehát a következő

341
Óbudai Egyetem BGK Fejezetek a matematikából

y  t   C1e2t  C2 cos 2t  C3 sin 2t; C1, C2 , C3  R

2.3.20.Példa: Határozzuk meg az

y   8 y " 16 y  0;
4

negyedrendű lineáris differenciálegyenlet általános megoldását az átviteli elv segítségével. Az


átviteli elv szerint ez az egyenlet egyenértékű az alábbi homogén lineáris rendszerrel

 x1 '   0 1 0 0   x1 
 x '  0 0 1 0   x2 
 2  ;
 x3 '  0 0 0 1   x3 
    
 x4 '  16 0 8 0   x4 

Ennek megoldását a szokott módon végezzük el. Felírjuk a karakterisztikus egyenletet

 1 0 0
0  1
 
0
k     det  A  E  
2
 2  4  0;
0 0  1
16 0 8 

Ennek az egyenletnek két db, kétszeres multiplicitású komplex megoldása van, λ1 = 2i és λ2 = –2i
kétszeres komplex gyökök. Most megkeressük a sajátvektorokat. Kezdjük a λ1 = 2i komplex
sajátértékhez tartozó sajátvektorral. Ehhez meg kell oldanunk az alábbi homogén lineáris
rendszert

 2i 1 0 0   s1  0
 0 2i 1
 0   s2  0
 ;
 0 0 2i 1   s3  0 
    
 16 0 8 2i   s4  0

Ezen rendszer együtthatómátrixának rangja 3, ugyanis a bal felső 3×3-as almátrix determinánsa
– tekintettel arra, hogy egy felső háromszögmátrixról van szó –, a főátlóbeli komponensek
szorzata, azaz (–2i)3 ≠ 0. Azonban a négy sorvektor lineárisan összefügg, hiszen ellenőrizhető,
hogy ha az első egyenletet szorozzuk –8i-vel, a másodikat –4-gyel, a harmadikat pedig –2i-vel,
és ezeket összeadjuk, akkor a 4. egyenletet kapjuk. A mátrix rangja tehát ρ = 3, az ismeretlenek
száma k = 4, tehát a rendszer szabadságfoka k – ρ = 1. A 4. egyenlet elhagyásával adódó redukált
rendszer a következő

342
Óbudai Egyetem BGK Fejezetek a matematikából

 2is1  s2  0;  s2  2is1;
 
2is2  s3  0; azaz  s3  2is2 ;
2is  s  0;  s  2is ;
 3 4  4 3

és itt egy ismeretlen szabadon választható. Azt kaptuk tehát, hogy a λ1 = 2i komplex sajátérték
algebrai multiplicitása 2, geometriai multiplicitása azonban csak 1, mert a hozzá tartozó sajátaltér
1 dimenziós. Ennek a sajátaltérnek egy bázisvektora tehát egy sajátvektor, és a konjugált λ2 = –2i
sajátértékhez tartozó konjugált sajátvektor például a következő

 1  1 0  1  1 0


 2i   0   2   2i   0   2
s1       i   ;s        i   ;
 4   4   0  2  4   4  0 
           
 8i   0   8  8i   0   8 

Ezek alapján megadhatunk két lineárisan független megoldást a szokott módon. Képezzük az

 1   1   0  
 2i      
x t   e 2it     cos 2t  i sin 2t    0   i  2   ;
 4    4  0  
    0   8 
 8i 

komplex megoldás valós és képzetes részét, azaz kapjuk a lineárisan független

1  0   cos 2t  1  0   sin 2t 


0  2   2sin 2t       
x1  t   cos 2t    sin 2t      ; x 2  t   sin 2t  0   cos 2t  2    2 cos 2t  ;
 4  0   4 cos 2t   4  0   4sin 2t 
           
0  8  8sin 2t  0  8  8cos 2t 

megoldásokat. Ez azonban csak két lineárisan független megoldás. Szükség van további két olyan
függvényre, amely ezzel a két megoldással együtt lineárisan független rendszert, tehát
alaprendszert alkot.

A megoldás keresése során a 2.3.5 pont 4.esetében alkalmazott gondolatmenetet ismételjük,


amikor is a sajátérték algebrai multiplicitása nagyobb, mint a geometriai multiplicitás. A
jelzett esetben, a már meglévő megoldástól lineárisan független megoldást a

x  t   te1t s   e1t s 
1 2

alakban kerestük, ahol s   s1 a már előállított sajátvektor, s  pedig az általánosított


1 2

sajátvektor, ez utóbbit keressük. Ugyancsak a 2.3.5. pont 4. esetében megmutattuk, hogy ez az


x(t) függvény pontosan akkor megoldás, ha teljesül, hogy
343
Óbudai Egyetem BGK Fejezetek a matematikából

 As1  s1   A  E  s1  0


  2 1  2
; azaz   2 1
;
 As  s  s  A   E  s  s

Ez az összefüggés változtatás nélkül igaz, hiszen ott nem használtuk fel, hogy a sajátértékek és a
sajátvektorok valósak, tehát ezek az összefüggések komplex esetre is igazak. Megoldandó tehát
 2 1
az  A  E  s  s inhomogén lineáris egyenletrendszer.

 2i 1 0 0   s1   1 
 0 2i 1
 0   s2   2i 
 ;
 0 0 2i 1   s3   4 
    
 16 0 8 2i   s4   8i 

Itt pontosan azt tudjuk elmondani a rendszerről és annak együttható mátrixáról, mint korábban,
tehát azt, hogy a 4. egyenlet következménye az első három egyenletnek, így a redukált rendszer a
következő

 2is1  s2  1;  s2  1  2is1;
 
 2is2  s3  2i; azaz  s3  2i  2is2 ;
2is  s  4;  s  4  2is ;
 3 4  4 3

A rendszer szabadságfoka 1, élhetünk például az s4 = 0 választással. Ebben az esetben a


megoldásvektor, más szóval az általánosított sajátvektor a következő

1,5i   0  1,5
    0
 2   2   2 
s   i  ;
 2i   0   2 
     
 0  0 0

 t 1  t  2
helyettesítve az x  t   te 1 s  e 1 s formulába, kapjuk a

 1  1,5i 
 2i   2 
x  t   te2it    e2it   ;
 4   2i 
   
 8i   0 

tehát az

344
Óbudai Egyetem BGK Fejezetek a matematikából

 1   0     0  1,5 
         
 0   2    2 0 
x  t   t  cos 2t  i sin 2t   i    cos 2t  i sin 2t      i    ;
  4   0     0   2  
   
  0   8    0   0  

komplex megoldást. Szétválasztva a valós és képzetes részeket adódik két újabb lineárisan
független megoldás.

 1 0 0 1,5 


 0 2  2  0 
 
x  t   t cos 2t    t sin 2t    cos 2t    sin 2t    
  4  0 0  2  
        
0  8 0  0 
 1 0 0 1,5 
 0 2  2   0 
       
 i t sin 2t  t cos 2t  sin 2t  cos 2t   
  4  0 0  2  
        
0  8 0  0  

Összevonás után a két valós megoldás a következő

 t cos 2t  1,5sin 2t   t sin 2t  1,5cos 2t 


 2t sin 2t  2 cos 2t   
x3  t     ; x 4  t    2t cos 2t  2sin 2t  ;
 4t cos 2t  2sin 2t   4t sin 2t  2 cos 2t 
   
 8t sin 2t   8t cos 2t 

Figyelembe véve az x1(t) és x2(t) megoldásokat, kapjuk az átviteli elv alkalmazásával kapott
lineáris rendszer általános megoldását

 cos 2t   sin 2t   t cos 2t  1,5sin 2t   t sin 2t  1,5cos 2t 


 2sin 2t   2 cos 2t   2t sin 2t  2 cos 2t   
x há  t   C1    C2    C3    C4  2t cos 2t  2sin 2t  ;
 4 cos 2t   4sin 2t   4t cos 2t  2sin 2t   4t sin 2t  2 cos 2t 
       
 8sin 2t   8cos 2t   8t sin 2t   8t cos 2t 

ahol C1, C2 , C3 , C4 R tetszőleges konstansok. A rendszer megoldását tehát előállítottuk. Az


átviteli elv alapján az eredetileg kitűzött negyedrendű differenciálegyenlet általános megoldása a
kapott vaktor-skalár függvény első koordinátafüggvénye, tehát a megoldás az

y  t   C1 cos 2t  C2 sin 2t  C3  t cos 2t 1,5sin 2t   C4  t sin 2t  1,5cos 2t  ; C1, C2 , C3 , C4  R

345
Óbudai Egyetem BGK Fejezetek a matematikából

függvény. Az egynemű tagok összevonása után, figyelembe véve, hogy a C1, C2 , C3 , C4 R


konstansok tetszőlegesek, a megoldás a némileg egyszerűbb

y  t   K1 cos 2t  K2 sin 2t  K3t cos 2t  K4t sin 2t; K1, K 2 , K3 , K 4  R

alakban is írható. Ezzel a kitűzött feladatot megoldottuk.

346
Óbudai Egyetem BGK Fejezetek a matematikából

3. fejezet

Sorelmélet

347
Óbudai Egyetem BGK Fejezetek a matematikából

348
Óbudai Egyetem BGK Fejezetek a matematikából

3.1. Numerikus sorok


Az alábbiakban felhasználjuk azokat a fogalmakat, amelyek a Matematika I. tantárgy keretében a
sorozatokkal kapcsolatosan már szerepeltek. Ezek a következők: a sorozat és a határérték
fogalma, műveletek sorozatokkal, sorozatok tulajdonságai és a határérték tételek.

3.1.1. Numerikus sorok

Induljunk ki a következő problémából. Adott egy (an), nN+ valós számsorozat. Képezzünk az
alábbi módon ebből a sorozatból egy másik (sn), nN+ sorozatot. Legyen

s1 = a1
s2 = a1 + a2
s3 = a1 + a2 + a3

sn = a1 + a2 +…+ an (nN+)

Fogalmilag az ilyen módon értelmezett sorozat is egy ugyanolyan valós sorozat, mint amiből
kiindultunk, csak a képzési szabály sajátos. Ezért a sorozatok témakörében megismert fogalmak
(monotonitás, korlátosság, határérték, konvergencia,…,stb.) és tételek változtatás nélkül igazak
ebben az esetben is.

3.1.1.Definíció: Az (an), nN+valós sorozatból az említett módon képzett (sn), nN+valós


számsorozatot az (an), nN+sorozatból képzett végtelen numerikus sornak, vagy egyszerűen
csak végtelen sornak nevezzük. Az (sn), nN+ sorozat n-edik tagját, sn-t – a képzési szabályra
jobban utaló elnevezéssel – a sor n-edik részletösszegének nevezzük. A problémához jobban
illeszkedő elnevezéseket és jelöléseket vezetünk be.

– A végtelen sort gyakran jelöljük egyszerűen  ai -vel, vagy pontosabban  ai -vel. Ez


i i0
utóbbi esetben i0 a kezdőindex, amely tetszőleges pozitív egész lehet;
n
– Az n-edik részletösszeg: sn   ai ;
i 1

– Az (sn), nN+ sorozat határértéke: lim  sn    ai .
i 1
A határértéket ebben az esetben a végtelen numerikus sor összegének nevezzük.

Egyetlen tételt emelünk csak ki a konvergenciával kapcsolatban, amelynek elsősorban elméleti


jelentősége van, azonban a sorok elméletében kiemelkedő jelentőséggel bír. Ez a tétel a Cauchy-
féle konvergencia kritérium. A tételt először sorozatokra vonatkozólag fogalmazzuk meg és
bizonyítjuk be, majd a bevezetett jelölésekkel átfogalmazzuk numerikus sorokra.

349
Óbudai Egyetem BGK Fejezetek a matematikából

3.1.1Tétel: (Cauchy-féle konvergencia kritériumsorozatokra)


Az (an), nN+ valós számsorozat akkor és csak akkor konvergens, ha tetszőleges ε > 0
hibakorláthoz létezik olyan n0 pozitív egész szám, ún. küszöbindex, hogy tetszőleges n, m>n0
esetén teljesül, hogy an  am   .
Bizonyítás: Ezt a kritériumot sorelméleti fontossága miatt igazoljuk.
a) szükségesség: Elsőként tegyük fel, hogy a sorozat konvergens és határértéke az A valós szám.
Legyen ε tetszőleges pozitív szám. Ekkor a konvergencia miatt ε/2-höz létezik n0 küszöbindex

olyan, hogy ha n>n0 akkor teljesül, hogy an  A  . Használjuk most fel a háromszög
2
egyenlőtlenséget a tételbeli különbség becsléséhez. Legyen n, m>n0 , ekkor

 
an  am  an  A  A  am  an  A  am  A   
2 2

a szükségességet ezzel igazoltuk.


b) elégségesség: Induljunk ki abból, hogy ha egy sorozatra teljesül a tételbeli feltétel (Cauchy-
féle sorozat), akkor az korlátos. Ha ugyanis n, m>n0 és az n-et rögzítjük, akkor az an  am  
egyenlőtlenség azt jelenti, hogy a sorozatnak legfeljebb n0 tagja van az an valós szám ε sugarú
környezetén kívül, vagyis véges sok tag, ezek között van legnagyobb és legkisebb. Alkalmazzuk
most a Bolzano-Weierstass-féle kiválasztási tételt, mely szerint korlátos sorozatnak létezik
konvergens részsorozata. Legyen ennek határértéke A. Eszerint tetszőleges ε esetén ε/2-höz

létezik olyan n1 küszöbszám, hogy ha az ni index nagyobb, mint n1 akkor ani  A  . Másrészt
2

a feltétel szerint létezik n2 küszöbszám olyan, hogy ha n, ni > n2 akkor igaz, hogy an  ani  .
2
Innen ismét a háromszög egyenlőtlenség alkalmazásával, ha n0  max n1, n2  , akkor n, ni>n0
esetén már adódik az állítás:

 
an  A  an  ani  ani  A  an  ani  ani  A   
2 2

ugyanis ez az egyenlőtlenség pontosan azt jelenti, hogy a sorozat konvergens és határértéke A. ■

Ha a 3.1.1. tételt a részletösszegek (sn), nN+sorozatára alkalmazzuk akkor változtatás nélkül


igaz. A különbség csak a jelölésekben és a szóhasználatban van. Ezzel kapcsolatban vegyük
észre, hogy ha n > m, akkor az sn – sm különbség éppen az (m + 1)-edik tagtól az n-edik tagig
történő összegzést jelenti.

3.1.2. Tétel: (Cauchy-féle konvergencia kritériumnumerikus sorokra)


A  an numerikus sor akkor és csak akkor konvergens, ha tetszőleges ε > 0 (hibakorlát) esetén
létezik olyan n0 pozitív egész szám (küszöbindex), hogy tetszőleges n, m > n0 (n > m) esetén
n
teljesül, hogy  ai   . ■
i  m 1

350
Óbudai Egyetem BGK Fejezetek a matematikából

Ezt a kritériumot az alábbiakban többször is alkalmazzuk majd a vizsgálatainkban.

Két kérdést teszünk majd fel vizsgálataink során egy numerikus sorral kapcsolatban:
1. Létezik-e határértéke, tehát létezik-e a sornak összege?
2. Ha létezik a sornak összege, akkor mi az összeg?

Mint látni fogjuk az 1. kérdésre nagyon sok esetben tudunk majd válaszolni, de a 2. kérdés az
általános esetben akkor is bonyolult, ha tudjuk, hogy a sornak van összege. Ennek
megállapítására csak különleges esetekben van módszer, általában ad-hoc módszereket
alkalmazunk. Az egyetlen olyan numerikus sor, amelynek összegzésére általános érvényű
összefüggéseket tudunk mondani, a mértani sor.

3.1.2. Mértani sor


A legegyszerűbb sor vizsgálatával kezdjük. A „végtelen” mértani sort (a végtelen jelző
elhagyható) a mértani sorozatból képezzük. Emlékeztetőül megjegyezzük, hogy a q kvóciensű
mértani sorozatot az alábbi módon értelmezzük.

an = qn–1, nN+

Írjuk fel a sorozat néhány tagját: 1, q, q2, q3, …, qn – 1,… Mint ismeretes, a mértani sorozat az
alábbi konvergencia tulajdonságokkal rendelkezik.

 , ha q  1
 1, ha q  1
lim qn 1 
 
 0, ha  1  q  1

divergens,ha q  1

3.1.2.Definíció: Az an = qn–1, nN+ mértani sorozatból képezett numerikus sort (végtelen)


mértani sornak nevezzük. Ennek n-edik részletösszege

n
sn   qi 1  1  q  q 2  ...  q n 1
i 1

A mértani sorozat határérték tulajdonságai alapján meg tudjuk állapítani, hogy a mértani sor mely
esetekben konvergens, sőt azt is, hogy mi az összege. Ehhez segítségül hívjuk a mértani sorozat
első n db tagjának összegére vonatkozó összegképletet.

qn 1
sn  1  q  q 2  ...  q n 1  ; ha q  1
q 1

Az előbbiek alapján világos, hogy a sor csak a –1 < q < 1 esetben konvergens, és ekkor
határértéke

351
Óbudai Egyetem BGK Fejezetek a matematikából


1 1
lim sn   qi 1   ; ha q  1
i 1
q 1 1  q

Ha q> 1 akkor a sor összege +∞, ha q ≤ –1 akkor a sornak nem létezik összege. Ha q = 1 akkor ez
az összegképlet nem használható, de ekkor sn = 1 + 1 + 1+… + 1 = n, a sorösszeg nyilván ekkor
is végtelen.
Általánosítsuk most a fenti sort. Legyen aR egy 0-tól különböző valós szám. Végtelen mértani
sornak nevezzük az an = a∙qn–1 sorozatból képezett végtelen sort is, melynek n-edik részletösszege
a következő.

n
sn   aqi 1  a  aq  aq 2  ...  aq n 1
i 1

Világos, hogy ennek a sornak a konvergenciájáról pontosan azokat az állításokat mondhatjuk el,
mint az előbbiekben. Az „általánosított” mértani sor pontosan akkor konvergens, ha –1 < q < 1,
és ekkor a sor összege:


a
lim sn   aqi 1  a  aq  aq 2  ...  aq n 1  ...  ; ha  1  q  1
i 1
1 q

A mértani sor esetében tehát egyszerűen megállapítható a konvergencia ténye és a sor összege is
könnyen kiszámítható.

3.1.1.Példa: Számítsuk ki az alábbi mértani sor összegét, ha létezik.

3k 1
k
3  3k 3
 2k 1
  21  4k   6   4 
k 1 2 k 1 k 1

3
Az átalakítások mutatják, hogy a kvóciens, q = ]–1, 1[, tehát a sor konvergens. Összege
4
3
 6
3k 1
 22k 1  43  18
k 1 1
4

3.1.2. Példa: Határozzuk meg az A = 0,12435353535… végtelen szakaszos tizedes tört


közönséges tört alakját. Világos, hogy az A szám felírható egy végtelen numerikus sor alakjában
a következő módon

124 35 35 35 124 35  1 1 
A     ...    1   ... 
1000 105 107 109 1000 105  102 104 

352
Óbudai Egyetem BGK Fejezetek a matematikából

Ebben felfedezhető egy mértani sor, melynek első tagja 1, kvóciense pedig q = 0,01. Mivel a
kvóciens kisebb, mint 1 és nagyobb, mint –1 a mértani sor konvergens. Az összegképlet alapján
az összegzés könnyedén végrehajtható.

124 35 1 124 35 100 124 35 12311


A        
5
1000 10 1  1 1000 100000 99 1000 99000 99000
100

Egy paradoxon feloldásáról. Mielőtt folytatnánk a szigorúan matematikai vizsgálatokat a


témakörben, megemlítünk egy filozófiai problémát, a Zénón által leírt paradoxont (Zénón, görög
filozófus, i.e. 3-4. sz.), amely a leggyorsabb görög futó, Akhilleusz és a teknős futóversenyéről
szól. Mivel Akhilleusz a leggyorsabb futó, x1 = 100 lépés kezdeti előnyt ad a teknősnek, majd
kezdődik a „verseny”.
a) Elsőként fizikai, vagy ha tetszik, tapasztalati oldalról közelítjük a kérdést. Ekkor világos, hogy
Akhilleusz utoléri a teknőst. Egyszerű kinematikai problémaként kezelve, ha Akhilleusz v
sebességgel fut a teknős pedig u (u < v) sebességgel halad, és a teknős előnye kezdetben x1, akkor
a találkozásig eltelt t időre vonatkozólag felírható a következő egyenlet: vt  ut  x1 . Ezt a t időre
megoldva kapjuk azt az időtartamot, amely ahhoz szükséges, hogy Akhilleusz utolérje a teknőst.

x1
t
v u

b) Filozófiai oldalról megközelítve a kérdést, Zénón arra a következtetésre jutott, hogy


Akhilleusz nem érheti utol a teknőst. A következő módon gondolkodott: Ahhoz, hogy Akhilleusz
odaérjen ahol a teknős volt az indulás pillanatában, szükség volt t1 időtartamra. Világos, hogy
x
vt1  x1 , ahonnan t1  1 . Ez egy pozitív mennyiség. Ennyi idő alatt a teknős megtett
v
u
x2  ut1  x1 utat. Ahhoz, hogy Akhilleusz is megtegye ezt az utat, szükséges t2 időtartam.
v
x
Világos, hogy vt2  x2 ahonnan t2  2 . Ha itt felhasználjuk az előző eredményt, a t2 időtartamra
v
1u u
a következő adódik: t2  x1  2 x1 . Ez ismét egy pozitív mennyiség. Ennyi idő alatt a teknős
vv v
u2
ismét távolodott, megtett x3  ut2  2 x1 utat. Akhilleusznak t3 időtartamra van szüksége, hogy
v
x
ezt lefussa. Erre felírható, hogy vt3  x3 , ahonnan t3  3 . Helyettesítve ismét a legutóbbi
v
2
u
eredményt az adódik, hogy t3  3 x1 . Ismét egy pozitív mennyiség. A gondolatmenet
v
u n1
folytatható, könnyen látható, hogy az n-edik szakaszon az időtartam tn  n x1 . Ugyancsak
v

353
Óbudai Egyetem BGK Fejezetek a matematikából

pozitív mennyiség. Zénón azt állította ezek alapján, hogy Akhilleusz nem érheti utol a teknőst,
mert végtelen sokszor ismétlődik az a folyamat, hogy Akhilleusznak egy pozitív időtartamra van
szüksége egy adott útszakasz megtételéhez. Vagyis egy olyan végtelen tagú összeg a keresett
időtartam, melynek minden tagja pozitív. Ez az összeg Zénón szerint, csak a végtelen lehet.
Az ókori görög filozófusoktól nem lehet elvárni, hogy a határérték és a végtelen sorok fogalmát
megfelelő módon alkalmazzák. Gondolatmenetében nyilván az a hibás, hogy azt hitte,
végtelen sok pozitív mennyiség összege szükségképpen végtelen. Mi már tudjuk, hogy ez nem
igaz, ezáltal feloldjuk a paradoxont.

Adjuk össze a kiszámított időtartamokat és összegezzük azokat.

x1 u x1 u 2 x1 u n1 x1
t  t1  t2  t3  ...  tn  ...     ...  n1  ..
v v v v2 v v v

u
Vegyük észre, hogy ez éppen egy mértani sor, melynek kvóciense q  . Mivel a feltétel szerint
v
u<v, ezért q< 1 és nyilván q> 0, tehát a mértani sor konvergens. Az összegző képlet
alkalmazásával azt kapjuk, hogy
x1 x1
 n 1
u x x
t   n1 1  v  v  1
n 1 v v 1 u v  u v u
v v

Amely megegyezik az elemi számítás eredményével.

3.1.3. A parciális törtekre bontás módszere


Létezik egy viszonylag általános módszer, a parciális törtekre bontás vagy elemi résztörtekre
bontás módszere, amellyel bizonyos típusú sorok összegét meg lehet határozni. A módszer ismert
a racionális törtfüggvények integrálásának témaköréből, és a későbbiekben látjuk, hogy többek
között még hasznos lesz a Taylor-sorfejtés és az inverz Laplace-transzformáció témakörében is.
Numerikus sorok esetében a módszer akkor alkalmazható, ha a sorozat általános tagja – amelyből
a numerikus sort képeztük – egy racionális törtfüggvény. Konkrét példákon mutatjuk be a
módszer alkalmazását.
1
3.1.3. Példa: Vizsgáljuk a  végtelen numerikus sort. A módszer lényege, hogy az
n 1 
n n  1
általános tagot, a racionális törtfüggvényt, elemi résztörtek összegére bontjuk. Ebben az esetben
ez az alábbi összegre bontást jelenti:

1 A B
 
n  n  1 n n  1

Kérdés az A és B valós számok értéke. Hozzuk a törteket közös nevezőre:

354
Óbudai Egyetem BGK Fejezetek a matematikából

1 A  n  1  Bn

n  n  1 n  n  1

Mivel itt a nevezők egyenlők a számlálóknak is azonosan egyenlőknek kell lennie tetszőleges
természetes n-re. Ha a nevezőnek egyszeres gyökei vannak, mint ebben a példában, akkor
célszerű a nevező gyökeit helyettesíteni. Ha n = 0 akkor adódik, hogy A = 1, ha n = –1 akkor
pedig B = –1. Tehát a parciális törtekre bontott alak a következő:

1 1 1
 
n  n  1 n n  1

Alkalmazzuk ezt a felbontást első lépésben az n-edik részletösszeg meghatározásánál:

n n
1 1 1 
sn      
i 1 
i i  1 i 1  i i  1 
 1 1 1 1 1  1 1 1 1 
 1            ...      
 2  2 3  3 4  n 1 n   n n  1 

Innen jól látható, hogy az összeg tagjai páronként eltűnnek, hiszen összegük zérus, megmarad az
első és utolsó tag.
1
sn  1 
n 1

Ezzel meg tudtuk határozni az n-edik részletösszeget „zárt alakban”. Ebből következik a sor
összege.

1  1 
lim sn    lim 1   1
i 1 
i i  1  n 1 

A határérték tehát 1, vagyis a sor összege 1. A módszerrel tehát ki tudtuk számítani a sor
összegét. A példán keresztül látható a módszer alkalmazhatósága.

8
3.1.4. Példa: Vizsgáljuk meg konvergencia szempontjából a  n3  4 n numerikus sort. Az
n 3
előző példabeli eljárás mintájára elvégezzük a tört elemi résztörtekre bontását:

8 8 A B C 1 2 1
      
n3  4n n  n  2  n  2  n  2 n n  2 n  2 n n  2

Ezek után vizsgáljuk meg a sor n-edik részletösszegét:

355
Óbudai Egyetem BGK Fejezetek a matematikából

n n
8  1 2 1 
sn       
i 3
i  i  2  i  2  i 3  i  2 i i  2 
1 2 1   1 2 1   1 2 1   1 2 1   1 2 1   1 2 1 
                     ...        
1 3 5   2 4 6   3 5 7   4 6 8   n  3 n 1 n  1   n  2 n n  2 

Ebben az összegben számos tagot hármasával tudunk csoportosítani úgy, hogy az összeg zérus.
Az összevonást elvégezve, a megmaradó tagokat feltüntetve kapjuk az n-edik részletösszeget
"zárt alakban":

n
 1 2 1  2 1 2 1 1 1 2 1 2 1 1
sn       1           
i 3 
i2 i i2 3 2 4 3 4 n 1 n 1 n n n  1 n  2

ennek az összegnek a határértéke a sor összege. Mivel az utolsó 6 tag mindegyike 0-hoz tart, a
sor összege az első 5 tag összegével egyezik meg:


8 2 1 2 1 1 11
 n3  4n  1  3  2  4  3  4  12
n 3

3.1.4. Konvergencia kritériumok


Az alábbiakban olyan tételeket ismertetünk, amelyekkel eldönthető egy numerikus sorról, hogy
létezik-e határértéke vagy nem. Ezeket a módszereket nevezik konvergencia-kritériumoknak. A
konvergencia kritériumok azonban nyitva hagyják azt a kérdést, hogy amennyiben a kérdéses
sornak van összege, mi az összeg, és nem adnak programot a sorösszeg meghatározására sem.
Erre nem is léteznek általános módszerek. Néhány összegzést azonban a példákban bemutatunk.

Kezdjük egy egyszerű szükséges feltétellel.

3.1.3. Tétel: (A konvergenciaszükséges feltétele). Ha a ∑an sor konvergens, akkor lim(an) = 0.

Bizonyítás: A tétel állítása egyszerűen következik a 3.1.2. tételből. Ha a sor konvergens, akkor
tetszőleges ε-hoz létezik a tételnek megfelelő n0 küszöbindex. Alkalmazzuk a Cauchy-kritériumot
tetszőleges m > n0 és n = m + 1 esetére. Ekkor azonnal következik, hogy ha m > n0 akkor
am  0  am  0 , és éppen azt jelenti, hogy a sorozat 0-hoz tart. ■

Ez azt jelenti, hogy ha egy sorozatból végtelen sort képezünk, csak abban az esetben lehet
konvergens a sor, ha a sorozat a 0-hoz konvergál. Az alkalmazás fordított logikával működhet.
Ha egy sorozatról igazoljuk, hogy nem tart nullához, akkor a belőle képezett sor biztosan
divergens. Kihangsúlyozzuk, hogy a feltétel nem elégséges, tehát létezik olyan sor, amelyre igaz
a lim(an) = 0 feltétel és divergens. A későbbiekben látunk példát ilyen sorokra.

356
Óbudai Egyetem BGK Fejezetek a matematikából

3n  1  3n  1  3
3.1.5.Példa: Konvergens-e a  2n  5 numerikus sor? Mivel lim     0 , a sor
 2n  5  2
n 1
biztosan divergens.

Az alábbiakban elégséges feltételeket adunk a konvergenciára vonatkozólag. A tételeket a sorok


két osztályára fogalmazzuk meg. Először pozitív tagú majd váltakozó előjelű sorokat vizsgálunk.

3.1.4.1. Pozitív tagú sorokra vonatkozó kritériumok


A szakirodalomban találkozhatunk a „nemnegatív tagú sor” elnevezéssel is. Ez abban különbözik
a címben szereplő sortól, hogy a sorozat tagjai között, amelyből a sort képezzük, előfordulhat a
nulla. Ez azonban nyilván semmilyen szempontból nem befolyásolja a sor konvergenciáját, ezért
a vizsgálatainkból kihagyjuk.
A  an sor értelem szerűen pozitív tagú, ha an > 0 minden nN+ esetén. Kihangsúlyozzuk, hogy
pozitív tagú sorok esetén két eset fordulhat elő. Ha a sor konvergens, akkor az összeg
nyilvánvalóan véges érték, egy valós szám és az is nyilvánvaló, hogy az összeg csak pozitív szám
lehet. Ha azonban a sor divergens, akkor az összeg szükségképpen +∞.

3.1.4.Tétel: ( Összehasonlító kritérium vagy Majoráns/Minoráns kritérium).


Legyenek ∑an és ∑bn pozitív tagú sorok. Ha létezik olyan n0 index, hogy n>n0 esetén an ≤ bn és
a) ∑bn sor konvergens, akkor ∑an sor is konvergens (Majoráns-kritérium).
b) ∑an sor divergens, akkor ∑bn sor is divergens (Minoráns-kritérium).

Az a) esetben a ∑bn sort a ∑ansor konvergens majoránsának nevezzük, a b) esetben pedig azt
mondjuk, hogy a ∑an sor a ∑bnsor divergens minoránsa.

Bizonyítás: A tétel triviálisan igaz. Hiszen ha pl. az a) pontban a majoráns sor konvergens, akkor
az összege véges, valós szám. Ekkor a ∑an sor összege szükségképpen véges, hiszen a ∑bnsor
összegénél kisebb vagy egyenlő pozitív való szám lehet csak, ami éppen azt jelenti, hogy a
majorált sor konvergens. ■

A tétel alkalmazásaképpen vizsgáljunk meg két nevezetes sort.

1
3.1.6.Példa: Vizsgáljuk meg konvergencia szempontjából a  n ún. harmonikus sort. Írjuk fel a
n 1
sort „kibontva”, majd becsüljük az egyes tagokat megfelelően csoportosítva.

357
Óbudai Egyetem BGK Fejezetek a matematikából

1 1 1 1 1 1 1 1
 n  1  2   3  4    5  ...  8    9  ...  16   ... 
n 1
1 1 1 1 1  1 1
 1         ...      ...    ... 
2 4 4 8 8   16 16 
1 1 1 1
 1      ...
2 2 2 2

Tehát alulról tudtuk becsülni a harmonikus sort egy numerikus sorral, azaz minoráltuk. Az
1
1   sor pedig nyilvánvalóan divergens, összege végtelen, ez a sor tehát egy divergens
n 1
2
minoráns sor. Ebből következik, hogy a harmonikus sor divergens. Megjegyezzük, hogy
1
lim    0 , tehát a szükséges feltétel teljesül (3.1.3.tétel), a sor azonban divergens.
n
A sor elnevezésével kapcsolatban megjegyezzük, hogy a sort azért nevezzük harmonikusnak,
mert arra a sorozatra, amelyből képezzük, igaz a következő: minden tagja a hozzá képest
szimmetrikusan elhelyezkedő tagok harmonikus közepe. Valóban

2  1 1  2 2 1
H  a, b   ; Eszerint : H  ,    
1 1
  n  k n  k   n  k    n  k  2 n n
a b

1
3.1.7.Példa: Vizsgáljuk meg konvergencia szempontjából a  n2 numerikus sort. Alkalmazzuk
n 1
az alábbi nyilvánvaló becslést.

1 1
 ; ha n  2
n2  n  1 n

1
Vegyük észre, hogy a   n  1 n sor az első tagtól eltekintve ugyanaz a sor, mint amit a 3.1.3.
n2
példában vizsgáltunk. Ott kiderült, hogy ez a sor konvergens. Tehát találtunk egy olyan
1
konvergens numerikus sort, amely a  sort n ≥ 2 esetén majorálja. Tehát ez a sor a vizsgált
2
n 1 n
1
sor konvergens majoránsa, azaz a  sor konvergens.
2
n 1 n

Megjegyezzük ezzel a sorral kapcsolatban azt az Euler által bizonyított érdekes tényt, hogy a sor

1 2
összege  n2  6
. Ezt az egyenlőséget jelen pillanatban nem tudjuk igazolni, mert nincs a
n 1
kezünkben a szükséges apparátus, azonban később a Fourier-sorok elméletében, a 3.3 fejezetben

358
Óbudai Egyetem BGK Fejezetek a matematikából

bizonyítani fogjuk. Hangsúlyozzuk azonban ennek a ténynek a fényében azt, hogy a végtelen
tagú összegek sokszor másképpen viselkednek, mint a véges összegek. Erre a későbbiekben is
rámutatunk majd más szempontból. Ebben a példában az látszik, hogy az összeg tagjai mind
racionális számok, az összeg azonban irracionális. Végtelen sok racionális szám összege tehát
nem szükségképpen racionális. Véges összeg esetében ilyen természetesen nem fordulhat elő.

3.1.5.Tétel:( Cauchy-féle gyök-kritérium)


Tegyük fel, hogy a ∑an sor pozitív tagú, és tegyük fel, hogy az  n an  , nN+ sorozat

 
konvergens. Legyen lim n an  q . Ezen feltételek és jelölés esetén, ha q< 1 akkor a sor
konvergens, ha q> 1 akkor a sor divergens, és ha q = 1 akkor mindkét eset lehetséges, ebben az
utóbbi esetben tehát a gyökkritériummal nem dönthető el a konvergencia.

Bizonyítás:
A tétel a majoráns kritériummal igazolható. A konvergencia esetét tekintve ha q< 1, akkor
 
1 – q> 0. Legyen ε = (1 – q)/2. Ekkor ε > 0 továbbá q + ε < 1 is teljesül. Mivel az n an , nN+
sorozat konvergens és határértéke q, ezért ehhez az ε-hoz létezik olyan n0 küszöbindex, hogy ha
n>n0, akkor n an  q   azaz an   q    . Mivel q + ε< 1 a q   
n i
sor egy konvergens
i 1
mértani sor, amely majorálja a ∑an sort, tehát a 3.1.4. tétel szerint a ∑an sor konvergens. A
divergencia hasonló módon igazolható. ■

3.1.8. Példa: Vizsgáljuk meg, hogy konvergens-e a

n
 2n 
  n2  2n 
n 1

numerikus sor. A képletre tekintve azonnal látszik, hogy célszerű alkalmazni a gyök-kritériumot.

n
 2n   2n 
lim n 
2   lim  2   0 1
n n n n

Tehát a sor konvergens. A sor összegének meghatározására azonban nincs általános módszer.

3.1.9. Példa: Vizsgáljuk meg, hogy konvergens-e a

n2
 3n  2 
  3n  5 
n 1

numerikus sor. A képlet alapján ismét látszik, hogy célszerű alkalmazni a gyök-kritériumot.

359
Óbudai Egyetem BGK Fejezetek a matematikából

n
 2  2
n2 n  1  7
 3n  2   3n  2  3n e3
lim n   lim    lim    e3  1.

 3n  5   3n  5  5  5
 1 
 3n  e3

Mivel a határérték nagyobb, mint 1, a sor divergens.

3.1.10. Példa: Illusztráljuk azt az esetet, amikor q = 1. A 3.1.6. és 3.1.7. példák eredményére
támaszkodunk. A 3.1.6. példa alapján tudjuk, hogy a harmonikus sor divergens, másrészt
1 1 1
lim n  lim   1 . A 3.1.7. példabeli sor azonban konvergens, de ebben az esetben is igaz,
n n n 1
1 1 1
hogy lim n  lim   1 . Megmutattuk tehát, hogy a q = 1 esetben nem
 
2 2
n nn 12

következtethetünk sem a konvergenciára sem a divergenciára. Ha egy vizsgálat során q = 1


eredmény adódik, akkor egy másik kritériumot kell alkalmazni a konvergencia eldöntésére.

A 3.1.5. tétellel szoros rokonságban áll az alábbi kritérium.

3.1.6.Tétel:( d’Alembert-féle hányados-kritérium)


a 
Tegyük fel, hogy a ∑an sor pozitív tagú, és tegyük fel, hogy az  n 1  , nN+ sorozat
 an 
a 
konvergens. Vezessük be a lim  n 1   q jelölést. Az említett feltételekkel és a bevezetett
 an 
jelölés mellett, ha q< 1 akkor a sor konvergens, ha q > 1 akkor a sor divergens, és ha q = 1 akkor
mindkét eset lehetséges, ebben az utóbbi esetben tehát a hányados kritériummal nem dönthető el
a konvergencia.
Bizonyítás: A 3.1.5. tétel bizonyításához hasonlóan ismét a majoráns kritériumot használjuk. A
konvergencia esetét tekintve ha q < 1, akkor 1 – q > 0. Legyen ε = (1 – q)/2. Ekkor ε > 0 továbbá
a 
q + ε < 1 is teljesül. Mivel az  n 1  , nN+ sorozat konvergens és határértéke q, ezért ehhez az
 an 
a
ε-hoz létezik olyan n0 küszöbindex, hogy ha n>n0, akkor n 1  q   azaz an 1   q     an .
an
an  2   q     an ; an 3   q     an ;...; an  k   q     an ;...
2 3 k
Hasonlóan adódik, hogy

Ebból az következik, hogy az  q     an ; k  Z  sorozat egy 1-nél kisebb kvóciensű mértani


k

q   
k
sorozat, a belőle képezett mértani sor konvergens. Tehát a  an egy konvergens
k
mértani sor, az említett okok miatt a ∑an sor egy konvergens majoránsa. Ebből következik, hogy
a ∑an sor konvergens. A divergencia hasonlóan igazolható. ■

360
Óbudai Egyetem BGK Fejezetek a matematikából

3.1.11. Példa: Vizsgáljuk meg, hogy konvergens-e a

 3n  2 
  n! 
n 1  

numerikus sor. Mivel a képletben hatványozás és faktoriális szerepelnek, világos, hogy könnyen
oszthatjuk a szomszédos tagokat. Alkalmazzuk tehát a hányados-kritériumot.

a  3n 3 n!  3
lim n 1  lim     lim  0 1
an 
  n  1 ! 3n  2 
 n  1

tehát a numerikus sor konvergens. Ebben az esetben „véletlenül” meg tudjuk majd mondani a sor
összegét a Taylor-sorok elméletének tárgyalása során. Ez ugyanis egy nevezetes függvény
Taylor-sorának adott pontbeli helyettesítési értéke. A válaszra még visszatérünk később a 3.2.
fejezetben.

3.1.12. Példa: Vizsgáljuk meg hogy konvergens-e a

 nn 
  n! 
n 1  

numerikus sor. Ismét a hányados kritérium alkalmazása látszik célszerűnek.

an 1   n  1n 1 n !   n 1 
n
 1
n
lim  lim     lim    lim 1    e  1
an   n  1! nn   n   n
 
Tehát ez a sor divergens, az összeg ∞.

3.1.13. Példa: Ismét illusztráljuk azt az esetet, amikor q = 1. Ugyancsak a 3.1.6. és 3.1.7. példák
eredményére támaszkodunk. A 3.1.6. példa alapján tudjuk, hogy a harmonikus sor divergens,
 1 
 
n 1 
másrészt lim 
n
 lim  1 . A 3.1.7. példabeli sor azonban konvergens, de ebben az
1 n 1
 
n
esetben is igaz, hogy
 1 
 
  n  12  2
lim    lim  n   1 .
 
 1   n 1 
 2
n 

361
Óbudai Egyetem BGK Fejezetek a matematikából

Megmutattuk tehát, hogy a q = 1 esetben nem következtethetünk sem a konvergenciára sem a


divergenciára. Ha egy vizsgálat során q = 1 eredmény adódik, akkor egy másik kritériumot kell
alkalmazni a konvergencia eldöntésére.

Bizonyos esetekben improprius integrálok kiszámításával is eldönthető a konvergencia ténye.

3.1.7.Tétel:( Integrálkritérium)
Tegyük fel, hogy létezik olyan n0N+pozitív egész szám, hogy az f valós függvény az [n0, +∞[
intervallumon monoton csökkenő pozitív függvény. Ekkor a

 f (i )
i  n0
numerikus sor és az

 f ( x)dx
n0

improprius integrál egyszerre konvergens illetve divergens. Másképpen fogalmazva, ha az


integrál konvergens akkor a sor is konvergens, és fordítva, továbbá ha az integrál divergens akkor
a sor is divergens és fordítva.
Bizonyítás: (vázlat)
A bizonyítást inkább csak szemléltetjük. Ha összehasonlítjuk a végtelen összeget az improprius
integrállal, akkor világos, hogy az összeg az integrálnak éppen egy olyan integrál közelítő
összege, amelyben a részintervallumok mind egységnyi hosszúak, és a függvényértéket minden
részintervallumban a bal oldali végpontban számoljuk. Ha tekintetbe vesszük, hogy a függvény
monoton csökkenő, akkor az is látható, hogy ez egy felső összeg. Nem meglepő tehát a tétel
állítása, hiszen arról szól, hogy az integrál és a közelítő összege egyszerre konvergens illetve
divergens. ■

3.1.14. Példa: Vizsgáljuk meg hogy konvergens-e a

 1 
  n2  1 
n 1

1
numerikus sor. Definiáljuk az f függvényt a következő módon: f  x   . Világos, hogy a
2
x 1
függvény pozitív és az is, hogy a pozitív valós számok halmazán a függvény szigorúan monoton
csökkenő, hiszen a nevező szigorúan monoton növekszik. Ez azt jelenti, hogy most n0 = 1
választással alkalmazhatjuk az integrál kritériumot.


1    
 x2  1 dx  arctg x1  lim arctg x  arctg1 
x  2

4

4
1

362
Óbudai Egyetem BGK Fejezetek a matematikából

Az improprius integrál konvergens, tehát az integrál értéke véges. Ez a kritérium szerint azt
jelenti, hogy a numerikus sor konvergens. Hangsúlyozzuk azonban, hogy arról nincs szó, hogy a
sor összege megegyezne az integrál értékével. Csak annyit állíthatunk, hogy a sor összege véges.

3.1.15. Példa: Vizsgáljuk meg hogy konvergens-e a

 n 
  n2  1 
n 1

x
numerikus sor. Definiáljuk az f függvényt a következő módon: f  x  
. Az világos, hogy a
2
x 1
függvény pozitív a pozitív valós számok halmazán. A függvény monotonitása azonban nem

nyilvánvaló. Ehhez képezzük a derivált függvényt: f ' x 


 x 2  1  x  2 x

1  x2
. Ebből
 x  1  x  1
2 2 2 2

már következik, hogy ha x ≥ 1 akkor a függvény monoton csökkenő, tehát az integrál kritérium
ismét alkalmazható n0 = 1 választással.

 
   

dx  ln x 2  1   lim ln x 2  1  ln 2    ln 2  
x 1 2x 1
 2
dx  
2 x2  1 2  1 x 
1 x 1 1

Az improprius integrál divergens, amiből a kritérium szerint az következik, hogy a numerikus sor
divergens, az összege ∞.

3.1.4.2. Váltakozó előjelű sorokra vonatkozó konvergenciakritérium


Az előzőekben hangsúlyozottan pozitív tagú sorokra vonatkozó kritériumokat vizsgáltunk. Ebben
a pontban olyan sorokat vizsgálunk, amelyekben a szomszédos tagok előjele eltérő, egy pozitív
tagot negatív követ és fordítva. Az ilyen sorokat nevezzük váltakozó előjelű vagy másképpen
alternáló soroknak. A pontos definíció a következő:

3.1.3.Definíció:A∑an sort váltakozó előjelűnek nevezünk, ha teljesül, hogy an∙an+1< 0, ha nN+.

Váltakozó előjelű sorokra vonatkozik Leibniz tétele.

3.1.8.Tétel: ( Leibniz-kritérium)
Legyen a ∑an egy váltakozó előjelű sor, és tegyük fel, hogy az abszolút értékek  an  , nN+
sorozata monoton csökkenő módon a 0-hoz tart. Ekkor a sor konvergens.
Bizonyítás: A bizonyításhoz a Cauchy-féle konvergencia kritériumot használjuk. Felhasználjuk,
hogy az abszolút értékek sorozata monoton csökkenő, azaz ak  ak 1 minden pozitív egész

363
Óbudai Egyetem BGK Fejezetek a matematikából

k-ra. Ekkor egy bizonyos n0 küszöbindexnél nagyobb n, m egészekre, amelyekre m < n, páratlan
számú tag esetén teljesül, hogy

n
 ai  am 1  am  2  am  3  ...  an 1  an  am 1  am  2  am  3  ...  an 1  an
i  m 1

Legyen most ε > 0 tetszőleges, és legyen n0 olyan egész, amelyre m > n0 esetén igaz, hogy
am   . Ilyen n0 és ε létezik, hiszen a feltétel szerint az abszolút értékek sorozata 0-hoz tart. Ha
az előbbi egyenlőtlenségben figyelembe vesszük a monoton csökkenést, akkor azt kapjuk, hogy
n > m > n0 esetén

n
 ai  am 1   am  2  am 3   ...   an 1  an   am 1  am  
i  m 1

ugyanis a zárójelezett különbségek mind nem negatívok a monoton csökkenés miatt. Ha páros
számú tagot veszünk figyelembe az összegben, akkor az egyenlőtlenség ugyancsak igaz, hiszen
az utolsó tag előjele az összegben negatív, tehát az összeghez egy nem pozitív számot veszünk
hozzá. A kapott egyenlőtlenség a Cauchy kritérium szerint éppen azt jelenti, hogy a váltakozó
előjelű sor konvergens. ■

3.1.16. Példa: Későbbi vizsgálatok érdekében tűzzük ki az alábbi, nagyon egyszerű példát.
Vizsgáljuk meg, hogy konvergens-e a

 n 1 1 
   1 
n
n 1

numerikus sor. Ezt az alternáló sort „hiperharmonikus” sornak nevezzük. Az abszolút


értékekből képezett sor a harmonikus sor (3.1.6. példa), amelyről tudjuk, hogy divergens.
1
Számítások nélkül azonnal nyilvánvaló, hogy az  an     ; n  N  sorozat szigorúan monoton
n
csökkenő és a 0-hoz tart. Ez azt jelenti, hogy a hiperharmonikus sor Leibniz típusú, tehát
konvergens.

Ebben az esetben kiszámítjuk a sor összegét is. Ennek egyik oka, hogy az eredmény nevezetes,
másrészt illusztrálja a számítás azt is, hogy az összegzés módszere mennyire specifikus.
Vizsgáljuk meg elsőként a sor egy páros indexű részletösszegét. Azonos átalakításokkal a
következőt kapjuk.

1 1 1 1 1 1 1 1 1 1 
s2n  1    ...   1    ...    2    ...   
2 3 2n 2 3 2n  1 2n 2 4 2n 
1 1 1 1  1 1 1
 1    ...    1    ...   
2 3 2 n  1 2n  2 3 n

364
Óbudai Egyetem BGK Fejezetek a matematikából

 
1 1 1 1 1 1 1 1 1 
   ...       ...  
n 1 n  2 2n  1 2n n  1  1 1  2 n 1 n
1 1 
 n n n n

A kapott összegen azt kell észrevenni, hogy nem más, mint egy integrál közelítő összeg,
1
pontosan az f  x   függvény integrál közelítő összege az [1, 2] intervallumra vonatkozólag,
x
mely összegben az [1, 2] intervallumot n egyenlő hosszúságú részre osztottuk, és minden
részintervallumban a jobb oldali végpontban számítottuk a függvényértéket. Ebből következően a
2
1
páros indexű részletösszegek határértéke a következő: lim  s2n    dx  ln 2 . A páratlan
n  x
1
1 1
indexű részletösszeg a következő módon írható: s2n 1  s2n  . Mivel lim  0 , ezért
2n  1 2n  1
a páratlan indexű részletösszegek sorozata is ln2-höz tart. Kaptuk tehát a nevezetes eredményt,
miszerint


n 1 1
  1 n
 ln 2
n 1

3.1.17. Példa: Vizsgáljuk meg hogy konvergens-e a

 n
   1
n
2 
n 1 n 1 

numerikus sor. Az világos, hogy a sor váltakozó előjelű. A 3.1.15. példabeli számítás eredménye
n n n
alapján az is következik, hogy az abszolút értékek an   1  sorozata monoton
n2  1 n2  1
1
n
csökkenő. Továbbá az is igaz, hogy lim an  lim  lim n  0 , tehát a sor Leibniz
2
n 1 1 2
1
n
típusú, azaz konvergens.

Ha egy numerikus sorra teljesülnek a tétel feltételei, akkor azt szokás Leibniz típusú sornak
nevezni. Ezzel a terminológiával azt mondhatjuk, hogy ha egy sor Leibniz típusú akkor
konvergens. Azonban a tétel nem alkalmazható fordítva, másképpen fogalmazva, a tétel
elégséges feltétel, de nem szükséges. Előfordulhat olyan eset, hogy egy váltakozó előjelű sor nem
Leibniz típusú és mégis konvergens. Erre vonatkozik a következő példa.

365
Óbudai Egyetem BGK Fejezetek a matematikából

3.1.18. Példa: Vizsgáljuk meg hogy konvergens-e a  an sor, ha az  an  sorozatot a következő


módon definiáljuk.

1
 ; ha n  2k  1 (n ptl)
 3n
an  
  1 ; ha n  2k (n ps)

 2n

Az világos, hogy a sor váltakozó előjelű. Azonban a sor nem Leibniz típusú, ugyanis az abszolút
1 1
értékek sorozata nem monoton csökkenő, mert egyrészt nyilvánvalóan igaz, hogy  ,
22k 32k 1
1 1
másrészt viszont az  egyenlőtlenség is fennáll, hiszen azonos átalakításokkal a
2k 1 2k  2
3 2
k
4 9
   formára hozható, amely minden pozitív egész kitevőre teljesül. Ami azt jelenti, hogy
3 4
a2k  a2k 1 viszont a2k 1  a2k  2 . Tehát a sorozat valóban nem monoton csökkenő. Ennek
ellenére a sor konvergens, ugyanis összege két konvergens mértani sor összegeként áll elő.


1  1 
k k
1 1 1 1 1 1 9 1 4 1
 n 3   9    4   3 1  4 1  3  8  4  3  24
a  
n 1 k 0 k 1 1 1
9 4

366
Óbudai Egyetem BGK Fejezetek a matematikából

3.1.5. Abszolút és feltételes konvergencia


A numerikus sorok, mint végtelen tagú összegek gyakran meglepően viselkednek. Egy példát
már mutattunk – egyelőre bizonyítás nélkül –, a 3.1.7. példában, mely szerint végtelen sok
racionális szám összege irracionális. Ez bizonyítással együtt előfordult a hiperharmonikus sor
esetében is a 3.1.16. példában. Ez azonban nem az egyetlen meglepő tulajdonsága a végtelen
összegeknek.
Felmerül a kérdés, hogy egy végtelen összeg esetében fel lehet-e cserélni a tagok sorrendjét
anélkül, hogy az összeg megváltozna. Véges összeg esetén tudjuk a választ, természetesen igen
és az is nyilvánvaló, hogy ha egy végtelen sorban véges sok tag sorrendjét változtatjuk meg,
akkor az összeg nyilván nem változik meg. Azonban megváltoztatható egy sor tagjainak
sorrendje úgy, hogy végtelen sok tagot érint a csere. A válasz a kérdésre ebben az esetben nem
nyilvánvaló. A numerikus sorok két osztályba sorolhatók ebből a szempontból. Az egyik
osztályra nincs hatással a sorrendcsere a másikra lehet hatással. Ezt tisztázzuk az alábbiakban
elsősorban fogalmak ismertetésével és egy példával.

3.1.4. Definíció:A∑an sortabszolút konvergensnek nevezzük, ha az abszolút értékekből képezett


sor, tehát a  an sor is konvergens. Feltételesen konvergensnek nevezzük a ∑ansort ha nem
abszolút konvergens.
A fogalomkörrel kapcsolatban világos, hogy a kérdésfeltevésnek akkor van igazán értelme, ha a
sor amit vizsgálunk, nem pozitív tagú. Egy pozitív tagú sor esetében ugyanis az abszolút
konvergencia egybeesik a konvergenciával, hiszen a sor és az abszolút értékekből képezett sor
egy és ugyanaz a sor. Az alábbi illusztráló példáinkban tehát olyan sorokat vizsgálunk, amelyek
nem pozitív tagúak.

3.1.19. Példa: A 3.1.16. példában láttuk, hogy a hiperharmonikus sor konvergens. Ezen sor
abszolút értékeiből képezett sor azonban a harmonikus sor, amely divergens (3.1.6. példa).
Kijelenthetjük tehát, hogy a

 n 1 1 
   1 
n
n 1

hiperharmonikus sor feltételesen konvergens.

3.1.20. Példa: A 3.1.15. és a 3.1.17. példák eredményeiből következik, hogy a

 n 
   1
n

n 1 n2  1 

numerikus sor is feltételesen konvergens.

3.1.21. Példa: A 3.1.18. példában szereplő váltakozó előjelű sor abszolút konvergens, hiszen az
abszolút értékekből képezett sor két konvergens mértani sorra bontható.

367
Óbudai Egyetem BGK Fejezetek a matematikából

Igen könnyen igazolhatunk egy pozitív tényt az abszolút konvergens sorokkal kapcsolatban.

3.1.9. Tétel: Ha a ∑an sor abszolút konvergens akkor konvergens.


Bizonyítás: Ez a tény a Cauchy-kritériumon és a háromszög egyenlőtlenségen múlik. Legyen
ε > 0 tetszőleges. Ekkor az abszolút konvergencia miatt létezik n0 küszöbindex, hogy tetszőleges
n
n, m >n0 (n > m) esetén teljesül, hogy  ai   . Ekkor
i  m 1
n n n
 ai   ai   ai  
i  m 1 i  m 1 i  m 1

tehát a ∑an sor konvergens.■

A tagok sorrendjének megváltoztatása szempontjából az abszolút és feltételesen konvergens


sorok lényegesen különböző módon viselkednek. Ennek megvilágítását segíti elő az alábbi
fogalom.

3.1.5. Definíció: Legyen az i: N+ → N+ a pozitív egészek halmazának egy kölcsönösen


egyértelmű leképezése a pozitív egész számok halmazára ("bijekció"). Ez másképpen azt jelenti,
hogy az in számok halmaza megegyezik a pozitív egészek halmazával, de ha növekvő indexek
szerint sorba rendezzük a halmaz elemeit, akkor a sorrend eltér a természetes sorrendtől. Ezzel
az értelmezéssel és jelöléssel a  ain numerikus sort a  an sor egy átrendezésének nevezzük.

Ez tehát annyit jelent, hogy a sor tagjait eltérő sorrendben adjuk össze, és ismét hangsúlyozzuk,
hogy kérdés az összegek egyenlősége tekintetében csak akkor merül fel, ha végtelen sok tag
sorrendjét megváltoztatjuk. Az átrendezéssel kapcsolatban két nevezetes tételt említünk
bizonyítás nélkül.

3.1.10. Tétel: Ha a ∑an sor abszolút konvergens akkor tetszőleges  ain átrendezése is abszolút
konvergens, és az átrendezett sor összege megegyezik az eredeti sor összegével. ■

Ez a tétel lényegében azt mutatja, hogy az abszolút konvergens sorok azok, amelyek a jelzett
szempont szerint úgy viselkednek mint a véges összegek.

A feltételesen konvergens sorok azonban lényegesen különböznek ettől az osztálytól. Erre


vonatkozik Riemann híres tétele feltételesen konvergens sorok átrendezéséről.

3.1.11. Tétel: (Riemann)


Ha a ∑an sor feltételesen konvergens, akkor tetszőleges valós A szám esetén létezik a sornak
olyan átrendezése amelynek összege A, továbbá létezik a sornak olyan átrendezése is amelynek
összege végtelen és létezik a sornak olyan átrendezése is amely átrendezésnek nem létezik
összege. ■

368
Óbudai Egyetem BGK Fejezetek a matematikából

A tételt nem bizonyítjuk, ehelyett illusztrációképpen egy példát hozunk olyan átrendezésre,
melynek összege különbözik az eredeti, átrendezetlen sor összegétől.

 n 1 1 
3.1.22. Példa: Vizsgáljuk a    1  hiperharmonikus sort. Erről a 3.1.16. példában
n 1 
n
bebizonyítottuk, hogy konvergens és összege ln2, a 3.1.19. példában pedig megmutattuk, hogy
feltételesen konvergens. A hiperharmonikus sor n-edik részletösszegét jelölje ebben a példában
sn. Rendezzük át ezt a sort két különböző módon.
a) Elsőként rendezzük át úgy, hogy egy pozitív tagot két negatív előjelű tag kövessen. Vizsgáljuk
meg ennek az átrendezett sornak egy 3n elemű részletösszegét, jelölje ezt a részletösszeget s3n
*
.

 1 1 1 1 1 1 1 1   1 1 1 
s3*n  1               ...     
 2 4   3 6 8   5 10 12   2n  1 2  2n  1 4n 

Minden egyes zárójelben vonjuk össze az első két tagot, majd a kapott összeg nevezőjéből
emeljünk ki 2-t. Ekkor a következő adódik:

 1  1 1 1  1 1 1  1  1 1  1
s3*n  1               ...     
 2  4  3 6  8  5 10  12  2 n  1 2  2 n  1  4 n
1 1 1 1 1 1 1 1
       ...   
2 4 6 8 10 12 2  2n  1 2  2n
1 1 1 1 1 1 1 1 
 1       ...   
2 2 3 4 5 6 2n  1 2n 

Vegyük észre, hogy a zárójeles összeg az átrendezetlen hiperharmonikus sor 2n-edik


részletösszege. Ennek ismert a határértéke, ln2. Eszerint az átrendezett sor s3n
*
részletösszegének
1
határértéke ln 2 , ugyanis
2
  1 1
lim s3*n  lim  s2n   ln 2
2 2

1
Ha most még figyelembe vesszük, hogy s3*n1  s3*n  valamint azt, hogy
2n  1
1 1  1 
s3*n 2  s3*n   , akkor tekintetbe véve, hogy lim    0 , azt kapjuk, hogy az
2n  1 2  2n  1  2n  1 
1
említett módon átrendezve a hiperharmonikus sort, annak összege ln 2 , tehát a fele a
2
hiperharmonikus sor összegének.

369
Óbudai Egyetem BGK Fejezetek a matematikából

b) Rendezzük most át olyan módon, hogy két pozitív előjelű tagot kövessen egy negatív előjelű
tag. A tagokat célszerű hármasával csoportosítani. Az átrendezett sor 3n indexű részletösszege
így a következő.

 1 1 1 1 1 1 1 1  1 1 1 
s3**n  1               ...     
 3 2   5 7 4   9 11 6   4n  3 4n  1 2n 

Ezt az összeget egészítsük ki úgy, hogy szerepeljen benne az átrendezetlen hiperharmonikus sor
s4n részletösszege.

 1 1 1 1 1 1 1 1  1 1 1 
s3**n  1               ...     
 3 2   5 7 4   9 11 6   4n  3 4n  1 2n 
 1 1 1 1 1 
    ...   
 2n  2 2n  4 2n  6 4n  2 4n 
 1 1 1 1 1 
    ...   
 2n  2 2n  4 2n  6 4n  2 4n 

Megjelent tehát az összegben az s4n részletösszeg. Az utolsó zárójeles összeg minden tagjának
nevezőjéből emeljünk ki 2-t. Ekkor a következő adódik.

1 1 1 1 1 1 
s3**n  s4n      ...   
2  n 1 n  2 n  3 2n  1 2 n 

Ha visszatekintünk a 3.1.16. példa megoldására, akkor észrevehetjük, hogy a kapott zárójelben


éppen az s2n áll. Így az átrendezett sor 3n indexű részletösszegének határértéke:

  1 1 3
lim s3**n  lim  s4n   lim  s2n   ln 2  ln 2  ln 2
2 2 2

1 1 1
Ha végül figyelembe vesszük, hogy s3**n 1  s3**n  , továbbá s3**n  2  s3**n   ,
4n  1 4n  1 4 n  3
 1   1 
valamint azt, hogy lim    lim    0 , akkor kapjuk, hogy az átrendezett sor összege
 4n  1   4n  3 

  3
lim sn**  ln 2
2

3
tehát a hiperharmonikus sor összegének a -szerese.
2

370
Óbudai Egyetem BGK Fejezetek a matematikából

Mutattunk tehát két különböző átrendezést, amely esetén a sorösszeg különbözik az eredeti
összegtől is és egymástól is. Ezzel azonban még nem merítettük ki az összes lehetőséget, amely a
hiperharmonikus sorban rejlik.
c) Igazolható a következő: Ha a hiperharmonikus sort úgy rendezzük át, hogy a sorban p db
pozitív előjelű tagot q db negatív előjelű tag követ, akkor az átrendezett sor összege

1 p
lim  sn   ln 2  ln
2 q

Javasoljuk a tisztelt Olvasónak, hogy ellenőrizze, az a) és b) pontbeli eredmények összhangban


vannak ezzel az általános eredménnyel.

371
Óbudai Egyetem BGK Fejezetek a matematikából

3.2. Függvénysorok, Taylor-sorok


3.2.1. Függvénysorozatok általános fogalma, konvergenciája
A végtelen numerikus sorfogalmát könnyen általánosíthatjuk úgy, hogy a sorozat tagjai,
amelyből a sort képezzük nem valós számok, hanem függvények.

3.2.1.Definíció: Legyen I a valós számok R halmazának rögzített intervalluma és tegyük fel,


hogy az fn(x) (nN+) függvények mindannyian értelmezve vannak az I intervallumon. Azt a
függvényt amely minden n pozitív egész számhoz hozzárendeli az fn(x) függvényt,
függvénysorozatnak nevezzük. Az I intervallumot úgy is tekinthetjük, mint az fn(x) (nN+)
függvények értelmezési tartományának közös részét. Ha ez a közös rész üres halmaz, nem létezik
I-n függvénysorozat.

Az alábbi jegyzetben, a műszaki alkalmazások szempontjából a legfontosabb fogalom a


konvergencia. Megvilágítjuk ezt a problémakört két példán keresztül. Előtte azonban szükség van
néhány új fogalom értelmezésére.

3.2.2.Definíció: Legyen az xI tetszőlegesen rögzített valós szám. Ekkor az fn(x) (nN+)
helyettesítési értékek egy valós számsorozatot alkotnak. Tekintsük azokat az x helyeket az I
intervallumban, ahol az fn(x) (nN+) valós sorozat konvergens. Ezen pontok halmazát a
függvénysorozat konvergencia halmazának (konvergencia tartomány) nevezzük és KH-val
jelöljük. Ezen a konvergencia halmazon a függvénysorozat értelmez egy új függvényt, amit a
függvénysorozat határfüggvény-ének nevezünk. Jelölje ezt f(x), x KH. A konvergencia
szokásos értelmezése szerint a következőt mondhatjuk.
Az f(x), x KH függvény az fn(x) (nN+) x I függvénysorozat határfüggvénye, ha
tetszőleges ε > 0 hibakorláthoz létezik n0(ε, x) ε-tól és általában x-től is függő küszöbindex
olyan, hogy ha n>n0(ε, x), akkor teljesül, hogy fn  x   f  x    ha x  KH .

3.2.1.Példa: Illusztráljuk ezt a fogalmat az alábbi igen egyszerű, ám a későbbiek szempontjából


nagyon fontos példán keresztül. Legyen fn(x) = xn–1 (nN+), xR. Ebben az esetben tehát – a
definícióbeli jelölést alkalmazva – I = R. Ez a függvénysorozat minden valós x-re egy mértani
sorozatot ad. Erről ismeretes, hogy a ]–1, 1] intervallumon konvergens, és minden x ]–1, 1[
esetén a határérték zérus, x = 1-ben pedig 1. Minden más valós helyen a sorozat divergens. Ez azt
jelenti, hogy a függvénysorozat konvergencia halmaza a KH = ]–1, 1] intervallum és a
határfüggvény pedig f(x) = 0 ha x ]–1, 1[ és pedig f(x) = 1 ha x = 1. Vizsgáljuk most meg, hogy
a 3.2.2. definíció szerint hogyan adhatunk meg egy ε > 0 hibakorláthoz küszöbindexet. Az x = 1
pontot nem szükséges vizsgálni, hiszen ebben a pontban a sorozat a konstans 1 sorozat, ha
azonban x ]–1, 1[, akkor az

n 1
f n  x   f  x   x n 1  0  x n 1  x 

372
Óbudai Egyetem BGK Fejezetek a matematikából

egyenlőtlenség egyenértékű az

ln  ln   ln  
n 1  ; n  1  n0  , x     1 ;
ln x ln x  ln x 

egyenlőtlenséggel. Az egyenlőtlenség azért fordult meg, mert x  1 esetén ln x  0 . Megadtuk


tehát az ε hibakorláthoz tartozó küszöbindexet, [x] jelöli az x valós szám egész részét. Mint
látható ez valóban függ mind az ε-tól (ez természetes) és függ az x-től is. Igazoltuk tehát a 3.2.2.
definíció alapján is, hogy a határfüggvény valóban az az f(x) függvény, amelyet az előbbiekben
leírtunk.

Mielőtt egy második példát is hozunk a fogalmak illusztrálására, megfogalmazzuk a numerikus


sorok esetében igazolt, és igen nagy jelentőségű Cauchy-féle konvergencia kritériumot.

3.2.1. Tétel: (Cauchy-féle konvergencia kritérium függvénysorozatokra)


Az fn(x) (nN+) x I függvénysorozat akkor és csak akkor konvergens, vagyis pontosan akkor
létezik határfüggvénye a KH  I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε, x),
ε-tól és x-től függő küszöbindex olyan, hogy ha n, m > n0(ε, x), akkor teljesül, hogy
f n  x   f m  x    ha x  KH .■

3.2.2.Példa: A következő példa, túl azon, hogy ismét nagyon egyszerű, nagyon fontos szerepet
kap majd a Fourier-sorok elméletében, és rávilágít arra, hogy létezik egy másfajta, az
előbbiekben illusztráltnál erősebb konvergencia fogalom, amely teljesülése maga után von
számos hasznos tulajdonságot függvénysorokra vonatkozólag.
Vizsgáljuk meg konvergencia szempontjából az fn  x  
sin nx
n
 
; n  N , x  R
függvénysorozatot. Mivel a szinusz függvény értékkészlete a [–1, 1] intervallum, ezért minden
valós x-re igaz a következő egyenlőtlenséglánc:

sin nx 1
0 
n n
1
Figyelembe véve azt, hogy az   sorozat határértéke 0, a közrefogási elv alkalmazásával az
n
adódik, hogy a függvénysorozat minden valós x-re a nullához tart. Tehát most a konvergencia
halmaz KH = R, és a határfüggvény a teljes számegyenesen az azonosan nulla függvény.
Keressünk ismét tetszőleges ε > 0 hibakorláthoz küszöbindexet.

sin nx sin nx 1 1 1 
fn  x   f  x   0    ; ha n   n0    ;
n n n  

megkaptuk a küszöbindexet. A 3.2.1. példabeli függvénysorozathoz képest azonban van egy


jelentős különbség. Ebben a példában a küszöbindex nem függ az x-től, csak az ε hibakorláttól.
Más szavakkal egy helytől független küszöbindexet tudunk rendelni minden ε-hoz. Mint az

373
Óbudai Egyetem BGK Fejezetek a matematikából

alábbiakban kiderül, ez egy minőségileg más formája a konvergenciának. Ennek okán más
elnevezést alkalmazunk a fogalom megjelölésére.

3.2.3.Definíció: Azt mondjuk, hogy az fn(x) (nN+) xI valós függvénysorozat egyenletesen
konvergens a KH halmazon, és határfüggvénye azf(x), x KH függvény ha tetszőleges ε > 0
hibakorláthoz létezik n0(ε) kizárólag ε-tól függő – tehát az x KH helytől független –
küszöbindex olyan, hogy ha n > n0(ε), akkor teljesül, hogy fn  x   f  x    ha x  KH .
Összevetve a 3.2.1. és 3.2.2. példákban szereplő függvénysorozatokat és a példabeli számítások
eredményét, azt mondhatjuk, hogy az f n  x  
sin nx
n
 
; n  N , x  R függvénysorozat
egyenletesen konvergens az egész számegyenesen és határfüggvénye az azonosan nulla
függvény. Míg az fn(x) = xn–1 (nN+), xR függvénysorozat konvergens a KH = ]–1, 1]
intervallumon, de nem egyenletesen konvergens. Ez utóbbi konvergenciát, megkülönböztetésül,
lehet pontonkénti konvergenciának nevezni.

Mielőtt alkalmazzuk ezeket a fogalmakat függvénysorokra és rávilágítunk az egyenletes


konvergencia előnyeire, megfogalmazzuk a Cauchy-kritériumot egyenletes konvergenciára.

3.2.2. Tétel: (Cauchy-féle konvergencia kritérium egyenletes konvergenciára)


Az fn(x) (nN+) x I függvénysorozat akkor és csak akkor egyenletesen konvergens a KH  I
halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik n0(ε), kizárólag ε-tól függő – tehát az
x KH helytől független – küszöbindex olyan, hogy ha n, m > n0(ε), akkor teljesül, hogy
f n  x   f m  x   , ha x  KH . ■

3.2.2. Függvénysorok általános fogalma, konvergenciája

Az fn(x) (nN+) x I függvénysorozatból az alábbi értelmezés szerint képezzünk egy "új"


függvénysorozatot az alábbi definícióval:

s1(x) = f1(x)
s2(x) = f1(x) + f2(x)
s3(x) = f1(x) + f2(x) + f3(x)

sn(x) = f1(x) + f2(x) +…+ fn(x); nN+; xI

Az (sn(x)), nN+; xI függvénysorozatot az (fn(x)), nN+; xI függvénysorozatból képezett


végtelen függvénysornak, vagy egyszerűen csak függvénysornak nevezzük. Az

n
sn  x    fi  x  ;  x  I 
i 1

összeget a függvénysor n-edik részletösszegének nevezzük. A függvénysort egyszerűen csak a

374
Óbudai Egyetem BGK Fejezetek a matematikából

 fn ;  fn  x  ; vagy a  fn  x 
n 1

formulával jelöljük.

Felmerül a kérdés, hogy mit értünk egy függvénysor konvergenciáján, határértékén? A választ a
numerikus sorok konvergenciájának a fogalmára építjük. Legyen x0 I az I intervallum
tetszőleges pontja. Helyettesítsük a ∑fn(x) függvénysorban x helyére mindenütt x0-t. Mivel az
fn(x0) helyettesítési értékek valós számok, az ilyen módon kapott ∑fn(x0) sor egy végtelen
numerikus sor. Erre vonatkozólag a konvergencia fogalma ismert, és az említett kritériumokkal
meg is tudjuk vizsgálni a konvergencia tényét! Ez azt jelenti, hogy az I intervallum minden egyes
x pontjában megvizsgálhatjuk, hogy a ∑fn(x) végtelen numerikus sor konvergens-e. Azokban a
pontokban ahol konvergens, értelmezhetünk egy új függvényt az alábbi módon.

3.2.4.Definíció: JelöljeKH(∑fn) az I intervallumnak azokat a pontjait, amelyekre a ∑fn(x)


végtelen numerikus sor konvergens. Ezt a halmazt a függvénysor konvergencia-halmazának
vagy konvergencia-tartományának nevezzük. Ezen a halmazon értelmezhetünk egy függvényt.
Legyen ez a függvény a következő.

 
 f n : KH  f n   R ; x  f n x 
n 1 n 1

Tehát az I intervallum minden olyan pontjához, ahol a ∑fn(x) numerikus sor konvergens, tehát a
konvergencia-halmaz minden x pontjához, hozzárendeljük a ∑fn(x) numerikus sor összegét. Ezt a
függvényt a függvénysor összegfüggvényének nevezzük.

A definícióban említett módon beszélhetünk egy függvénysor konvergenciájáról. Egy


függvénysor konvergens, ha a konvergencia-halmaza nem üres halmaz, és a határértéke az
összegfüggvény, amit a definícióban leírtunk. A numerikus sorok tárgyalásának mintájára
megfogalmazzuk a Cauchy-kritériumot függvénysorokra is. A függvénysorozatoknál követett
gondolatmenet szerint itt is megkülönböztetjük a pontonkénti és az egyenletes konvergenciát.

3.2.3. Tétel: (Cauchy-féle konvergencia kritérium függvénysorokra)


A ∑fn(x) (nN+) x I függvénysor akkor és csak akkor konvergens tehát akkor és csak akkor
létezik összegfüggvénye a KH  I halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik olyan
n0(ε, x), ε-tól és x-től függő küszöbindex, hogy ha n, m > n0(ε, x), és n > m akkor teljesül, hogy

n
 fi  x    ha x  KH   f n  .
i  m 1

375
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.4. Tétel: (Cauchy-féle konvergencia kritérium egyenletes konvergenciára)


A ∑fn(x) (nN+) x I függvénysor akkor és csak akkor egyenletesen konvergens a KH  I
halmazon, ha tetszőleges ε > 0 hibakorláthoz létezik olyan n0(ε), kizárólag ε-tól függő – tehát
az x KH helytől független – küszöbindex, hogy ha n, m > n0(ε), és n > m akkor teljesül, hogy

n
 fi  x    ha x  KH   f n  .
i  m 1

Függvénysorok konvergenciáját is illusztráljuk az alábbi két példával.

3.2.3. Példa: Vizsgáljuk meg, hogy a  x n 1 függvénysornak mi a konvergenciatartománya, és


n 1
a konvergenciahalmazon adjuk meg az összegfüggvényt.

A megoldás során hivatkozhatunk a 3.1.1.definícióra. Vegyük észre, hogy ez a függvénysor


rögzített x-re egy q = x kvóciensű végtelen mértani sor. Tudjuk, hogy ez –1 < x < 1 esetén
konvergens és adott x-re a sor összegét is ismerjük, a numerikus sor összegképletében q helyére
x-et kell írnunk. A függvénysor konvergencia-halmaza tehát a ] –1, 1[ intervallum és az
összegfüggvény a következő.


x   1, 1 
1
 x n 1  1  x  x 2  x3  x 4  ...  1  x ;
n 1

A] –1, 1[ intervallumon kívül a függvénysor nem határoz meg függvényt, a függvénysor ezen
intervallumon kívül divergens. A konvergenciát grafikusan szemlélteti a 3.2.1. ábra.

3.2.1. ábra. A mértani sor összegfüggvénye (kék színű görbe) és az azt közelítő ötödfokú polinom
(piros színű görbe). A pontozott egyenesek a konvergencia halmaz határait jelölik.

376
Óbudai Egyetem BGK Fejezetek a matematikából

n
 x 
3.2.4.Példa: Vizsgáljuk meg, hogy a   x  1  függvénysornak mi a konvergencia tartománya
n 0
és ezen a halmazon mi a sor összegfüggvénye. Az előzőnél némileg bonyolultabb szerkezetű
függvénysorral van dolgunk, de abban megegyeznek, hogy adott x-re ez is egy mértani sor.
Vizsgáljuk meg, hogy a mértani sor konvergenciájának mi a feltétele. Akkor konvergens a sor, ha
x x
teljesül, hogy  1, tehát ha igaz, hogy  1   1 . Ennek az egyenlőtlenség láncnak a
x 1 x 1
1
megoldáshalmaza az x   félegyenes. Az egyenlőtlenség megoldásához ábrázoljuk az
2
x x  1 1 1
  1 lineáris törtfüggvényt. A grafikon alapján a megoldáshalmaz azonnal
x 1 x 1 x 1
leolvasható a 3.2.2. ábráról.

3.2.2. ábra. A 3.2.4. példabeli függvénysor konvergencia halmazának grafikus meghatározása.


A ]–1, 1[ intervallum határait jelölik a pontozott egyenesek.

 1 
Kaptuk tehát, hogy a függvénysor konvergencia halmaza a KH    ;   intervallum. Az
 2 
összegfüggvény ugyancsak a mértani sor összegképlete alapján kapható.

 n
 x  1  1 
  x  1   x  x  1; x    2 ;  
n 0 1
x 1

Az f(x) = x + 1 függvény természetesen értelmezve van az egész számegyenesen, de csak a


megjelölt intervallumra vonatkozó leszűkítése az amelynek "köze van" a függvénysorhoz,
 1 
ugyanis a függvénysornak a KH    ;   intervallumon kívül nem létezik összegfüggvénye.
 2 
A 3.2.3. ábrán grafikusan szemléltetjük, hogy hogyan közelíti a függvénysor a határfüggvényt, ha
a sorból az első hét tagot vesszük figyelembe.

377
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.3. ábra. A 3.2.4. példabeli függvénysor összegfüggvénye (kék színű görbe) és a sor hetedik részletösszege
(piros színű görbe). A pontozott egyenes a konvergencia halmaz bal oldali határát jelöli.

Az általános esetben egy függvénysor konvergenciájának vizsgálata bonyolult feladat, és a


konvergencia halmaz valamint az összegfüggvény meghatározására sincsenek általános
módszerek. Ebből a szempontból bizonyos értelemben szabályosan viselkednek azok a
"különleges" típusú, a gyakorlat számára is nagyon fontos függvénysorok, amelyekben
hatványfüggvényekből képezett függvénysorozatból állítjuk elő a függvénysort. Ezeket
tárgyaljuk a következő pontban.

Szeretnénk még rámutatni arra, hogy az előző két példában miért nem vizsgáltuk az egyenletes
konvergenciát. Ennek oka a következő. A 3.2.3. példabeli függvénysor egy általános
kategóriának a képviselője, amelyekre általános eredményeket fogunk megfogalmazni elméleti és
műszaki gyakorlati jelentősége miatt. A 3.2.4. példabeli sor pedig csak az illusztrációt szolgálta, a
későbbiekben nem vizsgáljuk.

A kérdés azonban természetesen fennáll és általánosan válaszolunk is a kérdésre. Tudunk-e olyan


feltételt mondani, amelynek teljesülése maga után vonja az egyenletes konvergenciát. A választ
egy olyan tétel adja meg, amely igen szoros kapcsolatot teremt a függvénysorok és a numerikus
sorok fogalomköre között. A jelzett elégséges feltétel kimondása és bizonyítása előtt egy fogalom
értelmezésére van szükség.

3.2.5.Definíció: Azt mondjuk, hogy a ∑fn(x) (nN+) x I függvénysornak a J  I intervallumon


a  an numerikus sor konvergens majoránsa, ha a numerikus sor konvergens és létezik olyan n0
küszöbszám, hogy ha n > n0 akkor tetszőleges x J esetén teljesül, hogy f n  x   an .

Ennek a fogalomnak a felhasználásával adható egy elégséges feltétel az egyenletes


konvergenciára vonatkozólag.

378
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.5. Tétel: (Weierstrass-féle majoráns kritérium)


Ha a ∑fn(x) (nN+) x I függvénysornak a J  I intervallumon létezik konvergens majoránsa,
akkor a J intervallumon a függvénysor egyenletesen konvergens.
Bizonyítás: Alkalmazzuk a 3.2.4. tételt. Legyen ε > 0 tetszőleges és tegyük fel, hogy létezik
konvergens majoráns. Ekkor, mivel a numerikus sor konvergens, teljesül rá a Cauchy-féle
konvergencia kritérium, azaz létezik n0 küszöbszám olyan, hogy ha n, m > n0, és n > m akkor
n
teljesül, hogy  ai   . Ha most alkalmazzuk a háromszög egyenlőtlenséget, azt kapjuk, hogy
i  m 1
n n n
 fi  x    fi  x    ai  
i  m 1 i  m 1 i  m 1

tehát teljesül a Cauchy-féle kritérium az egyenletes konvergenciára vonatkozólag.■

3.2.5.Példa: Megmutatjuk, hogy a 3.2.3. példabeli függvénysor tetszőleges x1 < 1 esetén


egyenletesen konvergens a [–x1, x1] intervallumon. A bizonyításhoz nem a Cauchy-kritériumot
használjuk, hanem a Weierstrass-féle majoráns kritériumot. Ehhez meg kell mutatni, hogy a
megjelölt intervallumon a függvénysornak van konvergens majoráns sora. Ez azonban nagyon
egyszerű, hiszen a mondott feltételek mellett létezik x2 valós szám olyan, hogy x1 < x2 < 1 teljesül.
Ezt az x2-t választva egy mértani sor kvócienseként, a mértani sor konvergens. Ebből
n
következően, ha még figyelembe vesszük az x1  x2n egyenlőtlenséget, akkor éppen a 3.2.5.

  x2 
n
tétel érvényessége következik. A numerikus sor konvergens majoráns sor a [–x1, x1]
intervallumon, tehát ezen az intervallumon a  x n 1 függvénysor egyenletesen konvergens.
n 1
Ez a tény egyébként egy alábbiakban tárgyalt általános tétel speciális esete.

3.2.6.Példa: Megmutatjuk, hogy a 3.2.4. példabeli függvénysor tetszőleges x1  R  esetén


'
 x  1 x
egyenletesen konvergens a [0, x1] intervallumon. Mivel     0 , ezért az
x 1
 x  1   x  1 2

hányados a teljes konvergencia halmazon szigorúan monoton növekedő függvény. Foglalkozzunk


elsőként a nem negatív valós számok halmazával. A monotonitásból következően tetszőleges
x x
x2  R  ; x2  x 1 esetén igaz, hogy ha x  0, x 1  akkor fennáll az 0   2 1
x  1 x2  1
n
 x 
egyenlőtlenséglánc. Ebből az következik, hogy [0, x1] intervallumon a   2  numerikus
x 1 
n 0  2
n
 x 
sor konvergens majoránsa a    függvénysornak, hiszen előbbi egy 1-nél kisebb
n 0 
x 1 

379
Óbudai Egyetem BGK Fejezetek a matematikából

n
 x 
  x  1  függvénysor
kvóciensű mértani sor. Ebből pedig a 3.2.5. tétel szerint következik a
n 0
egyenletes konvergenciája a megadott intervallumon. Ehhez hasonló gondolatmenettel
1
igazolható, hogy tetszőleges   x 3  0 esetén egyenletesen konvergens az  x3 , 0
2
intervallumon is.

A pont lezárásaképpen bizonyítás nélkül rámutatunk arra az okra, amiért ennyire hangsúlyoztuk
az egyenletes konvergencia fontosságát.

3.2.6. Tétel: Ha a ∑fn(x) (nN+) x I függvénysor az I intervallumon egyenletesen konvergens,


akkor a tagonkénti deriválással illetve a tagonkénti integrálással kapott sor összege az eredeti sor
összegfüggvényének deriváltja illetve primitív függvénye. Azaz, ha


 fn  x   F  x  , x  I
n 1
akkor

 
 f 'n  x   F '  x  , x  I illetve   f n  x dx   F  x  dx, x  I .
n 1 n 1

A tételt úgy is fogalmazhatjuk, hogy ha egy függvénysor egyenletesen konvergens, akkor a


deriválás és az összegzés illetve az integrálás és az összegzés sorrendje (végtelen összeg esetén
is) felcserélhető. A tétel nagyon fontos a következő pontban tanulmányozott hatványsorok
témakörében. ■

3.2.3. Hatványsorok
Ebben a pontban olyan függvénysorokat vizsgálunk, amelyekben az fn(x) függvények a
legegyszerűbb típusú függvények, azaz hatványfüggvények. Az általánosságot nem csorbítjuk
azáltal, ha az összegzést ezután nem 1 hanem 0 indexszel kezdjük. Legyen tehát fn(x) = cn∙(x–x0)n,
n = 0, 1, 2,…, ahol x0 I és a cn R együtthatók valós számok.

 cn  x  x0 
n
3.2.6.Definíció: Rögzítsük az x0R valós számot. A függvénysort
n 0
x0-középpontú hatványsornak nevezzük. A cnR valós számok a hatványsor együtthatói.

Az elnevezésnek az az oka, hogy a hatványsorok konvergencia-halmaza nagyon egyszerű


szerkezetű. Mint az alábbi alapvető fontosságú tételből kiderül, mindig egy x = x0 pontra
szimmetrikus intervallum. Innen ered az „x0-középpontú” elnevezés.

380
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.7.Tétel: (Cauchy-Hadamard)
 cn  x  x0 
n
A hatványsor az x = x0 pontban mindig konvergens, ezen kívül létezik egy nem
n 0
negatív R valós szám olyan, hogy ha x  x0  R akkor a hatványsor divergens, ha x  x0  R
akkor a hatványsor konvergens. Az x  x0  R feltételeknek eleget tevő pontokban a hatványsor
lehet konvergens is és divergens is, ezt minden konkrét esetben meg kell vizsgálni.
Az R valós számot a hatványsor konvergencia-sugarának nevezzük. A konvergencia-sugár
meghatározására több lehetőség is van, használhatjuk a gyökkritériumot is és a hányados-
kritériumot is az alábbi formulák szerint:

1 c 1
 lim n 1 ; vagy  lim n cn
R cn R

Ha valamelyik határérték +∞ akkor az R konvergencia sugár 0, ekkor a hatványsor csak az x = x0


pontban konvergál, ha pedig valamelyik határérték 0, akkor az R konvergencia sugár +∞, ekkor a
hatványsor a teljes számegyenesen konvergens, tehát a konvergencia-halmaz R.
Bizonyítás: Mindenek előtt kihangsúlyozzuk, hogy az együtthatóktól függetlenül minden
hatványsor konvergens az x = x0 helyen, ugyanis itt az összeg a sor első tagja, hiszen minden
további tag zérus. A továbbiakhoz alkalmazzuk például a hányados kritériumot (3.1.6. tétel)
annak eldöntésére, hogy a hatványsor egy adott x helyen konvergens vagy divergens. Képezzük
két szomszédos tag hányadosát és vizsgáljuk a hányados sorozat határértékét rögzített x-re.

n 1
cn 1  x  x0  cn 1  x  x0  cn 1
lim  lim  x  x0 lim
cn  x  x0 
n  n n  cn n  cn

Az említett kritérium szerint, ha ez a szorzat kisebb, mint 1, akkor a sor konvergens, ha nagyobb,
mint 1, akkor pedig divergens, ha éppen 1 akkor pedig mindkét eset előfordulhat. Vizsgáljunk
most meg három esetet.
c
a) Tegyük fel, hogy lim n 1  R  , tehát az idézett határérték pozitív valós érték. Ekkor a
n  cn
1
konvergencia elégséges feltétele a következő: x  x0 
. Ha ez utóbbi hányadosra
cn 1
lim
n  cn
bevezetjük az R jelölést, éppen a tételben megfogalmazott állítást kapjuk, az említett hányados
pedig definiálja a konvergencia sugarat. Az intervallum két végpontjában egymástól függetlenül
előfordulhat konvergencia és divergencia, ezt a hányados kritérium tárgyalásánál megmutattuk.

cn 1 c
b) Tegyük fel, hogy lim   . Ekkor az x  x0 lim n 1  1 feltétel egyetlen x0-tól
n  cn n  cn
különböző valós x számra sem igaz. Ez azt jelenti, hogy ebben az esetben a konvergencia halmaz

381
Óbudai Egyetem BGK Fejezetek a matematikából

a bevezetőben említett KH = {x0} halmaz. Ez egyben azt is jelenti, hogy a konvergencia sugár
R = 0.
c c
c) Tegyük fel, hogy lim n 1  0 . Ekkor az x  x0 lim n 1  1 feltétel minden valós x
n  cn n  cn
számra igaz, ami azt jelenti, hogy a sor mindenütt konvergens, vagyis R = ∞. ■

Ha a bizonyításnál nem a hányados kritériumot, hanem a gyök kritériumot használjuk, akkor a


tételben megfogalmazott másik formulát kapjuk a konvergencia sugárra vonatkozólag, illetve a
tétel értelemszerűen átfogalmazható a gyökös formula alkalmazásával.

A bizonyított tétellel tehát könnyedén leírhatjuk hatványsorok konvergencia halmazát. Ha


visszatekintünk a 3.2.3. példára, akkor látható, hogy a vizsgált sor egy 0-középpontú hatványsor,
ennek megfelelően a konvergencia halmaz egy 0-ra szimmetrikus intervallum. A 3.2.4 példabeli
függvénysor azonban nem hatványsor, ennek megfelelően a konvergencia halmaza nem ilyen
szerkezetű, nem szimmetrikus egyetlen valós számra sem.

3.2.7.Példa: Határozzuk meg a

 x  2 n 1 1 1
 2n (n  1)  22 1  x  2  x  2 3   x  2 4  ...
2

3 4
n2 2 2 2 3

hatványsor konvergencia-halmazát. Első megállapításunk, hogy ez egy x0 = –2 középpontú


1
hatványsor. Számítsuk ki a konvergencia-sugarat. Az együtthatókra tekintve, cn  ,
n
2 (n  1)
látható, hogy a hányados kritérium alkalmazása célszerű.

1 cn 1 2n (n  1) n 1 1
 lim  lim  lim 
R cn n 1 2n 2
2 n

A konvergencia sugár tehát R = 2. Az x0 középponttól tehát 2 egység távolságra levő pontokban


még meg kell vizsgálni a konvergenciát.

 2 n  1n
x = –4:  n
  (n  1)
n  2 2 (n  1) n2

Ez Leibniz-típusú sor, tehát konvergens. A hatványsor tehát konvergál a – 4 helyen.

2n 1
x = 0:  2n (n  1)   (n  1)
n2 n2

382
Óbudai Egyetem BGK Fejezetek a matematikából

Ez pedig a harmonikus sor, amelyről tudjuk, hogy divergens. Itt tehát a hatványsor is divergens.
Összefoglalva, a hatványsor konvergencia tartománya a [–4, 0 [ félig zárt intervallum.

3.2.8.Példa: Határozzuk meg a

n! 1 2! 3!
 2n  x  3   x  3  2  x  32  3  x  33  ...
n

n 1
2 2 2

hatványsor konvergencia-halmazát. Első megállapításunk, hogy ez egy x0 = +3 középpontú


n!
hatványsor. Számítsuk ki a konvergencia-sugarat. Az együtthatókra tekintve, cn  , ismét
2n
látható, hogy a hányados kritérium alkalmazása célszerű:

c 2n (n  1)! n 1
lim n 1  lim  lim 
cn n 1 2
2 n!

A Cauchy-Hadamard tétel b) pontja szerint ez azt jelenti, hogy a konvergencia sugár R = 0, tehát
a hatványsor konvergencia halmaza egyelemű, KH = {3}.

3.2.9.Példa: Határozzuk meg a

3n  2 n 34 2 35 3
 n! x  32
 33
x 
2!
x  x  ...
3!
n 0
3n  2
Ebben az esetben az együtthatók a következők: cn  , ismét a hányados kritériumot
n!
alkalmazzuk.
c 3n  3 n ! 3
lim n 1  lim  lim 0

cn 3n 2
 n  1! n 1

Ez az eredmény pedig pontosan azt jelenti a tétel szerint, hogy a konvergencia sugár R = ∞, tehát
a konvergencia tartomány a valós számok halmaza, KH = R.

A differenciálszámításban és az integrálszámításban ismert tény, hogy összeg tagonként


deriválható és integrálható, de ott véges összegekről van szó! Ha egy összegben végtelen sok tag
van, akkor ez a tény koránt sem magától értetődő dolog, sőt az általános esetben egy
függvénysorra vonatkozólag nem is igaz. A 3.2.6. tétel fogalmazza meg általánosan a tagonkénti
deriválhatóság illetve tagonkénti integrálhatóság feltételét. Az, hogy ez a tétel alkalmazható
hatványsorokra, Abel nevezetes tételén múlik.

383
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.8.Tétel: (Abel tétele)


 cn  x  x0 
n
Ha a hatványsor konvergens egy x1 pontban, és x2 egy tetszőleges olyan valós
n 0
szám amelyre x2  x0  x1  x0 teljesül, akkor a hatványsor abszolút és egyenletesen
konvergens az  x0  x2 ; x0  x2  zárt intervallumon.
Bizonyítás: Az állítás igazolásához a Weierstrass-féle majoráns kritériumot használjuk.
Tetszőleges x   x0  x2 ; x0  x2  esetén igaz, hogy x  x0  x2  x0  x1  x0 . Mivel a

 cn  x1  x0  numerikus sor konvergens, a 3.1.1. tétel szerint lim cn  x1  x0   0 , ezért a


n n

n 0

sorozat korlátos, azaz létezik K  R  olyan, hogy cn  x1  x0   K . Ebből következik, hogy


n

n n
n  x2  x0   x2  x0 
cn  x  x0   cn  x2  x0   cn  x1  x0 
n n
  K  
 x1  x0   x1  x0 

n
x2  x0 x x
A feltételek szerint  1 ami azt jelenti, hogy a K   2 0 numerikus sor 1-nél
x1  x0 x  x0
n 0 1

 cn  x  x0 
n
kisebb kvóciensű mértani sor, tehát konvergens majoránsa a hatványsornak az
n 0
 x0  x2 ; x0  x2  zárt intervallumon. A 3.2.5. tétel szerint ezzel az állítást bizonyítottuk. ■
Az Abel-tétel szerint tehát bármely hatványsor a konvergencia halmazhoz tartozó bármely zárt
intervallumon egyenletesen konvergens. Ennek számunkra legfontosabb következménye az, hogy
a 3.2.6. tétel alkalmazható hatványsorokra. A két tétel együttesen az alábbi állításban foglalható
össze.

3.2.9.Tétel: Ha a ∑cn∙(x – x0)n hatványsor egy nyílt intervallumon vagy az egész valós
számegyenesen konvergens, és ott az összegfüggvénye


s  x   cn  x  a 
n

n 0

akkor a tagonkénti deriválással illetve a tagonkénti integrálással nyert

  c
 n  cn x  a n 1; illetve  n n 1 x  a n 1
n 1 n0

hatványsorok ugyanazon a nyílt intervallumon illetve az egész számegyenesen konvergálnak, és a


tagonkénti deriválással nyert sor összegfüggvénye az eredeti összegfüggvény deriváltja, illetve a

384
Óbudai Egyetem BGK Fejezetek a matematikából

tagonkénti integrálással nyert hatványsor összegfüggvénye az eredeti összegfüggvény egy


alkalmas primitív függvénye:

 
c
 n  cn x  a n 1  sx ; illetve  n n 1 x  a n 1  S x   S a 
n 0 n 0

ahol S(x) az s(x) összegfüggvény egy primitív függvénye. A tagonkénti deriválás és integrálás
nem változtatja meg a konvergencia sugarat, továbbá ezen a halmazon az összegzés és a
deriválás, illetve az összegzés és az integrálás műveletének a sorrendje felcserélhető. ■

Azt az alapvetően fontos tényt, hogy a tagonkénti deriválás illetve tagonkénti integrálás során
a konvergencia sugár nem változik meg, igen egyszerűen igazolhatjuk. Induljunk ki abból,
hogy definíció szerint a kiindulásként alapul vett hatványsor konvergencia sugara

1
R
c
lim n 1
cn
cn
Ha a sort deriváljuk, akkor a cn együttható n  cn  re illetve  re módosul. Ha ezekre az
n 1
együtthatókra alkalmazzuk a konvergencia sugár kiszámítására vonatkozó formulát, akkor azt
kapjuk, hogy deriválás esetén

1 1 1
  R
 n  1 cn 1  n 1 
lim 
cn 1
1 lim
cn 1
lim  lim
n  cn  n  cn cn

tehát a sugár valóban nem változik. Integrálás esetén pedig

1 1 1
  R
 n  1 cn 1  n 1 
lim 
cn 1
1 lim
cn 1
lim  lim
 n  2  cn n2 cn cn

tehát a konvergencia sugár ebben az esetben sem változik.

Hangsúlyozzuk azonban, hogy bár a konvergencia sugár nem változik meg a vizsgált műveletek
során, a konvergencia halmaz megváltozhat, ami azt jelenti, hogy a végpontokban megváltozhat a
konvergencia ténye. Erre vonatkozólag látunk példát az alábbiakban.

Az előbbiekben hatványsorok esetében megoldottuk azt a problémát, hogy a hatványsor mely


esetben konvergens illetve divergens. Egy valós sorozat határértékének kiszámításával a
konvergencia-halmaz meghatározható. Nem foglalkoztunk azonban azzal a problémával az
általános esetben, hogy ezen a halmazon mi a hatványsor összegfüggvénye. Nos azért nem, mert

385
Óbudai Egyetem BGK Fejezetek a matematikából

ilyen jellegű általános tétel nincs. Egyes esetekben a 3.2.9. tétel segíthet, illetve különböző ad-
hoc módszereket alkalmazhatunk, de általános eredmény erre vonatkozólag nem létezik.

A következőkben speciális szerkezetű hatványsorokkal foglalkozunk.

3.2.3. Taylor-sorok
Az előző pontban felvetettük azt a problémát, hogy egy hatványsor konvergens-e és ha igen
akkor mi az összegfüggvény. Most tegyük fel a kérdést fordítva. Legyen adott egy függvény,
amely tetszőlegesen sokszor deriválható. Kérdés melyik az a hatványsor, amelynek egy adott
intervallumon éppen ez a függvény az összegfüggvénye. Ez a problémakör vezet el bennünket a
Taylor-sor és a MacLaurin-sor fogalmához.

Legyen adott egy f(x) függvény és tegyük fel, hogy egy I intervallumon a f(x)-et „előállítja” egy
hatványsor.

f(x) = c0 + c1(x – x0) + c2(x – x0)2 + c3(x – x0)3 +…+ cn(x – x0)n +… (xI)

Kérdés, hogyan határozhatók meg ennek a hatványsornak a cn együtthatói? Ezek kiszámításához


helyettesítsük a sorba x0-t, majd deriváljuk a sort – a 3.2.9. tétel szerint ezt lehet – és
helyettesítsük x0-t a deriválással kapott sorba, majd újra deriválunk …stb.

f(x0) = c0

f ’(x) = c1+ 2c2(x – x0) +3c3(x – x0)2 +…+ ncn(x – x0)n–1 +…; innen f’(x0) = 1∙c1

f ”(x) = 2c2 + 2∙3c3(x – x0) +…+ n(n – 1)cn(x – x0)n–2 +…; innen f ”(x0) = 1∙2∙c2

f ’”(x) = 2∙3c3 +…+ n(n – 1)(n – 2)cn(x – x0)n–3 +…; innen f ’”(x0) = 1∙2∙3∙c3

f(n)(x) = n(n – 1)(n – 2)…2∙1cn + …; innen f(n)(x0) = n(n – 1)(n – 2)…2∙1∙cn = n!∙cn

Ezzel el is jutottunk a keresett együtthatókhoz. Az f (n)(x0) = n!∙cn egyenletekből látszik, hogy ha


az f(x) függvényt előállítja a fenti hatványsor, akkor az együtthatókat csak az alábbi formulák
szolgáltathatják

f ( n) ( x0 )
cn  ; n = 0, 1, 2, …
n!

ahol n! = 1∙2∙3∙4∙…∙n, „n-faktoriális”.

386
Óbudai Egyetem BGK Fejezetek a matematikából

Bevezetünk egy elnevezést. Ha egy f(x) függvényhez a fenti eljárással hozzárendelünk egy
hatványsort, akkor azt mondjuk, hogy a függvényt hatványsorba fejtjük.

3.2.7. Definíció: Tegyük fel, hogy az f(x) függvény az x = x0 pontot tartalmazó nyílt
intervallumban tetszőlegesen sokszor differenciálható. Ekkor a

f (n) ( x0 ) f "( x0 ) f ( n) ( x0 )
 n!  x  x0   f ( x0 )  f ( x0 )( x  x0 )  2! ( x  x0 )  ...  n!  x  x0   ...
n n
 2
n 0

hatványsort az f(x) függvény az x = x0 körüli Taylor-sorának nevezzük. Speciális esetben,


ha x0 = 0, akkor a

f ( n) (0) n f "(0) 2 f ( n) (0) n


 n! x  f (0)  f (0) x 
2!
x  ... 
n !
x  ...
n 0

sort kapjuk. Ezt MacLaurin-sornak nevezzük.

Ez a sorfejtés minden olyan esetben elvégezhető, amikor az f(x) függvény tetszőlegesen sokszor
deriválható. De kérdés, hogy a sor konvergens-e egyáltalán és ha igen előállítja-e a függvényt. Ez
a probléma azt jelenti a gyakorlatban, hogy minden Taylor-sorfejtés esetében meg kell vizsgálni a
konvergencia kérdését.

3.2.10.Tétel: (Taylor-tétel)
Ha az f(x) függvény az x = x0 pont valamely környezetében legalább n + 1-szer differenciálható
és x hozzátartozik ehhez a környezethez, akkor létezik x és x0 között egy olyan ξ hely, hogy
fennáll az alábbi egyenlőség.

f (n) ( x0 ) f (n 1) ()


 x  x0 n 1
f "( x0 )
f ( x)  f ( x0 )  f ( x0 )( x  x0 )  ( x  x0 ) 2  ...   x  x0 n 
2! n!  n  1!
3.2.8.Definíció: Az előző tételben szereplő

f "( x0 ) f (n) ( x0 )
Txn ( x)  f ( x0 )  f ( x0 )( x  x0 )  ( x  x0 )2  ...   x  x0 n
0 2! n!

polinomot n-edfokú Taylor-féle polinomnak nevezzük, az összeg (n + 1)-edik tagját pedig


Lagrange-féle maradéktagnak. Ez utóbbit Rn(x)-el jelöljük.

f (n 1) ()
Rn ( x)   x  x0 n 1
 n  1!
Összefésülve az előző két formulát, a következőt kapjuk.

387
Óbudai Egyetem BGK Fejezetek a matematikából

f (n 1) ()
f ( x)  Txn ( x)   x  x0 n 1  Txn0 ( x)  Rn  x 
0  n  1!
Ezt az egyenlőséget úgy interpretálhatjuk, hogy egy f(x) függvényértéke előállítható egy polinom,
a Taylor-polinom helyettesítési értéke és a maradéktag helyettesítési értékének összegeként. Ez
utóbbi tagot az alkalmazások során gyakran hibatagnak tekintjük, illetve nevezzük, ugyanis ezzel
lehet becsülni a függvény polinommal történő közelítésének hibáját. Ezek a fogalmak a Taylor-
sorok alkalmazásánál illetve a konvergencia vizsgálatánál játszanak szerepet.

Mire használhatjuk a Taylor-polinomot? Nagyon sok lehetőség van erre, a lényeg minden esetben
az, hogy az f(x) függvényt egy alkalmasan választott x0 pont egy környezetében a megfelelően
magas fokú Taylor-polinomjával helyettesítünk. Alkalmazhatjuk például:
- Függvényértékek közelítő kiszámítására,
- Egyenletek (különösen transzcendens egyenletek) közelítő megoldására,
- Olyan függvények integrálására, amelyeknek nem létezik primitív függvénye,
vagy amelyek integrálása nagyon bonyolult,
- Differenciálegyenletek soralakú megoldásának előállítására,
- Határértékek kiszámítására,…stb

Az alkalmazás előnye, hogy a Taylor-polinom alkalmazása során csak könnyen kezelhető


hatványfüggvényekkel dolgozunk, és csak a négy alapművelet elvégzésére van szükség!

A Lagrange-féle maradéktag vizsgálata pedig arra ad lehetőséget, hogy megvizsgáljuk a fenti


esetekben, amikor a függvényt a polinommal helyettesítjük, mekkora hibát követünk el. De van
még egy fontos szerepe. Segítségével eldönthető, hogy a Taylor-sor valóban előállítja-e a
függvényt. A Taylor-tétel alapján ugyanis nyilvánvaló az alábbi tétel állítása.

3.2.11.Tétel: Legyen az f(x) függvény az x = x0 pont egy I környezetében tetszőlegesen sokszor


differenciálható. Akkor és csak akkor teljesül az


f ( n) ( x0 )
 n!  x  x0  ; xI
n
f ( x) 
n 0

egyenlőség, tehát pontosan akkor állítja elő a Taylor-sor az f(x) függvényt, ha minden xI esetén
teljesül, hogy lim Rn(x) = 0, tehát ha a Lagrange-féle maradéktag határértéke zérus. ■

A témakör alkalmazásaképpen elsőként arra mutatunk példákat, hogyan lehet egy függvény
Taylor sorát előállítani. Erre a következő módszerek alkalmazhatók.

1. A 3.2.7. definíció alapján.


2. Ismert Taylor-sor felhasználásával. Ezen belül:
a) Összetett függvény képzésével.
b) Deriválással vagy integrálással a 3.2.9. tétel alapján.
c) Elemi résztörtekre bontással.
d) stb.

388
Óbudai Egyetem BGK Fejezetek a matematikából

Az alábbiakban mindegyik módszerre mutatunk példát.

3.2.10.Példa: Kezdjük az egyik legfontosabb Taylor-sorral, az exponenciális függvény


x0 = 0-körüli Taylor-sorával. A definíció alkalmazásaképpen először minden n-re elő kell állítani
az f(x) = ex függvény n-edik deriváltját. Ez nagyon egyszerű, hiszen minden n-re igaz, hogy
f    x   e x . Ebből következően f    x0   f    0   e0  1 . Ebből már következik, hogy az
n n n

exponenciális függvény 0-körüli Taylor-sora a következő:

f (n) (0) n 1 2 1 n xn
T0 exp( x)   n! x  1  x 
2!
x  ... 
n!
x  ...   n!
n 0 n 0

Hátra van még a konvergencia vizsgálata. Elsőként meg kell határoznunk a konvergencia sugarat.
1
Az együtthatók a következők: cn   n  N  . Ebből következően a Cauchy-Hadamard tétel
n!
szerint
1 c n! 1
 lim n 1  lim  lim 0
R cn  n  1! n 1

Ez az idézett tétel szerint azt jelenti, hogy a konvergencia sugár R = ∞, tehát a konvergencia
 xn 
halmaz az egész R halmaz: KH     R . Hátra van még annak kimutatása, hogy a sor
 n ! 
 n 0 
valóban az exponenciális függvényt állítja elő. Ehhez a 3.2.11. tétel szerint igazolnunk kell, hogy
a Lagrange-féle maradéktag a nullához tart. Legyen x tetszőleges valós szám. Ekkor a Taylor-
tétel szerint létezik ξ ] 0, x [ vagy ξ ] x, 0 [ olyan, hogy

f (n 1) () n 1 e  x n 1
Rn ( x)  x 
 n  1!  n  1!
Ebben a hányadosban az exponenciális faktor egy konstans szorzó, elég az n-től függő hányados
konvergenciáját vizsgálni. Az egyszerűség érdekében vezessük be az m = n + 1 jelölést, és legyen
m0 > x pozitív egész. Ekkor igaz a következő becslés:

x m  m0 x m0 x m  m0
m
xm x m0 m m0 x m m m0 x
0      0   0
m! m0 !  m0  1  ...  m m0 ! m0m  m0 m0 ! m0m m0 ! m0

x
Az utolsó tagban az m0 választása miatt egy q   1, 1  kvóciensű mértani sorozat m-edik
m0
tagja áll. Erről tudjuk, hogy a 0-hoz konvergál. Ha most alkalmazzuk a közrefogási elvet – a
kérdéses hányadost alulról is és felülről is becsüljük egy 0-hoz tartó sorozattal –, akkor látjuk,
hogy az állítást igazoltuk, a Lagrange-féle maradéktag valóban nullához tart.

389
Óbudai Egyetem BGK Fejezetek a matematikából

Ez más szavakkal azt jelenti, hogy a fenti Taylor-sor előállítja az exponenciális függvényt, tehát a
Taylor-sort egyenlővé tehetjük az exponenciális függvénnyel


xn 1 1
exp( x)  e x   n!  1  x  2! x2  ...  n! xn  ...;  x  R 
n 0

Az exponenciális függvény Taylor-sorral történő közelítését szemlélteti a 3.2.4. ábra.

3.2.4. ábra. Az exponenciális függvény grafikonja (kék színű görbe) és a függvény közelítése a
Taylor-sor első hat tagjával, tehát az ötödfokú Taylor-polinommal (piros színű görbe).

 3n  2 
3.2.11.Példa: A numerikus sorok témakörében a 3.1.11. példában vizsgáltuk a   n! 
n 1  
numerikus sort. Ott megmutattuk a hányados kritériummal, hogy a sor konvergens, de nem
tudtuk megállapítani, hogy mi az összeg. Az exponenciális függvény Taylor-sorának birtokában
 3n 
azonban már meg tudjuk határozni a sor összegét. Vegyük észre, hogy a sor felírható 9    
 n! 
n 1  
alakban is, erről pedig már látható – a 9-es szorzótól eltekintve –, hogy éppen az exponenciális
függvény hatványsorának a helyettesítési értéke az x = 3 helyen. Eszerint a sor összege:

  n2 
3
    9  e3
n ! 
n 0 

390
Óbudai Egyetem BGK Fejezetek a matematikából

Mondhatjuk, hogy "szerencsénk" volt, nem általános dolog, hogy egy numerikus sor esetében
ráismerünk egy nevezetes Taylor-sorra.

3.2.12.Példa: Határozzuk meg az f(x) = cosx függvény 0-körüli Taylor-sorát! Ehhez elő kell
állítanunk tetszőleges n esetén a függvény n-edik deriváltját,

f (0)(x) = cosx; f ’(x) = –sinx; f ”(x) = –cosx; f (3)(x) = sinx; f (4)(x) = cosx; …

látható, hogy a negyedrendű deriválttól kezdődően a deriváltak ismétlődnek. Számítsuk ki a


deriváltakat a 0-helyen:

f (0)(0) = 1; f ’(0) = 0; f ”(0) = –1; f (3)(0) = 0; f (4)(0) = 1; …

Már nincs más feladatunk, mint behelyettesíteni a MacLaurin-sor képletébe.

f (n) (0) n 1 0 1 0 1 0
 n!
x  1  0 x  x 2  x3  x 4  x5  x6  x7  ...
2! 3! 4! 5! 6! 7!
n 0

ha itt elhagyjuk azokat a tagokat, amelyek zérussal egyenlők, megkapjuk a cosx függvény
MacLaurin-sorát.

T0 cos( x)  1 
x 2 x 4 x6 x8
    ...  
 1n x2n
n 0  
2! 4! 6! 8! 2n !

Kérdés, hogy a sor elállítja-e a függvényt. Ehhez elsőként a konvergencia sugarat kell
meghatározni. Ezt most a következő módon számítjuk. Rögzítünk egy valós x-et, és
megvizsgáljuk a hányados kritériummal, hogy az adott x helyen abszolút konvergens-e, tehát
konvergens-e a sor.

n 1 2n  2
lim
 2n !  1 x
 lim
x2
0
 1n x2n  2n  2 !  2n  1 2n  2 

A határérték tetszőlegesen rögzített x valós szám esetén zérus, ami a hányados kritérium szerint
azt jelenti, hogy a sor minden valós x esetén konvergens, tehát a konvergencia sugár R = ∞, ami
azt jelenti, hogy a koszinusz függvény hatványsorának konvergencia halmaza is az egész R
  1n x2n   R . Annak kimutatását, hogy a Lagrange-féle maradéktag
halmaz: KH  
 n  0  2n  ! 
 
nullához tart minden x-re a 3.2.8. példabeli gondolatmenet megismétlésével az Olvasóra bízzuk.
Ezek az eredmények pedig pontosan azt jelentik, hogy a felírt MacLaurin-sor előállítja a
koszinusz függvényt a teljes számegyenesen.

391
Óbudai Egyetem BGK Fejezetek a matematikából

Írhatjuk tehát, hogy


 1n x2n  1  x2  x4  x6  x8  ...;
cos( x)   2n ! xR
n 0  
2! 4! 6! 8!

A koszinusz függvény, különböző fokszámú Taylor-polinomokkal való közelítését illusztrálja a


3.2.5. ábra.

3.2.5. ábra. Az koszinusz függvény grafikonja (kék színű görbe) és a függvény közelítése különböző fokszámú
Taylor-polinomokkal (piros színű görbék). Az ábrán a koszinusz görbe feletti görbék az egyre pontosabb közelítés
szerint rendre az n = 4, 8, 12 fokszámú polinomok grafikonjai, a koszinusz függvény grafikonja alatt levő görbék, az
egyre pontosabb közelítésnek megfelelően rendre az n = 6, 10, 14 fokszámú Taylor-polinomok grafikonjai.

Megemlítjük még ebben az esetben azt a tényt, hogy a koszinusz függvény Taylor-sorában csak
páros kitevőjű hatványok szerepelnek. Ez, annak fényében, hogy a koszinusz függvény páros,
magától értetődőnek tűnik. Ezt az észrevételt mindenesetre felhasználhatjuk arra, hogy
könnyebben megjegyezzük a Taylor-sort. A későbbiek előrevetítéseként megjegyezzük, hogy a
paritás sokkal többet jelentő tény például akkor, ha egy páros vagy páratlan periodikus függvényt
Fourier-sorba fejtünk. Ehhez utalunk a Fourier-sorok című fejezetre ahol ezt a kérdést részletesen
megvizsgáljuk.

A 3.2.8. és 3.2.10. példák alapján egyszerűen felírható például egy tetszőleges pozitív valós alapú
exponenciális függvény, a szinusz függvény a szinusz-hiperbolikusz valamint a koszinusz-
hiperbolikusz függvény Taylor sora is. Javasoljuk, hogy ezeket a számításokat az Olvasó végezze
el.

392
Óbudai Egyetem BGK Fejezetek a matematikából

Ha a definíció szerint néhány sort felírunk, akkor ezekből a 3.2.9. tétel felhasználásával további
Taylor-sorok adódnak, ha egy ismert sort deriválunk vagy integrálunk. Vegyük észre azt is, hogy
1
a 3.2.3. példában szereplő hatványsor is egy Taylor-sor, méghozzá az f ( x)  függvény
1 x
Taylor-sora, melynek konvergencia tartománya a ]–1, 1[ intervallum. Ezt a sort nem a definíció
alapján kaptuk, hanem a mértani sorra való hivatkozással. Ha itt kvóciensként nem x-et, hanem
–x-et, x2-et,…stb. választunk, számos újabb Taylor-sort kaphatunk. Ezeket is lehet integrálni,
deriválni. Ezek után már csak fantázia kérdése, hogy újabb és újabb sorokat állítsunk elő.

3.2.13. Példa: Határozzuk meg az f(x) = sin2x függvény 0-körüli Taylor-sorát. Ebben az esetben
nem a definíció alapján dolgozunk, hanem felhasználjuk az alábbi trigonometrikus azonosságot,
amelyet leggyakrabban linearizáló formulaként emlegetünk:

1  cos 2 x
sin 2 x 
2

Itt használjuk fel, hogy ismerjük a koszinusz függvény mindenütt konvergens Taylor-sorát
(3.2.10. példa). Nem kell más tennünk, mint abban x helyére 2x-et írni és készen is vagyunk.
Mivel a konvergencia halmaz R, ez a helyettesítés nem változtat a konvergencia tényén, a kapott
sor tehát ugyancsak mindenütt konvergens.

1 1   1
n
1 1
sin  x    cos(2 x)   
2
 2 x 2 n 
2 2 2 2 n  0  2n  !

1 2  x 2 23  x 4 25  x6 27  x8
      ...; x  R
2 2! 4! 6! 8!

3.2.14. Példa: Határozzuk meg az f(x) = ln(1 + x), (x > –1) függvény 0-körüli Taylor-sorát.
Alkalmazzuk a hatványsorok deriválására-integrálására vonatkozó 3.2.9. tételt. Ezért először
deriváljuk f(x)-et.

1
f ' x 
1 x

Itt vegyük észre, hogy ez a függvény tekinthető egy q = –x kvóciensű mértani sor összegének is.

1 1
 1  x  x 2  x3  x 4  ...    1 x n ; x  1,1
n

1  x 1  (  x) n 0

Az f(x) = ln(1 + x) függvény sora ennek a hatványsornak az integrálásával születik.

393
Óbudai Egyetem BGK Fejezetek a matematikából

  n 1
n x
ln(1  x)      1 x n  dx     1 x n dx    1
n n
C 
  n  1
 n 0  n 0 n 0

x 2 x3 x 4 x5
 x     ...  C; x  1,1
2 3 4 5

Az egyenlőség mindkét oldalán, így egyelőre a Taylor-sorban is szerepel egy C integrációs


állandó. Ennek értékét megkapjuk, ha helyettesítünk egy alkalmas x-et a konvergencia
tartományból, legyen ez most a 0. Mivel ln(1 + 0) = 0 és a jobb oldalon a hatványsor minden
tagja 0, ezért a konstans is 0, tehát keresett Taylor-sor a következő.


n 1 xn x 2 x3 x 4 x5
ln(1  x)    1  x     ...; x  1,1
n 1
n 2 3 4 5

A konvergencia feltétele az, hogy a kvóciens abszolút értékben kisebb legyen, mint 1. Mivel most
q = –x, akkor konvergens a sor, ha teljesül, hogy –x ] –1, 1[, ez azonban nyilván pontosan akkor
teljesül ha x ] –1, 1[, ezért írhattuk, hogy KH = ] –1, 1[.

A 3.2.6. ábrán látható az ln(1 + x) függvény és a közelítése hatod fokú Taylor-polinommal.

3.2.6. ábra. Az ln(1 + x) függvény grafikonja (kék színű görbe) és közelítése hatod fokú Taylor-polinommal
(piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.

Az eredményünket némileg tudjuk pontosítani, ugyanis vegyük észre, hogy az x = 1 helyen, a


helyettesítési értékek sora éppen a hiperharmonikus sor, amelyről igazoltuk, hogy konvergens és
összege ln2. A bal oldali végpontban viszont a divergens harmonikus sor ellentettjét kapjuk. Ez
azt jelenti, hogy a konvergencia tartomány pontosabban a ] –1, 1] jobbról zárt intervallum.

394
Óbudai Egyetem BGK Fejezetek a matematikából

Azonban a Taylor-sorok alkalmazása szempontjából ez ritkán fontos, mert a sorfejtésnél


elsősorban a belső pontokban használjuk ki a konvergenciát, gondoljunk ehhez Abel tételére.

2x
3.2.15. Példa: Határozzuk meg az f  x   függvény 0-körüli Taylor-sorát. Vegyük
1  x 
2 2

észre, hogy ha integráljuk az f(x) függvényt, akkor egy olyan függvénysort kapunk, amelynek
1
már ismerjük a Taylor-sorát. Az f(x) egy primitív függvénye ugyanis az F  x   
1  x2
2
függvény. Ez pedig – az előjeltől eltekintve –, egy q = – x kvóciensű mértani sor összege.


1
1 x 2

1
2
1  ( x )
 
  1  x 2  x 4  x6  x8  ...     1 x 2n 
n 0
n
  1
n 0
n 1 2n
x

Ennek a sornak a konvergencia halmaza ugyancsak a ] –1, 1[ intervallum, hiszen  x 2  1,1


akkor teljesül, ha x  1,1 . Ebből a sorból az f(x) függvény sora tagonkénti deriválással adódik.


2x n 1
f  x  3 5 7
 2 x  4 x  6 x  8 x  ...    1 2n  x 2n 1; x  1,1
1  x2 
2
n 1

6x  8
3.2.16. Példa: Fejtsük 0-körüli Taylor-sorba az f  x   ; x  R \ 2,3 valós függvényt.
2
x  x6
Tekintettel arra, hogy ez a függvény egy valódi racionális törtfüggvény, megpróbálkozhatunk az
elemi résztörtekre bontás módszerével.

6x  8 6x  8 A B 2 4
    
x2  x  6  x  3 x  2  x  3 x  2 x  3 x  2
Így olyan tagokhoz jutottunk, amelyeket a korábbiak alapján már Taylor-sorba fejthetünk. Az
összeg mindkét tagja emlékeztet egy mértani sor összegére. Végezzük el a szükséges
átalakításokat, hogy pontosan úgy nézzen ki, mint egy mértani sor összegfüggvénye. Az alábbi
x
átalakítások mutatják, hogy első tag egy q  kvóciensű mértani sor összege.
3
2   x 2  1
n n
2 2 1 2 1
            xn
x  3 3 x 1 3 1 x 3 n 0  3  3 n 0  3 
3 3
x
a második tag pedig egy q   kvóciensű mértani sor összege.
2

395
Óbudai Egyetem BGK Fejezetek a matematikából

  n n
4 4 1 1  x  1 
 2  2      2    xn
x  2 2 x 1  x n 0 
2 n 0 
2 
1   
2  2

Az f(x) függvény hatványsora ezen két sor összege.

 
2  1 n  1   n
n  n n n
 1  n 21
T0 f  x     
3 n 0  3 
x  2   2  x    3  3   2   x
   2
n 0 n 0  

Már csak az a kérdés, hogy mi a hatványsor konvergencia halmaza. Az első tag sora konvergens,
x
ha  1, azaz  3  x  3 , a második tag sora pedig akkor konvergens, ha
3
x
  1, azaz  2  x  2 . Ebből következően az f(x) függvény hatványsora a ]–2, 2[
2
intervallumon konvergens és ott a sor előállítja a függvényt. A 3.3.7. ábrán láthatjuk a függvényt
és közelítését harmadfokú Taylor-polinommal.

3.2.7. ábra. A 3.2.16. példabeli racionális törtfüggvény grafikonja (kék színű görbe) és közelítése harmad fokú
Taylor-polinommal (piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.

396
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.4. A binomiális sor


A Taylor-sorok alkalmazásaképpen ebben a pontban általánosítjuk a valószínűség számítás
témakörében megismert binomiális tételt. Emlékeztetőként felidézzük a tételt, mely szerint, ha n
nem negatív egész, akkor az (a + b) binom n-edik hatványát a következő összeg szolgáltatja.

n
n
 a  b    k  a n  k bk
n

k 0  

ahol az együtthatók az ún. binomiális együtthatók, melyeknek definíciója a következő.

n n! n  n  1 n  2  ...  n  k  1


  
 k  k ! n  k ! k!

hangsúlyozzuk azonban, hogy ezek a formulák csak akkor értelmesek, ha n és k nem negatív
egészek továbbá k ≤ n. Alakítsuk át a binomiális tételt úgy, hogy alkalmazzuk az a = 1, b = x
jelöléseket. Ekkor a következőt kapjuk.

n
 n  nk k n n
  k n 2  n n
1  x n     1 x     x  1  nx    x  ...    x
k 0   k 0    2  n
k k

Kaptunk tehát egy n-ed fokú polinomot, a várakozásnak megfelelően. Felvetjük azt a problémát,
hogy lehet-e ezt a formulát általánosítani arra az esetre, amikor a kitevő tetszőleges valós szám. A
válasz bizonyos korlátozásokkal az, hogy igen. Természetesen arról van szó, hogy a kérdéses
függvényt Taylor-sorba fejtjük és a sor konvergencia halmazában a fenti előállítás
általánosítható.


Induljunk ki az f  x   1  x  ;   R függvényből, és fejtsük Taylor-sorba a 0-pont körül.
Ehhez szükség van a függvény k-ad rendű deriváltjára, illetve ezeknek a 0-helyen vett
helyettesítési értékére tetszőleges nem negatív egész k-ra


f  x   1  x 
1 f  0  1
f '  x    1  x 
f '  0  
 2
f ''  x       11  x  f ''  0       1
3
f '''  x       1   2 1  x  f '''  0       1   2 
... ...
f    x       1   2  ...    k  11  x  f    0       1   2  ...    k  1
k  k k

... ...

397
Óbudai Egyetem BGK Fejezetek a matematikából

ahonnan azonnal adódik a függvény Taylor-sora.

f (k ) (0) k     1     1   2  2     1   2  ...    k  1 k


 k ! x  1  x  2! x2  3!
x ... 
k!
x  ...
k 0

Ha a binomiális együttható értelmezését felidézzük, akkor magától értetődőnek tűnik egy jelölés
bevezetése az alábbi definíció által.

3.2.9. Definíció: Tetszőleges   R valós és k nem negatív egész szám esetén legyen a
binomiális együttható általánosítása az alábbi szimbólum:

       1   2  ...    k  1
  ;   R, k  N
k k!

Ezzel az egyszerűsítő jelöléssel sokkal kompaktabb módon írható fel a kapott hatványsor, melyre
a binomiális tétellel való rokonsága miatt az alábbi elnevezést használjuk.


3.2.10.Definíció: Az f  x   1  x  ;   R függvény 0-körüli Taylor-sorát binomiális sornak
nevezzük. Az előzőek szerint a binomiális sor a következő:

     1 2     1   2  3     1   2  ...    k  1 k


  k  xk  1  x  x  x ...  x  ...
k 0   2! 3! k!

Kérdés még a binomiális sor konvergenciája. A konvergencia sugarat a Cauchy-Hadamard tétel



alapján számítjuk. Mivel ck    , ezért a hányados kritérium szerint írhatjuk, hogy
k

1 c     1   2  ...    k  1   k  k ! k


 lim k 1  lim  lim 1
R ck     1   2  ...    k  1  k  1! k 1

A konvergencia sugár tehát R = 1. Az alkalmazások tekintetében legtöbbször nem érdekes, hogy


a határpontokban konvergens-e a sor, ezért megelégszünk azzal az eredménnyel, hogy a sor
konvergencia tartománya a ] –1, 1[ intervallum. Tehát, a következőre jutottunk.


 k    
    1   2 ...   k  1
 xk ; x  1,1
1  x      x    
k 0  k  k 0
k !

398
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.17.Példa: Írjuk fel az f  x   3 1  x függvény 0-körüli Taylor-sorát, azaz írjuk fel a binomi-
1
ális sort   esetén.
3
1  1  1   1 
 1    1  2  ...   k  1
  3  xk     k !   x k ; x  1,1
 
3 1 x  3 3 3 3
k 0  k  k 0

szemléletesebb a sorfejtés eredménye, ha felírjuk a Taylor-sor első néhány tagját.

11  1  1  1 
  1   1  2 
3 1 x  1 x  
1  x2     x3...  1  1 x  1 x 2  5 x3  ...; x  1,1
3 3 3 3 3
 
3 2! 3! 3 9 81

A sorfejtést grafikusan szemlélteti a 3.2.8. ábra, amelyen harmadfokú polinommal közelítünk.

3.2.8. ábra. A 3.2.17. példabeli irracionális függvény grafikonja (kék színű görbe) és közelítése harmad fokú Taylor-
polinommal (piros színű görbe). A pontozott egyenesek a konvergencia tartomány határait jelölik.

A Taylor-sorok alkalmazásának lezárásaképpen bizonyítsuk be azt az összefüggést amelyet a


komplex számok algebrájában és a differenciálegyenletek megoldása során számos alkalommal
használunk az analízisben. Ez pedig az Euler-féle formula. A bizonyítást Taylor-sorfejtéssel
végezzük, utalva arra a továbblépési lehetőségre, hogy a fentiekben vázolt elmélet kiterjeszthető
a komplex számsíkra. Bizonyítás nélkül megjegyezzük, hogy az elemi függvények komplex
Taylor-sora pontosan ugyanúgy fest, mint a valós Taylor-sor, csak a változók komplexek. Az
igényes Olvasó természetesen nem elégszik meg ezzel a megjegyzéssel, számára a komplex
analízist tárgyaló szakirodalom tanulmányozását javasoljuk.

399
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.12.Tétel: (Euler-féle formula)


Tetszőleges valós x estén fennáll a következő egyenlőség.

eix  cos x  i sin x

Bizonyítás: A bizonyítást úgy végezzük el, hogy felírjuk az egyenlőségben szereplő mindhárom
függvény 0-körüli Taylor-sorát, és az eredményeket összehasonlítjuk.
A 3.2.12. példában előállítottuk a koszinusz függvény Taylor-sorát.

cos( x)  
 1 2n
 n
x  1
x 2 x 4 x6 x8
    ...; xR
n 0  2 n  ! 2! 4! 6! 8!

Ennek tagonkénti deriválásával adódik a szinusz függvény ellentettjének hatványsora, tehát.

sin( x)  

 1
n
x3 x5 x 7 x9
x 2n 1  x      ...; xR
n 0 
2n  1! 3! 5! 7! 9!

A 3.2.12. példabeli gondolatmenetet követve megmutatható, hogy a szinusz függvény Taylor-


sora ugyancsak az egész számegyenesen konvergens. Most felírhatjuk az Euler egyenlőség jobb
oldalát hatványsor alakban.

cos x  i sin x  
 1 2n
 n 
x i 
 1
n
x 2n 1 
n 0   n 0 
2n ! 2n  1!
 x 2 x 4 x6 x8   x3 x5 x 7 x9 
 1      ...   i   x      ...  
 2! 4! 6! 8!   3! 5! 7! 9! 
   
x2 x3 x 4 x5 x 6 x 7 x8 x9
 1  ix  i  i  i   i  ...; x  R
2! 3! 4! 5! 6! 7! 8! 9!

Ezek után nem kell mást tennünk, mint felírni a bal oldali függvény Taylor-sorát. Ehhez
felhasználjuk a 3.2.10. példa eredményét.


 ix n  ix 
2
 ix   ix 
3 4
 ix 
n
ix
e   n!
 1  ix 
2!

3!

4!
 ... 
n!
 ...;  x  R
n 0

Ha felhasználjuk, hogy i 4k  1; i 4k 1  i; i 4k  2  1 és i 4k 3  i , akkor azt kapjuk, hogy a


jobboldal és baloldal Taylor-sora tagonként, rendre megegyezik. Ehhez már csak annyit kell
hozzátenni – bizonyítás nélkül –, hogy az idézett sorok a teljes komplex számsíkon is
konvergensek. ■

400
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.5. A Taylor-polinom és a Taylor-sor alkalmazásai


Ebben a pontban néhány példán keresztül bemutatjuk a Taylor-polinom és a Taylor-sor
alkalmazási lehetőségeit. Annak hangsúlyozása, hogy néha a polinomot használjuk, azért fontos,
mert a gyakorlatban egy hatványsorból mindig csak véges sok tagot tudunk figyelembe venni,
tehát minden ilyen alkalommal lényegében egy Taylor-polinommal dolgozunk és nem az egész
sorral. Ha viszont a hibát is becsülni akarjuk, természetesen a sor összes többi tagjára vonatkozó
becslést kell adnunk.

Függvényértékek közelítő számítása.Az első két példa az egyik legfontosabb alkalmazást


mutatja be, a közelítő függvényértékek kiszámítását és a kapcsolódó hibabecslést. Ehhez
felidézzük Taylor-tételét, amely formulákkal a következő módon írható:

f (n 1) ( )
n
f ( x)  Tx ( x)   x  x0 n 1  Txn0 ( x)  Rn  x  ; azaz f  x   Txn0 ( x)  Rn  x 
0  n  1!

Ez annyit jelent, hogy a közelítő függvényérték nem más, mint a Taylor-polinom helyettesítési
értéke, a hiba pedig a Lagrange féle maradéktag abszolút értékével becsülhető.

Mielőtt általános jellegű közelítéseket végeznénk a soron következő feladatokon belül, először a
két leggyakrabban alkalmazott közelítést emeljük ki.

a) Lineáris közelítés

Ha a Taylor-polinomból csak az első fokú tagot tartjuk meg, akkor beszélünk elsőfokú vagy
lineáris közelítésről. Ebben az esetben a közelítő formula az alábbi.

f  x   f  x0   f '  x0  x  x0 

Mivel a jobboldal az x változóban elsőfokú függvény, ezért a jobboldali függvény képe egyenes.
Ezért is nevezzük ezt a közelítést lineárisnak. A lineáris közelítést akkor szokás alkalmazni, ha az
x hely, ahol a közelítő függvényértéket számítjuk „elég közel van” az x0 helyhez. Itt
emlékeztetnénk a derivált definíciójára:

f  x   f  x0 
f '  x0   lim
x  x0 x  x0

Ha ezzel a definícióval, és a derivált szemléletes tartalmával összevetjük az elsőfokú közelítés


formuláját látható, hogy a lineáris közelítés azt jelenti, hogy a függvényt az x0-pontbeli
érintőjével közelítjük.
Példaként illusztráljuk a lineáris közelítést az f(x) = lnx függvény közelítését az x0 = 1 pontbeli
elsőfokú Taylor-polinomjával. Ehhez szükség van az x0 = 1 pont körüli Taylor-sor első két

401
Óbudai Egyetem BGK Fejezetek a matematikából

1
tagjára. Egyrészt f 1  ln1  0 , másrészt f '  x   miatt f ' 1  1 tehát a lineáris közelítést adó
x
elsőfokú Taylor-polinom T11 f  x   0  1  x  1  x  1 . Ezt szemlélteti a 3.2.9. ábra.

3.2.9. ábra. A logaritmus függvény grafikonja (kék színű görbe) és


lineáris közelítése az x0 = 1 pont körül (piros színű egyenes).

b) Másodfokú vagy parabolikus közelítés

Ha a Taylor-polinomból megtartjuk a konstans tagot az elsőfokú tagot és a másodfokú tagot is,


akkor beszélünk parabolikus vagy másodfokú közelítésről. Ezt akkor szokás alkalmazni, ha a
lineáris közelítés nem kielégítő pontosságú. Parabolikus közelítés esetén a közelítő formula az
alábbi:

f "  x0 
f  x   f  x0   f '  x0  x  x0    x  x0 2
2

Parabolikus közelítésre példaként lássuk a koszinusz hiperbolikusz függvény x0 = 0 pontbeli


közelítését a másodfokú Taylor-polinomjával. Ehhez szükségesek a következő számítások:

ch(0)  1;ch '  x   sh  x  így ch '  0   sh  0   0 végül ch"  x   ch  x  tehát ch " 0  1 .

Innen már következik, hogy a keresett másodfokú Taylor polinom:

1 2 x2
T02 ch  x   1  0  x  x  1
2 2

A koszinusz hiperbolikusz függvényx0 = 0 pontbeli másodfokú közelítését illusztrálja a 3.2.10.


ábra.

402
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.10. ábra. A koszinusz hiperbolikusz függvény grafikonja (kék színű görbe) és


parabolikus közelítése az x0 = 0 pont körül (piros színű parabola).

3.2.18.Példa: Határozzuk meg ln2 közelítő értékét úgy, hogy a hatod-fokú Taylor-polinommal
közelítünk és becsüljük meg a közelítés hibáját. A számításhoz felhasználjuk a 3.2.14. példa
eredményét, az f(x) = ln(1+x) függvény Taylor-sorát. A feladat azt kívánja, hogy a hatod fokú
Taylor-polinommal közelítsünk, ezért a sorból megtartjuk az első 6 tagot.

6 n
n 1 x x 2 x3 x 4 x5 x 6
T06 f  x     1 n
 x
2
 
3 4

5

6
n 1

Mivel ln2 = f(1) ezért a közelítő érték a polinom x = 1 helyen vett helyettesítési értéke. Tehát
írhatjuk, hogy

6
n 1 1n 1 1 1 1 1 37
ln 2  T06 f 1    1 n
 1     
2 3 4 5 6 60
 0, 616666...
n 1

Ez azonban csak akkor használható eredmény, ha meghatározzuk, hogy mekkora a közelítés


hibája. A hibát a maradéktaggal becsülhetjük. Mivel a sor 0-körüli Taylor-sor, és a helyettesítési
értéket az x = 1 pontban számítjuk, Taylor-tétele szerint létezik olyan   0,1 valós szám, hogy
teljesül az

f (7) ( ) 7 f (7) ( ) 7
f ( x)  T06 ( x)  x  x
7! 5040

egyenlőség. Mivel a   0,1 valós számnak csak a létezését biztosítja a tétel, de nem ad
módszert annak konkrét meghatározására, a maradéktagot csak becsülni tudjuk, célszerűen

403
Óbudai Egyetem BGK Fejezetek a matematikából

természetesen felülről. Ehhez szükség van az f(x) = ln(1+x) függvény hetedik deriváltjára.
Könnyen előállítható a függvény n-ed rendű deriváltja tetszőleges pozitív egész n-re.

n 1  n  1 !
f    x    1
n
1  x n
Ebből a hetedik derivált is azonnal adódik. Kérdés, hogy hogyan lehet ennek az abszolút értékét a
[0, 1] intervallumon felülről becsülni. Mivel a nevező x növekedésével szigorúan növekszik, a
tört szigorúan csökken, így az x = 0 helyen veszi fel a legnagyobb értékét. Innen a közelítő érték
hibája a következő.

f (7) ( ) 7  7  1! 17  6!  1  0,1428...


 17 1
1
f ( x)  T06 ( x)  x 
5040 5040 1  0 n 7! 7

Amelynek a felhasználásával írhatjuk, hogy ln2 a következő intervallumban van.

 37 1 37 1 
ln 2    ;    0, 4738;0, 7595
 60 7 60 7 

Látható, hogy a hiba még relatíve nagy, ami annak az oka, hogy a sor lassan konvergál, sokkal
több tagot kellene figyelembe vennünk egy olyan eredmény meghatározásához, amelynél ln2-nek
már vannak értékes jegyei. Pontosítva ezt, a számításból látható, hogy az n-ed fokú Taylor

polinommal történő közelítés esetén a közelítés hibája az


 n  1!  1 hányadossal becsülhető. Ez
n! n
–2
azt jelenti, hogy ha pl. 10 pontosságú becslést szeretnénk, akkor n=100 tagot figyelembe kell
venni a sorból, 10–3 pontossághoz pedig 1000 tagot, stb. Ezt jelenti a lassú konvergencia. Egy
illusztráló feladatban ennyi tagot nyilván nem tudunk figyelembe venni.

3.2.19.Példa: Határozzuk meg 3 30 közelítő értékét úgy, hogy a negyedfokú Taylor-polinommal


közelítünk és becsüljük meg a közelítés hibáját. A Taylor-polinom ebben az esetben a 3.2.17.
példában szereplő f  x   3 1  x függvény binomiális sorából adódik, ha az első öt tagot
megtartjuk. Öt tagot kell figyelembe vennünk, mert a sor konstans taggal kezdődik. A
negyedfokú Taylor-polinom tehát a következő.

1  1  1  1 
4   1  2  ...   k  1
T04 f  x    
3 3  3  3  x k  1  1 x  1 x 2  5 x3  10 x 4
k 0
k! 3 9 81 243

A kérdéses függvényértéket nem úgy számítjuk, hogy a polinomba az x = 29 értéket


helyettesítjük, hiszen a Binomiális sor csak a ]–1, 1[ intervallumban konvergens. Ezért először
azonos átalakításokat végzünk.

404
Óbudai Egyetem BGK Fejezetek a matematikából

1
3
30  3 27  3  3 33  3  3  3 1 
9

1
Ebben az esetben már helyesen járunk el, ha a felírt Taylor-polinomba az x  értéket
9
helyettesítjük, ugyanis ezen a helyen a Binomiális sor konvergál. Ezek szerint a közelítő
függvényérték:

3 30  3  T 4 f  1   3  1  1  1  1  1  5  1  10  1   3,10723107
0    3 9 9 2 81 3 243 4 
9  9 9 9 

Megkaptuk tehát a közelítő értéket, de meg kell becsülni a közelítés hibáját is. Ezt ismét a
Lagrange-féle maradéktaggal végezzük el. A negyedfokú polinomhoz tartozó maradéktag a
f (5) ( ) 5
következő: R4  x   x . Ehhez tehát szükséges az f(x) függvény ötödik deriváltja.
5!

1
f    x     1  2   3   4  1  x  3 
5 1  1  1  1  1  5 880 1
3  3  3  3  3   
243 3 1  x 14

Innen a hiba, a derivált függvény szigorú monoton csökkenésének figyelembe vételével a


 1
következő módon becsülhető.   0,  esetén.
 9

f (5) ( ) 5 1 880 1
f ( x)  T04 ( x)  x  x5 
5!
 
120 243 3 1   14

880 1 1 28160 1
    0, 0000163
5
 
29160 3 1  0 14 9 29160 59049

A közelítés hibája tehát 10–5 nagyságrendű.

3.2.20.Példa: Fordítsuk most meg a kérdésfeltevés logikáját. Előírunk egy hibakorlátot, és annak
megfelelően közelítünk Taylor-polinommal. Példaképpen számítsuk ki az Euler-féle e szám
közelítő értékét 10–5 pontossággal! Ehhez nyilván az exponenciális függvény Taylor-sorát
használjuk fel. Ha az n-ed fokú Taylor-polinommal közelítünk, akkor figyelembe véve, hogy az
exponenciális függvény szigorúan monoton növekedő, hogy e = f(1), tehát x = 1, továbbá azt,
hogy 0    1 valamint azt az analízisből ismert becslést, hogy e < 3, a Lagrange-féle
maradéktagot a következő módon becsülhetjük.

405
Óbudai Egyetem BGK Fejezetek a matematikából

f ( n 1) ( ) exp( n 1) ( ) n 1 e


 x  x0 n 1 
3
Rn  x   x  
 n  1!  n  1!  n  1!  n  1!

Ha az előírás az, hogy a hiba legyen kisebb, mint 10–5, akkor a feltétel n-re az, hogy
3
 105 , azaz 300000   n  1! teljesüljön. Ez igaz n = 8 esetén, ugyanis
 n  1!
(8 + 1)! = 362880. Tehát ha a 3.2.10. példa eredményét felhasználva a nyolcad fokú Taylor-
polinommal közelítünk az x = 1 helyen, akkor e értékét a kívánt pontossággal kapjuk.

8
f (n) (0) n 1 1 1 1 1 1 1
e  T08 exp(1)   n! 1  1  1  2!  3!  4!  5!  6!  7!  8!  2, 71827876...
n 0

Ismerve az e szám több tizedesre pontos értékét, e = 2,71828182..., látható, hogy a becslés hibája
valóban a kívánt nagyságrendbe esik. Mivel ebben az esetben, egy n-ed fokú polinommal
1
közelítve, a hiba lényegében nagyságrendjébe esik, mondhatjuk, hogy a Taylor-sor
 n  1!
ebben az esetben gyorsan konvergál, viszonylag kis számú tag figyelembe vételével pontos
közelítést adhatunk a függvényértékre.

Integrálás

A továbbiakban a Taylor-sor illetve a Taylor-polinom integrálszámításbeli alkalmazását mutatjuk


be. Az alkalmazás azért fontos, mert számos olyan függvény létezik, amely a műszaki
gyakorlatban és elméleti szempontból is fontos, de a függvénynek nem létezik primitív
sin x cos x e x  1
e x ;
2
függvénye. Ilyen függvények például az ; ; ;sin x 2 ;cos x 2 ;...;stb.
x x x
függvények. Ha nem létezik primitív függvény, akkor a függvény analitikusan nem integrálható.
Ha azonban a függvényt egy alkalmas pont körül Taylor-sorba fejtjük és a megfelelő fokú
Taylor-polinomot integráljuk a megadott intervallumon, akkor tetszőleges pontossággal
közelíthetjük a határozott integrál értékét. A mondottak szerint a probléma vizsgálatát kétféle
módon folytatjuk. Megvizsgáljuk a határozatlan és a határozott integrálás lehetőségét.

Ha határozatlan integrált számítunk, akkor gyakorlatilag a függvény primitív függvényének


analitikus alakját közelítjük egy Taylor-sorral. Ebben az esetben egy speciális primitív függvényt
választunk, az integrálfüggvényt. Az integrálfüggvény voltaképpen egy [a, x] intervallumra
vonatkozó határozott integrál, ahol az alsó határ rögzített a felső határ azonban változó. Ezért
szokás erről úgy beszélni, hogy az integrál a felső határ függvénye. Ebben az esetben tehát egy

 f  t  dt
a

406
Óbudai Egyetem BGK Fejezetek a matematikából

alakú integrált számítunk ki, ha az integrandusnak nem létezik primitív függvénye, de Taylor-
sorba fejthető. Ha az integrandusnak létezik hatványsora, akkor a hatványsorokról elmondott
általános tételek szerint, a hatványsort a konvergencia halmaz bármely zárt részintervallumán
tudjuk tagonként integrálni, mert ott egyenletesen konvergens, és a tagonkénti integrálással
kapott hatványsor ugyanabban a nyílt intervallumban konvergens ahol az integrandus. Ha ezt
alkalmazni akarjuk határozott integrál kiszámítására, akkor nem kell mást tennünk, mint az
integrálással kapott sorban az x változó helyére helyettesíteni a konkrét felső határt. Az integrál
hibájának becslésére pontosan azok a módszerek használhatóak, amelyeket a közelítő
függvényértékek hibabecslésénél alkalmaztunk, tehát a Taylor-tétel illetve a maradéktag, de
gyakran ennél sokkal egyszerűbben is célhoz érünk.

Ha általánosabb határozott integrálokat számolunk, a közelítés logikája illetve az integrál


hibájának becslése elvileg pontosan azon az egyenlőségen múlik, mint a függvényértékek
közelítése, vagyis az

f (n 1) ( )
f ( x)  Txn ( x)   x  x0 n 1  Txn0 ( x)  Rn  x 
0  n  1!
Taylor-tételen. Innen egy adott [a, b] intervallumra vonatkozó határozott integrál közelítő értéke
és a közelítés hibája a következő módon becsülhető.

b b b b b b
 f ( x)dx   Txn ( x)dx 
0  Rn  x  dx;  f ( x)dx   Txn ( x)dx
0
  Rn  x  dx  Rn  x 
max
b  a 
a a a a a a

Az integrál hibája tehát nem más, mint a maradéktag abszolút értékének maximuma szorozva az
integrációs intervallum hosszával. Ez az általános elv azonban nem minden esetben
gyümölcsöző, gyakran sokkal jobb becslést kapunk a hibára, ha a később tárgyalt 3.2.22. és 23.
példákban követett gondolatmenetet követjük. Ezt illusztráljuk is az alábbiakban.

3.2.21. Példa:Számítsuk ki negyed-fokú polinommal közelítveaz f  x   e x


2
függvény
határozott integrálját a [0, 1] intervallumon és becsüljük meg az integrál hibáját. Ehhez először
felhasználjuk a 3.2.10. példa eredményét, vagyis az exp(x) függvény Taylor-sorát, amelyről
2
tudjuk, hogy mindenütt konvergens. Ebből következik, hogy egyszerűen az x   x
helyettesítéssel kapjuk az exp(x) függvény sorából az f(x) függvény sorát, és a kapott sor
ugyancsak mindenütt konvergens lesz. A negyedfokú Taylor-polinom a következő:

x4
T04 f ( x)  1  x 2 
2!

Ennek integrálásával kapjuk az integrál közelítő értékét.

407
Óbudai Egyetem BGK Fejezetek a matematikából

1 4 1
1
 x2
1
2 x
 x3 x5 
e  
4
dx  T0 f ( x)dx  1  x   dx   x     0, 766666...
 
0 0 0
2!   3 10 
0

Kérdés, hogy milyen pontossággal kaptuk az integrál értékét. A hibabecsléshez szükség van a
Lagrange-féle maradéktagra. Ebben szerepel az f(x) függvény ötödik deriváltja, ez a következő:

 
f    x   e x 32 x5  16 x3  48x 2  72 x  24 . A hibabecsléshez ezt a deriváltat kell felülről
5 2

becsülni a [0, 1] intervallumon. Itt elkel némi grafikus segítség.Az ötödik derivált-függvény
görbéje látható a 3.2.11. ábrán.

3.2.11. ábra. Az ötödik derivált grafikonja a [0, 1] intervallumban és környezetében

A derivált felső becslése az adott intervallumon a következő: f    x   40 . Eszerint a határozott


5

integrál hibája a Lagrange-féle maradéktag becslésével a következő.

1 1
f (5) ( ) 5 40
 f ( x)dx   T04 ( x)dx  1 1  0   1  0   0,33
5! 120
0 0

Ez a pontosság, figyelembe véve a közelítő értéket, messzemenően nem kielégítő. Ez abból


adódik, hogy a Taylor-tételnem mond semmit arról, hogy a   0,1 valós szám az
intervallumban pontosan hol van. Mint az ábráról kiderül, a kérdéses polinom ezen az
intervallumon felvesz a 0 és durván a 40 valós szám között minden értéket, de nem tudjuk
pontosan, hogy melyiket kell figyelembe venni a becsléshez. Ezért a maradéktag ebben az
esetben csak egy nagyon durva felső becslést ad a hibára. Sokkal pontosabb becslést kaphatunk,
és ráadásul egyszerűbben, ha ehelyett a következő 3.2.22-24. példák logikáját követjük.

3.2.22.Példa: Tűzzük ki ismét az előző feladatbeli problémát kis módosítással. Határozzuk meg
x
2
t
az  e dt integrálfüggvényt hatványsor alakban. A sorfejtéshez felhasználjuk a 3.2.10. példa
0

408
Óbudai Egyetem BGK Fejezetek a matematikából

eredményét, vagyis az exp(x) függvény Taylor-sorát, amelyről tudjuk, hogy mindenütt


konvergens. Ebből következik, hogy az x   x2 helyettesítéssel kapjuk az exp(x) függvény
sorából az integrandus sorát, és a kapott sor ugyancsak mindenütt konvergens lesz.

t 4 t 6 t 8 t10
et  1  t 2 
2
    ...; t  R
2! 3! 4! 5!

A sorfejtést szemlélteti a 3.2.12. ábra.

3.2.12. ábra. Az exp(–x2) függvény grafikonja (kék színű görbe) és közelítése


nyolcad fokú Taylor-polinommal (piros színű görbe)

A keresett integrálfüggvény ezen sor tagonkénti integrálásával születik.

x
t 2 x3 x5 x7 x9 x11
 e dt  x     
3 5  2! 7  3! 9  4! 11  5!
 ...; x  R
0
1
t 2
Ezzel a primitív függvény közelítését megkaptuk. Alkalmazzuk most ezt a sort az e dt
0
határozott integrál közelítésére. Írjunk elő 10–4 pontosságot. Az x helyére tehát írjunk 1-et, és
számoljunk:

1
t 2 1 1 1 1 1 1 1 1 1 1 1 1
 dt  1  3  5  2!  7  3!  9  4!  11 5!  13  6!  1  3  10  42  216  1320  9360 
e
0
 1  0,333333  0,100000  0, 023809  0, 004629  0, 000757  0, 000106  0, 746836

409
Óbudai Egyetem BGK Fejezetek a matematikából

A közelítés hibáját azonban nem a Lagrange-féle maradéktaggal becsüljük, hanem felhasználjuk,


hogy a becslést jelentő numerikus sor váltakozó előjelű, és nyilvánvalóan abszolút értékben
monoton csökkenő sorozatból van képezve. Egy ilyen sor esetében pedig tudjuk – 3.1. fejezet,
3.1.8. tétel –, hogy az elhagyott tagok összege kisebb, mint az elhagyott tagok között az első tag
1 1
abszolút értéke. Ez esetünkben   1,322 105 . A hiba ennél kisebb, kijelenthetjük
15  7! 75600
tehát, hogy az integrál értékét 4 tizedes pontossággal kaptuk.

Az integrálást szemléltetni is lehet, ha az integrálfüggvényt numerikus módon, tehát például


Simpson-módszerrel kiszámítjuk az x = 0 ponttól jobbra. A 3.2.13. ábrán az integrálfüggvény
ilyen numerikus módon történő meghatározásával született görbe és az integrálfüggvény heted
fokú Taylor-polinomja látható.

3.2.13. ábra. Az exp(–x2) függvény numerikus módszerrel kapott integrálfüggvényének grafikonja (kék színű görbe)
és az integrálfüggvény közelítése heted fokú Taylor-polinommal (piros színű görbe). A pontozott egyenes az
integrálás felső határát jelöli a példabeli konkrét esetben.

et  1
x
3.2.23.Példa: Határozzuk meg az Ei  x  :  dt integrálfüggvényt hatványsor alakban. Az
0 t
integrandus hatványsorát ugyancsak a 3.2.10. példa eredménye alapján tudjuk meghatározni.

et  1 1   t n   t n 1 t t 2 t3 t n 1
    1    1     ...   ...;  t  R 
t t  n 0 n !  n 1 n ! 2! 3! 4! n!

Ez a sor ugyancsak a teljes számegyenesen konvergens, mert ugyanazok az együtthatói, mint az


exponenciális függvény Taylor-sorának, tehát tagonként integrálható az egész számegyenesen. A
tagonkénti integrálással kapjuk a primitív függvény Taylor-sorát.

410
Óbudai Egyetem BGK Fejezetek a matematikából

 
t n 1
x t x
e 1 xn x2 x3 x4 xn
 t dt    n! dt   n  n!  x  2  2!  3  3!  4  4!  ...  n  n!  ...;  x  R 
0 n 1 0n 1

ezzel megkaptuk a primitív függvényt hatványsor alakban. Könnyen ellenőrizhető a Cauchy-


Hadamard tétel alapján, hogy ez a sor ugyancsak mindenütt konvergens. Számítsuk ki ennek
e 1
1 t
felhasználásával az  dt határozott integrált 4 tizedes pontossággal. Helyettesítsünk a sorban
0 t
az x helyére 1-et.

1 t
e 1 1 1 1 1 1 1 1 1 1 1
 t
dt  1     
2  2! 3  3! 4  4! 5  5! 6  6!
 1    
4 18 96 600 4320

0
 1  0, 250000  0, 055555  0, 010416  0, 001666  0, 000231  1,317868

A határozott integrál hibájának a becslésére ismét nem a maradéktagot használjuk, hanem


ehelyett becsüljük a sorból elhagyott tagok összegét.

1 1 1 1 1 1 1 1
    ...      ... 
7  7! 8  8! 9  9! 10 10! 7  7! 7  8! 7  9! 7 10!
1 1 1 1 1  1  1 1 1 
      ...    1     ...  
7  7!  1 8 8  9 8  9 10  7  7!  8 8 2
83

1 1 1 8
     3, 239 105
7  7! 1  1 7  7! 7
8

Ez a közelítés hibájának felülről becsült értéke. Ebből látható, hogy a határozott integrál értékét
valóban négy tizedes pontossággal kaptuk.

0,5
 cos x
2
3.2.24.Példa: Számítsuk ki az dx határozott integrál közelítő értékét hét tizedes
0
pontossággal. Ehhez felhasználjuk a koszinusz függvény Taylor-sorát, amelyet a 3.2.12. példában
2
meghatároztunk. Ez a sor mindenütt konvergens, így az x  x helyettesítéssel ugyancsak
mindenütt konvergens sort kapunk. Ez utóbbi az integrandus Taylor-sora:


t 4 t 8 t12 t16 t 4n
cos t 2  1      ...   ; t R
2! 4! 6! 8! n 0  2 n  !

Ez a sor Abel tétele miatt a számegyenes bármely részintervallumán egyenletesen konvergens,


így tagonként integrálható. A tagonkénti integrálással kapott sor, tehát a keresett
integrálfüggvény hatványsor alakja a következő.

411
Óbudai Egyetem BGK Fejezetek a matematikából


x 4n 1
x
x5 x9 x13 x17
 cos t dt  x  5  2!  9  4!  13  6!  17  8!  ...    4n  1 2n !; x  R
2

0 n 0

Ebben a sorban kell az x helyére 0,5-et helyettesíteni és kellő számú tagot figyelembe venni a
kívánt pontosság eléréséhez.

0,5
1 1 1 1 1 1
 cos t
2
dt       
2 9
2 2  5  2! 2  9  4! 2 40 18432
0
 0,50000000  0, 02500000  0, 00005425  0, 47505425

A közelítő érték hibájának becsléséhez azt kell figyelembe venni, hogy az integrálfüggvényt adó
sor olyan sorozatból van képezve, amely az x = 0,5 helyen váltakozó előjelű és abszolút értékben
szigorúan monoton csökkenő sorozatból van képezve. Eszerint, felhasználva a 3.1.8. tétel
bizonyításának gondolatmenetét, az elhagyott végtelen sok tag összege biztosan kisebb, mint az
elhagyott tagok között az első tag abszolút értéke. Ez pedig a következő.

1 1
  1,304 108
213 13  6! 76677120

A hiba ennél kisebb. Eszerint, a kapott közelítő érték hét tizedes pontossággal adja a kérdéses
határozott integrál értékét.

Lineáris differenciálegyenletek soralakú megoldása

Lineáris differenciálegyenletek esetében nem minden esetben tudunk előállítani analitikus


megoldást zárt alakban. Ugyanis ha a differenciálegyenlet együtthatói nem konstansok, akkor
nincs általános módszer az analitikus megoldás előállítására. Ebben az esetben egy lehetséges
módszer a soralakú megoldás előállítása. Induljunk ki a lineáris differenciálegyenlet általános
alakjából.

an  x  y   x   an 1  x  y   x   ...  a2  x  y"  x   a1  x  y '  x   a0  x  y  x   b  x 


n n 1

Tegyük fel az általános esetben, hogy az együtthatófüggvények és a jobboldal Taylor-sorba


fejthető. Ebben az esetben kereshetjük a megoldást Taylor-sor alakjában. Az eljárás abban áll,
hogy miután az együtthatókat, a jobboldalt, és a megoldásfüggvényt sorba fejtjük,
behelyettesítünk az egyenletbe, elvégezzük a kijelölt műveleteket, és az egyenlet két oldalán
együttható összehasonlítást végzünk. Ez a módszer általában a differenciálegyenlet rendjétől
függően csak egy vagy több állandó szorzó erejéig határozza meg az ismeretlen együtthatókat,
ezért megfelelő számú kezdeti feltételt is csatolni kell a differenciálegyenlethez, tehát egy kezdeti
érték probléma megoldását tudjuk hatványsor alakban előállítani. A módszer akkor is
használható, ha az együtthatók konstansok, tehát az egyenlet állandó együtthatójú. Ebben az
esetben nem kell az együtthatók sorfejtésével foglakoznunk.

412
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.25. Példa: Első illusztráló példaként oldjuk meg az y ' y  x; y  0   0 állandó együtthatójú
egyenletre vonatkozó kezdeti érték problémát. Keressük a megoldást y  x    cn x n alakban. A
n 0
kezdeti feltételből máris következik, hogy c0  0 . Az egyenletbe történő helyettesítéshez szükség
van az y deriváltjára: y '  x    ncn x n1 . Ezek után helyettesíthetünk az egyenletbe, vagy
n 1
célszerűbben annak y '  y  x átrendezett alakjába:

c1  2c2 x  3c3 x 2  4c4 x3  ...  ncn x n1  ...  x  c0  c1x  c2 x 2  c3 x3  c4 x 4  ...  cn x n  ...

Figyelembe véve a kezdeti feltételt és kissé több tagot, némi rendezés után azt kapjuk, hogy:

c1  2c2 x  3c3 x 2  4c4 x3  5c5 x 4  ...  ncn x n1   n  1 cn1x n  ... 


 1  c1  x  c2 x 2  c3 x3  c4 x 4  ...  cn1 x n1  cn x n  ...

Most összehasonlítjuk az egyenlet két oldalát, egyenlővé tesszük az azonos hatványok


együtthatóit:
c1  0
1 1
2c2  c1  1;  c2   ;
2 2!
c 1
3c3  c2 ;  c3  2  ;
3 3!
c 1
4c4  c3 ;  c4  3  ;
4 4!
...
cn 1 1
ncn  cn 1;  cn   ;
n n!
...
1
Innen már világos, hogy az együtthatók: c0  c1  0; cn  ha n  2 . Ebből pedig a 3.2.10.
n!
példa alapján ráismerhetünk az exponenciális függvény Taylor-sorára, csak azt kell tekintetbe
vennünk, hogy a sor az n = 2 indexszel kezdődik. Tehát a kezdeti érték probléma megoldása:


xn
y  x    ex  x 1
n2 n !

Ebben az esetben tehát zárt alakban is meg tudtuk adni a megoldást.

3.2.26. Példa: Második illusztráló példaként oldjuk meg a y " x2 y  0; y  0   y '  0   1


másodrendű differenciálegyenletre vonatkozó kezdeti érték problémát. Lényeges különbség az

413
Óbudai Egyetem BGK Fejezetek a matematikából

előző példához képest, hogy ez a másodrendű lineáris differenciálegyenlet nem állandó


együtthatójú. Ilyen egyenletek megoldására nem létezik általános módszer. Keressük a megoldást
y  x    cn x n alakban. A helyettesítéshez szükség van az y második deriváltjára.
n 0

y '  x    ncn x n1; y "  x    n  n  1 cn x n2 .


n 1 n2

Helyettesítsünk az egyenletbe.

 n  n  1 cn xn2  x2  cn xn  0 azaz  n  n  1 cn x n2    cn x n2 ;


n2 n 0 n2 n 0

Az együtthatók összehasonlításhoz célszerű mindkét oldalon néhány tagot felírni.

2c2  3  2c3 x  4  3c4 x 2  5  4c5 x3  6  5c6 x 4 ...  n  n  1 cn x n2  ... 


  c0 x 2  c1 x3  c2 x 4  c3 x5  c4 x6  ...  cn4 x n2  ... 
Mielőtt az együtthatókat összevetjük, vegyük figyelembe a kezdeti feltételeket. Az y  0   1
feltételből következik, hogy c0  1 , az y '  0   1 feltételből pedig az következik, hogy c1  1 .
Ezek után írhatjuk, hogy

2c2  0;  c2  0;
6c3  0;  c3  0;
1
12c4  c0  1;  c4   ;
12
1
20c5  c1  1;  c5   ;
20
30c6  c2  0;  c6  0; ...stb.

Az eredmény alapján fel tudjuk írni a megoldásfüggvény Taylor-sorának első néhány tagját.

1 4 1 5
y  x  1 x  x  x  ...
12 20

Ebben az esetben nem kaptunk nevezetes Taylor-sort, a zárt alak – amennyiben létezik – ebből
még nem határozható meg. Ettől eltekintve a megoldásfüggvény polinommal történő közelítését
megadtuk olyan esetben, amikor a megoldáshoz nem létezik kvadratura, azaz olyan algoritmus,
amellyel az egyenlet megoldható lenne. Amennyiben pontosabb megoldásra van szükség,
természetesen több tagot veszünk figyelembe a sorból.

414
Óbudai Egyetem BGK Fejezetek a matematikából

Transzcendens egyenletek közelítő megoldása

Transzcendens egyenletnek nevezünk egy algebrai egyenletet akkor, ha a megoldás a négy


alapművelet és a gyökvonás véges sokszori alkalmazásával nem állítható elő. Ebben az esetben
azt a függvényt, amely az egyenletben a transzcendenciát okozza, helyettesítjük egy alkalmas
fokú Taylor-polinommal, és ebben az esetben oldjuk meg az egyenletet, amely megoldás közelítő
megoldásnak elfogadható, amely közelítés például numerikus módszerek kezdőértékének
tekinthető.

3.2.27. Példa: Határozzuk meg a 6sin x  x  2 x transzcendens egyenlet közelítő megoldását.


3 2

Világos, hogy ez az egyenlet valóban transzcendens, az x ismeretlent véges sok lépésben nem
lehet kifejezni. Ennek az oka, hogy az egyenletben szerepel a sinx függvényérték. Helyettesítsük
ezért a szinusz függvényt egy alkalmas fokszámú Taylor-polinomjával. Annak érekében, hogy
megoldható algebrai egyenletet kapjunk, válasszuk a harmadfokú Taylor-polinomot. Ekkor a
következő egyenlet adódik.

 x3   x3 
6  x    x3  2 x 2 ; azaz 6  x    x3  2 x 2 ; tehát 6 x  x3  x3  2 x 2
 3!   6

Összevonás után tehát a feladat arra redukálódik, hogy megoldjuk a 6 x  2 x másodfokú


2

egyenletet. Ennek megoldása, amely tehát az eredeti transzcendens egyenlet közelítő megoldása:
x1  0; x2  3 . A példa lezárásaként megjegyezzük, hogy az x1 = 0 gyök nem csak közelítő,
hanem pontos megoldása az eredeti transzcendens egyenletnek, amiről helyettesítéssel könnyen
meggyőződhetünk.

Határértékek kiszámítása

Bizonyos esetekben, amikor a határérték "kritikus", célravezető a határérték formulában szereplő


függvényeket a Taylor-sorukkal helyettesíteni, mert így más módszerek, például a L'Hospital
szabály alkalmazása nélkül is kiszámítható a határérték.

3.2.28. Példa: Számítsuk ki a következő határértéket.

t2
1  cos t 
lim 2
t 0 t4

0
Helyettesítéssel látható, hogy a határértéktípusú kritikus határérték. Ahelyett azonban, hogy az
0
ilyenkor szokásos L'Hospital szabályt alkalmaznánk, sorfejtést végzünk. A 3.2.12. példa
eredményét, tehát a koszinusz függvény Taylor sorát felhasználva, azt írhatjuk, hogy

415
Óbudai Egyetem BGK Fejezetek a matematikából

1  t2  t2 t4 t6  1  t4 t6  1 t2 t4 1
lim  1    1     ...    lim    ...   lim   ... 
t 0 t 
4  4
 2  2 4! 6!   t 0 t  4! 6!  t 0 4! 6! 8! 24

3.2.29. Példa: Számítsuk ki a következő határértéket.

x  arctgx
lim
x 0 x3

0
Ez ugyancsak típusú kritikus határérték. A kiszámításához elsőként sorba kell fejteni az
0
arkusztangens függvényt. Induljunk ki a függvény deriváltjából.

1
f '  x    arctgx  ' 
1  x2

Azonos átalakításokkal látható, hogy a derivált függvény egy mértani sornak az


összegfüggvénye, pontosan a q   x 2 kvóciensű mértani sor összegfüggvénye.

1 1
f '  x    arctgx  '    1  x 2  x 4  x6  ...; x  1,1
1 x 2
1 x 2
 
Innen az arkusztangens függvény sora tagonkénti integrálással adódik.

x3 x5 x 7
arctg x  x     ...; x  1,1
3 5 7

Ebből pedig a keresett határérték már könnyen adódik.

x  arctgx 1 1   x3 x5 x 7 
lim
x 0 3
 lim
x 0 x 3  x  arctg x   lim
x 0 x 3  
x  x     ...   

x   3 5 7 
 1 x2 x4  1
 lim     ...  
x 0 3
 5 7  3

Befejezésül szemléltetjük a példában szereplő sorfejtést. A 3.2.14. ábrán látható az arkusztangens


függvény és a függvényt közelítő heted fokú Taylor polinom.

416
Óbudai Egyetem BGK Fejezetek a matematikából

3.2.14. ábra. Az arkusztangens függvény grafikonja (kék színű görbe) és a közelítő heted fokú Taylor-polinom
(piros színű görbe). A pontozott egyenesek a konvergencia halmaz határait jelölik.

417
Óbudai Egyetem BGK Fejezetek a matematikából

3.3. Fourier-sorok
3.3.1. Problémafelvetés
A probléma nagyban hasonlít ahhoz a kérdéskörhöz, amelyet a hatványsorok témakörében
vizsgáltunk. Az alapvető különbség az, hogy ebben az esetben periodikus függvények
sorfejtésének a lehetőségét vizsgáljuk. Mivel a függvény, amelyet függvénysor összegeként
állítunk elő periodikus, nem meglepő, hogy a függvénysor tagjai is periodikus függvények.
Konkrétan azt tűzzük ki feladatként, hogy egy periodikus függvényt szinusz és koszinusz
függvények végtelen összegeként állítsunk elő.
Induljunk ki az alábbi R2-beli problémából. Adott R2-ben a standard {e1, e2} bázis, amelyről
tudjuk, hogy egységnyi hosszúságú vektorok és merőlegesek. Adott egy tetszőleges x R2 vektor
az alábbi lineáris kombinációval.

x = α1∙e1 + α2∙e2

Kérdés, hogyan határozhatjuk meg az elállításban szereplő α1 és α2 R együtthatókat? Mielőtt


erre válaszolunk, világítsuk meg a problémát egy egyszerű síkbeli ábrával.

x
α2e2

e2

e1 α1e1

Nyilvánvaló, hogy az előállítás egyértelmű, tehát az α1 és α2 Regyütthatók egyértelműek. Az


együtthatók meghatározásához idézzük fel a skaláris szorzat fogalmát.

3.3.1.Definíció: AzR2-beli x és y vektorok <x, y>-nal jelölt skaláris szorzatán értjük az alábbi
háromtényezős szorzatot:
<x, y> = │x│∙│y│çosα

ahol α az x és y vektorok szöge, │x│jelöli az x vektor hosszúságát. Könnyen ellenőrizhető, hogy


ez a művelet rendelkezik az alábbi tulajdonságokkal:

1. <x, y> =<y, x>


2. <λx, y> =λ<y, x>; λ R
3. <x+z, y> =<x, y> + <z, y>
4. <x, x> ≥ 0 és <x, x> = 0 akkor és csak akkor, ha x = 0.

418
Óbudai Egyetem BGK Fejezetek a matematikából

A továbbiakban skaláris szorzatnak nevezünk majd minden olyan leképezést, amely két általános
értelemben vett vektorhoz olyan módon rendel valós számot, hogy teljesülnek az 1-4.
tulajdonságok. Így innentől kezdve a 3.3.1. definíció értelmezi a skaláris szorzat fogalmát.

A definícióból adódóan, ha egy vektort saját magával szorzunk skalárisan, akkor abszolút
értékének négyzetét kapjuk, hiszen ekkor α = 0, tehát cos0 = 1 miatt <x, x> = │x│2.
Azért alkalmazunk itt a lineáris algebrában megszokott xTy jelöléstől eltérő jelölést a skaláris
szorzatra, mert az ott megismert fogalmat itt általánosabb értelemben használjuk majd, olyan
„vektorok” esetében is, amelyeknél nincs értelme a transzponálás műveletének, de a skaláris
szorzat fogalma, általánosabb értelemben, érvényben marad.

Van még egy nagyon fontos tulajdonsága a skaláris szorzatnak, amely használatát nagyon
praktikussá teszi: <x, y> = 0 akkor és csak akkor, ha x merőleges y-ra.

Ez utóbbi tétel felhasználásával meghatározhatjuk a fenti előállításban szereplő α1 és α2


együtthatókat. Sorozzuk meg az x = α1∙e1 + α2∙e2 egyenlet mindkét oldalát skalárisan először az
e1majd az e2vektorral. A szorzások eredménye <x, e1> = α1, és <x, e2> = α2. Megkaptuk tehát az
együtthatókat a fenti előállításban.

x = <x, e1> ∙e1 + <x, e2> ∙e2

A kétdimenziós probléma vizsgálatából az is nyilvánvalóan következik, hogy felírható az


együtthatókra a Pitagorasz-tétel, amely szerint.

2
  x, ei
2 2 2 2
x  12   22  x, e1  x, e2
i1

Ez a gondolatmenet általánosítható olyan többdimenziós vektorterekben, ahol definiálva van egy


skaláris szorzat. Ehhez értelmeznünk kell a skaláris szorzat fogalmát függetlenül annak
geometriai tartalmától, hiszen 3-nál több dimenziós terekben, amelyekben a „vektor” nem a
klasszikus értelemben vett vektort jelenti, a geometriai fogalmaknak nincs értelme. Azonban
nyilvánvaló, hogy ha a konkrét geometriai tartalom el is veszik, a műveleti tulajdonságok
fennmaradhatnak.

Az alábbiakban, a Fourier-sorok elméletének kifejtése során, általánosítani fogjuk nem csak a


skaláris szorzat fogalmát, hanem a bevezetőben említett vektor felbontási problémát végtelen
dimenziós függvényterekben. Érdekes módon, bár a geometriai szemléltetési lehetőség elvész, az
alapvető fontosságú összefüggések érvényben maradnak. Felhívjuk az Olvasó figyelmét a
későbbiekben igazolt Parseval-egyenlőségre, amely a Pitagorasz-tétel végtelen dimenziós
általánosításának tekinthető.

3.3.2.Definíció: Legyen L egy lineáris tér. Értelmezzünk egy <∙, ∙> szimbólummal jelölt
leképezést az L × L térben az alábbi módon: <∙, ∙>: L × L → R, tehát a leképezés két L-beli
elemhez (vektorhoz) egy valós számot rendel, és tegyük fel, hogy teljesülnek az alábbi
tulajdonságok.

419
Óbudai Egyetem BGK Fejezetek a matematikából

1. <x, y> =<y, x>


2. <λx, y> =λ<y, x>,λ R
3. <x+z, y> =<x, y> + <z, y>
4. <x, x> ≥ 0 és <x, x> = 0 akkor és csak akkor, ha x = 0.

Ebben az esetben a <∙, ∙>: L × L → R leképezést L-beli skaláris szorzatnak nevezzük.

A pont elején felvetet problémában szerepelt a merőlegesség fogalma. Általánosítsuk ezt is.

3.3.3.Definíció: Legyen adva egy x és egy y „vektor” egy L lineáris térben. Az x és y vektorokat
ortogonálisaknak nevezzük, ha <x, y> = 0.

A fentiekben használtuk még a vektor abszolút értékének fogalmát. Ezt a fogalmat is


általánosítjuk megtartva az abszolút érték legfontosabb tulajdonságait, illetve pontosabban
felhasználjuk ezeket a fogalom általánosításának definíciójában. Azért kell az abszolút értéket
általánosítanunk, mert olyan fogalmakkal dolgozunk majd, például függvényekkel, amelyeknek
létezik abszolút értéke a hagyományos értelemben, de ez az abszolút érték nem tekinthető a
vektor abszolút értéke azaz a vektor hossza általánosításának.

3.3.4.Definíció: Legyen adva egy L lineáris tér, és értelmezzünk egy ║∙║ szimbólummal jelölt
║∙║: L → R leképezést az alábbi tulajdonságokkal.

1. ║x║≥ 0 és║x║= 0 pontosan akkor, ha x = 0,


2. ║λx║=│λ│∙║x║,λ R
3. ║x + y║≤║x║+ ║y║.

Ebben az esetben a║∙║: L → R leképezést L-beli normának nevezzük.

A klasszikus esetben egy vektort egységnyi abszolút értékűnek neveztünk. Most azt mondjuk,
hogy egy vektor normája egységnyi, és azt írjuk, hogy ║x║= 1. Nem meglepő, ha azt állítjuk,
hogy a fent értelmezett két művelet között van kapcsolat. Vegyük észre a műveleti
tulajdonságokat vizsgálva, hogy a x  x, x definícióval meghatározott művelet teljesíti a
normára vonatkozó definíció követelményeit, tehát ez a művelet norma.

Általánosítani fogjuk a bevezetőben említett problémát. Ehhez a bázis fogalmát kell


kiegészítenünk olyan lineáris terekben, amelyekben értelmezve van egy skaláris szorzás.

3.3.5.Definíció: Legyen L egy lineáris tér, és legyen <∙, ∙>: L × L → R leképezés egy L-beli
skaláris szorzat. Legyen továbbá B = {b1, b2, b3, …, bn,…} az L tér egy bázisa. A B bázist
ortonormált bázisnak nevezzük, ha a bázisvektorok páronként ortogonálisak és minden
bázisvektor normája egységnyi. Tehát <bi, bj> = 0 ha i ≠ j, és ║bi║= 1, ha i = 1,2,3,…n,… .

420
Óbudai Egyetem BGK Fejezetek a matematikából

A definícióban nem szükséges feltételezni, hogy a bázis elemszáma véges, tehát az említett
fogalmak végtelen dimenziós vektorterekben is érvényesek, sőt az alábbi vizsgálatok
szempontjából még fontosabbak. A jegyzetben tárgyalt alkalmazások, a Fourier-sorok végtelen
dimenziós lineáris terekben értelmezett sorfejtések.

3.3.6.Definíció: Legyen L egy lineáris tér, és legyen B = {b1, b2, b3, …, bn,…} az L tér egy
ortonormált bázisa. Tetszőleges xL vektort felírhatunk a báziselemek egyértelmű lineáris
kombinációjaként.
x = α1∙b1 + α2∙b2 +α3∙b3 +…+αn∙bn +…

Az αi együtthatókat a fenti gondolatmenettel kapjuk: <x, bi> = αi, i = 1,2,3,…n,… tehát ekkor az
x vektor előállítása.

x = <x, b1> ∙b1 + <x, b2> ∙b2 +<x, b3> ∙b3 +…+<x, bn> ∙bn +…

Ezt az összeget (végtelen sort) az x vektor B ortonormált bázis szerint általános Fourier-
sorának nevezzük.

3.3.2. Általános értelemben vett Fourier-sor


Tegyük egy kissé konkrétabbá az előző pontban értelmezett fogalmakat. Legyen az L2 lineáris tér
az [a, b] intervallumon értelmezett, négyzetesen integrálható valós függvények halmaza
(„függvénytér”). A négyzetes integrálhatóság azt jelenti, hogy a függvény négyzete integrálható,
és a jelölésben a 2-es felső index is erre a tulajdonságra utal. Könnyen látható, hogy ez valóban
egy lineáris tér a szokásos függvények közötti összeadásra és függvény számmal való szorzására
vonatkozó műveletekkel. (Gondoljuk át, hogy valóban minden vektortér-axióma teljesül.)
Értelmezzünk most egy skaláris szorzatot ebben az L2 függvénytérben.

3.3.1.Tétel: Legyen adott egy [a, b] intervallum. Az f(x) és g(x) legyen értelmezve ezen az
intervallumon, és tegyük fel, hogy az f(x)∙g(x) szorzat integrálható ezen az intervallumon. Az

b
 f ( x), g ( x)   f ( x) g ( x)dx
a

összefüggéssel értelmezett <∙, ∙>: L2 × L2 → Rleképezés, egy L2-n értelmezett skaláris szorzat.

Ha átgondoljuk a határozott integrál tulajdonságait, akkor könnyen látható, hogy az állításban


szereplő művelet valóban teljesíti a skaláris szorzás 4 db műveleti tulajdonságát.

3.3.2.Tétel: Legyen adott egy [a, b] intervallum. Az f(x) legyen értelmezve ezen az
intervallumon, és tegyük fel, hogy az f2(x) függvény integrálható („négyzetesen integrálható”)
ezen az intervallumon. Az

421
Óbudai Egyetem BGK Fejezetek a matematikából

b
f
2
f ( x)  ( x)dx
a

összefüggéssel értelmezett ║∙║: L2 → Rleképezés, egy L2-n értelmezett norma.

Ha ismét végiggondoljuk a határozott integrál és a négyzetgyökfüggvény tulajdonságait, akkor


látható, hogy ez a művelet teljesíti a normától megkövetelt 3 db műveleti tulajdonságot.

A fentiekben értelmezett skaláris szorzatnak és normának a birtokában még tovább


általánosíthatjuk a Fourier-sor fogalmát.

3.3.7.Definíció: Legyen az L2négyzetesen integrálható függvények terében B = {g1, g2, g3, …,


gn,…} egy ortonormált függvényrendszer. Ekkor tetszőleges fL2 négyzetesen integrálható
függvényt felírhatunk a báziselemek lineáris kombinációjaként.

f = α1∙ g1 + α2∙ g2 +α3∙ g3 +…+αn∙ gn +…

Az αi együtthatókat ugyancsak a fenti gondolatmenettel kapjuk: < f, gi> = αi, i = 1,2,3,…n,…


ahol a skaláris szorzatot és a normát a 3.3.1. és 3.3.2. tételek értelmezik. Ekkor az f(x) függvény
előállítása.

f = < f, g1> ∙ g1 + < f, g2> ∙ g2 +< f, g3> ∙ g3 +…+< f, gn> ∙ gn +…

Ezt a függvénysort az f négyzetesen integrálható függvény Bortonormált függvényrendszer


szerinti általános Fourier-sorának nevezzük αi = < f, gi> valós (esetleg komplex) együtthatókat
az f(x) függvény Fourier-együtthatóinak nevezzük.

Az alábbiakban bemutatunk néhány konkrét Fourier-sort. Ezek a sorok az által vannak


meghatározva, hogy hogyan választunk ortonormált függvényrendszert az L2 térben. A műszaki
alkalmazások szempontjából az egyik legfontosabb a trigonometrikus rendszer és az
exponenciális függvényrendszer, amelyeket az alábbiakban részletesen kifejtünk, de ortogonális
függvényrendszer állhat akár polinomokból is. Ez utóbbiakat nem tárgyaljuk, a szakirodalom
tanulmányozását javasoljuk az Olvasónak.

A lineáris algebrában megismert bázis fogalmát az L2 függvénytérben a teljesség fogalmával


helyettesítjük.

3.3.8.Definíció:Az L2négyzetesen integrálható függvények terében a B = {g1, g2, g3, …, gn,…}


ortonormált függvényrendszert teljes ortonormált rendszernek nevezzük, ha teljesül a
következő: Ha egy gL2 függvény ortogonális a rendszer minden elemére, akkor g = 0. Tehát
csak az azonosan nulla függvény lehet ortogonális egy teljes rendszer minden elemére.

422
Óbudai Egyetem BGK Fejezetek a matematikából

A teljesség fogalma alapvető a Fourier-sorok konvergenciájának elméletében, és alapvetően


fontos jelentőségű a trigonometrikus és exponenciális Fourier-sorok elméletében, amelyet az
alábbiakban részletesen tanulmányozunk.

3.3.3. Általános Fourier-sorok konvergenciája, a Fourier együtthatók


szélsőérték tulajdonsága, a Parseval-képlet
A teljesség egzakt figyelembe vételéhez, a fogalom pontos megvilágításához nincs elegendő
matematikai apparátus a kezünkben. Az érdeklődő Olvasó számára a Funkcionálanalízis
tanulmányozását javasoljuk. Azonban a fogalomnak a konvergenciára vonatkozólag van egy
nagyon fontos következménye, amelyet mindenképpen meg kell fogalmaznunk. A tétel
megfogalmazása előtt azonban felmerül a konvergencia természetének kérdése.
Az előző két pontban bevezetett fogalmakból nem a 3.2. fejezetben megismert pontonkénti illetve
egyenletes konvergencia következik – bár természetesen az ott megismert fogalmak változtatás
nélkül érvényesek a Fourier-sorok elméletében is, ha a Fourier-sor részletösszegeit
tanulmányozzuk –, hanem a bevezetett normában értendő a konvergencia. Ez pontosabban azt
jelenti, hogy az általános Fourier-sor abban az értelemben tart az összegfüggvényéhez, hogy az
összegfüggvény és a sor részletösszege különbségének a normája tart a nullához. Ezt pontosítja
az alábbi tétel. A pontonkénti konvergenciára vonatkozó tételt a trigonometrikus sorok
tárgyalásánál majd megadjuk.

3.3.3.Tétel: Ha a B = {g1, g2, g3, …, gn,…} egy teljes ortonormált rendszer, akkor az fL2
négyzetesen integrálható függvény  f , gi gi általános értelemben vett Fourier-sora az L2-beli
i 1
normában tart az f függvényhez, azaz teljesül, hogy

n
lim f   f , gi gi  0
n  i 1

továbbá az együtthatókra teljesül a Parseval-féle képlet, mely szerint


 
  f , gi   i
2 2 2
f , tehát az f függvény normájának négyzete egyenlő a Fourier
i 1 i 1
együtthatók abszolút értékének négyzetösszegével.

Bizonyítás: Amint a bevezetőben említettük, a teljesség kérdésének vizsgálatával ebben a


jegyzetben nem foglalkozunk. Ellenben a Parseval-képletet igazolni tudjuk, és ezt annál is inkább
megtesszük, mert a trigonometrikus és komplex Fourier-sorok alkalmazása során használni
fogjuk és nagyon fontos összefüggésekre vezet.

Induljunk ki tehát abból, hogy a sor négyzetintegrálra tart az összegfüggvényhez. Használjuk ki,
hogy a normát skaláris szorzatból származtattuk. Ha figyelembe vesszük a skaláris szorzat
tulajdonságait, valamint azt, hogy a rendszer elemei páronként ortogonálisak, akkor teljes
négyzetté kiegészítés és azonos átalakítások után a következőket írhatjuk.

423
Óbudai Egyetem BGK Fejezetek a matematikából

 2     
f    i gi  f   i gi , f    j g j  f , f  2 i f , gi    i  j gi , g j 
i 1 i 1 j 1 i 1 i 1 j 1
   
  f , gi   f , gi 2 i f , gi   i2 
2 2 2
 f
i 1 i 1 i 1 i 1
 
  f , gi    f , gi  i   0
2 2 2
 f
i 1 i 1

Ebben az összegben az utolsó tag definíció szerint zérus, hiszen a szummában minden különbség
zérus a Fourier-együtthatók értelmezése miatt. Az egyenlőséglánc végén azért áll zérus, mert a
feltétel szerint a Fourier-sor L2-beli normában tart a függvényhez. Ha ezeket figyelembe vesszük,

  f , gi
2 2
akkor azt kapjuk, hogy f  0 , és éppen ezt kellett igazolni. ■
i 1

Megjegyezzük, hogy ha a négyzetek helyére az abszolút érték négyzetét írjuk – amely valós
esetben ugyanazt jelenti –, olyan összefüggéseket kapunk, amelyek komplex együtthatók és
komplex függvények esetén is érvényesek.

Kiemeljük a bizonyítás egyik érdekes következményét, mégpedig a Fourier-együtthatók



bizonyos szélsőértéket adó tulajdonságát. Azt, hogy az f   i gi  0 eltérés norma
i 1
pontosan akkor a legkisebb, teljes rendszer esetén zérus, ha az αi, i = 1,2,3,…n,… együtthatók
éppen a Fourier-együtthatók. Tetszőleges más valós vagy komplex együtthatók esetén az eltérés
normája szigorúan pozitív érték.

424
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.4. Trigonometrikus Fourier-sorok


Az említett fogalmak és tételek birtokában már rátérhetünk a trigonometrikus Fourier-sorok
tárgyalására.

3.3.9.Definíció: Legyen a  R tetszőleges és [a, a + 2π] egy 2π hosszúságú intervallum. Ezen az


intervallumon értelmezett

1, cosx, sinx, cos2x, sin2x, cos3x, sin3x, cos4x, sin4x, …, cosnx, sinnx,…

függvényrendszert trigonometrikus rendszernek nevezzük.

3.3.4.Tétel: A trigonometrikus függvényrendszer az [a, a + 2π] intervallumon ortogonális


függvényrendszer, azaz a rendszer elemei páronként ortogonálisak. A tétel állítása azt jelenti,
hogy bármely 2π hosszúságú intervallumon teljesülnek az

1. <1, cosnx> = 0
2. <1, sinnx> = 0
3. <sinnx, coskx> = 0
4. <sinnx, sinkx> = 0
5. <cosnx, coskx> = 0

egyenlőségek, minden n-re és minden k-ra, a 3., 4. és 5. esetben n ≠ k esetén.

Bizonyítás: A 3.3.1. tételben értelmeztük a skaláris szorzatot. Ennek megfelelően a felsorolt


skaláris szorzatok 0 értéke azt jelenti, hogy a függvények szorzatának határozott integrálja
bármely 2π-hosszúságú intervallumon zérus. Ez mind az öt esetben könnyen ellenőrizhető.
Példaképpen az első és harmadik összefüggést igazoljuk:

a  2 a  2
 sin nx  sin n  a  2  sin na
1, cos nx   1 cos nxdx   n  a 
n

n
0
a

ugyanis a szinusz függvény periódusa 2π. A 3. összefüggés igazolásához szükségünk van a


trigonometriából ismert alábbi azonosságra: sin   cos    sin       sin       . Ennek
1
2
felhasználásával, ha n ≠ kakkor kapjuk, hogy

a  2 a  2
 sin  n  k  x  sin  n  k  x  dx 
1
sin nx, cos kx   sin nx  cos kxdx 
2
a a
a  2
1  cos  n  k  x cos  n  k  x 
    
2 nk nk a

425
Óbudai Egyetem BGK Fejezetek a matematikából

1  cos  n  k  a  2  cos  n  k  a  1  cos  n  k  a  2  cos  n  k  a 


      0
2 nk nk  2  n  k n  k 

ugyanis a koszinusz függvény periódusa ugyancsak 2π, ezért a zárójeles kifejezések külön-
külön egyenlők nullával. Hasonlóan adódik a 4. és 5. egyenlőség is, ha felhasználjuk a

cos   cos  
1
2
 cos       cos       ; sin   sin     cos       cos      
1
2

trigonometrikus azonosságokat. ■

Kérdés, hogy mennyi a trigonometrikus függvényrendszer egyes függvényeinek normája.

3.3.5.Tétel: A trigonometrikus függvényrendszer tagjainak normája az [a, a + 2π] intervallumon


a következő: 1  2 , cos nx  ; és sin nx  ; n  1, 2,3,...

Bizonyítás: A 3.3.2. tételben értelmezett norma fogalmával.

a  2
1   12 dx   x  aa  2  a  2   a  2
a
a  2 a  2 a  2
1  cos 2nx  x sin 2nx 
 
2
cos nx  cos nxdx  dx   2  4n  
2 a
a a

 a  2 sin 2n  a  2    a sin 2na 


      
 2 4 n   2 4 n 

Itt ismét felhasználtuk, hogy a szinusz függvény periódusa 2π. Hasonlóan adódik sinnx normája
is.
sin nx  

Ezt kellett bizonyítani. ■

Ha egy „vektor” normája nem 1, akkor könnyen „lenormálhatjuk” úgy, hogy a vektort elosztjuk
a normájával. A 3.3.4. tétel alapján tudjuk, hogy a trigonometrikus függvényrendszer ortogonális
rendszer. Az előbbiekben kiszámítottuk a függvényrendszer minden egyes tagjának a normáját.
Osszuk most el a függvényrendszer tagjait a normájukkal, így ortonormált függvényrendszerhez
jutunk. Bebizonyítottuk tehát az alábbi állítást.

426
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.6.Tétel: Az [a, a + 2π] intervallumon értelmezett

1 cos x sin x cos 2 x sin 2 x cos3x sin 3x cos nx sin nx


; ; ; ; ; ; ;...; ; ;...
2        

függvényrendszer ortonormált rendszer a megadott intervallumon.

3.3.10.Definíció: Legyen f(x) egy [a, a + 2π] intervallumon értelmezett négyzetesen integrálható
függvény. Az f(x) függvény ortonormált trigonometrikus rendszer szerinti

1 1 cos x cos x sin x sin x


f ( x) ~  f ( x),    f ( x),    f ( x),   ...
2 2    
cos nx cos nx sin nx sin nx
...   f ( x),    f ( x),  ...
   

Fourier-sorát trigonometrikus Fourier-sornak nevezzük.Az alkalmazott ~ jelölés egyelőre


annyit jelent, hogy az f(x) függvényhez hozzárendeltünk egy függvénysort a fent részletezett
módon. Egyenlőséget nem írhatunk addig, amíg a konvergencia kérdését nem vizsgáljuk.
Nyilvánvaló, hogy egyenlőség csak abban az esetben írható, ha tudjuk, hogy a függvénysor
konvergens és előállítja a függvényt. Az alábbiakban egy kissé egyszerűsítjük ennek a sornak az
alakját. A sor „szummás alakja”


1 1  cos nx cos nx sin nx sin nx 
f ( x) ~  f ( x),      f ( x),    f ( x),  
2 2 n 1     

ha ebben az összegben a konstansokat kiemeljük a skaláris szorzatokból és az utánuk következő


tényezőkből, akkor a következő alakot kapjuk.


1 1 1 
f ( x) ~  f ( x),11     f ( x), cos nx cos nx   f ( x),sin nx sin nx 
2 n 1 
  

Vezessük most be a Fourier-együtthatókra az alábbi jelöléseket.

a  2
1 1
a0 
2
 f ( x),1 
2  f ( x)dx
a
a  2
1 1
an 

 f ( x), cos nx 
  f ( x)  cos nx dx; n  1, 2,3,...
a
a  2
1 1
bn 

 f ( x),sin nx 
  f ( x)  sin nx dx; n  1, 2,3,...
a

427
Óbudai Egyetem BGK Fejezetek a matematikából

ezekkel a jelölésekkel a trigonometrikus Fourier-sor szokásos alakja a következő.


f ( x) ~ a0    an cos nx  bn sin nx 
n 1

az a0, an, bn együtthatók kiszámítására vonatkozó formulákat pedig épp az előzőekben adtuk meg.
A Fourier-sorba fejtés tehát más jellegű, mit a 3.2. fejezetekben vizsgált Taylor-sor. Az
együtthatókat nem deriválással, hanem integrálással számítjuk. Egy sorfejtés általában 3 db
integrál kiszámítását igényli. Az an-re és bn-re vonatkozó formulákat úgy számítjuk, hogy az n-et
paraméternek tekintjük, tehát egy integrálás végtelen sok együtthatót szolgáltat.

A 3.3.3. pont bevezetőjében említettük a teljesség fogalmát és a következményeit egy tétel


formájában fogalmaztuk meg. Bizonyítható, hogy a trigonometrikus függvényrendszer teljes az
[a, a + 2π] intervallumon, azaz ha egy függvény ortogonális a függvényrendszer minden elemére,
akkor az csak a nulla függvény lehet. A teljességre támaszkodva átfogalmazhatjuk a 3.3.3. tételt
trigonometrikus sorokra. A Parseval-féle összefüggés felírásáhozcsak azt kell figyelembe venni,
hogy a korábbiak szerint

1 cos nx sin nx
 f ( x),   2  a0 ;  f ( x),     an ;  f ( x),     bn
2  

Innen a Parseval-képlet már egyszerű helyettesítéssel adódik.

3.3.7.Tétel: Az [a, a + 2π] intervallumon értelmezett, négyzetesen integrálható f függvény


trigonometrikus Fourier-sora az L2-térbeli normában tart az f függvényhez mint
összegfüggvényhez, azaz
n
lim f ( x)  a0    ak cos kx  bk sin kx   0
n  k 1

és igaz a Parseval-féle összefüggés

a  2
 ;

 f 2  x  dx  2 a0    an  bn
2 2 2 2
f 
a n 1

A Parseval-féle összefüggés egyik jelentősége, hogy segítségével numerikus sorokat lehet


összegezni. Ezt az alábbiakban példákon keresztül megmutatjuk.

A 3.3.3. illetve 3.3.7. tétel szerint a Fourier-sor négyzetintegrálra, tehát normában tart az
összegfüggvényhez. Ez nem egyenértékű a pontonkénti konvergenciával. Ez utóbbira
vonatkozólag egyetlen olyan elégséges feltételt fogalmazunk meg, amely a műszaki
alkalmazások szempontjából teljes mértékben kielégítő, és amelynek feltételei könnyedén
ellenőrizhetők.

428
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.8. Tétel: (Dirichlet-Jordan)


Tegyük fel, hogy az f(x) függvény periódusa 2π, továbbá tegyük fel, hogy bármely 2π hosszúságú
szakasz felosztható legfeljebb véges sok olyan részintervallumra, amelyeken az f(x) függvény
monoton. Ekkor azokon a helyeken, ahol az f(x) függvény folytonos, a trigonometrikus sor
konvergál a függvényértékhez, minden olyan x0helyen, ahol az f(x) függvénynek szakadása van,
akkor a trigonometrikus sor az adott pontbeli jobb és baloldali határérték számtani közepéhez
konvergál, feltéve, hogy az egyoldali határértékek léteznek és végesek, azaz teljesül, hogy a sor
összege a szakadási helyeken.

1  f  x0  0   f  x0  0 
 lim f  x   lim f  x   
2  x  x0  0 x  x0  0  2

ahol alkalmaztuk az egyoldali határértékre a témakörben szokásos egyszerűbb jelölést. Végül


pedig az is igaz, hogy ha az f(x) függvény egy zárt intervallumon folytonos, akkor a
trigonometrikus Fourier-sora ezen a zárt intervallumon egyenletesen konvergens.

A tételt nem bizonyítjuk, de minden egyes Fourier-sorfejtésnél ellenőrizzük a tétel feltételeinek


teljesülését, és eldöntjük, hogy a kapott sor előállítja-e a függvényt.

429
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.5. Trigonometrikus Fourier-sorok formális bevezetése


Ha a tisztelt Olvasó túlságosan hosszúnak tartja az előző pontokban vázlatosan kifejtett lineáris
algebrai illetve funkcionálanalízisbeli hátteret a klasszikus értelemben vett trigonometrikus
Fourier-sor előállításához, akkor eljuthatunk a sorfejtés „mechanikájához” a következő
egyszerűsített módon.

Tegyük fel, hogy a 2πszerint periodikusf(x) függvényt előállítja egy trigonometrikus Fourier-sor
egy 2π -hosszúságú intervallumon, azaz teljesül, hogy


f ( x)  a0    an cos nx  bn sin nx 
n 1

A kérdés ekkor a következő: Hogyan határozhatók meg az a0, an és bn együtthatók, ha teljesül az


egyenlőség? Formális gondolkodással a következőt tehetjük. Feltesszük, hogy a sor konvergens,
sőt egyenletesen konvergens, amiből az következik, hogy a sor tagonként integrálható, és
alkalmas integrálok kiszámításával meghatározzuk az együtthatókat.

a) Az a0 együttható meghatározása érdekében integráljuk a fenti egyenlőség mindkét oldalát az


[a, a + 2π] intervallumon. Ekkor a következő adódik

a  2 a  2 a  2   
 
f ( x)dx    n
a0 dx 
  a cos nx  bn sin nx   dx 

a a a  n 1
a  2   a  2 a  2 
  a0 dx    an  cos nxdx  bn  sin nxdx 

n 1 

a a a 

Az egyenlőség jobb oldalán szereplő integrálokat ki kell számítani. Ez három integrál


kiértékelését jelenti.

a  2
a  2
 a0 dx   a0 x a  a0  a  2   a0 a  2a0
a
a  2 a  2
 sin nx  sin n  a  2   sin na
 cos nxdx   n  a 
n
0
a
a  2 a  2
  cos nx  cos n  a  2   cos na
 sin nxdx   n  a 
n
0
a

Az utóbbi két integrál értéke azért zérus, mert mind a szinusz függvény, mind a koszinusz
függvény periódusa 2π, tehát a függvényértékek a számlálókban rendre egyenlők, akármi is az a
konkrét értéke. Ha az első egyenlőséget figyelembe vesszük, megkapjuk az a0 együtthatót:

430
Óbudai Egyetem BGK Fejezetek a matematikából

a  2 a  2
1
 f ( x)dx  2 a0 ; azaz: a0   f  x  dx
2
a a

b) Az an együtthatók meghatározásához szorozzuk meg a fenti egyenlőséget coskx-szel, ahol k


egy rögzített pozitív egész és integráljunk egy 2π hosszúságú intervallumra. Ekkor a következő
adódik

a  2 a  2   a  2 a  2 
 f ( x) cos kx dx   0
a cos kx dx   n 
 a cos nx  cos kx dx  bn  sin nx  cos kx dx 

a a n 1  a a 

Ebben az esetben a jobb oldalon öt integrált kell kiszámítanunk, ugyanis külön kell
foglalkoznunk a k = n és a k ≠ n esettel. Az integrálok kiszámításához fel kell használnunk az
alábbi trigonometrikus azonosságokat.

1
sin      sin       ;
sin   cos  
2
cos   cos    cos       cos       ;
1
2
sin   sin     cos       cos       ;
1
2
1  cos 2  1  cos 2
cos2   ; sin 2   ; sin 2  2sin  cos 
2 2

Ezek figyelembe vételével az adódik, hogy

a  2 a  2
 sin kx  sin k  a  2   sin ka
 a0 cos kx dx  a0  k  a  a0
k
0
a

a szinusz függvény 2π szerinti periodicitása miatt. Folytassuk most az an együtthatók mellett álló
integrálok kiszámításával. Ha egyrészt feltesszük, hogy k ≠ n, akkor az idézett azonosságok
szerint

a  2 a  2
  cos  n  k  x  cos  n  k  x  dx 
1
 cos nx  cos kx dx 
2
a a
a  2
1  sin  n  k  x sin  n  k  x 
    
2 nk nk a
1  sin  n  k  a  2   sin  n  k  a sin  n  k  a  2   sin  n  k  a 
   0
2 nk nk 

431
Óbudai Egyetem BGK Fejezetek a matematikából

ugyancsak a szinusz függvény 2π-szerinti periodicitása miatt. Másrészt viszont, ha n = k, akkor


világos, hogy az előző formulák nem alkalmazhatóak, mert 0-val kellene osztanunk, ezért ebben
az esetben a linearizáló formulát használjuk.

a  2 a  2 a  2
1  cos 2kx
 cos kx  cos kx dx   cos2 kx dx   2
dx 
a a a
a  2
 x sin 2kx    a  2   a sin 2k  a  2   sin 2ka 
    
2 4k  a  2 4k 

A számításokból kiderül, hogy az an együtthatók között mindössze egy van olyan, a k indexű,
amelynek szorzója különbözik 0-tól. Folytassuk most a számításokat a bn együtthatók szorzóinak
kiszámításával. Ehhez ismét alkalmaznunk kell trigonometrikus azonosságokat. Itt elsőként
ugyancsak feltesszük, hogy k ≠ n. Ekkor a következő adódik.

a  2 a  2
 sin  n  k  x  sin  n  k  x  dx 
1
 sin nx  cos kx dx 
2
a a
a  2
1  cos  n  k  x cos  n  k  x 
    
2 nk nk a
1  cos  n  k  a  2   cos  n  k  a cos  n  k  a  2   cos  n  k  a 
   0
2 nk nk 

a koszinusz függvény 2π-szerinti periodicitása miatt. ha viszont n = k, akkor

a  2 a  2 a  2
1 1  cos 2kx  1  cos 2k  a  2   cos 2ka 
 sin kx  cos kx dx 
2  sin 2kx dx 
2  2k  a

2

2k
0

a a

az idézett periodicitás miatt. Kaptuk tehát, hogy a bn együtthatók szorzói minden n-re zérussal
egyenlők. Ha figyelembe vesszük az eddigi eredményeket, akkor azt kapjuk, hogy

a  2 a  2
1
 f ( x) cos kx dx  ak  ; azaz: ak 
  f ( x) cos kx dx
a a

c) A bn együtthatók meghatározásához szorozzuk meg a fenti egyenlőséget sinkx-szel, ahol k egy


rögzített pozitív egész és integráljunk egy 2π hosszúságú intervallumra.Ekkor a következő
adódik.

432
Óbudai Egyetem BGK Fejezetek a matematikából

a  2 a  2  a  2
 a  2 
 f ( x)sin kx dx   a0 sin kx dx   an  cos nx  sin kx dx  bn  sin nx  sin kx dx 


n 1 

a a a a 

Ezeket a számításokat már nem részletezzük. A Tisztelt Olvasóra bízzuk annak ellenőrzését,
hogy a b) pontbeli azonosságok alkalmazásával, a fenti számítások mintájára az adódik, hogy
mindössze egyetlen együttható, konkrétan a bk együttható az, amelynek szorzója különbözik
0-tól. A jelzett integrál értéke ugyancsak π, tehát fennáll a következő egyenlőség.

a  2 a  2
1
 f ( x)sin kx dx  bk  ; azaz: bk 
  f ( x)sin kx dx
a a

Ezzel meghatároztuk a Fourier-együtthatókat, amelyeket a 3.3.4. pontban más elvi alapokon


megkaptunk.

Fontos szerepe miatt a Parseval-képletet is levezetjük ezen formális gondolatmenet segítségével.


Ehhez tegyük fel, hogy a sor előállítja a függvényt, amikor is pontonként teljesül az alábbi
összefüggés.

 n 
lim  a0    ak cos kx  bk sin kx    f  x 
n   k 1

Ha ez igaz, akkor az f(x) függvény négyzetéhez normában konvergál az f-et közelítő


trigonometrikus polinom négyzete. Így a norma definíciója miatt egy 2π hosszúságú
intervallumra vonatkozó integrálra vonatkozólag igaz a következő:

a  2  2
a  2
n 
lim   a0    ak cos kx  bk sin kx   dx   f 2  x  dx
n   
a  k 1  a

feladatunk kiszámítani a bal oldalon álló, trigonometrikus polinom négyzetének integrálját.


Mielőtt ehhez hozzálátnánk, gondoljuk át, hogy a négyzetre emelés során milyen tagok
keletkeznek. Ezek egy esetleges 2-es szorzótól eltekintve a következők.

a0ak cos kx; a0bk sin kx; ak bn cos kx sin nx;


ak an cos kx cos nx; bk bn sin kx sin nx; a02 ; an2 cos2 nx; bn2 sin 2 nx.

Ezeket a függvényeket kell integrálni egy 2π hosszúságú intervallumon. Nem szeretnénk


részletezni a számításokat, ugyanis a szükséges integrálokat már mind kiszámítottuk a szakasz b)
pontjában. Az ott részletezett számítások alapján azt mondhatjuk, hogy a felsorolt függvények
közül az első hat integrálja zérus, csak az utolsó három integrál különbözik zérustól. Ezek értéke
pedig a következőnek adódik.

433
Óbudai Egyetem BGK Fejezetek a matematikából

a  2 a  2
 a02dx   a02 x   a02  a  2   a02a  2a02
 a
a
továbbá

a  2 a  2
1  cos 2kx
ak2  cos kx dx  ak2 
2
dx 
2
a a
a  2
 x sin 2kx    a  2   a sin 2k  a  2   sin 2ka 
 ak2    ak2   2
  ak
2 4k  a  2 4 k 

végül pedig

a  2 a  2
1  cos 2kx
bk2  sin kx dx  bk2 
2
dx 
2
a a
a  2
 x sin 2kx    a  2   a sin 2k  a  2   sin 2ka 
 bk2    bk2   2
  bk
2 4k  a  2 4 k 

Az eredményeket behelyettesítve adódik a Parseval-képlet néven ismert összefüggés.

  a  2 2
 
n
lim  2a02   ak2  bk2    f  x  dx
n   k 1

 a

tehát a szokásos alakban írva.

a  2 
 f 2  x  dx  2a02    an2  bn2
n 1
 
a

3.3.1. Példa: Határozzuk meg a következő függvény Fourier-sorát.

 0, ha    x  0

f ( x)   x, ha 0  x  
 f ( x  2), különben

A Fourier-sor meghatározásához az általános esetben tehát három integrált kell kiszámítani, a


levezetett együttható formulák alapján. Válasszuk integrációs intervallumnak a [–π, π]
intervallumot, és integráljunk. Vegyük figyelembe, hogy a [–π, 0] intervallumon a függvény
zérus. Így a következőt kapjuk.

434
Óbudai Egyetem BGK Fejezetek a matematikából

  
1 1 1  x2  1 2 
a0 
2  f ( x)dx  2  x dx  2  2   2 2  4
 0  0
   
1 1 1   sin nx  sin nx  
an   f ( x)  cos nx dx   x  cos nx dx    x    dx  
    n 0 n 
 0  0 

1  sin n   cos nx    1  cos n 1  1   1 1 
n
   0       
   2    2 2  2 2

n  n  0  n n   n n 
   
1 1 1   cos nx   cos nx  
bn   f ( x)  sin nx dx   x  sin nx dx    x    dx  
    n 0 n 
 0  0 

1   cos n   sin nx    1   cos n  n 1 1
   0        0  0    1
  n   n2  0   n  n
 

Meghatároztuk az együtthatókat, tehát a Fourier-sor felírható. Előbb azonban még kiemeljük az


an együttható formula eredményére tekintve, hogy ez az együttható minden páros n-re zérus és
minden páratlan n-re különbözik zérustól. Így a sor a következő alakot ölti.

 2  cos(2n  1) x   n 1 sin nx 
f ( x)        1 
4  n 1  2n  12 n 1  n 
 2 cos 3 x cos 5 x cos 7 x   sin 2 x sin 3 x sin 4 x 
   cos x     ...    sin x     ... 
4  32
52
7 2
  2 3 4 

A sorfejtést grafikusan szemléltetjük a 3.3.1. ábrán.

3.3.1. ábra. A 3.3.1. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor „első kilenc” tagjával (piros
színű görbe), a konstans tag mellett 4 db koszinuszos és 4 db szinuszos tag figyelembe vételével

435
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.2. Példa: Határozzuk meg a következő függvény („négyszögrezgés”) Fourier-sorát.

 3, ha    x  0
 3, ha 0  x  

f ( x)  
 0, ha x  k , k  Z
 f ( x  2), különben

Ismét az együttható formulákba helyettesítünk. Elsőként azonban vegyük észre, hogy az f(x)
függvény páratlan. Ezért a [–π, π] intervallumra vonatkozó integrálja zérus, tehát a0 = 0.
Továbbá, mivel f(x) páratlan cosnx pedig páros, szorzatuk ugyancsak páratlan, tehát kapjuk, hogy
a szorzatuk origóra szimmetrikus intervallumra vonatkozó integrálja minden n-re zérus. Ezért


1
an 
  f ( x)  cos nx dx  0


Végül a bn együtthatókat kell kiszámítanunk. Ehhez használjuk fel, hogy az f(x) függvény
páratlan, de a sinnx függvény is páratlan, ezért szorzatuk páros, elég tehát a [0, π] intervallumon
integrálni:

  
6  cos nx 
 f ( x)  sin nx dx    3  sin nx dx    n 0  n cos n  cos 0  n  1  1
1 2 6 6 n
bn 

 0

Ezen együtthatók közül minden páros indexű szintén zérus, a páratlan indexűek értéke pedig
12
bn   ha n páratlan. Ezek felhasználásával a Fourier-sor a következő.
n

12   sin  2k  1 x  12  sin 3x sin 5 x sin 7 x 


f ( x)    
 k 1 2k  1 
    sin x 
 3

5

7
 ... 

Mivel az f(x) függvény teljesíti a 3.3.8. tétel feltételeit, hiszen a szakadási helyeken, tehát az
x = kπ helyeken a függvényérték az egyoldali határértékek (3 illetve –3) számtani közepe (zérus),
ezért jogosan írtuk az egyenlőséget a függvény és a sor közé, a sor előállítja a függvényt.

A feladat megoldása során több egyszerűsítő észrevételt is tettünk, amelyek a paritással voltak
kapcsolatosak. A 3.3.6. pontban szisztematikusan vizsgáljuk majd ezt a kérdést.

A sorfejtést grafikusan szemlélteti a 3.3.2. ábra.

436
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.2. ábra. A 3.3.2. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával
(piros színű görbe), azaz 4 db szinuszos tag figyelembe vételével

3.3.3. Példa: Az előző, 3.3.2. példabeli Fourier-sorfejtés eredményeit figyelembe véve


alkalmazzuk a Parseval-képletet. Ehhez szükség van az f(x) függvény négyzetének határozott
integráljára.
 
 f 2
 x  dx   9dx  9 x   9   9   18
 

A Parseval-formula szerint, ez az integrál egyenlő adott esetben a bn együtthatók


négyzetösszegének π-szeresével. Azaz

 2
 12  144  1
18   bn      
2
 
n k 0 
  2k  1   k  0  2k  12

Ha ezt átrendezzük, akkor kapjuk a következő nevezetes összefüggést, a páratlan számok


reciprokainak négyzetösszegét.


1 2
 
k  0  2k  1
2 8

A Parseval-formulával tehát numerikus sorokat tudunk összegezni.

437
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.6. Páros és páratlan függvények Fourier-sora


Különleges esetekben, amikor a sorba fejtendő függvény páros vagy páratlan, a feladat
egyszerűsödik, egy vagy akár két integrál kiszámításától is eltekinthetünk. Az együtthatók
kiszámításánál segít néhány ötlet. Először is, ha egy páratlan függvényt integrálunk egy origóra
szimmetrikus intervallumon, akkor az integrál zérus, ha pedig egy páros függvényt integrálunk
origóra szimmetrikus intervallumon, akkor az integrál kiszámítása egyszerűbb, ha megfelezzük
az intervallumot úgy, hogy pl. az alsó határ zérus legyen és a megfelezett intervallumon vett
integrált szorozzuk 2-vel, ugyanis a 0-t mindig egyszerűbb helyettesíteni a primitív függvénybe,
mint egy negatív számot. Összefoglalva

a a a
Ha f  x  páratlan :  f  x  dx  0; Ha f  x  páros :  f  x  dx  2 f  x  dx.
a a 0

Végül fogalmazzunk meg néhány nyilvánvaló tényt páros illetve páratlan függvények szorzatára
vonatkozólag: két páros függvény szorzata páros, azonban két páratlan függvény szorzata is
páros. Ha azonban egy páros és egy páratlan függvényt szorzunk, akkor a szorzat páratlan. Ezeket
az egyszerű észrevételeket mind használni fogjuk az együttható formulák kiértékelése során.

Páros függvény Fourier-sora

Legyen az f(x) függvény a [–π, π] intervallumon értelmezett páros függvény2π-periódusú


kiterjesztése a teljes számegyenesre. Ekkor, mivel sinnx páratlan függvény, az f(x)∙sinnx szorzat
páratlan, ezért a [–π, π] origóra szimmetrikus intervallumra vonatkozó integrálja zérus. Ezért
ebben az esetben bn = 0, n = 1,2,3,… Ekkor tehát csak az a0 és an együtthatókat kell
kiszámítanunk. A Fourier-sor ekkor a következőre redukálódik:


f ( x)  a0    an cos nx 
n 1

3.3.4. Példa: Határozzuk meg a következő 2π-szerint periodikus függvény („háromszögrezgés”)


Fourier-sorát.

  x, ha    x  0

f ( x)   x, ha 0  x  
 f ( x  2), különben

A függvény páros, így azonnal adódik, hogy bn = 0, n = 1,2,3,… Tehát csak két integrált kell
kiszámítanunk.

  
1 2 1  x2  
a0 
2  f ( x ) dx 
2  x dx    
  2  2
 0 0

438
Óbudai Egyetem BGK Fejezetek a matematikából

   
1 2 2  sin nx  sin nx  
an 
  f ( x )  cos nx dx 
  x  cos nx dx  
  x
n 0    n
dx  
 0  0 


2  sin n   cos nx    2  cos n 1  2   1 1 
n
   0       
   2    2 2  2 2

n  n  0  n n   n n 

4
Ennek a kifejezésnek az értéke páros n esetén zérus, páratlan n esetén pedig an  2 . Az
n 
integrálok kiszámításánál felhasználtuk azt az egyszerű tényt, hogy ha egy origóra szimmetrikus
intervallumra integrálunk egy páros függvényt, akkor az intervallumot megfelezhetjük, és az
integrál értékét szorozzuk 2-vel.
4
Ezzel előállítottuk a Fourier-sor együtthatóit. Innen a sorfejtés, ha a közös szorzó-tényezőt

kiemeljük, az alábbi.

 4 cos 3x cos 5 x cos 7 x   4  cos(2n  1) x


f ( x)    cos x     ...    
2  32 52 72  2  n 1  2n  12

A Fourier sorfejtést grafikusan szemlélteti a 3.3.3. ábra.

3.3.3. ábra. A 3.3.4. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első öt tagjával
(piros színű görbe), azaz a konstans taggal és az azt követő 4 db koszinuszos tag figyelembe vételével

439
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.5.Példa: Függvénysorokkal, speciálisan Fourier-sorokkal, numerikus sorok összegét is meg


tudjuk határozni, de nem kizárólag a Parseval-képlet felhasználásával. Helyettesítsünk az előbbi
sorban az x helyére 0-t, és számítsuk ki a helyettesítési értékeket:

 4 cos 0 cos 0   4  cos 0


f (0)    cos 0    ...    
2  32 52  2  n 1  2n  12

Mivel az f(x) definíciója szerint f(0) = 0, továbbá cos0 = 1, ezért azt kapjuk, hogy:

 4 1 1   4  1
0   1    ...    
2  3 2
52
 2  n 1  2n  12

Ha ezt az egyenletet átrendezzük a páratlan számok reciprokának négyzetösszegét kapjuk:


1 1 1 2
  1    ... 
n 1  2n  1
2
32 52 8

Ezt az eredményt már megkaptuk a 3.3.3. példában más módszerrel.

Páratlan függvényFourier-sora

Legyen az f(x) függvény a [–π, π] intervallumon értelmezett páratlanfüggvény 2π-periódusú


kiterjesztése a teljes számegyenesre. Ekkor mivel cosnx páros függvény, az f(x)∙cosnx
szorzatfüggvény is páratlan, ezért a [–π, π] origóra szimmetrikus intervallumra vonatkozó
integráljuk zérus. Ezért ebben az esetben a0 = an = 0, n = 1,2,3,… Ekkor tehát csak a bn
együtthatót kell kiszámítanunk A Fourier-sor így a következőre redukálódik.


f ( x)    bn sin nx 
n 1

3.3.6. Példa: Határozzuk meg a következő 2π-szerint periodikus függvény („fűrészfogrezgés”)


Fourier-sorát.

 x, ha    x  

f ( x)   0, ha x    2k 
 f ( x  2), különben

A függvény páratlan, így azonnal adódik, hogy a0 = an = 0, n = 1, 2, 3, … Tehát csak egyetlen


integrált kell kiszámítani. Használjuk fel, hogy két páratlan függvény szorzata páros, így
egyszerűsödik az integrál kiszámítása.

440
Óbudai Egyetem BGK Fejezetek a matematikából

    
1 1 2 2   cos nx   cos nx  
bn 
  f ( x)  sin nx dx 
  x  sin nx dx 
  x  sin nx dx  
  x
n 0    n
dx  
  0  0 


2   cos n   sin nx    2   cos n  n 1 2
   0        0  0    1
  n   n2  0   n  n
 

Az együtthatók ismeretében felírhatjuk a Fourier-sort.

 
 n 1 2sin nx   sin 2 x sin 3x sin 4 x 
f ( x)    bn sin nx      1   2  sin x     ... 
n 1 n 1
n   2 3 4 

A sorfejtést grafikusan szemlélteti a 3.3.4. ábra.

3.3.4. ábra. A 3.3.6. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával
(piros színű görbe), azaz 4 db szinuszos tag figyelembe vételével

3.3.7. Példa: Az előző, 3.3.6. példa eredményeire támaszkodva alkalmazzuk a Parseval-féle


képletet. Ehhez szükség van az f(x) függvény négyzetének határozott integráljára.

  
 x3  3  3  2 3
 f 
2
x  dx   x dx  
2
     
 
   3 
   3  3  3

A Parseval-formula szerint, tekintettel arra, hogy a0 = an = 0, n = 1,2,3,…, teljesül, hogy

  1 2n  2 4 
2 3 
    bn   
2

  

 4 
1
3 n 1

n 1  n 2  n 1 n
2

441
Óbudai Egyetem BGK Fejezetek a matematikából

Átrendezéssel kapjuk az egész számok reciprokainak négyzetösszegét.


1 1 1 1 2
 2
 1
22

32
 ... 
n2
 ... 
6
n 1 n

Ezt a sorösszeget a numerikus sorok elméletének tárgyalása során (3.1. fejezet) már bizonyítás
nélkül említettük, most érkeztünk el oda, hogy igazolni is tudjuk. Ennek az eredménynek a
birtokában, figyelembe véve a 3.3.3. illetve 3.3.5. példákban kapott eredményt, kiszámítható a
páros számok reciprokainak négyzetösszegét is. Induljunk ki a következő nyilvánvaló
összefüggésből.

  
1 1 1
 n2    
k 1  2k  k  0  2k  1
2 2
n 1

ahonnan a kiszámított sorösszegek alapján adódik, hogy.

2  1 2 
1 2 2 2
  ; átrendezve     ;
6 k 1  2k 2 8 k 1  2 k  2 6 8 24

Tehát a páros számok reciprokának négyzetösszege.


1 1 1 1 1 2
     ...   ...  ;
k 1  2k   2k  2
2
22 42 62 24

442
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.7. Nem 2π-szerint periodikus függvények Fourier-sora


A probléma könnyen általánosítható olyan esetekre, amikor a periódus nem 2π. Legyen az f(x)
függvény periódusa T = 2p. A Fourier-sor egy egyszerű lineáris transzformációval felírható erre
az esetre is, azonban végigkövethetjük a 3.3.4. vagy a 3.3.5. pont logikáját.

A számításokat nem végezzük el olyan részletességgel, mint az említett pontokban, csak nagy
vonalakban vázoljuk az eljárást, a számítások részletes kivitelezését az Olvasóra bízzuk.
2 2 
Ha bevezetjük a rezgéstanban szokásos     jelölést, akkor elsőként a következőt
T 2p p
állítjuk. Tetszőleges valós a esetén az [a, a + T] intervallumon a

1, cosωx, sinωx, cos2ωx, sin2ωx, cos3ωx, sin3ωx, …, cosnωx, sinnωx,…

függvényrendszer ortogonális rendszer. Ezt pontosan úgy igazolhatjuk, mint a 3.3.4. tételben.
Ahhoz hogy ortonormált függvényrendszert tudjuk képezni, szükség van minden egyes függvény
normájára.

a T
1   12 dx   xaa T  a T  a  T  2p
a
a T a T a T
1  cos 2nx  x sin 2nx 
cos nx   cos 2 nxdx   2
dx   2  4n 
a

a a

 a  T sin 2n  a  T    a sin 2na 


     
 2 4n  2 4n 

 a  T a   sin 2n  a  2  sin 2na  T


       p
 2 2  4n 4n  2

Az utolsó lépésben kihasználtuk, hogy a szinusz függvény periódusa 2π. Hasonló módon
T
igazolható, hogy sin nx   p.
2
Ezen számítások eredményének birtokában kijelenthetjük, hogy az

1 cos x sin x cos 2x sin 2x cos 3x sin 3x cos nx sin nx
; ; ; ; ; ; ;...; ; ;...
2p p p p p p p p p

függvényrendszer ortonormált rendszer az [a, a + T] = [a, a + 2p] intervallumon. Legyen adott


ezek után egy T = 2p-szerint periodikus f(x) függvény. Az f(x) függvény Fourier-sora a
következő.

443
Óbudai Egyetem BGK Fejezetek a matematikából

 
1 1 cos nx cos nx sin nx sin nx 
f ( x) ~  f ( x),      f ( x),    f ( x),  
2 p 2 p n 1 p p p p 

Ha alkalmazzuk a megszokott egyszerűbb jelölésrendszert, akkor a T = 2p-szerint periodikus


függvény Fourier-sora a következő, hagyományos formába írható.


f ( x) ~ a0    an cos nx  bn sin nx 
n 1

Ahol a Fourier-együtthatókat ebben az általánosabb esetben az alábbi formulák szolgáltatják.

a2 p a T
1 1 1
a0 
2p
 f ( x),1 
2p  f ( x)dx 
T  f ( x) dx
a a
a2 p a T
1 1 2
an   f ( x), cos nx 
p p  f ( x)  cos nx dx 
T  f ( x)  sin nx dx; n  1, 2,3,...
a a
a2 p a T
1 1 2
bn 
p
 f ( x),sin nx 
p  f ( x)  sin nx dx 
T  f ( x)  sin nx dx; n  1, 2,3,...
a a


  f , gi
2 2
Könnyen általánosíthatjuk az f Parseval-képletet is, csak azt kell figyelembe
i 1
venni, hogy az együttható formulák átrendezésével a következő adódik.

1 cos nx sin nx


 f ( x),   2 p  a0 ;  f ( x),  p  an ;  f ( x),  p  bn
2p p p

Innen a keresett összefüggés a következő két ekvivalens alakban írható.

a2 p
 

 f 2  x  dx  2 p a0  p  an  bn
2 2 2

a n 1
a T

a
f 2  x  dx  T a0 
2 T 

2 n 1 2
an  bn
2

A T = 2p szerint periodikus függvények pontonkénti illetve egyenletes konvergenciájára
vonatkozó Dirichlet-Jordan tétel értelemszerű módosításokkal átvihető.

444
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.8. Példa: Határozzuk meg az alábbi függvény Fourier-sorát.

4  x ; ha  2  x  2
2
f  x  
 f  x  4  ; különben

Világos, hogy a függvény periódusa T = 2p = 4, azaz p = 2. Innen következik, hogy


2 2 
   . Az is világos továbbá, hogy a függvény páros. A páros és páratlan
T 4 2
függvényekre vonatkozólag pontosan ugyanazokat a megállapításokat tehetjük, mint a 3.3.6.
pontban. Így ebben az esetben is igaz, hogy bn = 0, n = 1,2,3,… Tehát csak két integrált kell
kiszámítanunk. Figyelembe véve azt, hogy mind az f(x) függvény mind pedig a cosnωx függvény
páros, írhatjuk, hogy:

2
1 x3 
 4  x   
2 2 2
1 1 2 8
 dx   4  x 2 dx   4 x   
2
a0  f ( x)dx 
2p 4 4 2  3  3
2 2 0 0

 4  x   cos nx dx  22   4  x2   cos nx dx 


2 2 2
1 1

2
an  f ( x)  cos nx dx 
p 2
2 2 0

 
2 2 2
 sin nx  sin nx sin nx
  4  x2    2 x dx  0   2 x dx 
 n  0 n n
0 0
2 2 2
 cos nx  cos nx 4   sin nx 
  2 x    2 dx   cos n 2  0   2  
 n 22  0 0 n 22 n 22 2  n33  0
n 1 n 1
n 4  1 16  1
2
4  2    4
 cos n    sin n 2  sin 0      1  
n 22  n33  2 0 n22 n22 n 2 2

Kaptuk tehát az f(x) függvény Fourier-sorát. A Dirichlet-Jordan féle konvergencia tétel alapján
tudjuk, hogy a sor előállítja a függvényt, hiszen ez a függvény folytonos, tehát írhatjuk az
egyenlőséget:

n 1 n 1
8  4  1 8 16   1 
f  x    cos nx    cos n x
3 n 1 n22 3 2 n 1 n2 2
8 16    1 1  3  1 
   cos  x   cos  x   cos  x   cos  2x   ... 
3 2  2  4 9  2  16 

A sorfejtést a 3.3.5. ábrán szemléltetjük.

445
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.5. ábra. A 3.3.8. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első öt tagjával
(piros színű görbe), azaz a konstans taggal és az azt követő 4 db koszinuszos tag figyelembe vételével

Végül alkalmazzuk a Parseval-képletet. Ehhez ki kell számítanunk az f(x) függvény négyzetének


az integrálját.

2
2 2
 x3 x5 
 4  x   
2  64 32  512
2
dx  2 16  8 x  x dx  2 16 x  8    2 32    
2 4

2 0  3 5 0  3 5  15

Ha ezt az adatot, valamint az előző bekezdésben kapott Fourier-együtthatókat helyettesítjük a


Parseval-képletbe, azt kapjuk, hogy:

2
  16 1 n 1 
512 8
2
 4   2
  512 256 512  1
4  4
  ; azaz  
15  3  2 2
n 1  n 
 15 9  n 1 n

Rendezve a kapott egyenletet, ismét egy nevezetes végtelen numerikus sor összegét nyerjük.


1 4
 4

90
n 1 n

446
Óbudai Egyetem BGK Fejezetek a matematikából

3.3.8. Komplex Fourier-sor


Mielőtt a komplex Fourier-sor tárgyalásába belekezdenénk némileg módosítani, pontosabban
kiterjeszteni kell a skaláris szorzat fogalmát, mert komplex számok esetén a valós esetre adott
definíció nem megfelelő. Ennek oka a következő. Valós esetben teljesül, hogy egy vektor
önmagával képezett skaláris szorzata egyenlő a vektor abszolút értékének négyzetével, azaz
2
xT x  x, x  x . Ha komplex számokra alkalmazzuk ezt a definíciót, akkor ezt az összefüggést
nem kapjuk meg, pedig megköveteljük a skaláris szorzattól, hogy ez minden komplex vektorra is
teljesüljön. Legyen ugyanis z = a + ib = (a, b) egy komplex szám, ha tetszik vektor. Ha erre
alkalmazzuk az előző összefüggést változtatás nélkül, akkor a komplex számok szorzásának
szabálya szerint azt kapjuk, hogy z  z   a  ib  a  ib   a 2  2abi  b2 ez pedig nyilván nem
egyenlő a komplex z szám abszolút értékének a négyzetével. Ha azonban az értelmezést úgy
módosítjuk, hogy az önmagával képezett skaláris szorzatban a második tényező a konjugált
legyen, akkor helyes eredményt kapunk: z  z   a  ib  a  ib   a 2  b2  z 2 . Ebből adódóan,
komplex számok, vektorok, függvények esetén a skaláris szorzást a következő módon
értelmezzük.

3.3.11.Definíció: Legyenek z, w  Cn n-komponensű, komplex elemű vektorok. Ekkor a z és w


vektorok skaláris szorzatán a z T w szorzatot értjük, ahol a második tényező a w komplex vektor
konjugáltja, ami azt jelenti, hogy minden komponensének a konjugáltját kell képezni.
Legyenek f(x) és g(x) valós változójú, komplex értékű függvények, amelyek az [a, b]
intervallumon négyzetesen integrálhatóak. Az f és g komplex értékű függvények skaláris
szorzatán az

b
f , g   f  x  g  x dx
a

határozott integrált értjük. Most is könnyen ellenőrizhető, hogy a 3.3.2. definícióban szereplő
feltételek mind teljesülnek.

A komplex skaláris szorzat lehetőséget teremt arra, hogy a trigonometrikus függvényrendszerhez


hasonlóan ismét értelmezzünk egy nevezetes ortogonális rendszert. Ehhez mindössze annyit kell
bevezetésként megjegyeznünk, hogy hogyan értelmezzük egy komplex értékű függvény
konjugáltját. Ha f(x) egy valós változós komplex értékű függvény – a fogalom értelmezhető
komplex változóra is, de ebben a jegyzetben csak valós változókkal foglalkozunk –, azaz
felírható f  x   u  x   i  v( x) alakban, ahol u(x) és v(x) valós változójú, valós értékű függvények
az f(x) függvény valós és képzetes része, akkor az f(x) komplex konjugáltját a következő módon
értelmezzük: f  x   u  x   i  v( x) .

447
Óbudai Egyetem BGK Fejezetek a matematikából

Tekintsük konkrét példaként az f  x   eix valós változójú komplex függvényt. A konjugált


értelmezése alapján, valamint a 3.2. fejezetben igazolt Euler-féle összefüggés felhasználásával
kapjuk a következő alapvető fontosságú összefüggéseket.

f  x   eix  cos x  i  sin x,


f  x   eix  cos x  i  sin x

Ha ezt a két összefüggést, mint egyenletrendszert tekintjük, akkor látható, hogy a sinx és cosx
trigonometrikus függvények kifejezhetők komplex exponenciális függvényekkel. A
későbbiekben szükségünk lesz ezekre az összefüggésekre ezért felírjuk őket:

eix  eix eix  eix


cos x  ; illetve sin x 
2 2i

A mondottak birtokában készen állunk a jelzett definíció megfogalmazására.

3.3.12.Definíció: Az einx n  Z; x a, a  2 függvényrendszert – figyelembe véve, hogy


n = 0 esetén ei 0 x  e0  1 –, elemenként írva az

...; e3ix ; e2ix ; eix ; 1; eix ; e2ix ; e3ix ;...

függvényrendszert, ahol i az imaginárius egység, komplex exponenciális rendszernek nevezzük.

A 3.3.11. definícióval értelmezett skaláris szorzat birtokában könnyedén igazolhatjuk, hogy az


exponenciális rendszer ortogonális rendszer.

3.3.9. Tétel: Az exponenciális rendszer ortogonális függvényrendszer az [a, a+2π] intervallumon,


tetszőleges valós a esetén.
Bizonyítás: Meg kell mutatnunk, hogy tetszőleges n és k egészekre az einx ; eikx ; n  k
függvények ortogonálisak. A 3.3.11. definíció alapján ez könnyen igazolható, ha figyelembe
vesszük az Euler-összefüggést valamint a skaláris szorzat értelmezését komplex függvények
esetére.

a  2
a  2 a  2
i nk  x
 ei  n  k  x 
einx , eikx   einx  eikx dx   e dx    
a a
 i  n  k  
a
a  2
 cos  n  k  x  i sin  n  k  x 
  
 i n  k  a

448
Óbudai Egyetem BGK Fejezetek a matematikából

 cos  n  k  a  2   cos  n  k  a i sin  n  k  a  2   i sin  n  k  a 


  0
 i n  k  i n  k  

Az eredmény azért zérus, mert a szinusz függvény és a koszinusz függvény periódusa 2π, tehát a
zárójelben szereplő törtek értéke külön-külön zérus. Éppen ezt kellett igazolni. ■

Szeretnénk átalakítani az exponenciális rendszert úgy, hogy ortonormált rendszer legyen. Ehhez
meg kell határozni a rendszer elemeinek normáit.

3.3.10. Tétel: Az exponenciális függvényrendszer minden elemének normája 2 .


Bizonyítás: Legyen n tetszőleges egész szám, ekkor

2 a  2
einx  einx , einx   einx  einx dx 
a
a  2 a  2
  ei 0 x dx   1dx   x  aa  2  a  2  a  2
a a

Ezzel az állítást igazoltuk. ■

A 3.3.9. és 3.3.10. tételek következménye az alábbi tétel.



e
inx 

3.3.11. Tétel: Az  n  Z  ; x   a, a  2 függvényrendszer, vagy elemenként írva az
 2
 

e3ix e2ix eix 1 eix e2ix e3ix


...; ; ; ; ; ; ; ;...
2 2 2 2 2 2 2

függvényrendszer ortonormált rendszer az [a, a + 2π] intervallumon. ■

Ha adott egy ortonormált rendszer, továbbá egy négyzetesen integrálható f(x) függvény – amely
komplex esetben azt jelenti, hogy az abszolút érték négyzete integrálható –, akkor a 3.3.7.
definíció szerint az f(x) függvény ezen ortonormált rendszer szerint Fourier-sorba fejthető.

3.3.13.Definíció: A négyzetesen integrálható f(x) függvény ortonormált komplex exponenciális


rendszer szerinti kifejtését komplex Fourier sornak nevezzük. Ennek alakja


einx einx
f ( x)  f ( x), 2 2

n 

449
Óbudai Egyetem BGK Fejezetek a matematikából

e3ix e3ix e2ix e2ix eix eix 1 1


 ...  f ( x),  f ( x),  f ( x),  f ( x), 
2 2 2 2 2 2 2 2

eix eix e2ix e2ix e3ix e3ix


 f ( x),  f ( x),  f ( x),  ...
2 2 2 2 2 2

Ha itt a szokásos módon bevezetjük az együtthatókra a

1 einx 1
cn  f ( x),  f ( x), einx ; n  Z
2 2 2 

jelölést, akkor megkapjuk a komplex Fourier-sor szokásos alakját.


f ( x) ~  cneinx  ...  c3e3ix  c2e2ix  c1eix  c0  c1eix  c2e 2ix  c3e3ix  ...
n 

Ha figyelembe vesszük a skaláris szorzat értelmezését, akkor kapjuk az együttható formulák


szokásos alakját is.

a  2
1
cn   f  x   einx dx; n  Z
2
a

Ebben az esetben tehát nem kell három együttható formulát megjegyezni és három integrált
kiszámítani egy sorfejtésnél, hanem elég egy formula és egy integrál. A számítás annyiban
szokatlanabb, hogy általában komplex mennyiségekkel kell számolnunk. További lényeges
eltérés, hogy ez a függvénysor mindkét irányban végtelen sor.

Pontosan úgy, ahogyan a trigonometrikus rendszer tanulmányozásánál tettük, nem vizsgáljuk a


rendszer teljességét, mert nincs a kezünkben a szükséges apparátus, azonban a tényt egy nagyon
fontos következményével együtt egy tétel formájában megfogalmazzuk.


e
inx 

3.3.12. Tétel: Az  n  Z  ; x   a, a  2 függvényrendszer teljes ortonormált rendszer a
 2
 

megadott intervallumon. Tetszőleges négyzetesen integrálható f(x) függvény esetén a komplex
Fourier-sor négyzetintegrál normában tart az f(x) függvényhez, azaz teljesül, hogy

n
lim f ( x) 
n 
 ck eikx  0
k  n

ezen kívül teljesül a Parseval-összefüggés

450
Óbudai Egyetem BGK Fejezetek a matematikából



2 2
f  2 cn
n 

Bizonyítás: A teljességet és a normában való konvergenciát nem vizsgáljuk, de a Parseval-


képletet igazoljuk. Használjuk fel az általános Fourier-sorok elméletében levezetett általános


2 2
Parseval-képletet. A 3.3.3. tétel szerint igaz, hogy f  f , gn ahol gn jelöli az
n 
ortonormált rendszer egy tagját. A 3.3.13. definícióban foglaltak szerint

1 einx 1
cn  f ( x),  f ( x), g n  x  ; n  Z; ahonnan f ( x), g n  x   2  cn
2 2 2

 
 
2 2
Ebből pedig már azonnal következik, hogy f , gn  2 cn , és éppen ezt kellett
n  n 
igazolni. ■

3.3.9. Példa: Határozzuk meg az alábbi függvény exponenciális Fourier-sorát.

 e x , ha    x  

 e  e
f  x   , ha x    2k ; k  Z
 2
 f  x  2  különben

A sorfejtés trigonometrikus rendszeren belül is elvégezhető természetesen, de a függvény


exponenciális jellegéből adódóan egy kissé hosszadalmas, kétszer kell parciálisan integrálni,
ráadásul két alkalommal is. Ez természetesen elvi problémát nem okoz, de jobban illeszkedik a
feladat az exponenciális sorfejtés témaköréhez. Itt mindössze egyetlen integrált kell kiszámítani
az n paraméter függvényében és már kezünkben is a Fourier-sor. Válasszuk integrációs
intervallumnak a természetesen adódó [–π, π] intervallumot. Ekkor kapjuk, hogy

  
1 inx 1 inx 1 1in  x dx 
 f  x  e e e
x
cn  dx  e dx 
2 2 2
  

1  e 
1in x 
   
1 e1in    e1in     1 eein  eein 
2  1  in  2 1  in  
  2 1  in  
 
 

Ezeknek a függvényértékeknek a kiszámításához szükségünk van az Euler-összefüggésre.


Eszerint sinnπ = 0 és cosnπ = (–1)n miatt

451
Óbudai Egyetem BGK Fejezetek a matematikából

1 e  cos n  sin n   e  cos n  sin n   


cn 
2 1  in   


 1
n

e  e

 1
n
sh  
sh   1
n

 1  in  2  1  in   1  in 

Ezzel a komplex Fourier-sort elő is állítottuk.

  1n
    1 n 
   einx
inx sh 
f  x    
sh   e    
n   
  1  in    n   1  in  
  

A kapott sor jelentős mértékben különbözik attól, amelyet trigonometrikus sorfejtés esetén
kaptunk volna. A legfontosabb különbség az, hogy a periodikus f(x) függvény valós függvény,
ennek ellenére egy komplex együtthatós függvénysort kaptunk, amelyben a sor függvényei is
komplex függvények. Természetesen van kapcsolat a valós sorfejtés és a komplex sorfejtés
között. Ennek a kérdésnek a részletes vizsgálatára visszatérünk a 3.3.11. pontban. Azt azonban
már most is hangsúlyozzuk, hogy tekintettel az Euler formulára, lényegében a kapott sor is
szinusz és koszinusz függvények szerint haladó sor, így a Dirichlet-Jordan tétel alkalmazható erre
az esetre is. Így megállapíthatjuk, hogy a kapott sor előállítja a függvényt, hiszen a szakadási
helyeken, tehát az x = π + k2π helyeken éppen úgy definiáltuk a függvényt, hogy a helyettesítési
érték az egyoldali határértékek számtani közepe legyen.

A sorfejtést közvetlenül szemléltetni nem tudjuk, hiszen valós változós komplex értékű
függvényeket kellene ábrázolnunk. Azt megtehetnénk, hogy ábrázoljuk külön a valós és a
képzetes részeket, de inkább más utat választunk. Először áttranszformáljuk a komplex sort
trigonometrikus sorrá, és azt szemléltetjük majd a 3.3.12. példában. A problémakört részletesen
vizsgáljuk majd a 3.3.11. pontban.

3.3.10. Példa: Induljunk ki a 3.3.9. példa eredményeiből, és alkalmazzuk a komplex Fourier-


sorokra vonatkozó Parseval-formulát. Ehhez először is szükség van az f(x) függvény
négyzetének az integráljára.

  
 e2 x  e2  e2
   
2 2x
f x dx  e dx      sh 2
   2   2

Az idézett formula szerint ez egyenlő a Fourier-együtthatók abszolút értékei négyzetösszegének


2π-szeresével.

A négyzetösszeg a következő.
2 2

sh 2    1n 2sh 2   1  in 
  1  in  
2
2 cn 2  
n  
n  2  n  1  in 1  in 

452
Óbudai Egyetem BGK Fejezetek a matematikából

2sh 2   1  in 2sh 2   1  in 1  in 2sh 2  


2
1
 
 n  1  n2
  
 n  1  n 1  n
2 2
 
 n  1  n2

Tegyük most egyenlővé a két eredményt, és azonnal vegyükfigyelembe az ismert hiperbolikus


trigonometriai összefüggést, mely szerint sh2x = 2shxchx. Így a következőt kapjuk.

2sh 2   1

 n  1  n2
 sh 2  2sh  ch 

Ha rendezzük a kapott egyenlőséget, ismét kaptuk egy végtelen numerikus sor összegét.


1 ch 
 2

sh 
  cth 
n  1  n

ahol cthx a kotangens hiperbolikusz függvényt jelöli.

3.3.9. Páros és páratlan függvények komplex Fourier-sora


A trigonometrikus esetben is tettünk észrevételeket páros és páratlan függvények sorfejtésével
kapcsolatban. A komplex esetben is léteznek ide vágó törvényszerűségek, azonban a komplex
jellegből adódóan az összefüggések természete más jellegűek.

Páros függvény komplex Fourier-sora

Induljunk ki tehát abból, hogy az f(x) függvény páros a [–π, π] intervallumon és ezt terjesztjük ki
2π-szerint periodikus módon a számegyenesre. Írjuk fel az együttható formulát. Ha figyelembe
vesszük az Euler-összefüggést, azt kapjuk, hogy

 
1 1
cn   f  x   einx dx   f  x    cos nx  i sin nx  dx 
2 2
 
  
1 i 1
  f  x   cos nx dx   f  x   sin nx dx   f  x   cos nx dx
2 2 2
  

ugyanis a második integrál zérus, hiszen egy páros és páratlan függvény szorzatának, vagyis egy
páratlan függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja. Ebben az esetben
tehát egyrészt azt kaptuk, hogy az együttható a kapott egyszerűbb összefüggéssel számítható,
aminek közvetlen következménye, hogy az együtthatók mind valós számok. Páros függvény
komplex Fourier-sorában tehát – a trigonometrikus esettel ellentétben – minden tag megtalálható,
de minden együttható valós szám.

453
Óbudai Egyetem BGK Fejezetek a matematikából

Ha még figyelembe vesszük, hogy a nem nulla integrál két páros függvény szorzatának, tehát egy
páros függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja, akkor az együttható
formula az alábbi legegyszerűbb alakot ölti.

  
1 2 1
cn   f  x   cos nx dx   f  x   cos nx dx   f  x   cos nx dx
2 2 
 0 0

3.3.11. Példa: Határozzuk meg az alábbi függvény („egyenirányított harmonikus jel”) komplex
Fourier-sorát.

 x
cos , ha    x  
f  x   2
 f  x  2  különben

A függvény páros, tehát az egyszerűség kedvéért alkalmazzuk a sorfejtéshez a páros


függvényekre levezetett együttható formulát.

 
1 1 x
cn   f  x   cos nx dx   cos  cos nx dx
  2
0 0

Az integrál kiszámításához ismét használjuk a cos   cos  


1
2
 cos      cos     
trigonometrikus azonosságot.

 
1  1  1   1  sin  0,5  n  x sin  0,5  n  x 
cn  
2  cos   n  x  cos   n  x  dx 
 2   2  

2  0,5  n

0,5  n  0
 
0
  
1  sin  0,5  n   sin  0,5  n    1  sin  2n  1 2 sin  2n  1 2 
  0  0    
2  0,5  n 0,5  n   2n  1 2n  1 
 
n 1 n 1
1   1  1   1  1 1  2  1
n n
      
  2n  1 2n  1    2n  1 2n  1   4n2  1
 

Az együtthatók birtokában írhatjuk az exponenciális függvények szerint haladó Fourier-sort:

n 1
2   1
f  x  
 n  4n2  1
 einx

454
Óbudai Egyetem BGK Fejezetek a matematikából

Az általános megállapításoknak megfelelően valós együtthatójú sort kaptunk. Ismét a Dirichlet-


Jordan tételre hivatkozva írható az egyenlőség, a sor előállítja a függvényt mindenütt, mert a
függvény mindenütt folytonos.

Az ábrázolásra majd visszatérünk a 3.3.11. pontban a 3.3.13. példán belül.

Páratlan függvény komplex Fourier-sora

Induljunk ki most abból, hogy az f(x) függvény páratlan a [–π, π] intervallumon és ezt terjesztjük
ki 2π-szerint periodikus módon a számegyenesre. Írjuk fel az együttható formulát. Ha figyelembe
vesszük az Euler-összefüggést, azt kapjuk, hogy

 
1 inx 1
cn 
2  f  x  e dx 
2  f  x    cos nx  i sin nx  dx 
 
  
1 i i
  f  x   cos nx dx   f  x   sin nx dx    f  x   sin nx dx
2 2 2
  

ugyanis ebben az esetben az első integrál zérus, hiszen egy páratlan és páros függvény
szorzatának, vagyis egy páratlan függvénynek origóra szimmetrikus intervallumra vonatkozó
integrálja. Ebben az esetben tehát egyrészt azt kaptuk, hogy az együttható a kapott egyszerűbb
összefüggéssel számítható, aminek közvetlen következménye, hogy az együtthatók mind
imaginárius számok. Páratlan függvény komplex Fourier-sorában tehát – a trigonometrikus
esettel ellentétben – minden tag megtalálható, de minden együttható imaginárius szám.

Ha még figyelembe vesszük, hogy a nem nulla integrál két páratlan függvény szorzatának, tehát
egy páros függvénynek origóra szimmetrikus intervallumra vonatkozó integrálja, akkor az
együttható formula az alábbi legegyszerűbb alakot ölti.

  
i 2i i
cn    f  x   sin nx dx    f  x   sin nx dx    f  x   sin nx dx
2 2 
 0 0

3.3.10. Kapcsolat a trigonometrikus és komplex Fourier-sor között


Az Euler-összefüggés kapcsolatot teremt a trigonometrikus függvények és a komplex
exponenciális függvény között. Nem meglepő tehát, ha felfedezünk kapcsolatot a trigonometrikus
Fourier-sor és a komplex Fourier-sor között. Alkalmazzuk az Euler-összefüggést a komplex
Fourier-sor két 0-indexre szimmetrikus indexű tagjára:

cneinx  cn cos nx  i  cn sin nx,


cneinx  cn cos nx  i  cn sin nx

455
Óbudai Egyetem BGK Fejezetek a matematikából

Ha ezt a két egyenletet összeadjuk, azonnal látszik, hogy a két irányban végtelen sor,
trigonometrikus függvények szerint rendezve egy hagyományos trigonometrikus függvénysorrá
alakítható, mely cosnx és sinnx szerint van rendezve. Ha a c0 konstans tagot első tagnak tekintjük,
akkor a komplex Fourier-sor az alábbi ekvivalens alakban írható.

 
 
f  x  ~ c0   cneinx  cneinx  c0     cn  cn  cos nx  i   cn  cn  sin nx 
n 1 n 1

Innen pedig következik a trigonometrikus és komplex sor együttható közötti alábbi összefüggés.

a0  c0 ; an  cn  cn ; és bn  i  cn  cn 

illetve megfordítva

a  ibn a  ibn
c0  a0 ; cn  n ; és cn  n
2 2

Ezek az összefüggések felhasználhatók arra, hogy ha ismerünk egy trigonometrikus sorfejtést,


akkor segítségükkel áttérhetünk a komplex sorra illetve fordítva, attól függően, hogy az
alkalmazások mit követelnek meg, illetve az is lehet az ok, hogy az egyik típusú együttható
formula alkalmazásával az együttható kiszámítása egyszerűbb.

3.3.12. Példa: Határozzuk meg a 3.3.9. példában szereplő függvény trigonometrikus Fourier-
sorát. A hivatkozott példában megkaptuk a komplex Fourier-sort. A komplex Fourier együtthatók
ismeretében az

a0  c0 ; an  cn  cn ; és bn  i  cn  cn 

formulák felhasználásával adódnak a trigonometrikus sor együtthatói.

sh   1
0
sh 
a0  c0  
 1  i 0  
n
sh    1  1  n sh  1  in  1  in 2sh   1
n n
an  cn  cn       1 
  1  in  1  in    1  n 2  1  n2
 
n n 1
sh    1  1  sh  1  in  1  in 2sh   1  n
n
bn  i  cn  cn   i    i  1 n
 
  1  in  1  in    1  n 2  1  n2
 

Az együtthatók ismeretében felírható a trigonometrikus Fourier-sor.

456
Óbudai Egyetem BGK Fejezetek a matematikából

n 1
sh  2sh     1  1 
n
n
f ( x) 

  
 n 1 1  n2
cos nx 
1  n2
sin nx 

 

Az ábrázolás érdekében felírjuk a sor első néhány tagját:

sh    1 1 1 2 1 3 1 4 
f ( x)  1  2   cos x  sin x  cos 2 x  sin 2 x  cos3x  sin 3x  cos 4 x  sin 4 x...  
   2 2 5 5 10 10 17 17 

A sorfejtést szemlélteti a 3.3.6. ábra.

3.3.6. ábra. A 3.3.9. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor „első kilenc” tagjával
(piros színű görbe), azaz a konstans tagot követően 4 db koszinuszos és 4 db szinuszos tag figyelembe vételével

3.3.13. Példa: Határozzuk meg a 3.3.11. példában szereplő függvény trigonometrikus Fourier-
sorát a komplex Fourier-sor együtthatóinak felhasználásával. Az előző példa megoldásához
hasonlóan járunk el.

0 1
2  1 2
a0  c0  
 4  0 1 
2
n 1
an  cn  cn 
2   1
 
 1n 1   2   1n 1   1n 1   4  1n 1
  4n 2  1 4   n  2  1    4n 2  1 4 n 2  1   4 n 2  1
   

457
Óbudai Egyetem BGK Fejezetek a matematikából

n 1  n 1  n 1 n 1 
2   1  1 2   1  1
bn  i  cn  cn   i    i   0
  4n 2  1 4   n  2  1    4n 2  1 4 n 2  1 
   

A legutóbbi eredmény a várakozásnak megfelelően azt jelenti, hogy egy páros függvény Fourier
sorában nincsenek szinuszos tagok. Mint látjuk ez természetesen a „komplex irányból
megközelítve” is adódik. A számítások eredményeire támaszkodva adódik a trigonometrikus
Fourier-sor.
n 1
2 4    1 
f ( x)     cos nx 
  n 1  4n2  1 
 

Az ábrázolás érdekében felírjuk a sor néhány tagját.

2 1 1 1 
f ( x)  1  2  cos x  cos 2 x  cos 3x  ...  
 3 15 35 

Mint már említettük, a Fourier-sor mindenütt előállítja a függvényt, tehát valóban írhatunk
egyenlőséget. A sorfejtést szemlélteti a 3.3.7. ábra.

3.3.7. ábra. A 3.3.11. példabeli f(x) függvény (kék színű görbe) közelítése a Fourier-sor első négy tagjával
(piros színű görbe), azaz a konstans tagot követően 3 db koszinuszos tag figyelembe vételével

458
Óbudai Egyetem BGK Fejezetek a matematikából

Irodalomjegyzék
Bronstejn-Szemengyajev: Matematikai zsebkönyv. Typotex. 2006.
Fagyejev-Szominszkij: Felsőfokú algebrai feladatok. Műszaki Kiadó, Budapest, 1973
Fuksz-Sabat: Komplex függvénytan. Műszaki Kiadó, 1978.
Freud Róbert: Lineáris algebra, ELTE Eötvös kiadó, 2006
Fried Ervin: Klasszikus és lineáris algebra. Tankönyvkiadó, Budapest, 1995.
Halmos Pál: Véges dimenziós vektorterek. Műszaki Kiadó. Bp. 1984.
Hajós György: Bevezetés a geometriába. Tankönyvkiadó, Budapest, 1993.
Járai Antal: Modern alkalmazott analízis. Typotex, Budapest, 2008.
Kiss Emil: Bevezetés az algebrába, Typotex Kiadó, Budapest, 2007.
Kovács – Takács - Takács: Analízis. Nemzeti Tankönyvkiadó, 2005.
Krekó Béla: Lineáris Algebra. Közgazdasági és Jogi Könyvkiadó. Budapest, 1976
Laczkovich Miklós – T. Sós Vera: Analízis I-II., Nemzeti Tankönyvkiadó, 2007.
Pontrjagin: Közönséges differenciálegyenletek. Akadémiai Kiadó. Bp. 1976.
Obádovics J. Gyula: Mátrixok és differenciálegyenlet-rendszerek. Scolar. Bp. 2005.
Obádovics J. Gyula: Lineáris algebra, Példákkal. Scolar. Bp. 2001.
Ponomarjov: Differenciálegyenletek felállítása és megoldása. Tankönyvkiadó, Bp. 1969.
Prasolov: Lineáris algebra. Typotex. Bp. 2006.
Rózsa Pál: Bevezetés a mátrixelméletbe. Typotex, Budapest, 2009.
Rózsa Pál: Lineáris algebra és alkalmazásai. Műszaki Kiadó, Budapest, 1984.
Scharnitzky viktor: Differenciálegyenletek. Műszaki Kiadó, Budapest, 2008.
Scharnitzky Viktor: Mátrixszámítás. Műszaki Kiadó, Budapest, 2008.
Scharnitzky Viktor: Matematikai feladatok, Nemzeti Tankönyvkiadó 1996
Simon Péter - Tóth János: Differenciálegyenletek. Typotex. Bp. 2006.
Stoyan Gisbert: MATLAB. Typotex. Bp. 2010.
Szász Gábor: Matematika I-II-III. Nemzeti Tankönyvkiadó, 2007.
Szász Pál: A differenciál és integrálszámítás elemei I-II. Typotex, Budapest, 2008
Thomas-féle kalkulus I-II-III: Typotex, Budapest, 2008.

459
Óbudai Egyetem BGK Fejezetek a matematikából

Tartalomjegyzék

Előszó ............................................................................................................................................... 5
1. fejezet Mátrixelmélet, Lineáris algebra ....................................................................................... 7
1. Lineáris algebra ............................................................................................................................ 9
1.1. A lineáris tér. Alapfogalmak .................................................................................................... 9
1.2. Vektorrendszerek és tulajdonságaik ........................................................................................ 13
1.3. Elemi bázistranszformáció ...................................................................................................... 20
1.4. Az elemi bázistranszformáció alkalmazásai ........................................................................... 24
1.5. Mátrixok .................................................................................................................................. 27
1.6. Műveletek mátrixokkal ........................................................................................................... 30
1.7. Kvadratikus mátrix determinánsa............................................................................................ 43
1.8. Kvadratikus mátrix inverze ..................................................................................................... 56
1.9. Lineáris egyenletrendszerek .................................................................................................... 62
1.10. Gauss elimináció, mátrixok LU-felbontása ........................................................................... 77
1.11. Mátrix sajátértéke, sajátvektora............................................................................................. 95
1.12. Kvadratikus mátrixok hatványozása ................................................................................... 114
1.13. Speciális mátrixok tulajdonságai ......................................................................................... 120
1.14. Ortogonális projekciók. Lineáris egyenletrendszer legjobban közelítő megoldása, a
legkisebb négyzetek módszere ..................................................................................................... 132
1.15. Gram-Schmidt-féle ortogonalizáció. Reguláris mátrixok QR-felbontása .......................... 142
1.16. Hasonló mátrixok. Diagonalizáció ...................................................................................... 150
1.17. Kvadratikus alakok. Pozitív definit mátrixok ..................................................................... 163
2. fejezet Differenciálegyenletek................................................................................................. 180
2.1. Elsőrendű differenciálegyenletek .......................................................................................... 182
2.1.1. Bevezető példák ................................................................................................................. 182
2.1.2. A differenciálegyenlet fogalma .......................................................................................... 183
2.1.3. Explicit közönséges elsőrendű differenciálegyenlet .......................................................... 184
2.1.4. Az y’= f(x, y) differenciálegyenlet megoldhatósága, a megoldás egyértelműsége
(egzisztencia és unicitás) .............................................................................................................. 187
2.1.5. Közvetlenül integrálható differenciálegyenletek ............................................................... 189
2.1.6. Szétválasztható változójú (szeparálható) differenciálegyenlet .......................................... 193
2.1.7. Homogén differenciálegyenlet ........................................................................................... 196
2.1.8. Elsőrendű lineáris differenciálegyenlet ............................................................................. 199
2.1.8.1. Homogén lineáris differenciálegyenlet ........................................................................... 199

460
Óbudai Egyetem BGK Fejezetek a matematikából

2.1.8.2. Inhomogén lineáris differenciálegyenlet ......................................................................... 201


2.1.8.3. Az állandó variálásának módszere .................................................................................. 202
2.1.9. A Bernoulli-féle differenciálegyenlet................................................................................. 205
2.1.10. Egzakt differenciálegyenlet .............................................................................................. 208
2.1.11. Integráló tényező .............................................................................................................. 213
2.2. Másodrendű differenciálegyenletek ...................................................................................... 218
2.2.1.Bevezető példák .................................................................................................................. 218
2.2.2. Explicit közönséges másodrendű differenciálegyenlet ...................................................... 219
2.2.3. Hiányos másodrendű differenciálegyenletek ..................................................................... 221
2.2.4. Másodrendű lineáris differenciálegyenletek ...................................................................... 229
2.2.4.1. Másodrendű homogén lineáris differenciálegyenlet ....................................................... 230
2.2.4.2. Másodrendű inhomogén lineáris differenciálegyenlet .................................................... 242
2.2.5. Másodrendű állandó együtthatójú lineáris differenciálegyenlet ........................................ 247
2.2.5.1. Másodrendű állandó együtthatójú homogén lineáris differenciálegyenlet ..................... 247
2.2.5.2. Másodrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet .................. 252
2.2.6. Rezgések elmélete .............................................................................................................. 265
2.2.6.1. Harmonikus oszcillátor ................................................................................................... 265
2.2.6.2. Csillapított harmonikus oszcillátor.................................................................................. 269
2.2.6.3. Gerjesztett és csillapított harmonikus oszcillátor ............................................................ 274
2.3. Elsőrendű lineáris differenciálegyenlet rendszerek............................................................... 281
2.3.1. Bevezető példák ................................................................................................................ 281
2.3.2. Elsőrendű lineáris differenciálegyenlet rendszer fogalma ................................................. 283
2.3.3. Elsőrendű homogén lineáris differenciálegyenlet rendszer ............................................... 287
2.3.4. Elsőrendű inhomogén lineáris differenciálegyenlet rendszer ............................................ 295
2.3.5. Elsőrendű állandó együtthatójú homogén lineáris differenciálegyenlet rendszer .............. 299
2.3.6. Elsőrendű állandó együtthatójú inhomogén lineáris differenciálegyenlet rendszer........... 327
2.3.7. n-ed rendű állandó együtthatójú lineáris differenciálegyenlet, az átviteli elv.................... 337
3. fejezet Sorelmélet .................................................................................................................... 347
3.1. Numerikus sorok ................................................................................................................... 349
3.1.1. Numerikus sorok ................................................................................................................ 349
3.1.2. Végtelen mértani sor .......................................................................................................... 351
3.1.3. A parciális törtekre bontás módszere ................................................................................. 354
3.1.4. Konvergencia kritériumok................................................................................................. 356
3.1.4.1. Pozitív tagú sorokra vonatkozó kritériumok .................................................................. 357

461
Óbudai Egyetem BGK Fejezetek a matematikából

3.1.4.2. Váltakozó előjelű sorokra vonatkozó konvergencia kritérium ....................................... 363


3.1.5. Abszolút és feltételes konvergencia ................................................................................... 367
3.2. Függvénysorok, Taylor-sorok ............................................................................................... 372
3.2.1. Függvénysorozatok általános fogalma, konvergenciája ..................................................... 372
3.2.2. Függvénysorok általános fogalma, konvergenciája ........................................................... 374
3.2.3. Hatványsorok ..................................................................................................................... 380
3.2.3. Taylor-sorok ....................................................................................................................... 386
3.2.4. A binomiális sor ................................................................................................................. 397
3.2.5. A Taylor-polinom és a Taylor-sor alkalmazásai ................................................................ 401
3.3. Fourier-sorok ......................................................................................................................... 418
3.3.1. Problémafelvetés ................................................................................................................ 418
3.3.2. Általános értelemben vett Fourier-sor ................................................................................ 421
3.3.3. Általános Fourier-sorok konvergenciája, a Fourier együtthatók szélsőérték tulajdonsága, a
Parseval-képlet ............................................................................................................................. 423
3.3.4. Trigonometrikus Fourier-sorok .......................................................................................... 425
3.3.5. Trigonometrikus Fourier-sorok formális bevezetése ......................................................... 430
3.3.6. Páros és páratlan függvények Fourier-sora ........................................................................ 438
3.3.7. Nem 2π-szerint periodikus függvények Fourier-sora......................................................... 443
3.3.8. Komplex Fourier-sor .......................................................................................................... 447
3.3.9. Páros és páratlan függvények komplex Fourier-sora ......................................................... 453
3.3.10. Kapcsolat a trigonometrikus és komplex Fourier-sor között ........................................... 455
Irodalomjegyzék ........................................................................................................................... 459

462

You might also like