Professional Documents
Culture Documents
Matematika by Bereczky Áron Gerőcs László Vancsó Ödön
Matematika by Bereczky Áron Gerőcs László Vancsó Ödön
Matematika by Bereczky Áron Gerőcs László Vancsó Ödön
Impresszum
Előszó
A kötetben használt jelölések
1. Halmazok
2. Logikai alapok
7. Ábrázoló geometria
8. Vektorok
9. Szögfüggvények
13. Számelmélet
14. Számsorozatok
22. Fraktálgeometria
23. Kombinatorika
24. Gráfok
25. Kódelmélet
26. Valószínűség-számítás
© Szerzők, 2010
© Akadémiai Kiadó, 2016
Minden jog fenntartva, beleértve a sokszorosítás, a nyilvános előadás, a rádió- és televízióadás, valamint a fordítás jogát, az
egyes fejezeteket illetően is.
Előszó
Az Akadémiai kézikönyvek sorozat Matematika című kötetét tartja kezében az olvasó. Bár kétségtelen, hogy több, jól
használható matematikai kézikönyv is található a könyvpiacon, a kiadó mégis úgy gondolta, hogy a sorozatból nem
maradhat ki éppen a matematika. Egy olyan matematikai ismereteket tartalmazó kötet, amely a XXI. század kihívásainak
megfelelően a hagyományos alapismeretek mellett a kor néhány újabb matematikai területét is tárgyalja, és ezek alapvető
fogalmaival igyekszik megismertetni az érdeklődőket. Ennek megfelelően a kötetben a hagyományosan tanultak (a
felsőoktatási intézmények BSc fokozatáig bezárólag): a legfontosabb fogalmak, tételek, eljárások és módszerek kapják a
hangsúlyosabb szerepet, de mindezek mellett igyekeztünk olyan (már inkább az MSc fokozatba tartozó) ismereteket is
érinteni, melyek nagyobb rálátást, mélyebb betekintést kínálnak a kötet olvasóinak. Fontosnak tartottuk azt is, hogy a
kötetbe bekerüljenek középiskolai szinten is azok a témakörök, melyek az új típusú érettségi követelményrendszerben is
megjelentek (például a statisztika vagy a gráfelmélet). Mindezek mellett – bár érintőlegesen – a matematikai kutatások
néhány újabb területét (kódoláselmélet, fraktálelmélet stb.) is bemutatjuk.
Könyvünk 27 fejezetből áll. Az első fejezetekben az elemi számolási fogalmak és szabályok szerepelnek, majd a
továbbiak elsősorban a középiskolai tananyagban előforduló legfontosabb területeket tárgyalják. A kötet második felében
találjuk a felsőoktatási tematikáknak megfelelő témákat tárgyaló fejezeteket. Ez alól kivétel a 23., 24., 26. és 27. fejezet, ahol
a középiskolai és a felsőoktatási anyag egy egységben szerepel. Az egyes fejezetekben levő fogalmakat gyakran
magyarázattal is elláttuk. Sok esetben a fontosnak tartott tételek bizonyítását is megadtuk, hol csak vázlatosan, hol teljes
részletességgel.
Mivel néhány felsőoktatási intézményben alapvetően fontos témakör az ábrázoló geometria, és a jelenleg forgalomban
levő matematikai kézikönyvek általában nem vagy csak nagyon érintőlegesen tárgyalják, ezt a témakört kicsit
részletesebben kifejtjük. Ezzel elsősorban a műszaki jellegű felsőoktatási intézményekben tanulóknak szeretnénk
segítséget nyújtani.
Az egyes fejezeteken belül részletesen kidolgozott mintapéldák vannak a tárgyalt elméleti anyag alkalmazására,
melyek áttanulmányozása nagyban hozzájárulhat az elméleti problémák mélyebb megértéséhez.
Kötetünknek több szerzője van. Ennek megfelelően a stílus, a szövegformálás (ami nyilván szubjektív elemeket is
hordoz) az egyes fejezeteket illetően eltérő lehet. Mindez azonban, reményeink szerint, nem megy az élvezhetőség és a
megértés rovására.
Reméljük, hogy egy olyan könyv kerül az olvasó kezébe – legyen általános vagy középiskolás diák, egyetemi hallgató
vagy az idősebb generációhoz tartozó, de a tárgyat valaha komolyabban tanuló és értő felnőtt –, mely kellő eligazodást
nyújt számára, akár egy számonkérésre való felkészüléshez, akár régen tanult, de valamelyest elfelejtett ismeretek
felelevenítéséhez. Így akár érettségire készüléshez, akár egyetemi vizsgához is hasznos segédeszköz lehet. Az áttekintést
segíti, hogy minden de níciót szürke tónusú kiemeléssel jeleztünk, minden tétel keretbe került, a példákat pedig más
betűméret jelzi. A legfontosabb jelölések jegyzéke és egy tárgymutató is könnyíti a keresést és eligazodást ebben az
egyébként igen vaskosra sikerült kötetben. A könyv a szokásos kézikönyveknél kissé részletesebben fejti ki az egyes témák
matematikai tartalmát, és főleg a sok példával az alkalmazásokat támogatja, ami a mai matematikaoktatás egyik fontos,
korábban kissé elhanyagolt területe.
Ø üres halmaz
Ā komplementer halmaz
⊂ részhalmaz (valódi)
⊆ részhalmaz
∈ eleme
∉ nem eleme
= egyenlő
≠ nem egyenlő
≥ nagyobb-egyenlő
> nagyobb
≤ kisebb-egyenlő
< kisebb
≈ közelítőleg egyenlő
∞ végtelen
% százalék
am hatvány
négyzetgyök
n-edik gyök
ln e-alapú logaritmus
2 × 2-es mátrix
2 × 2-es determináns
a1 + a2 + a3+… + an
a1 · a2 · a3 · … · an
Geometria, vektorok
┴ merőleges
║ párhuzamos
Δ háromszög
≈ hasonló
≅ egybevágó
∠ szög
° fok
AB A, B szakasz
az AB szakasz hossza
π pi(≈ 3,1415…)
tg α tangens alfa
a, b vektormennyiségek
a0 a irányú egységvektor
∇ nabla operátor
Laplace-operátor
Fraktálok
d[a,b] a és b távolsága
s boxdimenzió
n! n faktoriális
n alatt a k
Ω eseménytér
P valószínűség
ξ, η valószínűségi változók
átmenetvalószínűségek mátrixa
Algebra, kódelmélet
AT mátrix transzponáltja
En egységmátrix
G/N faktorcsoport
R/I faktorgyűrű
W┴ merőleges altér
T|F testbővítés
φ(n) Euler-függvény
μ(n) Möbius-függvény
≡ kongruenciareláció
ā kongruenciaosztály
Legendre-szimbólum
d(x, y) Hamming-távolság
C┴ duális kód
S(y) szindrómavektor
Ham(r, q) Hamming-kód
A, α alfa
B, β béta
Γ, γ gamma
Δ, δ delta
E, ϵ epszilon
Z, ζ zéta
H, η éta
Θ, θ théta
I, ı ióta
K, κ kappa
Λ, λ lambda
M, μ mű
N, ν nű
Ξ, ξ kszi
O, o omikron
Π, π pi
P, ρ rhó
∑, σ szigma
T, τ tau
Y, υ üpszilon
Φ, φ
X, χ khi
Ψ, ψ pszi
Ω, ω ómega
1. Halmazok
1.1. Alapfogalmak
1.2. Műveletek halmazokkal
1.3. A természetes számok halmaza, oszthatóság, számelmélet
1.4. További számhalmazok, halmazok számossága
1.1. Alapfogalmak
A valamilyen szempontból azonos tulajdonsággal rendelkező dolgok összességét halmaznak mondjuk. A halmaz fogalmát
nem de niáljuk, a halmaz és a halmazhoz való tartozás fogalmakat a szemléletből fogadjuk el. Ha egy dolog valamely
halmazhoz tartozik, azt mondjuk, hogy eleme a halmaznak. Egy halmazt akkor tekintünk adottnak, ha minden dologról
egyértelműen eldönthető, hogy eleme (vagy nem eleme) ennek a halmaznak. Pl. „Magyarország templomai”-ból halmazt
alkothatunk, mert minden dologról egyértelműen eldönthető, hogy magyarországi templom vagy sem. De a „magas úk”-
ból nem alkothatunk halmazt, mert nem dönthető el egyértelműen, hogy „valami” magas ú vagy sem. A halmazokat
általában az ábécé nagybetűivel, a halmaz elemeit pedig az ábécé kisbetűivel jelöljük. Ha a eleme az A halmaznak, akkor azt
így jelöljük: a ∈ A, ha a nem eleme az A halmaznak, akkor: a ∉ A. A halmazokat általában kapcsos zárójelben, vagy az egyes
elemeket vesszővel elválasztva, vagy a halmaz elemeinek közös tulajdonságát leírva adjuk meg. A halmazokat szokásos
különböző zárt görbékkel szemléltetni. Az ilyen szemléltetést Venn-diagramnak nevezzük.
1.1. ábra
Példák
Hány eleműek az alábbi halmazok?
A: = {a, b, c, d, e},
B: = {Az egyjegyű, pozitív páros számok halmaza},
C: = {A 0 ≤ x ≤ 1 valós számok halmaza},
D: = {A–12-nél kisebb pozitív egész számok halmaza} stb.
Az olyan halmazt, melynek egyetlen eleme sincs, üres halmaznak nevezzük; jele: Ø. Ha egy halmaz elemeinek a száma
véges, véges halmaznak mondjuk, ha a halmaz elemeinek a száma végtelen, végtelen halmaznak nevezzük.
A fenti példákban az A és B halmazok véges halmazok, a C halmaz végtelen halmaz, míg a D halmaz üres halmaz.
Két halmazt egyenlőnek mondunk, ha ugyanazok az elemei. Ha A és B egyenlő halmazok, akkor azt így jelöljük: A = B.
Egy A halmaz a B halmaznak részhalmaza, ha az A halmaz minden eleme eleme a B halmaznak is, vagy másként
fogalmazva, ha A-nak nincs olyan eleme, mely a B-nek ne lenne eleme. E részhalmazviszonyt így jelöljük: A ⊆ B.
Az A halmazt a B halmaz valódi részhalmazának mondjuk, ha A részhalmaza B-nek, de az A halmaz nem azonos a B
halmazzal. Ennek jele: A ⊂ B.
Példák
1. Legyenek az A és B halmazok a következők:
A: = {A pozitív páros számok halmaza},
B: = {A pozitív, 4-gyel osztható számok halmaza}.
Ekkor nyilván B ⊂ A.
2. Legyen az A halmaz egy adott osztály tanulóinak a halmaza, a B halmaz ezen osztály lánytanulóinak a halmaza, C
halmaz pedig az osztály Katalin keresztnevű tanulóinak a halmaza. Ekkor nyilván C ⊆ B ⊆ A. (Természetesen
előfordulhat ebben az esetben, hogy C az üres halmaz.)
3. Legyen A : = {x | 1 ≤ x ≤ 6}, B : = {x | 2 ≤ x ≤ 5}! Ekkor B ⊂ A.
4. Írjuk fel egy 4 elemű halmaz összes részhalmazát. Legyen A : = {1, 2, 3, 4}. Az A halmaz részhalmazai:
{Ø}, {1}, {2}, {3}, {4}, {1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}, {1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4}, {1, 2, 3, 4}.
Tehát az A halmaznak 16 részhalmaza van.
2 elemű részhalmaza db van, hiszen az n elemből ennyiféleképpen lehet kiválasztani (a kiválasztás sorrendjére
való tekintet nélkül) 2 db-ot.
nbsb
Ha a H halmaznak az A halmaz egy részhalmaza, akkor a H halmaz azon elemeinek a halmazát, melyek A-nak nem
elemei, az A halmaznak H-ra vonatkozó komplementer halmazának mondjuk. Ilyenkor a H halmazt alaphalmaznak
nevezzük. Az A halmaz komplementerét Ā-sal jelöljük.
1.2. ábra
Ha például az A halmaz a pozitív egész számok halmaza, a B halmaz pedig a pozitív páros számok halmaza, akkor a B̄
halmaz (vagyis a B halmaz A halmazra vonatkozó komplementere) a pozitív páratlan számok halmaza. Nyilván A̿ = A.
Két halmaz uniója (egyesítése): Az A és B halmaz uniója olyan halmaz, melynek elemei vagy az A, vagy pedig a B
halmazba beletartoztak. Az unió jele: A ⋂ B.
Két halmaz metszete (közös része): Az A és B halmazok metszete olyan halmaz, melynek elemei az A halmazba is és
a B halmazba is beletartoznak. A metszet jele: A ⋃ B.
1.3. ábra
Hasonlóan értelmezhetjük 2-nél több (de véges sok) halmaz metszetét és unióját is.
Ha A és B két halmaz, továbbá Ø az üres halmaz, akkor igazak az alábbi halmazegyenlőségek:
1.4. ábra
Két halmaz különbsége. Az A és B halmazok különbsége olyan halmaz, melynek elemei az A halmazba beletartoznak,
de a B halmazba nem. A különbséghalmaz jele: A \ B.
1.5. ábra
Míg két halmaz uniója és a metszete kommutatív művelet, két halmaz különbsége már nem az: A\B≠B\A.
Igazak az alábbi azonosságok:
E meghatározásból következik, hogy a direkt szorzat nem kommutatív. Könnyen megmutatható, hogy e művelet nem
is asszociatív.
Példák
1. Egy sport tagozatos osztályban – ahol mindenki sportol – atletizálnak, birkóznak és cselgáncsoznak a tanulók.
Négy olyan diák van, aki mindhárom sportot űzi. Akik pontosan 2 sportot űznek, 13-mal kevesebben vannak,
mint azok, akik pontosan egy sportot űznek. Akik csak birkóznak, háromszor annyian vannak, mint akik csak
atletizálnak, és harmadannyian vannak, mint akik csak cselgáncsoznak. Melyik állítás lehet igaz?
a) Osztálylétszám: 40 fő,
b) osztálylétszám: 41 fő,
c) osztálylétszám: 42 fő,
d) osztálylétszám: 43 fő,
e) osztálylétszám: 44 fő.
Készítsünk halmazábrát a feladat szövege alapján!
1.6. ábra
1.7. ábra
Legyen a, b ∈ N. Azt mondjuk, hogy az a szám osztható b-vel, ha létezik olyan c ∈ N, melyre a = b · c. Ilyenkor a b
számot az a szám osztójának, az a számot a b szám többszörösének nevezzük, mindezt így jelöljük: b | a.
Tehát egy természetes szám osztói azok a természetes számok, amelyek maradék nélkül megvannak benne. Nyilván
minden szám osztható 1-gyel és önmagával, ezért e két osztót a kérdéses szám nem valódi osztóinak mondjuk, míg e két
osztón kívül a többi osztót valódi osztónak nevezzük.
Fontosak az alábbi oszthatósági szabályok.
2-vel a páros számok (és csak ezek) oszthatók (vagyis azok a számok, amelyek utolsó számjegye páros).
Például: 3874, 29 016, 10 203 040 oszthatók 2-vel, de 5431, 37 567, 20 067 nem oszthatók 2-vel.
3-mal azok és csak azok a számok oszthatók, melyek számjegyeinek összege is osztható 3-mal.
Például: 34 581 osztható 3-mal, mert 3 + 4 + 5 + 8+1 = 21 osztható 3-mal, de 2896 nem osztható 3-mal, mert 2 + 8 + 9 + 6 =
25 nem osztható 3-mal.
4-gyel azok és csak azok a számok oszthatók, melyek utolsó két jegyéből alkotott kétjegyű szám osztható 4-gyel.
Például: 125 060 osztható 4-gyel, mert 60 osztható 4-gyel, de 3986 nem osztható 4-gyel, mert 86 nem osztható 4-gyel.
5-tel azok és csak azok a számok oszthatók, melyek 5-re vagy 0-ra végződnek.
6-tal azok és csak azok a számok oszthatók, melyek 2-vel is és 3-mal is oszthatók.
Például: 2988 osztható 6-tal, mert páros, és 2 + 9 + 8 + 8 = 27 osztható 3-mal, de 5860 nem osztható 6-tal, mert ugyan
páros, de 5 + 8 + 6 + 0 = 19 3-mal nem osztható.
7-tel azok és csak azok a számok oszthatók, melyek számjegyeit (hátulról kezdve) hármasával csoportosítva, majd az így
nyert csoportokat váltakozó előjellel összeadva, a kapott eredmény (vagy annak abszolút értéke) osztható 7-tel.
Például: 12 348 567 osztható 7-tel, mert 567 – 348 + 12 = 231 = 210 + 21 osztható 7-tel.
8-cal azok és csak azok a számok oszthatók, melyek utolsó három jegyéből alkotott háromjegyű szám osztható 8-cal.
Például: 12 880 osztható 8-cal, mert 880 osztható 8-cal, de 3454 nem osztható 8-cal, mert 454 nem osztható 8-cal.
9-cel azok és csak azok a számok oszthatók, melyek számjegyeinek összege is osztható 9-cel.
Például: 45 729 osztható 9-cel, mert 4 + 5 + 7 + 2 + 9 = 27 osztható 9-cel, de 32 892 nem osztható 9-cel, mert 3 + 2 + 8 + 9 +
2 = 24 nem osztható 9-cel.
10-zel azok és csak azok a számok oszthatók, melyek utolsó számjegye 0.
11-gyel azok és csak azok a számok oszthatók, melyeknél a páratlan helyen álló számjegyek összegének és a páros helyen
álló számjegyek összegének különbsége osztható 11-gyel.
Például: 7 381 968 osztható 11-gyel, mert 7 + 8 + 9 + 8 = 32, 3 + 1 + 6 = 10 és 32 – 10 = 22 osztható 11-gyel, de 6459 nem
osztható 11-gyel, mert 6 + 5 = 11, 9 + 4 = 13, és 13 – 11 = 2 nem osztható 11-gyel.
Prímszámnak nevezzük azokat az 1-nél nagyobb egész számokat, melyek csak 1-gyel és önmagukkal oszthatók. (Az 1
nem prímszám.)
Tehát azok a számok a prímszámok, melyeknek nincs valódi osztójuk, vagy másképpen fogalmazva pontosan két
osztójuk van. Azokat az 1-nél nagyobb pozitív egészeket, melyek nem prímszámok, összetett számnak nevezzük.
Az első néhány prímszám:
Vajon hogyan dönthető el egy aránylag nagyobb természetes számról, hogy prímszám vagy összetett szám? Erre az
alábbi módszer igen jól alkalmazható:
Ezek szerint, ha egy N természetes számról el akarjuk dönteni, hogy prímszám vagy sem, elegendő
prímosztót keresni, s ha addig nem találunk prímosztót, akkor N biztosan prímszám.
Példa. Vizsgáljuk meg ebből a szempontból az N = 1999 számot. Mivel ezért elegendő az 1999-nek 43-
nál kisebb prímosztóját keresni. A 43-nál nem nagyobb prímek:
s – amint az könnyen ellenőrizhető – az 1999 ezek egyikével sem osztható, ezért az 1999 biztosan prímszám.
Minden összetett szám egyértelműen felbontható prímszámok szorzatára (a tényezők sorrendjére való tekintet
nélkül).
Ez tehát azt jelenti, hogy egy összetett számot bárhogyan is kezdünk több tényezős szorzatra bontani, ha az eljárást
addig folytatjuk, amíg az egyes tényezők már mind prímszámok, akkor a végeredményben kapott szorzat (a tényezők
sorrendjétől eltekintve) mindig ugyanaz lesz.
Bár a prímszámokról tudjuk, hogy végtelen sokan vannak, az ikerprímekkel kapcsolatban még nincs eredmény arról,
hogy ezek száma véges vagy végtelen.
Az első néhány ikerprímpár:
Megjegyzés. Látjuk, hogy két szomszédos prímszám között „kicsi“ különbségek is lehetnek. A legkisebb különbség 1,
a 2 és a 3 között. Az ikerprímek között a különbség 2. Ugyanakkor az is igaz, hogy két szomszédos prímszám között
„akármilyen nagy“ különbségek is lehetnek. Ha N egy tetszőleges természetes szám, akkor megadható N db egymás
utáni szomszédos természetes szám úgy, hogy mindegyikük összetett szám, vagyis egyetlen prímszám sincs
közöttük. Tekintsük ugyanis az alábbi N db egymást követő szomszédos egész számot:
Az első 2-vel, a második 3-mal, a harmadik 4-gyel stb., az utolsó előtti N-nel, az utolsó pedig N + 1-gyel osztható,
vagyis mindegyik összetett szám. Így valóban két szomszédos prímszám között akármilyen nagy különbségek is
lehetnek.
Két vagy több szám legnagyobb közös osztója az a szám, mely a vizsgált számok mindegyikének osztója (tehát e
számoknak közös osztója), s az ilyen közös osztók közül a legnagyobb.
Az a és b természetes számok legnagyobb közös osztóját gömbölyű zárójellel jelöljük: (a; b).
Két vagy több szám legnagyobb közös osztóját úgy kapjuk, hogy a számokat prímtényezők szorzatára bontjuk, majd a
közös prímtényezőket az előforduló legkisebb hatványkitevőn összeszorozzuk.
Mivel a közös prímtényezők: 2, 3, 5, így ezek előforduló legkisebb kitevőn vett szorzata: 30. Tehát 2460 és 5430
legnagyobb közös osztója: (2460; 5430) = 30.
Két számot relatív prímnek mondunk, ha nincs közös valódi osztójuk, vagyis ha a legnagyobb közös osztójuk 1.
nbsb
A relatív prímszámokkal kapcsolatosak az alábbi oszthatósági szabályok:
- ha n osztója ab-nek, és (n; a) = 1, akkor n osztója b-nek;
- ha a osztója n-nek és b is osztója n-nek, továbbá (a; b) = 1, akkor ab is osztója n-nek.
Két szám legnagyobb közös osztóját könnyen meghatározhatjuk az euklideszi algoritmus segítségével is. Ennek
lényege a következő. A nagyobbik számot elosztjuk a kisebbikkel. Ha megvan benne maradék nélkül, akkor nyilván a
kisebb szám a legnagyobb közös osztó. Ha a maradék m, akkor az előbbi osztót elosztjuk m-mel. Ha ennek az osztásnak a
maradéka m1, akkor az utolsó osztás osztóját elosztjuk m1-gyel. Az eljárást egészen addig folytatjuk, amíg maradékul 0-t
kapunk. Az ezen eljárás végén az utolsó osztó (azaz az utolsó még nem 0 maradék) lesz a két szám legnagyobb közös osztója.
Két (vagy több) szám közös többszörösének nevezzük az olyan számot, mely minden vizsgált számnak többszöröse,
azaz melyben minden vizsgált szám megvan maradék nélkül. Nyilván két (vagy több) számnak végtelen sok közös
többszöröse van, hiszen a vizsgált számok szorzata nyilván közös többszörös, s így e szorzat minden többszöröse is közös
többszörös. Érdemes vizsgálni a közös többszörösök közül a legkisebbet.
Két vagy több szám legkisebb közös többszöröse az a szám, mely mindegyik számnak többszöröse, s az ilyen
többszörösök közül a legkisebb.
Az a és b természetes számok legkisebb közös többszörösét szögletes zárójellel jelöljük: [a; b].
Két vagy több szám legkisebb közös többszörösét úgy kapjuk meg, hogy a kérdéses számokat prímtényezőkre bontjuk,
s az egyes számokban előforduló valamennyi prímszámot az előforduló legnagyobb hatványkitevőn összeszorozzuk.
Ezek szerint tehát a legkisebb közös többszörös képzésénél – ellentétben a legnagyobb közös osztóval – nemcsak a közös
prímeket, hanem az előforduló valamennyi prímet gyelembe kell venni.
Az összes előforduló prímek: 2, 5, 17, 23. Ezek legnagyobb előforduló kitevőn vett szorzata:
Megjegyzés. A természetes számok prímtényezős felbontása sok egyéb kérdés megválaszolására is jól alkalmazható.
Ilyen például annak eldöntése, hogy egy természetes számnak hány db osztója van.
Legyen például N = 3500! E szám prímtényezős alakja: 3500 = 22 · 53 · 7. Ezek szerint 3500 osztóinak a száma: (2 + 1)(3 +
1) (1 + 1) = 24.
Legyen most valamely természetes szám prímtényezős felbontása:
Azt látjuk tehát, hogy a négyzetszámok prímtényezős felbontásában minden hatványkitevő páros, és nyilván e
tulajdonság csak a négyzetszámokra igaz. (Hasonló megfontolásból arra a következtetésre jutunk, hogy minden
köbszám prímtényezős alakjában minden prím hatványkitevője 3-mal osztható, s általában, ha valamely
természetes szám n-edik hatvány, akkor a prímtényezős felbontásában minden hatványkitevő osztható n-nel.)
Nézzük most meg a négyzetszám osztóinak a számát:
Mivel e szorzat minden tényezője páratlan, ezért a négyzetszámoknak (és csakis a négyzetszámoknak) páratlan
számú osztójuk van. A négyzetszámokról mondottakból az is következik, hogy ha egy p prímszám osztója egy
négyzetszámnak, akkor p2 is osztója kell, hogy legyen.
Egyéb módon is eldönthető sok esetben egy természetes szám négyzetszám volta. Vizsgáljuk meg, hogy a természetes
számok négyzetének utolsó számjegyei milyen számok lehetnek!
n n2
…1 …1
…2 …4
…3 …9
…4 …6
…5 …5
…6 …6
…7 …9
…8 …4
…9 …1
…0 …0
A táblázatból kiolvasható, hogy egy természetes szám négyzetének utolsó számjegye nem lehet 2, 3, 7 vagy 8.
Ugyancsak a prímtényezős felbontás segítségével állapíthatjuk meg egy természetes szám osztóinak az összegét. Ha
valamely N természetes szám prímtényezős felbontása:
Az elmúlt évezredek kutatásai során számtalan sok érdekes tulajdonsággal rendelkező természetes szám került elő.
Ilyenek például a tökéletes számok és a barátságos számok.
Egy számot tökéletes számnak nevezünk, ha egyenlő a nála kisebb osztóinak az öszszegével.
Az első 4 tökéletes szám: 6, 28, 496, 8128. Ezeket már az ókorban is ismerték. Az ötödik tökéletes számot J. M.
Regiomontanus fedezte fel a XVI. században; az ötödik tökéletes szám: 33 550 336. Eukleidész (Kr. e. 300 körül)
kimutatta, hogy ha valamely p prímszámra pk+1 – 1 ugyancsak prímszám, akkor pk(pk+1 – 1) biztosan tökéletes szám.
Leonard Euler (1707–1783) svájci származású matematikus bebizonyította, hogy Eukleidész állításának megfordítása
is igaz, vagyis minden páros tökéletes szám a fenti alakú, ahol pk+1 – 1 prímszám. Páratlan tökéletes számot még nem
sikerült találni, ami nem mond ellent annak, hogy végtelen sok létezzen.
A ma ismert legnagyobb tökéletes szám: 230402456 · (230402457 – 1). (2005. októberi adat.)
Két természetes számot barátságos számoknak mondunk, ha az egyik nála kisebb osztóinak összege egyenlő a
másikkal és fordítva.
A kapott kéttagú összeg első tagja osztható 8-cal, hiszen k és k + 1 két szomszédos egész szám, így valamelyik
biztosan páros. Tehát a kérdéses páratlan szám négyzete 8-cal osztva valóban 1-et ad maradékul.
2. Jelöljük d(N)-nel az N természetes szám osztóinak a számát! Bizonyítsuk be, hogy ha valamely N természetes
számra d(d(N)) = 3, akkor N nem osztható 30-cal!
Ha d(d(N)) = 3, akkor d(N) prímtényezős alakja d(N) = p2. Ez azt jelenti, hogy N prímtényezős alakja N = qp2-1 vagy
N = q1p-1·q2p-1, ahol q, q1 és q2 prímszámok és q1≠q2. Ezek szerint ha d(d(N)) = 3, akkor N prímtényezős
felbontásában legfeljebb két különböző prímszám szerepelhet csak. Mivel 30 = 2 · 3 · 5, vagyis 30 prímtényezős
felbontásában három különböző prím szerepel, így valóban, ha d(d(N)) = 3, akkor N nem lehet 30-cal osztható.
3. Igazoljuk, hogy 5 db egymást követő egész szám négyzetének összege nem lehet négyzetszám! Legyen az 5 egymás
utáni pozitív egész szám közül a középső n. Ekkor azt kell belátnunk, hogy nincs olyan pozitív egész k, amelyre
Ez utóbbi egyenlőség akkor és csak akkor teljesül, ha n2 + 2 osztható 5-tel, azaz utolsó számjegye 0 vagy 5. Ez
viszont azt jelentené, hogy n2 utolsó jegye 8 vagy 3. De tudjuk, hogy négyzetszám nem végződhet sem 3-ra, sem 8-
ra, így n2 + 2 nem lehet 5-tel osztható, így valóban: öt egymást követő természetes szám négyzetének összege nem
lehet négyzetszám.
A természetes számok vizsgálata során számtalan állítást, tételt fogalmazhatunk meg. Közülük soknak a
bizonyításánál használhatjuk a teljes indukciós bizonyítási eljárást. Ennek lényege a következő:
1. A bizonyítandó állítást először ellenőrizzük néhány kezdő pozitív egészre: n = 1-re, n = 2-re.
2. Feltételezzük, hogy k egy olyan természetes szám, melyre igaz az állítás (tudjuk, hogy ilyen k szám létezik, hiszen 1.-ben ezt
ellenőriztük).
3. Megmutatjuk, hogy ha k-ra igaz az állítás, akkor a rákövetkező természetes számra, k + 1-re is igaz.
Ekkor a kérdéses állítás minden természetes számra igaz.
Példák
1. Igazoljuk az első n db pozitív egész szám köbének összegéről szóló alábbi egyenlőséget:
Most ezt felhasználva igazoljuk, hogy e tulajdonság öröklődik k + 1-re, vagyis igazoljuk, hogy
A bal oldali első k db tag helyébe beírhatjuk az előző egyenlőséget (az ún. indukciós feltevést). Azt kapjuk:
A kapott öttagú összeg első három tagja – feltevésünk szerint – osztható 64-gyel, így már csak azt kell belátnunk,
hogy 8 · 32k+1 + 40 osztható 64-gyel. Ez utóbbi állítás igazolásához alkalmazzuk újra a teljes indukció módszerét!
k = 1-re igaz az állítás, hiszen 8 · 27 + 40 = 256 = 256 = 4 · 64. Legyen r egy olyan természetes szám, melyre 8 · 32r+1 +
40 osztható 64-gyel, és ezt felhasználva vizsgáljuk meg, vajon 8 · 32(r+1) + 1 + 40 osztható-e 64-gyel.
A kapott háromtagú összeg első két tagja – indukciós feltevésünk miatt – osztható 64-gyel, az utolsó tag pedig
nyilván 64-nek többszöröse. Ezzel az eredeti állítás bizonyítását elvégeztük.
Az osztásra nézve a Z halmaz már nem zárt: ha a és b ∈ Z, akkor a : b már nem biztos, hogy eleme a Z halmaznak. Az új,
alakú számok a törtszámok. Legyenek a, b, c és d pozitív egész számok és b ≠ 0, d ≠ 0. Ekkor az törtek akkor
és csak akkor egyenlők, ha ad = bc.
Az alakú számokat, ahol a és b ∈ Z és b ≠ 0 racionális számoknak nevezzük. A racionális számok tehát olyan
számok, melyek felírhatók két egész szám hányadosaként.
számok is a Q halmaz elemei. Mondhatjuk tehát, hogy a Q halmaz a négy alapműveletre nézve zárt halmaz.
Mivel a 0 · x = a (a ≠ 0) egyenletnek nincs megoldása, hiszen 0 · x minden x-re 0, ezért az hányadosnak nincs
értelme. (A 0 · x = 0 egyenletnek minden Q-beli elem megoldása lenne, vagyis nem lenne egyértelmű.) Mivel így a 0 · x = a
egyenletnek vagy nincs megoldása, vagy minden x ∈ Q megoldása, ezért a Q halmazon a 0-val való osztást nem
értelmezzük.
A négyzetgyökvonás a Q halmazon nem mindig végezhető el. Ha p ∈ Q, akkor nem biztos, hogy eleme a Q
halmaznak. Ez tehát azt jelenti, hogy ha egy szám felírható két egész szám hányadosaként, a négyzetgyöke nem biztos,
hogy felírható két egész szám hányadosaként.
Azokat a számokat, melyek nem írhatók fel két egész szám hányadosaként, irracionális számoknak nevezzük.
A bizonyítást indirekt úton végezzük. Tegyük fel – az állítással ellentétben –, hogy felírható két egész szám
(Ha p és q nem relatív prímek, akkor a törtet addig egyszerűsítjük, míg azok lesznek.)
Ekkor 2q2 = p2, ami azt jelenti, hogy p2, azaz p is páros szám: p = 2k. Ezzel
Ez utóbbi egyenlőség viszont azt jelenti, hogy q2, azaz q is páros szám. Ha tehát felírható két relatív prím egész
szám hányadosaként, akkor mindkét szám páros. Ez nyilvánvaló ellentmondás, amit csak úgy oldhatunk fel, hogy
kiindulási feltételezésünk helytelen volt, vagyis valóban irracionális.
Általában ha n egy természetes szám, akkor vagy egész szám, vagy irracionális szám. Ha n négyzetszám: n =
k2 valamilyen k pozitív egész számra, akkor nyilván egész szám. Ha viszont n nem négyzetszám; n ≠ k2, akkor
irracionális szám.
Mivel minden természetes szám egész szám, és minden egész szám racionális, ezért az N, Z és Q halmazok
részhalmazviszonyban vannak egymással. De a Q és Q* halmazok diszjunkt halmazok (azaz a metszetük az üres halmaz),
így a fent vázolt halmazokat az alábbi módon szemléltethetjük:
1.8. ábra
A racionális és irracionális számok halmazának unióját a valós számok halmazának mondjuk, és R-rel jelöljük: R = Q ∪
Q*.
Gyakran használjuk a valós számok halmaza elemeinek tizedes tört alakját. Ha valamely valós szám tizedes tört alakja
véges vagy végtelen szakaszos, akkor a kérdéses valós szám biztosan felírható két egész szám hányadosaként, tehát az ilyen
szám biztosan racionális szám. Ha a valós szám tizedes tört alakja végtelen, nem szakaszos tizedes tört, akkor a kérdéses
valós szám nem írható fel két egész szám hányadosaként, azaz irracionális szám.
A valós számok halmazának elemei, valamint a számegyenes pontjai között kölcsönösen egyértelmű megfeleltetést
hozhatunk létre, így a valós számokat a számegyenesen szemléltethetjük.
1.9. ábra
1.10. ábra
Egy halmaz elemeinek a számát a halmaz számosságával jellemzünk. Ha az A halmaz véges, n elemű halmaz, akkor
számossága: n, vagyis az elemeinek a száma.
Ha két halmaz elemei között kölcsönösen egyértelmű megfeleltetés létesíthető, akkor azt mondjuk, hogy e két halmaz
számossága egyenlő.
Példaként nézzük a pozitív egész számok halmazát (N+), és legyen P a pozitív páros számok halmaza. Minden N+-beli n
elemhez hozzárendelhetjük a P-beli 2n elemet. Ekkor bármely N+-beli elemnek lesz megfelelője P-ben, és bármely P-beli
elemnek lesz megfelelője N+-ban, továbbá N+ két különböző elemének P-ben is két különböző elem felel meg és fordítva.
Ezek szerint N+ és P elemei között egy kölcsönösen egyértelmű megfeleltetést hoztunk létre, így az N+ és a P halmazok
számossága megegyezik.
Sok esetben járhatunk el hasonlóképpen, és így sok végtelen halmaz elemei és N+ elemei között létrehozhatunk
kölcsönösen egyértelmű megfeleltetést.
E tétel tehát azt mondja ki, hogy a Q+ halmaz számossága megegyezik N+ számosságával, azaz e két halmaz elemei
között létesíthető kölcsönösen egyértelmű megfeleltetés.
Azt kell megmutatnunk, hogy az alakban felírt pozitív racionális számok és az n pozitív egész számok között
létesíthető kölcsönösen egyértelmű hozzárendelés.
Tekintsük az alábbi végtelen számtáblázatot, mely nyilván tartalmazza az összes pozitív racionális számot. Pl. a
az 5. sorban a 4. helyen van, s általában az racionális szám a k-adik sorban az n-edik helyen található.
Írjuk le a táblázatban levő egyes törteket a nyilakkal jelölt vonalak mentén haladva. Ekkor az alábbi számsorozatot
kapjuk:
Számítsuk ki, hogy pl. a racionális szám e sorozatnak hányadik tagja! Könnyen észrevehetjük, hogy a
táblázatban egy-egy ferde vonal mentén található számokban a számláló és a nevező összege állandó: az n-edik ferde
vonal mentén ez az összeg éppen n + 2. Mivel 77 + 3 = 80, ezért a tört a 78. ferde sorban foglal helyet. A 78. ferde
vonalat megelőző ferde vonalakon levő racionális számok száma:
Mivel a 78. ferde vonalon az első racionális szám , a második racionális szám , a harmadik , így a
kérdéses racionális szám, a fenti számsorozatnak a 3084. tagja. Teljesen hasonló gondolatmenettel
kiszámolható, hogy a számsorozatnak melyik racionális szám lesz az n-edik tagja.
A most bemutatott eljárásból látható, hogy a pozitív egész számok halmazának elemei és a pozitív racionális számok
halmazának elemei között valóban létesíthető kölcsönösen egyértelmű hozzárendelés, így a racionális számok halmaza
valóban megszámlálható számosságú. Ugyanakkor kimutatható, hogy a valós számok halmaza és a pozitív egész számok
halmaza között nem létesíthető kölcsönösen egyértelmű hozzárendelés, így a valós számok halmaza már nem
megszámlálható (más néven kontinuum) sokaságú halmaz.
Ennek igazolásához elegendő megmutatnunk, hogy a]0; 1[intervallumban levő valós számokat nem lehet sorba
rendezni, azaz e számhalmaz elemei és a természetes számok halmazának elemei között nem létesíthető kölcsönösen
egyértelmű megfeleltetés.
Tegyük fel – indirekt –, hogy létezik egy ilyen kölcsönösen egyértelmű hozzárendelés, és legyen ez a következő:
Ha a]0; 1[intervallumban levő valós számok halmaza megszámlálható, akkor megadható e sorozat úgy, hogy az a
kérdéses valós számok mindegyikét tartalmazza.
Megmutatjuk, hogy létezik olyan 0 < a < 1 valós szám, mely nem szerepel az itt felsoroltak között. Legyen a kérdéses
valós szám tizedes tört alakja:
ahol a1 ≠ x11, a2 ≠ x22, és általában ai ≠ xii. Az így megadott tizedes tört a fenti sorozat minden tagjától különbözik.
Ebből következik, hogy a]0; 1[valós számok halmaza és a természetes számok halmaza között nem létesíthető
kölcsönösen egyértelmű megfeleltetés, így a]0; 1[valós számok halmaza nem megszámlálható, kontinuum
számosságú halmaz.
Nagy jelentőségű és fontos számhalmaz még a komplex számok halmaza. E számhalmazzal részletesebben majd a 4.
fejezetben foglalkozunk.
2. Logikai alapok
2.1. Állítások logikai értéke, logikai műveletek
2.2. Predikátumok és kvantorok
2.3. Bizonyítási módszerek
I I I I I I
I H H I H H
H I H I I H
H H H H I I
Minden olyan állítást, amiben egy vagy több művelet elvégzése szerepel, összetett állításnak nevezünk. Ha egy állítás
több műveletet is használ, természetesen tisztázni kell, hogy ezeket milyen sorrendben végezzük el. Ahogyan az egész
számokon értelmezett műveletek körében is van egy elfogadott elvégzési sorrend (hatványozás – szorzás – összeadás),
hasonló a helyzet a logikai műveleteknél is, ahol az elsőbbségi sorrend:
Azonos műveletek közül mindig a bal oldalit végezzük el előbb. Ha ezen szabályoktól eltérő sorrendben akarjuk egy
összetett állítás műveleteit elvégezni, akkor zárójelezést használunk.
Például a p → ¬q ˅ r formula szerint p-ből következik a „nem q vagy r“ állítás. Ha a műveleteket az előírt elsőbbségi
sorrendtől eltérően akarjuk elvégezni, azt megfelelő zárójelezéssel tehetjük meg. Ugyanezt a példát tekintve, ha azt akarjuk
kifejezni, hogy p-ből következik a „q vagy r“ állítás tagadása, akkor a „q vagy r“ állítást zárójelbe tesszük: p → ¬ (q ˅ r). Ha
pedig azt szeretnénk állítani, hogy „p-ből következik ¬q, vagy r“, akkor a következtetést tesszük zárójelbe: (p → ¬q) ˅ r.
Egy logikai formula (azaz egy logikai állításokat jelképező változókból logikai műveletek elvégzésével alkotott formula)
igazságértéke a benne szereplő állításváltozók igazságértékétől függ, és a már ismertetett szabályok alapján vázolható egy
igazságtáblázatban.
p q r ¬q ¬q ˄ r p → ¬q ˅ r
I I I H I I
I I H H H H
I H I I I I
I H H I I I
H I I H I I
H I H H H I
H H I I I I
H H H I I I
Tehát a p → ¬q ˅ r formula csak abban az esetben hamis, ha p és q igazak, míg r hamis, minden más esetben igaz.
Egy összetett logikai formula érvényes (általános érvényű), illetve érvénytelen (ellentmondásos), ha benne szereplő
állításváltozók igazságértékétől függetlenül mindig igaz, illetve mindig hamis. Két logikai formula ekvivalens, ha az
igazságértékük mindig ugyanaz. Az ekvivalencia jelölése: A ≡ B. Például p ˅ ¬p egy általános érvényű, míg p ˄ ¬p egy
ellentmondásos formula. A p → q implikáció ekvivalens a ¬p ˅ q összetett állítással. Az alábbiakban felsoroljuk a
leggyakrabban használt logikai ekvivalenciákat. (Kényelmi szempontból érdemes bevezetni az I és H konstansokat,
amiknek az igazságértéke a betűjeleknek megfelelően igaz, illetve hamis.)
- Identitásszabályok: p ˄ I ≡ p, p ˅ H ≡ p.
- Dominálási szabályok: p ˅ I ≡ I, p ˄ H ≡ H.
- Ismétlés kiküszöbölése: p ˄ p ≡ p, p ˅ p ≡ p.
- Kettős tagadás: ¬p ≡ ¬p.
- Felcserélhetőségi szabályok: p ˄ q ≡ q ˄ p, p ˅ q ≡ q ˅ p.
- Asszociatív szabályok: (p ˄ q) ˄ r ≡ p ˄ (q ˄ r), (p ˅ q) ˅ r ≡ p ˅ (q ˅ r).
- Disztributív szabályok: (p ˄ q) ˅ r ≡ (p ˅ r) ˄ (q ˄ r), (p ˅ q) ˄ r ≡ (p ˄ r) ˅ (q ˄ r).
- De Morgan-szabályok: ¬ (p ˄ q) ≡ ¬p ˅ ¬q, ¬ (p ˅ q) ≡ ¬p ˄ ¬q.
- Elnyelési (abszorpciós) szabályok: p ˄ (p ˅ q) ≡p, p ˅ (p ˄ q) ≡ p.
- Implikáció kiküszöbölése: p → q ≡ ¬p ˅ q.
- Ekvivalencia kiküszöbölése: p ↔ q ≡ (p → q) ˄ (q → p).
- Kontrapozíció :p → q ≡ ¬q → ¬p.
Ezen ekvivalenciák bármelyike egyszerűen ellenőrizhető azzal, hogy a kétoldalt álló formulák igazságtáblázatát
elkészítjük és meggyőződünk arról, hogy az adott formuláknak megfelelő oszlopok megegyeznek. További ekvivalenciákat
pedig levezethetünk a fenti ekvivalenciák segítségével, vagy szintén a megfelelő igazságtáblázatok kitöltésével.
A P(x) egyváltozós predikátum univerzális kvanti kációja a „P(x) minden x-re igaz“ állítás, ennek a jelölése: ∀xP(x). A
P(x) egyváltozós predikátum egzisztenciális kvanti kációja a „P(x) valamely x-re igaz“ állítás, ennek a jelölése: ∃xP(x).
A ∀ és ∃ jeleket nevezzük kvantoroknak.
Természetesen a „minden“ és a „valamely“ szavak a fenti de nícióban a predikátum adott változójának az értelmezési
tartományára vonatkoznak. Az értelmezési tartomány megváltoztatásával a kvanti káció igazságértéke is megváltozhat,
például a „∀x(x2 ∈ [0, ∞))“ univerzális állítás igaz a valós számok ℝ halmazán, de hamis a komplex számok ℂ halmazán. A
„∃x(x2 = 2)“ egzisztenciális állítás pedig hamis az egész számok ℤ halmazán, de igaz a valós számok ℝ halmazán.
Egy kvanti káció igazságértékének a meghatározása néha körülményes feladat (néha meg egyenesen lehetetlen), de a
következő alapelveket érdemes követni:
- Ha a ∀xP(x) univerzális állítás igaz, akkor ennek a megállapításához vagy végig kell ellenőriznünk, hogy az értelmezési
tartomány minden x elemére P(x) egy igaz állítás, vagy egy általános érvelést kell megadnunk arra, hogy P(x) az x
megválasztásától függetlenül mindig igaz. (Végtelen értelmezési tartomány esetén csak az utóbbi jöhet szóba.)
- Ha a ∀xP(x) univerzális állítás hamis, akkor ennek a megállapításához elég egy ellenpéldát találni, azaz egy olyan értéket x-
re, amivel P(x) hamis. Esetenként előfordulhat, hogy egy ilyen példa megadása nagyon körülményes vagy lehetetlen,
viszont valamilyen érveléssel meg tudjuk indokolni, hogy az állítás nem lehet igaz az értelmezési tartomány minden
elemére.
- Ha a ∃xP(x) egzisztenciális állítás igaz, akkor ennek a megállapításához elég egy példát találni, azaz egy olyan értéket x-re,
amivel P(x) igaz. Itt szintén előfordulhat, hogy nehéz egy konkrét példát felmutatni, viszont valahogyan meg tudjuk
indokolni, hogy miért létezik egy, az állítást alátámasztó példa.
- Ha a ∃xP(x) egzisztenciális állítás hamis, akkor ennek a megállapításához vagy végig kell ellenőriznünk, hogy az értelmezési
tartomány minden x elemére P(x) egy hamis állítás, vagy egy általános érvelést kell megadnunk arra, hogy P(x) az x
megválasztásától függetlenül mindig hamis.
Ezeket az alapelveket az alábbi egyszerű táblázatban is összefoglalhatjuk:
A fentiekből már látható, hogy egy univerzális állítás tagadása ekvivalens egy egzisztenciális állítással, és fordítva, egy
egzisztenciális állítás tagadása ekvivalens egy univerzális állítással. Ezt formulákkal is kifejezhetjük:
Többváltozós predikátumokból többféle módon képezhetünk logikai állításokat oly módon, hogy mindegyik változóra
vagy egy behelyettesítést, vagy egy kvanti kációt végzünk el. Pl. a Q(x, y): „x3 > y + 5“ (valós számokon értelmezett)
predikátumból képezhetünk állításokat kettős kvanti kációval: ∀x∀yQ(x, y), ∃x∀yQ(x, y) stb. vagy úgy, hogy az egyik
változót rögzítjük, és csak a másikra alkalmazunk kvanti kációt: ∃xQ(x, 8), ∀yQ(2, y) stb. és természetesen úgy is, hogy
mindkét változóra behelyettesítünk. A kettős kvanti kációkat a következőképp értelmezzük:
- A ∀x∀yQ(x, y) állítás jelentése, hogy minden x és y mellett Q(x, y) igaz.
- A ∀x∃yQ(x, y) állítás jelentése, hogy minden x-hez van olyan y, amivel Q(x, y) igaz.
- A ∃x∀yQ(x, y) állítás jelentése, hogy van olyan x, ami mellett minden y-ra Q(x, y) igaz.
- A ∃x∃yQ(x, y) állítás jelentése, hogy van olyan x és y, amik mellett Q(x, y) igaz.
Tehát többszörös kvantorok esetén azokat balról jobbra olvassuk. Az azonos kvantorok felcserélhetők:
viszont különböző kvantorok felcserélése már általában megváltoztatja az állítás értelmét. Például a valós számokon
értelmezett ∀x∃y(x3 > y + 5) állítás igaz (mert x tetszőleges megválasztása után y = x3 – 6 mellett igaz, hogy „x3 > y +5 “),
azonban a ∃y∀x(x3 > y + 5) állítás már hamis (mert x3 tetszőleges valós értéket felvehet, és y + 5 soha nem lehet kisebb
minden valós számnál).
Az igazságérték megindoklásánál ugyanazok az elvek vannak érvényben, amiket korábban az egyváltozós
predikátumoknál kifejtettünk, azaz minden változóra nézve vagy egy általános érvelést, vagy egy példát/ellenpéldát kell
szolgáltatnunk aszerint, hogy a változó melyik kvantorral szerepel az állításban, illetve hogy maga az állítás igaz vagy
hamis.
Visszatérve a ∃y∀x(x3 > y + 5) állításra, mivel ez egy hamis állítás, ezért ennek a precíz igazolásához az egzisztenciális
kvantorral ellátott y változóra általános érvelést, míg az univerzális kvantorral ellátott x változóra pedig egy ellenpéldát
szolgáltatunk, azonban ez a példa már függhet az y változótól. (Például: bármely y mellett az választással az „x3 >
y + 5“ állítás hamis, tehát nincs olyan y, amivel minden x-re „x3 > y + 5“ igaz lenne.) Viszont azt is megtehetjük, hogy az
eredeti állítás tagadásáról mutatjuk meg, hogy igaz: ¬∃y∀x(x3 > y + 5) ≡ ∀y(¬∀x(x3 > y + 5)) ≡ ∀y∃x ¬ (x3 > y + 5) ≡ ∀y∃x(x3 ≤ y +
5). Ezúttal egy igaz állítással van dolgunk, tehát univerzális kvantorral ellátott y változóra általános érvelést, míg az
egzisztenciális kvantorral ellátott x változóra pedig egy példát szolgáltatunk, ami lényegében ugyanaz, mint az előbbi
érvelés.
Bizonyos állításoknál célszerű az esetekre bontott bizonyítás: ilyenkor különböző eseteket vizsgálunk meg, amelyek
valamelyike biztosan fennáll, és minden esetre külön igazoljuk a bizonyítandó állítást. Tehát ha a q ˅ r diszjunkció biztosan
igaz, és a q → p és r → p következtetések is matematikailag igazolhatók, akkor a p állítás is igaz.
Gyakran találkozunk olyan matematikai állításokkal, amik a természetes számokra mondanak ki egy általános
igazságot. Ezek formálisan ∀nP(n) alakban írhatók le, ahol P egy olyan predikátum, aminek az értelmezési tartománya a
természetes számokból áll. A teljes indukció elvét ilyen típusú állítások bizonyításakor próbálhatjuk meg alkalmazni: Ha a
P predikátum értelmezési tartománya a pozitív egész számok halmaza, P(1) egy igaz állítás, és bármely k pozitív egészre
matematikailag helyes a P(k) → P(k + 1) következtetés, akkor a ∀nP(n) állítás is igaz, azaz P(n) igaz minden n pozitív egészre.
A teljes indukciónak egy erősített változata a következő: Ha a P predikátum értelmezési tartománya a pozitív egész
számok halmaza, P(1) egy igaz állítás, és bármely k pozitív egészre matematikailag helyes a P(1) ˄ P(2) ˄ … ˄ P(k) → → P(k + 1)
következtetés, akkor a ∀nP(n) állítás is igaz, azaz P(n) igaz minden n pozitív egészre.
Példa. Igazoljuk, hogy minden 1-nél nagyobb egész szám előáll prímszámok szorzataként! (Magukat a prímszámokat
egytényezős szorzatnak tekintjük.)
Mivel az állítás az 1-nél nagyobb számokra vonatkozik, először n = 2-re vizsgáljuk meg, amire az állítás nyilván igaz,
hiszen 2 egy prímszám. Amennyiben pedig feltesszük, hogy az állítás 2-től valamely k egészig minden egész számra
igaz, úgy k + 1-re is igazolni tudjuk. Ugyanis ha k + 1 egy prímszám, akkor egytényezős prímszorzat, ha pedig nem
prímszám, akkor előáll a · b szorzat alakban, ahol 2 ≤ a ≤ b ≤ k. Az indukciós feltevésünk szerint a és b felírhatók
prímszámok szorzataként, így aztán a k + 1 = a · b szorzat szintén prímszámok szorzata. Ezzel beláttuk az indukciós
lépést, így az eredeti állításunk igazolást nyert.
3. Számtan, elemi algebra
3.1. Elemi számtan (a számok írásának kialakulása, műveletek különböző számokkal,
negatív számok, törtek, tizedes törtek), kerekítés, százalékszámítás
3.2. Arányok (egyenes és fordított arányosság, az aranymetszés, a π), nevezetes közepek
3.3. Algebrai kifejezések és műveletek, hatványozás, összevonás, szorzás, kiemelés,
nevezetes azonosságok
3.4. Gyökvonás, hatványozás, logaritmus és műveleteik
3.5. Számrendszerek
3.6. Egyenletek, egyenletrendszerek (fogalom, mérlegelv, osztályozás fokszám és
egyenletek száma szerint, első- és másodfokú egyenletek, exponenciális és
logaritmikus egyenletek)
3.7. Harmad- és negyedfokú egyenletek (speciális magasabb fokú egyenletek)
3.1. ábra
Az egyes szimbólumokat nagyság szerint növekvő sorrendben, jobbról balra haladva írták le, s ha valamely 10-
hatványból nem szerepelt a kérdéses számban, az annak megfelelő szimbólumot egyszerűen kihagyták. Egyiptomban
ekkor tehát a következőképpen írták le az alábbi két számot:
3.2. ábra
Az ókori Kínában szintén ismerték a 10-es számrendszert, de a 0 és a helyi érték fogalma náluk is ismeretlen volt. Ők
szintén egy-egy szimbólummal jelölték 10 megfelelő hatványait, de külön szimbólumaik voltak az egyes számjegyekre is.
Így a leírandó számban a kérdéses 10-hatványt nem annyiszor írták le, ahányszor szerepelt a számban, hanem a megfelelő
egyes szimbólummal jelölték, hogy hány db van a megfelelő 10-hatványból (3.3. ábra).
3.3. ábra
E szimbólumokkal az ókori Kínában így írták le pl. a 4672 és 2007 számokat (3.4. ábra):
3.4. ábra
Ilyen rendszerben már jóval kevesebb szimbólumot kellett használniuk az egyes számok leírásához, mint az ókori
Egyiptomban, bár az ilyen módon leírt számokkal való műveletek elvégzése még mindig igen nehézkes lehetett. Érdekes
módon végezték el a szorzást, ehhez szorzópálcikákat használtak. Vizsgáljuk például a 13 • 24 szorzatot (3.5. ábra):
3.5. ábra
A szorzás műveletét keresztbe elhelyezett pálcikákkal végezték az ábrán látható módon. Azt számolták, hogy az egyes
kereszteződésekben hány metszéspont található. Az egyesek (3 és 4) kereszteződésében összesen 12 metszéspont van, tehát
a szorzat 2-re végződik, és a tízesek száma eggyel nő. Az egyesek és tízesek kereszteződésében (1, 4 és 2, 3) 10 metszéspont
van, ehhez hozzáadva az előbbi 1-et, a szorzat utolsó előtti jegye 1 és a százasok szintén eggyel növekednek. A tízesek
kereszteződésében (1 és 2) 2 metszéspont van, ehhez hozzáadva az előbbi 1-et, a szorzat első jegye 3. Tehát a szorzat
eredménye 312. Ezzel a módszerrel nagyobb számokat is össze tudtak szorozni.
Sajátos számírást használtak a Római Birodalomban; az ún. római számokat, melyek Európában egészen a XIV.
századig elterjedtek voltak, csak akkor kezdték kiszorítani őket az ún. arab számok. A római számok még ma is
használatosak bizonyos számok jelölésére: általában sorszámozásra, könyvek fejezeteinek számozására, de találkozunk
velük uralkodói dinasztiák neveiben, vagy éppen régi épületek építési éveinek jelölésében. Az ókori Rómából származó
számjelölési rendszer alapelvei szerint néhány kiválasztott betűnek számértéket adtak (általában 10 hatványainak és ezek
5-szöröseinek), és ezek bizonyos kombinációival fejezték ki a felírandó számot. A leggyakoribban használt római számok:
I 1
V 5
X 10
L 50
C 100
D 500
M 1000
Nagyobb számok leírására a következő szabályt használták: először leírták pl. az ezreseket, aztán a százasokat, majd a
tízeseket, végül az egyeseket. Az 5 és 10 közötti (V és X közötti) számokból az 5 (V) után írt egy, két vagy három 1-essel (I-vel)
írták le a 6, 7, 8 számokat, míg a 9-est a 10 (X) elé írt 1-essel (I-vel) jelölték:
Hasonlóképpen jártak el az 50 és a 100 (L és C) közötti, valamint az 500 és az 1000 (D és M) közötti számok jelölésekor.
Ebből következik, hogy az I csak V vagy X előtt állhat, az X csak L és C előtt, C pedig csak D vagy M előtt állhat. Például:
Érdekes a második szám (999) leírása. Több dokumentumban is találkozunk ennek IM alakjával annak ellenére, hogy
(bár egyértelmű) ez az írásmód nem felel meg a római számok leírási szabályainak.
A nagyobb számok leírására a rómaiak az alábbi módszert használták: ha egy szám fölé egy vízszintes vonalat írtak,
akkor az a szám ezerszeresét jelentette. Például 000. Ha a számot két függőleges vonal közé helyezték, akkor az a
szám milliószorosát jelentette. Például |VI| = 6 000 000. Ezek szerint
.
A 0 „felfedezése“ nagyban megkönnyítette a számok leírását, s egyben megnyitotta az utat a ma is használt helyi
értékes 10-es számrendszer kialakulásához. Mindez a Kr. u. VI–VII. században élt kiváló hindu matematikus, Brahmagupta
nevéhez fűződik. Ő azt találta, hogy elegendő csak az egyeseket jelző szimbólumokat használni, s hogy a kérdéses
szimbólum milyen 10-hatványt jelöl, az attól függ, hogy a szám leírásának sorrendjében a szimbólum éppen hol foglal
helyet. Ha tehát egy ezres nagyságrendű számról van szó, akkor legelőre írjuk az ezresek számának megfelelő szimbólumot,
második helyre a százasok számát jelölő szimbólumot, és így tovább. Így ha valamely 10-hatványból nem szerepelt a
kérdéses számban, akkor annak helyét nem kihagyni kell (ez félreértésre adhat okot), hanem a „semmit“, vagyis e 10-
hatvány hiányát egy újabb szimbólummal jelölni kell. Vélhetően így jutott el a „nulla“ fogalmához, s azt bevezetve
megszületett a helyi értékes 10-es számrendszer.
Érdekes, hogy az általunk arab számoknak nevezett számjegyek is eredetileg az ősi Indiából származnak. Indiából
Perzsián keresztül jutott el az arab világba, majd az arab hódítások révén került előbb Spanyolországba, onnan pedig a XI–
XII. században elindult egész Európába.
Összeadás
Kivonás
Szorzás
Osztás
Zárójelek használata, a műveletek sorrendje
Műveletek előjeles számokkal
Műveletek törtszámokkal
Tizedes törtek, műveletek tizedes törtekkel
Összeadás
Ha két (vagy több) pozitív mennyiséget együttesen tekintünk, akkor a mennyiségek összegét vizsgáljuk.
Bélának 38, Csabának 44 eurója van. Mennyi pénzük van összesen? A két ú összes pénzét az egyes úk pénzének
összege adja: 38 + 44 = 82. Az egyenlőség bal oldalán levő két mennyiséget összeadandóknak (vagy az összeg tagjainak)
nevezzük, a jobb oldali mennyiséget az összeadandók összegének mondjuk. Nem változik az összeg, ha az összeadandók
sorrendjét felcseréljük. Az összeadás művelete felcserélhető (kommutatív) művelet:
Ha az összeg három tagból áll, akkor közülük bármely két tag összegéhez hozzáadva a harmadik tagot, az összeg nem
változik. Az összeadás csoportosítható (asszociatív) művelet.
Az összeadás műveletét (többtagú és többjegyű tagok esetén) az alábbi módon végezzük el. Az összeadandókat
egymás alá írjuk úgy, hogy az azonos helyi értékű számjegyek egymás alá kerüljenek. Az összeadandókat aláhúzzuk,
e vonal alá kerül az összeg. Például
Az összeadást az egyesekkel kezdjük: 2 + 9 + 7 = 18. Az egyesek összege 8 egyest és egy tízest tartalmaz, tehát az egyesek
alá leírjuk a 8-at, az egy tízest pedig hozzáadjuk a tízesek összegéhez: 7 + 7 + 4 + 1 = 19. Tehát 19 tízesünk (vagyis 9
tízesünk és egy százasunk) van. A 9 tízest leírjuk a tízesek alá, az egy százast hozzáadjuk a százasok összegéhez, és így
tovább.
Kivonás
Ha valamely mennyiségből elvesszük annak egy részét, a kivonás műveletét hajtjuk végre. Úgy is fogalmazhatnánk:
kivonáskor ismerjük a kéttagú összeg egyik tagját, az összeget, és keressük a másik tagot. Az összeget kisebbítendőnek, az
ismert tagot kivonandónak, az ismeretlen tagot különbségnek nevezzük. A különbség értéke nem változik, ha a
kisebbítendőhöz és a kivonandóhoz ugyanazt a számot hozzáadjuk vagy ugyanazt a számot kivonjuk belőlük.
Többjegyű számok kivonását az alábbi módon végezhetjük el. A számokat helyi értéküknek megfelelően egymás alá
írjuk, majd az egyes helyi értékeknek megfelelően az 1-esekkel kezdve az egyes helyi értékek kivonását elvégezzük.
Például
A kivonás természetesen nem felcserélhető, azaz nem kommutatív művelet. A természetes számok halmazán a kivonás
csak akkor végezhető el, ha a kisebbítendő legalább akkora, mint a kivonandó.
Szorzás
Ha egy többtagú összeg minden tagja ugyanaz a szám, akkor az összeadás műveletét szorzással is elvégezhetjük. Például
Az azonos tagokat szorzandónak, azt a számot, ahányszor vennünk kell e tagokat, szorzónak nevezzük. A szorzandót és
szorzót közös néven szorzótényezőknek hívjuk. A művelet eredménye a szorzat. A szorzótényezőket egy ponttal választjuk
el egymástól; ez a szorzás műveleti jele:
A szorzás művelete kommutatív, vagyis a szorzat értéke nem változik, ha a szorzandót és a szorzót felcseréljük. Például
A szorzás művelete asszociatív. Ez azt jelenti, hogy több tényezőt tartalmazó szorzás esetében a szorzat nem változik,
ha az egyes tényezőket tetszés szerint csoportosítjuk. Például
Ha valamelyik szorzótényező többtagú összeg, akkor vagy e tagokat összeadjuk és a kapott összeget megszorozzuk a
másik szorzótényezővel, vagy pedig az összeg minden tagját megszorozzuk a másik tényezővel, s az így kapott szorzatokat
összeadjuk. A szorzás e tulajdonságát disztributivitásnak nevezzük. Például
Ha többjegyű számot (szorzandó) szorzunk egy egyjegyű számmal (szorzó), akkor a szorzandó jegyeit az egyesektől
kezdve megszorozzuk a szorzóval, vigyázva arra, hogy a helyi értékeket is gyelembe vegyük. Például
7-szer 6 az 42 egység, tehát leírjuk a 2-est, a 4 tízes pedig „átmegy” a következő helyi értékbe. 7-szer 7 az 49, plusz az
„átjövő“ 4 az 53. Tehát leírjuk a 3-ast, az 5 százas pedig „átmegy“ a következő helyi értékbe. 7-szer 2 az 14 plusz az
„átjövő“ 5 százas az 19. Mivel több szorzótényező számjegy nincs, így e 19-et leírjuk: a szorzás végeredménye 1932.
Ha többjegyű számot (szorzandó) szorzunk többjegyű számmal (szorzó), akkor a szorzandó minden számjegyét
megszorozzuk a szorzó minden számjegyével, majd az így nyert részletszorzatokat egymás alá írjuk és összeadjuk. De
vigyáznunk kell arra, hogy a részletszorzatok egymás alá írásakor az azonos helyi értékű számjegyek egymás alá
kerüljenek. Ha például a szorzást a szorzó legnagyobb helyi értékű számjegyével kezdjük, akkor az egyes részletszorzatokat
egy-egy helyi értékkel balra írjuk. (Természetesen, ha a szorzást a szorzó legkisebb helyi értékű számjegyével kezdjük,
akkor az egyes részletszorzatokat egy-egy hellyel balra írjuk). Például
Osztás
Ha valamely szorzás esetében ismerjük az egyik tényezőt, valamint a szorzatot, akkor a másik szorzótényezőt az osztás
műveletével határozhatjuk meg. A szorzat neve: osztandó, az ismert szorzótényező neve: osztó, a keresett szorzótényezőt
(vagyis az osztás eredményét) pedig hányadosnak hívjuk. Az osztás műveleti jele az osztandó és az osztó közé írt
„kettőspont“, vagy az osztandó és az osztó közé írt törtvonal
Maradék nélküli osztás esetében a hányados értéke nem változik, ha az osztandót és az osztót ugyanazzal a 0-tól
különböző számmal megszorozzuk.
Ha többjegyű számot egyjegyű számmal osztunk, akkor az osztást az osztó legmagasabb helyi értékű számjegyével
kezdjük. Például
1-ben nincs meg a 8, így gyelembe vesszük a következő jegyet is. 19-ben a 8 megvan 2-szer. Leírjuk a 2-est, majd
„visszaszorzunk“ vele: 2-szer 8 az 16, ezt kiegészíjük 19-re, az így adódó 3-ast leírjuk a 9-es alá. Eztán a 3-as mellé írjuk
az osztandó következő jegyét, jelen esetben a 7-est. 37-ben a 8 megvan 4-szer, így a hányadosban leírjuk a 4-est, majd
„visszaszorzunk“: 4-szer 8 az 32, ehhez, hogy 37 legyen kell 5. Leírjuk az 5-öst a 7-es alá, majd melléírjuk az osztandó
soron következő jegyét, jelen esetben a 6-ot. 56-ban a 8 megvan 7-szer. Leírjuk a 7-est, aztán 7-szer 8 az 56. Ehhez,
hogy 56 legyen, nem kell semmi. Tehát a hányados 247, a maradék 0.
Ha az osztandó is és az osztó is többjegyű szám, akkor az osztandóban a legmagasabb helyi értékű jegytől számítva
annyi jegyet választunk, hogy ebben az osztó meglegyen legalább egyszer, de legfeljebb 9-szer, s eztán az előbb ismertetett
módszert alkalmazva végezzük el az osztást. Például
Most először az osztandó első két jegyét kell gyelembe vennünk. 32-ben a 26 megvan 1-szer. Leírjuk az 1-est, majd
„visszaszorzunk“. 1-szer 26 az 26; ehhez, hogy 32-t kapjunk, kell 8. Leírjuk a 8-ast, majd mellé írjuk az osztandó
következő számjegyét, a 6-ot. 86-ban a 26 megvan 3-szor. Leírjuk az eredménybe a 3-ast, majd „visszaszorzunk“: 3-
szor 26 az 78, ehhez 8-at kell adnunk, hogy 86 legyen. Leírjuk ezt a 8-ast, majd mellé írjuk az osztandó következő
jegyét, a 4-est. 84-ben a 26 megvan 3-szor. Leírjuk a 3-ast a hányados következő helyére és „visszaszorzunk“: 3-szor 26
az 78, ehhez 6-ot kell adnunk, hogy 84 legyen. Leírjuk a 6-ost, majd mellé írjuk az osztandó következő jegyét, a 7-est.
67-ben a 26 megvan 2-szer. Leírjuk a hányados megfelelő helyére a 2-est, majd: 2-szer 26 az 52, ehhez, hogy 67 legyen,
kell 15. Ezzel az osztást elvégeztük. 32 647-ben a 26 megvan 1332-szer, a maradék 15.
Előfordulhat, hogy egy műveletsorban csak szorzás és osztás szerepel. Ilyenkor (ha nem tettünk ki zárójelet, amely
utalna a műveletek elvégzésének sorrendjére) is a balról jobbra szabályt alkalmazzuk. Például
Gyakran előfordul, hogy egy zárójelen belül is külön kiszámítandó műveletek, azaz újabb zárójelek szerepelnek.
Ilyenkor általában a szögletes [] vagy, ha még szükséges, akkor a kapcsos {} zárójelet használjuk. Több egymásba
skatulyázott zárójel esetén belülről kifelé haladva először a belső, aztán a közbülső zárójelek értékét határozzuk meg, végül
pedig a legkülső zárójelben szereplő mennyiségeket, majd ezek után a kapott mennyiségeket a megfelelő szabályok szerint
összevonjuk. Például
Megjegyzés. A negatív számok először Kínában jelentek meg Kr. e. a II. században az elsőfokú egyenletrendszerek
vizsgálatakor. Indiában az V–VI. században alkalmazták először a negatív számokat. Európában sokáig nem
ismerték a negatív számokat, vagy egyszerűen „abszurd“ vagy „ ktív“ számoknak nevezték őket. A XIV–XV.
században a virágzó kereskedelem egyre inkább megkívánta a negatív számok használatát. A negatív számok igazi
létjogosultságot Cardano és Viète munkássága után nyertek.
Mielőtt rátérünk az egész számok Z halmazán végzett műveletekre, meg kell ismerkednünk az abszolút érték
fogalmával. Bár egyelőre csak a Z halmazban dolgozunk, az abszolút érték fogalmát minden valós számra értelmezzük. Az a
valós szám abszolút értékét így jelöljük: |a|, és az a szám előjel nélküli értékét értjük alatta. Pontosabban
Azonos előjelű számokat úgy adunk össze, hogy a számok abszolút értékét öszszeadjuk, majd az összeget az eredeti
számok előjelével látjuk el. Például
Két különböző előjelű számot úgy adunk össze, hogy a nagyobb abszolút értékű szám abszolút értékéből kivonjuk a
kisebb abszolút értékű szám abszolút értékét, majd e különbséget a nagyobb abszolút értékű szám előjelével látjuk el.
Például
Előjeles számok kivonásánál úgy járunk el, hogy a kivonandót az ellentétére változtatjuk, és így hozzáadjuk a
kisebbítendőhöz. Így tehát az előjeles számok kivonását az előjeles számok összeadására vezetjük vissza. Például
Előfordulhat, hogy egy kifejezésben több előjeles számmal kell a műveleteket elvégeznünk. Ekkor a következőképpen
járunk el: ha a zárójelen belüli előjel és a zárójel előtti műveleti jel megegyezik, akkor a zárójel elhagyásával a kérdéses
számot + előjellel vesszük; ha a zárójelen belüli előjel és a zárójel előtti műveleti jel különböző, akkor szintén elhagyjuk a
zárójelet és a kérdéses számot – előjellel látjuk el. Ezek után külön összeadjuk a + előjellel szereplő számokat, a – előjellel
szereplő számokat, majd a már korábban ismertetett módon összeadjuk e két eredményt. Például
Ha több tényezőből álló szorzást kell elvégeznünk, akkor először a tényezők abszolút értékét összeszorozzuk, majd ha a
negatív tényezők száma páros, akkor + előjellel látjuk el a szorzatot, ha a negatív tényezők száma páratlan, akkor pedig –
előjellel látjuk el a szorzatot.
Ha az osztás a Z halmazban elvégezhető, akkor két előjeles számot úgy osztunk, hogy a számok abszolút értékével
elvégezzük az osztást, majd ha az osztó és osztandó előjele megegyezik, akkor a hányadost + előjellel, ha az osztó és az
osztandó előjele különböző, akkor a hányadost – jellel látjuk el. Például
Műveletek törtszámokkal
Gyakran előfordul, hogy egy egész számot úgy kell egyenlő részekre osztanunk, hogy e részek száma nem osztója a kérdéses
egész számnak. Ha pl. 2 egyforma kör alakú tortát szeretnénk 5 gyerek között egyenlő mértékben elosztani, vagy ha pl. egy
görögdinnyét szeretnénk egy 6 tagú család tagjai között egyenlő mértékben elosztani.
Az egész számok Z halmazán az osztás nem minden esetben végezhető el, vagyis a Z halmaz az osztás műveletére nézve
nem zárt halmaz. Legyen n és k eleme a Z halmaznak. Ha az n számot k egyenlő részre akarjuk osztani, akkor azt -val
jelöljük, és törtszámnak nevezzük. A törtvonal fölötti szám neve: számláló, a törtvonal alatti szám neve: nevező. Az
alakú számok (k ≠ 0) a törtek vagy racionális számok. A racionális számok Q halmazában az összeadás, kivonás, szorzás és
osztás elvégezhető, vagyis e műveletekre nézve a racionális számok halmaza zárt halmaz.
Ha a tört számlálója és a nevezője pozitív és a számláló kisebb, mint a nevező, akkor valódi törtről van szó, ha a
számláló nagyobb mint a nevező, akkor a törtet áltörtnek mondjuk. Például
A valódi tört értéke 1-nél kisebb, az áltört értéke 1-nél nagyobb. Ha egy tört számlálója egyenlő a nevezőjével, akkor a
tört értéke 1. Így az áltörteket felbonthatjuk egy egész szám és egy valódi tört összegére. Például
Az áltörtek ilyen alakját vegyes számnak mondjuk. Vegyes számot úgy alakíthatunk át áltörtté, hogy annak egész
részét megszorozzuk a törtrészének nevezőjével, majd az eredményt hozzáadjuk a törtrész számlálójához. A kapott
eredmény lesz az áltört számlálója, a törtrész nevezője lesz az áltört nevezője. Például
Egy tört értéke nem változik, ha a számlálóját és a nevezőjét ugyanazzal a 0-tól különböző számmal megszorozzuk. Ezt
a műveletet a tört bővítésének nevezzük.
Például
Az első törtet 11-gyel, a másodikat 3-mal bővítettük. Ebből következik, hogy egy racionális számnak végtelen sok alakja
van.
Egy tört értéke nem változik, ha a számlálóját és a nevezőjét ugyanazzal a 0-tól különböző számmal elosztjuk. Ezt a
műveletet a tört egyszerűsítésének nevezzük.
Például
Törtek összeadása és kivonása. Egyenlő nevezőjű törteket úgy adunk össze (vagy vonunk ki egymásból), hogy a
számlálókat a megfelelő módon összeadjuk (kivonjuk), a nevezőt pedig változatlanul leírjuk. Például
Különböző nevezőjű törteket úgy adunk össze (vonunk ki egymásból), hogy először a nevezőket közös nevezőre
hozzuk, majd e közös nevezőnek megfelelő számmal bővítjük az egyes törteket. Így elérjük, hogy az összeadandó
(kivonandó) törtek közös nevezőn legyenek, s ekkor az előbbi szabály szerint adjuk össze (vonjuk ki) a törteket. Például
Törtek szorzása és osztása. Törtet egész számmal úgy szorzunk, hogy a tört számlálóját megszorozzuk a kérdéses egész
számmal. (Természetesen azt is megtehetjük, hogy ha a tört nevezője osztható az egész számmal, hogy a számláló szorzása
helyett a tört nevezőjét elosztjuk az egész számmal.) Például
Törtet törttel úgy szorzunk, hogy a számlálót a számlálóval, a nevezőt a nevezővel összeszorozzuk. Például
Egy törtszám (valós szám) reciprokán azt a törtet (valós számot) értjük, mellyel a kérdéses törtet megszorozva
eredményül 1-et kapunk. Ebből következik, hogy egy tört reciprokát úgy kapjuk, hogy a számlálóját és a nevezőjét
felcseréljük. Mivel az egész számok olyan törnek foghatók fel, melyek nevezője 1, ezért az egész szám reciproka olyan tört,
melynek a számlálója 1, a nevezője pedig maga a kérdéses egész szám. Például
Törtet egész számmal úgy osztunk, hogy a tört nevezőjét megszorozzuk az egész számmal, vagy másként fogalmazva,
törtet egész számmal úgy osztunk, hogy a törtet megszorozzuk az egész szám reciprokával. Egész számot törttel úgy
osztunk, hogy az egész számot megszorozzuk az osztó reciprokával.
Általában törtet törttel úgy osztunk, hogy az osztó reciprokával szorzunk. Például
Ha a törteket tartalmazó kiszámítandó mennyiség több műveletet is tartalmaz, akkor a már az egész számoknál
megismert szabályok szerint járunk el. Például
A 10-es számrendszerben valamely számjegytől balról jobbra haladva az egymást követő számjegyek mindegyike 10-
szer kisebb, mint a kérdéses számjegyet megelőző számjegy. Az egyesektől jobbra tizedek, századok, ezredek stb.
következnek, és az egyes helyi értékű számjegytől e tizedesjegyeket vesszővel (tizedesvesszővel) választjuk el.
A tizedes tört értéke 10-szeresére, 100-szorosára, 1000-szeresére stb. nő, ha a tizedesvesszőt 1-gyel, 2-vel, 3-mal stb.
jobbra visszük, illetve tized-, század-, ezredrészére csökken, ha a tizedesvesszőt 1-gyel, 2-vel, 3-mal stb. balra visszük.
Tizedes törtek összeadásánál és kivonásánál ugyanúgy járunk el, mint egész számok összeadásánál, illetve
kivonásánál: a tizedes törteket helyi értéküknek megfelelően egymás alá írjuk, és elvégezzük a kérdéses műveletet, nagyon
vigyázva arra, hogy a tizedesvessző a két számban egymás alá kerüljön. Az összegben (különbségben) a tizedesvessző az
eredeti tizedes törtekben szereplő helyen áll. Például
Tizedes törtek szorzásánál ugyanúgy járunk el, mint egész számok szorzásánál, de vigyáznunk kell arra, hogy a
szorzatban (jobbról balra haladva) annyi tizedesjegyet jelöljünk ki, amennyi a szorzandókban együttvéve volt. Például
(Mivel az egyik szorzótényezőben 2 tizedesjegy volt, a másikban egy, ezért a szorzatban összesen három tizedesjegyet
veszünk.)
Tizedes törtet egész számmal úgy osztunk, mintha egész számot osztanánk egész számmal, ügyelve arra, hogy amikor
az első tizedesjegyet (tehát a tizedeket) leírjuk, akkor az eredményben is ki kell tennünk a tizedesvesszőt. Tizedes törtet
tizedes törttel úgy osztunk, hogy az osztót és az osztandót is megszorozzuk 10-nek annyiadik hatványával, ahány
tizedesjegy az osztóban szerepel, ezzel az osztó egész számmá válik, így tizedes törtnek egész számmal való osztására
vezetjük vissza ezt az osztást. Például
Gyakran fordul elő, hogy egy valódi törtet (áltörtet vagy vegyes törtet) kell átváltanunk tizedes törtté vagy fordítva.
Egy közönséges tört átváltása tizedes törtté egy egyszerű osztást jelent: a számlálót elosztjuk a nevezővel. Ha az osztás
során véges számú lépés után 0 maradék adódik, akkor az eredmény egy véges tizedes tört. Ha az osztás során soha nem
adódik 0 maradék, akkor végtelen tizedes tört a hányados. Ekkor minden esetben az utolsó tizedesjegy (illetve a
tizedesjegyek egy csoportja) végtelen sokszor periodikusan ismétlődik. Az ilyen tizedes törtet végtelen szakaszos tizedes
törtnek mondjuk.
Közönséges törtek tizedes törtté alakítása során a tizedes tört minden esetben véges vagy végtelen szakaszos tizedes
tört lesz. A végtelen szakaszos tizedes törtekben az utolsó leírt periódus első és utolsó számjegye fölé egy-egy pontot írunk,
ezzel jelezve, hogy e periódus ismétlődik végtelen sokszor. Például
Tizedes törtek közönséges törtté alakításakor a következőképpen járunk el: ha a tizedes tört véges, akkor a közönséges
tört számlálójába beírjuk a tizedesjegyekből álló számot, a nevezőbe pedig 10-nek annyiadik hatványát írjuk, ahány
tizedesjegy áll az eredeti tizedes törtben a tizedesvessző után. Például
Végtelen szakaszos tizedes törtet közönséges törtté úgy alakítunk át, hogy a tizedesvessző utáni számjegyekből a
számlálóba annyit írunk le, amennyi tartalmaz egy szakaszt az ismétlődő periódusokból, majd ebből levonjuk az
ismétlődést megelőző számjegyekből adódó számot, végül a nevezőbe annyi kilencest írunk ahány jegyből áll egy periódus,
majd annyi nullát írunk utána, ahány tizedesjegy szerepel az ismétlődések előtt. Például
A mindennapok gyakorlatában általában nem pontos számokkal, hanem azok közelítő értékeivel számolunk. Például a
különböző hosszúság-, súly- vagy hőmérsékletméréskor mérőeszközeink pontatlansága miatt csak közelítő értékekkel
számolhatunk. A közelítő értékek jelölésére a ≈ jelet használjuk. Az ilyen értékekkel való számolási műveletek eredményei
természetesen szintén csak közelítő értékek lesznek. Amennyiben megadjuk, hogy a kérdéses számra milyen pontossággal
(hány tizedesjegy pontossággal) van szükségünk, akkor alkalmazhatjuk az alábbi kerekítési szabályokat.
Ha az elhagyandó első számjegy 5 vagy annál nagyobb, akkor a megmaradó utolsó számjegyet 1-gyel megnöveljük. Ha
az elhagyandó első számjegy 5 vagy annál kisebb, akkor a megmaradó számjegyeket változatlanul leírjuk.
Példa. Kerekítsük 2 tizedesjegy pontosságúra a 24,5761 számot! Mivel ennek első elhagyandó tizedesjegye 6, ami 5-nél
nagyobb, ezért a 2 tizedesjegyre kerekített érték: 24,58. Ez az érték közelebb van az eredeti szám valódi értékéhez,
mint ha az eredeti szám első 2 tizedesjegy értékét vennénk csak gyelembe, vagyis 24,57-et írnánk.
Kerekítsük 3 tizedesjegy pontosságúra a 6,789 28 számot! Most az elhagyandó első számjegy 2, így a kerekített érték:
6,789.
Példák
1. Kovács úr bruttó zetése 128 600 Ft. Január elején kapott 12%-os zetésemelést. Mekkora lesz ezután Kovács úr
bruttó zetése? Az új zetés az eredeti zetés és annak 12%-ának összege, vagyis
2. Egy akció során egy kerékpár árát 20%-kal csökkentették. Hány %-kal kell növelni a kerékpár akciós árát, hogy az
akció lejárta után a kerékpár az eredeti árába kerüljön? Legyen x a kerékpár eredeti ára, p pedig az a százalékláb,
amennyivel emelni kell az árat az akció végén. Az akció során a kerékpár ára:
Tehát az akció végén 25%-kal kell emelni a kerékpár árát, hogy az eredeti ár visszaálljon.
3. András és Béla ugyanazt a távolságot becsülték meg. Ha András 10%-kal nagyobbat mondott volna, akkor
pontosan eltalálta volna a távolságot. Ha Béla 10%-kal kevesebbet mondott volna, akkor ő is talált volna.
Melyikük tévedett nagyobbat?
Mivel András kevesebbet, Béla pedig többet mondott a tényleges távolságnál, ezért András kisebbet mondott,
mint Béla. Mivel kisebb mennyiség 10%-a kisebb, mint a nagyobb mennyiség 10%-a, ezért Béla többet tévedett,
mint András.
Nevezetes arányok
Nevezetes közepek
Nevezetes arányok
Két mennyiség egyenesen arányos, ha az egyik mennyiséget valahányszorosára növelve (csökkentve) a másik mennyiség
ugyanannyiszorosára növekszik (csökken). Másként fogalmazva:
Egyenesen arányos mennyiségek pl. egyenes vonalú egyenletes mozgás esetében az út és a megtételéhez szükséges idő.
Ezek hányadosa a sebesség. Ugyancsak egyenesen arányos mennyiségek: az áru és annak az ára. Ha ugyanis k-szor annyi
árut vásárolunk, az ár is k-szorosára növekszik. Szintén egyenesen arányos mennyiségek: az erő és az általa létrehozott
gyorsulás. Ha az erőt k-szorosára növeljük, akkor az általa létrehozott gyorsulás is a k-szorosára nő.
Ha az y és x valós számok egyenesen arányosak, akkor hányadosuk állandó:
Innen látható, hogy az egyenesen arányos mennyiségek gra kus képe egy origón áthaladó félegyenes, feltételezve,
hogy x és y nem negatívok (3.6. ábra).
3.6. ábra
Két mennyiség fordítottan arányos, ha az egyik mennyiséget valahányszorosára növelve (csökkentve) a másik
mennyiség ugyanannyiad részére csökken (növekszik). Másképpen fogalmazva:
Fordítottan arányos mennyiségek pl. egy adott út megtétele esetén a megtételre fordított idő, illetve az utazás
sebessége; ha ugyanis a sebességet k-szorosára növeljük, akkor az út megtételéhez szükséges idő a k-ad részére csökken.
Ugyancsak fordítottan arányos mennyiségek az adott hőmérsékleten levő gáz nyomása és térfogata; ha a térfogatot a k-ad
részére csökkentjük, akkor a nyomás a k-szorosára növekszik.
Ha az x és y pozitív mennyiségek fordítottan arányosak, akkor
Innen kiolvasható, hogy a fordított arányosság gra kus képe egy fél hiperbolaág (3.7. ábra).
3.7. ábra
Aranymetszésnek nevezzük egy mennyiségnek (pl. egy szakasznak) két olyan részre bontását, melyek közül a kisebbik
úgy aránylik a nagyobbhoz, mint a nagyobbik az egészhez, vagy másképpen fogalmazva: az a és b mennyiségek
aranymetszeti arányban állnak, ha
emeljünk egy rá merőleges szakaszt, majd O köré rajzoljunk egy sugarú kört. A BO egyenes e kört E-
ben és F-ben metszi. A BE = x sugarú kör az AB szakaszt C-ben metszi (3.8. ábra).
3.8. ábra
A BAE és BAF háromszögek hasonlók, hiszen B-nél közös szögük van, az F-nél és A-nál levő szögek pedig egyenlők
(lásd azonos íven nyugvó kerületi szögek). Ezek szerint írhatjuk az alábbi aránypárt:
(Már ez utóbbi egyenlőség is mutat egy aranymetszeti arányt; nevezetes az x szakasz és az eredeti a szakasz ilyen
arányát.) A fenti egyenlőségből azt kapjuk:
innen pedig
Ez pedig éppen azt fejezi ki, hogy az AB szakasznak C pont az aranymetszés szerinti osztópontja, mégpedig AC a
kisebb, BC pedig a nagyobb aranymetszeti darab.
Ugyancsak aranymetszeti szakaszokhoz jutunk, ha megrajzoljuk egy szabályos háromszög köré írt körét, valamint a
háromszög egyik középvonalának egyenesét (3.9. ábra).
3.9. ábra
Ez utóbbi egyenlőség pedig pontosan azt fejezi ki, hogy az ábra EP és EF szakaszai aranymetszeti arányban állnak
egymással.
Rendkívül fontos arány a matematikában a kör kerületének és átmérőjének aránya. Ezt az arányszámot (a görög
periféria = kerület szó kezdőbetűjéről) π-vel szokás jelölni. A π szám irracionális, azaz nem írható fel két egész szám
hányadosaként, tizedes tört alakja végtelen nem szakaszos. Értéke 4 tizedesjegy pontosságig: π ≈ 3,1415…
Megjegyzés. Már az ókorban is sokat foglalkoztak a kör kerületének meghatározásával, így a π szám közelítő
értékének kiszámításával. Az ókori Egyiptomban π-t 3,1605-nek vették. Indiában a közelítést használták.
Az ókori Kínában már a körbe írható és a kör köré írható szabályos sokszögekkel közelítették meg a π-t: a III.
században Liu Huj már 5 tizedesjegy pontossággal határozta meg a π-t. A XVII. században Lambert kimutatta, hogy a
π irracionális szám, a XIX. században pedig az is kiderült, hogy a π transzcendens szám, azaz semmilyen racionális
együtthatós polinomnak nem lehet gyöke. Ma már több milliárd tizedesjegye ismert a π-nek, melyeket számítógépek
segítségével határoznak meg.
Nevezetes közepek
Ha a1, a2, …, an pozitív számok, akkor ezek S számtani, M mértani, H harmonikus és N négyzetes közepe:
Az egyenlőtlenségláncolatot könnyen igazolhatjuk algebrai úton, mi most egy geometriai úton végezzük el a
bizonyítást. Elemezzük a 3.10. ábrát!
3.10. ábra
Mivel bármely derékszögű háromszögben az átfogó a leghosszabb oldal, ezért a CDO, CEO, CEF háromszögekre
Mennyi ebben az országban az átlagos in áció? A kérdés tehát az, mekkora az az átlagos in áció, amelyre teljesül,
hogy ha mind az 5 évben ugyanannyival növekszik, akkor is ugyanazt a teljes in ációt érjük el az öt év során, mint
amennyi a valóságban is bekövetkezett. Ha ez az átlagos in áció p, akkor
vagyis az egyes évek in ációjának mértani közepe. A harmonikus közepet használjuk pl. az átlagsebesség
kiszámítására. Ha valamely S utat egy alkalommal v1, egy más alkalommal v2, egy harmadik alkalommal pedig v3
sebességgel tettünk meg, akkor kérdezhetjük, hogy mennyi volt az átlagsebességünk. Ez nyilván nem a sebességek
átlaga, hanem a teljes út és a ráfordított idő hányadosa. Az egyes időtartamok:
Így az átlagsebesség:
vagyis az eredeti sebességek harmonikus közepe.
A négyzetes közepet elsősorban a statisztikában használjuk főleg a statisztikai adatsokaság szórásának
kiszámítására.
Ha egy algebrai kifejezésben szereplő mennyiségeket csak a szorzás vagy osztás jelével kapcsoltuk össze, akkor azt
egytagú algebrai kifejezésnek mondjuk. Például
Ha az algebrai kifejezésünkben szereplő egyes mennyiségeket a + vagy a – műveleti jel is összeköti, akkor többtagú
algebrai kifejezésünk van. Például
Az első példa egy kéttagú algebrai kifejezés, a másik háromtagú, míg a harmadik egy olyan egytagú kifejezés, mely
kéttényezős szorzat: első tényezője egy kéttagú, másik tényezője egy háromtagú összeg.
A betűkifejezés előtt álló szorzót együtthatónak nevezzük, valamely kifejezés jobb felső sarkában szereplő számot (vagy
betűt) hatványkitevőnek nevezzük.
Legyen n > 1 pozitív egész szám. Ekkor an olyan n-tényezős szorzat, melynek minden tényezője a:
A hatványozás pozitív egész kitevőre történő de níciójából egyenesen következnek a hatványozás alábbi azonosságai.
1. Azonos alapú hatványokat úgy szorzunk, hogy az alapot a kitevők öszszegére emeljük:
3. Szorzatot úgy hatványozunk, hogy a szorzat minden tényezőjét a megfelelő hatványra emeljük:
4. Törtet úgy hatványozunk, hogy a számlálót is és a nevezőt is a megfelelő hatványra emeljük:
5. Azonos alapú hatványokat úgy osztunk, hogy az alapot a számláló és a nevező kitevőinek különbségére emeljük:
Példák
1. x8 · x11 = x8+11 = x19, (y6)3 · (y5)2 = y18 · y10 = y28,
2. Döntsük el, melyik szám nagyobb: 1020 vagy 2010? A megfelelő azonosság szerint 1020 így írható: 1020 = 102 · 10 =
(102)10 = 10010. Mivel 100 > 20, ezért 10010 > 2010, tehát 1020 > 2010.
Megjegyzés. A fentiekben a hatványozás fogalmával és szabályaival foglalkoztunk olyan esetekben, amikor a
hatványkitevő pozitív egész szám. A hatványfogalom kiterjesztését negatív egészekre, racionális és irracionális
kitevőkre a 3.4. fejezetben fogjuk megtenni.
Ha az algebrai kifejezésünkben a változó helyére beírunk egy valós számot, akkor az algebrai kifejezésnek a kérdéses
valós számon vett helyettesítési értékét kapjuk.
Ha két egytagú algebrai kifejezés legfeljebb csak az együtthatókban különbözik egymástól, akkor egynemű
kifejezéseknek mondjuk őket. (Tehát két algebrai kifejezés akkor egynemű, ha pontosan ugyanazok a betűk szerepelnek
mindkettőben, és a megfelelő azonos betűk ugyanazon a hatványkitevőn vannak.)
Az egynemű algebrai kifejezéseket összevonhatjuk. Ez azt jelenti, hogy az együtthatóikkal elvégezzük a megfelelő
összeadási és kivonási műveleteket, majd ezek eredménye mögé írjuk változatlan formában a kérdéses algebrai kifejezést.
A nem egynemű algebrai kifejezések nem vonhatók össze. Ha egy többtagú összegben van többfajta egynemű algebrai
kifejezésünk, akkor az egyneműeket külön-külön összevonjuk.
Példák
1. 5a – 6b + 8a + 4b = 13a – 2b.
2. 3x2y – 4xy2 + 6x2y + 8xy2 = (3x2y + 6x2y) + (8xy2 – 4xy2) = 9x2y + 4xy2.
3. 5a3b – 2a2b2 + 8ab3 + 4a2b2 + 3a3b – 7ab3 =
= (5a3b + 3a3b) + (4a2b2 – 2a2b2) + (8ab3 – 7ab3) =
= 8a3b + 2a2b2 +ab3.
Egytagú algebrai kifejezéseket úgy szorzunk, hogy az együtthatókat összeszorozzuk, majd az azonos alapú hatványokat
is összeszorozzuk, a különböző alapú hatványok szorzását pedig a szorzásjellel jelöljük.
Példák
1. 5a2x3y · 3a4y2z = 15a6y3x3z,
2.
Egytagú kifejezéseket úgy osztunk, hogy az együtthatókat, valamint az azonos alapú hatványokat elosztjuk egymással,
a különböző alapú hatványok osztását pedig törtvonallal kijelöljük.
Példák
1.
3.11. ábra
Az ábrán látható téglalap területe egyenlő egyrészt a két oldalának szorzatával, másrészt a két résztéglalap területének
összegével, vagyis
Ha egy tagot szorzunk egy n tagú összeggel, akkor a szorzat n tagú összeg lesz.
Példák
1. a2b(a + 3b – ab2) = a3b + 3a2b2 – a3b3;
2. xy(x2 – 2xy + 3y2) = x3y – 2x2y2 + 3xy3;
3.
4.
Többtagú kifejezést többtagú kifejezéssel úgy szorzunk, hogy az egyik tényező minden tagját a másik tényező minden
tagjával megszorozzuk. E szabályt – az előzőhöz hasonlóan – ugyancsak szemléltethetjük pozitív számok esetére (3.12.
ábra).
3.12. ábra
A téglalap területe egyrészt két oldalának szorzata, másrészt pedig a négy db résztéglalap területének összege:
Megjegyzés. A gyelmetlenségek elkerülése érdekében érdemes a szorzást ilyenkor úgy végezni, hogy az egyik
tényező (pl. a bal oldali tényező) első tagjával végigszorozni a jobb oldali tényező minden tagját, majd a bal oldali
tényező második tagjával végigszorozni, és így tovább addig, amíg a bal oldali tényező utolsó tagjához nem érünk;
ezzel is végigszorozzuk a jobb oldali tényező minden tagját. Így biztos, hogy minden tagot minden taggal
megszoroztunk, és pontosan egyszer.
Ha egy n tagú összeget szorzunk egy k tagú összeggel, akkor az összeg egy legfeljebb n + k tagú összeg lesz, hiszen a
szorzás elvégzése után lehetnek összevonható tagok.
Példák
1. (a + b)(2a2 – ab + 3b2) = 2a3 – a2b + 3ab2 + 2a2b – ab2 + 3b3 =
= 2a3 + a2b + 2ab2 + 3b3.
2. (x2 + 2xy)(x3 – 3xy2 + 2y) = x5 – 3x3y2 + 2x2y + 2x4y – 6x2y3 + 2xy2.
3. (2x – y2 + y)(3x – 2xy + y2) =
= 6x2 – 4x2y + 2xy2 – 3xy2 + 2xy3 – y4 + 3xy – 2xy2 + y3 =
= 6x2 – 4x2y – 3xy2 + 2xy3 – y4 + 3xy + y3.
4.
5.
Sok esetben az lehet a cél, hogy többtagú algebrai kifejezésünket szorzattá alakítsuk. Ezt akkor tehetjük meg, ha a
többtagú összeg valamennyi tagjában szerepel ugyanaz a szorzótényező. Ezt a műveletet kiemelésnek nevezzük. Az alábbi
egyszerű példában egy olyan 3 tagú összeg szerepel, melynek mindhárom tagjában szerepel az a szorzótényező, így ezt
kiemelve az összeget szorzattá alakíthatjuk:
Példák
1. ax2 + 2a2bx – 3acx = ax(x + 2ab – 3c);
2. 4p2qr + 2pq2r – 6pqr2 + 2xpqr = 2pqr(2p + q – 3r + x);
3. ax + by + bx + ay = x(a + b) + y(b + a) = (a + b)(x + y);
4. 2a2x + 6by – a2z – 2bz + 4bx + 3a2y = a2(2x – z + 3y) + 2b(2x – z + 3y) =
= (2x – z + 3y)(a2 + 2b).
Megjegyzés. A 3. példában először az első és a negyedik tagból emeltünk ki a-t, majd a második és a harmadik tagból
b-t. A kapott kéttagú összeg mindkét tagjában szorzótényezőként szerepel (a + b), így második lépésként ezt is
kiemelhettük. A 4. példában előbb az első, a harmadik és a hatodik tagból emeltünk ki a2-et, majd a második, a
negyedik és az ötödik tagból 2b-t, majd a kapott kéttagú összeg mindkét tagjából emeltünk ki 2x – z + 3y-t.
Két tag különbségének négyzete egyenlő az első tag négyzetének és a második tag négyzetének az összegéből kivonva a
két tag szorzatának kétszeresét:
Két tag összegének és ugyanazon két tag különbségének szorzata egyenlő a két tag négyzetének különbségével:
Példák
1. (2x + 3y)2 = 4x2 + 9y2 + 12xy;
2. (3a2b + 4ab2)2 = 9a4b2 + 16a2b4 + 24a3b3;
3.
Általában: két tag n-edik hatványának különbsége minden n-re osztható a – b-vel:
an – bn = (a – b)(an–1 + an–2b + an–3b2 + an–4b3 + … + a2bn–3 + abn–2 + bn–1).
Érdemes meg gyelni, hogy a második zárójelben egy olyan n tagú összeg szerepel, melyben az a hatványkitevője
rendre eggyel csökken, míg ezzel párhuzamosan a b kitevője eggyel növekszik.
Míg két tag n-edik hatványának különbsége minden n-re osztható az alapok különbségével, addig ugyanez két tag n-
edik hatványának összegéről már nem mondható el. Két tag n-edik hatványának összege akkor és csak akkor osztható az
alapok összegével, ha n páratlan. Ekkor
Megjegyzés. Két tag összegének, illetve különbségének harmadik, negyedik és általában n-edik hatványát a 23.,
Kombinatorika című fejezetben tárgyaljuk.
Példák
1. Igazoljuk, hogy 1313 + 1 osztható 14-gyel!
Mivel 1 minden hatványa 1, ezért írhatjuk: 1313 + 113. A hatványkitevő mindkét tagban páratlan, így a kéttagú
összeg osztható az alapok összegével, azaz 14-gyel.
2. Igazoljuk, hogy 1818 –1 osztható 323-mal!
A kapott kéttényezős szorzat első tényezője osztható az alapok különbségével, azaz 17-tel. A második tényező
viszont osztható az alapok összegével, 19-cel, hiszen a hatványkitevő páratlan. Ezek szerint a szorzat osztható 17-
tel és 19-cel. Mivel e két szám relatív prím, így a szorzat osztható 17 · 19 = 323-mal.
Fontos nevezetes azonosság még három-, négy-, illetve többtagú összeg négyzete.
Többtagú összeg négyzetében szerepel minden tag négyzete, valamint bármely két tag szorzatának kétszerese:
Ennek megfelelően egy n tagú összegben az egyes tagok négyzetének összege n tagú összeg, az egyes kétszeres szorzatok
száma pedig
Példák
1. (x + 2y – z)2 = x2 + 4y2 + z2 + 4xy – 2xz – 4yz;
2. (3x – 4xy + 2y – y2)2 =
= 9x2 + 16x2y2 + 4y2 + y4 – 24x2y + 12xy – 6xy2 – 16xy2 + 8xy3 – 4y3 =
= 9x2 + 16x2y2 + 4y2 + y4 – 24x2y + 12xy – 22xy2 + 8xy3 – 4y3.
Többtagú algebrai kifejezés osztása egytagú algebrai kifejezéssel úgy történik, hogy az osztandó minden tagját
elosztjuk az egytagú osztóval, majd az így kapott hányadosokat összeadjuk.
Példák
1.
2.
Többtagú algebrai kifejezés osztása több taggal már kicsit bonyolultabb, nagy oda gyelést igényel. Mielőtt az osztást
elvégezzük, érdemes az osztót és az osztandót is valamelyik, de ugyanazon változó szerint fogyó hatványokként sorba
rendezni. Ezek után az osztást a következő módon végezzük el. Az osztandó első tagját elosztjuk az osztó első tagjával, így
megkapjuk a hányados első tagját. A kapott taggal megszorozzuk az osztó minden tagját, majd a kapott szorzatot kivonjuk
az osztandóból. A maradék rendezése után annak első tagját újra elosztjuk az osztó első tagjával, az eredmény lesz a
hányados második tagja. Ezzel ismét megszorozzuk az osztó minden tagját, s a kapott szorzatot levonjuk az utolsó
maradékból. Ezt az eljárást egészen addig folytatjuk, amíg a maradék vagy 0 lesz, vagy egy, az osztónál alacsonyabb fokú
algebrai kifejezés.
Példa
Algebrai törtnek mondjuk az olyan algebrai kifejezéseket, melyek számlálójában is és nevezőjében is egy- vagy
többtagú algebrai kifejezések szerepelnek. Ilyenek például az alábbi törtek:
Az algebrai törteknek természetesen csak akkor van értelmük, ha a nevezőjük nem 0. Az algebrai tört értelmezési
tartománya a valós számoknak az a részhalmaza, melynek elemeire az algebrai tört nevezője nem 0. A fenti példák közül az
első tört értelmezhető minden olyan x és y valós számra, melyekre y ≠ – 2x, a második tört minden olyan a és x valós számra
értelmezhető, melyekre 2x ≠ a, a harmadik tört pedig minden p valós számra értelmezhető, hiszen p2 + 1 > 0 minden p
esetén.
Az algebrai törteket – ugyanúgy, ahogyan ezt a 3.1. fejezetben is láttuk – bővíthetjük és egyszerűsíthetjük, de
vigyáznunk kell arra, hogy bővítés vagy egyszerűsítés esetén a tört értelmezési tartománya megváltozhat. Bővítéskor a
számlálót és a nevezőt ugyanazzal a 0-tól különböző algebrai kifejezéssel szorozzuk, egyszerűsítéskor pedig a számlálót és a
nevezőt ugyanazzal a nem 0 algebrai kifejezéssel osztjuk. Leggyakrabban az egyszerűsítés igénye merül fel, így sok esetben
célszerűnek látszik a tört számlálóját is és a nevezőjét is megpróbálni szorzattá alakítani. Ehhez, ha lehet, a kiemelés
módszerét vagy pedig a már ismertetett nevezetes szorzatokat alkalmazzuk.
2.
3.
4.
5.
6.
Megjegyzés. A 6. példa esetén a számlálóban és a nevezőben is az első három tag egy-egy teljes négyzet, először ezeket
írtuk ki. Ezután a számlálóban és a nevezőben is két négyzet különbsége jelent meg, melyet már könnyen szorzattá
alakíthattunk.
Az algebrai törtek összeadása és kivonása ugyanúgy történik, ahogyan azt a 3.1. fejezetben egész számok esetében
láttuk. Az azonos nevezőjű törtek számlálóival elvégezzük a megfelelő összeadási, kivonási műveleteket, a kapott
eredmény lesz a számláló, a nevezőt pedig változatlanul leírjuk.
Különböző nevezőjű törtek esetében először meghatározzuk a közös nevezőt. Ez a nevezők legkisebb közös többszöröse
lesz. Az egyes törteket bővítjük azzal a mennyiséggel, mellyel a kérdéses tört nevezőjét megszorozva az a közös nevezővé
válik. Ez után a törtek már azonos nevezőjűek lesznek, így már csak – az előbb írtak alapján – a számlálóikat kell
összevonnunk.
Példák
1.
2.
3.
4.
Algebrai törtek szorzásánál és osztásánál a 3.1. fejezetben már megismert szabályt használjuk.
Törtet egésszel úgy szorzunk, hogy a számlálót megszorozzuk a kérdéses egésszel, a nevezőt változatlanul hagyjuk.
Törtet törttel úgy szorzunk, hogy a számlálókat is és a nevezőket is összeszorozzuk. A számlálók szorzata lesz a szorzat
számlálója, a nevezők szorzata lesz a szorzat nevezője.
Törtet egésszel úgy osztunk, hogy a tört nevezőjét megszorozzuk az osztóval.
Törtet törttel úgy osztunk, hogy az osztandó törtet megszorozzuk az osztó tört reciprokával.
Megjegyzés. Mivel az algebrai „egész“ kifejezés úgy is értelmezhető, hogy olyan tört, melynek a nevezője 1, ezért e
mostani szabályok röviden így is összefoglalhatók: törtet törttel úgy szorzunk, hogy a számlálót a számlálóval,
nevezőt a nevezővel szorozzuk, illetve törtet törttel úgy osztunk, hogy az osztó reciprokával szorzunk.
Példák
1.
2.
3.
4.
Gyakran előfordul, hogy olyan törttel van dolgunk, melynek a számlálójában és/vagy a nevezőjében is egy-egy tört
szerepel. Az ilyen törteket emeletes törteknek nevezzük. Az emeletes törtek vizsgálatánál célszerű úgy eljárni, hogy a
számlálót elosztjuk a nevező reciprokával, így könnyebben kezelhető algebrai törtet kapunk:
Ha a számláló vagy a nevező nem tört, hanem algebrai egész, akkor nagyon fontos legelőször megállapítanunk, hogy
melyik törtvonal az ún. „fő törtvonal“; ez alapvetően befolyásolja a tört értékét. Például
Példák
1.
2.
3.
4.
Az algebrai kifejezésekkel, algebrai törtekkel való műveletek gyakorlására tekintsük az alábbi összetettebb kidolgozott
példákat.
Példák
1. Hozzuk egyszerűbb alakra az alábbi algebrai kifejezést:
A megfelelő nevezetes szorzatokat és a törttel való osztás szabályát alkalmazva azt kapjuk:
Tehát
4. Bizonyítsuk be, hogy ha k egy 0-tól különböző egész szám, akkor az alábbi kifejezés értéke is egész szám!
Először az emeletes törteket alakítjuk át, majd közös nevezőre hozva a zárójelben levő két törtet összeadjuk:
Gyökvonás
A hatványozás kiterjesztése
Logaritmus
Gyökvonás
Először ismerkedjünk meg a négyzetgyök fogalmával.
(„négyzetgyök a“) az a nem negatív valós szám, melynek négyzete a.
Mivel egy valós szám négyzete nem lehet negatív, ezért -nak csak akkor van értelme, ha a ≥ 0. Tehát a
vonatkozásában a „nem negatív“ kitétel kétféle értelemben szerepel: egyrészt, nem negatív, másrészt a nem
negatív. Mindebből következnek az alábbi egyszerű példák:
Ha valamely négyzetgyökös kifejezés előtt álló szorzótényezőt be akarjuk vinni a négyzetgyök alá, akkor azt négyzetre
kell emelnünk. Ha a négyzetgyök alatti szorzótényezőt ki akarjuk vinni a négyzetgyök előtti szorzóvá, akkor abból
négyzetgyököt kell vonnunk.
2.
3.
4.
Az kifejezésében szereplő n-et gyökkitevőnek hívjuk. Azt látjuk, hogy páratlan n esetén értéke lehet
negatív, amiből következik, hogy ekkor a is lehet negatív. Például:
Mindebből következik, hogy nem változik egy mennyiség értéke, ha abból n-edik gyököt vonunk, majd ezt követően az
n-edik hatványra emeljük a kérdéses mennyiséget.
Ha valamely n-edik gyökös kifejezés előtt álló szorzótényezőt be akarjuk vinni az n-edik gyök alá, akkor azt n-edik
hatványra kell emelnünk. Ha az n-edik gyök alatti szorzótényezőt ki akarjuk vinni az n-edik gyök előtti szorzóvá, akkor
abból n-edik gyököt kell vonnunk.
4.
5.
6.
7.
8.
Gyakran előfordul, hogy különböző gyökkitevőjű kifejezéseket kell összeszoroznunk vagy osztanunk. Ilyenkor a
következőképpen járunk el: az egyik (esetleg mindkét) tényezőből megfelelő gyökkitevőjű gyököt vonva és ugyanannyiadik
hatványra emelve elérjük, hogy mindkét tényező ugyanannyiadik gyök alatt szerepeljen. Így elérve, hogy már közös
gyökkitevőn vannak a tényezők, elvégezzük a szorzást, illetve az osztást. A közös gyökkitevő általában az egyes
gyökkitevők legkisebb közös többszöröse lesz.
Példák
1.
2.
3.
4.
A törtkifejezésekkel kényelmesebben tudunk számolni, ha a tört nevezője nem tartalmaz gyökös kifejezést. Ezért
gyakran fordul elő, hogy el akarjuk érni a nevező gyöktelenítését. Amennyiben a tört nevezője egytagú négyzetgyökös
kifejezés, akkor könnyű dolgunk van; egyszerűen bővítjük a törtet a nevezővel, azaz a számlálót is és a nevezőt is
megszorozzuk a tört nevezőjével.
Példák
1.
2.
3.
4.
Ha a tört nevezője kéttagú kifejezés, melyek közül az egyik tag (esetleg mindkettő) négyzetgyökös kifejezés, akkor az (a
+ b) (a – b) = a2 – b2 azonosság felhasználásával bővítjük a törtet a nevező konjugáltjával, azaz, ha a nevező x + y alakú, akkor
x – y-nal, ha a nevező x – y alakú, akkor x + y-nal.
Példák
1.
2.
3.
4.
Ha a tört nevezője háromtagú, akkor először két tagot egynek tekintve (zárójelbe téve a két tagot), első lépésben
elérjük, hogy már csak kéttagú gyökös kifejezés lesz a nevezőben, majd az eljárást megismételve elérjük, hogy a nevező már
nem tartalmaz négyzetgyököt. Szintén két lépésben érjük el a négyzetgyökmentes nevezőt, ha a nevezőben egytagú gyökös
kifejezés áll, de e négyzetgyök alatt két vagy többtagú összeg szerepel.
Példák
1.
2.
A hatványozás kiterjesztése
A 3.3. fejezetben megismerkedtünk a hatványozás fogalmával és legfontosabb azonosságaival abban az esetben, amikor a
hatványkitevő pozitív egész szám. Most rátérünk a hatványozás fogalmának kiterjesztésére bármilyen egész, illetve
racionális, irracionális hatványkitevőre.
Ezen de níciók alapján most már bármilyen racionális számra értelmezni tudjuk a hatványozást. A hatványozás
fogalmának kiterjesztésekor alapvető cél, hogy a hatványozás 3.1. fejezetben megismert azonosságai továbbra is érvényben
maradjanak. Bizonyítható, hogy ha a 0, negatív, illetve tört kitevőjű hatványokat a fenti módon de niáljuk, akkor a
hatványozás eddigi azonosságai érvényben maradnak.
Megjegyzés. Nem értelmezzük negatív számok tört kitevőjű hatványát. Ennek oka a következő: nyilvánvaló ennek
értelmezése nem függhet attól, hogy a kitevőben levő törtet milyen alakban adjuk meg.
már értelmezhető. Innen már látható, hogy negatív szám tört kitevőjű
hatványának nem tudunk használható módon értelmet adni.
Példák
1.
Logaritmus
Ha az an = b egyenlőségben ismert az a alap, valamint a hatvány értéke b, és keressük az n hatványkitevő értékét, akkor a
logaritmus fogalma vezethet el bennünket az ismeretlenhez.
Legyenek a > 0, b > 0 és a ≠ 1. Ekkor logab („a alapú logaritmus b”) jelenti azt a hatványkitevőt, melyre a-t emelve b-t
kapunk:
Mivel bármely pozitív szám 0-dik hatványa 1, továbbá bármely pozitív szám első hatványa magával a számmal egyenlő,
ezért
Leggyakrabban a 10-es alapú, valamint a természetes e alapú logaritmusokat használjuk; ezeket megkülönböztetésül
lg-vel, illetve ln-nel jelöljük: log10… = lg … és loge … = ln …
Példák
1.
2.
3.
Megjegyzés. A logaritmus fogalma és a vele való számolási eljárás a XVI. században alakult ki Joost Bürgi (1552–1632)
és John Napier (1550–1617) munkássága kapcsán. Bürgi svájci órásmester volt, két évtizeden át Kepler munkatársa. A
hosszadalmas számítások megkönnyítésére keresett valamilyen megoldást, amikor észrevette, hogy ha a kérdéses
számokat valamilyen szám hatványaként írja fel, s a számításokat a hatványkitevőkkel való számolásra vezeti vissza,
akkor az egyes műveletek (hatványozás, szorzás) rendre alacsonyabb rendű műveletek végzésére vezetődik vissza,
így jóval egyszerűbbé válnak a számítások. Ennek megfelelően elkészítette az első logaritmustáblázatokat. Napier
skót matematikus volt, aki Bürgihez hasonló gondolatmenet alapján jutott el a logaritmus fogalmához. Ő már
szögfüggvények logaritmusaival is foglalkozott.
Megjegyzés. Vigyázzunk! Hatvány logaritmusa, illetve logaritmus hatványa két lényegesen különböző dolgot
jelentenek. Hatvány logaritmusánál először a hatványozást végezzük el, majd a kapott hatványnak keressük a
megfelelő alapú logaritmusát. Logaritmus hatványánál először a logaritmust számoljuk ki, majd a kapott
mennyiséget hatványozzuk. Például
Példaként bebizonyítjuk az első azonosságot. Legyen loga x = c és loga y = d! Ekkor x = ac és y = ad. E két utóbbi
egyenlőséget összeszorozva azt kapjuk: xy = ac · adac+d. Ez viszont a logaritmus de níciója alapján azt jelenti, hogy
loga (xy) = c + d. Ha most visszaírjuk c és d jelentését, megkapjuk a bizonyítandó állítást:
Példák
1. a)
b)
c)
b)
c)
b)
c)
Gyakran előfordul, hogy egy logaritmikus kifejezés értékét kell meghatároznunk, de a kifejezésben szereplő
logaritmus alapjával rendelkező táblázatunk nincs. (A kézi számológépek is általában 10-es és e alapú logaritmusra vannak
csupán beprogramozva.) Ilyenkor használhatjuk az új alapra való áttérés tételét.
Legyen ugyanis logab = x. Ekkor ax = b. Vegyük ez utóbbi egyenlőség mindkét oldalának c alapú logaritmusát: logc ax
Számolás 10-es alapú logaritmussal. A gyakori és nehézkes számolások elvégzéséhez elsősorban a 10-es alapú
logaritmustáblázatok, illetve a 10-es alapra programozott zsebszámológépek nyújtanak segítséget. Ehhez először a kérdéses
valós számokat át kell írnunk normálalakra.
Minden pozitív valós szám felírható két olyan szám szorzataként, melyek közül az egyik 1 és 10 közötti szám, a másik
pedig 10-nek egész kitevőjű hatványa. A számok ilyen alakját a szám normálalakjának mondjuk.
Például: 3456 = 3,456 · 103, 534,62 = 5,3462 · 102, 0,000 382 = 3,82 · 10–4. Ha most ezeknek a számoknak 10-es alapú
logaritmusát szeretnénk közelítőleg megkapni, akkor a következőképpen járhatunk el: alkalmazva a logaritmus
megfelelő azonosságait, valamint a logaritmus fogalmát:
Most nézzük visszafelé: ha ismerjük valamely szám 10-es alapú logaritmusát, akkor azt átírva 10 hatványaként,
táblázat vagy számológép segítségével meghatározhatjuk a kérdéses számot. (Természetesen az esetek többségében
csak e számok közelítő értékét.) Ha lg x = 3,2245, akkor x = 103,2245 = 103+0,2245 = 103 · 100,2245 ≈ 1000 · 0,67 687 ≈ 676,87.
Ha lg x = –2,145, akkor x = 10–2,145 = 10–3+0,855 = 10–3 · 100,855 ≈ 10–3 · 7,1614 ≈ 0,007 1614. Példák
1. Számítsuk ki x közelítő értékét a 10-es alapú logaritmus segítségével!
Először a logaritmus megfelelő azonosságainak alkalmazásával határozzuk meg lg x-et, majd az egyes számok 10-
es alapú logaritmusát zsebszámológép segítségével meghatározva és elvégezve a műveleteket megkapjuk lg x
numerikus értékét. Ezután x-et 10 hatványaként felírva eljutunk x értékéhez:
3. Kísérleti úton állapították meg az ún. lehűlési törvényt, mely szerint az ahhoz szükséges t idő (percekben mérve),
hogy egy T0 hőmérsékletű tárgy K hőmérsékletű környezetben T hőmérsékletre lehűljön:
ahol k egy, a kérdéses anyagra jellemző állandó. Kb. mennyi idő alatt hűl le a sütőből kivett sült kacsa 95 °C-ról 60
°C-ra, ha a konyha hőmérséklete 22 °C, és a sült kacsa esetében k ≈ 22,4 perc?
Esetünkben T0 = 95 °C, K = 22 °C, T = 60 °C. Tehát a szükséges t idő:
4. Tapasztalati mérések alapján a tücsök H ciripelési frekvenciájának mérőszáma a °C-ban mért t hőmérséklettől és
a tengerszint feletti méterben mért m magasságtól függ az alábbi módon:
ahol k a kérdéses tücsökfajtára jellemző állandó. H0 a tengerszinten mért frekvencia, m a tengerszint feletti
magasság méterben, t pedig a °C-ban mért hőmérséklet. Egy tücsök ciripelési frekvenciája 320 m magasságon 110.
Mekkora itt a hőmérséklet, ha e tücsökfajtára nézve k = 6,8 és H0 = 80?
A feladat feltételei szerint a egyenletet kell megoldanunk.
Innen
Vegyük mindkét oldal 10-es alapú logaritmusát:
3.5. Számrendszerek
A számok jelzésére, leírására a különböző korok, különböző civilizációk különféle módszereket dolgoztak ki. Valamennyi
módszer lényege az volt, hogy a kérdéses mennyiséget (darabszámot) csoportokba sorolták, s valamilyen módon azt
jelezték, hogy az egyes csoportból hány darab keletkezett. Legtöbb helyen a 10-es számrendszer alakult ki, de használatos
volt pl. a 6-os, 12-es vagy éppen a 60-as számrendszer is.
Vizsgáljuk meg például a 10-es számrendszer működését. Legyen egy nagyobb mennyiségű korongunk. Ezeket először
10-es csoportokba rakjuk (természetesen előfordulhat, hogy az utolsó csoportba már nem jut 10 db, csak annál kevesebb).
Ezután a 10-es csoportokat 10-esével csomagokba helyezzük; így egy csomagban már 102 = 100 db korong lesz. Utána a
csomagokat 10-esével dobozokba helyezzük, így egy dobozban 103 = 1000 db korong lesz, és így tovább folytatjuk az eljárást,
amíg a korongok elfogynak. Így lesznek 1-esek, 10-esek, százasok, ezresek stb. Természetesen mindegyikből legfeljebb 9
lehet, hiszen, ha valamelyik fajtából 10 (vagy annál több) lenne, akkor az már egy nagyobb egységet alkotna. Ezek szerint a
10-es számrendszerben 10 db számjegyet különböztethetünk meg. Egy számjegynek van alaki értéke, ami megmutatja,
hogy a kérdéses 10-hatványból hány darab szerepel a kérdéses számban, és van helyi értéke, ami azt mutatja meg, hogy
(jobbról balra haladva) a kérdéses számjegy 10 hányadik hatványának a mérőszámát jelenti. Például
Hasonló gondolatmenettel jutunk a 2-es számrendszerhez. Itt – az előbbi gondolatmenetet követve – a korongokat nem
10-esével, hanem 2-esével csoportosítjuk, ennek megfelelően a 2-es számrendszerben csak két számjegy létezik: a 0 és az 1. A
2-es számrendszerben az egyes helyi értékek 2 hatványai lesznek: 1, 2, 22, 23, 24 stb.
Általában, ha a számrendszer alapszámát c-vel jelöljük, akkor ebben a számrendszerben c db számjegy létezik, és az
egyes helyi értékek c hatványai: 1, c, c2, c3, c4 stb. A leírt számok jobb alsó sarkában jelezzük, hogy a kérdéses számot melyik
számrendszerben írtuk fel. 23024 a 4-es, 11011012 a 2-es, 530416 a 6-os számrendszerben felírt számok.
Vizsgáljuk meg, hogyan tudunk átváltani 10-es számrendszerbeli számot 2-es számrendszerbeli számra és fordítva.
Legyen pl. 3761 egy 10-es számrendszerben felírt szám, és váltsuk ezt át 2-es számrendszerbeli számmá.
2 hatványai:
20 21 22 23 24 25 26 27 28 29 210 211
A 3761-be „beleférő“ legnagyobb 2-hatvány: 211 = 2048, tehát 211-ből lesz 1 db. A még megmaradt szám: 3761–2048 = 1713.
Ebbe „belefér“ 210 = 1024, tehát ebből is lesz 1 db. A megmaradó szám: 1713 – 1024 = 689. Ebbe belefér a 29 = 512, tehát ebből is
lesz egy db. A megmaradó szám: 689 – 512 = 177. Ebbe a 28 = 256 nem fér bele, így 28-ból nem lesz (azaz 0 db lesz). A következő
helyi érték, a 27 = 128, ami belefér a 177-be, így 27-ből lesz 1 db, és a megmaradó szám 177 – 128 = 49. Ebbe 26 = 64 nem fér bele,
tehát 26-ból is 0 db lesz, de 25 = 32 belefér, így 25-ből lesz 1 db. A megmaradó szám: 49 – 32 = 17. Ebbe belefér a 24 = 16, tehát 24-
ből is lesz 1 db, a megmaradó szám: 17 – 16 = 1. Ebbe sem 23, sem 22, sem 21 nem fér bele, így ezekből 0 db lesz, végül
megmaradt a 20 = 1.
Tehát 3761 a 2-es számrendszerben így néz ki:
Most vizsgáljuk fordítva: mi lesz a 10-es számrendszerben az 11001012 2-es számrendszerben felírt szám? Látható, hogy
a felírt számban szerepel 26, 25, 22 és 20. Tehát
Az alábbi táblázat a 2-es, 3-as, 6-os, 8-as és a 10-es számrendszer első néhány helyi értékét tartalmazza.
számrendszer
0. 1 1 1 1 1
1. 2 3 6 8 10
2. 4 9 36 64 100
Példák
1. Írjuk át 10-es számrendszerbe az alábbi számokat:
a) 330214, b) 2100123, c) 51036,
b) 330214 = 3 · 44 + 3 · 43+0 · 42+2 · 41 + 1 · 40 = 768 + 192 + 8 + 1 = 969,
c) 2100123 = 2 · 35 + 1 · 34 + 0 · 33 + 0 · 32 + 1 · 31 + 2 · 30 = 486 + 81 + 3 + 2 = 542,
d) 51036 = 5 · 63 + 1 · 62 + 0 · 61 + 3 · 60 = 1080 + 36 + 3 = 1119.
2. Végezzük el az alábbi 10-es számrendszerbeli összeadást! Ezután írjuk át az összeadandókat 2-es számrendszerbe,
végezzük el ott is az összeadást, és ellenőrizzük, hogy a 2-es számrendszerben kapott eredmény egyenlő a 10-es
számrendszerben kapott eredménnyel!
Most adjuk össze e két 2-es számrendszerbeli számot! (Vigyázzunk! A „tízes átlépés“ most kettes átlépés, hiszen a
számrendszer alapszáma most 2.)
3. Egy derékszögű háromszög oldalai egész számok, valamely számrendszerben: 12, 110, 111. Mekkorák az oldalak a
10-es számrendszerben?
Legyen a számrendszer alapszáma x, és írjuk fel e háromszögre Pitagorasz tételét (lásd 5.4. fejezet)
Ez utóbbi másodfokú egyenlet megoldásai (lásd a 3.6. fejezetet) x1 = 3, x2 = –1. A negatív megoldás nyilván nem
jöhet számításba, így a számrendszer keresett alapszáma: x = 3.
4. Melyik az a számrendszer, amelyben az 1122 alakú szám nagyobb, mint a kétszer akkora alapú számrendszerben
felírt 112 alakú szám?
Most az 1122x < 1122x egyenlőtlenséget kell megoldanunk. Kiírva részletesen:
Mivel egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, ezért az eredeti egyenlet gyökei: x = 6 és x = 1.
Az egyenletek osztályozásánál két szempont szerint járunk el. Osztályozhatjuk az egyenleteket a bennük szereplő
ismeretlenek száma szerint: vagyis megkülönböztetünk egy- vagy többismeretlenes egyenletet, illetve egyenletrendszert.
Osztályozhatjuk az egyenleteket a bennük szereplő ismeretlenek fokszáma szerint: így megkülönböztetünk első-, másod-,
n-edfokú algebrai egyenleteket.
alakú, vagy ekvivalens átalakítások után ilyen alakra hozható, ahol a ≠ 0. Innen először mindkét oldalból b-t elvéve, majd
mindkét oldalt a-val elosztva kapjuk az egyenlet megoldását:
Ez valóban kielégíti az eredeti egyenletet, hiszen
Az elsőfokú egyismeretlenes egyenletek megoldása során általában a következő lépéseket célszerű követni.
1. Először törtmentesítjük az egyenletet (ez általában az egyenletben előforduló törtek közös nevezőjével való szorzást jelenti).
2. Elvégezzük a kijelölt műveleteket (ez általában az egyenletben előforduló zárójelek felbontását jelenti).
3. Összevonjuk az egyenlet mindkét oldalán az összevonható tagokat.
4. Megfelelő átalakításokkal elérjük, hogy az ismeretlen csak az egyik oldalon, az ismertnek tekinthető mennyiségek pedig a
másik oldalon szerepeljenek (ez után a lépés után jutunk el az ax = –b alakra).
5. Mindkét oldalt elosztjuk az ismeretlen együtthatójával.
6. Elvégezzük az ellenőrzést.
Most az ismeretleneket egy oldalra, egyebeket a másik oldalra csoportosítjuk, azaz elveszünk mindkét oldalból
9x-et, és mindkét oldalhoz hozzáadunk 4-et:
Ez utóbb kapott egyenlőséget egyetlen valós szám sem elégíti ki, így az eredeti egyenletnek nincs valós száma.
3. ax + b = x + 2b.
Vonjunk ki mindkét oldalból x-et és b-t. Azt kapjuk: ax – x = b.
Emeljük ki a bal oldalon x-et:
Most szeretnénk elosztani mindkét oldalt a – 1-gyel, de meg kell vizsgálnunk, hogyan alakul az eredeti egyenlet,
ha ez 0, azaz a = 1. Ekkor az eredeti egyenlet
Ha most b = 0, akkor az eredeti egyenletet bármely valós szám kielégíti. Ha b ≠ 0 akkor az egyenletnek nincs
megoldása.
Ha a ≠ 1 akkor oszthatunk a – 1-gyel, így ekkor az eredeti egyenlet megoldása:
4.
Mindkét oldalt megszorozzuk a közös nevezővel, ab-vel:
Most szeretnénk osztani mindkét oldalt b – a-val. Ha ez 0, azaz a = b, akkor az eredeti egyenlet így alakul:
Ellenőrzés:
5. Mekkora legyen az a paraméter értéke, hogy az alábbi egyenlet megoldása x = 1 legyen?
(3.1)
alakú egyenleteket, ahol tehát két ismeretlen szerepel és mindkettő első fokon. Ennek az egyenletnek a megoldása x-re
nézve:
Ha most y-nak tetszőleges értéket adunk, akkor x-re más és más értékeket kapunk. Az így adódó x, y rendezett
számpárok adják a (3.1) egyenlet megoldáshalmazát. Tehát a (3.1) egyenletnek végtelen sok megoldása van.
Legyen adott két kétismeretlenes elsőfokú egyenlet, és keressük azokat az x, y rendezett számpárokat, melyek mindkét
egyenletet kielégítik. Ekkor elsőfokú kétismeretlenes egyenletrendszert kapunk:
(3.2)
akkor az egyenletrendszernek van egyértelmű megoldása, vagyis egyetlen olyan x, y számpár, mely mindkét egyenletet
kielégíti.
2. Ha az egyik egyenletet valamilyen számmal megszorozva éppen a másik egyenletet kapjuk, vagyis
akkor az egyenletrendszernek végtelen sok megoldása van. (Ekkor tulajdonképpen – bár formailag két egyenletünk van –
csak egy egyenlet áll rendelkezésünkre.)
3. Ha az egyik egyenlet bal oldala számszorosa a másik egyenlet bal oldalának, de a jobb oldal nem, vagyis
akkor a két egyenlet ellentmond egymásnak, vagyis az eredeti egyenletrendszernek nincs megoldása.
A (3.2) egyenletrendszer megoldására több módszer ismeretes, mi most három módszert mutatunk be.
Egyenlő együtthatók módszere. E módszernek az a lényege, hogy valamelyik egyenletet (esetleg mindkettőt) szorozzuk
meg egy-egy alkalmas számmal úgy, hogy a szorzás után valamelyik ismeretlen együtthatói megegyezzenek. Ezután a két
egyenletet kivonva egymásból, az egyik ismeretlen kiesik (éppen az, amelynek együtthatói egyenlők), így egyismeretlenes
egyenlethez jutunk; ezt megoldjuk, majd a kérdéses ismeretlen kapott értékét visszahelyettesítjük az eredeti (3.2)
egyenletrendszer valamelyik egyenletébe, így eljutunk a másik ismeretlenhez is.
Behelyettesítő módszer. Valamelyik egyenletből kifejezzük az egyik ismeretlent, majd azt behelyettesítjük a másik
egyenletbe. Ezáltal egy egyismeretlenes egyenlethez jutunk, azt megoldjuk, s a kapott gyököt visszahelyettesítjük
valamelyik eredeti egyenletbe, így eljutunk a másik ismeretlenhez is.
E két egyenlet különbsége: 19y = 57, ahonnan y = 3. Ezt visszahelyettesítve pl. az első egyenletbe: 2x – 21 = –20,
A kapott két egyenlet különbsége: 41y = 82, ahonnan y = 2. Ezt valamelyik (pl. az első) egyenletbe
visszahelyettesítve x = 1 adódik. Tehát az egyenletrendszer megoldása: x = 1, y = 2.
3. 2x – y = 12,
3x + 4y = 34,5.
Legcélszerűbb az első egyenletből y-t kifejezni, hiszen ennek együtthatója –1. y = 2x – 12. Ezt a második egyenletbe
helyettesítve azt kapjuk:
Először mindkét egyenletet ax + by = c alakra kell hoznunk. Az első egyenletet 5-tel, a másodikat 30-cal szorozva,
majd megfelelően rendezve az egyenleteket azt kapjuk:
Ezek után képezzük a Dx determinánst oly módon, hogy a D determinánsból elhagyjuk az x együtthatóit, és helyükre a
jobb oldali c konstansokat írjuk:
Ez az ún. Cramer-szabály. Világos, hogy az egyértelmű megoldás szükséges és elégséges feltétele, hogy
Az egyes determinánsok:
Az egyenletrendszer megoldása:
Megjegyzés. A három ismeretlent tartalmazó, három egyenletből álló, illetve n ismeretlent tartalmazó, n
egyenletből álló n ismeretlenes elsőfokú (lineáris) egyenletrendszerekkel, a hozzájuk tartozó determinánsokkal és
azok tulajdonságaival a 11. fejezetben fogunk megismerkedni.
Másodfokú egyenletek
Egyismeretlenes másodfokú egyenletnek mondjuk az
(3.3)
alakú, vagy ilyen alakra hozható egyenleteket. Tehát azokat az egyenleteket, melyekben az ismeretlen legmagasabb fokon a
másodikon szerepel.
A (3.3) egyenlet tiszta másodfokú egyenlet, ha az elsőfokú tag együtthatója 0, b = 0. Ekkor
Innen mindkét oldalból c-t elvéve, majd mindkét oldalt a-val elosztva
A kapott gyökökből világos, hogy az ilyen típusú egyenletnek akkor és csak akkor van valós megoldása, ha a c konstans
és a másodfokú tag a együtthatójának előjele különböző.
A (3.3) egyenletet hiányos másodfokú egyenletnek nevezzük, ha (3.3)-ban c = 0. Ekkor
Mivel egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, kapjuk az egyenlet két valós gyökét:
A másodfokú egyenlet megoldásainak a száma a négyzetgyök alatti kifejezéstől függ. A D = b2 – 4ac mennyiséget a
másodfokú egyenlet (másodfokú kifejezés) diszkriminánsának nevezzük. Ha ez negatív, akkor a négyzetgyökvonás nem
végezhető el a valós számok körében, így ekkor a (3.3) egyenletnek nincs valós megoldása.
Ha D > 0, akkor a másodfokú egyenletnek két különböző valós gyöke van.
Ha D = 0, akkor a másodfokú egyenletnek egy valós gyöke van.
Ha D < 0, akkor a másodfokú egyenletnek nincs valós gyöke.
Megjegyzés. D < 0 esetén a négyzetgyök alatti negatív számnak a négyzetgyöke komplex szám, így ekkor a másodfokú
egyenletnek komplex gyökei vannak (lásd 21. fejezet).
Példák. Oldjuk meg az alábbi másodfokú egyenleteket!
1. 3x2 + 20x – 7 = 0. A megoldóképlet szerint
2.
Mielőtt a megoldóképletet használnánk, az egyenletet (3.3) alakra kell hoznunk:
3. 3x2 + 6x – 1 = 2x2 + 8x – 8. először ismét 0-ra rendezzük az egyenletet: x2 – 2x + 7 = 0. Mivel a kapott egyenlet D
diszkriminánsa: D = 4 – 28 = –24 < 0, ezért az egyenletnek nincs valós gyöke.
4.
. Az egyenletnek csak akkor van értelme, ha .
Ezek után szorozzuk meg mindkét oldalt a bal oldal nevezőjével, majd hozzuk az egyenletet (3.3) alakra.
Tehát a keresett öt db szám: –2, –1, 0, 1, 2, vagy pedig 10, 11, 12, 13, 14.
Megjegyzés. Ha a másodfokú egyenlet diszkriminánsa negatív, vagyis nincsenek valós gyökök, Viète formulái akkor
is igazak. Ekkor a gyökök ún. konjugált komplex számok (lásd 21. fejezet). Könnyen kimutatható, hogy az ilyen
komplex számok összege és szorzata is valós szám.
Ez utóbbi egyenlet első két tagjából x-et, utolsó két tagjából –x2-t kiemelve a következőt kapjuk:
Tehát
Ezt nevezzük a másodfokú egyenlet gyöktényezős alakjának. Ennek segítségével – a gyökök meghatározása után – a
másodfokú kifejezést könnyen felbonthatjuk két elsőfokú szorzatára.
Példák
1. Állítsuk elő az ax2 + bx + c = 0 másodfokú egyenletben a Viète-formulák segítségével
a) a gyökök reciprokának összegét,
b) a gyökök négyzetének összegét!
a)
2. Az x2 + px + 8 = 0 másodfokú egyenlet egyik gyöke 2-vel nagyobb a másik gyöknél. Határozzuk meg a p paraméter
értékét! Írjuk fel egyenletünkre a Viète-formulákat, tudva, hogy x2 = x1 + 2.
A második egyenlet x1-re nézve egy másodfokú egyenlet, melynek gyökei: x1 = 2 vagy x1 = –4. Ezeket az értékeket az
első egyenletbe helyettesítve kapjuk: p = –4 vagy p = 6.
3.
Egyszerűsítsük a következő törtet:
Alakítsuk a számlálót is és a nevezőt is szorzattá a gyöktényezős alak segítségével. A számláló gyökei: 2 és –6, a
nevező gyökei 2 és 9. Tehát a tört így írható:
Egyenlőtlenségek
Egyenlőtlenségnek nevezzük az olyan relációt, melyben két algebrai kifejezés a > (nagyobb), < (kisebb), ≥ (nagyobb-
egyenlő), vagy ≤ (kisebb-egyenlő) jelek valamelyikével van összekapcsolva. Az egyismeretlenes egyenlőtlenségek
megoldásánál az a célunk, hogy meghatározzuk mindazon valós számokat, melyeket az ismeretlen helyére beírva az
egyenlőtlenség teljesül.
Egyenlőtlenségek megoldása során ugyanazokat a lépéseket tehetjük meg, amelyeket az egyenleteknél a mérlegelv
alapján, csupán arra kell vigyáznunk, hogy
1. az egyenlőtlenség iránya megfordul, ha az egyenlőtlenség mindkét oldalát ugyanazzal a negatív számmal osztjuk vagy
szorozzuk;
2. az egyenlőtlenség iránya megfordul, ha az egyenlőtlenség mindkét oldalának a reciprokát vesszük.
Egyidejűleg több egyenlőtlenséget, ún. egyenlőtlenség-rendszert is vizsgálhatunk. Ekkor az a célunk, hogy
meghatározzuk azon számok halmazát, melyek az összes vizsgált egyenlőtlenséget kielégítik. Ez pontosan azt jelenti, hogy
meg kell keresnünk az összes egyenlőtlenséget külön-külön kielégítő számhalmazt, majd vennünk kell e halmazok
metszetét.
Megjegyzés. 1. A másodfokú egyenlőtlenségek általános alakja: ax2 + bx + c ≥ 0 vagy ≤ 0 (vagy ugyanezek egyenlőség
nélkül). Ennek megoldásához legkézenfekvőbb a másodfokú függvény gra konjából kiindulnunk (lásd 15. fejezet),
majd a zérushelyek meghatározása után a gra konról könnyen leolvashatjuk az egyenlőtlenségben feltett kérdésre a
választ.
2. Egyenlőtlenség-rendszer vizsgálatakor érdemes a benne szereplő egyenlőtlenségek megoldáshalmazát külön-
külön ábrázolni a számegyenesen, mert így jóval áttekinthetőbben leolvashatjuk az egyes megoldáshalmazok
metszetét.
Példák
1. Oldjuk meg az alábbi egyenlőtlenséget a valós számok halmazán
Szorozzuk meg mindkét oldalt 3-mal, majd vonjuk össze a két oldalt:
Most osszuk el mindkét oldalt –8-cal, de vigyázzunk, mivel negatív számmal osztunk, a relációjel megfordul!
A második egyenlőtlenségből
3.13. ábra
Mármost egy szorzat akkor és csak akkor legalább 0, ha mindkét tényezője legalább 0, vagy mindkét tényezője
legfeljebb 0.
vagy pedig
Az olyan nem algebrai egyenletet, amelyekben az ismeretlen csak a hatványkitevőben szerepel, exponenciális
egyenletnek hívjuk. Ha egyenletünk olyan, hogy abban az ismeretlennek valamilyen alapú logaritmusa szerepel, akkor
logaritmikus egyenletnek nevezzük. Az exponenciális és a logaritmikus egyenletek megoldására általános eljárás nem
adható, de sokszor előfordul, hogy az ilyen típusú egyenleteket – a hatványozás és a logaritmus fogalma, valamint az ismert
azonosságok segítségével – jóval egyszerűbb algebrai egyenletekre vezethetjük vissza. A leggyakrabban előforduló esetek:
1. Ha az egyenlet két oldalán egy-egy azonos alapú exponenciális kifejezés szerepel – vagy a megfelelő azonosságokkal az
egyenlet ilyen alakra hozható –, akkor az alapok elhagyásával a kitevők egyenlővé tehetők, vagyis ha ax = ay (a > 0), akkor
vagy x = y, vagy pedig a = 1.
2. Ha az exponenciális egyenlet a1 · a2x+ a2 · ax + a3 = 0 alakra hozható, ahol a > 0, továbbá a1, a2, a3 adott valós számok, akkor az
ax = y helyettesítéssel másodfokú egyenletre vezethetjük vissza eredeti egyenletünket.
3. Ha az egyenletben ugyanannak az ismeretlennek ugyanolyan alapú logaritmusai szerepelnek – vagy az egyenlet ilyen alakra
hozható –, akkor megfelelő új ismeretlen bevezetésével könnyebben kezelhető első- vagy másodfokú algebrai egyenletté
alakítható az eredeti egyenlet.
4. Ha különböző alapú logaritmusok szerepelnek az egyenletben, de ezek új alapra való áttéréssel azonos alapra hozhatók,
akkor ugyancsak egyszerűbb algebrai egyenletet kaphatunk eredeti egyenletünkből.
Nézzünk az elmondottakra néhány példát!
Példák
1. Oldjuk meg az alábbi egyenletet a valós számok halmazán!
Először próbáljuk elérni a megfelelő azonosságok alkalmazásával, hogy a kitevőkben csak az x ismeretlen
szerepeljen.
Mivel 4x = (2x)2, ezért, ha bevezetjük a 2x = y új ismeretlent, akkor egy másodfokú egyenlethez jutunk.
Mivel y = 2x minden valós x esetén pozitív, ezért a negatív megoldás nem jöhet számításba,
Ellenőrzés: .
4. Oldjuk meg a következő egyenletet a valós számok halmazán:
legyen. Az egyenlet értelmezési tartománya e számhalmazok metszete, azaz x > 4. A logaritmus megfelelő
azonosságait felhasználva egyenletünk így írható:
Innen
A –5 nem tartozik bele az egyenlet értelmezési tartományába, így az nem megoldás. Az x = 13 kielégíti az eredeti
egyenletet, amint azt az alábbi ellenőrzés is mutatja.
Ellenőrzés:
ahol a, b, c, d adott valós számok, és a ≠ 0. Az egyenlet megoldását kezdjük azzal, hogy megpróbáljuk a másodfokú tagot
„eltüntetni“ az egyenletből. Először osszuk el mindkét oldalt a-val, akkor
Azt látjuk, hogy a másodfokú tag kiesik, az elsőfokú tag együtthatóját p-vel, a konstans tagot q-val jelölve az alábbi
egyenlethez jutunk:
(3.4)
Ezek szerint – a másodfokú egyenleteknél megismert Viète-formulák alapján – u3 és v3 az alábbi másodfokú egyenlet
megoldásai:
Tehát
Innen
Ez az ún. Cardano-képlet.
(3.5)
ahol a, b, c, d és e adott valós számok és a ≠ 0. Először elosztjuk az egyenlet mindkét oldalát a-val, majd a harmadfokú
egyenletnél már használt ötlettel élve vezessünk be egy új ismeretlent; legyen . Könnyen ellenőrizhető, hogy
ezzel a (3.5) egyenlet olyan alakúvá válik, melyben eltűnik a harmadfokú tag, azt kapjuk:
(3.6)
Mint látni fogjuk, a negyedfokú egyenlet általános megoldóképletét már nem érdemes felírni, mert rendkívül hosszú,
bonyolult lenne. Ehelyett egy lehetséges megoldási eljárást mutatunk be a (3.6) egyenlet megoldására. Célunk az lesz, hogy
a (3.6) egyenlet bal oldalát írjuk fel két másodfokú kifejezés szorzataként:
Ha ezt sikerül elérni, akkor két másodfokú egyenlet megoldására vezethetjük vissza a (3.6) egyenlet megoldását. A
szorzást elvégezve és a megfelelő tagok együtthatóit a (3.6)-ban szereplő együtthatókkal összehasonlítva egy olyan
harmadfokú négyismeretlenes egyenletrendszerre jutunk, mely visszavezethető egy egyismeretlenes harmadfokú egyenlet
megoldására. Ezt megoldva megkapjuk az A, B, C és D ismeretleneket p, q, r függvényében, ami azt jelenti, hogy a
negyedfokú egyenletet visszavezethetjük egy harmadfokú és két másodfokú egyenlet megoldására.
Megjegyzés. A negyedfokú egyenlet megoldásának módszerét először Lodovico Ferrari (1522–1565) olasz
matematikus, Cardano tanítványa dolgozta ki. Lényegében a fent ismertetett eljárással először megmutatta, hogy
bármely negyedfokú egyenlet visszavezethető olyan negyedfokú egyenletre, melyben eltűnik a harmadfokú tag,
majd egy paraméter bevezetésével, egy harmadfokú egyenlet megoldásával két másodfokú egyenletre vezette vissza
az eredeti negyedfokú egyenletet.
Az ötöd- vagy annál magasabb fokú egyismeretlenes egyenleteknek nem létezik általános megoldóképletük.
Ugyanakkor bizonyos speciális esetekben mégis meg tudjuk oldani az ilyen egyenleteket, s bizonyos esetekben a harmad- és
negyedfokú egyenletek is jóval egyszerűbbé válnak. Az ilyenekre mutatunk néhány példát.
Előfordulhat, hogy egy harmadfokú egyenletnek „ránézésre“ meg tudjuk mondani valamelyik gyökét. Legyen például
(3.7)
Mivel az egyenletben szereplő együtthatók összege 0, ezért a (3.7) egyenletnek az x = 1 biztosan megoldása. Ezek szerint
a (3.7) egyenlet bal oldalán szereplő harmadfokú kifejezés felbontható egy másodfokú és egy elsőfokú szorzatára, ahol az
elsőfokú tényező: x – 1. Legyen a másodfokú tényező: ax2 + bx+ c, így írhatjuk a következőt:
Ez utóbbi másodfokú egyenlet gyökei: 3 és –7, tehát az eredeti (3.7) egyenlet megoldásai:
Könnyen megoldhatjuk a másodfokúra redukálható negyedfokú egyenleteket. Ezek olyan egyismeretlenes negyedfokú
egyenletek, melyekben nem szerepel sem harmad-, sem elsőfokú tag. Általános alakja:
(3.8)
ahol a, b és c adott valós számok és a ≠ 0. Ha a (3.8) egyenletben bevezetjük az y = x2 új ismeretlent, akkor y2 = x4, így (3.8)
egyenletből az
másodfokú egyenlethez jutunk. Ennek gyökeit y1-gyel és y2-vel jelölve az eredeti (3.8) egyenlet gyökei:
Ugyancsak egyszerűen megoldhatók a páros fokú ún. szimmetrikus egyenletek (vagy más néven reciprokegyenletek).
Azokat az algebrai egyenleteket hívjuk így, melyekben a tagokat csökkenő hatványok szerint sorba rendezve, az
együtthatók szimmetrikusan helyezkednek el. (A reciprok elnevezés onnan ered, hogy, amint látni fogjuk, ha valamely
valós szám gyöke egy ilyen egyenletnek, akkor annak reciproka is gyöke lesz.)
Nézzük példaként a negyedfokú reciprok egyenleteket! Ezek általános alakja:
(3.9)
Világos, hogy x = 0 nem megoldása az egyenletnek, így osszuk el mindkét oldalt x2-tel:
(3.10)
(3.11)
Amint az könnyen ellenőrizhető, az ilyen típusú egyenletnek az x = –1 mindig megoldása. Így a (3.11) egyenletet elosztva
az (x + 1) tényezővel, már páros fokú egyenletet kapunk, s az is megmutatható, hogy az így nyert páros fokú egyenlet
ugyancsak szimmetrikus lesz, melyre így a páros fokúakra fent leírt eljárás már alkalmazható.
Példák
1. Oldjuk meg a valós számok halmazán az alábbi egyenletet!
Azonnal látszik, hogy negyedfokú szimmetrikus egyenlettel van dolgunk. Osszuk el mindkét oldalt x2-tel:
Az első egyenlet gyökei: –2 és , a második egyenlet gyökei: 4 és . Tehát az eredeti egyenlet megoldásai:
2. Oldjuk meg az 2x5 – 7x4 + 5x3 + 5x2 + 7x + 2 = 0 egyenletet a valós számok halmazán! Most páratlan fokú
szimmetrikus egyenlettel van dolgunk. Ennek – mint láttuk, de egyszerű számolással ellenőrizhető – az x – 1
megoldása, így elosztva az egyenlet bal oldalát az (x + 1) gyöktényezővel az alábbi alakra jutunk:
ahonnan x + 1 = 0 vagy 2x4 – 9x3 + 14x2 – 9x + 2 = 0. Látjuk, hogy a második tényező egy negyedfokú, ugyancsak
szimmetrikus egyenlet. Osszuk el ennek mindkét oldalát x2 ≠ 0-val, azt kapjuk:
Egy polinom normáltja az a polinom, amit a főegyütthatójával való osztás eredményeképp kapunk.
Egy f(x) = anxn + an–1 xn–1 + … +a1x + a0 polinom eltoltjai a g(x) = f(x – c) = an(x – c)n + + an–1 (x – c)n–1 + … +a1 (x – c) + a0
képlettel megadható polinomok. Továbbá ha an, a0 ≠ 0, akkor f(x) reciprok polinomja a0xn + a1xn–1 + … +an–1 x + an.
Két polinom hányadosa sajnos ritkán eredményez ismét egy polinomot, így az osztást mint műveletet nem
értelmezhetjük a polinomok halmazán, helyette csak az oszthatóság fogalmáról beszélhetünk, illetve a maradékos
osztásról.
Egy f(x) (nem azonosan nulla) polinom osztója a g(x) polinomnak, ha valamely alkalmas h(x) polinommal g(x) = f(x)
h(x). Ekkor a h(x) polinom a g(x) és az f(x) hányadosa.
Ez a de níció ugyan leírja az oszthatóság fogalmát, azonban sokszor kicsit árnyaltabban kell majd fogalmaznunk,
amikor oszthatóságról beszélünk. Pontosabban arról van szó, hogy az oszthatóság fogalmát külön is lehet de niálni a
valós, racionális, illetve az egész együtthatós polinomok körében. Előfordulhat például, hogy g(x) és f(x) egész együtthatós
polinomok, f(x) osztja g(x)-et, viszont a hányadosuk nem egy egész, hanem csak racionális együtthatós polinom. Ekkor azt
mondhatjuk, hogy f(x) csak a racionális együtthatós polinomok körében osztja g(x)-et, az egész együtthatós polinomok
körében már nem.
A maradékos osztás a következőt jelenti:
Legyen g(x) és f(x) két valós együtthatós polinom, f(x) nem azonosan nulla. Ekkor léteznek olyan h(x) és m(x) szintén
valós együtthatós, f(x) és g(x) által egyértelműen meghatározott polinomok, amikkel g(x) = f(x) · h(x) + m(x), továbbá
m(x) vagy azonosan nulla, vagy pedig a fokszáma kisebb f(x) fokszámánál.
A tételben szereplő h(x) polinom neve hányados, az m(x) polinom neve maradék. Amennyiben a maradékos osztást
racionális együtthatós polinomokkal végezzük el, úgy a hányados és a maradék szintén racionális együtthatósak lesznek.
Ugyanez az egész együtthatós polinomokra már nem mondható el: két egész együtthatós polinom hányadosáról és
maradékáról csak annyi garantálható, hogy racionális együtthatósak. Az m(x) maradék polinom pontosan akkor lesz az
azonosan nulla polinom, ha f(x) osztója g(x)-nek.
A gyakorlatban egy maradékos osztást többlépcsős algoritmusban végezhetünk el. Amennyiben g(x) foka kisebb f(x)
fokánál, akkor nincs mit számolni: a hányados nulla, a maradék pedig g(x). Ha pedig g(x) foka legalább annyi, mint f(x)
foka, akkor az első lépésben g(x) és f(x) legmagasabb fokú tagjait osztjuk, ezzel megkapjuk a hányados legmagasabb fokú
tagját, majd g(x)-ből levonjuk ennek a tényezőnek az f(x)-szel vett szorzatát. A következő lépésben a kapott eredmény
helyettesíti a g(x) polinomot (amennyiben a fokszáma még mindig legalább annyi, mint f(x) fokszáma), és ezt a műveletet
ismételjük mindaddig, amíg lehetséges. Az egyes lépésekben a legmagasabb fokú tagok osztásából kapott hányadosok adják
ki a hányados polinomot, és az utolsó lépés eredménye – ami már f(x)-nél alacsonyabb fokú – a maradék.
Példa. Végezzük el a maradékos osztást a g(x) = 2x4 – x3 – 6x2+ 5x+3 és az f(x) = x2 + x – 2 polinomokkal.
A legmagasabb fokú tagok hányadosa 2x4/x2 = 2x2, első lépésben ennek az f(x)-szeresét kell levonni a g(x) polinomból:
A második lépésben g(x)-et már ez az eredmény helyettesíti, ezúttal a legmagasabb fokú tagok hányadosa –3x3/x2 = –
3x és
Végül x2/x2 = 1 és (x2 – x + 3) – 1 (x2 + x – 2) = –2x + 5, ennek a fokszáma már kisebb f(x) fokszámánál, tehát ez a polinom
a maradék, a hányados pedig a legmagasabb fokú tagok osztásaiból kapott h(x) = 2x2 – 3x + 1. Összegezve:
Tehát a legfelső sorba az f(x) polinom együtthatóit írjuk a főegyütthatóval kezdve, ezt a főegyütthatót írjuk a harmadik
sor elejére is, ezek után balról jobbra haladva töltjük ki a második és harmadik sort, minden oszlop második eleme az előző
oszlop harmadik elemének a c-szerese, majd az alatta levő harmadik elem az oszlop első két elemének az összege. A
harmadik sorban megkapott számok a hányados polinom együtthatói, illetve a maradék:
A harmadik sor végén megjelenő b0 maradék ebben az esetben nem más, mint az f(x) polinom c helyen felvett
helyettesítési értéke: b0 = f(c). Amennyiben c az f(x)-nek egy zérushelye, azaz f(c) = 0, akkor azt kapjuk, hogy f(x) felírható
olyan szorzatként, aminek az egyik tényezője x – c.
Egy f(x) polinom akkor és csak akkor osztható az x – c polinommal, ha c egy zérushelye f(x)-nek.
Amennyiben f(x) az x – c polinomnak egy magasabb hatványával is osztható, akkor c egy többszörös zérushely:
Ha a c valós és m pozitív egész számmal (x – c)m osztója az f(x) polinomnak, viszont (x – c)m+1 már nem, akkor azt
mondjuk, hogy a c szám m-szeres multiplicitással gyöke f(x)-nek.
Úgy is fogalmazhatnánk, hogy c egy m-szeres gyöke az f(x) polinomnak, ha f(x) = (x – c)m h(x) egy olyan h(x)
polinommal, amire h(c) ≠ 0.
Ha egy polinomnak több gyökét is ismerjük (esetleg multiplicitásukkal együtt), akkor egy magasabb fokú osztót is
garantálhatunk:
Ha egy f(x) polinomnak c1, c2, …, ck különböző gyökei és ci multiplicitása legalább mi (i = 1, 2, …, k), akkor f(x) osztható
az
polinommal.
A d(x) normált polinom az f(x) és g(x) polinomok legnagyobb közös osztója, ha d(x) |f(x), d(x) |g(x) és az f(x) és g(x)
polinomok bármely közös osztója osztja d(x)-et is. A t(x) normált polinom az f(x) és g(x) polinomok legkisebb közös
többszöröse, ha f(x) | t(x), g(x) | t(x) és az f(x) és g(x) polinomok bármely közös többszöröse osztható t(x)-szel.
Ha az f(x) és g(x) polinomok közül legalább az egyik nem azonosan nulla, akkor a legnagyobb közös osztójuk létezik,
egyértelmű és egyenlő a legkisebb fokú olyan normált polinommal, ami felírható a(x)f(x) + b(x) g(x) alakban (ahol a(x) és
b(x) is polinomok). Jelölése: lnko(f(x), g(x)). (Az angol nyelvű irodalomban gcd(f(x), g(x)), ami a „greatest common divisor“
kifejezésre utal.) Ha az f(x) és g(x) polinomok egyike sem azonosan nulla, akkor a legkisebb közös többszörösük létezik,
egyértelmű, jelölése lkkt(f(x), g(x)) (az angol nyelvű irodalomban lcm(f(x), g(x)), ami a „least common multiple“ kifejezésre
utal). Továbbá lnko(f(x), g(x)) · lkkt(f(x), g(x)) megegyezik az f(x) · g(x) szorzat normáltjával, tehát az egyik ismeretében a
másikat már könnyen ki tudjuk számítani.
Két adott polinom, f(x) és g(x) legnagyobb közös osztóját az euklideszi algoritmus segítségével számíthatjuk ki. Ennek
az a lényege, hogy ha f(x) ≢ 0, akkor maradékos osztások sorozatát végezzük el a következőképpen: először g(x)-et osztjuk
maradékosan f(x)-szel, majd minden egyes következő lépésben az előző lépés osztója és maradéka között végezzük el ismét
a maradékos osztást. Ezt folytatjuk mindaddig, amíg egyszer nullát kapunk maradékul. Tehát
Mivel a maradékok fokszámai egy szigorúan csökkenő sorozatot alkotnak, előbb-utóbb mindenképp elérkezünk egy
olyan lépéshez, ahol a maradék nulla. Az utolsó nem nulla maradék normáltja az f(x) és g(x) polinomok legnagyobb közös
osztója. (Amennyiben már rögtön az első maradék nulla, úgy f(x) osztja g(x)-et, és akkor természetesen lnko (f(x), g(x)) nem
más, mint az f(x) polinom normáltja.)
Példa. Számítsuk ki az f(x) = x3 + x2 – 5x + 3 és g(x) = 2x3 + 7x2 – x – 12 polinomok legnagyobb közös osztóját és legkisebb
közös többszörösét!
Az euklideszi algoritmus a következőt adja:
Az utolsó nem nulla maradék , és ennek a polinomnak a normáltja x + 3. Tehát lnko(x3 + x2 – 5x + 3, 2x3 +
7x2 – x – 12) = x + 3, a legkisebb közös többszörös pedig
Ebből már következik, hogy akárhány primitív polinom szorzata is primitív polinomot eredményez. Egy ℤ[x]-beli
felbonthatatlan polinom tehát szükségszerűen primitív (különben kiemelhető belőle az együtthatók legnagyobb közös
osztója), viszont nem minden primitív polinom felbonthatatlan, és erre az egyik legegyszerűbb példa x2 – 1 = (x + 1) (x – 1).
Egy legalább másodfokú felbonthatatlan polinomról az is elmondható, hogy nem rendelkezhet racionális zérushellyel,
ha ugyanis az f(x) egész együtthatós polinomnak az a/b racionális szám egy zérushelye, ahol a és b relatív prím egészek,
akkor f(x) felírható (bx – a)g(x) szorzat alakban valamilyen szintén egész együtthatós g(x) polinommal. Ennek az állításnak
a megfordítása is igaz: ha f(x) = (bx – a)g(x), akkor a/b természetesen egy zérushelye f(x)-nek.
Mivel egy másod- vagy harmadfokú polinom szorzatfelbontásában szükségszerűen szerepelnie kell egy legfeljebb
elsőfokú tényezőnek is, ezen polinomok közül viszonylag egyszerűen jellemezhetjük a felbonthatatlanokat:
Egy másodfokú, illetve egy harmadfokú egész együtthatós polinom pontosan akkor felbonthatatlan az egészek felett,
ha primitív és nincs racionális zérushelye.
Negyedfokú, illetve annál magasabb fokú polinomokra ez a jellemzés már nem áll, például x4 – 4 = (x2 + 2) (x2 – 2) egy
primitív polinom, nincs racionális gyöke, viszont felbontható. Ennek ellenére gyakran hasznos, ha egy adott egész
együtthatós polinom racionális zérushelyeit meg tudjuk találni, és ebben a következő tétel az irányadó:
Ha a c/d racionális szám – ahol c és d relatív prím egészek – gyöke az f(x) egész együtthatós polinomnak, akkor c osztja
f(x) konstans tagját, és d osztja f(x) főegyütthatóját.
Ez a tétel természetesen nem garantálja egyetlen racionális gyök létezését sem, mindössze leszűkíti azon racionális
számok körét, amiket érdemes megvizsgálni, mint lehetséges zérushelyeket. Tehát ha egy adott egész együtthatós polinom
első és utolsó együtthatóinak az osztóit ismerjük, akkor készíthetünk egy listát azon racionális számokról, amiknek a
számlálója osztja a konstans tagot, és a nevezője osztja a főegyütthatót, majd az így listázott racionális számokat az adott
polinomba helyettesítve kiderül, hogy van-e egyáltalán racionális zérushely, illetve ha van, akkor ezeknek a teljes listáját is
megkapjuk.
Példa. Keressük meg a p(x) = 5x4 + 2x3 – 5x2 – 32x – 12 polinom racionális gyökeit! A konstans tag osztói: ±1, ±2, +3, ±4,
±6 és ±12, ezek szerepelhetnek egy racionális zérushely számlálójában, a főegyüttható osztói pedig ±1 és ±5, ezek
szerepelhetnek egy racionális zérushely nevezőjében. Így a következő racionális számokat kell megvizsgálnunk:
A jobb alsó sarokba kapott 0 jelzi, hogy 2 valóban gyök, és a 3. sor alapján
Ezek után már elég a q(x) = 5x3 + 12x2 + 19x + 6 polinom racionális gyökeit keresni, tehát a fenti listából elhagyható a
±12 és a ±12/5. A megmaradtak közül egyedül a –2/5 bizonyul zérushelynek, a szintetikus osztással:
Ebből p(x) = (x – 2) (x + 2/5) (5x2 + 10x + 15) = (x – 2) (5x + 2) (x2 + 2x + 3). Az x2 + 2x + 3 polinomnak már nincs valós gyöke,
így a p(x) polinom racionális gyökei 2 és –2/5.
Ahogy azt az iménti példában is láttuk, ha egy polinom főegyütthatójának vagy konstans tagjának sok osztója van,
akkor igen hosszú lehet azon racionális számoknak a listája, amiket ellenőriznünk kellene, mint lehetséges zérushelyeket.
A következő tétellel azonban jelentősen szűkíthetjük ezt a listát.
Ha a c/d racionális szám – ahol c és d relatív prím egészek – gyöke az f(x) egész együtthatós polinomnak, akkor
tetszőleges m egész szám mellett c + md osztója f(–m)-nek.
Példa. Tekintsük újra a korábbi példát: p(x) = 5x4 + 2x3 – 5x2 – 32x – 12.
Mivel p(–1) = 18, a már listázott racionális számok közül, ahol c osztja 12-t, és d osztja 5-öt, elhagyhatjuk azokat,
ahol a számláló és a nevező összege, c + d nem osztja 18-at.
különbsége, c – d nem osztja 42-t. Ami marad: . Ennek a négy számnak az ellenőrzése a szintetikus
osztással már nem igényel sok időt, de akár tovább is szűkíthetjük a listát azzal, hogy p(–2) = 96 miatt töröljük azon
törteket, ahol c + 2d nem osztja 96-ot. Így már csak a 2 és maradnak, amik valóban gyökök.
Mint már említettük, a legalább negyedfokú (egész együtthatós) polinomoknál a lehetséges racionális zérushelyek
vizsgálata nem mindig dönti el a felbonthatóság kérdését. Ha találunk racionális gyököt, akkor a polinom garantáltan
felbontható, de ha nem találunk racionális gyököt, akkor az még csak annyit jelent, hogy elsőfokú tényezőt tartalmazó
felbontás nincs. Sokszor az a legegyszerűbb módja a felbonthatóság eldöntésének, hogy határozatlan együtthatókkal írjuk
fel a polinomot szorzatként, amiből a szorzás elvégzésével egy egyenletrendszert kapunk a felhasznált határozatlanokra.
Például ha az f(x) = a4x4 + a3x3 + a2x2 + a1x + a0 negyedfokú polinomról szeretnénk eldönteni, hogy felírható-e két
másodfokú polinom szorzataként, akkor az
Mivel ezt az egyenletrendszert az egész számok körében szeretnénk megoldani, az a4 és a0 együtthatók lehetséges
szorzatfelbontásai véges sok lehetséges értéket adnak meg az a, d, c és f számokra. Ezekre a lehetséges értékekre pedig
külön-külön vizsgálhatjuk meg, hogy a fennmaradó három egyenletnek létezik-e b-re és e-re megoldása.
Először is, azok a racionális számok, amiknek a számlálója osztja 7-et és a nevezője osztja .
Ebből elhagyjuk azokat a c/d alakú számokat, ahol c – d nem osztja p(1) = –2-t, marad a –1 és , majd szintetikus
osztással könnyen ellenőrizhetjük, hogy ezek egyike sem gyök. A p(x) polinomnak tehát nincs racionális gyöke, így
elsőfokú és negyedfokú tényezők szorzatára nem bontható fel.
Marad az a lehetőség, hogy p(x) = (ax3 + bx2 +cx + d) (ex2 +fx + g) valamilyen a, b, c, d, e, f, g egészekkel, és ekkor a
jobb oldal kiszorzásából, illetve a p(x) ismert együtthatóiból az adódik, hogy ae = 2, af + be = 0, ag + bf + ce = 0, bg + cf +
de = 3, cg + df = 0 és dg = –7. Feltehetjük, hogy a szorzatfelbontás mindkét tényezője pozitív főegyütthatós, így az ae =
2 egyenlet alapján az a két eset lehetséges, hogy a = 2 és e = 1, vagy a = 1 és e = 2. Az első esetben a második egyenletből
2f + b = 0, azaz b = –2f, majd a harmadik egyenletből 2g + (–2f)f + c = 0, azaz c = 2f2 – 2g. Ezután a negyedik egyenletből
(–2f)g + (2f2 – 2g)f + d = 3, d = 3 + 4f g – 2f3, és az ötödikből (2f2 – 2g)g + (3 + 4fg – 2f3)f = 0, azaz 6f2 g – 2g2 + 3f – 2f4 = 0.
Ebből látszik, hogy f csak páros szám lehet (mert itt a 3f kivételével minden tényező páros), viszont akkor d – 3 = 4f g –
2f3 már 8-nak is többszöröse, ami pedig ellentmondáshoz vezet, ugyanis dg = –7 miatt d értéke csak ±1 és ±7 lehet.
Hátravan még annak az esetnek a vizsgálata, amikor a = 1 és e = 2. Ekkor a második egyenletből f + 2b = 0, azaz f = –2b,
majd a harmadik egyenletből g + b (– 2b) + 2c = 0, azaz g = 2b2 – 2c. Ekkor viszont az utolsó egyenletből d(2b2 – 2c) = –7,
ami nem lehet, hiszen –7 nem osztható 2-vel. Ezzel beláttuk, hogy a megadott p(x) polinom nem bontható fel egy
másodfokú és egy harmadfokú tényező szorzatára az egész számok felett. Korábban azt is beláttuk, hogy elsőfokú és
negyedfokú tényezők szorzatára sem bontható, így p(x) = 2x5 + 3x2 – 7 felbonthatatlan ℤ[x]-ben.
Minél magasabb fokú egy polinom, annál fáradtságosabb az imént tárgyalt módszert alkalmazni a felbonthatóság
eldöntésére, ugyanis pl. egy hatodfokú polinomnál már külön meg kellene vizsgálnunk, hogy felbontható-e két
harmadfokú tényezőre, illetve egy másodfokú és egy negyedfokú tényező szorzatára, egy tizedfokú polinom esetében pedig
már négy különböző lehetőséget kellene vizsgálnunk a felbontási tényezők fokszámait illetően (miután már a lehetséges
racionális zérushelyeket előzőleg végignéztük).
A Schönemann–Eisenstein-kritérium ettől a fáradtságos munkától kímél meg minket bizonyos speciális esetekben:
Ha f(x) egy legalább elsőfokú, egész együtthatós primitív polinom, és van olyan p prímszám, ami nem osztja f(x)
főegyütthatóját, viszont osztja az összes többi együtthatót, továbbá p2 nem osztja a konstans tagot, akkor f(x)
felbonthatatlan az egészek felett.
Ez alapján például tetszőleges n nem negatív egész mellett xn + 2 egy ℤ[x]-ben felbonthatatlan polinom: p = 2-vel
alkalmazható rá a fenti Schönemann–Eisenstein-kritérium.
Ha egy f(x) egész együtthatós polinom felbonthatatlan az egészek felett, akkor ugyanez igaz tetszőleges f(x – c), (c ∈ ℤ)
alakú eltoltjára és a reciprok polinomjára is. Fordítva, ha egy egész együtthatós polinomnak valamelyik egész számmal
való eltoltja felbonthatatlan ℤ[x]-ben, vagy ha a konstans tagja nem nulla, és a reciprok polinomja felbonthatatlan ℤ[x]-
ben, akkor ugyanez igaz f(x)-re is.
Előfordulhat, hogy egy polinomra nem tudjuk közvetlenül alkalmazni a Schönemann–Eisenstein-kritériumot, viszont
a reciprok polinomjára vagy egy alkalmas eltoltjára már igen. Például ha f(x) = x4 + 4x3 + x – 2, akkor
Ha f(x) egy egész együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és ℤ[x]-ben felbonthatatlan,
pozitív főegyütthatós primitív polinomok szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.
Ha f(x) egy legalább elsőfokú racionális együtthatós polinom, akkor pontosan egy olyan r racionális szám van, amivel r
· f(x) egy primitív egész együtthatós polinom. Ez az r · f(x) polinom akkor és csak akkor felbonthatatlan az egészek
felett, ha f(x) felbonthatatlan a racionális számok felett.
A gyakorlatban úgy kapunk primitív egész együtthatós polinomot egy racionális polinomból, hogy azt először
megszorozzuk az együtthatók nevezőinek a legkisebb közös többszörösével, majd az így kapott (immár egész együtthatós)
polinomot az együtthatók legnagyobb közös osztójával leosztjuk. Az eredmény így egy primitív ℤ[x]-beli polinom, aminek
az egészek feletti felbonthatóságát a már korábban részletezett módokon vizsgálhatjuk. Amennyiben ez a polinom
felbomlik két alacsonyabb fokú egész együtthatós polinom szorzatára, úgy az eredeti polinom is felbomlik két alacsonyabb
fokú racionális együtthatós polinom szorzatára, ellenkező esetben az eredeti polinom ℚ[x]-ben felbonthatatlan.
Tehát nem fordulhat elő, hogy egy egész együtthatós polinom felbonthatatlan lenne az egész számok felett, de
felbomlana kisebb fokú polinomok szorzatára a racionális számok felett. Ez a tény szintén Gauss-lemma néven ismert, és
pontosan a következőt állíthatjuk:
Ha f(x) nullától különböző egész együtthatós polinom, és valamilyen racionális együtthatós g(x) és h(x) polinomokkal
f(x) = g(x) · h(x), akkor létezik olyan r racionális szám, amivel r · g(x) és (1/r) · h(x) mindketten egész együtthatósak, azaz
f(x) = (r · g(x)) · ((1/r) · h(x)) egy egészek feletti felbontása f(x)-nek.
Ha f(x) egy racionális együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és normált, ℚ[x]-ben
felbonthatatlan tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.
Ha f(x) egy valós együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans, normált elsőfokú és
normált felbonthatatlan másodfokú tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.
ahol minden 1 ≤ i ≤ s egészre. Ebből a felírásból kiolvasható, hogy f(x) foka r + 2s, a főegyütthatója a, a
konstans tagja (–1)r ac1 … cre1 … es és a (valós) zérushelyei c1, c2, …, cr.
Ahhoz, hogy ez az i szimbólum létjogosultságot nyerjen, a komplex számokat egy konstruktív módon de niáljuk:
A komplex számok a valós számokból alkotott (a, b) számpárok, amiknek a körében a következő összeadás és szorzás
műveleteket értelmezzük:
Ezekkel a műveletekkel teljesülnek a valós számok körében megszokott műveleti alaptulajdonságok (axiómák):
- Tetszőleges két komplex számra z1 + z2 = z2 + z1 és z1 · z2 = z2 · z1. (A két művelet kommutatív.)
- Tetszőleges három komplex számra (z1 + z2) + z3 = z1 + (z2 + z3), (z1 · z2) · z3 = = z1 · (z2 · z3), (z1 + z2) · z3 = z1 · z3 + z2 · z3 és z1 · (z2 +
z3) = z1 · z2 + z1 · z3. (A két művelet asszociatív és a szorzás az összeadásra nézve disztributív.)
Az így de niált számhalmazban az (a, 0) alakú számok részhalmaza azonosítható a valós számok ℝ halmazával, ugyanis a
fent bevezetett műveletek alapján
Ily módon a komplex számokat tekinthetjük a valós számok bővítésének, ahol a 0 és az 1 továbbra is neutrális elemek az
összeadásra, illetve a szorzásra nézve:
Az i = (0, 1) jelöléssel i2 = (0, 1) · (0, 1) = (–1, 0) és ez a pár a valós –1 számnak felel meg, továbbá bármely (a, b) számpár
felírható úgy, mint
A továbbiakban már eltekintünk a (kissé körülményes) számpáros jelöléstől, és az a + bi jelölést fogjuk használni, amit
a komplex számok algebrai alakjának (vagy kanonikus alakjának) nevezünk. A komplex számok halmazának a jelölése: ℂ.
Egy z = a + bi (a, b ∈ ℝ) komplex szám valós része: Re(z) = a, képzetes része: Im(z) = b, konjugáltja pedig z̄ = a – bi.
A konjugált első praktikus haszna a komplex számok osztásánál jelentkezik: ahhoz hogy egy
tört kanonikus alakját megkapjuk, általában a nevező konjugáltjával szorozzuk a számlálót és a nevezőt egyaránt:
Ebben a megfeleltetésben a valós számok a vízszintes tengely pontjainak felelnek meg, a képzetes számok pedig a
függőleges tengely pontjainak. Továbbá egy z = a + bi szám konjugáltja, z̄ = a – bi nem más, mint z-nek a vízszintes tengelyre
vonatkozó tükörképe.
Egy z = a + bi (a, b ∈ ℝ) komplex szám abszolút értéke a komplex számsíkon a 0-tól vett távolsága: , és
ha z ≠ 0, akkor az argumentuma (irányszöge), arg(z) a z-be mutató helyvektornak a valós tengely pozitív felével bezárt
szöge.
Ez a szög természetesen nem egyértelmű, hiszen 2π bármely egész számszorosának a hozzáadásával ugyanazt az irányt
kapjuk meg, azonban a szög szinusza és koszinusza már egyértelműen meghatározottak.
Egy nem nulla komplex szám valós része (a), képzetes része (b), abszolút értéke (r) és irányszöge (ø) közt a következő
összefüggések állnak fenn:
Így a z = a + bi algebrai alak mellett minden nullától különböző komplex szám trigonometrikus alakban is felírható:
Ha z = r (cos ø + i sin ø), és w = s (cos γ + i sin γ) trigonometrikus alakban megadott nem nulla komplex számok, akkor
- z · w = rs(cos (ø + γ) + i sin (ø + γ)),
-
,
- zn = rn (cos (nø) + i sin (nø)) tetszőleges egész n számmal.
Ez utóbbi Moivre képlete. Szavakban összefoglalva, két komplex szám szorzásánál az abszolút értékek szorzódnak, és a
szögek összeadódnak; osztásnál az abszolút értékek hányadosát kell venni és a szögek különbségét; egész kitevős
hatványozásnál pedig az abszolút értéket az adott kitevőre emeljük, a szöget pedig szorozzuk a kitevővel.
Minden nullától különböző komplex számnak pontosan n darab n-edik gyöke van (ha n tetszőleges pozitív egész), és
amennyiben z = r(cos ø + i sin ø), akkor ezek az n-edik gyökök az alábbi módon írhatók fel:
A komplex számsíkon ez az n szám egy origó középpontú és sugarú körön helyezkedik el úgy, hogy egy szabályos
n-szög csúcsait alkotják.
Komplex n-edik egységgyökön egy olyan ϵ komplex számot értünk, ami az 1-nek n-edik gyöke, azaz ϵn = 1. Ha ϵn = 1 és
bármilyen n-nél kisebb pozitív egész k-ra ϵk ≠ 1, akkor ϵ egy primitív komplex n-edik egységgyök.
A k = 0 esetben magát az 1 számot kapjuk vissza, a k = 1 esetben mindig egy primitív n-edik egységgyököt kapunk.
A másodfokú polinomok körében ez egyszerűen azért igaz, mert a megoldóképletben a gyökvonást mindig el lehet
végezni.
Példák
1. Adjuk meg a p(x) = x2 + 4x + 7 polinom komplex zérushelyeit!
A másodfokú egyenlet megoldóképlete alapján
2. Adjuk meg a g(x) = 2x2 + (1 – 2i)x – (3 – 2i) polinom komplex zérushelyeit! Szintén a megoldóképlettel kezdünk:
A 21 –20i komplex szám négyzetgyökeit egy kétismeretlenes egyenletrendszer megoldásával kaphatjuk meg: ha (a
+ bi)2 = 21 – 20i, és a, b ∈ ℝ, akkor a négyzet kibontásával (a2 – b2) + 2abi = 21 – 20i, és ebből a2 – b2 = 21, 2ab = –20.
Ennek az egyenletrendszernek két megoldása van: a = 5, b = –2, illetve a = –5, b = 2. Ezután visszatérhetünk a
megoldóképlethez: .
Az egyik megoldás tehát
a másik
Egy komplex együtthatós polinom akkor és csak akkor felbonthatatlan a komplex számok felett, ha elsőfokú.
Ha ugyanis f(x) egy tetszőleges, nem konstans komplex együtthatós polinom, akkor a komplex számok körében van
egy α zérushelye, és így (x – α) kiemelhető f(x)-ből. És ha f(x) legalább másodfokú, akkor ez a kiemelés már egy felbontása
f(x)-nek, alacsonyabb fokú polinomok szorzatára.
Az egyértelmű felbontás tétele ℂ[x]-re:
Ha f(x) egy komplex együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és normált elsőfokú
tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.
Ez az f(x) polinom gyöktényezős alakja, és ebből a felírásból kiolvasható, hogy f(x) foka r, a főegyütthatója a, a
konstans tagja (–1)r ac1 … cr és a (komplex) zérushelyei pedig c1, c2, …, cr. Ez a lista a zérushelyekről természetesen
tartalmazhat ismétlődést, amennyiben egy (x – ci) tényezőnek magasabb hatványa is osztja f(x)-et, azaz ha ci többszörös
gyöke az f(x) polinomnak. A komplex zérushelyek száma és a fokszám közötti összefüggés a következő:
Egy komplex együtthatós, nem azonosan nulla polinom zérushelyeinek a száma (multiplicitással számolva)
megegyezik a polinom fokával.
Az egyértelmű felbontás tételét – amint az eddigiekben láttuk – valamilyen formában mind az egész, mind a racionális,
valós, illetve komplex együtthatós polinomokra ki lehet mondani. Egy egész együtthatós polinomnak így akár négy
különböző felbontása is lehet attól függően, hogy ℤ[x]-ben, ℚ[x]-ben, ℝ[x]-ben vagy ℂ[x]-ben kívánjuk a felbontást
elvégezni. Ebből az első két felbontás csak konstans szorzókkal térhet el egymástól, hiszen egy egészek felett
felbonthatatlan polinom a racionális számok felett is felbonthatatlan, amennyiben legalább elsőfokú. Ha egy racionális
együtthatós polinom ℚ[x]-beli felbontása ismert, akkor az egy használható kiindulópont az ℝ[x]-beli felbontáshoz: a
racionális számok felett felbonthatatlan tényezőket kell lehetőség szerint tovább bontani a valós számok felett. Ez a tovább
bontás akkor lehetséges, ha egy tényező foka legalább három, illetve ha a tényező másodfokú, és a diszkriminánsa pozitív.
(Egy ℚ[x]-ben felbonthatatlan másodfokú polinom diszkriminánsa sosem lehet nulla, ha pedig negatív, akkor a polinom
ℝ[x]-ben is felbonthatatlan.) Végül, ha egy valós együtthatós polinom ℝ[x]-beli felbontása ismert, akkor itt már csak
elsőfokú és (negatív diszkriminánsú) másodfokú tényezők szerepelhetnek, az előbbiek természetesen ℂ[x]-ben is
felbonthatatlanok, míg az utóbbiak a komplex számok felett felbomlanak két elsőfokú tényező szorzatára.
Példák
1. A 6x – 10 polinom felbontása az egész számok felett 2(3x – 5), ebből 2 egy felbonthatatlan konstans polinom, és 3x –
5 egy primitív elsőfokú (és így szintén felbonthatatlan) polinom ℤ[x]-ben. A 6x – 10 polinom felbontása a
racionális számok felett 6(x – 5/3), ebből 6 a kiemelhető konstans (egység), és x – 5/3 egy normált felbonthatatlan
polinom.
2. A p(x) = x4 – 4x3 + 4x2 – 16 polinom felbontása az egészek, illetve a racionális számok felett egyaránt p(x) = (x2 – 2x +
4) (x2 – 2x – 4). Az első tényező diszkriminánsa negatív, a második tényezőé pozitív, így ez tovább bomlik ℝ[x]-ben:
A körosztási polinom
Már említettük korábban a komplex n-edik egységgyököket (n tetszőleges pozitív egész), mint az 1 szám n-edik gyökeit a
komplex számok körében. Mivel pontosan n darab van belőlük, és ezek éppen az xn – 1 polinom (komplex) zérushelyei, ezzel
meg is kaptuk xn – 1 gyöktényezős felbontását:
Az xn – 1 polinom valós, illetve egész számok feletti felbontása ettől általában lényegesen különbözik. Az ℝ[x]-beli
felbontás komponensei az x – 1; ha n páros, akkor az x + 1, illetve általában az 1 ≤ k < n/2 egészekre az
Ha n egy tetszőleges pozitív egész, az n-edik körosztási polinom, Φn(x) azon x – ϵk komplex elsőfokú polinomok
szorzata, ahol ϵk egy primitív n-edik egységgyök.
A primitív n-edik egységgyökök száma megegyezik az n-nél nem nagyobb és n-hez relatív prím pozitív egészek
számával. Ez a szám φ(n), ahol φ az ismert Euler-féle függvény, erről bővebben a 13. fejezetben esik szó.
Amennyiben p egy prímszám, akkor az 1 kivételével mindegyik komplex p-edik egységgyök primitív, így xp – 1 = (x – 1) ·
Φp(x), és ebből pedig
Kissé meglepő módon a körosztási polinomok mind egész együtthatósak, továbbá mind felbonthatatlanok az egész
számok felett (és ennélfogva a racionális számok felett is). Az xn – 1 alakú polinomok ℤ[x]-beli felbontását is a körosztási
polinomok szolgáltatják.
Legyen n egy tetszőleges pozitív egész. Ekkor az xn – 1 polinom felbontása felbonthatatlan polinomok szorzatára az
egész számok felett:
A tételben szereplő szorzat tehát azon Φd(x) körosztási polinomokból áll, ahol d egy pozitív osztója az n számnak. A
gyakorlatban ebből a képletből tudjuk kiszámolni a körosztási polinomokat, például n = 6-ra:
Így először az y3 + py + q = 0 egyenletet oldjuk meg, majd az x = y – b/3a helyettesítés megadja az eredeti polinom
zérushelyeit. (Ezzel tulajdonképpen egy tetszőleges harmadfokú egyenlet megoldását visszavezettük egy négyzetes tag
nélküli harmadfokú egyenlet megoldására.) Az y3 + py + q = 0 egyenlet megoldásai pedig a Cardano-képlet alapján
Ez a képlet ebben a formában nem teljesen egyértelmű, hiszen a komplex számok körében a nulla kivételével minden
számnak két négyzetgyöke és három köbgyöke van. A két köbgyökös kifejezésen belüli + és – különbség arra utal, hogy a
q2/4 + p3/27 szám két négyzetgyöke közül – amik egymásnak ellentettjei – az egyik az első, a másik pedig a második
köbgyökös kifejezésben szerepeljen. Ezek után, ha a két harmadik gyököt úgy választjuk meg, hogy a szorzatuk –p/3, akkor
(és csak akkor) kapjuk meg az y3 + py + q = 0 egyenlet egy megoldását. Tehát az első köbgyöknek a komplex számok körében
három lehetséges értéke van, legyenek ezek α1, α2 és α3, és így a megoldások:
Ha az y3 + py + q = 0 egyenlet valós együtthatós, akkor a valós gyökök számát illetően két eset lehetséges: vagy egy gyök
valós, vagy mindhárom az. Ez utóbbi eset pontosan akkor áll fenn, ha a négyzetgyök alatt álló q2/4 + p3/27 szám negatív
vagy nulla. Három különböző valós gyök esetén q2/4 + p3/27 szigorúan negatív, és így ahhoz, hogy ezt a három valós gyököt
megkapjuk, komplex (és nem valós) számokból kell köbgyököt vonnunk.
A negyedfokú polinomok gyökeinek a keresését szintén egy helyettesítéssel érdemes kezdeni: egy adott ax4 + bx3 + ex2 +
dx + e = 0 egyenlet az x = y – b/4a helyettesítéssel, majd az a főegyütthatóval történő leosztással y4 + py2 + qy + r = 0 alakra
hozható. Ha találunk olyan u, v, w számokat, amikkel
Ahhoz, hogy a fenti egyenletrendszert u, v, w-re megoldjuk, egy harmadfokú egyenlet gyökeit kell megtalálnunk,
ugyanis ekkor a p(z) = (z – u2) (z – v2) (z – w2) polinom kiszorozva:
Tehát a 64z3 + 32pz2 + (4p2 – 16r)z – q2 = 0 egyenlet megoldásaiból megkapjuk az u2, v2, w2 értékeket, ez ugyan nyolc
lehetőséget szolgáltat az u, v, w számhármasra, de ebből csak négy teljesíti az előírt –8 u v w = q feltételt (a másik négyre 8 u
v w = q). Ennek megfelelően négy eredményt kapunk az y = u + v + w értékre, ezek az y4 + py2 + qy + r = 0 egyenlet
megoldásai. Végül az x = y – b/4a helyettesítéssel megkapjuk az eredeti negyedfokú polinom gyökeit.
Az ötödfokú, illetve az annál magasabb fokú polinomok zérushelyeire már nincs általános megoldóképlet, ami az
együtthatók, a négy alapművelet, illetve gyökvonások segítségével tenné kiszámíthatóvá egy adott polinom gyökeit. Ennek
ellenére számos olyan tétel van, amikkel egy adott polinom zérushelyeiről értékes információkat kaphatunk.
Fontos szerepet játszik a zérushelyek vizsgálatában a polinomok deriváltjának a fogalma, amit itt most algebrai
módon, formálisan de niálunk:
Egy p(x) polinom nulladik deriváltja saját maga, és bármely pozitív egész k-ra a k-adik deriváltja a (k – 1)-edik derivált
deriváltja. A k-adik derivált jelölése: p(k) (x).
Ha f(x) és g(x) polinomok, valamint c egy tetszőleges konstans, akkor (cf) (x) = c · f(x), (f + g) (x) = f(x) + g (x), (f · g) (x) =
f(x) · g(x) és (f ○ g) (x) = f(g(x)) szintén polinomok, és a deriváltjaik az alábbi szabályokkal kaphatók meg f(x) és g(x)
deriváltjaiból:
- (cf)′(x) = c · f′(x),
- (f + g)′(x) = f′(x) + g′(x),
- (f · g)′ (x) = f′(x) · g(x) + f(x) · g′(x),
- (f ○ g)′(x) = f′(g(x))′g′(x).
Ha egy c szám k-szoros multiplicitással gyöke az f(x) polinomnak, akkor (k – 1)-szeres multiplicitással gyöke f′(x)-nek.
Tehát ha egy f(x) polinomnak van többszörös gyöke, akkor az szükségszerűen f′(x)-nek is gyöke, így f(x) és f′(x)
legnagyobb közös osztójának is.
Egy f(x) polinomnak pontosan akkor van többszörös gyöke, ha lnko(f (x), f′(x)) legalább elsőfokú. Minden többszörös
gyök szintén zérushelye az lnko(f (x), f′(x)) polinomnak is (eggyel kisebb multiplicitással, mint f(x)-ben), továbbá az f(x)
és f(x)/lnko(f (x), f′(x)) polinomok gyökei ugyanazok, ez utóbbiban viszont minden gyök egyszeres.
Az f(x) = anxn + an–1xn–1 + … + a1x + a0 és g(x) = bmxm + bm–1xm–1 + … + b1x + b0 (an ≠ 0, bm ≠ 0) polinomok rezultánsa az az
(n + m) × (n + m) méretű determináns, aminek 1 ≤ i ≤ m esetén az i-edik sorában i – 1 db 0-t az f(x) együtthatói követnek
sorban a főegyütthatóval kezdve, és a maradék m – i db elem ismét 0, valamint 1 ≤ j ≤ n esetén az m + j-edik sorában j – 1 db 0-
t a g(x) együtthatói követnek (szintén sorban, a főegyütthatóval kezdve), és a maradék n – j db elem ismét 0. Ezt a rezultánst
R(f(x), g(x)) jelöli (vagy röviden R(f, g)).
Amennyiben az f(x) polinom (komplex) gyökei α1, α2, …, αn és a g(x) polinom gyökei β1, β2, …, βm (a többszörös
gyököket multiplicitásuknak megfelelő számban szerepeltetve), tehát
és
akkor
Következésképp:
Az R (f(x), g(x)) rezultáns akkor és csak akkor nulla, ha a két polinomnak van közös zérushelye, azaz lnko(f(x), g(x))
legalább elsőfokú.
Egy f(x) polinomnak akkor és csak akkor van többszörös zérushelye, ha R(f(x), f′(x)) = 0.
Amennyiben az f(x) polinom (komplex) gyökei α1 α2, …, αn (multiplicitásuknak megfelelő számban szerepeltetve),
tehát f(x) = an(x – α1) (x – α2) … (x – αn), akkor
Ha f(x) másodfokú polinom, tehát f(x) = ax2 + bx + c és a ≠ 0, akkor f′(x) = 2ax + b, és visszakapjuk az ismert
diszkriminánsfogalmat:
Ez éppen a Cardano-képletben a négyzetgyök alatt szereplő q2/4 + p3/3 kifejezés –108-szorosa. Tehát az x3 + px + q
polinomnak akkor és csak akkor van többszörös zérushelye, ha a Cardano-képletben a négyzetgyök alatt nulla szerepel.
Mivel így a nem valós zérushelyek párba állíthatók konjugáltság szerint, a valós gyökök számáról a következőt
állíthatjuk:
Egy páros fokú valós együtthatós polinomnak páros sok, egy páratlan fokú valós együtthatós polinomnak páratlan sok
valós gyöke van (multiplicitásokkal számolva). Így minden páratlan fokú valós együtthatós polinomnak van legalább
egy valós gyöke.
Descartes tétele arról szól, hogy külön a pozitív, illetve negatív gyökök számának a paritását is meg tudjuk állapítani
az együtthatókból:
Ha f(x) = anxn + an–1xn–1 + … + a2x2 + a1x + A0 egy valós együtthatós polinom és az an, an–1, …, a2, a1, a0 sorozat
előjelváltásainak a száma d, akkor f(x) pozitív zérushelyeinek a száma (multiplicitásokkal számolva) d-vel egyező
paritású, és legfeljebb d.
Ha f(x) = anxn + an–1xn–1 + … + a1x + a0 egy valós együtthatós polinom és a (–1)nan, (–1)n–1an–1, …, a2, –a1, a0 sorozat
előjelváltásainak a száma d, akkor f(x) negatív zérushelyeinek a száma (multiplicitásokkal számolva) d-vel egyező
paritású, és legfeljebb d.
Előjelváltásnak kell számolni azt, amikor a sorozatban pozitív tagot negatív vagy negatív tagot pozitív követ, illetve
amikor egy 0 tag (vagy több 0-ból álló részsorozat) előtt és után különböző előjelű tagok állnak.
A Boudan–Fourier-tétel egy tetszőleges intervallumon belüli zérushelyek számára vonatkozik. Ha f(x) egy adott n-
edfokú polinom, jelölje df(γ) tetszőleges γ valós szám esetén az f(γ), f′(γ), f(2) (γ), …, f(n) (γ) sorozat előjelváltásainak a számát.
Amennyiben az α < β valós számok egyike sem gyöke f(x)-nek, akkor az (α, β) intervallumba eső zérushelyek száma
legfeljebb df(α) – df(β), és ezzel a számmal egyező paritású.
A Sturm-módszer ennél kicsit körülményesebb, viszont pontosan kiadja egy intervallumon belüli zérushelyek számát.
Egy adott f(x) polinomhoz konstruálunk egy g0(x), g1(x), g2(x), …, gr(x) polinomsorozatot a következőképp:
Legyen g0(x) = f(x)/lnko(f(x), f′(x)), g1(x) = g′0(x), és i ≥ 2 esetén gi(x) legyen a gi–2(x) polinom gi–1(x)-szel vett maradékos
osztásából kapott maradékának a negatívja. A sorozat tagjai tehát szigorúan csökkenő fokszámú polinomok, és mivel g0 (x)-
nek nincs többszörös gyöke, így Inko(g0(x), g1(x)) = 1, ezért pedig az utolsó nem nulla tag, gr(x) egy konstans polinom lesz.
Ezek után jelölje df(γ) tetszőleges γ valós szám esetén a g0(γ), g1(γ), g2(γ), …, gr(γ) sorozat előjelváltásainak a számát. Ha
most az α < β valós számok egyike sem gyöke f(x)-nek, akkor az (α, β) intervallumba eső zérushelyek száma pontosan df(α) –
df(β).
Ez az eredmény a multiplicitásokat gyelmen kívül hagyja, viszont utólag, külön munkával megkaphatjuk a kétszeres
gyökök számát, ha lnko(f(x), f′(x)) gyökeit számoljuk meg ugyanabban az intervallumban, illetve a háromszoros gyökök
számát, ha az lnko(f(x), f′(x)) polinomnak vesszük a deriváltjával a legnagyobb közös osztóját stb.
Példa. Az f(x, y, z) = 2x2yz + y2z2 – xy2 + 3z3 + x – 5 háromváltozós polinom foka 4, a negyedfokú homogén komponense
2x2yz + y2z2, a harmadfokú, másodfokú, elsőfokú és konstans homogén komponensek pedig rendre –xy2 + 3z3, 0, x és
–5.
Az x1, x2, …, xn változók (határozatlanok) egész együtthatós polinomjainak a halmazát ℤ[x1, x2, …, xn] jelöli, és
hasonlóan ℚ[x1, x2, …, xn], ℝ[x1, x2, …, xn], illetve ℂ[x1, x2, …, xn] jelölik a racionális, valós és komplex együtthatós
polinomok halmazát.
Egy többváltozós polinom szimmetrikus, ha bármely két változójának a felcserélése a polinomot magát változatlanul
hagyja.
Általában, a k-adik elemi szimmetrikus polinom – amit σk jelöl – a különböző változókból készült összes lehetséges k-
tényezős szorzat összege.
A szimmetrikus polinomok alaptétele:
Minden szimmetrikus polinom egyértelműen írható fel az elemi szimmetrikus polinomok polinomjaként. Ha f(x1, x2,
…, xn) szimmetrikus, akkor létezik pontosan egy olyan g(x1, x2, …, xn) polinom, amivel f(x1, x2, …, xn) = = g(σ1, σ2, …,
σn).
A tételben szereplő g(x1 x2, …, xn) polinom együtthatói az adott f(x1, x2, …, xn) szimmetrikus polinom együtthatóiból
összeadás és kivonás útján kaphatók meg, így ha f(x1, x2, …, xn) egész együtthatós, akkor ugyanez igaz g(x1, x2, …, xn)-re is,
illetve ha f(x1, x2, …, xn) racionális, valós vagy komplex együtthatós, akkor ugyanaz mondható el a g(x1, x2, …, xn)
polinomról is.
Példa. Az f(x, y, z) = x3y2z + x3z2y + y3z2x + y3x2z + z3x2y + z3y2x szimmetrikus polinom előállítása elemi szimmetrikus
polinomokkal:
Speciális szimmetrikus polinomok a k-adik hatványösszegek (ahol k tetszőleges pozitív egész szám):
A szimmetrikus polinomok alaptétele szerint ezek is kifejezhetők az elemi szimmetrikus polinomokból. Erre
vonatkoznak a Newton–Girard-formulák, amik segítségével rekurzív módon tudjuk sorra kiszámítani az Sk = Sk(x1, x2, …,
xn) hatványösszegek előállítását az elemi szimmetrikus polinomokkal:
Ha f(x) = anxn + an–1xn–1 + … + a1x + a0 (an ≠ 0) polinom gyöktényezős alakja f(x) = an(x – α1) (x – α2) … (x – αn), akkor
tetszőleges 1 ≤ i ≤ n egészre σi(α1, α2, …, αn) = (–1)i · an–i/an.
Speciálisan egy normált polinom együtthatói éppen a gyökök elemi szimmetrikus polinomjai váltakozó előjelekkel.
5. A sík elemi geometriája
5.1. A geometria rövid története
5.2. Geometriai alapfogalmak
5.3. Geometriai transzformációk
5.4. Háromszögek, nevezetes vonalak, pontok, körök, egyéb nevezetes objektumok
5.5. Négyszögek
5.6. Sokszögek, szabályos sokszögek, aranymetszés
5.7. A kör és részei, kerületi és középponti szögek, húr- és érintőnégyszögek
5.8. Geometriai szerkesztések, speciális szerkesztések
5.1. ábra
Az egyenest egy pontja két félegyenesre bontja. E pont a két félegyenes kezdőpontja. Ha kijelölünk egy egyenesen két
pontot: A-t és B-t, akkor ezek az egyenest két félegyenesre és egy szakaszra bontják (5.1. ábra).
Egy egyenes a síkot két félsíkra bontja. Ez az egyenes a két félsík határoló egyenese. Ha egy szakaszt egységnyi
hosszúságúnak választunk, akkor egy tetszőleges szakasz hosszát azzal a számmal jelöljük, ahányszor rámérhető az
egységnyi hoszszúságú szakasz.
A későbbiekben fontos lesz számunkra a távolság fogalma.
Megjegyzés. Tisztáznunk kell a „legrövidebb“ kifejezés jelentését. Ez úgy értendő, hogy a két ponthalmaz pontjait
összekötő szakaszok között a távolságnál nincs rövidebb szakasz. Ha pl. egy egyenesen kijelölünk két pontot: A-t és B-
t, és kivesszük az egyenesből e két pont közötti pontokat (vagyis az AB szakaszt az A és B pontok nélkül), akkor a
kapott két félegyenes távolsága az AB távolság. Ha azonban az A és B pontokat is tartalmazó szakaszt vesszük el,
akkor a megmaradó két „félegyenes“ pontjai között nincs „legkisebb“ távolság, így e két ponthalmaznak ilyen
módon nem értelmezzük a távolságát.
5.2. ábra
Két síkbeli egyenes metszi egymást, ha egy közös pontjuk van (5.2a ábra). Két síkbeli egyenes párhuzamos, ha nincs
közös pontjuk (5.2b ábra). A párhuzamosságjele: e║f.
Ha több szakaszt egymáshoz csatlakoztatunk, akkor töröttvonalat kapunk. Ha az egymáshoz csatlakoztatott szakaszok
közül az első kezdőpontja egybeesik az utolsó végpontjával, akkor zárt töröttvonalat (sokszöget, poligont), egyébként nyílt
töröttvonalat kapunk (5.3a–b ábra).
5.3. ábra
Szögek, szögpárok
A sík egy pontjából kiinduló két félegyenes a síkot két tartományra osztja; ezeket szögnek vagy szögtartománynak
nevezzük. Közülük az általunk vizsgálandó szöget körívvel jelöljük. A két félegyenest a szög szárainak, a közös
kezdőpontjukat a szög csúcsának mondjuk (5.4. ábra).
5.4. ábra
Szokás úgy is jelölni a szöget, hogy az egyik, illetve a másik szögszáron levő pontok közé írjuk a szög csúcsát jelölő
pontot. Így az 5.4. ábrán látható szöget jelölhetjük így is: AOB ∠ vagy BOA ∠.
Ha a két szögszár egybeesik és az általuk meghatározott nagyobbik síkrészt tekintjük, annak neve: teljesszög. Ha a két
szögszár egy egyenesbe esik, akkor a kapott szög neve: egyenesszög (5.5a–b ábra).
5.5. ábra
Ha az egyenesszöget két egybevágó szögtartományra bontjuk (azaz olyan szögtartományokra, melyek egymással
fedésbe hozhatók) derékszöget kapunk. A derékszögnél kisebb szöget hegyesszögnek, a derékszögnél nagyobb, de az
egyenesszögnél kisebb szöget tompaszögnek, a tompaszögnél nagyobb szöget homorúszögnek nevezzük (lásd 5.6a–d ábra).
A derékszöget megkülönböztetésül a szöget jelölő körívbe rajzolt ponttal jelöljük az ábrákon.
Gyakran előfordul, hogy egy szög egy félegyenesnek a végpontja körüli elforgatásával keletkezik; az ilyen szöget
irányított szögnek nevezzük. Amennyiben a forgatás iránya az óramutató járásával ellenkező, akkor pozitív irányítású, ha
a forgatás az óramutató járásával megegyező, akkor negatív irányítású szögről van szó.
5.6. ábra
A szögeket mérni tudjuk. A szögmérés egysége az 1 fok (1°). Ez a teljesszög 360-ad része. Ennek megfelelően az
egyenesszög mértéke 180°, a derékszög mértéke 90°. Az 1° 60-ad része a szögperc (′), a szögperc 60-ad része a szögmásodperc
(˝).
A szög mértékének másik jelölésére használjuk az ívmértek fogalmát. Ennek egysége az 1 radián. Vegyünk fel egy O
középpontú kört, majd annak valamely A pontjából kiindulva mérjük fel azt az AB ívet, melynek hossza egyenlő a kör
sugarával. Az így kapott AOB szög mértéke az 1 radián (5.7. ábra).
5.7. ábra
5.8. ábra
Mivel a kör kerületére a sugár 2π-szer fér rá, ezért a teljesszög mértéke 2π radián, az egyenesszög π radián, a derékszög
radián.
Ha két egyenes metszi egymást, akkor a metszéspontjuk 4 db szög csúcsa. Azokat a szögeket, melyeknek nincs közös
száruk, csúcsszögeknek nevezzük. Azokat a szögeket, melyeknek van egy-egy közös száruk mellékszögeknek nevezzük (5.8.
ábra).
A csúcsszögek mindig egyenlők. A mellékszögek összege mindig 180°.
Az olyan szögeket, melyeknek szárai párhuzamosak és azonos irányúak, egyállású szögeknek, amelyeknek szárai
párhuzamosak, de ellentétes irányúak, váltószögeknek nevezzük (5.9a–b ábra).
5.9. ábra
Ha két szög szárai merőlegesek egymásra, akkor lehet mindkét szög hegyesszög, mindkét szög tompaszög vagy az egyik
szög hegyes-, a másik pedig tompaszög (5.10a–c ábra).
5.10. ábra
A merőleges szárú hegyesszögek és a merőleges szárú tompaszögek mindig egyenlők. Ha a merőleges szárú szögek
egyike hegyesszög, a másik tompaszög, akkor a két szög összege 180°.
Ha egy transzformáció során bármely P pont P′ képével a transzformációt még egyszer végrehajtva az eredeti ponthoz
jutunk vissza, azaz P ˝ ≡ P, akkor a transzformációt szimmetrikus transzformációnak nevezzük. Ha egy transzformáció
során valamely P pont képe önmaga, azaz P ≡P′, akkor e P pontot xpontnak nevezzük. Ha egy transzformáció során
valamely alakzat képe önmaga, akkor az alakzatot invariáns alakzatnak nevezzük. (Természetesen, ha egy alakzat minden
pontja xpont, akkor invariáns alakzatról van szó.)
Nagyon fontos transzformációk a távolságtartó transzformációk. Ezek legfőbb jellemzője, hogy bármely két pont
képének a távolsága megegyezik az eredeti tárgypontok távolságával. Az ilyen transzformációkat egybevágósági
transzformációknak nevezzük. Ilyenek pl. a tengelyes tükrözés, a középpontos tükrözés, az eltolás és a pont körüli
elforgatás.
Az egyes transzformációk vizsgálata során az alábbi tulajdonságok lesznek számunkra a legfontosabbak.
Van-e a transzformáció végrehajtása során xpont, azaz olyan pont, melynek képe önmaga? (Találhatók-e invariáns
alakzatok, azaz olyan alakzatok, melyeknek képe maga az eredeti alakzat.)
Szimmetrikus-e a transzformáció, azaz bármely P pont képének a képe azonos-e az eredeti P ponttal?
Egyenes és szakasz képe hogyan alakul?
Szög képe hogyan alakul?
Változik-e a transzformáció során az alakzat körüljárásának iránya? (Ez azt jelenti, hogy ha pl. egy A1A2 … An sokszöget
valamely, pl. az A1 pontból kiindulva körbejárunk pl. az óramutató járásával ellentétes irányban, akkor a képalakzat A′1
pontjából kiindulva, az egyes csúcspontokat a megfelelő sorrendben körüljárva az alakzatot, az óramutató járásával
ellenkező irány marad-e, vagy ez megváltozik.)
Tengelyes tükrözés
Középpontos tükrözés
Pont körüli elforgatás
Eltolás
Középpontos hasonlóság
Merőleges a nitás
Inverzió
Tengelyes tükrözés
Legyen adott a síkon egy t egyenes (tengely). A sík tetszőleges P pontjához hozzárendeljük azt a P′ pontot, mely a P-ből
t-re állított merőleges egyenes t-n túli meghosszabbításán van t-től ugyanolyan távolságra, mint az eredeti P pont (5.11.
ábra). Ekkor tengelyes tükrözésről beszélünk.
5.11. ábra
A tengelyes tükrözés esetében xpont: a t tengely összes pontja, és csak ezek a pontok. Ugyanakkor vannak invariáns
alakzatok. Invariáns egyenes pl. maga a t tengely, hiszen minden pontja xpont. De invariáns egyenes minden olyan
egyenes, mely a t tengelyre merőleges. Invariáns szakasz minden olyan szakasz, melynek a t tengely felező merőlegese.
Invariáns kör pl. minden olyan kör, melynek középpontja illeszkedik a t tengelyre.
A tengelyes tükrözés szimmetrikus transzformáció, azaz bármely P pont P′ képének a P ˝ képe az eredeti P ponttal
azonos.
Egyenes képe egyenes. Ha az eredeti e egyenes párhuzamos a t tengellyel, akkor annak e′ képe is párhuzamos a t
tengellyel. Ha az eredeti e egyenes nem párhuzamos a t tengellyel, akkor e és e′ a t tengelyen metszik egymást (5.12a–b ábra).
5.12. ábra
A tengelyes tükrözés távolságtartó, szögtartó transzformáció, mely a körüljárás irányát megváltoztatja (5.13. ábra).
Megjegyzés. Ha valamely alakzathoz található olyan egyenes, melyre nézve az alakzat invariáns alakzat, azaz melyre
az alakzatot tengelyesen tükrözve a képe önmaga, akkor az alakzatot tengelyesen szimmetrikus alakzatnak, a
kérdéses egyenest pedig az alakzat szimmetriatengelyének nevezzük. Tengelyesen szimmetrikus alakzat pl. az
egyenlő szárú háromszög egy szimmetriatengellyel, a négyzet 4 db szimmetriatengellyel, a rombusz két
szimmetriatengellyel, a kör végtelen sok szimmetriatengellyel (5.14. ábra). Ha egy véges (korlátos) alakzatnak több
szimmetriatengelye van, akkor ezek mindig egy pontban metszik egymást.
5.13. ábra
5.14. ábra
Példák
1. Adott egy t egyenes és két partján egy-egy pont: A és B. Szerkesszünk olyan egyenlő szárú háromszöget, melynek t
a szimmetriatengelye, továbbá A az egyik csúcsa, és B pont a háromszög másik száregyenesére illeszkedik.
Az egyenlő szárú háromszög a t tengelyre tengelyesen szimmetrikus, így az egyik szárnak a t tengelyre vonatkozó
tükörképe a másik szár. Ebből következik, hogy az egyik pontnak (pl. B-nek) t-re vonatkozó tükörképe rajta van a
másik száron (5.15. ábra). A szerkesztés menete: B-t tükrözzük a t tengelyre, a tükörkép B′ pontot A-val összekötve
megkapjuk a háromszög C csúcsát. Eztán a C-t B-vel összekötő egyenes és A-ból a t-re állított egyenes
metszéspontja egyértelműen megadja a háromszög harmadik A′ csúcsát. Ha a B pont t-re vonatkozó tükörképe
azonos az A ponttal, akkor végtelen sok megoldást kapunk. Ha a B pont ugyanolyan távol van t-től, mint az A
pont, de egymásnak nem tükörképei, akkor az AB′ egyenes párhuzamos lesz t-vel, így ez esetben nincs megoldás.
2. A térképen egy t egyenes jelöl egy folyót, és a folyó ugyanazon partján két pont, A és B jelöl egy-egy falut. AB
faluban tűz ütött ki, az A faluban laknak a tűzoltók. Hogyan juthatnak
5.15. ábra
el a tűzoltók a leggyorsabban (azaz a legrövidebb úton) A-ból B-be, ha közben a folyóról vizet is kell venniük.
Tükrözzük a két pont egyikét (pl. A-t) t-re, majd az A′ pontot kössük össze B-vel. Ha az A′B egyenes t-t M-ben
metszi, akkor az AM–MB út a legrövidebb. Legyen ugyanis Q egy M-től különböző pont (5.16. ábra).
5.16. ábra
A tükrözés miatt AM = A′M és AQ = A′Q. Az A′QB háromszögben – a háromszögegyenlőtlenség miatt –A′B = A′M +
MB < A′Q + QB. Ezek szerint
Középpontos tükrözés
Adott egy O pont (a tükrözés centruma). A sík tetszőleges P pontjához hozzárendeljük azt a P′ pontot, mely a PO
félegyenes O-n túli meghosszabbításán van, és amelyre PO = P′O. Az így megadott transzformációt középpontos
(centrális) tükrözésnek nevezzük.
A középpontos tükrözésnél xpont az O pont és csak az O pont. Megemlítünk néhány invariáns alakzatot: invariáns
egyenes minden az O ponton áthaladó egyenes. Invariáns szakaszok azok a szakaszok, melyeknek felezőpontja az O pont.
Invariáns körök azok a körök, melyek középpontja az O pont.
A középpontos tükrözés szimmetrikus transzformáció, mert bármely P pont képének a P ˝ képe azonos az eredeti P
ponttal.
Egyenes képe vele párhuzamos egyenes.
A középpontos tükrözés távolságtartó, szögtartó transzformáció, mely a körüljárás irányát nem változtatja meg (5.17.
ábra).
Megjegyzés. Ha valamely alakzathoz található olyan O pont, melyre nézve az alakzat invariáns (azaz, amelyre
középpontosan tükrözve a képe önmaga), akkor az alakzatot középpontosan szimmetrikus alakzatnak nevezzük, a
kérdéses pontot szimmetria-középpontnak (szimmetriacentrumnak) nevezzük. Középpontosan szimmetrikus
alakzatok pl. a paralelogramma, a kör, a páros oldalszámú szabályos sokszög stb. Ha egy véges alakzatnak több
szimmetriatengelye van és középpontosan is szimmetrikus, akkor a szimmetriatengelyek metszéspontja a
szimmetriacentrumban van.
5.17. ábra
Példák
1. Adott két egymásra merőleges egyenes e és f, melyek az M pontban metszik egymást, továbbá adott egy P pont. A
P pontnak e-re vonatkozó tükörképe P′, P′-nek f-re vonatkozó tükörképe P ˝. Igazoljuk, hogy P ˝ az eredeti P
pontnak O-ra vonatkozó centrális tükörképe.
Tekintsük az 5.18. ábrát! A tükrözés miatt PM = P′M = P ˝M, továbbá a PMP′ szögnek e, a P′MP ˝ szögnek f
szögfelezője. Mivel α + β = 90°, vagyis 2α + 2β = 180°, ez pedig éppen azt jelenti, hogy a P pontnak az M pontra
vonatkozó tükörképe P ˝.
2. Adott egy hegyesszög és annak belsejében a P pont. Szerkesszünk olyan P ponton átmenő egyenest, melynek a
szögszárak közé eső darabját a P pont felezi!
Legyen O a szög csúcsa, e és f a két szögszár. Ha a P pont felezi a szerkesztendő egyenesnek a szögszárak közé eső
darabját, akkor ennek az egyenesnek az egyik szögszárral való metszéspontjának P-re vonatkozó tükörképe éppen
az egyenesnek a másik
5.18. ábra
5.19. ábra
szögszárral való metszéspontja lesz (5.19. ábra). Így ha az egyik szögszárat (pl. e-t) tükrözzük P-re, akkor az e''
tükörkép fogja kimetszeni a keresett egyenes és az f szögszár M metszéspontját.
Adott egy O pont és egy α irányított szög. A sík tetszőleges P pontjához hozzárendeljük az alábbi P'' pontot: O-ban
felmérjük az OP félegyenesre az irányított α szöget, majd az új szögszárra felmérjük az OP′ = OP szakaszt. Az így
megadott transzformációt pont körüli elforgatásnak nevezzük.
Ha az elforgatás szöge 360°, vagy annak egész számú többszöröse, akkor a sík minden pontja xpont. Egyébként a pont
körüli elforgatás esetében egyedül az O pont xpont. Ez a transzformáció általában nem szimmetrikus, vagyis valamely P
pont képének a képe általában nem azonos a P ponttal. Kivétel az az eset, amikor az elforgatás szöge 180° vagy annak egész
számú többszöröse.
Egyenes képe olyan egyenes, melynek az eredeti egyenessel bezárt szöge megegyezik az elforgatás szögével. A pont
körüli elforgatás távolság- és szögtartó transzformáció. A pont körüli elforgatás a körüljárás irányát megtartja (5.20. ábra).
Megjegyzés. Ha valamely alakzathoz található olyan O pont, mely körül α < 360° szöggel elforgatva az alakzat
önmagába megy át, forgásszimmetrikus alakzatnak nevezzük. Ha az alakzatot az O pont körül n-szer elforgatva úgy
megy át önmagába, hogy a megfelelő pontok a megfelelő pontokba mennek át, akkor az alakzat n-ed rendben
forgásszimmetrikus. Minden szabályos n oldalú sokszög n-ed rendben forgásszimmetrikus alakzat.
Példák
1. Adott két nem párhuzamos, egyenlő hosszúságú szakasz. Határozzuk meg a sík azon O pontját, mely körül
alkalmas forgatással az egyik szakasz a másikba vihető!
Ha valamely P′ pont egy adott P pont elforgatott képe, akkor a forgatás O középpontjának rajta kell lennie a PP′
szakasz felező merőlegesén. Ezek szerint az elforgatás O középpontja a két szakasz megfelelő végpontjai által
meghatározott szakaszok felező
5.20. ábra
merőlegeseinek a metszéspontja. Mivel a két szakasz nem párhuzamos, ezért ez a pont egyértelműen
meghatározható.
2. Adott három párhuzamos egyenes: e, f és g. Szerkesszünk olyan szabályos (egyenlő oldalú) háromszöget, melyek
csúcsai egy-egy egyenesre illeszkednek!
Vegyünk fel a középső f egyenesen egy tetszőleges P pontot, és forgassuk el P körül 60°-kal az e és g egyenesek
egyikét (pl. g-t)! (Az elforgatást úgy tudjuk a legegyszerűbben végrehajtani, hogy P-ből merőlegest állítunk g-re,
majd e merőleges T talppontját forgatjuk el 60°-kal, s a kapott T′ pontban merőlegest állítunk a PT′ szakaszra; az
így kapott egyenes lesz a g egyenes P körüli 60°-os elforgatottja.) Az 5.21. ábrán a g egyenesnek és g′
elforgatottjának metszéspontját E′-vel jelöltük.
Ha most az E′ pontot elforgatjuk P körül –60°-kal, akkor a kapott E pont a g egyenesen lesz. Mivel PE′ = PE és E′PE
∠ = 60°, ezért az E′PE háromszög egyenlő oldalú háromszög.
5.21. ábra
Eltolás
Az irányított szakaszt vektornak nevezzük. A vektor tehát olyan mennyiség, melynek nagysága, állása és iránya van. A
vektorokat (kezdő- és végpontjukat érzékeltetve) nyíllal szemléltetjük. Jelölésükre vastag betűt használunk, vagy pedig a
kezdő- és végpontját jelölő pontok fölé írt nyíllal szemléltetjük (5.22. ábra).
Két vektor akkor és csak akkor egyenlő, ha nagyságuk, állásuk és irányuk is megegyezik. Ha valamely vektor hossza 0,
akkor nullvektornak nevezzük, melynek iránya tetszőleges.
Adott egy v vektor. A sík tetszőleges P pontjához hozzárendeljük a P pontból induló v vektor P′ végpontját. Az így
de niált transzformációt eltolásnak nevezzük.
5.22. ábra
Ha az eltolás vektora nullvektor, akkor a sík minden pontja xpont. Ha az eltolás vektora nem nullvektor, akkor az
eltolásnál nincs xpont. Invariáns egyenes minden olyan egyenes, mely párhuzamos az eltolás vektorával. Bármely
egyenes képe párhuzamos az eredeti egyenessel. Az eltolás távolság- és szögtartó transzformáció. Az eltolás a körüljárás
irányát nem változtatja meg (5.23. ábra).
5.23. ábra
Megjegyzés. Érdemes kiemelni, hogy – ellentétben a korábbi transzformációkkal – ha az eltolás vektora nem
nullvektor, akkor nem létezik véges invariáns alakzat.
Példák
1. Adott két pont: O1 és O2. A sík egy tetszőleges P pontját centrálisán tükrözzük O1-re, majd a kapott P′ képpontot
ugyancsak centrálisan tükrözzük O2-re. Igazoljuk, hogy az így végrehajtott két transzformáció helyettesíthető
egyetlen eltolással! Adjuk meg az eltolás vektorát is!
Az 5.24. ábrát elemezve észrevehetjük, hogy a PP′P ˝ háromszögnek O1O2 egy középvonala, így PP ˝ szakasz
párhuzamos az O1O2 szakasszal, és hossza az O1O2 szakasz hosszának kétszerese.
Ez azt jelenti, hogy a két transzformáció helyettesíthető egy olyan eltolással, melynek vektora az O1O2 vektor
kétszerese: v = 2O1O2. (Könnyen ellenőrizhető, hogy ez akkor is igaz lesz, ha a P pont az O1O2 szakasz egyenesére
illeszkedik, vagyis a P, P′, P ˝ pontok egy egyenesre illeszkednek.)
5.24. ábra
5.25. ábra
2. Az 5.25. ábrán egy folyót látunk, annak két partján egy-egy falut: A-t és B-t. Hová építsék a folyóra merőleges
hidat, hogy a lehető legrövidebb úton el lehessen jutni A-ból B-be?
Toljuk el a folyó egyik partját és valamelyik (pl. az A) pontot a folyó irányára merőleges és a folyó szélességével
egyenlő nagyságú vektorral, majd az A pont A′ képét kössük össze a B ponttal. Ha ez az A′B szakasz a folyó másik
partját M-ben metszi, akkor M-ben kell a folyóra merőleges hidat építeni, hogy a legrövidebb utat megkapjuk A és
B között. Tekintsük ugyanis az 5.26. ábrát! Azt kell megmutatnunk, hogy bármely más Q pont esetén
5.26. ábra
Az eddig megismert transzformációk fontos tulajdonsága, hogy távolságtartó leképezések, azaz egybevágósági
transzformációk. A továbbiakban néhány nem egybevágósági transzformációt tárgyalunk.
Középpontos hasonlóság
Adott egy O pont és egy k > 0 valós szám. A sík tetszőleges P pontjához hozzárendeljük az OP félegyenes azon P′ pontját,
melyre OP′ = k · OP. Az így de niált transzformációt középpontos hasonlóságnak nevezzük.
Az O pontot a középpontos hasonlóság középpontjának, a k számot a hasonlóság arányának mondjuk. Ha k > 1, akkor a
középpontos hasonlóság nagyítás, ha k < 1, akkor kicsinyítés.
Középpontos hasonlóság esetén xpont egyedül az O pont. (Kivéve, ha k = 1, ekkor a sík minden pontja xpont.) Ha k ≠
1, akkor nincs invariáns alakzat.
E transzformáció nem szimmetrikus, azaz nincs olyan P pont, amely P′ képének a P ˝ képe azonos az eredeti P ponttal.
Egyenes képe mindig egyenes, mégpedig az eredeti egyenessel párhuzamos egyenes. Szakasz képének a hossza az
eredeti szakasz hosszának a k-szorosa. A középpontos hasonlóság szögtartó.
A középpontos hasonlóság a körüljárás irányát nem változtatja meg (lásd 5.27. ábra, melyen az ABC háromszögre k = 2
arányú nagyítást szemléltettünk).
5.27. ábra
A középpontos hasonlóság egy fontos alkalmazása a párhuzamos szelők, illetve a párhuzamos szelőszakaszok tétele.
Ha egy szög szárait párhuzamosokkal metsszük, akkor az egyik szögszáron keletkező szakaszok aránya egyenlő a
másik szögszáron keletkező szakaszok arányával.
Ha egy szög szárait párhuzamosokkal metsszük, akkor a szárak között keletkező szakaszok aránya egyenlő a szárakból
lemetszett szakaszok arányával.
Ha egy szög szárait úgy metsszük el két egyenessel, hogy a szög száraiból a csúcsoktól mérve a levágott szakaszok
aránya egyenlő, akkor a két metsző egyenes párhuzamos.
A háromszög szögfelezője a szemközti oldalt két olyan szakaszra bontja, melyek aránya egyenlő a megfelelő
szomszédos oldalak arányával.
Mérjük fel az ABC háromszög b = AC oldalának C-n túli meghosszabbítására a CE = a szakaszt (5.29. ábra), és legyen p
és q az a két szakasz, melyre a C-ből induló szögfelező a szemközti c oldalt bontja.
5.29. ábra
A BCE háromszög egyenlő szárú. Mivel ECB ∠ = 180° – γ, ezért . Ez viszont azt jelenti, hogy az EB
szakasz párhuzamos az ABC háromszög C-ből induló szögfelezőjével. E két párhuzamos szakaszt felhasználva írjuk
fel a párhuzamos szelők tételét:
Példák
1. Az AB szakasz végpontjaiban merőlegeseket állítunk a szakaszra a szakasz ugyanazon oldalának irányában.
Ezekre felmérjük az a = AE és b = BF szakaszokat. Legyen M az AF és BE szakaszok metszéspontja! Milyen távol van
az M pont az AB egyenestől (5.30. ábra)? Az EBA, majd az FAB szögekre alkalmazva a párhuzamos
szelőszakaszokról szóló tételt, azt kapjuk:
2. Az ABC háromszög AB oldalának felezőpontja F. Az AB oldal egy tetszőleges belső P pontján keresztül CF-fel
párhuzamos egyenes AC oldal egyenesét M-ben, BC oldal egyenesét N-ben metszi. Igazoljuk, hogy a PM + PN
összeg állandó, azaz független a P pont választásától! Tekintsük az 5.31. ábrát!
5.30. ábra
5.31. ábra
(5.1)
Merőleges a nitás
Adott a síkon egy t egyenes és egy k > 0 valós szám. A sík tetszőleges P pontjához hozzárendeljük az alábbi P′ pontot: P-
ből merőlegest állítunk a t egyenesre, ennek talppontja legyen T; P′ a TP félegyenes azon pontja, melyre TP′ = k · TP. Az
így megadott transzformációt merőleges a nitásnak nevezzük.
A t egyenest az a nitás tengelyének, a k számot az a nitás arányának nevezzük. Ha k = 1, akkor a sík minden pontja
xpont. Ha k ≠ 1, akkor e transzformáció xpontjai a t tengely és csak a t tengely pontjai. Invariáns egyenes a t tengely
(hiszen minden pontja xpont), valamint a t tengelyre merőleges egyenesek.
Ez a transzformáció nem szimmetrikus, hiszen nincs olyan P pont, mely képének a képe azonos P-vel.
A merőleges a nitás esetén egyenes képe egyenes, de nem távolságtartó és nem is szögtartó transzformáció.
A transzformáció a körüljárás irányát megtartja (5.32. ábra, melyen a merőleges a nitás aránya ).
5.32. ábra
Megjegyzés. A merőleges a nitás nem távolságtartó transzformáció. A tengellyel párhuzamos szakasz képének
hossza egyenlő az eredeti szakasz hosszával, de a tengellyel nem párhuzamos szakasz hossza már eltér az eredeti
szakasz hosszától. Ha k < 1, akkor a szakasz képe rövidebb az eredetinél; a legnagyobb a rövidülés, ha az eredeti
szakasz merőleges a tengelyre; ekkor a kép hossza az eredeti szakasz hosszának k-ad része, k > 1 esetén pedig a szakasz
képének hossza az eredeti szakasz hosszának a k-szorosa. Szokás a merőleges a nitást k > 1 esetben „nyújtásnak“, k <
1 esetén pedig „zsugorításnak“ nevezni. Kimutatható, hogy a merőleges a nitás körhöz ellipszist rendel.
Inverzió
Adott egy O középpontú r sugarú kör. A sík – O-tól különböző – tetszőleges P pontjához hozzárendeljük az AP félegyenes
azon P′ pontját, melyre OP · OP′ = r2. Az így de niált transzformációt inverziónak nevezzük.
Az O pont az inverzió pólusa, a kör az inverzió alapköre, az r2 pedig az inverzió hatványa. (Szokás az inverziót körre
vonatkozó tükrözésnek is nevezni.) Ez a transzformáció a kör O középpontjához nem rendel pontot, a kör többi belső
pontjához körön kívüli pontot rendel, a körön kívüli ponthoz pedig a kör egy belső pontját rendeli; mondhatjuk: a sík
körön kívüli pontjait a kör belsejébe képezi le (5.33. ábra).
Az inverzió meghatározásából következik, hogy xpontok az alapkör pontjai és csakis ezek a pontok. Invariáns
egyenesek a póluson áthaladó egyenesek, kivéve belőlük magát a pólust. Az inverzió szimmetrikus transzformáció:
bármely P pont P′ képének a P ˝ képe maga a P pont.
A póluson át nem haladó egyenes képe póluson áthaladó kör, míg a póluson áthaladó kör képe póluson át nem haladó
egyenes (5.34. ábra).
5.33. ábra
5.34. ábra
5.4. Háromszögek, nevezetes vonalak, pontok, körök, egyéb nevezetes
objektumok
A háromszög olyan síkidom, melynek három nem egy egyenesre illeszkedő csúcsa, három oldala és három szöge van.
A háromszög csúcsait nagybetűkkel, egy-egy csúccsal szemközti oldalait kisbetűkkel, az egyes csúcsoknál levő
megfelelő szöget görög kisbetűkkel jelöljük (5.35. ábra).
5.35. ábra
A háromszögeket osztályozhatjuk oldalaik és szögeik szerint. Oldalaik szerint két speciális háromszöget
különböztetünk meg.
Az egyenlő szárú háromszög olyan háromszög, melynek két oldala egyenlő. Az egyenlő szárú háromszög egyenlő
oldalait száraknak, a harmadik oldalt alapnak nevezzük; a szárakkal szemközti szögek egyenlők. Az egyenlő szárú
háromszög tengelyesen szimmetrikus alakzat, szimmetriatengelye az alap oldalfelező merőlegese (5.36a ábra).
5.36. ábra
Az egyenlő oldalú (szabályos) háromszög mindhárom oldala és mindhárom szöge egyenlő, szögei 60°-osak. Az egyenlő
oldalú háromszög tengelyesen szimmetrikus alakzat, három szimmetriatengelye van (5.36b ábra).
Szögei szerint a háromszög hegyes-, derék- vagy tompaszögű.
A hegyesszögű háromszög minden szöge hegyesszög (5.37a ábra). A derékszögű háromszög egyik szöge 90°, másik két
szöge hegyesszög (5.37b ábra). A derékszöget közrefogó oldalak a derékszögű háromszög befogói, a derékszöggel szemközti
oldal a háromszög átfogója. A tompaszögű háromszög egyik szöge 90°-nál nagyobb, másik két szöge pedig hegyesszög (5.37c
ábra).
5.37. ábra
Egyszerű algebrai átrendezéssel kapjuk, hogy a háromszög bármely két oldalának különbsége kisebb a harmadik
oldalnál.
Húzzunk ugyanis a háromszög egyik (pl. C) csúcsán keresztül egy párhuzamost a szemközti oldallal (5.38. ábra)!
5.38. ábra
Az α-val jelölt szögek, illetve a β-val jelölt szögek egyenlők, hiszen egyállású szögek, a γ-val jelölt szögek pedig azért
egyenlők, mert csúcsszögek. Az ábrából látható:
Bármely háromszögben nagyobb oldallal szemben nagyobb, kisebb oldallal szemben kisebb szög van.
A háromszög egy oldalának meghosszabbításakor a belső szög mellékszögét a háromszög egy külső szögének mondjuk.
A háromszög külső szöge egyenlő a nem mellette fekvő belső szögek összegével.
Tekintsük az 5.39. ábrát, melyen a B csúcsnál levő külső szöget φ-vel jelöltük!
5.39. ábra
Példák
1. Az ABC háromszög B, illetve C csúcsainál levő külső szögek: 103°, illetve 130°. Mekkora a háromszög A csúcsnál
levő belső szöge?
A B és C csúcsoknál levő belső szögek: 77°, illetve 50° (5.40. ábra).
5.40. ábra
2. Az ABCD négyszög A csúcsnál levő belső szöge 72°, a C és D csúcsoknál levő külső szögek: 85°, illetve 80°. Az ACD
szög 40°. Mekkora a B csúcsnál levő belső szög?
Tekintsük az 5.41. ábrát! A D csúcsnál levő belső szög 100°, így az ADC háromszög A csúcsnál levő belső szöge 40°,
tehát az ABC háromszög A csúcsnál levő szöge 32°. Mivel a négyszög C csúcsnál levő belső szöge 95°, ezért az ABC
háromszög C csúcsánál levő belső szöge 55°. Ezek szerint a B csúcsnál levő keresett szög: φ = 180° – 32° – 55° = 93°.
5.41. ábra
3. Egy háromszög szögei egy számtani sorozat egymást követő tagjai, legnagyobb szöge 82°. Mekkora a háromszög
másik két szöge?
Legyen α a háromszög „középső“ szöge, és legyen d a sorozat di erenciája! Ekkor
Ha a legnagyobb szög 82°, akkor a di erencia 22°, tehát a legkisebb szög 38°.
4. Az ABC egyenlő szárú hegyesszögű háromszög alapja AB. A BC szárra emeltük a BCE szabályos háromszöget.
Mekkora az EAB szög?
Elemezzük az 5.42. ábrát! Ha az AB alapon fekvő két szög α, akkor a C csúcsnál levő belső szög 180° – 2α. Mivel AC =
CB = CE, ezért az ACE háromszög egyenlő szárú. E háromszög C csúcsnál levő belső szöge 240° – 2α, ezért az ACE
háromszög A csúcsnál levő szöge:
5.42. ábra
Ebből következik, hogy ha két háromszög egy-egy oldala egyenlő, akkor területeik aránya az egyenlő oldalakhoz
tartozó magasságok arányával egyenlő, ha pedig két háromszög egy-egy oldalához tartozó magasságai egyenlők, akkor a
háromszögek területének aránya az egyenlő magasságokhoz tartozó oldalak arányával egyenlő. Mindezek segítségével
igazolhatjuk a bizonyítási feladatoknál igen hasznos Ceva-tételt.
Legyen P az ABC háromszög egy tetszőleges belső pontja; az AP, BP, CP egyenesek a szemközti oldalait A1, B1, illetve C1
pontokban metszik. Ekkor
Tekintsük az 5.44. ábrát, melyen a keletkező részháromszögek területeit t1, t2, …, t6-tal jelöltük.
5.43. ábra
5.44. ábra
Az APC1 és BPC1 háromszögek AC1 és BC1 oldalaihoz tartozó magasságaik egyenlők. De ugyanez elmondható az AC1C,
illetve BC1C háromszögekről is, így írhatjuk az alábbi egyenlőségeket:
(5.2)
Igaz a Ceva-tétel megfordítása is: ha az ABC háromszög AB oldalának C1, BC oldalának A1, CA oldalának B1 pontjaira
fennáll az
egyenlőség, akkor az AA1, BB1, CC1 egyenesek egy ponton haladnak keresztül.
5.45. ábra
Az ABC és ABC′ háromszögekben két-két oldal és a kisebbikkel szemközti szögek egyenlők, de a két háromszög
nyilvánvalóan nem egybevágó. A B csúccsal szemközti szög lehet hegyesszög (ABC′ háromszög), de lehet tompaszög
is (ABC háromszög). Ha azonban megköveteljük, hogy a nagyobbik oldallal szemközti szögek legyenek egyenlők,
akkor ez már nem fordulhat elő. Háromszögek hasonlóságánál pontosan ugyanezzel a helyzettel állunk szemben.
Példák
1. Az ABC háromszög AC oldalának felezőpontja F, BC oldalának felezőpontja E. Az EFC háromszög területe
hányadrésze az ABC háromszög területének?
Ezek szerint az ABC és EFC háromszögek hasonlók, és a hasonlóság aránya 1 : 2, így a két háromszög területének
aránya 1 : 4, vagyis az EFC háromszög területe az ABC háromszög területének a negyedrésze.
2. Az ABCD trapéz átlóinak metszéspontja M. Igazoljuk, hogy az AMD és a BMC háromszögek területe egyenlő,
mégpedig az ABM és CDM háromszögek területeinek a mértani közepe.
Az ABC és ABD háromszögek területe egyenlő, hiszen AB oldaluk közös, és az ezekhez az oldalakhoz tartozó
magasságok egyenlők. Ha mindkét háromszögből elvesszük az ABM háromszöget, akkor egyenlő területek
maradnak vissza, tehát az AMD háromszög területe valóban egyenlő a BMC háromszög területével. Jelöljük ezt a
területet tx-szel (5.47. ábra)!
5.47. ábra
Derékszögű háromszögek
Különösen fontos tulajdonságaik miatt részletesebben foglalkozunk a derékszögű háromszögekkel.
Thalész tétele.
Ha egy kör egy átmérőjének két végpontját összekötjük a körív bármely más P pontjával, akkor a P pontnál derékszög
keletkezik.
5.48. ábra
Thalész tétele tehát azt is jelenti, hogy ha egy körbe derékszögű háromszöget írunk, akkor annak átfogója áthalad a kör
középpontján. Egy szakaszra mint átmérőre rajzolt kört a szakasz Thalész-körének nevezzük.
A matematika, a zika és általában a természettudományok szinte valamennyi területén nagyjelentőségű Pitagorasz
tétele.
Bármely derékszögű háromszög befogói négyzetének összege egyenlő az átfogó négyzetével, azaz (az 5.49. ábra
jelöléseivel) a2 + b2 = c2.
5.49. ábra
5.50. ábra
ha egy háromszög két oldala négyzetének összege egyenlő a harmadik oldal négyzetével, akkor a háromszög
derékszögű.
Alkalmazások
1. Pitagorasz tételének alkalmazásaként könnyen meghatározhatjuk az a oldalú négyzet átlóját, az a oldalú
szabályos háromszög magasságát, valamint az a élű kocka testátlójának a hosszát (5.51. ábra).
5.51. ábra
2. Igazoljuk, hogy a paralelogramma oldalai négyzetének összege egyenlő az átlók négyzetének összegével! Legyen a
paralelogramma két-két oldala a és b, átlói e és f hoszszúak (5.52. ábra)!
5.52. ábra
(5.4)
A BPC derékszögű háromszögben Pitagorasz tétele szerint b2 = x2 + m2; ezt felhasználva azt kapjuk:
5.53. ábra
(5.5)
Magasságtétel: A háromszög átfogóhoz tartozó magassága az átfogót két olyan szakaszra bontja, melyek mértani
közepe a magasság.
Befogótétel: A derékszögű háromszög befogója mértani közepe az átfogónak és a befogó átfogóra eső merőleges
vetületének.
5.55. ábra
A BTC és ABC, valamint az ATC és ABC háromszögek hasonlóságából pedig az alábbi egyenlőségek következnek:
A befogótétel két egyenletét négyzetre emelve, majd elosztva egymással, a következőt kapjuk:
Ez utóbbi egyenlőség azt fejezi ki, hogy a derékszögű háromszög átfogójához tartozó magassága az átfogót két olyan
szakaszra bontja, melyek aránya egyenlő a megfelelő szomszédos oldalak négyzeteinek arányával.
Példák
1. Az 5.56. ábrán egy tetőszerkezet keresztmetszete látható. A ferde tetősíkok merőlegesek egymásra; a födémtől a
tető csúcsáig merőlegesen állított g tartógerenda hoszsza 4 m, a födém szélessége 9 m. Mekkorák az ábrán AT-vel,
illetve BT-vel jelölt szakaszok?
5.56. ábra
5.57. ábra
3. Egy O középpontú AB szakaszra rajzoltunk egy félkört, valamint ugyanazon oldalra az OB szakaszra is rajzoltunk
egy félkört. Az AB szakasz egy tetszőleges belső P pontjában OB-re állított merőleges a kisebb félkört M-ben, a
nagyobb félkört N-ben metszi. Igazoljuk, hogy
Az 5.58. ábra BMO és BNA háromszögei derékszögűek Thalész tétele alapján. Írjuk fel a befogótételt az OBM és
ABN háromszögekre!
5.58. ábra
(5.6)
Oldalfelező merőlegesek
Szögfelezők
Középvonalak
Magasságvonalak
Súlyvonalak
Euler-egyenes
Feuerbach-kör
A háromszög talpponti háromszöge
Simson-egyenes
Szimedián-egyenes
A háromszög Torricelli-pontja
A háromszög Napóleon-háromszögei
Oldalfelező merőlegesek
A háromszög oldalfelező merőlegesei egy pontban metszik egymást. Ez a pont a háromszög köré írható körének a
középpontja.
5.59. ábra
KA = KB, hiszen K rajta van AB felező merőlegesén. De KA = KC, hiszen K rajta van AC felező merőlegesén is. Ezek
szerint KB = KC, ami azt jelenti, hogy K-nak illeszkednie kell a BC oldal felező merőlegesére is. Mivel a K pont a
háromszög mindhárom csúcsától egyenlő távolságra van, ezért a K középpontú AK sugarú kör áthalad a háromszög
B és C csúcsain is, vagyis a K pont a háromszög köré írható körének a középpontja.
Megjegyzés. A háromszög köré írható körének K középpontja hegyesszögű háromszög esetén a háromszög belső
pontja, derékszögű háromszög esetén az átfogó felezőpontja, tompaszögű háromszög esetében a háromszögön kívüli
pont (5.60a–c ábra).
5.60. ábra
Tekintsük ugyanis az 5.61. ábrát, melyen berajzoltuk az ABC háromszög köré írható körének C-ből induló átmérőjét.
5.61. ábra
Thalész tétele miatt CAP ∠ = 90°, továbbá PAC ∠ = CBT ∠ (azonos íven nyugvó kerületi szögek), ezért a CTB és CAP
háromszögek hasonlók. Felírhatjuk az alábbi egyenlőséget:
(5.7)
Szögfelezők
A háromszög belső szögfelezői egy pontban metszik egymást. Ez a pont a háromszög beírható körének a középpontja
(5.62a ábra).
A háromszög egy belső és másik két külső szögfelezője egy pontban metszik egymást. Ez a pont a háromszög egyik
hozzá írható körének középpontja (5.62b ábra).
5.62. ábra
E két tétel igazolása teljesen hasonló gondolatmenettel végezhető el, mint az oldalfelező merőlegesek esetében.
Megjegyzés. A háromszög beírható körének r sugarát könnyen megkapjuk, ha felírjuk az 5.62a ábra ABO, BCO és CAO
háromszögeinek a területét:
(5.8)
Hasonló gondolatmenettel juthatunk el az a, b és c oldalakat érintő hozzá írható körök ra, rb, rc sugaraihoz. Az APOQ
négyszög területét kétféleképpen írjuk fel: egyrészt az APO és AQO derékszögű háromszögek összegeként, másrészt
az eredeti háromszög, valamint a BPOT és CQOT deltoidok területének összegeként. Eszerint
ahonnan
A másik két oldalhoz hozzáírható körök sugaraira hasonlóképpen
Középvonalak
A háromszögnek tehát három középvonala van. Ezek nem egy pontban metszik egymást.
A háromszög középvonala párhuzamos a háromszög egyik oldalával, és hossza ezen oldal hosszának a fele.
Az 5.63. ábrán megrajzoltuk az ABC háromszög mindhárom középvonalát. E középvonalak a háromszöget négy
egybevágó háromszögre bontják. E háromszögek mindegyike hasonló az eredeti háromszöghöz; a hasonlóság aránya
1 : 2.
5.63. ábra
Magasságvonalak
A háromszög magasságvonala valamely csúcsból a szemközti oldal egyenesére állított merőleges egyenes.
Húzzunk az ABC háromszög csúcspontjain keresztül egy-egy párhuzamost a szemközti oldallal (5.64. ábra)!
5.64. ábra
A keletkező PQR háromszögnek az AB, BC, CA oldalak középvonalai, vagyis a PQR háromszögnek az A, B, C pontok
oldalfelező pontjai. Ebből következik, hogy az ABC háromszög magasságvonalai a PQR háromszögben oldalfelező
merőlegesek, amelyekről tudjuk, hogy egy pontban metszik egymást.
Megjegyzés. Hegyesszögű háromszög magasságpontja mindig a háromszög belső pontja, derékszögű háromszög
magasságpontja a derékszögű csúcsban van, tompaszögű háromszög magasságpontja a háromszögön kívül
helyezkedik el (5.65. ábra).
5.65. ábra
Az 5.65. ábrából azt is kiolvashatjuk, hogy ha megrajzoljuk az ABC háromszög M magasságpontját, akkor a kapott
négy db pont közül bármely hármat kiválasztjuk, akkor a kiválasztott pontok alkotta háromszög magasságpontja
éppen a negyedik (ki nem választott) pont.
Súlyvonalak
A háromszögnek három súlyvonala van. E súlyvonalak bármelyike mindig felezi a háromszög területét.
A háromszög súlyvonalai egy pontban metszik egymást, ez a pont (súlypont) minden súlyvonalon a csúcstól távolabbi
harmadoló pont.
Az 5.66. ábrán két súlyvonalat rajzoltunk meg. Azt mutatjuk meg, hogy ezek S metszéspontja mindkét súlyvonalon a
csúcstól távolabbi harmadoló pont. Legyen P és Q az AS, illetve BS szakaszok felezőpontja, és húzzuk be még a
háromszög EF középvonalát!
5.66. ábra
Az EF középvonal párhuzamos AB-vel és fele olyan hosszú. Az ABS háromszögben PQ ugyancsak középvonal, tehát
párhuzamos AB-vel és fele olyan hosszú. Ebből következik, hogy az EF és PQ szakaszok párhuzamosak és egyenlőek,
vagyis a PQFE négyszög paralelogramma. Mivel annak átlói felezik egymást, azért AP = PS = SF és BQ = QS = SE, tehát
az S pont mindkét súlyvonalon a csúcstól távolabbi harmadoló pont.
Ugyanez a gondolatmenet nyilván az A-ból és C-ből induló súlyvonalakra is elmondható. Mármost ha a C-ből induló
súlyvonal nem haladna át az S ponton, akkor az A-ból induló súlyvonalnak két „csúcstól távolabbi harmadoló
pontja” lenne, ami lehetetlen. Tehát a súlyvonalak egy pontban metszik egymást.
Megjegyzés. Pitagorasz tételének felhasználásával kiszámolhatjuk a háromszög egyes súlyvonalainak a hosszát.
Tükrözzük az ABC háromszöget a c oldal F felezőpontjára (5.67. ábra). Az eredeti háromszög és tükörképe együttesen
egy paralelogrammát határoznak meg. A paralelogrammáról ismert, hogy oldalai négyzetének összege egyenlő az
átlók négyzetének összegével (lásd 5.52. ábra). Tehát jelen esetben
5.67. ábra
(5.9)
Euler-egyenes
A háromszög M magasságpontja, köré írt körének K középpontja és S súlypontja egy egyenesbe esik. (Ezt az egyenest
nevezzük a háromszög Euleregyenesének.)
Elemezzük az 5.68. ábrát, melyen E, F, G-vel jelöltük az ABC háromszög oldalfelező pontjait!
5.68. ábra
A középvonalak alkotta EFG háromszög hasonló az ABC háromszöghöz, és a hasonlóság aránya 1:2. AKF szakasz
megfelelője a CM szakasz, így Mivel és a KFS ∠ = SCM ∠, ezért a KFS és MCS háromszögek
is hasonlók, tehát megfelelő szögeik egyenlők, vagyis KSF ∠ = MSC ∠, ez pedig éppen azt jelenti, hogy a K, S és M
pontok egy egyenesbe esnek, és az S pont a KM szakasznak K-hoz közelebbi harmadoló pontja.
Feuerbach-kör
Ezt a kört (5.69. ábra) szokás a háromszög Feuerbach-körének vagy más néven kilencpontos körnek nevezni. A
Feuerbach-kör érinti a háromszög beírható, valamint hozzá írható köreit. A Feuerbach-kör sugara fele akkora, mint
a köré írható kör sugara.
5.69. ábra
A hegyesszögű háromszög talpponti háromszöge beírható körének középpontja az eredeti háromszög magasságpontja.
Ha egybevetjük ezt az eredményt azzal, hogy a háromszög köré írható körének középpontja a középvonalai alkotta
háromszög magasságpontja (5.64. ábra), akkor kimondhatjuk, hogy a hegyesszögű háromszög köré írt körének
középpontja a középvonalai alkotta háromszög talpponti háromszögének a beírható körének a középpontja.
Simson-egyenes
Állítsunk merőlegeseket a háromszög köré írt köre tetszőleges P pontjából az oldalegyenesekre. E merőlegesek
talppontjai mindig egy egyenesre illeszkednek.
Ezt az egyenest nevezzük a háromszög P ponthoz tartozó Simson-egyenesének. Az 5.71. ábrán az ABC háromszög
köré írt köre egy P pontjához tartozó Simson-egyenest szemléltettük. A Simson-egyenes egy érdekes tulajdonsága a
következő: ha a P pontot elforgatjuk a kör középpontja körül α szöggel, akkor a P ponthoz tartozó Simson-egyenes
szöggel fordul el.
5.71. ábra
Szimedián-egyenes
A háromszög szimedián-egyenese: valamely súlyvonalának a vele azonos csúcsból induló szögfelezőre vonatkozó
tükörképe.
Ezt a pontot szokás a háromszög Lamoine-féle pontjának nevezni. Tekintsük az 5.72. ábrát, melyen az s súlyvonal, f
szögfelező és d szimedián-egyenes talppontjait rendre F-fel, E-vel, D-vel jelöltük.
Az ADC és BDC, valamint az AFC és BFC háromszögekre felírva e háromszögek trigonometrikus területet, arra
jutunk, hogy , vagyis a szimedián-egyenes a szemközti oldalt két olyan szakaszra bontja, melyek aránya
egyenlő a megfelelő szomszédos oldalak négyzetének arányával. Innen már következik – Ceva tételének
alkalmazásával –, hogy a szimedián-egyenesek egy pontban metszik egymást.
5.72. ábra
A háromszög Torricelli-pontja
Ha keressük a hegyesszögű ABC háromszög azon belső P pontját, melyet a csúcsokkal összekötve a PA + PB + PC
összeg a legkisebb, kimutatható, hogy ez a P pont éppen a háromszög Torricelli-pontja.
A háromszög Napóleon-háromszögei
Emeljünk egy-egy szabályos háromszöget a háromszög oldalaira kifelé. Az így kapott szabályos háromszögek
súlypontjai szabályos háromszöget alkotnak.
Ezt a háromszöget nevezzük az eredeti háromszög külső Napóleon-háromszögének. Az 5.73. ábrán az ABC
háromszög külső Napóleon-háromszögét szemléltettük.
Megjegyzés. Ha a háromszög oldalaira nem kifelé, hanem befelé emeljük a szabályos háromszögeket, akkor ezek
súlypontjai is szabályos háromszöget alkotnak; ezt nevezzük az eredeti háromszög belső Napóleon-háromszögének.
Kimutatható, hogy a háromszög külső és belső Napóleon-háromszögei területének a különbsége mindig egyenlő az
eredeti háromszög területével.
5.73. ábra
5.5. Négyszögek
A négy szakaszból álló olyan zárt töröttvonalat, melyek oldalai egymást nem metszik, négyszögnek nevezzük.
A négyszögnek négy oldala, négy szöge és négy csúcsa van. A négyszöget konvexnek mondjuk, ha minden szöge kisebb
180°-nál. Ha a négyszögnek van 180°-nál nagyobb szöge, akkor konkáv négyszögnek hívjuk (5.74. ábra).
5.74. ábra
Egy alakzat konvex, ha bármely két pontját összekötő szakaszt az alakzat magában tartalmazza. Egy alakzat konkáv, ha
van két olyan pontja, amelyeket összekötő szakasznak van olyan pontja, melyet az alakzat nem tartalmaz.
A négyszög átlójának nevezzük a szemközti csúcsait összekötő szakaszt, ha az a négyszög belsejében van. Konvex
négyszögnek két átlója van, konkáv négyszögnek egy átlója van. Speciális tulajdonságaik miatt az alábbi négyszögeket
emeljük ki.
Trapéz
Paralelogramma
Téglalap
Rombusz
Négyzet
Deltoid
Trapéz
A trapéz párhuzamos oldalait a trapéz alapjainak mondjuk, a másik két oldala a trapéz szárai, a párhuzamos oldalak
távolsága a trapéz magassága. A szárak felezőpontjait összekötő szakaszt a trapéz középvonalának nevezzük. A trapéz
középvonala párhuzamos az alapokkal, és hossza az alapok hosszának a számtani közepe. A trapéz egy száron levő
szögeinek összege 180°.
Tekintsük az 5.75. ábrát, melyen az ABCD trapézt centrálisan tükröztük a trapéz BC szárának F felezőpontjára.
5.75. ábra
Az ABCD trapéz és A′CBD′ tükörképe együttesen paralelogrammát alkotnak. E paralelogrammában az EE′ szakasz
párhuzamos és egyenlő az AD′, illetve A′D oldalakkal. Ezek szerint
A trapéz átlói a trapézt négy db háromszögre bontják (5.76. ábra). E háromszögek közül az alapokra illeszkedő
háromszögek mindig hasonlók, a szárakra illeszkedő háromszögek területe mindig egyenlő.
5.76. ábra
Az 5.75. ábrán látható AD′A′D paralelogramma területe az ABCD trapéz területének kétszerese. A paralelogramma T
területe (a + b) · m = 2k · m, így az ABCD trapéz területe:
Paralelogramma
5.77. ábra
Téglalap
A téglalap átlói egyenlő hosszúak. A téglalap területe: két szomszédos oldalának szorzata: T=ab (5.78. ábra).
5.78. ábra
Rombusz
A rombusz átlói merőlegesen felezik egymást. A rombusz területe egyenlő az átlók szorzatának a felével:
(5.79. ábra).
5.79. ábra
Négyzet
A négyzet tehát paralelogramma és egyben rombusz is. A négyzet területe egyenlő az oldalának a négyzetével: T= a2
(5.80. ábra).
5.80. ábra
Deltoid
A deltoid átlói merőlegesek egymásra, egyik átlója felezi a másikat. A deltoid lehet konvex, de lehet konkáv is (5.81.
5.81. ábra
Megjegyzés. A körrel kapcsolatos speciális négyszögeket (húrnégyszög, érintőnégyszög) a körrel kapcsolatos 5.7.
fejezetben tárgyaljuk.
Példák
1. Egy trapéz párhuzamos oldalai 18 cm és 10 cm. A trapéz szárai 6 cm hosszúak. Mekkora a trapéz területe?
Mivel a trapéz szárai egyenlők, ezért Írjuk fel Pitagorasz tételét az 5.82. ábra CTB derékszögű
háromszögére. A trapéz TABCD területe:
5.82. ábra
2. Adott három nem egy egyenesbe eső pont. Szerkesztendő olyan pont, hogy az a megadott három ponttal együtt
paralelogrammát alkosson.
Legyenek az adott pontok A, B és C! Mivel a paralelogramma átlói felezik egymást, ezért az ABC háromszög egyik
(pl. AB) oldalának F felezőpontjára tükrözve a C pontot, a keresett ponthoz (D pont) jutunk (5.83. ábra).
5.83. ábra
(Természetesen azt is megtehettük volna, hogy az A pontot tükrözzük a BC szakasz felezőpontjára, vagy a B
pontot tükrözzük az AC szakasz felezőpontjára; így a feladatnak három megoldása van.)
3. Az ABCD trapéz párhuzamos oldalai: AB = 3a, CD = a, szárai AD = a, BC = 2a. Mekkora a trapéz területe?
5.84. ábra
A C ponton át AD-vel húzott párhuzamos az AB oldalt E-ben metszi (5.84. ábra). Az AECD négyszög rombusz, így
AE = a, vagyis EB = 2a. Arra jutottunk, hogy az EBC háromszög egyenlő szárú háromszög. Húzzuk be az alaphoz
tartozó m1 magasságot – ezt könnyen kiszámíthatjuk Pitagorasz tételével –, majd írjuk fel az EBC háromszög
területét kétféleképpen; így eljutunk a trapéz m magasságához.
A trapéz területe:
4. Az ABCD paralelogramma AB oldalára A-ban, BC oldalára C-ben állított merőlegesek metszéspontja E. Igazoljuk,
hogy ED merőleges AC-re!
Mivel EA merőleges AB-re (5.85. ábra), ezért EA merőleges CD-re is.
5.85. ábra
Az EC merőleges BC-re, ezért EC és AD is merőlegesek egymásra. Mindez azt jelenti, hogy az ACE háromszögben
CD és AD egy-egy magasságvonalra illeszkedik, vagyis e háromszögnek D a magasságpontja. Ha D a
magasságpont, akkor ED illeszkedik az AC oldalhoz tartozó magasságvonalra, vagyis ED merőleges AC-re.
Az n db szakaszból álló olyan zárt töröttvonalat, melyek oldalai egymást nem metszik, n oldalú sokszögnek nevezzük.
Az n oldalú sokszögnek n csúcsa, n oldala és n szöge van. A sokszöget konvexnek mondjuk, ha minden szöge kisebb,
mint 180°. Ha az n szögnek van 180°-nál nagyobb szöge, akkor konkáv sokszögnek nevezzük. A sokszög valamely csúcsából
valamely vele nem szomszédos csúcsába húzott szakaszt a sokszög egy átlójának nevezzük.
Az n oldalú konvex sokszög átlóinak a száma .
Tekintsük ugyanis az 5.86. ábrát, melyen egy n oldalú konvex sokszöget érzékeltettünk, s meghúztuk az egy csúcsból
húzható átlót.
5.86. ábra
Egy csúcsból (bármely csúcsból) n – 3 átló húzható, hiszen a csúcsból önmagába és két szomszédjába nem húzhatunk
átlót. Így az n db csúcsból összesen n(n – 3) húzható. Ezzel azonban minden átlót kétszer számoltunk, így az összes átlók
száma: .
Megjegyzés. A tétel konkáv sokszögekre már nem igaz, hiszen, ha egy konkáv sokszögnek valamely P csúcsában 180°-
nál nagyobb szöge van, akkor a P csúcs szomszédos csúcsait összekötő szakasz a sokszögön kívül halad, így ez nem
lehet átló.
Az n oldalú konvex sokszög egy csúcsból húzott átlói a sokszöget n – 2 db háromszögre bontják (5.86. ábra). A sokszög
belső szögeinek összege ezeknek a háromszögeknek a belső szögeinek összege, vagyis (n – 2) · 180°.
Megjegyzés. A bizonyítás során lényegesen kihasználtuk, hogy a sokszög konvex. A tétel akkor is igaz, ha konkáv
sokszögről van szó.
5.87. ábra
Ha minden egyes külső szöghöz hozzáadjuk a mellette fekvő belső szöget, akkor minden csúcsnál 180°-os szöget
kapunk. Ezek szerint a külső és a belső szögek összege n·180°,
Szabályos sokszögnek nevezzük az olyan sokszöget, melynek minden oldala és minden szöge egyenlő.
Minden szabályos sokszög konvex. A szabályos sokszög egy szöge (minden szöge)
A szabályos sokszög bármely oldalának felező merőlegese egyben szimmetriatengelye. Páros oldalú szabályos sokszög
esetén egy oldal szimmetriatengelye egyben a szemközti oldalnak is szimmetriatengelye, és ez esetben a szemközti
csúcsokon átmenő egyenesek is szimmetriatengelyek (5.88a ábra). Páratlan oldalú szabályos sokszög esetében egy oldal
felező merőlegese áthalad a szemközti csúcson (5.88b ábra). Mindez azt jelenti, hogy az n oldalú szabályos sokszögnek n db
szimmetriatengelye van. E szimmetriatengelyek egy pontban metszik egymást.
5.88. ábra
Páros oldalú szabályos sokszög esetén ez a pont egyben szimmetriacentrum is; a páros oldalú szabályos sokszögek
középpontosan is szimmetrikusak. A páratlan oldalú szabályos sokszögek középpontosan nem szimmetrikusak. A
szabályos sokszög szimmetriatengelyeinek a metszéspontja egyben a szabályos sokszög be-, illetve köré írható körének a
középpontja. A szimmetriatengelyek metszéspontját a csúcsokkal összekötve a szabályos n szög n db egybevágó egyenlő
szárú háromszögre bontható. n = 6 esetén e háromszögek szabályos (egyenlő oldalú) háromszögek.
Aranymetszés
Aranymetszés
A szabályos ötszög kiemelkedő jelentőségű a szabályos sokszögek közül. Oldalainak átlóihoz való viszonya, az
egymást metsző átlók szeleteinek viszonya, valamint az a tény, hogy a szabályos ötszög az egyetlen olyan szabályos n
szög, melynek átlói ugyancsak szabályos n szöget határoznak meg, az ókortól napjainkig esztétikai élményt nyújt a
szemlélőnek. Ennek hátterében az aranymetszés áll.
Aranymetszésnek nevezzük egy mennyiség (pl. egy szakasz) olyan arányú felbontását, melyben a kisebb darab úgy
aránylik a nagyobbhoz, mint a nagyobb darab az egészhez.
Vegyünk pl. egy egységnyi hosszúságú AB szakaszt, és jelöljük P-vel az aranymetszés szerinti osztópontot, x-szel a
rövidebb szakasz hosszát (5.89. ábra).
5.89. ábra
Ekkor
A kapott arányszámnak igen nagy jelentősége van a geometriában, a művészetekben, a természetben és még számos
egyéb területen.
Most vizsgáljuk egy szakasz aranymetszeti felbontásának szerkesztését, vagyis szerkesszük meg azt a C pontot, mely
a kérdéses szakaszt aranymetszeti arányban osztja két részre. Vegyünk fel egy AB = a hosszúságú szakaszt, és
állítsunk rá merőlegest egyik (pl. az A) végpontjában. Mérjünk fel erre a merőlegesre távolságot. Ennek O
végpontja mint középpont köré rajzoljunk egy sugarú kört. A körnek az OB egyenessel alkotott metszéspontjai E
és F (5.90. ábra).
5.90. ábra
Az AEB és FAB háromszögek hasonlók, mert B-nél közös szögük van, továbbá EAB ∠ = BFA ∠, hiszen azonos íven
nyugvó kerületi szögek. Ennek megfelelően írhatjuk:
A kapott egyenlőség éppen azt fejezi ki, hogy az AB szakasznak C pontja az aranymetszés szerinti osztópont, ahol AC
a kisebb, BC pedig a nagyobb szelet.
Ha a szabályos ötszög egy oldalának két végpontját összekötjük az ötszög köré írt körének középpontjával, akkor a
középpontnál 360°: 5 = 72° keletkezik. Ezek szerint a szabályos ötszög egy oldalának két végpontját a szemközti
csúccsal összekötve olyan egyenlő szárú háromszöget kapunk, melynek szárszöge 36°, az alapon fekvő szögei 72°-osak
(5.91. ábra).
5.91. ábra
Húzzuk meg e háromszög alapjának valamely végpontjából a szögfelezőt, melynek talppontja legyen D. A keletkező
ABD háromszög szögei megegyeznek az eredeti ABC háromszög szögeivel, így az ABD háromszög szintén egyenlő
szárú és nyilvánvalóan hasonló az eredeti háromszöghöz, továbbá
A szögfelezőtételből
Ez az egyenlőség pedig éppen azt fejezi ki, hogy a D pont a BC szakaszt az aranymetszésnek megfelelő arányban osztja
két részre. Mindezeken túl a szabályos ötszögnek számtalan érdekes tulajdonsága van (5.92. ábra).
5.92. ábra
A szabályos ötszög átlói az aranymetszésnek megfelelő arányban metszik egymást, és e metszet nagyobbik szelete
egyenlő az ötszög oldalával. A szabályos ötszög átlói egy újabb szabályos ötszöget határoznak meg, melynek oldala az
eredeti szabályos ötszög oldalának kisebbik aranymetszete. A kapott eredményekből az is következik, hogy a
szabályos tízszög (melyben valamely oldalhoz tartozó középponti szög 36°) oldala a köré írható kör sugarának
hosszabbik aranymetszete. Ennek birtokában pedig már a szabályos tízszög is könnyen szerkeszthető.
Példák
1. Van-e olyan szabályos sokszög, melynek külső szögei 72°-osak?
Ha a szabályos sokszögnek n oldala van, akkor egy szöge Ekkor a sokszög külső szögei:
Ha ez 72°, akkor
A negatív gyök érdektelen, így a szabályos sokszögnek 12 oldala van. Ekkor egy szöge:
3. Melyek azok az egybevágó szabályos sokszögek, amelyekkel a sík egyrétűen és hézagmentesen lefedhető?
Ha a keresett szabályos sokszögnek n oldala van, és egy csúcsban k db szabályos sokszög érintkezik, akkor
A 4-et csak háromféleképpen tudjuk két pozitív egész szám szorzatára bontani: 1·4 = 2·2 = 4·1.
Ha k – 2 = 1 és n – 2 = 4, akkor k = 3 és n = 6. Tehát szabályos hatszögekről van szó, és minden csúcsban 3 db
érintkezik egymással.
Ha k – 2 = 2 és n – 2 = 2, akkor k = n = 4. Ekkor négyzetről van szó, és a csúcsokban 4 db érintkezik egymással.
Ha k – 2 = 4 és n – 2 = 1, akkor k = 6 és n = 3. Ekkor szabályos háromszögekről van szó, és minden csúcsban 6 db
érintkezik egymással.
Más egybevágó szabályos sokszögekkel a sík egyrétegűen és hézagmentesen nem fedhető le.
A kör és részei
Kör és egyenes, két kör viszonylagos helyzete
Érintőnégyszög
Kerületi és középponti szög, húrnégyszög
A kör és részei
A kör a sík azon pontjainak a halmaza, melyek a sík egy adott O pontjától egyenlő távolságra vannak.
Az O pontot a kör középpontjának, az adott távolságot a kör sugarának (rádiusz) nevezzük. A körvonal által határolt
síkrészt körlemeznek (körlap) nevezzük. A kör két pontjára illeszkedő egyenest szelőnek hívjuk; a szelőnek a kör két pontja
közé eső darabját húrnak nevezzük. A kör két pontja közé eső darabjának neve körív. Két sugár és az általuk meghatározott
körív által közbezárt tartományt körcikknek nevezzük, egy szelő által a körlemezből lemetszett síkrész neve körszelet. Az
olyan egyenest, melynek a körrel csak egy közös pontja van, érintőnek nevezzük (5.93. ábra).
5.93. ábra
5.94. ábra
A körhöz egy külső P pontból két érintő húzható, a P-ből húzott érintőszakaszok (vagyis az érintőnek a külső P ponttól
az érintési pontig tartó szakasza) mindig egyenlők: az 5.95. ábra jelöléseivel: PE1 = PE2.
5.95. ábra
Megjegyzés. Egy külső P pontból a k körhöz érintőt az alábbi módon szerkeszthetünk. Megszerkesztjük a PO szakasz
F felezőpontját (5.95. ábra), majd megrajzoljuk az OP szakasz F középpontú Thalész-körét; ez a kör az eredeti k kört
E1-ben és E2-ben metszi. Thalész tétele miatt az OE1P = OE2P = 90°, ezért az E1 és E2 pontok lesznek az érintési pontok,
tehát a P-ből húzott érintők: a PE1 és PE2 egyenesek.
A fenti tétel igazolásához azt kell észrevennünk, hogy a PBC és PAC háromszögek hasonlók, hiszen P-nél közös
szögük van, a B-nél és D-nél levő szögek pedig azonos íven nyugvó kerületi szögek. Ezek szerint
Ha a P-n keresztül egy szelőt és egy érintőt húzunk, melynek érintési pontja E, akkor a PEA és PEB háromszögek
hasonlóságából a PA · PB = PE2 egyenlőséghez jutunk (5.97. ábra). Ha a P ponton átmenő átmérő egyenest húzzuk be,
és a P pontnak a kör O középpontjától való távolsága d (5.98. ábra), akkor PA = d – r, PB = d + r, tehát a P pontnak a k
körre vonatkozó hatványa: PA·PB = (d – r)(d + r) = d2 – r2.
5.97. ábra
5.98. ábra
5.99. ábra
5.100. ábra
5.101. ábra
Megjegyzés. Két kör közös érintőinek szerkesztését egy kör egy külső pontból húzott érintőinek szerkesztésére
tudjuk visszavezetni. A közös külső érintő szerkesztésekor először csökkentjük mindkét kör sugarát a kisebb kör r
sugarával. Ekkor a nagyobb kör sugara R – r lesz. E körnek megszerkesztjük a kisebb kör O2 középpontjából húzott
érintőit, majd ezeket az érintőket önmagukra merőlegesen r-rel eltolva megkapjuk a két eredeti kör közös külső
érintőit (5.102a ábra). A közös belső érintő esetében a nagyobb kör sugarát növeljük a kisebb kör r sugarával. Ekkor a
nagyobb kör sugara R + r lesz. E körnek megszerkesztjük a kisebb kör O2 középpontjából az érintőket, majd eltoljuk
ezeket önmagukkal párhuzamosan r-rel, így kapjuk a két eredeti kör közös belső érintőit (5.102b ábra).
Példák
1. Egy tengelyesen szimmetrikus trapéz egyben érintőnégyszög. Párhuzamos oldalai 24 és 16. Mekkora a trapézba
írható kör sugara?
Ha a trapéz érintőnégyszög, akkor szemközti oldalainak összege egyenlő, tehát Mivel a trapéz
szimmetrikus, ezért Írjuk fel az 5.103. ábra CTB derékszögű háromszögére Pitagorasz tételét:
m2 +42 =202, ahonnan
5.102. ábra
2. Két kör sugara R és r, középpontjaik távolsága d. Számítsuk ki a közös külső érintőszakaszuk hosszát!
Legyen a két kör sugara R > r, és képzeljük el, hogy mindkét kör sugarát csökkentjük a kisebbik kör r sugarával.
Ekkor a nagyobb kör sugara R – r lesz, a kisebb kör pedig egy pontba, O2-be megy át (5.104. ábra). A keresett x
szakasz az R – r sugarú kör O2-ből húzott érintőszakasza. Írjuk fel Pitagorasz tételét az O1O2T derékszögű
háromszögre:
Megjegyzés. Érdemes megvizsgálni azt az esetet, amikor a két kör érinti egymást. Ekkor d = (R + r), így ekkor a
közös érintőszakasz:
5.104. ábra
3. Adjuk meg a háromszög a) S súlypontjának és b) M magasságpontjának a köré írható körre vonatkozó hatványát!
a) Elemezzük az 5.105. ábrát!
5.105. ábra
(5.10)
b) Tekintsük az 5.106. ábrát, melyen berajzoltuk az MK egyenest (Euler-egyenes). Az MK szakasz K-hoz közelebbi
harmadoló pontja a háromszög S súlypontja.
5.106. ábra
A súlypontra felírhatjuk:
Ezt felhasználva:
A kör kerületének és átmérőjének hányadosát π-vel (a görög kerület = periféria szó kezdőbetűjével) jelöljük. Ennek
megfelelően
Megjegyzés. A π értékének meghatározásával már az ókorban is sokan foglalkoztak. Kr. e. kb. 2000 évvel
Egyiptomban a kör területére a képletet használták, amit az r2π-vel azonosítva π-re kb. 3,1605 érték
Érintőnégyszög
Egy konvex négyszög akkor és csak akkor érintőnégyszög, ha szemközti oldalainak összege egyenlő.
Fontos feltétel e tételben a négyszög konvexitása, hiszen pl. a konkáv deltoid szemközti oldalainak összege egyenlő,
mégsem érintőnégyszög.
Megmutatjuk, hogy ha a négyszög érintőnégyszög, akkor szemközti oldalainak összege egyenlő. Tekintsük az 5.107.
ábrát! Ezen az azonos módon jelölt szakaszok egyenlők, hiszen a körhöz egy külső pontból húzott érintőszakaszok
egyenlők. A négyszög szemközti oldalainak összege: x + y + t + s = y + t + s + x.
Érintőnégyszög például a négyzet, a konvex deltoid, a rombusz, de érintőnégyszög az olyan tengelyesen szimmetrikus
trapéz, melynek szára egyenlő a középvonalával. Ugyanakkor általában nem érintőnégyszög a téglalap, a paralelogramma,
a trapéz. Az érintőnégyszög beírható körének középpontja mind a négy csúcshoz tartozó szögfelezőre illeszkedik, ezért az
érintőnégyszög szögfelezői egy pontban metszik egymást.
5.107. ábra
A kerületi szög olyan szög, melynek csúcsa a kör kerületén van, szárai pedig egy-egy húrra illeszkednek. Az
érintőszárú kerületi szög olyan szög, melynek csúcsa a kör kerületén van, egyik szára érintő, másik szára pedig egy
húrra illeszkedik.
Az 5.108a ábrán egy α kerületi szöget, az 5.108b ábrán egy γ érintőszárú kerületi szöget látunk. Azt mondjuk, hogy a
kerületi szög az AB íven (vagy az AB húron) nyugszik.
5.108. ábra
A középponti szög olyan szög, melynek csúcsa a kör középpontjában van, szárai egy-egy sugárra illeszkednek.
Az 5.109. ábrán az AB ívhez tartozó (az AB íven nyugvó) β középponti szöget rajzoltunk.
5.109. ábra
Nyilvánvaló, hogy egy kör egy AB ívéhez végtelen sok kerületi szög, de csak egyetlen középponti szög tartozik. Az
azonos ívhez tartozó kerületi és középponti szögek közötti fontos összefüggés a kerületi és középponti szögek tétele.
Azonos íven nyugvó kerületi és középponti szögek közül a középponti szög a kerületi szög kétszerese.
A tétel igazolásához négy esetet kell vizsgálnunk aszerint, hogy a) a középponti szög csúcsa illeszkedik-e a kerületi
szög egyik szárára (5.110a ábra), b) a középponti szög a kerületi szög tartományába esik (5.110b ábra), c) a középponti
szög a kerületi szög tartományán kívül esik (5.110c ábra), illetve d) az érintő szárú kerületi szög esetében (5.110d ábra).
a) Az QPB háromszög egyenlő szárú, hiszen OP és OB egyaránt a kör sugarai. Ezek szerint az OPB háromszög B
csúcsnál levő szöge is α. Az AOB középponti szög a POB háromszög egy külső szöge, így β = 2α.
b) A PO egyenes az α kerületi szöget két szögre, α1-re és α2-re, a β középponti szöget β1-re és β2-re bontja. A POB és
POA háromszögek egyenlő szárú háromszögek, hiszen OA, OB, OP egyaránt kör sugarai. Az APO háromszögnek
β1, a BPO háromszögnek β2 egy-egy külső szöge, ezért β1 = 2α1 és β2 = 2α2. Ekkor a középponti szögre
c) Az AOQ szög – az a) eset miatt – 2γ. Ekkor QOB Z =2y + b. Így – ugyancsak az a) eset miatt – 2γ + β = 2(γ + α) = 2γ + 2α,
ahonnan β = 2α.
d) Az kör O középpontjából a P érintési pontba húzott sugár az érintőre merőleges, ezért
5.110. ábra
Ez tehát azt jelenti, hogy az 5.111. ábra valamennyi AB íven nyugvó kerületi szöge ugyanakkora, hiszen mindegyik
egyenlő az AB ívhez tartozó középponti szög felével.
Mindebből az is következik, hogy a sík azon pontjainak a halmaza, melyekből az adott AB szakasz egy α < 90°-os
szögben látszik, két, az AB szakaszra szimmetrikus körív pontjai (5.112. ábra).
E köríveket az AB szakasz α szögű látókörének nevezzük. A látókörök belső pontjaiból az AB szakasz α-nál nagyobb
szögben, a látókörökön kívüli pontokból az AB szakasz α-nál kisebb szögben látszik.
Megjegyzés. Az AB szakasz α szögű látókörét a következőképpen szerkeszthetjük meg: állítsunk egy merőlegest az AB
szakasz egyik végpontjában (pl. A-ban) AB-re, majd a másik végpontban szerkesszük meg a 90° – α hegyesszöget
(5.113. ábra)! A megszerkesztett szögszár és az A-ban emelt merőleges P metszéspontjából az AB szakasz éppen α
szögben látszik. Ezek után már csak az ABP derékszögű háromszög köré írható körét kell megszerkesztenünk.
5.111. ábra
5.112. ábra
5.113. ábra
Húrnégyszögnek nevezzük az olyan négyszöget, melynek minden csúcsa ugyanazon a körön van.
A húrnégyszögek oldalai tehát ugyanannak a körnek a húrjai, vagyis a húrnégyszög olyan négyszög, melynek van köré
írható köre. Ebből következik, hogy a húrnégyszög oldalfelező merőlegesei egy pontban metszik egymást. Ez egyben azt is
jelenti, hogy minden húrnégyszög konvex. Húrnégyszög pl. a négyzet, a téglalap, a tengelyesen szimmetrikus trapéz, a
derékszögű deltoid stb. Az azonos íven nyugvó kerületi szögek tételéből az is következik, hogy ha egy négyszög valamely
oldala a másik két csúcsból ugyanakkora szögben látszik, akkor e négyszög húrnégyszög.
Egy négyszög akkor és csak akkor húrnégyszög, ha szemközti szögeinek összege 180°.
Ha tehát egy négyszög húrnégyszög, akkor szemközti szögeinek összege 180°, illetve ha egy négyszög szemközti
szögeinek összege 180°, akkor e négyszög húrnégyszög. Igazoljuk az állítás első részét, tekintsük az 5.114. ábrát!
5.114. ábra
Ha ABC∠ = β, akkor a kerületi és középponti szögek tétele alapján AOC∠ = 2β. Ekkor az AOC homorúszög 360° – 2β. De
ez a szög az AC íven nyugvó kerületi szög, így
Az 5.115. ábra jelöléseivel e tétel azt mondja ki, hogy AB·CD + BC·AD = AC·BD.
Húzzunk a húrnégyszög valamely csúcsából a vele nem érintkező átlóhoz egy szakaszt úgy (ábránkon ez a DE
szakasz), hogy a keletkező ADE szög egyenlő legyen a BDC szöggel (az valamelyik csúcsból mindig megtehető, kivéve,
ha a húrnégyszög négyzet; ekkor viszont a tétel állítása nyilvánvaló). Az AED és BCD háromszögek hasonlók, hiszen
az EAD és DBC szögek azonos íven nyugvó kerületi szögek, tehát egyenlők. Így írhatjuk:
(5.12)
5.115. ábra
(5.13)
5.116. ábra
tehát az A′B′C háromszög B′-nél levő szöge 27° + 23° = 50°. Hasonlóképpen kapjuk, hogy az A′ csúcsnál levő szög 40°
+ 27° = 67°, a C′ csúcsnál levő szög pedig 40° + 23° = 63°.
2. Egy kör egy AB átmérőjének B-n túli meghosszabbításán felvettünk egy E pontot, majd E-ben az AB egyenesre
állított merőlegesen egy tetszőleges D pontot. A D-t A-val összekötő szakasz a kört P-ben metszi. Igazoljuk, hogy a
BEDP négyszög húrnégyszög! Tekintsük az 5.117. ábrát!
5.117. ábra
Mivel AB a körnek átmérője, ezért Thalész tétele értelmében a P csúcsnál derékszög van: BPD ∠ = 90°. Ezek szerint
a BEDP négyszög két szemközti szögének összege 180°, tehát e négyszög valóban húrnégyszög.
3. Igazoljuk, hogy a hegyesszögű háromszög M magasságpontját valamely oldalra tükrözve a tükörkép illeszkedik a
háromszög köré írható körére! Tekintsük az 5.118. ábrát, melyen a háromszög A csúcsnál levő szögét α-val, az M
magasságpontnak a BC oldalra vonatkozó tükörképét M*-gal jelöltük.
5.118. ábra
A tengelyes tükrözés miatt BMC ∠ = BM*C ∠ = 180° – α. Azt kaptuk, hogy az ABM*C négyszög két szemközti
szögének összege 180°, így ez a négyszög húrnégyszög. Ebből viszont következik, hogy az M* pontnak rajta kell
lennie az ABC háromszög köré írható körén.
4. Az ABC hegyesszögű háromszög A-ból és C-ből induló magasságainak talppontja P és Q, a háromszög
magasságpontja M, köré írható körének középpontja K. Igazoljuk, hogy a PQ szakasz merőleges a KB szakaszra!
Készítsük el a szükséges ábrát (5.119. ábra)!
5.119. ábra
Az AQPC négyszög húrnégyszög, hiszen – Thalész tétele miatt – az AC oldal P-ből és Q-ból is derékszögben látszik.
Ekkor viszont QPC ∠ = 180° – α, vagyis QPB ∠ = α. Az azonos íven nyugvó kerületi és középponti szögek tétele
miatt BKC ∠ = 2α. Ezt a szöget a BC oldal felező merőlegese felezi, így BKF ∠ = α. Ebből következik, hogy a BKF
derékszögű háromszögben KBF ∠ = 90° – α. Mivel QPB ∠ = α és KBF ∠ = 90° – α, ezért a BK és PQ szakaszok valóban
merőlegesek egymásra.
5. Az ABCD húrnégyszög átlói M-ben merőlegesen metszik egymást. M-ből a húrnégyszög oldalaira állított
merőlegesek talppontjai P, Q, R, S. Igazoljuk, hogy a PQRS négyszög húrnégyszög és egyben érintőnégyszög is!
Legyen CAD ∠ = CBD ∠ = α és ACB ∠ = ADB ∠ = β (5.120. ábra).
5.120. ábra
Az AQMP négyszög húrnégyszög, hiszen két szemközti szöge (P-nél és Q-nál) derékszög, ezért az azonos íven
nyugvó kerületi szögek egyenlősége miatt PQM ∠ = α. Az MQBR négyszög ugyancsak húrnégyszög, mert Q-nál és
R-nél derékszöge van, így MQR ∠ = α. Tehát a PQRS négyszög Q-nál levő szöge 2α. Hasonlóképpen: PMSD
húrnégyszög, ezért MSP ∠ = β, és MRCS szintén húrnégyszög, tehát MSR ∠ = β, vagyis a PQRS négyszög S-nél levő
szöge 2β. E négyszög két szemközti szögének összege 2α + 2β. Mivel az ABCD húrnégyszög átlói merőlegesek
egymásra, ezért α + β = 90°, tehát 2α + 2β = 180°, ami éppen azt jelenti, hogy a PQRS négyszög húrnégyszög.
Az eddigi bizonyítás során láttuk, hogy QM a PQR szög felezője, SM pedig a PSR szög felezője. (Nyilván ugyanerre
a következtetésre jutunk a PM és RM szakaszokat illetően is.) Ezek szerint a PQRS négyszög szögfelezői egy
pontban metszik egymást, ami azt jelenti, hogy e húrnégyszög egyben érintőnégyszög is.
Az euklideszi szerkesztés
Alapszerkesztések
Speciális szerkesztések
Az euklideszi szerkesztés
A geometriai alakzatok megrajzolása (szerkesztése) elvégezhető bizonyos – egymásnak ellent nem mondó – adatok
ismeretében. A szekesztéshez két eszközt használhatunk: vonalzót (mely tetszőlegesen hosszú egyenes rajzolását teszi
lehetővé) és körzőt (melyet tetszőlegesen nagy nyílással használhatunk).
A szerkesztések elvégzésekor az alábbi lépések megengedhetők:
1. Két adott ponthoz illesztve vonalzónkat, megrajzolhatjuk e két ponton átmenő egyenest.
2. Két adott pont távolságát körzőnyílásba vehetjük.
3. Adott pont köré, adott körzőnyílással kört rajzolhatunk.
4. Két, egymást metsző egyenes metszéspontját kijelölhetjük.
5. Egy kör és e kört metsző egyenes metszéspontjait kijelölhetjük.
6. Két egymást két pontban metsző kör metszéspontjait kijelölhetjük.
Az olyan szerkesztési eljárást, mely csak ezeket a lépéseket engedi meg, euklideszi szerkesztésnek mondjuk.
Egy alakzatot euklideszi értelemben megszerkeszthetőnek mondunk, ha e hat lépés véges sokszori alkalmazásával
eljuthatunk az alakzatnak a feltételeket kielégítő képéhez.
Megjegyzés. Természetesen nem minden alakzat szerkeszthető meg a fenti hat lépés véges sokszori alkalmazásával.
Erre jó példák az alábbi ókori görög problémák: a kör négyszögesítése, amikor az a kérdés, hogyan lehetne egy adott
körrel egyenlő területű négyzetet szerkeszteni, a szögharmadolás, amikor egy adott szöget szerkesztéssel három
egyenlő részre kellene osztani, kockakettőzés, amikor adott egy kocka éle, s meg kell szerkeszteni egy olyan kocka
élét, melynek térfogata az eredeti kocka térfogatának a kétszerese. Ezek a több ezer éves kérdések – ma már tudjuk –
euklideszi szerkesztéssel nem megoldható kérdések (e problémák nem euklideszi módon történő szerkesztésével e
fejezet végén részletesebben foglalkozunk).
A szerkesztési feladatok megoldása során általában célszerű a már késznek gondolt ábrából kiindulni úgy, hogy
ábránkon az adatok vagy az azokból nyerhető menynyiségek szerepeljenek. Magát a szerkesztést az ábra elemzésével
kezdjük. Ilyenkor geometriai fogalmakra, tételekre épülő kapcsolatokat, összefüggéseket keresünk, melyek segítségével
eljuthatunk az ábra hiányzó elemeinek megszerkesztéséhez. A szerkesztési feladatok általában nagyobb elmélyülést, a
geometriai ismereteink megfelelő mozgósítása révén kellő kreativitást igényelnek, ezért az ilyen feladatok megoldásának
sikeres elsajátításakor fontos betartanunk a fokozatosság elvét.
A szerkesztés befejezése után meg kell vizsgálnunk, hogy a kapott ábránk teljesíti-e a feltételeket, illetve hogy van-e a
feltételeknek megfelelő több megoldása is a problémának. (Általában az egybevágó alakzatokat nem tekintjük különböző
megoldásnak.) Ha nem konkrét számértékekkel adottak a feladat feltételei, hanem adottnak tekintendő mennyiségekkel
(paraméteres adatokkal) dolgozunk, akkor szükséges azt is megvizsgálni, hogy a paraméterek változtatásával hogyan
változik a megoldások száma, illetve lehetnek-e olyan értékei a paramétereknek, melyek esetében nincs megoldása a
feladatnak. Ezt a műveletet diszkussziónak (esetvizsgálat) nevezzük.
Alapszerkesztések
1. Adott egyenes egy adott pontjában az egyenesre merőleges szerkesztése. Az adott P pontba beszúrjuk körzőnket,
tetszőleges körzőnyílással mindkét irányban elmetszük az egyenest egy A, illetve egy B pontban (5.121. ábra).
5.121. ábra
Ezután A körül is és B körül is egy-egy körívet rajzolunk ugyanakkora sugárral, mely az AB távolság felénél nagyobb. E
két körív egy M pontban metszi egymást, a keresett merőleges a PM egyenes.
2. Adott pontból adott egyenesre merőleges egyenes szerkesztése. Az adott P pont körül körívet rajzolunk, melynek
sugara a pont és egyenes távolságánál nagyobb. Ez a körív az egyenest két pontban (A-ban és B-ben) metszi (5.122. ábra).
Ezután A és B körül egy-egy körívet rajzolunk, melynek sugara az AB távolság felénél nagyobb. E körívek M-ben
metszik egymást. A keresett merőleges egyenes a PM egyenes.
3. Szakaszfelező merőleges szerkesztése. Az AB szakasz mindkét végpontja körül egy-egy körívet rajzolunk, melyek
sugara az AB távolság felénél nagyobb (5.123. ábra).
E két körív P-ben és Q-ban metszi egymást. Az AB szakasz felező merőlegese a PQ egyenes.
5.122. ábra
5.123. ábra
4. Szögfelező szerkesztése. A szög O csúcsa körül körívet rajzolunk, mely a szögszárakat A-ban és B-ben metszi (5.124.
ábra).
5.124. ábra
Ezután A és B körül egy-egy körívet rajzolunk, melynek sugara az AB távolság felénél nagyobb. E két körív M
metszéspontját O-val összekötő egyenes lesz a szög felezője.
5. Adott ponton át adott egyenessel párhuzamos egyenes szerkesztése. A 2. pontban leírtak szerint az adott P pontból m
merőleges egyenest szerkesztünk az adott e egyenesre, majd az 1. pontban leírtak szerint P-ben merőlegest szerkesztünk az
előbb szerkesztett m egyenesre. Az így nyert egyenes lesz a P ponton átmenő, e-vel párhuzamos egyenes (5.125. ábra).
5.125. ábra
6. Adott szög másolása adott félegyenes végpontjában. Az adott szög O csúcsa körül körívet rajzolunk, mely a szög
szárait A-ban és B-ben metszi. Ezután az adott félegyenes E végpontja körül ugyanolyan sugárral szintén körívet rajzolunk,
mely a félegyenest M-ben metszi (5.126. ábra).
5.126. ábra
Az AB távolságot körzőnyílásba vesszük, és ekkora nyílással M körül körívet rajzolunk, mely az E körül rajzolt körívet
N-ben metszi. Ekkor az MEN szög egyenlő a másolandó AOB szöggel.
7. Háromszög szerkesztése a három oldal ismeretében. Az adott három oldal (a, b és c) egyikét (pl. c-t) felvesszük,
végpontjai legyenek A és B. Ezután A körül b sugarú, B körül a sugarú körívet rajzolunk. Ezek C metszéspontja lesz a
háromszög harmadik csúcsa (5.127. ábra).
5.127. ábra
Természetesen a szerkeszthetőség szükséges (és elégséges) feltétele, hogy az adott oldalak teljesítsék a háromszög-
egyenlőtlenséget.
8. Háromszög szerkesztése két oldal és a közbezárt szög ismeretében. Felvesszük a háromszög két ismert oldala (a és c)
közül az egyiket (pl. BC = a-t), majd e szakasz egyik végpontjába (pl. B-be) felmásoljuk az adott β szöget (5.128. ábra). A
keletkezett szögszárra B-ből kiindulva felmérjük az adott BA = c szakaszt, így eljutunk a keresett ABC háromszöghöz.
5.128. ábra
9. Adott a szakasz és az egységnyi hosszúságú szakasz ismeretében az a szakasz négyzetének, illetve az a szakasz
reciprokának megszerkesztése. Az a szakasz négyzetének és reciprokának szerkesztéséhez a párhuzamos szelők tételét
használhatjuk. Vegyünk fel egy O csúcspontú szöget, majd egyik szárára mérjük fel az egységnyi szakaszt és közvetlenül
mellé az a hosszúságú szakaszt; a másik szögszárra mérjük fel O-ból kiindulva az a szakaszt (5.129a ábra)!
Az 5.129a ábra A és B pontjait összekötjük, majd C-n keresztül párhuzamost szerkesztünk AB-vel, így jutunk az x=BX
szakaszhoz. A párhuzamos szelők tétele alapján
Az 5.129b ábrán az egyik szögszárra először az a hosszúságú szakaszt, majd közvetlenül mellé az egységnyi szakaszt
mértük fel, a másik szögszárra O-ból kiindulva az egységnyi szakaszt. A P és Q pontokat összekötjük, majd az R ponton
keresztül PQ-val párhuzamost szerkesztünk, így jutunk el az Y ponthoz. A párhuzamos szelők tétele alapján
5.129. ábra
10. Adott szakasz n egyenlő részre bontása. Az adott AB szakasz egyik végpontjából (pl. A-ból) indítunk egy félegyenest,
majd erre A-ból indulva felmérünk n-szer egy tetszőlegesen választott hosszúságú szakaszt (5.130. ábra, ahol n = 6).
Az utolsó szakasz végpontját összekötjük B-vel, majd a félegyenes egyes osztópontjain keresztül ezzel a szakasszal
párhuzamosokat szerkesztünk. A párhuzamos szelők tételből következik, hogy e párhuzamosok az eredeti AB szakaszt n
egyenlő részre bontják.
5.130. ábra
11. Két adott szakasz számtani közepének szerkesztése. A két adott szakaszt (AB-t és CD-t) közvetlenül egymás mellé
mérjük, majd az így kapott AB + CD = AD szakaszt megfelezzük a 3. pontban leírtak szerint, így kapjuk az AB és CD
szakaszok számtani közepét (5.131. ábra).
5.131. ábra
12. Két adott szakasz mértani közepének szerkesztése. Mérjük fel közvetlenül egymás mellé az adott AB = a és CD = b
hosszúságú szakaszokat, majd szerkesszük meg a kapott AB + CD = AD szakasz Thalész-körét (5.132. ábra).
5.132. ábra
A B pontból AD-re állított merőleges a Thalész-kört P-ben metszi. Thalész tétele miatt az APB háromszögnek P-nél
derékszöge van. A magasságtétel szerint e háromszög átfogóhoz tartozó magassága éppen az adott a és b szakaszok mértani
közepe.
Megjegyzés. Érdemes észrevenni, hogy az alapszerkesztések felhasználásával bármely szöget, melynek fokokban vett
mérőszáma 3-mal osztható egész szám, meg tudunk szerkeszteni. Ugyanis 60°-ot könnyen szerkeszthetünk. Az 5.6.
fejezetben leírtak szerint 72°-os szöget is szerkeszthetünk, továbbá tudunk szöget felezni, másolni, így két szög
összegét és különbségét is megszerkeszthetjük. Ha szerkesztünk egy 72°-os szöget, majd azt megfelezzük, 36°-os
szöget kapunk. Ha e 36°-os szögből levonjuk a 60°-os szög felezésével adódó 30°-os szöget, akkor 6°-os szög adódik.
Végül e 6°-os szöget megfelezve 3°-os szöget kapunk, ennek pedig tetszőleges egész számszorosát már könnyen
megkaphatjuk. (Ha lehetne euklideszi szerkesztéssel szöget harmadolni, akkor ezek szerint az 1°-os szög is, tehát
bármilyen, fokokban mérve egész fokú szög megszerkeszthető lenne.)
Példák. Az alábbi feladatokban általános szerkesztési eljárások, ötletek, módszerek kerülnek bemutatásra. Az egyes
feladatokra általában többféle megoldás is adható, mi – helyszűke miatt – csak egy és nem is feltétlenül a
legkézenfekvőbb megoldást adjuk meg. Ahol szükséges, diszkutáljuk is a megoldást.
1. Szerkesztendő háromszög, ha adott egy oldala a, a szemközti szöge α, valamint az oldalhoz tartozó magassága ma.
Vegyünk fel egy e egyenest, és jelöljük ki rajta az adott a = BC oldalt! Ezután szerkeszszük meg az a szakasz α szögű
látókörét! Szerkesszünk egy e egyenessel párhuzamos f egyenest tőle adott ma távolságban (5.133. ábra)!
5.133. ábra
Az f egyenesnek a látókörrel 0, 1 vagy 2 közös pontja van. (Ábránkon két közös pont van: P1 és P2.) Ha nincs közös
pont, akkor a feladatnak nincs megoldása. Ha az f egyenes érinti a látókört, akkor egy db egyenlő szárú
háromszög a megoldás. Ha két metszéspont adódik, akkor a feltételeknek eleget tevő háromszögek az BCP1, illetve
BCP2 egybevágó háromszögek. (Ezeket az egybevágó háromszögeket nem tekintjük lényegesen különböző
megoldásnak.)
2. Szerkesztendő egyenlő szárú háromszög, ha adott az alaphoz tartozó ma magassága és adott a K kerülete.
Vegyük fel az adott K = PQ szakaszt, majd annak T felezőpontjában állítsunk e szakaszra egy ma = TC merőlegest
(5.134. ábra)!
5.134. ábra
Ha ma , akkor a CQ, illetve CP szakaszok felező merőlegesei a PQ szakaszt B-ben, illetve A-ban metszik.
Mivel CB = BQ és CA = AP, ezért PA + AB + BQ = CA+ AB + BQ, vagyis a feltételeknek eleget tevő háromszög az ABC
5.135. ábra
Hosszabbítsuk meg a háromszög BA oldalát A-n túl az AE = b szakasszal. Ekkor az EAC háromszög egyenlő szárú,
az E csúcsnál levő szöge pedig . Ezek szerint az E pontnak rajta kell lennie az a oldal szögű látókörén.
Ezzel megvan a szerkesztés menete: szerkesszük meg az a oldal α szögű és szögű látókörét, majd ez utóbbi
látókört B körül, rajzoljunk egy b + c sugarú körívet (5.135b ábra). Ahol ez a körív metszi az szögű látókört, ott
lesz a háromszög keresett harmadik csúcsa. Természetesen a szerkeszthetőség feltétele, hogy a < b + c, továbbá,
5.136. ábra
Speciális szerkesztések
Valamikor a Kr. e. V. században keletkezett a három híres görög szerkesztési probléma, mely hosszú évszázadokon
keresztül tartotta lázban a szakembereket és laikusokat egyaránt.
Ezek a következők: 1. A kockakettőzés, azaz lehet-e körzővel és vonalzóval egy adott kockához kétszer akkora térfogatú
kocka élét megszerkeszteni. 2. A szögharmadolás, azaz lehet-e körzővel és vonalzóval egy tetszőlegesen adott szög
harmadát megszerkeszteni. 3. A kör négyszögesítése, azaz lehet-e körzővel és vonalzóval egy körhöz vele azonos területű
négyzetet szerkeszteni. (Természetesen mindhárom esetben „szerkesztésen” az euklideszi szerkesztési lépések használatát
értjük.) Ma már tudjuk, hogy e problémákat euklideszi úton nem lehet megoldani. De sok évszázadnak kellett eltelnie
ahhoz, hogy mindez kiderüljön, s ez idő alatt a sok-sok kísérlet, kutatás, próbálkozás nagymértékben
„megtermékenyítette” a matematika tudományát, számos új eredmény, algebrai és geometriai tétel megszületése volt
köszönhető e három görög problémakörnek.
A három probléma közül most kettőt: a kör négyszögesítését, illetve a szögharmadolást mint speciális szerkesztéseket
vizsgáljuk részletesebben.
A kör négyszögesítése
Szögharmadolás
Egyéb speciális szerkesztések
A kör négyszögesítése
A kör négyszögesítésének fő akadálya a π számnak körzővel való megszerkesztésében rejlik. Legyen ugyanis valamely kör
sugara 1. Ekkor ennek területe 12 · π. Ha valamely a oldalú négyzet területe megegyezik e kör területével, akkor
Ha a π szakaszt meg tudjuk szerkeszteni, akkor már nem okozhat problémát, hiszen a Thalész-tétel és a
befogótétel segítségével (5.137. ábra) azonnal adódik.
5.137. ábra
A π hosszúságú szakasz megszerkesztésére számos kísérlet született az évszázadok során, mindaddig, míg Evariste
Galois (1811–1832) francia matematikusnak, a modern algebra megteremtőjének kutatásai alapján be nem bizonyosodott,
hogy ez a szám euklideszi módon nem szerkeszthető meg.
A π hosszúságú szakasz megszerkesztésére vonatkozó kísérletek közül tán legérdekesebb a XVII. század második
felében élt lengyel származású matematikus, Kochanski eljárása.
Vegyünk egy egységnyi sugarú, O középpontú kört! Rajzoljuk meg e kör AB átmérőjét, majd rajzoljuk meg a kör B-
beli érintőjét! Ezután húzzuk be a BC = 1 húrt! E húr felező merőlegese az előbbi érintőt P-ben metszi. Legvégül P-ből
kiindulva mérjük fel az ábrán látható módon a PK = 3 szakaszt (5.138. ábra)!
Mivel az OBC háromszög szabályos háromszög, és OB = 1, ezért
innen pedig
Szögharmadolás
Hogy miként vetődött föl egy adott szög három egyenlő részre osztásának kérdése, nem tudható, bár mindenképpen
gyelemre méltó, hogy ha e szerkesztési eljárás elvégezhető lenne, akkor akárhány (egész számú) fokos szög euklideszi úton
megszerkeszthető lenne. Ennek az az oka, hogy az aranymetszés ismeretében (amit természetesen már a görögök is
ismertek) a 36°-os szög könnyen megszerkeszthető euklideszi úton. Ekkor annak fele, a 18° is megszerkeszthető. Mivel a 60°-
os szöget kétszer megfelezve eljuthatunk az 15°-os szöghöz, így a 18° és a 15° különbségeként megkaphatjuk a 3°-os szöget. Ha
pedig tudnánk szöget harmadolni, akkor a 3°-os szög harmadolásával eljuthatnánk az 1°-os szöghöz, így már valóban
akárhány (egész számú) fokos szög euklideszi úton megszerkeszthető lenne.
A szögharmadolás kérdésében a kutatásokat kezdetben semmiféle siker nem koronázta, mindaddig, míg az ókor
matematikusai ki nem találtak mindenféle segédeszközöket, melyek már lehetővé tették tetszőleges szög
harmadolását. (Természetesen ezzel eltértek az euklideszi szerkesztés megengedhető lépéseitől.) Az első komolyabb
sikert e téren Arkhimédész (Kr. e. III. század) érte el. Ha – Arkhimédész javaslatára – pluszként megengedünk egy
olyan vonalzót, melyen egy előre kijelölt adott szakaszt is felhasználhatunk, akkor a kérdéses szerkesztés már
elvégezhető. Ennek az adott szakasznak a felhasználása úgy értendő, hogy a vonalzón kijelölt szakasz két végpontját
illeszthetjük egy-egy görbére (pl. egy-egy egyenesre vagy egy egyenesre és egy körre) úgy, hogy eközben vonalzónk
áthaladjon egy adott ponton.
Az 5.139. ábrán az O csúcspontú α szöget akarjuk harmadolni, felhasználva ehhez egy olyan vonalzót, melyen egy r
hosszúságú szakaszt előre kijelöltünk. Rajzoljunk O körül egy r sugarú félkört, és hosszabbítsuk meg az egyik
szögszárat! Ezután helyezzük el az r szakaszt tartalmazó vonalzónkat úgy, hogy a szakasz egyik végpontja (P) a
meghosszabbított szögszárra, másik végpontja (Q) a körre illeszkedjen, és a PQ egyenes illeszkedjen az M pontra!
Mivel PQO egyenlő szárú háromszög, ezért QOP ∠ = β. Ekkor az MQO ∠ a PQO háromszögnek egy külső szöge, tehát
MQO ∠ = 2β. Az MQO háromszög ugyancsak egyenlő szárú, így QMO ∠ = MQO ∠ = 2β. Mivel a harmadolandó α szög
az MPO háromszögnek külső szöge, ezért
Az eljárás valóban szellemes, de sajnos az euklideszi szerkesztés nem engedi meg az Arkhimédész által javasolt
„vonalzó” használatát.
5.139. ábra
A matematikai kutatások során a XIX. században bebizonyosodott, hogy egy d racionális számmal jelzett szakaszból
csak a racionális számok, valamint a belőlük a négy alapművelettel és négyzetgyökvonással véges számú lépésben nyert
számok, illetve az ezeknek megfelelő hosszúságú szakaszok szerkeszthetők meg euklideszi szerkesztéssel.
Egyéb speciális szerkesztések
Gyakori speciális szerkesztések az olyan szerkesztési feladatok, amikor a megszerkesztendő objektumhoz a megengedett
két eszköz (körző, vonalzó) közül csak az egyiket használhatjuk. E fejezet zárásaként erre is mutatunk néhány példát.
Példák
1. Adott egy k kör, ennek egy átmérő e egyenese, valamint a körön kívül egy P pont. Szerkesztendő a P ponton
átmenő, e-re merőleges egyenes úgy, hogy a szerkesztéshez csak vonalzót használhatunk.
Legyen A és B az e egyenes és a k kör két metszéspontja (5.140. ábra). A P-t A-val, illetve B-vel összekötő egyenesek
a k kört R-ben, illetve Q-ban metszik.
Legyen M az AQ és RB egyenesek metszéspontja. Thalész tétele miatt ARB ∠ = AQB ∠ = 90°. Ebből következik,
hogy az APM háromszögnek MR és PQ egy-egy magasságvonala, vagyis a B pont e háromszög magasságpontja. De
ha az APM háromszögnek B a magasságpontja, akkor az e egyenes szintén magasságvonal, vagyis az e egyenes
merőleges PM-re.
5.140. ábra
2. Adott két pont: A és B. Szerkesztendők a C és D pontok úgy, hogy ABCD négyzet legyen (A és B szomszédos
csúcsok), és a szerkesztéshez csak körzőt használhatunk.
Vegyük egységnyinek az A és B pontok távolságát, és rajzoljunk A körül és B körül egy-egy AB sugarú kört! Mivel a
kör egy pontjából kiindulva a kör sugarát a körívre pontosan hatszor mérhetjük fel, ezért A-ból, illetve B-ből
kiindulva, a körívekre a sugarat háromszor-háromszor felmérve az A pont B-re vonatkozó A′, illetve a B pont A-ra
vonatkozó B′ képét kapjuk. Ezek után rajzoljunk A′ és B′ körül egy-egy 2 sugarú kört; ezek egyik metszéspontja
legyen P (5.141. ábra)!
5.141. ábra
Az A′PT derékszögű háromszög A′P átfogója 2, A′T befogója Pitagorasz tétele alapján
Arra jutottunk, hogy az AP szakasz egyenlő az AB oldalú négyzet átlójával. Ezek szerint, ha A és B körül rajzolunk
egy-egy AP sugarú kört, akkor ezek a meglévő köröket éppen a keresett C és D pontokban fogják metszeni.
3. Adott egy egyenes és egy vele párhuzamos AB szakasz. Szerkesztendő az AB szakasz felezőpontja úgy, hogy a
szerkesztéshez csak vonalzót használhatunk. A szerkesztéshez azt használjuk fel, hogy ha egy trapéz átlóinak M
metszéspontján keresztül párhuzamost húzunk a trapéz alapjaival, akkor e párhuzamosnak a szárak közé eső
darabját az M pont felezi (5.142. ábra).
5.142. ábra
Az ABM és CDM háromszögek hasonlók, a hasonlóság aránya , így ha AM=x, akkor Az AME és
ACD háromszögek is hasonlók, vagyis
5.143. ábra
5.144. ábra
Az APA′ egyenlő szárú háromszög oldalai 1, 2, 2. Legyen F a P és Q pontok körül rajzolt egységnyi sugarú körök
metszéspontja. Az F pont illeszkedik az AA′ egyenesre. Az APF háromszög szintén egyenlő szárú, melynek szárai
AP = PF = 1 hosszúak. Mivel az APF egyenlő szárú háromszög és a PAA′ egyenlő szárú háromszög alapon fekvő
szögei egyenlők (PAF ∠ = PAA′ ∠), ezért e két háromszög hasonló, és a hasonlóság aránya 1:2. Ez viszont azt jelenti,
6.1. Alapfogalmak
Ebben a fejezetben a tér elemi geometriai vizsgálatával foglalkozunk. Egyenesek, síkok viszonylagos helyzetét, térelemek
távolságát, hajlásszögét vizsgáljuk. A tér, a sík, az egyenes és a pont fogalmakat nem de niáljuk, azokat a szemléletből
elfogadjuk, ahogyan azt tettük a sík elemi geometriai tárgyalásánál is. Ugyancsak elfogadjuk szemléletből az „illeszkedés”
fogalmát.
Pont és egyenes, valamint pont és sík viszonylagos helyzete egyszerűen tárgyalható, hiszen a pont vagy illeszkedik az
egyenesre (síkra), vagy nem. Ha egy pont nem illeszkedik egy egyenesre, akkor együtt egyetlen síkot határoznak meg.
Két egyenes viszonylagos helyzete háromféle lehet:
a) A két egyenes egy síkban van, de nincs közös pontjuk. Ekkor a két egyenest párhuzamosnak mondjuk. A tér bármely két
párhuzamos egyenese egyértelműen meghatároz egy síkot (6.1. ábra).
6.1. ábra
b) A két egyenes egy síkban van, és van egy közös pontjuk. Az ilyen egyeneseket metsző egyeneseknek nevezzük (6.2. ábra).
Bármely két metsző egyenes egyértelműen meghatároz egy síkot.
6.2. ábra
c) A két egyenes nincs egy síkban. Az ilyen egyeneseket kitérő egyeneseknek nevezzük (6.3. ábra).
6.3. ábra
Általában két egyenesnek 0 vagy 1 közös pontja lehet (esetleg végtelen sok közös pontjuk van; ekkor természetesen
minden pontjuk közös és a két egyenes egybeesik).
Egyenes és sík esetében (ha a sík nem tartalmazza az egyenest) két eset lehetséges:
a) Az egyenesnek nincs közös pontja a síkkal. Ekkor az egyenes párhuzamos a síkkal (6.4. ábra).
6.4. ábra
b) Az egyenesnek és a síknak egy közös pontja van. Ekkor azt mondjuk, hogy az egyenes dö (metszi) a síkot (6.5. ábra).
6.5. ábra
Egy síknak és egy egyenesnek tehát 0, 1 vagy végtelen sok közös pontja van (utóbbi esetben a sík tartalmazza az
egyenest, azaz annak minden pontját).
Két sík vagy párhuzamos helyzetű (6.6. ábra), ekkor e két síknak nincs közös pontja, vagy nem párhuzamosak, ekkor a
két síknak végtelen sok közös pontja van, mely pontok egy egyenest alkotnak. Ezt az egyenest a két sík metszésvonalának
nevezzük (6.7. ábra).
6.6. ábra
6.7. ábra
Térelemek hajlásszöge. Két egyenes hajlásszögének nevezzük a tér egy tetszőleges pontján át az egyenesekkel
párhuzamosan húzott egyenesek hajlásszögét. Ha a két egyenes párhuzamos, akkor hajlásszögük 0°. Két sík hajlásszögét a
következőképpen határozzuk meg: ha a két sík párhuzamos, akkor hajlásszögük 0°. Ha nem párhuzamosak, akkor
metszésvonaluk egy tetszőleges pontjában merőlegest állítunk e metszésvonalra mindkét síkban, s a kapott félegyenesek
hajlásszögét mondjuk a két sík hajlásszögének (6.8. ábra).
6.8. ábra
6.9. ábra
Egyenes és sík hajlásszögén a következőt értjük: ha az e egyenes párhuzamos az S síkkal, akkor hajlásszögük 0°. Ha e
nem párhuzamos az S síkkal, akkor van egy D közös pontjuk. Az e egyenes egy tetszőleges P pontjából merőlegest állítunk
az S síkra. Ennek a merőlegesnek és a síknak M metszéspontját összekötjük D-vel, s az így keletkezett szöget nevezzük az
egyenes és sík hajlásszögének (6.9. ábra).
Egy egyenes és egy sík akkor merőleges egymásra, ha az egyenes a sík minden egyenesére merőleges.
Ha egy egyenes merőleges egy sík két egymást metsző egyenesére, akkor az egyenes merőleges a síkra.
E tétel szerint tehát ha az egyenes merőleges a döfésponton áthaladó két síkbeli egyenesre, akkor minden, a
döfésponton áthaladó egyenesre merőleges; a 6.10. ábra jelöléseivel: ha a h egyenes merőleges az S sík D döféspontján
áthaladó e és f egyenesekre, akkor merőleges a g egyenesre is.
6.10. ábra
Térelemek távolsága. Két pont távolságán a két pontot összekötő szakasz hosszát értjük. Pont és egyenes távolsága a
pontból az egyenesre állított merőleges szakasz hossza. Pont és sík távolsága a pontból a síkra állított merőleges szakasz
hossza.
Két sík távolsága 0, ha a két sík nem párhuzamos. Ha a két sík párhuzamos, akkor az egyik sík bármely pontjából a
másik síkra állított merőleges szakasz hossza ugyanakkora, azaz nem függ a pont választásától. Ennek a merőleges
szakasznak a hosszát mondjuk a két sík távolságának (6.11. ábra).
6.11. ábra
Két egyenes távolsága 0, ha a két egyenes metszi egymást. Ha a két egyenes egy síkban van, de nincs közös pontjuk,
akkor párhuzamosak; ekkor az egyik egyenes egy tetszőleges pontjából a másik egyenesre állított merőleges szakaszt
mondjuk a két egyenes távolságának. Ha két egyenes nincs egy síkban (kitérő egyenesek), akkor távolságukat az alábbi
módon határozzuk meg: bármely két kitérő egyeneshez létezik egyetlen olyan egyenes, mely mindkét eredeti egyenesre
merőleges, és mindkettőt metszi. Ezt az egyenest a két kitérő egyenes normáltranszverzális egyenesének nevezzük. A két
kitérő egyenes távolsága a két metszéspont távolsága (6.12. ábra).
6.12. ábra
Példák
1. Számítsuk ki az egységnyi élű kocka két kitérő éle felezőpontjainak a távolságát! Készítsük el a szükséges ábrát
(6.13. ábra)! Az EF szakasz hosszát kell meghatároznunk.
6.13. ábra
2. A zsámbéki XIII. századi premontrei templom romjának egyik tetőzete olyan négyzet alapú egyenes gúla,
melynek oldaléle az alaplappal 72°-os szöget zár be. Mekkora az oldallap és az alaplap hajlásszöge? Tekintsük a
6.14. ábrát!
6.14. ábra
egybevetve azt kapjuk: ahonnan tg α = 4,35. Tehát az oldallap és alaplap hajlásszöge α = 77°.
3. Adott három különböző sík: S1, S2, S3. Határozzuk meg azon pontok halmazát, melyek a három sík közül legalább
kettőre illeszkednek! Három különböző sík viszonylagos helyzete négyféle lehet.
1. Ha a három sík mindegyike párhuzamos a másik kettővel, akkor a három sík közül bármely kettő közös
pontjainak a halmaza üres halmaz, így a keresett ponthalmaznak egyetlen eleme sincs (6.15a ábra).
2. Ha a három sík közül kettő párhuzamos, a harmadik nem párhuzamos velük, akkor azok a pontok, melyek
legalább két síkra illeszkednek, két párhuzamos egyenest alkotnak (6.15b ábra).
3. Ha a három sík közül semelyik kettő nem párhuzamos egymással, de az egyik párhuzamos a másik kettő
metszésvonalával, akkor azon pontok halmaza, melyek legalább két síkra illeszkednek, három, páronként
párhuzamos egyenes (6.15c ábra).
4. Ha a három sík közül semelyik kettő nem párhuzamos egymással, és semelyik nem párhuzamos a másik kettő
metszésvonalával, akkor a keresett ponthalmaz három, egymást egy pontban metsző egyenes (6.15d ábra).
Összefoglalva tehát három különböző sík esetén azon pontok halmaza, melyek legalább két síkra illeszkednek,
vagy üres halmaz, vagy két párhuzamos egyenes, vagy három párhuzamos egyenes, vagy pedig három,
egymást egy pontban metsző egyenes.
6.15. ábra
4. Az S1 és S2 síkok merőlegesek egymásra. A két sík metszésvonalának egy P pontjában állítottunk mindkét síkban
egy-egy olyan félegyenest, mely a metszésvonallal ugyanabban az irányban 60°-os szöget zár be. Mekkora e két
félegyenes hajlásszöge?
Mérjük fel a metszésvonal valamely P pontjából a 60°-os szöget bezáró félegyenesekre a PQ = PR = 1 hosszúságú
szakaszokat (6.16. ábra)!
6.16. ábra
így a QNR egyenlő szárú derékszögű háromszögben Írjuk fel a QPR háromszögre a
6.17. ábra
6.2. Poliéderek
Az olyan (korlátos) testet, melyet véges sok sokszöglap határol, poliédernek nevezzük.
A poliédert lapjai, a lapjait élei, az éleit pedig csúcsai határolják. Minden él legalább két lap határán van, minden
csúcsba legalább három él fut össze. Minden poliédernek legalább négy lapja és legalább négy csúcsa van.
A poliéder csúcsait összekötő szakaszok vagy élek (két szomszédos sokszöglap közös oldala), vagy lapátlók (valamely
határoló sokszöglap két nem szomszédos csúcsát összekötő szakasz, vagyis e sokszöglap egy átlója), vagy testátlók, azaz két
olyan csúcsot összekötő szakasz, amelyik nem is él, és nem is lapátló. A testátló lehet belső testátló (ha teljes egészében a
poliéder belsejében van), vagy lehet külső testátló (ha nincs minden pontja a poliéder belsejében vagy határán).
A konvex poliéder minden testátlója belső testátló. Ha a poliéder nem konvex, akkor konkávnak mondjuk.
A 6.18. ábrán néhány poliédert szemléltettünk. Az a), d) és e) poliéderek konvexek, míg a b) és c) poliéderek nem
konvexek (konkávok).
A poliéder lapjait alkotó sokszögek szögei a poliéder élszögei. Ha egy él két lapban csatlakozik egymáshoz, akkor e
lapok síkjainak hajlásszöge a poliéder egy lapszöge.
6.18. ábra
Ebből következik, hogy a szabályos poliéder lapjai egybevágó szabályos sokszögek. Szabályos poliéderre példa a 6.18.
ábra a) (kocka) és d) (szabályos tetraéder) esete.
A poliéder csúcsai, lapjai és élei közötti fontos összefüggésről szól Euler poliédertétele.
Ha egy konvex poliéder csúcsainak a száma c, lapjainak a száma l, éleinek a száma e, akkor
(6.1)
Ötféle szabályos poliéder van: tetraéder, hexaéder (kocka), oktaéder, dodekaéder és ikozaéder.
Az egyes szabályos testek elnevezése görög eredetű; az egyes szabályos poliéderek lapszámaira utalnak.
A tétel igazolásához Euler poliédertételét használhatjuk fel. Legyen n a szabályos poliédert határoló szabályos
sokszögek oldalainak a száma. Mivel minden él két lap csatlakozásánál van, ezért a lapok számát szorozva az egyes
lapok oldalainak a számával, éppen az élek számának kétszeresét kapjuk: l·n = 2e. Mivel minden él két csúcsot köt
össze, így, ha az egy csúcsba (minden csúcsba) futó élek száma m, akkor a csúcsok számának m-mel vett szorzata az
élek számának kétszerese: cm = 2e. Euler tétele szerint tehát írhatjuk: l + c = e + 2, azaz
6.19. ábra
Az alábbi táblázatokban összefoglaltuk a szabályos poliéderek jellemző adatait, valamint az a oldalú szabályos poliéder
felszínét és térfogatát.
Határoló lapok oldalszáma Egy csúcsba futó élek száma Csúcsok száma Élek száma Lapok száma
3 3 4 6 4 tetraéder
4 3 8 12 6 hexaéder
3 4 6 12 8 oktaéder
5 3 20 30 12 dodekaéder
3 5 12 30 20 ikozaéder
Felszín Térfogat
Tetraéder
Hexaéder 6a2 a3
Oktaéder
Dodekaéder
Ikozaéder
Példák
1. Ellenőrizzük Euler tételét a) konvex sokszög alapú gúla esetében, b) konvex sokszög alapú hasáb esetén!
a) A konvex n-szög alapú gúla csúcsainak a száma c = n + 1, lapjainak a száma l = n + 1, éleinek a száma e = 2n. Ekkor
l + c = n + 1 + n + 1 = 2n + 2 = e + 2.
b) A konvex n-szög alapú hasáb csúcsainak a száma c = 2n, lapjainak a száma l = n + 2, éleinek a száma e = 3n. Ekkor
l + c = 2n + n + 2 = 3n + 2 = e + 2.
2. Igazoljuk, hogy nincs olyan poliéder, melynek pontosan 7 éle van!
Minden lap legalább 3 oldalú, így 2e ≥ 3l. Minden csúcsba legalább 3 él fut, így Euler tételét használva 2e ≥ 3c = 3(e–
l + 2) = 3e – 3l + 6, tehát Зl ≥ e + 6. Ezek szerint tehát 2e ≥ 3l ≥ e + 6. Ha most e = 7, akkor 14 ≥ 3l ≥ 13, ami nyilván
lehetetlen.
3.
Legyen li a konvex poliédert határoló lapok közül az i oldalú lapok száma. Igazoljuk, hogy ekkor
A 3 oldalú lapok a poliédernek 3 élét, a 4 oldalú lapok a poliéder 4 élét, az i oldalú lapok a poliéder i db élét
tartalmazzák. Ezek összege a poliédernek minden élét kétszer tartalmazza, tehát valóban
4. Egy konvex poliéder éleinek a száma e, lapjainak a száma l. Mekkora a poliédert határoló sokszögek szögeinek az
összege?
Legyen a 3, 4, …, i oldalú lapok száma l3, l4, …, li. Egy háromoldalú lap szögeinek összege 180°, így a 3 oldalú lapok
összes szögének összege 180°l3. Hasonlóképpen a 4 oldalú lapok szögeinek összege 2 · 180° · l4; általában az i oldalú
lapok szögeinek összege (i – 2) · 180° · li. Ezek szerint az összes lap szögeinek keresett összege:
Az első zárójelben az élek számának kétszerese, a második zárójelben pedig a lapok száma szerepel, így az összes
lap szögeinek összege:
5. Igazoljuk, hogy bármely konvex poliéder esetén minden lap oldalszáma nem lehet 5-nél nagyobb!
Ha a poliédernek nincs sem 3, sem 4, sem 5 oldalú lapja, akkor l3 = l4 = l5 = 0. Ekkor
tehát e ≥ 3l. A 2. feladatban kimutattuk, hogy 3l ≥ e + 6, ahonnan e ≥ 3l – 6. Azt kaptuk, hogy ha minden lap
oldalszáma 5-nél nagyobb, akkor 3l – 6 ≥ e ≥ 3l, ami nyilván lehetetlen.
Speciális poliéderek
Speciális poliéderek
Hasábok
Gúlák, csonka gúlák
Hasábok
Legyen adott egy sokszög. Ennek pontjain át húzzunk olyan párhuzamos egyeneseket, melyek nem párhuzamosak a
sokszög síkjával. Ekkor egy végtelen hasábot kapunk. Ha ezt a végtelen hasábot elmetsszük az alapsokszög síkjával és egy
ezzel párhuzamos síkkal, akkor a kiindulási sokszög és a vele párhuzamos síkmetszet alkotta sokszög egy hasábot határoz
meg (6.21. ábra).
6.21. ábra
A metszősíkokban elhelyezkedő lapok a hasáb alaplapjai. A többi lapot oldallapoknak mondjuk. Az alaplapok síkjainak
távolsága a hasáb magassága. Az oldallapok összességét a hasáb palástjának nevezzük. A származtatáskor használt
egyeneseknek az alaplapok közötti szakaszai a hasáb alkotói. A hasáb alkotói mind egyenlők. Ha az alkotók merőlegesek az
alapsokszögekre, akkor a hasábot egyenes hasábnak mondjuk, ha nem merőlegesek, akkor a hasáb ferde hasáb. Az egyenes
hasáb oldallapjai téglalapok, a ferde hasáb oldallapjai paralelogrammák. Ha a hasábot egy, az alapsokszögekkel
párhuzamos síkkal metsszük, akkor a síkmetszet az alapsokszögekkel egybevágó sokszög.
A paralelogramma alapú hasábot paralelepipedonnak nevezzük (6.22a ábra) A paralelepipedon szemközti lapjai
egybevágó paralelogrammák. Ha az egyenes hasáb alaplapja téglalap, akkor a paralelepipedon lapjai téglalapok, ennek
neve téglatest (6.22b ábra). Ha az egyenes hasáb alaplapja négyzet, akkor négyzetes hasábot kapunk (6.22c ábra), ha e hasáb
oldallapjai is négyzetek, akkor a hasábot kockának mondjuk (6.22d ábra). Természetesen a téglatest, a négyzetes hasáb és a
kocka is paralelepipedon. Minden paralelepipedon középpontosan szimmetrikus alakzat.
A testek térfogatát V-vel, felszínét A-val jelöljük. Minden hasáb térfogata az alapsokszög területének és magasságának
a szorzata. Minden hasáb felszíne a határoló lapok területének az összege. Ennek megfelelően a speciális hasábok térfogata
és felszíne:
kocka:
négyzetes hasáb:
téglatest: (6.3)
6.22. ábra
Két testet hasonlónak mondunk, ha létezik olyan térbeli egybevágósági transzformáció, mely az egyik testet a
másikkal középpontosan hasonló alakzatba viszi át.
Hasonló poliéderek megfelelő lapjai hasonló sokszögek, így ha két poliéder hasonló, akkor felszínük aránya a
hasonlóság arányának négyzetével egyenlő.
6.23. ábra
Az első két egyenlet különbségéhez adjuk hozzá a harmadik egyenletet; azt kapjuk: 2a2 = f2 + g2 – e2, ahonnan
Látszik tehát, hogy lapátlóból van a legtöbb. Ha a csúcsok száma a legkisebb, akkor a következő összefüggést
írhatjuk fel: 2n + 2n + n(n – 3) = 2n(n – 3), ahonnan n = 7. Ha a testátlók száma a legkisebb, akkor a következő
összefüggés igaz: n(n – 3) + 2n + + n(n – 3) = 4n, ahonnan n = 4. Ha tehát a csúcsok, testátlók, lapátlók száma
valamilyen sorrendben egy számtani sorozat szomszédos tagjai, akkor a hasáb alapsokszöge vagy 4 oldalú, vagy 7
oldalú.
4. Adott egy ABCDA′B′C′D′ kocka. Számítsuk ki az A′B′C és A′D′C háromszögek síkjának hajlásszögét! Legyen a kocka
egységnyi oldalú! Az A′B′C és A′D′C háromszögek egybevágó derék szögű háromszögek, melyek oldalai 1,
A két háromszög síkjának hajlásszöge a derékszögű háromszögek átfogóhoz tartozó magasságainak a
hajlásszöge. E magasságok talppontjai nyilván egybeesnek (6.24. ábra).
6.24. ábra
A háromszögek átfogóhoz tartozó magassága Mivel D′B′ = a D′B′T háromszögre felírhatjuk a
koszinusztételt: cos α, ahonnan cos α Tehát a két sík hajlásszöge 120°. (Érdemes
észrevenni, hogy ha a kockát az A′C testátló irányából nézzük, akkor az A′D′C, A′B′C és A′AC egybevágó
háromszögeket egy-egy szakasznak látjuk, melyek forgásszimmetrikusan helyezkednek el, éppen 120°-os szöget
zárnak be egymással.)
5. Az ABCDA′B′C′D′ kocka DD′ élének felezőpontja F, a BCC′B′ oldallap középpontja O. Az FAO háromszög síkja a
kockát két testre vágja szét. Mekkora e testek térfogatának aránya?
Tükrözzük az A pontot az O pontra! A kapott A′ pont illeszkedik a D′C′ egyenesre, és C′-től éppen egységnyi
távolságra van (6.25. ábra).
6.25. ábra
Mivel A′ és F is benne van az FAO háromszög síkjában, ezért az FA′ egyenes is. Ez az egyenes a kocka CC′ élét P-ben
metszi. A PC′ az A′D′F háromszögnek középvonala, így Ha P-t is tükrözzük O-ra, akkor a kapott Q pont
B-től szintén távolságra van. Ezzel megkaptuk a kocka és az FAO háromszög síkjának AQPF metszetét. Most
képzeljük el, hogy a kocka A′B′C′D′ fedőlapját -del lejjebb toljuk. Az így keletkező hasáb térfogatát a
háromszög síkja felezi, így a sík „alatti” térfogat Ezek szerint a keletkező két test térfogatának
aránya: 5:3.
6.26. ábra
A sokszöget a gúla alaplapjának nevezzük. A pont, melyből a félegyeneseket indítottuk, a gúla csúcsa. Az alaplap
oldalai a gúla alapélei, a pontból az alaplap csúcsaiba húzott szakaszok a gúla oldalélei. A gúla csúcsából az alaplap két
szomszédos csúcsába futó szakaszok és a kérdéses oldal egy-egy háromszöget határoznak meg; ezek a gúla oldallapjai. Az
oldallapok összessége a gúla palástja. A pont és az alaplap síkjának a távolsága a gúla magassága. Ha az alaplap n oldalú
sokszög, akkor a gúlát egy n oldalú sokszög és n db háromszög határolja. A háromoldalú gúlát tetraédernek is mondjuk. Ha
a gúla alaplapja n oldalú szabályos sokszög, és a pontnak a sokszög síkjára eső merőleges vetülete a szabályos sokszög
középpontja, akkor a gúlát szabályos gúlának mondjuk. A szabályos gúla oldallapjai egybevágó egyenlő szárú háromszögek.
Kimutatható, hogy
ha két tetraéder alapterülete és magassága megegyezik, akkor a két gúla térfogata egyenlő.
Mivel minden gúla tetraéderekre bontható (6.27. ábra), és a gúla térfogata az őt alkotó tetraéderek térfogatának
összege, ezért a gúla térfogatának tárgyalását elegendő tetraéderekre vizsgálni.
6.27. ábra
(6.4)
6.28. ábra
Az ABCD és EDFC tetraéderek térfogata egyenlő, hiszen alaplapjaik (ABC és DEF háromszögek) egybevágó
háromszögek, tehát területeik egyenlő. De e két tetraéder magasságai is egyenlők, hiszen e magasságok a hasáb ABC
és DEF párhuzamos síkjainak a távolsága. Tehát VMCD = VDEFC. De a DEFC és DEBC tetraéderek térfogata is egyenlő;
tekintsük ugyanis alaplapjaiknak az EFC és EBC háromszögeket (ezek egybevágók, hiszen a BCFE
paralelogrammának EC egy átlója), e háromszögek egyenlő területűek. Mindkét tetraéder magassága a D csúcsuknak
a BCFE négyszög síkjától való távolsága, vagyis a magasságaik is egyenlők, tehát VEFCD = VEBCD. Azt kaptuk tehát,
hogy VMCD = VEFCD = VEBCD = Vhasáb. Vagyis az egyes tetraéderek térfogata a hasáb térfogatának a harmada.
A tetraéder egy súlyvonala valamely csúcsból a szemközti oldallap súlypontjába húzott szakasz.
A tetraéder súlyvonalai egy pontban metszik egymást, ez a pont minden súlyvonalon a csúcstól távolabbi negyedelő
pont.
Tekintsük ugyanis a 6.29. ábrát! Legyen F a DC él felezőpontja, vagyis BF, illetve AF a BDC, illetve ADC háromszögek
egy-egy súlyvonala. Mivel a tetraéder ASA és BSB súlyvonalai benne vannak az ABF síkban, ezért van metszéspontjuk
(S). Megmutatjuk, hogy az S pont mindkét súlyvonalon a csúcstól távolabbi negyedelő pont.
6.29. ábra
Mivel ezért a párhuzamos szelők tételének megfordítása miatt SASB párhuzamos AB-vel, és
tehát az S pont valóban mindkét súlyvonalon a csúcstól távolabbi negyedelő pont. Mivel mindezt bármely két
súlyvonalra elmondhattuk volna, így a súlyvonalak valóban egy pontban metszik egymást.
Ha a gúlát egy olyan síkkal metsszük, mely párhuzamos az alaplappal, akkor a gúla szétesik egy gúlára és egy csonka
gúlára (6.30. ábra). A metszetet a csonka gúla fedőlapjának nevezzük. A csonka gúla alap- és fedőlapja hasonló sokszögek; a
hasonlóság aránya a gúla csúcsának a fedőlaptól, illetve alaplaptól vett távolságának a hányadosa. Az alaplap és a fedőlap
síkjának távolsága a csonka gúla magassága. A csonka gúla oldallapjai trapézok, melyek összessége a csonka gúla palástja.
6.30. ábra
(6.5)
6.31. ábra
A csonka gúla térfogatát megkapjuk, ha az eredeti gúla térfogatából (amelyből származtattuk) levonjuk az alaplappal
párhuzamos síkkal való metszés után keletkező gúla térfogatát. Ezek szerint a csonka gúla térfogata:
Tudjuk, hogy hasonló alakzatok területeinek aránya egyenlő a hasonlóság arányának
Innen a nevezők gyöktelenítése, majd a megfelelő algebrai átalakítások után kapjuk a tételben szereplő eredményt.
Bizonyos poliéderekhez található olyan gömb, mely a poliédernek minden lapját érinti, akkor e gömböt a poliéder
beírható gömbjének mondjuk. E gömb sugarának meghatározását – a háromszögek beírható köre sugarának
meghatározásához hasonló módon – tetraéderekre mutatjuk meg.
(6.6)
Kössük össze az ABCD tetraéder beírható gömbjének középpontját a csúcsokkal (6.32. ábra)! Így az eredeti tetraéder 4
db kisebb tetraéderre esik szét, melyek alapháromszöge az eredeti tetraéder egyes oldallapjai, csúcsaik pedig minden
esetben a beírható gömb O középpontja. Ebből következik, hogy mind a négy tetraédernek az alaphoz tartozó
testmagassága a beírható gömb R sugara.
Írjuk fel a négy kisebb tetraéder térfogatát, hiszen ezek összege nyilván egyenlő az eredeti tetraéder V térfogatával.
innen
Az egyenlőség bal oldalán a zárójelben az eredeti tetraéder A felszíne áll, így kapjuk:
6.32. ábra
Példák
1. Egy négyzet alapú szabályos gúla alaplapjának oldalai 12 cm hosszúak. Az oldalélek az alaplappal 60°-os szöget
zárnak be. Mekkora a test térfogata és felszíne? Tekintsük a 6.33. ábrát! A térfogat kiszámításához az m
magasságot kell kiszámítanunk. Mivel TC a négyzet átlójának a fele, ezért Az ETC derékszögű
A felszín az alapnégyzet területéből és három egybevágó egyenlő szárú háromszög területeinek összegéből áll. A
háromszögek területének kiszámításához meg kell határoznunk e háromszögek m* magasságát. Az ETF
derékszögű háromszögből
2. Az ABCDE négyzet alapú szabályos gúla alapja az a oldalú ABCD négyzet. Legyen F a CE oldalél felezőpontja!
Mekkora a test magassága, ha tudjuk, hogy a BDF háromszög szabályos?
Az F-ből ET-re állított merőleges felezi az m magasságot (6.34. ábra).
6.34. ábra
A 6.35b ábra CTB derékszögű háromszögének BT szakasza A beírt gömb keresett sugara a trapéz
magasságának a fele. Írjuk fel Pitagorasz tételét a CTB derékszögű háromszögre:
4. * Egy négyzet alapú szabályos csonka gúlát elvágtunk egy olyan, az alaplapokkal párhuzamos síkkal, mely felezi a
test térfogatát. Igazoljuk, hogy a síkmetszetre emelt kocka térfogata az alaplapokra emelt kockák térfogatának a
számtani közepe!
Azt kell megmutatnunk, hogy ha a síkmetszet oldala x, akkor Vegyük a csonka gúla két szemközti
alapélének felezőpontjain átmenő, az alaplapokra merőleges síkmetszetét (6.36a ábra)! Ez a síkmetszet egy
szimmetrikus trapéz, melyet a 6.36b ábrán látunk.
6.36. ábra
Az ábra jelöléseivel írhatjuk a következőket: Mivel a metsző sík felezi a térfogatot, ezért
azaz
Az előző egyenlettel egybevetve azt kaptuk:
5. Egy szabályos hatszög alapú szabályos gúla alaplapjának oldalai 12 cm hosszúak, oldalélei 18 cm hosszúak.
Mekkora a beírható gömb sugara?
A szabályos hatszög 6 db szabályos háromszögből áll, így a 6.37. ábra ABT háromszögének minden oldala 12.
6.37. ábra
A beírható gömb sugara (6.6) szerint A CTB derékszögű háromszögben m2 = 182 – 122 = 180, tehát a gúla
6.38. ábra
Henger
Kúp, csonka kúp
Gömb
Henger
Ha egy síkbeli zárt görbe pontjain át olyan párhuzamos egyeneseket fektetünk, melyek a görbe síkjával nem
párhuzamosak, akkor egy végtelen hengerfelületet kapunk. Ha e hengerfelületet elmetsszük két párhuzamos síkkal, akkor
egy véges testet kapunk, melyet hengernek nevezünk (6.39a ábra). A hengerfelületet metsző síkok a hengerfelületből két
egybevágó görbét metszenek ki; ezek a henger alaplapjai. A hengerfelület származtatásában szereplő párhuzamos
egyeneseknek az alaplapok közötti szakaszai a henger alkotói. Az alaplapok síkjainak a távolsága a henger magassága. Ha az
alkotók az alaplapokra merőlegesek, akkor egyenes hengerről, egyéb esetben ferde hengerről beszélünk. Ha az alaplapok
körök, akkor a testet körhengernek nevezzük (6.39b ábra). Az egyenes körhenger (forgáshenger) az alapkörök
középpontjain átmenő egyenesre tengelyesen szimmetrikus alakzat. Ezt az egyenest a henger tengelyének is mondhatjuk.
6.39. ábra
Megjegyzés. A henger származtatásánál hasonlóképpen jártunk el, mint a hasáb származtatásánál, csupán az a
különbség, hogy a hasáb esetében a kiindulási zárt síkidom valamilyen sokszög, míg a henger esetében görbevonallal
is határolt zárt síkgörbe.
(6.7)
Az egyenes körhenger felszíne az alapkörök területének, valamint a palást területének az összege. Az egyenes
körhenger palástja kiterítve egy olyan téglalap, melynek egyik oldala az alapkör kerülete, másik oldala pedig a henger
magassága (6.40. ábra).
(6.8)
6.40. ábra
Példák
1. Egy egyenes körhenger palástja kiterítve 8 cm átlójú négyzet. Mekkora a henger térfogata és felszíne?
Ha a négyzet átlója 8, akkor oldala Ez az alapkör kerülete és egyben a henger magassága is. Ha a
2. Egy egyenes körhenger alapkörének sugara r = 6 cm, magassága m = 18 cm. A hengert „elvágtuk” egy, a tengelyével
párhuzamos síkkal; a síkmetszet területe 108 cm2. Milyen távol van e metsző sík a henger tengelyétől?
Állítsunk merőleges szakaszt a fedőkör középpontjából a síkmetszet oldalára! Ez a merőleges felezi a kérdéses
húrt. A 6.41. ábra megfelelő derékszögű háromszögére felírhatjuk Pitagorasz tételét. , tehát a
metszet területe: . m = 108, vagyis . 18 = 108. Innen 36 – x2 = 9, vagyis a metszetnek a
henger tengelyétől való távolsága .
6.41. ábra
3. Egy viaszból készült henger alakú gyertya alapkörének sugara 8 cm, magassága 20 cm. A gyertyát felolvasztottuk,
és 6 cm élű kis viaszkockákat öntöttünk ki belőle. Hány db kis kockánk keletkezett?
A felolvasztott viasz térfogata (vagyis a henger térfogata): VH = 82π · 20. Egy kis kocka térfogata: VK = 63. Ezek
szerint a kiönthető kis kockák száma: , vagyis 18 db kis kockát lehet kiönteni.
6.42. ábra
A forgáskúp tengelyesen szimmetrikus alakzat, alkotói egyenlők. Az alkotóknak a tengellyel bezárt szöge a forgáskúp
félnyílásszöge.
(6.9)
A forgáskúp palástját kiterítve egy körcikkhez jutunk. A test felszíne az alapkör területének és a palást (tehát e körcikk)
területének az összege.
(6.10)
Az alapkör területe r2π. A palást egy olyan körcikk, melynek sugara az eredeti kúp alkotója (l), körívének hossza
pedig az eredeti kúp alapkörének a kerülete (2rπ) (6.43. ábra). Ezek szerint a palást területe rlπ, így a kúp felszíne A =
r2π + rlπ = rπ(r + l).
6.43. ábra
Ha egy kúpot elmetszünk egy, az alaplappal párhuzamos síkkal, akkor kapunk egy kúpot és egy másik testet. Ez utóbbi
testet csonka kúpnak nevezzük. Az eredeti kúp alaplapja a csonka kúp alaplapja, a metszet pedig a csonka kúp fedőlapja. A
metsző sík és az eredeti kúp alaplapja síkjának a távolsága a csonka kúp magassága (6.44. ábra). A csonka kúp alap- és
fedőlapja mindig egymáshoz hasonló síkidomok. Az eredeti kúp alkotóinak az alap- és fedőlap közé eső szakaszai a csonka
kúp alkotói. Ha az eredeti kúp forgáskúp volt, akkor egyenes csonka kúpot kapunk.
6.44. ábra
Megjegyzés. A kúp és a csonka kúp származtatásakor ugyanúgy jártunk el, mint a gúla és a csonka gúla
származtatásánál. A különbség csupán az, hogy a gúla és a csonka gúla esetében a kiindulási síkidom sokszög, míg
kúp és csonka kúp esetében görbékkel határolt zárt síkidom.
Ha az egyenes csonka kúp alapkörének sugara R, fedőkörének sugara r, magassága m, akkor térfogata
(6.11)
A tétel bizonyítását a csonka gúla (6.5)-ben ismertetett térfogatának levezetéséhez teljesen hasonló módon tehetjük
meg.
Ha az egyenes csonka kúp alapkörének sugara R, fedőkörének sugara r, alkotója l, akkor felszíne
(6.12)
A felszín az alapkör és a fedőkör területének, valamint a palást területének az összege. A csonka kúp palástja
kiterítve egy körcikkgyűrű (6.45. ábra).
6.45. ábra
A körcikkgyűrűt határoló nagyobbik ív a csonka kúp alapkörének a kerülete, a határoló kisebb ív a fedőkör kerülete,
az íveket összekötő egyenes szakaszok pedig a csonka kúp alkotójával egyenlők. Ha e körcikkgyűrűt kiegészítjük
teljes körcikké, akkor a csonka kúpot teljes kúppá kiegészítő körcikket, azaz a teljes kúppalástot kapjuk. A csonka
kúp palástja tehát a teljes kúppalást és a levágott kúp palást területeinek a különbsége:
R(l + x)π – rxπ = π[Rl + x(R – r)]. A hasonlóság miatt , ahonnan , tehát a palást területe:
. Tehát a csonka kúp felszíne: A = R2π + r2π + lπ(R + r) = π[R2 + r2 + l(R + r)].
Példák
1. Egy forgáskúp alapkörének a sugara r = 6 cm, alkotója l = 10 cm. Mekkora a kúp térfogata és felszíne?
A sugárból és az alkotóból a kúp m magassága: Tehát a kúp V térfogata és A felszíne (6.9)
és (6.10) alapján:
2. Egy egyenes kúp alakú tartályba egy csapon át folyik a víz; óránként 1 liter. A kúp sugara és magassága: r = 1,2 m,
m = 2, 1 m. Közben a tartályban levő víz párolog is, a párolgás mennyisége egyenesen arányos a vízfelszín
nagyságával; 1 m2-re számítva 0,5 liter óránként. Milyen magasan áll a folyadék a tartályban, amikor beáll az
egyensúly? Tekintsük a 6.46. ábrát! Az egyensúly akkor áll be, amikor a befolyó víz mennyisége egyenlő az
elpárolgó víz mennyiségével; ha óránként 1 liter víz folyik be, akkor óránként 1 liter víznek kell elpárolognia.
Ez akkor következik be, amikor a vízfelszín 2 m2, vagyis x2π = 2 ahonnan A 6.46. ábra megfelelő hasonló
háromszögeiből , azaz
6.46. ábra
3. Két egyenes körkúp úgy helyezkedik el, hogy alapköreik párhuzamosak, és mindegyik csúcsa a másik
alapkörének középpontjába esik egymástól m távolságra. Mekkora a kúpok közös részének a térfogata, ha
alapköreik sugara R és r ?
Vizsgáljuk a 6.47. ábrát! A közös rész egy kettős kúp, közös, x sugarú alapkörrel. Ha az egyik kúp magassága d,
akkor a másik kúp magassága m – d. A közös rész V térfogata:
(6.13)
6.47. ábra
A 6.47. ábra megfelelő hasonló háromszögeiből E két egyenletet összeadva azt kapjuk:
4. Egy zárt, egyenes körkúp alakú edényben magasságának feléig áll a víz. Milyen magasan áll a víz a kúpban, ha azt
„fejre állítjuk”?
A 6.48a és a 6.48b ábrán szemléltetjük a két helyzetet. A 6.48a ábrán a felső „üres” kúp és az eredeti kúp hasonlók
egymáshoz; a hasonlóság aránya 1: 2, így az üres kúp és az eredeti kúp térfogatának aránya 1 : 8. Tehát az eredeti
kúpban levő víz térfogata a kúp térfogatának a 7-ed része.
A 6.48b ábrán az alsó „vízkúp” hasonló az eredeti kúphoz. Mivel térfogataik aránya 7 : 8, ezért a hasonlóság aránya
, tehát , tehát fejre állítás után a víz magassága a kúp magasságának kb. 95,6%-a.
6.48. ábra
5. A 6.49a ábrán egy olyan 120°-os körcikkgyűrű látható, melynek belső sugara 6 dm, külső sugara 12 dm. A
körcikkgyűrű két szélét összeillesztjük, alap- és fedőkörét befedjük, majd az így kapott zárt edényt megtöltjük
vízzel. Hány liter víz fér az edénybe? A körcikkgyűrűből készült edény egy csonka kúp (6.49b ábra). Ennek
fedőkörének, illetve alapkörének kerülete a körcikkgyűrű kisebb, illetve nagyobb körívének hosszával egyenlő.
. Tehát az ilyen módon készült edénybe kb. 165,8 liter víz fér.
6.49. ábra
6. Egy a oldalú szabályos hatszöget elforgattunk két szemközti oldalának felezőpontján átmenő egyenes körül.
Mekkora a keletkezett test felszíne?
A keletkezett forgástest két egybevágó, alapköreiknél egymáshoz illesztett csonka kúp (6.50. ábra). Mivel a
szabályos hatszög hat db szabályos háromszögből áll, ezért a csonka kúpok alapköreinek sugara a, fedőkörének
sugara alkotója a, magassága A test felszíne a fedőkör területe kétszeresének és egy csonka kúp
palástja területének a kétszerese:
6.50. ábra
Gömb
A gömbfelület a tér azon pontjainak a halmaza, melyek egy adott ponttól egyenlő távolságra vannak.
Az adott pont a gömb középpontja, az adott távolság a gömb sugara, melyet a körhöz hasonlóan R-rel szokás jelölni. A
gömbfelület két pontját összekötő szakasz a gömb húrja. A középponton átmenő húr a gömb átmérője. Az átmérő egyben a
gömb leghosszabb húrja.
Bármely a gömböt metsző síknak a gömbbel vett síkmetszete kör. Ha a metsző sík áthalad a gömb középpontján, akkor
főkörnek nevezzük. A főkör olyan körben metszi a gömböt, melynek középpontja egybeesik a gömb középpontjával, és
sugara egyenlő a gömb sugarával (6.51. ábra).
Ha egy síknak a gömbbel egyetlen közös pontja van, akkor e sík a gömbnek érintő síkja. Az érintő sík érintési pontjába
húzott sugár az érintősíkra merőleges. Ez egyben azt is jelenti, hogy az érintési pontba húzott sugár az érintősík minden
olyan egyenesére is merőleges, mely áthalad az érintési ponton (6.52. ábra).
6.51. ábra
6.52. ábra
Az érintősík érintési pontján áthaladó egyenesei a gömbnek érintő egyenesei (érintői). Természetesen az érintő
egyeneseknek is egyetlen közös pontja van a gömbbel. Általában: egy síknak és egy gömbfelületnek 0, 1 vagy végtelen sok
közös pontja van; egy egyenesnek és egy gömbfelületnek 0, 1 vagy 2 közös pontja van.
A gömbhöz egy külső pontból végtelen sok érintő húzható. Ezen érintőknek a külső pontból az érintési pontig terjedő
szakaszai egy forgáskúppalástot alkotnak, s az érintési pontok egy gömbi körön helyezkednek el. E forgáskúp tengelye
áthalad a gömb középpontján. A külső pontból húzott érintőszakaszok mind egyenlő hosszúak (6.53. ábra).
Ha a gömböt egy síkkal metsszük, akkor a gömböt két testre vágjuk szét, e testeket gömbsüvegnek (gömbszelet)
nevezzük (6.54. ábra). A metsző sík által kimetszett kör a gömbsüvegek alapköre. Az alapkör középpontjában az alapkörre
állított merőleges metszi a gömbsüveget. E metszéspont és az alapkör középpontjának a távolsága a gömbsüveg magassága.
Ha a gömbsüveg alapkörének a sugara a, akkor m2 = 2Rm – a2.
6.53. ábra
6.54. ábra
Ha a gömböt két párhuzamos síkkal metsszük, akkor e síkok a gömböt két gömbsüvegre és egy gömbövre (gömbréteg)
bontják (6.55. ábra).
6.55. ábra
A síkok által kimetszett körök a gömböv alapkörei, a síkok távolsága a gömböv magassága. Legyen a gömböv
alapköreinek sugarai a és b (a ≤ b), magassága m! Ha a gömböv tartalmazza a gömb középpontját, akkor
Ha egy lapszög áthalad a gömb középpontján, akkor a gömbből egy gömbgerezdet vág ki (6.56. ábra). A gömbgerezdet
egy gömbkétszög és két félkör határolja.
6.56. ábra
6.57. ábra
Ha egy forgáskúppalást csúcsa a gömb középpontja, alapköre pedig gömbi kör, akkor e kúp, valamint a gömbi körhöz
tartozó, a kúppalástot nem tartalmazó gömbszelet együtt egy gömbcikket határoznak meg (6.57. ábra).
Az alábbi táblázat a most származtatott testek térfogatának és felszínének kiszámítási módját tartalmazza.
Térfogat Felszín
Gömb 4R2π
Gömbszelet mπ(4R – m)
Gömbcikk
Gömbgerezd
Példák
1. Három acélgömböt – melyek sugarai r1 = 1 cm, r2 = 2 cm, r3 = 3 cm – felolvasztottunk, majd egyetlen gömböt
öntöttünk ki az anyagból.
a) Mekkora a keletkezett gömb sugara?
b) Számítsuk ki az eredeti gömbök felszínei összegének és a keletkezett gömb felszínének hányadosát!
a) Ha a keletkezett gömb sugara x, akkor
keresett arány:
2. Egy r = 3 cm sugarú, l = 5 cm alkotójú forgáskúp alakú ólomtömbből 2 mm átmérőjű ólomsörét golyókat akarunk
kiönteni. Hány db sörétet kapunk?
A forgáskúp m magassága: mm. Ezek szerint a forgáskúp V térfogata:
mm3. Egy sörét sugara 1 mm, tehát egy sörét térfogata mm3. A kúpból
6.58. ábra
a) A síkmetszet fölötti gömbszelet magassága , így Vsz térfogata a fenti táblázat alapján
térfogatából kivonjuk a gömbszelet Vsz térfogatát: Ezek szerint a keletkezett két test
térfogatának aránya:Vsz: Vr = 5:11.
6.59. ábra
A négy gömb középpontjai egy négyzet alapú szabályos gúlát határoznak meg, melyet a 6.60. ábra szemléltet.
6.60. ábra
A gúla alapnégyzetének oldala 2R, így átlójának a fele Ha x a keresett kis gömb sugara, akkor a gúla
oldalélei R + x hosszúak, magassága pedig R – x hosszú. Az ábra megfelelő derékszögű háromszögére felírva
Pitagorasz tételét, azt kapjuk: , azaz 4Rx = 2R2, ahonnan a kis gömb keresett
sugara Tehát az eredeti négy gömb közé behelyezhető kis gömb sugara az eredeti gömbök sugarának a
fele.
A forgáshengert tengelyével nem párhuzamos és rá nem merőleges síkkal metszve, a metszet mindig ellipszis.
Ennek igazolásához tekintsük a 6.61a és 6.61b ábrát, melyeken megrajzoltunk egy-egy olyan gömböt, melyek a
hengerpalástot belülről érintik, továbbá érintik a metsző síkot is (e gömböket első alkalmazójukról P. Dandelin
francia-belga mérnökről elnevezve Dandelin-féle gömböknek nevezzük).
6.61. ábra
A gömbök a hengerpalástot belülről egy-egy körben, a k1, illetve k2 körben metszik. Legyen F1 és F2 a metsző sík és a
gömbök érintési pontja. A metsző sík a hengerpalást minden alkotóját metszi; legyen P az egyik alkotóval való
metszéspontja. E P pont tehát illeszkedik az S síkra és illeszkedik a hengerpalástra is. P-ből a k1 körhöz húzott
érintőszakasz éppen PF1, a k2 körhöz húzott érintőszakasz PF2. Mivel egy külső pontból egy gömbhöz húzott
érintőszakaszok egyenlők, ezért PF1 = PA1 és PF2 = PA2 tehát PF1 + PF2 = PA1 + PA2. De PA1 + PA2 összeg állandó, hiszen
ez a k1 és k2 párhuzamos síkok távolsága. Így arra jutottunk, hogy a P pont F1 és F2 pontoktól mért távolságának
összege állandó, vagyis a P pont az F1, F2 fókuszú ellipszis egy pontja.
Ha egy forgáskúpot metszünk egy olyan síkkal, mely nem halad át a forgáskúp csúcsán, akkor a metszet attól függ,
hogy a metsző sík mekkora szöget zár be a forgáskúp tengelyével. Ha a metsző sík e tengelyre merőleges, akkor a metszet
kör.
Ha a forgáskúpot olyan síkkal metsszük, mely nem halad át a kúp csúcsán, és a kúp tengelyére nem merőleges, akkor a
metszet ellipszis, hiperbola vagy parabola aszerint, hogy a metsző sík a kúp tengelyével a fél nyílásszögnél nagyobb,
kisebb vagy azzal egyenlő szöget zár be.
Legyen először a metsző S síknak a kúp tengelyével bezárt szöge nagyobb a kúp félnyílásszögénél! Ekkor a sík a kúp
minden alkotóját metszi. Írjunk a kúpba egy-egy olyan gömböt, mely érinti a kúppalástot (azaz annak minden
alkotóját), és érinti a metsző síkot is (E gömböket Dandelin-féle gömböknek nevezzük.) Tekintsük a 6.62a és 6.62b
ábrát; a 6.62a ábrán a kúpnak a metsző S síkra merőleges tengelymetszetét szemléltetjük; a tengelymetszeten a
Dandelin-gömbök köröknek látszanak. Legyenek F1 és F2 a Dandelin-gömbök és a metsző S sík érintési pontjai!
6.62. ábra
A Dandelin-gömbök a kúppalástot egy-egy körben k1-ben és k2-ben érintik. Legyen P a metsző S sík és a kúppalást
metszetének egy tetszőleges pontja, és tekintsük a kúpnak a P ponton áthaladó alkotóját, legyen A1 és A2 ennek az
alkotónak a k1 és k2 körökkel alkotott metszéspontja! Mivel P az S síkban van, ezért P-ből az egyes gömbökhöz húzott
érintőszakaszok PF1 és PF2. A külső pontból a gömbhöz húzott érintőszakaszok egyenlősége miatt PF1 = PA1 és PF2 =
PA2, vagyis PF1 + PF2 = PA1 + PA2. De a PA1 + PA2 összeg állandó, hiszen ez az összeg a k1 és k2 körök mint alapkörök
által meghatározott csonka kúp alkotója. Ezek szerint a metszet P pontjának F1-től és F2-től vett távolságának összege
állandó, vagyis a P pont az F1, F2 fókuszú ellipszis egy pontja.
Legyen most a metsző S síknak a kúp tengelyével bezárt szöge a kúp félnyílásszögénél kisebb! Ekkor a metsző sík a
kúp mindkét tartományába belevág. Írjunk mindkét tartományba egy-egy olyan gömböt (Dandelin-gömbök), mely
érinti mindkét kúppalástot (azaz minden alkotót), és érinti az S síkot is (6.63a és 6.63b ábra). Legyen az S síknak a
gömbökkel alkotott érintési pontja F1 és F2. A gömbök a kúppalást egy-egy tartományát egy-egy körben, k1-ben és k2-
ben érintik. Ha az S sík és a kúppalást egy közös pontja P, akkor P illeszkedik egy alkotóra. Legyenek A1 és A2 ezen
alkotónak a k1 és k2 körökkel alkotott metszéspontjai!
6.63. ábra
Mivel P az S síkban van, ezért PF1 az egyik, PF2 a másik gömbnek érintője. Mivel a gömb külső pontból húzott
érintőszakaszai egyenlők, ezért PF1 = PA1 és PF2 = PA2. Ezek szerint |PF1 – PF2| = A1A2. De az A1A2 szakasz hossza
állandó (azaz független a P pont választásától), így a metszetgörbe valóban egy hiperbola, melynek fókuszpontjai az
F1 és F2 pontok.
Most legyen a metsző S sík párhuzamos egy alkotóval, azaz a kúp t tengelyével bezárt szöge egyenlő a kúp
félnyílásszögével! Írjunk a kúpba egy olyan gömböt, mely érinti a kúppalástot (azaz minden alkotót), és érinti az S
síkot is (6.64a és 6.64b ábra). E gömb a palástot egy k körben érinti, az S síkot pedig egy F pontban.
6.64. ábra
Legyen P az S sík és a kúppalást egy közös pontja, és legyen a kúp P-n átmenő alkotójának és a k körnek a
metszéspontja A, végül legyen a k kör síkjának és az S síknak a metszésvonala v! PF = PA, hiszen mindkettő a gömb
érintője. Állítsunk merőlegest P-ből a két sík közös v egyenesére, legyen ennek talppontja T! Mivel PA és PT a kúp
tengelyével ugyanakkora szöget zár be (a kúp félnyílásszögét), ezért PA = PT. Ezek szerint PF = PT, vagyis a
metszetgörbe bármely pontja ugyanakkora távolságra van az S sík és a gömb F érintési pontjától, mint a v egyenestől,
így a metszet valóban parabola, melynek F a fókusza és v a vezéregyenese.
Példák
1. Egy kúp félnyílásszöge α. Egy S sík a kúp tengelyével ugyancsak α szöget zár be, és a kúp csúcsától d távolságra
„lép be” a kúpba. Mekkora a síkmetszet parabola paramétere? Használjuk a 6.65. ábra jelöléseit!
A parabola p paramétere az F fókuszpontnak a v vezéregyenestől való távolsága. A parabola tengelypontja az M
pont, így Állítsunk merőlegest M-ből a megfelelő alkotóra, ennek talppontja T, a gömb sugara r. Az
OTM háromszögből MT = 2r = d sin 2α, tehát KF = r = d sin α cos α. Az FKM és OKM hasonló háromszögekből
6.65. ábra
6.66. ábra
2. Egy kúp félnyílásszöge α. Egy S sík a kúp tengelyével 3α szöget zár be, és a kúp csúcsától d távolságra „lép be” a
kúpba. Mekkora a metsző sík és a kúp csúcsa közötti térrészbe írható Dandelin-gömb sugara? Legyen K a metsző S
sík és a kúp t tengelyének metszéspontja! A 6.66. ábra jelöléseit használjuk.
Ha az S sík a t tengellyel 3α szöget zár be, akkor az OMT háromszögben OTM ∠ = 2α, vagyis e háromszög egyenlő
szárú: TM = d. E háromszög alapja: OT = 2OQ = 2d cos 2α, ehhez tartozó magassága: MQ = d sin 2α, tehát az OMT
háromszög területe: TOMT = d2 sin 2α cos 2α. A háromszög kerülete: KOMT = 2d + 2d cos 2α. A háromszög beírható
körének r sugara (5.8) alapján
A 6.4. alfejezetet Hajós György Bevezetés a geometriába című könyvének felhasználásával állítottuk össze.
7. Ábrázoló geometria
7.1. Bevezetés
7.2. Ábrázolás két képsíkon
7.3. Axonometrikus ábrázolás
7.4. Néhány görbékre és felületekre vonatkozó feladat
7.5. Kótás ábrázolás
7.6. Néhány további ábrázolási módszer
Irodalom
7.1. Bevezetés
Az ábrázoló geometria története pár ezer éves. Az építészet, a térképészet alakították ki első, talán ma már kezdetlegesnek
tűnő eljárásait. Az alap- és homlokrajz eljárását a középkor építészete bonyolultabb feladatok megoldására is felhasználta.
Később a technika fejlődése is hozzájárult az ábrázolás tudományának kialakulásához. Gaspard Monge (1746–1818) foglalta
tudományos rendszerbe az addigi módszereket, eljárásokat. Munkássága nyomán megszületett az alkalmazott matematika
új ága, amelyet ma ábrázoló geometria néven ismernek. A geometria részterületeként tartják számon, a geometriai
leképezések elméletének egy alkalmazása.
Az ábrázoló geometria célja a térbeli alakzatok elsősorban síkon való ábrázolása. Valamely síkbeli vagy térbeli alakzat
ábrázolásán olyan geometriai alapokra épülő módszereket, eljárásokat értünk, melyek lehetővé teszik a térbeli alakzat
méreteinek, helyzetének, alakjának gra kus szemléltetését, valamint az alakzattal kapcsolatos geometriai feladatok
szerkesztéssel történő megoldását.
Módszere a vetítés, az ábrázolás eredménye az alakzat képe, vetülete (projekció). Az ábrázolási módszerekkel szemben
támasztott legfontosabb követelmények:
- az ábrázolt alakzat geometriai viszonyai a vetületek alapján egyértelműen megállapíthatóak legyenek,
- az ábrázolás eredményeképpen nyert képek lehetőleg szemléletesek legyenek, azaz a vetületek alapján könnyen el tudjuk
képzelni az alakzatot.
A vetítés egyik módja a párhuzamos vetítés. Ennek során adott a K sík és a v egyenes (7.1. ábra), ahol v-nek és K-nak
egyetlen közös pontja van. A tér pontjait v irányú egyenesekkel, a vetítősugarakkal képezzük le a K síkra, a képsíkra. A 7.1.
ábrán a v adott egyenes adja a vetítősugarak irányát. A tér tetszőleges P pontján át fektetett v állású egyenes K-val alkotott
Pa döféspontja a P pont párhuzamos vetülete, a P pont képe. Ha v ⊥ K, akkor merőleges (ortogonális) vetítésről beszélünk,
ha pedig v nem merőleges K-ra, akkor ferde (klinogonális) vetítésről.
A centrális vetítés esetén adott az O pont és a rá nem illeszkedő K sík (7.2. ábra). A tér pontjait az O pontból, a
centrumból vagy vetítési középpontból vetítjük le a K síkra, melyet képsíknak nevezünk. A tér valamely P pontjának Pc
centrális vetülete (centrális képe) az OP egyenes (vetítősugár) és a K képsík közös pontja. A centrális vetítést alkalmazó
ábrázolási módszerrel a 7.5. fejezetben ismerkedünk meg részletesebben.
Valamely alakzat pontjainak vetületei (képei) az alakzat vetületét (képét) alkotják.
7.1. ábra
7.2. ábra
Az ábrázolással szemben támasztott követelmény a rekonstrukció (visszaállítás), vagyis az ábrázolt alakzat térbeli
helyzetére, alakjára, geometriai viszonyaira való visszakövetkeztetés a vetületek ismeretében. A fenti két vetítés nyilván
nem létesít egy-egyértelmű megfeleltetést a tér és a K képsík pontjai között. A különböző ábrázolási módszerek különféle
módon igyekeznek kiküszöbölni ezt a problémát és más-más módon biztosítani az egyértelmű visszaállítást.
A mérnöki munkában, a művészetekben szükségesek olyan képességek is, melyek lehetővé teszik valamely alkotás
elképzelését, rajzban való megfelelő rögzítését még annak megvalósítása előtt. Ehhez egyrészt megfelelő térszemlélet és
geometriai, térgeometriai ismeretanyag szükséges. Ezenkívül el kell sajátítani azokat az alapvető ábrázoló geometriai,
műszaki rajzban használatos módszereket, melyek lehetővé teszik az ábrázolást, szemléltetést. A geometriai, ábrázoló
geometriai ismeretek segítik a számítógéppel való tervezést is.
Az alábbiakban csak a leggyakrabban használt ábrázolási módszerekkel foglalkozhatunk, helyszűke miatt. A megadott
irodalomjegyzék további ismeretek elsajátítására nyújt lehetőséget.
Jelölések, szerkesztések
Néhány geometriai transzformáció, leképezés
Jelölések, szerkesztések
A háromdimenziós euklideszi tér legegyszerűbb geometriai alakzatai, a térelemek: a pont, az egyenes és a sík. A térelemek
jelölése:
- pontok: A, B, C, … (dőlt nagybetűk),
- egyenesek: a, b, c, … (dőlt kisbetűk),
- síkok: A, B, C, … (álló nagybetűk).
A különböző ábrázolási módszerek foglalkoznak a térelemek és azok kölcsönös helyzetének ábrázolásával. Ennek
megfelelően tárgyalják az illeszkedő, a párhuzamos, a metsző térelemek megadásával kapcsolatos kérdéseket, valamint
azt, hogy a vetületekből milyen módon következtethetünk térbeli viszonyaikra.
A szokásos jelöléseket használjuk. A teljesség igénye nélkül néhány példa. A P ∈ e jelölés szerint a P pont illeszkedik az e
egyenesre. Ellenkező esetben P ∉ e. Egyenes és sík illeszkedésének jelölése: e ⊂ S. Az a és b párhuzamos egyeneseket a || b
jelöli. Ha az e egyenes metszi az S síkot, akkor a metszéspont D = e ⋂ S. A D pontot az e egyenes S síkkal való döféspontjának
nevezzük.
Az A és B pontok által meghatározott egyenest AB-vel, az A, B, C nem egy egyenesre illeszkedő pontok által
meghatározott síkot ABC-vel jelöljük. A P pont és a rá nem illeszkedő e egyenes síkja: Pe. Hasonlóan az a és b egyenesek
által meghatározott síkot ab jelöli.
A helyzetgeometriai feladatok megoldásánál nehezebb probléma az ábrázolt alakzatok méreteinek meghatározásával
kapcsolatos szerkesztési feladatok megoldása, illetve adott metrikus tulajdonságokkal rendelkező alakzatok ábrázolása. (Ez
az igény műszaki vonatkozású ábrázolások esetén, a méretezésekkel kapcsolatban fokozottan fellép.) A geometriai alapot a
térelemek távolságainak és szögeinek meghatározásával kapcsolatos de níciók és a vetítés tulajdonságainak ismerete
jelenti. Bizonyos ábrázolási módok esetén fontos szerepet játszik a merőlegesség is, különösen a következő esetben. Az S
síkot metsző n egyenes merőleges a síkra, ha a T = S ⋂ n ponton átmenő, minden S síkbeli egyenesre merőleges. Az S síkra
merőleges n egyenest a sík egy normálisának nevezzük, a T döféspontot pedig n talppontjának.
A fenti feladatok megoldásánál térbeli szerkesztési feladatok lépnek fel, melyeket az adott ábrázolási módszer síkbeli
szerkesztésekre vezet vissza. Ez oly módon történik, hogy a szerkesztés eredménye visszavihető a térbeli alakzatra.
A síkgeometriában a szerkesztések nagy részében úgynevezett euklideszi szerkesztéseket alkalmazzunk. Euklideszi
szerkesztéseket használunk például adott szakasz felező merőlegesének, adott szög szögfelező egyenesének
megszerkesztésénél stb.
7.3. ábra
7.4. ábra
Még az elvileg pontos szerkesztések is a gyakorlati végrehajtás során pontatlanná válnak. Megfelelőnek tekintjük a
szerkesztést, ha a pontatlanság nem számottevő. Sokszor alkalmazunk ún. közelítő szerkesztéseket, amikor a szerkesztés
elvileg sem pontos, viszont ez a pontatlanság elhanyagolhatóan kicsi. Körív közelítő hosszának szerkesztésénél
alkalmazhatjuk a következő Snellius-féle szerkesztést. Az O középpontú r sugarú kör α középponti szögéhez tartozó PL ívét
tekintjük (7.5. ábra). Az OL szakasz O-n túli meghosszabbítására felmérjük az r sugár kétszeresét. Az így kapott M pontot
összekötjük P-vel. Legyen Q az MP egyenes és a körhöz az L pontban vont érintő metszéspontja! Ekkor
Ebből adódik, hogy α < 30° esetén a QL szakasz és a PL ív eltérése nem nagyobb, mint r két tizedrésze. A 30°-nál nagyobb
szögeket 30°-nál kisebbekre bontva alkalmazhatjuk az előző szerkesztést.
7.5. ábra
Egy másik megoldás, ha a körívet a körbe beírt, elég nagy oldalszámú sokszög kerületével közelítjük (rekti káljuk),
melyet már könnyen meghatározhatunk. Ezt a módszert alkalmazhatjuk síkbeli görbeívek esetén, ha az íveknek van
ívhosszuk.
A térgeometriai szerkesztések során a síkgeometriai szerkesztési eszközeink, ha nem síkbeli a feladat, nem
alkalmazhatók. Értelmeznünk kell, mit jelent egy térbeli szerkesztést elvégezni. A térben akkor tekintünk
megszerkesztettnek egy alakzatot, ha a kiindulási adatokból a következő, ún. alapszerkesztések véges sokszori
alkalmazásával eljutunk a keresett alakzathoz:
- Egy síkot megszerkesztettnek tekintünk, ha ismerjük a síkot egyértelműen meghatározó adatokat.
- Ha adott két sík, akkor feltételezzük, hogy a metszésvonalukat is meg tudjuk határozni.
- Ha adott a térben egy tetszőleges sík, akkor ebben a síkban minden, a síkgeometriában szokásos szerkesztést végre tudunk
hajtani.
Nézzünk egy példát térbeli szerkesztési feladatra!
Feladat. Adottak az e és f kitérő egyenesek, valamint a rájuk nem illeszkedő P pont. Szerkesszünk P-n át olyan g
egyenest, mely mindkét adott egyenest metszi.
Megoldás. A szerkesztendő g egyenes átmegy P-n, és metszi e-t, tehát benne van a Pe síkban (7.6. ábra). Hasonlóan
benne van a Pf síkban is. Tehát g a két sík metszésvonala. Ha a két sík metszésvonala párhuzamos e-vel vagy f-fel,
akkor nincs megoldás, különben pedig egyetlen megoldás van. Megjegyezzük, hogy az ábrázoló geometria
eszközeivel a fent leírt szerkesztés konkrétan végrehajtható.
7.6. ábra
7.7. ábra
7.8. ábra
7.9. ábra
Tekintsünk egy S síkot! Az S síkra vonatkozó tükrözésnél (7.10. ábra) a sík pontjai helyben maradnak, xpontok. Az S
által határolt egyik féltér P pontjához oly módon rendeljük hozzá a másik féltér P′ pontját, hogy PP′ ⊥ S, és ha PP′ talppontja
S-en T, akkor PT = TP′. Az S síkot szimmetriasíknak nevezzük.
A tér O pontjára vonatkozó tükrözésnél O-hoz önmagát rendeljük (7.11. ábra), a tér egy további P pontjához az OP
egyenesnek azt a P′ pontját rendeljük, mely az O kezdőpontú P-t nem tartalmazó félegyenesen van, és amelyre OP = OP′
teljesül.
A térbeli transzformációknál is vizsgáljuk, hogy az orientációt megtartják-e, vagy sem. Ehhez szükség van a
jobbrendszer, illetve balrendszer fogalmára. Legyen O a nem egysíkú e, f, g félegyenesek közös kezdőpontja (7.12. ábra). Ha
g irányával szembe nézve az e félegyenest az f félegyenesbe az O körüli, az ef síkban levő, 180°-nál kisebb, pozitív irányú
(azaz megállapodás szerint az óramutató járásával ellentétes) elforgatás viszi, akkor az e, f, g félegyenesek jobbrendszert
alkotnak. Ellenkező esetben az e, f, g félegyenesek balrendszert alkotnak. Az elnevezés onnan származik, hogy jobb kezünk
hüvelyk-, mutató- és középső ujja jobbrendszert, a bal kezünk hüvelyk-, mutató- és középső ujja balrendszert alkot.
7.10. ábra
7.11. ábra
7.12. ábra
Ha egy térbeli transzformáció az O, A, B, C pontokhoz az O′, A′, B′, C′ pontokat rendeli, és az OA, OB, OC és az O′A′, O′B′,
O′C′ hármasok mindketten jobbrendszert vagy mindketten balrendszert alkotnak, azt mondjuk, hogy a transzformáció az
orientációt megtartja, ellenkező esetben megváltoztatja azt.
A térmozgások (eltolás, tengely körüli forgatás, csavarmozgás) megtartják az orientációt, a síkra, illetve a pontra
vonatkozó tükrözés viszont nem.
Az egybevágósági transzformációk egymás utáni alkalmazásával nyert transzformáció is egybevágósági
transzformáció. Két alakzatot egybevágónak neveztünk, ha van olyan egybevágósági transzformáció, mely egyiket a
másikba viszi át. Ha egy alakzatot egy síkra vagy pontra vonatkozó tükrözés önmagába visz át, akkor síkszimmetrikusnak,
illetve centrálszimmetrikusnak nevezzük. A téglatest testközéppontjára nézve centrálszimmetrikus alakzat. Több
szimmetriasíkja is van (pl. a párhuzamos lapok középpárhuzamos síkjai). Forgásszimmetrikus alakzathoz létezik olyan
tengely körüli elforgatás, mely az alakzathoz önmagát rendeli (de nem minden ponthoz rendeli önmagát). A kocka például
a testátló egyenesei körüli 120°-os elforgatásra nézve forgásszimmetrikus. A gömb bármely, a középpontján átmenő
egyenesre mint tengelyre nézve forgásszimmetrikus. (Más egyéb szimmetriái is vannak.)
osztóviszonyán (7.13. ábra) az AP és PB irányított szakaszok előjeles hosszainak arányát értjük, azaz
Nyilván P ≠ B. Ez a hányados az e egyenes irányításától független. Ha P az AB szakasz pontja (P ≠ B), akkor az osztóviszony
nem negatív. Amennyiben P az e egyenes B kezdőpontú, A-t nem tartalmazó félegyenesének pontja, akkor az osztóviszony
negatív és abszolút értékben 1-nél nagyobb. Az e egyenes A kezdőpontú, B-t nem tartalmazó félegyenesének pontjaira az
osztóviszony negatív és abszolút értékben kisebb 1-nél.
7.13 ábra
A leképezés osztóviszonytartó, ha az S sík bármely e egyenesének tetszőleges A, B, P pontjaihoz a leképezés olyan A′, B′,
P′ ∈ e′ pontokat rendel, melyekre (ABP) = (A′B′P′).
Az S → S′ leképezést a n transzformációnak nevezzük, ha bijektív, egyenestartó és osztóviszonytartó. Megjegyezzük,
hogy az a nitás de níciójában kevesebbet is elegendő lenne megkövetelni, s a fenti tulajdonságok egy része bizonyítható
lenne.
A n transzformációk alkalmazásai során metsző egyenesek képei a metszéspont képén áthaladó egyenesek,
párhuzamos egyenesek a n képei párhuzamos egyenesek. Ha két vagy több a nitást egymás után alkalmazunk, a kapott
transzformáció szintén a nitás.
Tengelyes a nitások
Az S → S′ a n transzformációnak F xpontja, ha F képe F′ = F. Az a nitásnak az f egyenes xegyenese, ha az S → S′
leképezés az f egyenest önmagára képezi le. Pl. az S síkban az O pontra vonatkozó tükrözés a nitás, melynél az O ponton
áthaladó egyenesek xegyenesek. Az egyenesek O-tól különböző pontjai nem xpontok. Ha azonban a t xegyenes minden
pontja xpont, akkor a t egyenest tengelynek nevezzük. Ha egy a nitás rendelkezik tengellyel, tengelyes a nitásnak
nevezzük. Speciális tengelyes a nitás a t egyenesre vonatkozó tükrözés S síkjában. Tekintsük azt az a nitást, melynek
tengelye t, P → P′ és Q → Q′ két megfelelő pontpár (7.14. ábra). Az a nitás tulajdonságaiból adódik, hogy a PQ és a P′Q′
egyenesek L metszéspontja a tengelyen van. Ha PQ || t, akkor P′Q′ || t is teljesül. Az osztóviszonytartásból következik, hogy
(PQL) = (P′Q′L′), amiből PP′ || QQ′ adódik.
7.14. ábra
Legyen S = S′! Ekkor a fent leírt a nitásnál a PP′ egyenes által megadott irányt a tengelyes a nitás irányának
nevezzük. Bebizonyítható, hogy egy tengelyes a nitás egyértelműen megadható a tengellyel és egy megfelelő pontpárral
(t, P → P′). A 7.14. ábráról leolvasható tetszőleges további pont képének megszerkesztése. Ha PP′ || t, akkor elációról
beszélünk.
Tekintsük a hányadost! A párhuzamos szelők tételének egy következménye alapján belátható, hogy a PQ-
val egyállású egyenesek esetén q mindig ugyanaz, függetlenül a PQ szakasz megválasztásától. A PQ szakasz állásának
változásával azonban q is változik. A fenti módon a sík ugyanolyan állású egyeneseit a q értékkel jellemezhetjük. Ez az
adott álláshoz tartozó dilatáció. Az S = S′ esetben nyilván teljesül, hogy a hányados is független a P (P ∉ t, T = PP′
⋂ t) pont megválasztásától. Ezt a λ számot a tengelyes a nitás arányának (karakterisztikus osztóviszonynak) nevezzük.
Általános a n transzformációk
Az S → S′ a nitás az A, B, C nem egy egyenesen fekvő pontokhoz rendre az A′, B′, C′ nem egy egyenesen fekvő pontokat
(7.15. ábra) rendeli. Ezt az a nitást előállíthatjuk két a n transzformáció egymás utáni alkalmazásaként. Az első az S → S′
hasonlósági transzformáció, mely az A, B, C pontokhoz rendre az A1 = A′, B1 = B′, C1 pontokat rendeli. A másik leképezés az
S′ → S′ tengelyes a nitás, melynek tengelye A′B′ egyenese, és egy megfelelő pontpárja C1 → C′. Az is adódik, hogy az S → S′
a nitást egy megfelelő ABC, A′B′C′ háromszögpár egyértelműen meghatározza.
7.15. ábra
7.16. ábra
7.17. ábra
Ha az S sík nem vetítősík, akkor párhuzamos vetülete a K képsík (7.18. ábra). A párhuzamos vetítés S és K pontjai között
egy-egyértelmű leképezést létesít, mely egyenestartó és osztóviszonytartó, azaz a nitás. Ha S || K, akkor speciálisan
egybevágóság (eltolás) ez az a nitás. Ha S és K egymást metsző síkok, és m = S ⋂ K, akkor m tetszőleges pontjának képe
önmaga, az m egyenes pontonként xegyenes, vagyis tengely.
Két, egymással párhuzamos vetítőegyenes képe egy-egy pont. Ha a párhuzamos egyenesek nem vetítőegyenesek, de
síkjuk vetítősík, akkor az egyenesek vetületei egybeesnek. Amennyiben az e és f párhuzamos egyenesek nincsenek egy
vetítősíkban, akkor ea és fa vetületeik is párhuzamosak egymással (7.19. ábra). Ugyanis az egyenesek E és F vetítősíkjai
párhuzamos síkok és e síkok és a képsík metszésvonalai, azaz ea és fa is párhuzamosak egymással. Csupán a vetületek
párhuzamosságából azonban nem következik az ábrázolt egyenesek párhuzamossága. Például az e-t metsző g egyenesre ga
|| fa, de g és f kitérő egyenesek.
7.18. ábra
7.19. ábra
Szakasz párhuzamos vetülete lehet nagyobb, egyenlő vagy kisebb az eredeti szakasznál, a vetítés irányától függően. Ha
az AB szakasz K-val párhuzamos, vagy K-ra illeszkedik, akkor biztosan egyenlő vele a képszakasz (de nem csak ekkor).
Hasonlóan a szög vetülete is általában nem egyenlő a kiindulási szöggel. Ha mindkét szögszár K-ban van, vagy K-val
párhuzamos (7.20. ábra), akkor viszont teljesül a szögek egyenlősége (de nem csak ekkor).
7.20. ábra
7.21. ábra
Ha v ⊥ K, akkor merőleges vetítésről beszélünk. Ez a gyakran használt vetítési mód rendelkezik néhány speciális
tulajdonsággal. Szakasz merőleges vetülete kisebb egyenlő, mint a merőlegesen vetített szakasz. Ha egy derékszög egyik
szára párhuzamos a képsíkkal, vagy a képsíkban van (7.21. ábra), akkor a derékszög merőleges vetülete is derékszög
(feltéve, hogy egyik szár egyenese sem vetítőegyenes). A későbbiekben sokszor felhasználjuk ezt a megállapítást.
7.2. Ábrázolás két képsíkon
Térelemek ábrázolása
Helyzetgeometriai feladatok
Metrikus feladatok
Néhány alkalmazás
Térelemek ábrázolása
7.22. ábra
A P, P′, P″ pontok által meghatározott síknak az x12 képsíktengellyel való metszéspontja legyen a Px pont. Ekkor a P, P′,
P″, Px pontok egy vetítő téglalapot határoznak meg (7.23. ábra). A merőleges vetítés tulajdonságaiból következik, hogy a P
pont K1 képsíktól való távolságát („magasságát”) P″Pz = PP′ adja, míg a K2 képsíktól való távolsága P′Pz = PP″-vel egyenlő. A
képsíktengely által határolt fél képsíkokat előjellel látjuk el. Jelöljük a K1 képsík „hozzánk közelebbi” felét + jellel, a másikat
– jellel, továbbá a K2 képsík „felső” felét + jellel, az „alsót” – jellel, majd a két képsíkot egyesítsük, forgassuk egymásba az x12
képsíktengely körül úgy, hogy a és a , illetve a és a félsíkok fedésbe kerüljenek!
7.23. ábra
A két képsíkot egymásba forgatással egyesítettük, a kapott síkot a rajz síkjának tekinthetjük. A P′P″ szakasz egyenesét
rendezőegyenesnek, az r1 = P′Px szakaszt első rendezőnek, az r2 = P″Px szakaszt második rendezőnek nevezzük. Mivel a P, P′,
P″, Px pontok síkja merőleges mindkét síkra, így az x12 tengelyre is, ezért a rendezők is mindig merőlegesek az x12 tengelyre.
(Az első rendező a térbeli P pont K2 képsíktól való távolságát, a második rendező a P pont K1 képsíktól való távolságát adja.)
7.24. ábra
Ha két különböző térbeli pont első vetületei megegyeznek, azaz közös az első vetítőegyenesük, akkor azokat első
fedőpontoknak, ha a második képeik egyeznek meg, akkor második fedőpontoknak nevezzük. A 7.24. ábrán az U és V
pontok első fedőpontok, az R és S pontok pedig második fedőpontok.
Egyenes ábrázolása
A tér egy általános helyzetű e egyenesének e′ első vetülete az e egyenes első vetítősíkjának az első képsíkkal való metszete.
Az e egyenes e″ második vetülete az e egyenes második vetítősíkjának a második képsíkkal való metszete (7.25. ábra). A
merőleges vetítés tulajdonságaiból következik, hogy egy általános helyzetű e egyenes vetületei egyenesek. (Speciális
esetben lehet pont az egyik vetület.) Az egyenes vetületeiből az egyenes rekonstruálható. Ugyanis, ha az első képsíkra
illeszkedő tetszőleges e′ egyeneshez tartozó első vetítősíknak és a második képsíkra illeszkedő tetszőleges e″ egyeneshez
tartozó második vetítősíknak a metszete egyenes, akkor a metszet a térbeli e egyenes. Ha a két vetítősík egybeesik, akkor
nem egyértelmű a vetületekből történő rekonstrukció. Bármely ebben a közös vetítősíkban fekvő egyenes megfelel. Ha a
két vetítősík párhuzamos, akkor e′ és e″ nem lehetnek egy egyenes vetületei.
7.25. ábra
Az egyenest két pontja egyértelműen meghatározza. Legyen adott a g egyenes P és Q pontjaival (7.26. ábra). Először
ábrázoljuk a pontok vetületeit, majd a kapott vetületek alapján megrajzolhatjuk a g′ = P′R′ és a g″ = P″R″ egyeneseket, melyek
a g egyenes vetületei. Az általános helyzetű g egyenesnek az első képsíkkal való G1 metszéspontját (ha létezik) első
nyompontnak, míg a második képsíkkal való G2 metszéspontját (ha létezik) második nyompontnak nevezzük. A 7.26.
ábráról a nyompontok szerkesztése leolvasható.
7.26. ábra
Speciális egyenesek
Az első képsíkra merőleges v1 egyenest első vetítőegyenesnek, a második képsíkra merőleges v2 egyenest második
vetítőegyenesnek nevezzük. Ábrázoló geometriai szerkesztések során nagyon sokszor használjuk a képsíkokkal
párhuzamos úgynevezett fővonalakat (főegyeneseket). Az első képsíkkal párhuzamos f1 egyenest első fővonalnak, a
másodikkal párhuzamos f2 egyenest második fővonalnak nevezzük. Az x12 képsíktengelyre merőleges p egyenest, amely
nem vetítőegyenes, pro legyenesnek nevezzük.
A v1 első vetítőegyenes első képe pont, második vetülete az x12 képsíktengelyre merőleges egyenes (7.27. ábra). A v2
második vetítőegyenesnél fordított a helyzet. A p pro legyenes mindkét vetülete merőleges x12-re (és a vetületek
egybeesnek).
7.27. ábra
Az f1 első fővonal második, az f2 második fővonalnak pedig az első vetülete párhuzamos a képsíktengellyel (7.28. ábra).
7.28. ábra
Két nem egybeeső egyenes kölcsönös helyzete háromféle lehet, metsző, párhuzamos vagy kitérő. A merőleges vetítés
tulajdonságaiból következik, hogy az általános helyzetű metsző egyenesek mindkét vetülete metsző egyenespár, és a
képegyenesek metszéspontjai egy rendezőegyenesre esnek (7.29. ábra). Teljesül továbbá az is, hogy ha két egyenes mindkét
vetületén a metszéspontok egy rendezőn vannak (kivéve, ha az egyik vagy mindkettő pro legyenes), akkor az egyenesek a
térben is metszik egymást.
Általános helyzetű párhuzamos egyenesek mindkét vetülete párhuzamos egyenespár. Megfordítva, ha két egyenes
mindkét vetülete párhuzamos egyenespár (kivéve a pro legyenesek), akkor a térbeli egyenesek is párhuzamosak. A 7.30.
ábrán a c és a d egyenesek párhuzamosak.
Ha a nem egysíkú, azaz kitérő egyenesek mindkét vetületének van metszéspontja, akkor a metszéspontok nincsenek
egy rendezőn. Speciális helyzetben a kitérő egyenesek valamelyike lehet vetítőegyenes is. A 7.31. ábrán a p és a q egyenesek
kitérő helyzetűek. A fedőpontok vizsgálatával a vetületekből is meg tudjuk állapítani a két kitérő egyenes egymáshoz
viszonyított térbeli elhelyezkedését, és azt a vetületeken szemléltetni is tudjuk. A 7.31. ábrán a P ∈ p és a Q ∈ q első
fedőpontok megkeresésével szemléltetni tudjuk a felülnézeten a két egyenes láthatósági viszonyát.
7.29. ábra
7.30. ábra
7.31. ábra
Sík ábrázolása
Egy sík ábrázolásánál a síkot meghatározó alakzatokat ábrázoljuk. Így két metsző egyenessel, egy párhuzamos
egyenespárral, egy egyenessel és egy rá nem illeszkedő ponttal, három, nem egy egyenesre illeszkedő ponttal
(háromszöggel) (7.32. ábra) adhatjuk meg a síkot.
7.32. ábra
Speciális síkok
A képsíkrendszerhez képest speciálisan elhelyezkedő síkok közé tartoznak a már említett vetítősíkok. Ha egy sík az első
képsíkra merőleges, akkor első, ha a másodikra, akkor második vetítősík. A 7.33. és a 7.34. ábrán metsző és párhuzamos
egyenesekkel megadott első vetítősíkok láthatók. Az egyenesek első vetületei egybeesnek, ezért első fedőegyeneseknek
nevezzük őket. Hasonlóan lehet értelmezni második fedőegyeneseket is.
7.33. ábra
7.34. ábra
7.35. ábra
7.36. ábra
7.37. ábra
Helyzetgeometriai feladatok
7.38. ábra
7.39. ábra
Metsző térelemek
Metsző egyenesek ábrázolásával már foglalkoztunk. A következőkben egyenes és sík, valamint két sík metszetének
szerkesztését tárgyaljuk.
Sík és egyenes közös pontjának, döféspontjának (metszéspontjának) szerkesztése egyszerű, ha vagy a sík, vagy az
egyenes speciális helyzetű.
Legyen a V sík első vetítősík. A sík első vetülete, a V′ egyenes tartalmazza a sík minden pontjának első képét (7.40.
ábra). Így az e egyenes e′ első képének és V′-nek közös pontja a D = V ⋂ e metszéspont első képe. A döféspont második képét
rendezőegyenessel jelöljük ki az e″ képegyenesen.
Ha az e egyenes vetítőegyenes, akkor a szerkesztés a következő. A 7.41. ábrán a síkot az ABC háromszöggel adtuk meg,
az e egyenes pedig második vetítőegyenes. Ennek második képe az e″ pont. Ez egyben minden pontjának második képe,
tehát a döfésponté (D″) is. A D pontot az s segédegyenessel illesztettük az ABC síkra.
Az általános helyzetű S sík e egyenessel való D döféspontjának szerkesztésénél úgy járunk el, hogy az e egyenesre
illesztünk egy tetszőleges U segédsíkot (7.42. ábra). Megszerkesztjük S és U metszésvonalát, az m egyenest (m = S ⋂ U). Az e
és az m egyenesek metszéspontja eleme az S síknak is és az e egyenesnek is, tehát D = m ⋂ e.
Példa. A szerkesztés konkrét kivitelezésénél az egyszerűség kedvéért az U segédsíkot speciálisan vesszük fel,
általában vetítősíkot célszerű választani. A 7.43. ábrán az S síkot az ABC háromszöglemezzel adtuk meg. Az e
egyenesre az U első vetítősíkot illesztettük, ennek U′ első képe azonos e′-vel. Az m = S ⋂ U egyenes első vetülete
egybeesik az U′ első képpel (m eleme U-nak). Ugyanakkor m benne van az S = ABC síkban is, ezért második képe
megszerkeszthető. Az m″ és e″ képegyenesek közös pontja D″, a sík és egyenes döféspontjának második képe. Ebből a
D′ első képpontrendezéssel adódik. A lemezt átlátszatlannak tekintve szemléltethetjük a síklemez és egyenes térbeli
helyzetét (az elöl- és a felülnézetet is láthatóság szerint kihúztuk). A láthatósági viszonyokat fedőpontok segítségével
állapítottuk meg.
7.40. ábra
7.41. ábra
7.42. ábra
7.43. ábra
Ha ismerjük két sík két közös pontját, akkor ismerjük metszésvonalukat is, ugyanis a két pontot összekötő egyenes a
metszésvonal. Ezért arra törekszünk, hogy megszerkesszük a két sík két közös pontját. Ezt elérhetjük úgy is, hogy
előállítjuk az egyik sík tetszőleges két egyenesének a másikkal alkotott döféspontjait. Egyszerű a metszésvonal
szerkesztése, ha a két egymást metsző sík valamelyike vetítősík. Ekkor a vetítősík egyik képe azonos az m metszésvonal
ugyanazon képével. A másik kép síkra illesztéssel szerkeszthető.
Példa. A 7.44. ábrán a síkokat az A, B és C nem egy egyenesre eső pontokkal, illetve a g és h párhuzamos egyenesekkel
adtuk meg. A két sík metszésvonalát megkapjuk, ha megszerkesztjük az előző feladat alapján a g és h egyeneseknek
az ABC síkkal alkotott G és H döféspontjait.
7.44. ábra
7.45. ábra
Két síkidom metszete a két sík metszésvonalának az a része, melyet mindkét síkidom tartalmaz.
Példa. A 7.45. ábrán az ABC háromszöglemez és az XYZU paralelogrammalemez közös részét, metszetét
szerkesztettük meg. Meghatározása céljából először az XY paralelogrammaoldal egyenesének ABC síkkal való M
döféspontját szerkesztettük meg, majd az UZ oldalegyenes ABC síkkal alkotott N döféspontját (a síkkal, nem a
háromszöglemezzel!). Az MN metszésvonal mindkét síkidomhoz tartozó szakasza a két lemez metszete. A
láthatóságot úgy tüntettük fel, hogy mindkét lemezt átlátszatlannak tekintettük.
7.46. ábra
A 7.47. ábrán egy alakzat három vetülete, elölnézete, felülnézete és balnézete látható.
7.47. ábra
A műszaki ábrázolásban további képsíkokat is bevezetnek. Az alakzat „bal oldalára”, a K1 és a K2 képsíkokra merőleges,
K3-mal párhuzamos K4 negyedik képsíkot a jobbnézet számára. A K1, K2, K3 és K4 képsíkok úgy helyezkednek el, mintha egy
kocka lapjainak síkjai lennének. Ezért szemléletesen az ábrázolni kívánt alakzat, műszaki alkatrész köré egy kockát
képzeljünk el, és ennek lapjaira vetítjük az alakzatot merőlegesen (7.48. ábra). Majd a kocka lapjait (képsíkokat) a kocka élei
(képsíktengelyek) körül egymásba, legvégén az elölnézet síkjába forgatjuk a 7.48. ábrának megfelelően.
7.48. ábra
Már az eddigiekben is találkoztunk olyan szerkesztésekkel (pl. 7.45. ábra), melyeknek megoldása során a
képsíktengelynek semmilyen szerepe nem volt. Ha a képsíktengelyt „lejjebb” vagy „feljebb” vesszük fel, annak
következménye csupán annyi, hogy a képsíkrendszer az ábrázolt alakzathoz képest eltolódik. Mivel számos feladat
szempontjából az alakzatoknak a képsíkrendszerhez viszonyított helyzete egy eltolás erejéig közömbös, ezért bizonyos
esetekben a képsíktengely megrajzolását mellőzhetjük. A továbbiakban, ha nem szükséges, a képsíktengelyeket nem
rajzoljuk meg. Az egyes vetületek között levő képsíktengelyeket a műszaki ábrázolásban nem rajzolják meg.
Az alakzatot használatának megfelelően helyezzük el. Törekedjünk továbbá arra is, hogy az alakzatról az elöl-, felül- és
valamely oldalnézete (lehetőleg a balnézete) a legtöbbet mutasson meg az alakzatból. Ha szükséges, akkor további
nézeteket is alkalmazunk.
Képsík-transzformáció általában
A képsík-transzformáció lényege az, hogy a képsíkrendszer (K1 és K2) valamelyik képsíkjához egy újabb, célszerűen
választott (K5) képsíkot veszünk fel, amely az egyik képsíkra merőleges, de nem feltétlenül merőleges mindkettőre. A 7.49.
ábrán a K1-re merőleges K5 képsíkot vettünk fel, metszetük az x15 képsíktengely. A P pont K5-re való merőleges vetülete a PV
pont. (Több vessző helyett római számokat használunk „felső” indexben.) A K2 képsíkot a szokásos módon, a K5 képsíkot
pedig az x15 képsíktengely körül forgassuk be a K1 képsíkba az ábrának megfelelően! A P″ ponthoz tartozó r2 és a PV ponthoz
tartozó r5 rendező is a P pont K1 képsíktól való távolságával egyenlő, ezért a képsíkok egyesítése után is igaz, hogy r2 = r5.
7.49. ábra
Példa. A 7.50. ábrán a már bemutatott alakzatról készítsünk egy ferde, első képsíkkal párhuzamos nyíl irányú
nézetet! Az alakzat csúcspontjait a 7.49. ábra szerint szerkesztettük meg.
7.50. ábra
A képsík-transzformációt nem csupán az első képsíkra merőlegesen felvett új képsík segítségével alkalmazhatjuk,
hanem a második képsíkra merőlegesen is vehetünk fel új képsíkot. A következőkben erre látunk egy példát.
Példa. Néhány alkatrész esetén az egyes részletek jobb bemutatása, méretezhetősége miatt is szükséges úgynevezett
ferde vetületet, segédnézetet készíteni. A 7.51. ábrán látható alakzatról készítettünk egy olyan új nézetet, melyen a
„ferde rész” is valódi nagyságban látszódik. A szerkesztés az ábráról leolvasható. (Az AV pont szerkesztését
részleteztük, r1 = r5.)
7.51. ábra
Metrikus feladatok
Az alábbiakban három módszert ismertetünk, melyek alkalmazásával poliéderek metrikus adatait szerkeszthetjük meg.
Példa. Szerkesszük meg egy ABC alapú, M csúcsú gúla BCM oldallapjának, illetve BM oldalélének az alaplappal
bezárt szögét!
A 7.52. ábrán mindkét szöget egy-egy alkalmas transzformációval határoztuk meg. Az alaplap és a BCM oldallap
közös egyenesének irányával, azaz a BC alapéllel párhuzamosan transzformáljuk a gúlát. (A vetítés irányát az első
képsíkkal párhuzamos 1-es jelű nyíl mutatja.) Az ötödik képen a BC él vetülete egy pont, a keresett két sík szöge α =
AVBVMV. A BM oldalél alaplappal bezárt szögének meghatározásához a BM él vetítősíkjára merőleges irányban
transzformáltunk (a 2-es nyíl B′M′-re merőleges és az első képsíkkal párhuzamos). Az így kapott hatodik vetületen a
keresett szög β=AVIBVIMVI. A képsíktengelyeket nem jelöltük, azok egybeesnek (egybeeshetnek) a gúla alapjának
második, ötödik és hatodik vetületével.
7.52. ábra
Példa. A 7.53a–b ábrán az ABC alaplapú, M csúcspontú, első képsíkon álló gúla BCM lapjának valódi alakját
szerkesztettük meg. A BC él az első képsíkban van, ezért a BCM oldallapot a BC szakasz egyenese, a forgatás tengelye
körül az első képsíkba tudjuk forgatni. Az így leforgatott képen az oldallap valódi adatait olvashatjuk le. A képsíkba
forgatott pontokat és egyeneseket zárójellel jelöljük.
A forgatás során minden pont egy körív mentén mozog, melynek síkja a forgatás tengelyére merőleges. A 7.53a ábrán
az M ponthoz tartozó körívet rajzoltuk le. Legyen az MY szakasz a BCM lap magassága, azaz MY ⊥ BC, ekkor az (M)
(Y) szakasz a (B)(C)(M) leforgatott lap magassága, azaz (M)(Y) ⊥ BC. Teljesül továbbá, hogy MY = (M)(Y), ez az M
ponthoz tartozó körív sugara.
A fentiek alapján szerkesztettük meg a BCM oldallap leforgatott képét a 7.53b ábrán. A felülnézeten az M′ pontból a
B′C′ egyenesre merőleges egyenest állítva kapjuk az Y′ pontot. A BCM lap második vetítősík, ezért a lap magassága a
második képen valódi méretében látszódik. Így az Y′M″ szakaszt az Y″ ponttól fölmérve az M′Y′ egyenesre kapjuk (M)
-et. A BCM lapra illeszkedő, általános helyzetű X pontot egy rajta áthaladó egyenes segítségével forgattuk le az ábra
alapján. Megjegyezzük, hogy a B′C′M′ oldallap és a (B)(C)(M) leforgatottja között egy merőleges a nitás van,
melynek tengelye a B′C′ egyenes és megfelelő pontpárja M′ és (M).
7.53. ábra
Különbségi háromszög
A metrikus feladatok megoldásának alapvető eleme két pont távolságának, azaz egy szakasz hosszának meghatározása. Két
pont távolságának meghatározásánál gyakran alkalmazzák a különbségi háromszög módszerét.
Példa. A 7.54. ábrán e módszerrel szerkesztettük meg a PQ szakasz valódi hosszát. Ha a P′Q′ vetületet eltoljuk a Q
pontba, akkor térben a PQX derékszögű háromszöget kapjuk, ahol a QX = P′Q′ és a PX=P″X″ = PP′ – QQ′, azaz az egyik
befogó hossza a PQ szakasz felülnézetének hossza, a másik befogó a P és a Q pontok második rendezőinek
különbsége. A PQX derékszögű háromszöget különbségi háromszögnek nevezzük. A 7.54. ábrán a különbségi
háromszöget kétféleképpen is megszerkesztettük.
7.54. ábra
Példa. A 7.55. ábrán egy ABCD négyszög alapú M csúcspontú gúla palástjának síkba fejtését szerkesztjük meg. A gúla
oldaléleinek hosszát különbségi háromszögek segítségével adjuk meg. Az alapélek az első képsíkra illeszkednek,
ezért felülnézetük hossza a valódi hosszukkal egyenlő. A gúla palástját az AM oldalél mentén vágjuk fel, és az
oldallapokat az ábrának megfelelően egymáshoz illesztve a gúla palástjának síkba fejtett képéhez, az AkBkCkDkAkMk
hatszöghöz jutunk. A hajtáséleket kétpontvonallal jelöljük. Az ABM lapra illeszkedő X pont kiterített képen való
megszerkesztéséhez az X pontra illeszkedő két szakaszra van szükségünk. Az egyik az M ponton átmenő, a másik az
AB alapéllel párhuzamos szakasz. Az ábrán jelölt Yk pont szerkesztésénél vegyük gyelembe, hogy A′Y′ = AkYk. Az X
pontra illeszkedő AB-vel párhuzamos egyenes és az AM alkotó metszete legyen a Z pont. Az MZ szakasz valódi
hosszának megszerkesztéséhez tartozó különbségi háromszöget megkapjuk, ha a Z″ pontot az ábrának megfelelően
(a Z″X″ szakasz meghosszabbításával) átvetítjük az AM jelű élre. Az Xk pont az MkYk szakasz és a Zk ponton áthaladó,
az AkBk-val párhuzamos szakasz metszeteként adódik.
7.55. ábra
Néhány alkalmazás
Poliéderek síkmetszete
Poliéderek áthatása
Poliéderek síkmetszete
A síkmetszet egy vagy több töröttvonalból (metszetsokszög(ek)) áll. Megszerkesztésükre általában az alábbi két módszert
alkalmazzuk.
Lapmódszer. Ebben az esetben a síkmetszet éleit szerkesztjük meg. A síkmetszet élei ugyanis a poliéderfelület lapjainak
metszetei a metszősíkkal. A szerkesztést két sík metszésvonalának megszerkesztésére vezetjük vissza.
Élmódszer. Ilyenkor a síkmetszet csúcsait szerkesztjük meg. A síkmetszet csúcsai a poliéder éleinek a metszősíkkal
való döféspontjai. Azokat a döféspontokat köthetjük össze, melyek a poliéderfelület ugyanazon lapján vannak. Így nyerjük
a síkmetszet éleit. Itt a szerkesztést sík és egyenes döféspontjának szerkesztésére vezetjük vissza.
Ha metszősík első vagy második vetítősík, akkor a fenti metszéspontok szerkesztése egyszerű.
Példa. A 7.56. ábrán az négyoldalú ferde hasáb metszetét szerkesztettük meg a V második vetítősíkkal
az élmódszer alkalmazásával. A szerkesztést az ábrán nyomon követhetjük.
7.56. ábra
A síkba fejtést is elvégezzük, a kiterítésen megjelöljük a síkmetszetet is. Az oldalparalelogrammák valódi alakját a
korábban ismertetett módon szerkesztjük. (Például az lap esetén az háromszög valódi alakját
szerkesztjük, majd paralelogrammává egészítjük ki.) Az alap és a fedőlap kiterítése könnyen elvégezhető, mert a
négyszögek valódi alakja a felvétel miatt az első vetületről leolvasható. A metszet csúcsait segédábra felhasználásával
adtuk meg a kiterítésen.
A hasáb oldalélekre merőleges síkkal való metszete a normálmetszet. Az 7.56. ábrán az S síkkal való metszet
normálmetszet. Az S síkot most könnyen felvehettük, hiszen az ábrán a hasáb oldalélei a második képsíkkal
párhuzamosak, így S második vetítősík, azaz S″ egyenes. A normálmetszet a síkba fejtésen szakasz, mely a hasáb
oldaléleire merőleges. A 7.56. ábrán megadtuk a normálmetszet valódi alakját is képsík-transzformáció
alkalmazásával.
Ha a metszősík általános helyzetű, akkor az általános helyzetű síkot célszerű vetítősíkká transzformálni. Az új
képsíkot a metszősík valamelyik fővonalára merőlegesen vesszük fel. Ezután a fentiek szerint járunk el. Ha egy poliédert
véges síklemezzel metszünk el, akkor itt is célszerű a lemez síkjával való metszetét megszerkeszteni, és csak ezután
gyelembe venni a metszetlemez által tartalmazott részét.
7.57. ábra
Példa. Szerkesszük meg az ABCDEFM szabályos hatoldalú gúlának az 1234 paralelogrammalemezzel való metszetét!
A 7.57. ábrán képsík-transzformációt alkalmazunk, a negyedik képsík a paralelogramma síkjának f1 első fővonalára
merőleges. A paralelogramma 2 és 3 jelű csúcsait transzformáltuk, így szerkesztettük meg az U = 1234 sík negyedik
képét. Az U síkkal való metszet az előbbi résznél leírt módon szerkeszthető. Ez a GHJKLPQ sokszög, melynek oldalait
vékony vonallal jelöltük az ábrán. Ezután vettük a paralelogrammalemez és a GHJKLPQ sokszög metszetét. Ez lesz a
gúlafelület metszete az 1234 lemezzel. Az ábra láthatóság szerinti kihúzásánál a gúlát és a lemezt átlátszatlannak
tekintettük.
Poliéderek áthatása
Két poliéder közös része síkidomok metszésvonalaiból, tehát szakaszokból áll, amely rendszerint térbeli töröttvonal
(esetleg több különálló részből álló töröttvonal rendszeréből áll). Neve áthatási töröttvonal, melyet a következőképpen
szerkeszthetünk meg.
Lapmódszer. Az áthatási töröttvonal éleit szerkesztjük, melyek egy-egy poliéderlap metszeteként keletkeznek. A
szerkesztést két síklemez metszetének szerkesztésére vezethetjük vissza.
Élmódszer. Az áthatási töröttvonal(ak) csúcspontjait adjuk meg oly módon, hogy az egyik poliéder éleinek a másik
poliéder lapjaival való közös pontjait szerkesztjük, majd fordítva. Az áthatási töröttvonal éleit ezen csúcsok megfelelő
öszszekötésével nyerjük. Két csúcsot akkor kötünk össze, ha azok az egyik és a másik poliédernek is ugyanazon lapján
vannak.
Az alábbiakban tárgyalt két példában az élmódszert alkalmazzuk.
Példa. A 7.58. ábrán az első képsíkon álló ABCM háromoldalú gúla és egy háromoldalú hasáb áthatását szerkesztettük
meg, az hasáb e, f, g oldalélei a második képsíkra merőlegesek, az oldallapok második vetítősíkokban
vannak.
Az élmódszerrel járunk el. Az áthatási töröttvonal (poligon) második vetülete rajta van az EFG háromszög második
képén. A gúla élei közül csak az MC él metsz bele a hasábba, mégpedig az 1 és 2 pontokban. Az 1 és 2 pontok második
képei közvetlenül adódnak, az első képeket rendezéssel nyerjük. A hasáb oldalélei közül csak az e jelű metszi a gúlát.
Ez a második vetületről közvetlenül leolvasható. A 3 és 4 döféspontok szerkesztésénél a hasáb e élére az első képsíkkal
párhuzamos V segédsíkot illesztünk. Ennek a gúlafelülettel való metszetét szerkesztjük. A metszet első képének az e′
éllel való metszéspontjai adják a 3 és a 4 pont első vetületét. Megszerkesztettük tehát az áthatási töröttvonal csúcsait.
A 2 és a 3 pontok a gúla ACM lapján, a hasáb eg lapján vannak, így összeköthetők. Hasonlóan az 1 és a 3 pontok
egyrészt a gúla AMC lapján, másrészt a hasáb ef lapján vannak, tehát az áthatási töröttvonal élét határozzák meg.
Könnyen adódik, hogy az áthatási töröttvonal az 1, 3, 2, 4 csúcsokkal rendelkező négyszög lesz.
A láthatóságot úgy tüntettük fel, mintha a hasábot eltávolítottuk, „kitoltuk” volna.
Példa. A 7.59. ábrán az és az háromszög alapú hasábok áthatását szerkesztettük meg.
Az áthatási töröttvonal első vetülete könnyen megadható, hiszen az első vetítő helyzetű hasáb oldallapjai első
vetítősíkokban vannak. A felülnézetről közvetlenül leolvasható, hogy csak az élek metszenek bele a vetítő
helyzetű, a K1-en „álló” hasábba, a metszéspontok 1, 3, 2, 4. Az is leolvasható az első vetületről, hogy az „álló”
hasábnak csak a éle metsz bele a másik hasábba. Ennek 5 és 6 döféspontjait szerkesztjük meg a élre
illesztett első vetítősík alkalmazásával. Ez az hasábból az 1, 2, N csúcsokkal rendelkező
háromszöget metszi ki. Ahol a háromszög második képét B″ metszi, ott van 5″ és 6″. Végül az azonos lapon levő
pontokat összekötve megadjuk az áthatási töröttvonalat. A láthatóságot is feltüntettük, mégpedig oly módon,
mintha a két felületet egyesítettük volna.
7.58. ábra
7.59. ábra
7.60. ábra
A metrikus feladatok és metszési feladatok megoldásánál kedvező volt, ha az alakzatok a képsíkokhoz képest
speciálisan helyezkedtek el. Ennek érdekében sokszor képsík-transzformációt alkalmaztunk.
Képsík-transzformációt alkalmazhatunk azonban a képsíkokhoz képest speciálisan elhelyezkedő alakzatokra annak
érdekében is, hogy szemléletesebb képet szerkesszünk róluk. Ilyenkor esetleg többször is transzformáljuk az alakzatot. A
7.60. ábrán a K6 képsík a K5 képsíkra merőleges.
Szemléltető ábrák szerkesztésére szolgál a következő ábrázolási módszer is.
7.61. ábra
7.62. ábra
Példa. Az 7.63a–b ábrán egy alakzat két vetületét adtuk meg, és az ábra szerint vettük fel a derékszögű koordináta-
rendszert. Az alakzat csúcspontjainak derékszögű koordinátáit megadtuk. Például a P pont esetén: (2, 1, 2). Ezután az
axonometrikus kép az adott tengelykereszt ismeretében a már az előzőekben leírt módon szerkeszthető.
Felhasználtuk a párhuzamos vetítés azon tulajdonságát is, hogy nem egy vetítősíkban fekvő párhuzamos egyenesek
vetületei párhuzamos egyenesek.
A műszaki ábrázolásban az alakzat egyértelmű rekonstrukciójához megfelelő számú nézetet adnak meg. Az 7.64. ábrán
egy tárgy három fő nézetét és a képsíkrendszerhez rögzített axonometrikus koordináta-rendszert adtuk meg. Itt is először
az xy síkban levő vetületet szerkesztjük meg. A pontok z koordinátáit az elöl-, illetve oldalnézetek segítségével olvashatjuk
le. Ebben az esetben a tengelyirányú rövidüléseket adtuk meg.
7.63. ábra
7.64. ábra
(Pohlke tétele) Ha nem egy egyenesre illeszkedő síkbeli pontok, akkor van olyan térbeli derékszögű (O;
Ex, Ey, Ez) tengelykereszt, melynek párhuzamos vetülete az adott síkbeli ( ) tengelykereszt.
A tétel a térbeli tengelykereszt létezését biztosítja, az egységet azonban nem választhatjuk meg tetszőlegesen. Ez azt
jelenti, hogy az ábrázolt alakzat legfeljebb hasonló az eredetihez.
A tengelyirányú rövidülések azonban nem lehetnek tetszőlegesek.
A tengelyirányú rövidülések négyzetösszege nem kisebb kettőnél, azaz . Egyenlőség csak ortogonális
axonometria esetén lép fel.
Pohlke tétele alapján elvileg tetszőlegesen választhatjuk meg a tengelykereszt vetületét. A gyakorlatban azonban
törekszünk arra, hogy vizuálisan megfelelő legyen a szerkesztett kép. Az 7.65. ábrán szereplő alakzat valóban kocka
benyomását kelti. Itt említjük meg, hogy az axonometrikus vetület esetén is feltüntetjük a láthatóságot. Az ábrán
úgynevezett felülnézeti, illetve alulnézeti képeket adunk meg.
7.65. ábra
Speciális axonometriák
Az axonometrikus képek szerkesztése egyszerűbbé válik, ha a tengelykereszt vetületét speciálisan választjuk meg. Az
axonometriákat osztályozhatjuk a tengelyirányú rövidülések szerint is. Ha qz = qz = qz, akkor az axonometria izometrikus.
Ha csak két tengelyirányú rövidülés egyenlő, dimetrikus axonometriáról beszélünk. A trimetrikus axonometriában a
tengelyirányú rövidülések különbözők.
Az izometrikus axonometria két különleges esete látható a 7.66. ábrán.
7.66. ábra
A dimetrikus axonometriák két esetét mutatja a 7.67. ábra. Az elsőt, a frontális axonometriát gyakran használjuk. Az yz
síkban vagy azzal párhuzamos síkban fekvő alakzat vetülete az eredetivel egybevágó.
7.67. ábra
Ha az axonometrikus képsíkra merőlegesen vetítünk, merőleges axonometriát kapunk. Pohlke tétele nem garantálja,
hogy egy megfelelő síkbeli tengelykereszthez létezik olyan térbeli tengelykereszt, hogy azt merőleges vetítés viszi a
megadottba. Merőleges vetítés esetén nem adhatjuk meg minden további nélkül a tengelykereszt vetületét.
7.68. ábra
Legyen az (O; Ex, Ey, Ez) tengelykereszt az axonometrikus képsíkhoz képest általános helyzetű. Ebben az esetben a
koordináta-rendszer tengelyegyenesei metszik a K képsíkot, rendre az X, Y, Z pontokban. Az XYZ háromszöget
nyomháromszögnek (7.68. ábra) nevezzük. Nyomháromszög nyilván ferde axonometria esetén is létezik, ha a
tengelyegyenesek metszik a képsíkot. A nyomháromszög és a tengelykereszt vetületének megadására vonatkozik a
következő két tétel.
A nyomháromszög hegyesszögű.
leforgatottja, rajta van egyrészt az XY fölé írt Thalész-körön , másrészt az O-ból XY-ra húzott
merőlegesen. Az (x) és (y) félegyenesekre (O)-ból kiindulva felmérhető az e egységszakasz. Az axonometrikus kép és a
leforgatott között XY tengelyű merőleges a nitás áll fenn, ahol O és (O) megfelelő pontok. Ez alapján ex=OEx és ey= OEy
szerkeszthető. Az YZ körüli képsíkba forgatással hasonlóan meghatározható ez= OEz.
7.69. ábra
Megszerkesztettük tehát a tengelykereszt merőleges vetületét az XYZ nyomháromszög és az e egységszakasz
ismeretében. Ezután már az általános esetben leírt módon szerkeszthetjük bármely alakzat axonometrikus képét.
Kör, ellipszis
Közönséges csavarvonal
Kör, ellipszis
A kört középpontja, sugara és síkja egyértelműen meghatározza. Ezeket az adatokat vagy külön megadjuk, vagy egy
megfelelő vetületi ábráról leolvashatjuk. Bizonyítható, hogy ha a kör nincs vetítősíkban, akkor a kör párhuzamos vetülete
ellipszis. A kör vetületeinek ábrázolása nem okoz problémát, ha a kör síkja valamely képsíkkal párhuzamos. Ekkor az r
sugarú kör egyik vetülete egy r sugarú kör, a másik pedig egy 2r hosszúságú szakasz.
7.70. ábra
Ha viszont a kör síkja egyik képsíkkal sem párhuzamos, akkor legalább az egyik vetülete ellipszis. A 7.70. ábrán egy r
sugarú K középpontú k kört ábrázoltunk. A kör síkja második vetítősík, mely nem párhuzamos az első képsíkkal. A K
középpontra illeszkedő v2 második vetítőegyenes körül forgassuk a k kört a K1 képsíkkal párhuzamos helyzetbe. Ekkor a (k)
kört kapjuk, melynek felülnézete kör. E körön felveszünk egy tetszőleges (P) pontot. Visszaforgatva a v2 egyenes körül
olyan P pontot kapunk, amelynek P′ vetülete a k′ vetületen (amely ellipszis) van. További pontok szerkesztésével k′ újabb
pontjaihoz jutunk. Mivel a (k)′ kör és a k′ ellipszis pontjai között egy v′2 tengelyű merőleges a nitás áll fenn, ezért az
ellipszis további pontjait az a nitás segítségével is szerkeszthetjük. Ezt a következő részben ismertetjük.
Legyen az ellipszis nagytengelye AB = 2a, kistengelye CD = 2b, középpontja 0 (7.71. ábra). Megadunk egy kört és egy
speciális a nitást, melynél a kör a n képe éppen az adott ellipszis. Ily módon a megfelelő szerkesztéseket elég lesz a körre
elvégezni, majd ennek a n képére áttérni. A k1 kör középpontja O és sugara a. Az a nitás legyen egy AB tengelyű
merőleges a nitás, melynek aránya Bizonyitható, hogy a k1 kör képe a tengelyeivel adott ellipszis. Az ellipszis P
pontbeli érintőjének szerkesztése az ábráról leolvasható. Az is bizonyítható, hogy általános a nitás esetén is kör a n képe
ellipszis.
7.71. ábra
Tekintsük a 7.72. ábrán szereplő kört és körülírt négyzetét. A négyzet képe általános a nitásnál paralelogramma, a
beírt köré pedig ellipszis. A kör merőleges átmérőinek képeit a képellipszis egymáshoz konjugált átmérőinek nevezzük.
Az a nitás osztóviszonytartó leképzés, ezért a konjugált átmérőpárjával adott ellipszis pontjainak szerkesztésére a
következő egyszerű és praktikus, a műszaki ábrázolásban is használatos szerkesztés adódik. Az ellipszis OQ és OP konjugált
félátmérőit ismerjük. Megrajzolhatjuk az ellipszis körülírt érintő paralelogrammáját. Ennek egyik csúcsa U. Osszuk fel az
OP és az UP szakaszokat ugyanannyi egyenlő részre. A 7.73. ábrán 3-3 egyenlő részre osztottuk fel a szóban forgó
szakaszokat. A megfelelő osztópontokat O-ból és U-ból kiindulva megszámozzuk. Kössük össze a S pontot az OP-n lévő i-
edik (i = 1, 2, 3), Q-t pedig az UP-n fekvő i-edik osztóponttal! A két egyenes metszéspontja ellipszispont.
7.72. ábra
7.73. ábra
A fenti szerkesztés a kör axonometrikus ábrázolásánál nyújt segítséget. A legegyszerűbb esetekben a kör síkja az
axonometrikus koordináta-rendszer valamelyik koordinátasíkja. Legyen az r sugarú k kör O középpontja az
axonometrikus koordináta-rendszer kezdőpontja (7.74. ábra), síkja az xy koordinátasík. A kört az x koordinátatengely a T
és a P, az y tengely az S és a Q pontokban metszi. E pontok axonometrikus képeit könnyen szerkeszthetjük, például a
tengelyirányú rövidülések ismeretében. A TP és SQ merőleges körátmérők párhuzamos vetületei (a n képei) a képellipszis
egymáshoz konjugált átmérői. A konjugált átmérők végpontjain át a tengelyekkel húzott párhuzamosokkal megadhatjuk a
k kör egy körülírt négyzetét. Ennek axonometrikus képe az ellipszis egy körülírt paralelogrammája. Ezek ismeretében az
ellipszis pontjai szerkeszthetők.
7.74. ábra
7.75. ábra
7.76. ábra
Ha az m kör síkja az xy síkkal párhuzamos (7.75. ábra), akkor a K középpontján keresztül a tengelyek vetületeivel
párhuzamost húzunk, és ugyanúgy szerkeszthetjük a képellipszis pontjait, mint a fent leírt egyszerű helyzetben. Ha a kör
síkja másik koordinátasíkban van (7.76. ábra), vagy azzal párhuzamos, az axonometrikus kép szerkesztése hasonlóan
történik.
Ha az axonometria olyan, hogy két tengely vetülete merőleges egymásra, és e tengelyekre a rövidülés 1, akkor a két
koordinátatengely síkjában fekvő vagy azzal párhuzamos síkban elhelyezkedő kör képe ugyanolyan sugarú kör. Ez az eset
fordul elő például frontális axonometria (ya ⊥ za, qy = qx = 1) és a katonaperspektíva (xa ⊥ ya, qx = qy = qz = 1) esetén. Ezek
könnyen megrajzolhatók, ezért a műszaki ábrázolásban gyakran használják az előzőekben említett axonometriákat.
Közönséges csavarvonal
A t egyenes körüli elforgatás és a t-vel párhuzamos eltolás egyidejű alkalmazását csavarmozgásnak nevezzük. Ha egy P pont
úgy mozog a térben, hogy a t egyenessel párhuzamos eltolódása a t tengely körüli elfordulás szögével egyenesen arányos, és
mindig ugyanolyan irányú, a pont pályája hengerre írt csavarvonal vagy közönséges csavarvonal. Ha s a tengelyirányú
eltolódás, és φ az elfordulás szöge (radiánban adjuk meg), akkor s = pφ, ahol p állandó (7.77. ábra). A p állandó a
csavarvonal paramétere, t pedig a tengelye. A P pont minden helyzetében t-től ugyanolyan r távolságra van, ez a távolság a
csavarvonal sugara. A φ = 2π szögelforduláshoz tartozó h eltolódás a menetmagasság. Ha a tengely helyén álló szemlélő
számára a jobbról balra történő forgás esetén emelkedik a pont, akkor a csavarvonal jobbmenetű. Ellenkező esetben
balmenetű. Bizonyítható, hogy a közönséges csavarvonal önmagában elmozgatható úgy, hogy tetszőlegesen kiválasztott
két pontja fedésbe kerül, úgynevezett önmagában eltolható görbe (a térgörbék közül az egyetlen).
7.77. ábra
A következőkben egy közönséges csavarvonal két vetületét ábrázoljuk. Legyen egy r sugarú, h menetemelkedésű,
jobbmenetű g csavarvonal t tengelye első vetítőegyenes. A csavarvonal felülnézete egy t′ középpontú, r sugarú kör, mivel
minden pontja t-től r távolságra van. E kört osztjuk fel 12 egyenlő részre (7.78a ábra). A felülnézeten az osztáspontokat 0-tól
11-ig jelöltük jobbmenetnek megfelelően (a 0. és a 12. osztópont megegyezik), az óramutató járásával ellentétesen. Mivel az
alapkört 12 egyenlő részre osztottuk, a h menetemelkedést is 12 egyenlő részre osztjuk. Az elölnézeten minden egyes
osztóponthoz a h magasság 12-ed részét annyiszor mérjük fel, ahányadik osztópontnál tartunk. Az így kapott pontok a
keresett csavarvonal pontjainak elölnézetei lesznek. Ezen pontokat összekötve a keresett g csavarvonal elölnézetének egy
menetét ábrázoltuk (közelítőleg).
Hasonlóan, a görbepontok axonometrikus vetületeit megszerkesztve, majd megfelelően összekötve jutunk a görbe,
természetesen közelítő axonometrikus képéhez (7.78b ábra).
7.78. ábra
A közönséges csavarvonalnál leírt módszer elvileg bármely, vetületeivel adott görbe esetén alkalmazható.
Felületek ábrázolása
Néhány egyszerű, a műszaki ábrázolásban gyakran előforduló felület, test ábrázolásával foglalkozunk. Valamely felület
pontjainak vetületeit az előzőekben leírt módszerek valamelyikével szerkeszthetjük, ehhez nem szükséges új
ismeretanyag.
Vetítsünk egy F felületet párhuzamosan a K képsíkra (7.79. ábra). A vetület az F′ síkidom, melyet valamilyen síkbeli
görbe határol. Ez a felület képhatára a K képsíkon az adott párhuzamos vetítésnél.
7.79. ábra
Az F felületet érintő, a v vetítősugárral párhuzamos egyenesek érintési pontjai a felületen általában egy k görbét
alkotnak, amit kontúrgörbének nevezünk. A k kontúrgörbe vetülete a k′ képkontúr, mely a felületek ábrázolásában jelentős
szerepet játszik. A képkontúr pontjainak megszerkesztése nem mindig egyszerű feladat. Sokszor közelítő megadásával is
megelégszünk. Például a felületen elhelyezkedő, felületi görbék vetületeit adjuk meg, majd ezek burkológörbéjét rajzoljuk
meg (közelítően). A burkológörbe pontjaiban a burkológörbe érinti az ezen a ponton átmenő felületi görbevetületet.
Forgáshenger
Forgáskúp
Gömb
Néhány speciális forgásfelület
Egyenes vonalú csavarfelületek
Forgáshenger
7.80. ábra
A 7.80. ábrán egy r sugarú, h magasságú véges forgáshenger két vetületét ábrázoltuk, melynek t tengelye első
vetítőegyenes. A henger felülnézetének képe egy t′ körül rajzolt r sugarú kör, második képkontúrja a két kontúralkotó
vetülete. Az ábrán az egyik kontúralkotót a-val jelöljük. Az elölnézeten a két alapkör vetülete egy-egy szakasz. Az elölnézeti
képhatár (mely téglalap) szimmetriatengelye a t″ egyenes. A henger palástjára illeszkedő általános helyzetű P pont
felülnézete az ábrának megfelelően mindig az első képkontúrra illeszkedik.
A hengert két különböző helyzetben axonometriában is ábrázoltuk. Először a henger tengelye az x tengely, egyik
alapkörének középpontja az origó. (Frontális izometrikus axonometriában ábrázoltunk, minden tengelyirányú rövidülés
1.) A kontúralkotók vetületei az alapkörök vetületéhez húzott érintők. A másik esetben dimetrikus axonometriában is
ábrázoltuk az előbbi véges hengert. Az alapkörök vetületei ellipszisek, melyeket z tengely irányú eltolással egymásba
vihetünk. Az ellipszisek konjugált átmérőit a kör ábrázolásánál leírt módon kapjuk. Ezek alapján a vetületi ellipszisek
pontjai szerkeszthetők. A kontúralkotók vetületei az alapkörök vetületeihez húzott érintők. (Ezeket is közelítően rajzoltuk
meg, bár szerkesztésük is lehetséges.)
A fenti forgáshenger palástjának síkba fejtése egy téglalap h és 2rπ oldalakkal. Ezt a téglalapot csak közelítőleg tudjuk
megszerkeszteni rekti kálással vagy a Snellius-féle szerkesztés segítségével. A 7.81. ábrán az alapkört 12 egyenlő részre
osztottuk, és a kör 12-ed részét közelítően a Snellius-féle szerkesztéssel határoztuk meg. A henger palástját a 0-ás alkotó
mentén vágtuk fel. A palástra illeszkedő P pont helyzete a P′8′ körív közelítő meghatározásával a vetületekről leolvasható.
7.81. ábra
Forgáskúp
A 7.82a ábrán egy r sugarú, h magasságú, M csúcspontú véges forgáskúp két vetületét ábrázoltuk, melynek t tengelye első
vetítőegyenes. A forgáskúp elölnézetének képkontúrja a két kontúralkotó vetülete, melyek a t″ egyenesre szimmetrikusan
helyezkednek el. Második képhatára egyenlő szárú háromszög, melynek szárai a második képkontúralkotók. Az ábrán az
egyik kontúralkotót a-val jelöljük. A felületet az alapkör határolja, melynek felülnézete egy t′ körül rajzolt r sugarú kör,
második vetülete pedig egy 2r hosszúságú szakasz.
A forgáskúp felületére illeszkedő P pontot két módon is megadhatjuk. A rajta átmenő alkotó segítségével vagy a
tengelyre merőleges metszettel, amely egy p paralel kör. A p″ vetület egy P″-re illeszkedő, t″-re merőleges szakasz, a p′
vetület pedig egy M′ középpontú kör, melynek átmérője a p″ szakasz hosszával egyezik meg.
Legyen a kúp k alapkörének középpontja a koordináta-rendszer kezdőpontja, a kúp tengelye a z koordinátatengely,
mely vetítőegyenes, illetve első vetítőegyenes. A 7.82b ábrán a kúpot frontális axonometriában is ábrázoltuk. A k alapkör
képe O középpontú ellipszis, melynek pontjait a kör vetületénél leírt módon szerkesztettük. A kontúralkotókat úgy kapjuk
meg, hogy az M csúcspont axonometrikus képéből k vetületéhez érintőket húzunk (ha M külső pont). Ez esetben, bár pl.
a nitás alkalmazásával szerkeszthető is lenne, közelítően.
7.82. ábra
A forgáskúp palástjának kifejtésekor az alapkört szintén 12 egyenlő részre osztjuk a 0, 1, 2, …, 11 osztópontokkal (7.83.
ábra). Ezután egy ív hosszát határozzuk meg közelítően. Ezt olyan körcikk ívére mérjük fel 12-szer, melynek sugara a kúp
egy alkotójának hossza. A kúp 0-ás és a 6-os osztópontokhoz tartozó kontúralkotói a második képsíkkal párhuzamosak, így
a második vetületen valódi nagyságban látszódnak. A kúp palástját a 0-ás osztóponthoz tartozó alkotó mentén vágtuk fel. A
Pk pont megszerkesztéséhez először a rajta átmenő alkotó kiterített képét határozzuk meg, majd a PM szakasz hosszát. A P
ponton átmenő p paralel kör minden pontja M-től egyenlő távolságra van, akárcsak pk pontjai az Mk ponttól. A szerkesztés
az ábráról leolvasható. (A kúp palástjának szerkesztésénél a húrokkal való közelítés is elfogadható pontosságú megoldást
ad. Ebben az esetben például a 01 ív hosszát a 01 húrral közelítjük, a véges forgáskúp palástját pedig a 0, 1, 2, …, 11 szabályos
tizenkétszög alapú, M csúcsú gúlapalásttal közelítjük.)
7.83. ábra
Gömb
Az r sugarú K középpontú gömb első kontúrgörbéje az első képsíkkal párhuzamos gömbi főkör, így a felülnézetének
képkontúrja egy K′ középpontú r sugarú kör. Hasonlóan az elölnézeten a képkontúr egy K″ középpontú r sugarú kör. A 7.84.
ábrán k1 az első, k2 a második kontúrkör. Egy általános helyzetű gömbfelületre illeszkedő P pont vetületeit a P ponton
átmenő első képsíkkal párhuzamos gömbfelületre illeszkedő m kör (paralel kör) segítségével szerkesztjük meg, ahol az m″
és k1″ szakaszok párhuzamosak, m′ pedig egy K′ középpontú kör, melynek átmérője m″ hosszával egyezik meg.
Bizonyítható, hogy a gömbfelület nem fejthető síkba.
7.84. ábra
7.85. ábra
A gömbfelület merőleges vetülete egy, a gömbével egyező sugarú kör, melynek középpontja a gömb középpontjának
vetülete. A gömbfelület képkontúrja csak merőleges vetítés esetén kör, mégpedig a gömb sugarával megegyező sugarú kör.
A 7.85. ábrán egy félgömböt ábrázoltunk kétképsíkos rendszerben. A gömbfelület első képsíkkal párhuzamos metszetei
körök, ezek általános axonometriában is ábrázolhatók. Az ábrán megadtuk az axonometrikus koordináta-rendszer
vetületeit. Frontális axonometriában szerkesztettünk szemléltető képet. A metszetkörök axonometrikus képei ellipszisek,
pontjaikat a kör ábrázolásánál leírt módon adtuk meg, majd olyan b görbét rajzoltunk, mely burkolja a vetületi
ellipsziseket (a metszetkörök képeit). Bizonyítható, hogy a b burkológörbe egy ellipszisív. A teljes gömbfelület képkontúrja
ellipszis.
Végül ortogonális axonometriában is ábrázoljuk az O középpontú, r sugarú félgömböt (7.86. ábra). A határoló g főkör
axonometrikus vetületét a kör ábrázolásánál leírt módon szerkesztjük. A félgömbfelület kontúrjának vetületét egyszerűen
megrajzolhatjuk, ez ugyanis az O középpont körül írt, a gömb sugarával egyenlő sugarú félkör. A szerkesztés az ábrán jól
nyomon követhető.
A fenti módszerek általánosabb felületek ábrázolására is alkalmasak. Ezekkel most nincs lehetőségünk foglalkozni.
7.86. ábra
7.87. ábra
7.88. ábra
7.89. ábra
Legyen egy forgásfelület meridiángörbéje a k kör. Ha k középpontja a t forgástengelyen van, gömbfelület keletkezik. A
7.90. ábrán megrajzoltuk a k kör néhány helyzetét a forgás során, valamint szimmetrikusan elhelyezkedő paralel köröket.
Az ábra hasonlatos a Föld hosszúsági és szélességi köreiből álló rendszerre. Ha a k meridiánkör síkja illeszkedik t-re, de
középpontja nem, akkor a t körüli forgatás során körgyűrűfelület vagy tóruszfelület keletkezik (7.91. ábra).
7.90. ábra
7.91. ábra
7.92. ábra
Felületek síkmetszete
Bármely felület és sík közös pontjainak halmaza a felület síkmetszete. Cél a síkmetszet pontjainak szerkesztése, melyeket
megfelelő módon összekötve rajzoljuk meg a síkmetszet görbéjét. A síkmetszet pontjainak megszerkesztésénél általában a
felület alkotógörbéinek metszetét keressük meg a metszősíkkal (7.93. ábra).
7.93. ábra
Forgásfelületek síkmetszeteinek szerkesztésénél azonban a leggyakrabban használt módszer nem a fenti, hanem a
„szeletelő síkos eljárás”. A módszer lényege a következő. A síkmetszet pontjainak szerkesztéséhez olyan segédsíkokat
alkalmazunk (szeletelő síkok), amelyek a felület tengelyére merőlegesek. Ezek a síkok a felületből paralel köröket
metszenek ki. A segédsík és a metszősík metszésvonala a paralel kört a síkmetszet pontjaiban metszi. Kellő számú szeletelő
síkkal való metszés biztosítja a kívánt pontosságot a metszetgörbe közelítő megrajzolásához. A módszer alkalmazását a
következőkben néhány speciális forgásfelület esetében mutatjuk be.
Forgáshenger síkmetszete
Forgáskúp síkmetszete
Egy forgásfelület síkmetszete
Forgáshenger síkmetszete
A 7.94a ábrán egy első képsíkon álló, első vetítőegyenes tengelyű véges forgáshengert ábrázoltunk. Ezt a hengert
elmetszettük egy V második vetítősíkkal. A síkmetszet bizonyíthatóan ellipszis lesz. Ennek az ellipszisnek a második képe
egy szakasz (A″B″), első vetülete pedig egybeesik a henger első képével. A metszetellipszis pontjainak vetületei a
rendezőegyenesek segítségével könnyen megadhatók.
Az ellipszismetszet valódi alakjának megszerkesztését itt a V sík első képsíkkal való metszésvonala, első nyomvonala
(v1) körüli első képsíkba forgatásával határoztuk meg. A henger alapkörét felosztottuk 12 egyenlő részre a 0 – 11
osztópontokkal. Ezeken a pontokon átmenő hengeralkotókon a síkmetszetpontok helyezkednek el. Megadjuk a
pontok második vetületeit. A metszősíkot a pontokkal együtt forgattuk le. A pont leforgatásánál a
pontból húzzunk merőlegest v′1-re! A merőleges és v′1 metszéspontjából mérjük fel a merőlegesre a távolságot! Így a
( ) leforgatott pontot kapjuk. Ezt ismételve szerkesztjük az ( ) pontokat, majd törésmentes ívvel összekötve
közelítően megrajzoljuk az ellipszis ívét.
7.94. ábra
Síkba fejtettük a hengert a metszetgörbével együtt, nyilván közelítően. A 7.94b ábrán a palástot a 0 ponton átmenő
alkotó mentén metszettük fel. Az ellipszismetszetet is kiterítjük úgy, hogy a megfelelő alkotókra felmérjük az V-vel alkotott
metszéspontoknak az alaptól mért távolságát, ami a második képen valódi nagyságban látszik. Tehát például a pontot
úgy kaptuk, hogy a kiterítésen a 0k alkotóra 0k-ból kiindulva felmértük a szakaszt. Bizonyítás nélkül megjegyezzük,
hogy az ellipszis a síkba fejtésen egy szinuszgörbe részlete.
Forgáskúp síkmetszete
Ha egy sík a forgáskúpfelület (végtelen kúpfelület, kettős kúpfelület) csúcsán halad át, akkor a kúpfelületet vagy csak a
csúcsban, vagy két alkotóban metszi, vagy pedig egy kúpalkotó mentén érinti. A tengelyre merőleges metszetek körök.
Bizonyítható, hogy minden más esetben a síkmetszet ellipszis, hiperbola, illetve parabola. Ha a sík minden alkotót metsz,
akkor a síkmetszet ellipszis, ha a metszősík két alkotóval párhuzamos, akkor a metszet hiperbola, ha viszont egy alkotóval
párhuzamos, akkor a metszetgörbe parabola.
Az előzőekben tárgyalt ábrázolásoknál tulajdonképpen nem maga a kúpszelet, hanem annak vetülete jelenik meg.
Bizonyítható, hogy az ellipszis párhuzamos vetülete ellipszis, speciálisan kör, a paraboláé parabola, a hiperboláé pedig
hiperbola. (Ha a metszősík vetítősík, akkor a vetület egy egyenesre esik.)
7.95. ábra
A metszetgörbe pontjait szerkesztjük, majd megfelelő számú pont ismeretében a pontokat törésmentes görbével
összekötjük. A görbét tehát közelítően rajzoljuk. Szerkesztéseinkben a képsíkrendszert úgy vesszük fel, hogy a kúp
tengelye első vetítőegyenes legyen, a metszősík pedig második vetítősík.
A 7.95. ábrán a t tengelyű M csúcspontú kúp és az U második vetítősík metszetét szerkesztettük meg. A sík a kúpfelület
minden alkotóját metszi, a metszetgörbe ellipszis. A metszet második képe az A″B″ szakasz. A metszetellipszis nagytengelye
az AB =A″B″ szakasz. Az ellipszis O középpontjának második vetülete az A″B″ szakasz felezőpontja. Az O ponton átmenő t-re
merőleges szeletelő sík a kúpfelületből a k kört metszi ki. A kistengely végpontjai ezen a körön helyezkednek el. A
kistengely második vetülete, C″D″ egybeesik O″-vel. Első képét a k paralel kör első képe metszi ki a közös
rendezőegyenesből. További ellipszispontok szerkesztése a szeletelő síkos eljárással történhet. A P és Q pontokat az S
szeletelő sík segítségével szerkesztettük meg. Az S sík kúpfelülettel való metszetének első képe az s′ kör, melynek sugara az
elölnézetről leolvasható. Nyilván {P″, Q″} = s″ ⋂ U″. Az első képeket az s′ körön rendezéssel nyerjük.
Megszerkesztettük a metszetellipszis valódi alakját is, képsíkba forgatással. Az első képsíkba forgatás végrehajtása az
ábrán jól követhető.
7.96. ábra
7.98. ábra
A 7.99–101. ábrákon néhány, gyakorlati jellegű példa szerepel felületek síkmetszeteivel kapcsolatban.
7.99. ábra
7.100. ábra
7.101. ábra
Felületek áthatása
Két felület közös pontjainak halmaza általában görbe, melyet áthatási görbének vagy metszésvonalnak nevezünk. Az
alábbiakban vázolt eljárások több felület áthatása esetén is alkalmazhatók. Az áthatási görbe pontjainak szerkesztése a
következő. Az F1 és F2 felületeket elmetsszük egy S segédfelülettel (7.102. ábra). A metszésvonalak a g1 és a g2 görbék. A két
görbe közös pontjai a két felületnek is közös pontjai, azaz áthatási görbepontok. A 7.102. ábra P pontja ilyen. Újabb
segédfelületekkel tetszőleges számú metszéspont megszerkeszthető. Úgy tűnik, mintha a segédfelület felvételével
bonyolítanánk a helyzetet. Ez azonban nincs így, a segédfelületet ugyanis oly módon választjuk meg, hogy egyszerűen
lehessen megszerkeszteni a g1 = S ⋂ F15 g2 = S ⋂ F2 görbéket. Az S felület általában sík.
7.102. ábra
7.103. ábra
Más mód is van az áthatási görbepontok szerkesztésére. Ekkor az F1 felületen elhelyezkedő speciális görbék (ha lehet,
egyenesek) F2 felülettel való döféspontjait szerkesztjük meg. Ezek nyilván áthatási görbepontok. A 7.103. ábrán az a1, a2, …
görbéket jelöltük meg az F1 felületen, az a1 görbe F2 felülettel való döféspontja D, mely az áthatási görbe pontja. Megfelelő
számú döféspont szerkesztésével az áthatási görbe jó közelítéssel megrajzolható.
Az alábbiakban egy-egy példát mutatunk mindkét módszer alkalmazására.
Példák
1. Egy forgáskúp és egy forgáshenger áthatását szerkesztettük meg a 7.104a–c. ábrán. A metszésvonal második képe
rajta van a henger második vetületén, tehát körív. (Az ábrán vastagon jelölt körív.) Vegyünk fel egy, az első
képsíkkal párhuzamos V1 síkot, mely metszi a felületeket (7.104a ábra)! Ez a sík a kúpból a k paralel kört, a
hengerből az a és b alkotókat metszi ki. A k kör a felülnézeten valódi nagyságban látszik, elölnézetben a k″
szakasz. A henger alkotói a második képsíkra merőlegesek, tehát a″ és b″ pontok, amelyeket V″1 metsz ki a henger
második vetületéből (most egy kör). Ennek alapján az alkotók első vetületei megrajzolhatók. Az áthatási görbe
pontjai a k kör a és b egyenesekkel való metszéspontjai. Az első vetületen k′-nek csak a′-vel vannak közös pontjai,
ezek a P′ és Q′ pontok. További V1-gyel párhuzamos szeletelő síkok felvételével további áthatási görbepontokat
szerkeszthetünk.
7.104. ábra
A V2 szeletelő sík (7.104b ábra) a hengert az első kontúralkotókban metszi. Tehát V2 segítségével adjuk meg a
henger első kontúralkotóin levő A′ és B′ pontokat.
Az S sík mindkét felület szimmetriasíkja. (Ebben az esetben S illeszkedik a kúp tengelyére és merőleges a henger
tengelyére.) Az S síkban fekvő áthatási görbepontok (C és D) a szimmetriapontok. Az áthatási görbét a szerkesztett
áthatási görbepontok összekötésével a 2. kép alapján közelítőleg rajzoltuk meg.
A láthatóságot a henger kitolása után adtuk meg (7.104c ábra).
2. A 7.105a ábrán forgáskúp és forgáshenger testeket ábrázoltunk. Szerkesszük meg az áthatásukat! A felületükön
levő áthatási görbét szerkesztjük meg először, a második módszerrel, azaz a kúp alkotóinak a hengerfelülettel
való metszéspontjait.
Az áthatási görbe első képe egybeesik a henger első vetületével, ezért csak a második vetületet kell szerkeszteni. A
kúp alapkörét a 0, 1, …, 11 pontokkal egyenlő részekre osztottuk. Az M0, M1, …, M11 alkotók első képének a henger
első képével (kör) alkotott metszéspontjai adják az áthatási görbe pontjainak első képét. A második képeket pedig
rendezéssel nyerjük. Az ábrán az M10 alkotónak a hengerfelülettel való A metszéspontját jelöltük csak meg.
Megjegyezzük, hogy a felületek szimmetriája és elhelyezkedésük miatt az áthatási görbe elölnézete kettősvetület,
az elölnézet pontjai, kivéve a henger kontúralkotóin levő pontokat, két-két áthatási görbepont vetületei. A
láthatóságot a henger kitolása után adtuk meg. A kúptestből ekkor egy hengerrészletnyi hiányzik, ennek
kontúrja az elölnézeten megjelenik.
7.105. ábra
A 7.105b ábrán látható a kúppalást és a hengerpalást síkba terítése az áthatási görbével együtt. A kiterített
kúppalást körcikk, melynek sugara a kúp alkotója, íve pedig az alapkör kerületével egyenlő hosszú. Az alkotó
valódi hosszát a második kontúralkotó hossza adja. A kúp alapkörének kiterítését közelítőleg a 0 – 1, 1 – 2, … 11 – 0
ívekhez tartozó húrok hosszának felmérésével nyertük. Az áthatási görbe pontjainak a kúp csúcsától mért
távolságait a második vetületen a kúp tengelye körüli, kontúralkotóra való kiforgatással nyertük. Az ábrán az A
pont esetén tüntettük fel részletesen a szerkesztést. (A kiforgatott pont Ā.)
A hengerpalást síkba fejtésénél téglalap keletkezik, melynek egyik oldala a hengeralkotóval, a másik a henger
alapkörének kerületével egyenlő. A henger felületének síkba fejtését is az áthatási görbéével együtt
szerkesztettük, közelítően. Ehhez a fentiekben megszerkesztett áthatási görbepontokon keresztül vettünk fel
hengeralkotókat. (A henger alapkörén nyilván az ennek megfelelő beosztás nem egyenletes. Az alapkör síkba
fejtésénél a nagyobb ívek esetén rekti kálhatunk.) A szükséges alkotószakaszokat a második vetületről
leolvashatjuk. Az ábrán az A pont esetén tüntettük fel részletesen a szerkesztést.
A gyakorlatban is sokszor előfordulnak áthatások. Erre néhány példát mutatnak a 7.106–110. ábrák.
7.106. ábra
7.107. ábra
7.108. ábra
7.109. ábra
7.110. ábra
Térelemek ábrázolása
Görbék ábrázolása
Felületek ábrázolása
Egyszerű rézsűfelületek
Metszési feladatok
Térelemek ábrázolása
A kótás ábrázolás lényegében egyképsíkos ábrázolási eljárás, mely a tér pontjait merőleges vetületekkel és a vetülethez írt
kótával (másképpen: mérőszámmal) adja meg. Részletesebben: a tér valamely P pontját megadhatjuk a K képsíkon lévő P′
vetületével és a képsíktól mért előjeles távolságával, a „képsík feletti” (vagy alatti) magasságot rögzítő kótával.
A P′ (2) vagy P(2) jel tehát egy, a képsík, a 0-ás szintsík „felett” 2 egység magasságban lévő pontot ad meg (7.111. ábra).
Alkalmazzák a P2 jelölést is. Szó lehet negatív kótáról is, mint a Q pont esetében, Q a képsík „alatt” helyezkedik el, attól
egységnyi távolságra. A továbbiakban lényeges szerepük lesz a képsíkkal párhuzamos, attól 1, 2, … egység távolságban lévő
úgynevezett főszintsíkoknak. Egységként általában a méter vagy alkalmasan választott többszöröse szerepel.
7.111. ábra
A kótás ábrázolásban általában nagy kiterjedésű objektumokat kell ábrázolnunk. Ezeket valódi nagyságukban nem
tudjuk ábrázolni. Ezért minden méretet alkalmasan kicsinyítünk. A tér bármely H hosszúságú szakaszának egy
hosszúságú szakasz felel meg a rajzunkon, ahol a egy adott szám, az arányszám. Az arányszám reciproka a méretarány,
amelynek megadása M 1: a, vagy az M = 1: a formában szokásos.
Kótás ábrázolást alkalmazó rajzokon, térképeken általában feltüntetik a méretarányt, esetleg az 1 m vagy alkalmas
többszörösének rajzi hosszát, a rajzi egységet, melyet 1e-vel jelölünk. Valamely alakzat pontjainak merőleges vetületei
(képei) az alakzat vetületét, képét alkotják.
Példa. A 7.112a ábrán látható szabályos gúla ABCD alapja 5 cm oldalú négyzet, mely a K képsíkban helyezkedik el. Az
alaplap bármely pontjának kótája 0. A gúla magassága 5 cm, így az M csúcspont kótája 5. A méretarány 1:2, tehát a
rajzi egység 0,5 cm. A 7.112b ábra mutatja a gúla vetületét, mellette az 1 cm rajzi megfelelőjét, a rajzi egységet.
Megjegyezzük, hogy később az egyszerűség kedvéért a pont vetülete mellett többnyire már csak a kótát tüntetjük fel.
7.112. ábra
Görbék ábrázolása
Alapvető fontosságú az egyenes ábrázolása. A g egyenest két pontja, P és Q egyértelműen meghatározza (7.113a ábra).
Legyen a P pont kótája p, a Q ponté pedig q! A 7.113b ábrán a vetületet, a g′ =P′pQ′q egyenest ábrázoltuk. Gyakran vessző
nélkül ugyanazzal a betűvel jelöljük a vetületet is. Hogyan határozzuk meg az egyenes pontjainak kótáit, hogyan veszünk
fel az egyenesen adott kótához tartozó pontot? Mekkora a PQ szakasz valódi hossza?
7.113. ábra
Valamennyi kérdésre választ kaphatunk, ha az egyenes vetítősíkját például g′ körül a 0 kótához tartozó főszintsíkba
forgatjuk.
A P pont képsíkba forgatottját (P)0-lal jelöljük. A (P)0 pont a g′-re merőleges egyenesen helyezkedik el és a P′ (P)0 szakasz
a kótának megfelelő hosszúságú. A g egyenes (g)0 leforgatottjának megadásához az egyenes Q pontját is leforgatjuk.
Példa. Legyen a g = PQ egyenest (7.114a ábra) meghatározó P pont kótája 1, a Q pont kótája 4, P és Q vetületei
egymástól 3 m távolságban vannak. A kótákat méterben adtuk meg, M 1:100. Határozzuk meg a g egyenes az ábrán
vetületben megjelölt B pontjának kótáját! Vegyünk fel az egyenesen 3,2 kótához tartozó C pontot, valamint
határozzuk meg a PQ szakasz hosszát!
7.114. ábra
A 0-ás főszintsíkba forgatjuk g-t a g′ egyenese körül (7.114b ábra). A rajzon 1 méternek 1 cm felel meg, P1Q4 = 3 cm. Ha
a (B)0 pont a g′ egyenestől b távolságra van, akkor B kótája b. Jelen esetben b ≈ 1,75. A 3,2 kótához tartozó
egyenespont (C)0 leforgatottját a g′-vel párhuzamos, tőle 3,2 cm távolságra haladó azon egyenes metszi ki (g)0-ból,
amely (B)0-lal egy félsíkban van. A PQ szakasz hossza egyenlő (P)0(Q)0-lal.
Megemlítjük, hogy az előző szerkesztést, a leforgatott ábrát, máshol is elhelyezhetjük. A 7.114c ábrán egy derékszögű
koordináta-rendszer x tengelyén helyeztük el a g′ egyenest. Az y tengelyen a méretaránynak megfelelően egy
magassági skálát készítünk el. A P1 és a Q4 pontban az x tengelyre merőleges egyenesekre felmérjük (előjelesen) a
kótáknak megfelelő szakaszokat. A kapott pontokat összekötve megkapjuk a (g)0 egyenes megfelelőjét. Minden, az
előzőekben tárgyalt szerkesztés itt is végrehajtható.
Az egyenes azon pontjai, amelyek kótái egész számok, azaz úgynevezett főszintsíkokban vannak, az A, B, C, …
szintpontok (7.115a ábra). A szintpontok vetületei az osztópontok. Az osztópontok kijelölése a graduálás (lépcsőzés).
Graduálhatunk szükség esetén tizedméterenként, de olykor 20 méterenként is.
Ekkor tehát a 0,1 m, illetve 20 m szintkülönbségű szintsíkokban lévő szintpontok vetületeit határozzuk meg. Ha egy
szakasz végpontjainak magasságkülönbsége 1 m, a szakasz vetületi hosszát osztóköznek nevezzük, melyet a továbbiakban
7.115. ábra
A graduálást elvégezhetjük oly módon is, hogy az egyenest szintsíkba forgatjuk (7.115b ábra). Az egyenes lejtiránya azt
mutatja, hogy a vetületen milyen irányban haladva jutunk egyre kisebb kótájú pontokhoz. A lejtirányt az egyenes vetülete
mellé rajzolt nyíl jelöli. Az egyenesnek a szintsíkokkal bezárt szöge a dőlésszög vagy lejtszög (ϵ), melyet a 7.115a–b ábrán
ugyancsak megjelöltünk. A műszaki gyakorlatban az egyenes (és a sík) térbeli helyzetét gyakran nem a dőlésszöggel, hanem
annak kotangensével, a rézsűvel, az r = ctg ϵ számmal jellemzik. Például az r = 3 : 2 rézsű azt jelenti, hogy ha az egyenes
valamely szakaszának vetülete 3 egység hosszúságú, akkor a végpontok magasságkülönbsége 2 egység. A rézsű reciproka a
lejtő (másképp: lejtés), a dőlésszög tangense.
Az egyenes meredekségének számszerű jellemzésére szolgál a százalékos lejtés. Az egyenes p%-kal emelkedik, illetve
lejt, ha az egyenes valamely szakaszának 100 egységnyi vetületi hosszához a végpontok p egységnyi magasságkülönbsége
tartozik. A p%-os lejtés és a lejtszög kapcsolata: p = 100·tg ϵ. Ha például a lejtszög ϵ = 10°, akkor a tg 10° = 0,176 326…, a
százalékos lejtés két tizedes pontosságig 17,63 %.
Hasonló fogalom az ezrelékes lejtés. Az egyenes q ezrelékkel (q ‰ ) emelkedik, illetve lejt, ha az egyenes valamely
szakaszának 1000 egységnyi vetületi hosszához a végpontok q egységnyi magasságkülönbsége tartozik. A q ‰-es lejtés és a
lejtszög között a következő kapcsolat van: q = 1000·tg ϵ.
Görbét kótás ábrázolásban merőleges vetületével és megfelelő számú, ismert kótájú pontjának megjelölésével adjuk
meg.
Példa. A 7.116a–b ábrán egy V vetítősíkban fekvő g görbét ábrázoltunk. A görbe adott pontjához tartozó lejtésén,
illetve rézsűjén a pontbeli e érintő lejtését, illetve rézsűjét értjük. Az érintő és ezzel együtt a görbe adott pontbeli
lejtszögét ϵ-nal jelöljük. A g′ vetületet egy derékszögű koordináta-rendszer x tengelyén, a g görbe leforgatottját a
koordináta-rendszerben ábrázoltuk. A magassági skála segítségével közelítően megadtuk a görbe 3,6 kótához tartozó
Z pontját és az Y görbepont közelítő kótáját (~ 1,3). A B görbepontban megrajzoltuk az e érintőt, és jelöltük a lejtszöget
(ϵ).
7.116. ábra
A 7.117a ábrán egy térgörbe g′ merőleges vetületét és néhány pontjának kótáját adtuk meg. A térgörbe pontjait vetítő
egyenesek egy általános hengerfelület alkotói. A merőleges vetület ennek a hengerfelületnek a 0-ás szintsíkkal való
metszete. A hengerfelület görbével együtt való síkba fejtésének műszaki jelentősége van.
A síkba fejtés ívhossztartó leképezés. Ez azt jelenti, hogy a g térgörbe AB ívének hossza megegyezik a gk síkba fejtett
görbe AkBk ívének hosszával. A síkba fejtés szögtartó leképezés is, ezért a g görbe B pontbeli érintőjének a B ponton átmenő
hengeralkotóval bezárt γ szöge is változatlan a síkba fejtés után. Így a gk görbe Bk pontbeli lejtése, illetve rézsűje sem
változik. A gk görbe a g görbe hossz-szelvénye, mely megőrzi a pontok eredeti kótáit, a görbeívek ívhosszait és a
7.117. ábra
A szerkesztés konkrét kivitelezése közelítő. Megjegyezzük, hogy a hossz-szelvényt utak tengelyvonalának ábrázolására
is használják. Ebből leolvasható egy-egy útszakasz közelítő hossza és lejtése. Gyakran szakaszokkal kötik össze a
szomszédos pontokat a hossz-szelvényen. Ilyenkor egy-egy szakasz esetén határozható meg közelítően a lejtszög, illetve a
rézsű.
Megemlítjük, hogy de níciója alapján a közönséges csavarvonal hossz-szelvénye egyenes. Ez azt jelenti, hogy lejtése
állandó.
Példa. A 7.118. ábrán egy csavarvonal fél menetének hossz-szelvényét adtuk meg.
7.118. ábra
Felületek ábrázolása
Kótás ábrázolásban a felületeket szintsíkokkal való metszeteikkel, szintvonalaikkal ábrázoljuk általában. A legegyszerűbb
felület, a sík esetében a szintvonalak párhuzamos egyenesek. Általában a főszintsíkokban lévő szintvonalakat tüntetjük fel
(7.119a ábra).
7.119. ábra
A szintvonalakra merőleges síkbeli egyeneseket, vagyis az esésvonalakat, a kótás ábrázolásban nyíllal ellátott kettős
vonallal jelöljük (7.119b ábra). A nyíl az esésvonal lejtirányát jelöli. A síkot gyakran csupán graduált esésvonalával adjuk
meg. Ez már meghatározza az esésvonalra vetületben is merőleges szintvonalak helyzetét. Beszélhetünk a sík osztóközéről,
lejtszögéről (lejtéséről), rézsűjéről, ami esésvonalának osztóköze, lejtszöge (lejtése), rézsűje. Az alábbiakban egy felület
szintvonalrendszerét adjuk meg, példaként.
Példa. Ábrázoljunk szintes tengelyű forgáshengert! A 7.120. ábra hengerének t tengelye az 5-ös szinten van, sugara 4
cm, 1 rajzi egység 0,5 cm. A szintvonalak a megadás miatt hengeralkotók. A szintvonalak megrajzolása érdekében
egy V segédsíkot veszünk fel a henger tengelyére merőlegesen (V vetítősík). A henger V-re való merőleges vetülete
kör, melyet egy szintsíkba forgatunk. A szintsíkok V-re való vetületeit beforgatva V′-vel párhuzamos egyeneseket
kapunk, melyek egymástól való távolságai rendre 1-1 rajzi egységnyiek. Ezek az egyenesek a körből kimetszik a
szintvonalak vetületeinek leforgatottjait. Ezután a szintvonalak már megrajzolhatók. (Ha az ábrán két szintvonal
vetülete ugyanaz, a hozzájuk tartozó kótákat vesszővel választjuk el.)
A természetes földfelületet, az úgynevezett terepfelületet általában kótájukkal ellátott szintvonalaikkal adjuk meg. A
szintvonalak vetületeinek összessége a szintvonalas térkép. A következőkben a szintvonalak merőleges vetületeit adjuk
meg. A szintvonalas térképek felvétele geodéziai módszerekkel történik.
7.120. ábra
Ha a terepfelület C pontja kis környezetében levő tereppontok C-nél alacsonyabban helyezkednek el, akkor C-t
csúcspontnak nevezzük. Az M mélypont kis környezetében levő tereppontok M-nél magasabban vannak. A 7.121. ábrán
csúcsponton és mélyponton kívül ábrázoltunk egy N nyeregpontot. Ebben a pontban két azonos kótához tartozó szintvonal
metszi egymást.
7.121. ábra
Gyakorlati alkalmazásuk miatt két, a terepfelületen elhelyezkedő görbetípust említünk meg. A terepfelület
szintvonalait merőlegesen metsző görbék (a metszéspontban a görbéhez és a szintvonalhoz húzott érintők merőlegesek) az
esésvonalak. Egy közelítő szerkesztésüket láthatjuk a 7.122. ábrán. (Az esésvonal két szintvonal közötti részét körívvel
közelítjük.)
A lejtvonalak olyan terepfelületen haladó görbék, melyek lejtése minden pontban azonos. Utak, csatornák
tengelyvonalainak egyes szakaszai gyakran lejtvonalak.
Közelítő szerkesztésénél a lejtvonal két szomszédos szintvonal közötti részét gondolatban szakasszal helyettesítjük, a
lejtvonalat tehát olyan töröttvonallal, melynek szakaszai ugyanazon osztóközzel rendelkeznek. Ennek megfelelően adott
rézsű esetén az alkalmas osztóközt megszerkesztve és körzőnyílásba véve, az adott pontból kiindulva a szintvonalakon
kijelölhetők a lejtvonal pontjai (7.123. ábra). Ezeket sokszor egy törésmentes görbével kötjük össze (nem a töröttvonalat
rajzoljuk meg). Egy pontból több lejtvonal is indulhat. A gyakorlatban a lehetséges utak közül a „törésmenteset” választják.
(A 7.123. ábrán a d jelű út ilyen.)
7.122. ábra
7.123. ábra
A terepfelület két szintvonal közötti részén további szintvonalakat szerkeszthetünk közelítően, sűríthetjük a
szintvonalrendszert. Szerkesszünk esésvonalakat az említett két szintvonal között! Ezeket az esésvonalíveket
lejtvonalaknak tekintve egyenletesen beosztjuk, majd az azonos kótához tartozó pontokat görbével összekötjük.
Példa. A 7.124. ábrán a 810-es és a 815-ös szintvonalak közötti részen sűrítettük a szintvonalrendszert, a
szintvonalakat méterenként rajzoltuk meg (közelítően). A terepfelület egy nem szintvonalon elhelyezkedő
pontjának kótáját közelítően határozhatjuk meg a szintvonalrendszer sűrítésével. (A 7.124. ábrán a terepfelületen
elhelyezkedő P pont kótája ~ 813,5.)
7.124. ábra
Gyakori feladat a terepfelület vetítősíkkal való metszetének megadása, az úgynevezett szelvény szerkesztése. A V
vetítősík vetülete a V′ egyenes, melynek szintvonalakkal való metszéspontjai adják a terepfelülettel való metszetgörbe
pontjait. Hogy láthatóvá tegyük a szelvény alakját, vagy valamelyik szintsíkba forgatunk, vagy pedig külön ábrán
helyezzük el a metszetet.
Példa. A 7.125a ábrán a szintvonalak kótái méterben szerepelnek, M 1: 200. A szelvényt külön ábrán (7.125b ábra)
helyeztük el, a magassági skálán1 m magasságkülönbségnek 0,5 cm felel meg.
7.125. ábra
Egyszerű rézsűfelületek
A P ponton átmenő, adott rézsűvel rendelkező egyenesek egy P csúcsú forgáskúpfelületet alkotnak, melynek tengelye a
szintsíkokra merőleges (7.126a ábra). Ez a rézsűkúp. Ábrázolhatjuk a főszintsíkokkal való metszeteivel, melyek körök. A
szintkörök vetületei a P pont vetülete körül írt koncentrikus körök, melyek kótáit a körök mellé írjuk.
7.126. ábra
Példa. Legyen P kótája 4 (az adatot méterben adtuk meg). Szerkesszük meg az r = 1 rézsűhöz tartozó rézsűkúp
szintköreit, ha M 1: 200. A P ponton átmenő 1 rézsűhöz tartozó g egyenes vetületét rajzoltuk meg, lejtirányát is
megjelöltük (7.126b ábra). Osztóköze K = 1 m, melynek rajzi hossza k = 1/200 m = 5 mm. Graduálva a g egyenest a
rézsűkúp szintkörei már megrajzolhatók. (A szintkörök sugarai k, 2k, 3k, …) Megjegyezzük, hogy a 3-as és 5-ös, 2-es
és 6-os, … szintkörök vetületei nyilván egybeesnek.
Abban a fontos esetben, amikor f a képsíkkal párhuzamos, úgynevezett szintes egyenes, mindig két r rézsűjű sík
illeszthető f-hez (7.127a–b ábra). A rézsűsíkok szintvonalai párhuzamosak f-fel, és esésvonalaik rézsűje r. Az ábrán az f
egyenes pontjainak kótája 3, a rá illeszkedő adott rézsűjű rézsűsíkok néhány szintvonalát rajzoltuk meg.
7.127. ábra
A következő részben néhány egyszerűen megadható rézsűfelületet használunk fel. Ezeket adott rézsűvel rendelkező
síkok és rézsűkúpok, valamint ezek részletei határolják.
Metszési feladatok
A metszési feladatok megoldása kótás ábrázolásban egyszerű. Ugyanis két felület adott kótához tartozó közös pontjait (ha
léteznek) a felületek adott kótához tartozó szintvonalainak metszéspontjai adják.
Két általános helyzetű sík közös egyenesét mindkét sík szintvonalai graduálják. A metszésvonal pontjait a megfelelő
szintvonalak metszeteiként adjuk meg (7.128a ábra). A metszésvonal vetületét ezért a 7.128b ábrán látható módon
szerkeszthetjük meg. A szerkesztéshez nem szükséges a rajzi egység ismerete.
A következő két feladatban szakaszokból álló egyszerű alakzatokra illesztünk rézsűsíkokat, illetve alkalmazunk
rézsűkúpokat. A fenti módon szerkeszthetők a metszésvonalak.
7.128. ábra
Feladat. Terepfelületen az ABCD négyzet alakú szintes platót szeretnénk kialakítani, AB = 12 m, a plató szintje 200 m.
Fektessünk a négyzet oldalaira rézsűsíkokat r = 2,5 rézsűvel, ha M 1:400. A talaj, mely síknak tekinthető, a 197-es
szinten van.
Megoldás. A 7.129a ábra alapján nyomon követhetjük a megoldást. A rajzon az ABCD négyzet vetületének oldala
7.129. ábra
A következő feladatban egy felület (rézsűfelület) síkkal való metszetét szerkesztjük a fenti alapelv szerint.
Feladat. Adott egy síknak tekinthető terepfelület (7.131. ábra) szintvonalrendszere a 95-ös szintvonaltól a 140-es
szintvonalig, 5 méterenként. A terepfelületen egy téglalap alakú (ABCD) 40 m × 60 m-es platót szeretnénk kialakítani
120 m magasságban. Végezzük el a földmunkákhoz szükséges szerkesztéseket, ha a feltöltéshez szükséges határoló
rézsűsíkok rézsűje rf = 1,25, a bevágás esetén pedig rb = 1, M 1:1000!
7.131. ábra
Megoldás. A terepfelület és a plató metszésvonala a nullavonal. Ez az EF-fel jelölt szakasz, szintje 120 m. Az ábrán
látható, hogy az A pont kótája kisebb, mint az azonos vetülettel rendelkező tereppont kótája. Így az EABF töröttvonal
környezetében a talajt el kell távolítani, bevágás szükséges.
Az EA, AB, BF szakaszokra emelkedő rézsűsíkokat illesztünk rb rézsűvel. A szintvonalakat 5 méterenként rajzoltuk
meg, majd meghatároztuk az így nyert csonkagúla-felület részlet és a terep metszésvonalát. (A metszésvonal
szakaszait laponként szerkesztettük, felhasználva a síkok metszésvonalánál mondottakat.) Az ED, DC, CF
szakaszokra lejtő rézsűsíkokat illesztettünk kifelé rf rézsűvel. A szintvonalakat itt is 5 méterenként rajzoltuk meg.
Meghatároztuk a csonkagúla-felület részlet és a terep metszésvonalát.
A 7.132. ábrán megadtuk a szerkesztés befejezése után kialakított (mesterséges és természetes) felület egyesített
szintvonalrendszerét.
7.132. ábra
Két felület áthatási görbéjének pontjait a szintvonalrendszerek birtokában a fentiek szerint szerkeszthetjük. Ezt
mutatjuk be a következő példán keresztül.
Példa. Egy forgáskúp- és egy félhengerfelület áthatását szerkesztettük meg a 7.133. ábrán. A kúp alapköre a 0-ás
szintsíkban van, csúcsának kótája 5. A félhenger két határoló alkotójának is 0 a kótája. A rajzi egység 1 cm.
Megadtuk a felületek szintvonalrendszerét. Ehhez a henger alkotóira merőleges V vetítősíkot vettünk fel. A V síkra
merőlegesen vetítettük mindkét forgásfelületet, és V-t a vetületekkel együtt a 0-ás szintsíkba forgattuk. A
főszintsíkokkal való metszetek a kúp esetén paralel körök, a hengernél pedig alkotók. Ezek a már korábban
ismertetett módon megadhatók. A megfelelő (itt a 0, 0,5, 1, 1,5 kótákhoz tartozó) szintvonalak metszéspontjai az
áthatási görbe pontjai. A metszetgörbe további pontjaihoz jutunk, ha a felületek szintvonalrendszerét sűrítjük
(például az 1,3 kótához tartozó szintvonalakat is megrajzoljuk). A szerkesztés kivitelezése az ábráról leolvasható. A
láthatóságot úgy tüntettük fel, hogy a forgásfelületeket átlátszatlannak tekintettük.
7.133. ábra
Centrális ábrázolás
Sztereogra kus projekció
Centrális ábrázolás
A fotogrammetria, a műszaki szemléltetés, a képzőművészet szempontjából fontos ábrázolási mód a centrális ábrázolás. Az
ebben az ábrázolásban szerkesztett vetületek képiesebb benyomást keltenek, mint az axonometrikus vetületek, az így
szerkesztett ábra többé-kevésbé olyan benyomást kelt, mint a tárgy közvetlen megtekintése. A perspektívában való
ábrázolás főbb szabályait a reneszánsz nagy művészei fedezték fel. A. Dürer alkotásain meg is örökítette azt az eszközt,
mellyel a perspektívaszerkesztések kivitelezhetők (7.134. ábra).
7.134. ábra
7.135. ábra
7.136. ábra
A centrális vetítés során a tér pontjait a centrumból vagy vetítési középpontból vetítjük le egy adott, a centrumra nem
illeszkedő síkra, melyet képsíknak nevezünk (7.135. ábra). Ha O a centrum és K a képsík, akkor a tér valamely O-tól
különböző P pontjának Pc centrális vetülete (centrális képe) az OP vetítősugár és a K képsík közös pontja. A centrumnak a
képsíkon lévő merőleges vetülete az F főpont. Az FO távolság a distancia vagy szemtávolság. Az imént használt „szem” szó
arra utal, hogy egy tárgy centrális vetítéssel nyert képe megfelel annak a látványnak, melyet a tárgy az O pontban
elhelyezkedő szemlélőnek nyújt.
Az általános helyzetű e egyenes nem megy át O-n, és metszi a K képsíkot (7.136. ábra). Az e egyenes pontjaihoz tartozó
vetítősugarak egy, a centrumot tartalmazó síkban, az egyenes centrális vetítősíkjában vannak. Ennek a síknak és a
képsíknak a metszésvonalán vannak az egyenes pontjainak centrális vetületei. Az e egyenes nyompontja az E = e ⋂ K pont.
A nyompont vetülete önmaga. Az e-vel párhuzamos ē vetítőegyenes, az iránysugár, a képsíkot az pontban metszi,
melyet az egyenes iránypontjának nevezünk. Ez a pont egyelőre egyetlen egyenespontnak sem vetülete. Bővítsük ki az e
egyenes pontjait egy úgynevezett ideális ponttal, melyet az e-vel párhuzamos egyenesek közös pontjaként értelmezünk. Így
az e egyenes Ie ideális pontjának centrális vetülete lesz . Az e egyenes képpontjai tehát az egyenesen vannak.
Legyen V az e egyenes olyan pontja, melyre OV || K. A V pont Vc képe, az úgynevezett eltűnési pont, az ec egyenes ideális
pontja. Az e egyenes a vetítési rendszer (O, K), a nyompont és az iránypont ismeretében egyértelműen rekonstruálható.
Kössük ugyanis össze az O és az pontot (iránysugár), majd húzzunk párhuzamost vele az E nyomponton át! Az e
egyenessel párhuzamos g egyenes iránypontja , így vetületeik egy pontban metszik egymást.
Az O ponton átmenő egyenesek vetítőegyenesek, centrális vetületük pont, mely lehet ideális is. Az O pontra nem
illeszkedő, a K képsíkkal párhuzamos egyenes képe egyenes, nyompontja ideális pont.
7.137. ábra
7.138. ábra
A képsíkhoz képest általános helyzetű S sík metszi K-t, és nem illeszkedik O-ra (7.137. ábra). Ábrázolása két különleges
egyenesének képével történhet. Egyik az S sík és a K képsík s metszésvonala, az S sík nyomvonala. A nyomvonal centrális
vetülete nyilván önmaga. A másik a sík iS irányvonala. Ez utóbbi a centrumon átmenő és az S síkkal párhuzamos S̄ sík, az
iránysík és a képsík metszésvonala. Az is egyenesen helyezkednek el az S síkban fekvő egyenesek ideális pontjainak
centrális vetületei. Úgy tekintjük, hogy az S sík ideális pontjai egy egyenesen, a sík ideális egyenesén vannak, és az iS
irányvonal az S sík ideális egyenesének képe. Az O ponton áthaladó, K-val párhuzamos, úgynevezett eltűnési sík (E) metszi
ki S-ből a t egyenest (7.138. ábra), melyet talpvonalnak nevezünk. A t egyenes minden pontjának centrális képe ideális pont.
A nyomvonal és az irányvonal egyértelműen meghatározza a sík térbeli helyzetét. A sík rekonstrukciója a következő: az
irányvonalon és a centrumon át síkot fektetünk, azaz rekonstruáljuk az iránysíkot, majd a nyomvonalon át az iránysíkkal
párhuzamos síkot fektetve kapjuk az ábrázolt síkot. Ha az S sík O-ra illeszkedik, azaz vetítősík, akkor vetülete egyenes
(esetleg ideális egyenes).
Bővítsük ki a K képsík és az S sík pontjait ideális térelemekkel! Az O (O ∉ S) centrumú vetítés S és K pontjai között olyan
megfeleltetést létesít, mely egy-egyértelmű és egyenestartó. Az osztóviszonyt azonban nem tartja meg, mint az a nitások.
Azaz, ha A, B, P egy egyenes pontjai, akkor az Ac, Bc, Pc képpontokra az (ABP) = (AcBcPc) egyenlőség általában nem áll fenn.
Így a centrális vetítésnél már nem az a nitás tulajdonságai teljesülnek, mint ahogy ezt az eddigiek során megszoktuk. A
centrális vetítés geometriája a projektív geometria. Ezért a centrális vetületek rajzolása az eddigiektől különböző
szemléletet igényel.
Néhány perspektívaszerkesztés
Leggyakrabban a centrális vetítés K képsíkja függőleges helyzetű, a szerkesztéshez használt S sík rá merőleges (7.139. ábra).
Az S sík egyeneseinek iránypontjai az O centrumra illeszkedő, S-sel párhuzamos sík és a K képsík közös egyenesén (S
irányvonalán) vannak. Ezt ebben a speciális esetben horizontvonalnak nevezzük, és h-val jelöljük. A főpont a h
horizontvonalon helyezkedik el. Az O pont S-től való távolsága a szemmagasság, melyet m-mel jelölünk. Az S síkot ebben az
esetben alapsíknak nevezzük, és a továbbiakban A-val jelöljük. Az A sík a nyomvonala nyilván h-val párhuzamos, a és h
távolsága m-mel egyenlő.
7.139. ábra
7.140. ábra
A 7.141. ábrán a vetítőrendszert és egy P pontot vettünk fel két képével. Nyilván K′ ||x12, a|| x12. A horizontvonal és a
főpont mindkét vetületét szerkeszthetjük. Az O pont és főpont nyilván különbözők, de O″ = F″. A centrális vetítés
de níciója szerint O-t összekötjük P-vel (mindkét vetületet megrajzoljuk), majd megkeressük az OP egyenes K-val való
döféspontját, a Pc pontot. A döféspont első vetülete kijelölhető, Pc′ = O′P′ ⋂ K′. A Pc′ ponton átmenő rendezőegyenes O″P″-
vel való metszéspontja a Pc″ pont.
7.141. ábra
A 7.142. ábrán egy elöl- és felülnézetével adott alakzat (szobabelső) centrális vetületét szerkesztettük meg frontális
perspektívában.
7.142. ábra
7.143. ábra
Helyezzük el a perspektíva K képsíkját az első képsíkra merőlegesen, de a második képsíkkal nem párhuzamosan. Az F
főpont első vetülete az O′ pontból a perspektíva képsíkjának első vetületére, K′-re húzott merőleges talppontja. A 7.143.
ábrán látható alakzat tetszőleges P pontjának perspektív képét a fentiek szerint szerkesztettük, és mindkét vetületen
megjelöltük. A perspektíva K képsíkja a második képsíkkal nem párhuzamos, így a centrális vetület második képe már nem
egybevágó a centrális vetülettel. Helyezzük el a perspektíva képsíkját a rajz síkjában, a horizontvonalon valahol jelöljük
meg az F főpontot! A P pont Pc centrális képét megkaphatjuk, ha meghatározzuk a v = Pc″H″ és az u = Pc′F′ távolságokat a
merőleges vetületeken, és ezeket átmásoljuk.
Párhuzamos egyenesek perspektív képei egy ponton mennek át. Az ábrán a PE egyenes I2 iránypontját könnyen
kijelölhetjük. Az O′ ponton át P′E′-vel húzott párhuzamos egyenes K′-ből kimetszi az I2 iránypont első vetületét. Az I
iránypont a horizontvonalon helyezkedik el, az F′I′2 = FI2 egyenlőség alapján a perspektív képen is megkereshető. Mivel egy
objektumon rendszerint több párhuzamos él van, többnyire kevés iránypont szerkesztésére van szükség.
Bicentrális ábrázolás
A centrális vetítéssel történő ábrázolás során keletkező kép hasonlatos ahhoz, amit egyik szemünkkel érzékelünk. A két
szem által észlelt centrális képek különbözők, ez kelti bennünk a térhatást. Ez a hatás mesterségesen, gra kai, mechanikai
vagy egyéb eszközökkel is elérhető, ha azt tudjuk biztosítani, hogy mindkét szemünk csak a neki megfelelő centrális
vetületet lássa. Ezzel olyan benyomásunk támad, mintha a valóságos tárgyat szemlélnénk.
Ekkor ugyanarról a tárgyról két különböző centrumból szerkesztünk centrális vetületet ugyanarra a képsíkra
vonatkozóan. (A két centrum a két szemünknek, a képsík a rajz síkjának felel meg.) Színezzük ki pirossal a jobb, zöld
színnel a bal szemünknek megfelelő vetítési centrum esetén keletkező képeket! Nézzük az ábrát egy olyan szemüveggel,
melynek bal oldali „üvege” ugyanolyan piros árnyalatú, mint a rajz piros színe, a jobb oldali „üvege” pedig a rajznak
megfelelő zöld árnyalatú. Ekkor a jobb szemünk csak a piros, a bal szemünk csak a zöld ábrát, azaz mindkét szemünk a neki
megfelelő centrális vetületet látja. A térben látszólagosan megjelenő alakzat fekete és erőteljesen térhatású.
7.144. ábra
7.145. ábra
7.146. ábra
A sztereogra kus projekció egyik legfontosabb gyakorlati alkalmazása a térképkészítés. A 7.147. ábrán a földgömb déli
felének sztereogra kus projekciója látható az északi pólusból, a szélességi és hosszúsági körök vetületeit 10 fokonként
adtuk meg. A 7.148. ábrán a keleti felének a nyugati félteke középpontjából való sztereogra kus projekcióját ábrázoltuk, a
szélességi és hosszúsági körök vetületeit ismét 10 fokonként adtuk meg.
A sztereogra kus projekció jól alkalmazható a matematikán belül is, körökkel és egyenesekkel kapcsolatos problémák
megoldásánál (inverzió, körsorok, Apolloniosz-feladatok, hiperbolikus sík modellezése stb.).
Itt említünk meg egy olyan vetítést, melynél a gömbfelületet egy azt valamely főkörében érintő véges forgáshenger
felületére vetítjük (7.149a ábra). A vetítőegyenesek merőlegesen metszik az érintőhenger tengelyét. A leképezés
területtartó. A hengerpalástot síkba fejtve az úgynevezett Mercator-térképet kapjuk. (A 7.149b ábrán egy félgömbhöz
tartozó 10 fokonkénti hosszúsági és szélességi körök vetületei láthatók a síkba fejtés után.)
7.147. ábra
7.148. ábra
7.149. ábra
Irodalom
Bancsik Zs.–Lajos S.–Juhász I.: Ábrázoló geometria kezdőknek. link, mobiDIÁK könyvtár, Debreceni Egyetem, 2004
Brauner, H.: Lehrbuch der Konstruktiven Geometrie. VEB Fachbuchverlag, Leipzig, 1986
Coxeter, H. S. M.: Projektív geometria. Gondolat Kiadó, Budapest, 1986
Giering, O.–Seybold, H.: Konstruktive Ingenieurgeometrie. Karl Hanser Verlag, München–Wien, 1987
H. Temesvári Á.–Szakál P.–Németh L: Ábrázoló geometria – EMK hallgatóinak. Mezőgazda Kiadó–NyME EMK, Sopron,
2007
H. Temesvári Á.–Szakál P.–Németh L.: Ábrázoló geometria – FMK hallgatóinak. Mezőgazda Kiadó–NyME FMK, Sopron,
2008
Hajdu E.–H. Temesvári Á.: Konstruktív geometria. Mezőgazdasági Szaktudás Kiadó, Budapest, 1995
Hajós Gy.: Bevezetés a geometriába. Tankönyvkiadó, Budapest, 1961
Hohenberg, F.: Konstruktive Geometrie in der Technik. Springer Verlag, Wien–New York, 1966
Horváth J.: Sztereogra kus projekció és alkalmazásai. ELTE, 1980
Juhász I.: Számítógépi geometria és gra ka. Miskolci Egyetemi Kiadó, 1993
Kárteszi F.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1952
Krames, J.: Darstellende und kinematische Geometrie. Deuticke Verlag, Wien, 1952
Müller, E.–Kruppa, E.: Lehrbuch der darstellenden Geometrie. Springer Verlag, Wien, 1948
Nagyné Szilvási M.: CAD-Iskola. TypoTEX Kft. Elektronikus Kiadó, 1991
Pál I.: Térgeometria a műszaki gyakorlatban. Tankönyvkiadó, Budapest, 1973
Petrich G.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1969
Strommer Gy.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1974
Strommer Gy.: Geometria. Tankönyvkiadó, Budapest, 1987
Vermes I.: Geometriai útmutató és példatár (BME egyetemi jegyzet). Tankönyvkiadó, Budapest, 1991
Wunderlich, W.: Darstellende Geometrie. Hochschultaschenbücher–Verlag, Mannheim, 1966
Zigány F.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1952
8. Vektorok
8.1. A vektor fogalma és jellemzői
8.2. Műveletek vektorokkal, vektorok a koordináta-rendszerben
8.3. Vektorok skaláris szorzata, vektoriális szorzata, vegyes szorzat
Az olyan mennyiségeket, melyek jellemzéséhez a számértéken és mértékegységen túl az irányukra is szükség van,
vektormennyiségeknek nevezzük.
Vektorok pl. az erő, a sebesség, a nyomás, a gyorsulás, a mágneses térerősség stb., míg nem vektor-, azaz skaláris
mennyiségek pl. a tömeg, a terület, a térfogat, a hőmérséklet stb. A vektormennyiségeket egyenesszakasszal szemléltetjük,
mely szakaszt egyik végén – a vektor irányításának megfelelően – egy nyíllal látjuk el. A vektor jelölésére vagy két pontot
használunk (kezdőpontját és végpontját), de gyakran félkövér kisbetűkkel jelöljük a vektorokat. A 8.1. ábrán az A pontból a
B pontba mutat az vektor, a P pontból a Q pontba mutat a vektor. Azt mondjuk, hogy az a vektor
kezdőpontja az A pont, végpontja a B pont, a b vektor kezdőpontja P, végpontja Q.
8.1. ábra
Egy vektort abszolút értékének a vektor hosszát nevezzük és így jelöljük: | a |. Az olyan vektort, melynek kezdőpontja
megegyezik végpontjával, nullvektornak mondjuk. A nullvektor tehát olyan vektor, melynek hossza 0, és megállapodás
szerint iránya tetszőleges. A nullvektor minden vektorral párhuzamos és egyben minden vektorra merőleges.
Két vektor akkor és csak akkor egyenlő, ha nagyságuk, állásuk és irányuk is megegyezik. Ez azt jelenti, hogy ha egy
vektort önmagával párhuzamosan eltolunk a térben, ugyanazt a vektort kapjuk.
Vektorok összeadása
Vektorok különbsége
Skalárral való szorzás
Vektorok a koordináta-rendszerben
Vektorok összeadása
A vektorokat kétféleképpen adhatjuk össze: paralelogrammamódszerrel vagy háromszögmódszerrel.
Az a és b vektorok összegét úgy képezzük, hogy az a és b vektorokat közös kezdőpontba toljuk, kiegészítjük
paralelogrammává; az a és b vektorok a + b összege a paralelogramma közös kezdőpontjából induló átlóvektor (8.2a
ábra). Ezt az eljárást paralelogrammamódszernek hívjuk.
8.2. ábra
Az a és b vektorokat úgy is összeadhatjuk, hogy az egyik összeadandó vektort (pl. b-t) úgy toljuk el, hogy annak
kezdőpontja a másik (a) vektor végpontjába essen; a két vektor összege az a vektor kezdőpontjából a b vektor
végpontjába mutató vektor (8.2b ábra). Ezt az eljárást háromszögmódszernek nevezzük.
A háromszögmódszer nagy előnye, hogy segítségével több vektort is gyorsan összeadhatunk; nem kell mást tennünk,
csak az összeadandó vektorokat egymást követően egymáshoz csatlakoztatni, majd az első vektor kezdőpontját az utolsó
vektor végpontjával összekötni (8.3. ábra).
8.3. ábra
A két módszer természetesen ugyanahhoz az eredményhez vezet, s hogy éppen melyik módszert alkalmazzuk két
vektor összegzésekor, azt a konkrét probléma döntheti el. A vektorok összeadása kommutatív (felcserélhető) és asszociatív
(csoportosítható) művelet:
Az összeadás e két tulajdonsága lehetővé teszi, hogy akárhány (de véges sok) vektor összegezésénél az egyes vektorokat
tetszőleges sorrendben, tetszőlegesen csoportosítva adhatjuk össze.
Vektorok különbsége
Az a vektor ellentettje (–1-szerese) az a vektor, melynek nagysága és állása megegyezik az a vektor nagyságával és
állásával, iránya pedig az a vektor irányának ellentéte.
Az a vektor ellentett vektorát –a-val jelöljük. Az a vektor ellentettjének ellentettje maga az a vektor. A 8.4. ábra egy a
vektort és ellentettjét ábrázolja.
8.4. ábra
Az a és b vektorok a – b különbségét úgy képezzük, hogy az a vektorhoz hozzáadjuk a b vektor ellentettjét (8.5a ábra).
8.5. ábra
Az a és b vektorok különbségét úgy is megkaphatjuk, ha a két vektort közös kezdőpontba toljuk; az a – b vektor a
kivonandó vektor végpontjából mutat a kisebbítendő vektor végpontjába (8.5b ábra).
Ezek szerint két vektor összegét és különbségét egyszerre szemléltethetjük, ha a vektorokat közös kezdőpontba toljuk,
kiegészítjük paralelogrammává; e paralelogramma két átlóvektora közül a közös kezdőpontból induló a két vektor összege,
a kisebbítendő vektor végpontjából induló pedig a két vektor különbsége (8.6. ábra).
8.6. ábra
Legyen k egy tetszőleges valós szám. Ekkor a k · a vektor olyan vektor, mely az a vektorral párhuzamos, és hossza az a
vektor hosszának k-szorosa. Ha k pozitív, akkor a k · a vektor az a vektorral egyirányú, ha k negatív, akkor a k · a vektor
az a vektorral ellentétes irányú.
Ha az a vektor a nullvektor, vagy ha k = 0, akkor a szorzás eredménye a nullvektor lesz. E de nícióból az is következik,
hogy ha k és l valós számok, akkor
Ez tehát azt jelenti, hogy valós szám és vektor szorzása a számtényező tagjaira nézve, továbbá a szám és vektor szorzása
a vektortényező tagjaira nézve is disztributív művelet.
Ha az a és b vektorok párhuzamosak, egyikük sem a nullvektor, akkor egyértelműen létezik olyan k valós szám, hogy a
= k · b. Ha az a és b vektorok egyirányúak, akkor k pozitív, ha a és b ellentétes irányú vektorok, akkor k negatív (8.7. ábra).
8.7. ábra
Gyakran van szükségünk egy a vektor irányával megegyező egységvektorra. Ha az a vektort megszorozzuk abszolút
értékének reciprokával, azaz a k skalárszorzó , akkor olyan vektorhoz jutunk, melynek állása és iránya
megegyezik az a vektor állásával és irányával, abszolút értéke pedig 1. Az ilyen vektort mondjuk az a vektor
egységvektorának, és így jelöljük: a0 vagy ea.
Ha a, b és v a sík olyan vektorai, hogy a és b nem párhuzamos, akkor egyértelműen léteznek olyan k és l valós számok,
hogy v = k · a + l · b, másképpen fogalmazva: a sík tetszőleges v vektora egyértelműen felbontható két, nem párhuzamos
vektorral párhuzamos vektorok összegére (8.8. ábra).
8.8. ábra
Ez tehát azt jelenti, hogy ha a sík valamely v vektorára v = k1·a+l1·b = k2·a + l2·b, akkor k1 = k2 és l1 = l2.
Megjegyzés. Ha adottak az a, b és v vektorok, ahol a nem párhuzamos b-vel, akkor a v vektort a következőképpen
bonthatjuk fel a-val és b-vel párhuzamos összetevőkre. Először a három vektort közös kezdőpontba toljuk, majd a v
vektor P végpontján keresztül húzunk egy párhuzamos egyenest b-vel, O kezdőpontján keresztül pedig a-val. E két
egyenesnek lesz egy M metszéspontja, hiszen a és b nem párhuzamosak. Ekkor valamely k és l valós számokra OM =
k · a és MP = l · b, így .
Ha a, b és c térbeli vektorok nincsenek egy síkban, és v a tér egy tetszőleges vektora, akkor egyértelműen léteznek
olyan k, l, m valós számok, hogy
Másképpen fogalmazva: a tér tetszőleges v vektora egyértelműen felbontható három, nem egysíkú vektorral
párhuzamos vektorok összegére (8.9. ábra).
8.9. ábra
8.10. ábra
szerint .
2. Az ABCDA′B′C′D′ kocka egy csúcsból induló élvektorai: a, b, c (8.11. ábra). Legyen O a BCC′B′ oldallap középpontja,
F a C′D′ él felezőpontja. Fejezzük ki az a, b, c vektorokkal az alábbi vektorokat:
a)
b)
c)
8.11. ábra
a)
Mivel ezért .
b)
.
c) .
3. Az előző feladat megadott csúcsaiból indítjuk az alábbi vektorokat. Hol lesz a kérdéses vektor végpontja?
a) B-ből indítva a vektor,
b)
F-ből indítva az vektor,
c)
O-ból indítva a .
a) B-ből indítva a b vektort C-be jutunk, C-ből indítva a c vektort C′-be jutunk, C′-ből indítva a vektort F-be
jutunk. Tehát a kérdéses vektor végpontja az F pont.
b)
Az F-ből indított vektor végpontja a BC él felezőpontja.
c)
Az O-ból indított vektor végpontja a DD′ él D-n túli meghosszabbításán van D-től a kocka éle
felének távolságára.
4. Az ABC háromszög súlypontja S, a BC oldal felezőpontja F. Legyen .
Fejezzük ki az a és c vektorokkal az SF vektort! (lásd 8.12. ábra).
8.12. ábra
Az vektor az vektor kétharmad része, ahol E pont az AB oldal felezőpontja. Mivel , így
. Ezek szerint
5. Legyen O az ABC háromszög síkjának egy tetszőleges pontja. O-ból a háromszög csúcsaiba mutató vektorok: a, b
és c. Határozzuk meg az O-ból a háromszög S súlypontjába mutató vektort!
8.13. ábra
A keresett vektor: . De , tehát
. Tehát
8.14. ábra
Ezek szerint .
Vektorok a koordináta-rendszerben
Ha a vektorokat számokkal akarjuk jellemezni, akkor erre jó lehetőséget ad síkban, illetve térben a derékszögű koordináta-
rendszer. Vegyünk fel a síkban két egymásra merőleges egységvektort (i és j vektort) úgy, hogy az i vektort +90°-os
elforgatás vigye át a j vektorba, majd vegyük az i és j vektorokat tartalmazó egyeneseket! Ezzel megadtunk egy síkbeli
derékszögű koordináta-rendszert, melyben az egység mindkét tengelyen a megadott vektorok hossza. Az i vektort
tartalmazó egyenest szokás x tengelynek (vagy 1-es tengelynek), a j vektort tartalmazó tengelyt y tengelynek (2-es
tengelynek) nevezni. Az i és j vektorokat alapvektoroknak hívjuk. Ezek egyben helyvektorok.
Helyvektornak nevezzük az olyan vektort, melynek kezdőpontja a koordináta-rendszer origójában van. Helyvektor
koordinátái a vektor végpontjának a koordinátái.
Ezek szerint az i vektor koordinátái (1; 0), a j vektor koordinátái (0; 1). Ha valamely v helyvektor koordinátái v1, v2,
akkor azt általában így jelöljük: v(v1; v2). Ha olyan vektort adunk meg a koordináta-rendszerben, melynek kezdőpontja
nem az origó (azaz nem helyvektorról van szó), akkor azt szabadvektornak nevezzük. Egy szabadvektor koordinátái a vele
egyenlő helyvektor koordinátái.
A sík bármely P(v1; v2) pontjába mutató v helyvektor egyértelműen felírható az i, j alapvektorok segítségével v = v1i + v2j
alakban, ahol v1 és v2 a v vektor koordinátái (8.15. ábra).
8.15. ábra
Két vektor összegének és különbségének koordinátái a megfelelő koordináták összege, illetve különbsége.
E tétel tehát azt jelenti, hogy ha a(a1; a2), b(b1; b2), akkor a + b(a1 + b1; a2 + b2) és a – b(a1 – b1; a2 – b2) (8.16. ábra).
8.16. ábra
A kapott egyenlőségek pedig éppen azt mutatják, hogy az összeg-, illetve a különbségvektor koordinátái az eredeti
vektorok megfelelő koordinátáinak összege, illetve különbsége.
Ha tehát a(a1; a2) és k egy valós szám, akkor k · a(k · a1; k·a2 (lásd 8.17. ábra).
8.17. ábra
Mivel a paralelogramma átlói felezik egymást, így két vektor összegének a fele éppen a közös kezdőpontból induló átló
felezőpontjába mutat, tehát kimondhatjuk:
Az AB szakasz felezőpontjának koordinátái a megfelelő koordináták számtani közepe, azaz, ha A(a1, a2), B(b1; b2), akkor
az AB szakasz F felezőpontja:
Példák
1. Adottak az a(2; –2), b(1; 6), c(–4; 3) vektorok. Határozzuk meg az alábbi vektorok koordinátáit:
a) a + b + c,
b) a – 2b – c,
c)
2. Adottak a v(6; –4), a(–2; 1) és b(2; 5) vektorok. Írjuk fel a v vektort az a és b vektorokkal párhuzamos vektorok
összegeként!
Legyen v = k · a + l · b. Ez azt jelenti, hogy
hozzáadva azt kapjuk: 12l = 2, ahonnan . Ezt valamelyik eredeti egyenletbe (pl. az elsőbe)
3. Tükrözzük az A(2; 4) pontot a B(6; 6) pontra, és határozzuk meg a tükörkép koordinátáit! Ábrázoljuk a megadott
pontokat, illetve a tükrözés után kapott A′ pontot egy koordináta-rendszerben! Az A és B pontokba mutató
helyvektorokat jelöljük a-val, illetve b-vel (8.18. ábra)!
8.18. ábra
Ezek szerint az A′ pont első koordinátája 12 – 2 = 10, második koordinátája: 12 – 4 = 8. Az A pont B pontra vonatkozó
tükörképe: A′ (10; 8).
Térbeli vektorokkal hasonló módon számolhatunk térbeli koordináta-rendszerben, mint a síkbeli esetben.
Legyen adott a térben három egy pontból induló félegyenes: e, f és g. Ha egy 180°-nál kisebb elforgatás az e egyenest f-be
viszi át, és ez az elforgatás g felől nézve pozitív irányú, akkor az e, f, g egyeneseket jobbrendszernek (jobbsodrású
rendszernek) nevezzük.
Vegyünk fel a térben három, egymásra páronként merőleges egységvektort: i-t, j-t és k-t úgy, hogy az őket tartalmazó
félegyenesek jobbsodrású rendszert alkossanak! Az e vektorokat tartalmazó egyenesek egy térbeli koordináta-rendszert
alkotnak, melyen az egység mindhárom tengelyen a vektorok hossza. E térbeli koordináta-rendszer i, j és k vektorait
alapvektoroknak nevezzük. Ezen alapvektorok térbeli helyvektorok, koordinátáik i(1; 0; 0), j(0; 1; 0), k(0; 0; 1).
A tér tetszőleges v helyvektora egyértelműen felírható az i, j, k alapvektorok segítségével
Térbeli vektorokkal kapcsolatos műveletekre ugyanazok a tételek érvényesek, mint a síkbeli vektorok esetében.
Az a(a1; a2; a3) és b(b1; b2; b3) vektorok összegének, illetve különbségének koordinátái:
Skaláris szorzat
Vektoriális szorzat
Vegyes szorzat
Skaláris szorzat
Az a és b vektorok skaláris szorzata: a · b = | a | · | b | · cos φ, ahol φ a két vektor által közbezárt szög.
Tehát két vektor skaláris szorzata egy háromtényezős szorzat, mely tényezők valós számok.
Ha az a és b vektorok párhuzamosak egymással, akkor φ = 0 vagy φ = 180°, ennek megfelelően cos φ = 1, vagy cos φ = –1.
Ekkor tehát
Ha az a és b vektorok merőlegesek egymásra, akkor cos φ = 0, ekkor tehát a · b = 0. Ennek megfordítása is igaz:
A skaláris szorzat kommutatív művelet: a · b = b · a, hiszen a valós számok körében a szorzás kommutatív és asszociatív
művelet. Igaz továbbá, hogy
8.20. ábra
A koordináta-rendszer i, j, k alapvektoraira
(8.1)
Az a(a1, a2; a3) és b(b1, b2; b3) vektorok skaláris szorzata a megfelelő koordináták szorzatainak összege.
8.21. ábra
b)
Az vektor abszolút értéke: . Az és vektorok hajlásszöge 30°, így e két
vektor skaláris szorzata:
8.22. ábra
b)
. A két vektor hajlásszöge 120°, így
c)
. A két vektor hajlásszöge 30°, tehát
a) a · b = –9 – 8 = –17,
b) a – b = 6 – 4 – 6 = –4,
c) a · b = 2n2 + 2n2 + 2n2 = 6n2.
4. Határozzuk meg a b vektorban szereplő b paraméter értékét úgy, hogy a következő két vektor merőleges legyen
egymásra: a(3; –2; 1), b(b; 3; –4).
A két vektor akkor és csak akkor merőleges egymásra, ha skaláris szorzatuk 0, azaz
5. Határozzuk meg a b vektorban szereplő b paraméter értékét úgy, hogy a következő két vektor hajlásszöge 60°
legyen: a(–1; 2), b(1; b).
Az a és b vektorok skaláris szorzata: a · b = –1 + 2b. A két vektor abszolút értéke:
Az egyenlet jobb oldala pozitív, így szükséges, hogy legyen. A (8.2) egyenlet mindkét oldalát 2-vel
szorozva, majd mindkét oldalt négyzetre emelve azt kapjuk:
8.23. ábra
Tehát a BMA ∠ = 90°, így az M pont valóban rajta van az ABC háromszög köré írható körén. (Az és
vektorok koordinátáiból az is látszik, hogy e két vektor abszolút értéke egyenlő, vagyis az ABM háromszög
egyenlő szárú.)
Vektoriális szorzat
Két vektor között értelmezünk egy olyan szorzási műveletet, melynek eredménye szintén vektor; ezt a szorzást vektoriális
szorzatnak nevezzük.
Két vektor vektoriális szorzata akkor és csak akkor nullvektor, ha a két vektor párhuzamos egymással.
a) Ha ugyanis a két vektor egyike nullvektor, akkor az állítás nyilvánvaló, hiszen a nullvektor tetszőleges irányú, így
a két vektort párhuzamosnak mondhatjuk. Ha egyik vektor sem a nullvektor, akkor a közbezárt φ szögre sin φ =
0, ami azt jelenti, hogy vagy φ = 0°, vagy φ = 180°, tehát a két vektor párhuzamos.
b) Ha a két vektor párhuzamos, akkor vagy az egyikük nullvektor, tehát a szorzat nullvektor, vagy φ = 0°, vagy φ =
180°, tehát ekkor sin φ = 0, így a vektoriális szorzat eredménye nullvektor.
Ha az a és b nem párhuzamos vektorokat közös kezdőpontba toljuk (8.24. ábra), akkor az a × b vektoriális szorzat
abszolút értéke a két vektor által kifeszített paralelogramma területével egyenlő. A vektoriális szorzat de níciójából
egyenesen következik, hogy ez a szorzás nem kommutatív művelet; az a × b és b × a vektorok egymásnak ellentett vektorai:
a × b = – b × a.
A vektoriális szorzat fontos tulajdonságai még:
Az első azonosság azt mutatja, hogy a vektoriális szorzat bármely tényezőjét egy valós számmal szorozva az egész
szorzat megszorzódik a kérdéses valós számmal, a másik két azonosság szerint pedig kimondhatjuk, hogy a vektoriális
szorzat bármely tényezőjének tagjaira nézve disztributív művelet. (Az utóbbi két azonosság mindkét tagját ki kell
mondanunk, hiszen a vektoriális szorzat nem kommutatív művelet.)
Ha i, j és k a térbeli derékszögű koordináta-rendszer alapvektorai, akkor a vektoriális szorzat de níciójából következik:
(8.3)
A 3.6. fejezetben megismerkedtünk a másodrendű determináns fogalmával. Mivel a vektoriális szorzat kiszámításánál
elengedhetetlenül szükséges, ezért most tárgyaljuk a harmadrendű determináns fogalmát és kiszámítási módját.
Harmadrendű determinánsnak mondjuk az alábbi típusú 3 × 3-as számtáblázatot:
(8.4)
A (8.4) harmadrendű determinánshoz hozzárendelünk egy valós értéket, melyet az alábbi módon számíthatunk ki:
(8.5)
A determináns értéke nem változik, ha valamely sorának (oszlopának) számszorosát hozzáadjuk egy másik sorhoz
(oszlophoz). A determináns értéke –1-szeresére változik, ha két sorát (vagy két oszlopát) felcseréljük.
Az a(a1; a2; a3), b(b1, b2; b3) koordinátákkal adott térbeli vektorok vektoriális szorzata:
Végezzük el az a × b = (a1i + a1j + a3k) × (b1i + b2j + b3k) szorzást tagonként a vektoriális szorzás tulajdonságainak
megfelelően.
Példák
1. Számítsuk ki az alábbi vektorok vektoriális szorzatát:
a) a(2; –3; 4), b(2; 0; –3),
b) a(4; 2; –2), b(5; 2; 1)!
a)
Az a × b(2; –14; –5) és c(4; 2; –4) vektorok hajlásszögének meghatározásához először számítsuk ki a két vektor
skaláris szorzatát: c(a × b) = 2·4–2·14+ 5·4 = 8–28 + + 20 = 0. Tehát az a × b és c vektorok merőlegesek egymásra.
4. Számítsuk ki az előző feladat a, b, c vektoraival az a) (a × b) × c és az b) a × (b × c) vektorokat!
a) Az a × b vektort az előző feladatban kiszámoltuk: a × b(2; –14; –5). Így
b)
5. Az ABC háromszög csúcspontjainak koordinátái A(2; 1; 5), B(4; 3; –1), C(2; 2; 6). Számítsuk ki a háromszög
területét!
Legyenek a, b, c a háromszög megfelelő csúcsaiba mutató helyvektorok (8.25. ábra)! Az A csúcsból induló
oldalvektorok: c – a(0; 1; 1), b–a(2; 2; –6). Az ABC háromszög t területe az A-ból induló oldalvektorok vektoriális
szorzata abszolút értékének a fele.
(8.6)
8.25. ábra
Vegyes szorzat
A skaláris szorzat és a vektoriális szorzat bizonyos kombinációjával jutunk el vektorok vegyes szorzatához.
Az a, b és c vektorok vegyes szorzata: abc = (a × b) · c, azaz az első két tényező vektoriális szorzatának a harmadik
tényezővel vett skaláris szorzata.
Az abc jelölés merőben különbözik az (ab)c vagy a(bc) jelöléstől; utóbbi esetekben ugyanis a zárójelben szereplő
tényezők skaláris szorzatával (mint skalárral) szorozzuk a zárójelen kívüli vektort, míg az első esetben az a, b és c vektorok
imént de niált vegyes szorzatáról van szó.
A vegyes szorzat de níciójában két vektor vektoriális szorzatának (tehát egy vektornak) és egy vektornak skaláris
szorzatáról van szó, amiből következik, hogy a vegyes szorzat skaláris mennyiség.
Ha az a és b vektorok párhuzamosak, akkor az a, b és c vektorok egy síkban vannak. Mivel az a × b vektor merőleges
erre a síkra, ezért a × b a c vektorra is merőleges, így az a, b és c vektorok vegyes szorzata 0. Ha az a és b vektorok nem
párhuzamosak, akkor vektoriális szorzatuk merőleges az a és b vektor által kifeszített síkra. A c vektor akkor és csak akkor
merőleges az a × b vektorra, ha c is benne van e síkban. Ekkor viszont a c vektornak a × b-vel vett skaláris szorzata 0. Ezek
szerint kimondhatjuk:
Három vektor akkor és csak akkor van egy síkban, ha vegyes szorzatuk 0.
Ha az a, b és c vektorokat közös kezdőpontba toljuk, akkor együtt egy paralelepipedont feszítenek ki (8.26. ábra).
8.26. ábra
E paralelepipedonnak az a és b vektorok által kifeszített alaplapjának területe |a × b|. Mivel a c vektornak az a×b
vektorra eső merőleges vetülete |c| · cos φ – ahol φ a c vektor és az a × b vektor hajlásszöge –, ami egyben a paralelepipedon
alaplapjához tartozó magassága, így kimondhatjuk az alábbi tételt:
Az a, b és c vektorok vegyes szorzata az a, b és c vektorok által kifeszített paralelepipedon térfogatával egyenlő (feltéve,
hogy az a, b és c vektorok jobbsodrású rendszert alkotnak).
Megjegyzés. Természetesen, ha az a, b és c vektorok nem jobbsodrású rendszert alkotnak, akkor az abc vegyes
szorzat a paralelepipedon térfogatának –1-szeresét adja. A most kimondott tétel természetesen csak nem egy síkban
levő, tehát paralelepipedont kifeszítő vektorokról szól.
Az a(a1; a2; a3), b(b1; b2; b3), c(c1; c2; c3) vektorok vegyes szorzata
(8.7)
(8.8)
De – mint az előbb láttuk – abc = bca = (b × c) · a = a · (b × c). Ezt (8.8)-cal egybevetve azt kapjuk:
Vagyis a vektorok vegyes szorzatában a kétféle szorzás műveletét felcserélve a vegyes szorzat értéke nem változik.
Szokás ezt a vektorok vegyes szorzatára vonatkozó felcserélési tételnek nevezni.
Ha három nem egy síkú vektor között végzünk többszörös vektoriális szorzást, akkor meglehetősen hosszadalmas
számolást kell elvégeznünk. Ennek egyszerűbb elvégzéséről szól a kifejtési tétel.
tehát
Ezzel
A kapott eredményt (8.9)-cel egybevetve kapjuk a kifejtési tétel helyességét az i vektorra. Teljesen hasonló módon
adódik a j és k vektorok együtthatóinak egyenlősége.
Példák
1. Számítsuk ki az alábbi a, b, c vektorok abc vegyes szorzatát!
2. Adottak az a(4; –1; 2), b(1; 2; 3), c(3; 3; c) vektorok. Határozzuk meg a c vektorban szereplő c paraméter értékét úgy,
hogy a három vektor egy síkú legyen! A három vektor akkor és csak akkor egy síkú, ha vegyes szorzatuk 0.
3. Számítsuk ki az A(–2; 4; 3), B(2; 1; –1), C(3; –4; –2) pontok és az origó által meghatározott tetraéder térfogatát!
Legyenek az A, B, C pontba mutató helyvektorok rendre a, b és c. A keresett tetraéder térfogata az a, b és c
vektorok által kifeszített paralelepipedon térfogatának hatodrésze; a paralelepipedon térfogata az abc vegyes
szorzat abszolút értéke:
(8.10)
(8.11)
A kapott eredményt (8.11)-gyel egybevetve valóban (a × b) × c = (ac)b – (bc)a.
9. Szögfüggvények
9.1. A hegyesszög szögfüggvényei
9.2. Szögfüggvények általánosítása
9.3. Szögfüggvények alkalmazása háromszögekkel kapcsolatos problémák
megoldására
9.4. Trigonometrikus egyenletek
9.5. Trigonometrikus függvények és inverzeik
9.6. Gömbháromszögek és tulajdonságaik
Már az ókorban is tudták azt, hogy ha két derékszögű háromszög egy-egy hegyesszögében megegyezik, akkor a két
háromszög hasonló, vagyis megfelelő oldalaik aránya egyenlő. Ez tehát azt jelenti, hogy a derékszögű háromszög valamely
két oldalának arányát a háromszög egyetlen hegyesszöge egyértelműen meghatározza. E felismerés vezetett az első olyan
táblázatok megalkotásához, melyekben a különböző fokokhoz tartozó oldalarányokat (valamely befogó és az átfogó
arányát, két befogó arányát stb.) foglalták össze; így születtek meg az első „szögfüggvény-táblázatok”. Ezek birtokában már
konkrét számításokat lehetett végezni egy derékszögű háromszögben valamely oldal és valamely szög ismeretében. Mivel
bármely sokszög háromszögekre és bármely háromszög derékszögű háromszögekre bontható, így a derékszögű
háromszögekben az oldalak arányának valamely hegyesszöggel való kapcsolata egyre nagyobb jelentőséggel bírt, így
megszületett a háromszögtan, azaz a trigonometria (görögül tri = három, go = szög, metria = mérés).
(ejtsd: szinusz alfa, koszinusz alfa, tangens alfa, kotangens alfa, szekáns alfa, koszekáns alfa).
A 9.1. ábrát tekintve tehát a de níció szerint
9.1. ábra
A de níciókból világos, hogy bármely hegyesszög szinusza, koszinusza, tangense és kotangense pozitív mennyiség.
Mivel a derékszögű háromszög átfogója mindig nagyobb bármelyik befogónál, ezért bármely hegyesszög esetében sin α < 1
és cos α < 1. (Ugyanez egy szög tangensének és kotangensének esetében nem mondható el; ezek bármilyen kicsik vagy
bármilyen nagyok lehetnek.)
Pitagorasz tételének ismeretében elegendő lenne egyetlen szögfüggvényt használnunk, mert azzal (bármelyikkel) a
derékszögű háromszög minden adata már kiszámolható lenne, de a számítások meggyorsítása érdekében általában négy
szögfüggvényt használunk: a sin, cos, tg és ctg szögfüggvényeket. A továbbiakban mi is e négy szögfüggvényre
szorítkozunk csak.
A 9.1. ábra jelöléseivel
Bármely szög szinusza egyenlő pótszögének koszinuszával, és bármely szög tangense egyenlő pótszögének
kotangensével, vagyis
Most emeljük négyzetre egy hegyesszög szinuszát és koszinuszát, majd adjuk ezeket össze:
ezek összege
(9.1)
(9.2)
A különböző szögfüggvények közötti újabb összefüggéshez jutunk, ha a tg α-t, illetve ctg α-t de niáló törtek
számlálóját és nevezőjét is elosztjuk a háromszög átfogójával.
Bármely szög tangense egyenlő ugyanazon szög szinuszának és koszinuszának a hányadosával, és bármely szög
kotangense egyenlő ugyanazon szög koszinuszának és szinuszának a hányadosával:
(9.3)
A (9.1), (9.2) és (9.3) összefüggések lehetőséget nyújtanak arra, hogy bármely szögfüggvényt bármely másik
szögfüggvénnyel kifejezhessünk. Fejezzük ki pl. sin α-t tg α-val. (9.3)-ból sin α = tg α · cos α, de (9.1)-ből cos
, így írhatjuk
Mindkét oldalon pozitív mennyiségek szerepelnek, így négyzetre emelve azt kapjuk:
ahonnan
sin α sin α
cos α cos α
tg α tg α
ctg α ctg α
9.2. ábra
Megjegyzés. Könnyen meghatározhatjuk táblázat és számológép nélkül a 15°, a 75°, a 22,5°, a 72° és a 18°
szögfüggvényeit is.
A 15° és a 75° szögfüggvényeinek meghatározásához vegyünk fel egy olyan derékszögű háromszöget, melynek egyik
szöge 15°, rajzoljuk meg ennek átfogóhoz tartozó magasságát és súlyvonalát (9.3. ábra)!
9.3. ábra
Az AFC háromszög egyenlő szárú háromszög, így FCA∠ = FAC∠ = 15°. Ennek a háromszögnek a TFC szög egy külső
szöge, így TFC∠ = 30°. Ez azt jelenti, hogy TCF∠ = 60°, vagyis a TFC háromszög egy félszabályos háromszög. Ha az
ABC háromszög átfogóhoz tartozó magassága 1, akkor FC = 2 és . Ezek szerint , tehát
Ezek után már az ATC derékszögű háromszögből 15° és 75° összes többi szögfüggvénye meghatározható.
(Természetesen ezeket a szögfüggvényeket az egyes szögfüggvényeknek más szögfüggvénnyel való kifejezését
tartalmazó táblázat alapján is meghatározhattuk volna.)
A 22,5° szögfüggvényeinek meghatározásához vegyünk fel egy egységnyi befogójú egyenlő szárú derékszögű
háromszöget, és rajzoljuk be annak egyik befogójához tartozó szögfelezőjét (9.4. ábra)!
9.4. ábra
Így . A 22,5° többi szögfüggvényértékeit pedig vagy az említett táblázat alapján, vagy
pedig Pitagorasz tételének segítségével már könnyen meghatározhatjuk.
A 18° és 72° szögfüggvényeinek meghatározásához vegyünk fel egy olyan egyenlő szárú háromszöget, melynek alapja
1, az alapon fekvő szögei pedig 72°-osak, és rajzoljuk meg az egyik szárhoz tartozó szögfelezőt (9.5.ábra)!
9.5. ábra
A háromszög szárszöge ACB∠ = 36°. Ebből következik, hogy az ADC és az ABD háromszögek is egyenlő szárú
háromszögek, és az ABD háromszög hasonló az eredeti ABC háromszöghöz. Így
9.6. ábra
9.7. ábra
Az n oldalú szabályos sokszög középpontját a csúcsokkal összekötve n db egyenlő szárú háromszög keletkezik,
melyek szárszöge . A kör R sugara e háromszögek szárával egyenlő. A 9.7a ábra megfelelő háromszögére
9.8. ábra
A BCJ derékszögű háromszögben ahonnan h = 4,6 · sin 52° ≈ 4,6 · 0,788 ≈ 3,62 m. Az ACD
derékszögű háromszögben , ahonnan y = 4,6 · sin 32° ≈ 2,44 m. A két ablakpárkány közti távolság h
– y ≈ 1,18 m.
4. Egy hegycsúcsot két expedíció akart egyszerre meghódítani. Az egyik csapat a keleti oldalról indult, 464 m utat
kellett megtenniük, amely a vízszintessel 28°-os szöget zár be. A másik csapat (ugyanolyan magassági szintről
indulva) a nyugati oldalon mászta meg a hegyet, nekik 38°-os emelkedési szögű utat kellett megtenniük. A keleti
oldalon menők 2,4 km/h sebességgel, a meredekebb nyugati oldalon menők 1,4 km/h sebességgel haladtak.
Melyik csapat ért előbb célba?
Tekintsük a 9.9. ábrát, melyen m-mel jelöltük a hegy magasságát, s-sel a nyugati oldalon haladók által megteendő
utat.
9.9. ábra
Mivel F az AC oldalfelező pontja (9.10. ábra), ezért CF = 4,2 cm. A BCF háromszögben , ahonnan β
= 45°.
9.10. ábra
Az E pont a BC oldal felezőpontja, így EC = 2,1; az AEC háromszögben , ahonnan α ≈ 14°. A β szög az
ASF háromszögnek egy külső szöge, így a súlyvonalak φ hajlásszöge φ = β – α ≈ 45° – 14° ≈ 31°.
6. Egy háromszög egyik oldala a, szemközti szöge α. Igazoljuk, hogy a háromszög köré írt körének R sugara:
Tekintsük a 9.11. ábrát! A kerületi és középponti szögek tételéből következik, hogy BOC ∠ = 2α, tehát BOF ∠ = α. A
9.11. ábra
7. Számítsuk ki
a) az ABCDA’B’C’D’ kocka AC’ testátlójának az ABCD lappal bezárt szögét,
b) az ABCD szabályos tetraéder AD élének az ABC lappal bezárt szögét,
c) a szabályos tetraéder két lapjának hajlásszögét,
d) a négyzet alapú szabályos gúla oldalélének az alaplappal bezárt szögét,
e) a négyzet alapú szabályos gúla oldallapjának az alaplappal bezárt szögét!
a) Legyen a kocka minden éle 1. A 9.12a ábrán α-val jelöltük a keresett szöget. A besatírozott derékszögű
9.12. ábra
b) Legyen a szabályos tetraéder minden éle 1. A 9.12b ábrán α-val jelöltük az oldalél és az ABC háromszöglap
hajlásszögét. Mivel a D csúcsból induló m magasság T talppontja az ABC háromszögnek súlypontja, ezért
, ahonnan α = 45°. (Ez egyben azt is jelenti, hogy a CTE háromszög egyenlő szárú, vagyis
.)
e)
Az ETF háromszögben , így , ahonnan β ≈ 54,7°.
8. Egy 24 m magas ház tetejéről a szemközti ház teteje 22°-os emelkedési szögben, a szemközti ház alja 36°-os
depressziós szögben látszik. Milyen magas a szemközti ház? Tekintsük a 9.13. ábrát! A BCD derékszögű
háromszögben BD = h = 24 m.
9.13. ábra
9.14. ábra
(9.4)
(9.5)
10. Egy kálváriadomb tetején áll egy kis kápolna. A dombon a kápolnához vezető út 340 m, ennek emelkedési szöge
22°. A domb aljáról a kápolna teteje a dombhoz viszonyítva 3°-os emelkedési szögben látszik (9.15. ábra). Milyen
magas a kápolna? A 9.15. ábra jelöléseit használjuk. Az ábra megfelelő derékszögű háromszögeiből
9.15. ábra
Innen a kápolna h magassága: h ≈ 0,4663·315,2 – 127,36 ≈ 19,6 m.
9.16. ábra
A fenti de níciókból következnek sin α és cos α lehetséges értékei: bármely α szög esetében
Ha az i egységvektort 360°-nál nagyobb szögben forgatjuk el az origó körül, akkor olyan helyzetbe kerül, mely már
korábban előfordult; pontosabban fogalmazva, ha az α irányított szöggel elforgatott i egységvektort akárhányszor és
akármilyen irányban elforgatjuk 360°-kal, akkor ugyanabba a helyzetbe kerül, mint eredetileg, így ennek koordinátái,
tehát a kérdéses szög szinusza, illetve koszinusza nem változik. Azt mondjuk, hogy a szinusz-, illetve koszinuszfüggvények
360°-onként (vagy másképpen 2π szerint) periodikusak.
Mint láttuk tg α csak akkor értelmezhető, ha cos α ≠ 0; ez azt jelenti, hogy , és ctg α csak akkor
értelmezhető, ha sin α ≠ 0, ami azt jelenti, hogy α ≠ k · π, ahol k tetszőleges egész szám.
A 9.2a–b ábra táblázatát most már kiegészíthetjük az alábbiakkal
sin 0 1 0 –1 0
cos 1 0 –1 0 1
9.17. ábra
Ha az α szög a második síknegyedbe esik, akkor a megfelelő e egységvektort az y tengelyre tükrözve olyan vektorhoz
jutunk, melynek második koordinátája egyenlő az eredeti e vektor második koordinátájával, első koordinátája pedig az
eredeti e egységvektor első koordinátájának ellentettje (9.18. ábra), azaz
9.18. ábra
Hasonló módszerrel vezethetjük vissza a II., a III. és a IV. síknegyedben levő vektorokat első síknegyedbeli vektorokra.
Ezeket a következő táblázat szemlélteti.
Ha az α irányított szöggel elforgatott i egységvektort tükrözzük az y tengelyre, akkor olyan vektorhoz jutunk, melyet az
i egységvektor –α szöggel való elforgatásával nyerünk. Ebből következnek az alábbi egyenlőségek:
Példák
1. Határozzuk meg az alábbi szögfüggvények értékét
a) sin 120°, cos 150°, tg 135°;
b)
;
c) sin 2220°, cos 3000°, tg 1665°;
d)
;
a)
b)
c)
d)
2. Mivel egyenlő α, ha
a)
b)
c)
d)
e)
a)
A sin egyenlőségnek megfelelő vektorokat a 9.19a ábrán szemléltetjük.
9.19 ábra
b)
A cos egyenlőségnek megfelelő vektoroka 9.19b ábrán láthatók.
9.20 ábra
e)
Először – úgy, mint az előző d) feladatban – meghatározzuk a egyenletnek megfelelő szögeket, majd
az egyenlőtlenségnek megfelelő szögeket (9.20b ábra). Az egyenlőtlenséget kielégítő szögek: 60° + k · 360° ≤ α ≤
300° + k · 360°.
3. Számítsuk ki az alábbi kifejezések pontos értékét
a)
b)
c)
a)
b)
c)
Innen cos α = 0, vagy sin α = cos α, azaz tg α = 1. Tehát az eredeti egyenletet kielégítő értékek:
b) Az egyenlet mindkét oldalából 1-et elvéve a bal oldal könnyen szorzattá alakítható:
c) Próbáljuk elérni, hogy a megoldandó egyenletben csak egyfajta trigonometrikus kifejezés szerepeljen! Ennek
érdekében írjunk cos2 α helyébe 1 – sin2 α-t!
Addíciós tételek
Két szög összegének szinusza nem egyenlő a két szög szinuszának összegével. Ezt egy egyszerű ellenpéldán keresztül is
könnyen beláthatjuk. Legyen pl. α = 60°, β = 30°. Ekkor sin(α + β) = sin 90° = 1, de
(9.6)
Mielőtt rátérünk a tétel igazolására, vegyük gyelembe a következőket: ha egy v(v1; v2) helyvektort elforgatunk +90°-
kal az origó körül, akkor az új vektor koordinátáit úgy kapjuk meg, hogy az eredeti vektor koordinátáit felcseréljük,
majd a csere utáni első koordinátát az ellentettjére változtatjuk. Mindez könnyen kiolvasható a 9.21. ábrából.
9.21. ábra
(Ha a v vektort –90°-kal forgatjuk el az origó körül, koordinátái akkor is felcserélődnek, de ekkor a csere utáni
második koordináta változik az ellentettjére.)
Ezek után az addíciós tételek bizonyításához vegyünk fel egy koordináta-rendszert az i és j alapvektorokkal, majd
helyezzünk el egy origó középpontú, az i vektorral α szöget bezáró a egységvektort, annak + 90°-os elforgatottja
legyen az a* vektor, végül egy, az a vektorral β szöget bezáró b egységvektort (9.22. ábra)!
9.22. ábra
Az a egységvektor az i, j rendszerben
(9.7)
(9.8)
A b vektor az i, j rendszerben
(9.9)
(9.10)
Mivel a b vektornak az i és j vektorokkal való kifejezése egyértelmű, így a kapott egyenlőséget (9.9) egyenlőséggel
egybevetve az i és j vektorok megfelelő együtthatói egyenlők, azaz
(9.11)
(9.12)
A képletek természetesen csak olyan szögekre érvényesek, melyek esetében a megfelelő tg és ctg szögfüggvények
értelmezhetők.
(9.13)(9.14)
(9.15)(9.16)
Ha a (9.13)–(9.16) egyenlőségekben α helyére írunk, akkor az egyes szögfüggvényeknek a kérdéses szög felére
vonatkozó szögfüggvényeivel való kifejezéseit kapjuk:
Írjunk (9.14) képlet jobb oldalán először cos2 α helyébe 1 – sin2 α-t, majd sin2 α helyébe 1 – cos2 α-t; ekkor a következő
fontos összefüggésekhez jutunk:
(9.17)
illetve
(9.18)
Gyakran van szükségünk két szög szinusza összegének, különbségének, illetve két szög koszinusza összegének és
különbségének szorzat alakban való előállítására. Erről szólnak az alábbi képletek:
(9.19)
(9.20)
(9.21)
(9.22)
Fejtsük ki a bal oldalt az addíciós tétel szerint, így az alábbi nyilvánvaló azonossághoz jutunk:
b) cos 105° = cos (60° + 45°) = cos 60° cos 45° – sin 60° sin 45° =
c)
3. 7 db egybevágó négyzetet helyezzünk egymás mellé a 9.23. ábrán látható módon! Igazoljuk, hogy az ábra α, β, γ
szögeire α + β = γ!
9.23. ábra
Innen vagy sin α – cos α = 0, vagy sin 2β – cos 2β = 0. Első esetben tg α = 1, azaz α = 45° lenne, ami lehetetlen, hiszen
ekkor a háromszög egyenlő szárú lenne. A másik esetben sin 2β = cos 2β, azaz tg 2β = 1. Ekkor 2β = 45°, tehát a
háromszög hegyesszögei: β = 22,5°, α = 67,5°.
5. Állítsuk elő a következő összegeket szorzat alakban:
a) sin x + sin 2x + sin 3x,
b) cos x + cos 2x + cos 3x.
a) Bár használhatnánk a (9.19)-ben leírt képletet, most más ötlettel élünk. Írjunk a sin x helyébe sin(2x–x)-et, a sin
3x helyébe pedig sin(2x+x)-et. A következőt kapjuk:
A jobb oldal első és harmadik tagját fejtsük ki a megfelelő addíciós tétel szerint:
b)
6. Fejezzük ki
a) sin 3α-t sin α-val;
b) cos 3α-t cos α-val;
c) tg 3α-t tg α-val!
a) A (9.6), (9.13) és (9.14) azonosságok felhasználásával a következő átalakításokat végezhetjük el:
A (9.1) azonosság szerint cos2 α = 1 – sin2 α, illetve sin2 α = 1 – cos2 α; ezeket felhasználva azt kapjuk
(9.23)
(9.24)
(9.25)
7. * Az ABCD egységnyi oldalú négyzet BC oldalának B-hez közelebbi harmadoló pontja H, legyen a CD oldal C-n túli
9.24. ábra
Az AMB ∠ akkor és csak akkor 45°, ha HME ∠ = 135°. Ez viszont akkor és csak akkor teljesül – a HMEC négyszög
belső szögeinek összegét tekintve –, ha α + β = 135°.
, így α + β = 135°, tehát az M pont valóban illeszkedik az ABCD négyzet köré írható
körére.
A háromszög bármely két oldalának aránya egyenlő a megfelelő szemközti szögek szinuszainak arányával.
A tétel bizonyítását külön vizsgáljuk hegyesszögű háromszög (9.26a ábra) és tompaszögű háromszög (9.26b ábra)
esetében.
9.26 ábra
Hegyesszögű háromszög esetében tekintsük a 9.26a ábrát! Az ABT és ACT derékszögű háromszögekben
A két egyenlőségből
Tompaszögű háromszög esetében a 9.26b ábrát használjuk. A BTC és ATC derékszögű háromszögekben
A két egyenlőségből
A háromszög területe egyenlő két oldal és a közbezárt szög szinusza szorzatának a felével.
(9.26)
Példák
1. Az ABC háromszög két oldala a = 2,4 cm, b = 4 cm. A b oldallal szemközti szög β = 78°. Számítsuk ki a háromszög
hiányzó oldalait és szögét!
Mivel a nagyobb oldallal szemközti szög adott, ezért az α oldallal szemközti szög csak hegyesszög lehet.
Használjuk a 9.27. ábra jelöléseit!
9.27. ábra
A szinusztétel szerint
ahonnan α ≈ 35,9°. Ezzel a háromszög harmadik szöge: γ ≈ 180°–78°–35,9°≈66,1°. A háromszög harmadik oldalát
ugyancsak a szinusztétel segítségével számítjuk ki:
2. Az ABCD egységnyi oldalú négyzet AC átlójának mely P pontjából látszik az AB oldal 120°-os szögben? Tekintsük a
9.28. ábrát! A PAB háromszögben PAB ∠ = 45°, így PBA ∠ = 15°.
9.28. ábra
Tehát az AC átló megfelelő P pontja az A csúcstól kb. 0,299 távolságra van. (Ez a távolság az átlónak kb. 21%-a.)
3.
Egy nem egyenlő szárú háromszögben, . Igazoljuk, hogy a háromszög derékszögű!
Ez utóbbi egyenlőségből vagy az következik, hogy α = β, vagy pedig 2α + 2β = 180°. Az első eset nem lehetséges,
hiszen a háromszög nem egyenlő szárú, a második esetből pedig α + β = 90°, ami éppen azt jelenti, hogy a
háromszög derékszögű.
4. Egy háromszög leghosszabb oldala a legrövidebb oldal másfélszerese. A háromszög legnagyobb szöge a legkisebb
szög kétszerese. Mekkorák a háromszög szögei?
A legnagyobb szög a leghosszabb oldallal szemközt, a legkisebb szög pedig a legrövidebb oldallal szemközt van, ha
a a legkisebb szög, felírhatjuk a szinusztételt az alábbi módon
Ekkor a háromszög legnagyobb szöge 2α ≈ 82,8°, a háromszög harmadik szöge pedig 180°–41,4°–82,8°≈55,8°.
5. Egy egység sugarú körbe írt hegyesszögű háromszög szögei α, β és γ. Igazoljuk, hogy ekkor a háromszög T
területe:
A 9.29. ábra jelöléseit használjuk. Az azonos íven nyugvó kerületi és középponti szögek tétele alapján a kör O
középpontjából az egyes oldalak 2α, 2β és 2γ szögben látszanak. Az ABO, BCO, CAO háromszögek területe a
trigonometrikus területképlet alapján
9.29. ábra
Megjegyzés. Lényegesen kihasználtuk azt, hogy a háromszög hegyesszögű, vagyis hogy a kör középpontja a
háromszög belsejében van. Könnyen megmutatható, hogy az állítás tompaszögű és derékszögű háromszögre is
igaz.
6. * Az ABC háromszög C csúcsból induló f1 és f2 szögharmadolói a szemközti c oldalt c1, c2 és c3 hosszúságú
szakaszokra bontják (9.30. ábra). Igazoljuk, hogy ekkor
(9.27) (9.28)
(9.29) (9.30)
Ezek szerint
Nem használhatjuk a szinusztételt, ha a háromszögnek két oldala és a közbezárt szög adott, vagy pedig ha a háromszög
három oldala adott. Ilyenkor célszerű alkalmazni a koszinusztételt.
A tétel bizonyítását – ugyanúgy, mint a szinusztétel esetében – külön vizsgáljuk hegyesszögű (9.31a ábra), illetve
tompaszögű háromszög (9.31b ábra) esetében.
9.31 ábra
(9.31)
(9.32)
azaz
A koszinusztételt akkor célszerű alkalmazni, ha ismert két oldal és a közbezárt szög, vagy ha három oldal ismert. Ha
a háromszögnek három oldalát ismerjük, akkor valamelyiket (bármelyiket) kiválasztva felírjuk erre az oldalra a
koszinusztételt, abban ismeretlenként a kérdéses oldallal szemközti szög szerepel, így megkapjuk a szemközti szöget,
majd ezután már akár a szinusztétel, akár a koszinusztétel további alkalmazásával eljuthatunk a háromszög többi
oldalához és szögéhez. Valamelyest ritkábban használjuk a „tangenstételt”.
Ha a háromszög két oldala a és b (a≠b), szemközti szögeik α és β, akkor
A bizonyításhoz először osszuk el a bal oldali tört számlálóját és nevezőjét is b-vel, majd alkalmazzuk a szinusztételt!
Bővítsük a kapott törtet sin β-val: . Most alkalmazzuk a jobb oldali tört számlálójában és
nevezőjében a (9.19), illetve (9.20) összefüggéseket.
Példák
1. Egy paralelogramma két oldala a = 2,4 cm, b = 6 cm, a közbezárt szög 62,6°.
a) Mekkorák a paralelogramma átlói?
b) Mekkora az átlók hajlásszöge?
a) Írjuk fel a 9.32. ábra ABD és ABC háromszögeire a koszinusztételt, tudva, hogy a paralelogramma szomszédos
szögei 180°-ra egészítik ki egymást.
9.32. ábra
b) A paralelogramma átlói felezik egymást, így a BMC háromszög oldalai: BC = 2,4, BM ≈ 2,67, MC ≈ 3,705. Írjuk
fel e háromszög BC oldalára a koszinusztételt!
befogói .
9.33. ábra
Az APB háromszög szintén egyenlő szárú derékszögű háromszög, átfogója 16, tehát . Írjuk fel a
koszinusztételt az AQP háromszög PQ oldalára!
Ezzel az AQB háromszögben AQB∠ = 180°–70°–27,5°≈82,5°. Most már írhatjuk a koszinusztételt az x szakaszra: x2 =
2,782 + 32 – 2 · 2,78 · 3 · cos 82,5° ≈ 81,45, ahonnan a két falu távolsága: AB ≈ 9,02 km.
6. Az ABC nem egyenlő szárú háromszög két oldala a és b, a közbezárt szög 120°.
9.35. ábra
(9.33)
(9.34)
A szögfelezőtétel szerint , azaz , így osszuk el egymással a (9.33) és (9.34) egyenlőségeket; azt
kapjuk, hogy
Most szorozzunk keresztbe, egyszerűsítsünk f-fel, majd végezzük el a megfelelő algebrai átalakításokat:
innen pedig
A jobb oldali másodfokú kifejezést felbonthatjuk két elsőfokú szorzatára, ha meghatározzuk zérushelyeit
Mivel n ≥ 3, ezért , vagyis , ami éppen azt jelenti, hogy a háromszög legnagyobb
szöge α legfeljebb 120°.
9.
* Igazoljuk, hogy bármely háromszögben
Próbáljuk elérni, hogy a bizonyítandó egyenlőségben csak oldalak vagy csak szögfüggvények szerepeljenek! Ez
utóbbit könnyen elérhetjük, ha az egyenlőség jobb oldalán alkalmazzuk a szinusztételt:
Mivel α + β + γ = 180°, ezért sin α = sin(β + γ), tehát az egyenlőség így írható:
10. * Legyenek a, b és c pozitív valós számok. Igazoljuk, hogy fennáll közöttük az alábbi egyenlőtlenség:
Próbáljunk meg a bizonyítandó egyenlőtlenségben szereplő kifejezéseknek valamilyen geometriai tartalmat adni.
A bal oldalon a négyzetgyökök alatti kifejezések a koszinusztételnek olyan felírásával azonosak, ahol a közbezárt
szög 60°. Ez adja az ötletet: indítsunk egy pontból egy b, a és c hosszúságú szakaszt úgy, hogy b és a, valamint a és c
60°-os szöget zárjanak be egymással (9.37. ábra), és írjuk fel a megfelelő háromszögekre a koszinusztételt!
9.37. ábra
Az OAB háromszögben
az OAC háromszögben
az OBC háromszögben
Megjegyzés. Az egyenlőség akkor és csak akkor teljesül, ha az A csúcs illeszkedik a BC szakaszra, vagyis ha az a
szakasz a BOC háromszögnek éppen a szögfelezője; ez pedig akkor és csak akkor teljesül (lásd a 6. feladatot), ha
1. Ebben az esetben csak akkor van megoldás, ha |a| ≤ 1. Mivel sin x = sin(π – x) és sin x = sin(x + 2kπ), így ha az
egyenletnek van megoldása, akkor végtelen sok megoldása van, de ezek egy-egy megoldás segítségével általában könnyen
felírhatók. Ha az egyenlet egy megoldása x0, akkor az x0-nak megfelelő egységvektor y tengelyre vonatkozó tükörképe
ugyancsak megoldás, így ekkor az egyenlet összes megoldása:
2. Természetesen ebben az esetben is akkor és csak akkor van megoldás, ha | a | ≤ 1. A cos x = cos(–x) = cos(x + 2kπ)
azonosságokból következik, hogy ha van megoldás, akkor végtelen sok megoldás van. Ha valamely x0 megoldása az
egyenletnek, akkor az xo-nak megfelelő vektor x tengelyre vonatkozó tükörképe is megoldás, így ekkor az egyenlet összes
megoldása:
3. A tg x = tg(– x) = tg(x + kπ) azonosságokból adódik, hogy ha van megoldás, akkor végtelen sok megoldás van; ha x0 egy
megoldás, akkor az összes megoldás: x = x0 + kπ.
4. Ebben az esetben – ugyanúgy, mint a 3. pontban – ha x0 egy megoldás, akkor az összes megoldás: x = x0 + kπ.
A trigonometrikus egyenletek megoldásánál az egyik leggyakrabban alkalmazott eljárás az, hogy megpróbáljuk elérni:
az egyenletben lehetőleg csak egyfajta trigonometrikus kifejezés szerepeljen. Ha ez sikerült, akkor már egy egyszerű
helyettesítéssel algebrai egyenletre vezethetjük vissza az eredeti trigonometrikus egyenletet. Erre mutatunk néhány
példát.
2. |2cos2x–1| + 4 sin2 x = 1.
Tehát a kitűzött egyenlet így írható: |1 – 4 sin2 x| = 1 – 4 sin2 x. Az |a| = a egyenlet megoldása minden nem negatív
valós szám, így az eredeti egyenlet ekvivalens az 1 – 4 sin2 x ≥ 0 egyenlőtlenséggel. Innen
9.38. ábra
3.
Alakítsuk át az egyes négyzetgyök alatti kifejezéseket úgy, hogy csak egyfajta szögfüggvény szerepeljen bennük! A
bal oldali első tagot így alakíthatjuk:
A sin x és cos x lehetséges értékeit gyelembe véve az abszolút értékeken belül negatív számok szerepelnek, így azt
kaptuk:
nyilvánvaló azonossághoz jutunk. Tehát az eredeti egyenletet minden valós szám kielégíti, vagyis azonosság.
Sok esetben úgy tudjuk a trigonometrikus egyenletet megoldani, hogy az ismert azonosságok, tételek felhasználásával
az egyes oldalakat szorzattá alakítjuk, és egy szorzat egyenlő 0-val alakra hozzuk. Ilyenkor azt vesszük gyelembe, hogy egy
szorzat akkor és csak akkor 0, ha valamelyik tényezője 0. Az is gyakran előfordul, hogy egy tört egyenlő 0-val. Ehhez az
szükséges, hogy a számláló 0 legyen, és ugyanakkor a nevező értéke ne legyen 0. Néhány esetben az az ötlet vezethet el
bennünket a megoldáshoz, ha egy ügyes átalakítással a többtagú összeget az addíciós tétel alkalmazásával egyetlen taggá
alakítjuk, s így egy jóval egyszerűbb egyenletre vezetjük vissza az eredeti egyenletet. Néha csábítónak látszik az egyenlet
mindkét oldalának négyzetre emelése, de vigyáznunk kell, mert ilyenkor rendszerint hamis gyökök is fellépnek. Nézzünk
ezekre is néhány példát!
Példák
1.
Az egyenletnek csak akkor van értelme, ha cos x ≠ 0, ami azt jelenti, hogy Az egyenlet így alakítható:
Ekkor vagy sin x = 0, vagy 2 cos x – 1 = 0, azaz= Így az eredeti egyenlet megoldásai:
Ekkor tehát 2 cos x +1 = 0, azaz , vagy sin x = –1. Az eredeti egyenlet megoldásai:
Mivel sin , ezért az egyenlet bal oldali két tagját az addíciós tétel felhasználásával egy taggá
alakíthatjuk:
Az előző feladatban használt ötletet alkalmazzuk most is; osszuk el mindkét oldalt 2-vel:
azaz ahonnan
Állítsuk elő a sin x és cos x negyedik hatványának összegét a sin2 x + cos2 x = 1 azonosság négyzetre emelésével:
Most szorozzuk meg mindkét oldalt 2-vel, így a bal oldalon sin 2x négyzetét kapjuk.
Ha , akkor vagy .
Ha , akkor vagy .
Az eredeti egyenlet összes megoldása:
7. * Mekkora legyen a p paraméter értéke, hogy a sin6 x + cos6 x = 1 + p egyenletnek legyen megoldása?
Az előző feladathoz hasonlóan állítsuk elő a sin x és cos x hatodik hatványának összegét a sin2 x + cos2 x = 1
azonosság köbre emelésével:
Trigonometrikus függvények
A trigonometrikus függvények inverzei
Trigonometrikus függvények
Az y = sin x függvény értelmezési tartománya minden valós szám, értékkészlete: –1 ≤ y ≤ 1. Mivel a függvény periodikus,
periódusa 2π, ezért a függvény menetét elegendő egy periódusban, pl. a [0; 2π] intervallumon vizsgálnunk. A függvény
gra kus képét a 9.39. ábrán szemléltetjük.
9.39. ábra
Mivel , ezért a cos x függvény gra konját könnyen megkaphatjuk a sin x gra konjából egy x
9.40. ábra
Az y = cos x függvény értelmezési tartománya minden valós szám, értékkészlete – 1 ≤ y ≤ 1. Mivel a cos x függvény
ugyancsak 2π szerint periodikus, ezért elegendő egy periódusban (pl. a [–π; π] intervallumon) vizsgálnunk. A függvénynek
zérushelye van az helyeken. A [–π; 0] intervallumon szigorúan monoton növekvő, a [0; π] intervallumon
szigorúan monoton csökken. A függvénynek maximuma van x = 2kπ-ben, a maximum értéke 1, minimuma van x = (2kπ +
1)π-ben, a minimum értéke –1.
Az y = tg x függvény gra kus képét a 9.41. ábrán szemléltetjük.
9.41. ábra
Mivel a tg x függvény π szerint periodikus, így elegendő egy periódusban (pl. a intervallumon)
vizsgálnunk. A függvény értelmezési tartománya a valós számok halmaza, kivéve a számokat. Értékkészlete a
intervallumon szigorúan monoton növekvő; 0-ban in exiós pontja van. A intervallumon konkáv, a
intervallumon konvex.
Mivel ctg x = tg , ezért az y = ctg x függvény gra kus képét könnyen megkapjuk az y = tg x
gra kus képéből, ha azt az x tengely mentén pozitív irányban eltoljuk -vel, majd az így kapott gra kont tengelyesen
tükrözzük az x tengelyre (9.42. ábra).
9.42. ábra
Az y = ctg x függvény értelmezési tartománya a valós számok halmaza, kivéve az x = k·π valós számokat, értékkészlete a
valós számok halmaza. A függvény – az y = tg x függvényhez hasonlóan – π szerint periodikus, így elegendő egy periódust
(pl. a [0; π] intervallumot) vizsgálnunk. Egy perióduson belül a függvény szigorúan monoton csökkenő, zérushelye van az
helyeken. E zérushelyek egyben a függvény gra konjának in exiós pontjai. A függvény gra konja a
Az y = sin x függvény szigorúan monoton növekvő a intervallumon, ezért ott létezik inverz függvénye.
Az y = sin x függvény inverzét árkusz szinusz függvénynek nevezzük és arcsin x-szel jelöljük.
Az y = arcsin x függvény tehát olyan -beli valós számot (ívmértékben mért szöget) jelent, melynek
szinusza x, azaz sin y = x.
A függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete a
intervallumba eső valós számok halmaza. A függvény szigorúan monoton növekvő, zérushelye x = 0-ban van. A függvény
gra konját a 9.43. ábrán szemléltetjük.
A függvény gra konja az y = sin x függvény gra konja intervallumba eső darabjának az y = x egyenesre
vonatkozó tengelyes tükörképe.
Az y = arcksin x függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete
pedig a intervallumba eső valós számok halmaza. A függvénynek csak k = 0 esetén van
zérushelye: x = 0. A függvény szigorúan monoton növekvő, ha k páros, szigorúan monoton csökkenő, ha k páratlan.
Az y = arcsin x függvényhez hasonló módon értelmezhetjük az y = arccos x függvényt. Mivel az y = cos x függvény a [0;
π] intervallumon szigorúan monoton csökkenő, ezért itt van inverze.
Az y = cos x függvény inverzét árkusz koszinusz függvénynek nevezzük és arccos x-szel jelöljük.
Az y = arccos x függvény tehát olyan [0; π]-vel valós számot (ívmértékben mért szöget) jelent, melynek koszinusza x,
azaz cos y = x. A függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete a [–0; π]
intervallumba eső valós számok halmaza. A függvény szigorúan monoton csökkenő, zérushelye x = 1-ben van. A függvény
gra konját a 9.44. ábrán szemléltetjük.
9.44. ábra
Megjegyzés. Az y = arccos x függvény természetesen minden [kπ; (k+1)π] intervallumon szigorúan monoton
(csökkenő vagy növekvő, attól függően, hogy k páros vagy páratlan), így minden ilyen intervallumon létezik inverze:
ezt arckcos x függvénynek nevezzük. Ebben az értelemben tehát a 9.44. ábrán szemléltetett függvényt arc0cos x
függvénynek mondhatjuk. A cos x függvény menetének alakulásából következik, hogy
Az y = arcksin x függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete
pedig a [kπ; (k+1)π] intervallumba eső valós számok halmaza. A függvénynek csak k = 0 esetén van zérushelye: x = 1. A
függvény szigorúan monoton csökkenő, ha k páros, szigorúan monoton növekvő, ha k páratlan.
9.45. ábra
Az y = arc0ctg x függvény értelmezési tartománya a valós számok halmaza, értékkészlete a (0; π) intervallumba eső
valós számok halmaza.
9.46. ábra
Alapfogalmak
Gömbháromszögpárok
Alapfogalmak
A gömb felületén végezhetünk geometriai vizsgálatokat ugyanúgy, mint síkban. A gömbi geometriában az egyenesek
szerepét a főkörök játsszák, a körök szerepét pedig a gömb felületének többi köre. Gömbi szakasznak a félkörívnél nem
nagyobb főköríveket mondjuk. Két pont távolságát a hozzájuk vezető sugarak hajlásszögével mérjük.
Ha egy konvex háromélű szöglet (triéder) csúcsa egy gömb középpontjában van, akkor e háromélű szöglet élei a
gömböt három pontban metszik. A szöglet lapsíkjai a gömbfelületet egy-egy főkörívben metszik. E főkörívek egy
gömbháromszöget határoznak meg. Az ívek végpontjai a gömbháromszög csúcsai, maguk az ívek a gömbháromszög oldalai
(9.47. ábra).
9.47. ábra
A gömbháromszög oldalait a hozzájuk tartozó középponti szöggel mérjük. Így a 9.47. ábrán látható ABC
gömbháromszög b oldala az AOC szöggel azonos: AOC∠ = b. Ez a szög az O középpontú háromélű szöglet AO és CO éleinek a
hajlásszöge. A gömbháromszög szögei az őt létrehozó háromélű szöglet megfelelő lapszögei. Pl. a 9.47. ábra ABC
gömbháromszögének α szöge az O középpontú szöglet AOB és AOC lapsíkjainak a hajlásszöge. Oldalai szerint
megkülönböztetünk egyenlő oldalú, egyenlő szárú és különböző oldalú gömbháromszöget.
A gömbháromszögek legfontosabb tulajdonságai:
9.48. ábra
Egy gömbháromszög csúcsgömbháromszögének mondjuk az olyan gömbháromszöget, melynek egy csúcsa közös az
eredeti gömbháromszög egy csúcsával. A 9.48. ábra ABC gömbháromszögének csúcsgömbháromszögei például az AB1C1,
BA1C1, CA1B1 gömbháromszögek.
Egy gömbháromszög átellenes gömbháromszögének mondjuk azt a gömbháromszöget, melynek csúcspontjai az
eredeti gömbháromszög csúcsainak átellenes pontjai. A 9.48. ábra ABC gömbháromszögének átellenes gömbháromszöge az
A1B1C1 gömbháromszög. Az átellenes gömbháromszögek az O pontra szimmetrikusak, ilyen értelemben tehát
„egybevágók”, területeik egyenlő.
Egy gömbkétszög felszíne szögével arányos (9.49a ábra). Mivel a gömb felszíne 4r2π, így az r sugarú gömb α szögű
gömbkétszögének Tα területe:
9.49 ábra
(9.35)
9.50. ábra
(Gömbi szinusztétel) A gömbháromszög oldalai szinuszainak aránya egyenlő a szemközti szögek szinuszainak
arányával:
A tétel igazolásához képezzük az (a × b) × (b × c) szorzatot! E szorzatot a kifejtési tétel szerint így alakíthatjuk:
hiszen b egységvektor. Mivel az a×b és b×c vektorok hajlásszöge 180°–β, így írhatjuk:
Ha most ugyanezt a gondolatsort nem az a, b, c vektorokra, hanem rendre a c, a, b vektorokra alkalmazzuk, akkor
azt kapjuk:
Természetesen a c oldal helyett bármely másikat is szerepeltethettünk volna, így e tétel a másik két oldalra felírva
A tétel bizonyításához tekintsük az (a×b)(b×c) szorzatot! Előbb a felcserélési tételt, majd a kifejtési tételt alkalmazva
ezt így írhatjuk:
Az a, b, c vektorok egységvektorok, az általuk közbezárt megfelelő szögeket (9.35)-ből kiolvasva azt kapjuk:
A gömbháromszögnek nem csak oldalaira, de szögeire is felírhatunk egy koszinusztételt; ezt bizonyítás nélkül
közöljük.
Természetesen a γ szög helyett bármely másikat is szerepeltethettük volna, így e tételt a másik két szögre is felírhatjuk:
Ha a gömbháromszög három oldala és három szöge közül három adatot ismerünk, akkor a most ismertetett gömbi
szinusz- és koszinusztételek segítségével a többit már meghatározhatjuk.
Alkalmazásként vizsgáljuk meg két földrajzi hely távolságának meghatározását a gömbháromszögek segítségével.
Tételezzük fel, hogy a Föld tökéletes gömb alakú, és képzeljük el e gömb felületén a szokásos szélességi és hosszúsági
köröket. Ekkor két pont távolságát a rajtuk keresztül haladó főkör kisebbik íve adja meg. A 9.51. ábrán a P és Q pontok
meghatározásához vizsgáljuk meg az ÉPQ gömbháromszöget. Ha a P, illetve Q pontok északi szélessége φ1, illetve φ2, akkor
e gömbháromszög két oldala: ÉP = b = 90° – φ1, illetve ÉQ = c = 90° – φ2.
9.51. ábra
Az ÉPQ gömbháromszög α szöge a P és Q pontok keleti hosszúságának különbsége: α = λ2 – λ1. Írjuk fel az oldalakra
vonatkozó koszinusztételt:
(9.36)
Ezzel az a szöget már meghatározhatjuk, onnan pedig a Föld sugarának ismeretében a PQ ív hosszát is megkaphatjuk.
Határozzuk meg Budapest és Tokió távolságát, ha tudjuk, hogy Budapest helyzete: északi szélesség 47,5°, keleti
hosszúság 19°, Tokió adatai: északi szélesség 35,7°, keleti hoszszúság 139,7°. Az adatokkal (9.36) szerint
A Föld egy főkörének kerületét 40 000 km-nek feltételezve írhatjuk az alábbi arányt:
Példák
1. Számítsuk ki a gömbháromszög hiányzó oldalait és szögeit, ha
a) a = 60°, b = 45°, c = 90°;
b) α = 45°, β = 120°, γ = 45°;
c) α = 120°, β = 60°, γ = 135°.
a) Az oldalakra vonatkozó koszinusztételt írjuk fel először valamelyik (pl. a b) oldalra:
A b oldalra
9.52. ábra
Most írjuk fel az oldalakra vonatkozó koszinusztételt az AFC háromszög x oldalára:
3. Egy gömbháromszög oldalai a = 30°, b = c = 60°. A B csúcsból merőleges főkörívet állítottunk az AC oldalra; e
merőleges és az AC oldal metszéspontja T. Mekkora a BT főkörív? Tekintsük a 9.53. ábrát! Először kiszámítjuk az
ABC gömbháromszög γ szögét az AB oldalra felírt koszinusztétellel, majd a BTC gömbháromszögre felírva a
szinusztételt, eljutunk a keresett BT főkörívhez:
9.53. ábra
4. Egy gömbháromszög oldalai a = 30°, b = c = 60°. A β szöget felező főkörív az AC oldalt E-ben metszi. Mekkora az BE
főkörív?
Először számítsuk ki az oldalakra felírt koszinusztétellel az ABC gömbháromszög β szögét (9.54. ábra):
9.54. ábra
Mivel cos 90° = 0 és sin 90° = 1, így azt kapjuk: cos α = sin β · cos a, éppen, amit bizonyítanunk kellett.
c) A c oldalra írjuk fel az oldalakra vonatkozó koszinusztételt:
tehát .
Ez utóbbi pedig éppen azt jelenti, hogy a > 60°.
8. Egy r sugarú gömbfelületen egy gömbháromszögben a = 60°, b = 30°, α = 90° (9.55. ábra). Mekkora e
gömbháromszög területe?
9.55. ábra
Ezek szerint a legkisebb oldal a γ-val szemközti c oldal. Írjuk fel a c oldalra a szögekre vonatkozó koszinusztételt:
Alapfogalmak
Osztópontok, két pont távolsága
A háromszög területe
Alapfogalmak
Egy síkbeli alakzat egyenletén olyan összefüggést értünk, melyet az alakzat pontjainak a koordinátái kielégítenek, és
más pont koordinátái nem elégítenek ki.
Ez tehát azt jelenti, hogy az alakzat minden pontjának a koordinátái kielégítik az egyenletet, illetve ha egy pont
koordinátái kielégítik az egyenletet, akkor az a pont a kérdéses alakzathoz tartozik. Természetesen előfordulhat, hogy
olyan összefüggésünk van, melyet egyetlen pont koordinátái sem elégítenek ki. Ilyen pl. az x2 +y2 + 4 = 0 egyenlet, melyet
nyilván egyetlen (x; y) számpár sem elégít ki. Az is előfordulhat, hogy a megadott összefüggésben csak az egyik koordináta
szerepel, pl. x = 5. Ilyenkor a másik koordináta tetszőlegesen megválasztható, tehát ez egy olyan alakzat egyenlete, melynek
bármely pontjának első koordinátája 5, vagyis az y tengellyel párhuzamos, az x tengelyt x = 5-ben metsző egyenes egyenlete.
Amennyiben az egyenlet azonosság, akkor a sík bármely pontjának koordinátái kielégítik azt, vagyis a kérdéses alakzat
maga a koordinátasík. Ilyen pl. az (x+y)2 = x2+2xy+y2 egyenlet, melyet bármely (x; y) számpár kielégít.
Ha egy alakzat egyenletét valamely 0-tól különböző valós számmal megszorozzuk, ugyanannak az alakzatnak az
egyenletéhez jutunk, hiszen azok és pontosan azok a számpárok elégítik ki az új egyenletet, mint az eredetit is. Ha ismerjük
két alakzat egyenletét, akkor meghatározhatjuk e két alakzat közös pontjainak a koordinátáit. Ehhez a két alakzat
egyenletét egy kétismeretlenes egyenletrendszernek tekintjük, ennek az egyenletrendszernek a megoldásai olyan (x; y)
számpárok (ha léteznek), melyek mindkét egyenletet kielégítik, vagyis mindkét alakzathoz hozzátartoznak.
Megjegyzés. Előfordulhat, hogy az adott összefüggésben nem egyenlőségjel, hanem valamilyen irányú
egyenlőtlenség szerepel. Természetesen az ilyen összefüggésre is érvényes, hogy olyan alakzatot ír le, melynek
koordinátái kielégítik a kérdéses egyenlőtlenséget, és más pont koordinátái nem elégítik ki az egyenlőtlenséget.
Vegyünk fel két egymásra merőleges számegyenest, mindkettőn vegyük fel az egységet úgy, hogy a két egyenes
metszéspontjában legyen mindkét számegyenes 0 pontja. Az így megadott egyenesek egy Descartes-féle derékszögű
koordináta-rendszert alkotnak; a „vízszintes” egyenest szokás abszcisszatengelynek (x tengelynek), a „függőleges”
egyenest pedig ordinátatengelynek (y tengelynek) nevezni. Az x tengelyen jobbra, az y tengelyen fölfelé vannak a pozitív
számok, ellenkező irányokban a negatív számok. A két egyenes metszéspontja a koordináta-rendszer kezdőpontja vagy
más néven origója. Egy ilyen módon megadott koordináta-rendszerben a sík bármely P pontjának helyzetét egyértelműen
meghatározhatjuk két számadattal: az egyes tengelyektől vett előjeles távolságukkal. A P pont y tengelytől vett előjeles
távolságát abszcisszának (x koordinátának), az x tengelytől vett előjeles távolságát ordinátának (y koordinátának)
nevezzük. Ha a P pontnak az y tengelytől vett előjeles távolsága a, az x tengelytől vett előjeles távolsága b, akkor azt így
jelöljük P(a; b).
Így tehát a sík bármely P pontjának helyzete megadható koordinátáival, és bármely rendezett számpárnak megfelel
egyetlen pont a síkon (10.1. ábra).
10.1. ábra
melyre teljesül: .
Tekintsük a 10.2. ábrát! Az AB szakasz r : s arányú osztópontjának meghatározásához használjuk az A és B pontokba
mutató a és b helyvektorokat.
10.2. ábra
(10.1)
A vektor a vektor -szerese, tehát
(10.2)
A most kapott (10.2) egyenleteket alkalmazva megkapjuk az AB szakasz harmadoló pontjainak koordinátáit.
Az A(a1; a2), B(b1; b2) pontok által meghatározott AB szakasz A-hoz közelebbi HA harmadoló pontjának koordinátái
(10.3)
A harmadoló pont koordinátáinak ismeretében könnyen meghatározhatjuk egy csúcspontjaival adott háromszög S
súlypontjának a koordinátáit is. Tekintsük a 10.3. ábrát!
10.3. ábra
A háromszög S súlypontjának a koordinátái a megfelelő koordináták számtani közepe, azaz ha A(a1; a2), B(b1; b2), C(c1,
c2), akkor
(10.4)
A háromszög S súlypontja valamely (pl. a C) csúcsból induló súlyvonalnak a csúcstól távolabbi harmadoló pontja. Az F
pont koordinátái
Gyakran van szükség két koordinátáival adott pont távolságának meghatározására. Ezt pl. Pitagorasz tételének
segítségével tehetjük meg. Foglaljuk bele az AB szakaszt egy olyan derékszögű háromszögbe, melynek befogói
párhuzamosak a koordinátatengelyekkel. Tekintsük a 10.4. ábrát! A létrejött derékszögű háromszög befogói |a1 – b1| és |a2 –
b2|. Írjuk fel Pitagorasz tételét a megfelelő háromszögre:
(10.5)
10.4. ábra
Megjegyzés. Két pont távolságának meghatározásakor azt is megtehettük volna, hogy a két pontba mutató
helyvektorok különbségének abszolút értékét vesszük; természetesen akkor is ugyanerre az eredményre jutunk.
Ha az AB szakasz párhuzamos valamelyik koordinátatengellyel, akkor a szakasz hossza egyszerűen leolvasható a
különböző koordinátákból. Ha pl. az AB szakasz párhuzamos az x tengellyel, akkor nyilván a2 = b2, tehát ekkor az AB
szakasz d hossza: d = |a2 – b2|.
A háromszög területe
Egy háromszög területét többféleképpen is meghatározhatjuk csúcspontjai koordinátáinak a segítségével.
1. A 10.5. ábra ABC háromszögének T területét megkapjuk, ha az APRC trapéz területéből kivonjuk az APQB trapéz t1 és a
BQRC trapéz t2 területét.
10.5. ábra
Ez utóbbi kifejezés viszont azonos az alábbi harmadrendű determinánssal, tehát a háromszög T területe:
(10.6)
Megjegyzés. A (10.6) képlet a háromszög előjeles területét adja, így ha a determináns értéke negatív, akkor annak
abszolút értéke adja meg a kérdéses háromszög területét.
2. Úgy is kiszámíthatjuk a háromszög területét, ha a (10.5) távolságképletet alkalmazva kiszámítjuk mindhárom oldalának a
hosszát, majd az (5.5)-ben leírt Héron-képletet alkalmazzuk.
3. Ha már ismerjük a háromszög oldalainak hosszát, úgy is eljuthatunk a területhez, ha valamelyik oldalra felírva a
koszinusztételt, megkapjuk a szemközti szöget, majd a (9.26)-ban leírt trigonometrikus területképletet alkalmazva
megkapjuk a háromszög területét.
Példák
1. Szemléltessük a koordinátasíkon azokat a pontokat, melyek koordinátái kielégítik az alábbi egyenlőségeket:
a) Egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, így vagy x = 0, vagy y = 0. Az x = 0 egyenletnek
eleget tevő pontok az y tengely pontjai, az y = 0 egyenletnek eleget tevő pontok pedig az x tengely pontjai. Így
az eredeti egyenlőségnek eleget tevő pontok a két koordinátatengely pontjai (10.6. ábra).
10.6. ábra
10.7. ábra
b) Ebben az esetben vagy x = 3, vagy y = –2. Az egyenletet kielégítő pontok halmazát vastag vonallal szemléltettük
a 10.7. ábrán.
c) |x| = 1, vagy |y| = 1, tehát x = ± 1, vagy y = ± 1. Az egyenletet kielégítő pontok halmaza két-két, az x tengellyel,
illetve az y tengellyel párhuzamos egyenes (10.8. ábra).
10.8. ábra
a) Ha egy kéttényezős szorzat értéke kisebb 0, akkor a tényezők különböző előjelűek. Ezek szerint vagy x ≤ 0 és y ≥
0, vagy x ≥ 0 és y ≤ 0. Első esetben az y tengelytől negatív irányban és az x tengelytől pozitív irányban levő
pontokról van szó (tehát a II. síknegyed pontjai), második esetben pedig a IV. síknegyed pontjai, amit a 10.9. ábrán
szemléltetünk (természetesen mindkét esetben a tengely pontjai is beleértendők a kérdéses ponthalmazba).
10.9. ábra
10.10. ábra
b) Most vagy |x| ≤ 1 és |y| ≥ 1, vagy fordítva, |x| ≥ 1 és |y| ≤ 1. Ez tehát azt jelenti, hogy vagy –1 ≤ x ≤ 1 és ugyanakkor
y ≤ – 1 vagy y ≥ 1, vagy pedig –1 ≤ y ≤ 1 és ugyanakkor x ≤ –1 vagy x ≥ 1. Az egyenlőtlenséget kielégítő ponthalmazt a
10.10. ábrán besatírozva láthatjuk.
c) Most x2 – 4 ≥ 0 és 2y – 6 ≥ 0, vagy x2 – 4 ≤ 0 és 2y – 6 ≤ 0. Első esetben |x| ≥ 2 és y ≥ 3, a másik esetben pedig |x| ≤ 2 és
y ≤ 3. Az egyenlőtlenséget kielégítő pontokat a 10.11. ábrán besatírozva szemléltetjük.
10.11. ábra
3. Adott két pont: A(–2; 6), B(5; –4). Számítsuk ki az AB szakasz B-hez közelebbi N negyedelő pontjának a
koordinátáit!
(10.2) alapján a keresett negyedelő pont
4. Az AB szakasz egyik végpontja A(5; –3). A szakasz A-hoz közelebbi P hatodoló pontjának a koordinátái P(3; –2).
Határozzuk meg a szakasz másik végpontjának a koordinátáit!
Legyenek a B pont koordinátái B(b1; b2). A (10.2) képlet alapján felírhatjuk az alábbi egyenleteket:
10.12. ábra
Tehát a P pont koordinátái: P(3b1 – 2a1; 3b2 – 2a2). Hasonlóan kapjuk a Q és R pontok koordinátáit is.
Q(3c1 – 2b1; 3c2 – 2b2), R(3a1 – 2c1; 3a2 – 2c2).
Ezek szerint a PQR háromszög súlypontjának a koordinátái (10.4) alapján
Ezek pedig pontosan megegyeznek az ABC háromszög súlypontjának a koordinátáival, vagyis az ABC és PQR
háromszögek súlypontjai valóban megegyeznek.
6. Számítsuk ki az A és B pontok távolságát, ha A(5; –8), B(–4; 2).
A (10.5) képletet alkalmazva a két pont d távolsága:
7. Egy AB szakasz egyik végpontja A (4; 6). A másik végpont első koordinátája 8. Mekkora a B pont második
koordinátája, ha az AB szakasz hossza 12 hosszúságegység?
Ha a B pont koordinátái B(8; b2), akkor a (10.5) alapján írhatjuk az alábbi egyenletet:
Tehát a B pont koordinátái vagy .
8. Adott három pont: A(–2; 3), B(5; –1), P(6; 6). Milyen távol van a P pont az AB szakasz azon belső pontjától, amelyik
A-tól négyszer olyan távol van, mint B-től?
Az AB szakasz azon belső Q pontja, mely A-tól négyszer olyan távol van, mint B-től, az AB szakasz B-hez közelebbi
ötödölő pontja. Tekintsük a 10.13. ábrát!
10.13. ábra
9. Számítsuk ki az A(2; 2), B(3; –1), C(5; 0) csúcspontokkal rendelkező háromszög területét! A háromszög területének
meghatározásához a (10.6) determináns értékét kell kiszámítanunk.
Az egyenes egyenletei
Két egyenes metszéspontja
A párhuzamosság és merőlegesség feltétele
Két egyenes hajlásszöge, pont és egyenes távolsága
Az egyenes egyenletei
Az egyenes egyenletét határozzuk meg. Olyan összefüggést (egyenletet) keresünk, melybe behelyettesítve az egyenes
bármely pontjának koordinátáit, azok igazzá teszik az egyenletet, de bármely az egyenesre nem illeszkedő pont
koordinátáit behelyettesítve, azok nem elégítik ki az egyenletet.
Egy egyenest egyértelműen meghatározhatunk két adott pontjával vagy egy adott pontjával és egy, az egyenessel
párhuzamos helyvektorral.
Az adott P0(x0; y0) ponton átmenő, adott v(v1; v2) irányvektorú egyenes egyenlete
(10.7)
10.14. ábra
Az egyenes bármely P pontjába mutató r helyvektorhoz eljuthatunk, ha az adott P0 pontba mutató r0 helyvektorhoz
hozzáadjuk az adott v irányvektor valamely t valós számszorosát. Ha t végigfut a valós számok halmazán, akkor
ilyen módon az egyenes minden pontjához eljutunk. Ezek szerint
(10.8)
(10.9)
Legyen adott két pont: A(a1; a2) és B(b1; b2). E két ponton átmenő egyenes egyenletét úgy kaphatjuk meg, hogy először a
két pontba mutató a és b helyvektorok különbségét vesszük. Az így kapott a – b (vagy b – a) vektort használhatjuk
irányvektornak, hiszen ez párhuzamos az egyenessel (adott pontnak akár az A, akár a B pontot használhatjuk). Mivel a–
b(a1–b1; a2–b2), így a két pontjával adott egyenes egyenlete
(10.10)
(10.10) birtokában meghatározhatjuk annak szükséges és elégséges feltételét, hogy három pont egy egyenesre
illeszkedjen. Ha a három pont A(a1; a2), B(b1; b2), C(c1, c2) egy egyenesre illeszkedik, akkor az A és B pontokon átmenő
egyenes (10.10) egyenletét a C pont koordinátái kielégítik, vagyis annak szükséges és elégséges feltétele, hogy három pont
egy egyenesre illeszkedjen az, hogy az alábbi determináns értéke 0 legyen:
Gyakran előfordul, hogy nem az egyenessel párhuzamos, hanem az egyenesre merőleges helyvektor adott.
(10.11)
Tekintsük a 10.15. ábrát! Mivel az n vektor merőleges a vektorra, ezért skaláris szorzatuk 0.
10.15. ábra
10.16. ábra
(10.12)
Megjegyzés. Míg egy egyenesnek végtelen sok irányvektora van, addig meredeksége csak egyetlenegy. A meredekség
bevezetésekor feltettük, hogy v1 ≠ 0, ami azt jelenti, hogy az egyenes nem párhuzamos az y tengellyel. Mindebből
következik, hogy az y tengellyel párhuzamos egyeneseknek nincs meredekségük. Ha az egyenes áthalad az origón,
azaz P0(0; 0), akkor egyenlete y = mx alakú. A koordinátatengelyek derékszögét felező egyenesek esetében α = 45°,
vagy α = 135°, így tg α = 1, vagy tg α = –1; ezért az I. és III. síknegyed szögfelező egyenesének egyenlete y = x, a II. és IV.
síknegyed derékszögeit felező egyenes egyenlete y = –x.
Ha az egyenes az x tengelyt az (a; 0) pontban, az y tengelyt a (0; b) pontban metszi, akkor egyenlete
(10.13)
A (10.13) egyenlet igazolásához tekintsük a 10.15. ábrát! Az egyenes egy irányvektora v(a; –b). Ezzel az egyenes
egyenlete
(10.14)
(10.15)
Ha a nevezőkben levő determináns értéke 0, akkor a két egyenes vagy egybeesik, vagy nincs közös pontjuk, azaz
párhuzamosak.
Két egyenes metszéspontjának ismeretében megadhatjuk annak szükséges és elégséges feltételét, hogy három egyenes
egy ponton haladjon keresztül. Legyen a három egyenes
E három egyenes akkor és csak akkor megy át egy ponton, ha közülük kettőnek (pl. az elsőnek és a másodiknak) a
metszéspontja illeszkedik a harmadik egyenesre. Az első és a második egyenes metszéspontját (10.15)-ben látjuk, ha ez
kielégíti a harmadik egyenes egyenletét, akkor
De ez utóbbi egyenlet bal oldalán éppen egy harmadrendű determináns szerepel, így azt kaptuk: annak szükséges és
elégséges feltétele, hogy három egyenes egy ponton haladjon keresztül, az, hogy az együtthatóikból alkotott harmadrendű
determináns értéke 0 legyen:
(10.16)
A két egyenes akkor merőleges egymásra, ha az egyik irányvektorát 90°-kal elforgatva a másik egyenes irányvektorával
párhuzamos lesz, azaz ha
(10.17)
Példák
1. Írjuk fel a P(4; –2) ponton átmenő, v(3; 5) irányvektorú egyenes egyenletét! Az egyenes egyenlete (10.7) alapján
2. Írjuk fel az A(–5; 7) ponton átmenő, n(2; –1) normálvektorú egyenes egyenletét. Az egyenes egyenlete (10.11)
alapján
3. Adott a P(3; 5) pont és a –2x + 4y = 7 egyenletű e egyenes. Mekkora területű háromszöget vág le a
koordinátatengelyekből a P ponton átmenő, e-vel párhuzamos egyenes?
A megadott egyenes egy irányvektorát kiolvashatjuk az egyenletéből: v(–4; –2). A keresett egyenes párhuzamos e-
vel, ezért v ennek is egy irányvektora, így a keresett egyenes egyenlete: –2x + 4y = –6 + 20 = 14, azaz –x + 2y = 7. Ez az
egyenes ott metszi az x tengelyt, ahol y = 0, és ott metszi az y tengelyt, ahol x = 0; tehát x = –7, . Ezek
szerint az egyenes és a koordinátatengelyek alkotta háromszög T területe:
4. Adottak a 2x + 5y = –12 és –6x +by = c egyenletű egyenesek. Mekkora legyen a b és c paraméter, hogy
a) különböző párhuzamos egyenesek legyenek,
b) egybeeső egyenesek legyenek,
c) merőleges egyenesek legyenek,
d) sem párhuzamos, sem merőleges ne legyen egymásra a két egyenes.
A különböző feltételeket az egyenesek irányvektorainak, illetve iránytangenseinek vizsgálatával végezzük.
a) Az első egyenes egy irányvektora v(–5; 2), a második egyenes egy irányvektora v*(–b; –6). A két egyenes akkor és
csak akkor párhuzamos, ha , azaz b = –15. Ez egyben azt jelenti, hogy a második egyenlet bal oldala az
első egyenlet bal oldalának –3-szorosa. Amennyiben a jobb oldal is az első egyenlet jobb oldalának –3-szorosa,
akkor a két egyenlet ugyanannak az egyenesnek az egyenlete. Tehát a két egyenes akkor lesz két különböző
párhuzamos egyenes, ha b = –15 és c ≠ 36.
b) A két egyenes akkor lesz egybeeső, ha b = –15 és c = 36.
A két egyenes akkor és csak akkor merőleges egymásra, ha m1·m2 = –1, tehát , ahonnan és c
tetszőleges valós szám.
d) Ha b ≠ –15 és (c tetszőleges valós szám), akkor a két egyenes sem merőleges, sem párhuzamos nem lesz
egymással.
5. Egy térképhez rögzített koordináta-rendszerben az egység mindkét tengelyen 1,5 km. Az A és B faluk
központjának koordinátái A(2; 6), B(10; 2); az országút egyenlete y = 0, az origó a megyeszékhely központja. Milyen
távol van a megyeszékhely központjától az országúton levő M buszmegálló, ha az az A és B faluk központjától
egyenlő távolságra van?
Tekintsük a 10.17. ábrát! Az x tengely azon M pontját, mely A-tól és B-től egyenlő távolságra van, az AB szakasz
felező merőlegese metszi ki.
10.17. ábra
Az F pont koordinátái F(6; 4). Az AB egyenes egy irányvektora v(8; –4), vagy az egyszerűbb, vele párhuzamos v*(2;
–1). Ez a v* vektor a felező merőlegesnek egy normálvektora, így írhatjuk a felező merőleges egyenletét: 2x – y = 12
– 4 = 8. Ez ott metszi az x tengelyt, ahol y = 0, tehát 2x = 8, azaz x = 4. Ezek szerint az M pont koordinátái M(4; 0).
Mivel az egység másfél km, így az országúton az M buszmegálló a megyeszékhely középpontjától 6 km távolságra
van.
6. Egy háromszög csúcspontjainak a koordinátái A(–2; 2), B(0; 8), C(4; 2). Számítsuk ki a háromszög köré írható köre
középpontjának a koordinátáit, valamint a magasságpontjának a koordinátáit, és igazoljuk, hogy a két pont,
valamint a háromszög súlypontja egy egyenesen van.
Először ábrázoljuk a megadott háromszöget (10.18. ábra). A háromszög AC oldalhoz tartozó magasságvonala az y
tengely, ennek egyenlete x = 0. A BC oldalhoz tartozó magasságvonal merőleges BC-re. A BC egyenes egy
irányvektora v(4; –6), vagy az egyszerűbb (2; –3); ez a vektor a magasságvonalnak egy normálvektora, tehát a BC
oldalhoz tartozó magasságvonal egyenlete 2x – 3y = –10. Mivel x = 0, ezért . Tehát az ABC háromszög
magasságpontja .
10.18. ábra
A köré írható kör K középpontja az oldalfelező merőlegesek metszéspontja. Az AC oldal felezőpontja F1(1; 2); e
felező merőleges párhuzamos az y tengellyel, így e felező merőleges egyenlete x = 1. A BC oldal felezőpontja F2(2;
5), egy irányvektora v(2; –3). Ez az irányvektor a felező merőlegesnek egy normálvektora, tehát a BC oldal felező
merőlegesének egyenlete 2x – 3y = 4–15 = –11. Mivel x = 1, ezért , tehát az ABC háromszög köré írható
7. A 10.19a ábrán egy tetőszerkezet keresztmetszete látható. A szakemberek szerint ezt a ferde tető felezőpontjában,
rá merőlegesen kell alátámasztani egy g gerendával, hogy a legstabilabb legyen. Milyen hosszú legyen ez a g
gerenda?
10.19a ábra
Helyezzük el az ábrát egy alkalmasan választott koordináta-rendszerben (10.19b ábra). Az egyes csúcspontok
koordinátáit az adatokból könnyen megállapíthatjuk. A g gerenda egyenese a CD szakasz felező merőlegese. A CD
szakasz felezőpontja F(4; 5), a DC egyenes egy irányvektora v(8; –2) vagy az egyszerűbb (4; –1). Ez a vektor a DC
ferde tetőnek egy irányvektora, így a g gerenda egyenesének egyenlete 4x – y = 16 – 5 = 11. Ez az egyenes ott metszi
8. Egy háromszög két csúcspontja A(2; 6), B(6; 4). A háromszög súlypontja S(1; 1). Mekkora a háromszög területe?
Tekintsük a 10.20. ábrát! Megtehetnénk, hogy a háromszög két csúcspontjának és súlypontjának ismeretében
(10.4) segítségével kiszámítjuk a harmadik csúcs koordinátáit, majd alkalmazzuk a (10.6) képletet.
10.20. ábra
= c2, azaz , ahonnan b1c2 – c1b2 = 0. Ez utóbbi egyenlet bal oldala egy másodrendű determináns
értékével egyenlő, így tehát annak a feltétele, hogy a megadott két egyenes az y tengelyen metssze egymást:
(10.19)
Példák
1. Számítsuk ki a 2x – 3y = – 7 és x + 4y = 12 egyenletű egyenesek hajlásszögét!
Az egyenesek normálvektorai n(2; –3) és n*(1; 4). A (10.18) képletet használva azt kapjuk
3. Egy háromszög csúcspontjai A(–2; 2), B(4; 4), C(0; 6). Milyen hosszú a háromszög C csúcsból induló magassága?
Tekintsük a 10.21. ábrát! Először felírjuk az AB egyenes egyenletét, majd kiszámítjuk a C pont és az egyenes
távolságát.
10.21. ábra
Az A és B ponton átmenő egyenes egy irányvektora v(6; 2) vagy az egyszerűbb (3; 1) vektor. Tehát az AB egyenes
egyenlete: x–3y = –8. Ezek után a C pontnak az AB egyenestől való távolsága (10.19) alapján
A kör a sík azon pontjainak a halmaza, melyek egy adott ponttól egyenlő távolságra vannak. Az adott pont a kör
középpontja, az adott távolság a kör sugara.
A kör középpontját általában K-val, sugarát r-rel jelöljük. Ezek szerint a koordináta-rendszerben egyértelműen
megadhatjuk a kört, ha megadjuk a kör K(u; v) középpontját és r sugarát (10.22. ábra).
Egy P(x; y) pont akkor és csak akkor van rajta a körön, ha a K(u; v) középponttól vett távolsága r, azaz
(10.20)
10.22. ábra
Ha elvégezzük a kör egyenletének bal oldalán szereplő négyzetre emeléseket, és az egyes tagokat a megfelelő módon
rendezzük, a következőt kapjuk
(10.21)
Tehát a kör egyenlete egy kétismeretlenes másodfokú egyenlet. Hasonlítsuk össze ezt az egyenletet a kétismeretlenes
másodfokú egyenlet általános alakjával:
(10.22)
(10.21)-et és (10.22)-t összehasonlítva arra jutunk, hogy egy kétismeretlenes másodfokú egyenlet csak akkor lehet kör
egyenlete, ha a = b és e = 0, tehát a másodfokú tagok együtthatói egyenlők, és nem szerepel benne xy-os tag (ún. vegyes
szorzat). Ha a = b és e = 0, akkor a-val elosztva (10.22) mindkét oldalát
alakot kapunk. Ez akkor lesz kör egyenlete, ha a jobb oldalon szereplő tagra s > 0.
Példák
1. Ábrázoljuk az alábbi egyenletekkel megadott köröket:
a)(x+1)2 + (y–2)2 = 4, b)x2+y2–4x+ 6y + 4 = 0.
a) (10.20) alapján a kör középpontja K(–1; 2), sugara r = 2 (10.23. ábra).
b) A megadott kétismeretlenes másodfokú egyenletet először teljes négyzetté kiegészítve (10.20) alakra kell
hoznunk.
10.23. ábra
10.24. ábra
Megjegyzés. Érdemes kiemelni, hogy ha a kör középpontja első koordinátájának abszolút értéke egyenlő a kör
sugarával, akkor a kör érinti az y tengelyt, ha pedig a középpont második koordinátájának abszolút értéke
egyenlő a kör sugarával, akkor a kör érinti az x tengelyt; ezt láthattuk a feladat a) és b) részében is.
2. Ábrázoljuk egy koordináta-rendszerben az x2 +y2 – 6x + 8y = 0 kört, és számítsuk ki, hogy e kör mely pontokban
metszi a koordinátatengelyeket!
A kör egyenlete átalakítva (x – 3)2 + (y + 4)2 = 25, tehát a kör középpontja K(3; –4), sugara r = 5. Mivel a P(0; 0) pont
koordinátái kielégítik az egyenletet, ezért a kör áthalad az origón (10.25. ábra).
10.25. ábra
A kör ott metszi az x tengelyt, ahol y = 0, tehát x2 – 6x = 0, ahonnan x1 = 0, x2 = 6. Ott metszi az y tengelyt, ahol x = 0,
tehát y2 + 8y = 0, ahonnan y1 = 0, y2 = –8.
3. Egy kör egy átmérőjének két végpontja A(2; 4), B(6; 1). Írjuk fel a kör egyenletét! A kör középpontja az AB szakasz F
felezőpontja, sugara az AB szakasz fele (10.26. ábra).
10.26. ábra
4. Határozzuk meg a k paraméter értékét úgy, hogy az x2 +y2 – 4x + 8y + k = 0 egyenletű kör érintse az y = –2 egyenletű
egyenest!
A kör egyenlete átalakítva: (x–3)2 + (y + 4)2 = 20–k. Tehát a kör középpontjának a koordinátái K(2; –4), sugara
. Ábrázoljuk a kör középpontját és az y = –2 egyenest (10.27. ábra).
10.27. ábra
Ha a kör érinti az y = –2 egyenletű egyenest, és középpontja K(2; –4), akkor a sugara r = 2, így írhatjuk a következő
egyenletet: , ahonnan k = 16.
5. Egy kör érinti a koordinátatengelyeket, és áthalad a P(1; 2) ponton. Melyik ez a kör? Mivel a P pont az első
síknegyedben van, ezért a keresett kör is az első síknegyedben van. Mivel a kör érinti a koordinátatengelyeket,
ezért középpontjának a koordinátái egyenlők a kör sugarával: u = v = r (10.28. ábra). Ezek szerint a kör egyenlete
(10.23)
alakú egyenlet. Ha a kör illeszkedika P(1; 2) pontra, akkor e pont koordinátái kielégítik a (10.23) egyenletet, tehát
(1 – r)2 + (2 – r)2 = r2, ahonnan r2 – 6r + 5 = 0. E másodfokú egyenlet gyökei
Tehát két olyan kör van, mely megfelel a feladat feltételeinek; ezek egyenlete
10.28. ábra
6. Határozzuk meg a k paraméter értékét, hogy az alábbi két egyenlettel megadott körök kívülről érintsék egymást:
x2 +y2 – 8x + 6y + 21 = 0, x2 +y2 + 4x – 10y + k = 0.
Alakítsuk át a körök egyenleteit úgy, hogy a középpontok és a sugarak kiolvashatóak legyenek.
Tehát az első kör középpontja K1 (4; –3), sugara r1 = 2, a második kör középpontja K2(–2; 5), sugara
(10.29. ábra).
Ha a két kör kívülről érinti egymást, akkor középpontjaik távolsága egyenlő a sugaraik összegével. A két kör
középpontjának távolsága , tehát , azaz ,
ahonnan k = –35.
10.29. ábra
Kör és egyenes
(10.24)
(10.25)
típusú kétismeretlenes elsőfokú egyenlet. A kör és egyenes közös pontjainak meghatározásához a (10.24) és (10.25)
egyenletekből álló egyenletrendszert kell megoldanunk. Ehhez először az elsőfokú egyenletből (10.25) kifejezzük az egyik
ismeretlent, majd azt behelyettesítjük a kör (10.24) egyenletébe, így a kör egyenlete egyismeretlenes másodfokú egyenletté
válik, melynek 0, 1 vagy 2 megoldása van aszerint, hogy diszkriminánsa negatív, 0 vagy pozitív. Ez természetesen
összhangban van azzal, hogy a körnek és egyenesnek 0, 1 vagy 2 közös pontja van. Az egyismeretlenes másodfokú egyenlet
megoldásait visszahelyettesítjük az egyenes (elsőfokú) egyenletébe, s így megkapjuk a kör és az egyenes közös pontjainak a
koordinátáit.
10.30. ábra
Példa. Számítsuk ki az x2+y2 + 6x – 4y–12 = 0 egyenletű kör és az x+y = 4 egyenletű egyenes közös pontjainak a
koordinátáit!
Bár nem szükséges, ábrázoljuk egy koordináta-rendszerben a megadott kört és az egyenest! A kör egyenletéből (x +
3)2 + (y – 2)2 = 25, tehát a középpont K(–3; 2), a sugár r = 5. Az egyenes meredeksége –1, az y tengelyt a (0; 4) pontban
metszi (10.31. ábra). Az egyenes egyenletéből y = 4–x. Ezt a kör egyenletébe helyettesítve azt kapjuk:
10.31. ábra
A kapott értékeket visszahelyettesítjük az egyenes egyenletébe; kapjuk: y1 = 7, y2 = 2. Tehát az adott kör és az adott
egyenes közös pontjai: M1(–3; 7), M2(2; 2).
Példa. Írjuk fel az x2+y2 + 2x – 6y – 15 = 0 egyenletű kör P0(–5; 6) pontjába húzható érintőjének az egyenletét! A kör
egyenletéből a középpont K(–1; 3). Ekkor a vektor: (-4;3). Ez a vektor az érintő egy normálvektora, így a
P0-beli érintő egyenlete: –4x+3y = 38.
Mielőtt a kör egy külső pontból húzott érintőinek egyenleteit tárgyalnánk, nézzük meg két kör közös pontjainak
kiszámítási módját.
(10.26)
(10.27)
A kapott (10.27) egyenlet egy kétismeretlenes elsőfokú egyenlet, egy egyenes egyenlete. A (10.27) egyenletet nevezzük a
(10.26) egyenletű körök hatványvonalának. Ha a P0(x0; y0) pont illeszkedik mindkét körre, akkor
vagyis a P0 pont illeszkedik a (10.27) egyenesre, vagyis a két kör hatványvonalára is. Természetesen, ha a P1(x1; y1) pont is
közös pontja a két körnek, akkor ugyanez elmondható e P1 pontra is, tehát, ha a köröknek vannak közös pontjai, akkor azok
illeszkednek a körök egyenleteinek különbségéből adódó egyenesre. Ilyen módon a két kör közös pontjainak a kiszámítását
visszavezettük a kör és egyenes közös pontjainak kiszámítására. A gyakorlatban mindez úgy történik, hogy a körök
egyenleteinek különbségét képezve először meghatározzuk (10.27) egyenletet, majd megoldjuk az ezen egyenletből és
valamelyik kör egyenletéből álló egyenletrendszert.
Megjegyzés. Természetesen, ha a két körnek nincs közös pontja, az egyenleteik különbségéből adódó elsőfokú
kétismeretlenes egyenlet akkor is egy egyenes egyenlete, tehát ekkor a két kör hatványvonalának egyik körrel sincs
közös pontja. Kimutatható, hogy két nem koncentrikus kör hatványvonala mindig merőleges a két kör középpontján
áthaladó (centrális) egyenesre. Ha adott három nem koncentrikus kör, akkor ezek páronként vett hatványvonala
mindig egy pontban metszi egymást; ezt a pontot szokás nevezni a három kör hatványpontjának (10.33. ábra). Ha
ugyanis a körök egyenletei
akkor a hatványvonalak egyenletei
10.33. ábra
A kapott értékeket visszahelyettesítve a hatványvonal egyenletébe kapjuk a két kör közös pontjainak koordinátáit:
M1(2; 3), M2(0; 1) (10.34. ábra).
10.34. ábra
Megjegyzés. Egyéb módon is felírhatjuk a kör egy külső P0 pontból húzott érintőinek az egyenletét. Először felírjuk a
P0 ponton áthaladó összes egyenes egyenletét; ehhez egy paramétert használunk, amit legcélszerűbb az m
meredekségnek választani. Ezután e paraméteres egyenletből (ami elsőfokú kétismeretlenes egyenlet) kifejezzük az
egyik ismeretlent, majd azt behelyettesítjük a kör egyenletébe. Így a kör egyenlete egy egyismeretlenes másodfokú
paraméteres egyenlet lesz; melynek megoldásai adják az egyenes és a kör metszéspontjainak a megfelelő
koordinátáit. Mivel azt akarjuk, hogy az egyenes érintő legyen, ezért ennek az egyenletnek csak egy megoldása lehet,
amit úgy tudunk elérni, hogy a diszkriminánsát 0-val tesszük egyenlővé. Ezzel a választott m paraméterre kapunk
egy (általában másodfokú) egyenletet, melyet megoldva megkapjuk a P0 ponton átmenő érintők meredekségét, így
már felírhatjuk a kérdéses érintők egyenletét. (Természetesen ez utóbbi eljárás csak akkor használható, ha egyik
érintő sem párhuzamos az y tengellyel.) Példák
1. Határozzuk meg az x2 + y2 – 8x – 6y + 9 = 0 körnek azokat a pontjait, melyek az A(–3; 2) és B(1; 0) pontoktól egyenlő
távolságra vannak!
Az A és B pontoktól egyenlő távolságra levő síkbeli pontok az AB szakasz felező merőlegesének a pontjai, tehát a
felező merőleges és a kör metszéspontjait kell meghatároznunk. A kör egyenletéből (x – 4)2 + (y – 3)2 = 16, tehát a
kör középpontja K(4; 3), sugara pedig r = 4 (10.36. ábra).
10.36. ábra
Az AB szakasz felezőpontja F(–1; 1), egy irányvektora v(–2; 1). Ez az irányvektor a felező merőlegesnek
normálvektora, így a felező merőleges egyenlete: –2x + y = 3, azaz y = 2x+ 3. Helyettesítsük ezt a kör egyenletébe:
3. Egy város térképéhez rögzített koordináta-rendszerben (ahol az egység mindkét tengelyen 20 m) a városi
körcsarnok egyenlete x2 +y2 – 6x–4y – 12 = 0. A város főútvonalának egyenlete 4x + 3y = 44. A körcsarnok egyik
bejáratát olyan pontba építik, amelyik a legközelebb van a főútvonalhoz. Milyen távol van ez a kapu a
főútvonaltól? A kör középpontja K(3; 2), sugara r = 5. Tekintsük a 10.38. ábrát!
10.38. ábra
A körnek a főúthoz legközelebb eső pontját a kör középpontján átmenő, a főút egyenesére merőleges egyenes
metszi ki a körből. A főút egyenesének egy normálvektora n(–4; 3). Ez a vektor a rá merőleges egyenesnek egy
irányvektora, így a K pontból az egyenesre állított merőleges egyenlete 3x + 4y = 17. A 4x + 3y = 44 és 3x + 4y = 17
egyenletrendszer megoldása, azaz a főút keresett P pontjának a koordinátái P(–5; 8).
Ez utóbbi másodfokú egyenlet gyökei: x1 = 7, x2 = –1. Az adatokból nyilván számunkra x2 az érdekes, így a
körcsarnok keresett pontja M2(–1; 5). Az M2P szakasz hossza:
Mivel az egység mindkét tengelyen 20 m, így a körcsarnok bejáratának a főúttól való távolsága 100 méter.
4. Az ABCD téglalap oldalai: AB = 20, BC = 10. Az AB oldalra mint átmérőre egy félkört rajzolunk a téglalap belsejébe.
Az AC és BD átlók e félkört a P és Q pontokban metszik. Mekkora az ABPQ négyszög területe? Helyezzük el a
szükséges ábrát egy koordinátarendszerben (10.39. ábra)!
10.39. ábra
A kérdéses négyszög egy szimmetrikus trapéz, melynek hosszabbik alapja 20. A magasságát és rövidebb alapját
könnyen megkapjuk, ha meghatározzuk a P pont koordinátáit. E P pont a K középpontú, 10 sugarú körnek és az
AC egyenesnek a metszéspontja. Az AC egyenes egyenlete , a kör egyenlete (x – 10)2 +y2 = 102. Az egyenes
10.40. ábra
APK egyenes egy irányvektora v(2; –1). Ez a vektor a rá merőleges egyenesnek normálvektora, tehát a keresett húr
egyenlete y = 2x + 5. Ezt a kör egyenletébe helyettesítve:
10.4. Koordinátatranszformációk
Legyen adott egy koordináta-rendszerben egy P0(x0; y0) pont, és azt szeretnénk meghatározni, hogy ugyanennek a pontnak
a koordinátái egy másik koordináta-rendszerben hogyan alakulnak. Ilyenkor koordinátatranszformációt hajtunk végre,
melyek közül a két legfontosabb a kordináta-rendszer párhuzamos eltolása, illetve az origó körüli adott szögű elforgatása.
Most szorozzuk meg az első egyenletet cos α-val, a másodikat sin α-val, majd adjuk össze a két egyenlet megfelelő
oldalát; azt kapjuk:
Ha pedig az első egyenletet –sin α-val, a másodikat cos α-val szorozzuk, akkor az adódik
10.42. ábra
Példák
1. Egy egyenes egyenlete az x, y koordináta-rendszerben y = –3x + 5. Eltoljuk a koordináta-rendszert önmagával
párhuzamosan úgy, hogy az új x*, y* rendszer origója az eredeti rendszer O*(3; 5) pontjába kerüljön. Mi lesz az
egyenes egyenlete az új rendszerben?
10.43. ábra
A kör egyenletével a 10.3. fejezetben foglalkoztunk. Ebben a fejezetben a többi kúpszeletet tárgyaljuk. Először
ponthalmazként de niáljuk e görbéket, majd egyenleteikkel, érintőik egyenletével foglalkozunk. Hogy az alábbiakban
szereplő de nícióknak valóban megfelelnek a kúp különböző síkmetszetei, annak tárgyalását a 6., A tér elemi geometriája
című fejezetben találjuk.
A parabola
Az ellipszis
A hiperbola
Másodrendű görbék
A parabola
A parabola a sík azon pontjainak a halmaza, melyek a sík egy pontjától és egy rá nem illeszkedő síkbeli egyenestől
egyenlő távolságra vannak.
Az adott pontot a parabola F fókuszpontjának nevezzük, az adott egyenes pedig a parabola vezéregyenese (direktrixe).
Ha egy pont a vezéregyenestől ugyanakkora távolságra van, mint a fókuszponttól, akkor e pont egy olyan kör középpontja,
mely érinti a vezéregyenest, és áthalad a fókuszon. Ennek megfelelően a parabolát így is de niálhatjuk:
A parabola egy adott egyenest érintő és egy adott, az egyenesre nem illeszkedő ponton áthaladó körök
középpontjainak a halmaza.
Tekintsük a 10.44. ábrát! Ha P pontja az F fókuszpontú, v vezéregyenesű parabolának, akkor PF = Pv. Ha valamely Q
pontra QF < Qv, akkor e Q pont a parabola belső pontja, ha pedig valamely R pontra RF > Rv, akkor az R pont a parabola
külső pontja.
10.44. ábra
10.45. ábra
Vegyük a vezéregyenes egy tetszőleges (a tengely és a vezéregyenes metszéspontjától különböző) Q pontját, és állítsunk
Q-ban merőlegest a vezéregyenesre. E merőleges és az FQ szakasz felező merőlegese valamilyen P pontban metszik
egymást. A P illeszkedik a felező merőlegesre, ezért PF = PQ. De PQ azonos a P pontnak a vezéregyenestől való távolságával,
így a P pont biztosan illeszkedik a parabolára. Mivel a Q pontot a vezéregyenesen bárhol felvehetjük, így valóban a
parabolának minden pontjához eljuthatunk.
Helyezzük el a parabolát egy koordináta-rendszerben úgy, hogy tengelye az y tengely legyen, tengelypontja pedig az
origóba essen (10.46. ábra)!
10.46. ábra
(10.28)
Megjegyzés. Ha a p paraméter értéke negatív, akkor a parabola „lefelé nyíló”; ekkor egyenlete .
Természetesen ekkor a fókuszpont a tengelypont alatt, a vezéregyenes pedig a tengelypont fölött van.
Hasonló gondolatmenettel jutunk el az x tengelyű, p paraméterű parabola kanonikus egyenletéhez (10.47. ábra).
10.47. ábra
(10.29)
Ha a parabola tengelye párhuzamos az y tengellyel, de tengelypontja nem az origóban van, hanem a T(u; v) pontban
(10.48. ábra), akkor egyenlete
(10.30)
10.48. ábra
Ha a (10.30) egyenletben elvégezzük a kijelölt műveleteket, akkor ax2 + bx + cy + d = 0 alakú egyenlethez jutunk.
Megállapíthatjuk tehát, hogy a parabola egyenlete olyan kétismeretlenes másodfokú egyenlet, melyben az egyik (és csak az
egyik) ismeretlen szerepel a másodfokon, továbbá xy-os tag nem szerepel benne. Ha a parabola tengelye az y tengellyel
párhuzamos, akkor az x szerepel másodfokon, ha pedig a tengely az x tengellyel párhuzamos, akkor y szerepel másodfokon.
A parabola érintője
A parabola érintője
A parabola érintője olyan egyenes, melynek a parabolával egyetlen közös pontja van, és nem párhuzamos a parabola
tengelyével.
Írjuk fel az parabola egy adott P0 (x0; y0) pontjában az érintő egyenletét (10.49. ábra)!
10.49. ábra
(10.31)
A (10.31) egyenletű egyenes és a parabola közös pontjait megkapjuk, ha y-t behelyettesítjük a parabola egyenletébe
Ha az egyenes érintője a parabolának, akkor csak egy közös pontjuk van, vagyis ennek az x2-ben másodfokú
egyenletnek csak egy megoldása lehet, tehát diszkriminánsa 0 kell, hogy legyen.
(10.32)
azaz
Ezt (10.31)-be visszahelyettesítve kapjuk a P0 ponton átmenő érintő egyenletét:
(10.33)
Érdemes meg gyelni, hogy a diszkriminánst 0-val egyenlővé tevő (10.32) egyenlet bal oldala teljes négyzet. Ez nem
meglepő, sőt törvényszerűen így kellett lennie, hiszen ha a (10.32) m-ben másodfokú egyenletnek két megoldása lenne,
akkor a parabola egy P0 pontjába két érintőt húzhatnánk, ha pedig a (10.32) egyenletnek nem lenne megoldása, akkor a P0
pontban egyetlen érintő sem lenne húzható.
A P0-beli érintő (10.33)-beli alakjából számítsuk ki, hol metszi ez az érintő az x tengelyt. Ekkor y = 0, tehát
, ahonnan . Ez lehetőséget nyújt számunkra egy adott parabola valamely P0 pontbeli érintőjének a
megszerkesztésére. A parabola T tengelypontjában merőlegest állítunk a parabola t tengelyére, majd e merőlegesre szintén
merőlegest állítunk a P0 pontból. Ha ez utóbbi merőleges talppontja Q, akkor – az előbb kapott eredmény alapján – a P0-beli
érintőnek át kell haladnia a TQ szakasz F felezőpontján (10.50. ábra). Fontos tulajdonsága még a parabolának, hogy a P0
pontjába húzott érintő felezi az FP0Q szöget.
10.50. ábra
Megjegyzés. A külső pontból húzott érintők egyenletét hasonló gondolatmenettel határozhatjuk meg. A külső P0
ponton átmenő m meredekségű egyenes egyenletéből és a parabola egyenletéből álló egyenletrendszert felírva, az
egyenes egyenletéből y-t kifejezve és behelyettesítve a parabola egyenletébe egy x-ben másodfokú, m paraméteres
egyismeretlenes egyenletet kapunk. Mivel a keresett egyenesnek a parabolával egy közös pontja van, így ennek az
egyenletnek a diszkriminánsa 0 kell, hogy legyen. Ezt felírva, m-re kapunk egy másodfokú egyenletet, melynek
minden esetben lesz két megoldása, így megkapjuk a keresett érintők meredekségét. Példák
1. Írjuk fel annak a felfelé nyitott parabolának az egyenletét, melynek tengelye párhuzamos az y tengellyel,
tengelypontja T(3; 1), paramétere 4.
Innen a parabola paramétere tengelypontja T(2; 3). A parabola lefelé nyitott. Ez azt jelenti, hogy a fókuszpont
a tengelypont „alatt” van a paraméter felével, a vezéregyenes pedig a tengelypont „fölött” van a paraméter
Ennek az egyenesnek a parabolával alkotott közös pontjait az x2 – 4x + 6 = mx–4m + 6 egyenlet megoldásai adják.
Az egyenletből x2 – (4 + m)x + 4m = 0. Ha az egyenes érintő, akkor csak egy közös pontja van a parabolával, tehát ez
utóbbi egyenletnek csak egy megoldása lehet, ami azt jelenti, hogy a diszkriminánsa 0. (4 + m)2 – 16m = 0, azaz m2
– 8m+ 16 = 0, ahonnan (m – 4)2 = 0, tehát az érintő meredeksége m = 4. Az érintő egyenlete y = 4x – 10.
4.
Az egyenletű parabola minden pontját összekötöttük a fókuszponttal. Mi lesz az így keletkező szakaszok
felezőpontjainak a halmaza?
Tekintsük a 10.51. ábrát! Ha a parabola valamely P0 pontját a fókuszponttal összekötő szakasz felezőpontja Q,
akkor Q koordinátái .
Ezek szerint a keresett ponthalmaz első, illetve második koordinátáira
(10.34)
Fejezzük ki (10.34) első egyenletéből x0-t, és helyettesítsük ezt (10.34) második egyenletébe:
10.51. ábra
A keresett ponthalmaz egy olyan y tengelyű parabola, melynek paramétere az eredeti parabola paraméterének a
. (10.52. ábra).
10.52. ábra
azaz .
azaz . Ennek az egyenesnek és a parabolának a közös pontjait (illetve a közös pontok első
(10.35)
Ha az egyenes érintője a parabolának, akkor (10.35) egyenletnek csak egy megoldása lehet, vagyis diszkriminánsa
0.
10.53. ábra
Az ellipszis
Az ellipszis a sík azon pontjainak a halmaza, melyek két adott ponttól mért távolságainak összege adott, a két pont
távolságánál nagyobb állandó.
A két pont az ellipszis két fókuszpontja, melyeket általában F1-gyel és F2-vel, ezek távolságát F1F2 = 2c-vel, az adott
távolságot pedig 2a-val szokás jelölni (10.54. ábra). Ha tehát adottak az F1, F2 fókuszpontok, továbbá a 2a távolság, akkor az
ellipszis azon P pontok összessége, melyekre PF1 + PF2 = 2a.
10.54. ábra
Az ellipszis valamely pontját a fókuszpontokkal összekötő r1, r2 szakaszokat a P ponthoz tartozó vezérsugárnak
nevezzük. A fókuszpontoknak az O szimmetriacentrumtól való távolságát lineáris excentricitásnak, a lineáris excentricitás
és a fél nagytengely hányadosát pedig numerikus excentricitásnak nevezzük. E numerikus excentricitásra nyilván
.
Minél nagyobb e numerikus excentricitás, annál „laposabb”, elnyúltabb az ellipszis. Ha e tört értéke 0, azaz a
fókuszpontok egybeesnek a szimmetriacentrummal, akkor a nagy- és kistengely egyenlő egymással, ekkor az ellipszis
speciálisan körbe megy át.
Az ellipszis tengelyesen szimmetrikus alakzat, két egymásra merőleges szimmetriatengelye van, melyek metszéspontja
az ellipszis O szimmetriacentruma. A 10.54. ábra R pontjára
így az ellipszis RT szimmetriaátlója éppen az adott 2a távolsággal egyenlő. Az RT szakaszt az ellipszis nagytengelyének, a QS
szakaszt a kistengelyének mondjuk. Ha a kistengely hossza 2b, akkor az OF1Q derékszögű háromszögre
(10.36)
Megjegyzés. Az ellipszis pontjait könnyen megszerkeszthetjük, ha adott a két fókuszpont, valamint adott a 2a
távolság. Rajzoljunk ugyanis az egyik fókusz (pl. F1) körül egy tetszőleges a – c ≤ r1 ≤ a + c sugarú kört, majd F2 körül
egy r2 = 2a – r1 sugarú kört! E körök P1 és P2 metszéspontjai biztosan rajta vannak az ellipszisen, hiszen e pontokra r1 +
r2 = 2a, amit a 10.55. ábráról leolvashatunk. Ilyen módon az ellipszis minden pontjához eljuthatunk.
10.55. ábra
10.56. ábra
Egy P(x; y) pont akkor és csak akkor illeszkedik az ellipszisre, ha PF1 + PF2 = 2a. Mivel
Emeljük négyzetre mindkét oldalt, majd végezzük el a lehetséges egyszerűsítést, azt kapjuk
(10.37)
Speciálisan, ha a = b, akkor az egyenlet x2 + y2 = a2 alakot ölt, vagyis ekkor egy origó középpontú, a sugarú kör
egyenletét kapjuk.
Ha az ellipszis centruma nem az origóban van, hanem a K(u; v) pontban, 2a nagytengelye az x tengellyel, 2b kistengelye
az y tengellyel párhuzamos (10.57. ábra), akkor egyenlete:
10.57. ábra
Az ellipszis érintője
Az ellipszis érintője
Az ellipszis érintőjének olyan egyenest nevezünk, melynek az ellipszissel egy közös pontja van. Ha a sík valamely P pontjára
PF1 + PF2 < 2a, akkor e P pontot az ellipszis belső pontjának nevezzük, ha PF1 + PF2 > 2a, akkor P az ellipszis külső pontja.
Ilyen módon azt is mondhatjuk: az ellipszis érintője olyan egyenes, melynek az ellipszissel egy közös pontja van, minden
egyéb pontja külső pont.
Legyen az egyenletű ellipszis két pontja P1(x1; y1) és P2(x2; y2), és közülük valamelyiken (pl. a P1-en)
átmenő érintőt szeretnénk meghatározni. A P1 és P2 pontokon átmenő egyenes egyenlete:
(10.38)
Az utóbb kapott egyenlet jobb oldalán éppen a P1 és P2 pontokon átmenő egyenes meredeksége szerepel. Helyettesítsük
ezt (10.38) egyenletbe:
Ha most a kérdéses egyenes a P1-beli érintő, akkor a P1 és P2 pontok egybeesnek, azaz x1 = x2 és y1 = y2, tehát azt kapjuk:
De a P1 pont illeszkedik az ellipszisre, így koordinátái kielégítik az ellipszis egyenletét, ami azt jelenti, hogy az utóbbi
egyenlet jobb oldalán 1 szerepel. Így az ellipszis P1 pontjára illeszkedő érintő egyenlete:
(10.39)
Fontos tulajdonsága az ellipszisnek, hogy valamely P pontjába húzott érintője felezi a P pontból húzott vezérsugarak
külső szögét (10.58. ábra).
10.58. ábra
Megjegyzés. Kimutatható, hogy az 5.3. fejezetben tárgyalt merőleges a nitás körhöz ellipszist rendel. Ha az ellipszis
nagytengelye 2a, kistengelye 2b, akkor az r = a sugarú kör valamely átmérő egyenesére vonatkozó arányú
merőleges a nitás a körhöz éppen az előbbi ellipszist rendeli. Mivel e transzformáció egyeneshez egyenest rendel,
így a kör egy P pontjába húzott érintőjének a n képe a keletkező ellipszis megfelelő P′ pontjába húzott érintője lesz.
Példák
1.
Határozzuk meg az egyenletű ellipszis fókuszpontjainak a koordinátáit! A fókuszpontok
koordinátái F1(c; 0) és F2(–c; 0), ahol (10.36) szerint c2 = a2 – b2. Ezek szerint c2 = 10–4 = 6, tehát . Tehát a
fókuszpontok koordinátái:
2. Egy tengelyponti ellipszis nagytengelyének egyik végpontja (6; 0), egyik fókuszpontjának a koordinátái F(4; 0).
Írjuk fel az ellipszis egyenletét!
A feltételek szerint a = 6 és c = 4. (10.36) alapján b2 = a2–c2, tehát b2 = 36–16 = 20. Így az ellipszis egyenlete:
3.
Írjunk négyzetet az egyenletű ellipszisbe! Igazoljuk, hogy e négyzet T területére .
Tekintsük a 10.59. ábrát! Az ellipszis beírható négyzetének a csúcsait az y = x és y = –x egyenletű egyenesek metszik
ki az ellipszisből.
10.59. ábra
Legyen az ellipszis az egyenletű ellipszis! Ha ennek valamely (pl. első síknegyedbeli) P pontjának
Az első egyenletből x0 = 3xs; ezt a másodikba helyettesítve, majd négyzetre emelve azt kapjuk
A keresett ponthalmaz tehát egy olyan kanonikus helyzetű ellipszis, melynek nagy- és kistengelye az eredeti
ellipszis nagy- és kistengelyének a harmada, kivéve az AB szakaszra eső pontokat.
5.
Írjuk fel az egyenletű ellipszis x = 4 abszcisszájú pontjaiba húzható érintőinek az egyenletét!
A hiperbola
A hiperbola a sík azon pontjainak a halmaza, melyeknek a sík két adott pontjától mért távolságai különbsége
(különbségének abszolút értéke) a két pont távolságánál kisebb állandó.
Az adott F1 és F2 pontok a hiperbola fókuszpontjai. A két fókuszpont távolságát 2c-vel jelöljük. A hiperbola valamely P
pontját a fókuszpontokkal összekötő r1 és r2 szakaszok a P ponthoz tartozó rádiuszvektorok (10.61. ábra)
10.61. ábra
A hiperbolának két ága van, tengelyesen szimmetrikus a fókuszpontokon áthaladó egyenesre, valamint a
fókuszpontok által meghatározott szakasz felező merőlegesére. E két tengely O metszéspontja a hiperbola centruma. A
fókuszpontoknak a centrumtól vett távolságát a hiperbola lineáris excentricitásának nevezzük. De níciónk szerint tehát,
ha az adott távolság 2a, akkor a hiperbola bármely P pontjára
(10.40)
A hiperbola két ágának a fókuszpontokon átmenő egyenessel alkotott metszéspontjainak távolsága éppen a megadott
2a, hiszen pl. (a 10.61. ábra jelöléseivel)
A fókuszpontokat tartalmazó egyenest a hiperbola valós tengelyegyenesének nevezzük, az AB = 2a szakaszt a hiperbola
valós tengelyének mondjuk. A fókuszpontokat összekötő szakasz felező merőlegese a hiperbola képzetes tengelyegyenese.
A képzetes tengelyegyenesre a hiperbola O centrumából mindkét irányban felmért b szakasz, melyre
(10.41)
10.62. ábra
Ennek megfelelően a hiperbola de níciójában megadott 2a szakasz felét, a-t a hiperbola valós féltengelyének, a (10.41)-
ben de niált b-t képzetes féltengelynek nevezzük.
Ha adott a hiperbola két fókuszpontjának 2c távolsága, valamint a valós tengely 2a hossza, akkor könnyen
megszerkeszthetjük a hiperbola tetszőlegesen sok pontját. Ha az egyik fókuszpont körül rajzolunk egy r1≥c – a sugarú
kört, majd a másik fókuszpont körül egy r2 = r1 + 2a sugarú kört, e körök biztosan metszik egymást, s a
metszéspontok a de níció alapján a hiperbola pontjai. E szerkesztési eljárással a hiperbola tetszőlegesen sok pontját
megszerkeszthetjük, s a hiperbola bármely pontjához eljuthatunk.
Helyezzük el a hiperbolát úgy egy koordináta-rendszerben, hogy valós tengelyegyenese az x tengely, képzetes
tengelyegyenese az y tengely legyen. Ekkor a hiperbola centruma a koordináta-rendszer origójába kerül. Ha a hiperbola
fókuszpontjainak a távolsága 2c, valós tengelye 2a, akkor
(10.42)
10.63. ábra
Innen négyzetre emelés után azt kapjuk
10.64. ábra
alakú egyenletet kapunk. Ez olyan kétismeretlenes másodfokú egyenlet, melyben a másodfokú tagok együtthatói
különböző előjelűek, és nem szerepel benne xy-os tag.
(10.43)
Érdekes tulajdonsága a hiperbolának, hogy bármely P pontjába húzott érintője felezi a P pontból húzott
rádiuszvektorok hajlásszögét (10.65. ábra).
10.65. ábra
A parabola és az ellipszis esetében bármely külső pontból két érintő húzható a kérdéses alakzathoz. A hiperbola
esetében vannak olyan külső pontok, melyekre ez nem teljesül. Az ilyen pontok két egyenest alkotnak, melyek a hiperbola
centrumában metszik egymást. Ezeket az egyeneseket a hiperbola aszimptotáinak nevezzük (10.66. ábra).
10.66. ábra
A centrumból nem húzható érintő a hiperbolához, az aszimptoták egyéb pontjaiból pedig egy érintő húzható a
hiperbolához. A hiperbola ágai a végtelenbe tartva tetszőlegesen megközelítik az aszimptotákat, így mondhatjuk, hogy az
aszimptoták a végtelenben érintik a hiperbolát.
Példák
1. Írjuk fel a hiperbola kanonikus egyenletét, ha a valós tengelye 8, képzetes tengelye 6.
hiperbolának a közös pontjait, illetve a közös pontok x koordinátáit az egyenlet adja. Innen
Ha az egyenesnek egy közös pontja van a hiperbolával, akkor ennek az egyenletnek csak egy megoldása lehet,
vagyis diszkriminánsa 0; 182m2 + 180(4 – 9m2) = 0, ahonnan . Ezek szerint az érintők egyenlete:
, illetve .
4.
Kössük össze az egyenletű hiperbola minden pontját a fókuszpontokkal! Mi lesz az így keletkező
háromszögek súlypontjainak a halmaza?
Tekintsük a 10.67. ábrát! Ha a hiperbola valamely (pl. első síknegyedbe eső) P0 pontjának első koordinátája x0,
Ekkor x0 = 3xs, tehát azaz 9a2y2, = = 9b2x2 – 9a2b2, ahonnan azt kapjuk: . Ez
utóbbi egyenlet egy olyan kanonikus helyzetű hiperbola egyenlete, melynek valós tengelye és képzetes tengelye az
eredeti hiperbola valós és képzetes tengelyének a harmada (kivéve a valós tengelyegyenesre eső pontokat).
Természetesen a kapott hiperbola fókuszpontjainak a távolsága ugyancsak harmada az eredeti hiperbola
fókuszpontjai távolságának.
5.
Az egyenletű hiperbola valamely P pontjából állítsunk merőleges egyenest a valós
tengelyegyenesre! Igazoljuk, hogy ennek az egyenesnek az aszimptoták közé eső darabját a P pont két olyan részre
bontja, melyek mértani közepe b. Tekintsük a 10.68. ábrát! Ha a P0 pontjának első koordinátája x0, akkor második
koordinátája
10.68. ábra
és Ekkor
tehát
Másodrendű görbék
Másodrendű görbének mondjuk az olyan (valós vagy képzetes) görbéket, melyek általános egyenlete
(10.44)
ahol a11, a12 és a22 nem mindegyike 0. (A bal oldali 2., 4. és 5. tagban azért szerepeltettünk egy-egy 2-es szorzót, mert a
későbbiekben közlendő képletek leírásához ez hasznos lesz majd számunkra.)
A (10.44) egyenletben feltehetjük, hogy a11 ≥ 0, ellenkező esetben az egyenletet –1-gyel szorozva ezt elérjük. Ha a11 = 0,
akkor feltételezzük, hogy a22 ≥ 0. Az a12 = 0 esettel e fejezet előző részeiben (kör, parabola, ellipszis, hiperbola) már
foglalkoztunk; ekkor ugyanis a megfelelő tagokat teljes négyzetté alakítva tudtuk a kérdéses alakzatokat kanonikus alakra
hozni a megfelelő általános másodfokú kétismeretlenes egyenletet, így legyen a12 ≠ 0.
A (10.44) egyenlet együtthatóiból képezzük az alábbi A harmadrendű determinánst, és ennek A11, A22, A33
aldeterminánsait!
E determinánsok mindegyike főátlójára szimmetrikus; segítségükkel a (10.44) egyenlet által meghatározott görbéket az
alábbiakban foglalhatjuk össze.
1. Ha A > 0, akkor a kérdéses görbe
a) A33 > 0 esetén képzetes ellipszis,
b) A33 = 0 esetén parabola,
c) A33 < 0 esetén hiperbola.
2. Ha A = 0, akkor a görbe
a) A33 > 0 esetén képzetes egyenespár (valós metszésponttal),
b) A33 = 0 esetén valós egyenespár, vagy képzetes párhuzamos egyenespár vagy egybeeső egyenespár attól függően, hogy A11
+ A22 < 0 vagy A11 + A22 > 0 vagy A11 + A22 = 0,
c) A33 < 0 esetén valós metsző egyenespár.
3. Ha A < 0, akkor a görbe
a) A33 > 0 esetén valós ellipszis,
b) A33 = 0 esetén parabola,
c) A33 < 0 esetén hiperbola.
Példák
1. Állapítsuk meg, hogy az alábbi kétismeretlenes másodfokú egyenlet milyen másodrendű görbét határoz meg!
a) 2x2 – 4xy+ 3y2 – 4x + 6y – 1 = 0
10.6. Polárkoordináták
Ha a síkon felveszünk egy derékszögű koordináta-rendszert, akkor a sík pontjait egyértelműen megadhatjuk egy rendezett
számpárral, vagyis a koordinátáikkal. De egyéb módon is megadhatjuk egyértelműen a sík pontjait; legyen a sík egy
tetszőleges P pontjának az O origótól vett távolsága r, az OP félegyenesnek az x tengely pozitív irányú félegyenesével bezárt
szöge α. Ekkor a P(r; α) módon jelölt adatokkal ugyancsak egyértelműen megadtuk a sík kérdéses pontját, s ilyen módon a
sík valamennyi pontját jellemezhetjük. Az r és α koordinátákat a P pont polárkoordinátáinak nevezzük. Sok matematikai,
zikai, tájékozódási, technikai probléma esetén célszerűbb és könnyen kezelhetőbb a polárkoordinátákkal való számolás,
mint a derékszögű koordináták alkalmazása.
A P pont x, y derékszögű és r, α polárkoordinátái között az alábbi összefüggések állnak fenn (10.69. ábra):
(10.45)
illetve
(10.46)
10.69. ábra
Ha a derékszögű koordinátákról polárkoordinátákra akarunk áttérni, akkor a (10.46) összefüggést használjuk, ha pedig
polárkoordinátákról derékszögű koordinátákra, akkor a (10.45) összefüggés használatos.
Példák
1. Számítsuk ki a P(6; –2) derékszögű koordinátákkal adott pont polárkoordinátáit! (10.46) alapján a
polárkoordináták:
2. Írjuk át a következő alakzatok egyenletét polárkoordinátás alakra!
a) x2+y2 = 9.
Az egyenlet egy origó középpontú, 3 sugarú kör egyenlete. (10.45) alapján
A polárkoordinátás egyenlet független α-tól, vagyis az alakzat olyan pontok összessége, melyek az origótól 3
egység távolságra vannak.
b) y = 3x.
A polárkoordinátás egyenlet r-től független, egy 3 meredekségű, origón átmenő egyenes egyenlete.
c) x2+ y2 – 10x = 0.
A megadott egyenlet egy K(5; 0) középpontú, 5 sugarú kör egyenlete. Áttérve polárkoordinátákra
d)
.
Az egyenlet egy origó centrumú ellipszis egyenlete. (10.45) alapján
10.70. ábra
A térbeli koordináta-rendszer alkothat jobbrendszert, de alkothat balrendszert is, ami azt jelenti, hogy az x tengelyt az
y tengelybe forgatva a kisebb szöggel, e forgás a z tengely pozitív irányából pozitív vagy negatív forgásnak látszik. Az esetek
többségében a térgeometriai problémák koordinátákkal való leírásánál jobbrendszert alkotó térbeli koordináta-rendszert
használnak – mi is ezt fogjuk használni.
A három egymásra merőleges koordinátasík a teret 8 részre, ún. térnyolcadokra osztja. Egy P pont egyes
koordinátáinak előjele attól függ, hogy a P pont melyik térnyolcadban van. Az egyes térnyolcadok és az egyes koordináták
előjelviszonyait az alábbi táblázat szemlélteti.
x + – – + + – – +
y + + – – + + – –
z + + + + – – – –
10.71. ábra
Legyenek a térbeli koordináta-rendszerben az A és B pontok koordinátái A(a1; a2; a3) és B(b1; b2; b3), és mutasson az A
pontba az a, a B pontba a b helyvektor! Az A pontból a B pontba mutató vektor
(10.47)
Legyenek adottak ismét a térbeli koordináta-rendszerben az A és B pontok koordinátái A(a1; a2; a3) és B(b1; b2; b3), és
mutasson az A pontba az a, a B pontba a b helyvektor! Keressük az AB szakasz azon P pontját, mely az AB szakaszt ismert p :
r arányban osztja két részre, vagyis, melyre . A 10.1. fejezetben leírt gondolatmenetet követve arra jutunk, hogy
a térbeli A(a1; a2; a3) és B(b1; b2; b3) pontok által meghatározott szakasz p : r arányú osztópontjának a koordinátái
(10.48)
Példák
1. Számítsuk ki az A(–2; 1; 6) és B(4; 5; 0) pontok által meghatározott szakasz felezőpontjának az origótól mért
távolságát!
Egy AB szakasz F felezőpontjának a kiszámításához a (10.48) képletet használhatjuk, amikor speciálisan p = r = 1.
Így esetünkben az AB szakasz F felezőpontja F(1; 3; 3). Az F pontnak az origótól való távolsága:
.
2. Adott két pont: A(–4; 3; 1) és N(2; 2; 0). Az N pont egy AB szakasz A-hoz közelebbi negyedelő pontja. Határozzuk
meg a B pont koordinátáit!
Legyenek az A, B és N pontokba mutató helyvektorok a, b és n. Ha az N pont az AB szakasz A-hoz közelebbi
negyedelő pontja, akkor ahonnan b = 4n – 3a. Ennek megfelelően a B pont koordinátái B(20; –1; –3).
3. Határozzuk meg az x tengelynek azt a pontját, mely az A(2; 3; 0) és B(5; –2; 6) pontoktól egyenlő távolságra van.
Ha az x tengely keresett pontja P(x0; 0; 0), akkor a PA = PB egyenlőség (10.47) alapján
, x20 – 4x0 + 13 = x20 – 10x0 + 65, ahonnan az x tengely keresett pontja
.
4. Melyik az a pont az y tengelyen, amelyik az A(3; 4; –1) ponttól kétszer olyan távol van, mint a B(5; 0; 2) ponttól?
Legyen az y tengely keresett pontja P(0; y0; 0)! A feltételek szerint PA = 2PB, vagyis
, azaz 10 +(4 – y0) = 4(29 + y20).
2
Innen 3y20 + 8y0 + 90 = 0. Ez utóbbi másodfokú egyenlet diszkriminánsa negatív, tehát nincs valós megoldása, ami
azt jelenti, hogy nincs az y tengelynek olyan pontja, mely az adott A ponttól kétszer olyan távol van, mint az adott
B ponttól.
A sík egyenletei
Egy adott S síkra merőleges 0-tól különböző vektort a sík egy normálvektorának nevezzük. Mutasson az r0 helyvektor a sík
egy adott P0(x0; y0; z0) pontjába, s legyen a síknak n(A; B; C) egy normálvektora. Ekkor a sík tetszőleges P(x; y; z) pontjába
mutató r vektorra teljesül, hogy
(10.49)
Ezt az egyenletet a sík P0 pontján átmenő, n normálvektorú vektoregyenletének mondjuk (10.72. ábra).
10.72. ábra
(10.50)
A (10.50)-ben szereplő műveleteket elvégezve (és feltételezve, hogy az A, B, C együtthatók nem mindegyike 0)
(10.51)
alakú egyenletet kapunk. Ez azt jelenti, hogy a sík egyenlete egy háromismeretlenes elsőfokú egyenlet, és minden ilyen
egyenlet egy sík egyenlete.
Gyakran használjuk a sík tengelymetszeti egyenletét. A (10.51)-ben leírt sík ott metszi az x tengelyt, ahol y = z = 0, az y
tengelyt, ahol x = z = 0, a z tengelyt, ahol x = y = 0. Ezek szerint a tengelyekkel való metszéspontok
Ezek szerint, ha a kérdéses sík az x tengelyt a-ban, az y tengelyt b-ben, a z tengelyt c-ben metszi, akkor tengelymetszeti
egyenlete:
Könnyen kimutatható, hogy az A(a1; a2; a3), S(b1; b2; b3), C(c1, c2; c3), D(d1; d2; d3) pontok akkor és csak akkor vannak
egy síkon, ha
(10.52)
továbbá, ha a fenti A, B és C pontok nincsenek egy egyenesen, akkor az általuk meghatározott sík egyenlete
(10.53)
10.73. ábra
Érdemes megjegyezni, hogy amennyiben ismerjük a sík három nem egy egyenesre illeszkedő pontját, akkor nem
érdemes a (10.53) determinánst kiszámolnunk, ha fel akarjuk írni a sík egyenletét. Gyorsabban érünk célt, ha a
három pont valamelyikéből a másik két pontba mutató vektort írjuk fel, majd kiszámoljuk e két vektor vektoriális
szorzatát. E vektoriális szorzat merőleges a két vektor által kifeszített síkra, így a sík egy normálvektora lesz, majd
kiválasztva a három pont valamelyikét (10.50) egyenletbe helyettesítve megkaphatjuk a sík egyenletét.
Az egyenes egyenletei
A térbeli egyenes egyenletét akarjuk felírni. Ehhez ismernünk kell az egyenes egy P0(x0; y0; z0) pontját, valamint egy v(v1;
v2; v3) irányvektorát. Ha a P0 pontba mutat az r0 helyvektor, akkor az egyenes bármely P(x; y; z) pontjába mutató r vektort
felírhatjuk
(10.54)
10.74. ábra
A (10.54) egyenletet a P0 ponton átmenő, v irányvektorú térbeli egyenes paraméteres vektoregyenletének mondjuk. A
(10.54) egyenletet koordinátákra kiírva kapjuk a térbeli egyenes paraméteres egyenletrendszerét:
Ha e három egyenlet mindegyikéből kifejezzük a t paramétert, kapjuk az egyenes egyenletét.
Legyen v(v1; v2; v3), P0(x0; y0; z0), ahol a v vektor nem minden koordinátája 0. A P0 ponton átmenő, v irányvektorú
egyenes egyenlete:
(10.55)
2. Írjuk fel az A(2; 2; 4), B(–1; 4; 2), C(3; 0; –4) pontokra illeszkedő sík egyenletét! Kétféleképpen járhatunk el. Vagy a
(10.53) képlet alapján kifejtjük az alábbi determinánst
vagy kiszámítjuk az és vektorokat és e két vektor vektoriális szorzatát. E vektoriális szorzat merőleges
a kérdéses síkra, így használhatjuk normálvektornak. Ezután valamelyik pontot kiválasztva (10.50) alapján
írhatjuk a sík egyenletét. (–3; 2; –2), (1; –2; –8).
Tehát a sík egy normálvektora n(–20; –26; 4). A C pontot választva a sík egyenlete
3. Számítsuk ki az A(–3; 4; 4) és B(5; 2; 6) pontokra illeszkedő egyenes egyenletrendszerét, és számítsuk ki, hogy ez az
egyenes hol metszi az xy koordinátasíkot!
Az egyenes egy irányvektora (8, –2; 2) vagy az egyszerűbb (4;–1; 1). A B pontot választva az egyenes
Ezt az előző egyenletbe helyettesítve: z = –2, és így x = z + 7 – 2y = –2 + 7–4 = 1. Tehát a megadott három sík közös
pontja M(1; 2; –2).
5. Adott két sík egyenleteikkel: 3x – 4y + 2z + 8 = 0 és x –3y + 4z – 6 = 0. Számítsuk ki a két sík metszésvonalának
egyenletrendszerét!
A két sík metszésvonala egyenletrendszerének felírásához az egyenes egy pontjára és egy irányvektorára van
szükségünk. Mivel ez az egyenes mindkét síkban benne van, ezért a két sík normálvektorának vektoriális
szorzata a metszésvonalnak egy irányvektora (10.75. ábra).
Tehát a két sík metszésvonalának egy irányvektora n(–10; –10; –5) vagy az egyszerűbb (2; 2; 1). A metszésvonal egy
pontjának meghatározásához rögzítsük valamelyik koordinátát; legyen pl. x = 0! Ekkor – 4y+2z – 8 = 0, azaz –2y + z
= 4, és – 3y + 4z = 6. Az első egyenlet –4-szeresét a második egyenlettel összeadva azt kapjuk: 5y = –10, ahonnan y = –
2, és ezzel z = 0. Tehát a metszésvonal egy P pontja P(0; –2; 0). A két sík metszésvonalának egyenletrendszere:
10.75. ábra
6. Számítsuk ki az A(–1; 2; 6) és B(3; –6; 8) pontok által meghatározott szakasz felező merőleges síkjának egyenletét,
és számítsuk ki, hogy ez a sík hol metszi a z tengelyt! Tekintsük a 10.76. ábrát! Az AB szakasz F felezőpontja
illeszkedik a síkra, és az AB szakasz
10.76. ábra
egyenesének egy irányvektora a síknak normálvektora. A felezőpont koordinátái F(1; –2; 7). vAB(4; –8; 2), így a sík
egy normálvektora n(2; –4; 1). Ezzel a sík egyenlete (10.50) alapján
A kapott sík ott metszi a z tengelyt, ahol x = y = 0, tehát a z tengellyel való M metszéspont M(0; 0; 17).
7. Az 5x + 3y – 4z + 2 = 0 egyenletű sík mekkora térfogatú tetraédert vág le a koordinátatengelyekből? A kérdéses
síknak a koordinátatengelyekkel alkotott metszéspontjai és az origó egy derékszögű tetraédert határoznak meg.
Legelőször a tengelyekkel alkotott metszéspontokat kell kiszámítanunk (10.77. ábra).
10.77. ábra
A sík az x tengelyt ott metszi, ahol y = z = 0, tehát az y tengelyt ott metszi, ahol x = z = 0, tehát a
10.78. ábra
Az M pont koordinátái kielégítik a sík egyenletét, így írhatjuk: 4(2t + 1) + 2(4t – 3) – – 4(t + 2) + 9 = 0, azaz 12t – 1 = 0,
10.79. ábra
A sík n(3; 2; –4) normálvektora az egyenesnek egy irányvektora, tehát az egyenes egyenletrendszere
10.
Adott az egyenletrendszerű egyenes. Írjuk fel annak a síknak az egyenletét, mely
illeszkedik az egyenes és az xy koordinátasík döféspontjára, és amely sík merőleges a megadott egyenesre.
Először kiszámítjuk, hogy a kérdéses egyenes mely pontban dö az xy koordinátasíkot. Ez a döféspont illeszkedik
a keresett síkra. Az egyenes irányvektora a síknak egy normálvektora, így a sík egy pontjának és
normálvektorának ismeretében már írhatjuk a sík egyenletét (10.80. ábra).
10.80. ábra
Az egyenes ott dö az xy koordinátasíkot, ahol z = 0, tehát . Innen . Tehát a
döféspont M koordinátái . Az egyenes egy irányvektora v(2; 3; 4), ami a keresett síknak egy
Másodrendű felületek
A másodrendű görbék térbeli megfelelői a másodrendű felületek. Másodrendű felületnek nevezzük azokat a térbeli
alakzatokat, amelyeknek az egyenlete a koordinátákban másodfokú. A másodrendű felületek egyenletének általános alakja
(10.56)
ahol nem minden másodfokú tag együtthatója 0, vagyis az a, b, c, d, e, f együtthatók egyszerre nem lehetnek 0-k.
Ha tekintjük a másodrendű felületnek a z = 0 síkkal való metszetét, akkor (10.56) egyenlet így alakul
Ez az egyenlet általában egy másodrendű görbe egyenlete lesz, de lehet valamely egyenes egyenlete vagy a teljes xy
koordinátasík egyenlete, esetleg lehet üres alakzat egyenlete is. Általában elmondhatjuk, hogy egy másodrendű felületnek
és egy térbeli egyenesnek mindig 0, 1 vagy 2 közös pontja van, vagy pedig az egyenes illeszkedik a másodrendű felületre.
Gömb
Forgásparaboloid
Forgásellipszoid
Forgáshiperboloid
Másodrendű kúpfelület
Gömb
A legismertebb másodrendű felület a gömb.
(10.57)
Tekintsük ugyanis a 10.81. ábrát! Egy P(x; y; z) pont akkor és csak akkor illeszkedik a K(u; v; w) középpontú, r sugarú
gömbre, ha PK = r. Ez viszont (10.57) szerint éppen azt jelenti, hogy
10.81. ábra
(10.58)
alakú kétismeretlenes másodfokú egyenletet kapunk. A gömb tehát olyan másodrendű felület, melynek egyenletében a
másodfokú tagok együtthatói egyenlők, nem szerepelnek benne „vegyes” szorzatok (xy, xz és yz). Természetesen nem
minden ilyen másodfokú kétismeretlenes egyenlet lesz gömb egyenlete (ahogyan ezt a kör esetében is láttuk). Ha a (10.58)
egyenletet teljes négyzetté kiegészítéssel
alakra hoztuk, akkor K > 0 esetén gömb egyenlete, K = 0 esetén egy pont (a középpont) adódik, míg K < 0 esetén üres alakzat
egyenlete.
Példák
1. Adott az x2+y2 + z2 – 4x + 6y – 8z + 13 = 0 egyenletű gömb. Számítsuk ki a gömb K középpontjának koordinátáit, a
gömb r sugarát, valamint azt, hogy milyen alakzatban metszi e gömb az xy koordinátasíkot.
A gömb egyenlete átalakítva: (x – 2)2 + (y + 3)2 + (z – 4)2 = 16, tehát a gömb K középpontja és r sugara: K(2; – 3; 4), r = 4
(10.82. ábra).
10.82. ábra
A gömb azokban a pontokban metszi az xy koordinátasíkot, melyekre x = 0. Ezzel a gömb egyenlete: x2+y2 – 4x+
6y+ 13 = 0, azaz (x – 2)2 + (y + 3)2 = 0. Tehát a gömb egyetlen pontban, a (2; –3) pontban érinti az xy koordinátasíkot.
(A kapott eredmény természetesen nem meglepetés, hiszen a középpont harmadik koordinátája egyenlő a gömb
sugarával, így törvényszerűen ezt az eredményt kellett kapnunk.)
2. Írjuk fel a gömb egyenletét, ha egy átmérőjének két végpontja A(2; –3; 6), B(–4; 5; 12). A gömb középpontja az AB
szakasz F felezőpontja, sugara pedig az AF = BF szakasz hossza. Az F pont koordinátái F(–1; 1; 9).
. Tehát a gömb egyenlete:
3. Határozzuk meg a p paraméter értékét úgy, hogy az x2 +y2 + z2 – 4x – 8y – 6z + 20 = 0 egyenletű gömb kívülről
érintse az x2 +y2 + z2 – 2x – 2y – 4z + p = 0 egyenletű gömböt. Alakítsuk át a megadott egyenleteket! (x – 2)2 + (y – 4)2 +
(z – 3)2 = 9 az első gömb egyenlete és (x – 1)2+ (y – 1)2 + (z – 2)2 = 6–p a másiké. Tehát az egyik gömb középpontja és
sugara K1(2; 4; 3), r1 = 3, a másikgömbé pedig K2(1; 1; 2), (10.83. ábra).
Ha a két gömb kívülről érinti egymást, akkor középpontjaik távolsága egyenlő a sugarak összegével: K1K2 = r1 + r2.
A középpontok távolsága: .
Tehát írhatjuk: , ahonnan .
10.83. ábra
4.
Mekkora húrt metsz ki az egyenletrendszerű egyenes az x2 +y2 + z2 – 4x – 4y + 2z – 40 = 0
egyenletű gömbből?
Először számítsuk ki az egyenes és a gömb döféspontjainak, M1 és M2 koordinátáit (10.84. ábra)!
10.84. ábra
Írjuk az egyenes egyenletrendszerét paraméteres alakban, és legyen az egyenes és a gömb egy közös pontja M1(x0;
Tehát az egyenes és a gömb döféspontjai: M1(4; 5; 5), M2(–4; 4; 2). Az egyenesből a gömb által kimetszett húr d
hossza: .
5. Adott az x2 +y2 + z2 – 4x + 6y – 2z – 22 = 0 egyenletű gömb és ennek egy P0 pontja: P0(6; 1; –1). Számítsuk ki a gömböt
P0-ban érintő sík egyenletét!
A gömb egyenletéből (x – 2)2 + (y + 3)2 + (z – 1)2 = 36, tehát a gömb K középpontja K(2; –3; 1). Készítsünk egy ktív
ábrát (10.85. ábra)! Mivel a gömböt érintő sík merőleges az érintési pontba húzott sugárra, így a vektor az
érintő síknak egy normálvektora.
10.85. ábra
tehát a sík egy normálvektora n(2; 2; –1). Ezzel és a P0 pont koordinátáival az érintő sík egyenlete
(10.50) alapján: 2(x – 6) + 2(y – 1) – (z+ 1) = 0, azaz 2x + 2y–z–15 = 0.
6. Határozzuk meg annak a gömbnek az egyenletét, amelyik érinti a koordinátasíkokat, és illeszkedika P(1; 1; 4)
pontra.
Legyen a gömb középpontja K(u; v; w), sugara r! Ha a P(1; 1; 4) pont illeszkedik a gömbre, akkor e gömb csak az első
síknyolcadban lehet. Mivel érinti a koordinátasíkokat, ezért u = v = w = r (10.86. ábra).
10.86. ábra
A gömb egyenlete tehát (x – r)2 + (y – r)2 + (z – r)2 = r2. Behelyettesítve a P pont koordinátáit:
Tehát egyetlen olyan gömb van, mely áthalad a P ponton, és érinti a koordinátasíkokat; e gömb egyenlete
Megjegyzés. Talán meglepő, hogy csak egyetlen gömböt kaptunk eredményül; szemléletünk azt sugallhatná, hogy
két megoldása lesz a feladatnak, ahogyan a síkbeli esetben is két megoldás adódott. Gondoljuk meg: ha egy
végtelenül pici sugarú gömböt (mely érinti a koordinátasíkokat) folyamatosan nagyítunk az origóból, akkor minden
olyan gömbhöz eljutunk, mely ebben a térnyolcadban van és érinti a koordinátasíkokat. Az így keletkező gömbök
burkolója egy végtelen kúppalástot határoz meg, mely palást érinti a koordinátasíkokat. Így a kúppalást és a
térnyolcad közötti térrész pontjain egyetlen olyan gömb sem haladhat át, mely érinti a koordinátasíkokat; a
kúppalást pontjain egyetlen ilyen érintő gömb halad át, míg a kúppalást belső pontjain két olyan gömb halad át, mely
érinti a koordinátasíkokat (10.87. ábra).
10.87. ábra
A továbbiakban megemlítünk még néhány másodrendű felületet. Mielőtt ezekkel megismerkednénk, de niáljuk a
térbeli merőleges a nitást.
Legyen adott egy S sík és egy k > 0 valós szám. Merőleges a nitásnak nevezzük azt a térbeli transzformációt, mely az
adott sík pontjait helyben hagyja, s a tér bármely P pontjához a következő P′ pontot rendeli: ha P-ből S-re állított
merőleges talppontja T, akkor P′T :PT = k.
Az S síkot az a nitás alapsíkjának, a k > 0 valós számot pedig az a nitás arányának nevezzük. Egy alakzat pontjainak
a n képe az alakzat pontjaihoz rendelt pontok halmaza. A 10.88. ábrán a P pontnak arányú a n képét
szemléltettük az S síkra vonatkozóan.
10.88. ábra
Ha k < 1, akkor az a nitás az S sík irányában történő zsugorítást („összenyomást”) jelent, ha pedig k > 1, akkor
széthúzást.
Ha olyan merőleges a nitást alkalmazunk egy felületre, melynek alapsíkja az xy koordinátasík, és aránya k, akkor a
felület a n képének pontjaira teljesül, hogy x és y koordinátái változatlanok maradnak, z koordinátája pedig értékre
változik.
Megjegyzés. Néha megengedjük az a nitás arányának a k < 0 valós számot is. Ilyenkor a |k| arányú a nitást még
egy S síkra való tükrözés is követi.
Forgásparaboloid
Forgásparaboloid úgy származtatható, ha egy parabolát tengelye körül körbeforgatunk. Legyen a p paraméterű
pont az eredeti parabola F fókuszpontjától ugyanolyan távolságra van, mint a síktól (10.89. ábra).
10.89. ábra
Ezek szerint .
10.90. ábra
Ha két parabolát úgy mozgatunk, hogy tengelyeik iránya ellentétes, síkjaik merőlegesek egymásra, és az egyik parabola
tengelypontja a másik parabolát írja le, akkor a kapott felület neve hiperbolikus paraboloid (nyeregfelület) (10.91. ábra).
10.91. ábra
Forgásellipszoid
A forgásellipszoidot úgy származtatjuk, hogy az ellipszist körbeforgatjuk valamelyik tengelye körül. Ha az xy
koordinátasíkban levő a és b féltengelyű tengelyponti ellipszist forgatjuk körbe a nagytengelye körül (10.92. ábra), akkor a
kapott forgásellipszoid egyenlete
10.92. ábra
Alkalmazzunk egy merőleges a nitást, melynek alapsíkja az xy koordinátasík, aránya pedig . Ekkor általános
10.93. ábra
Amennyiben a = b = c, akkor az ellipszoid természetesen a sugarú gömbbe megy át. Ez egyben azt is jelenti, hogy az
általános ellipszoidot úgy is származtathatjuk, hogy egy gömbre alkalmazunk egymás után két merőleges síkra vonatkozó
merőleges a nitást.
Forgáshiperboloid
A forgáshiperboloidot úgy származtatjuk, hogy a hiperbolát valamelyik tengelye körül körbeforgatjuk. Ha a hiperbolát a
képzetes tengelye körül forgatjuk körbe, akkor a forgáshiperboloidot egyköpenyűnek (egypalástú) nevezzük (10.94. ábra),
ha a hiperbolát a valós tengelye körül forgatjuk körbe, akkor kétköpenyű hiperboloidnak (kétpalástú) nevezzük (10.95.
ábra).
Ha a forgáshiperboloidra alkalmazunk egy olyan merőleges a nitást, melynek alapsíkja tartalmazza a hiperboloid
, kétköpenyű: .
Az egyköpenyű hiperboloid egy fontos tulajdonsága, hogy – a hiperbolikus paraboloidhoz hasonlóan – bármely pontján
áthalad két olyan egyenes, melyet a hiperboloid tartalmaz. Ezeket az egyeneseket a hiperboloid alkotóinak mondjuk. Ez azt
jelenti tehát, hogy az egyköpenyű hiperboloid vonalfelület.
10.94. ábra
10.95. ábra
Másodrendű kúpfelület
A másodrendű kúpot úgy származtatjuk, hogy egy ellipszis (vagy kör) középpontjában az ellipszisre (körre) merőlegest
állítunk, és e merőleges valamely (a középponttól különböző) pontját összekötjük az ellipszis (kör) pontjaival (10.96. ábra).
10.96. ábra
Példák
1.
Az egyenletű másodrendű kúpfelületet elmetszük a síkkal. Mi lesz a keletkezett
síkmetszet (10.97. ábra)?
10.97. ábra
Eredményül egy olyan, a síkban levő ellipszist kaptunk, melynek nagy és kis féltengelye az eredeti
ellipszis nagy és kis féltengelyének a fele. Az eredmény természetesen nem meglepő, hiszen az eredeti ellipszist a
10.98. ábra
Ezt behelyettesítve az ellipszoid egyenletébe azt kapjuk: ahonnan 49x2 = 36, tehát
. A kapott érték a kocka élének a fele, vagyis a kocka éle , így felszíne:
3.
Egy egyköpenyű hiperboloid egyenlete . Egy egyenes egyenletrendszere .
Számítsuk ki az egyenes és a hiperboloid közös pontjainak a távolságát!
Tekintsük a 10.99. ábrát! A hiperboloid és az egyenes M1 és M2 közös pontjainak meghatározásához először
térjünk át az egyenes egyenletrendszerében paraméteres egyenletrendszerre. Az egyenes egyenletrendszeréből: x
= 2t, y = t, z = t + 1. Helyettesítsük ezeket az értékeket a hiperboloid egyenletébe; azt kapjuk:
A döféspontok távolsága:
Térbeli polárkoordináták
Ahogyan a sík pontjait síkbeli polárkoordinátákkal is jellemezhettük, ugyanígy a tér pontjait is egyértelműen megadhatjuk
térbeli polárkoordinátákkal is. Legyen a P pont merőleges vetülete az xy koordinátasíkon T, legyen α a TO egyenesnek az x
tengely pozitív félegyenesével bezárt szöge, legyen a PO egyenesnek a z tengellyel bezárt szöge φ, és végül legyen a P
pontnak az origótól való távolsága r! Ekkor a P(r; α; φ) rendezett adathármassal egyértelműen megadhatjuk bármely térbeli
pont helyzetét (10.100. ábra).
10.100. ábra
A TOP és TOQ derékszögű háromszögek segítségével könnyen találhatunk összefüggést a P pont x, y, z koordinátái,
valamint a P pont polárkoordinátái között.
11. Lineáris algebra
A lineáris algebra egyik fontos kiindulópontjának tekinthetjük azt az észrevételt, hogy a Descartes-féle koordináta-
rendszerben a sík vektorai számpárokkal, míg a tér vektorai számhármasokkal jellemezhetők. Sőt, ezzel a jellemzéssel a
vektorok körében értelmezett műveleteket kényelmesen el is végezhetjük, ugyanis a számmal való szorzás, illetve
összeadás komponensenként történik: az (a, b) koordinátájú vektor t-szerese a (ta, tb) koordinátájú vektor, illetve az (a, b)
és (c, d) koordinátájú vektorok összege az (a + c, b + d) koordinátájú vektor. (Minderről részletesebben a 8. fejezetben
olvashatunk.)
Ez az egyszerű észrevétel kínálja a lehetőséget arra, hogy „magasabb dimenziós” vektorokról is beszélhessünk, amiket
már nem iránnyal és hosszúsággal jellemezhető geometriai objektumként képzelünk el, hanem mint véges sok
koordinátából álló számsorozatokat kezelünk. Rögzített dimenzió, azaz koordinátamennyiség mellett a vektorok körében
bevezetett két műveletet továbbra is el tudjuk végezni, koordinátánként tudunk egy vektort számmal szorozni, illetve két
vektort összeadni. Ezzel az általánosítással a vektorok jelentősége már nem annyira geometriai, mint inkább algebrai:
elsősorban a lineáris (elsőfokú) egyenletrendszerek vizsgálatánál játszanak fontos szerepet, de a matematika sok más
területén is jelen vannak.
A modern lineáris algebra aztán tovább bővíti a vektor fogalmát minden olyan matematikai rendszer elemeire, ahol
valamilyen módon értelmezni tudjuk a számmal való szorzást és az összeadást, illetve ahol erre a két műveletre teljesülnek
bizonyos – a vektorműveletektől elvárható – tulajdonságok (lásd a 11.3. fejezetet). Ebben a formában a lineáris algebra
viszonylag „új” tudomány – az absztrakt vektortér fogalmát Peano vezette be 1888-ban –, a lineáris algebra eszköztárának
bizonyos elemeit azonban már évszázadokkal korábban is használták. A Gauss-eliminációs módszert háromismeretlenes
egyenletrendszerek megoldására az időszámítás előtti kínai kultúrában is ismerték (Gauss maga 1800 körül dolgozta ki a
később róla elnevezett módszert), a determinánsok számolása pedig az 1600-as évek végére nyúlik vissza, ismereteink
szerint Seki Kowa japán matematikus és Leibnitz használták először munkáikban a determináns fogalmát. A mátrixok
precíz bevezetése egészen az 1800-as évek közepéig várt, és hamarosan komoly elméletük alakult ki, leginkább Cayley
munkásságának köszönhetően, igaz, kimondatlanul már Lagrange is használt mátrixokat – mint kettős indexeléssel
ellátott változórendszereket – a XVIII. század végén.
A XX. században további bővülésen ment át a vektorok, illetve a vektorterek fogalma abban az értelemben, hogy a
„számok” alatt (amikkel a vektorokat szorozhatjuk) már nem feltétlenül kell valós számokat értenünk, hanem inkább
skalárokról beszélünk, amik egy olyan matematikai rendszer elemei lehetnek, amely bizonyos értelemben a valós számok
halmazához hasonló tulajdonságokkal rendelkezik. (Lásd bővebben a 12. fejezetben a testekről szóló részt.) Ebben a
fejezetben viszont a könnyebb érthetőség kedvéért ettől az általánosítástól eltekintünk, és csak valós vektorokkal, illetve
vektorterekkel foglalkozunk, tehát a skalárral való szorzás mindig egy valós számmal való szorzást fog jelenteni. Mielőtt
rátérnénk az absztrakt vektorterek vizsgálatára, először az eszköztárral ismerkedünk meg: mátrixokkal,
determinánsokkal és lineáris egyenletrendszerekkel.
Ajánlott irodalom
Egy m×n méretű valós mátrix valós számoknak m sorba és n oszlopba rendezett, zárójelek közé foglalt táblázata.
Hasonlóan de niálhatjuk a komplex mátrixokat is, sőt, bármely adott H halmaz felett is de niálhatunk mátrixokat,
mint az adott halmaz elemeiből álló téglalap alakú táblázatokat. (Többnyire elvárás, hogy a halmaz elemeit lehessen
összeadni, illetve szorozni, és ez azért fontos, hogy a mátrixokon is bizonyos műveleteket értelmezhessünk.) Ebben a
fejezetben viszont a könnyebb érthetőség kedvéért csak valós mátrixokkal foglalkozunk. Egy m×n méretű valós mátrix
általános alakja tehát
Kisebb alakú mátrixoknál természetesen elkerülhető az indexelés, használhatunk különböző betűket a mátrix
elemeire, például egy 2 × 3-as mátrix általános alakja
Nagyobb (vagy határozatlan) méretű mátrix elemeit pedig úgy indexeljük, hogy a kettős index első tagja utal a
sorszámra és a második tagja az oszlopszámra. Az A mátrix i-edik sorában és j-edik oszlopában álló elemre használjuk az
(A)ij jelölést, illetve fordítva, az aij elemekből összerakott m×n méretű mátrix jelölése (aij)m×n.
Mátrixműveletek
Oszlopvektorok algebrája
Determináns
Invertálható mátrixok
Mátrixok rangja
Speciális mátrixok
Mátrixműveletek
A valós mátrixokkal elvégezhetünk bizonyos műveleteket: transzponálás, számmal szorzás, összeadás és szorzás, ez utóbbi
kettő azonban nem végezhető el bármely két mátrixszal. Az A + B mátrixösszeg akkor és csak akkor létezik, ha az A és B
mátrixok mérete ugyanaz, az A·B mátrixszorzat létezésének a feltétele pedig, hogy az A mátrix oszlopainak a száma
megegyezzen a B mátrix sorainak a számával. (Másképp fogalmazva: az A mátrix sorainak a hossza egyenlő kell, hogy
legyen a B mátrix oszlopainak a hosszával.)
Az A = (aij)m×n mátrix transzponáltja az az n × m méretű mátrix, aminek az i-edik sorában a j-edik elem aji. Jelölése:
AT.
A transzponált mátrix sorai megegyeznek az eredeti mátrix oszlopaival, illetve az oszlopai megegyeznek az eredeti
mátrix soraival.
Egy mátrixot valós számmal úgy szorzunk, hogy a mátrix minden elemét szorozzuk ugyanazzal a számmal:
Ha az A és B mátrixok mérete megegyezik, akkor az összegüket az egyes pozíciókban elvégzett összeadással képezzük:
Ezt a három műveletet röviden úgy foglalhatjuk össze, hogy (AT)ij = (A)ji, (cA)ij = c(A)ij, és (A + B)ij = (A)ij + (B)ij. Ha pedig
az A mátrix mérete m × n, és a B mátrix mérete n × k, akkor az A·B szorzat egy m × k méretű mátrix, amiben az i-edik sor j-
edik eleme az A mátrix i-edik sorának és a B mátrix j-edik oszlopának a skaláris szorzata:
Tehát az A mátrix i-edik sorában és a B mátrix j-edik oszlopában az egymásnak megfelelő elemeket összeszorozzuk (az
első elemet az elsővel, a másodikat a másodikkal stb.), és végül ezeket a szorzatokat összeadjuk. A gyakorlatban ez úgy
végezhető el kényelmesen, hogy az A mátrix jobb felső sarkát és a B mátrix bal alsó sarkát egymáshoz illesztjük, a
szorzatmátrixot pedig az A-tól jobbra lévő és a B alatti helyre számoljuk ki. Ekkor az A·B mátrix mindegyik elemét a vele
vízszintesen egy vonalban lévő A-beli sor és a vele függőlegesen egy vonalban lévő B-beli oszlop határozza meg.
Érvényesek az alábbi műveleti tulajdonságok, ahol c és d valós számokat, míg A, B és C mátrixokat jelölnek (és az
egyenlőségek úgy értendők, hogy ha legalább az egyik oldaluk értelmezhető, akkor a másik oldal is létezik, és a két oldalon
ugyanaz a mátrix szerepel):
- A + B = B+A és ( A + B) + C = A + (B + C),
- c(A + B) = cA + cB és (c + d)A = cA + dA,
- c(AB) = (cA)B = A(cB),
- (A + B)C = AC+BC és A(B + Q = AB+AC,
- (AB)C = A(BC),
- (cA)T = cAT, (A + B)T = AT + BT és (AB)T = BTAT.
Rögzített m és n pozitív egészek mellett ℝm×n jelöli az m×n méretű valós mátrixok halmazát. A műveletek de níciói
alapján ez a halmaz zárt az összeadásra és a számokkal való szorzásra. Egy speciális eleme az m×n méretű nullmátrix
(jelölése 0m×n, vagy egyszerűen csak 0), aminek minden eleme nulla. Ezzel a mátrixszal c0 = 0 és A + 0 = A bármely c valós
szám, illetve (egy ugyanolyan méretű) A mátrix mellett. A nullmátrixokon kívül kitüntetett szerepe van a négyzetes
egységmátrixoknak. Ezekben a főátló – a bal felső sarkot a jobb alsó sarokkal összekötő átló – mindegyik eleme 1, és a
Oszlopvektorok algebrája
Speciális típusú mátrixok a sorvektorok, illetve az oszlopvektorok, amiknek a mérete 1 × n, illetve m × 1 valamilyen n vagy
m pozitív egész számmal. Tehát az előbbiek egyetlen sorból, míg az utóbbiak egyetlen oszlopból állnak. Az m hosszúságú
oszlopvektorok halmazára ℝm×1 helyett egyszerűen az ℝm jelölést használjuk. Mint már említettük, ez a halmaz zárt az
összeadásra és a valós számmal való szorzásra, így e két műveletnek bármely kombinációjára is: ha v1, v2, ...,vk mind ℝm-
beli oszlopvektorok, és c1, c2, ..., ck valós számok, akkor c1v1 + c2v2 + ... + ckvk szintén egy ℝm-beli oszlopvektor.
A v1; v2, ..., vk oszlopvektorok lineáris kombinációi azok az oszlopvektorok, amik előállíthatok c1v1 + c2v2 + ... + ckvk
alakban alkalmas c1, c2, ...,ck együtthatókkal.
Speciálisan a csupa 0 koordinátából álló nullvektor – amit 0m vagy egyszerűen 0 jelöl – oszlopvektorok bármely
rendszerének lineáris kombinációja, mivel előáll úgy, ha mindegyik oszlopvektor együtthatóját 0-nak választjuk.
A v1; v2, ...,vk oszlopvektorok lineárisan függetlenek, ha a 0 vektor csak oly módon állítható elő c1v1+c2v2 +... +ckvk
alakban, hogy mindegyik ci együttható 0. Ellenkező esetben az adott oszlopvektorok lineárisan összefüggőek.
Az egy oszlopvektorból álló {v} halmaz akkor és csak akkor lineárisan összefüggő, ha v = 0, egy legalább kéttagú
vektorrendszer pedig pontosan akkor lineárisan összefüggő, ha valamelyik tagja előáll a többi lineáris kombinációjaként.
Sorvektorok körében a lineáris kombináció, illetve a lineáris függetlenség fogalma ugyanígy értelmezhető. Könnyen
átgondolható, hogy sorvektoroknak egy rendszere pontosan akkor lineárisan független, ha a sorvektorok transzponáltjai
mint oszlopvektorok egy lineárisan független rendszert alkotnak az oszlopvektorok körében.
Determináns
Négyzetes mátrixok determinánsának a bevezetéséhez szükségünk van a permutációk, illetve azok inverziószámának a
fogalmára. Egy tetszőleges halmaz permutációján annak egy önmagába történő kölcsönösen egyértelmű leképezését
értjük. Például az {1, 2, ..., n} halmaznak egy permutációja egy olyan τ függvény, amivel a τ(1), τ(2), ...,τ(n) számsorozat az 1,
2, .., n számoknak egy átrendezése. (Ezért szokás a permutációkat néha átrendezéseknek is tekinteni.) Az {1, 2, ..., n} halmaz
egy τ permutációjának az inverziószáma azoknak az (i, j) számpároknak a száma, amikre i < j és τ(i) > τ(j). Az inverziószám
tehát azt adja meg, hogy az átrendezésből hány olyan számpár választható ki, amiben a nagyobb tényező megelőzi a
kisebbiket. Ha ez az inverziószám páros, akkor τ egy páros permutáció, ha pedig az inverziószám páratlan, akkor τ egy
páratlan permutáció.
Példa. Az 1, 2, 3, 4, 5 számok 3, 1, 5, 4, 2 átrendezése arra a τ permutációra utal, amivel τ(1) = 3, τ(2) = 1, τ(3) = 5, τ(4) = 4
és τ(5) = 2. Ekkor az átrendezés inverzióban levő párjai (3, 1), (3, 2), (5, 4), (5, 2) és (4, 2), tehát τ inverziószáma 5, és így τ
egy páratlan permutáció.
ahol σ az {1, 2, ..., n} halmaz összes permutációján végigfut, és I(σ) jelöli a σ permutáció inverziószámát.
Tehát egy 2 × 2-es determináns a főátló elemeinek a szorzatából kivonva a mellékátló elemeinek a szorzata, egy 3 × 3-as
determináns kiszámolásához pedig pozitív előjellel vesszük a főátló és eltoltjainak az elemeiből vett szorzatokat (aei, bfg,
cdh), és negatív előjellel vesszük a mellékátló és eltoltjainak az elemeiből vett szorzatokat (ceg, afh, bdi). Nagyobb méretű
determinánsok esetében sajnos már nem támaszkodhatunk ilyen egyszerű szabályokra, bizonyos speciális mátrixok
determinánsai azonban könnyen kiszámolhatók.
Egy négyzetes mátrix felső-háromszögmátrix, ha a főátló alatt mindegyik eleme nulla, illetve alsó-háromszögmátrix,
ha a főátló felett mindegyik eleme nulla. Egy négyzetes mátrix diagonális, ha a főátlón kívül mindegyik eleme nulla.
Tehát egy A = (aij)n×n mátrix felső-háromszögmátrix, ha i > j esetén aij = 0; alsó-háromszögmátrix, ha i < j esetén aij = 0,
illetve diagonális mátrix, ha i ≠ j esetén aij = 0.
Egy felső-háromszögmátrix, illetve egy alsó-háromszögmátrix determinánsa egyenlő a főátlóbeli elemek szorzatával.
Egy általános négyzetes mátrix determinánsának a kiszámolása mindig visszavezethető egy felső-háromszögmátrix
determinánsára, de mielőtt erre rátérünk, felsoroljuk a determinánsok alaptulajdonságait (ezek természetesen kizárólag
négyzetes mátrixokra vonatkoznak):
- Ha egy mátrix valamely sorában minden elem 0, akkor a determináns nulla.
- Ha egy mátrix valamely sorát egy c számmal végigszorozzuk, akkor a determináns is a c-szeresére változik.
- Ha egy mátrix két sora egyenlő, illetve ha az egyik sora egy másik sor számszorosa, akkor a mátrix determinánsa nulla.
- Ha egy mátrix két sorát felcseréljük, akkor a determináns a negatívjára változik.
- Ha egy mátrix egyik sorában minden tagot összegre bontunk, akkor a determinánsa is két determináns összegére bontható:
az egyikben az adott sor tagjainak az első tényezői, míg a másikban az adott sor tagjainak a második tényezői állnak.
- Ha egy mátrix egyik sorához egy másik sor számszorosát hozzáadjuk, a determináns nem változik.
- A fenti tulajdonságok mindegyike sorok helyett oszlopokra is igaz.
- Egy mátrix determinánsa megegyezik a transzponáltjának a determinánsával.
Egy tetszőleges négyzetes mátrixból kiindulva, abból elemi sorátalakításokkal (sorok cseréje, sor szorzása egy nullától
különböző számmal, illetve egy sor számszorosának a hozzáadása egy másik sorhoz) eljuthatunk egy felső-
háromszögmátrixhoz, miközben nyomon követhetjük a determináns alakulását. Ezután a kapott háromszögmátrix
determinánsából vissza tudunk következtetni az eredeti mátrix determinánsára.
Az első sorból vonjuk ki a másodikat, hogy a bal felső sarokba 1-et kapjunk, ezután az első sor kétszeresét vonjuk ki a
második sorból, illetve az ötszörösét a harmadik sorból:
Végül a második sor 4,5-szeresét kivonjuk a harmadik sorból, és az eredmény . Mivel egyik
elvégzett sorátalakítással sem változott a determináns, az eredeti mátrix determinánsa az eredményül kapott
háromszögmátrix determinánsával egyenlő: det(A) = 1 · (–2) · 27,5 = –55. Természetesen ugyanezt az eredményt a már
korábban említett képletből is megkaphatjuk:
Nagyobb méretű mátrixok esetében a determináns kiszámítása általában sokkal gyorsabb a felső-háromszögmátrix
alakra hozással, mint a de níció képletének alkalmazásával.
Az n×n méretű A = (aij) mátrix i-edik sorának és j-edik oszlopának az elhagyásából kapott (n–1) × (n–1)-es determináns (–
1)i+j-vel vett szorzatát Aij jelöli, ez az (i, j) pozícióhoz tartozó előjeles aldetermináns.
Legyen A egy n×n méretű mátrix, továbbá i és j egész számok az [1, n] intervallumban! Ekkor az A mátrix
determinánsának az i-edik sor, illetve a j-edik oszlop szerinti kifejtése:
illetve
Ferde kifejtésről beszélünk, amennyiben egy adott sor (illetve oszlop) elemeit egy másik sorhoz (illetve oszlophoz)
tartozó előjeles aldeterminánsokkal szorozzuk, ilyenkor az eredmény mindig nulla. Tehát ha i ≠ l, akkor
és ha j ≠ l, akkor
Invertálható mátrixok
Egy n×n méretű négyzetes A mátrix invertálható, ha van olyan szintén n×n méretű B mátrix, amivel AB = En és BA =
En. Ekkor az A és B mátrixok inverzei egymásnak.
Nincs minden négyzetes mátrixnak inverze, de ha van, akkor az egyértelmű (azaz minden mátrixnak legfeljebb egy
inverze lehet). Az invertálható A mátrix inverzét A–1 jelöli.
Egy invertálható n×n -es mátrix inverzének a kiszámítására konkrét képlet is van:
Tehát A–1 = (1/det(A)) Ā, ahol az Ā mátrix i-edik sorában és j-edik oszlopában lévő elem az eredeti mátrix fordított
indexelésű előjeles aldeterminánsa: (Ā)ij = Aji.
Ezek után egy négyzetes mátrix hatványait a következőképp értelmezhetjük:
- Ha k pozitív egész, akkor Ak = A·A·... ·A (k tényezős szorzat).
- A0 = En, ahol n×n az A mátrix mérete.
- Ha A invertálható mátrix, és k egy pozitív egész, akkor A–k = A–1 · A–1·... ·A–1 (k tényezős szorzat).
Mátrixok rangja
Visszatérve tetszőleges méretű mátrixokra, a lineáris függetlenség és a determináns fogalmának ismeretében
de niálhatjuk bármely mátrix rangját.
Tehát ha a mátrix oszlopaiból kiválasztható k darab független oszlopvektor, de k + 1 már nem, akkor az oszloprang k.
Ha pedig a sorokból választható ki l darab független sorvektor, de l + 1 már nem, akkor a sorrang l.
Egy mátrix determinánsrangja a sorok és oszlopok elhagyásával kapott invertálható részmátrixok maximális mérete.
Tehát ha a mátrix alkalmas sorainak és oszlopainak az elhagyásával kaphatunk egy r×r méretű invertálható mátrixot,
de egy (r + 1) × (r + 1) méretű invertálható mátrixot már nem kaphatunk, akkor a determinánsrang r.
Speciális mátrixok
Néhány speciális mátrixtípust érdemes még megemlítenünk, egyelőre csak a de níciók szintjén.
Egy négyzetes A = (aij) mátrix szimmetrikus, ha szimmetrikus a főátlójára nézve, azaz minden (i, j) indexpárra aji = aij
Az A = (aij) négyzetes mátrix ferdén szimmetrikus, ha minden (i, j) indexpárra aji = –aij.
Egy szimmetrikus mátrix számszorosa is mindig szimmetrikus, illetve egy ferdén szimmetrikus mátrix számszorosa
mindig ferdén szimmetrikus. Két azonos méretű szimmetrikus mátrixnak az összege is szimmetrikus, a szorzatuk viszont
már nem feltétlenül az. Konkrétabban annyi igaz, hogy ha A és B mindketten n×n méretű szimmetrikus mátrixok, akkor az
A·B szorzat akkor és csak akkor szimmetrikus, ha A és B a szorzásra nézve felcserélhetőek, azaz A·B = B·A. Hasonlóan, két
azonos méretű ferdén szimmetrikus mátrix összege is ferdén szimmetrikus, és ha ezen kívül a szorzásra nézve
felcserélhetőek, akkor a szorzatuk egy szimmetrikus mátrix. Továbbá egy páratlan méretű ferdén szimmetrikus mátrix
determinánsa mindig nulla.
Egy ortogonális mátrix számszorosai közül csak saját maga és a –1-szerese ortogonális, és a determinánsa csak 1 vagy –1
lehet. Két azonos méretű ortogonális mátrix összege nagyon ritkán lesz ismét ortogonális, viszont két azonos méretű
ortogonális mátrix szorzata mindig egy ortogonális mátrixot eredményez.
(11.1)
ahol x1, x2, ..., xn az ismeretlenek, és az aij együtthatók, valamint a bi konstansok adott valós számok. Az egyenletrendszer
együtthatómátrixa, illetve kibővített együtthatómátrixa:
Az egyenletrendszer egy megoldása alatt olyan behelyettesítési értékek megadását értjük, amivel a fenti egyenlőségek
mindegyike igaz. Az egyenletrendszer általános megoldása pedig az, hogyha az összes megoldást megadjuk, esetenként egy
vagy több szabadon választható paraméter segítségével. A megoldások számát illetően háromféle eset lehetséges: vagy
nincs megoldás, vagy pontosan egy megoldás van, vagy pedig végtelen sok megoldás létezik, és azt, hogy egy adott
egyenletrendszernél melyik eset áll fenn, a kibővített együtthatómátrix vizsgálatával meg tudjuk állapítani.
A Gauss-eliminációs módszer
Homogén egyenletrendszerek
Lineáris egyenletrendszerek többféle alakja
Cramer-szabály
A Gauss-eliminációs módszer
Két egyenletrendszer ekvivalens, ha ugyanazok a megoldásaik. Egy adott egyenletrendszerrel ekvivalens
egyenletrendszert kapunk, ha a következő elemi átalakítások valamelyikét vagy ezek bármely kombinációját hajtjuk végre:
- Két egyenletet felcserélünk.
- Ha az egyik egyenletben az összes együttható és a jobb oldalon álló konstans nulla, akkor azt az egyenletet elhagyjuk.
- Az egyik egyenletet végigszorozzuk egy nullától különböző valós számmal.
- Az egyik egyenlethez hozzáadjuk egy másik egyenlet számszorosát.
Ez utóbbi átalakítás úgy értendő, hogy ha (11.1) egyenletrendszer i-edik egyenletéhez hozzáadjuk a j-edik egyenlet c-
szeresét, akkor az eredmény
Bármely mátrix rangja megegyezik a (redukált) lépcsős alakjában szereplő vezéregyesek számával.
A kibővített együtthatómátrix: Az első sor vezéregyesét például úgy kaphatjuk meg, hogy
az első és a második sort felcseréljük: de azt is tehettük volna, hogy az első sorból
kivonjuk a harmadik sor kétszeresét, vagy az első sort végigosztjuk 5-tel. (Ez utóbbi csak azért nem praktikus, mert
azzal törtszámok kerülnek a mátrixba, és ez a további számolásokat igencsak megnehezítené.) Ezután az első oszlop
többi elemét kinullázzuk úgy, hogy a második és a harmadik sorból kivonjuk az első sor ötszörösét, illetve
nek többszöröse. Az állás ekkor . Ahhoz, hogy a második sor vezéregyesét megkapjuk,
ismét több lehetőség közül választhatunk, például szorozhatjuk a sort 3-mal, majd hozzáadhatjuk az utolsó sort.
szorosát hozzáadjuk a negyedik sorhoz: . Most osszuk el a harmadik sort –4-gyel, és a kapott
új sor háromszorosát vonjuk ki az utolsó sorból: .Végül elhagyhatjuk a csupa nullából álló
utolsó sort, illetve kinullázzuk a harmadik vezéregyes oszlopának a többi elemét azzal, hogy az első sorból kivonjuk a
A redukált lépcsős alak kiszámításához a legegyszerűbb általános stratégia az, amit az előbbi példában is követtünk:
először az első sor vezéregyesét rögzítjük, majd ennek a segítségével kinullázzuk a vezéregyes oszlopának a többi elemét,
ezután a második sor vezéregyesét hozzuk létre, és így tovább. Felülről lefelé haladva, az alkalmazható elemi átalakítások
valamilyen kombinációjával létrehozzuk a sorok vezéregyeseit, majd mindegyik vezéregyes oszlopában az adott vezéregyes
segítségével minden más elemet kinullázunk. Ez a módszer a Gauss-elimináció (Gauss-kiküszöbölés).
A kibővített együtthatómátrix redukált lépcsős alakjából már egyenesen kiolvasható az eredeti egyenletrendszer
általános megoldása, illetve az, hogy az egyenletrendszer egyáltalán megoldható-e.
A megoldhatóság azon múlik, hogy a redukált lépcsős alaknak az utolsó oszlopában van-e vezéregyes. Ha igen, akkor ez
azt jelenti, hogy annak a vezéregyesnek a sorában minden más elem nulla, tehát a sor (0 0 ··· 0 | 1) alakú, ez pedig ahhoz az
egyenlethez tartozik, miszerint 0x1 + 0x2 + · · · + 0xn = 1. Az ilyen egyenletnek (ahol az összes ismeretlen együtthatója nulla,
az egyenlet jobb oldalán pedig egy nullától különböző szám áll) nyilván nincs megoldása, és így akkor az eredeti
egyenletrendszernek sincs.
Amennyiben a redukált lépcsős alak utolsó oszlopában nincs vezéregyes, akkor az egyenletrendszer megoldható, és a
megoldások száma attól függ, hogy van-e az utolsó oszlopon kívül minden más oszlopban vezéregyes: ha igen, akkor
pontosan egy megoldás létezik, ha pedig nem, akkor végtelen sok megoldása van az egyenletrendszernek. Mivel – mint már
említettük – a vezéregyesek száma a mátrix rangjával egyenlő, az egyenletrendszer megoldhatóságát az alábbi tételben is
öszszefoglalhatjuk.
Egy egyenletrendszer pontosan akkor oldható meg, ha az együtthatómátrixának a rangja megegyezik a kibővített
együtthatómátrixának a rangjával. Ebben az esetben, ha ez a rang egyenlő az ismeretlenek számával, akkor a megoldás
egyértelmű, ha pedig kisebb az ismeretlenek számánál, akkor végtelen sok megoldás van.
A (11.1) egyenletrendszer xi ismeretlene egy szabad változó, ha a kibővített együtthatómátrix redukált lépcsős
alakjában az i-edik oszlop nem tartalmaz vezéregyest.
Egy egyenletrendszer általános megoldását a kibővített együtthatómátrix redukált lépcsős alakjának soraiból felírt
egyenletek szolgáltatják. Konkrét megoldásokat pedig úgy kaphatunk, hogy a szabad változók értékeit tetszőlegesen
megválasztjuk, majd a többi ismeretlen értékét ezen egyenletek alapján számoljuk ki.
Példa. Írjuk fel az előző példában szereplő egyenletrendszer általános megoldását, majd adjunk meg három
különböző konkrét megoldást!
Ha A egy n×n méretű invertálható mátrix, akkor az (A | E) mátrix redukált lépcsős alakja (E | A–1), ahol E az n×n méretű
egységmátrixot jelöli.
Homogén egyenletrendszerek
Ilyenkor mindig van legalább egy megoldás: x1 = x2 = ... = xn = 0. Természetesen előfordulhat, hogy végtelen sok
megoldás van, attól függően, hogy az ismeretlenek közt szerepel-e szabad változó. Például ha egy homogén
egyenletrendszerben az ismeretlenek száma nagyobb, mint az egyenletek száma, akkor biztosan végtelen sok megoldás
létezik, ugyanis ilyenkor garantált, hogy a redukált lépcsős alakban nem jut minden oszlopra egy vezéregyes.
jelölésekkel előállítható-e a b oszlopvektor az a1, a2, ..., an oszlopvektorok lineáris kombinációjaként. Amennyiben igen,
úgy a felhasznált együtthatók az eredeti (11.1) lineáris egyenletrendszernek egy megoldását adják.
A (11.1) lineáris egyenletrendszer továbbá ekvivalens az A · x = b mátrixegyenlettel is, ahol A az egyenletrendszer
együtthatómátrixa, x ∈ ℝn és b ∈ ℝm pedig az ismeretlenekből, illetve a konstans tagokból szerkesztett oszlopvektorok:
A lineáris egyenletrendszereknek egy speciális esete, amikor az ismeretlenek száma megegyezik az egyenletek
számával, és az együtthatómátrix invertálható. Ekkor az egyenletrendszernek garantáltan egy megoldása van, amit a már
ismertetett Gauss-eliminációs módszeren kívül más úton is megkaphatunk. Például ha az egyenletrendszerrel ekvivalens A
· x = b egyenlet mindkét oldalát balról szorozzuk az A együtthatómátrix inverzével: A–1 · (A·x) = A–1·b, ennek az egyenletnek
a bal oldalán pedig A–1 · (A · x) = (A–1 · A) · x = E · x = x. Így – amennyiben az együtthatómátrix inverzét ismerjük – a megoldás
egyetlen mátrixszorzásból megkapható: x = A–1·b.
Cramer-szabály
Ugyancsak a négyzetes együtthatómátrix esetére vonatkozik a Cramer-szabály. Az n ismeretlent és n egyenletet tartalmazó
egyenlet együtthatómátrixát jelölje A, és a k = 1, 2,..., n számokhoz legyen Ak az a mátrix, amit úgy kapunk, hogy az A
mátrix k-adik oszlopát kicseréljük a bi konstansok által alkott oszlopra. Tehát
A Cramer-szabály szerint:
Ha det(A) ≠ 0, akkor az egyenletrendszernek pontosan egy megoldása van, amikor is minden k-ra xk = det(Ak)/det(A).
Ha det(A) = 0, és legalább az egyik k-ra det(Ak) ≠ 0, akkor az egyenletrendszernek nincs megoldása.
A Cramer-szabály nem mond semmit arra az esetre, amikor A, A1 A2, ...,An mind nulla determinánsú mátrixok.
11.3. Vektorterek
Valós vektortérnek nevezünk egy V halmazt a rajta értelmezett összeadás (+) művelettel és valós számokkal való
szorzással együtt, ha a következő axiómák teljesülnek:
1. Minden v, w ∈ V esetén v+w ∈ V.
2. Tetszőleges u, v, w ∈ V elemekre (u + v) + w = u + (v + w).
3. Tetszőleges v, w ∈ V elemekre v + w = w + v.
4. Van egy 0 ∈ V elem, amivel minden v ∈ V elemre 0 + v = v.
5. Minden v ∈ V elemhez van olyan w ∈ V, amivel v + w = 0.
6. Minden v ∈ V és a valós szám esetén a · v ∈ V.
7. Tetszőleges v ∈ V elemre és a, b valós számokra a · (b · v) = (a · b) · v.
8. Tetszőleges v ∈ V elemre és a, b valós számokra (a + b) · v = a · v + b · v.
9. Tetszőleges v, w ∈ V elemekre és a valós számra a · (v + w) = a · v + a · w.
10. Tetszőleges v ∈ V elemre 1 · v = v.
Egy (valós) vektortér elemeit vektoroknak nevezzük.
Ebben a fejezetben csak valós vektorterekről lesz szó, de a komplex vektortereket (aminek az elemeit tetszőleges
komplex számmal lehet szorozni) is ugyanígy értelmezhetjük. Sőt, tetszőleges test (lásd a 12. fejezetet) felett is
de niálhatunk vektortereket.
A fenti axiómák közül az első és a hatodik csak azt a követelményt fogalmazzák meg, hogy egy vektortér legyen zárt az
összeadásra és számmal való szorzásra. A második axiómában a zárójelezés az összeadások elvégzésének a sorrendjére utal,
és az axióma szerint mindegy, hogy először az u + v összeget vesszük, és ehhez adjuk hozzá a w vektort, vagy pedig az u
vektorhoz adjuk hozzá a v+w összeg eredményét. Ebből a tulajdonságból levezethető, hogy tetszőlegesen hosszú
vektorösszegnél is elhagyható a zárójelezés, ugyanis az egyes összeadások elvégzésének a sorrendje nem változtat a
végeredményen. Ez az asszociatív tulajdonság.
A harmadik axióma a kommutatív tulajdonság: egy összeg tagjai felcserélhetőek, és ez az előbbi axiómával együtt már
azt eredményezi, hogy egy akárhány tagú összegben is tetszőlegesen felcserélhetőek a tagok anélkül, hogy az eredmény
változna.
A negyedik axióma a nullvektor létezését írja elő, az ötödik pedig azt, hogy minden vektornak legyen negatívja
(ellentettje). Bár az axiómákban nincs külön megfogalmazva, viszont levezethető, hogy egy vektortérben csak egy
nullvektor létezik, illetve minden vektornak pontosan egy negatívja van. Egy v vektor negatívját –v jelöli.
A hetedik axióma szerint akkor sincs szükség zárójelezésre, ha egy vektort több számmal szorzunk egymás után.
Viszont szükséges a zárójelezés, ha egy összeget szorzunk (összegvektort számmal vagy számösszeget vektorral). A
nyolcadik és kilencedik axiómák erről az esetről szólnak: összeggel való szorzás esetén elvégezhetjük a szorzást külön-
külön az összeg tényezőivel, és itt szintén levezethető, hogy ez a szabály (amit disztributív tulajdonságnak nevezünk)
akárhány tagú öszszeggel való szorzásra is vonatkozik.
A kivonás mint művelet nem szerepel az axiómákban, azonban kényelmi okokból érdemes bevezetni: a v és w vektorok
különbsége v – w = v + (–w).
Az axiómákból bizonyos alapvető tulajdonságok gyorsan levezethetők:
- Tetszőleges v ∈ V vektorra 0 · v = 0, és tetszőleges a számra a · 0 = 0. Fordítva, ha egy a számmal és v vektorral a · v = 0, akkor
vagy a = 0, vagy v = 0.
- Tetszőleges v, w ∈ V vektorokra –1 · v = –v, –(–v) = v, (–v) + (–w) = –(v + w) és –(v–w) = –v+w.
- Tetszőleges u, v, w ∈ V vektorokra és a ≠ 0 számra az u + v = u + w, illetve az a · v = a · w egyenlőségek bármelyikéből
következik v = w.
Néhány közismertebb példa vektorterekre:
- Bármely m pozitív egészhez az m hosszú valós oszlopvektorok ℝm halmaza, a már ismert összeadás és számmal való szorzás
műveletekkel.
- Bármely m és n pozitív egészekhez az m×n méretű valós mátrixok ℝm×n halmaza a már bevezetett összeadás és számmal
való szorzás műveletekkel.
- Az origóból kiinduló síkvektorok halmaza a szokásos összeadással és számmal való szorzással.
- Az origóból kiinduló térvektorok halmaza a szokásos összeadással és számmal való szorzással.
- A valós együtthatós polinomok ℝ [x] halmaza a 4. fejezetben bevezetett együtthatónkénti összeadással és számmal való
szorzással.
- A valós számokon értelmezett függvények a szokásos függvényösszeadással és számmal való szorzással. ((f+g)(t) = f(t) + g(t)
és (cf)(t) = c · f((t).)
- A valós számsorozatok a tagonkénti összeadással, illetve a számmal való tagonkénti szorzással.
- A komplex számok a szokásos műveletekkel.
Alterek
Speciális vektorrendszerek, lineáris függetlenség
Dimenzió
Bázistranszformációk
Alterek
A V vektortér egy W részhalmaza altér V-ben, ha maga is vektortér a V-ben értelmezett műveletekkel. Ennek a
kapcsolatnak a jelölése: W ≤ V.
Minden vektortérnek altere saját maga, illetve a nullvektorból álló egyelemű {0} halmaz. További tipikus példa altérre,
ha egy rögzített v vektor összes számszorosát vesszük: W = {a · v | a ∈ ℝ}. Ez a v vektor által generált altér, a jelölése: 〈v〉.
Egy V vektortér W részhalmaza pontosan akkor altér, ha tartalmazza a nullvektort, bármely elemével együtt annak az
összes számszorosát is, illetve bármely két elemével együtt azoknak az összegét is. Néhány tipikus példa:
- Azon ℝn-beli oszlopvektorok halmaza, amiknek az első koordinátája nulla. Általánosabban: rögzített 1≤i≤n mellett azon ℝn-
beli oszlopvektorok halmaza, amiknek az i-edik koordinátája nulla.
- Azon ℝn-beli oszlopvektorok halmaza, amiknek a koordinátaösszege nulla.
- A síkvektorok (vagy térvektorok) vektorterében egy adott egyenessel párhuzamos vektorok halmaza a nullvektorral együtt.
- A térvektorok vektorterében egy adott, origót tartalmazó sík vektorai.
- Tetszőleges nem negatív egész n mellett a valós polinomok ℝ [x] vektorterében a legfeljebb n-edfokú polinomok a konstans
nulla polinommal együtt.
- A valós polinomok ℝ [x] vektorterében azok a p(x) polinomok, amikre p(1) = 0. (Ez a példa az 1 helyett tetszőleges valós
számmal egy alteret szolgáltat.)
- A valós függvények vektorterében azok az f(x) függvények, amikre f(1) = 0. (Ez a példa is ugyanúgy egy alteret ad, ha az 1
helyett egy másik valós számot választunk.)
- A valós függvények vektorterében a polinomfüggvények.
- A valós függvények vektorterében a páros függvények, illetve a páratlan függvények.
- Tetszőleges pozitív egész mellett az n×n méretű valós mátrixok ℝn×n vektorterében a szimmetrikus, illetve a ferdén
szimmetrikus mátrixok halmaza.
Egy V vektortér v1, v2, ..., vn vektorainak a lineáris kombinációi a c1v1 + c2v2 + ... + cnvn alakú vektorok, ahol c1, c2,...,
cn tetszőleges valós számok.
Speciálisan a nullvektor egy lineáris kombinációja bármely vektorrendszernek, mert megkaphatjuk úgy, hogy az
együtthatókat mind 0-nak választjuk.
Adott H ⊆ V nem üres vektorhalmaz mellett a H-beli vektorok összes lehetséges lineáris kombinációi egy alteret
alkotnak V-ben, ez a H halmaz által generált altér, a jelölése: 〈H〉. (A H halmaz lehet végtelen, azonban a vektoraiból
alkotott lineáris kombinációk csak véges összegek lehetnek.) Ez az altér a „legkisebb” H-t tartalmazó V-beli altér abban az
értelemben, hogy bármely H-t tartalmazó W altér automatikusan tartalmazza a H által generált alteret is. Másképp
fogalmazva, ha egy W altér tartalmazza a V vektortér vl5 v2, ..., vn vektorait, akkor azoknak tetszőleges c1v1 + c2v2 + ... +
cnvn lineáris kombinációja is W-ben van.
Az üres halmaz által generált altér az egyelemű triviális {0} altér. Amennyiben H = {v} egy egyelemű halmaz, akkor
〈 〉 〈〉 〈 〉 〈 〉
H = v = {cv| c ∈ ℝ}, ha H = {v, w} egy kételemű halmaz, akkor H = v, w = {av + bw | a, b ∈ ℝ}, stb.
Ha U és W két altere a V vektortérnek, akkor U ∩ W szintén egy altér V-ben, az uniójuk által generált altér pedig U ∪ 〈
〉
W = U + W = {u + w | u ∈ U, w ∈ W}. (Két altér uniója csak abban az esetben lehet ismét altér, ha az egyikük tartalmazza a
másikat.) Az U + W alteret az U és W alterek összegének nevezzük, illetve direkt összegének abban az esetben, ha U ∩ W =
{0}. A direkt összeg jelölése: U⊕W. Ha egy V vektortér U és W altereinek a metszete {0}, akkor az U⊕W direkt összeg
minden vektora pontosan egyféleképpen állítható elő egy U-beli vektor és egy W-beli vektor összegeként.
Példa. Az ℝ3 vektortérben a 0 koordinátaösszegű vektorok egy alteret alkotnak, ami nem más, mint az é
altérben. Jelöljük ezt az alteret U-val, és legyen továbbá W az vektor által generált altér! Megmutatjuk, hogy
ℝ3 = U⊕W.
Először is, a két altér metszete csak a nullvektort tartalmazza. Ugyanis ha akkor a + b + c = 0, másrészt ha
, akkor az vektornak számszorosa, ami pedig csak akkor lehet, ha a = b = c. Így viszont az a + b + c
Egy V vektortér v1, v2, ..., vn vektoraiból álló halmaz generátorrendszer V-ben, ha minden V-beli vektor előáll mint a
v1, v2, ..., vn vektorok lineáris kombinációja.
A lineáris függetlenséget ugyanúgy de niáljuk, mint azt tettük korábban az oszlopvektorok körében:
Egy V vektortér v1, v2, ..., vn vektorai lineárisan független rendszert alkotnak, ha a 0 vektor csak oly módon állítható
elő c1v1 + c2v2 + ... + cnvn alakban, hogy mindegyik ci együttható 0. Ellenkező esetben az adott vektorok rendszere
lineárisan összefüggő.
A lineáris függetlenséget, illetve összefüggőséget végtelen vektorrendszerekre is lehet értelmezni aszerint, hogy az
adott rendszer egy alkalmas véges részrendszeréből előállítható-e a 0 vektor nem triviális lineáris kombinációval. (A „nem
triviális” lineáris kombináción az értendő, hogy legalább az egyik vektor előtt nem nulla együttható áll.)
Az egy vektorból álló {v} halmaz akkor és csak akkor lineárisan összefüggő, ha v = 0, egy legalább kéttagú
vektorrendszer pedig pontosan akkor lineárisan összefüggő, ha valamelyik tagja előáll a többi lineáris kombinációjaként.
Egy V vektortér vektoraiból álló {v1, v2, ..., vn} rendezett halmaz bázis V-ben, ha lineárisan független
generátorrendszer.
Minden vektortér tartalmaz bázist. Egy bázis segítségével nemcsak, hogy minden vektor felírható lineáris
kombinációként, hanem ez a felírás mindig egyértelmű (azaz pontosan egyféleképpen tehető meg). Így egy rögzített bázis
szerint a vektortér vektorai koordinátázhatóak: ha ugyanis B = {v1, v2,..., vn} egy bázisa a V vektortérnek és v ∈ V, akkor
pontosan egy olyan c1, c2, ..., cn (valós számokból álló) együttható-sorozat van, amivel c1v1 + c2v2 + ... + cnvn = v. Az ezekből
az együtthatókból készített n hosszú oszlopvektor – amit [v]B jelöl – a v vektor B bázis szerinti koordinátavektora. Könnyen
átgondolható, hogy tetszőleges B bázis, v, w vektorok és c valós szám mellett igazak a következő egyenlőségek:
Egy vektortérnek általában végtelen sok bázisa van, bizonyos vektorterekben azonban vannak kitüntetett szerepű
bázisok. Például az ℝn vektortér kanonikus bázisa:
Tehát az ei vektor az n×n méretű egységmátrix i-edik oszlopa: az i-edik koordinátája 1, a többi koordinátája pedig 0.
Ezzel a bázissal tetszőleges oszlopvektor könnyen előállítható lineáris kombinációként:
Ugyancsak egy természetes bázist alkotnak a legfeljebb n-edfokú valós polinomok vektorterében az 1, x, x2,..., xn
polinomok.
vektor eleme W-nek, így előállítható a B = {v1, v2} bázisból, konkrétan v = 2v1 – 3v2. Így a v vektor B
koordinátavektora , mivel .
Az (n-beli v1, v2, ..., vm vektorok rendszere akkor és csak akkor bázis ℝn-ben, ha m = n, és a vektorokból mint
oszlopokból összerakott n×n méretű mátrix determinánsa nem nulla.
Ha a V vektortérben v1, v2, ..., vm egy generátorrendszer, és w1, w2, ...,wk lineárisan független vektorok, akkor ez
utóbbi rendszerből bármely wi vektort elhagyva található a generátorrendszernek egy olyan vj vektora, amivel a w1,
w2,..., wi–1, vj, wi+1, ..., wk vektorrendszer továbbra is független.
Ha B1 és B2 két bázis ugyanabban a vektortérben, akkor mivel mindketten lineárisan független generátorrendszerek, a
fenti tételek alapján |B1| ≥ |B2| és |B2| ≥ |B1| egyaránt teljesül, így |B1| = |B2|.
Dimenzió
Egy V vektortér dimenziója a bázisainak az elemszáma (illetve számossága, végtelen bázisok esetén). Ezt a számot
dim(V) jelöli.
Egy vektortér tehát lehet véges vagy végtelen dimenziós attól függően, hogy benne egy bázis véges vagy végtelen
elemszámú. Minden pozitív egész n-hez létezik n-dimenziós vektortér, például az n hosszúságú valós oszlopvektorok ℝn
tere. A valós polinomok ℝ [x] vektortere végtelen dimenziós, a legfeljebb n-edfokú valós polinomok vektortere pedig n + 1
dimenziós. (Ez utóbbiban az 1, x, x2,..., xn polinomok egy n + 1 elemű bázist alkotnak, az előbbiben pedig az összes nem
negatív kitevőjű x-hatvány egy végtelen elemszámú bázist.)
Egy altér dimenziója sohasem lehet nagyobb az őt tartalmazó vektortér dimenziójánál, tehát W ≤ V esetén dim(W) ≤
dim(V). Itt a dimenziók közti egyenlőség csak akkor állhat fenn, ha W = V, vagy ha V végtelen dimenziós.
A triviális {0} vektortér dimenziója nulla, mivel ebben az üres halmaz egy bázis. Ha egy vektortér dimenziója egy,
akkor egy nullától különböző vektor generálja, tehát az egész vektortér egy nem nulla vektor számszorosaiból áll.
Általában egy n elemű vektorrendszer által generált altér dimenziója legfeljebb n, és pontosan akkor n, ha a rendszer
lineárisan független.
Ha egy V vektortér dimenziója n, akkor igazak a következő állítások:
- V-ben bármely valódi altér dimenziója kisebb, mint n.
- V-ben bármely lineárisan független vektorrendszer legfeljebb n elemű.
- V-ben bármely generátorrendszer legalább n elemű.
- V-ben bármely n elemű független rendszer egyben egy bázis.
- V-ben bármely n elemű generátorrendszer egyben egy bázis.
Két altér metszetének és összegének a dimenziója között van egy ismert összefüggés:
Bázistranszformációk
Ha B = {v1, v2, ...,vn} és B′ = {v′1, v′2, ...,v′n} két bázis egy V vektortérben, akkor tetszőleges v ∈ V vektor koordinátázható
mindkét bázis szerint, a kapott [v]B és [v]B''oszlopvektorok viszont általában nem ugyanazok. Azonban van köztük
összefüggés, megkaphatók egymásból olyan mátrixok segítségével, amik csak a B és a B′ bázisoktól függnek.
Legyen B = {v1, v2, ..., vn} és B′ = {v′1, v′2, ..., v′n} egy V vektortér két bázisa. A B → B′ báziscsere átmenetmátrixa a [v′1]B′
[v′2]B′..., [v′n]B oszlopokból összerakott n×n méretű mátrix.
Az alábbiakban egy példán illusztráljuk, hogy az elemi bázistranszformáció többszöri alkalmazásával hogyan lehet két
tetszőleges bázis közti átmenetmátrixot kiszámítani, illetve amint azt majd látni fogjuk, ez a módszer általában négyzetes
mátrixok inverzeinek a kiszámítására is alkalmazható.
e1 e2 e3 v1 v2 v3
e1 1 0 0 3 2 1
e2 0 1 0 5 4 1
e3 0 0 1 1 0 2
Első csereként az e1 bázisvektort lecseréljük v1-re (ezt megtehetjük, mert v1 előállításában e1 nem nulla együtthatóval
szerepel), és az elemi bázistranszformáció képletét követve kiszámítjuk az e1, e2, e3 és v1, v2, v3 vektorok új
koordinátáit:
e1 e2 e3 v1 v2 v3
e1 e2 e3 v1 v2 v3
v1 2 –1 0 1 0 1
v2 –5/2 3/2 0 0 1 –1
e3 –2 1 1 0 0 1
e1 e2 e3 v1 v2 v3
v1 4 –2 –1 1 0 0
v2 –9/2 5/2 1 0 1 0
v3 –2 1 1 0 0 1
Mivel minden egyes elemi bázistranszformáció egy újabb bázist eredményez a táblázat bal szélső oszlopában, így B′ =
{v1, v2, v3} egy bázisa ℝ3-nak, a B′ → B báziscsere átmenetmátrixa pedig leolvasható:
Ez mellesleg a B → B′ báziscsere átmenetmátrixának az inverze (amit korábban már más úton is kiszámoltunk):
Az elemi bázistranszformáció első ránézésre kicsit körülményes műveletnek tűnik, azonban kis gyakorlás után már
nem több egy egyszerű rutinszámolásnál. Amikor az ei bázisvektort cseréljük a vj vektorra – amit akkor tehetünk meg, ha
az ei sorában és a vj oszlopában egy 0-tól különböző szám áll –, akkor először is ezzel a számmal osztjuk le az érintett sort,
míg vj. oszlopában a többi elem 0-ra változik. A táblázat többi rubrikájából pedig képzeletben húzunk egy függőleges és egy
vízszintes vonalat, amik valahol metszik ei sorát, illetve vj oszlopát. Az itt található számok szorzatát elosztjuk a már
említett kulcspozícióban (ei sorában és vj oszlopában) lévő számmal, majd a kapott hányadost vonjuk ki az adott rubrika
eredeti értékéből.
Egy φ: V → W leképezés lineáris leképezés a V és W valós vektorterek között, ha bármely V-beli u és v vektorokra,
illetve bármely c valós számra φ(u + v) = φ(u) + φ(v) és φ(cv) = cφ(v). Egy vektortér önmagába történő lineáris
leképezését lineáris transzformációnak nevezzük.
Egy φ: V → W lineáris leképezés a V-beli nullvektort a W-beli nullvektorba képezi le, azaz φ(0) = 0. A leképezés magtere,
Ker(φ) = {v ∈ V| φ (v) = 0} nemcsak egy részhalmaza V-nek, hanem mindig egy altér V-ben. A leképezés képtere, Im(φ) =
{φ(v) | v ∈ V} pedig egy altér W-ben. A képtér és a magtér dimenziói közötti összefüggés:
Az azonosan nulla leképezés (amikor is φ(v) = 0 minden V-beli v vektorra) egy lineáris leképezés bármely V
vektortérből tetszőleges W vektortérbe, ekkor Ker(φ) = V és Im(φ) = {0}.
Egy φ: V → W lineáris leképezés pontosan akkor szürjektív (ráképezés), ha Im(φ) = W, és pontosan akkor injektív, ha
Ker(φ) = {0}.
Egy kölcsönösen egyértelmű lineáris leképezés neve izomor zmus. Két vektortér izomorf, ha létezik köztük egy
izomor zmus.
Ha a V és W vektorterek izomorfak, azt V ≅ W jelöli.
Az izomor zmus egy ekvivalenciareláció a valós vektorterek halmazán, ugyanis két izomor zmus kompozíciója is
izomor zmus, egy izomor zmus inverze is izomor zmus, továbbá bármely vektortéren az identikus leképezés is egy
izomor zmus. Az ekvivalenciaosztályokat is pontosan meg tudjuk határozni:
Két valós vektortér akkor és csak akkor izomorf egymással, ha a dimenziójuk egyenlő.
Ez a tétel végtelen dimenziós vektorterek esetén úgy értendő, hogy két végtelen dimenziós vektortér akkor és csak
akkor izomorf, ha a dimenziójuk mint számosság egyenlő.
Néhány ismert példa lineáris leképezésekre:
- Ha A egy tetszőleges m×n méretű mátrix, akkor a φA: ℝn → ℝm, φA(v) = A · v leképezés lineáris, ugyanis bármely v, w ∈ ℝn
oszlopvektorok és c valós szám mellett
- Az előbbinél kicsit általánosabban, ha A egy tetszőleges m×n méretű mátrix és k egy pozitív egész, akkor a φ : (n×k → (n×k,
φ(M) = A·M leképezés lineáris.
- Tetszőleges c valós szám mellett az fc: ℝ [x] → ℝ, fc(p(x)) = p(c) behelyettesítés egy lineáris leképezés a valós együtthatós
polinomok vektorteréből az egydimenziós ℝ vektortérbe.
- Tetszőleges q(x) (nem konstans) valós együtthatós polinom mellett az a leképezés, ami egy p(x) polinomhoz hozzárendeli a
q(x)-szel vett maradékos osztásának a maradékát, egy lineáris leképezés ℝ [x]-ből a q(x)-nél kisebb fokú valós együtthatós
polinomok vektorterébe.
- A deriválás egy lineáris transzformációja az ℝ [x] vektortérnek, illetve a mindenütt akárhányszor di erenciálható valós
függvények vektorterének is.
- Tetszőleges n-dimenziós V vektortér és annak egy B = {v1, v2, ..., vn} bázisa mellett a B szerinti koordinátázás egy V → ℝn
izomor zmus.
Egy φ: V → W lineáris leképezést már egyértelműen meghatároznak egy rögzített V-beli bázison felvett értékei, azaz ha
B = {v1, v2, ..., vn} egy bázis V-ben, akkor φ(v1), φ(v2), ..., φ(vn) ismeretében bármely v ∈ V vektor φ(v) képe kiszámítható.
Ugyanis v előáll a bázisvektorok lineáris kombinációjaként: v = c1v1 + c2v2 + ... + cnvn valamilyen ci valós együtthatókkal,
ebből a felírásból pedig következik, hogy
Tehát φ(v) csak a v vektor B szerinti koordinátáitól, illetve a bázisvektorok képeitől függ.
A bázisvektorok képeire viszont semmilyen általános megkötés nincs. Ha a V vektortérnek B = {v1, v2, ..., vn} egy
bázisa, és w1, w2, ..., wn tetszőleges vektorok egy W vektortérben, akkor létezik (pontosan egy) olyan φ: V → W lineáris
leképezés, amivel φ(v1) = w1, φ(v2) = w2, ..., φ(vn) = wn. Ez a leképezés a
képlettel adható meg. Az így de niált φ: V → W lineáris leképezés képtere a w1, w2, ..., wn vektorok által generált W-beli
altér, tehát φ pontosan akkor ráképezés, ha w1, w2,..., wn egy generátorrendszere W-nek. Továbbá pontosan akkor
injektív, ha a w1, w2, ..., wn vektorok egy lineárisan független rendszert alkotnak W-ben.
Egy φ: V → W lineáris leképezés pontosan akkor izomor zmus, ha V-nek valamely B = {v1, v2, ..., vn} bázisa mellett a
φ(v1), φ(v2), ..., φ(vn) vektorok szintén egy bázist alkotnak W-ben.
Itt a „valamely” szó helyett a „minden” szót is használhatnánk, ugyanis ha a tétel állításában szereplő feltétel egy
bázisra teljesül, akkor már az összesre is.
Egy φ: V → W lineáris leképezés tetszőleges bázispár szerinti mátrixának a rangja megegyezik a leképezés képterének a
dimenziójával. Speciálisan egy lineáris leképezés izomor zmus, ha a mátrixa egy nem nulla determinánsú négyzetes
mátrix.
Ezen a ponton érdemes megjegyezni, hogy egy φ: V → V lineáris transzformációra ekvivalensek a következő
tulajdonságok (azaz bármelyikből következik a többi):
1. φ egy izomor zmus,
2. Ker(φ) = {0},
3. Im(φ) = V,
4. bármely V-beli B bázissal a [φ]B mátrix invertálható (azaz nem nulla determinánsú).
Példa. Legyen V a legfeljebb másodfokú valós polinomok vektortere, ebben – mint már említettük – B = {1, x, x2} egy
bázis. A B′ = {(x–1)2, x2, (x + 1)2} vektorrendszer szintén egy bázis, és ezt a következő módon igazolhatjuk: a B′-beli
vektorok B szerinti koordinátáiból alkotott determinánsa –4 (a lényeg, hogy nem nulla), így a φ(1)
= (x–1)2, φ(x) = x2, φ(x2) = (x + 1)2 feltételekkel megadott φ:V → V lineáris transzformáció egy izomor zmus. Tehát B′,
mint a B bázis képe, szintén egy bázis. Egyben a fenti P mátrix a B → B′ báziscsere átmenetmátrixa, így tetszőleges
p(x) = ax2 + bx + c valós polinomra
Ha φ: V → V egy lineáris transzformáció, és c egy tetszőleges valós szám, akkor a Vc = {v ∈ V | φ(v) = cv} halmaz egy
altér V-ben, ami tulajdonképpen nem más, mint a cI – φ lineáris transzformáció magtere, ahol I az identikus leképezést
jelöli. (Ugyanis a φ(v) = cv feltétel ekvivalens azzal, hogy (cI – φ)(v) = 0).) Amennyiben ez az altér legalább egydimenziós
(azaz tartalmaz a 0 vektoron kívül más vektort is), akkor c egy sajátértéke φ-nek, a Vc pedig a c-hez tartozó sajátaltér. Egy c
valós szám tehát akkor és csak akkor sajátértéke a φ: V → V lineáris transzformációnak, ha a cI – φ transzformáció
valamely B bázis szerinti [cI – φ]B mátrixa nulla determinánsú. Mivel [cI – φ]B = c[I]B – [φ]B = cE – [φ]B, ez a feltétel azt
jelenti, hogy a cE – [φ]B mátrix determinánsa nulla.
Egy n×n méretű A valós mátrix karakterisztikus polinomja kA(x) = det(xE–A), ahol E az n×n méretű egységmátrix.
Tehát ha
akkor
Egy lineáris transzformáció (valamely bázis szerinti) mátrixának a karakterisztikus polinomja független a bázis
választásától.
Ez azt jelenti, hogy ha S és T két különböző bázis a V vektortérben, és φ: V → V egy lineáris transzformáció, akkor a
[φ]S és [φ]T mátrixok karakterisztikus polinomja ugyanaz. Ez a φ transzformáció karakterisztikus polinomja:
Egy φ:V → V lineáris transzformáció karakterisztikus polinomja a transzformáció bármely bázis szerinti mátrixának
a karakterisztikus polinomja. Jelölése: kφ(x).
Egy c valós szám akkor és csak akkor sajátértéke a φ: V → V lineáris transzformációnak, ha kφ(c) = 0, azaz c gyöke a
transzformáció karakterisztikus polinomjának.
Ebből már következik, hogy egy n-dimenziós vektortér lineáris transzformációinak legfeljebb n sajátértéke lehet.
Azonban a sajátérték létezése egyáltalán nem garantált: amennyiben a karakterisztikus polinomnak nincs valós gyöke, úgy
a lineáris transzformációnak sincs sajátértéke.
Egy adott sajátérték ismeretében a kapcsolódó sajátvektorok meghatározása már viszonylag egyszerű feladat, mivel
ezek cI – φ transzformáció magterének a nullától különböző vektorai. A gyakorlatban tehát úgy kaphatjuk meg a
sajátvektorokat, hogy rögzítünk egy V-beli B = {v1, v2, ..., vn} bázist, kiszámítjuk a φ: V → V lineáris transzformáció B
szerinti [φ]B mátrixát, majd megoldjuk a (cE – [φ]B) · x = 0 homogén lineáris egyenletrendszert. Amennyiben egy ℝn-beli d
oszlopvektor megoldása az egyenletrendszernek, akkor a koordinátáival alkotott V-beli v = d1v1 + d2v2 + ... + dnvn vektor
egy sajátvektora φ-nek.
A sajátértékek tehát ennek a polinomnak a zérushelyei: 2 és 4. Ahhoz, hogy a 2 sajátértékhez tartozó sajátvektorokat
megtaláljuk, a (2E–A)v = 0 egyenletet kell megoldanunk v-re:
Tehát a 2 sajátértékhez tartozó sajátvektorok azok a vektorok, amiknél az első és harmadik koordináta egymás
negatívjai (a nullvektor kivételével, ugyanis a de níció alapján a nullvektor nem számít sajátvektornak). A 4
sajátértékhez tartozó sajátvektorokhoz pedig a (4E–A)v = 0 egyenletet kell megoldanunk v-re:
Diagonalizálható transzformációk
Egy lineáris transzformáció diagonalizálható, ha alkalmas bázis szerinti mátrixa egy diagonális mátrix.
Egy n×n méretű A mátrix diagonalizálható, ha a φ : ℝn → ℝn, φ(v) = A · v lineáris transzformáció diagonalizálható.
Lineáris transzformációknál a diagonalizálhatóság ekvivalens egy sajátvektorokból álló bázis létezésével. Ha ugyanis
egy φ: V → V transzformáció mátrixa a B = {v1, v2,..., vn} bázis szerint
akkor ez azt jelenti, hogy φ(v1) = d1v1, φ(v2) = d2v2, ..., φ(vn) = dnvn, tehát a B bázis sajátvektorokból áll. Megfordítva is igaz,
hogy ha B egy sajátvektorokból álló bázis, akkor [φ]B egy diagonális mátrix, a főátlóban a báziselemekhez tartozó
sajátértékekkel.
Egy n×n méretű A mátrix diagonalizálható, ha alkalmas szintén n×n méretű P invertálható mátrixszal a P–1 A · szorzat
diagonális mátrix.
Egy P–1 · A·P szorzatmátrix pedig pontosan akkor diagonális, ha a P mátrix oszlopai az A mátrix sajátvektoraiból álló
bázist alkotnak ℝn-ben.
Egy diagonalizálható φ : V → V lineáris transzformáció tetszőleges bázis szerinti mátrixa természetesen nem mindig
diagonális, viszont annyi igaz, hogy mindig egy diagonalizálható mátrix. Megfordítva, ha egy lineáris transzformáció
valamely bázis szerinti mátrixa diagonalizálható mátrix, akkor a transzformáció maga is diagonalizálható.
A diagonalizálhatóság jellemzése a sajátalterek segítségével:
Példa. Az előző példában vizsgált φ: ℝ3 → ℝ3, φ(v) = Av leképezés – ahol – egy diagonalizálható
a bázisban a φ transzformáció mátrixa , mivel φ(v1) = 2v1; φ(v2) = 2v2 és φ(v3) = 4v3. Ez az A mátrixra
Minimálpolinom
Bármely négyzetes valós mátrix behelyettesíthető egy valós együtthatós polinomba, aminek eredménye szintén egy
ugyanolyan méretű négyzetes mátrix. Ha ugyanis p(x) = amxm+am_1xm–1 + ... +a1x+a0∈ ℝ [x] és A ∈ ℝn×n, akkor
A p(A) mátrixra úgy is tekinthetünk, mint az ℝn×n vektortérben az En, A, A2, ..., Am vektoroknak az a0, a1, ..., am
együtthatókkal vett lineáris kombinációjára, és fordítva, az A mátrix nem negatív egész kitevős hatványainak bármely
lineáris kombinációja ugyanaz, mint a megfelelő együtthatókkal de niált valós polinom A-nál vett helyettesítési értéke.
Mivel ℝn×n egy véges dimenziós vektortér, amiben az A mátrix hatványai egy végtelen (és ennek következtében lineárisan
öszszefüggő) rendszert alkotnak, valamilyen alkalmas nem triviális lineáris kombinációjuk kiadja a 0 mátrixot, azaz
létezik olyan valós együtthatós p(x) polinom, amivel p(A) = 0.
Hasonlóan, egy valós vektortéren értelmezett lineáris transzformáció behelyettesíthető bármely valós együtthatós
polinomba, aminek eredménye szintén egy lineáris transzformáció. Ha ugyanis p(x) = amxm + am_1xm–1+... +a1x + a0 ∈ ℝ [x],
V egy valós vektortér és φ ∈ Hom(V, V), akkor
Itt φ hatványait úgy értelmezzük, hogy tetszőleges pozitív egész k szám esetén φk a k-tényezős φ ○ φ ○ ... ○ φ
kompozíció. A p(φ) leképezésre úgy is tekinthetünk, hogy ez a Hom(V, V) vektortérben a φm, φm–1, ..., φ, I vektoroknak egy
lineáris kombinációja. És ha rögzítünk V-ben egy B bázist, és eszerint vesszük φ, illetve p(φ) mátrixát, akkor azt kapjuk,
hogy [p(φ)]B = p([φ]B).
Amennyiben V véges dimenziós, úgy Hom(V, V) is véges dimenziós, így φ hatványainak végtelen sorozata Hom(V, V)-
ben egy lineárisan összefüggő rendszert alkot, ez pedig azt jelenti, hogy az azonosan nulla lineáris transzformáció előáll a
φ véges sok hatványának nem triviális lineáris kombinációjaként. Tehát létezik olyan valós együtthatós p(x) polinom,
amivel p(φ) = 0.
Az n × n méretű A mátrix minimálpolinomja az a legkisebb fokú normált polinom, amibe A-t behelyettesítve a
nullmátrixot kapjuk. A minimálpolinom jelölése: mA(x).
A V véges dimenziós vektortér egy φ lineáris transzformációjának a minimálpolinomja az a legkisebb fokú normált
polinom, amibe φ-t behelyettesítve az azonosan nulla transzformációt kapjuk. A minimálpolinom jelölése: mφ(x).
Egy lineáris transzformáció, illetve annak bármely bázis szerinti mátrixa ugyanazt a minimálpolinomot szolgáltatja,
azaz ha V egy véges dimenziós valós vektortér, B egy bázisa V-nek és φ: V → V egy lineáris transzformáció, aminek a B
szerinti mátrixa A, akkor mφ(x) = mA(x).
Bármely négyzetes A mátrix minimálpolinomja egyértelmű és tetszőleges p(x) ∈ ℝ [x] polinomra p(A) = 0 akkor és csak
akkor teljesül, ha mA(x) osztja p(x)-et. Továbbá az mA(x) minimálpolinom és a kA(x) karakterisztikus polinom (valós és
komplex) gyökei ugyanazok.
Bármely φ lineáris transzformáció minimálpolinomja egyértelmű és tetszőleges p(x) ∈ ℝ [x] polinomra p(φ) = 0 akkor
és csak akkor teljesül, ha mφ(x) osztja p(x)-et. Továbbá az mφ(x) minimálpolinom és a kφ(x) karakterisztikus polinom
(valós és komplex) gyökei ugyanazok.
A Cayley–Hamilton-tétel szerint:
Példa. A korábbi példákban már vizsgált mátrix karakterisztikus polinomja kA(x) = x3 – 8x2 + 20x –
16 = (x – 2) (x – 4), így 2 és 4 az mA(x) minimálpolinomnak szintén gyökei. Így (x – 2)(x – 4) = x2 – 6x + 8 mindenképpen
2
osztja mA(x)-et, ami viszont a Cayley–Hamilton-tétel miatt osztja a kA(x) = (x – 2)2(x – 4) polinomot. Ebből következik,
hogy a minimálpolinom csak (x – 2)(x – 4) vagy (x – 2)2(x – 4) lehet. Ha az előbbi (a kisebb fokú) polinomba
helyettesítjük be az A mátrixot, az eredmény
Legyen V egy valós vektortér. A B : V × V → ℝ leképezés egy bilineáris függvény, ha bármelyik változóját rögzítve a
másik változóra nézve egy lineáris függvényt kapunk.
Ha V a valós polinomok ℝ[x] vektortere, és a, b rögzített valós számok, akkor a képlet egy
bilineáris függvényt ad meg V-n.
A fenti de níció után felsorolt tulajdonságokból következik, hogy ha B: V×V → ℝ egy bilineáris függvény, akkor
bármely v ∈ V vektorra B(v, 0) = 0 és B(0, v) = 0, továbbá ha vektorok lineáris kombinációit helyezzük az egyes változók
helyébe, akkor a B függvény értéke kifejthető:
Így egy V-beli bázis vektorpárjain felvett értékek már meghatározzák a bilineáris függvényt: ha S = {v1, v2, ..., vn} egy
bázis V-ben, akkor a B(vi, vj) értékekből tetszőleges (v, w) vektorpár képe kiszámítható. A B(vi, vj) értékekre viszont
semmilyen megkötés nincs, tetszőlegesen megadott bij ∈ ℝ (1 ≤ i, j ≤ n) számokhoz létezik (pontosan egy) olyan B: V × V → ℝ
bilineáris függvény, amivel minden (i, j) indexpárra B(vi, vj) = bij. z a bilineáris függvény a
Ekkor tetszőleges v, w ∈ V vektorokra B(v, w) = [v]TS · [B]S · [w]S. (Az egyenlet jobb oldalán a mátrixok méretei 1×n,
n×n, illetve n×1, a szorzat eredménye tehát egy 1×1 méretű mátrix, és az egyenlőség úgy értendő, hogy ennek a mátrixnak az
egyetlen eleme megegyezik a B(v, w) számmal.)
Ily módon különböző bilineáris függvényekhez különböző mátrixok tartoznak, illetve minden n×n méretű valós
mátrix egy alkalmas bilineáris függvény S szerinti mátrixa.
Ha Z egy másik bázisa ugyanannak a vektortérnek, és P az S → Z báziscsere átmenetmátrixa, akkor [B]Z = PT· [B]S·P.
Egy B : V × V → ℝ bilineáris függvény szimmetrikus, ha bármely v, w ∈ V vektorokra B(w, v) = B(v, w), illetve ferdén
szimmetrikus, ha bármely v, w ∈ V vektorokra B(w, v) = –B(v, w).
Egy szimmetrikus bilineáris függvény mátrixa bármely bázis szerint egy szimmetrikus mátrix és fordítva,
szimmetrikus mátrix csak szimmetrikus bilineáris függvényhez tartozhat. Hasonlóan, a ferdén szimmetrikus bilineáris
függvényekhez a ferdén szimmetrikus mátrixok tartoznak.
Szimmetrikus és ferdén szimmetrikus bilineáris függvényeknél a B(v, w) = 0 feltételből már természetesen következik
B(w, v) = 0, általában azonban ez nincs mindig így.
Egy V vektortér S = {v1, v2, …, vn} bázisa ortogonális bázis a B : V × V → ℝ bilineáris függvényre nézve, ha a vi vektorok
B szerint egymásra ortogonálisak.
Ha egy B : V × V → ℝ bilineáris függvényhez létezik ortogonális bázis, akkor ezen bázis szerint B mátrixa egy diagonális
mátrix. (Az, hogy a főátlón kívüli elemek mind nullák, éppen azt jelenti, hogy a bázis vektorai egymásra merőlegesek.)
Mivel minden diagonális mátrix szimmetrikus, ami csak szimmetrikus bilineáris függvényhez tartozhat, így ortogonális
bázisa is csak szimmetrikus bilineáris függvénynek lehet.
Legyen B egy V valós vektortéren értelmezett bilineáris függvény. Ha V-nek létezik B szerint ortogonális bázisa, akkor
B szimmetrikus. Fordítva, ha B szimmetrikus, akkor létezik V-nek egy B szerint ortogonális bázisa.
Ha V egy valós vektortér, és B : V × V → ℝ egy szimmetrikus bilineáris függvény, akkor létezik olyan S = {v1, v2, …, vn}
bázis V-ben, ami ortogonális, és azon kívül minden i-re B(vi, vi) vagy –1, vagy 0, vagy 1.
Ugyanez mátrixokra:
Ha M egy négyzetes szimmetrikus valós mátrix, akkor létezik olyan invertálható P mátrix, amivel PT·M·P diagonális,
és a főátlójában minden elem vagy –1, vagy 0, vagy 1.
Jóllehet a fenti tételekben sem az S bázis, sem a P mátrix általában nem egyértelmű (azaz többféle alkalmas választás is
létezhet ezekre), azonban a kapott diagonális mátrixban a –1-ek, a 0-k és az 1-ek száma már egyértelmű, csak az adott
szimmetrikus bilineáris függvénytől, illetve szimmetrikus mátrixtól függ. Ezt mondja ki a Sylvester-féle tehetetlenségi
törvény:
Egy valós vektortéren értelmezett szimmetrikus bilineáris függvény bármely diagonális mátrixában a pozitív, a
negatív és a nulla elemek száma egyértelműen meghatározott, nem függ az alkalmas bázis választásától.
A ferdén szimmetrikus (szimplektikus) bilineáris függvényekhez mindig található olyan bázis, ami szerinti
mátrixukban a mellékátlón kívüli elemek mind nullák, és a mellékátlóban minden elem vagy –1, vagy 0, vagy 1.
Ha V egy valós vektortér, és B : V × V → ℝ egy ferdén szimmetrikus bilineáris függvény, akkor létezik olyan S = {v1, v2,
…, vn} bázis V-ben és olyan egész szám, hogy az i = 1, 2, …, k egészekre B(vi, vn–i) = 1, B(vn–i, vi) = –1 és
ezeken kívül minden más B(vj, vl) érték nulla.
Egy B : V × V → ℝ bilineáris függvény szinguláris (elfajuló), ha van olyan v ∈ V vektor, amivel minden w ∈ V vektorra
B (v, w) = 0.
Ilyenkor az is igaz, hogy van olyan u ∈ V vektor, amivel minden w ∈ V vektorra B(w, u) = 0, továbbá:
Egy B : V × V → ℝ bilineáris függvény akkor és csak akkor szinguláris, ha valamely bázis szerinti mátrixa szinguláris
(azaz nulla determinánsú).
Természetesen ha valamely S bázis szerinti mátrix szinguláris, akkor bármely más bázis szerinti mátrix is az. Ugyanis
ha Z egy másik bázis, akkor, mint már korábban említettük, alkalmas P mátrixszal [B]Z = PT·[B]S·P, és így det([B]Z) =
det([B]S)·det(P)2.
Konkrétan, ha az S = {v1, v2, …, vn} bázis szerinti [B]S mátrix szinguláris, akkor a sorvektorainak valamely c1, c2, …, cn
együtthatókkal vett lineáris kombinációja a nulla sorvektor, és ebből az következik, hogy a v = c1v1 + c2v2 + … + cnvn vektor
balról merőleges a vektortér összes vektorára. Hasonlóan a [B]S mátrix oszlopainak valamely d1, d2, …, dn együtthatókkal
vett lineáris kombinációja a nulla oszlopvektor, és ekkor az u = d1v1 + d2v2 + … + dnvn vektor jobbról merőleges a vektortér
összes vektorára.
Adott B : V × V → ℝ bilineáris függvény mellett a V vektortér tetszőleges U részhalmazához tekinthetjük az
részhalmazokat, amik valójában alterek V-ben. Ha B szimmetrikus vagy ferdén szimmetrikus, akkor ez a két altér
megegyezik, és az U halmaz merőleges alterének nevezzük. A {0}⊥ = V azonosság mindig fennáll, és B pontosan akkor
szinguláris, ha dim(V⊥) ≥ 1. Egy nem szinguláris bilineáris függvény esetében minden U ⊆ V részhalmazra dim( U ) + 〈 〉
dim(U⊥) = dim(V), ahol 〈U〉 a szokásos módon az U által generált alteret jelöli.
Kvadratikus alakok
Egy V valós vektortéren értelmezett B : V × V → ℝ szimmetrikus bilineáris függvényhez tartozó kvadratikus alak a
Q(v) =B(v, v) képlettel megadott Q : V → ℝ függvény.
Tehát minden szimmetrikus bilineáris függvényhez tartozik egy kvadratikus alak, és az is igaz, hogy különböző
szimmetrikus bilineáris függvényekhez különböző kvadratikus alakok tartoznak. Ugyanis egy kvadratikus alak már
egyértelműen meghatározza a szimmetrikus bilineáris függvényét a 2B(v, w) = Q(v + w) – Q(v) – Q(w) képlettel. (Ugyanis Q(v
+ w) = B(v + w, v + w) = B(v, v) + B(v, w) + B(w, v) + B(w, w) = Q(v) + Q(w) + 2B(v, w).)
A valós vektorterek kvadratikus alakjait (illetve a hozzájuk tartozó szimmetrikus bilineáris függvényeket) ötféle
kategóriába soroljuk:
- A Q kvadratikus alak pozitív de nit, ha minden 0-tól különböző v vektorra Q(v) > 0.
- A Q kvadratikus alak negatív de nit, ha minden 0-tól különböző v vektorra Q(v) < 0.
- A Q kvadratikus alak pozitív szemide nit, ha minden 0-tól különböző v vektorra Q(v) ≥ 0, és van olyan 0-tól különböző v
vektor, amivel Q(v) = 0.
- A Q kvadratikus alak negatív szemide nit, ha minden 0-tól különböző v vektorra Q(v) ≤ 0, és van olyan 0-tól különböző v
vektor, amivel Q(v) = 0.
- A Q kvadratikus alak inde nit, ha nem tartozik az előző négy kategóriába, azaz pozitív és negatív értéket is felvesz.
Az, hogy egy adott kvadratikus alak ezen osztályok közül melyikbe tartozik, azzal van összefüggésben, hogy a hozzá
tartozó szimmetrikus bilineáris függvény valamely diagonális mátrixában hány pozitív, negatív, illetve nulla elem
szerepel. Ha B : V × V → ℝ egy szimmetrikus bilineáris függvény, Q : V → ℝ a hozzá tartozó kvadratikus alak, és D egy
alkalmas bázis szerinti diagonális mátrixa B-nek, akkor a következő összefüggések állnak fenn Q és D között:
- Q pozitív de nit, ha D főátlójában minden szám pozitív.
- Q negatív de nit, ha D főátlójában minden szám negatív.
- Q pozitív szemide nit, ha D főátlójában van nulla, de nincs negatív szám.
- Q negatív szemide nit, ha D főátlójában van nulla, de nincs pozitív szám.
- Q inde nit, ha D főátlójában van pozitív és negatív szám is.
Továbbá egy kicsit körülményesebb módon B-nek tetszőleges bázis szerinti M mátrixából is megállapítható, hogy Q
de nit alak-e. Ehhez az M mátrix bal felső sarkában lévő 1 × 1, 2 × 2 stb. méretű mátrixok determinánsait kell ismerni,
beleértve M-et magát is.
- Q pozitív de nit, ha ezen determinánsok mindegyike pozitív.
- Q negatív de nit, ha a szóban forgó determinánsok közül a páratlan méretűek negatívak és a páros méretűek pozitívak.
A kvadratikus alakok egy másik lehetséges megközelítésben másodfokú homogén többismeretlenes polinomok. Az x1,
x2, …, xn ismeretlenek homogén másodfokú polinomjai olyan összegek, amelyek xi xj, illetve x2i alakú tagok
A már korábban említett tétel, miszerint minden szimmetrikus bilineáris függvény alkalmas bázis szerinti mátrixa
olyan diagonális mátrix, ahol a főátlóbeli számok mindegyike –1, 0 vagy 1, a homogén másodfokú polinomok számára a
következőt jelenti:
Minden valós együtthatós n-ismeretlenes homogén másodfokú polinom felírható legfeljebb n darab elsőfokú kifejezés
előjeles négyzetösszegeként.
Példa. Az szimmetrikus mátrixhoz tartozó B : ℝ4 × ℝ4 → ℝ bilineáris függvény képlete:
Egy lehetséges módja annak, hogy ezt előjeles négyzetösszeggé alakítsuk, hogy először az x1-et tartalmazó tagokat
teljes négyzetté egészítjük ki:
Természetesen nem ez az egyetlen módja az előjeles négyzetösszeggé alakításnak, egy másik lehetséges eredmény
például
Nem véletlen, hogy itt mind a két előjeles négyzetösszegre bontásban három tényező szerepel, és ezek közül kettő
pozitív, egy pedig negatív előjellel. A Sylvester-féle tehetetlenségi törvényből adódó általános szabály az, hogy ha a
bilineáris függvény mátrixának a rangja r, akkor a kvadratikus alak legkevesebb r darab tényező előjeles
négyzetösszegére bontható, és bármely két r darab tényezőre bontásban a pozitív előjeles, illetve a negatív előjeles
tagok száma megegyezik.
Egy pozitív de nit szimmetrikus bilineáris függvénnyel ellátott valós vektortér neve valós euklideszi tér.
Tehát egy V valós vektortér euklideszi tér egy adott B : V × V → ℝ szimmetrikus bilineáris függvénnyel, ha tetszőleges
nem nulla v vektorra B(v, v) > 0. Ekkor a B függvényt egy belső szorzatnak (skalárszorzatnak) nevezzük, és mivel
kitüntetett szerepe van az összes többi bilineáris függvény közt, a jelölésében általában elhagyjuk a B betűt és egyszerűen
(v, w)-t írunk B(v, w) helyett.
A legismertebb példák euklideszi terekre:
- Tetszőleges pozitív egész n mellett az ℝn vektortér a szokásos skalárszorzattal:
- A síkvektorok, illetve a térvektorok vektortere a geometriából ismert skalárszorzással: (v, w) = ||v|| · ||w|| · cos(v, w), ahol
||v|| és ||w|| a két vektor hosszát jelölik.
- Tetszőleges rögzített a, b valós számok mellett az (a, b) intervallumon folytonos függvények vektortere az
belső szorzattal.
Általában egy n-dimenziós valós euklideszi tér lényegében ugyanúgy néz ki, mint a fent említett ℝn példa a
skalárszorzattal. Mint korábban már említettük, tetszőleges B : V × V → ℝ szimmetrikus bilineáris függvényhez található
olyan S = {v1, v2, …, vn} bázis, ami szerint B mátrixa diagonális, és a főátló minden eleme –1, 0 vagy 1. Mivel esetünkben
most B pozitív de nit, így ebben a diagonális mátrixban a főátló minden eleme 1, és ekkor az S bázis szerint koordinátázva a
V-beli vektorokat, pont a fenti skalárszorzat képletét kapjuk B-re. Tehát ha
Egy valós euklideszi tér v vektorának a normája (hossza) , két vektor távolsága pedig d(v, w) = ||v – w||.
Egy w vektor egységvektor, ha ||w|| = 1.
Speciálisan az ℝn térben:
Egy valós euklideszi tér tetszőleges v és w vektoraira ||v + w|| ≤ ||v|| + ||w||.
Ennek a tételnek egy következménye, hogy tetszőleges x1, x2, …, xn és y1, y2, …, yn valós számokra
Ugyanis ha a v ∈ ℝn vektor koordinátái az xi, a w ∈ ℝn vektor koordinátái pedig az yi számok, akkor ennek az
egyenlőtlenségnek a bal oldala (v, w)2, jobb oldala pedig ||v||2·||w||2.
További következménye a Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenségnek, hogy tetszőleges valós euklideszi
térben de niálhatjuk a vektorok közti szög fogalmát.
Egy valós euklideszi tér v és w (0-tól különböző) vektorai által bezárt szög az a 0 és π közti φ szög, amivel
Egy V valós euklideszi tér v és w vektorai ortogonálisak (merőlegesek), ha (v, w) = 0. Továbbá tetszőleges U ⊆ V
részhalmaz merőleges altere U⊥ = {v ∈ V | ∀u ∈ U : (u, v) = 0}.
Tehát U⊥ azokból a vektorokból áll, amik minden U-beli vektorra merőlegesek. Korábban már megjegyeztük, hogy
ezek a vektorok V-nek mindig egy alterét alkotják.
Ez azt jelenti, hogy a vektortér bármely v vektora felírható v = w + w'' összegként, ahol w ∈ W és w'' ∈ W⊥, továbbá ez
az összegre bontás egyértelmű. A w összetevő a v vektor merőleges vetülete W-re, ennek a vetületnek a jelölése: projw(v).
Egy valós euklideszi tér v1, v2, …, vk vektorai egy ortogonális vektorrendszert alkotnak, ha egymásra merőlegesek,
azaz 1 ≤ i, j ≤ k és i ≠ j esetén (vi, vj) = 0. Ha ezenkívül a rendszer mindegyik tagja egységvektor, akkor v1, v2, …, vk egy
ortonormált vektorrendszer. Egy egymásra merőleges vektorokból álló bázist ortogonális bázisnak, egy egymásra
merőleges egységvektorokból álló bázist ortonormált bázisnak nevezünk.
Tehát egy valós euklideszi tér S = {v1, v2, …, vn} bázisa pontosan akkor ortogonális bázis, ha a belső szorzat S szerinti
mátrixa diagonális, illetve pontosan akkor ortonormált bázis, ha a belső szorzat S szerinti mátrixa az egységmátrix. Mint
már említettük, minden véges dimenziós valós euklideszi térnek létezik ortonormált bázisa, és ez igaz végtelen dimenziós
euklideszi terekre is.
Érdemes még megjegyezni, hogy az ortogonális tulajdonságból következik a lineáris függetlenség, azaz egy ortogonális
vektorrendszer mindig független is.
Az így kapott {w′1, w′2 …, w′k} vektorrendszer egy ortogonális bázisa W-nek. Ebből már könnyen kaphatunk egy
ortonormált bázist is, ha a w′i vektorokat normáljuk, azaz mindegyiket leosztjuk a saját hosszával. Tehát ha i = 1, 2, …, k-ra
akkor {v1, v2, …, vk} már egy ortonormált bázis W-ben. Mellesleg ez az egyetlen olyan ortonormált
bázisa W-nek, amivel mindegyik 1 és k közötti i egész számra
Egy praktikus haszna annak, ha egy altér ortogonális bázisát ismerjük, hogy annak a segítségével bármelyik vektor
merőleges vetületét ki tudjuk számítani. Ha ugyanis W altér a V valós euklideszi térben, és {w1, w2, …, wk} egy ortogonális
bázisa W-nek, akkor tetszőleges v ∈ V vektor merőleges vetülete W-re:
Az előbb ismertetett Gram–Schmidt-ortogonalizáció lényege is az, hogy az adott bázis minden vektorából kivonjuk az
őt megelőző bázisvektorok által generált altérre vett merőleges vetületét, és így eredményül egy erre az altérre merőleges
vektort kapunk.
Egy V valós euklideszi téren értelmezett φ : V → V lineáris transzformáció szimmetrikus, ha tetszőleges v ∈ V vektorra
(v, φ(v)) = (φ(v), v), illetve ortogonális, ha tetszőleges v ∈ V vektorra ||φ(v)|| = ||v||.
A szimmetrikus tulajdonságból már következik, hogy tetszőleges v, w ∈ V vektorokra (v, φ(w)) = (φ(v), w), illetve az
ortogonális tulajdonságból következik, hogy tetszőleges v, w ∈ V vektorokra (φ(v), φ(w)) = (v, w), továbbá a φ(v) és φ(w)
vektorok által bezárt szög megegyezik a v és w vektorok által bezárt szöggel.
Egy véges dimenziós, valós V vektortér φ : V → V lineáris transzformációja akkor és csak akkor szimmetrikus, ha egy
ortonormált bázis szerinti mátrixa szimmetrikus, illetve akkor és csak akkor ortogonális, ha egy ortonormált bázis
szerinti mátrixa ortogonális mátrix.
Az „egy” helyett használhatnánk a „minden” szót is, ugyanis egy szimmetrikus lineáris transzformáció bármely
ortonormált bázis szerinti mátrixa szimmetrikus, illetve egy ortogonális lineáris transzformáció bármely ortonormált
bázis szerinti mátrixa ortogonális mátrix. (Emlékeztetőül, egy M valós mátrix szimmetrikus, ha MT = M, illetve
ortogonális, ha MT·M=E. Ez utóbbi pontosan akkor teljesül, ha az M mátrix oszlopai ℝn-nek a szokásos skalárszorzatra
nézve egy ortonormált bázisát alkotják.)
Speciálisan tetszőleges n pozitív egész mellett, ha A egy szimmetrikus és Q egy ortogonális n × n méretű mátrix, akkor
az ℝn vektortéren értelmezett v ↦ A·v lineáris transzformáció szimmetrikus, illetve a v ↦ Q·v lineáris transzformáció
ortogonális.
Minden lineáris transzformációnak van adjungáltja, és egy ortonormált bázis szerint az adjungált, illetve az eredeti
lineáris transzformációk mátrixai egymásnak transzponáltjai. Tehát ha S egy ortonormált bázisa a V vektortérnek, és φ : V
→ V egy lineáris transzformáció, akkor [φ*]S = [φ]TS. Egy φ : V → V lineáris transzformáció pontosan akkor szimmetrikus,
ha φ* = φ, illetve pontosan akkor ortogonális, ha φ* = φ–1.
Korábban már említettük, hogy ha egy lineáris transzformáció valamely bázis szerinti mátrixa szimmetrikus, akkor a
transzformáció diagonalizálható, azaz létezik a vektortérnek olyan bázisa is, ami az adott transzformáció sajátvektoraiból
áll. Így egy valós euklideszi tér szimmetrikus transzformációi is diagonalizálhatók (mivel minden ortonormált bázis
szerinti mátrixuk szimmetrikus), tehát létezik hozzájuk sajátvektorbázis. Ennél több is igaz:
Egy valós euklideszi tér szimmetrikus lineáris transzformációjához mindig található sajátvektorokból álló
ortonormált bázis.
Ha A egy n × n méretű szimmetrikus valós mátrix, akkor A diagonalizálható egy ortogonális mátrixszal, azaz létezik
olyan n × n méretű ortogonális Q mátrix, amivel a Q–1AQ szorzat diagonális.
Érdemes még megemlíteni, hogy ha egy φ : V → V szimmetrikus lineáris transzformációnak v és w két különböző
sajátértékhez tartozó sajátvektora, akkor szükségszerűen merőlegesek egymásra, azaz (v, w) = 0.
Az ortogonális lineáris transzformációk nem feltétlenül diagonalizálhatók, viszont mindig található hozzájuk olyan
bázis, amely szerinti mátrixukban a főátló mentén
típusú 2 × 2-es blokkok, illetve 1 vagy –1 található, ezeken kívül pedig minden más elem nulla.
Ha egy egyenletrendszer együtthatómátrixának létezik, és ismert ez a típusú felbontása, akkor a megoldás már
könnyen kiszámítható. Tekintsük ugyanis az A·x = b mátrixegyenlettel megadott, m egyenletből álló n ismeretlenes
egyenletrendszert, ahol A egy m × n méretű mátrix, x az ismeretlenek n hosszú oszlopvektora, b pedig az egyenletek
konstans tényezőinek m hosszú oszlopvektora. Amennyiben A = Q·R, ahol Q és R a fenti tételben leírt mátrixok, akkor az
egyenletrendszer mindkét oldalát Q transzponáltjával balról szorozva az R·x = QT·b mátrixegyenletet kapjuk. Ehhez a
mátrixegyenlethez egy n egyenletből álló egyenletrendszer tartozik, ami gyorsan és kényelmesen megoldható: mivel R egy
felső-háromszögmátrix, az utolsó egyenletben az ismeretlenek közül csak xn szerepel, az utolsó előttiben xn–1 és xn stb. Így
az utolsó egyenlettől visszafelé haladva sorra megkapjuk az xn, xn–1, …, x1 ismeretlenek értékeit.
Abból a feltevésből, hogy az m×n méretű A együtthatómátrix rangja n (azaz A oszlopai lineárisan függetlenek)
következik, hogy az A·x = b egyenletrendszernek legfeljebb egy megoldása lehet. Ha pontosan egy megoldás létezik, akkor
ezt a megoldást kapjuk az R·x = QT·b egyenlet megoldásával is. Azonban előfordulhat, hogy az A·x = b egyenletrendszernek
nincs megoldása, az R·x = QT·b egyenlet viszont így is szolgáltat egy megoldást. Az így kapott x1, x2, …, xn értékek az eredeti
egyenletnek az ún. közelítő megoldását adják.
A (11.1) lineáris egyenletrendszernek egy közelítő megoldásán olyan x1, x2, …, xn értékek megadását értjük, amikkel az
egyenletek bal és jobb oldalainak a különbségeiből alkotott négyzetösszeg a lehető legkisebb.
Az A·x = b (A ∈ ℝm×n, b ∈ ℝm) egyenletrendszernek z ∈ ℝn egy közelítő megoldása, ha ||A·z – b|| a lehető legkisebb.
Amennyiben az egyenletrendszer megoldható, akkor a közelítő megoldások maguk a valódi megoldások, közelítő
megoldásról tehát akkor érdemes beszélni, ha az adott egyenletrendszer nem oldható meg. Mivel az A·v (v ∈ ℝn) alakú
vektorok egy alteret alkotnak ℝm-ben – jelöljük ezt az alteret W-vel, és ez nem más, mint az A mátrix oszlopai által generált
altér –, az ||A·z – b|| távolság pontosan akkor a lehető legkisebb, ha A·z megegyezik a b vektornak W-re vett merőleges
vetületével, azaz A·z = projw(b). Korábban már leírtuk, hogy egy adott vektor adott altérre vett merőleges vetülete miként
számítható ki, így tehát bármely egyenletrendszer közelítő megoldásait meg tudjuk adni: az A·x = b egyenlet helyett
egyszerűen az A·x = projw(b) egyenletrendszert oldjuk meg, ahol W az A mátrix oszlopai által generált altér. Ez a módszer a
gyakorlatban – a merőleges vetület kiszámítása miatt – kicsit körülményes, azonban egy ekvivalens egyenletrendszerhez
jutunk azzal az észrevétellel, hogy A·x= projw(b) pontosan akkor teljesül, ha A·x–b merőleges a W altérre, azaz merőleges az
A mátrix összes oszlopára. Ez a feltétel mátrixegyenlettel kifejezve AT· (A·x – b) = 0, átrendezés után ATA·x = ATb.
Ha adott egy A·x = b, (A ∈ ℝm×n, b ∈ ℝm) valós egyenletrendszer, akkor az (ATA)·x = ATb egyenletrendszernek
garantáltan van megoldása (egy vagy végtelen sok), és minden megoldása az eredeti egyenletrendszernek egy közelítő
megoldása.
A közelítő megoldás pontosan akkor egyértelmű, ha az együtthatómátrix oszlopai lineárisan függetlenek, és ebben az
esetben ATA egy invertálható négyzetes mátrix.
Ajánlott irodalom
Davaadorzsin, M.: Valós lineáris algebra és lineáris programozás. Műszaki Könyvkiadó, Budapest, 2001
Fagyejev, D. K.–Szominszkij, I. Sz.: Felsőfokú algebrai feladatok. Typotex Kiadó, Budapest, 2000
Freud R.: Lineáris algebra. ELTE Eötvös Kiadó, Budapest, 2006
Fried E.: Algebra I. Elemi és lineáris algebra. Nemzeti Tankönyvkiadó, Budapest, 2000
Kirchner I.: Lineáris algebra és vektoralgebra. Nemzeti Tankönyvkiadó, Budapest, 2007
Kuros, A. G.: Felsőbb algebra. Tankönyvkiadó, Budapest, 1967
Obádovics J. Gy.: Lineáris algebra példákkal. Scolar Kiadó, Budapest, 2001
Obádovics J. Gy.: Mátrixok és di erenciálegyenlet-rendszerek. Scolar Kiadó, Budapest, 2005
Rózsa P.: Bevezetés a mátrixelméletbe. Typotex Kiadó, Budapest, 2009
Scharnitzky V.: Mátrixszámítás. Műszaki Kiadó, Budapest, 2006
Scharnitzky V.: Vektorgeometria és lineáris algebra. Nemzeti Tankönyvkiadó, Budapest, 2006
12. Absztrakt algebra
12.1. Az algebrai struktúrákról általában
12.2. Gyűrűelmélet, alapfogalmak
12.3. Kommutatív egységelemes gyűrűk
12.4. Csoportelmélet, alapfogalmak
12.5. További témák a csoportelméletből
12.6. Testek és Galois-csoportok
12.7. Modulusok
12.8. Hálók és Boole-algebrák
Egy nem üres S halmazon értelmezett n-változós műveleten az S halmaz n-tényezős S × S × … × S Descartes-féle
szorzatának egy S-be történő leképezését értjük. Ha egy halmazon legalább egy (akárhány változós) művelet
értelmezve van, akkor az a halmaz a rajta értelmezett művelet(ek)kel együtt egy algebrai struktúra.
Mint már utaltunk rá, egy adott algebrai struktúra vizsgálatakor fontos szempont annak a kérdésnek a
megválaszolása, hogy a struktúrán értelmezett művelet(ek)ről milyen tulajdonságok mondhatók el. Elvileg egy algebrai
művelet akárhány változós lehet, de mivel a klasszikus algebrai struktúrák többnyire kétváltozós műveleteken alapszanak,
így ebben a fejezetben mi is csak kétváltozós műveletekkel foglalkozunk. Egy S halmazon értelmezett kétváltozós művelet
tehát az S × S halmaznak egy S-be történő leképezése. Az S × S-beli (x, y) elem képének a jelölésére ebben a szekcióban az x *
y és x⊙y kifejezéseket fogjuk használni (az általánosság kedvéért), de természetesen a közismert algebrai struktúrákon
értelmezett műveleteknek mind megvan a maguk általánosan elfogadott standard jelölése (x + y, x · y, x ∪ y, x ∩y stb.).
Jóllehet az asszociatív tulajdonság csak háromtényezős műveletsorokra mondja ki, hogy a zárójelezés nem változtat az
eredményen, ebből már következik, hogy akárhány tényezős műveletsornál is elhagyható a zárójelezés: a műveletek
tetszőleges sorrendbeni elvégzése mindig ugyanahhoz az eredményhez vezet, feltéve hogy a tényezők sorrendje
változatlan. Például (a * b) * (c * d) = a * ((b * c) * d). Ha az asszociatív és a kommutatív tulajdonság egyszerre áll fenn, akkor a
többtényezős műveletsorokban a tényezők sorrendje is lényegtelen. Amennyiben viszont a kommutatív tulajdonság nem
teljesül, akkor a tényezők sorrendjére szigorúan ügyelni kell!
Egy S halmazon értelmezett * műveletre nézve az S-beli e elem egy egységelem (neutrális elem), ha bármely S-beli x
elemre e * x = x * e = x. Amennyiben csak annyit kötünk ki, hogy bármely S-beli x elemre e * x = x, akkor e egy bal oldali
egységelem, ha pedig azt kötjük ki, hogy bármely S-beli x elemre x * e = x, akkor e egy jobb oldali egységelem.
Az egységelem létezése maga után vonja annak egyértelműségét is, illetve kicsit több is igaz: ha létezik egy bal oldali és
egy jobb oldali egységelem, akkor azok egyenlők, s ez az elem (általános) egységelem. Viszont előfordulhat, hogy egy
struktúrában van több bal oldali egységelem és nincs jobb oldali, vagy fordítva.
Egy S halmazon értelmezett * műveletre nézve az S-beli x és y elemek inverzei egymásnak, ha ugyanarra a műveletre
nézve van egy e egységelem és x * y = y * x = e. Amennyiben csak annyit teszünk fel, hogy x * y = e, akkor x egy bal oldali
inverze y-nak és y egy jobb oldali inverze x-nek.
Az inverzelem létezése ugyancsak maga után vonja annak egyértelműségét. Általánosabban: ha egy adott elemnek
létezik bal oldali és jobb oldali inverze is, akkor azok egyenlők.
Egy adott S halmazon értelmezett * művelet disztributív az (ugyancsak S-en értelmezett) ⊙ műveletre nézve, ha
bármely S-beli x, y és z elemekre (x ⊙ y) * z = (x * z) ⊙ (y * z) és z* (x ⊙ y) = (z * x) ⊙ (z * y). Jobb oldali, illetve bal oldali
disztributív tulajdonságról beszélhetünk, ha ezen azonosságok közül csak az első, illetve csak a második érvényes.
Gyűrűnek nevezünk egy R halmazt a rajta értelmezett összeadás (+) és szorzás (·) műveletekkel együtt, ha a következő
axiómák teljesülnek:
1. Minden a, b ∈ R esetén a + b ∈ R.
2. Tetszőleges a, b, c ∈ R elemekre (a + b) + c = a + (b + c).
3. Tetszőleges a, b ∈ R elemekre a + b = b + a.
4. Van egy 0 ∈ R elem, amivel minden a ∈ R elemre 0 + a = a.
5. Minden a ∈ R elemhez van olyan b ∈ R, amivel a + b = 0.
6. Minden a, b ∈ R esetén a·b ∈ R.
7. Tetszőleges a, b, c ∈ R elemekre (a·b)·c = a·(b·c).
8. Tetszőleges a, b, c ∈ R elemekre (a + b)·c = a·c + b·c és c·(a + b) = c·a + c·b.
A fentieket röviden úgy lehetne összegezni, hogy az (R, +, ·) algebrai struktúra egy gyűrű, ha (R, +) egy kommutatív
csoport, (R, ·) egy félcsoport, és a szorzás az összeadásra nézve disztributív.
Kommutatív gyűrűn egy olyan gyűrűt értünk, ahol a szorzás is kommutatív: tetszőleges a, b ∈ R elemekre a·b = b·a.
Egységelemes gyűrűn egy olyan gyűrűt értünk, amiben a szorzásra nézve is van egységelem: 1 ∈ R, amivel minden a ∈
R elemre 1 · a = a · 1 = a, és ez az elem különbözik a 0-tól.
Testen egy olyan kommutatív egységelemes gyűrűt értünk, ahol a nullától különböző elemeknek van multiplikatív
inverze: minden 0 ≠ a ∈ R elemhez van olyan b ∈ R, amivel a·b = b·a = 1. Ha eltekintünk a kommutatív tulajdonságtól,
akkor ferdetestről beszélünk.
A gyűrűaxiómák közül az első és hatodik jelentése egyszerűen csak annyi, hogy az R halmaz az összeadásra és a
szorzásra nézve zárt, azaz bármely művelet elvégzése olyan eredményhez vezet, ami szintén eleme az R-nek. Ez következik
abból, ahogy a művelet fogalmát de niáltuk a fejezet elején, viszont szokás ezt a feltételt is belevenni az axiómák közé
(hangsúlyozva annak fontosságát). A második és hetedik axióma elvárása, hogy az összeadás és a szorzás asszociatív
műveletek legyenek. Ennek eredményeképp egy tetszőleges tagot számláló összegben (illetve szorzatban) felesleges a
zárójelezés, azaz lényegtelen, hogy az egyes összeadásokat (illetve szorzatokat) milyen sorrendben végezzük el. (Azonban
ha egy kifejezés mind a két műveletet tartalmazza, azok elvégzésének a sorrendje már lényeges. Ilyenkor a szorzás élvez
prioritást az összeadással szemben, kivéve ha a kifejezésben használt zárójelezés másképp rendelkezik.) A harmadik
axióma szerint az összeadásnak kommutatívnak kell lennie: így egy tetszőleges tagot számláló összegben lényegtelen a
tagok sorrendje, egy esetleges átrendezés nem változtat az eredményen. A negyedik és az ötödik axióma azt a feltételt köti
ki, hogy léteznie kell egy nullelemnek a gyűrűben, és erre nézve minden elemnek kell, hogy legyen negatívja. Jóllehet ezen
axiómákban a nullelem és a negatívok egyértelműsége nincs szó szerint kimondva, de ez az egyértelműség
kikövetkeztethető az axiómarendszerből: egy gyűrűben pontosan egy nullelem létezik, és erre nézve minden elemnek
pontosan egy negatívja van. Megszokott, hogy általában egy x elem negatívját –x jelöli. Végül a nyolcadik axióma a két
művelet kapcsolatáról szól: a szorzás disztributív az összeadásra nézve. A „kivonás” mint művelet nem szerepel az
axiómákban, mégis praktikus okokból érdemes használni az a – b jelölést az a + (–b) elemre. Továbbá ha n egy természetes
szám, és a egy gyűrűbeli elem, akkor an az n-tényezős a·a·…·a szorzatot, na az n-tényezős a + a+ … +a összeget, –na pedig az
n-tényezős (–a) + (–a) + … + (–a) összeget jelöli.
Egy gyűrűben lehetnek bizonyos speciális elemek, amiknek külön elnevezésük van. Egy x elem nullosztó, ha x ≠ 0, és
alkalmas nem nulla y elemmel x · y = 0 vagy y·x = 0; nilpotens, ha x ≠ 0, de valamelyik hatványa egyenlő 0-val; és
idempotens, ha x2 = x.
Néhány példa gyűrűre a legfontosabbak közül:
- Az egész / racionális / valós / komplex számok az összeadással és szorzással: (ℤ, +, ·), (ℚ, +, ·), (ℝ, +, ·) és (ℂ, +, ·).
- Az egész / racionális / valós / komplex együtthatós polinomok az összeadással és szorzással: (ℤ[x], +, ·), (ℚ[x], +, ·), (ℝ[x], +, ·)
és ℂ([x],+, ·).
- Az egész / racionális / valós / komplex együtthatós formális hatványsorok az összeadással és szorzással: (ℤ[[x]], +, ·), (ℚ[[x]]
+, ·), (ℝ[[x]], +, ·) és (ℂ[[x]], +, ·).
- Bármely n pozitív egész szám mellett az egész / racionális / valós / komplex n×n méretű mátrixok a mátrixösszeadással és a
mátrixszorzással: (Mn(ℤ), +, ·), (Mn(ℚ), +, ·), (Mn(ℝ), +, ·) és (Mn(ℂ), +, ·).
- Bármely nem üres halmazon értelmezett valós függvények a függvényösszeadással és a függvényszorzással.
- Bármely nem üres X halmaz hatványhalmaza (részhalmazainak a halmaza) a szimmetrikus di erencia- és a
metszetműveletekkel: (P(X), ⊕, ∩).
Az axiómákból bizonyos alapvető tulajdonságok gyorsan levezethetők:
- A nullelem és minden elemnek az additív inverze (negatívja) egyértelmű.
- Tetszőleges a ∈ R elemre –(–a) = a, 0·a = a·0 = 0, valamint ha a gyűrű egységelemes, akkor (–1) ·a = a· (–1) = –a.
- Tetszőleges a, b ∈ R elemekre (–a) + (–b) = –(a + b), –(a – b) = –a + b, a · (–b) = (–a) · b = (–a · b) és (–a) · (–b) = a · b.
- Tetszőleges a, b, c ∈ R elemekre az a + c = b + c egyenlőségből következik a = b.
Ez utóbbi az összeadás egyszerűsítési szabálya. Ezzel szemben a szorzás egyszerűsítési szabálya nem minden gyűrűben
érvényes: az a·c = b·c egyenlőségből általában nem következik a = b, még akkor sem, ha feltesszük, hogy c ≠ 0. Ez azzal az
egyszerű észrevétellel van összefüggésben, hogy általában egy szorzat akkor is lehet nulla, ha egyik tényező sem nulla.
Egy gyűrűt nullosztómentesnek nevezünk, ha két nem nulla elemének a szorzata sosem egyenlő nullával.
Két gyűrű, A és B direkt szorzatát az A × B Descartes-féle szorzaton úgy de niálhatjuk, hogy a műveleteket
koordinátánként végezzük el.
Tehát A × B = {(a, b)| a ∈ A, b ∈ B}, (a1, b1)+ (a2, b2) = (a1 + a2, b1 + b2), és (a1, b1) · (a2, b2) = {a1·a2, b1·b2). A direkt szorzat
nulleleme (0, 0), és egy (a, b) elemének a negatívja –(a, b) = (–a, –b). Ha A és B egységelemes gyűrűk, akkor A × B is
egységelemes, továbbá A × B akkor és csak akkor kommutatív, ha A és B mindketten azok.
Részgyűrűk, ideálok
Homomor zmusok
Polinomgyűrűk
Részgyűrűk, ideálok
Ha az R gyűrűnek egy T részhalmaza maga is gyűrűt alkot az R-beli műveletekkel, akkor T egy részgyűrű R-ben, és ezt
a kapcsolatot T ≤ R jelöli.
Minden gyűrűnek részgyűrűje saját maga, illetve a {0} halmaz. Egy T részgyűrű R-ben valódi részgyűrű, ha T ≠ R (és ez
esetben a T < R jelölést is használhatjuk). Ahhoz, hogy egy T ⊆ R részhalmaz részgyűrű legyen, tartalmaznia kell a gyűrű
nullelemét, továbbá mindegyik elemével együtt annak a negatívját, valamint bármely két elemének az összegét és a
szorzatát is. Néhány közismert példa részgyűrűkre:
- (ℤ. +, ·) < (ℚ, +, ·) < (ℝ, +, ·) < (ℂ, +, ·)
- (ℤ[x], +, ·) < (ℚ[x], +, ·) < (ℝ[x], +, ·) < (ℂ[x], +, ·)
- (Mn(ℤ), +, ·) < (Mn(ℚ), +, ·) < (Mn(ℝ), +, ·) < (Mn(ℂ), +, ·) tetszőleges n pozitivív egész mellett,
- (ℤ, +, ·) < (ℤ[x], +, ·); (ℝ, +, ·) < (ℝ[x], +, ·); (ℂ, +, ·) < (ℂ[x], +, ·).
Az ideál tulajdonság jelölése: I ◃ R. Minden gyűrűnek ideálja a {0} egyelemű halmaz, illetve a gyűrű maga. Ha ezeken
kívül más ideál nincs az R gyűrűben, akkor R egy egyszerű gyűrű. Egy ideál mindig egyben részgyűrű is, de a szorzásra
nézve a részgyűrűknél sokkal szigorúbb feltételt teljesít, így egy részgyűrűről ritkán mondható el, hogy ideál is lenne. Ha
az első két feltétel mellett a harmadik feltételből csak annyi teljesül, hogy bármely x ∈ I és r ∈ R esetén rx ∈ I (illetve xr ∈
I), akkor I egy bal oldali ideál (illetve jobb oldali ideál).
Egy I ideál szerinti kongruencia a következőképp de niált: a gyűrűben két elem kongruens egymással modulo I, ha a
különbségük benne van I-ben. Ennek a relációnak a jelölése: a ≡ b (mod I).
Egy adott ideál szerinti kongruencia mindig ekvivalenciareláció, sőt, a gyűrű műveletei átvihetők az
ekvivalenciaosztályok halmazára. Amennyiben ā jelöli az a elem ekvivalenciaosztályát, azaz
Itt fontos tisztában lenni azzal, hogy ez a műveletértelmezés jól de niált, azaz ha akkor garantált,
Az R gyűrű I ideálja szerinti kongruenciaosztályok az imént de niált műveletekkel szintén egy gyűrűt alkotnak: az R/I
faktorgyűrűt.
Az R gyűrűnek egy M ideálja maximális ideál, ha M ≠ R, és más (R-től különböző) ideál nem tartalmazza M-et
részhalmazként.
Egy φ : R → T leképezés homomor zmus az (R, +, ·) és (T, +, ·) gyűrűk között, ha az R gyűrű bármely két, x és y elemére
φ(x + y) = φ(x) + φ(y) és φ(x · y) = φ(x) · φ(y).
Egy φ : R → T homomor zmusra mindig igaz, hogy az R-beli nullelem képe a T-beli nullelem (azaz φ(0) = 0), és bármely
R-beli x elemre φ(–x) = –φ(x). A φ : R → T homomor zmus képe: Im(φ) = {φ(r) | r ∈ R} mindig egy részgyűrű T-ben. A φ : R
→ T homomor zmus magja: Ker(φ) = {r ∈ R | φ(r) = 0} mindig egy ideál R-ben. Megfordítva, minden R-beli I ideál magja
egy alkalmas homomor zmusnak: de niáljuk az R gyűrűnek az R/I faktorgyűrűbe való kanonikus homomor zmusát úgy,
hogy tetszőleges r elem képe legyen az kongruenciaosztály. Ez a leképezés valóban egy homomor zmus, és a magja
pontosan az I ideál. (A képe pedig az egész R/I.)
Bizonyos speciális típusú homomor zmusokra külön elnevezéseket használunk.
- Endomor zmus: homomor zmus egy adott gyűrűn belül (φ : R → R).
- Izomor zmus: homomor zmus, ami egyben egy bijektív leképezés.
- Automor zmus: izomor zmus egy adott gyűrűn belül.
Ha az R és T gyűrűk közt létezik egy izomor zmus, akkor azt mondjuk, hogy R és T izomorf egymással, és ezt a
kapcsolatot R ≅ T jelöli.
Az izomor a egy ekvivalenciareláció a gyűrűk osztályán (mivel egy izomor zmusnak az inverze is mindig
izomor zmus, két izomor zmus kompozíciója is mindig izomor zmus, továbbá bármely gyűrűn értelmezett identikus
leképezés egy izomor zmus).
Izomorf gyűrűk közt strukturális szempontból nincs különbség: ha R ≅ T, akkor bármely algebrai tulajdonság, ami az
egyik gyűrű struktúrájáról elmondható, garantáltan igaz a másikra is.
Általában igaz, hogy ha egy R gyűrűben I ideál és T részgyűrű, akkor T ∩I egy ideál T-ben, illetve a T + I = {t + i | t ∈ T, i
∈ I} halmaz egy részgyűrű R-ben, ami tartalmazza az I ideált.
Ha I egy ideál az R gyűrűben, akkor az R gyűrű I-t tartalmazó részgyűrűi kölcsönösen és egyértelműen
megfeleltethetők az R/I gyűrű részgyűrűivel úgy, hogy egy I-t tartalmazó T részgyűrűnek az R/I-beli T/I részgyűrű felel
meg. Ebben a megfeleltetésben R-beli (I-t tartalmazó) ideálok R/I-beli ideálokhoz kapcsolódnak.
Polinomgyűrűk
A gyakorlatban egy R-beli együtthatós polinom alatt – ahol R egy tetszőleges gyűrűt jelöl – egy anxn + an–1xn–1 + … + a1x + a0
alakú kifejezést szoktunk érteni, ahol az ai „együtthatók” R-beli elemek, és x pedig egy „szimbólum”, szigorú matematikai
értelemben viszont ez nem tekinthető precíz de níciónak.
Egy R gyűrű feletti polinom egy R-beli elemekből álló végtelen (a0, al, a2, …) sorozat, ha létezik olyan pozitív egész n
szám, hogy minden i > n egészre ai = 0. Tehát a sorozatnak legfeljebb véges sok tagja lehet 0-tól különböző. Az ai elemek
a polinom együtthatói. Az (a0, a1, a2, …) polinom foka n, ha n a legnagyobb olyan egész szám, amire an ≠ 0. (Ha nincs
ilyen egész, azaz mindegyik együttható nulla, akkor a polinom foka nem de niált.)
Az R gyűrű feletti polinomok halmazán értelmezhetjük az összeadás és a szorzás műveleteket:
Az összeadást koordinátánként végezzük el, a szorzat pedig az a (c0, c1, c2, …) polinom, aminek az együtthatóira
teljesül. Ezekkel a műveletekkel az R feletti polinomok halmaza egy gyűrű: az R feletti polinomgyűrű.
Ezt a gyűrűt R[x] jelöli, és általánosan elfogadott, hogy az (a0, a1, a2, …) polinomra a
jelölést használjuk, amennyiben minden i > n egészre ai = 0. Az R[x] gyűrű nulleleme a zérus polinom, aminek minden
együtthatója nulla, és egy a0 + a1x + a2x2 + …+anxn polinom negatívja –a0 – a1x – a2x2 – … –anxn. Ha R egységelemes gyűrű,
akkor az x szimbólum tulajdonképpen a (0, 1, 0, 0, …) elsőfokú polinomra utal. Ekkor ugyanis a polinomok körében
értelmezett szorzás művelettel x-nek bármelyik pozitív egész kitevős xk hatványa az a polinom, amiben a k-adik együttható
1 és az összes többi 0. (Így a fentebb bevezetett jelölés valójában egy R[x]-beli egyenlőség.) Konstans polinomoknak
nevezzük a nulla fokú polinomokat, valamint a zérus polinomot. A konstans polinomok egy részgyűrűt alkotnak R[x]-ben,
és ez a részgyűrű izomorf az eredeti R gyűrűvel.
Az R[x] polinomgyűrű pontosan akkor kommutatív, ha R kommutatív, és pontosan akkor egységelemes, ha R
egységelemes.
halmaz egy ideál R-ben, méghozzá a legkisebb olyan ideál, ami tartalmazza az xi elemeket. Ezért ezt nevezzük az x1, x2, …,
xk elemek által generált ideálnak.
Az R gyűrűnek egy I ideálja végesen generált, ha alkalmas k pozitív egész és R-beli x1, x2, …, xk elemek mellett I = Rx1 +
Rx2 + … + Rxk. Egy I ideál főideál, ha egy elem generálja. Az R gyűrűnek egy P ideálja prímideál, ha P ≠ R, és tetszőleges
a · b szorzat a gyűrűben csak úgy lehet eleme P-nek, ha a ∈ P vagy b ∈ P. Az R gyűrűnek egy Q ideálja primer ideál, ha
tetszőleges a · b szorzat a gyűrűben csak úgy lehet eleme Q-nak, ha a ∈ Q vagy valamilyen k pozitív egész számmal bk ∈
Q.
Ezeket az ideáltípusokat a faktorgyűrűk segítségével is lehet karakterizálni: az R gyűrűben egy P ideál prímideál, ha
R/P nullosztómentes; és egy Q ideál primer ideál, ha R/Q-ban minden nullosztó nilpotens. Továbbá egy M ideál maximális,
ha R/M test. Egy maximális ideál mindig egyben prímideál is, és egy prímideál mindig egyben primer ideál is.
A kommutatív nullosztómentes gyűrűk neve integritási tartomány. Egy egységelemes integritási tartomány
főideálgyűrű, ha minden ideálja főideál. Egy kommutatív gyűrű Noether-gyűrű, ha minden ideálja végesen generált.
Oszthatóság
Euklideszi gyűrűk
Egyértelmű felbontási tartományok
Oszthatóság
Az oszthatóság fogalmát bármilyen (kommutatív) gyűrűben lehet de niálni, viszont komoly elmélete az oszthatóságnak
csak integritási tartományokban van, így ennek a témakörnek az áttekintésekor mi is csak integritási tartományokra
szorítkozunk.
Egy R integritási tartományban az x elem osztója az y elemnek (y többszöröse x-nek), ha alkalmas R-beli z elemmel y =
x · z. Ezt a kapcsolatot x | y jelöli. Az e elem egy egység, ha minden gyűrűbeli elemnek osztója. Az x és y elemek
asszociáltak (jelben x ~ y), ha egymás osztói.
Egy f elem felbonthatatlan (irreducibilis), ha nem nulla, nem egység, és csak úgy állítható elő x·y szorzatként, ha vagy
x, vagy y asszociáltja f-nek. Egy p elem prím, ha nem nulla, nem egység, és csak úgy lehet osztója egy ab szorzatnak, ha
p | a vagy p | b.
Egy felbonthatatlan elemnek az összes asszociáltja is felbonthatatlan, és egy prím elemnek az összes asszociáltja is
prím. Minden prím elem felbonthatatlan, de ennek a megfordítottja már nem minden integritási tartományban igaz.
Főideálgyűrűkben minden irreducibilis elem prím, így az irreducibilis és a prím elemek halmaza megegyezik.
Euklideszi gyűrűk
A maradékos osztás fogalmát a következőképp tudjuk értelmezni:
Egy E integritási tartomány euklideszi gyűrű, ha létezik olyan Ψ : E– {0} → ℤ ≥ 0 függvény, hogy bármely E-beli nem
zéró x és y elemekre Ψ (x) ≤ Ψ (xy), továbbá bármely E-beli a és b ≠ 0 elemekhez léteznek olyan h (hányados) és m
(maradék) elemek, amikkel a = bh + m és vagy m = 0, vagy Ψ (m) < Ψ(b).
A fenti elvárást teljesítő Ψ függvényt euklideszi függvénynek (vagy euklideszi normának) nevezzük.
Euklideszi gyűrűkre példák az alábbiak:
- (ℤ, +, ·) a szokásos maradékos osztással, ekkor Ψ (x) = |x|.
- A Gauss-egészek (ℤ[i], +, ·) gyűrűje, ahol Ψ(x) = |x|2.
- (ℚ[x], +, ·), (ℝ [x], +, ·), illetve (ℂ[x], +, ·), ahol az euklideszi függvény a fokszámot rendeli hozzá az egyes polinomokhoz.
Ebből következik, hogy az euklideszi gyűrűkben is bármely két elemnek van legnagyobb közös osztója, ami
(asszociáltság erejéig) a szokásos euklideszi algoritmussal meg is kapható.
Egy R integritási tartomány egyértelmű felbontási tartomány (EFT), ha minden nullától és egységektől különböző
elem előáll irreducibilis elemek szorzataként, és ez az előállítás a szorzatbeli tényezők sorrendjétől és asszociáltságtól
eltekintve egyértelmű.
Az egyértelműségen azt értjük, hogy ha egy R-beli r elemnek r = p1 · p2·… ·ps és r = q1 · q2 · … ·qt egyaránt irreducibilis
tényezők szorzataként való előállítása, akkor s = t és az {1, 2, …, s} halmaznak egy alkalmas π permutációjával minden 1 ≤ i ≤
s egészre pi és qπ(i) asszociáltak.
Minden főideálgyűrű EFT.
És mivel minden euklideszi gyűrű főideálgyűrű, az euklideszi gyűrűk is mind egyértelmű felbontási tartományok.
További egyértelmű felbontási tartományokat kaphatunk a polinomgyűrű-konstrukcióval:
Egy R integritási tartomány pontosan akkor EFT, ha a következő két feltétel teljesül rá:
1. R-ben minden irreducibilis elem prím.
2. Az R-beli főideáloknak nincs végtelen, a tartalmazásra nézve szigorúan növekvő lánca.
A tételben szereplő második feltétel szerint az R-beli főideáloknak bármely növekvő I1⫅ I2 ⫅I3⫅ … láncához van olyan
pozitív egész k, hogy a lánc Ik-nál stabilizálódik, azaz Ik = Ik+1 = Ik+2 = …. Ezt a koncepciót általánosítva azt mondjuk, hogy
egy R gyűrű ideáljaira teljesül a növekvő láncfeltétel, ha R-beli tetszőleges ideáloknak nincs a tartalmazásra nézve
szigorúan növekvő végtelen lánca, azaz bármely növekvő ideállánc egy ponton stabilizálódik.
Egy kommutatív gyűrű pontosan akkor Noether-gyűrű, ha az ideáljaira teljesül a növekvő láncfeltétel.
Természetesen minden főideálgyűrű Noether-gyűrű is egyben (és így minden euklideszi gyűrű is), azonban nem
minden EFT Noether-gyűrű, és fordítva sem igaz, hogy minden Noether-gyűrű EFT lenne. Annyi igaz, hogy egy Noether-
gyűrűben minden nullától és az egységektől különböző elem előáll irreducibilis elemek szorzataként. A Noether-
tulajdonság is öröklődik polinomgyűrűkre:
Csoportnak nevezünk egy G halmazt egy rajta értelmezett * művelettel, ha a következő axiómák teljesülnek:
1. Minden a, b ∈ G esetén a * b ∈ G.
2. Tetszőleges a, b, c ∈ G elemekre (a * b) * c = a * (b * c).
3. Van egy olyan e ∈ G, amivel minden a ∈ G elemre e * a = a * e = a.
4. Minden a ∈ G elemhez van olyan b ∈ G, amivel a * b = b * a = e.
Az első axióma azt mondja ki, hogy a G halmaz zárt az adott * műveletre. (Jóllehet ez automatikusan következik abból,
ahogy a műveleteket de niáltuk a fejezet elején, ezt a feltételt is szokás a csoportaxiómák közé sorolni.) A második axióma
a művelet asszociatív voltát követeli meg. Ennek eredményeképp egy tetszőleges tagot számláló műveletsorban felesleges a
zárójelezés feltüntetése: a műveletek elvégzésének sorrendje nem változtat az eredményen, amennyiben a tényezők
sorrendje változatlan, pl. (a * b) * (c * (d * e)) = a * ((b * c) * (d * e)). A harmadik axióma az egységelem létezéséről szól, és ebből
következik annak az egyértelműsége is. Ha ugyanis e és f mindketten egységelemek G-ben, akkor e egységelem volta miatt e
* f = f, és f egységelem volta miatt e * f = e, tehát e = f. Hasonlóan, az axiómákból az is következik, hogy minden elemnek az
inverze egyértelmű: ha b és c inverzei a-nak, akkor
A továbbiakban azokat a csoportelméleti alapfogalmakat tekintjük át, amik részcsoportokra, elemekre, illetve
csoportok közötti művelettartó leképezésekre vonatkoznak.
Részcsoportok
Mellékosztályok, Lagrange tétele
Normális részcsoportok
Elemek rendje
Ciklikus csoportok
Homomor zmusok
Konjugáltsági osztályok
Részcsoportok
Ha egy G csoportnak egy H részhalmaza maga is csoportot alkot a G-beli művelettel, akkor H egy részcsoport G-ben, és
ezt a kapcsolatot H ≤ G jelöli.
Minden csoportnak részcsoportja saját maga, illetve az {1} halmaz. Ez utóbbi a triviális részcsoport. Egy H részcsoport
G-ben valódi részcsoport, ha H ≠ G (és ez esetben a H< G jelölést is használhatjuk).
Ahhoz, hogy egy H ⊆ G részhalmaz részcsoport legyen, tartalmaznia kell a csoport egységelemét, továbbá mindegyik
elemével együtt annak az inverzét, valamint bármely két elemének a szorzatát is. (Egy alternatív részcsoportteszt: ha H egy
nem üres részhalmaza a G csoportnak, és bármely x, y ∈ H esetén xy–1 is eleme H-nak, akkor H garantáltan egy
részcsoport.) Néhány közismert példa részcsoportokra:
- (ℤ, +)<(ℚ, +)<(ℝ, +) < (ℂ, +)
- ℚx < ℝx < ℂx
- GLn(ℚ) < GLn(ℝ) < GLn(ℂ)
Egy csoportnak bármely eleme generál egy részcsoportot: ha G egy csoport és g ∈ G, akkor a g elem összes hatványából
álló {gn | n ∈ ℤ} halmaz egy részcsoport G-ben. Ezt a g elem által generált ciklikus részcsoportnak nevezzük, jelölése (g).
(Két elem akkor és csak akkor generálja ugyanazt a részcsoportot, ha egymásnak hatványai.) A generálás fogalmát
tetszőleges részhalmazra is kiterjeszthetjük: ha G egy csoport és X ⊆ G, akkor az összes X-et tartalmazó G-beli részcsoport
metszetét nevezzük az X által generált részcsoportnak, amit 〈X〉 jelöl. (Ha X = {g} egyelemű halmaz, akkor könnyen
igazolható, hogy az X-et tartalmazó részcsoportok metszete valóban megegyezik g hatványainak a halmazával.)
Csoportok elemeinek, illetve részhalmazainak a segítségével más módon is de niálhatunk részcsoportokat. Ha G egy
csoport és X ⊆ G, az X halmaz G-beli centralizátora azokból az elemekből áll, amik X-nek minden elemével felcserélhetők:
Az x elem centralizátora CG(x) = {g ∈ G | xg = gx}. A G csoport centruma pedig a G minden elemével felcserélhető
elemek részcsoportja: Z(G) = {g ∈ G | ∀ x ∈ G(xg = gx)}.
Egy G csoport H részcsoportjának az indexe a H szerinti (jobb oldali) mellékosztályok száma, amit | G : H | jelöl.
Abból a tényből, hogy a G csoport H szerinti mellékosztályok diszjunkt uniójaként áll elő, következik Lagrange tétele.
Speciálisan egy véges csoportban minden részcsoport rendje osztja a csoport rendjét.
Példák
1. A ℤ+12 additív csoportban a részcsoportnak három különböző mellékosztálya van:
és , tehát |ℤ+12 : H| = 3. (Mivel a csoport
kommutatív, a bal oldali és a jobb oldali mellékosztályai ugyanazok.)
2. A ℤ+21 multiplikatív csoportban (ami szintén kommutatív), a részcsoportnak négy különböző
mellékosztálya van: , , és
, tehát |ℤ+21 : H | = 4.
Poincaré tétele alapján egy (nem feltétlenül véges) csoport véges sok véges indexű részcsoportjának a metszete is véges
indexű:
Egy további fontos tény, hogy részcsoport részcsoportja esetén az indexek szorzódnak: ha H egy részcsoport a G
csoportban, és K egy részcsoport H-ban, akkor |G : K| = |G : H| · |H : K|.
Normális részcsoportok
Egy G csoport N részcsoportja normális részcsoport (vagy normálosztó), ha bármely g ∈ G elemre gN = Ng. Ezt a
kapcsolatot N ◃ G jelöli.
Tehát egy részcsoport normális, ha a jobb oldali mellékosztályai megegyeznek a bal oldali mellékosztályokkal. Evidens,
hogy kommutatív csoportban minden részcsoport normális, illetve tetszőleges G csoportban saját maga és az {1} triviális
részcsoport mindig normális részcsoportok. Egy csoport egyszerű, ha nincs valódi, nem triviális normális részcsoportja.
Egy G csoport N részcsoportjára az alábbi állítások ekvivalensek:
- Bármely g ∈ G elemre gN = Ng.
- Bármely g ∈ G elemre g–1Ng = N.
- Bármely g ∈ G elemre g–1Ng ⊆ N.
Ebben az esetben (tehát amikor N normálosztó G-ben) az N szerinti mellékosztályok egy kongruenciarelációt
határoznak meg a G csoport elemein. Ezen reláció szerint az x és y elemek pontosan akkor kongruensek (modulo N), ha
ugyanabban az N szerinti mellékosztályban vannak, azaz xN = yN.
Egy G csoport N normális részcsoportja szerinti mellékosztályok az (aN)(bN) = abN szorzási szabállyal csoportot
alkotnak, ez a G/N faktorcsoport.
Elemek rendje
Egy G csoport g elemének a rendje a g különböző hatványainak a száma, amit |g| (vagy o (g)) jelöl.
Mivel g hatványainak a halmaza éppen a 〈g〉 részcsoport, úgy is fogalmazhatunk, hogy a g elem rendje a 〈g〉
részcsoport rendjével egyenlő. Így Lagrange tételének egy speciális esete a következő:
Ha g egy végtelen rendű elem, akkor természetesen bármely nem triviális hatványa szintén végtelen rendű.
Ciklikus csoportok
Tetszőleges pozitív egész n számhoz van n rendű ciklikus csoport, pl. ℤ+n. Ezt a csoportot ugyanis az elem mindig
generálja. Abban az esetben, ha n prímszám, sokkal több is igaz:
Ciklikus csoportok részcsoportjairól a csoportrendtől függően egy teljes listát lehet készíteni. Legyen G = 〈g〉 egy
ciklikus csoport. Ha G véges, akkor minden részcsoportja H = 〈gd〉 alakban adható meg, ahol d a | g | elemrend egy
pozitív osztója. Ekkor a H részcsoport rendje | g | /d. Ha G végtelen, akkor minden részcsoportja H = (gk) alakban adható
meg, ahol k egy nem negatív egész. Ekkor a k = 0 eset kivételével (amikor is H = {1}) H szintén végtelen. Röviden összegezve:
Példa. Mint korábban láttuk, egy 6 rendű ciklikus csoport. A csoportrend osztói: 1, 2, 3 és 6, ennek
megfelelően ebben a ciklikus csoportban négy részcsoport van: {1} rendje 1, rendje 2,
rendje 3 és ℤ×18 = 〈5̄〉 rendje 6. Hasonlóan, minden 6 rendű ciklikus csoportban négy
részcsoport van, amiknek a rendjei 1, 2, 3 és 6.
Ha G = 〈g〉 egy véges ciklikus csoport, természetesen mindegyik eleme generál egy részcsoportot, így bármely k egész
számhoz található olyan d osztója a csoport rendjének, amivel 〈gk〉 = 〈gd〉. Ez a d osztó pedig nem más, mint a
csoportrend és a k kitevő legnagyobb közös osztója:
Homomor zmusok
Egy φ : G → H csoportok közötti leképezés homomor zmus, ha a G csoport bármely két, x és y elemére φ(xy) =
φ(x)φ(y).
Fontos tisztában lennünk azzal, hogy a φ(xy) = φ(x)φ(y) egyenlőség bal oldalán a G-beli művelet, a jobb oldalán pedig a
H-beli művelet elvégzése szerepel. Az alapértelmezés szerint ezeket a műveleteket nem tüntettük fel, de ha mondjuk a G
csoport műveletét *, a H csoport műveletét pedig ⊙ jelöli, akkor egy φ: G → H homomor zmusnak a φ(x * y) = φ(x) ⊙ φ(y)
egyenlőséget kell teljesítenie minden x, y ∈ G elemekre.
Egy φ : G → H homomor zmusra mindig igaz, hogy a G-beli egységelem képe a H-beli egységelem (azaz φ(1) = 1), és
bármely G-beli x elemre φ(x–1) = φ(x)–1. A φ : G → H homomor zmus képe: Im(φ) = {φ(g) |g ∈ G} mindig egy részcsoport H-
ban. A φ: G → H homomor zmus magja: Ker(φ) = {g ∈ G | φ(g) = 1} mindig egy normális részcsoport G-ben. Megfordítva,
minden G-beli N normális részcsoport magja egy alkalmas homomor zmusnak: de niáljuk a G csoportnak a G/N
faktorcsoportba történő kanonikus homomor zmusát úgy, hogy tetszőleges g elem képe legyen a gN mellékosztály. Ez a
leképezés valóban egy homomor zmus, és a magja pontosan az N normálosztó. (A képe pedig az egész G/N.)
Példák
1. Legyen n egy pozitív egész. Ekkor a det: GL(n, ℂ) → ℂx determináns leképezés egy homomor zmus, hiszen
bármely két n × n méretű komplex mátrixra det(AB) = det(A)det(B). Ennek a homomor zmusnak a magja SL(n,
ℂ), az 1 determinánsú komplex mátrixok halmaza, ami tehát így egy normális részcsoport GL(n, ℂ) -ben. (Az SL
betűk az angol special linear kifejezésből erednek.)
2. Ha G = 〈g〉 egy m rendű és H = 〈h〉 egy n rendű ciklikus csoport, a φ(gk) = hk leképezési szabály akkor és csak
akkor ad meg egy jól de niált φ : G → H leképezést, ha n osztója m-nek. (Ugyanis szükséges, hogy gk = gl esetén
mindig hk = hl is teljesüljön.) Ekkor viszont φ egy homomor zmus: bármely k és l egészekre
3. Az abszolút érték függvény egy ℂx → ℝx homomor zmus, hiszen komplex számokra |xy| = |x| · |y| mindig
teljesül. Ennek a homomor zmusnak a képe a pozitív valós számok multiplikatív csoportja, a magja pedig a
komplex egységkör: {x ∈ (: |x| = 1}.
Akárcsak a gyűrűknél, a csoportok esetében is endomor zmusnak nevezünk egy adott G csoporton belüli φ : G → G
homomor zmust, izomor zmusnak nevezünk egy olyan homomor zmust, ami egyben egy bijektív leképezés, és
automor zmusnak nevezünk egy adott csoporton belüli izomor zmust.
Ha a G és H csoportok közt létezik egy izomor zmus, akkor azt mondjuk, hogy G és H izomorf csoportok, és ezt a
kapcsolatot G ≅ H jelöli.
Az izomor a egy ekvivalenciareláció a csoportok halmazán (mivel egy izomor zmusnak az inverze is mindig
izomor zmus, és két izomor zmus kompozíciója is mindig izomor zmus, továbbá bármely csoporton értelmezett
identikus leképezés egy izomor zmus).
Izomorf csoportok közt strukturális szempontból nincs különbség: ha G ≅ H, akkor bármely algebrai tulajdonság, ami
az egyik csoport struktúrájáról elmondható, garantáltan igaz a másikra is.
Itt érdemes megjegyezni, hogy két azonos rendű ciklikus csoport mindig izomorf egymással. (A fenti 2. példában m = n
esetén egy izomor zmust kapunk.)
Általában igaz, hogy ha egy G csoportban N normálosztó és H részcsoport, akkor a H ∩N részcsoport normális H-ban,
illetve a HN= {hn | h ∈ H, n ∈ N} halmaz egy részcsoport G-ben.
Ha N egy normális részcsoport a G csoportban, akkor a G csoport N-et tartalmazó részcsoportjai kölcsönösen és
egyértelműen megfeleltethetők a G/N csoport részcsoportjaival úgy, hogy egy N-et tartalmazó H részcsoportnak a G/N-beli
H/N részcsoport felel meg. Ebben a megfeleltetésben G-beli (N-et tartalmazó) normálosztók G/N-beli normálosztókhoz
kapcsolódnak.
Bármely G csoport automor zmusai szintén csoportot alkotnak (a kompozíció műveletével), amit G
automor zmuscsoportjának nevezünk, és a jelölése Aut(G). Ennek a csoportnak az egységeleme az I : G → G identikus
leképezés. Továbbá minden g ∈ G elem meghatároz egy τg : G → G automor zmust a τg(x) = g–1xg leképezési szabállyal. Egy
ilyen típusú automor zmus neve belső automor zmus, magát a leképezést pedig a g elemmel való konjugálásnak
nevezzük. A belső automor zmusok egy normális részcsoportot alkotnak az Aut(G) automor zmuscsoportban, amit
Inn(G) jelöl.
Konjugáltsági osztályok
Egy G csoport x és y elemei konjugáltak egymással, ha alkalmas g ∈ G elemmel y = g–1xg. Adott G csoporton belüli
konjugáltság egy ekvivalenciareláció a csoport elemei között, egy ehhez tartozó ekvivalenciaosztály neve konjugáltsági
osztály (vagy konjugáltosztály). Ha G egy véges csoport, x ∈ G és Cx az x elem G-beli konjugáltosztálya, akkor fennáll az
alábbi egyenlőség:
Szimmetrikus csoportok
Direkt szorzat
Cauchy és Sylow tételei
Szimmetrikus csoportok
Bármely nem üres T halmaz összes permutációjának a halmaza a kompozíció műveletével csoportot alkot. Ezt a
csoportot a T halmaz szimmetrikus csoportjának nevezzük, általános jelölése ST.
Az ST csoport egységeleme az I : T → T identikus leképezés, amire minden t ∈ T esetén I(t) = t. Továbbá minden ST-beli
permutációnak mint T → T leképezésnek létezik inverze, ami szintén egy permutáció (így eleme ST-nek), valamint két
permutáció kompozíciója ugyancsak egy permutáció.
Ha n egy pozitív egész, az Sn n-edfokú szimmetrikus csoport alatt a T = {1, 2, … …, n} halmaz permutációinak csoportját
értjük. Ennek a csoportnak a rendje n!.
A T = {1, 2, …, n} halmaznak egy f : T → T permutációját jelölhetjük az
mátrixszal vagy ciklusfelbontással. Ez utóbbinak a lényege, hogy egy (a1, a2, …, ak) ciklus arra a p permutációra utal, amivel
p(a1) = a2, p(a2) = a3, …, p(ak) = a1. Természetesen nem minden permutáció egy ciklus, de minden permutáció felírható
diszjunkt ciklusok szorzataként, és ez az előállítás a ciklusok sorrendjétől eltekintve egyértelmű.
A kettő hosszúságú ciklusok neve transzpozíció. Minden permutáció előáll transzpozíciók szorzataként. Jóllehet ez az
előállítás távolról sem egyértelmű, viszont a szorzatban szereplő transzpozíciók számának a paritása már az: egy
permutáció vagy csak páros sok, vagy csak páratlan sok transzpozíciónak lehet a szorzata. Az előbbi esetben azt mondjuk,
hogy a permutáció páros, az utóbbi esetben a permutáció páratlan.
Példa. Az előbbi f = (1, 5) (2, 3, 6) permutáció páratlan, ugyanis előállítható három transzpozíció szorzataként: f = (1, 5)
(2, 6)(2, 3). (Amennyiben a transzpozíciók kompozícióját jobbról balra haladva végezzük el.)
Két páros vagy két páratlan permutáció szorzata páros. Páros és páratlan permutáció szorzata páratlan. Páros
permutáció inverze páros, és páratlan permutáció inverze páratlan. Ezt úgy is összegezhetjük, hogy tetszőleges pozitív
egész n esetén a
leképezés egy csoporthomomor zmus Sn-ből a multiplikatív {1, –1} csoportba. Ennek a leképezésnek a magja, ami a
szimmetrikus csoport páros permutációiból áll, az An n-edfokú alternáló csoport. Ha n ≥ 2, az An csoport rendje n!/2.
Egy permutáció ciklusfelbontásából több, az adott permutációra vonatkozó hasznos információ kiolvasható:
- Egy permutáció akkor és csak akkor páros, ha a ciklusfelbontásában páros sok páros hosszúságú ciklus szerepel.
- Egy f permutáció rendje az f ciklusfelbontásában szereplő ciklusok hosszainak a legkisebb közös többszöröse.
- Két permutáció akkor és csak akkor konjugált az Sn szimmetrikus csoportban, ha a ciklusszerkezetük megegyezik.
Direkt szorzat
Két csoport, A és B direkt szorzatát az A × B Descartes-féle szorzaton úgy de niálhatjuk, hogy a műveletet
koordinátánként végezzük el.
Tehát A × B = {(a, b) | a ∈ A, b ∈ B} és (a1, b1) · (a2, b2) = (a1, a2, b1b2). A direkt szorzat egységeleme (1, 1), és egy (a, b)
elemének az inverze (a, b)–1 = (a–1, b–1). Az A × B csoport akkor és csak akkor kommutatív, ha A is és B is az. A direkt szorzatot
nemcsak két, hanem több csoport esetében is megkonstruálhatjuk: a csoportok alaphalmazának Descartes-féle szorzatán a
csoportműveletet koordinátánként végezzük el. Egy direkt szorzat rendje megegyezik a tényezők rendjeinek a szorzatával,
a direkt szorzat elemeinek a rendjét meg az | (a, b) | = lkkt (|a|, |b|) képlettel kaphatjuk meg. Illetve többtényezős direkt
szorzat esetén is igaz, hogy a direkt szorzat egy elemének a rendje a koordináták rendjeinek a legkisebb közös többszöröse.
Az A × B direkt szorzatban az Ā = {(a, 1) |a ∈ A} halmaz egy A-val izomorf, a halmaz pedig egy B-
vel izomorf normális részcsoportot alkot, amikre igaz, hogy és . Ennek az észrevételnek a
megfordítása a következőképp igaz:
Minden véges kommutatív csoport megkonstruálható ciklikus csoportokból a direkt szorzat segítségével, erről szól a
véges Abel-csoportok alaptétele.
Minden véges kommutatív csoport prímhatvány rendű ciklikus csoportok direkt szorzatával izomorf. Továbbá ez a
felbontás direkt szorzatra a tényezők sorrendjétől eltekintve egyértelmű.
Példa. Összesen hat 200 rendű kommutatív csoport van (izomor a erejéig), és ezek a következők: C8 × C25, C2 × C4 ×
C25, C2 × C2 × C2 × C25, C8 × C5 × C5, C2 × C4 × C5 × C5 és C2 × C2 × C2 × C5 × C5, ahol Ci általában egy i rendű ciklikus
csoportot jelöl.
Az m és n rendű ciklikus csoportok Cm × Cn direkt szorzata akkor és csak akkor izomorf a Cmn ciklikus csoporttal, ha m
és n relatív prímek.
Ha egy p prímszám osztja a G véges csoport rendjét, akkor G-ben van p rendű elem.
Legyen p egy tetszőleges prímszám. Egy G véges csoport P részcsoportja Sylow p-részcsoport G-ben, ha P rendje
megegyezik a legnagyobb, G rendjét osztó p-hatvánnyal. Ezen részcsoportok halmazát Sylp (G) jelöli.
Egy Sylow p-részcsoportnak természetesen minden konjugáltja is Sylow p-részcsoport (hiszen konjugált részcsoportok
rendje megegyezik). Viszont az is igaz, hogy egy adott Sylow p-részcsoportból konjugálással már minden Sylow p-
részcsoport megkapható. Ezt mondja ki Sylow második tétele:
Azaz ha P1 és P2 ugyanazon p prímszámhoz tartozó Sylow részcsoportok G-ben, akkor alkalmas G-beli g elemmel P2 = g–
1P g. Következésképp:
1
Egy P Sylow p-részcsoport akkor és akkor normálosztó a G csoportban, ha az az egyetlen G-beli Sylow p-részcsoport.
Tehát előfordulhat, hogy egy csoportban (adott p prímszám mellett) csak egyetlen Sylow p-részcsoport van. Általában
a Sylow p-részcsoportok lehetséges számáról szól Sylow harmadik tétele:
Egy G véges csoport p prímszámhoz tartozó Sylow részcsoportjainak a száma egyrészt osztja a G rendjét, másrészt
kongruens 1-gyel modulo p.
Példa. Bizonyítjuk, hogy minden 15 rendű csoport ciklikus. Legyen ugyanis G egy tetszőleges 15 rendű csoport, ekkor
Sylow első tétele alapján G tartalmaz egy 3 rendű M és egy 5 rendű N részcsoportot. Továbbá Sylow harmadik tétele
miatt a Sylow 3-részcsoportok száma 15-nek egy olyan osztója, ami kongruens 1-gyel modulo 3, így ez csak 1 lehet.
Hasonlóan, a Sylow 5-részcsoportok száma 15-nek egy olyan osztója, ami kongruens 1-gyel modulo 5, ami megint
csak 1 lehet. Így mindkét Sylow részcsoport, M és N egyaránt normális részcsoport G-ben.
Lagrange tétele alapján M ∩N ≤ M miatt M ∩N rendje osztója 3-nak és M ∩N ≤ N miatt M ∩N rendje osztója 5-nek,
ebből pedig |M ∩N| = 1, azaz |M ∩N| ={1}. Hasonlóan, MN szintén egy részcsoport G-ben, M ≤ MN miatt 3 osztja MN
rendjét, és N ≤ MN miatt 5 osztja MN rendjét, ebből pedig | MN | = 15, azaz MN = G.
Mivel M és N normálosztók G-ben, | M ∩N | ={1} és MN = G, ebből az következik, hogy G ≅ M × N. Továbbá M és N
ciklikus csoportok (mint minden prímrendű csoport), tehát M = 〈m〉 és N = 〈n〉 alkalmas m és n elemekkel,
amikre |m| = 3 és |n| = 5. Ekkor viszont az (m, n) elem rendje az M × N direkt szorzatban 15, ami megegyezik M × N
rendjével, így M × N = 〈(m, n)〉 egy ciklikus csoport. Tehát a vele izomorf G is ciklikus.
Egy R kommutatív egységelemes gyűrűben az M ideál pontosan akkor maximális ideál, ha az R/M faktorgyűrű test.
Az M = {0} választással ez a tétel tehát azt mondja ki, hogy egy R kommutatív egységelemes gyűrű pontosan akkor test,
ha nincs valódi ideálja.
Az egész számok gyűrűjében minden maximális ideál (p) = pℤ = {px|x ∈ ℤ} alakban adható meg valamely p prímszám
mellett. Ekkor a ℤ/(p) faktorgyűrű, ami valójában a modulo p kongruenciaosztályok gyűrűje, egy p elemű test jelölése ℤp.
Legyen p(x) egy racionális együtthatós, ℚ[x]-ben irreducibilis polinom! Ekkor az általa generált ideál egy maximális
ideál ℚ[x]-ben, következésképp a ℚ[x]//(p(x)) faktorgyűrű egy test. Ennél általánosabban is igaz a következő:
Ha R egy főideálgyűrű, és p ∈ R, a (p) ideál szerinti R/(p) faktorgyűrű pontosan akkor test, ha p egy irreducibilis elem
R-ben.
Egy másik ismert konstrukció, amivel (bizonyos esetekben) testeket kaphatunk, gyűrűknek „hányadosokkal való
kibővítése”, azt azonban precízen meg kell fogalmaznunk, hogy mit is értünk ezen. Legyen R egy kommutatív (nem
feltétlenül egységelemes) gyűrű, és jelölje S az R gyűrűnek egy olyan nem üres részhalmazát, ami zárt a szorzásra, nem
tartalmazza a nullát, és nem tartalmaz nullosztót sem. Tekintsük azt a relációt az R × S Descartes-féle szorzaton, ahol (a, x)~
(b, y) akkor és csak akkor, ha ay = bx. Könnyen ellenőrizhető, hogy ez egy ekvivalenciareláció (de ahhoz, hogy ez a reláció
tranzitív legyen, valóban fel kell tenni, hogy az S halmaz ne tartalmazzon nullosztót). Jelölje a/x általában egy (a, x) ∈ R × S
elem ekvivalenciaosztályát! Ezen ekvivalenciaosztályok halmaza egy kommutatív egységelemes gyűrűt alkot a következő
műveletekkel:
Ha R egy integritási tartomány, és S = R– {0}, akkor az S–1R hányadosgyűrű egy test, amit az R hányadostestének
nevezünk.
Ilyen konstrukcióval kaphatjuk meg a racionális számok testét az egész számok gyűrűjéből (ha S az összes nullától
különböző egész szám halmaza), illetve a valós racionális törtfüggvények testét a valós polinomok gyűrűjéből (ha S az
összes nem zéró valós polinom halmaza).
Egy R integritási tartomány hányadosteste a legkisebb R-et tartalmazó test abban az értelemben, hogy ha T egy
tetszőleges R-et tartalmazó test, akkor T-ben biztosan van olyan E résztest, ami szintén tartalmazza R-et, és izomorf az R
hányadostestével.
Legyen T egy test. Ha létezik olyan pozitív egész m szám, hogy m1 = 0 (azaz az m tagú 1 + 1 + … + 1 összeg nullával
egyenlő), akkor a legkisebb ilyen pozitív egész a T test karakterisztikája. Ha nincs ilyen szám, akkor a T
karakterisztikája nulla.
Egy test karakterisztikája mindig vagy nulla, vagy prímszám. Ha T egy test, x ∈ T és m ∈ ℤ, az mx = 0 egyenlőség akkor
és csak akkor áll fenn, ha m többszöröse a karakterisztikának, vagy x = 0.
Elemszámra nézve vannak véges és végtelen testek. Véges testekre a következő módon kaphatunk példákat: ha g(x) egy
n-edfokú irreducibilis polinom a ℤp prímtest felett, akkor a ℤp[x]/(g(x)) faktorgyűrű egy pn elemszámú és p
karakterisztikájú test, ami tartalmaz a ℤp-vel izomorf résztestet. (A konstans polinomok modulo g(x) kongruenciaosztályai
természetes módon egy ℤp-vel izomorf résztestet alkotnak.) Izomor a erejéig ilyen módon az összes véges test előállítható.
Ha T egy véges test, akkor az elemszáma prímhatvány, pontosabban T karakterisztikájának egy hatványa. Továbbá
ekkor bármely T-vel azonos elemszámú test izomorf T-vel.
Mindig igaz, hogy ha egy T test karakterisztikája a p prímszám, akkor T tartalmaz ℤp-vel izomorf résztestet (ami a 0, 1,
1 + 1, 1 + 1 + 1, … elemekből áll). Ha pedig egy T test karakterisztikája nulla, akkor T tartalmaz ℚ-val izomorf résztestet.
Testbővítések
Algebrai elemek
Egyszerű bővítések
Algebrai bővítések
Galois-elmélet
Testbővítések
Mint ahogy általában az algebrai struktúrák elméletében fontos szerepet tölt be a struktúrák és részstruktúráik közötti
kapcsolat vizsgálata, ugyanúgy a testelméletnek is egy igen fontos része a testbővítések tanulmányozása, illetve azok
osztályozása különböző szempontok szerint. Az első fontos észrevétel, hogy egy test mindig vektortérként is tekinthető
bármelyik részteste felett, ugyanis ha T | F egy tetszőleges testbővítés, akkor a T-ben de niált összeadással és T eleméinek
az F elemeivel való szorzásával, mint skalárszorzással teljesülnek a vektortér-axiómák. Például a komplex számok ℂ teste
egy kétdimenziós vektortér a valós ℝ test felett (egy lehetséges bázis az {1, i} rendszer), és a valós test egy végtelen
dimenziós vektortér a racionális számok ℚ teste felett. Egy másik fontos tény, hogy bármely T | F testbővítés esetén a T és
az F testek karakterisztikája megegyezik.
A T | F testbővítés foka – amit [T : F] jelöl – a T-nek mint F feletti vektortérnek a dimenziója. Véges bővítésnek
nevezzük azt a testbővítést, aminek a foka véges.
A T|F testbővítésben E egy közbülső test, ha E egy F-et tartalmazó részteste T-nek, azaz F ≤ E ≤ T. Ilyenkor az egymás
utáni bővítések fokai szorzódnak:
A tételbeli egyenlőség úgy értendő, hogy ha a bal oldali szorzatnak valamelyik tényezője végtelen, akkor T | F is egy
végtelen bővítés.
Algebrai elemek
A T testnek egy t eleme algebrai egy F résztest felett, ha a t hatványai lineárisan összefüggő rendszert alkotnak a T-
ben, mint F feletti vektortérben. Ellenkező esetben t egy transzcendens elem F felett.
Tehát ha a T | F bővítésben t algebrai F felett, akkor alkalmas pozitív egész n szám, és F-beli (nem mind nulla) f0, f1, …,
fn elemek mellett f0 + f1t + … + fntn = 0. Azt is mondhatjuk, hogy t pontosan akkor algebrai elem az F test felett, ha gyöke egy
F[x]-beli nem zéró polinomnak. Egy testnek minden eleme algebrai saját maga felett (hiszen t ∈ T gyöke az x – t ∈ T[x]
polinomnak).
Legyen T | F egy testbővítés és t ∈ T egy algebrai elem F felett! Ekkor pontosan egy olyan normált irreducibilis p(x)
polinom van F[x]-ben, amire p(t) = 0. Továbbá bármely g(x) ∈ F[x] polinomra g(t) = 0 akkor és csak akkor teljesül, ha
p(x) osztója g(x)-nek.
A tételben szereplő p(x) polinomot a t elem minimálpolinomjának hívjuk, p(x) foka pedig a t elem foka.
Példák
1. A ℂ | ℚ bővítésben egy algebrai elem. Egyszerű számolással:
Egyszerű bővítések
Ha T | F egy testbővítés és u ∈ T, az u által generált F(u) résztest a T test összes, F-et és u-t tartalmazó résztestének a
metszete. Általánosabban, ha S ⊆ T, akkor az ezen részhalmaz által generált F(S) résztest a T összes, az F-et és az S
részhalmazt tartalmazó résztestének a metszete. Ha F(u) = T (valamilyen u ∈ T mellett), akkor T|F egy egyszerű
bővítés.
Amennyiben u algebrai F felett, és a foka n, akkor az 1, u, u2, …, un–1 elemek egy bázist alkotnak F(u)-ban, mint F feletti
vektortérben, tehát az F(u) résztest minden eleme egyértelműen áll elő az u elemnek egy legfeljebb n – 1 fokú
polinomjaként. Ekkor F(u) izomorf az F[x]/(p(x)) faktorgyűrűvel, ahol p(x) az u minimálpolinomja. Ha azonban u
transzcendens F felett, akkor F(u) minden eleme g(u)/h(u) alakban adható meg alkalmas g(x), h(x) ∈ F[x] polinomokkal. (Itt
egyértelműségről nyilván csak akkor beszélhetünk, ha kikötjük, hogy g(x) és h(x) egymáshoz relatív prím polinomok,
továbbá hogy h(x) normált.) Ekkor F(u) izomorf az F feletti racionális törtfüggvények F(x) testével. Egy egyszerű bővítés
tehát attól függően véges vagy végtelen, hogy algebrai vagy transzcendens elem generálja.
Algebrai bővítésnek nevezünk egy olyan T | F testbővítést, ahol a T testnek minden eleme algebrai az F felett. Egy
testbővítés transzcendens, ha nem algebrai. Tiszta transzcendens bővítésnek nevezünk egy olyan T | F testbővítést,
ahol T = F(S) alkalmas S ⊆ T részhalmazzal úgy, hogy mindegyik s ∈ S elem transzcendens az F(S – {s}) test felett.
Ilyenkor azt mondjuk, hogy S egy algebrailag független halmaz F felett.
Egyszerű, de fontos észrevétel, hogy minden véges testbővítés algebrai, így például a ℂ | ℝ bővítés is. (Minden komplex
szám gyöke egy irreducibilis valós polinomnak.) Viszont léteznek végtelen algebrai bővítések is: például a racionális test
felett algebrai komplex számok A halmaza egy testet alkot, amivel A | ℚ egy végtelen algebrai bővítés.
Algebrai elemek által generált bővítés algebrai: ha T = F(S), és S minden eleme algebrai F felett, akkor ugyanez T
minden eleméről is elmondható.
Láttuk tehát, hogy ha adott egy T | F testbővítés, akkor a T test elemeit osztályozni lehet aszerint, hogy algebraiak vagy
transzcendensek F felett, továbbá az algebrai elemeket is osztályozhatjuk a fokszámaik, illetve a minimálpolinomjaik
szerint.
Fordított megközelítéssel, kiindulhatunk abból, hogy adott egy F test és egy g(x) ∈ F[x] nem konstans polinom, és
feltehetjük a kérdést, hogy van-e olyan K | F testbővítés, ahol egy alkalmas k ∈ K elemre g(k) = 0. Illetve van-e olyan K | F
testbővítés, ahol a g(x) polinom K felett lineáris tényezők szorzatára bomlik? A válasz igenlő.
Legyen g(x) egy n-edfokú polinom az F test felett, n pozitív egész. Ekkor létezik olyan K|F testbővítés, hogy g(x) = c(x –
k1)(x – k2) … (x – kn) alkalmas K-beli c, k1, …, kn elemekkel és K = F(k1, …, kn).
A tételben szereplő K test izomor a erejéig egyértelmű, és ezt a g(x) polinom F feletti felbontási testének nevezzük.
Egy algebrai K | F testbővítés normális, ha minden olyan F feletti irreducibilis polinom, aminek K-ban gyöke van,
lineáris tényezők szorzatára bomlik fel K felett.
A feltétel, ami ebben a de nícióban szerepel, nem kimondottan praktikus arra, hogy egy adott testbővítést
leteszteljünk a normális tulajdonság szempontjából. Viszont igaz a következő:
Egy véges K | F bővítés akkor és csak akkor normális, ha a K test felbontási teste F felett egy alkalmas g(x) ∈ F[x]
polinomnak.
A g(x) ∈ F[x] polinom szeparábilis, ha az F feletti felbontási testében g(x)-nek nincs többszörös gyöke. Ha K | F egy
testbővítés, a k ∈ K elem szeparábilis F felett, ha egyrészt algebrai, másrészt az F feletti minimálpolinomja
szeparábilis. A K | F testbővítés szeparábilis, ha K minden eleme szeparábilis F felett. Egy véges, normális és
szeparábilis bővítés neve Galois-bővítés.
A de nícióból következően minden szeparábilis bővítés algebrai. A megfordítás nulla karakterisztika esetén igaz:
mivel ekkor minden irreducibilis polinom szeparábilis, így minden algebrai elem automatikusan szeparábilis. Prím
karakterisztika esetén viszont előfordulhat, hogy egy irreducibilis polinom nem szeparábilis (pl. az yp – x polinom a ℤp(x)
test feletti ℤp(x) [y] polinomgyűrűben), így az is előfordulhat, hogy egy algebrai bővítés nem szeparábilis (pl. ℤp(x)[y]/(yp –
x) nem szeparábilis ℤp(x) felett). Véges testek esetén azonban megint csak igaz, hogy minden irreducibilis polinom
szeparábilis, így egy véges test algebrai bővítése is garantáltan szeparábilis bővítés.
Szeparábilis elemek által generált bővítés szeparábilis: ha K = F(S) és S minden eleme szeparábilis F felett, akkor
ugyanez K minden eleméről is elmondható.
Egy véges normális K | F bővítés akkor és csak akkor szeparábilis, ha K egy alkalmas F[x]-beli szeparábilis polinomnak
a felbontási teste.
Példák
1. A bővítés véges, normális és szeparábilis, ugyanis a ℚ[x]-ben irreducibilis x2 – 5
polinomnak a felbontási teste.
2. bővítés véges, szeparábilis, de nem normális. Szeparábilis, mert egy szeparábilis elem generálja, de
nem normális, ugyanis a ℚ[x]-ben irreducibilis x3 – 5 polinomnak van gyöke -ben, de nem bomlik fel
lineáris tényezők szorzatára felett. (Hiszen a polinom másik két gyöke nem valós, míg .)
3. Haaz x3 –5 ∈ ℚ[x] polinom nem valós komplex gyökeit v-vel és w-vel jelöljük, akkor a bővítés véges,
normális és szeparábilis: a ℚ[x]-ben irreducibilis x3 – 5 polinomnak a felbontási teste.
Ennek a bővítésnek a foka 6, ugyanis harmadfokú ℚ felett és v másodfokú lett, így
Galois-elmélet
A testek Galois-elméletének alaptémáját a testautomor zmusok szolgáltatják. Egy T test automor zmusai mindig
csoportot alkotnak (a kompozíció műveletével): ez az Aut(T) automor zmuscsoport. Továbbá ha T egy tetszőleges test, és σ
: T → T egy automor zmusa T-nek, tekinthetjük azon T-beli t elemek halmazát, amiket a σ automor zmus helybenhagy,
azaz amikre σ(t) = t. Ez a halmaz mindig egy résztest T-ben. Fordítva, ha T | F egy adott testbővítés, akkor tekinthetjük
azokat a σ : T → T automor zmusokat, amik az F résztest minden elemét helybenhagyják, és ily módon az Aut(T)
automor zmuscsoportnak mindig egy részcsoportját kapjuk.
Legyen K | F egy testbővítés! A σ : K → K automor zmus egy F-automor zmus, ha minden f ∈ F elemre σ(f) = f. A K test
F-automor zmusai csoportot alkotnak (a kompozíció művelettel), amit a K | F bővítés Galois-csoportjának nevezünk.
Jelölése: Gal(K | F).
Az egyik legismertebb példa nem triviális testautomor zmusra a komplex számokon értelmezett konjugálás. Ez az
egyetlen nem triviális automor zmusa a ℂ | ℝ bővítésnek, így Gal(ℂ | ℝ) egy másodrendű ciklikus csoport. Nem véletlen,
hogy a Gal(ℂ | ℝ) csoport rendje megegyezik a (ℂ | ℝ bővítés fokával, ugyanis ez mindig igaz egy Galois-bővítésre.
Arról, hogy egy K | F bővítés Galois-csoportja miként permutálja a K test elemeit, a következőt érdemes tudni.
Legyen K | F egy véges szeparábilis bővítés! A K-beli u és v elemekhez akkor és csak akkor létezik olyan σ ∈ Gal(K | F),
amivel σ(u) = v, ha u-nak és v-nek ugyanaz a minimálpolinomja.
Legyen K | F egy tetszőleges testbővítés, és G = Gal(K | F) a Galois-csoportja! Ekkor bármely F-et tartalmazó E ≤ K
résztesthez természetes módon hozzárendelhetjük a G csoport egy részcsoportját és viszont, a G csoport bármely H
részcsoportjához természetes módon hozzárendelhetjük a K-nak egy F-et tartalmazó résztestét.
Ha ugyanis E egy közbülső test F és K között, a Gal(K | F) Galois-csoport egy részcsoportja G-nek. Fordítva, ha H egy
részcsoport G-ben (tehát H is a K test bizonyos automor zmusainak egy csoportja), akkor K azon elemei, amiket minden H-
beli automor zmus helybenhagy, egy F-et tartalmazó résztestet alkotnak. Jelöljük ezt a résztestet KH-val! Általában
előfordulhat, hogy két különböző közbülső testhez a G csoportnak ugyanaz a részcsoportja tartozik, és nincs garantálva,
hogy a K testnek minden F-et tartalmazó részteste egy alkalmas G-beli részcsoporthoz tartozó xált test. Viszont Galois-
bővítések esetén a fent de niált hozzárendelések egy kölcsönösen egyértelmű megfeleltetést szolgáltatnak G részcsoportjai
és a K test F-et tartalmazó résztestei között.
A Galois-elmélet főtétele:
Legyen K | F egy Galois-bővítés! Ekkor az E → Gal(K | E) hozzárendelés egy kölcsönösen egyértelmű megfeleltetés a K |
F bővítés közbülső testei és a Gal(K | F) csoport részcsoportjai között. Továbbá minden E közbülső testre
1. A Gal(K | E) csoporthoz tartozó xált test E.
2. [K : E] = | Gal(K | E) | és [E : F] = | Gal(K | F) : Gal(K | E).
3. Az E | F bővítés akkor és csak akkor normális, ha Gal(K | E) egy normális részcsoport a Gal(K | F) csoportban, és
ebben az esetben
Példa. Jelöljük az x3 – 5 ∈ ℚ[x] polinom nem valós komplex gyökeit v-vel és w-vel, továbbá legyen ,
tehát ϵ egy komplex harmadik egységgyök, amivel feltehető, hogy és . Mint már láttuk
korábban, az x3 – 5 polinom felbontási teste és a bővítés egy hatodfokú Galois-
bővítés. Tehát a bővítés G Galois-csoportjának a rendje 6. Másrészt G permutálja a halmazt, mint az x3
– 5 polinom gyökeinek a halmazát. Mivel ennek a halmaznak összesen 6 permutációja van, következik, hogy G
izomorf a halmazon ható S3 szimmetrikus csoporttal. Ebben a csoportban van három 2 rendű
részcsoport, amik az identitáson kívül a , illetve a transzpozíciókat tartalmazzák. Ezen
részcsoportok xált testei rendre a , ℚ(W) és ℚ(v) közbülső testek. Továbbá van G-ben egy 3 rendű
normálosztó: , ez pedig a normális, harmadrendű bővítés Galois-
csoportja. Az olvasóra bízzuk annak az átgondolását, hogy ℚ(ϵ) valóban egy közbülső teste a
bővítésnek, továbbá ℚ(ϵ) az x2 + x + 1 polinom felbontási teste, így ℚ(ϵ) | ℚ egy normális bővítés.
A polinomegyenlőségek gyökjelekkel való megoldhatósága szoros összefüggésben áll a testbővítésekkel, illetve azok
Galois-csoportjaival. Ahhoz, hogy ezt az összefüggést megfogalmazzuk, szükségünk van a következő csoportelméleti
de nícióra:
Egy G csoport feloldható, ha van a részcsoportjainak egy olyan G = G0 ≥ G1 ≥ … ≥ Gn = {1} lánca (valamilyen pozitív egész
n szám mellett), ahol minden 1 ≤ i ≤ n egészre Gi normális részcsoport Gi-1-ben, és a Gi–1/Gi faktorcsoport kommutatív.
Legyen F egy tetszőleges zéró karakterisztikájú test, p (x) ∈ F[x], és legyen K a p(x) polinom F feletti felbontási teste. A
p(x) = 0 egyenlőség K-beli megoldásai akkor és csak akkor fejezhetők ki az F-beli elemek, az alapműveletek és
gyökvonások segítségével, ha a K | F bővítés Galois-csoportja feloldható.
Az a tény, hogy az ötödfokú polinomiális egyenletekre nincs megoldóképlet, olyan racionális együtthatós ötödfokú
polinomok létezésével magyarázható, amiknek a Galois-csoportja (pontosabban a felbontási testüknek a racionális test
feletti Galois-csoportja) izomorf az S5 szimmetrikus csoporttal, és ez a csoport nem feloldható. (Egyetlen nem triviális
valódi normálosztója van, az A5 alternáló csoport, A5 pedig egy nem kommutatív egyszerű csoport.)
12.7. Modulusok
A modulusok a vektorterek általánosításai abban az értelemben, hogy a skalárok nem feltétlenül valós vagy komplex
számok, illetve egy adott test elemei, hanem annál általánosabban, egy tetszőleges rögzített gyűrű elemei lehetnek.
Bármely R gyűrűhöz de niálhatjuk az R feletti modulusokat:
Egy (M, +) additívan írt kommutatív csoport egy bal oldali R-modulus, ha bármely r ∈ R és m ∈ M elemekre
értelmezve van egy rm M-beli „szorzat”, amire az alábbi tulajdonságok teljesülnek:
- Tetszőleges r ∈ R és m1, m2 ∈ M elemekre r(m1 + m2) = rm1 + rm2.
- Tetszőleges r1, r2 ∈ R és m ∈ M elemekre (r1 + r2)m = r1m + r2m.
- Tetszőleges r1, r2 ∈ R és m ∈ M elemekre (r1r2)m = r1(r2m).
- Ha R egységelemes, akkor bármely m ∈ M elemre 1m = m.
A jobb oldali R-modulusok hasonlóan de niálhatók, a különbség mindössze annyi, hogy ott a modulus elemeit jobbról
„szorozhatjuk” a gyűrű elemeivel. Az axiómákból levezethetők a következő alaptulajdonságok:
- Bármely m ∈ M elemre 0m = 0, azaz a gyűrű nullelemével szorozva a modulus nullelemét kapjuk.
- Bármely r ∈ R elemre r0 = 0.
- Bármely r ∈ R és m ∈ M elemekre (–r)m = r(–m) = –(rm), és ezt az elemet így nyugodtan jelölhetjük –rm-mel.
Tetszőleges R gyűrűnek egy I bal oldali ideálja egyben egy bal oldali R-modulus is (a gyűrűbeli szorzással), speciálisan
{0} és R is bal oldali modulusok. Néhány további közismert példa:
- Minden additívan írt Abel-csoport egy (kétoldali) ℤ-modulus, ahol a pozitív számokkal való szorzás az nx = x + x + … + x, a
negatív számokkal való szorzás a (–n)x = (–x) + (–x) + … + (–x), a nullával való szorzás pedig a 0x = 0 képletekkel adott. (A fenti
összegek természetesen n-tényezős összegek.)
- Ha T egy test (például a komplex, a valós vagy a racionális számok teste), akkor a T-modulusok éppen a T feletti vektorterek.
- Tetszőleges n pozitív egész mellett az n hosszúságú valós oszlopvektorok ℝn vektortere egyben egy bal oldali modulus az
Mn(ℝ) mátrixgyűrűre nézve, illetve az n hosszúságú valós sorvektorok tere egyben egy jobb oldali modulus ugyancsak az
Mn(ℝ) mátrixgyűrűre nézve.
- Egy tetszőleges T test feletti V vektortér tekinthető a T[x] polinomgyűrű feletti modulusnak, amennyiben rögzítünk egy A :
V → V lineáris transzformációt, és a gyűrűbeli elemekkel való szorzást az f(x)v = f(A)v képlettel értelmezzük. Azaz egy f
polinom és v vektor „szorzata” a v vektor f(A) lineáris transzformációnál vett képe.
A többi algebrai struktúrához hasonlóan de niálhatjuk a részmodulus, faktormodulus, illetve a homomor zmusok
fogalmát.
Részmodulusok
Homomor zmusok
Modulusok direkt összege
Részmodulusok
Ha az R gyűrű feletti M modulusnak egy N részhalmaza maga is modulust alkot ugyanazon gyűrű felett, akkor N egy
részmodulus M-ben, és ezt a kapcsolatot N ≤ M jelöli.
Minden modulusnak részmodulusa saját maga, illetve a {0} halmaz. Egy modulus egyszerű, ha ezeken kívül más
részmodulusa nincs. Egy N részmodulus M-ben valódi részmodulus, ha N ≠ M (és ez esetben az N < M jelölést is
használhatjuk). Ahhoz, hogy egy N ⊆ M részhalmaz részmodulus legyen, tartalmaznia kell a modulus nullelemét, továbbá
mindegyik elemével együtt annak a negatívját, bármely két elemének az összegét, továbbá bármely elemének az összes
„skalárszorosát” is, azaz ha n ∈ N és r ∈ R, akkor szükségszerűen rn ∈ N. Röviden fogalmazva, részmodulus egy olyan
(additív) részcsoport, ami zárt a gyűrű elemeivel való szorzásra.
Mivel kommutatív csoportban minden részcsoport normális, azaz minden részcsoport szerint lehet faktorizálni, ezért
tetszőleges R gyűrű feletti (bal oldali) M modulus és annak egy N részmodulusa esetén is beszélhetünk az M/N
faktorcsoportról, ami nem más, mint az m + N = {m + n |n ∈ N} mellékosztályok additív csoportja. Ekkor ez a csoport is
tekinthető egyben egy R-modulusnak, ahol a gyűrűelemekkel vett szorzást értelemszerűen az r(m + N) = rm + N képlet adja
meg. (És ez a művelet pontosan azért lesz jól de niált, mert N nem pusztán egy részcsoport, hanem részmodulus is:
amennyiben m1 + N = m2 + N, úgy m1 – m2 ∈ N, és így r(m1 – m2) ∈ N, amiből már következik, hogy rm1 + N = rm2 + N.)
Egy R gyűrű feletti M modulus tetszőleges x elemére az Rx = {rx | r ∈ R} halmaz egy részmodulusa M-nek.
Általánosabban, a modulus tetszőleges x1, x2, …, xk elemei mellett az
halmaz egy részmodulus M-ben, méghozzá a legkisebb olyan részmodulus, ami tartalmazza az xi elemeket. Ezért ezt
nevezzük az x1, x2, …, xk elemek által generált részmodulusnak.
Az R gyűrű feletti M modulus végesen generált, ha alkalmas k pozitív egész és M-beli x1, x2, …, xk elemek mellett M =
Rx1 + Rx2 + … + Rxk. Egy M modulus ciklikus, ha egy elem generálja.
Például ha I egy ideál az R egységelemes gyűrűben, akkor egy részmodulus is R-ben, mint saját maga feletti
modulusban, és R/I egy ciklikus R feletti modulus, amit az 1 + I mellékosztály generál. Ennek az állításnak a megfordítottja
kommutatív gyűrűkre igaz: ha R egy kommutatív gyűrű, és M egy ciklikus R-modulus, akkor akkor alkalmas I ◃ R ideállal
M ≅ R/I.
Homomor zmusok
Ha R egy gyűrű, M és K pedig tetszőleges R-modulusok, akkor egy φ : M → K leképezés R-homomor zmus, ha bármely
r ∈ R, és m, n ∈ M elemekre φ(m + n) = φ(m) + φ(n) és φ(rm) = rφ(m).
Egy φ : M → K R-homomor zmusra mindig igaz, hogy egyben egy csoporthomomor zmus is az M és K, mint additív
csoportok közt, így az M-beli nullelem képe a K-beli nullelem (azaz φ(0) = 0), és bármely M-beli m elemre φ(–m) = –φ(m). A
φ : M → K homomor zmus képe: Im(φ) = {φ(m) |m ∈ M} mindig egy részmodulus K-ban. A φ : M → K homomor zmus
magja: Ker(φ) = {m ∈ M | φ(m) = 0} mindig egy részmodulus M-ben. Megfordítva, minden M-beli N részmodulus magja egy
alkalmas homomor zmusnak: de niáljuk az M modulusnak az M/N faktormodulusra való kanonikus homomor zmusát
úgy, hogy tetszőleges m elem képe legyen az m + N mellékosztály. Ez a leképezés valóban egy homomor zmus, és a magja
pontosan az N részmodulus. (A képe pedig az egész M/N.)
Ahogyan más algebrai struktúráknál, itt is de niálhatjuk az endomor zmus (adott moduluson belüli
homomor zmus), az izomor zmus (bijektív homomor zmus), illetve az automor zmus (adott moduluson belüli
izomor zmus) fogalmát, és két (M és N) modulust izomorfnak nevezünk (jelben M ≅ N), ha létezik köztük egy
izomor zmus. Adott R gyűrű mellett az izomor zmus egy ekvivalenciareláció a bal oldali (illetve a jobb oldali) R-
modulusok osztályán, és modulusokra is kimondhatók a gyűrűkre, illetve csoportokra már megismert
izomor zmustételek megfelelői:
Egy adott R gyűrű feletti két modulus, M és N direkt összegét az M × N Descartes-féle szorzaton úgy de niálhatjuk,
hogy a műveleteket koordinátánként végezzük el. A direkt összeg jelölése: M ⊕ N.
Tehát M ⊕ N = {(m, n) | m ∈ M, n ∈ N}, {m1, n1) + (m2, n2) = (m1 + m2, n1 + n2), és r(m, n) = (rm, rn). A direkt összeget
nemcsak két, hanem több modulus esetében is megkonstruálhatjuk: a modulusok alaphalmazának Descartes-féle
szorzatán a műveleteket koordinátánként végezzük el. Az M ⊕ N direkt összegben az halmaz egy
M-mel izomorf, az halmaz pedig egy N-nel izomorf részmodulust alkot, amikre igaz, hogy
és . Ennek az észrevételnek a megfordítása a következőképp igaz:
Ha a K modulusban M és N olyan részmodulusok, amikre M ∩N= {0} és M+N = K, akkor K izomorf az M ⊕ N direkt
összeggel.
A véges Abel-csoportok alaptételének egyfajta általánosítása a következő, modulusokról szóló tétel (mivelhogy az Abel-
csoportok is modulusok: a (ℤ, +, ·) gyűrű felett):
Egy főideálgyűrű feletti végesen generált modulus mindig izomorf véges sok ciklikus modulus direkt összegével.
Hálónak nevezünk egy H halmazt a rajta értelmezett „metszet” (˄) és „unió” (˅) műveletekkel, ha a következő axiómák
teljesülnek:
1. Tetszőleges x ∈ H elemre x ˄ x = x és x ˅ x = x.
2. Tetszőleges x, y ∈ H elemekre x ˄ y = y ˄ x és x ˅ y = y ˅ x.
3. Tetszőleges x, y, z ∈ H elemekre (x ˄ y) ˄ z = x ˄ (y ˄ z) és (x ˅ y) ˅ z = x ˅ (y ˅ z).
4. Tetszőleges x, y ∈ H elemekre x ˄ (x ˅ y) = x = x ˅ (x ˄ y).
Más megközelítésben egy háló olyan részben rendezett halmaz, ahol bármely két elemnek van legnagyobb alsó korlátja
és legkisebb felső korlátja.
Ha (H, ≤) egy részben rendezett halmaz, ahol bármely x és y elempárnak van legnagyobb alsó korlátja (lak(x, y)) és
legkisebb felső korlátja (lfk(x, y)), akkor az x ˄ y = lak(x, y) és x ˅ y = lfk(x, y) műveletekkel (H, ˄, ˅) egy háló.
Megfordítva, ha (H, ˄, ˅) egy háló, akkor az a ≤ b ↔ a ˄ b = a relációval (H, ≤) egy részben rendezett halmaz, ahol
bármely x és y elemek legnagyobb alsó korlátja x ˄ y és legkisebb felső korlátja x ˅ y.
Az axiómákból látszik, hogy a két művelet szerepe felcserélhető, azaz ha (H, ˄, ˅) egy háló, akkor (H, ˄, ˅) is egy háló: ez
az eredeti háló duálisa. Néhány ismert példa hálókra, illetve hálótípusokra:
- A pozitív egész számok halmaza az oszthatósági részben rendezéssel, ekkor a ˄ b a két szám legnagyobb közös osztója, és a ˅
b pedig a két szám legkisebb közös többszöröse.
- Egy halmaz részhalmazainak a halmaza a tartalmazási részben rendezéssel. Ekkor X ˄ Y a két részhalmaz metszete, és X ˅ Y
a két részhalmaz uniója.
- Egy csoport részcsoportjainak a halmaza a tartalmazási részben rendezéssel. Ekkor H ˄ K a két részcsoport metszete, és H ˄
〈 〉
K = H, K a két részcsoport által generált részcsoport.
- Egy gyűrű ideáljainak a halmaza szintén a tartalmazási részben rendezéssel. Ekkor I ˄ J a két ideál metszete, és I ˄J = I + J a
két ideál összege.
- Egy modulus részmodulusainak a halmaza a tartalmazási részben rendezéssel. Ekkor M ˄ N a két részmodulus metszete, és
M ˄ N = M + N a két részmodulus összege.
Ha a H hálónak egy L részhalmaza maga is hálót alkot a H-beli műveletekkel, akkor L egy részháló H-ban.
Minden hálónak részhálója saját maga, illetve az egyelemű részhalmazai, általában pedig egy L ⊆ H részhalmaz
pontosan akkor alkot részhálót, ha zárt a két műveletre nézve, azaz bármely x, y ∈ L esetén x ˄ y ∈ L és x ˅ y ∈ L. Például
egy csoport részcsoporthálójában részhálót alkot a normálosztók halmaza, hiszen két normálosztónak a metszete és a
generátuma is mindig normálosztó.
Ha H és L tetszőleges hálók, a φ : H → L leképezés egy hálóhomomor zmus, ha bármely H-beli x és y elemekre φ(x ˄ y)
= φ(x) ˄ φ(y) és φ(x ˅ y) = φ(x) ˅ φ(y).
Két háló izomorf (jelben H ≅ L), ha létezik közöttük egy izomor zmus (azaz egy bijektív homomor zmus).
A disztributív tulajdonságból következik a moduláris tulajdonság, így minden disztributív háló egyben moduláris is.
Modulusok részmodulushálói, illetve csoportok normálosztóhálói mindig modulárisak, halmazok részhalmazhálói
disztributívak, és természetesen egy moduláris háló minden részhálója is moduláris, illetve egy disztributív háló minden
részhálója is disztributív. A disztributív tulajdonsághoz tulajdonképpen elég a két egyenlőség közül csak az egyiket előírni,
ugyanis e két szabály közül bármelyik levezethető a másikból. (Vigyázat: nem a két egyenlőség, hanem a két szabály
vezethető le egymásból, tehát ha minden x, y, z elemhármasra x ˅ (y ˄z) = (x ˅ y) ˄ (x ˅ z), akkor az is kimondható, hogy
minden x, y, z elemhármasra x ⌃ (y ˅ z) = (x ˄ y) ˅ (x ˄ z), és ez fordítva is igaz.) Disztributív hálókból csak a már említett
példák léteznek, ez Stone reprezentációs tétele.
Minden disztributív háló izomorf egy alkalmas halmaz részhalmazhálójának valamely részhálójával.
Egy H háló egységelemes, ha van olyan 1 ∈ H elem, amivel bármely h ∈ H elemre 1 ˄h = h. Illetve a háló zéruselemes,
ha van olyan 0 ∈ H elem, amivel bármely h ∈ H elemre 0 ˅ h = h.
Ha egy hálóban van egységelem, akkor az egyértelmű, továbbá bármely h ∈ H elemre 1 h = 1. És ha egy hálóban van
zéruselem, akkor az is egyértelmű, továbbá bármely h ∈ H elemre 0 ˄ h = 0. A részhalmazhálók, részcsoporthálók és a
részmodulushálók egység- és zéruselemesek, ahol az egységelem maga az egész halmaz, illetve csoport, vagy modulus, a
zéruselem pedig az üres halmaz, illetve csoportoknál az {1} részcsoport és modulusoknál a {0} részmodulus.
Komplementumos hálónak nevezünk egy egységelemes és zéruselemes hálót, ha bármely x eleméhez található olyan y
elem, amivel x ˄ y = 0 és x ˅ y = 1. Ekkor x és y komplementumai egymásnak.
Az elnevezés George Boole (1815–1864) angol matematikusra utal, aki először használta logikai formalizációkhoz az
ilyen típusú hálókat. A Boole-algebrákat szokás Boole-hálóknak is nevezni. Boole-algebrákban a komplementum fogaimát
egyváltozós műveletként is értelmezhetjük, és ez teljesen jogos, hiszen a de nícióból már következik, hogy egy Boole-
algebrában minden elemnek pontosan egy komplementuma van. Egy x elem komplementumát x′ jelöli.
Boole-algebrákban érvényes a következő egyszerűsítési szabály: ha az x, y, z elemekre x ˄ y = z ˄z és x ˅ y = x ˅ z, akkor y
= z. Továbbá érvényesek a De Morgan-szabályok is: tetszőleges x és y elemekre (x ˄ y)′ = x′ ˅ y′ és (x ˄ y)′ = x′ ˄ y′.
Minden véges Boole-algebra izomorf egy alkalmas véges halmaz részhalmazhálójával. Egy végtelen Boole-algebráról
annyi mondható el, hogy egy alkalmas halmaz részhalmazhálójának valamely komplementumos részhálójával
izomorf.
Minden Boole-gyűrű kommutatív, továbbá az is igaz, hogy egy Boole-gyűrű bármely x elemére x + x = 0. A Boole-
algebrák és a Boole-gyűrűk kölcsönösen és egyértelműen megfeleltethetők egymásnak.
Legyen (B, ˄ ˅) egy tetszőleges Boole-algebra! Ekkor az a + b = (a ˄ b′) ˅ (a′ ˄ b) és az a · b = a ˄ b műveletekkel (B, +, ·) egy
Boole-gyűrű. Megfordítva, ha (B, +, ·) egy Boole-gyűrű, akkor az a ˄ b = a · b és a ⌄ b = a + b + a · b műveletekkel (B, ˄, ˅)
egy Boole-algebra.
13. Számelmélet
13.1. Bevezetés, oszthatóság
13.2. Számelméleti függvények
13.3. Kongruenciák
13.4. A kongruenciaosztályok algebrája
13.5. Kvadratikus maradékok
13.6. Prímszámok
13.7. Diofantikus egyenletek
Az a (nullától különböző) egész szám osztója a b egész számnak, ha alkalmas x egész számmal ax = b. Jelölésben: a | b.
Ilyenkor azt is mondjuk, hogy b többszöröse a-nak, illetve b osztható a-val. Néhány alapvető tény:
- Minden számnak osztója az 1, de az 1 osztói csak az 1 és a –1.
- Ha a | b és b | c, akkor a | c.
- Ha a | b és a | c, akkor tetszőleges m és n egész számok mellett a | mb + nc.
- Ha a | b és b | a, akkor a = b vagy a = –b.
Az a és b egész számok legnagyobb közös osztója az a legnagyobb olyan d pozitív egész, amire d | a és d | b. A legkisebb
közös többszörösük pedig az a legkisebb olyan m pozitív egész, amire a | m és b | m.
Ha az a és b egészek közül legalább az egyik nem nulla, akkor a legnagyobb közös osztójuk létezik és egyenlő a legkisebb
olyan pozitív egész számmal, ami felírható ma + nb alakban (ahol m és n is egészek). Jelölése: lnko(a, b). (Az angol nyelvű
irodalomban gcd (a, b).) Ha az a és b egészek egyike sem nulla, akkor a legkisebb közös többszörösük szintén létezik, jelölése
lkkt(a, b) (az angol nyelvű irodalomban lcm(a, b)), továbbá lnko(a, b) · lkkt(a, b) = |ab|. A legnagyobb közös osztó és a
legkisebb közös többszörös az alábbi tulajdonságokkal is jellemezhető:
A d pozitív egész szám az a és b számok legnagyobb közös osztója, ha d | a, d | b és az a és b számok bármely közös
osztója osztja d-t is. Az m pozitív egész az a és b számok legkisebb közös többszöröse, ha a | m, b | m és az a és b számok
bármely közös többszöröse osztható m-mel.
Bármely a és b egészek, illetve c pozitív egész szám mellett igaz, hogy lnko (ca, cb) = c·lnko(a, b) és lkkt(ca, cb) = c·lkkt(a,
b), feltéve hogy az adott egyenlőségnek legalább az egyik oldala létezik.
Két egész szám relatív prím, ha a legnagyobb közös osztójuk 1. A legnagyobb közös osztó és a legkisebb közös többszörös
fogalma kettőnél több megadott egész szám esetén is értelmezhető. Amennyiben egész számok egy halmazának legalább az
egyik tagja nem nulla, úgy a legnagyobb közös osztó létezik és egyértelmű, amennyiben pedig a halmaz véges és egyik tagja
sem nulla, akkor a legkisebb közös többszörös szintén létezik és egyértelmű.
Ha a és b egész számok és b ≠ 0, akkor alkalmas q (hányados) és r (maradék) egész számokkal a = qb + r és 0 ≤ r < |b|.
A fenti tételben szereplő hányados és maradék egyértelműen maghatározott. A q hányadost az a/b tört kerekítéséből
kapjuk meg: ha b pozitív, akkor q = ⌊a/b⌋, ha pedig b negatív, akkor q = ⌈a/b⌉. Ezek után a maradék az r = a – qb
összefüggésből adódik.
Az euklideszi algoritmus lényege, hogy ha a és b egész számok, és b ≠ 0, akkor maradékos osztások sorozatát végezzük el
a következőképpen: először | a | -t osztjuk maradékosan | b | -vel, majd minden egyes következő lépésben az előző lépés
osztója és maradéka között végezzük el ismét a maradékos osztást. Ezt folytatjuk mindaddig, amíg egyszer nullát kapunk
maradékul. Tehát
Mivel a maradékok egy szigorúan csökkenő sorozatot alkotnak (nem negatív számokból), előbb-utóbb mindenképp
elérkezünk egy olyan lépéshez, ahol a maradék nulla. Az utolsó nem nulla maradék az a és b számok legnagyobb közös
osztója. (Amennyiben már rögtön az első maradék nulla, úgy b osztja a-t, és akkor természetesen lnko(a, b) = |b|.)
Példa. Keressük meg az 123 321 és 112 233 számok legnagyobb közös osztóját és legkisebb közös többszörösét. Az
euklideszi algoritmus a következőt adja:
Prímszámok, prímfelbontás
Az oszthatóság szempontjából kitüntetett szerepet játszanak a prímszámok.
Egy egynél nagyobb p egész szám akkor és csak akkor prím, ha bármely a és b egészek mellett p|ab-ből következik,
hogy p|a vagy p|b.
Minden egynél nagyobb egész szám előáll prímszámok szorzataként. Ez az előállítás a prímtényezők sorrendjétől
eltekintve egyértelmű.
Példa. Adjuk meg a 312 – 1 szám prímtényezős felbontását!
Alkalmazzuk először az x2 –1 = (x – 1)(x + 1) és x3 + 1 = (x + 1)(x2 – x + 1) faktorizációs formulákat: 312 – 1 = (36 – 1)(36 + 1) =
(33 + 1)(33 – 1)(32 + l)(34 – 32 + 1) =28·26·10·73. Itt már mindegyik tényező prímfelbontása kis fejszámolással
megkapható: 28 = 22·7, 26 = 2 · 13, 10 = 2 · 5 és 73 maga egy prímszám, így 312 – 1 prímfelbontása 24 · 5 · 7 · 13 · 73.
A prímtényezős felbontás segítségével könnyen eldönthető, hogy két szám közül osztja-e egyik a másikat, illetve
könnyen megkaphatjuk két adott szám legnagyobb közös osztóját és legkisebb közös többszörösét is. Ha a és b pozitív
egészek, akkor alkalmas p1, p2, …, pr prímszámokkal és α1, α2, …, αr illetve ß1, ß2, …, ßr nem negatív egészekkel
a Möbius-függvény:
Tehát a konstans f(n) = 1 függvény összegzési függvénye τ(n), az f(n) = n függvény összegzési függvénye σ(n), illetve
általánosabban az f(n) = nk függvény összegzési függvénye σk(n). (A képletben szereplő összegzést természetesen csak a
pozitív osztókra végezzük el!) A Möbius-függvény összegzési függvénye:
A Möbius-féle inverziós formula segítségével egy összegzési függvényből is megkaphatjuk az eredeti számelméleti
függvényt:
Pontosabban, ha az f és F számelméleti függvényekkel az és azonosságok
valamelyike igaz minden pozitív egészre, akkor a másik azonosság is fennáll.
Egy f : ℕ → ℂ számelméleti függvény multiplikatív, ha tetszőleges m és n relatív prím pozitív egészekre f(mn) =
f(m)/(n). Az f függvény teljesen multiplikatív, ha tetszőleges m és n pozitív egészekre f(mn) = f(m)f(n).
A φ, τ, σk, μ függvények mind multiplikatív számelméleti függvények. Ezt a következő tétel alkalmazásával
igazolhatjuk:
Egy f számelméleti függvény összegzési függvénye akkor és csak akkor multiplikatív, ha f multiplikatív.
A multiplikatív számelméleti függvények egyik előnyös tulajdonsága, hogy ha a prímhatványokon felvett értékeik
ismertek, akkor azokból már bármely természetes számon felvett értékük kiszámítható. Ugyanis ha f egy multiplikatív
Konvolúció
Az f és g számelméleti függvények konvolúciója (Dirichlet-szorzata) f * g, ahol
Az f számelméleti függvénynek akkor és csak akkor van multiplikatív inverze, ha f(1) ≠ 0. Ebben az esetben a
multiplikatív inverz egyértelmű.
Multiplikatív függvények konvolúciója szintén multiplikatív, illetve egy multiplikatív függvény inverze is
multiplikatív. Tehát elmondható a következő:
Azok a számelméleti függvények, amikre f(1) ≠ 0, a konvolúcióra nézve csoportot alkotnak, és ebben a csoportban a
multiplikatív függvények halmaza egy részcsoport.
Egy g : ℕ → ℂ számelméleti függvény additív, ha tetszőleges m és n relatív prím pozitív egészekre g(mn) = g(m) + g(n). A
g függvény teljesen additív, ha tetszőleges m és n pozitív egészekre g(mn) = g(m) + g(n).
Például az ω(n) függvény, ami az n pozitív egész prímosztóinak a számát jelöli, egy additív (de nem teljesen additív)
függvény. Könnyen belátható, hogy – tetszőleges pozitív z mellett – ha g egy additív számelméleti függvény, akkor f(n) =
sg(n) multiplikatív, és megfordítva, ha f egy pozitív valós értékű multiplikatív számelméleti függvény, akkor g(n) = logz(f(n))
additív. Továbbá additív függvények konstansszorosai is additívak, így például tetszőleges c komplex szám mellett g(n) =
cln n egy additív függvény.
13.3. Kongruenciák
A kongruencia mint relációtípus fogalmát Karl Friedrich Gauss vezette be a XIX. században. A lényege, hogy az
oszthatósági tulajdonságokat a kongruencia nyelvezetén megfogalmazva, azokkal viszonylag kényelmesen, az
egyenlőségekhez hasonlóan tudjunk dolgozni. Minden pozitív egész számhoz mint modulushoz de niálható egy
kongruenciareláció az egész számok halmazán, az alábbi módon.
Legyen m egy pozitív egész szám. Az a egész szám kongruens a b egész számmal modulo m, ha m osztója az a – b
különbségnek. Ennek a relációnak a jelölése: a ≡ b (mod m).
Az a ≡ b (mod m) reláció akkor és csak akkor áll fenn, ha a és b ugyanazt a maradékot adják m-mel osztva. Tetszőleges
m modulus mellett a kongruenciareláció egy ekvivalenciareláció, azaz re exív, szimmetrikus és tranzitív az egész számok
halmazán. (Minden a egész számra a ≡ a (mod m), a ≡ b (mod m) esetén b ≡ a (mod m), valamint a ≡ b (mod m) és b ≡ c (mod
m) esetén a ≡ c (mod m).) Így a reláció ekvivalenciaosztályai az egész számok ℤ halmazának egy partícióját alkotják. Egy
tetszőleges a egész szám ekvivalenciaosztálya:
Tehát ā = b̄ pontosan akkor áll fenn, ha a ≡ b (mod m), azaz m | (a– b). Ezeket az ekvivalenciaosztályokat
kongruenciaosztályoknak (vagy maradékosztályoknak) nevezzük. (Ha a modulus feltüntetése is fontos, akkor ā helyett a
kicsit körülményesebb [a]m jelölést is használhatjuk.) A modulo m kongruenciaosztályok: .
Könnyen belátható, hogy ezek mind különbözőek, továbbá bármely a egész számra ā megegyezik ezen
kongruenciaosztályok valamelyikével: ā = r̄, ahol r az a-nak m-mel való osztásából származó maradék. Tehát pontosan m
kongruenciaosztály van modulo m, ezeknek az algebrai tulajdonságait a 13.4. fejezetben részletesebben is fogjuk tárgyalni.
Egy adott m modulus mellett a kongruenciarelációk összeadhatók, kivonhatók és szorozhatók. Ha a ≡ c (mod m) és b ≡
d (mod m), akkor a + b ≡ c + d (mod m), a – b ≡ c – d (mod m) és ab ≡ cd (mod m). Szintúgy elvégezhető egy (pozitív egész
kitevős) hatványozás is egy kongruencia két oldalával: ha a ≡ b (mod m), akkor tetszőleges k pozitív egész számmal ak ≡ bk
(mod m). Az osztás (egyszerűsítés) már nem végezhető el akármikor, azonban mindig lehet egyszerűsíteni egy olyan
számmal, ami relatív prím a modulushoz:
Ha ac ≡ bc (mod m) és lnko (m, c) = 1, akkor a ≡ b (mod m).
Ennél általánosabban az is igaz, hogy ha ac ≡ bc (mod m) és lnko(m, c) = d, akkor a ≡ b (mod m/d). Így például bármikor
nyugodtan egyszerűsíthetünk, ha ezt megtesszük a modulussal is: tetszőleges c pozitív egész mellett az a ≡ b (mod m) és az
ac ≡ bc (mod cm) kongruenciák ekvivalensek.
Elsőfokú kongruenciaegyenletek
Magasabb fokú kongruenciaegyenletek
Elsőfokú kongruenciaegyenletek
Kongruenciaegyenlet alatt egy olyan kongruenciát értünk, ami tartalmaz legalább egy ismeretlent (változót). A
ismeretleneket tartalmazó kifejezések fokától függően beszélhetünk lineáris, másodfokú, harmadfokú stb.
kongruenciákról.
Az ax ≡ b (mod m) lineáris (elsőfokú) kongruencia akkor és csak akkor oldható meg, ha lnko(a, m) osztja b-t az egész
számok körében. Ekkor a megoldások pontosan egy kongruenciaosztályt alkotnak modulo m/lnko(a, m), azaz lnko(a, m)
darab kongruenciaosztályt modulo m.
A lineáris kongruencia-rendszereknek két főbb típusa van. Az egyikbe azok a rendszerek tartoznak, ahol csak egy
ismeretlen van, viszont az egyes kongruenciák modulusai nem feltétlenül ugyanazok. A másik fontos típus, ahol a modulus
rögzített, viszont több ismeretlennel állunk szemben. Az előbbi esetben, amennyiben egy adott rendszer megoldható, a
megoldás(ok) a modulusok legkisebb közös többszöröséhez tartozó kongruenciaosztályok formájában adható(k) meg. A
második típusnál természetesen a megoldás(ok) is az adott modulus szerinti kongruenciaosztályokkal fejezhető(k) ki.
A híres kínai maradéktétel szerint:
Ha az m1, m2, …, mk modulusok páronként relatív prímek, akkor az x ≡ a1(mod m1), x ≡ a2(mod m2), …, x ≡ ak(mod mk)
szimultán kongruencia-rendszernek pontosan egy megoldása van modulo M=m1m2 … mk.
A megoldás megtalálására van egy viszonylag egyszerűen követhető módszer. A fenti jelölésekkel legyen M1 = M/m1,
M2 = M/m2, …, Mk = M/mk. Mivel feltettük, hogy a modulusok páronként relatív prímek, ezért az is igaz, hogy mindegyik i-
re Mi relatív prím mi-hez, így létezik inverze modulo mi: egy olyan yi egész, amivel Miyi ≡ 1 (mod mi). Ekkor a = a1M1y1 +
a2M2y2 + … + akMkyk egy megoldása a tételbeli szimultán kongruencia-rendszernek, és az általános megoldás x ≡ a (mod M)
alakban fejezhető ki.
Példa. Oldjuk meg az x ≡ 4(mod 5), x ≡ 3(mod 7), x ≡ 2(mod 9) kongruencia-rendszert! A modulusok páronként relatív
prímek, a szorzatuk M = 5 · 7 · 9 = 315, így pontosan egy megoldás van modulo 315. M1 = 7·9 = 63 ≡ 3(mod 5), M2 = 5·9 =
45 ≡ 3(mod 7), M3 = 5 · 7 = 35 ≡ 8(mod 9), az inverzeik a megfelelő modulusokra nézve rendre y1 = 2, y2 = 5 és y3 = 8, tehát
a = a1M1y1 + a2M2y2 + a3M3y3 = 4·63·2 + 3·45·5 + 2·35·8 = 1739 egy megoldása a szimultán kongruenciának. Végül 1739 ≡
164(mod 315), tehát az általános megoldás: x ≡ 164(mod 315). Ez azokat az egészeket jelenti, amik 315-tel osztva 164-et
adnak maradékul.
Az x ≡ a1(mod m1), x ≡ a2(mod m2), …, x ≡ ak(mod mk) szimultán kongruencia-rendszer akkor és csak akkor oldható
meg, ha lnko(mi, mj) osztja (ai – aj)-t minden i, j egész és 1 ≤ i ≤ j ≤ k esetén. Ebben az esetben egyetlen megoldás van
modulo M = lkkt(m1, m2, …, mk).
Ez a tétel a számtani sorozatok nyelvén is megfogalmazható, ugyanis egy x ≡ a(mod m) típusú kongruencia önmagában
egy (mindkét irányban végtelen) számtani sorozatot ad megoldásként: aminek az a szám tagja, és a di erenciája m. Az
iménti tétel k = 2 esetén azt mondja ki, hogy két számtani sorozatnak akkor és csak akkor van közös eleme, ha a két sorozat
egy-egy tagjából alkotott különbség osztható a di erenciák legnagyobb közös osztójával. Továbbá k > 2 esetén k darab
számtani sorozatnak akkor és csak akkor van közös eleme, ha a sorozatok közül bármely kettőnek van.
ahol f(x) egy egész együtthatós polinom. A megoldások halmaza – amennyiben nem üres – ebben az esetben is bizonyos
modulo m kongruenciaosztályokból áll (mivel x ≡ y (mod m) esetén f(x) ≡ f(y)(mod m) is igaz). Ha az m szám
Miután megállapítottuk, hogy egy tetszőleges modulusú magasabb fokú polinomiális kongruencia megoldása
visszavezethető prímhatvány modulusú kongruenciák megoldására, érdemes pár szót ejteni arról, hogy a prímhatvány
modulusú kongruenciák megoldásait milyen módszerekkel lehet megkapni.
Speciális esetként először tekintsük a prím modulusú polinomiális kongruenciákat! Ezeknek a megoldására általános
módszer nincs – eltekintve attól, hogy ha az adott p modulus nem túl nagy, akkor a 0, 1, 2, …, p – 1 számok egyenkénti
vizsgálatával is megkaphatjuk a megoldást szolgáltató kongruenciaosztályokat, és néha valóban ez a legkézenfekvőbb
módszer. Azonban bizonyos trükkökkel a legtöbb prím modulusú polinomiális kongruencia visszavezethető egy
egyszerűbb (alacsonyabb fokú) kongruenciára. Induljunk ki abból, hogy adott egy
kongruencia, ahol p egy prímszám, és f(x) egy egész együtthatós polinom. Figyelembe véve, hogy a kis Fermat-tétel alapján
minden a egész számra aP ≡ a(mod p) (lásd a következő szakaszt), továbbá az f(x) polinom minden együtthatója kongruens a
0, 1, 2, …, p – 1 számok valamelyikével modulo p, az f(x) ≡ 0(mod p) kongruencia visszavezethető egy g(x) ≡ 0(mod p)
kongruenciára, ahol g(x) egy legfeljebb p – 1 fokú polinom, amelynek minden együtthatója egy, a [0, p – 1] intervallumba eső
egész szám. (Sőt, még az is feltehető, hogy a g(x) polinom főegyütthatója 1, ugyanis ellenkező esetben a főegyüttható
inverzével végigszorozva a kongruenciát, egy 1 főegyütthatós polinomot kapunk a bal oldalon.)
A továbbiakban érdemes a g(x) polinomot a ℤp gyűrű felett tekinteni. Legyen h(x) a g(x) és az xp – x polinomok ℤp [x]-
beli legnagyobb közös osztója, ekkor a g(x) ≡ 0(mod p) kongruencia modulo p megoldásainak a száma megegyezik a h(x)
polinom fokával. Sőt, ℤp felett h(x) lineáris tényezők szorzatára bomlik, és ezek a lineáris tényezők szolgáltatják a g(x) ≡
0(mod p) kongruencia összes megoldását. Speciálisan igaz a következő, Lagrange-tól származó észrevétel a megoldások
számára vonatkozóan:
Ha az f(x) n-edfokú polinom főegyütthatója nem osztható a p prímszámmal, akkor az f(x) ≡ 0(mod p) kongruenciának
legfeljebb n megoldása van a modulo p kongruenciaosztályok között.
Az utolsó nem nulla maradék tehát 9x3 + 7, ezt 3-mal beszorozva egy normált polinomot kapunk ℤ13 felett: x3 + 8. Ez
az x6 + 4x3 + 7 és x13 – x polinomok legnagyobb közös osztója ℤ13 felett, ahol ez a legnagyobb közös osztó lineáris
tényezők szorzatára bomlik:
Az eredeti x15 – 3x6 – 8 ≡ 0(mod 9) kongruencia megoldásai tehát x ≡ 7(mod 13), x ≡ 8(mod 13) és x ≡ 11(mod 13).
Ki kell hangsúlyoznunk, hogy csak prím modulus esetén garantált, hogy egy polinom lineáris tényezőkre bontásával
az összes zérushelyet megkapjuk az adott modulusra nézve. Egy korábbi példában láttuk, hogy az x2 + 7x – 9 ≡ 0(mod 315)
kongruenciának négy megoldása van, ez abból adódik, hogy az x2 + 7x – 9 polinomot kétféleképp lehet modulo 315 lineáris
tényezőkre bontani:
Ennek a jelenségnek a hátterében az a tény áll, hogy egy ℤm[x] polinomgyűrű akkor és csak akkor egyértelmű
felbontási tartomány, ha m egy prímszám.
A prímhatvány modulusú kongruenciák visszavezethetők prím modulusra. Ez a visszavezetés több lépésben történik,
az egyes lépésekben egy adott f(x) ≡ 0(mod pa–1) kongruencia megoldásaiból megkaphatjuk az f(x) ≡ 0(mod pa) kongruencia
megoldásait. Az alapgondolat az, hogy ha valamely n egész számra f(n) ≡ 0(mod pa), akkor az is igaz, hogy f(n) ≡ 0(mod pa–1),
hiszen evidens, hogy ha pa osztja f(n)-et, akkor pa–1 szintén osztója f(n)-nek. Legyen r az n maradéka pa–1-nel osztva, ekkor r
szintén megoldása az f(x) ≡ 0(mod pa–1) kongruenciának, és n = r+ tpa–1 valamilyen t egész számmal. A vizsgálandó kérdés
ezek után az, hogy ha az f(x) ≡ 0(mod pa–1) kongruenciának adott egy r megoldása a [0, pa–1 – 1] intervallumban, akkor
milyen t egészek mellett lesz az n = r + tpa–1 szám egy megoldás az f(x) ≡ 0(mod pa) kongruenciára. Erről szól a Kurt Hensel
(1861–1941) német matematikusról elnevezett Hensel-lemma:
Legyen f(x) egy egész együtthatós polinom, jelölje f′(x) az f(x) deriváltját, és tegyük fel, hogy az r egész szám egy
megoldása az f(x) ≡ 0(mod pa–1) kongruenciának.
- Ha f′(r) ≠ 0(mod p) és y az f′(r) szám inverze modulo p, akkor legyen t a (–yf(r))/pa–1 szám maradéka p-vel való osztás
után. Ekkor t az egyetlen olyan egész a [0, p – 1] intervallumban, amivel f(r + tpa–1) ≡ 0(mod pa).
- Ha f′(r) ≡ 0(mod p) és f(r) ≡ 0(mod pa), akkor bármely t egész számmal f(r+tpa–1) ≡ 0(mod pa).
- Ha f′(r) ≡ 0(mod p) és f(r) ≠ 0(mod pa), akkor az f(x) ≡ 0 (mod pa) kongruenciának nincs olyan megoldása, amivel x ≡
r(mod pa–1).
Az {a1, a2, …, am} halmazt modulo m teljes maradékrendszernek nevezzük, ha mindegyik kongruenciaosztályból
pontosan egy elemet tartalmaz, tehát {ā1, ā2, …, ām} = ℤm. A {b1, b2, …, bφ(m)} halmazt modulo m redukált
maradékrendszernek nevezzük, ha mindegyik m-hez relatív prím kongruenciaosztályból pontosan egy elemet
tartalmaz, tehát {b̄1, b̄2, … b̄φ(m)} = ℤ×m.
Ha a és m relatív prím pozitív egészek, akkor az a rendje modulo m, ordma az a legkisebb olyan pozitív egész k szám,
amivel ak ≡ 1 (mod m).
Ez pontosan az ā elem rendje a csoportban. (Tehát kongruens számok rendje mindig megegyezik.) Mivel egy
véges csoportban az elemek rendje osztja a csoport rendjét, így ordma osztja φ(m)-et, és így minden -beli ā elemre
. Az Euler–Fermat-tétel ugyanezt fogalmazza meg a kongruenciák nyelvén.
Primitív gyökök
Primitív gyökök
Visszatérve a kongruenciaosztályokra, már említettük, hogy
egy φ(m) rendű kommutatív csoport. Ha ez a csoport ciklikus, akkor alkalmas g számmal (lásd a generált
részcsoport fogalmát a 12.4. fejezetben), és bármely m-hez relatív prím a számhoz van olyan k kitevő, amivel a ≡ gk(mod
m). Ebben az esetben azt mondjuk, hogy g egy primitív gyök modulo m.
A g egész szám egy primitív gyök modulo m, ha az 1, g, g2, …, gφ(m)–1 számok egy redukált maradékrendszert alkotnak
modulo m. Ez ekvivalens azzal a feltétellel, hogy g relatív prím m-hez, és ordmg = φ(m).
Nincs minden modulushoz primitív gyök. Sőt, az ilyen „szerencsés” modulus viszonylag kevés.
Primitív gyök modulo m akkor és csak akkor létezik, ha m = 2, m = 4, m =pa, vagy m = 2pa valamilyen páratlan p prím és
a pozitív egésszel.
Ha az m pozitív egész szám prímhatványfelbontása (ahol a ≥ 0 és minden más ai > 0), akkor
, továbbá a = 0 és a = 1 esetén esetén és tetszőleges
páratlan primp és pozitív egész a kitevő mellett .
Primitív gyököt találni egy adott m modulusra nézve (amennyiben létezik) általában nem könnyű feladat, és
legtöbbször próbálgatást igényel. Például kiindulásnak listázhatjuk a 2-hatványokat modulo m. Ha 2φ(m) az első pozitív
egész kitevős, 1-gyel kongruens 2-hatvány, akkor ordm2 = φ(m), és 2 egy primitív gyök. Ellenkező esetben vegyük a
legkisebb olyan a egészt, ami nem szerepel modulo m a 2-hatványok között, és listázzuk az a hatványait modulo m stb. A
keresést segítheti néhány hasznos észrevétel, illetve tény:
-
Bármely a egészre és n pozitív egész kitevőre .
- Ha ordma és ordmb relatív prímek, akkor ordm(ab) = ordma · ordmb.
- Bármely a egészre és k pozitív egész kitevőre, ha ak ≡ 1(mod m), akkor ordma osztja k-t.
- Egy a egész szám pontosan akkor primitív gyök modulo m, ha lnko(a, m) = 1, és φ(m) bármely q prímosztójára aφ(m)/q ≢
1(mod m).
- Ha p egy páratlan prímszám és r primitív gyök modulo p, akkor r vagy r + p egy primitív gyök modulo p2.
- Ha p egy páratlan prímszám, és r primitív gyök modulo p2, akkor r szintén primitív gyök modulo pk, bármely pozitív egész
k kitevő mellett.
- Ha p egy páratlan prímszám, k pozitív egész, és r primitív gyök modulo pk, akkor amennyiben r páratlan, akkor r szintén
primitív gyök modulo 2pk, amennyiben pedig r páros, akkor r + pk egy primitív gyök modulo 2pk.
Ez utóbbi három megjegyzés alapján a pk, illetve 2pk alakú modulusokhoz tartozó primitív gyökök keresése lényegében
azon múlik, hogy a p prím modulushoz találjunk egy primitív gyököt, a többi viszonylag könnyű számolással adódik. Egy
adott primitív gyökből az összes többit is megkaphatjuk.
Ha g egy primitív gyök modulo m, és a k pozitív egész kitevő relatív prím φ(m)-hez, akkor gk szintén egy primitív gyök
modulo m. Fordítva: bármely r, modulo m primitív gyökhöz található olyan φ(m)-hez relatív prím k kitevő, amivel r ≡
gk (mod m).
Tehát ha léteznek primitív gyökök az m modulushoz, akkor azok pontosan φ(φ(m)) darab kongruenciaosztályt
alkotnak.
A primitív gyökök egy alkalmazási területe az indexaritmetika, ami például prím modulus esetén az axk ≡ b(mod p)
típusú kongruenciák megoldásában nyújthat hasznos segítséget.
Legyen r egy primitív gyök modulo m. Ha az a egész szám relatív prím m-hez, akkor a-nak az r alapú modulo m indexe
(diszkrét logaritmusa) az a legkisebb olyan k nem negatív egész, amivel rk ≡ a(mod m). Jelölése: indra.
Mivel r egy primitív gyök, ez az index minden m-hez relatív prím egész mellett létezik, és legfeljebb φ(m) – 1. Alapvető
tulajdonságai:
- indr 1 = 0,
- indr(ab) ≡ indra + indrb(mod φ(m)),
- indr(ak) ≡ k · indra(mod φ(m)),
- rl ≡ a(mod m) akkor és csak akkor, ha l ≡ indra(mod φ(m)).
Mindez bármely m-hez relatív prím a és b egészek, illetve k és l nem negatív egész számok mellett érvényes.
Ha egy adott axk ≡ b(mod m) kongruencia megoldásait keressük, ahol b és m relatív prímek, akkor a megoldás
létezésének szükséges feltétele, hogy a is relatív prím legyen m-hez, továbbá ennek fenn kell állnia minden x megoldásra is.
Ha most r egy primitív gyök az m modulushoz, akkor vehetjük a kongruencia két oldalának az indexét, és indra + k·indrx ≡
indrb(mod φ(m)), azaz egy lineáris kongruenciát kapunk az x ismeretlen indexére. Mint azt korábban már tárgyaltuk, a
lineáris kongruenciák megoldhatóságának eldöntése, illetve a megoldások megtalálása viszonylag könnyű feladat, és x
indexének az ismeretében már magát x-et is ismerjük, hiszen . A nehézség viszont abban van, hogy
ehhez a lineáris kongruenciához valahogy eljussunk, azaz hogy az a és b egészek r alapú indexét kiszámoljuk.
Egy a egész szám kvadratikus maradék modulo m, ha az x2 ≡ a(mod m) kongruenciának van megoldása. Ellenkező
esetben a egy kvadratikus nem maradék modulo m.
Korábban már láttuk, hogy a polinomiális kongruenciák visszavezethetők prím modulusú polinomiális
kongruenciákra, és hasonló a helyzet annak az eldöntésében is, hogy egy adott a egész kvadratikus maradék-e egy adott m
modulusra nézve.
Egy, az m modulushoz relatív prím a egész szám akkor és csak akkor kvadratikus maradék modulo m, ha kvadratikus
maradék az m minden prímosztójára nézve, továbbá a ≡ 1(mod 4), amennyiben m osztható 4-gyel, illetve a ≡ 1(mod 8),
amennyiben m osztható 8-cal.
Ha az m-hez relatív prím a egész szám kvadratikus maradék modulo m, akkor az x2 ≡ a(mod m) kongruenciának 2r+s
darab megoldása van modulo m, ahol r az m prímosztóinak számát jelöli, és s = 0, 1 vagy 2 annak megfelelően, hogy m/4
nem egész, páratlan egész vagy páros egész.
A továbbiakban többnyire olyan kongruenciákkal foglalkozunk, ahol a modulus egy páratlan (azaz 2-nél nagyobb)
prímszám.
Ha adott egy ax2 + bx+ c ≡ 0(mod p) kongruenciaegyenlet (ahol p egy páratlan prím, és a relatív prím p-hez), az
visszavezethető egy (x + k)2 ≡ l(mod p) alakú kongruenciára. Ha szorzunk 4a-val (ez relatív prím p-hez az előbbi feltevés
szerint), akkor az ezzel ekvivalens, 4a2x2 + 4abx + 4ac ≡ 0(mod p) kongruenciát kapjuk, ami átrendezve (2ax+ b)2 ≡ b2 –
4ac(mod p). A megoldhatóság most már csak attól függ, hogy b2 – 4ac egy kvadratikus maradék vagy nem maradék modulo
p. Azonban két külön feladat eldönteni egy adott a egészről, hogy kvadratikus maradék-e a p modulusra nézve, illetve
találni egy konkrét megoldást az x2 ≡ a(mod p) kongruenciára. Az előbbire létezik egy elemi eljárás, az utóbbi általában
bonyolult. Ha ismert egy r primitív gyök modulo p és az a egész szám r alapú indexe, akkor minden egyszerű.
Ha r primitív gyök a p páratlan prím modulusra nézve, akkor egy a egész szám pontosan akkor kvadratikus maradék
modulo p, ha az r alapú indexe páros.
Ebben az esetben a 2indrx ≡ indra(mod p – 1) lineáris kongruencia megoldásával megkaphatjuk azon x számok indexét,
amikre x2 ≡ a(mod p).
Ha p egy páratlan prímszám, akkor az 1, 2, …, p – 1 számok közül pontosan (p – 1)/2 kvadratikus maradék, és (p – 1)/2
kvadratikus nem maradék. Amennyiben a egy p-vel nem osztható kvadratikus maradék, akkor az x2 ≡ a(mod p)
kongruenciának pontosan két megoldása van modulo p.
Az Euler–Fermat-tétel alapján, ha egy a egész szám nem osztható a p páratlan prímmel, akkor ap–1 ≡ 1(mod p), tehát p
osztja az ap–1 – 1 = (a(p–1)/2 – 1) (a(p–1)/2 + 1) szorzatot, következésképp a szorzat valamelyik tényezőjét is, tehát vagy a(p–1)/2 =
1(mod p), vagy a(p–1)/2 ≡ –1(mod p). Az Euler-feltétel szerint ez pont attól függ, hogy a kvadratikus maradék-e modulo p.
Hap egy páratlan prím, és a(p – 1)/2 ≡ 1(mod p), akkor a egy kvadratikus maradék, ha pedig a(p – 1)/2 ≡ –1(mod p), akkor a
egy kvadratikus nem maradék modulo p.
A Legendre- és Jacobi-szimbólumok
A Legendre- és Jacobi-szimbólumok
Adrien-Marie Legendre (1752–1833) francia matematikus nevét viseli az a szimbólum, ami azt jelzi, hogy egy egész szám
kvadratikus maradék-e egy adott prím modulusra nézve.
Ha p egy páratlan prím, és nem osztója az a egész számnak, akkor az Legendre-szimbólum értéke:
,
-
,
-
,
-
,
bármely páratlan prím p és p-vel nem osztható a és b egész számok mellett.
A kvadratikus reciprocitás törvénye szerint:
Tehát ha p és q egyaránt kongruens 3-mal modulo 4, akkor (p/q) = –(q/p), minden más esetben (p/q) = (q/p). Ez a tétel
rendkívül praktikus segítséget nyújt ahhoz, hogy eldöntsük, egy adott egész szám kvadratikus maradék-e egy adott
páratlan prímszámra nézve.
Példa. Igazoljuk, hogy 69 egy kvadratikus maradék modulo 83!
Legendre-szimbólum értékét kell kiszámolnunk, ehhez használni fogjuk a már felsorolt tulajdonságokat,
illetve a kvadratikus reciprocitás törvényét. Mivel 69 = 3·23,
A Jacobi-szimbólum – ami Carl Gustav Jacobi (1804–1851) német matematikus nevét viseli – általánosítása a Legendre-
szimbólumnak, és ugyanazt a jelölést is használja. Amennyiben m egy páratlan szám, a prímhatványfelbontása
, és a egy m-hez relatív prím egész, akkor
ahol az egyenlet jobb oldalán a Legendre-szimbólumok szerepelnek. Ebbe beleértendő, hogy m = 1 esetén a Jacobi-
szimbólum értéke 1.
A Jacobi-szimbólum alapvető tulajdonságai:
-
Ha a ≡ b(mod m), akkor .
-
,
-
,
-
,
-
,
bármely páratlan m és n és hozzájuk relatív prím a és b egész számok mellett.
A Jacobi-szimbólumra is igaz a reciprocitási törvény:
Ki kell hangsúlyoznunk, hogy az (a/m) Jacobi-szimbólum már nem arról szól, hogy az a szám egy kvadratikus
maradék-e modulo m. Amennyiben (a/m) = –1, akkor garantált, hogy a egy kvadratikus nem maradék, viszont ha (a/m) = 1,
abból még általában nem következik, hogy a kvadratikus maradék lenne modulo m.
Egy pozitív egész a szám akkor és csak akkor kvadratikus maradék minden prím modulusra nézve, ha a egy
négyzetszám.
13.6. Prímszámok
A számelméletben kitüntetett szerepe van a prímszámoknak. Ennek egyik oka, hogy a számelmélet alaptétele szerint
minden 1-nél nagyobb pozitív egész szám prímtényezők szorzatára bomlik, és ennek a ténynek köszönhetően sok
számelméleti kérdés visszavezethető prímszámok vizsgálatára. Másrészt pedig a prímszámok látszólagos rendezetlensége
évezredek óta inspirálta a matematikusokat arra, hogy ebben a rendezetlenségben megpróbáljanak eligazodni, valamilyen
rendet, illetve szabályokat felfedezni.
Eukleidész (Kr. e. 350 körül) óta ismeretes, hogy végtelen sok prímszám van, azóta ennél a tételnél sokkal erősebb
tételek is napvilágot láttak, mint például Dirichlet (1805–1895) tétele:
Ha az a és d számok relatív prímek, akkor az a, a + d, a + 2d, … számtani sorozatban végtelen sok prímszám van.
A kongruenciák nyelvén megfogalmazva, ha a és d relatív prímek, akkor végtelen sok p prímre igaz, hogy p ≡ a(mod d).
Szintén következik végtelen sok prímszámnak a létezése Csebisev (1821–1894) tételéből:
Bármely pozitív egész n számhoz van olyan p prímszám, amivel n < p ≤ 2n.
A ~ jelölés arra utal, hogy a két oldal hányadosa x → ∞ mellett l-hez konvergál.
Sokáig megoldatlan kérdés volt, hogy milyen hosszú számtani sorozatot lehet alkotni prímszámokból (például 3, 5, 7
egy háromtagú, 5, 11, 17, 23, 29 egy öttagú számtani sorozat). Végül 2004-ben, kevéssel azután, hogy M. Frind, P. Jobling és
P. Underwood találtak egy prímekből álló 23 tagú számtani sorozatot (az első tagja 56211383760397, a di erenciája pedig
44546738095860), Ben Green és Terence Tao bizonyították, hogy akármilyen hosszú számtani sorozat létezik prím
tagokkal:
Minden pozitív egész k számhoz létezik végtelen sok k tagú, prímszámokból álló számtani sorozat.
Azonban olyan végtelen számtani sorozat nincs, aminek minden tagja prím lenne. Ez például abból a tényből is
következik, hogy míg számtani sorozatokban az egymás utáni tagok különbsége állandó, a szomszédos prímek közti
különbség bármekkora lehet.
Bármely d pozitív egész számhoz végtelen sok olyan szintén pozitív egész n létezik, amire az n + 1, n + 2, …, n + d
számok mindegyike összetett.
Egyik következménye a prímszámtételnek, hogy meg tudjuk becsülni általában az n-edik prím nagyságrendjét:
Prímtesztek
Fermat-prímek és Mersenne-prímek
Prímszámok a titkosításban
Megoldatlan problémák
Prímtesztek
Egy adott számról általában nehéz eldönteni, hogy prímszám-e. A prímtesztek olyan eljárások, amikkel adott számokról
(esetekben csak bizonyos speciális típusú számokról) meg tudjuk állapítani, hogy prímek-e vagy sem. A legegyszerűbb
ilyen eljárás, ha az adott n számot osztjuk minden, a intervallumban lévő összes prímszámmal, és ha
valamelyik hányados egésznek bizonyul, akkor n összetett, ellenkező esetben n prím. (Azért elég csak a
intervallum egészeivel osztani, mert ha n összetett, akkor biztosan van -nél nem nagyobb prímosztója.)
Az eratoszthenészi szita lényege, hogy alkalmazásával egy adott n egészhez megkaphatjuk az összes n-nél nem nagyobb
prímszám listáját. Az eljárás igen egyszerű. Először felírjuk az egész számokat 2-től n-ig, majd kihúzzuk az összetett
számokat oly módon, hogy sorban -re megnézzük, hogy a k szám ki lett-e már húzva korábban, ha
igen, akkor nem csinálunk semmit, ha nem, akkor pedig kihúzzuk a k többszöröseit 2k-tól kezdve. Végül a ki nem húzott
számok alkotják a prímszámok teljes listáját 2-től n-ig.
A továbbiakban megemlítünk néhány olyan prímtesztet, amik nem támaszkodnak az összes -nél nem nagyobb
prímek listájára. Az egyik ilyen a kis Fermat-tétel Lucas-féle megfordítása:
Ha n egy pozitív egész, és valamely x egész számmal xn–1 ≡ 1(mod n), viszont az n – 1 szám bármely q prímosztójával x(n–
1)/q ≢ 1(mod n), akkor n prímszám.
Fermat-prímek és Mersenne-prímek
m
Az Fm = 22 + 1 alakú számokat Fermat-számoknak nevezzük. Fermat azt sejtette, hogy bármely nem negatív m egészre Fm
egy prímszám, és ezt ellenőrizte m = 0, 1, 2, 3, 4-re: F0 = 3, F1 = 5, F2 = 17, F3 = 257 és F4 = 65 537 valóban prímek. Azután Euler
1732-ben észrevette, hogy F5 = 232 + 1 már nem prím: osztható 641-gyel. E könyv írásakor (2009-ben) nem ismeretes, hogy
van-e több prím a Fermat-számok között. Sokan azt sejtik, hogy nincs. F11-ig ismert a Fermat-számok prímfelbontása,
továbbá sok más Fermat-számnak ismert legalább egy prímosztója. További Fermat-számokról tudjuk, hogy nem prímek,
viszont még nem ismert egyetlen prímosztójuk sem (ilyen például F14, F20, F22 és F24). Érdekesség, hogy a Fermat-számok
m
prímosztói csak speciális alakú prímek lehetnek: minden egynél nagyobb egész m-re igaz, hogy az Fm = 22 + 1 Fermat-szám
valamennyi prímosztója k·2m + 2+ 1 alakú (valamilyen k egész mellett). Eddig 242 Fermat-szám igazoltan nem prím, közülük
F2 478 782 a legnagyobb, és jelenleg F33 a legkisebb olyan Fermat-szám, amiről még nem sikerült eldönteni, hogy prímszám-
e.
A Fermat-prímeknek a geometriai vonatkozása az a Gausstól származó tétel, hogy egy szabályos n-szög akkor és csak
akkor szerkeszthető meg körzővel és vonalzóval, ha n egy 2-hatvány, vagy n = 2ap1 … pr, ahol a ≥ 0 egész, r ≥ 1 és p1, …, pr
különböző Fermat-prímek.
A Lucas-teszthez hasonló jellegű E. Proth 1878-ból származó tétele:
Ha n = k · 2m + 1, ahol k és m pozitív egészek és k páratlan, továbbá k < 2m és valamely x egész számmal x(n –1)/2 ≡ –1 (mod
n), akkor n prímszám.
A 2k – 1 alakú prímeket Mersenne-prímeknek nevezzük. Ilyenkor a k kitevő maga is prímszám kell, hogy legyen
(ellenkező esetben, ha k = ml és m > 1, akkor 2m – 1 egy valódi osztó). A megfordítás azonban nem igaz: az Mp = 2p – 1
Mersenne-szám nem minden p prímszám mellett lesz prím. E könyv írásakor összesen 47 Mersenne-prímet ismerünk,
ezeket a következő p kitevőkkel kapjuk: 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1279, 2203, 2281, 3217, 4253, 4423, 9689,
9941, 11 213, 19 937, 21 701, 23 209, 44 497, 86 243, 110 503, 132 049, 216 091, 756 839, 859 433, 1 257 787, 1 398 269, 2 976 221, 3 021
377, 6 972 593, 13 466 917, 20 996 011, 24 036 583, 25 964 951, 30 402 457, 32 582 657, 37 156 667, 42 643 801 és 43 112 609. Ez utóbbi
kitevővel kapott Mersenne-prím a jelenleg ismert legnagyobb prímszám, a 10-es számrendszerbeli alakja 12 978 189
számjegyből áll. Azt nem tudjuk, hogy van-e végtelen sok Mersenne-prím, és azt sem tudjuk, hogy van-e végtelen sok olyan
Mersenne-szám, ami nem prím. Az bizonyított, hogy ha q egy prímosztója az Mp = 2p – 1 Mersenne-számnak, akkor q ≡
1(mod p) és q ≡ ± 1(mod 8). A fenti lista 12 millióig teljes: ennél kisebb kitevővel már nincs több Mersenne-prím.
A Lucas–Lehmer-teszt egy rekurzívan de niált sorozat elemeinek a segítségével dönti el a Mersenne-számokról, hogy
melyikük prím.
Prímszámok a titkosításban
A prímszámok egyik legfontosabb alkalmazási területe a titkosítás. Például ha egy számítógépes szolgáltatás beléptetési
rendszere jelszót igényel, nagyon rizikós lenne a felhasználók jelszavait tárolni a rendszerben. Sokkal biztonságosabb
például a következő eljárás: a számítógép kiválaszt egy nagy p prímszámot (lehetőleg több száz számjegyűt) és egy g
primitív gyököt modulo p. Amikor egy felhasználó jelszót választ, abból valamilyen egyszerű eljárással kialakít egy x
pozitív egész számot, és aztán a gx hatvány p-vel vett m maradékát tárolja a rendszerben. Ezek után minden egyes
belépésnél könnyen ellenőrizheti, hogy a megadott x (számosított) jelszóra teljesül-e a gx ≡ m(mod p) kongruencia. Viszont
ha valaki hozzá is jutna a p prímszámhoz, a g primitív gyökhöz és a tárolt m maradékhoz, abból a jelenleg ismert technikák
alapján lehetetlen belátható időn belül megtalálni az x jelszót (azaz az m szám g alapú diszkrét logaritmusát modulo p).
Titkosításon legtöbbször üzenetek titkosítását értjük. Az alapszituáció, hogy A szeretne egy bizalmas üzenetet küldeni
B-nek, és fennáll a veszélye annak, hogy illetéktelen személyek valamilyen módon hozzájutnak ehhez az üzenethez. Tehát
A szeretné az üzenetét kódolni oly módon, hogy azt csak B fejthesse meg. Feltehetjük, hogy az üzenet természetes
számokból áll (ugyanis vannak egyszerű eljárások arra, hogy szavakból számokat készítsünk, aztán alkalomadtán ezekből a
számokból visszakapjuk az eredeti szavakat). Az üzenetküldés úgy zajlik le, hogy A valahogyan kódolja a számokból álló
mondandóját, ezt továbbítja B felé, végül B egy meghatározott eljárással dekódolja a kapott számokból az eredeti üzenetet.
A lényeg, hogy egyedül B ismerje ezt a megfejtési eljárást.
A kódolás, illetve a dekódolás alapulhat egy rögzített kulcson is, például egy nagy (több száz számjegyű) természetes
számon. (Mondjuk úgy, hogy az adott kulcs számjegyeit hozzáadjuk az eredeti számok számjegyeihez, de számtalan más
lehetőség is van.) Ennek a hátránya az, hogy rendszeres kommunikáció esetén gyakran kell cserélni a kulcsot, ugyanis az
illetéktelenek egy idő után fel tudnák törni. (Erre már nagyon ki nomult és hatékony módszerek vannak.) Viszont ahhoz,
hogy A és B kulcsot cseréljen, megint csak kommunikációra van szükség, amit az illetéktelenek szintúgy lehallgatnak.
A Di e–Hellman-eljárás egy biztonságos kulcsválasztási módszer: A és B nyilvános kommunikáció mellett tud
megegyezni egy olyan természetes számban, amit aztán csak ők ketten ismernek. Az eljárás a következő: A és B választanak
egy nagy p prímszámot és egy g primitív gyököt modulo p. Továbbá A választ egy a és B választ egy b egész számot a [2, p – 2]
intervallumból, de nem ezeket küldik el egymásnak, hanem A kiszámolja ga maradékát modulo p, és B kiszámolja gb
maradékát modulo p – legyenek ezek a számok x és y –, és ezt a két számot cserélik ki egymás közt. Ezek után A kiszámolja
ya maradékát, és B kiszámolja xb maradékát p-vel osztva, és ha jól számoltak, akkor ugyanazt a k eredményt kapják: ez lesz
a kulcs. (Ugyanis ya ≡ (gb)a ≡ (ga) ≡ xb(mod p).) Az illetéktelen lehallgatók meg azért lesznek gondban, mert nincs – legalábbis
egyelőre nem ismert – olyan eljárás, amivel diszkrét logaritmust könnyen lehetne számolni. Márpedig hiába nyilvános a p,
a g, az x és az y, a k kulcshoz vagy az a = indgx, vagy a b = indgy számra is szükség van.
Napjaink leghíresebb nyilvános kódú titkosítási eljárása az RSA-séma, amit R. Rivest, A. Shamir és L. Adleman
publikáltak 1978-ban. A rendszer lényege, hogy nyilvánosságra hozhatunk egy olyan kódolási eljárást, amivel bárki küldhet
nekünk üzenetet, de azt csak mi tudjuk megfejteni. Válasszunk két nagy prímszámot, jelöljük őket p-vel és q-val, legyen
továbbá N = pq, F = φ(N) = (p – 1) (q – 1), E egy olyan egész a [3, N – 2] intervallumban, ami relatív prím F-hez, és végül D az E
szám modulo F inverze. (D viszonylag könnyen kiszámolható: az euklideszi algoritmus segítségével 1-et, mint F és E
legnagyobb közös osztóját felírjuk rF + sE alakban, és D ≡ s mod F.) Amit nyilvánosságra hozunk, az az (N, E) számpár,
viszont szigorúan titokban tartjuk a p, q, F és D számokat. Ha ezek után valaki akar nekünk küldeni egy N-nél kisebb
természetes számban kifejezett x bizalmas üzenetet, akkor kiszámolja xE maradékát modulo N, és ezt az y számot küldi el.
Ekkor mi meg kiszámoljuk yD maradékát modulo N, és visszakapjuk x-et, ugyanis yD ≡ xED ≡ x(mod N), mivel az Euler–
Fermat-tétel alapján xF ≡ 1(mod N), és az ED szorzat 1-et ad maradékul F-fel osztva.
Ahhoz, hogy valaki a kódolt üzenetet megfejtse, ismernie kell a D számot, a D-hez pedig ismernie kell F-et, F-hez pedig
a p és q prímeket, tehát a nyilvánosságra hozott N szám prímtényezős felbontását. Éppen ebben rejlik az RSA-séma
biztonsága, ugyanis a jelenleg ismert faktorizációs eljárásokkal és a rendelkezésre álló számítógépes technológiával is
reménytelen feladat egy 3-400 számjegyből álló szám prímtényezőinek a megtalálása. (Sokkal egyszerűbb eldönteni egy
adott számról, hogy prímszám-e, mint megtalálni a prímosztóit: manapság már tetszőleges 15 ezer jegyű számról is
eldönthető, hogy prím vagy összetett. Így a p és q számok kiválasztásával nem lehet gond.)
Az RSA-séma egy kis nomítással arra is használható, hogy az üzeneteket „aláírjuk”. Ha A szeretne egy üzenetet
küldeni B-nek, és B szeretne meggyőződni arról, hogy az üzenetet valóban A-tól kapta, akkor a következőt tehetik.
Mindketten felállítanak egy-egy RSA-sémát a fentiek alapján, A nyilvánosságra hozza az (NA, EA) számpárt, és megőrzi
magának a DA dekódoló kulcsot, ugyanúgy B nyilvánosságra hozza az (NB, EB) számpárt, és megőrzi magának a DB
dekódoló kulcsot. Mivel NA és NB hatalmas számok, feltehetjük, hogy az x bizalmas üzenet egy mindkettőjüknél kisebb
természetes szám. Ekkor A kiszámolja maradékát modulo NA – jelölje ezt a számot s, majd maradékát
modulo NB – ez pedig legyen y, és ezt küldi el B-nek. Miután B megkapta az y számot, veszi maradékát modulo NB,
ami nem más, mint s, aztán kiszámolja maradékát modulo NA, és így visszakapta az eredeti x üzenetet. Ezzel
lényegében garantálva van, hogy az üzenet valóban A-tól érkezett, ugyanis csak ő tudja x alapján s-et kiszámolni. (Bárki
mástól kapott üzenet esetén mod NA minden bizonnyal valami értelmetlen eredményt adna ki.)
Megoldatlan problémák
A prímszámokkal kapcsolatban végül megemlítünk néhány híres problémát, amik viszonylag egyszerűen
megfogalmazhatók, mégis megoldatlanok mind a mai napig. Az egyik ilyen probléma az ikerprímek kérdése: van-e
végtelen sok belőlük? Ikerprímeknek nevezünk két olyan prímszámot, amik különbsége 2. Például 3 és 5, 5 és 7, 11 és 13
ikerprímek. (Ennél „közelebbi” prímek csak a 2 és a 3, mivel két szomszédos szám közül az egyik biztosan páros.) Eddigi
számítások azt a sejtést támasztják alá, hogy az x-nél nem nagyobb ikerprímek száma aszimptotikusan
, ahol C ≈ 0,660 16, pontosabban az 1 – [1/(p – 1)2] alakú racionális számok szorzata, ahol p végigfut a
páratlan prímszámokon. Ha ez a sejtés igaz, akkor természetesen végtelen sok ikerprím létezik, azonban erre semmi
bizonyítás nincs, csak számítási adatok (kb. x = 1016-ig). Annyi biztos, hogy ha van is végtelen sok ikerprím, a reciprokaik
összege konvergens, és a sorösszeg valahol 1,83 és 2,347 között van. Egy pozitív eredmény, ami kapcsolódik a témához: 1966-
ban Chen Jing-run igazolta, hogy végtelen sok olyan p prímszám van, amire p + 2 vagy szintén prím, vagy két prímszám
szorzata.
Az ikerprímek problémájához hasonlóan az is egy nyitott kérdés, hogy van-e végtelen sok olyan szomszédos számpár,
aminek az egyik tagja prím, a másik tagja pedig egy prím kétszerese.
Egy másik megoldatlan probléma a Goldbach-sejtés (1742-ből), miszerint minden 2-nél nagyobb páros szám előáll két
prímszám összegeként (mint például 10 = 3 + 7). Számítógépes ellenőrzések igazolják, hogy 4-től 1017-ig valóban minden
páros szám megkapható két prímszám összegeként. Chen 1966-ban azt is igazolta, hogy minden „elég nagy” páros szám
előáll egy olyan összeg eredményeképp, aminek az egyik tagja prím, a másik tagja pedig vagy prím, vagy két prímszám
szorzata. A „páratlan” Goldbach-sejtés, miszerint minden 5-nél nagyobb páratlan szám megkapható három prímszám
összegeként, szintén egy megoldatlan probléma, viszont egyenesen következne az eredeti sejtésből (mivel akkor az egyik
tényezőnek választhatnánk 3-at). Vinogradov 1937-ben igazolta, hogy minden „elég nagy” páratlan szám három darab
prímszám összege, aztán később, 1989-ben Chen és Wang konkretizálták az „elég nagy” fogalmát: megmutatták, hogy a
páratlan Goldbach-sejtés igaz minden 1043000-nél nagyobb páratlan számra.
ahol az ai egész együtthatók közül egyik sem nulla. Ez az egyenlet is pontosan akkor oldható meg az egész számok körében,
ha lnko(a1, a2, …, an) osztja c-t. A gyakorlatban ez az egyenlet visszavezethető egy eggyel kevesebb ismeretlenes egyenletre:
legyen y = lnko(an – 1, an), és ekkor az a1x1 + … + an–2xn–2 + by = c egyenlet bármely megoldása az an–1xn–1 + anxn = by egyenlet
egy tetszőleges megoldásával az eredeti egyenlet egy megoldását szolgáltatja.
Pitagoraszi számhármasok
A Fermat-egyenlet
A Pell-egyenlet
A Waring-probléma
Pitagoraszi számhármasok
Egy másik közismert diofantikus egyenlet a pitagoraszi számhármasok egyenlete: x2 + y2 = z2, ahol csak pozitív egész
megoldásokat keresünk. Tehát azt is mondhatjuk, hogy olyan derékszögű háromszögeket keresünk, amiknek az
oldalhosszúságai egész számok. Például (3, 4, 5), (4, 6, 10) és (5, 12, 13) a legegyszerűbb pitagoraszi számhármasok. Egyszerű
észrevétel, hogy egy adott (x, y, z) pitagoraszi számhármasból végtelen sokat tudunk készíteni, ugyanis x2 + y2 = z2 esetén
tetszőleges d természetes szám mellett (xd)2 + (yd)2= (zd)2 szintén teljesül. Egy (x, y, z) számhármast primitív pitagoraszi
számhármasnak nevezünk, ha x2 +y2 = z2 mellett még az is teljesül, hogy lnko(x, y, z) = 1. A fenti észrevétel alapján minden
pitagoraszi számhármas megkapható úgy, hogy egy alkalmas primitív pitagoraszi számhármas minden tagját
megszorozzuk egy adott pozitív egésszel. A primitív pitagoraszi számhármasokat pedig az x = m2 – n2, y = 2mn, z = m2 + n2
képlettel kaphatjuk meg, ahol m és n egymáshoz relatív prím, különböző paritású pozitív egészek, továbbá m > n. Az alábbi
táblázatban felsoroljuk az összes olyan primitív pitagoraszi számhármast, aminek az m és n paraméterei 5-nél nem
nagyobbak.
m n x y z
2 1 3 4 5
4 1 15 8 17
3 2 5 12 13
5 2 21 20 29
4 3 7 24 25
5 4 9 40 41
A Fermat-egyenlet
A pitagoraszi számhármasok egyenletének egy lehetséges általánosítása a Fermat-egyenlet: xn + yn = zn, ahol szintén
pozitív egész megoldásokat keresünk mind a négy ismeretlenre az n ≥ 3 feltétel mellett. Fermat híres sejtése 1637-ből –
miszerint n ≥ 3 esetén az egyenletnek nincs pozitív egészekből álló megoldása – évszázadokig foglalkoztatta matematikusok
és matematikakedvelők ezreit, míg végül 1994-ben Andrew Wilesnak sikerült a sejtést igazolnia. (Wiles tulajdonképpen
1993-ban hozta nyilvánosságra a bizonyítását, de néhány hét múlva találtak benne egy hibát, amit aztán Wiles és Richard
Taylor 1994 őszére sikeresen kijavított.) Bizonyos konkrét kitevőkre már régóta bizonyított volt Fermat sejtése, például az n
= 4 esetre Fermat saját maga adott egy elemi bizonyítást. Euler 1770-ben igazolta a sejtést az n = 3 esetre, aztán 1825-ben
Dirichlet és Legendre egymástól függetlenül bizonyították az n = 5, majd Lamé 1839-ben az n = 7 esetet. Komoly áttörést
jelentett az 1840-es években Ernst Kummer munkája, aki a sejtést minden 100-nál kisebb páratlan prím kitevőre igazolta,
37, 59 és 67 kivételével. Wiles történelmi cambridge-i előadásának az idején, 1993-ban már ismert volt, hogy az xn + yn = zn
egyenletnek semmilyen négymilliónál kisebb (és kettőnél nagyobb) kitevővel nincs pozitív egészekből álló megoldása.
A Fermat-sejtést elég volt páratlan prím kitevőkre, illetve n = 4-re igazolni, ha ugyanis létezne egy an + bn = cn, pozitív
egészekből álló megoldás és n osztható egy p páratlan prímszámmal – mondjuk n =pk, ahol k is egész –, akkor az egyenlőség
átírásával (ak)p + (bk)p = (ck)p, tehát az xp + yp = zp egyenletnek is létezne pozitív egészekből álló megoldása. Ha pedig n olyan
2-nél nagyobb egész, ami nem osztható semmilyen páratlan prímszámmal, akkor csak egy 2-hatvány lehet, és így
többszöröse 4-nek: n = Ak, ahol k szintén egész. Ekkor pedig az an + bn = cn egyenlőségből (ak)4 + (bk)4 = (ck)4, tehát az x4 + y4
= z4 egyenletre is kapnánk egy megoldást, amiről pedig már Fermat óta tudjuk, hogy nincs.
A Pell-egyenlet
A Pell-egyenlet általános alakja x2 – dy2 = k, ahol d és k adott egész paraméterek, és d nem négyzetszám. Ha d és k
mindketten negatívak, akkor x2 – dy2 ≥ 0 és k < 0 miatt az egyenletnek nincs megoldása. Ha d negatív és k pozitív, akkor
|d|y2 ≤ k miatt az egyenletnek csak véges sok megoldása lehet, és ezeket megkaphatjuk úgy, hogy végignézzük az összes
olyan y egész számot, ami közé esik, és megvizsgáljuk, hogy mely esetekben lesz k + dy2 egy
négyzetszám. Ha k = 0, akkor az egyenletből x2 = dy2 és d csak úgy lehetne egész, ha maga is négyzetszám. Általában, ha d =
D2, akkor az egyenlet bal oldala szorzatra bomlik: (x + Dy) (x – Dy) = k, és a megoldásokat megkapjuk a k szám szorzatra
bontási lehetőségeiből. Tehát a Pell-egyenlet megoldása csak akkor igényel komolyabb számelméleti megfontolást, ha d egy
pozitív egész, nem négyzetszám és k ≠ 0.
A k = 1 speciális esetben (amikor is az egyenlet alakja x2 – dy2= 1) x = 1, y = 0 egy triviális megoldás, és bármely nem
triviális megoldásból végtelen sok további megoldás konstruálható (ugyanarra a d-re). Ha ugyanis , akkor a
bal oldalt szorzatra bontva azt kapjuk, hogy , és tetszőleges n természetes szám mellett
. Mivel ekkor
Bármely d pozitív egész mellett, ami nem négyzetszám, az x2 – dy2 = 1 egyenletnek végtelen sok megoldása van az egész
számok körében, és ezek között létezik egy alapmegoldás: olyan x0 és y0 pozitív egészek, amikkel az összes megoldást
megkapjuk az , n ∈ ℤ képlettel.
A Waring-probléma
Közismert és sokat vizsgált számelméleti kérdés, hogy a pozitív egészek hogyan írhatók fel négyzetszámok összegeként.
Mely számok írhatók fel mint két vagy három négyzetszám összege, illetve van-e olyan n természetes szám, hogy n darab
négyzetszám összegeként már felírható minden pozitív egész szám? Ez a kérdés aztán magasabb kitevőkre is
megfogalmazható: adott k kitevő mellett van-e mindig olyan n természetes szám, hogy n darab k-adik hatvány összegeként
felírható minden pozitív egész szám? Ha a válasz igen, akkor természetesen jó lenne megtalálni a legkisebb ilyen n számot
(ami minden bizonnyal függ majd k-tól). Ez a Waring-problémakör.
Négyzetösszegekről a következő igaz:
Bármely pozitív egész felírható négy négyzetszám összegeként. Három négyzetszám összegeként csak a 4k(8m + 7)
alakú egészek nem állnak elő. Két négyzetszám összegeként pedig pontosan azok a pozitív egészek írhatók fel,
amelyeknek a prímfelbontásában minden 4m + 3 alakú prímszám páros hatványon szerepel.
Általában g(k) jelöli azt legkisebb olyan n pozitív egészt, amire igaz, hogy minden természetes szám előáll n darab k-
adik hatvány összegeként, és G(k) azt a legkisebb olyan m pozitív egészt, amivel maximum véges sok kivételtől eltekintve
minden természetes szám előáll m darab k-adik hatvány összegeként – amennyiben ezek a számok léteznek. A fenti tétel
alapján g(2) = G(2) = 4 (ugyanis végtelen sok természetes szám nem írható fel három négyzetszám összegeként), és már a
XIX. században ismert volt, hogy g(k) létezik k = 3, 4, 5, 6, 7, 8, 10-re. David Hilbert igazolta 1909-ben, hogy g(k) (és így G(k)
is) minden k pozitív egész mellett létezik. Valószínűleg érvényes a g(k) = [(3/2)k] + 2k – 2 képlet (bizonyítottan csak véges sok
k érték lehet ez alól kivétel), így például g(3) = 9, g(4) = 19 és g(5) = 37. Továbbá 4 ≤ G(3) ≤ 7, G(4) = 16, 6 ≤ G(5) ≤ 17, 9 ≤ G(6) ≤ 24,
8 ≤ G(7) ≤ 32 és 32 ≤ G(8) ≤ 42. Egy általános eredmény, hogy minden k pozitív egészre k + 1 ≤ G(k) ≤ 6k ln k.
14. Számsorozatok
14.1. A számsorozat fogalma
14.2. A számtani sorozat és tulajdonságai
14.3. A mértani sorozat és tulajdonságai
14.4. Korlátos, monoton, konvergens sorozatok
14.5. A Fibonacci-sorozat
14.6. Magasabb rendű lineáris rekurzív sorozatok, néhány speciális sor
Számsorozatnak nevezzük az olyan függvényt, melynek értelmezési tartománya a pozitív egész számok halmaza (vagy
annak valamely végtelen részhalmaza), értékkészlete pedig a valós számok egy részhalmaza.
A számsorozatot általában {an}-nel jelöljük. A sorozatban részt vevő valós számokat a sorozat tagjainak mondjuk. A
sorozat 1., 2., …, n. tagját általában a1, a2, …, an-nel jelöljük. Ha tehát a sorozatot leíró függvény f, akkor a számsorozat:
b) Egy számsorozat tagjait megadhatjuk úgy is, hogy egyértelmű szöveggel körülírjuk a sorozat tagjainak képzési
szabályát. Például
an: a prímszámok növekvő sorozata: 2, 3, 5, 7, 11, …
an: a négyzetszámoknál eggyel kisebb számok nagyság szerint növekvő sorozata:
an : a 3 nevezőjű, pozitív egész számlálójú racionális számok nagyság szerint növekvő sorozata:
c) Gyakran fordul elő, hogy egy számsorozatot rekurzív módon adunk meg: ez azt jelenti, hogy megadjuk a
számsorozat első néhány (k db) tagját, majd megadjuk azt a képzési szabályt, mely megmutatja, hogy a sorozat minden
további tagja hogyan képezhető a kérdéses tagot megelőző k db tag segítségével. Például
A jobb oldali tört nevezője n = 2 és n = 3 esetén 0, vagyis e két szám esetén a törtnek nincs értelme; így a számsorozatnak
nincs második és harmadik tagja (például ilyen esetekre utal a de nícióban szereplő „vagy annak valamely végtelen
részhalmaza” kifejezés).
A számsorozat tagjait ábrázolhatjuk számegyenesen vagy derékszögű koordináta-rendszerben. Ez utóbbi esetben az
ábrázolt pontok első koordinátái rendre az értelmezési tartomány növekvő tagjai: 1, 2, 3, 4, …, n, …, a pont második
koordinátái pedig a sorozat egymást követő tagjai: a1, a2, a3, a4, …, an, …
Ábrázoljuk pl. az an = 2n + (–1)n sorozat néhány tagját a koordináta-rendszerben! A sorozatnak megfelelő pontok
koordinátái:
(1; 1), (2; 5), (3; 5), (4; 9), (5; 9), (6; 13), (7; 13), … (14.1. ábra).
14.1. ábra
A számtani sorozat olyan számsorozat, melyben bármely két szomszédos tag különbsége a sorozatra jellemző állandó,
azaz minden n > 1 esetén an+1 – an = állandó.
Ezt az állandót d-vel szokás jelölni, és a sorozat különbségének vagy di erenciájának nevezzük. Ha d = 0, akkor a
sorozat minden tagja a1. Ezek szerint a számtani sorozat tagjait a második tagtól kezdve úgy kaphatjuk meg, hogy a
kérdéses tagot megelőző taghoz hozzáadjuk a sorozat di erenciáját:
Könnyen kifejezhetjük a sorozat n-edik tagját az első tag és a di erencia segítségével. Mivel
Vagyis a sorozat n-edik tagját megkapjuk, ha az első taghoz hozzáadjuk a di erencia (n – 1)-szeresét.
A számtani sorozat bármely három szomszédos tagját tekintve a középső a két szélsőnek mindig számtani közepe. Sőt,
az is igaz, hogy a számtani sorozat bármely három olyan tagja, melyek közül a két szélső a középsőre „szimmetrikusan”
helyezkedik el, e három tag közül a középső a két szélső számtani közepe:
Gyakran van szükség a számtani sorozat első n tagjának összegére. Ezt az összeget Sn-nel szokás jelölni.
Példák
1. Számítsuk ki azoknak a kétjegyű számoknak az összegét, melyek 7-tel osztva 2 maradékot adnak!
A kérdéses számok egy olyan számtani sorozat tagjai, melynek első tagja 16, di erenciája 7. Mivel a legnagyobb
olyan kétjegyű szám, amelyik 7-tel osztva 2 maradékot ad 93, ezért an = 93.
A sorozat első 12 tagjának összege:
2. Egy nem állandó számtani sorozat (d ≠ 0) első tagja 3, di erenciája 2-nél nagyobb prímszám. A sorozat első három
tagja négyzetének összege ugyancsak tagja a sorozatnak. Hányadik tagja?
A feltételek szerint valamely k pozitív egész számra
A bal oldal csak akkor lesz egész szám, ha az első tagja egész, azaz, ha d osztója 24-nek. Mivel d 2-nél nagyobb
prím, ezért csak d = 3 lehetséges, és ekkor
Tehát a kérdéses sorozat első három tagja négyzetének összege a sorozatnak a 42. tagja.
3. Egy derékszögű háromszög oldalai egy számtani sorozat egymást követő tagjai. Mekkora a háromszög területe, ha
a kerülete 24 cm?
Legyen a derékszögű háromszög nagyobbik befogója b, a számtani sorozat di erenciája d (14.2. ábra).
14.2. ábra
A mértani sorozat olyan számsorozat, melyben bármely két szomszédos tag hányadosa a sorozatra jellemző állandó,
Ezt az állandót a mértani sorozat hányadosának vagy kvóciensének nevezzük és általában q-val jelöljük. Nyilván q ≠ 0.
Ha q = 1, akkor a sorozat minden tagja az első tag.
Ezek szerint a mértani sorozat tagjait a második tagtól kezdve úgy kaphatjuk meg, hogy a kérdéses tagot megelőző
tagot megszorozzuk a kvócienssel:
Gyakran van szükség a mértani sorozat első n tagjának összegére. Ezt az összeget – a számtani sorozathoz hasonlóan –
Sn-nel szokás jelölni. Ha a mértani sorozat hányadosa 1, vagyis a sorozat minden tagja a1, akkor nyilván
Ha q ≠ 1, akkor
Példák
1. Egy derékszögű háromszög oldalai egy mértani sorozat egymást követő tagjai. Mekkorák a háromszög szögei?
Az általánosság megszorítása nélkül feltehetjük, hogy a háromszög egyik befogója egységnyi, továbbá legyen a
mértani sorozat hányadosa q (14.3. ábra)!
14.3. ábra
2. Egy pozitív tagú nem állandó számtani sorozat első, második és negyedik tagja egy mértani sorozat egymást
követő tagjai. Igazoljuk, hogy ekkor a számtani sorozat első, harmadik és kilencedik tagja ugyancsak egy mértani
sorozat egymást követő tagjai! A feltételek szerint a1, a1 + d, a1 + 3d egy mértani sorozat egymást követő tagjai. Ez
azt jelenti, hogy
Mivel a sorozat nem állandó, azaz d ≠ 0, így azt kapjuk, hogy d = a1.
A számtani sorozat első, harmadik és kilencedik tagja: a1, a1 + 2d, a1 + 8d. Felhasználva az előbb d-re kapott
értéket, ezek a tagok: a1, 3a1, 9a1. Ezek a tagok egy olyan mértani sorozat egymást követő tagjai, melynek
hányadosa q = 3.
3. Állítsuk elő a mértani sorozat első n tagjának a szorzatát!
Igen jól alkalmazhatók a mértani sorozatok a kamatoskamat-, a törlesztőrészlet-, illetve a járadékszámításoknál.
Ha egy A0 összeget év elején n évre, évenként p% kamatra elhelyezünk, akkor n év elteltével a kamatos kamattal
megnövelt összeg, azaz
összeg áll rendelkezésünkre. Ez tulajdonképpen egy olyan mértani sorozat, melynek első tagja A0, hányadosa pedig:
Ha minden év elején elhelyezünk egy A0 összeget évi p%-os kamatra, akkor kérdezhetjük, hogy mennyi lesz betétünk
értéke n év múlva. A betét értéke n év múlva:
A zárójelben egy olyan mértani sorozat tagjai szerepelnek, melynek első tagja 1, hányadosa q, így azt kapjuk
Ha K0 kölcsönt veszünk fel évi p%-os kamatra, és évenként egyenlő t törlesztést vállalunk, akkor n év múlva még
fennálló Tn tartozásunk:
Ha e K0 kölcsönt n év alatt szeretnénk vissza zetni, akkor az éves egyenlő t törlesztőrészlet kiszámításához vegyük
gyelembe, hogy ez utóbbi kifejezésben Tn = 0. Ekkor
Ha elhelyezünk a bankban egy A0 összeget p%-os kamatra, s minden év végén a kamatos kamattal növelt összegből
ugyanannyi r összeget felveszünk, akkor n év múlva a bankkal szemben fennálló An követelésünk:
Példák
1. Egy bizonyos évtől kezdődően minden év elején elhelyeztünk 150 000 Ft összeget egy bankban, évi 12%-os
kamatra. Mennyi pénzünk lesz 7 év múlva? Hány év alatt duplázódik meg a pénzünk?
Hét év múlva pénzünk
Vegyük mindkét oldal 10-es alapú logaritmusát, majd alkalmazzuk a logaritmus megfelelő azonosságát!
4. Egy A bankban elhelyeztünk 600 000 Ft-ot évi 14%-os kamatra. Egy másik B bankban 800 000 Ft-ot helyeztünk el
évi 12%-os kamatra. Hány év elteltével ér többet az A bankban elhelyezett betétünk, mint a B bankban elhelyezett
betét?
Ha n év múlva az A bankban elhelyezett betét már legalább akkora, mint a B bankban elhelyezett betét, akkor
Tehát a 17. évben „éri utol” az A bankban elhelyezett összeg a B bankban elhelyezett összeget. (Az utolsó lépésnél –
ne feledjük el – negatív számmal osztottunk.)
Példák
1.
. Írjuk ki a sorozat első néhány tagját: , … Az lehet a sejtésünk, hogy ez a sorozat
szigorúan monoton növekvő sorozat. Ennek igazolásához vizsgáljuk meg a következő egyenlőtlenséget: vajon
igaz-e minden n-re, hogy
Ez utóbbi egyenlőtlenség nyilván minden n-re igaz, tehát a sorozat valóban szigorúan monoton növekedő.
2.
. A sorozat első néhány tagja: , … Most azt sejtjük, hogy a sorozat szigorúan
monoton csökkenő. Hogy ez valóban így van, ahhoz azt kell megmutatnunk, hogy minden n-re an > an+1, vagyis
Ez utóbbi egyenlőtlenség nyilván minden n-re igaz, így a sorozat valóban szigorúan monoton csökkenő.
3.
. A sorozat első néhány tagja: , … Nyilvánvaló, hogy a sorozat tagjai
váltakozó előjelűek, így e sorozat sem nem szigorúan monoton növekvő, sem szigorúan monoton csökkenő.
(Szokás az ilyen számsorozatot oszcilláló sorozatnak nevezni.)
Az {an} sorozatot felülről korlátosnak mondjuk, ha létezik olyan K valós szám, hogy minden n-re an ≤ K. A K számot a
sorozat egy felső korlátjának nevezzük.
Az {an} sorozatot alulról korlátosnak mondjuk, ha létezik olyan k valós szám, hogy minden n-re an ≥ k. A k számot a
sorozat egy alsó korlátjának nevezzük.
Az olyan számsorozatot mely felülről is és alulról is korlátos, korlátos sorozatnak nevezzük.
Nyilvánvaló, hogy ha egy sorozat felülről korlátos, akkor végtelen sok felső korlátja van, hiszen, ha K* > K, akkor K* is
egy felső korlát. Ugyanez természetesen elmondható az alulról korlátos sorozatokra is.
Nézzünk néhány példát korlátos (és nem korlátos) sorozatokra!
Példák
1.
Az előző 1. példában említett sorozatról beláttuk, hogy szigorúan monoton növekvő sorozat. Most
belátjuk, hogy felülről korlátos. Ugyanis minden n-re an < 2.
Ami nyilvánvaló. Mivel e sorozat alulról is korlátos (hiszen minden tagja pozitív, tehát egy alsó korlátja pl. a 0),
így e sorozat korlátos sorozat.
2.
Az előző 2. példában említett sorozat szigorúan monoton csökkenő.
Mivel minden tagja (az első kivételével) negatív, ezért felülről korlátos; egy felső korlátja pl. a 0. Vajon alulról
korlátos-e? Azaz létezik-e olyan k valós szám, hogy minden n-re an ≥ k?
Ez utóbbi egyenlőtlenség nem teljesülhet minden n-re, hiszen ennek az n-ben másodfokú kifejezésnek a gra kus
képe egy felfelé nyíló parabola, így nem lehet minden n-re kisebb-egyenlő 0. Tehát ez a sorozat alulról nem
korlátos, azaz minden határon túl csökken.
Nagy jelentőséggel bírnak azok a sorozatok, melyeknek van határértéke. Az ilyen sorozatokat konvergens
sorozatoknak nevezzük.
Az {an} sorozat konvergens, és határértéke az A szám, ha minden ϵ > 0 valós számhoz létezik olyan n0 pozitív egész
szám, hogy ha n > n0, akkor
Az A számot a sorozat határértékének mondjuk, az n0 pozitív egész számot pedig a kérdéses ϵ-hoz tartozó
küszöbindexnek nevezzük. Mindezt az alábbi módon jelöljük:
Mindez szemléletesen azt jelenti, hogy a sorozat tagjai „egyre közelebb” kerülnek az A számhoz, s az A számnak
bármilyen pici ϵ sugarú környezetét is vesszük, egy bizonyos tagtól kezdve a sorozat összes többi tagja már közelebb van A-
hoz, mint a kérdéses ϵ, azaz e tagtól kezdve a sorozat összes tagja benne van az A ϵ sugarú környezetében. Másképpen ezt
úgy is megfogalmazhatjuk, hogy az A számnak ϵ sugarú környezetében a sorozatnak végtelen sok tagja van, azon kívül
pedig csak véges.
Példák
1.
Első példaként tekintsük az sorozatot! A sorozat néhány kezdő eleme: , … Azt
látjuk, hogy a sorozat szigorúan monoton növekvő, ugyanakkor korlátos, hiszen minden tagja pozitív, s például
minden n-re an < 1. Megmutatjuk, hogy a sorozat konvergens, és a határértéke 1. Ugyanis
Adjuk meg pl. az ϵ = 10–4 értéket, s nézzük meg, a sorozat hányadik tagjától kezdve lesznek a sorozat tagjai
közelebb 1-hez, mint a megadott ϵ!
Tehát az 19 999. tagtól kezdve a sorozat minden tagja kevesebbel tér el az 1-től, mint 10–4, mondhatnánk úgy is,
hogy az 1 szám 10–4 sugarú környezetében a sorozatnak végtelen sok tagja van, azonkívül pedig csak véges,
pontosan 19 998.
2.
Legyen ! A sorozat első néhány tagja: , …. Látjuk, hogy a sorozat nem
monoton, de korlátos, hiszen minden tagja –1 és 1 között van. A sorozat tagjait érdemes szemléltetni a
számegyenesen (14.4. ábra).
14.4. ábra
Azt látjuk, hogy a sorozat tagjai a 0 körül „ugrálva” egyre közelebb kerülnek a 0-hoz. Bármilyen pici ϵ sugarú
környezetét vesszük is a 0-nak, a sorozat tagjai előbb-utóbb e környezetbe kerülnek, s így valamely tagtól kezdve a
sorozatnak már minden tagja kevesebbel tér el a 0-tól, mint az adott ϵ. Vagyis e sorozat konvergens és
Természetesen nem minden sorozat rendelkezik a fenti tulajdonsággal, vagyis nem minden sorozat konvergens.
Azt mondjuk, hogy az {an} sorozat tart +∞-hez, ha tetszőleges K valós számhoz létezik olyan n0 pozitív egész szám, hogy
n > n0 esetén an > K.
Azt mondjuk, hogy az {an} sorozat tart –∞-hez, ha tetszőleges k valós számhoz létezik olyan n0 pozitív egész szám, hogy
n > n0 esetén an < k.
14.5. ábra
A határérték de níciójának következményeként az A szám ϵ sugarú környezetében a sorozatnak végtelen sok tagja
van, azonkívül csak véges. De B is határérték, ezért a B szám ϵ sugarú környezetében a sorozatnak ugyancsak
végtelen sok tagja van, azonkívül csak véges. Mivel az A és B körüli ϵ sugarú környezeteknek nincs közös része, így
ellentmondásra jutottunk, vagyis valóban, ha az an sorozat konvergens, akkor csak egy határértéke van.
Ez tehát azt jelenti, hogy ha az an és bn konvergens sorozatok határértéke megegyezik, és a cn sorozat minden tagja az
an és bn sorozatok megfelelő tagja közé esik, akkor a cn sorozat is konvergens, és határértéke megegyezik az an és bn
sorozatok határértékével.
Bizonyítás. Ennek igazolásához vegyük az A szám egy tetszőleges ϵ > 0 környezetét! A feltételek szerint az an sorozat
esetében van olyan N1 pozitív egész szám, hogy n > N1 esetén a sorozat tagjai az A szám ϵ sugarú környezetébe esnek.
De a bn sorozat esetében is található olyan N2 küszöbindex, hogy n > N2 esetén a sorozat tagjai már az ϵ sugarú
környezetbe esnek. Legyen N2 > N1. Ekkor mindkét sorozat esetében n > N2-re a sorozatok minden tagja az A szám ϵ
sugarú környezetébe esik. De minden n-re an ≤ cn ≤ bn, így a cn sorozatnak ugyancsak minden ilyen indexű tagja az A
szám ϵ sugarú környezetébe esik, és éppen ezt kellett igazolnunk.
Érdemes megvizsgálni azt a kérdést, hogy ha konvergens sorozatokkal bizonyos műveleteket végzünk, akkor e
műveletek hogyan vihetők át a kérdéses sorozatok határértékére. Erről szólnak a de níció alapján könnyen igazolható
határértéktételek.
Ekkor
1. ,
2. ,
3. ,
4.
, itt természetesen bn ≠ 0 és B ≠ 0.
Példák
1. Vizsgáljuk meg, konvergens-e az alábbi számsorozat, és ha igen, mi a határértéke:
A fenti szabályokat tovább alkalmazva, a számláló első tagjának határértéke 3, a többi tag pedig 0-hoz tart, a
nevező esetében az első tag határértéke 6, a többi tag szintén 0-hoz tart. Ezek szerint az an sorozat konvergens és
racionális törtfüggvény alakú sorozat hogyan viselkedik a konvergencia szempontjából. Ha r > k (tehát a számláló
magasabb fokú, mint a nevező), akkor a sorozat nem konvergens, határértéke +∞ vagy –∞, aszerint hogy br és ck
(vagyis a legmagasabb fokú tagok együtthatói) előjele megegyezik vagy különböző.
Ha r < k (vagyis a nevező magasabb fokú, mint a számláló), akkor a sorozat konvergens, és határértéke 0 : an → 0.
Végül, ha r = k, akkor a sorozat konvergens, és határértéke a legmagasabb fokú tagok együtthatóinak a
hányadosa.
2. Vizsgáljuk meg az sorozatot. Ezt még így is írhatjuk:
Igazoljuk, hogy a sorozat alulról korlátos, szigorúan monoton csökkenő, és határozzuk meg a határértékét!
Írjuk fel a bal oldali n tényezős szorzatra a számtani és mértani közép közötti egyenlőtlenséget
(itt az tényező n-szer szerepel). Írjuk fel erre a szorzatra a számtani és mértani közép közötti egyenlőtlenséget:
Azt látjuk tehát, hogy e sorozat szigorúan monoton növekvő, felülről korlátos, vagyis konvergens. E sorozat
határértékét e-vel jelöljük.
Az e számról kimutatható, hogy irracionális és transzcendens szám (azaz nem létezik olyan egész együtthatós polinom,
amelynek e gyöke lenne). Az e szám nyolc tizedes pontossággal: e ≈ 2,718 281 82.
Egy másik fontos számsorozat, amelynek n-edik tagja valamely mértani sorozat első n tagjának összege. Legyen an egy
mértani sorozat, melynek első tagja a1, hányadosa q, és legyen Sn az alábbi számsorozat:
A mértani sorozat összegeiből ilyen módon képzett számsorozatot mértani sornak nevezzük.
A mértani sorozat összegképletét felhasználva állapítsuk meg, lesz-e és ha igen, mi lesz a végtelen mértani sor
határértéke.
Ha |q| < 1, akkor qn → 0, ha n tart végtelenhez, így
Példák
1.
Egy a oldalú négyzet mellé írtunk egy oldalú négyzetet, emellé egy újabb négyzetet, melynek oldala az
előbbi négyzet oldalának kétharmada, és így tovább (14.6. ábra). Mekkora lesz az így lerajzolt végtelen sok négyzet
területének összege?
14.6. ábra
Az első négyzet területe a2. A második négyzet területe . Az egymás után lerajzolt négyzetek területei egy
mértani sorozat egymást követő tagjai. E végtelen sok négyzet területének összege egy olyan mértani sor
2. Tudjuk, hogy a végtelen szakaszos tizedes törtek racionális számok, azaz felírhatók két egész szám
hányadosaként. Melyik két egész szám hányadosa A kérdéses szám az alábbi végtelen mértani sor
határértéke:
14.5. A Fibonacci-sorozat
Leonardo Pisano (Fibonacci) 1202-ben publikált Liber Abaci című munkájában tette fel az alábbi kérdést: „Hány pár nyúl
származik egyetlen pár nyúltól, ha minden pár havonta új párnak ad életet, és az újszülöttek két hónapos koruktól lesznek
ivarérettek?”
Az első hónapban egyetlen pár nyúl van, a másodikban szintén. A harmadik hónapban már két pár nyúl lesz: az eredeti
pár és ennek két hónapos korában született új pár. A negyedik hónapban az eredeti nyúlpár újabb nyúlpárnak ad életet, az
elsőszülött ivadékok még nem szülnek, így három pár nyúl lesz. E gondolatsort folytatva nézzük, hány pár nyúl lesz az n-
edik hónapban. (A 14.7. ábrán üres karika jelzi az újszülött nyúlpárokat, kereszttel ellátott karika az egy hónapos
nyúlpárokat, szürke karika a 2 hónapos vagy annál idősebb nyúlpárokat.)
14.7. ábra
Az n-edik hónapban levő nyúlpárok száma egyrészt az n – 1-edik hónapban meglevő nyúlpárok száma, másrészt az
újszülött párok száma. De az újszülött párok száma megegyezik az n – 2-edik hónapban levő párok számával, hiszen
pontosan azok és csak azok fognak szülni az n-edik hónapban, akik (akár öregek, akár újszülöttek) az n – 2-edik hónapban
megvoltak.
Jelöljük fn-nel az n-edik hónapban meglevő nyúlpárok számát, így kapjuk az alábbi számsorozatot:
2. A sorozat első n tagja négyzetének összege egyenlő az n-edik és n + 1-edik tag szorzatával:
3.
.
4. A sorozat páros, illetve páratlan indexű tagjainak összege:
5. A sorozat bármely tagjának négyzete a szomszédos tagok szorzatától eggyel tér el:
Megjegyzés. A Fibonacci-sorozat fenti tulajdonságainak mindegyikét könnyen igazolhatjuk pl. teljes indukcióval.
Példaként igazoljuk a 2. és a 9. tulajdonságot!
Ez utóbbi egyenlőség bal oldalának első k db tagjának helyébe beírhatjuk az előbbi egyenlőség jobb oldalát, így
azt kapjuk:
(14.1)
egyenlőséget felhasználva azt kapjuk, hogy fk–1 és fr–1 maradéka is megegyezik m-mel osztva. Most ismét alkalmazva
a (14.1) egyenlőséget azt kapjuk, hogy fk–2 és fr–2 osztási maradékai is megegyeznek. Folytatva az eljárást – egymás
után alkalmazva a (14.1) egyenlőséget – arra jutunk, hogy fk– (r_2) és fr– (r_2) = f2 maradékai is, valamint az fk–(r–1) és fr–
(r–1) = f1 maradékai is megegyeznek m-mel osztva. Mivel f2 és f1 m-mel osztva 1 maradékot ad, így a (14.1) egyenlőség
alapján
A Fibonacci-sorozat és a Pascal-háromszög között igen szoros kapcsolat van, melyet az alábbi egyenlőséggel
fejezhetünk ki: legyen k < n pozitív egész szám:
Ez utóbbi másodfokú egyenlet pozitív megoldása: , az „aranymetszés” jól ismert arányszáma. Tehát a
Fibonacci-sorozat szomszédos tagjai hányadosának a határértéke:
kezdőelemekkel és az
0. 1 1 1
1. 1 1 1
2. 1 1 1
3. 3 1 1
4. 5 4 1
5. 9 7 5
6. 17 13 9
7. 31 25 17
8. 57 49 33
9. 105 94 65
Megjegyzés. A Fibonacci-sorozat tulajdonságai közül sok általánosítható az általánosabb k-adrendű sorozatra is.
Ezek közül említünk néhányat.
1. Ha k = 3, akkor az általános Fibonacci-sorozat n-edik tagja:
2. Az előző fejezetben láttuk, hogy az eredeti Fibonacci-sorozat bármely két szomszédos eleme relatív prím. A fenti
táblázatból könnyen kiolvasható, hogy a magasabb rendű Fibonacci-sorozatokra általában ez már nem igaz. Igaz
azonban, hogy bármely k db egymás után következő tagra
3. Láttuk a Fibonacci-sorozatnál, hogy bármely pozitív egész számnak van többszöröse a sorozatban. Általános
esetben ez sem igaz: Ha Fn a k-adrendű Fibonacci-sorozat, akkor a sorozatnak nincs k – 1-gyel osztható tagja.
4. A k-adrendű Fibonacci-sorozat és a k-adik Pascal-háromszög között hasonló kapcsolat áll fenn, mint az eredeti
Fibonacci-sorozat és a Pascal-háromszög között. Ezt k = 3 esetre ismertetjük.
„Harmadik Pascal-háromszögnek” nevezzük az egész számok alábbi elrendezését:
A 0. sorba egy 1-est, az első sorban szimmetrikusan három 1-est írunk. Minden további elemet úgy kapunk, hogy a
közvetlen fölötte levő, valamint az attól eggyel jobbra, illetve balra levő elemet összeadjuk. Kimutatható, hogy a
harmadik Pascal-háromszög n-edik sorának elemei az
polinom együtthatói, továbbá, hogy a harmadik Pascal-háromszög n-edik sorában levő elemek összege éppen 3n.
A harmadrendű Fibonacci-sorozat elemeire:
ahol cjk a harmadik Pascal-háromszög k-adik sorának j-edik eleme.
Teljes indukcióval igazolhatók az alábbi egyenlőségek:
1. Az első n darab pozitív egész szám összege
15.1. Függvény
15.2. Polinomfüggvények
15.3. Racionális törtfüggvények
15.4. Exponenciális és logaritmusfüggvények
15.5. Trigonometrikus függvények
15.6. Hiperbolikus függvények
15.1. Függvény
Adott A és B valós halmazok. Ha az A halmaz minden eleméhez hozzárendelünk pontosan egy B halmazbeli elemet,
akkor ezt a hozzárendelést függvénynek vagy leképezésnek nevezzük. Jele: f : A → B vagy f ↦ f(a). Az A halmazt a
függvény értelmezési tartományának (Df), a B halmazt a függvény képhalmazának nevezzük (15.1. ábra).
15.1. ábra
Ha f : A → B függvény, akkor bármely A-beli a esetén a B-beli f(d) elemet az f függvény a-beli helyettesítési értékének
vagy függvényértékének nevezzük. Az f függvény helyettesítési értékeinek halmazát a függvény értékkészletének
nevezzük, és Rf-fel jelöljük.
Mivel bármely (x; f(x)) valós számpár meghatároz egy pontot a síkon, ezért az {(x; f(x) : x ∈ A)} halmaz ábrázolható
Descartes-koordináta-rendszerben, és ezt a függvény gra konjának nevezzük (15.2. ábra).
15.2. ábra
Példák
1. Ha minden élő emberhez egy adott pillanatban hozzárendeljük az életkorát, a testsúlyát, a csillagjegyét, akkor
függvényt kapunk. Ha az állampolgárságát, akkor nem kapunk függvényt (a problémát a kettős állampolgárság
okozza).
2. Ha a világ országaihoz (A halmaz) hozzárendeljük a fővárosukat (B halmaz), akkor ez a hozzárendelés nem
függvény, hiszen vannak olyan országok, amelyeknek két fővárosuk van (például Hollandia).
3. Ha minden racionális számhoz hozzárendeljük az abszolút értékét, akkor függvényt kapunk (f : Q → Q, x ↦ |x|).
azon legbővebb részhalmazának tekintjük, amelyen a függvény értelmezhető. Ezek szerint az kifejezés
értelmezési tartománya az R\{1} halmaz.
Függvénytranszformációk
Műveletek függvények között
Tulajdonságok
Függvénytranszformációk
Függvénytranszformációkkal egy-egy függvénytípus valamely függvényéből, a hozzárendelési szabály bizonyos
megváltoztatásával ugyanolyan típusú függvényeket állíthatunk elő. A hozzárendelési szabály megváltoztatása kétféle
módon történhet:
- a függvényérték megváltoztatásával (függvényérték-transzformáció)
15.3. ábra
15.4. ábra
Megjegyzés. Vegyük észre, hogy ha c > 0, akkor az f(x + c) függvény c-vel előbb veszi fel azt az értéket, amit f(x) felvesz
x-ben, és ha c < 0, akkor pedig c-vel később.
Átalakítás ellentettel
- A függvényérték ellentettje. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett – f(x) lesz. Geometriailag a gra kon
minden pontját az x tengelyre tükrözzük (15.5. ábra).
- A függvényváltozó ellentettje. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett f(–x) lesz. Geometriailag a
gra kon minden pontját az y tengelyre tükrözzük (15.6. ábra).
15.5. ábra
15.6. ábra
Geometriailag ez egy olyan merőleges a nitás, amelynek a tengelye az y tengely, aránya pedig . Ha c > 1, akkor az x
tengellyel párhuzamos összenyomásról, ha 0 < c < 1, akkor az x tengellyel párhuzamos nyújtásról beszélünk (15.8. ábra).
15.7. ábra
15.8. ábra
Egy f : A → B függvény injektív, ha B halmaz egy elemére legfeljebb egy A-beli elemet képez.
Megjegyzés. Ha f : A → B függvény injektív, akkor az értékkészlet részhalmaza a képhalmaznak (15.10. ábra).
15.9. ábra
15.10. ábra
Egy f : A → B függvény bijektív vagy más szóval kölcsönösen egyértelmű, ha szürjektív és injektív.
Megjegyzés. Ha f : A → B függvény bijektív, akkor a B halmaz minden elemére pontosan egy A-beli elemet képez.
Egyszerű következmény, hogy az értelmezési tartomány és a képhalmaz (ami egyben az értékkészlet is) egyenlő
elemszámú halmazok (15.11. ábra).
15.11. ábra
Két függvény egyenlő, ha értelmezési tartományuk megegyezik, és az értelmezési tartomány ugyanazon eleméhez a
képhalmaz ugyanazon elemét rendelik.
Példák
1. Az előző példában az f a g leképezésnek az R \{–1} halmazra vett leszűkítése, és a g pedig a h függvény R halmazra
vonatkozó kiterjesztése.
2. Az általános iskolában a hatványozást csak (pozitív) egész kitevőre szokás tanítani, majd a középiskolában
terjesztik ki a racionális kitevőre. Az x ↦ an, n ∈ Z függvény kiterjesztése a racionális számok halmazára az x ↦ ar,
r ∈ Q függvényt eredményezi.
Megjegyzés. f ○ g általában nem egyenlő g ○ f-fel. Az f ○ g függvényt szokás összetett függvénynek is nevezni.
15.12. ábra
H-nak önmagára való olyan leképezését, melynél ∀ elem képe önmaga, H identikus leképezésének nevezzük. Jele: idH
: H → H, x ↦ x.
Legyenek f : R → R, g : R → R függvények.
Ekkor (f + g) függvényt f és g összegfüggvényének nevezzük, és (f + g)(x) := f(x) + g(x), ∀ x ∈ D(f + g) esetén, ahol D(f + g)
:= D(f) ∩D(g).
Az (f – g) függvényt f és g különbségfüggvényének nevezzük, és (f – g)(x) := f(x) – g(x), ∀ x ∈ D(f – g) esetén, ahol D(f – g)
:= D(f) ∩D(g).
Az (α · f) függvényt konstansszoros függvényének nevezzük, és (α · f)(x) := α · f(x), ∀ x ∈ D(α · f) esetén, ahol D(α · f) :=
D(f).
Az (f · g) függvényt f és g szorzatfüggvényének nevezzük, és (f · g)(x) := f(x) · g(x), ∀ x ∈ D(f · g) esetén, ahol D(f · g) := D(f)
∩D(g).
Megjegyzés. Ha valamely f : A → B függvény esetében a hozzárendelés irányát megfordítva B-t A-ba leképező
függvényt kapunk, akkor az f függvényt invertálhatónak, a kapott f–1 : B → A függvényt f inverz függvényének
nevezzük (15.13. ábra).
A függvény értékkészlete megegyezik az inverzének az értelmezési tartományával. Az inverz függvény értékkészlete
megegyezik a függvény értelmezési tartományával.
Ha f függvény invertálható, akkor f–1 ○ f = idA, f ○ f–1 = idB.
15.13. ábra
Tulajdonságok
Zérushely, y-tengelymetszet
Paritás
Periodicitás
Korlátosság
Monotonitás
Konvexitás
Szélsőértékek
Zérushely, y-tengelymetszet
Paritás
Megjegyzés. A függvények paritás szempontjából nem úgy viselkednek, mint a természetes számok. Sok függvény se
nem páros, se nem páratlan (pl. f(x) = x + 1), sőt olyan is van, amely páros és páratlan is egyben (pl. f(x) = 0).
Periodicitás
Az f függvény periodikus, ha van olyan p ≠ 0 valós szám, amire minden valós x-re x ∈ Df pontosan akkor teljesül, ha x +
p ∈ Df, és minden x ∈ D-re f(x) = f(x + p).
Korlátosság
Az f függvényt felülről korlátosnak nevezzük, ha létezik olyan K szám, amire minden x ∈ Df esetén f(x) ≤ K. K-t az f
függvény felső korlátjának nevezzük.
Ha egy függvény felülről korlátos, akkor végtelen sok felső korlátja van.
Az f függvényt alulról korlátosnak nevezzük, ha létezik olyan k szám, amire minden x ∈ Df esetén f(x) ≥ k. k-t az f
függvény alsó korlátjának nevezzük.
Ha egy függvény alulról korlátos, akkor végtelen sok alsó korlátja van.
Az f függvény pontosan akkor korlátos, ha létezik olyan M szám, amire minden x ∈ Df esetén |f(x) | ≤ M. M a függvény
korlátja.
Példák
1. Az x ↦ sin x függvénynek létezik alsó korlátja, a –1, létezik felső korlátja, az 1, tehát a függvény korlátos. | sin x| ≤ 1,
ezért korlátja az 1.
2.
Az függvénynek létezik alsó korlátja, tehát a függvény alulról korlátos, a függvénynek nincs
felső korlátja, tehát felülről nem korlátos. Tehát a függvény nem korlátos.
A példabeli függvény alulról korlátos, tehát végtelen sok alsó korlátja van. Felmerül a kérdés, hogy van-e ezek között
legnagyobb?
Legyen f : A → B egy felülről korlátos függvény. Az f függvény szuprémumának nevezzük a legkisebb felső korlátját.
Legyen f : A → B egy alulról korlátos függvény. Az f függvény in mumának nevezzük a legnagyobb alsó korlátját.
Megjegyzés. Egy korlátos függvénynek mindig van in muma és szuprémuma. Később tárgyaljuk a szuprémum és az
in mum pontosabb de nícióját.
Monotonitás
Ha az f függvény szigorúan monoton (növő vagy csökkenő), akkor az értelmezési tartománya és értékkészlete közötti
hozzárendelés bijektív, tehát a függvény invertálható.
Megjegyzés. Az állítás megfordítása nem igaz, hiszen léteznek invertálható, de nem szigorúan monoton függvények.
Konvexitás
Az f függvény konvex az f intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr alatt van [a;
b]-on, azaz
Az f függvény szigorúan konvex az I intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr
alatt van [a; b] -on, azaz
Az f függvény konkáv az f intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr alatt van [a;
b]-on, azaz
Az f függvény szigorúan konkáv az I intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr
alatt van [a; b]-on, azaz
Az f függvény pontosan akkor konvex az I intervallumon, ha – f konkáv az I intervallumon.
Szélsőértékek
15.2. Polinomfüggvények
A függvény tulajdonságainak megismerése után meghatározunk néhány elemi függvényt. Legyen A a valós számok
halmazának egy nem üres részhalmaza.
Vizsgáljuk meg, hogy az előbbi egyszerű függvények segítségével milyen további függvényeket hozhatunk létre!
Használjuk fel ehhez az előző pontban tárgyalt függvényműveleteket!
Az a) függvényből valamely c ∈ R konstanssal való szorzás felhasználásával az x ↦ c, ∀x ∈ A konstansfüggvényt kapjuk.
A függvények közötti szorzást alkalmazhatjuk úgy a b) függvényre, hogy önmagával megszorozzuk. Ekkor megkapjuk
az x ↦ x2, ∀x ∈ A másodfokú függvényt, majd ezt és a b) függvényt összeszorozva az x ↦ x3, ∀x ∈ A harmadfokú függvényt.
Ezt az eljárást folytatva egy tetszőleges n pozitív számra, megkaphatjuk az x ↦ xn, ∀x ∈ A pozitív egész kitevős
hatványfüggvényt.
A hatványfüggvényeket konstanssal szorozva, a kapott kifejezéseket összeadva, majd a konstansfüggvényt mindehhez
hozzáadva megkapjuk a p(x) = anxn + an–1xn–1 + … + a1x + a0 alakú függvényeket, amiket polinomfüggvényeknek szokás
nevezni.
alakú függvényt értünk, amelyben az a0, a1, …, an együtthatók adott valós számok, x értéke pedig tetszőleges valós
értéket felvehet. Az n számot p fokszámának nevezzük, és deg p-vel jelöljük. A nem azonosan nulla konstans
függvények fokszáma 0. Az an együtthatót a polinom főegyütthatójának nevezzük.
A másodfokú függvény
A másodfokú függvény tulajdonságai
A másodfokú függvény
A másodfokú függvény általános alakja: f(x) = ax2 + bx + c(x ∈ R, a ≠ 0, a, b, c ∈ R).
Ha ábrázolni szeretnénk, akkor f(x) = a(x – u)2 + v, (x ∈ R, a ≠ 0, a, u, v ∈ R) alakra kell hozni, és ezután a megfelelő
függvénytranszformációkat elvégezni.
Az általános alakból teljes négyzetté alakítás után azt kapjuk, hogy
A függvény képe parabola (15.14. ábra). A parabola csúcspontjának koordinátái: C(u; v).
15.14. ábra
Legyen az f(x) = anxn + an–1xn–1 + … +a1x+a0 és a g(x) = bmxm + bm–1xm–1 + … + b1x + b0 két polinom. Írjuk fel az
hányadosfüggvényt!
Megjegyzés. A racionális törtfüggvény értelmezési tartománya nem tartalmazza a nevezőben lévő polinom gyökeit.
Speciális esetek
Lineáris törtfüggvény
A lineáris törtfüggvény tulajdonságai
Speciális esetek
A negatív egész kitevős hatványfüggvény: f(x) = x–n.
A lineáris törtfüggvény: .
Lineáris törtfüggvény
Y-tengelymetszet: .
n > 0 esetén
n = 0 esetén a0 = 1, ha a ≠ 0;
Tehát, ha n nem pozitív, akkor ki kell zárnunk azt az esetet, hogy az a szám nulla lehessen.
Azonosságok
Az exponenciális függvény tulajdonságai
A logaritmusfüggvény
A logaritmusfüggvény tulajdonságai
Azonosságok
Ha a > 1, akkor an szigorúan monoton nő, vagyis n > m esetén an > am.
Ha 0 < a < 1, akkor an szigorúan monoton csökken, vagyis n > m esetén an < am.
Most terjesszük ki az n szám számkörét a racionális számok halmazára! Ehhez az szükséges, hogy az a szám ne legyen
negatív, hiszen -et nem értelmezzük. (Nincs olyan valós szám, amelynek a négyzete –1.)
Ha a pozitív valós, n pedig pozitív egész, akkor legyen
Bármely r racionális szám felírható alakban, ahol n egész, m pedig pozitív egész, és n és m relatív prímek.
Ekkor
A hatványozást a permanenciaelv értelmében úgy terjesztettük ki pozitív egész kitevőről racionális kitevőre, hogy az
azonosságok és a szigorú monotonitás érvényben maradtak. Most pedig ugyanezen kívánalmak mellett de niáljuk a
hatványozást bármely valós kitevőre.
Megjegyzés. A felső határ egyértelműségéből adódik, hogy az azonosságok és a szigorú monotonitás érvényben
marad.
Ezek után két fontos függvényt de niálhatunk attól függően, hogy az aα valós kitevőjű hatványban az alapot vagy a
kitevőt rögzítjük. Először legyen rögzítve az α kitevő! Ekkor az x pozitív valós alaptól függ az f(x) = xα leképezés.
Most rögzítsük az a pozitív valós számot! Ekkor az x valós kitevőtől függ az f(x) = ax leképezés.
Legyen a rögzített pozitív valós, x valós szám. Az f(x) = ax függvényt a alapú exponenciális függvénynek nevezzük.
Megjegyzés. Az elnevezést az indokolja, hogy a kitevő latinul exponens, és itt a változó a kitevőben szerepel.
Olykor x ↦ ax-nel vagy egyszerűen csak ax-nel fogjuk jelölni. Az a = 1 alap nagyon egyszerű eredményre vezet. Bármely
α valós szám esetén 1α = 1.
A továbbiakban olyan exponenciális függvényeket jellemzünk, amelyeknek az alapja 1-től különböző.
A logaritmusfüggvény
Az a ≠ 1 esetén keressük az y = ax egyenlet megoldásait. Az x-re egyetlen megoldást kapunk, amit loga y-nal jelölünk.
Belátható, hogy az y ↦ loga y éppen az x ↦ ax függvény inverz függvénye lesz.
Legyen az a ≠ 1 rögzített pozitív valós szám. Ekkor az x ↦ ax a alapú bijektív exponenciális függvény inverzét a alapú
exponenciális függvénynek nevezzük, és x ↦ loga x-szel jelöljük.
Megjegyzés. Az a ≠ 1-et azért kell kikötnünk, mert az y = 1x esetén y minden x-re 1-et vesz fel, és a konstans
függvénynek a valós számok halmazán nincs inverze.
Az a alapú exponenciális függvény és a logaritmusfüggvény gra kus képe egymás tükörképei az y = x egyenletű
egyenesre nézve (15.17. ábra). Nagyon fontosak az ex és az ln x úgynevezett természetes alapú függvények. Később pontosan
de niáljuk majd az e számot.
15.17. ábra
A logaritmusfüggvény tulajdonságai
Értelmezési tartomány, értékkészlet: Az inverz függvény de niálásánál megjegyeztük, hogy egy függvény értékkészlete
megegyezik inverz függvényének értelmezési tartományával, és egy függvény értelmezési tartománya megegyezik inverz
függvényének értékkészletével. Mivel az exponenciális függvény értelmezési tartománya a valós számok halmaza,
értékkészlete pedig a pozitív valós számok halmaza (R → R+), ezért a logaritmusfüggvény értelmezési tartománya a pozitív
valós számok halmaza, értékkészlete pedig a valós számok halmaza (R+ → R).
Zérushelye: x = 1, ami az exponenciális függvény y-tengelymetszetével egyenlő.
Y-tengelymetszet: A függvénynek az értelmezési tartományából adódóan nincs y-tengelymetszete.
Paritás: nem páros és nem páratlan. A loga x és a függvények egymásnak az x tengelyre vonatkozó tükörképei.
Periodicitás: nem periodikus.
Korlátosság: Nincs alsó és nincs felső korlátja, hiszen az értékkészlete a valós számok halmaza.
Monotonitás: szigorúan monoton.
Ha a > 1, akkor loga x szigorúan monoton nő, vagyis x > y esetén logax > logay.
Ha 0 < a < 1, akkor logax szigorúan monoton csökken, vagyis x > y esetén logax < logay.
Konvexitás:
Ha a > 1, akkor szigorúan konkáv.
Ha 0 < a < 1, akkor szigorúan konvex.
Szélsőértékek: nincs sem minimuma, sem maximuma.
15.18. ábra
(cos x; sin y) azon pont két koordinátája a Descartes-koordináta-rendszerben, amit úgy kapunk meg, hogy az origó
középpontú egység sugarú körön az (1; 0) pontból indulva |x| hosszú körívet felmérünk x előjelétől függően pozitív (az
óramutató járásával ellentétes), illetve negatív (az óramutató járásával megegyező) irányban.
Azt a függvényt, amely minden valós számra értelmezve van, és minden valós számhoz a szám szinuszát rendeli hozzá,
szinuszfüggvénynek nevezzük.
Azt a függvényt, amely minden valós számra értelmezve van, és minden valós számhoz a szám koszinuszát rendeli
hozzá, koszinuszfüggvénynek nevezzük.
Trigonometrikus függvényeknek nevezzük azokat a függvényeket, melyek az x ↦ sin x és az x ↦ cos x, valamint a
konstans függvényekből függvényműveletek segítségével jönnek létre.
Megjegyzés. Vegyük észre, hogy a tangens x és a kotangens x függvények egymás reciprokai, vagyis tg x · ctg x = 1!
A szinuszfüggvény tulajdonságai
A koszinuszfüggvény tulajdonságai
A tangensfüggvény tulajdonságai
A kotangensfüggvény tulajdonságai
Árkuszfüggvények
Az árkusz szinusz függvény és tulajdonságai
Az árkusz koszinusz függvény és tulajdonságai
Az árkusz tangens függvény és tulajdonságai
Az árkusz kotangens függvény és tulajdonságai
A szinuszfüggvény tulajdonságai
Értelmezési tartomány: a valós számok halmaza.
Értékkészlet: A de nícióból következik, hogy a [–1; 1] intervallum, hiszen az egységkörben nincs olyan pont, amelynek
valamelyik koordinátája kívül esik az [–1; 1] intervallumon.
Zérushelyek: x = kπ, ahol k ∈ Z.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és sin(–x) = –sin x.
Periodicitás: Periodikus, egy periódus hossza 2π.
Korlátosság: Korlátos, in muma a – 1, szuprémuma az 1.
-on, ahol n e Z.
Konvexitás: Szigorúan konvex a [π + 2kπ; 2π + 2kπ]-on, ahol k ∈ Z, és szigorúan konkáv a [2nπ; π + 2nπ]-on, ahol n ∈ Z.
15.19. ábra
A koszinuszfüggvény tulajdonságai
A koszinuszfüggvény képét megkaphatjuk úgy is, hogy a szinuszfüggvény képét eltoljuk -vel negatív irányba.
Értelmezési tartomány: a valós számok halmaza.
Értékkészlete: A de nícióból következik, hogy a [–1; 1] intervallum.
Zérushelyek: , ahol k ∈ Z.
Y-tengelymetszete: y = 1.
Paritás: Páros, tehát tükrös az y tengelyre, és cos(–x) = cos x.
Periodicitás: periodikus, egy periódus hossza 2π.
Korlátosság: korlátos, in muma a – 1, szuprémuma az 1.
Monotonitás: Szigorúan monoton nő a [–π + 2kπ; 2kπ]-on, ahol k ∈ Z, és szigorúan monoton csökken a [2nπ; π + 2nπ]-on,
ahol n ∈ Z.
15.20. ábra
A tangensfüggvény tulajdonságai
15.21. ábra
A kotangensfüggvény tulajdonságai
Értelmezési tartomány: Az x = kπ, ahol k ∈ Z számok kivételével a valós számok halmaza.
Értékkészlet: a valós számok halmaza.
15.22. ábra
Árkuszfüggvények
A szinusz-, koszinusz-, tangens- és kotangensfüggvények szigorú monotonitásából adódik, hogy bijektívek a megfelelő
intervallumokon. Mivel a bijektív függvények invertálhatók, ezért megvizsgálhatjuk a fenti függvények inverzeit,
amelyeket ciklometrikus vagy árkuszfüggvényeknek szokás nevezni.
Értékkészlet: a intervallum.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arcsin(–x) = –arcsin x.
Periodicitás: nem periodikus.
15.23. ábra
Tekintsük a cos x függvény leszűkítését a [0; π] intervallumra. Ekkor a cos x függvény inverzét árkusz koszinusz
függvénynek nevezzük, vagyis arccos x azt a függvényt jelenti, amelyre cos(arccos x) = x.
Y-tengelymetszet: .
Paritás: nem páros és nem páratlan.
Periodicitás: nem periodikus.
Korlátosság: korlátos, in muma a 0, szuprémuma a π.
Monotonitás: szigorúan monoton csökken.
Konvexitás: Szigorúan konvex a [–1; 0] intervallumon, és szigorúan konkáv a [0; 1] intervallumon.
Szélsőértékek: Maximuma van az x = –1 pontban y = π, minimuma van az x = 1 pontban y = 0.
15.24. ábra
Értékkészlet: a intervallum.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arctg(–x) = –arctg x.
Periodicitás: nem periodikus.
15.25. ábra
Tekintsük a ctg x függvény leszűkítését a ]0; π[ intervallumra! Ekkor a ctg x függvény inverzét árkusz kotangens
függvénynek nevezzük, vagyis arcctg x azt a függvényt jelenti, amelyre ctg(arcctg x) = x.
15.26. ábra
Megjegyzés. Vegyük észre, hogy a tangens hiperbolikusz x és a kotangens hiperbolikusz x függvények egymás
reciprokai, vagyis th x · cth x = 1!
A (ch x; sh x) koordinátájú pontok a síkon az x2 – y2 = 1 egyenletű egyenlő szárú hiperbola jobb oldali ágát írják le,
ugyanis
15.27. ábra
Megjegyzés. A 15.27. ábrán a T pont koordinátái (ch x; sh x), T'' pont koordinátái (ch x; –sh x), ahol x a bevonalkázott
területet jelöli.
15.28. ábra
15.29. ábra
15.30. ábra
15.31. ábra
Áreafüggvények
A szinusz, koszinusz, tangens és kotangens hiperbolikusz függvények szigorú monotonitásából adódik, hogy bijektívek a
megfelelő intervallumokon. Mivel a bijektív függvények invertálhatók, ezért megvizsgálhatjuk a fenti függvények
inverzeit, amelyeket inverz hiperbolikusz vagy áreafüggvényeknek szokás nevezni.
A sh x függvény inverzét área szinusz hiperbolikusz függvénynek nevezzük, vagyis arsh x azt a függvényt jelenti,
amelyre sh(arsh x) = x.
15.32. ábra
Az área koszinusz hiperbolikusz függvény és tulajdonságai
Tekintsük a ch x függvény leszűkítését a [0; ∞[ intervallumra! Ekkor a ch x függvény inverzét área koszinusz
hiperbolikusz függvénynek nevezzük, vagyis arch x azt a függvényt jelenti, amelyre ch(arch x) = x.
15.33. ábra
Tekintsük a th x függvény leszűkítését a (–1; 1) intervallumra! Ekkor az th x függvény inverzét área tangens
hiperbolikusz függvénynek nevezzük, vagyis arth x azt a függvényt jelenti, amelyre th(arth x) = x.
A cth x függvény inverzét área kotangens hiperbolikusz függvénynek nevezzük, vagyis arcth x azt a függvényt jelenti,
amelyre cth(arcth x) = x.
15.35. ábra
16. A valós analízis elemei
16.1. A valós számok alapfogalmai
16.2. Számsorozatok
16.3. Numerikus sorok
16.4. Egyváltozós függvények folytonossága és határértéke
16.5. Többváltozós analízis elemei
Arkhimédészi axióma. Bármely valós számhoz található nála nagyobb természetes szám.
Cantor-axióma. Bármely egymásba skatulyázott zárt intervallumsorozatnak létezik közös pontja.
Egy F ⊆ R halmazt felülről korlátosnak nevezünk, ha létezik olyan a valós szám, hogy bármely x ∈ F esetén x ≤ a.
Egy A ⊆ R halmazt alulról korlátosnak nevezünk, ha létezik olyan b valós szám, hogy bármely x ∈ A esetén x ≥ b.
Egy H ⊆ R halmazt korlátosnak nevezünk, ha alulról és felülről is korlátos.
Az iménti de nícióban szereplő a számot az F halmaz egy felső korlátjának, a b számot az A halmaz egy alsó korlátjának
nevezzük.
Megjegyzés. Egy felülről korlátos F halmaznak nyilván végtelen sok felső korlátja van, ugyanis ha az a szám egy felső
korlátja F-nek, akkor minden a-nál nagyobb szám is felső korlátja F-nek.
A következő tétel a felső korlátok halmazának egy nagyon fontos tulajdonságát mondja ki:
Bármely nem üres, felülről korlátos F halmaz felső korlátai között létezik legkisebb. Ezt a számot az F halmaz felső
határának, szuprémumának nevezzük. Jelölés: sup F.
Bármely nem üres, alulról korlátos A halmaz alsó korlátai között létezik legnagyobb. Ezt a számot az A halmaz alsó
határának, in mumának nevezzük. Jelölés: inf A.
Megállapodunk abban, hogy felülről nem korlátos halmazok legkisebb felső korlátja plusz végtelen (jelölésben: +∞),
alulról nem korlátos halmazok legnagyobb alsó korlátja mínusz végtelen (jelölésben: –∞).
Példa. Tekintsük az halmazt! Ennek legkisebb felső korlátja 1, legnagyobb alsó korlátja 0. Valóban, 1
felső korlátja a halmaznak, hiszen minden eleménél nagyobb vagy egyenlő. Mivel 1 eleme is a halmaznak, nincs nála
kisebb felső korlát, hiszen az nem lenne nagyobb vagy egyenlő a halmaz minden eleménél. A 0 alsó korlát, hiszen a
halmaz elemei mind pozitív számok, így nagyobbak, mint 0. Azt pedig, hogy nincs 0-nál nagyobb alsó korlát, az
arkhimédészi axióma biztosítja. Ha lenne alsó ϵ > 0 korlát, az azt jelentené, hogy minden n ∈ N számra
Legyen x ∈ R tetszőleges valós szám, és legyen ϵ > 0! Ekkor az (x – ϵ, x + ϵ) nyílt intervallumot az x pont ϵ sugarú
környezetének nevezzük.
Példa. Tekintsük a (–1, 1) intervallumot! Ennek a halmaznak nyilván torlódási pontja a 0, amely eleme a halmaznak.
Az halmaz torlódási pontja a 0, amely nem eleme a halmaznak. Hogy valóban torlódási pont, az az
arkhimédészi axiómából adódik: legyen ϵ > 0 szám. Ekkor az axióma szerint az számhoz van olyan n természetes
szám, hogy . Ezt átrendezve kapjuk, hogy . Vagyis , ami azt jelenti, hogy 0 torlódási
pontja az halmaznak.
Véges halmazoknak nincs torlódási pontjuk, azonban korlátos, végtelen halmazokra a következőt mondja ki a
Bolzano–Weierstrass-tétel:
16.2. Számsorozatok
Számsorozat határértéke
Nevezetes sorozatok határértéke
Műveletek sorozatokkal
Sorozatok tulajdonságai
Számsorozat határértéke
Egy, a természetes számok halmazán értelmezett, valós számok halmazába képező a : N → R függvényt valós
számsorozatnak, röviden sorozatnak nevezünk.
Az egyszerűbb írásmód kedvéért a(n) helyett egy sorozatra az an indexes jelölést alkalmazzuk. Használatos jelölés még:
(an).
Példák
Azt mondjuk, hogy az an számsorozat határértéke, limesze az a valós szám, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ϵ N, n ≥ n0 esetén |an – a| < ϵ.
Jelölés: .
Megjegyzés. Az n0 ∈ N küszöbindex függ az ϵ > 0 számtól.
Azt mondjuk, hogy az an számsorozat határértéke, limesze +∞, ha bármely K valós számhoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ∈ N, n ≥ n0 esetén an ≥ K.
Jelölés: .
Azt mondjuk, hogy az an számsorozat határértéke, limesze –∞, ha bármely K valós számhoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ∈ N, n ≥ n0 esetén an ≤ K.
Jelölés:
Azokat a sorozatokat, amelyeknek létezik véges határértéke, konvergensnek nevezzük. Azokat a sorozatokat,
amelyeknek határértéke +∞ vagy –∞, esetleg nincs határértéke, divergensnek nevezzük.
Azt mondjuk, hogy egy H ⊆ R halmaz torlódási pontja +∞, ha létezik olyan an sorozat, hogy minden n ∈ N esetén an ∈
H, és an → +∞ (n → + ∞).
Azt mondjuk, hogy egy H ⊆ R halmaz torlódási pontja –∞, ha létezik olyan an sorozat, hogy minden n ∈ N esetén an ∈
H, és an → –∞ (n → +∞).
tetszőleges ϵ > 0 számot! Ekkor az axióma szerint van olyan n0 természetes szám, hogy . Természetesen ekkor
minden n > n0 természetes számra . Átrendezve azt kapjuk tehát, hogy a tetszőleges ϵ > 0-hoz létezik n0
természetes szám, hogy minden n ≥ n0 természetes szám esetén . Ez pedig pontosan azt jelenti, hogy
Egy olyan sorozatot, amelynek minden tagja egyenlő, konstans sorozatnak nevezünk. A de nícióból nagyon
egyszerűen adódik, hogy minden konstans sorozat konvergens, és határértéke az a szám, amellyel tagjai megegyeznek.
Legyen most q ∈ R valós szám, és tekintsük a qn sorozatot! Ennek a sorozatnak a határértékei q-tól függően változnak:
Nagyon fontos sorozat as sorozat. Belátható, hogy ez a sorozat konvergens, azaz létezik véges határértéke.
Ezt a határértékét nevezzük az e számnak, tehát
Műveletek sorozatokkal
A következőkben értelmezzük a sorozatok közötti műveleteket, melyek természetes módon adódnak. Legyenek an és bn
valós számsorozatok, c tetszőleges valós szám. Ekkor tetszőleges n természetes számra legyen
az an és bn sorozatok hányadosa.
Konkrét sorozatok határértékének kiszámításánál gyakran lesz szükségünk a valós számok és a „végtelenek” közötti
műveletekre. Ezeket az alábbiakban értelmezzük, a szemléletünkre is hagyatkozva. Legyen a egy tetszőleges valós szám.
Ekkor
Nem értelmezzük ellenkező előjelű végtelenek összegét, végtelenek hányadosát, illetve 0-nak bármelyik végtelennel
való szorzatát.
E műveletek bevezetésének oka a következő tétel, amely a sorozatok közötti műveletek és a határértékek közötti
műveletek összefüggéseit írja le. Az egyszerűbb írásmód kedvéért vezessük be az halmazt, amelyet
kibővített valós számoknak nevezünk.
Legyenek an és bn valós számsorozatok, c tetszőleges szám. Tegyük fel, hogy az an sorozat határértéke a, a bn sorozat
határértéke b, ahol a, b ∈ R̄.
Ekkor n → +∞ esetén
anbn → a + b, ha a + b értelmes,
anbn → ab, ha ab értelmes,
can → ca, ha ca értelmes,
, ha bn ≠ 0 minden n természetes számra, és értelmes.
Ebből következik, hogy konvergens sorozatok összege, szorzata, számmal való szorzata konvergens.
A nevezőt kifejtve kapjuk, hogy . A számlálóból és nevezőből is kiemelve n2-et, kapjuk, hogy
. A számlálóban szereplő sorozat az előző tétel összefüggései alapján 2 – 0 – 0-hoz tart, a nevező
A következő példák mutatják, hogy miért nem célszerű de niálnunk minden lehetséges műveletet:
Példa. Legyen an = n2, bn = n2 – 1! Mindkét sorozat határértéke +∞, így az an – bn sorozat határértéke (+∞) – (+∞) alakú.
Az an–bn = 1 sorozat határértéke 1. Így ha értelmeznünk kellene azonos előjelű végtelenek különbségét, akkor azt 1-
nek lenne célszerű de niálni, hogy összhangban maradjunk a tétellel. Viszont az n2 – n2 = 0 sorozat szerint 0 lenne
megfelelő érték.
Tekintsük az sorozatokat! Az első sorozat határértéke +∞, a második sorozaté 0. Így szorzás esetén (+∞)0
alakú a határérték. A két sorozat szorzata (–1)n, aminek nincs határértéke.
Sorozatok tulajdonságai
Egy an sorozatot felülről korlátosnak (alulról korlátosnak) nevezünk, ha az értékkészlete, {an | n ∈ N} felülről
korlátos (alulról korlátos) halmaz. Egy sorozat korlátos, ha alulról és felülről is korlátos.
A megfordítás nem igaz, azaz léteznek olyan korlátos sorozatok, amelyek nem konvergensek. Ilyen például a (–1)n
sorozat.
Egy an sorozatot monoton növőnek (illetve fogyónak) nevezünk, ha minden n természetes szám esetén an ≤ an+1
(illetve an ≥ an+1). Ha minden n természetes számra szigorú egyenlőtlenség áll fenn, akkor szigorúan monoton
sorozatokról beszélünk.
Minden monoton sorozatnak létezik határértéke. Ha monoton növő, akkor ez a határérték nem más, mint a sorozat
értékkészletének szuprémuma. Ha monoton fogyó, akkor pedig határértéke a sorozat értékkészletének in muma.
De níció szerint egy korlátos halmaz szuprémuma és in muma véges, ezért kimondhatjuk a következő tételt:
Megjegyzés. Az e-t de niáló sorozatról belátható, hogy monoton növő és korlátos, így valóban létezik
véges határértéke.
A következő állítás csendőrelvként vagy közrefogási elvként ismert a szakirodalomban, amely gyakran alkalmazható
sorozatok határértékének meghatározására.
Legyenek an, bn, cn számsorozatok! Tegyük fel, hogy létezik olyan n0 index, hogy minden n ≥ n0 esetén an ≤ bn ≤ cn
teljesül. Ha létezik
akkor a bn sorozatnak is létezik határértéke, és egyenlő a-val.
Példa. Tekintsük az sorozatot! Ekkor bármely n természetes szám esetén fennáll a következő
egyenlőtlenség: . Vagyis a kérdéses sorozatot alulról becsültük a
konstans 7 sorozattal, felülről pedig a 7-hez tartó sorozattal. Így az előzőek szerint
Legyen an egy valós számsorozat, és legyen φ : N → N egy szigorúan monoton növő sorozat! Ekkor azt a bn sorozatot,
melyre minden n ∈ N esetén bn = aφ(n) teljesül, az an sorozat egy részsorozatának nevezzük.
Ha egy an sorozatnak létezik határértéke, akkor minden részsorozatának létezik határértéke, és megegyezik az an
sorozat határértékével.
Nem biztos, hogy egy sorozatnak létezik határértéke, így felvetődik a kérdés, hogy van-e olyan részsorozata, amelynek
létezik limesze. Kiderül, hogy mindig van ilyen részsorozat.
Mivel minden monoton sorozatnak létezik határértéke, ezért kimondhatjuk a következő tételt, amely a sorozatokra
vonatkozó:
Példa. A (–1)n sorozat részsorozata a (–1)2n = 1 konstans 1 sorozat. Ez monoton növő, határértéke pedig 1. Ugyanennek
a sorozatnak részsorozata a (–1)2n–1 = –1 konstans –1 sorozat, ez is monoton, határértéke pedig –1. Ez mutatja azt is,
hogy a (–1)n sorozatnak nincs határértéke, ugyanis minden részsorozatának ugyanoda kellene tartania.
Legyen an egy tetszőleges sorozat, és jelölje H azt az R̄-beli halmazt, melynek elemei az an valamely részsorozatának
határértékei. Ekkor a H halmaznak létezik legkisebb és legnagyobb eleme -ban.
Legyenek an és bn számsorozatok! Ekkor azt a cn sorozatot, amelyre minden n ∈ N esetén c2n–1 = an, a2n = bn, az an és bn
sorozatok összefésülésének nevezzük.
Ha létezik , és ezek egyenlők, akkor a két sorozat összefésülésének is létezik limesze, amely egyenlő
az eredeti sorozatok limeszével.
Legyen p : N → N egy bijekció, azaz olyan függvény, amely kölcsönösen egyértelmű és R(p) = N! Legyen an egy
számsorozat! Ekkor azt a bn sorozatot, amelyre minden n esetén bn = ap(n), az an sorozat egy átrendezésének nevezzük.
Ha egy számsorozatnak létezik határértéke, akkor minden átrendezésének létezik, és egyenlő az eredeti sorozat
határértékével.
Egy an számsorozatot Cauchy-sorozatnak nevezünk, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N küszöbindex, hogy
tetszőleges n, m ∈ N, n ≥ n0, m ≥ n0 esetén | an – am | < ϵ.
Az előbbi tulajdonságot a gyakorlatban általában nem könnyű ellenőrizni, a tételnek főleg elméleti jelentősége van,
más állítások és tételek bizonyításaiban játszik fontos szerepet. Léteznek azért konkrét sorozatok, amelyek esetében
alkalmazható a tétel, a következő példában egy ilyen sorozatot vizsgálunk meg.
konvergens lenne a sorozat, így az előző tétel szerint Cauchy-sorozat. Ezért az számhoz is létezik olyan no ∈
számot! Látható, hogy az összegben minden tag nevezője kisebb vagy egyenlő, mint 2n0. Ezért
Sorok tulajdonságai
Műveletek sorokkal
Pozitív tagú sorok konvergenciájára vonatkozó elégséges kritériumok
Feltételesen konvergens sorok, átrendezések
Sorok tulajdonságai
Legyen an valós számsorozat! Képezzünk ebből egy új számsorozatot a következő módon: minden n ∈ N esetén legyen
.
Ekkor az Sn sorozatot az an sorozathoz tartozó végtelen sornak, az Sn számot a sor n-edik szeletének nevezzük. Jelölés:
Sn = ∑an.
Ha létezik , akkor ezt a határértéket a ∑an sor összegének nevezzük, és a jelölés helyett -t
írunk. Azt mondjuk, hogy a ∑an sor konvergens, ha létezik és véges. Minden más esetben (tehát ha ez a
határérték végtelen vagy nem létezik) azt mondjuk, hogy ∑an divergens.
. Ha q ≥ 1, akkor a sor divergens, és összege +∞, q ≤ – 1 esetén divergens a sor, és összege sem létezik.
Sorokra vonatkozó Cauchy-kritérium. A ∑an sor pontosan akkor konvergens, ha minden ϵ > 0 számhoz létezik n0 ∈ N
Később látni fogunk olyan példát konvergens sorra, amely nem abszolút konvergens.
Műveletek sorokkal
Legyenek ∑an és ∑bn tetszőleges sorok! Ekkor a két sor összegén a ∑(an + bn) sort értjük.
Ekkor a ∑(an + bn) sornak is létezik összege, éspedig , feltéve, hogy a + b értelmes.
A most következő két tétel ∑anbn alakú sorok konvergenciájáról szól. Fontos alkalmazásaik vannak a hatványsorok és
trigonometrikus sorok elméletében.
Abel tétele:
Legyen an monoton, korlátos sorozat, és legyen ∑bn egy konvergens sor.
Ekkor a ∑anbn sor konvergens.
Dirichlet tétele:
Legyen an monoton zérussorozat, és legyen ∑bn olyan sor, amelynek a szeletei korlátosak, azaz van olyan K > 0 szám,
Legyenek ∑an és ∑bn tetszőleges sorok! Készítsük el minden n ∈ N-re a cn = a1bn + a2bn–1 + … + anb1 számot (látható,
hogy minden tag indexösszege n + 1). Ekkor a ∑cn sort a ∑an és ∑bn sorok Cauchy-szorzatának nevezzük.
Ha ∑an abszolút konvergens, ∑bn konvergens sor, akkor a Cauchy-szorzatuk is konvergens, és összege a két sor
összegének a szorzata.
Pozitív tagú sornak létezik összege. Ez pontosan akkor véges, vagyis egy pozitív tagú sor pontosan akkor konvergens,
ha a sor részletösszegeinek sorozata felülről korlátos.
Könnyű meggondolni ezt az állítást, ugyanis ha ∑an pozitív tagú sor, akkor a részletösszegeiből álló Sn sorozat
monoton növő, ezért van határértéke. Ez pontosan akkor véges, ha a sorozat felülről korlátos.
A következő tétel mind elméleti, mind gyakorlati alkalmazásokban is előfordul. Abszolútkonvergencia-vizsgálatoknál
is hasznos, hiszen ott pozitív tagú sorokat vizsgálunk.
Cauchy-féle gyökkritérium:
Legyen ∑an pozitív tagú sor! Ha , akkor ∑an konvergens, ha , akkor ∑an
divergens.
D''Alembert-féle hányadoskritérium:
Legyen ∑an pozitív tagú sor, és tegyük fel, hogy an ≠ 0 minden n ∈ N-re!
Megjegyzés. Ha a fenti sorozatoknak létezik határértéke, akkor természetesen mindenhol lim írható.
Példa. Legyen x ∈ R tetszőleges valós szám, és tekintsük a sort! Ha x = 0, akkor a sor nyilván konvergens. Ha
erre is teljesül, hogy . Tehát, ha egyenlőség szerepel a két limeszben, nem állíthatunk
semmit a konvergenciáról.
Példa. Az előbbi kritérium nagyon szép alkalmazása az ún. hiperharmonikus sor konvergenciájának meghatározása.
Legyen α valós szám! Ekkor a sor pontosan akkor konvergens, ha α > 1. Valóban, felhasználva a Gauss-
kritériumot, kapjuk, hogy pontosan akkor konvergens, amikor konvergens. Ez a sor nem más,
mint amely egy geometriai sor, kvócienssel. Láttuk korábban, hogy egy geometriai
sor pontosan akkor konvergens, ha kvóciensének abszolút értéke kisebb, mint 1. Példánk esetén ez pedig pontosan
akkor teljesül, ha α > 1. Érdemes megjegyezni, hogy a = 2 esetén , amely egyenlőség például Fourier-
sorok segítségével is bizonyítható.
A ∑an sort Leibniz-típusú sornak nevezzük, ha an váltakozó előjelű (azaz minden n ∈ N esetén anan+1 < 0), és az |an|
sorozat monoton fogyólag tart 0-hoz.
Példa. Tekintsük a sort! Ez Leibniz-típusú, hiszen váltakozó előjelű, és 0-hoz tart monoton
A ∑an sort feltételesen konvergens sornak nevezzük, ha ∑an konvergens, de nem abszolút konvergens.
A sor ilyen tulajdonságú, hiszen konvergens, de nem abszolút konvergens, mert divergens.
Ha ∑an abszolút konvergens sor, akkor az an sorozat bármely ap(n) átrendezésére ∑ap(n) konvergens, és összege
megegyezik az eredeti sor összegével.
Látszik tehát, hogy abszolút konvergens sorok esetén a tagok sorrendje az összeg szempontjából nem számít (mint
véges összeg esetén, hiszen az összeadás kommutatív művelet). Feltételesen konvergens sorok esetében ez azonban nincs
így. Ezt mondja ki a nevezetes Riemann-féle átrendezési tétel.
Legyen ∑an egy feltételesen konvergens sor. Ekkor bármely a valós számhoz van an-nek olyan ap(n) átrendezése, hogy a
∑ap(n) sor összege a. Olyan átrendezések is léteznek, hogy ∑ap(n) összege +∞, –∞, vagy nem is létezik.
Megjegyzés. A tétel bizonyításának hátterében egy szemléletes gondolatmenet húzódik, precízen leírva azonban
meglehetősen bonyolult és hosszadalmas.
Legyen H ⊆ R egy nem üres számhalmaz. Legyen f : H → R egy tetszőleges függvény, xo ∈ H. Azt mondjuk, hogy az f
függvény folytonos az xo ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, akkor |f(x) –
f(x0) | < ϵ. Az f függvény folytonos a H halmazon, ha minden pontjában folytonos.
A szemlélethez visszatérve, a pontbeli folytonosság azt jelenti, hogy ha „közel” vagyunk a ponthoz, akkor a
függvényértékek is „közel” lesznek.
Megjegyzés. Ha egy f : H → R függvény folytonos egy x0 ∈ H pontban, akkor ott |f| is folytonos. Valóban, az ismert
||f(x)| – |f(x0) || ≤ |f(x) – f(x0) | egyenlőtlenség alapján adott ϵ > 0-hoz ugyanaz a δ > 0 jó lesz, ami f-hez jó volt.
Legyen H ⊆ R egy nem üres számhalmaz! Legyen f : H → R egy tetszőleges függvény, x0 ∈ H. Azt mondjuk, hogy az f
függvény jobbról (illetve balról) folytonos az x0 ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha |x – x0|
< δ, x ∈ H és x ≥ x0 (illetve x ≤ x0), akkor |f(x) – f(x0)| < ϵ.
Egy f : H → R függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha ott jobbról és balról is folytonos.
Egy f : H → R függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha bármely olyan xn ∈ H sorozatra,
melyre , fennáll, hogy .
Tehát „elegendő” megmutatnunk, hogy bármely, az értelmezési tartományban haladó x0-hoz tartó sorozat mentén a
függvényértékek tartanak f(x0)-hoz. Ezt a gyakorlatban nem mindig könnyű ellenőrizni, főleg elméleti alkalmazásai
vannak a tételnek. Feladatok esetében főleg úgy fordul elő, hogy a nem folytonosságot kell bizonyítani. Ezt illusztráljuk a
következő példán.
Legyenek f : H → R és g : f(H) → R tetszőleges függvények! Tegyük fel, hogy f folytonos az x0 ∈ H pontban, g folytonos
az f(x0) ∈ f(H) pontban. Ekkor a (g ○ f) : H → R függvény folytonos x0 ∈ H-ban.
Tehát nem egészen precízen azt mondhatjuk, hogy „folytonos függvények összege, szorzata, számmal való szorzata,
hányadosa és kompozíciója folytonos”.
Folytonos függvényre példának felsorolhatjuk az összes elemi függvényt, illetve ezek és a négy alapművelet, valamint a
kompozíció segítségével gyártott függvények bármelyikét. Megfogalmazzuk ezt külön is:
Az elemi függvények mindegyike folytonos az értelmezési tartományuk minden pontjában. Tehát minden
hatványfüggvény, minden polinomfüggvény, minden exponenciális és logaritmusfüggvény, minden trigonometrikus
függvény folytonos.
Példa. Az f : (0, +∞) → R, f(x) = ln(x + sin2 x)ex függvény folytonos a (0, +∞) intervallum minden pontjában, hiszen x +
sin2 x folytonos függvények összege, így folytonos, ln(x + sin2 x) folytonos, mert folytonos függvények kompozíciója,
végül ln(x + sin2 x)ex folytonos, mert folytonos függvények szorzata.
A határérték fogalma
A most következő fogalom nagyon fontos, ez adja a di erenciálszámítás alapját. A teljesség kedvéért kimondjuk az összes
de níciót. Kezdjük először a véges pontbeli határértékkel!
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik x0-ban véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan δ
> 0, hogy ha |x – x0| < δ, x ∈ H, x ≠ x0, akkor |f(x) – α| < ϵ.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy x0-ban az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈
H, x ≠ x0, akkor f(x) ≥ K.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy x0-ban az f függvény határértéke –∞, ha minden K < 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈
H, x ≠ x0, akkor f(x) ≤ K.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik +∞-ben véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan L
> 0, hogy ha x > L, x ∈ H, akkor |f(x) – α| < ϵ.
Jelölés: vagy
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy +∞-ben az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan L > 0, hogy ha x > L, x ∈ H,
akkor f(x) > K.
Jelölés: vagy
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy +∞-ben az f függvény határértéke –∞, ha minden K < 0-hoz létezik olyan L > 0, hogy ha x > L, x ∈ H,
akkor f(x) < K.
Jelölés: vagy
Ugyanez –∞ esetén.
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik –∞-ben véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan L
< 0, hogy ha x < L, x ∈ H, akkor |f(x) – α| < ϵ.
Jelölés: vagy
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy –∞-ben az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan L < 0, hogy ha x < L, x ∈ H,
akkor f(x) > K.
Jelölés: vagy
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy –∞-ben az f függvény határértéke +∞, ha minden K < 0-hoz létezik olyan L < 0, hogy ha x < L, x ∈ H,
akkor f(x) < K.
Jelölés: vagy
Legyen f : H → R tetszőleges függvény, és legyen x0 ∈ H, amely egyúttal torlódási pontja a H halmaznak. Ekkor az f : H
→ R függvény pontosan akkor folytonos az x0 ∈ H pontban, ha létezik x0-ban határértéke, és a limesz egyenlő az f(x0)
helyettesítési értékkel.
Megjegyzés. A pontbeli folytonossághoz még nem elegendő a véges határérték létezése, erre példa az
függvény.
16.1. ábra
A folytonossághoz hasonló átviteli elvet megfogalmazhatunk határértékekre is. Az alábbiakban egy halmaz torlódási
pontja esetén gondolhatunk plusz vagy mínusz végtelenre is.
Pontosan akkor létezik , ha minden xn ∈ H sorozatra, melyre xn → x0, xn ≠ x0, teljesül, hogy f(xn) →
α(n → + ∞).
De niáljuk függvények jobb és bal oldali határértékét, teljesen analóg módon a határértékhez.
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R jobb oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy létezik x0-ban jobb oldali határértéke az f függvénynek, és ez az α szám, ha minden ϵ >
0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, x0 < x, akkor |f(x) – α| < ϵ.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R bal oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy létezik x0-ban bal oldali határértéke az f függvénynek, és ez az α szám, ha minden ϵ >
0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, x < x0, akkor |f(x) – α| < ϵ.
Jelölés: vagy .
Végtelen határértékek közül csak a +∞ esetet írjuk le, a –∞ teljesen hasonlóan de niálható.
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R jobb oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy x0-ban az f függvény jobb oldali határértéke +∞, ha minden K > 0-hoz létezik olyan δ >
0, hogy ha |x – x0| < δ, x ∈ H, x0 < x, akkor f(x) ≥ K.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R bal oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy xo-ban az f függvény bal oldali határértéke +∞, ha minden K > 0-hoz létezik olyan δ > 0,
hogy ha |x – x0| < δ, x ∈ H, x < x0, akkor f(x) ≥ K.
Jelölés: vagy .
Példa:
Egy f : H → R függvénynek pontosan akkor létezik határértéke egy x0 ∈ H′ pontban, amely jobb és bal oldali torlódási
pont egyben, ha ott létezik jobb oldali és bal oldali határértéke, és ezek egyenlőek (ez lesz a határérték).
Legyen f : I → R egy I intervallumon értelmezett monoton függvény, az intervallum végpontjai legyenek a, b, a < b!
Ekkor az f függvénynek az a pontban létezik jobb oldali, a b pontban létezik bal oldali határértéke, éspedig: ha f
16.2. ábra
Nevezetes függvényhatárértékek
Ebben a részben felsoroljuk az elemi függvények nevezetes határértékeit, továbbá olyan határértékeket, amelyek a
di erenciálás de niálása után lesznek fontosak.
Polinomfüggvények
Racionális törtfüggvények
Exponenciális és logaritmusfüggvények
Trigonometrikus függvények
Polinomfüggvények
Legyen f : R → R, f(x) = anxn + anxn–1 + … + a0 egy n-edfokú polinom (n ∈ N)! Ekkor , ha an pozitív,
, ha an negatív;
, ha an pozitív, és n páratlan;
, ha an pozitív, és n páros;
, ha an negatív, és n páratlan;
Példa: .
Racionális törtfüggvények
, ha m = n.
Legyen ezek után m < n!
, ha anbm pozitív;
, ha anbm negatív;
, ha anbm pozitív, és n – m páratlan;
, ha anbm pozitív, és n – m páros;
, ha anbm negatív, és n – m páratlan;
, ha anbm negatív, és n – m páros.
Példa: .
Exponenciális és logaritmusfüggvények
Legyen a > 0 szám, a ≠ 1. Ekkor
Trigonometrikus függvények
A szinusz- és koszinuszfüggvényeknek nincs határértéke egyik végtelenben sem. A tangensfüggvényre viszont legyen k ∈
Z. Ekkor
Függvényműveletek és határérték
A számsorozatoknál láttuk, hogy a határértékképzés és a műveletek jól illeszkedtek egymáshoz, például két konvergens
sorozat összege konvergens volt, és a határérték nem volt más, mint a határértékek összege. Tetszőleges függvényekre is
hasonló áll fenn, köszönhetően az átviteli elvnek, hiszen a sorozatok „átörökítik” függvényekre.
valós szám! Legyen x0 ∈ H′, azaz torlódási pontja a H halmaznak! Tegyük fel, hogy létezik és
Az állítás hasonló abban az esetben is, ha valamelyik végtelenben vizsgáljuk a határértéket. Kimondjuk mindkét
esetet:
értelmesek, létezik , , , és ha is
tegyük fel, hogy létezik úgy, hogy b ∈ H, és f folytonos a b pontban! Ekkor létezik
Példák
1.
Számítsuk ki a határértéket!
Teljesülnek a kompozíció határértékére vonatkozó állítás feltételei, ugyanis a nevezetes
határérték, és az összegfüggvényre vonatkozó határérték alapján, valamint az ln függvény
folytonos a b = 1 pontban. Így a kérdéses határérték .
2.
Számítsuk ki a határértéket!
2
Mivel x – 1 és x – 1 is folytonos függvény az egész számegyenesen, ezért mindkettő határértéke az 1 pontban a
helyettesítési érték, azaz 0. A kérdéses határérték tehát 0/0 alakú, így további vizsgálat szükséges. Könnyen
észrevehető, hogy minden x ≠ 1 számra . Mivel a helyettesítési érték nem játszik szerepet a
pontban, ezért a határérték a helyettesítési érték, ami nem más, mint 1 + 1 = 2. Ezért .
3.
Számítsuk ki a határértéket!
Mivel a törtben szereplő függvények mindegyike folytonos függvény, ezért a számláló és a nevező 0-beli
határértéke egyenlő a helyettesítési értékkel. Viszont ebből az látszik, hogy ez alakú határérték, hiszen e0 –
Az első határérték létezik, mert egy nevezetes határértékről van szo: . Továbbá
Bolzano tétele:
Legyen f : [a, b] → R folytonos függvény, f(a) < 0, f(b) > 0. Ekkor van olyan c ∈ (a, b), hogy f(c) = 0.
Az állítás szemléletes, hiszen ha az a pontban az x tengely „alatt”, a b pontban az x tengely „felett” vagyunk, akkor a két
pontot a függvény gra konjával összekötve valahol metszeni kell az x tengelyt, ha a függvény folytonos.
16.3. ábra
Darboux tétele:
Legyen f egy I intervallumon értelmezett folytonos függvény, és legyenek x1, x2 ∈ I, x1 < x2 tetszőleges pontok! Ekkor
bármely f(x1) és f(x2) közé eső c számhoz van olyan x ∈ (x1, x2), hogy f(x) = c.
Szemléletesen annyit mond a tétel, hogy folytonos függvény intervallumot intervallumra képez (esetleg konstans). A
tételben szereplő tulajdonságot Darboux-tulajdonságnak nevezik, felfedezője után.
Példa. Szép alkalmazása Bolzano tételének annak bizonyítása, hogy minden valós együtthatós, páratlan fokú
polinomfüggvénynek létezik valós gyöke. Láttuk korábban, hogy egy páratlan fokú polinomfüggvénynek a +∞-ben
és a –∞-ben ellenkező előjelű végtelenek a határértékei, így szükségszerűen felvesz pozitív és negatív értékeket. Mivel
egy polinomfüggvény folytonos, Bolzano tétele miatt valahol felvesz zérust.
Korlátos és zárt intervallumon értelmezett folytonos függvények nagyon fontos tulajdonsága Weierstrass tétele:
Egy f : [a, b] → R folytonos függvénynek van maximuma és minimuma, azaz létezik olyan x1, x2 ∈ [a, b], hogy minden x
∈ [a, b] esetén f(x1) ≤ f(x) ≤ f(x2).
Korlátos és zárt intervallumon értelmezett folytonos függvény értékkészlete korlátos és zárt intervallum.
Megjegyzés. Az f(x) = x folytonos függvénynek a (0,1) nyílt intervallumon nincs sem maximuma, sem minimuma,
tehát a zártságra vonatkozó feltétel nem hagyható el.
Egy I intervallumon értelmezett folytonos és injektív f függvény szigorúan monoton, továbbá az f–1 inverz függvény is
folytonos és szigorúan monoton (ugyanolyan értelemben, mint f) az f(I) intervallumon.
Egy H ⊆ R halmazon értelmezett függvény folytonossága azt jelenti, hogy minden egyes pontban teljesíti a „minden ϵ-
hoz van olyan δ” de níciót. Adott ϵ-hoz persze különböző pontok esetén más és más δ lesz jó általában. A következő
de níció azt fogalmazza meg, amikor nem ez a helyzet.
Legyen H ⊆ R számhalmaz, f : H → R függvény! Azt mondjuk, hogy f egyenletesen folytonos a H halmazon, ha ∀ ϵ > 0-
hoz ∃δ > 0, hogy ∀ x, y ∈ H esetén, melyekre |x – y| <δ, akkor |f(x) – f(y)| < ϵ teljesül.
Heine tétele:
Egy korlátos és zárt intervallumon folytonos függvény egyenletesen is folytonos.
Az Rp tér alapfogalmai
Folytonosság és határérték
Az Rp tér alapfogalmai
Legyen p ≥ 1 természetes szám!
Emlékeztetünk az Rp térben használatos abszolút értékre, avagy vektor hosszára: ha x = (x1, …, xp) ∈ Rp, akkor legyen
Egy H ⊆ Rp halmazt korlátosnak nevezünk, ha létezik olyan r > 0 szám, hogy minden x ∈ H pontra |x| < r teljesül.
Legyen x ∈ Rp tetszőleges pont, és legyen ϵ > 0! Ekkor a B(x, ϵ) = {y ∈ Rp : |x – y| < ϵ} nyílt gömböt az x pont ϵ sugarú
környezetének nevezzük.
Legyen H ⊆ Rp tetszőleges halmaz! Egy x ∈ Rp pont a H halmaz belső pontja, ha létezik olyan ϵ > 0 szám, hogy B(x, ϵ) ⊆
H;
határpontja, ha minden ϵ > 0 esetén a B(x, ϵ) ∩H és B{x, ϵ) ∩Hc halmazok egyike sem üres;
torlódási pontja, ha minden ϵ > 0 számra teljesül, hogy az x ϵ sugarú környezete tartalmaz x-től különböző H-beli
pontot;
izolált pontja, ha létezik olyan ϵ > 0 szám, hogy B(x, ϵ) ∩H = {x}.
Egy, a természetes számok halmazán értelmezett, Rp-be képező a : N → Rp függvényt pontsorozatnak vagy
vektorsorozatnak, röviden sorozatnak nevezünk.
Az egyszerűbb írásmód kedvéért a(n) helyett egy sorozatra továbbra is az an indexes jelölést alkalmazzuk.
Megjegyzés. Egy an sorozatot meghatároznak a koordinátasorozatai, ugyanis egy sorozat (a1n, …, apn) alakú, ahol
minden 1 < j < p esetén ajn valós számsorozat.
Azt mondjuk, hogy az an sorozat határértéke, limesze az a ∈ Rp vektor, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n e N, n ≥ n0 esetén |an – a| < ϵ.
Jelölés: .
Egy vektorsorozat pontosan akkor konvergens, ha minden koordinátasorozata konvergens, és határértéke azon
számokból álló vektor, melyekhez a koordinátasorozatok tartanak.
Legyenek an és bn vektorsorozatok, c tetszőleges szám! Tegyük fel, hogy az an sorozat határértéke a, a bn sorozat
határértéke b, ahol a, b ∈ Rp. Ekkor n → +∞ esetén an + bn → a + b, és can → ca.
Folytonosság és határérték
A folytonosság és határérték fogalma szinte szó szerint átvihető tetszőleges f : Rp → Rq függvényre. Először a folytonosság
de níciója következik.
Legyen H ⊆ Rp egy nem üres halmaz! Legyen f : H → Rq egy tetszőleges függvény, x0 ∈ H! Azt mondjuk, hogy az f
függvény folytonos az x0 ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha | x – x0| < δ, x ∈ H, akkor |f(x) –
f(x0)| < ϵ. Az f függvény folytonos a H halmazon, ha minden pontjában folytonos.
Egy f : H → Rq függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha bármely olyan x ∈ H sorozatra,
melyre fennáll, hogy .
Példa. Legyen f : R2 → R2, f(x, y) = (x + y2, xy)! Ez folytonos függvény, hiszen a koordinátafüggvényei folytonosak.
Legyenek f : H → Rq és g : H → Rq tetszőleges függvények a közös H értelmezési tartományon, és legyen c ∈ R
tetszőleges valós szám! Tegyük fel, hogy f és g folytonosak az x0 ∈ H pontban. Ekkor az f + g, fg, cf függvények
mindegyike folytonos x0-ban.
Legyenek f : H → Rq és g : f(H) → Rl tetszőleges függvények! Tegyük fel, hogy f folytonos az x0 ∈ H pontban, g folytonos
az f(x0) ∈ f(H) pontban. Ekkor a (g ○ f) : H → Rl függvény folytonos x0 ∈ H-ban.
Egy γ : [a, b] → Rp folytonos függvényt útnak vagy paraméterezett görbének nevezünk. A γ(a) pontot a görbe
kezdőpontjának, a γ(b) pontot a görbe végpontjának nevezzük.
Tartománynak nevezünk minden olyan nyílt halmazt, amelynek bármely x, y pontjához létezik olyan folytonos út,
melynek kezdőpontja x, végpontja y.
Magasabb dimenzióban végtelenben vett határértékről nem beszélünk, végtelenről mint határértékről csak valósba
képező függvények esetén eshet szó.
valós szám! Legyen x0 ∈ H′, azaz torlódási pontja a H halmaznak! Tegyük fel, hogy létezik és
, ahol a, b ∈ Rq. Ekkor létezik
17. Di erenciálszámítás és alkalmazásai
17.1. Di erenciálható függvények
17.2. Nevezetes függvények deriváltja
17.3. Függvényműveletek és a deriválás kapcsolata
17.4. Di erenciálható függvények tulajdonságai
17.5. Di erenciálszámítás alkalmazása függvények viselkedésének leírására
17.6. Többváltozós függvények di erenciálása
17.7. Fizikai alkalmazások
17.1. ábra
Az m(x, x0) függvényt (mint x függvényét) f-nek – az x0 ponthoz tartozó – különbségi hányados vagy
di erenciahányados függvényének nevezzük.
Az érintő meredekségét (amennyiben egyáltalán létezik érintő) úgy kaphatjuk meg, hogy az x pontot közelítjük az x0
Legyen f : R → R függvény! Legyen x0 ∈ int D(f) az értelmezési tartomány egy belső pontja! Azt mondjuk, hogy f
di erenciálható (deriválható) az x0 pontban, ha létezik
Nyilvánvaló módon de niálhatóak a féloldali deriváltak (di erenciálhányadosok). Például a jobb oldali deriválthoz
tegyük fel, hogy található ϵ > 0, hogy [x0, x0 + ϵ) ⊂ D(f), és legyen
A bal oldali di erenciálhányados ugyanilyen módon de niálható, ha található ϵ > 0, hogy(x0 – ϵ, x0] ⊂ D(f):
Viszont abból, hogy létezik a jobb oldali és a bal oldali derivált egy x0 pontban, még nem következik, hogy f ott
di erenciálható, ugyanis vegyük például az f(x) = |x| függvényt, aminek létezik a jobb oldali és a bal oldali deriváltja is x0 =
0-ban:
de nem létezik f′(x0), mert ha létezne, akkor egyenlő lenne a jobb és a bal oldali deriválttal is, ami nem lehetséges.
Megjegyzés. Szemléletesen látható, hogy az abszolútérték-függvény x0 = 0 pontban „megtörik” (nem sima), így nem
találhatunk megfelelő érintőt hozzá (17.3. ábra).
17.3. ábra
Az előző de níció segítségével adott f : R → R függvényhez készíthetünk egy új függvényt a következő módon. Ezt f
derivált függvényének nevezzük, és f′ jelöli,
Tehát az f′: R → R függvény minden olyan x0 ponthoz, amihez létezik di erenciálhányados, hozzárendeli az f függvény
x0-beli di erenciálhányadosát (deriváltját). Ha az f függvény egy I nyílt intervallum minden pontjában di erenciálható,
akkor azt mondjuk, hogy f az I intervallumon di erenciálható.
Megjegyzés. Azért tettük fel, hogy az f intervallum nyílt, mert ebben az esetben az intervallum minden pontja belső
pont, ami feltétele a pontbeli deriválhatóságnak. f = [a, b] intervallum esetén (vagyis ha I zárt), akkor ha azt
mondjuk, hogy I az I intervallumon di erenciálható, az azt jelenti, hogy a belső pontokban di erenciálható, és a-
ban és b-ben léteznek a megfelelő féloldali deriváltak.
Meg kell említenünk, hogy az előző állítás nem megfordítható, hiszen ha f(x) = |x| és x0 = 0, akkor x0-ban f folytonos
(csakúgy, mint minden x ∈ R pontban), de ott nem di erenciálható, mert nem egyezik meg a jobb oldali és a bal oldali
derivált.
Megjegyzés. Megmutatható, hogy létezik (nagyon sok) mindenhol de niált folytonos függvény, amely értelmezési
tartományának egyetlen pontjában sem di erenciálható.
Konstans függvény
Lineáris függvény
Hatványfüggvény
Az
függvény deriváltja
Az
négyzetgyökfüggvény deriváltja
Konstans függvény
Emlékeztetünk arra, hogy konstans függvénynek nevezzük azt az f : R → R függvényt, amely minden x pontban
ugyanazt a c ∈ R számot veszi fel, azaz f(x) := c, ∀x ∈ R esetén.
Tehát tetszőleges x0 ∈ D(f) pontra f′(x0) = 0, azaz f az értelmezési tartomány minden pontjában di erenciálható, így
ezekben a pontokban létezik az f′ derivált függvény:
Lineáris függvény
Emlékeztetünk arra, hogy lineáris függvénynek (elsőfokú függvénynek) nevezzük azt az f : R → R függvényt, amelyre
Megjegyzés. Azért tettük fel, hogy a ≠ 0, mert ha a = 0 lenne, akkor f(x) = b konstans függvény, és ezzel már
foglalkoztunk. Emellett a jelenti a lineáris függvény meredekségét, így látszik, hogy bármely (x0, ax0 + b) pontbeli
érintő meredeksége a lesz, és minden ponthoz húzható érintő.
Hatványfüggvény
Nézzük, mi lesz a f(x) = xn hatványfüggvény deriváltja, ahol n ≥ 1 és egész szám! Tetszőleges D(f) = R esetén
Ismert, hogy . Így
Megjegyzés. Kihasználtuk, hogy x ≠ x0, hogy folytonos függvény határértéke az x0 helyen megegyezik a helyettesítési
értékkel, és hogy a fenti összeg n tagú.
Az
függvény deriváltja
Vegyünk tetszőleges x0 ∈ D(f) pontot! (x0 ∈ R tetszőleges, csak 0 nem lehet.)
Tehát minden nem nulla x valós szám esetén létezik f′(x), és esetén.
Az
négyzetgyökfüggvény deriváltja
Tudjuk, hogy D(f) = [0, +∞). Nézzük tetszőleges x0 ∈ (0, +∞) belső pontra a di erenciálhányados de nícióját:
Általánosítva az eddigieket belátható, hogy ha n ∈ R és f(x) =xn, akkor az int D(f)-en f deriválható, és f′(x) = nxn–1.
A további nevezetes függvények derivált függvényeinek létezését nem bizonyítjuk, derivált függvényeiket csak
megadjuk. Az összes nevezetes függvény deriváltját táblázatba foglalva közöljük:
R c (c ∈ R) 0
x ∈ R, de x ≠ 0 xn(n ∈ Z) nxn–1
R ex ex
(0, +∞) ln x
R sin x cos x
R cos x –sin x
tg x
x e R, de x ≠ kπ (k ∈ Z) ctg x
D(f) = [–1, 1]
arcsin x
D(f′) = (–1, 1)
D(f) = [–1, 1]
arccos x
D(f′) = (–1, 1)
R arctg x
R arcctg x
R sh x ch x
R ch x sh x
R th x
R, de x ≠ 0 cth x
R arsh x
D(f) = [1,+∞)
arch x
D(f′)= (1, +∞)
(–1, 1) arth x
Megjegyzés. Az xn (n ∈ Z) függvényeknél az értelmezési tartomány ha n pozitív egész, akkor a valós számok halmaza,
ha n negatív egész, akkor kell a x ≠ 0 feltétel. Az értelmezési tartomány megadásánál így a szűkebb értelmezési
tartományú esetet adjuk meg, így nem vétünk hibát. Ugyanígy járunk el az xα (α ∈ R) függvényeknél.
Emlékeztetünk, hogy az arcsin x függvény a sin x inverz függvénye, azaz arcsin(sin x) = x, ugyanígy arccos x a cos x a
inverz függvénye stb., a hiperbolikus függvények de níciója:
Nézzük akkor meg, hogy mik a pontos összefüggések a függvényműveletek és a di erenciálhatóság között.
Legyenek f : R → R, g : R → R függvények! Legyen I ⊂ D(f), I ⊂ D(g) intervallum, x0 ∈ int I belső pont, melyben legyen f
és g di erenciálható.
Ekkor f +g, f – g, α · f (a ∈ R), f · g, és ha g(x0) ≠ 0, akkor di erenciálható x0-ban és
Tehát az összeg-, a kivonásfüggvény és a konstansszoros függvény deriválására egyszerű szabályok vonatkoznak. Ezek
az összefüggések a di erenciálhányados fogalmának segítségével könnyedén ellenőrizhetők:
Így .
5. Deriváljuk le a f(x) = tg2 x függvényt!
f(x) = tg x ·tg x
6.
Deriváljuk az függvényt!
Összetett függvény
Emlékeztetünk az összetett függvény fogalmára:
Példa. Legyen f(x) := cos x és g(x) := 2x2 + 1! D(f) = D(g) = R, ekkor D(f ◦ g) = D(g ◦ f) = R, így de niálhatjuk e függvények
kompozícióját. Ekkor (f ◦ g) (x) = f(g(x)) = cos (2x2 + 1), ahol g a belső és f a külső függvény. Másrészt (g ◦ f)(x) = g(f(x)) =
2cos2 x + 1, ahol pedig f a belső és g a külső függvény.
Megjegyzés. Felhívjuk a gyelmet, hogy bizonyos függvények nem komponálhatók egymással. Például vegyük a
és g(x) := –|x|–1 függvényeket! D(f) = [0, +∞) és R(g) = (–∞, –1], így {x ∈ D(g) : g(x) ∈ D(f)} = ø, tehát D(f ○ g) =
ø, vagyis e két függvény nem alkothat összetett függvényt, mert a belőlük alkotott kompozíciófüggvény sehol sem
értelmezhető.
Példák
1. Legyen f(x) := sin x és g(x) := x3 + 3, ekkor (f ◦ g)(x) = sin(x3 + 3) és D(f ◦ g) = R. (f ◦ g) ′(x) = f′(g(x)) · g′(x) = cos (x3 + 3) ·
3x2 és D((f ◦ g)′) = R, mert f és g is mindenütt di erenciálható, és persze f és g is egész R-en értelmezve volt, így
beszélhettünk f és g kompozíciójáról.
2. Deriváljuk az függvényt!
Vegyük észre, hogy ez egy összetett függvény: f(x) := (g ◦ h)(x), ahol g(x) := ex és h(x) := x2. Ezek után csak
alkalmaznunk kell az összetett függvény deriválási szabályát: .
3. Deriváljuk az függvényt!
Itt is kompozíciófüggvénnyel állunk szemben: f(x) := (g ◦ h)(x), ahol g(x) := x2 és h(x):= ex. Alkalmazzuk az összetett
függvény deriválási szabályát: .
4. Deriváljuk a f(x) =cos3 (x + 1) függvényt!
Észre kell vennünk, hogy ez egy többszörösen összetett függvény: f(x) := h(g(k(x))), ahol h(x) := x3, g(x) := cos x,
k(x) := x + 1. Ezt a következő módon deriváljuk, többször alkalmazva a kompozíciófüggvényre vonatkozó szabályt:
f(x) = (h ◦ (g ◦ k)) ′(x) = h′((g ◦ k)(x)) · (g ◦ k) ′(x) = h′((g ◦ k)(x)) · (g′(k(x))) · k′(x) = 3cos2 (x + 1) · (–sin(x + 1)) · 1.
Legyen f : R → R bijektív függvény. Ekkor az f–1: R →R függvényt az f inverz függvényének nevezzük, ha (f ◦ f–1)(x) = x és
(f–1 ◦ f)(x) = x.
Legyen f : R → R és legyen I ⊂ D(f) intervallum, f legyen szigorúan monoton I-n. Legyen továbbá x0 ∈ int I, és tegyük
fel, hogy f di erenciálható az x0 pontban, és f′(x0) ≠ 0. Ekkor f–1 di erenciálható az η = f(x0) pontban, és
Megjegyzés. f szigorú monotonitása f–1 létezéséhez elégséges feltétel. Így biztosítjuk, hogy az állításban lévő f–1
létezzen.
Így .
Azt mondjuk, hogy egy f : R → R függvény kétszer di erenciálható egy x0 ∈ int I pontban (I ⊂ D(f)), ha létezik f′ (f
derivált függvénye) az x0 pont egy környezetében, és f′ di erenciálható x0-ban.
Ha f egy nyílt I intervallum minden pontjában di erenciálható, akkor I-n létezik f′, azaz I ⊂ D(f′). Ha f′ az I
intervallumon di erenciálható, azaz (f′)′ létezik I-n, akkor azt mondjuk, hogy f kétszer di erenciálható I-n. Ezt a (f′)′
függvényt f második derivált függvényének nevezzük, és f ˝-vel jelöljük. Azaz f ˝(x) := (f′) ′(x).
Ugyanilyen módon határozhatjuk meg egy I intervallumon háromszor di erenciálható függvény fogalmát: f′˝(x) := ((f′)
′)′(x) (ha a deriválások elvégezhetőek).
Még egy jelölést használunk: f(0)(x) := f(x), azaz f 0-dik derivált függvényének az f függvényt hívjuk.
Megjegyzés. Ha f függvény az I intevallumon n-szer folytonosan di erenciálható, akkor k = 0, …, n–1 esetén az f(k)
derivált függvény természetesen folytonos, hiszen deriválható.
Egy f : R → R függvényt egy I ⊂ D(f) intervallumon végtelen sokszor di erenciálhatónak mondunk, ha ∀n ∈ N
esetén f n-szer di erenciálható I-n. Jele: f ∈ C∞(I).
Példa végtelen sokszor di erenciálható függvényre:
1. n-edfokú polinomfüggvény: f(x) = xn + an–1xn–1+ … + a2x2 + a1x + a0
f′(x) = nxn–1 + an–1(n – 1)xn–2 + … + a22x + a1.
Tehát f′ is polinomfüggvény, csak már (n – 1)-edfokú, így ez is deriválható:
f ˝(x) := (f′)′(x) = n(n –1)xn–2 + … + 2a2,
f ˝ is polinomfüggvény, így tovább deriválható, és az eredménye is polinomfüggvény lesz, ami megint deriválható,
így végtelen sokszor deriválható lesz.
f(n)(x) = n(n – 1)(n – 2) ·…· 2 · 1, és mivel ez konstans, ezért
f(n + 1)(x) = 0 és ∀k ≥ n + 1 és egész szám esetén f(k)(x) = 0.
2. Az exponenciális függvény: f(x) = ex,
f′(x) = ex, és látható, hogy f(n)(x) = ex ∀n ∈ N esetén.
3. A trigonometrikus függvények:
például: f(x) = sin x, f′(x) = cos x, f ˝(x) = (f′) ′(x) = – sin x, f(3)(x) = (f ˝) ′(x) = cos x, f(4)(x) = (f3) ′(x) = sin x, f(5)(x) = cos x és
így tovább.
4.
Az racionális törtfüggvények is végtelen sokszor di erenciálhatók.
Középértéktételek, l'Hospital-szabály
Először a középértéktételeket vázoljuk.
Rolle tétele:
Legyen f : R → R és [a, b] ⊂ D(f), f folytonos [a, b]-n, f di erenciálható az (a, b) intervallumban (a ≠ b), és legyen f(a) =
f(b). Ekkor található olyan x0 ∈ (a, b), melyre f′(x0) = 0.
Első hallásra ez az állítás bonyolultan hangzik, de a 17.4. ábra rávilágít a szemléletes jelentésére.
17.4. ábra
Megjegyzés. Tehát az állítás azt mondja ki, hogy ha egy di erenciálható függvény két különböző pontban ugyanazt a
függvényértéket veszi fel, akkor a két pont között található egy olyan harmadik köztük lévő pont, amiben a derivált
0, azaz az érintő vízszintes.
Lagrange-középértéktétel:
Legyen f: R → R és [a, b] ⊂ D(f), f folytonos [a, b]-n, f di erenciálható az (a, b) intervallumban (a ≠ b). Ekkor található
olyan x0 ∈ (a, b), hogy
Megjegyzés. Tehát a tétel azt mondja ki, hogy bármely, intervallumon di erenciálható függvény esetén található egy
olyan pont az intervallum belsejében, amiben a derivált meredeksége megegyezik a gra kon végpontjait összekötő
szakasz meredekségével (17.5. ábra).
17.5. ábra
Cauchy-féle középértéktétel:
Legyen f: R → R, g: R → R, [a, b] ⊂ D(f) és [a, b] ( D(g), f és g folytonos [a, b]-n, f és g is di erenciálható az (a, b)
intervallumban (a ≠ b), és tegyük fel, hogy g′(x) ≠ 0, ∀x ∈ (a, b) esetén. Ekkor létezik x0 ∈ (a, b), hogy
Darboux-tétel:
Legyen I nyílt intervallum, f : R → R, di erenciálható I-n.
Ekkor ∀[a, b] ⊂I intervallumra és ∀d ∈ R számra, melyre f′(a) < d < f′(b) vagy f′(b) < d < f′(a) teljesül, létezik olyan c ∈ (a,
b), hogy f′(c) = d.
A Darboux-tétel pontosan azt mondja ki, hogy minden f deriválható függvény f′ derivált függvénye Darboux-
tulajdonságú.
Nehezebb határérték-számítások is elvégezhetők a deriváltak segítségével, ehhez csak a következő szabályt kell
ismernünk:
l’Hospital-szabály:
Legyen f : R → R, g : R → R, és I ⊂ D⊂f) és I ( D(g) I nyílt intervallum, f és g di erenciálható I-n, x0 vagy eleme, vagy
végpontja az I intervallumnak, akár + ∞ vagy – ∞ is lehet, és g′(x) ≠ 0, ∀x ∈ I, x ≠ x0 esetén. Tegyük fel, hogy
Ha létezik
akkor létezik .
Ugyanez igaz akkor is, ha az x0 pontban f és g a 0 helyett +∞-hez vagy –∞-hez tart (nem szükséges, hogy azonos előjelű
végtelen legyen a két függvény határértéke).
Ennek az állításnak a segítségével például vagy típusú határértékek válnak kiszámíthatóvá, amik
meghatározása eddig lehetetlennek tűnt.
.
Példa olyan határérték kiszámítására, mely esetén a l’Hospital-szabály nem alkalmazható: Legyen f(x) = ex + e–x és
kiszámítására a l’Hospital-szabály nem használható, hiszen határértéke típusú (és hasonló lesz a
közelséget” így: x0 ≈ x. Ekkor a derivált de níciója alapján: , vagyis f(x) – f(x0) ≈ f′(x0)(x – x0), azaz
f(x) ≈ f′(x0)(x – x0) + f(x0).
Ez azt jelenti, hogy ha x nagyon közel van x0-hoz, akkor az f(x) közel van a f′(x0) (x – x0) + f(x0) értékhez. Tehát az x0-hoz
közeli pontokban a függvényérték a e(x): = f′(x0)(x – x0) + f(x0) lineáris függvény helyettesítési értékével közelíthető. A
lineáris függvény gra konja pedig pontosan az (x0, f(x0)) pontba húzott érintő egyenlete.
Példa. Adjuk meg az f(x) = x2 – 3x függvény gra konjának érintőjét az x0 = 2 helyen! f′(x) = 2x – 3, és x0-t
behelyettesítve f′(x0) = f′(2) = 1 és f(x0) = f(2) = –2. Az érintő egyenlete: y = 1(x – 2) – 2, azazy = x – 4 (17.6. ábra).
17.6. ábra
Monotonitásvizsgálat
Emlékeztetünk a monotonitás de níciójára:
Az f : R → R függvényt egy I intervallumon monoton növőnek nevezünk, ha ∀x1, x2 ∈ I, x1 < x2 esetén f(x1) ≤ f(x2). f
szigorúan monoton növő, ha ilyen x1 és x2 esetén f(x1) < f(x2).
Az f : R → R függvényt egy I intervallumon monoton fogyónak nevezünk, ha ∀x1, x2 ∈ I, x1 < x2 esetén f(x1) ≥ f(x2). f
szigorúan monoton fogyó, ha ilyen x1 és x2 esetén f(x1) > f(x2).
Az f függvény derivált függvényének segítségével következtethetünk f monoton növőségére vagy fogyására egy I
intervallumon.
Ez az állítás könnyen belátható. Vizsgáljuk például az első esetet, a többi hasonlóan történhet. Tegyük fel, hogy ∀x ∈
int I pontban f′(x) ≥ 0, és legyen tetszőleges x, y ∈ I, olyan, hogy x < y. A Lagrange-középértéktétel szerint található x0 ∈ (x,
y) ⊂ I, hogy f(y) – f(x) = f′(x0)(y – x) ≥ 0, tehát f(y) ≥ f(x).
Tehát ha x < y, akkor f(x) ≤ f(y), azaz monoton növő I-ben.
így , mert nem negatív függvény határértéke csak nem negatív lehet.
Mivel x0 ∈ int I tetszőleges volt, így minden x0 ∈ int I pontra f′(x0) ≥ 0.
Megjegyzés. Gondoljunk bele, hogy ha f egy I intervallumon szigorúan monoton nő, akkor abból nem következik,
hogy f′(x) > 0 minden pontjában az intervallumnak. Vegyük ugyanis a f(x) = x3 függvényt, ami szigorúan monoton nő
∀x ∈ R esetén (17.7. ábra), de f′(x) = 3x2 és f′(0) = 0, azaz van olyan x0 ∈ R, hogy f(x0) > 0 nem teljesül. Vagyis a szigorú
monotonitásból nem következtethetünk f′ szigorú pozitivitására, illetve negativitására.
17.7. ábra
Példák
1. Nézzük meg, hogy az f(x) = –x2 – 2x + 3 függvény mely intervallumokon nő, illetve csökken! Erre a kérdésre a
derivált függvény adja meg a választ: f′(x) = –2x – 2.
Vizsgáljuk meg, mely intervallumokon lesz pozitív f′:
Tehát, f′(x) pontosan akkor nem negatív, ha x ≤ –1. Azaz ha x ≤ –1, akkor f monoton növő. Sőt, ha x < –1, akkor f
szigorúan monoton növő. Másrészről f′(x) pontosan akkor nem pozitív, ha x ≥ –1. Azaz ha x ≥ –1, akkor f monoton
csökken, és ha x > –1, akkor f szigorúan monoton csökken (17.8. ábra).
17.8. ábra
2. Vizsgáljuk meg az f(x) = x3 – 4,5x2 + 6x függvényt monotonitás szempontjából! f′(x) = 3x2 – 9x + 6. Nézzük f′(x) mely
x-ekre lesz pozitív, azaz 3x2 – 9x + 6 ≥ 0 mikor teljesül?
Tehát x1 = 2 és x2 = 1, vagyis 3x2 – 9x + 6 = 3(x – 2)(x – 1). Azaz, keressük azon x-eket, melyekre 3(x – 2)(x – 1) ≥ 0!
Az előzőkből következik, hogy f′(x) pontosan akkor lesz nem negatív, ha x ≥ 2 vagy x ≤ 1, és f′(x) pontosan akkor
lesz nem pozitív, ha 1 ≤ x ≤ 2. Tehát ha x ≥ 2 vagy x ≤ 1, akkor f monoton növő (és ha x > 2 vagy x < 1, akkor f
szigorúan monoton növő). Ha 1 ≤ x ≤ 2, akkor f monoton csökken (és ha 1 < x < 2, akkor f szigorúan monoton növő)
(17.9. ábra).
17.9. ábra
3. Adjuk meg, hogy mely intervallumokon szigorúan monoton csökken f(x) = sin2x! Az a kérdés, hogy f′(x) < 0 mikor
teljesül. f′(x) = 2 sin x cos x és 2 sin x cos x < 0 ⇔ sin x cos x < 0.
Ez pontosan akkor teljesül, ha sin x negatív és cos x pozitív (1. eset), vagy ha sin x pozitív és cos x negatív (2. eset).
Tudjuk, hogy
1.
esetben sin x < 0 és .
2.
esetben sin x > 0 és .
Tehát ezeken az intervallumokon lesz f(x) = sin2 x szigorúan monoton fogyó (17.10. ábra).
17.10. ábra
Szélsőérték-számítás
Tekintsük az f : R → R függvényt!
Az x0 ∈ D(f) pont lokális maximumhely, ha található ϵ > 0, hogy (x0 – ϵ, x0 + ϵ) ⊂ D(f), és bármely x ∈ (x0 – ϵ, x0 + ϵ) esetén
f(x) ≤ f(x0).
Az x0 ∈ D(f) pont lokális minimumhely, ha található ϵ > 0, hogy (x0 – ϵ, x0 + ϵ) ⊂ D(f), és bármely x ∈ (x0 – ϵ, x0 + ϵ) esetén
f(x) ≥ f(x0).
Ha az x0 ∈ D(f) pont lokális minimumhely vagy lokális maximumhely, akkor azt mondjuk, hogy x0 lokális
szélsőértékhely.
Ha egy x0 ∈ D(f) pontra f(x) ≤ f(x0) teljesül bármely x ∈ D(f) esetén, akkor x0 abszolút minimumhely, és f(x0) érték az f
függvény minimuma.
Ha egy x0 ∈ D(f) pontra f(x) ≥ f(x0) teljesül bármely x ∈ D(f) esetén, akkor x0 abszolút maximumhely, és f(x0) érték az f
függvény maximuma.
Látható, hogy ha x0 abszolút minimumhely, akkor x0 lokális minimumhely is. De ha x0 lokális minimumhely, akkor
abból nem következik, hogy x0 abszolút minimumhely is. De csak az a pont lehet abszolút minimumhely, ami lokális
minimumhely is. (Ugyanez teljesül a maximumhelyre is.)
Megjegyzés. Fontos az a feltétel is, hogy x0 ∈ int I ⊂ D(f), hiszen ha f(x) = x2, D(f) = [1, 2], (vagyis f(x) = x2 | [1, 2]), akkor
x0 = 1 minimumhely, x0 = 2 maximumhely (de x0 egyik esetben sem belső pontja az értelmezési tartománynak),
viszont f′(1) = f′+(1) = 2 ≠ 0 és f′(2) = f′−(2) = 4 ≠ 0 (17.11. ábra).
17.11. ábra
Abból hogy egy pontban a derivált 0, még nem következik, hogy a pont lokális szélsőértékhely, például nézzük az f(x) =
x3 függvényt az x0 = 0 pontban! f′(x) = 3x2, f′(0) = 0, viszont x0 = 0 nem lokális szélsőértékhely, hiszen f szigorúan monoton
nő (17.7. ábra). Ezért kell pontosan megvizsgálnunk, hogy milyen feltételek mellett következtethetünk arra, hogy x0 lokális
szélsőértékhely.
Azaz egy f di erenciálható függvénynek egy x0 ∈ int I ⊂ D(f) pontban lokális szélsőértékhelye van, ha f′(x0) = 0, és f′ az
x0 pontban előjelet vált. (Sőt, az is megmutatható, hogy ha f′ egy x0 pontban nem vált előjelet, akkor ott nincs szélsőérték.)
Ha f′(x0) = 0, és f″(x0) ≠ 0, akkor belátható, hogy f′ az x0 pontban előjelet vált. (Ez visszafelé nem igaz, pl. ha f′(x) = x3,
akkor f a nullában előjelet vált, de f″(0) ≠ 0.)
így az is igaz, hogy
Megjegyezzük, hogy ha f′(x0) = 0, és f″(x0) = 0, abból nem következik feltétlenül, hogy f-nek x0-ban nincs lokális
szélsőértékhelye (pl. , aminek nullában minimuma van, de f′(0) = 0, és f″(0) = 0). Ebben az esetben
folytatnunk kell a vizsgálódást a szélsőérték elégséges feltételét ellenőrizve. Másképp megfogalmazva az elégséges feltétel a
következő.
Ha egy f függvény di erenciálható I intervallumon, és egy x0 ∈ int I ⊂ D(f) pontban f′(x0) = 0, és található ϵ < 0, hogy f
monoton növő az (x0 – ϵ, x0) intervallumon, és f monoton fogyó az (x0, x0 + ϵ) intervallumon, akkor f-nek x0-ban lokális
maximumhelye van.
Ugyanígy, ha egy f függvény di erenciálható I intervallumon, és egy x0 ∈ int I ⊂ D(f) pontban f′(x0) = 0, és található ϵ >
0, hogy f monoton fogyó az (x0– ϵ, x0) intervallumon, és f monoton növő az (x0, x0 + ϵ) intervallumon, akkor f-nek x0-
ban lokális minimumhelye van.
Az előző részben a monotonitásra vonatkozó állítások segítségével könnyedén igazolható, hogy ez az átfogalmazás
valóban ugyanazt mondja ki, mint a fenti állítás. Viszont ez az átfogalmazott állítás láthatóan teljesül: ha egy függvény
monoton nő, „majd” monoton fogy, akkor természetesen maximumhelye lesz a monoton növő és a monoton fogyó „részek
között” (17.12. ábra).
17.12. ábra
Példa. Állapítsuk meg, hogy az függvénynek hol van abszolút minimumhelye és abszolút
maximumhelye!
Ehhez f′-at kell vizsgálnunk: f′(x) = 4x3 + 4x2 – 8x = 4x(x2 + x – 2).
Kérdés, hogy f′ mikor 0? f′(x) = 4x(x2 + x – 2) = 0.
Látható, hogy x0 = 0 esetén f′(x0) = 0.
Még vizsgáljuk meg, hogy mik az x2 + x – 2 = 0 egyenlet gyökei!
így x1 = 1 és x2 = –2.
Tehát f′(x0) = f(x1) = f′(x2) = 0. x0, x1 és x2 lehet, hogy szélsőértékhely, de ehhez még az is kell, hogy például f″(x0) ≠ 0. Ha
ez teljesülne, akkor x0 szélsőértékhely lenne. Nézzük, mi az f második derivált függvénye: f″(x) = 12x2 + 8x – 8.
f″(x0) = f″(0) = –8 < 0, tehát a szélsőértékhelyről szóló állítás szerint x0 = 0 lokális maximumhely, és az x0-hoz tartozó
függvényérték: f(x0) = f(0) = 0.
f″(x1) = f″(1) = 12 · 12 + 8 · 1 – 8 = 12 > 0, tehát x1 = 1 lokális minimumhely, és az x1-hez tartozó függvényérték:
.
f″(x1) = f″(–2) = 12 · (–2)2 + 8 · (–2) – 8 = 24 > 0, tehát x2 = –2 lokális minimumhely, és az x2-höz tartozó függvényérték:
Megmutatható, hogy f′ ≤ 0, ha x ∈ (–∞, –2) vagy ha x ∈ (0, 1), tehát f ezeken az intervallumokon monoton fogyó, és f′ ≥
0, ha x ∈ (–2, 0) vagy ha x ∈ (1, +∞), tehát f ezeken az intervallumokon monoton növő (17.13. ábra). Az ábra alapján
látható, hogy x0 = 0 csak lokális maximumhely, míg x2 = –2 abszolút minimumhely.
17.13. ábra
Konvexitásvizsgálat
Ez szemléletesen azt jelenti, hogy f pontosan akkor konvex az I intervallumban, ha ∀x1, x2 ∈ I esetén az f függvény
gra konja a P1 : = (x1, f(x1)) és a P2:= (x2, f(x2)) pontokat összekötő húr alatt
(pontosabban nem felette) fekszik az [x1, x2] intervallumon (17.14a ábra).
Ugyanígy f pontosan akkor konkáv az I intervallumban, ha ∀x1, x2 ∈ I esetén az f függvény gra konja a húr
felett fekszik az [x1, x2] intervallumon (17.14b ábra).
17.14. ábra
Egy nyílt intervallumon konvex (konkáv) függvény folytonos az intervallum minden pontjában.
Ebből arra következtethetünk, hogy ha az előbbi feltételek mellett f még kétszer di erenciálható is int I-ben, akkor ha
minden x ∈ int I esetén
f″(x) ≥ 0, akkor f konvex,
f″(x) ≤ 0, akkor f konkáv.
Példa. Vizsgáljuk meg, hogy az f(x) = sin x függvény mely intervallumokon konvex, illetve konkáv! Ehhez tekintsük f″
(x) = (f′)′(x) = ((sin x)′)′ = (cos x)′ = –sin x! Tehát ha – sin x ≥ 0, akkor f konvex, ha – sin x ≤ 0, akkor f konkáv.
Azaz ha – π + 2kπ ≤ x ≤ 0 + 2kπ (k ∈ Z), akkor f konvex, ha 0 + 2kπ ≤ x ≤ π + 2kπ (k ∈ Z), akkor f konkáv (17.15. ábra).
17.15. ábra
In exiós pont
Legyen f: R → R, I ⊂ (f) intervallum, f folytonos és int I-ben kétszer di erenciálható. Az x0 ∈ int I pont in exiós pont (f-
nek x0-ban in exiója van), ha f″ az x0 pontban előjelet vált, azaz f″(x0) = 0, és található ϵ > 0, hogy
∀x ∈ (x0 – ϵ, x0) esetén f″(x) ≥ 0, és ∀x ∈ (x0, x0 + ϵ), esetén f″(x) ≤ 0, vagy
∀x ∈ (x0 – ϵ, x0) esetén f″(x) ≤ 0, és ∀x ∈ (x0, x0 + ϵ), esetén f″(x) ≥ 0.
Ha f″(x0) = 0 és f′″ (x0) ≠ 0, akkor belátható, hogy f″ az x0 pontban előjelet vált. Ezért igaz a következő.
Megemlítjük, hogy az x0 ∈ int I in exiós pont az a pont, ahol az f függvény konvexből átmegy konkávba, illetve
konkávból átmegy konvexbe. Ha x0 in exiós pont, akkor az (x0 f(x0)) ponton átmenő érintő (az ún. in exiós érintő)
belemetsz a függvény görbéjébe.
17.16. ábra
Függvényvizsgálat
Az eddigiek alapján már el tudunk végezni egy precíz függvényvizsgálatot.
A függvényvizsgálat szempontjai:
1. Értelmezési tartomány (D(f)).
2. Tengelymetszetek.
3. Folytonosság, (féloldali) határértékek a szakadási helyeken és az értelmezési tartomány határpontjaiban, esetleges
aszimptoták.
4. Monotonitás, lokális szélsőértékek.
5. Konvexitás, in exiós pont.
6. Táblázat, a függvénygra kon vázlatos megrajzolása.
7. Értékkészlet (R(f)).
Már csak egy fogalmat kell tisztáznunk: az f függvény aszimptotája, egy olyan y = mx + b egyenletű egyenes, melyre
(ha a határérték egyáltalán létezik) vagy olyan függőleges x = x0 egyenes, melyre
és .
Az aszimptota létezése szemléletesen azt jelenti, hogy a függvénygra kon hozzásimul az adott egyeneshez (17.17. ábra).
17.17. ábra
Meghatározása: és .
Az függvény vizsgálata:
1. A polinomfüggvény értelmezési tartománya minden esetben: R.
2. Tengelymetszetek:
Az x tengely és a gra kon metszete: f gyökei, azaz ahol f(x) = 0:
Azaz x0 = 0, a gyökök.
Azy tengely és a gra kon metszete a (0, f(0)) pont:
Tehát az x tengelyt a gra kon (0, 0), a pontokban metszi, az y tengelyt a (0, 0)
pontban.
3. A polinomfüggvények egész R-en folytonosak, és , , a határértéknél tanultak alapján.
4. A monotonitás és a szélsőérték-vizsgálathoz deriválni kell: f′(x) = x2 + 2x – 8.
Ha f′(x) ≥ 0, akkor f monoton nő, ha f′(x) ≤ 0, akkor f monoton csökken.
f′(x) + 0 – 0 +
17.18. ábra
x –2π < x < –π x = –π –π < x > 0 x=0 0<x<π x=π π < x < 2π
f′(x) + 0 + + 0 +
f″(x) – 0 + 0 – 0 +
f(x) monoton nő in exiós pont monoton nő in exiós pont monoton nő in exiós pont monoton nő
17.19. ábra
Az függvény vizsgálata:
1. Ez egy racionális törtfüggvény, amiről tudjuk, hogy értelmezési tartománya a nevezőben lévő polinom gyökein kívül az
összes valós szám. Az x ↦ x + 3 polinom gyöke az x = –3. Tehát D(f) = R\{–3}.
2. Tengelymetszetek:
Az y tengellyel: .
Tehát a (0, 0) pont az x és az y tengellyel vett metszete a gra konnak.
3. A racionális törtfüggvények az értelmezési tartományuk minden pontjában folytonosak. Nézzük meg a függvény jobb oldali
és bal oldali határértékét az x = –3 pontban:
f′(x) + 0 – – 0 +
f(x) monoton nő lokális maximum monoton fogy monoton fogy lokális minimum monoton nő
17.20. ábra
Parciális derivált
Di erenciálhatóság fogalma többváltozós függvény esetén
Második derivált
Felület érintősíkja
Szélsőérték
Parciális derivált
Legyen f: R2 → R függvény! Legyen a = (x0, y0) ∈ int D(f)! Tekintsük az (x0, y0) ponton áthaladó, az x tengellyel párhuzamos
egyenest az xy síkon. Az egyenes egy pontja: (x0 + t, y0) (t ∈ R). Tekintsük ezen egyenes pontjaihoz tartozó
függvényértékeket: f(x0 + t, y0) (t ∈ R). De niáljuk a ψ:R → R függvényt úgy, hogy minden t ∈ R valós számhoz rendelje
hozzá az f függvénynek az (x0 + t, y0) ponthoz tartozó helyettesítési értékét, azaz ψ(t): = f(x0 + t, y0). Vagyis szemléletesen ψ
egy, a felületen futó görbe (17.21. ábra).
17.21. ábra
Azt mondjuk, hogy az f függvény az (x0, y0) pontban az első változó szerint parciálisan di erenciálható, ha a ψ
függvény di erenciálható a t = 0-ban, és ekkor f(x0, y0) pontbeli első változó szerinti parciális deriváltja legyen ψ′(0) ∈
R.
Mivel ψ valósból valósba képező függvény, így az egyváltozós di erenciálhatóság de níciója alapján:
További jelölések:
Mivel ψ′(0) a ψ görbe 0 ponthoz tartozó érintőjének a meredeksége, így ∂1f(x0, y0) a ψ függvény által megrajzolt felületi
görbe (x0, y0, f(x0, y0)) ponthoz tartozó meredeksége (17.22. ábra).
17.22. ábra
Ha a ψ függvény di erenciálható a t = 0-ban, akkor az f függvény (x0, y0) pontbeli másodikváltozó szerinti parciális
deriváltja legyen ψ′(0) ∈ R. Azaz
A további jelölések értelemszerűen:
Az előzőekhez hasonló a ∂2f(x0, y0) jelentése is, azaz ∂2f(x0, y0) a felületi görbe érintőjének a meredeksége.
Az első változó szerinti parciális derivált de níciójából látszik, hogy a második koordináta, az y nem változik, állandó
marad. Ebből következik, hogy ha egy függvényt az első változója szerint deriválunk, akkor a második változót
konstansnak kell tekintenünk. Ugyanígy, ha a második változó szerint deriválunk, akkor az első változót tekintjük
konstansnak.
Megjegyzés. Az egyváltozós esetben beláttuk, hogy ha egy f: R → R függvény egy pontban di erenciálható, akkor ott
folytonos is. Kétváltozós esetben azonban egy (x0, y0) pontbeli parciális deriváltak létezéséből nem következik f(x0,
y0)-beli folytonossága. Vegyük ugyanis például az
Példa. Számítsuk ki az f(x) = 4x2 – 2xy3 + y függvény első és második parciális derivált függvényét!
Az x szerinti deriváltnál az y számít konstansnak: ∂1f(x, y) = 8x – 2y3.
Az y szerinti deriválásnál pedig x-t tekintjük konstansnak: ∂2f(x, y) = 6xy2 + 1.
Azt mondjuk, hogy f: R2 → R kétváltozós függvény di erenciálható az (x0, y0) ∈ int D(f) belső pontban, ha van olyan
A1, A2 ∈ R és olyan α: R2 → R függvény, hogy minden olyan h = (h1, h2) ∈ R2 vektorra, amelyre (x0 + h1, y0 + h2) ∈ D(f),
arra teljesül, hogy
hogy az α függvény a 0 közelében nagyon pici. Látható, hogy ha fennáll, akkor , de itt
ennél erősebb tulajdonságról van szó: ha veszünk egy, a 0-hoz nagyon közeli h vektort, és ennek hosszával elosztjuk
α(h)-t, akkor ha |h| < 1, akkor , tehát az osztással α(h) értékét növeljük, de még így is h → 0 esetén
Ez pontosan azt jelenti, hogy – mint az egyváltozós esetben – ha veszünk egy h = (h1, h2) vektort, melyre |h| kicsi, akkor
az (x0, y0) és (x0 + h1, y0 + h2) pontok távolsága |h|, vagyis a távolságuk kicsi, azaz (x0, y0) ≈ (x0 + h1, y0 + h2), és ekkor a
függvényértékek különbsége jól becsülhető a következő módon:
Vegyük észre, hogy a bal oldali határérték az első változó szerinti parciális derivált az (x0, y0) pontban (csak azt kell
Tehát ha f di erenciálható az (x0, y0) pontban (vagyis létezik jó A1, A2, α), akkor f parciálisán is di erenciálható (x0,
y0)-ban, és A1 = ∂(x0, y0), A2 = ∂2f(x0, y0).
Láthattuk, hogy mikor mondjuk egy f: R2 → R függvényre, hogy di erenciálható egy (x0, y0) pontban, de mit hívunk
f(x0, y0) pontbeli deriváltjának?
Az f:R2 → R függvény (x0, y0) pontbeli deriváltjának nevezzük azt az A ∈ R1 × 2 mátrixot, ún. derivált mátrixot, melyre
Ha f: R2 → R di erenciálható az értelmezési tartománya belső pontjaiban, akkor ott létezik f derivált függvénye, és
Tegyük fel, hogy f:R2 → R függvénynek léteznek a parciális deriváltjai (x0, y0)-ban, és (x0, y0) egy környezetében is, és a
környezetében a parciális derivált függvények folytonosak, persze így (x0, y0)-ban is. Ekkor f az (x0, y0) pontban
di erenciálható.
Ahogy a parciális derivált fogalmát, úgy a derivált fogalmát is kiterjeszthetjük n-változós függvényekre:
Egy f: Rn → R egy x = (x1, x2, …, xn) ∈ int D(f) belső pontban di erenciálható, ha létezik olyan A = [A1, A2, …, An) ∈ R1 × n
mátrix és olyan α: Rn → R függvény, hogy minden h ∈ Rn vektor esetén
Ebben az általános esetben is belátható, hogy ha f : Rn →R di erenciálható egy x ∈ int D(f) pontban, akkor a parciális
deriváltak léteznek, és minden i = 1, …, n esetén
Egy f: Rn → Rm egy x ∈ int D(f) belső pontban di erenciálható, ha létezik olyan mátrix
Ha f: Rn →Rm di erenciálható egy x ∈ int D(f) pontban, akkor a parciális deriváltjai léteznek minden fj (j = 1, …, m)
koordinátafüggvénynek és minden i = 1, …, n esetén
Második derivált
Legyen f: Rn → R. Tegyük fel, hogy a ∂if: Rn → R i-edik változó szerinti parciális derivált függvénynek létezik a j-edik
változó szerinti parciális deriváltja. Ekkor
Legyen f : Rn → R, a ∈ D(f) és K(a) az a egy környezete. Minden i, j = 1, …, n esetén ∂2ij f folytonos K(a)-ban. Ekkor az
Young-tétel:
Legyen f : Rn → R, a ∈ D(f) és K(a) az a egy környezete. Minden i, j = 1, …, n esetén ∂2ij f folytonos K(a)-ban. Ekkor ∂2ij f =
∂2ij f (i, j = 1, ..., n).
Tehát a parciális deriváltak megfelelő feltételek teljesülése esetén felcserélhetők, vagyis a Young-tétel pont azt mondja
ki, hogy a H(a) = f″(a) mátrix szimmetrikus.
Felület érintősíkja
Emlékezzünk vissza, hogy egy f: R → R függvénynél, ha az di erenciálható volt egy x0 ∈ int D(f) pontban, akkor fel tudtuk
írni a gra kon (x0, f(x0)) pontjához húzott érintő egyenletét. Ugyanígy gondolkodva, szeretnénk megadni egy f: R2 → R
függvény gra konjához, vagyis az általa megrajzolt felülethez tartozó (x0, y0, f(x0, y0)) pontbeli érintősík egyenletét, ha f az
(x0, y0) pontban di erenciálható.
Már említettük, hogy ha f: R2 → R az (x0, y0) ∈ D(f) pontban di erenciálható, akkor ha (x0, y0) ≈ (x, y), akkor
azaz
Ez azt jelenti, hogy ha az (x0, y0) és az (x, y) távolsága kicsi, akkor az (x, y) ponthoz tartozó függvényértékek jól
becsülhetők a A1(x – x0) + A2(y – y0) + f(x0, y0) értékkel.
Vegyük észre koordinátageometriai ismereteinkre visszagondolva, hogy a z = A1(x – x0) + A2(y – y0) + f(x0, y0) egy sík
egyenlete. Erről beláttuk, hogy jól közelíti az f(x, y) értékeket (x0, y0) ≈ (x, y) esetén, emellett áthalad az (x0, y0, f(x0, y0))
ponton.
Így ez a
egyenletű sík az f függvény (x0, y0, f(x0, y0)) ponthoz tartozó érintősíkja (az (x0, y0) ponthoz tartozó érintősíkja), ahol A1
= ∂1f(x0, y0) és A2 = = ∂2f(x0, y0).
Példa. Adjuk meg az f(x, y) = x3y függvény (2, –1) ponthoz tartozó érintősíkját!
Szélsőérték
Csak f: Rn → R valós értékű függvény esetén tudunk szélsőértéket de niálni.
Legyen f : Rn → R, a ∈ int D(f). Ha létezik olyan K(a) környezete az a pontnak, hogy minden x ∈ K(a) ⊂ D(f) esetén
Megjegyzés. Az f′(a) = 0 jelen esetben azt jelenti, hogy f′(a) = (0, …, 0), vagyis minden parciális deriváltja 0 az a
pontban, az ilyen pontokat stacionárius pontoknak nevezzük. Felhívjuk a gyelmet, hogy az állítás visszafelé nem
igaz, vagyis ha egy pontban a derivált 0, abból még nem következik, hogy ott szélsőértékhely van.
Ennek az állításnak a segítségével megvizsgálhatjuk, hogy hol lehetnek f-nek lehetséges szélsőértékhelyei.
〈 〉
Megjegyzés. A x, y az x és y vektorok skaláris szorzatát jelöli. A tételben 〈f″(a)h, h〉 kifejezés értelmes, hiszen f″
(a)h egy Rn-beli vektor.
〈 〉 〈
Speciálisan kétváltozós esetben a f″(a)h, h > 0 és a f″(a)h, h 〉 < 0 (bármely h ∈ R, h ≠ 0 esetén) feltételeket a
következő feltételekre cserélhetjük le, mert ekvivalensek egymással:
- ha det H(a) > 0 és ∂211 f(a) > 0, akkor a-ban lokális minimum van,
- ha det H(a) > 0 és ∂211 f(a) < 0, akkor a-ban lokális maximum van, és
- ha det H(a) < 0, akkor a-ban nincs lokális szélsőérték,
- ha det H(a) = 0, akkor az eddigi információkból nem tudjuk még eldönteni, hogy a-ban van-e szélsőérték.
Ez a feltétel könnyebben ellenőrizhető, így segítséget jelent konkrét példák megoldásánál.
2 2
Példa. Határozzuk meg, hogy hol van szélsőértéke az f(x, y) = ex + y függvénynek!
f′ hol 0?
.
det H(a) = 4 > 0 és ∂211 f(0, 0) = 2 > 0, vagyis ebből az következik, hogy az f függvénynek a (0, 0) pontban lokális
minimuma van.
Sebesség
Gyorsulás
Sebesség
Tekintsük a sebességfogalom kérdését a zikában! Először vizsgáljuk az egyenes vonalú mozgást! Egyenes vonalú
egyenletes mozgás esetén a sebesség a megtett út és az eltelt idő hányadosa,
A sebesség – ebben az esetben – a mozgás nagyságát mérő mennyiség, a mozgás iránya pedig az egyenes vonal irányával
egyezik meg.
Hasonlóan értelmezhető időben változó sebességű egyenes vonalú mozgás esetén az átlagsebesség t0 és t időpillanat
között, azaz
ahol s(t) jelöli a t idő alatt megtett utat (s: R → R folytonos függvény). Észszerűnek látszik, hogy a pillanatnyi sebesség
fogalmát a t0 időpillanatban a következőképp értelmezzük. Vegyünk a t0 időponthoz közeli t időpontokat, határozzuk meg
az átlagsebességet a [t0, t] időintervallumon, majd közelítsük t-t t0-hoz. Matematikailag precízen megfogalmazva, legyen
Bonyolultabb az eset, ha nem egyenes vonalú mozgást nézünk. Nem egyenes vonalú mozgás esetén (például ha egy
kanyargós úton haladunk autóval):
a sebesség egy olyan mennyiség, amely a mozgás nagyságát és irányát adja meg. Tehát a sebesség egy vektor.
Egy sík felszínen haladó tetszőleges mozgást egy görbe segítségével írhatunk le.
Egy folytonos paraméterezett görbe egy φ: [a, b] → R2 folytonos leképezés az [a, b] intervallumról R2-be.
A φ függvény deriváltja egy t0 pontban: , ami a mozgás sebességét jelenti a t0 időpontban. Tehát
Ez egy sebességvektor, melynek hossza a mozgás nagyságát, iránya a mozgás irányát adja meg (17.23. ábra).
17.23. ábra
Ugyanígy modellezhető a térben például egy repülőgép mozgása, melyet az idő függvényében egy φ: [a, b] →R3
folytonos paraméterezett görbe ír le. Sebességvektora egy t0 időpillanatban:
Gyorsulás
A zikában a gyorsulás a sebesség változási gyorsasága, jele: a. Egyenes vonalú mozgás esetén az átlaggyorsulás úgy
értelmezhető a t0 és t időpillanat között, hogy
azaz, ha az időfüggvényben s(t) jelöli az eddig megtett utat, akkor a(t0) = s″(t0).
Nem egyenes vonalú mozgás esetén a mozgást egy φ: [a, b] → Rn folytonos leképezéssel írjuk le az [a, b] intervallumról
Rn-be (n = 2, 3). Ekkor a gyorsulás egy megfelelő dimenziós vektor lesz, melyet úgy kapunk, hogy a sebességvektorból
kapott függvényt deriváljuk. Például n = 3 esetén:
17.24. ábra
Azaz . Tehát ahogy halad a gép (t nő), a sebessége egyre növekszik, a mozgás iránya pedig állandóan
változik, mert a vektor iránya változik. A mozgás gyorsulásvektora pedig:
18. Integrálszámításéés alkalmazásai
18.1. Határozatlan integrál
18.2. Riemann-integrál és tulajdonságai
18.3. Numerikus integrálás
18.4. Integrálszámítás alkalmazásai (terület, térfogat, ívhossz)
18.5. Többváltozós integrál
Primitív függvény
Primitív függvény
Legyen f valós-valós függvény, D(f) = I tetszőleges intervallum (korlátos vagy nem korlátos, nyílt, zárt, félig nyílt stb.).
Azt mondjuk, hogy az F: I → R függvény az f függvény primitív függvénye vagy határozatlan integrálja, ha F
di erenciálható, és F′(x) = f(x) minden x ∈ I esetén.
Megjegyzés. Az egész fejezetben, ha az intervallum szót használjuk, mindig nem elfajuló, azaz legalább kétpontú
intervallumra fogunk gondolni.
Megemlítjük, hogy ha kiszámítjuk egy f függvény primitív függvényét, akkor azt is szoktuk mondani, hogy
„integráljuk az f függvényt”.
Az előbbi de níció alapján egyértelmű, hogy
ha F az f egy primitív függvénye, akkor bármely c ∈ R esetén (F + c)′ = f, így f-nek végtelen sok primitív függvénye van.
Ha F az f egy primitív függvénye, akkor f-nek minden más G primitív függvénye előáll G = F + c alakban valamely c ∈
R-re.
vagyis (F – G)′ = 0 az egész I intervallumon. Legyenek x1, x2 ∈ [a, b] tetszőleges pontok, [a, b] ⊂ I tetszőleges. A Lagrange-
középértéktétel feltételei nyilván teljesülnek az [x1, x2] intervallumon F – G-re, tehát létezik olyan c ∈ (x1, x2), melyre
Ebből (F – G)(x2) = (F – G)(x1). Mivel x1 és x2 tetszőleges volt, ezért az F és a G különbsége az egész intervallumon állandó,
így az állítást beláttuk.
Tehát a primitív függvény mindig konstans erejéig van megadva, nem egyértelmű.
Bevezetünk egy jelölést a primitív függvények halmazára. Elöljáróban megjegyezzük, hogy a jelölés talán logikai
szempontból nem tökéletes, mégis használjuk, mert elterjedt a hazai és a nemzetközi szakirodalomban, lényegében Leibniz
óta bevett jelölés, és a megfelelő megállapodásokkal precízzé tehető.
Tehát az előzőek szerint, ha F az f egy primitív függvénye, ahol D(f) = I intervallum, akkor
A továbbiakban a fenti halmazt nem fogjuk mindig ilyen részletességgel kiírni, hanem egyszerűsítve, F + C alakban,
tehát
Ha ezt az írásmódot használjuk, emlékezzünk mindig arra, hogy itt C nem egy számot jelöl, hanem az összes lehetséges
számot, tehát ez a szimbólum nem egy függvényt jelöl, hanem függvények halmazát. Ha nem okoz félreértést, akkor ∫f(x)
dx = {F + C : C ∈ R} minden elemét is az egyszerűség kedvéért ∫f-fel jelöljük, tehát
Szokásosak még az ∫f(x) és ∫f(x) dx jelölések is a primitív függvény x pontbeli helyettesítési értékére, csakúgy, mint a
halmaz jelölésére. Vegyük észre, hogy a primitívfüggvény-keresés vagy határozatlan integrálás lényegében a di erenciálás
műveletének megfordítása. Így a di erenciálás szabályai megadják nagyon sok függvénynek a határozatlan integrálját. A
fontosabb alapintegrálok a következők:
A lista ízlés szerint a végtelenségig folytatható ismert függvények di erenciálásának megfordításával, például:
Az elemi függvények primitív függvényei után rátérhetünk a határozatlan integrál műveleti azonosságaira. A
di erenciálás azonosságaiból egyből adódnak a következők:
Ugyanis például az első esetben, ha f-nek és g-nek létezik primitív függvénye: ∫f, ∫g, azaz (∫f)′ = f és (∫g)′ = g, akkor ebből
következnie kellene, hogy létezik egy olyan H függvény, melyre H′ = f + g. Valóban, H:= ∫f + ∫g választással H′:= (∫f + ∫g)′ = (∫f)′ +
(∫g)′ = f + g, azaz (f + g)-nek létezik primitív függvénye, vagyis létezik ∫(f + g) és ∫(f + g) = H = ∫f + ∫g.
Ugyanígy látható be a másik két állítás is, a di erenciálás tulajdonságait kihasználva. Sajnos az integrálás szorzás és
kompozíció esetén nem viselkedik ilyen szépen, ezért bonyolultabb függvények esetén csak esetleges módszereink vannak.
A szorzással kapcsolatos a parciális integrálás:
A parciális integrálás elve:
Legyenek f és g di erenciálhatóak az I intervallumban, és tegyük fel, f · g′-nek létezik primitív függvénye! Ekkor f′ · g-
nek is létezik primitív függvénye, és az egyik:
Be kell látnunk, hogy (f · g – ∫f · g′) di erenciálható, és (f · g – ∫f · g′)′ = f′ · g, ekkor ugyanis f′ · g-nek létezik primitív
függvénye, és ∫f′ · g = f · g – ∫f · g′.
Nézzük: (f · g – ∫f · g′)′ = (f · g)′ – (∫f · g′)′ = f′ · g + f · g′ – f · g′ = f′ · g, tehát teljesülnek az elvárásaink.
Megjegyzés. Használtuk az inverz függvény deriválási szabályát és hogy F′(t) = f(g(t))g′(t) (amit feltettünk).
Így .
Valóban, (−e−x + 2) ′ = −(e−x + 2) ′ = −e−x + 2 · (−1) = e−x + 2.
2.
Mi a primitív függvénye az függvénynek ?
Tehát .
3. Ez a példa ötletet ad bizonyos racionális törtfüggvények primitív függvényének kiszámolásához.
Ha alakú racionális törtfüggvény, ahol p(x) egy n-edfokú polinom, akkor ismert, hogy p(x)
előállítható a következő gyöktényezős alakban:
p(x) = a(x – x1)(x – x2) · …· (x · xn). Ennek segítségével f(x) parciális törtekre bontható úgy, hogy
.
Keresnünk kell olyan A1, A2 ∈ R számokat, melyekre:
Valóban .
Ha g(x) = tg x, akkor
Példa helyettesítéses integrálra:
Számítsuk ki helyettesítéssel a függvényt az I = [–1, 1] intervallumon! Helyettesítsünk t:= sin x-t,
Így
Mi nem az · cos x függvény primitív függvényére vagyunk kíváncsiak (eddig csak ezt számoltuk
ki), hanem a függvénynek a primitív függvényére, így a helyettesítést „visszafelé” is el kell végeznünk,
azaz legyen x = arcsin t:
A Riemann-integrál fogalma
A Riemann-integrál formális tulajdonságai
A Newton–Leibniz-tétel
Integrálfüggvények
Improprius integrál
A Riemann-integrál fogalma
Az [a, b] intervallum (korlátos és zárt) egy felosztása egy olyan {Ii = [xi – 1, xi]: i = 1, …, n} véges intervallumrendszer,
melyre a = x0 < x1 < x2 < … < xn = b valamely n ∈ N esetén. Az [a, b] intervallum felosztásainak halmazát jelölje FO [a, b].
Adott f: [a, b] → R korlátos függvény és Φ = {I1, I2, …, In} ∈ FO[a, b] felosztás esetén de niálja a Φ felosztáshoz tartozó
alsó közelítő összeget
18.1. ábra
az {Sf(Φ):Φ ∈ FO[a, b]} és {Sf(Φ):Φ ∈ FO[a, b]} halmazok közül a bal oldali halmaz minden eleme kisebb vagy egyenlő a
jobb oldali halmaz minden eleménél. Ebből az is következik, hogy az első halmaz felülről, a második alulról korlátos.
Megjegyezzük, hogy az integrál szemléletes jelentése a következő. Mivel sf(Φ) egy alsó becslése a függvénygörbe és az x
tengely által határolt síkidom „előjeles” területének az [a, b]-n és Sf(Φ) egy felső becslése. Ezek szuprémuma, illetve
in muma által előállított mennyiség az integrál, és ha ezek megegyeznek, így ebből következik, hogy az integrál az [a, b]
intervallumon pontosan a függvénygörbe és az x tengely által határolt síkidom „előjeles” területe az [a, b] intervallumon
(18.2. ábra).
18.2. ábra
18.3. ábra
A továbbiakban jelölje
R[a, b] := {f: [a, b] → R: f korlátos és Riemann-integrálható}.
Ha Φ ∈ FO[a, b], akkor az
Először kimondunk egy, az előző kritériumhoz nagyon hasonló integrálhatósági feltételt, ami azonban „több” annál.
Az integrálhatóság Riemann-féle kritériumának kimondásához szükségünk lesz még az alábbi fogalomra is.
Legyen Φ = {I1, I2, …, In} ∈ FO[a, b] felosztás, és ξ = (ξ1, …, ξn) ∈ Rn tetszőleges, a Φ felosztás egy osztópontvektora,
vagyis
Az integrálhatóság Riemann-féle kritériuma pont azt mondja ki, hogy a Riemann-féle de níció és a Darboux-féle
de níció megegyezik, azaz
A Riemann-féle de níciónál nem tettük fel, hogy f korlátos függvény. Ha egy tetszőleges f függvénynek létezik a
Riemann-integrálja, akkor létezik a Darboux-féle integrálja is, hiszen ugyanaz a két érték, viszont a Darboux-féle integrált
csak korlátos függvényekre tudjuk kiszámítani, tehát f biztosan korlátos is. Ebből a gondolatmenetből következik, hogy
Felhívjuk a gyelmet, hogy van olyan korlátos függvény, ami nem Riemann-integrálható. Tekintsük a
Dirichlet-függvényt!
Láthatóan f korlátos [0, 1]-en, de nem Riemann-integrálható, mert minden Φ ∈ FO[a, b] esetén sf(Φ) = 0 és Sf(Φ) = 1, így
Most már példát is mutattunk nem Riemann-integrálható függvényre! Feltehetjük a kérdést, hogy vajon melyek azok a
függvények, amelyek biztosan Riemann-integrálhatóak? Erre ad választ az alábbi fontos állítás.
Tehát ha f folytonos egy [a, b] intervallumon, akkor ott integrálható is, azonban ez az állítás szintén nem igaz
visszafelé. Vegyük például az
[0, 2]-n nem folytonos függvényt, ami integrálható [0, 2]-n (18.4. ábra).
18.4. ábra
A Riemann-integrál formális tulajdonságai
Hasonlóan a határozatlan integrálhoz, a Riemann-integrálra is érvényesek bizonyos műveleti tulajdonságok.
Ha a Riemann-integrál szemléletes jelentésére gondolunk, azaz az integrál a „függvény görbéje, és a vízszintes tengely
által határolt síkidom előjeles területe”, akkor az előbbi állítások láthatóan teljesülnek. Például, ha az f és g függvényeket
összeadjuk, akkor az f + g függvény görbe alatti területe a két függvény görbe alatti területének az összege (18.5. ábra).
Az |f| és a szorzatfüggvény Riemann-integrálhatóságáról szólnak az alábbi állítások.
18.5. ábra
Például .
Ez azt jelenti, hogy ha f Riemann-integrálható [a, b]-n, akkor [a, b] egy részintervallumán f leszűkítése is nyilván
integrálható.
Legyen f: [a, c] →R függvény, a < b < c. Tegyük fel, hogy f ∈ R[a, b] és f ∈ R[b, c]. Ekkor f ∈ R [a, c] és
A 18.6. ábrából szépen látható, hogy miről szól ez az állítás.
18.6. ábra
Ebben a részben közlünk az integrálról egy jelölésbeli megállapodást is. f ∈ R [a, b] esetén jelölje
Az integrál az integrandus szerint monoton, ezt matematikailag úgy fogalmazzuk meg, hogy
Ehhez csak azt kell meggondolnunk, hogy minden Φ ∈ FO[a, b] esetén sf(Φ) ≤ sg(Φ), amiből
Ugyanis, minden x ∈ [a, b] esetén − |f(x) | ≤ f(x) ≤ | f(x) |, így . Az első egyenlőtlenséget (–1)-
A bizonyítás azonnal adódik abból, hogy az integrál monoton. Ehhez a fenti állítást az inf f konstans függvényre és f-re,
illetve f-re és a sup f konstans függvényre kell alkalmazni. Ennek az állításnak a következménye:
A Newton–Leibniz-tétel
Ebben a fejezetben azt vizsgáljuk, hogy hogyan lehet kiszámolni egy konkrét függvény Riemann-integrálját egy [a, b]
intervallumon. A következő tétel az egész integrálszámítás legjelentősebb eredménye.
Newton–Leibniz-tétel:
Ha f ∈ R [a, b] és f-nek létezik primitív függvénye [a, b]-n, akkor f minden rögzített F primitív függvényére
Példák
1.
2.
3.
18.7. ábra
A 18.7. ábrából jól látható, hogy miért 0 ez az „előjeles terület”: a [–π, π] intervallumon a sin x függvény görbéje
ugyanakkora területet metsz ki a síkból az x tengely felett és alatt.
Példák
1.
Vajon rájöhetünk-e máshogy is arra, hogy az integrál 0? A válasz igen. Ez egy speciális típusú függvény volt:
páratlan függvény, azaz f(–x) = –f(x). Valóban cos (–x) · (–x) = – cos x · x, hiszen tudjuk, hogy cos (x) = cos (–x).
Ha páratlan függvényt integrálunk egy, a 0-ra szimmetrikus intervallumon, akkor az integrál értéke 0 lesz. Jól
szemlélteti ezt a 18.7. ábra is, hiszen az integrál egy „előjeles terület”.
2.
Legyen G(x):= x2 és f(x):= e4x! Ekkor , hiszen F′(x) = f(x) = e4x és g(x) = G′(x) = 2x, így
most .
Tehát
Úgy osztottuk ki a szerepeket a szorzatban, hogy G legyen az a függvény, amit a deriválás egyszerűsít, és valóban: a
G(x) = x2 függvényt a deriválás egyszerűsíti, a második deriváltja pedig konstans, így lényegében „eltüntettük”, hogy
ne zavarjon minket az integrandusban.
Megjegyzés. Ha g bijekció, akkor létezik g–1, és nyilvánvaló, hogy g–1(a) = α és g–1(b) = β az állításban.
Példa. Számítsuk ki a értékét!
Szeretnénk a helyettesítéses integrál képletét alkalmazni! Vegyük észre, hogy ha f(x) = akkor
Megjegyezzük, hogy a primitívfüggvény-számításnál ugyanígy levezethetők ezek a példák, mint itt, például az előbbi
példából látszik, hogy
Integrálfüggvények
Megjegyzés. Mivel x ∈ [a, b], így [a, x] ⊂ [a, b] és ezért a megfelelő állítást használva f ∈ R[a, x], vagyis az
Legyen például c = 0, ekkor egy integrálfüggvény: . Mivel f egész R-en értelmezett függvény, így
a de níció szerint tetszőleges a ∈ R számot választhatok. Legyen például a = 0, ekkor f egy integrálfüggvénye:
dt.
Észrevehető, hogy a példában lévő integrálfüggvény megegyezik f egy primitív függvényével. A továbbiakban azzal
foglalkozunk, hogy mikor egyeznek meg egy függvény primitív és integrálfüggvényei.
Meg kell említenünk az integrálfüggvények egy fontos tulajdonságát:
Felhívjuk a gyelmet, hogy attól, hogy f Riemann-integrálható, még nem biztos, hogy van primitív függvénye, és lehet
olyan, hogy f-nek van primitív függvénye, mégsem Riemann-integrálható. A következő állítás tisztázza az összefüggést a
határozott integrálok és a primitív függvények között.
Ha f ∈ R [a, b] és f-nek létezik primitív függvénye, akkor f primitív függvényeinek ∫f halmaza megegyezik f
integrálfüggvényeinek halmazával. Ez azt is jelenti, hogy ekkor f integrálfüggvényei di erenciálhatók, és deriváltjuk
éppen f, azaz
Tehát az állítás feltételeinek teljesülése mellett ha f ∈ R[a, b], akkor van integrálfüggvénye, ami primitív függvény is.
Ha f-nek van primitív függvénye, akkor az integrálfüggvény is, és akkor könnyen látható, hogy f Riemann-integrálható.
Nézzük meg, hogy mit lehet tudni egy Riemann-integrálható és folytonos függvény integrálfüggvényeiről!
ha f folytonos [a, b]-n, akkor f-nek van primitív függvénye [a, b]-n (éspedig bármely integrálfüggvénye az).
Ugyanis, ha f folytonos [a, b]-n, akkor ott Riemann-integrálható is, és akkor létezik F integrálfüggvénye, ami az előbbi
állítás alapján primitív függvénye is f-nek [a, b]-n.
Improprius integrál
Ki szeretnénk terjeszteni a Riemann-integrál fogalmát nyílt, félig nyílt és nem korlátos intervallumokra.
Megjegyzés. Könnyen látható, hogy ha I = [a, b], akkor Rloc[a, b] = R[a, b].
Legyen f: I → R függvény! Azt mondjuk, hogy f impropriusan integrálható I-n, ha f ∈ Rloc(I), és f-nek létezik olyan F
integrálfüggvénye I-n, melyre
Látható, hogy ezzel a de nícióval kiterjesztettük a Newton–Leibniz-tétel öszszefüggését, ugyanis ha f ∈ R[a, b], akkor F
integrálfüggvénye folytonos az a és b végpontokban, ezért határértékei is léteznek, és megegyeznek a helyettesítési
értékkel, vagyis ekkor a Newton–Leibniz-tételt kapjuk vissza.
18.8. ábra
Most nézzük meg, hogy milyen feltételek segítségével látható be, hogy egy függvény improprius integrálható-e.
Cauchy-féle szükséges és elégséges feltétel improprius integrálhatóságra: Legyen f ∈ Rloc(I). Ekkor f pontosan akkor
impropriusan integrálható I-n, ha minden ϵ > 0 esetén léteznek olyan a, b ∈ I, inf I < a ≤ b > sup I számok, hogy
Ebből
Vagyis teljesül f-re a Cauchy-feltétel, így improprius integrálható, bár az integrál értékét nem tudtuk kiszámolni.
Összehasonlító kritérium:
Legyen f ∈ Rloc(I)! Tegyük fel, hogy léteznek α, β ∈ I, inf I < a ≤ β > sup I számok és g1: I ∩ (–∞, α] → [0, +∞), g2: I ∩ [β, + ∞)
→ [0, +∞) függvények, melyek improprius integrálhatók, és majorálják f-et, vagyis
Ekkor f improprius értelemben integrálható I-n.
Ha f ∈ Rloc(I) és |f| improprius értelemben integrálható I-n, akkor f is improprius értelemben integrálható I-n.
Belátható, hogy ilyen n-edfokú p polinom létezik és egyértelmű, azaz egyetlen ilyen tulajdonságú polinom van.
Ez ap polinom könnyedén meg is határozható adott alappontok és f függvény esetén. Ehhez tekintsük a következő
de níciót!
Ellenőrizzük, hogy pn valóban az interpolációs feladat megoldása-e! Mivel pn n-edfokú, így elegendő megnézni, hogy
pn(xt) = f(xi) (i = 0, …, n) teljesül-e.
közelíteni:
Tehát .
integráljai, azaz .
Egy kvadratúra akkor és csak akkor pontos minden legfeljebb n-edfokú polinomra, ha interpolációs
Newton–Cotes-kvadratúraformulák
Érintőformula
Trapézformula
Simpson-formula
Összetett formulák
Newton–Cotes-kvadratúraformulák
Az elnevezésben a „zárt” jelző arra utal, hogy az alappontrendszer az a és b végpontokat is tartalmazza (x0 = a és xn = b),
így összesen n + 1 alappontunk van. Ha a végpontokat nem vesszük bele az ekvidisztáns alappontrendszerbe, akkor
nyílt Newton–Cotes-formuláról beszélünk, ebben az esetben csupán n – 1 alappontunk van: x1, x2, …, xn – 1, de itt is
teljesülnie kell annak a feltételnek, hogy a szomszédos alappontok távolsága h, sőt még x1 – a = b – xn–1 = h.
Ez egy nyílt Newton–Cotes-formula, egy alappontja van: , ami az [a, b] intervallum felezőpontja. Ehhez az
interpolációs alapponthoz tartozó Lagrange-féle alappolinom: l1(x) = 1 (hiszen az 1 darab alapponthoz 0-adfokú
18.9. ábra
Trapézformula
Ez egy zárt formula két alapponttal: x0 = a és x1 = b. A két alappontra elsőfokú Lagrange-interpolációt végzünk, az
alappolinomok:
A kvadratúra együtthatói:
Így a trapézformula:
18.10. ábra
A 18.10. ábrából látható, hogy ha az f nem negatív függvény, akkor a trapézformula az (a, 0), (a, f(a)), (b, f(b)), (b, 0)
pontok által meghatározott trapéz területét adja, így már érthető az elnevezés. Nyilván, ez a formula nem pontos
tetszőleges függvényre. A következő állítás a formula hibájáról ad felvilágosítást.
Ez egy zárt formula három alapponttal: x0 = a, és x2 = b, így az alappontok az [a, b] intervallumot két egyenlő
részre osztják. Ezekre az alappontokra illesztett alappolinomok integráljai, azaz a kvadratúra együtthatói a következők:
Tehát a Simpson-formula
Összetett formulák
Ha az [a, b] intervallumot m egyenlő részre osztjuk, és minden ilyen részintervallumon alkalmazzuk a trapézformulát,
majd a kapott részintervallumokon az f közelített integrálját összegezzük, akkor az összetett trapézszabályt kapjuk meg.
Nyilván ez a formula sokkal pontosabb az egyszerű trapézszabálynál, és m növelésével egyre pontosabbá válik.
Ugyanígy járhatunk el a Simpson-formulánál is. Az [a, b] intervallumot egyenlő részre osztjuk (persze m páros),
Megjegyezzük, hogy rengeteg Newton–Cotes-típusú kvadratúraformula létezik, attól függően, hogy nyílt vagy zárt
formulát használunk, és mennyi alappontot veszünk. Emellett még arra is felhívjuk a gyelmet, hogy nemcsak Newton–
Cotes-típusú kvadratúrák vannak.
A Gauss-típusú kvadratúraformulák esetén az xk, Ak(k = 0, …, n) értékeket úgy választjuk meg, hogy a kvadratúra
minél magasabb fokú polinomokra is pontos legyen. A Csebisev-típusú kvadratúraformulák esetén az xk ∈ [a, b] (k =
Példa. Adjuk meg közelítő értékét az egyszerű trapézformula, majd az összetett trapézformula
segítségével! Végül számoljuk ki az integrál pontos értékét a primitív függvény segítségével!
Területszámítás
Ívhosszúság-számítás
Forgástestek térfogata
Területszámítás
Mint már említettük, az integrálszámítás felhasználható síkidomok területének kiszámítására. Emlékezzünk vissza, hogy
ha f:R → R függvény folytonos, és f ≥ 0 [a, b]-n, akkor az [a, b] intervallumon az f függvény görbéje és az x tengely közötti
rész területe pontosan az f függvény [a, b]-n vett integráljával egyezik meg.
Azaz, ha f: R → R függvény integrálható [a, b] intervallumon, és A:= {(x, y) ∈ R2: a ≤ x ≤ b, 0 ≤ y ≤ f(x)}, akkor az A halmaz
területe a következő:
Felhívjuk a gyelmet, hogy ha f ≤ 0 [a, b]-n, akkor –f ≥ 0 [a, b]-n, és a görbe alatti terület,
Példák
1. Számítsuk ki a függvény görbe alatti területét a [0, 2] intervallumon!
18.11. ábra
2. Mekkora területet határolnak az y = 1, y = e–x és x = –3 egyenletű görbék?
Nézzük meg, hogy hol metszi egymást az y = 1 és y = e–x görbe, ezt úgy számoljuk ki, mintha az
18.12. ábra
Vegyük a B :={(x, y) ∈ R2: –3 ≤ x ≤ 0, 0 ≤ y ≤ e–x–1} halmazt. Láthatóan az A és a B halmaz területe megegyezik. Így ha
az f(x) = e–x – 1 függvényt integráljuk a [–3, 0] intervallumon, akkor a B, azaz az A halmaz területét kapjuk meg.
Vagyis a görbék által határolt terület 15,9 egység. Felhasználtuk, hogy e ≅ 2,71.
3. Számítsuk ki az f(x) = 3x2 + 3x – 1 és a g(x) = 2x2 – 5x – 8 parabolák által határolt területet! Ehhez először meg kell
határoznunk a két gra kon metszéspontjait:
Tehát x1 = –1 és x2 = –7, és így y1 = f(x1) = 3 · (–1)2 + 3 · (–1) – 1 = –1, és y2 = f(x2) = –3 · (–7)2 + 3 · (–7) – 1 = 147 – 21 – 1 = 125,
vagyis a két metszéspont: (–1, –1) és (–7, 125). Ez azt jelenti, hogy a [–7, –1] intervallumon kell integrálnunk a g(x) –
f(x) függvényt (18.13a ábra). Azért ezt a függvényt, mert ezen az intervallumon g(x) ≥ f(x) (18.13b ábra).
(Megjegyzés: a 18.13b ábra nem arányos!)
18.13. ábra
4. Számítsuk ki az r > 0 sugarú kör területét! A sík x2 + y2 = r2 egyenletet kielégítő (x, y) pontjai pontosan az origó
középpontú, r sugarú kör pontjai (18.14. ábra).
18.14. ábra
Először a felső félkör területét fogjuk kiszámolni, ami megegyezik az függvény görbéje és az x
tengely által bezárt területtel. f(x) és az x tengely metszete: (0, –r) és (0, r). Tehát a felső félkör területe:
intervallumon.
Ívhosszúság-számítás
Emlékeztetünk ennek a résznek a legfontosabb fogalmára:
Egy folytonos, paraméterezett görbe egy φ : [a, b] → Rn folytonos leképezés az [a, b] intervallumról Rn-be.
Ha a φ: [a, b] → Rn folytonos, paraméterezett görbe folytonosan di erenciálható, akkor φ rekti kálható, és ívhossza:
Ha egy f: [a, b] → R folytonosan di erenciálható függvény gra konjának mint síkbeli görbének az ívhosszát
Ezzel beláttuk, hogy az r sugarú, origó középpontú kör ívhossza, azaz kerülete: 2rπ.
Forgástestek térfogata
Legyen f: [a, b] → R függvény folytonos [a, b]-n, és legyen f ≥ 0! Képzeljük el az f függvény gra konját a kétdimenziós
koordináta-rendszerben (x tengely és y tengely), és vegyük hozzá a z tengelyt, hogy térbeli koordináta-rendszerünk
legyen.
Az f függvény által meghatározott forgástesten a tér azon (x, y, z) koordinátájú pontjait értjük, melyekre teljesül, hogy
A forgástestet szemléletesen úgy kapjuk, hogy az f függvény gra konját a térbeli koordináta-rendszerben
megforgatjuk az x tengely körül (18.15. ábra).
18.15. ábra
Ha f: [a, b] → R függvény folytonos [a, b]-n, és f ≥ 0, akkor az f függvény által meghatározott forgástest térfogata a
következő formulával számítható ki:
Megjegyzés. Az állításban a feltételeket úgy határoztuk meg, hogy f2 minden esetben integrálható legyen.
Példák
1. Kúp és csonka kúp térfogata.
Adjuk meg az f(x) = 3x által meghatározott forgástest térfogatát a [0, 5] és a [2, 5] intervallumban (18.16. ábra)!
18.16. ábra
Ha f gra konját megforgatjuk az x tengely körül, akkor ha a [0, 5] intervallumon nézzük a forgástestet, akkor egy
kúpot kapunk, melynek magassága 5, alapkörének sugara pedig 3·5. Ha pedig a [2, 5] intervallumon vizsgáljuk a
forgástestet, akkor csonka kúpot kapunk, melynek magassága 3, és az alapkörének sugara 15, míg a fedőlap
körének sugara 6. Nézzük meg mi lesz a kúp térfogata:
2. Gömb térfogata.
Adjuk meg az függvény által meghatározott forgástest térfogatát a [–r, r] intervallumban! Ez az f
függvény az origó középpontú, r sugarú kör felső körívét adja meg, mint azt már láthattuk az előbbi részeknél. Ha
tehát megforgatjuk a függvény gra konját az x tengely körül, akkor az r sugarú gömböt kapjuk.
Számítsuk ki ennek a testnek a térfogatát:
Legyen f: [a, b] × [c, d] → R kétváltozós függvény! Vegyük az [a, b] intervallum a = x0 < x1 < x2 < … < xn = b felosztását,
jelöljük ezt Φ = {I1, I2, …, In} ∈ FO [a, b]-vel, és a [c, d] intervallum c = y0 < x1 < y2 < … < ym = d felosztását, jelöljükΨ = {J1,
J2, …, Jm} ∈ FO [c, d]-vel. Legyen ξ = (ξ1, …, ξn) ∈ Rn tetszőleges, a Φ felosztás egy osztópontvektora, vagyis ξi ∈ Ii, t = 1,
…, n, és η = (η1 …, ηm) ∈ Rm tetszőleges, a Ψ felosztás egy osztópontvektora, ηj ∈ Jj, j = 1, …, m. (Azaz ξ ∞ Φ és η ∞ Ψ.)
Ekkor a
Szemléletesen ez az összeg a [xi–1, x] × [yj–1, yj] téglalap alaplapú, f(ξi, ηj) magasságú hasábok „előjeles” térfogatának az
összege. (Hiszen az f(ξi, ηj) számok negatívak is lehetnek.)
Legyen f: [a, b] × [c, d] → R kétváltozós függvény! Ha van olyan A ∈ R szám, hogy minden ϵ > 0 számhoz létezik olyan δ >
0, hogy minden Φ ∈ FO[a, b] és Ψ ∈ FO[c, d], |Φ| < δ, |Ψ| < δ felosztások, és minden ξ ξ Φ, η > Ψ osztópontvektorok
esetén
akkor azt mondjuk, hogy f Riemann-integrálható T: = [a, b] × [c, d] téglalapon, és f Riemann-integrálja A, azaz
.
térrész előjeles térfogata, azaz az xy sík alatti területet negatív előjellel számolja.
Belátható, mint az egyváltozós esetben, hogy
Látható, hogy kétváltozós esetben ugyanolyan gondolatmenettel de niáltuk az integrált, mint az egyváltozós esetben.
Azonban míg az egyváltozós esetben a primitív függvények segítségével az integrálok egyszerűen kiszámíthatóak, a
kétváltozós esetben nem tudjuk alkalmazni „egy az egyben” ezt a technikát, hiszen nem tudjuk de niálni egy kétváltozós
függvény primitív függvényét.
A következő tétel arra ad választ, hogy hogyan tudjuk ebben az esetben könnyedén kiszámolni egy kétváltozós
függvény integrálját.
Fubini-tétel:
Legyen f: [a, b] × [c, d] → R, f folytonos az [a, b] × [c, d] téglalapon. Ekkor
Az f kétváltozós függvényre úgy nézzünk rá, mint egy egyváltozós függvényre: rögzítrsük le y-t, vagyis tekintsük
konstansnak, és vegyük az x ↦ f(x, y) egyváltozós függvényt!
Ezt az eljárást alkalmazzuk, akkor azt mondjuk, hogy x szerint integrálunk, és f x szerinti integrálja .
Megjegyzés. Ez a de níció analóg a parciális deriváltak fogalmával, csak itt integrálni kell. Nézzük meg, hogy mit
jelent ez a gyakorlatban:
Látjuk, hogy az y-nak egy függvénye lesz, az x változó eltűnt. Ezt úgy is szoktuk mondani, hogy
kiintegráltuk x-et a kifejezésből. Nézzük, mi lesz, ha y szerint integrálunk!
Vegyük a h : y ↦ x2y–ey + 2x egyváltozós függvényt!
Megemlítjük, hogy ha az integrált szeretnénk kiszámolni, akkor mivel y3 itt konstansnak tekinthető, így
Integráljuk az f(x) = sin x · sin y függvényt a téglalapon! Ez a függvény folytonos, így alkalmazható
a Fubini-tétel:
Számoljuk ki értékét:
Így
Megjegyezzük, hogy egy n-dimenziós téglatesten történő integrálás hasonlóan végezhető el. Háromdimenziós példát a
következő részben láthatunk.
Integrálás normáltartományon
A téglalapon vett integrálás kiterjeszthető kicsit bonyolultabb térrészeken való integrálásra is.
Legyen α: [a, b] → R, β: [a, b] → R olyan folytonos függvények, melyekre α(x) < β(x) minden x ∈ [a, b] esetén. Szeretnénk
az α és β függvények által határolt tartományon integrálni az [a, b] intervallumon, azaz a
Példa. Legyen α(x) ≡ 0 és β(x) = x(x – 2) a [0, 2] intervallumon, az ezen függvények és intervallum által meghatározott
Nx normáltartományon integráljuk az f(x) = xy függvényt (18.18. ábra)!
18.18. ábra
Integráltranszformáció
Emlékezzünk vissza a helyettesítéses integrál témakörére. Ott a helyettesítés segítségével egy bonyolult integrált
egyszerűbb alakra tudtunk hozni, és így már könnyebben ki tudtuk számolni. Több dimenzióban is szeretnénk egy hasonló
fogalmat bevezetni, melynek segítségével egy bonyolultabb halmazon vett integrált téglalapon vett integrállá
transzformálhatunk.
Integráltranszformáció:
legyen H ⊂ Rn halmaz és G: H → Rn olyan injektív függvény, melyre a ∂i;Gk: H → R parciális derivált függvények
léteznek és folytonosak a H halmazon, i = 1, … n, k = 1, …, n.
Ekkor minden a G(H) halmazon integrálható f: G(H) → R függvényre
Így ha H = [0, R] × [0, 2π), akkor G(H) az origó középpontú, R sugarú kör, vagyis ebben az esetben egy körön való
integrálást téglalapon vett integrálássá transzformálhatunk.
Példa. Számítsuk ki az R sugarú kör területét a polártranszformáció segítségével! Ehhez az f(x, y) ≡ 1 függvényt kell
integrálnunk az origó középpontú, R sugarú körön. Először kiszámoljuk det G′(r, φ) értékét:
Térbeli polártranszformáció. Ebben az esetben, azaz ha n = 3, akkor az olyan transzformációkat nevezzük térbeli
polártranszformációknak, melyeknél
Legyen, ekkor
Nézzük az integrálást!
Megjegyzés. Az integrálási határokat úgy választottuk, hogy det G′(r, φ, υ = r2 cos υ értéke pozitív legyen, így az
abszolút érték jelét elhagyhattuk.
19.1. Bevezetés
Középiskolában sokat foglalkoztunk különböző egyenletek, egyenletrendszerek megoldásával. Ennél általánosabb, ha egy
egyenletben az ismeretlen nem szám, hanem függvény. Ekkor az egyenletet függvényegyenletnek hívjuk. Ebben a
fejezetben olyan függvényegyenletek megoldásával foglalkozunk, amelyekben egy ismeretlen függvény, az ismeretlen
függvény deriváltja, illetve deriváltjai szerepelnek. Az ilyen egyenleteket di erenciálegyenletnek nevezzük.
A di erenciálegyenletek a természetben, társadalomban zajló folyamatok leírására alkalmasak. Most tekintsünk
néhány zikai, illetve biológiai példát ezekre:
1. Mozgás leírása (kinematika): jelölje x(t), hogy t időpontban hol tartózkodik a test, a pillanatnyi sebességét v(t) = x′(t),
a pillanatnyi gyorsulását a(t) = x″(t). Newton II. törvénye alapján a testre ható erő F = m · a.
Legegyszerűbb eset a szabadesés vizsgálata. Legyen m a test tömege, g a gravitációs állandó. Mivel zikából tudjuk,
hogy F = m · g, ezért a fentiek alapján
ahol K konstans.
3. Populációdinamika: jelölje x(t) t időpontban egy populáció méretét! Ekkor
ahol x0 ∈ R tetszőleges.
A di erenciálegyenlet fogalma
A di erenciálegyenlet megoldásai
A di erenciálegyenlet fogalma
Legyen F : Rn + 2→R folytonos függvény. Ekkor n-edrendű közönséges di erenciálegyenletnek nevezzük a következőt:
Legyen f:Rn + 1→R folytonos függvény! Ekkor n-edrendű explicit közönséges di erenciálegyenletnek nevezzük a
következőt:
Bár később még lesz szó ilyen típusú egyenletekről, most is felhívjuk az olvasó gyelmét arra, hogy egy n-edrendű
explicit közönséges di erenciálegyenlet egy elsőrendű rendszerré transzformálható a következő módon.
Legyen x1(t) := x(t), x2(t): = x′(t), …, xn(t): = x(n–1)(t). Ekkor a következők tel jesülnek:
A di erenciálegyenlet megoldásai
Egy di erenciálegyenletet megoldani annyit jelent, hogy meghatározzuk az összes olyan függvényt, amelyek a
deriváltfüggvényeikkel együtt kielégítik a szóban forgó di erenciálegyenletet. Tekintsük a következő példákat!
1. x′(t) = 3t2
Ez egy elsőrendű explicit közönséges di erenciálegyenlet. Ennek általános megoldása az x(t) = t3 + c függvény, ahol c ∈
R tetszőleges szám. Ugyanis, ha
Mivel c tetszőleges, ez végtelen sok megoldáshoz vezet. Ha azonban azt is kikötjük, hogy például x(0) = 5, akkor az x(t) =
t3 + 5 lesz az egyetlen megoldás, mivel x(0) = 3·02 + c = c = 5. Megjegyezzük, hogy lényegében ez egy primitívfüggvény-
keresési feladat volt. Egyszerűbb egyenletek esetében csupán a tanult primitívfüggvény-keresési technikákat kell
alkalmaznunk. A következő példa is ilyen.
2. x″(t) = 6t
Ez már másodrendű explicit közönséges di erenciálegyenlet. Keressük meg a t ↦ 6t függvény primitív függvényét:
ahol c, d ∈ R tetszőleges számok. Tekintsük tehát megint az x(0) = 5 kezdeti feltételt! Ekkor tehát
így az x(t) = t3 + ct + 5 megoldásra jutottunk. Ez még mindig végtelen sok megoldás, tehát még egy feltétel kell. Például
kiköthetjük azt, hogy x′(0) = 3. Ekkor
Legyen D ⊂ R × Rn tartomány, f: D → Rn folytonos függvény, (t0, p0) ∈ D egy pont. Ha az I ⊂ R nyílt intervallumra és az
x: I → Rn di erenciálható függvényre teljesül az, hogy
Megjegyzés. Partikuláris megoldásnak nevezünk minden olyan megoldást, ami nem tartalmazza a
di erenciálegyenlet összes megoldását.
Tegyük fel, hogy g folytonos az I intervallumon, és h folytonos a J intervallumon. Továbbá tegyük fel, hogy h(x(t)) ≠ 0
sehol J-n. Ezután az egyenlet mindkét oldalát h(x(t))-vel leosztva a következőre jutunk
Ha most integráljuk mindkét oldalt t szerint, azaz vesszük a primitív függvényüket, akkor
így a helyettesítéses integrálás szabálya alapján:
Legyen
az explicit megoldás. Ha H nem injektív, de részintervallumokon az, akkor a részintervallumokon invertáljuk H-t.
Példák
1. x′(t) = ch2(x(t))·t
Mivel ch2 (p) ≠ 0, p ∈ R esetén, ezért leoszthatunk vele. Így
Mivel
a következőt kapjuk:
az explicit megoldás.
2. x′(t) = 1 + x2(t)
Itt h(p) = 1 + p2 és g(t) ≡ 1. Mivel az 1 + p2 függvény sehol sem 0 R-en, ezért leoszthatunk 1 + x2(t)-vel:
Tehát
3. x′(t) = 1 – x2(t)
Ebben a példában g(t) ≡ 1 és h(p) = 1 – p2. Mivel g(p) = 0, ha p = ±1, ezért könnyű végiggondolni, hogy
konstans megoldások. Ezek után tegyük fel, hogy x(t) ≠ ± 1. Ekkor leoszthatunk h(p)-vel:
G(t) ugyanaz lesz, mint az előző példában, H(p) pedig a következő:
Megjegyezzük, hogy a szétválasztható változójú egyenleteknek létezik két speciális esete, nevezetesen:
1. g ≡ 1, azaz x′(t) = h(x(t)). Ekkor ugyanaz a módszer alkalmazandó, mint az általános esetben.
2. h ≡ 1, azaz x′(t) = g(t). Vagyis itt csak integrálnunk kell, azaz
alakú, ahol a, b, c ∈ R, b ≠ 0. Ekkor a megoldás módszere a következő. Új ismeretlen függvényt vezetünk be:
összefüggést kapjuk.
Így az egyenletünk a következő lesz:
Az egyenlet mindkét oldalát b-vel szorozva és a-t hozzáadva az alábbi alakhoz jutunk:
Ez már szétválasztható változójú di erenciálegyenlet, ahol h(p) = a + b·f(p), g(t) ≡ 1. Ezt a már ismertetett módon meg
tudjuk oldani z(t)-re, amiből pedig könnyű meghatározni x(t)-t.
2. A homogén egyenlet
alakú. Hogy az ilyen típusú egyenletet meg tudjuk oldani, ismét új ismeretlen függvényt kell bevezetnünk, ami a következő
lesz:
Példák
1. x′(t) = (3t + x(t) + 2)2
Legyen
di erenciálegyenletet kapjuk, amely z-re nézve már szétválasztható változójú di erenciálegyenlet. Itt h(p) = 3 +
p2, ami sehol sem 0 R-en. Így leosztva vele:
Tehát az és az ∫1dt határozatlan integrálokat kell megoldanunk. Az utóbbiról már tudjuk, hogy az t +
c1, így tekintsük az elsőt!
azaz
Tehát . Mivel h(p) sehol sem vesz fel 0-t, ezért osztva vele:
Ezért
illetve
Megjegyzés. Az elsőrendű homogén lineáris di erenciálegyenlet egy speciális alakú szétválasztható változójú
egyenlet, ahol h(p) = p és g(t) = a(t). Azt is megjegyezzük, hogy a homogén lineáris egyenletnek az x(t) ≡ 0 mindig
megoldása, ezért ezek után ezt nem írjuk le külön.
egy primitív függvény. Szorozzuk be az egyenletünk mindkét oldalát e–A(t)-vel, és rendezzük át:
alakú egyenlet, ahol az a valamilyen konstans. Az ilyen típusú egyenleteket elsőrendű állandó együtthatós homogén
di erenciálegyenleteknek nevezzük.
Megjegyzés. Az inhomogén egyenlet megoldásához más úton is el lehet jutni, méghozzá úgy, hogy először előállítjuk
az inhomogén egyenlethez hozzárendelt X′(t) = a(t) · X(t) homogén di erenciálegyenlet X-szel jelölt általános
megoldását, valamint az inhomogén egyenlet egy partikuláris megoldását, amit xp-vel jelölünk. Ekkor az inhomogén
lineáris di erenciálegyenlet általános megoldása az alábbi:
Példák
1.
így
A bal oldalon x(t) · e–A(t) deriváltja szerepel, így az egyenlet mindkét oldalát integrálva a következőt kapjuk:
2. x′(t) + 6t·x(t) = 0
Ez homogén lineáris egyenlet, ahol a(t) = –6t. A fentiek alapján a di erenciálegyenlet általános megoldása:
ahol
Ezek után adjuk meg az x(–2) = 3 kezdeti értékhez tartozó partikuláris megoldást is! Helyettesítsünk be t helyébe –
2-t:
A Bernoulli-egyenlet
deriválva
Ez már lineáris di erenciálegyenlet, amit a fent ismertetett módon meg tudunk oldani.
Integrálva az egyenletet:
Ismeretes, hogy ilyenkor ∃F: R2 → R folytonosan di erenciálható függvény, melyre ∂tF(t, p) = M(t, p) és ∂pF(t, p) = N(t,
p). Határozzuk meg így F-et, ekkor
Ez általában implicit megoldás. Ha ebből x(t) kifejezhető, akkor megkapjuk az explicit megoldást.
Integráljuk t szerint:
Itt a konstansoktól eltekintünk, hiszen csak egy primitív függvényre van szükségünk. Tehát
Autonóm egyenletek
Az autonóm egyenletekben az f függvény t-től csak x(t)-n keresztül függ. Ezt precízebben megfogalmazva:
19.3. Di erenciálegyenlet-rendszerek
Ebben a fejezetben olyan di erenciálegyenletekről lesz szó, ahol az ismeretlen többváltozós függvény. Ennek elmélete
általában igen összetett, így mi most csak az elsőrendű lineáris esetet fogjuk tárgyalni. Az elsőrendű közönséges lineáris
di erenciálegyenlet-rendszer általános alakja a következő:
ahol x:I → Rn, A(t) ∈ Rn × n és b(t) ∈ Rn ∀t ∈ I, továbbá A és b folytonos függvények. Ha b ≡ 0, akkor az egyenletrendszert
homogén elsőrendű lineáris di erenciálegyenlet-rendszernek nevezzük, ellenkező esetben inhomogénnek.
Az elsőrendű homogén lineáris di erenciálegyenlet-rendszer megoldásai előállnak
alakban, ahol x1(t), x2(t), …, xn(t) lineárisan független megoldások, c1, c2, …, cn ∈ R tetszőleges konstansok.
Ekkor az elsőrendű inhomogén lineáris di erenciálegyenlet-rendszer megoldásai:
ahol xh(t) az inhomogén rendszerhez tartozó homogén rendszer megoldása, amit úgy kapunk, hogy az inhomogén
rendszerben b(t)-t azonosan nullává tesszük, és az így kapott homogén lineáris di erenciálegyenlet-rendszert megoldjuk.
xp(t) az inhomogén rendszer egy partikuláris megoldása.
A megoldásra általában nem lehet képletet adni, ezért mi csak az állandó együtthatós esettel foglalkozunk. Az
elsőrendű állandó együtthatós lineáris di erenciálegyenlet-rendszerek általános alakja a következő:
Ez azonban a gyakorlatban nem túl jól használható, hiszen általában nem könnyű egy végtelen sor összegét
meghatározni, főleg hogy mátrixot kell hatványozni benne.
Ismeretes, hogy minden A ∈ Rn×n mátrixhoz létezik olyan P ∈ Rn × n invertálható mátrix, melyre
ahol a blokkok négy típus valamelyikébe tartoznak: ha λ valós sajátértéke az A mátrixnak, akkor egy blokk az alábbi
két típus valamelyikébe tartozik:
alakúak, ahol I2 a 2 × 2-es egységmátrixot jelöli. Valamely sajátértékhez annyi blokk tartozik, amennyi a hozzá tartozó
lineárisan független sajátvektorok száma. A legnagyobb λ blokk mérete egyenlő λ multiplicitásával az A mátrix
minimálpolinomjában. Ez az úgynevezett valós Jordan-féle normálalak.
A továbbiakban megnézzük, hogy 2 × 2-es A mátrixok esetén milyen alakú J mátrixokat kaphatunk a sajátértékeik (λ, μ)
felhasználásával.
1. Ha λ ≠ μ valósak, vagy λ = μ kétszeres sajátérték esetén
ahol u, v kétdimenziós oszlopvektorok, λ-hoz, illetve μ-höz tartozó sajátvektorok, azaz Au = λμ és Av = μv. Ez esetben
Példa: az x′(t) = Ax(t) alakú di erenciálegyenlet-rendszereket oldjuk meg a következő A mátrixok esetén:
1.
Ezek szerint
2.
Ami valójában (λ – 1)2 = 0, amelynek a megoldása egyszeres sajátérték: λ = 1. Ehhez két független sajátvektor
tartozik:
Ezek szerint
3.
Ezek szerint
Természetesen észrevehettük volna, hogy A mátrix eleve Jordan-féle normálformában van felírva. A megoldása a
következő:
ennek megoldása:
Azaz
a) Tegyük fel, hogy λ, μ > 0, ekkor a fáziskép típusa instabil csomó.
c) Tegyük fel, hogy λ · μ < 0 különböző előjelűek. Ekkor a fáziskép típusa nyereg.
a) Tegyük fel, hogy λ > 0! Ekkor a fáziskép típusa elfajult instabil csomó (19.9. ábra).
19.9. ábra
b) Tegyük fel, hogy λ < 0! Ekkor a fáziskép típusa elfajult stabil csomó (19.10. ábra).
19.10. ábra
Az első egyenletet cos φ(t)-vel szorozva, a második egyenlet sin φ(t)-szereséhez adva, illetve az első egyenletet – sin φ(t)-
vel szorozva, a második egyenlet cos φ(t)-szereséhez adva a következő rendszerhez jutunk:
Ezek után tetszőleges A mátrix esetén könnyen meg tudjuk határozni a fázisképet. Legyen A ∈ Rn × n tetszőleges, B = P–
1AP valamely P ∈ Rn × n invertálható mátrixszal. Ekkor az x′(t) = Ax(t) egyenletrendszernek a z(t) = P–1x(t) új ismeretlen
függvény bevezetésével a z′(t) = Bz(t) egyenletrendszer felel meg. Így ha B az A Jordan-féle normálalakja, akkor a z′(t) =
Bz(t)-hez tartozó fázisképet P viszi át az x′(t) = Ax(t) fázisképébe.
Ennek a fázisképe stabil csomó (lásd a 19.5. ábrán). Erre alkalmazva a P mátrixot a fázisképet a 19.17. ábra mutatja.
Ez már elsőrendű di erenciálegyenlet. Így az eredeti másodrendű egyenlet megoldását visszavezettük két elsőrendű
egyenlet megoldására.
Példa: di erenciálegyenlet általános megoldását keressük.
Alkalmazva az x′(t) = p(t) helyettesítést az alábbi di erenciálegyenlethez jutunk:
így
A bal oldalon p(t) · e–A(t) deriváltja szerepel, így az egyenlet mindkét oldalát integrálva a következőt kapjuk:
így
ahol a, b, f intervallumon értelmezett folytonos függvények. Ha f ≡ 0, akkor homogén, ellenkező esetben inhomogén
egyenlet.
A homogén egyenlet megoldásai előállnak
alakban, ahol c1, c2 ∈ R tetszőleges konstansok, és x1(t), x2(t) lineárisan független alapmegoldások.
Az inhomogén egyenlet megoldása így
lesz, ahol xp(t) az inhomogén egyenlet egy partikuláris megoldása, xh(t) pedig az egyenlethez tartozó homogén egyenlet
megoldása. A megoldást képlettel csak állandó együtthatós esetben tudjuk előállítani. Az állandó együtthatós egyenlet:
Először tekintsük a homogén esetet! Ennek két lineárisan független alapmegoldását szeretnénk előállítani. A módszer
a következő: keressük x-et x(t) = eλt alakban. Ezt a homogén egyenletbe helyettesítve:
Ezek után rátérünk az inhomogén egyenlet megoldására. Első lépésként előállítjuk az egyenlethez tartozó homogén
egyenletet úgy, hogy f(t) ≡ 0. Ennek a fentiek alapján meghatározzuk a megoldását. Így a megoldás előállításához az
inhomogén egyenlet egy partikuláris megoldását kell még meghatároznunk. Ezt általában próbálgatással tudjuk megtenni,
azonban a következő speciális esetben képlet van rá.
Legyen f(t) = eat(P1(t) cos bt + P2(t) sin bt) alakú, ahol a, b ∈ R, és P1, P2 polinomok. Ekkor létezik az alábbi alakú
partikuláris megoldás:
ahol Q1, Q2 polinomok, melyek foka P1 és P2 fokának maximuma, valamint a + bi a karakterisztikus egyenlet k-szoros
gyöke.
Példák
1. x″(t) + 2x′(t) + x(t) = 0 elsőrendű homogén lineáris egyenlet megoldásait keressük. Először a karakterisztikus
egyenletet kell felírnunk:
Ennek gyökei λ1 = λ2 = –1. Így a di erenciálegyenletünk általános megoldása a fentiek alapján az alábbi függvény:
2. x″(t) – 2x′(t) + 2x(t) = 0 elsőrendű homogén lineáris egyenlet megoldásait keressük. Most ismét a karakterisztikus
egyenlet felírásával kezdünk:
Ennek gyökei λ1 = 1 + i, illetve λ2 = 1 – i. Ezek komplex megoldások, így a di erenciálegyenletünk általános
megoldása a fentiek alapján az alábbi függvény:
3. x″(t) – 3x′(t) + 2x(t) = et cos t másodrendű inhomogén lineáris egyenlet megoldásait keressük. Első lépésként írjuk
fel az ehhez tartozó homogén lineáris egyenletet:
Ezek után az inhomogén egyenlet egy partikuláris megoldását kell előállítanunk, amit a fenti tétel alapján fogunk
megtenni.
19.5. A Laplace-transzformáció
Már a középiskolában is találkoztunk azzal a módszerrel, hogy egy egyenletet úgy oldottunk meg, hogy új változó
bevezetésével egy egyszerűbb egyenletre vezettük vissza az egyenletünket, és annak a megoldásából számoltuk ki az eredeti
ismeretlent. Az előzőkben is többször oldottunk meg úgy di erenciálegyenleteket, hogy először transzformáltuk az
ismeretlen függvényt, és az arra kapott egyenletet oldottuk meg, majd az eredményt visszatranszformáltuk.
Tulajdonképpen ezt csináltuk mindig, amikor új ismeretlen függvényt vezettünk be. A most bevezetésre kerülő
transzformáció az ismeretlen függvényre vonatkozó di erenciálegyenlet helyett annak egy transzformáltjára vonatkozó,
explicite megoldható függvényegyenletet szolgáltat. Ez az eljárás igen sok di erenciálegyenletre használható. A Laplace-
transzformáció csak az adott kezdeti feltételnek megfelelő megoldást adja meg, nem az általános megoldásból származtatja
a partikuláris megoldást. A következőkben bevezetünk néhány alapfogalmat, és leírjuk a Laplace-transzformáció
legfontosabb tulajdonságait.
Az alapfüggvények tehát többek között kisebbek, mint egy nem túlságosan gyorsan +∞-hez tartó függvény.
Megjegyezzük, hogy Mf és αf árnövelésével Tf mindig nullának vehető. A Laplace-transzformáció módszere olyan
egyenletek transzformálására használható, amelynek megoldásairól eleve tudjuk a fenti feltételek teljesülését, vagy az
adott egyenletnek csak ilyen megoldásait keressük. Ezek után bevezetjük a Laplace-transzformáció fogalmát.
2.
f + g is alapfüggvény, , t ∈ R és
3.
Legyen n ∈ N! Ha az f alapfüggvény N-szer folytonosan deriválható, és deriváltjai korlátosak a [0, +∞) intervallumon,
akkor f(N) is alapfüggvény, és
Legyen f, g: (0, +∞) → C! Tegyük fel, hogy az integrál minden t ∈ (0, +∞) esetén létezik. Ekkor az f és g
konvolúciója a következő:
Az alábbiakban a konvolúció néhány tulajdonságát mondjuk ki.
1. Ha létezik f * g, akkor g * f is létezik, és f * g = g * f. Továbbá tetszőleges k ∈ C mellett f * kg is létezik, és f * kg = k(f * g).
2. Ha létezik f * g és f * h, akkor f * (g + h) is létezik, és f * (g + h) = f * g + f * h.
Két függvény konvolúciójának Laplace-transzformáltját a következő módon adhatjuk meg. Ha f és g alapfüggvény,
akkor konvolúciójuk létezik, Mf * g ≤ max{Mf, Mg}, af * g ≤ max{αf, αg}, és L(f * g) = L(f)L(g).
Az alábbi táblázat néhány függvény Laplace-transzformáltját adja meg.
1 1 0
ϵ ∈ R+ tetszőleges
(n ∈N)
eat (a ∈ R) 1 |a|
cos (bt) (b ∈ R) 1 0
sin (bt) (b ∈ R) 1 0
ch (bt) (b ∈ R) 2 |b|
sh (bt) (b ∈ R) 2 |b|
|a| + ϵ
(n ∈ N, a ∈ R) ϵ ∈ R+ tetszőleges
t sin(bt) (b ∈ R) 1 ϵ ∈ R+ tetszőleges
Re (b) + ϵ
t ch (bt) (b ∈ R) 1
ϵ ∈ R+ tetszőleges
Re(b) + ϵ
t sh (bt)(b ∈ R) 1
ϵ ∈ R+ tetszőleges
függvény inverz Laplace-transzformáltjának nevezzük, és L–1(F)-fel jelöljük azt az alapfüggvényt, amelynek Laplace-
transzformáltja F.
Példák
1. x′″(t) – 6x″(t) + 12x′(t) – 8x(t) = t3e2t harmadrendű állandó együtthatós inhomogén lineáris di erenciálegyenlet
megoldásait keressük az x(0) = 1, x′(0) = –1, x″(0) = –2 kezdeti feltételek mellett. Legyen
Ekkor mivel
Legyen ismét X:= L(x), Y:= L(y). Ekkor az előző példához hasonlóan kapjuk, hogy
A táblázat segítségével meghatározhatjuk ezek inverz Laplace-transzformáltjait, ami már a megoldást adja:
19.6. Függvénysorok
Az előző fejezetekben volt már szó végtelen sorokról. Ebben a fejezetben is valami hasonlóról fogunk írni, csak itt az
összegzésen belül nem számok lesznek, hanem függvények. Először is ismerkedjünk meg a függvénysorok pontos
fogalmával!
Legyenek az f1, f2, …, fn, … függvények olyanok, hogy értelmezési tartományaiknak H metszete nem üres halmaz.
Ekkor az
végtelen sok tagú formális összeget függvénysornak nevezzük. Az f1, f2, …, fn, … függvények a függvénysor tagjai. Az
Függvénysorok konvergenciája
Műveletek függvénysorokkal
Hatványsorok
A Taylor-sor
Fourier-sorok
Függvénysorok konvergenciája
A végtelen sorokhoz hasonlóan a függvénysor részletösszegeinek segítségével fogalmazhatjuk meg a függvénysor
konvergenciájának fogalmát.
Megjegyezzük, hogy az (Sn(a)) számsorozat határértéke a konvergenciatartomány különböző pontjaiban más és más
lehet, így a függvénysor összege a hely függvénye.
A függvénysor konvergenciáját a maradékösszeg segítségével is megfogalmazhatjuk.
Már a végtelen soroknál is láttuk, hogy a véges összegekre vonatkozó műveleti szabályok általában nem érvényesek. Ez
a megállapítás a függvénysorokra is fennáll. Többek között ez is indokolja a következő fogalom bevezetését.
Felhívjuk a gyelmet arra, hogy itt δ csak ϵ-tól függ, x-től nem!
Ha egy függvénysor egyenletesen konvergens valamely halmazon, akkor ezen a halmazon konvergens is.
A következőkben szükséges és elégséges feltételeit fogjuk megadni az egyenletes konvergenciának.
A most leírt állításból és a végtelen sorokra vonatkozó Cauchy-tételből következik az alábbi állítás, ami végtelen sorok
konvergenciájára vezeti vissza a függvénysorok konvergenciáját.
Legyen egy H halmazon értelmezett függvénysor és a egy konvergens végtelen sor! Tegyük fel,
hogy ∀x ∈ H esetén
Műveletek függvénysorokkal
Mint már említettük a véges összegre vonatkozó műveleti szabályok általában nem igazak függvénysorokra. A
következőkben arról lesz szó, hogy milyen feltételek mellett teljesülnek mégis ezek a szabályok.
Legyenek az f1, f2, …, fn, … függvények di erenciálhatók és az f′1, f′2, …, f′n, … deriváltak folytonosak az [a, b]
Hatványsorok
Ebben a részben speciális függvénysorokról lesz szó, pontosabban:
Legyen a hatványsor az x ≠ 0 pontban konvergens! Ekkor létezik olyan, az origóra szimmetrikus (nem
elfajuló) intervallum, amelynek belső pontjaiban a hatványsor abszolút konvergens, a külső pontokban pedig
divergens. Ezt az állítást Abel tételének nevezzük.
Azt az origó körüli szimmetrikus nyílt intervallumot, amelyben az origó körüli hatványsor abszolút konvergens, a
hatványsor konvergenciaintervallumának nevezzük.
Abel tétele szerint a hatványsor konvergenciaintervalluma (–r, r) vagy (–∞, +∞) lehet. Ez az r ∈ R szám, illetve +∞ a
hatványsor konvergenciasugara.
Megjegyezzük, hogy ha a konvergenciasugár r, akkor x = r-ben és x = –r-ben a hatványsor lehet konvergens, de lehet
divergens is. Ha egy hatványsor konvergenciasugara r > 0, akkor ez a hatványsor abszolút és egyenletesen konvergens
minden olyan zárt [a, b] intervallumban, mely teljesen része a konvergenciaintervallumnak.
A következőkben a hatványsor együtthatóinak vizsgálatára vezetjük vissza a konvergenciasugár meghatározását. A
következő állítás a végtelen sorokra vonatkozó gyökkritériumon alapszik.
A hatványsor konvergenciasugara:
A konvergenciasugár meghatározásának másik gyakran használt módszere a végtelen sorokra vonatkozó
gyökkritériumhoz hasonlóan a következő.
Példák
1.
A hatványsor konvergenciasugara a hányadoskritérium szerint
2.
A hatványsor konvergenciasugara szintén a hányadoskritérium szerint
3.
A hatványsor konvergenciasugara a hányadoskritérium szerint
4.
A hatványsor konvergenciasugara a gyökkritérium szerint
A Taylor-sor
Ebben a részben egy speciális hatványsorról lesz szó.
hatványsort az f függvény x0 pont körüli Taylor-sorának nevezzük. Az f függvény x0 pont körüli Taylor-polinomjának
n-edik részletösszege, az
Legyen f az x0 pont egy környezetében (n + 1)-szer di erenciálható. Ekkor minden ebbe a környezetbe eső x-re érvényes
a következő:
ahol ξ az x és az x0 között van. Az f függvény ilyen előállítását Taylor-formulának, az
Valamely függvény Taylor-sora nem biztos, hogy előállítja magát a függvényt. Ezért foglalkoznunk kell azzal a
kérdéssel, hogy a Taylor-sornak mi a konvergenciatartománya, és összegfüggvénye mely pontokban egyenlő magával a
függvénnyel.
Legyen f az x0 pont egy környezetében akárhányszor di erenciálható! Ekkor az f függvény Taylor-sora akkor és csak
akkor állítja elő az f függvényt, ha az x0 pont ezen környezetének bármely x pontjában az f függvény n-edik Lagrange-
féle maradéktagja n → ∞ esetén nullához tart.
Mivel a Taylor-sor egy hatványsor, és tudjuk, hogy ha egy függvény hatványsorba fejthető, akkor az csak
egyféleképpen lehetséges, ezért kijelenthetjük, hogy ha egy függvény valamely pont körül hatványsorba fejthető, akkor ez
a függvény Taylor-sora.
A következő táblázat néhány függvény 0 körüli Taylor-sorát adja meg és annak konvergenciatartományát.
(–1, 1)
– ln(1 – x) (–1, 1)
ln (1 + x) (–1, 1)
ln (1 – x2) (–1, 1)
ex (–∞, ∞)
Fourier-sorok
Ebben a részben a függvénysorok egy másik speciális esetét fogjuk tárgyalni.
Legyen az f függvény 2π szerint periodikus és integrálható valamely [a, a + 2π] intervallumon. Ekkor az f függvény
Fourier-során az
trigonometrikus sort értjük, ahol az együtthatók:
Páros függvény Fourier-sora csak koszinuszos tagokat tartalmaz, páratlan függvényé pedig csak szinuszos tagokat
tartalmaz.
Példák
1. Adjuk meg az alábbi 2π szerint periodikus függvény Fourier-sorát:
Mivel f(–x) = –f(x), ezért a függvény páratlan, így a0 = 0, és a Fourier-sorban csak szinuszos tagok szerepelnek.
Számoljuk ki ezeket:
ezért a függvény páros. Így most a szinuszos együtthatók lesznek nullák. Számoljuk ki a többi együtthatót:
Megjegyezzük, hogy az integrálható periodikus függvények akkor is sorba fejthetők, ha a periódus nem 2π.
Legyen az f függvény 2l szerint periodikus és integrálható valamely [a, a + 2l] intervallumon. Ekkor az f függvény
Fourier-során az
trigonometrikus sort értjük, ahol az együtthatók:
20. Parciális di erenciálegyenletek
20.1. Bevezetés
20.2. Elsőrendű egyenletek
20.3. Másodrendű egyenletek
20.4. Vektoranalízis és integrálátalakító tételek
20.5. A hővezetési egyenlet és a hullámegyenlet
20.1. Bevezetés
Az előző fejezetben megismerkedhettünk a di erenciálegyenlet fogalmával. Ez olyan speciális egyenletet jelent, ahol a
megoldás egy x: R → R egyváltozós függvény. Ebben a részben kiterjesztjük ezt a fogalmat, és olyan egyenletekkel fogunk
foglalkozni, ahol a megoldás egy u : Rn → R többváltozós függvény. Az egyenletben – a di erenciálegyenletekhez hasonlóan
– nemcsak az u függvény fog szerepelni, hanem az u parciális deriváltjai és magasabb rendű parciális deriváltjai is
(természetesen fel fogjuk tenni, hogy ezek léteznek). Az ilyen egyenleteket parciális di erenciálegyenleteknek nevezzük. A
továbbiakban az egyszerűség kedvéért a parciális di erenciálegyenlet kifejezést esetenként PDE-vel fogjuk rövidíteni. A
parciális di erenciálegyenleteket gyakran alkalmazzák a zikában, kémiában, biológiában. A legfontosabb ilyen példákról
egy későbbi fejezetben teszünk említést.
A matematikailag is precíz de níció bevezetése előtt tisztázzunk néhány fogalmat. Az u függvény magasabb rendű
parciális deriváltjaival fogunk foglalkozni, de vajon mit is jelent ez pontosan?
Ha u ∈ C∞(Rn), akkor u parciális derivált függvényei parciálisan deriválhatóak lesznek, és a kapott függvények megint
parciálisan deriválhatóak lesznek. Például egy u ∈ C∞(R3) függvény esetén létezni fog a ∂2∂3∂1∂2∂3u függvény is, amit
magasabb rendű parciális deriváltnak nevezünk. A Young-tétel segítségével belátható, hogy ∂2∂3∂1∂2∂3u = ∂1∂2∂2∂3∂3u, és ha
Általános esetben, ha u ∈ C∞(Rn), akkor a egy (α1α2, …, αn)-ed-rendű parciális derivált függvény, ahol
α1α2, …, αn ∈ N.
Az egyszerűség kedvéért bevezetjük a következő jelöléseket: , ahol α := (α1, α2, …, αn) multiindex,
és |α|:= α1 + α2 + …+ αn jelölje a parciális derivált függvény rendjét.
Legyen Ω ⊂ Rn nyílt, összefüggő halmaz, azaz egy Rn-beli tartomány, m ≥ 1 egész szám! Jelölje N a legfeljebb m-edrendű
parciális deriváltak számát (azaz az 1 ≤ |α| ≤ m feltételeknek eleget tevő multiindexek számát)! Legyen G ⊂ RN egy
tartomány és F: Ω × G → R tetszőleges függvény!
Olyan u : Ω → R függvényt keresünk, melyre u ∈ Cm(Ω), és kielégíti az
Megjegyzés. Azt mondjuk, hogy egy u tetszőleges függvény megoldása a PDE-nek, ha kielégíti a fenti egyenletet.
Elemi úton megoldható példák
1. Keresendő olyan u : R2 → R függvény, melyre ∂1u = 0!
Könnyű végiggondolni, hogy ∂1u(x, y) = 0 ⇔ u(x, y) = c(y), ahol c: R → R tetszőleges függvény. (Ez megoldás, bár
nem feltétlenül a klasszikus értelemben.)
2. Keresendő olyan u : R2 → R függvény, melyre ∂1∂2u = 0!
Az előző feladat alapján ∂1∂2u(x, y) = 0 ⇔ ∂2u(x, y) = c(y) ⇔ u(x, y) = C(y) + D(x), ahol C, D ∈ C2(R) tetszőleges
függvények, és C(y) primitív függvénye c(y)-nak.
Tömören kifejezve, legyen , azaz f: Rn → Rn, és keresünk egy olyan u ∈ C1(Ω) függvényt, melyre
〈 〉
f(x), u′(x) = 0, ∀x ∈ Ω esetén.
Most nézzük, hogyan kell megoldani ezt a típusú feladatot. Az eljárást csak a háromdimenziós esetre részletezzük, a
két-, illetve többdimenziós eset lényegében ugyanaz, a példákban ezekre is ki fogunk térni.
Tehát n = 3 esetén olyan u : R3 → R folytonosan deriválható függvényt keresünk, amely megoldása az
Innen azt nyerjük, hogy x(t) = c1et, y(t) = c2e–t, c1, c2 ∈ R, vagyis a g (x, y) = xy függvény állandó a megoldások
mentén, hiszen g(x(t), y(t)) = c1c2ete–t = c1c2et–t = c1c2, tehát a feladat általános megoldása egy (x, y) ↦ h(xy) alakú
függvény (ahol h : R → R tetszőleges C1(R)-beli függvény).
Valóban: u(x, y) = h(xy) választással ∂1u(x, y) = h′(xy)y és ∂2u(xy) = h′(xy)x, így
Például konkrét megoldások az (x, y) ↦ xy vagy az (x, y) ↦ exy függvények, hiszen h:x ⊂ ex C1(R)-beli függvény. Itt
az alaprendszer 1 elemű: (x, y) ↦ xy, mert kétdimenziós volt a feladat.
2. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását:
Most következik az a lépés, mikor olyan g: R2 → R függvényeket keresünk, amelyek a karakterisztikus rendszer
megoldásai mentén állandók. Ennek a függvénynek a megtalálásához n = 2 esetén több módszer is
rendelkezésünkre állhat. Az egyik az előbb bemutatott, kezdjük megint ezzel!
Első módszer. A karakterisztikus rendszert megoldva azt nyerjük, hogy x(t) = c · sin t, y(t) = c · cos t. Vagyis a
karakterisztikus görbék c sugarú körök, tehát ezek mentén az origótól mért távolság lesz állandó, azaz
azaz g(x, y) = x2 + y2, tehát a feladat általános megoldása egy h (x2 + y2) alakú függvény (ahol h : R → R tetszőleges
C1(R)-beli függvény).
Második módszer. Első integrál keresése a „teljes derivált” módszerével. Ez az eljárás csak speciális esetekben
alkalmazható. Vegyük észre, hogy ha a karakterisztikus egyenletrendszer első egyenletét beszorozzuk 2x(t)-vel, a
másodikat pedig 2y(t)-vel, akkor a bal oldalon éppen a két ismeretlen függvény négyzetének deriváltjai
szerepelnek. Az egyenleteket összeadva tehát az
egyenlőséget nyerjük, vagyis ismét azt kaptuk, hogy a megoldások mentén az (x, y) ↦ x2 + y2 függvény állandó,
vagyis g(x, y) = x2 + y2, tehát a feladat általános megoldása egy h(x2 + y2) alakú függvény.
Harmadik módszer. Egy
alakú. Egy
alakú, akkor a rendszer Hamilton-rendszer is, és H(x, y) = G1(y) + G2(x), ahol (g1 és g2 folytonos
függvények).
Azért érdemes megnézni, hogy a rendszerünk Hamilton-rendszer-e, mert ha az, akkor a H függvény a
karakterisztikus rendszer első integrálja, vagyis a karakterisztikus görbék mentén H állandó, és pont egy ilyen
tulajdonságú függvényt keresünk.
Nézzük, mit jelent ez a mostani feladatban! A karakterisztikus egyenlet:
Emlékszünk, hogy f1(x, y) = y(= g1(y)), f2(x, y) =–x(= –g2(x)), és ∂1f1(x, y) + ∂2f2(x, y) = 0 + 0 = 0, vagyis Hamilton-
A karakterisztikus rendszer:
azaz a g: (x, y) ↦ xy függvény a karakterisztikus görbék mentén állandó, így a feladat általános megoldása egy (x,
y) ↦ h(xy) alakú függvény, ahol h: R → R tetszőleges C1(R)-beli függvény. Tehát kijött ugyanaz az eredmény.
Hamilton-módszer. Vizsgáljuk meg a karakterisztikus rendszert, emlékszünk, hogy f1(x, y) = x, f2(x, y) = –y.
Háromdimenziós példa
1. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását!
Ekkor f1(x, y, z) = yz, f2(x, y, z) = xz, f3(x, y, z) = x2 + y2. A karakterisztikus rendszer tehát:
Az előző megoldás gondolatmenete alapján szorozzuk be az első egyenletet 2x(t)-vel, a másodikat pedig 2y(t)-vel,
majd vonjuk ki ezeket egymásból. Ekkor az alábbi egyenlőséget kapjuk:
Tehát a φ1: (x, y, z) ↦ x2 – y2 megoldás, hiszen a karakterisztikus görbék mentén ez a függvény állandó. Az
alaprendszer meghatározásához két független megoldásra van szükségünk, úgyhogy még egy megoldást kell
találnunk. A harmadik egyenletet 2z(t)-vel szorozva, majd az első két egyenletet felhasználva nyerjük, hogy
tehát
vagyis összefoglalva:
két megoldása a lineáris PDE-nek, hiszen φ2 is állandó a karakterisztikus görbék mentén. Nézzük meg, hogy
függetlenek-e! A deriváltakból álló mátrix
Ennek rangja az origó kivételével mindenhol 2, azaz az origó kivételével az általános megoldás az
Tömören kifejezve, legyen azaz f : Rn → Rn, és keresünk egy olyan u ∈ C1(Ω) függvényt,
melyre 〈f(x, u(x)), u′(x)〉 = f (x, u(x)), ∀x ∈ Ω esetén.
0
Megjegyzés. A kvázilineáris PDE-nek speciális esete a homogén lineáris PDE f0(x, u(x)) = 0 és fi (x, u(x)) = fi(x)
választással.
A megoldási eljárást két dimenzióban (n = 2 esetén) mutatjuk be. Ekkor az ilyen típusú egyenlet általános alakja:
2. Ekkor a v függvényre vonatkozóan egy háromdimenziós homogén lineáris PDE-t kapunk (x, y, u) ∈ R3 változóval,
melynek megoldását az előző módszerrel határozhatjuk meg.
3. Ha az általános megoldást nullává téve a kapott formulából ki tudjuk fejezni az u változót, akkor az így kapott
kifejezés megoldása lesz az eredeti feladatnak.
Példák
1. Adjuk meg az alábbi egyenlet általános megoldását:
A transzformált egyenlet a következő lesz:
függvény. Emellett a karakterisztikus egyenlet első egyenletét a harmadikba helyettesítve, majd u-val osztva
kapjuk, hogy
azaz
melynek rangja 2, vagyis φ1, φ2 függetlenek, így a transzformált egyenlet általános megoldása
A fentiek alapján az eredeti egyenlet u(x, y) megoldását úgy kaphatjuk meg, ha a
Cauchy-feladatok
Itt olyan feladatokról lesz szó, ahol a kvázilineáris PDE-t egy mellékfeltétellel látjuk el: a PDE megoldását előírjuk egy görbe
mentén. Az ilyen feladatokat Cauchy-feladatoknak nevezzük. Megjegyezzük, hogy a homogén lineáris PDE speciális esete a
kvázilineáris PDE-nek, így a Cauchy-feladatban homogén lineáris PDE is szerepelhet.
Szemléletesen az u megoldások felületek, a mellékfeltétel pedig egy görbe. A Cauchy-feladat megoldása azt jelenti, hogy
a felületseregből megkeressük a görbére illeszkedőt. A megoldási módszert példákon illusztráljuk.
Példák
1.
Most kell megnézni, hogy az u(x, x2) = x3 feltétel mely megoldásokra teljesül, ezért behelyettesítünk:
azaz
Tehát a ψ(x) = x választással teljesül a mellékfeltétel. Nézzük meg, hogy mi adódik így u-ra:
Ezt a feltételt végtelen sok ø ∈ C1(R) függvény kielégíti, így végtelen sok megoldása lesz a Cauchy-feladatnak is. A
megoldások:
3.
Ezt a feltételt egyetlen ø ∈ C1(R) függvény sem teljesíti, hiszen ez nem is függvény, így nincs megoldása a Cauchy-
feladatnak.
Meg gyelhető, hogy a mellékfeltételtől függően előfordulhat, hogy egy Cauchy-feladatnak nincs megoldása, 1
megoldása van vagy végtelen sok. Belátható, hogy ha a mellékfeltételben lévő görbe minden karakterisztikus görbét
pontosan egyszer metsz, akkor van egyértelmű megoldás.
Jelölje n+ az A(x) pozitív sajátértékeinek számát multiplicitással, n– az A(x) negatív, míg n0 az A(x) 0 sajátértékeinek
számát multiplicitással. Nyilván n+ + n– + n0 = n.
Azt mondjuk, hogy másodrendű lineáris PDE x-ben elliptikus, ha n+ = n vagy n_ = n.
Hiperbolikus, ha n+ = 1 és n–= n – 1 vagy n+ = n – 1 és n– = 1.
Parabolikus, ha n0 = 1 és n+ = n – 1 vagy n– = n – 1.
Alappéldák
elliptikus egyenlet.
hiperbolikus egyenlet.
Ha új változót vezetünk be: x = (t, x1, x2, …, xn–1) esetén az egyenlet
alakúra módosul.
Megjegyzés. Az alappéldákban szereplő mátrixok főátlóiban természetesen a sajátértékek találhatók, ezért könnyen
meghatározhatók az egyenletek típusai.
Állandó együtthatósnak hívjuk az olyan egyenleteket, ahol ai, bi, c ∈ R, azaz konstans függvények.
Belátható, hogy egy állandó együtthatós elliptikus, hiperbolikus, illetve parabolikus egyenlet a változók és az u
függvény transzformációjával a fenti 1., 2., 3. alakra hozható. Ezeket az alakokat kanonikus alaknak nevezzük.
Példa másodrendű lineáris egyenlet típusának meghatározására: Mu:= –6 · ∂1∂2u milyen típusú?
A következő szakaszban megemlítjük, hogy a legegyszerűbb egyenletek esetén mi a megoldó képlet, illetve milyen
technikával kaphatunk megoldást.
problémát.
Megjegyzés. A jelölések kicsit megváltoztak: t > 0 a „0. változó”, és ∂i jelöli a xi szerinti parciális deriváltat. Gyakran
használják ezt a fajta jelölést is. Vigyázat, az u egy n + 1 változós függvény!
A megoldás kiszámítását csak a homogén esetre mutatjuk be, azaz amikor f(t, x) = 0. Ekkor a
probléma, megoldását az
alakot ölti.
Példa
A fenti probléma megoldását csak n = 2 esetén és homogén esetben vizsgáljuk, azaz ha f ≡ g ≡ 0. Vagyis
képlet adja meg. Az első integrált a másodikkal egy polártranszformáció köti össze, és Br(x) jelöli az x középpontú, r sugarú
körlapot a síkon.
Példa
1. Legyen K:= B1(0, 0) ⊂ R2 az egységkörlap, és ∂K:= {(x, y): x2 + y2 = 1} jelölje a peremét! Adjuk meg az alábbi
peremérték-feladat egy megoldását:
Mivel a keresett u függvény a határon nulla, azért keressük olyan alakban, hogy ezt a peremfeltételt azonnal
biztosítsuk: olyan lehető legegyszerűbb szorzótényezővel látjuk el, ami a peremen nulla, vagyis a (x2 + y2 – 1)-gyel.
Legyen tehát
ahol az a, b, c számokat nekünk kell megfelelően megválasztanunk. A második tényezőt azért választottuk
elsőfokú polinomnak, mert így reméljük, hogy a második deriváltak ismét elsőfokúak lesznek, mint ahogy x + y is
az. Ekkor
A vektormező rotációja pedig egy f: R3 → R3 di erenciálható függvény esetén legyen az a rot f: R3 → R3 függvény, mely
tetszőleges (x, y, z) ∈ R3 ponthoz a következő vektort rendeli hozzá:
Mindkét de níciónál feltettük, hogy az f: R3 → R3 vektormező di erenciálható, azaz – a 17.6. fejezet alapján – létezik az
derivált mátrix.
Meg gyelhető, hogy a divergencia a derivált mátrix nyoma, míg a rotációt a főátlón kívüli megfelelő elemeknek a
különbségeit vektorba rendezve kaphatjuk meg.
Megjegyzés. Itt f-et skalárnak tekintettük, és a skalár vektor szorzás alapján szoroztuk f-et és a ∇ vektort össze.
Megjegyzés. Emlékeztetünk, hogy a fenti 〈x, y〉 skaláris szorzás de níciója tetszőleges x, y ∈ Rn, n ∈ N esetén:
〈 〉
n x, y := x1, y1 + x2, y2 + … + xn, yn.
Ugyanígy
Fontos megemlíteni, hogy a ∇ vektornak önmagában nincs értelme, csak egy jelképes jelölés, melynek segítségével
könnyebben megjegyezhetjük az eddigi fogalmakat.
Az utolsó szemléletes összefüggést úgy kapjuk, ha nabla vektort önmagával skalárisan összeszorozzuk:
azaz f: R3 → R függvényre
Ezt az operátort (vagy hozzárendelést), mely az f : R3 → R függvényhez hozzárendeli az Lf : R3 → R függvényt, Laplace-
operátornak nevezzük.
A vonalintegrál fogalma és tulajdonságai
Legyen φ: [a, b] → R3 egy olyan folytonos paraméterezett görbe, ami folytonosan di erenciálható. Emellett minden t ∈ [a,
b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ1(t1) ≠ φ(t2). A továbbiakban mindig feltesszük, hogy a φ görbe ilyen
tulajdonságú, ugyanis ilyen görbe és folytonos f:R3 → R3 esetén belátható, hogy az f függvény – alább de niált –
vonalintegrálja a φ görbén létezik.
Vezessük be a vonalintegrál fogalmát tetszőleges f: R3 → R3 függvényre!
Vegyük az [a, b] intervallum egy felosztását: a = t0 < t1 < … < tn = b, jelöljük ezt Φ = {I1, I2, …, In} ∈ FO[a, b]-vel. Legyen ξ =
(ξλ, …, ξn) ∈ Rn a felosztáshoz tartozó osztópontvektor (azaz ξ ∞Φ). Ekkor a
Megjegyzés. A skaláris szorzat a de nícióban értelmes, hiszen f(φ(t1)), φ(ti) – φ(ti–1) ∈ R3.
Ha van olyan A ∈ R szám, hogy minden ϵ > 0 számhoz létezik olyan δ > 0, hogy minden Φ ∈ FO[a, b], |Φ| < δ felosztás és
minden ξ ∝ Φ osztópontvektor esetén
akkor azt mondjuk, hogy f integrálható a φ görbe mentén, és f vonalintegrálja a φ görbe mentén A, azaz .
a Lagrange-tétel és φ′ folytonossága miatt. Látható, hogy ahogy a Φ felosztás nomodik, úgy a φ(ti) – φ(ti – 1) ≈ φ′(ξi)(ti – ti–1)
becslés egyre pontosabbá válik. Ez alapján:
Belátható, hogy a két integrál egymással pontosan megegyezik, vagyis igaz a következő tétel:
Legyen φ: [a, b] → R3 egy olyan folytonos paraméterezett görbe, ami folytonosan di erenciálható! Emellett minden t ∈
[a, b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Emellett legyen f: R3 → R3 folytonos függvény! Ekkor
létezik, és
Legyen ø: T ⊂ R2 → R3 folytonosan di erenciálható paraméterezett felület, minden (u, v) ∈ T-re ∂1ø(u, v) × ∂2ø(u, v) ≠ 0,
és ha (u1, v1) ≠ (u2, v2) belső pontok, akkor ø(uv v1) ≠ ø(u2, v2). Legyen f: R3 → R3 folytonos függvény!
Ekkor létezik, és .
A felszín kiszámításához az függvényt kell integrálnunk a gömb felszínén (mert így az f(ø(u, v))
vektorok hossza 1 lesz, és így valóban a felszínt fogjuk megkapni). A képlet használatához ki kell számolni a ∂1ø(u, v) ×
∂2ø(u, v) vektort:
Többször is kihasználtuk, hogy cos2 u + sin2 u = 1.
Integrálátalakító tételek
Az itt szereplő tételek lényegében a Newton–Leibniz-szabály általánosításai. Egy térbeli halmazon (testen) vett integrálást
köti össze a halmaz határán mint felszínen vett integrálással a következő tétel.
Gauss–Osztrogradszkij-tétel:
Legyen ø: T ⊂ R2 → R3 folytonosan di erenciálható paraméterezett zárt felület, minden (u, v) ∈ T-re ∂1ø(u, v) × ∂2ø(u,
v) ≠ 0, és ha (u1, v1) ≠ (u2, v2) belső pontok, akkor ø(uv v) ≠ ø(u2, v2). F := ø(T) és V ⊂ R3 az F felület által határolt korlátos
test. Legyen f: R3 →R3 folytonosan di erenciálható függvény! Ekkor
Azaz az f függvény F felületen vett integrálja megegyezik a div f: R3 → R háromváltozós függvény V testen vett
Riemann-integráljával.
Megjegyzés. A zárt felület azt jelenti, hogy a felület egy V korlátos testet határol.
és Ḡ jelölje a gömböt!
Tekintsük az összefüggés bal oldalát, ami egy felszíni integrál. A ∂1ø(u, v) × ∂2ø(u, v) vektort már kiszámoltuk, így
Ugyanis , mert v ↦ cos v sin3 v páratlan függvény, ami egy origóra szimmetrikus
intervallumon van integrálva.
Számoljuk ki a másik két integrált is, hogy valóban nullák-e.
Kihasználtuk, hogy ∫(f ◦ g) · g′ = (∫f) ◦ g, f(t) = 1 – t2 és g(t) = sin t függvényekkel, és hogy sin u 2π-nként periodikus.
Ugyanilyen logikával
Ezek mellett nagyon fontos, hogy a ∫ ∫a(x)b(y)dxdy alakú integrálokat a következő módon számoltuk ki:
Ekkor
Az első két integrál természetesen 0 a periodikusság miatt, a harmadik integrál pedig a következők miatt:
Stokes-tétel:
Legyen φ: [a, b] → R3 folytonosan di erenciálható, paraméterezett zárt görbe, azaz φ(a) = φ(b)! Emellett minden t ∈ [a,
b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Legyen F egy, a φ görbe által határolt felület és f: R3 → R3
folytonosan di erenciálható függvény. Ekkor
Azaz az f függvény φ görbén vett integrálja megegyezik a rot f: R3→R3 függvény F felületen vett integráljával.
Kihasználtuk, hogy cos2t – sin2t = cos 2t, hogy cos 2t sin 2t = sin 4t és a periodikusságot. A Stokes-tétel segítségével
még könnyebben kiszámolhatjuk a vonalintegrált:
Most nézzük, hogy milyen kapcsolat van a kétdimenziós vonalintegrál és a síkbeli Riemann-integrál között!
Green-formula:
Legyen φ : [a, b] → R2 folytonosan di erenciálható, paraméterezett zárt görbe, azaz φ(α) = φ(b)! Emellett minden t ∈
[a, b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Legyen T ⊂ R2 a φ görbe által határolt öszszefüggő
síkdarab és f: R2 → R2 folytonosan di erenciálható függvény! Ekkor
Azaz az f függvény φ görbén vett integrálja megegyezik a (∂1f2(x, y) – –∂2f1(x, y)) :R2 → R függvény T halmazon vett
kétdimenziós Riemann-integráljával.
Kihasználtuk a összefüggést.
A vonalintegrál kiszámítása a Green-formulát használva a következő. Jelöljük a φ görbe által határolt összefüggő
síkdarabot, azaz az r sugarú, origó középpontú kört K-val. Ekkor
Vezessünk be polárkoordinátákat:
Így
alakot ölti, ahol Ω ⊂ R3 korlátos tartomány. Ekkor a következő peremfeltételt használjuk: u|∂Ω(x) = v(x), valamely v: R3 → R
folytonos függvényre, és ∂Ω jelöli a Ω tartomány határpontjainak halmazát, azaz a tartomány „peremén” a hőmérséklet
előre meghatározott. Vagyis a peremérték-feladat a következő:
Azért nevezzük vegyes feladatnak, mert kezdeti és peremfeltétellel is ellátjuk az egyenletet, azaz:
Megjegyzés. Belátható, hogy a fenti mellékfeltételekkel ellátott feladatnak létezik megoldása és az egyértelmű.
vagy
vagy a többi már említett peremfeltétellel is ellátható az u(c) = α és u(d) = β feltétel helyett.
Hullámegyenlet
Ezt az egyenletet csak egy dimenzióban vizsgáljuk. Szemléletesen, úgy képzeljük el a folyamatot, mint egy hullámmozgást
egy megpendített húrban. Jelölje u(t, x) a nyugalmi állapothoz viszonyított kitérést a t időpillanatban az x helyen (20.1.
ábra). Legyen I ⊂ R intervallum!
20.1. ábra
Ekkor a hullámegyenlet:
azaz előírjuk az u és a ∂0u függvények minden értékét a kezdő időpillanatban, és μi: R → R folytonos függvények (i = 1, 2).
2. Véges húr esetén, azaz ha I = (c, d), akkor vegyes feladatunk lesz: kezdeti és peremfeltételt is adunk. Rögzítsük a μ1(x), µ2(x),
α(t), β(t) függvényeket!
Kezdeti feltétel: μ(0, x) = μ1(x), x ∈ (c, d) és ∂0u(0, x) = μ2(x), x ∈ (c, d).
Peremfeltétel: u (t, c) = α(t), t > 0 és u(t, d) = β(t), t > 0,
vagy ∂1u(t, c) = α(t), t > 0 és ∂1u(t, d) = β(t), t > 0.
Tehát a vegyes feladat valamelyik peremfeltételt választva, sőt kombinálva:
Megjegyzés. Belátható, hogy a fenti mellékfeltételekkel ellátott feladatnak létezik megoldása és az egyértelmű.
21. Komplex függvénytan
21.1. Bevezető
21.2. Reguláris függvények
21.3. Integráltételek
21.4. Hatványsorba és Laurent-sorba fejtés
21.5. A reziduumtétel és alkalmazásai
21.6. Konform leképezések
21.7. Harmonikus függvények
21.1. Bevezető
Ebben a fejezetben a D ⊂ C, f : D → C ún. komplex függvények néhány fontos tulajdonságát mutatjuk be. Látni fogjuk, hogy
egy egészen egyszerűnek tűnő tulajdonságból, a pontonkénti di erenciálhatóságból mennyire messzemenő, globális
következtetéseket lehet levonni.
A komplex értelemben di erenciálható függvényeket több híres matematikus, így például Gauss, Euler, Riemann és
Weierstrass is vizsgálta. Ebben a fejezetben leggyakrabban Augustin Louis Cauchy (1789–1857) nevével találkozhatunk,
Cauchy volt ugyanis az, aki a komplex vonalintegrálok alkalmazásával bebizonyította, hogy a (komplex értelmen)
di erenciálható, más néven reguláris vagy holomorf és a hatványsorba fejthető, analitikus függvények fogalma egybeesik.
A komplex függvények viselkedése valóban különleges, és a matematika és a zika számos területén, az
összenyomhatatlan folyadékok áramlásától a Fourier-analízisen keresztül a prímszámok eloszlásának vizsgálatáig és még
nagyon sok más területen használjuk ezeket. De az alkalmazásoktól függetlenül, a matematika iránt érdeklődő diák
számára a komplex függvénytan az egyetemi matematika egyik, ha nem a legszebb fejezete.
Komplex számok. Feltételezzük, hogy az olvasó birtokában van a komplex számokra vonatkozó alapismereteknek, és
nem ismeretlenek számára a komplex számokkal való alapműveletek. Ezért ezek közül csak a legfontosabb elnevezéseket és
jelöléseket soroljuk fel.
– Az x és y betűket általában inkább csak valós számok jelölésére fogjuk használni, a komplex számokat z, w stb.
betűkkel fogjuk jelölni.
– A komplex számokat írhatjuk x + yi algebrai alakban, ahol az x és y valós számok a szám valós, illetve képzetes része. A
z komplex szám valós és képzetes részét Re z-vel, illetve Im z-vel jelöljük. Megjegyezzük, hogy az i nem része a képzetes
résznek, Im z maga valós szám.
– A komplex számokat írhatjuk z = r(cos φ + i sin φ) trigonometrikus alakban, ahol az r = |z| nem negatív valós szám a z
szám abszolút értéke, a φ szög pedig a szám argumentuma. Az argumentum csak modulo 2π értelemben egyértelmű,
összhangban azzal, hogy a szinusz- és a koszinuszfüggvény 2π szerint periodikus.
A z szám argumentumát arg z-vel jelöljük.
– A z = x + yi szám konjugáltja a z̄ = x + yi szám.
A komplex sík. A valós számokat az euklideszi egyenes pontjainak feleltettük meg. Többnyire célszerű volt az egyenes
két „végét” a ∞ és –∞ „végtelen távoli” pontokkal lezárnunk.
A komplex számokat a sík pontjainak feleltetjük meg: az x + yi komplex szám képe az (x, y) pont. Ami lényeges
különbség a számegyeneshez képest, hogy a különböző irányokhoz nem de niálunk különböző végtelen távoli pontokat,
hanem csak egyet. Ugyanaz a végtelen távoli pont lesz minden irányban.
A Riemann-gömb. Az egyetlen végtelen távoli pont de niálása egyáltalán nem természetellenes. A komplex számok és
a ∞ jól ábrázolhatok például a gömbön. Helyezzük el a komplex számsíkot a térben, és vegyünk egy egységgömböt, aminek
középpontja a 0! Válasszuk ki a gömb egyik olyan pontját, ahol a gömb érintője párhuzamos a síkkal. Ez a pont lesz a ∞ (21.1.
ábra).
21.1. ábra
Kössük össze a ∞ pontot a sík z pontjával. Az így kapott egyenes még egyszer metszi a gömböt: ezt a második
metszéspontot, z′-t feleltetjük meg z-nek. Az egyetlen pont, aminek nem feleltetünk meg egy komplex számot sem, a ∞. Ha
viszont a z pontot a síkon egyre távolabbra mozgatjuk, vagyis |z|-vel tartunk ∞-hez, akkor a gömbön a z′ pont a ∞ ponthoz
fog tartani.
Az alkalmazott feleltetés neve sztereogra kus projekció.
Mivel csak egy ∞ van, nincs értelme a z → –∞ és hasonló végtelen határértékeket megkülönböztetni, z → ∞, |z| → ∞ stb.
mind ugyanazt jelentik.
A komplex sík valamely részhalmazán értelmezett, komplex értékű függvényeket egyszerűen komplex függvényeknek
fogjuk hívni. Az éles szemű olvasó és a vájt fülű hallgató (de nem ám fordítva!) nyilván észrevette, hogy itt nem a
„tartomány”, hanem a „halmaz” szót használtuk. Többször előfordul ugyanis, hogy egy komplex függvény értelmezési
„tartománya” nem a fenti értelemben vett tartomány.
Határérték és folytonosság tekintetében nincs különbség a komplex függvények és az R2 valamely részhalmazán
értelmezett, R2-be képező függvények között. Merőben más lesz azonban a helyzet a komplex értelemben vett
di erenciálhatósággal.
Komplex di erenciálhatóság
A Cauchy–Riemann-féle parciális egyenletek
Reguláris és egészfüggvények
Hatványsorok
A hatványsor konvergenciahalmaza
Műveletek hatványsorokkal
Az összegfüggvény regularitása
Taylor-sor
Elemi függvények
Komplex di erenciálhatóság
Az egyváltozós valós analízisből ismert di erenciálhatóság komplex függvényekre is pontosan ugyanúgy de niálható.
Az egyváltozós valós függvényekre vonatkozó di erenciálási szabályok – a bizonyításukkal együtt – egy az egyben
átírhatók komplex függvényekre. Érvényben maradnak az alapműveletekre (összeg, különbség, szorzat, hányados)
vonatkozó szabályok, a láncszabály és az inverz függvény di erenciálási szabálya is.
A di erenciálhatóság de nícióját az
u(x, y) és v(x, y) valós értékű függvények. Legyen a = (a1, a2) az értelmezési tartomány egy belső pontja!
Az f(x + yi) = u(x, y) + iv(x, y) függvény komplex értelemben akkor di erenciálható az a1 + a2i pontban, ha
– az u(x, y) és v(x, y) függvények valós értelemben di erenciálhatóak az (a1, a2) pontban, és
– az (a1, a2) pontban teljesülnek az úgynevezett Cauchy–Riemann-egyenletek:
A két Cauchy–Riemann-egyenletet együtt úgy is átfogalmazhatjuk, hogy az f függvény mint R2 → R2 leképezés Jacobi-
mátrixa alakú.
Példák
1. Az f(z) = z2 függvény di erenciálható, mert a di erenciálási szabályokból következik, hogy minden polinom
di erenciálható. Most ellenőrizzük a függvényre a Cauchy–Riemann-egyenleteket is:
A különbségi hányados egységnyi abszolút értékű, de nincs határértéke, mert iránya tetszőleges lehet z0
bármilyen kis környezetében.
Reguláris és egészfüggvények
Legyen D ⊂ C tartomány! Ha az f(z) függvény D minden pontjában di erenciálható, akkor azt mondjuk, hogy f(z) reguláris
vagy holomorf D-n. Később látni fogjuk, hogy a regularitás nagyon erős tulajdonság; a reguláris függvények akárhányszor
di erenciálhatók, és az értelmezési tartományuk minden belső pontja körül hatványsorba fejthetők. Ha az f(z) függvény a
teljes komplex síkon reguláris, akkor egészfüggvénynek is nevezzük.
Hatványsorok
A komplex hatványsorokat a valós hatványsorokhoz hasonlóan de niáljuk.
Legyenek a és b0, b1, … komplex számok! A végtelen sort a körüli hatványsornak nevezzük. A b0, b1, …
számokat a hatványsor együtthatóinak nevezzük.
A hatványsor speciális esete a polinom, amikor az együtthatók néhány kivétellel mind nullák.
A hatványsor konvergenciahalmaza
Azoknak a pontoknak a halmaza, ahol a hatványsor konvergens, többféle lehet. Van olyan hatványsor, ami csak a
középpontban konvergens, de az is előfordul, hogy a konvergenciahalmaz a teljes sík. Hogy a lehetséges eseteket leírjuk,
először a következő tényt bizonyítjuk be.
Lemma. Tegyük fel, hogy a hatványsor konvergens a z0 ≠ a pontban, és r0 = |z0 – a|. Ekkor
– a hatványsor abszolút konvergens a B(a, r0) nyílt körlapon;
– a hatványsor tetszőleges r < r0 esetén egyenletesen és abszolút konvergens a B(a, r) körlapon.
Ekkor
és
A sor tehát, ami egyenletes majoránsa a hatványsornak a B(a, r) halmazon, konvergens. Ezért itt a
hatványsor egyenletesen és abszolút konvergens.
Az első állítás következik a másodikból. Ha z ∈ B (a, r0), akkor választhatunk egy olyan r > 0 valós számot, amikre |z–a|
< r < z0. Mivel a sor egyenletes és abszolút konvergens a B(a, r) halmazon, a z ∈ B(a, r) pontban is abszolút konvergens.
Legyen ezek után R a |z – a| szuprémuma azokra az értékekre, amikre a sor konvergens. A fenti lemma egyszerű
következménye, hogy
– a |z – a| < R kör belsejében a sor abszolút konvergens;
– tetszőleges 0 < r < R esetén a hatványsor egyenletesen és abszolút konvergens a |z – a| < r körlemezen;
– a körön kívül a hatványsor divergens. Sőt, a körön kívül a tagok sorozata nem is korlátos.
Az R számot a hatványsor konvergenciasugarának nevezzük. Az R = 0 és az R = ∞ értékek azt jelentik, hogy a sor csak a
középpontban, illetve a teljes síkon konvergens.
A fenti tétel nem mond semmit a hatványsor viselkedéséről magán a körvonalon. A konvergenciahalmaznak a
körvonalra eső része nagyon sokféle lehet az üres halmaztól a teljes körvonalig. Ennek a – nem is teljesen megválaszolt –
kérdésnek a részleteibe most nem megyünk bele; a továbbiakban amúgy is csak a konvergenciakör belső pontjait fogjuk
használni.
Példák
1.
Csak a hatványsor középpontjában, a 0-ban konvergens a sor.
2. A teljes síkon konvergensek a már említett polinomok (beleértve természetesen a konstans nulla sort is), vagy
Műveletek hatványsorokkal
Az abszolút konvergencia miatt kényelmes szabadságunk nyílik arra, hogy hatványsorokkal különféle műveleteket
végezzünk.
– A hatványsort tagonként megszorozhatjuk egy számmal:
– Két sor szorzatát felírhatjuk a két sor Cauchy-szorzataként a konvergenciatartományaik közös részében:
, ahol
Példa. A sor egy z hányadosú mértani sor, ami a B(0, 1) körben konvergens, az összege . A sort
négyzetre emelhetjük úgy, hogy megszorozzuk önmagával:
Az összegfüggvény regularitása
A komplex függvénytan szempontjából a hatványsor legfontosabb tulajdonsága, hogy az összegfüggvény a
konvergenciakör belsejében akárhányszor di erenciálható, és a sort szabad tagonként di erenciálni.
Bizonyítás. Ha egy hatványsor minden tagját megszorozzuk (z – a)-val, az nem változtat azon, hogy a sor konvergens-e.
Legyen tehát r0 = |z0 – a| és ϵ > 0. A bal oldalt a tagok abszolút értékeinek összegével becsüljük (b0 kiesik):
A további becslések során külön fogjuk kezelni a sor elejét (az első néhány tagot), és a többi tagot (a sor farkát), ahol az
összeg már kicsi.
a) Legyen . Mivel a derivált sor egyenletesen és abszolút konvergens a B(z0, r1 – r0) ⊂ B(a, r1) körlapon,
b) Tetszőleges 1≤ n ≤ N-re a zn függvény di erenciálható, ezért létezik egy olyan, δn > 0, amire tetszőleges z ∈ B(z0, δn)
esetén
Ha δ = min (δ1, …, δN, r1 – r0), akkor a fenti egyenlőtlenségeket egyszerre alkalmazhatjuk bármely z ∈ B(z0, δ) esetén:
A tételt k-szor alkalmazva láthatjuk, hogy a konvergenciakör belsejében a hatványsor összegfüggvénye akárhányszor
di erenciálható, és
Taylor-sor
sort az f(z) függvény a körüli Taylor-sorának nevezzük. A 0 körüli Taylor-sort MacLaurin-sornak is szokás nevezni.
Később látni fogjuk, hogy a Taylor-sor mindig konvergens az a pont egy környezetében, és előállítja az f(z) függvényt.
(Ez a tény azért is meglepő, mert egy valós értelemben akárhányszor di erenciálható függvényt nem feltétlenül állít elő a
valós Taylor-sora.)
Elemi függvények
Most a valós analízisben megszokott elemi függvényeknek a komplex számokra való kiterjesztésének kérdéseit vizsgáljuk
meg. Az egész kitevős hatványozást, a polinomokat és a racionális törtfüggvényeket bármilyen algebrai testben ugyanúgy
de niáljuk, nincs különbség a valós és a komplex eset között.
– A komplex exponenciális függvényre is érvényesek a valósból ismert, ez1 + z2 = ez1 · ez2, (ez)′ = ez azonosságok.
Ha z = x + yi, ahol x és y valós számok, akkor
Bizonyítás.
(21.2)
A komplex szinusz- és koszinuszfüggvényre is érvényesek a jól ismert trigonometrikus összefüggések, melyek könnyen
beláthatóak (21.1) segítségével:
A pozitív valós alapú exponenciális függvényeket az az = e(log a) z képlettel értelmezzük, ahol log a a valós logaritmus. Ez
a függvény is a valósból ismert ax kiterjesztése, és teljesülnek rá az összefüggések.
Komplex logaritmus
Az exponenciális függvény 2πi szerint periodikus, és minden, a nullától különböző komplex számot végtelen sokszor vesz
fel. Ezért minden 0-tól különböző számnak végtelen sokféle logaritmusa van, a logaritmust csak „modulo 2πi” ismerjük:
Általában, a logaritmust nem tudjuk az összes nullától különböző pontban egyszerre de niálni úgy, hogy a függvény
folytonos legyen; már a komplex számok argumentumát sem lehet folytonosan megválasztani.
Ha azonban a komplex síkból elhagyjuk a negatív számokat, megtehetjük, hogy arg z-t mindig a (–π, π) intervallumból
választjuk. Az így de niált számot hívjuk a logaritmus főértékének.
De bármilyen más, 0 csúcsú félegyenest is elhagyhatunk, és arg z-t egy alkalmas nyílt intervallumból választhatjuk.
21.3. Integráltételek
A komplex vonalintegrál
A primitív függvény létezésének feltételei
A Cauchy-tétel
A logaritmus létezése
Az integrációs út módosítása
A Cauchy-formulák
A deriváltakra vonatkozó Cauchy-integrálformula
A komplex vonalintegrál
A komplex vonalintegrál a valós analízisből és a zikából ismert vonalintegrál komplex változata, amelyben a vektorok
skaláris szorzata helyett a komplex szorzás szerepel. Az esetek nagy részében a megfelelő, Riemann- és Riemann–Stieltjes-
integrálokra, görbékre, illetve valós vonalintegrálokra vonatkozó tételek bizonyítása szó szerint átvihető. Itt most nem
bizonyítunk több olyan síktopológiai állítást, ami szemléletesen nyilvánvaló. Emiatt a bizonyítások egy része valójában
csak szemléltetés. Ugyanakkor megjegyezzük, hogy a síktopológiai kérdések vizsgálatához maga a komplex függvénytan is
jól használható eszközöket biztosít.
Síkgörbék
A vonalintegrál de níciója
A vonalintegrál létezése és kiszámítása
Műveletek vonalintegrálokkal
A Newton–Leibniz-formula
Síkgörbék
A síkgörbéket, a valós görbékhez hasonlóan valós intervallumok képeként állítjuk elő.
Legyen γ: [a, b] → C folytonos függvény. A γ függvényt (paraméteres) síkgörbének nevezzük. A γ függvény értékei a
görbe pontjai, az [a, b] intervallumban levő számok pedig a paraméterértékek. A γ(a) és a γ(b) pontokat a görbe
kezdő-, illetve végpontjának nevezzük. Ha γ(a) = γ(b), azaz a kezdő- és végpont megegyezik, akkor a görbe zárt.
A vonalintegrál de níciója
A Riemann-integrálhoz hasonlóan, ha a = t0< t1 < … < tn = b az [a, b] intervallum egy felosztása, akkor a felosztás
nomságának a max 1 ≤ k ≤ n|tk – tk – 1| számot nevezzük.
Legyen f(z) olyan komplex értékű függvény, ami értelmes a γ görbe pontjaiban.
Az f(z) függvény γ menti komplex vonalintegrálja az I komplex szám, ha minden ϵ >0-hoz létezik olyan δ > 0, hogy
valahányszor a = t0 < t1 < … < tn = b az [a, b] intervallum egy δ-nál nomabb felbontása, valamint u1 ∈ [t0, t1], u2 ∈ [t1,
t2], …, un ∈ [tn–1, tn], akkor
A vonalintegrál jele: .
Az f(z) függvény γ menti ívhossz szerinti integrálja az I komplex szám, ha minden ϵ > 0-hoz létezik olyan δ > 0, hogy
valahányszor a = t0 < t1 < … < tn = b az [a, b] intervallum egy δ-nál nomabb felbontása, valamint u1∈ [t0, t1], u2 ∈ [t1, t2],
…, un ∈ [tn–1, tn], akkor
Ha φ:[c, d] → [a, b] monoton növekvő, folytonos függvény, amire φ(c) = a és φ(d) = b, akkor az γ ◦ φ a γ görbe
átparaméterezése, és
Előfordul, hogy egy olyan görbe mentén akarunk vonalintegrált számítani, ami nem korlátos, például egy teljes
egyenesen. Ilyenkor a paramétertartomány nyílt vagy félig nyílt intervallum, és a vonalintegrált a valós improprius
integrálókhoz hasonlóan, a kompakt részgörbéken vett vonal-, illetve ívhossz szerinti integrálok határértékeként
értelmezzük.
Mivel az integrálok létezése és értéke nem függ a konkrét paraméterezéstől, legtöbbször csak a görbe képét adjuk meg
vagy rajzoljuk fel, és az ábrákon is csak az irányát tüntetjük fel. Képletekben gyakori, hogy az integrálási utat csak az
egyenletével írjuk le; ilyenkor megállapodás szerint a körvonalakat pozitív (az óramutatóval ellentétes), a vízszintes és
függőleges egyeneseket pozitív irányban irányítjuk. Ha ez nem okoz félreértést, az egyenesek végtelen távoli „végeinek”
megadásakor használhatjuk a ∞ szimbólumot. Például
A gyakorlatban szinte kivétel nélkül olyan görbék fordulnak elő, amik folytonosan di erenciálható darabokból állnak.
Példák
1. Számítsuk ki a z2 függvény vonalintegrálját azon a 0 középpontú, 1 sugarú negyedköríven, ami az 1 és az i
pontokat köti össze.
Megoldás. A görbe egy lehetséges paraméterezése γ: [0, π/2] → C, γ(t) = eit, és
Műveletek vonalintegrálokkal
A komplex vonalintegrálokra is érvényesek a valós Stieltjes- és vonalintegrálokra vonatkozó, jól ismert szabályok. Ha c
komplex szám, és az f(z) és g(z) függvények integrálhatók a γ görbén, akkor
Tegyük fel, hogy a < b < c valós számok, γ1: [a, b] → C és γ2: [b, c] → C olyan síkgörbék, amikre γ1(b) = γ2(b), vagyis γ1
végpontja megegyezik γ2 kezdőpontjával. Ekkor a két görbe összefűzésével kapható görbét γ1 + γ2-vel jelölve,
A Newton–Leibniz-formula
Legyen D ⊂ C nyílt tartomány és f : D → C folytonos függvény. Azt mondjuk, hogy F : D → C az f-nek primitív függvénye, ha
f = F′.
A Newton–Leibniz-formula egyszerű következménye, hogy ha az f(z) függvény folytonos, és létezik primitív függvénye
a D tartományon, akkor
– f(z)-nek bármely, D-ben fekvő rekti kálható görbe mentén vett vonalintegrálja csak a görbe két végpontjától függ;
– f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt görbe mentén.
Ha létezik a primitív függvény, akkor tehát nincs szükség a pontos integrációs út megadására, elég a görbe kezdő- és
Ha az f(z) függvény folytonos, és létezik primitív függvénye a D tartományon, akkor a következő állítások
ekvivalensek:
a) az f(z) függvénynek létezik primitív függvénye a D tartományon;
b) f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt görbe mentén;
c) f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt töröttvonal mentén.
Bizonyítás. Mint láttuk, a Newton–Leibniz-formula miatt az a) tulajdonságból következik a b). A b)-ből triviálisan
következik a c), mert minden töröttvonal egyben rekti kálható görbe is. Elegendő tehát azt igazolni, hogy c)-ből
következik a).
Az a) feltételt úgy is mondhatjuk, hogy ha a γ1 és γ2 töröttvonalaknak ugyanaz a kezdőpontja és ugyanaz a végpontja,
akkor az f(z) vonalintegrálja ugyanaz a két töröttvonalon. Ha tehát a és b két tetszőleges pont S-ben, akkor bármely, a
kezdőpontú és b végpontú töröttvonalon f(z) vonalintegrálja ugyanaz. Ezt a közös értéket jelöljük g(a, b)-vel. Mivel D
tartomány, bármelyik két pontja összeköthető töröttvonallal, tehát g(a, b) mindig létezik.
Válasszunk ki egy tetszőleges z0 ∈ D kezdőpontot, és legyen F(z) = g(z0, z). Megmutatjuk, hogy F(z) di erenciálható, és
F′(z) = f(z).
Rögzítsük most z-t, és legyen ϵ > 0! Mivel D nyílt és f(z) folytonos, ezekhez létezik olyan δ > 0, amire B(z, δ) ⊂ D, és
bármely w ∈ B(z, δ) esetén |f(w) – f(z)| < ϵ. Legyen [z, w] a z-t w-vel összekötő szakasz. Ekkor
A Cauchy-tétel
21.2. ábra
A Cauchy-tétel
Most vázoljuk a következő, a komplex függvénytanban alapvető fontosságú tétel bizonyítását.
Cauchy-tétel. Ha f(z) reguláris az egyszeresen összefüggő D tartományon, akkor bármely D-ben fekvő rekti kálható,
zárt γ görbén .
A tételt először abban az esetben bizonyítjuk, ha γ egy háromszögvonal, aminek a belseje is D-be esik.
Goursat-lemma. Tegyük fel, hogy T (irányított) háromszögvonal, és az f(z) függvény reguláris a teljes
háromszöglemezen. Ekkor .
21.3. ábra
Válasszuk ki a négy háromszög közül azt, amelyen f(z) vonalintegrálja a legnagyobb abszolút értékű; ez lesz Tn + 1. Mivel
Tehát
ha a D tartomány egyszeresen összefüggő, akkor minden D-n reguláris függvénynek létezik primitív függvénye.
Ha f(z) reguláris a D tartományon, és γ nullhomotóp, rekti kálható zárt görbe D-ben, akkor
Tegyük fel, hogy a D tartományt a γ1 …, γn, rekti kálható zárt görbék határolják úgy, hogy a külső határgörbét pozitív,
a belső határgörbéket pedig negatív irányban irányítjuk. Ha f(z) reguláris D-n és folytonos a D határgörbéin, akkor
21.4. ábra
A logaritmus létezése
A Cauchy-tétel ismeretében előállíthatjuk a logaritmus függvény(eke)t mint az 1/z függvény primitív függvénye(i)t.
Ha a D tartomány egyszeresen összefüggő és nem tartalmazza a 0-t, akkor a logaritmusfüggvény értelmezhető D-n.
Bizonyítás. Jelöljünk ki D-ben egy tetszőleges z0 pontot, és válasszunk ki egy olyan c0 komplex számot, amire
. Mivel az 1/z függvény reguláris, a Cauchy-tétel következménye szerint létezik D-n primitív függvénye; ezek
közül válasszuk azt az l(z) függvényt, amire l(z0) = c0. Más szóval, legyen
Ha a D tartomány egyszeresen összefüggő, f(z) reguláris D-n, és nem veszi fel a nullát, akkor a log f(z) függvény
értelmezhető D-n: létezik olyan reguláris g(z) függvény D-n, amire f(z) = eg(z).
Bizonyítás. Legyen most is z0 ∈ D és c0 olyan komplex szám, amire . Mivel reguláris D-n, létezik
primitív függvénye D-n. Legyen g(z) az a primitív függvény, amire g(z0) = c0, azaz legyen
Az integrációs út módosítása
A Cauchy-tétel lehetőséget ad arra, hogy az integrációs utat más görbékre cseréljük ki, amiken az integrál könnyebben
kiszámítható. Sőt, a gyakorlatban a vonalintegrálokat nagyon sokszor nem is számítjuk ki. Ehelyett az integrációs utat úgy
változtatjuk, hogy az integrandus kicsi legyen, és a teljes integrál nullához tartson.
A vonalintegrál becsléséhez legtöbbször a triviális
becslést használjuk.
Példák
1.
Számítsuk ki az integrált!
Megoldás: az integrandus mindenhol reguláris a és –i pontok kivételével. A Cauchy-tétel alapján az
integrációs utat bármilyen sugarú körre kicserélhetjük:
21.5. ábra
Mi történik, ha az integrációs kört végtelen nagyra felfújjuk, azaz R-rel tartunk végtelenhez? Mivel
2.
Felhasználva, hogy , számítsuk ki az integrált, ahol a tetszőleges valós szám.
Megoldás. Tetszőleges K > 0 valós számra
és igy
A Cauchy-formulák
Lemma.
Cauchy-formula Jordan-tartományon. Tegyük fel, hogy γ egyszerű, zárt, rekti kálható, pozitív irányítású görbe, és
f(z) reguláris γ belsejében és a görbe pontjaiban. Ekkor bármely, γ belsejében fekvő z pontban
Cauchy-formula több határú tartományon. Legyen D olyan tartomány, amit a γ1, …, γn rekti kálható görbék
határolnak. A görbéket a szokásos módon irányítjuk: a külső görbét pozitív, a belső határgörbéket pedig negatív
irányban. Ha f(z) reguláris D-n és folytonos D lezárásán, akkor D bármely z belső pontjára
Ebben a tényben az a meglepő, hogy az f(z) függvényről nem kötöttük ki a többszörös di erenciálhatóságot. Mégis, a
Cauchy-integrálformula egy olyan képlettel írja fel a függvényt, ami akárhányszor di erenciálható.
A Cauchy-integrálformula következménye tehát, hogy ha egy komplex értékű függvény egyszer di erenciálható egy
tartományon, akkor a függvény akárhányszor di erenciálható.
A deriváltakra vonatkozó Cauchy-formula. Legyen D olyan tartomány, amit a γ1, …, γn rekti kálható görbék
határolnak. A görbéket a szokásos módon irányítjuk. Ha f(z) reguláris D-n és folytonos D lezárásán, akkor D bármely z
belső pontjára és tetszőleges k pozitív egészre
Hatványsorba fejtés
A Cauchy-formula egyik fontos következménye a reguláris függvények hatványsorba fejthetősége.
Hatványsorba fejtés. Tegyük fel, hogy f(z) reguláris a B(a, r) körben és folytonos a határán. Ekkor
–f(z) hatványsorba fejthető az a pont körül;
–f(z) hatványsora a teljes B(a, r) körlapon konvergens, és előállítja a függvényt;
– a hatványsorban a (z – a)n együtthatója
. Ezért
Az utolsó zárójelben álló kifejezés nem függ w-től. Az f(z) függvényt ezzel a teljes B(a, r) körlapon előállítottuk
alakban, ahol .
A tétel következménye, hogy
– minden reguláris függvény analitikus, azaz ha az f(z) függvény reguláris a D tartományon, akkor az f(z) függvény a D
bármely a pontja körül sorba fejthető;
– az a körüli hatványsor konvergenciasugara legalább akkora, mint a legnagyobb, D-ben fekvő, a középpontú kör
sugara.
Laurent-sorba fejtés
A hatványsorokról tanultakból tudjuk, hogy a sor jobb fele, egy a középpontú, kör alakú halmazon
konvergens. A sor bal fele, pedig akkor konvergens, ha 1/(z – a) esik egy bizonyos körbe.
Lehetséges, hogy R1 = 0; ilyenkor a gyűrű belső határa az a pontból áll. Ha a sor nem tartalmaz negatív kitevőjű tagot,
vagyis a sor egy hatványsor, akkor természetesen a középpontban is konvergens. Ha R1 = ∞, akkor a tartománynak nincs
külső határa.
Példák
1. Az 1 körüli
Laurent-sorba fejtés. Ha az f(z) függvény reguláris az R1< |z – a| < R2 körgyűrűn, akkor f(z) ezen a tartományon
Laurent-sorba fejthető: léteznek olyan bn komplex számok, amelyekre
-
a Laurent-sor konvergens az R1<|z–a| < R2 tartományon;
-
;
-
Bizonyítás. Válasszuk ki az r1, r2 sugarakat úgy, hogy R1 < r1<|z – a| < r2 < R2 teljesüljön. A Cauchy-formula alapján
Az első integrált pontosan ugyanúgy alakítjuk át, mint a hatványsorba fejtés bizonyításában:
A második integrál átalakításában a sort integráljuk tagonként.
Mivel az függvény a teljes R1< |w – a| < R2 körgyűrűn reguláris, a két szummában szereplő integrálokban
a r1, illetve r2 sugarú köröket bármilyen R1 < r < R2 sugarú körre kicserélhetjük. Ezzel azt kapjuk, hogy
Tegyük fel, hogy a Laurent-sor konvergens az R1 <|z–a| < R2 gyűrűn, az összege f(z), és legyen
Ha m – n – 1 ≠ –1, azaz m ≠ n, akkor a (z – a)m – n – 1 függvénynek létezik primitív függvénye, ezért az integrál 0. Az m = n
esetben viszont, mint korábban már láttuk,
ezért
Az unicitástétel
A gyöktényezők kiemelhetősége; lokális aszimptotikus viselkedés
A maximumelv
Az unicitástétel
A reguláris függvényeket egyértelműen meghatározzák az értelmezési tartomány egy pontjának környezetében felvett
értékei.
Unicitástétel. Ha z1, z2, …, z, egy olyan, D-beli komplex számokból álló végtelen sorozat, aminek van torlódási pontja D
belsejében, akkor minden D-ben reguláris függvényt egyértelműen meghatároznak az f(z1), f(z2), … értékek. Más
szóval, ha f(z) és g(z) reguláris függvények D-n és f(zz) = g(zn) minden n-re, akkor f(z) = g(z) a teljes D tartományon.
Bizonyítás. Legyen h(z) = f(z) – g(z); a tételt úgy is megfogalmazhatjuk, hogy ha h(zn) = 0 minden n-re, akkor h(z) ≡ 0.
Legyen Z azon D-beli pontok halmaza, ahol h = 0, és legyen Z′ a Z halmaz torlódási pontjainak halmaza. Mint tudjuk,
tetszőleges halmaz torlódási pontjainak halmaza zárt, tehát Z′ egy zárt halmaz.
Most megmutatjuk, hogy a Z′ ⋂ D halmaz nyílt. Tegyük fel, hogy a ∈ D torlódási pontja Z-nek, azaz léteznek olyan w1,
ami ellentmondás. Tehát mindegyik együttható 0, és h(z) ≡ 0 az a pont egy környezetében. A Z′ ⋂ D halmaz tehát
tartalmazza a egy környezetét bármely a ∈ Z′ ⋂ D esetén.
Tekintsük most a Z′ ⋂ D és D\Z′ halmazokat! Ez két diszjunkt nyílt halmaz, amelyek uniója D. Mivel D összefüggő, ez
csak úgy lehetséges, ha az egyikük üres, a másik a teljes D. Azt azonban a feltételből tudjuk, hogy a z1, z2, … sorozatnak van
torlódási pontja D-ben, vagyis Z′ ⋂ D nem lehet üres. Tehát D ⊂ Z′, amiből következik, hogy h(z) = 0 a teljes D-n.
Az unicitástétel állítása nem marad igaz, ha a z1, z2, … sorozat csak a határhoz torlódik. Legyen például D az egységkör,
Ha f(z) reguláris az a pont egy környezetében, és f(a) = 0, akkor f(z)-ből kiemelhető a z – a gyöktényező, azaz létezik
olyan, g(z) reguláris függvény, amire f(z) = g(z)(z – a).
Általánosabban, f(z)-ből akkor és csak akkor emelhető ki (z – a)k, ha f(a) = f′(a) =…= f(k – 1)(a) = 0.
Ha f(z) regularis az a pont egy környezetében, f(a) = 0, és k a legnagyobb olyan pozitív egész, amire (z – a)k kiemelhető a
függvényből, akkor azt mondjuk, hogy f-nek az a pont k-szoros gyöke.
Tegyük most fel, hogy f(z) reguláris az a pont egy környezetében, és az f(z) – f(a) függvénynek az a szám m-szeres gyöke,
azaz f(z) – f(a) = g(z)(z – a)m, ahol g(a) ≠ 0. Vizsgáljuk meg, hogy mi egy a körüli kis r sugarú körvonal képe.
ha z körbefut |z – a| = r körvonalon, akkor f(z) közelítőleg az f(a) középpontú, rm|g(a + reit)| sugarú körön fut körbe m-
szer. Az a szögsebesség, amivel f(z) – f(a) körbefordul, közelítőleg m-szerese z – a szögsebességének.
Ha m > 1, azaz f′(a) = 0, akkor ez azt is jelenti, hogy a reguláris függvények nem szögtartók azokban a pontokban, ahol a
derivált eltűnik.
A maximumelv
Ha f(z) reguláris és nem konstans az a pont egy környezetében, akkor a lokális aszimptotikus viselkedésből szemléletesen
látható, hogy a környezet „körülveszi” az f(a) pontot, vagyis f(a) belső pontja a képhalmaznak.
A nyílt leképezés tétele. Ha f(z) reguláris és nem konstans a D tartományon, akkor bármely, D-ben fekvő nyílt halmaz
képe is nyílt.
Maximumelv
a) Nem konstans reguláris függvény abszolút értékének nincs lokális maximumhelye.
b) Ha K kompakt részhalmaza a h(z) nem konstans reguláris függvény értelmezési tartományának, akkor |h(z)| a
legnagyobb értékét K határán veszi fel.
c)
Ha z1, z2, … olyan pontsorozat a D tartományban, amire , akkor a sorozat minden torlódási
pontja (konvergens sorozat esetén a limesze) D-nek határpontja.
Bizonyítás. Az a) állításból azonnal következik b) és c), ezért csak a)-t bizonyítjuk. Legyen a tetszőleges pont, amelynek
egy B (a, δ) környezetében f(z) reguláris. Azt akarjuk megmutatni, hogy |f(z)| felvesz |f(a)|-nál nagyobb értéket.
Tegyük fel, hogy f(z) – f(a) = g(z) (z – a)m, ahol g(z) reguláris és g(a) ≠ 0. Válasszunk egy olyan t számot, amelyre g(a)emit
és f(a) iránya megegyezik, azaz nem negatív valós szám. (Ha f(a) = 0, akkor bármelyik irány megfelel.) Ekkor
Schwarz-lemma
a) Ha f(z) reguláris a B(0, 1) egységkör belsejében, |f(z)| ≤ 1 és f(0) = 0, akkor |f(z)| ≤ |z|, és |f′(0)| ≤ 1.
b) b) Ha |f′(0)| = 1, vagy |f(z)| = |z| teljesül akár csak egyetlen z ≠ 0 pontban, akkor f(z) = cz, ahol c egy egységi hosszú
komplex szám.
Bizonyítás. Mivel 0 gyöke f(z)-nek, f(z) = g(z) ·z és f′(0) = g(0) egy alkalmas g(z) reguláris függvénnyel, amire a feltétel
szerint .
A maximumelvet alkalmazva a g(z) függvényre, tetszőleges 0 < r < R < 1 esetén
A R → 1 – 0 határátmenetből
vagyis |g(z)| ≤ 1 a teljes körlapon. Visszaírva g(z) de nícióját, ez azt jelenti, hogy [f(z)| = |g(z)| · |z| ≤ |z| és |f′(0)| = |g(0)| ≤ 1.
Ha |g(z)| = 1 csak egyetlen pontban is teljesül, akkor a maximumelv szerint g(z) konstans, és f(z) valóban cz alakú.
A Liouville-tétel
Az együttható-formula ismeretében a függvényértékek nagyságából könnyen kaphatunk jól használható becsléseket a
hatványsor együtthatóinak nagyságára.
Bizonyítás. Tegyük fel, hogy f(z) egészfüggvény, és |f(z)| ≤ M a teljes síkon. Legyen a függvény 0 körüli hatványsora
.
Tehát valójában f(z) = b0 + b1z + … + bkzk egy polinom, ami nem tartalmaz k-nál magasabb fokú tagot.
Az a pontot az f(z) függvény izolált szingularitásának nevezzük, ha a függvény reguláris az a egy pontozott
környezetében. Az izolált szingularitásokat három csoportba soroljuk:
- Az a pont megszüntethető szingularitás, ha a függvény az a pontra is kiterjeszthető regulárisan.
-
Az a pont k-adrendű pólus, ha egy alkalmas g(z) függvényre, amely reguláris a-ban, és amelyre g(a)
≠ 0.
- Az a pont lényeges szingularitás, ha nem tartozik az előző két csoportba.
A megszüntethető szingularitások jellemzése. Tegyük fel, hogy f(z)-nek izolált szingularitása van a-ban. A következő
állítások ekvivalensek:
a) az a-beli szingularitás megszüntethető;
b) a függvény folytonosan kiterjeszthető az a pontban, azaz létezik véges határértéke;
c) a függvény korlátos a egy pontozott környezetében;
d) .
A pólusok jellemzése. Tegyük fel, hogy f(z)-nek izolált szingularitása van a-ban. A következő állítások ekvivalensek:
a) a függvénynek a-ban legfeljebb k-adrendű pólusa (vagy megszüntethető szingularitása) van;
b) az f(z) (z – a)k függvénynek létezik véges határértéke a-ban;
c) az f(z) (z – a)k függvény korlátos a egy pontozott környezetében;
d) .
Bizonyítás. Mivel triviálisan (a) ⇒ (b) ⇒ (c) ⇒ (d), elég azt igazolni, hogy (d) ⇒ (a).
Válasszunk egy olyan kicsi r0 > 0 számot, amire f(z) reguláris a Ḃ(a, r0) pontozott környezetben, és legyen f(z) Laurent-
sora a 0 < |z – a| < r0 tartományon A célunk annak megmutatása, hogy a Laurent-sorban nincsenek
(– k)-nál kisebb fokú tagok. Legyen tehát n ≤ – (k + 1), és vizsgáljuk a bn együtthatót! Az együttható-formula szerint bármely
0 < r < r0 esetén
, amiből
Picard-tétel. Ha a lényeges szingularitása az f(z) függvénynek, akkor a bármely pontozott környezetében legfeljebb egy
kivétellel minden komplex számot felvesz.
A Casorati–Weierstrass-tétel bizonyítása. Tegyük fel, hogy az állítás hamis, valamilyen δ > 0-ra a Ḃ(a, δ) halmaz képe
mégsem sűrű, vagyis nem vesz fel egy értéket sem egy tetszőleges B(b, r) körlapon. Nézzük a függvényt!
A fenti indirekt feltevés szerint halmazon. A g(z) függvény tehát korlátos az a egy pontozott
környezetében, és g(z)-nek megszüntethető szingularitása van a-ban.
Ha g(z)-nek k-szoros gyöke van a-ban, akkor az függvénynek ugyanitt k-adrendű pólusa (k = 0
esetén megszüntethető szingularitása) van.
A reziduumtétel
A reziduum kiszámítása
Az argumentumelv
A nyílt leképezés tételének bizonyítása
A reziduumtétel alkalmazásai
A reziduumtétel
Tegyük fel, hogy az f(z) reguláris a D egyszeresen összefüggő tartományon néhány izolált szingularitás kivételével, és γ
olyan zárt, rekti kálható görbe D-ben, ami elkerüli ezeket a szingularitásokat.
A Cauchy-tétel lehetőséget ad arra, hogy az integrációs utat megváltoztassuk, ha eközben nem „ugorjuk át” a
szingularitásokat. Húzzuk össze a görbét olyan kis körökre, amik egy-egy szingularitást kerülnek meg. A kis köröket olyan
görbedarabokkal kössük össze, amelyeken az új görbe mindkét irányban végighalad (21.7. ábra).
21.7. ábra
Az összekötő görbéken vett vonalintegrálok kiejtik egymást, a teljes görbén vett integrál ezért megegyezik a kis
körökön vett integrálok összegével. Ez a tény mutatja, hogy az integrál értéke csak attól függ, hogy a függvény hogy
viselkedik szingularitások körül, valamint attól, hogy az integrációs út hányszor kerüli meg az egyes szingularitásokat.
Tegyük fel, hogy f(z) reguláris a 0 < |z – a| ≤ r pontozott környezeten. Az számot az f(z) függvény a-beli
reziduumának nevezzük, és vagy, a változó feltüntetése nélkül, -fel jelöljük.
Reziduumtétel. Legyen D egyszeresen összefüggő tartomány, és f(z) reguláris D-n az a1, …, ak szinguláris pontok
kivételével. Legyen továbbá γ olyan zárt, rekti kálható görbe D-ben, ami nem megy át a szinguláris pontokon, és
jelöljük mj-vel azt, hogy a görbe (előjelesen) hányszor kerüli meg az aj pontot, vagyis a γ(t) – aj vektor hányszor fordul
körbe, amíg végigmegyünk a görbén. Ekkor
A reziduum kiszámítása
Sok esetben a Laurent-sor felírása nélkül is kiszámíthatjuk a reziduumot. Két ilyen fontos esetet mutatunk.
1.
Ha , ahol g(z) reguláris az a pont egy környezetében, akkor az a-beli reziduumot a Cauchy-formulák adják
meg: , , általában .
2.
Ha , ahol g(z) és h(z) reguláris az a pont egy környezetében, és h(z)-nek egyszeres gyöke van a-ban, akkor
Példák
1.
Számítsuk ki az függvény reziduumát a 0-ban!
Megoldás: .
3. Számítsuk ki a ctg z függvény reziduumát a 0-ban!
Megoldás:
4.
Számítsuk ki az függvény reziduumát a –i-ben!
Megoldás: a deriváltra vonatkozó Cauchy-formula szerint
5.
Számítsuk ki az függvény reziduumát a –π-ben!
amiből
Az argumentumelv
A reziduumtétel arra is használható, hogy egy függvény gyökeit és pólusait megszámoljuk egy adott görbe belsejében.
Ha az f(z) függvény izolált szingularitásoktól eltekintve reguláris, és a szingularitások mind pólusok, akkor
meromorfnak nevezzük.
-
ha f(z)-nek m-szeres gyöke van az a pontban, akkor ,
-
ha f(z)-nek m-edrendű pólusa az a pontban, akkor .
Argumentumelv. Tegyük fel, hogy f(z) meromorf a D tartományon, és legyen γ olyan, D-ben fekvő egyszerű, zárt,
rekti kálható görbe, ami nem megy át f semelyik gyökén és pólusán sem. Ha γ belsejében f-nek (multiplicitással
A tételben szereplő integrálnak egy fontos geometriai jelentése van: a γ görbén körbehaladva, az f(z) iránya (azaz az
Ha f(z) reguláris a γ görbén és annak belsejében, továbbá f(z) ≠ a a görbén, akkor a görbén körbehaladva f(z) pontosan
annyiszor kerüli meg az a számot, mint ahányszor f(z) felveszi az a értéket.
Rouché tétele. Legyen f(z) és g(z) meromorf a D tartományon, és legyen γ olyan zárt, rekti kálható görbe, ami a
belsejével együtt a tartományban fekszik úgy, hogy γ nem megy át f(z) és g(z) pólusain.
Ha a γ görbe pontjaiban |f(z)| > |g(z)|, akkor γ belsejében az f és f + g függvény gyökei és pólusai (multiplicitással vett)
számának különbsége ugyanaz.
A reziduumtétel alkalmazásai
Most a reziduumtétel néhány olyan alkalmazására mutatunk példákat, amikor nehezen kezelhető összegeket és
integrálokat számítunk ki a segítségével.
integrál kiszámítása
Az
integrál kiszámítása
Végtelen sorok összegének kiszámítása
Az
integrál kiszámítása
Ez az integrál a valós eszközökkel kiszámítható, de jól példázza a bemutatott technikát.
21.8. ábra
Legyen K > 1 esetén γK a K és –K pontokat összekötő félkör (21.8. ábra). A reziduumtétel szerint
Az
integrál kiszámítása
Ugyanezt kaphatjuk a harmadik integrálra. Ha tehát K→ ∞, akkor a két szélső integrál 0-hoz tart. Összességében azt
kaptuk, hogy
Legyen racionális függvény, amelyben a nevező foka legalább 2-vel nagyobb, mint a számláló foka. A
függvénynek az egészektől különböző pólusai legyenek a1, …, ak. A reziduumtételt az f(z) · π ctg (πz) függvényre alkalmazva
Ha az N pozitív egésszel tartunk ∞-hez, akkor a jobb oldal 0-hoz tart, mert az integrációs út hossza N, az integrandus
pedig legfeljebb 1/N2 nagyságrendű. Ezért
Azokon az egész j helyeken, ahol f(z)-nek nincs pólusa, Resj g = f(j). A képlet tehát lehetőséget ad az f(j) értékek
összegzésére.
Példák
1.
Számítsuk ki a összeget!
Legyen D1 és D2 két tartomány. Ha f : D1 → D2 kölcsönösen egyértelmű megfeleltetés úgy, hogy f és f–1 reguláris, akkor
az f függvényt konform leképezésnek nevezzük.
Bizonyítás. Azt kell bizonyítanunk, hogy ha egy f(z) egész függvény injektív, akkor minden komplex számot felvesz.
Tegyük fel indirekten, hogy f(z) nem vesz egy értéket; mivel f(z)-t egy konstanssal megváltoztathatjuk, feltehetjük, hogy
f(z) ≠ 0. Ekkor létezik log f-nek reguláris ága, legyen tehát g(z) az egyik ilyen ág; f(z) = eg(z) a teljes síkon.
Válasszuk ki g(z) egyik értékét, legyen ez a! A nyílt leképezések tételéből következik, hogy g(z) minden értéket felvesz a
egy kis B(a, r) környezetében. Az exponenciális függvény 2πi szerint periodikus, tetszőleges w ∈ B(a, r) esetén ew = e2πiw.
Mivel az f(z) = eg(z) függvény injektív, g értékei között nem szerepelhet egyszerre a w és a w + 2πi szám is. A g(z) függvény
tehát nem vesz fel egy értéket sem a B(a + 2πi, r) körben.
Tekintsük most a függvényt! h(z) egy olyan egész függvény, ami korlátos is: .A
Liouville-tétel alapján h(z) konstans, ez viszont ellentmond annak, hogy f, és vele együtt g és h is, injektív.
A konform leképezések alaptétele, Riemann-alaptétel. A teljes sík kivételével minden nem üres, egyszeresen
összefüggő tartomány konform ekvivalens az U = {z: |z| < 1} egységkörlemezzel.
A tételből természetesen azonnal következik, hogy bármely két olyan egyszeresen összefüggő tartomány, ami nem a
teljes sík, konform ekvivalens egymással.
Az (a, b, c, d) kettősviszony akkor és csak akkor valós, ha az (a, b, c, d) pontok egy körre vagy egy egyenesre esnek.
Bizonyítás. Az (a, b, c, d) kettősviszony akkor tisztán valós, ha (arg(a – c) – arg(b – c)) – (arg(a – d) – arg(b – d))
többszöröse π-nek. A két zárójelben az acbd négyszög c-nél és d-nél levő előjeles szögei állnak; a feltétel azzal ekvivalens,
hogy a két szemközti előjeles szög összege osztható π-vel.
Az az + b alakú lineáris függvények irányítástartó hasonlóságok, amik egyenest egyenesbe és kört körbe visznek. Egy
további fontos függvény az 1/z függvény, geometriailag egy tükrözött inverzió. (Az A/z̄ függvény írja le az egységkörre való
inverziót, de ez nem reguláris a konjugálás miatt.) A síkot kiegészítjük a ∞ ponttal, akkor az 1/z függvény a 0-t és a ∞ pontot
egymásnak felelteti meg. Nem nehéz ellenőrizni, hogy az 1/z függvény tengelyesen tükrözi a 21.1. fejezetben látott gömböt a
– 1, 1 átmérőre.
A ∞-nel kiegészített gömbön az egyeneseket is köröknek tekinthetjük. A félsíkok azok a körlemezek, amiknek határa
átmegy a ∞ ponton; egy kör külseje pedig az a kör, ami a belsejében tartalmazza a ∞-t (21.10. ábra).
21.10. ábra
Ha lineáris függvényeket és az 1/z függvényt egymás után alkalmazzuk, további függvényeket kaphatunk: ezek az
úgynevezett lineáris törtfüggvények.
A lineáris törtfüggvények kettősviszonytartóak, és minden kört és egyenest körbe vagy egyenesbe visznek. A lineáris
törtfüggvényeknek 3 „szabadsági foka” van. Általában is igaz, hogy
a lineáris törtfüggvények három tetszőleges pont képével egyértelműen meghatározhatók, azaz ha z1, z2, z3, illetve w1,
w2, w3 három különböző pont (szerepelhet közöttük a ∞ is), akkor pontosan egy olyan f(z) lineáris törtfüggvény
létezik, amire f(z1) = w1, f(z2) = w2, és f(z3) = w3.
Az egységkör konform automor zmusai
Az U = {z: |z| < 1} konform automor zmusai a alakú lineáris törtfüggvények, ahol a és ϵ komplex
számok, |a| < 1 és |ϵ|.
Bizonyítás. Tetszőleges |a| < 1 esetén legyen . Könnyű ellenőrizni, hogy φa(z) és φ–a(z) egymás
inverzei.
Először vizsgáljuk meg azokat a konform automor zmusokat, amik xen hagyják a 0-t. A 0 körüli forgatások, azaz az ϵz
alakú függvények nyilván ilyenek; megmutatjuk, hogy más nincs.
Tegyük fel tehát, hogy f(z) olyan konform automor zmusa az egységkörnek, amire f(0) = 0. A Schwarz-lemmát
alkalmazva az f és f–1 függvényekre, |f(z) | ≤ |z| és |z| = |f–1 (f(z))| ≤ |f(z)| bármely |z| < 1 esetén, ami csak úgy lehet, ha |f(z) | =
|z| a teljes körlemezen. Ez esetben viszont a Schwarz-lemma azt is kimondja, hogy f(z) = ϵz alkalmas, egységnyi hosszúságú
ϵ komplex számmal.
Tekintsük most a φa(z) függvényt, ahol |a| < 1! A függvény reguláris az A/z̄ pont kivételével, és körvonalon
A függvény tehát az egységkörvonalat önmagára képezi. Mivel a 0 képe a φa(0) = a belső pont, a függvény az
egységkörlemezt a kör belsejének felelteti meg, vagyis φa(z) egy konform automor zmusa U-nak.
Az eddigiekből láthatjuk, hogy minden ϵφα(z) alakú függvény konform automor zmusa az egységkörnek. Legyen most
f(z) egy tetszőleges konform automor zmusa U-nak; olyan a és ϵ számokat akarunk találni, amikre f(z) = ϵφα(z). Legyen a = –
f–1(0), és tekintsük a h(z) =f(φ–α(z)) függvényt! Ez a függvény konform automor zmusok összetétele, maga is
automor zmus, továbbá h(0) = f(φ_a(0))= f(– a) = 0. Mint láttuk, ebből következik, hogy h(z) = ϵz egy egységnyi hosszúságú
komplex számmal. Ezek után pedig, z helyére φα(z)-t helyettesítve,
A tükrözési elv
Egy tartomány határa nem mindig „szép”. A határnak lehetnek többszörös, sőt végtelenszeres pontjai. A határ maga lehet
egy egészen bonyolult fraktál is. Ezért nem mindig lehet egy konform megfeleltetést bővebb halmazra folytatni. Ha viszont
a határ „szép”, akkor többet lehet mondani.
21.11. ábra
Sokszög leképezése
A fejezetet egy olyan képlettel zárjuk, ami megadja egy félsík és egy sokszög között az összes lehetséges konform
megfeleltetést.
Schwarz–Christo el-formula. Tegyük fel, hogy f(z) konform megfeleltetés a felső félsík és az A1… An sokszög között
úgy, hogy a sokszög Ak csúcsának a valós tengely ak pontja felel meg. Ha a sokszög szögei a1…an, akkor
ahol B ≠ 0 és C alkalmas komplex számok.
21.12. ábra
Ha az ak számok valamelyike a ∞, akkor a megfelelő tényezőt elhagyjuk. A formula akkor is érvényes, ha a csúcsok
közül egy – vagy akár több – a ∞; így például szögtartományok esetén is használható.
Teljes általánosságban ez a képlet nem használható könnyen, ugyanis nem ad eljárást az a1, …, an számok
meghatározására. Az viszont igaz, hogy közülük bármelyik hármat tetszés szerint megadhatjuk, ha sorrendjük megfelel a
sokszög – mindig pozitív – körüljárásának.
Legyen D ⊂ Rn összefüggő, nyílt halmaz, és legyen h: D → R kétszer di erenciálható függvény! Azt mondjuk, hogy h(x1,
…, xn) harmonikus, ha teljesül rá az úgynevezett Laplace-egyenlet:
Bizonyítás. Legyen f(x + yi) = u(x, y) + v(x, y)i. A Cauchy–Riemann-egyenletek és a Young-tétel alapján
Bizonyítás. Először f(z) deriváltját írjuk fel, ezt ugyanis a Cauchy–Riemann-egyenletek miatt megtehetjük a képzetes
rész nélkül is.
Legyen
Könnyen ellenőrizhető, hogy a g(z) függvényre teljesülnek a Cauchy–Riemann-egyenletek. Így g(z) reguláris a D
tartományon, és létezik primitív függvénye. A g alkalmas primitív függvényét választva f-nek, teljesülni fog az u = Re f
azonosság.
A két fenti tételt összevetve, azt igazoltuk, hogy
egyszeresen összefüggő tartományon egy kétszer di erenciálható függvény akkor és csak akkor harmonikus, ha egy
reguláris komplex függvény valós része.
Megjegyezzük, hogy ez az eredmény nem marad igaz, ha D nem egyszeresen összefüggő. Például az
függvény a C\{0} tartományon harmonikus – ez a függvény a csak lokálisan létező
logaritmusfüggvény valós része –, de nincs olyan, a teljes C\{0} tartományon reguláris függvény, aminek ez lenne a valós
része.
Más szóval, a függvény átlaga a körlapon megegyezik a középpontban felvett értékkel. Megfordítva, ha h(z) folytonos a
D tartományon, és minden a ∈ D ponthoz létezik olyan δ(a) > 0, hogy bármely 0 < r < (a) esetén
Poisson-formula. Ha h(z) harmonikus a B(0, 1 + e) körlapon, akkor tetszőleges z = ρeiϑ, |ρ| < 1 esetén
Bizonyítás. A szimmetria miatt elég az állítást a ϑ = 0 esetben igazolni. Legyen f(z) olyan reguláris függvény, amelynek
valós része h(z). A Cauchy-formula alapján
Az utolsó integrál 0, mert az függvény reguláris, ezért
Nyílt leképezés tétele. Ha h(z) harmonikus és nem konstans a D tartományon, akkor bármely, D-ben fekvő nyílt
halmaz képe is nyílt.
Maximum- és minimumelv
a) Nem konstans harmonikus függvénynek nincs lokális szélsőértékhelye.
b) Ha K kompakt részhalmaza a h (nem konstans) harmonikus függvény értelmezési tartományának, akkor h a
legkisebb és a legnagyobb értékét K határán feszi fel.
c) Ha z1, z2, … olyan pontsorozat a D tartományban, amire h(zn) → supD h vagy h(zn) → infD h, akkor a sorozat minden
torlódási pontja (konvergens sorozat esetén a limesze) D-nek határpontja.
22. Fraktálgeometria
A fraktálgeometria a XX. század matematikájának a terméke. A század első évtizedeiben Sierpinski lengyel, Koch és Cantor
német matematikusok a halmazelmélet furcsaságainak bemutatására és vizsgálatára szerkesztettek „megmérhetetlen”
halmazokat, amelyek távolinak tűnnek a minket körülvevő világ geometriájától. A fraktálgeometria a XX. század utolsó
évtizedeiben alakult ki, miután Mandelbrot, a hazájából menekülni kényszerült, az IBM-nél dolgozó lengyel matematikus
1982-ben megjelent könyvében megmutatta, hogy ezek a patologikusnak tűnő halmazok alkalmasak lehetnek a
körülöttünk levő világ matematikai leírására is. A fraktál elnevezés is tőle származik.
(22.1)
22.2. ábra
Az egymás után kapott Kn(n = 1, 2, …) törtvonalak hossza ekkor határtalanul növekszik. Valóban, ha az indító
egyenesszakasz hossza egységnyi, akkor a generátor hossza , az F(generátor) hossza , hiszen a „2.
iteráció” úgy jön létre, hogy az „1. iteráció” ábráján minden egyenesszakaszt lecserélünk a generátor egyharmadára.
Ugyanígy belátható, hogy minden egyes lépésnél a kapott törtvonal hossza az előző 4/3-a lesz.
Ezért elég hosszú ideig folytatva az iterációt, vagyis elég sokszor ismételve a (22.2) szabályt, a kapott törtvonal hossza
tetszőlegesen nagy lesz.
Vegyük közelebbről szemügyre azt, hogy mi a végeredménye ennek a szerkesztésnek. A válasz céljából tekintsük a
(zárt) háromszögekből álló { ; n = 1, 2, …} sorozatot a 22.3b ábrán. Ezek egymásba skatulyázott halmazok
közös részét tekintjük az iteráció végeredményének. Ezt Koch-görbének nevezzük. Abból, hogy és
a háromszögek halmaza „rázsugorodik” a Kn törtvonalakra (*)
arra következtetünk, hogy a Kn; n = 1, 2, ...} és a { ; n = 1, 2,...} ugyanazt a halmazt állítja elő.
Megjegyzés. A (*) állítás a következőket jelenti. minden P* pontjához van a K1 halmaznak olyan P pontja,
amelyek távolsága
amely leolvasható a 22.3b ábrából. Ezután a szerkesztésből következik, hogy minden iterációval ez a távolság a
harmadára változik. Így a minden P* pontjához van a Kn halmaznak olyan P pontja, amelyek távolsága
Amint láttuk, a Koch-görbe egydimenziós mértéke (hossza) tetszőlegesen nagy lehet („végtelen”) és – a { ; n = 1,
2,...} háromszögeiből becsülve – kétdimenziós mértéke (területe) csak nulla lehet, mivel
és ha területe ( ), akkor
vagyis a { ; n = 1, 2,...} sorozatban mindegyik halmaz területe az előző területének kétharmada.
Gondolkodjunk el a következő furcsaságon. Ha egy sima görbét arányosan a harmadára kicsinyítünk, akkor a mérete
(hossza) is a harmadára változik. A Koch-görbénél azt tapasztaljuk, amint a 22.3a ábrából leolvasható, hogy a harmadára
kicsinyített Koch-görbéből (a szürkével fedett részből) négynek az uniója adja ki az eredeti Koch-görbét. Így a Koch-görbe
arányos méretváltozásra (röviden: skálaváltozásra) nem úgy viselkedik, mint egy sima görbe. Ezt a viselkedést is, mint a
Sierpinski-háromszög hasonló viselkedését, tört értékű dimenzióval fogjuk jellemezni.
A 22.3c ábrán a Koch-görbére vezető sorozatot kissé módosítottuk. Az egyenesszakaszokat olykor a 22.3a ábra
generátorának tükörképével helyettesítettük. Ez első ízben a 2. iteráció szürkével fedett részében látható. Ilyen
módosításokkal különböző zegzugos görbék, például tengerpartvonalak modellezhetők, és ez adja az alapot a geodéziában
a fraktálgeometria alkalmazásának.
3. Határtalanul nagyítható faág. A természeti környezetünk is rendelkezhet olyan tulajdonságokkal, mint a
Sierpinski-háromszög vagy a Koch-görbe. Ilyen a már említett zegzugos tengerpart és ilyen lehet egy faág. A 22.4a–b ábrák
azt mutatják, hogyan állítható elő egy faág képe iterációval. Kiindulhatunk egy egyenesszakaszból, és az iterációs szabály,
vagyis az a szabály, amelynek ismétlésével a faág szerkesztése történik, ekkor a következő négy (F1, F2, F3 és F4) szabály
uniója (egyesítése).
F1, F2, F3, F4 négy olyan transzformáció, amelyek az eredeti ábra lineáris méretét a 0,4-szeresére változtatják, majd a
22.4a–b ábrán látható módon, különböző mértékben eltolják, illetve elforgatják. Az F1, F2, F3, F4 transzformációk
uniójának (egyesítésének) ismétlésével alakul ki a faág. A 22.4a ábra részletesen mutatja az első két iterációt abban az
esetben, amikor egy egyenesszakaszból indulunk ki. A 22.4b ábra mutatja a szabály további ismétlésével kapott ábrákat. A
kialakult faágon az egymással hasonló részek árnyékolásával próbáljuk megmutatni az önhasonló jelleget (22.4c ábra).
Dacára annak, hogy a szerkesztés végeredménye alig különböztethető meg egy valódi faágtól, a végeredmény hossza
végtelen. Ugyanis, minden iteráció az előző halmaz 0,4-szeresének négyszeresét egyesíti. Így az egyre reálisabbnak tűnő
faágak hossza egy 1,6 hányadosú geometriai sorozatot alkot, és így tetszőlegesen naggyá válik, ha elég messze megyünk a
sorozatban.
22.4. ábra
Ekkor az iterációs szabály az, hogy a fenti négy leképezést egymás után alkalmazzuk az aktuális halmazra, majd az így
kapott halmazokat egyesítjük.
Ha
(22.4)
akkor a (22.3) leképezés az egységnégyzetet egy paralelogrammába viszi, amelynek nem párhuzamos oldalai az
vektorok. Ez pontosan akkor érvényes, ha ezek a vektorok nem párhuzamosak, vagyis lineárisan függetlenek (22.5a ábra).
22.5. ábra
egyenlőségekből pedig az következik, hogy a (zárt) egységnégyzetet a (zárt) paralelogrammára képezi le a (22.3)
transzformáció. A (22.3) leképezés „hatását” a 22.6. ábrával érzékeltetjük.
22.6. ábra
Példák
1. Az a11 = a, a22 = b diagonális mátrix az egységnégyzetet egy a, b oldalú téglalapba viszi, és az alakzatokon az x
tengely irányában a-szoros, az y tengely irányában b-szeres skálaváltoztatást hajt végre (22.5b ábra).
2.
A mátrix az alakzatokat ø szöggel elforgatja az óramutató járásával megegyező irányban (22.5c
ábra).
mátrix ø szöggel elforgat az óramutató járásával megegyező irányban, majd ezután r-szeres skálaváltoztatást
(léptékváltoztatást) végez mindkét koordinátatengely irányában.
Legyen
(22.5)
ahol
(22.6)
(Mekkora ez az r?)
Számunkra az az eset fontos, amikor r < 1. Ekkor F kontraktív leképezés. Ekkor az F leképezés összehúz, abban az
értelemben, hogy az F(x), F(y) képpontok távolsága mindig kisebb, mint az x, y pontoké (22.7. ábra). Ha a (22.6) formulában
egyenlőség áll, akkor az F függvény neve hasonlósági leképezés.
22.7. ábra
A hasonlósági leképezés fogalmával a geometriai hasonlóság de nícióját a következőképpen adhatjuk meg: két
korlátos halmaz, D és D*, hasonló, ha van olyan F hasonlósági leképezés, hogy a D-beli pontok képeinek a halmaza D*. Ezt
tömören, a matematika nyelvén így fejezzük ki
(22.7)
Példák
1. Egy diagonális mátrixhoz hozzárendelt transzformáció pontosan akkor kontraktív, ha a mátrix elemeinek
abszolút értéke egynél kisebb.
2. Ha egy F a n leképezésben
(22.8)
Az F függvénnyel adott
Példák
1. Legyen F(x) = log x. Ekkor F-et a (22.8) módon halmazfüggvénynek tekintve
és ha D = {1, 2, …, 10}, vagyis D a [0, 10] intervallumban levő egész számok sorozata, akkor
22.8. ábra
2. Legyen
Ekkor F a (0, 0), (a, 0), (a, a), (0, a) négyzetet a (0, 0,5a), (0,5a, 0,5a), (0,5a, a), (0, a) négyzetbe és az origó középpontú
R sugarú kört a (0, 0,5a) középpontú 0,5R sugarú körbe képezi le (22.9. ábra szürke). Köznapi nyelven szólva, az F
függvény a fenti halmazokat a felére „zsugorítja”, majd a
vektorral eltolja.
22.9. ábra
A fenti példákból is már láthatjuk, hogy a (22.8) halmazfüggvény bevezetésével jobban tudjuk szemléltetni egy-egy
függvény jellegzetességeit, mint az F függvény szokásos alakjával. Az R2 részhalmazai, amelyekre a (22.8) formulával adott
halmazfüggvényeket értelmezzük, korlátos és zárt halmazok. Az R2 korlátos és zárt részhalmazait kompakt halmazoknak
nevezzük.
22.4. Az IFS-modell
IFS, az iterált függvényrendszer angol kifejezésének (iterated function system) a rövidítése. Az IFS-modell egy olyan
eljárás, amellyel egyszerűen állíthatunk elő olyan halmazokat, amelyeket a bevezető három példában bemutattunk. Ez az
eljárás a következő lépésekből áll:
I. Megadunk véges sok kontraktív függvényt, legyenek ezek {Fi; i = 1, 2, …, N}.
II.
Képezzük a függvények unióját. Ezen a következő halmazfüggvényt értjük
III.Végül képezzük a
(22.9)
sorozatot, vagyis egy B halmazra újra meg újra alkalmaztuk a W szabályt. Ellenőrizzük, hogy a bevezető példák ezzel az
eljárással is előállíthatók.
A bevezető példáknál összetettebb, nem hasonlósági, hanem általános a n leképezésekből álló függvényrendszerre a
következő példát adjuk.
A függvényrendszerből képezett (22.9) sorozat látható a 22.10. ábrán, amikor B egy olyan nagy négyzetlap, amelyre
W(B) ⊂ B.
Az IFS invariáns halmaza egy fa képét mutatja. A fát szegélyező paralelogrammák a négyzet képei a beírt Fi
leképezésben. Vegyük észre, hogy a fát szegélyező paralelogrammák uniója a B négyzetlap részhalmaza.
Az IFS-modell eddigi alkalmazásaiban W (B) ⊂ B, és így
(22.10)
22.10. ábra
(22.11)
(22.12)
(22.13)
22.11. ábra
A (22.13) összefüggés alapján, ha egy K kör R sugara olyan nagy, hogy az iterált függvényrendszert (IFS) meghatározó
minden Fi függvényre (22.13) fennáll, akkor W(K) ⊂ K. Ebből már következik (22.11) minden olyan B halmazra, amely
tartalmazza a K körlapot.
Nyitva maradt az a probléma, hogy vajon különböző B halmazból indítva, az IFS-modellnek nevezett eljárás ugyanazt
az invariáns halmazt eredményezi-e? Erre a következő olvasmány keretében válaszolunk.
22.5. Olvasmány a halmazok távolságáról
Két ábra távolságát különböző elvek alapján mérhetjük meg. A számítógépes gra kában is alkalmazott és legcélszerűbb
távolságfogalom arra a formulára épül, amely megadja egy x pont és egy B (nem üres kompakt) halmaz távolságát. Ez a
formula
vagyis d[x, B] annak a b pontnak az x-től mért távolsága, ami a B pontjai közül a legközelebb van x-hez (22.12a ábra).
Példa erre az az eljárás, amikor egy pontnak egyenesszakasztól vagy egy körlaptól mért távolságát megállapítjuk. Ha
megadjuk egy x pontnak és egy B egyenesnek a távolságát, akkor azt a b pontot határozzuk meg az egyenesen, amely a
legközelebb van az x-hez (22.12c ábra). Ha az ismert módon egy x pontnak és egy B zárt körlapnak a távolságát határozzuk
meg, akkor is ezt a b pontot határozzuk meg (22.12b ábra).
22.12. ábra
vagyis B + t azoknak a pontoknak a halmaza, amelyek legfeljebb t távolságra vannak B-től (22.13. ábra).
22.13. ábra
Figyeljük meg, hogy ha K egy r sugarú körlap, akkor a K + t′ halmaz egy r + t′ sugarú körlap, viszont ha N egy négyzet,
akkor a tőle legfeljebb t távolságban levő pontok hamaza nem négyzet.
A B és C nem üres kompakt halmazok (ábrák) h[B, C] (Hausdor ) távolsága az a legkisebb t (22.14. ábra), amelyre
(22.14)
22.14. ábra
A (22.14) formula informális jelentése, amit a 22.14. ábráról is leolvashatunk, hogy a B halmazt addig növeljük, amíg B +
t „éppen elnyeli” a C halmazt, majd ugyanezt tegyük a C halmazzal. A kapott t értékek közül a nagyobbik lesz a B és C
halmazok távolsága.
A Hausdor -távolságnak egy másik, ismertebb, de kevésbé szemléletes meghatározása is van, és ez a következő.
Legyen d[B, C] = max {d[x, C]; x ∈ B}. Vagyis, legyen x a B halmaznak az a pontja, amely a legtávolabb van C-től, és d[B, C]
ennek az x pontnak a C-től mért távolsága. Ekkor a d[B, C] és a d[C, B] értékek közül a nagyobbik lesz a h[B, C].
Ellenőrizzük ezt! Melyik egyszerűbb a két de níció közül?
Példák
1. A Sierpinski-háromszögre vezető sorozat elemei közötti távolság (22.15. ábra). A B négyzet és a W(B) közötti
távolság 0,5a, és ezután a sorozat két egymás után következő eleme közötti távolság egyre csökken, mégpedig
mindig az előzőnek a fele lesz. Így h[W[n] (B), W[n + 1](B)] ≤ 0,5n + 1 a.
Ebből az is következik, hogy bármilyen kis ϵ > 0-t is veszünk, A + ϵ, az ϵ-nal növelt A, tartalmazni fogja a W[n] (B)
halmazokat valamely n-től kezdve. (Miért?)
22.15. ábra
Most legyen ϵ az a méret, amelynél kisebb átmérőjű halmazt nem tudunk észrevenni. (Ennek oka lehet az, hogy a
szemünk felbontóképességének ez a határa, vagy a számítógép képernyőjén, ahol a halmazokat megjelenítjük,
nem lehet ennél közelebbi pontokat megkülönböztetni stb.) Ekkor, ha n olyan nagy, hogy 0,5na < ϵ, akkor az n + 1-
edik elemtől kezdve a
sorozat elemei nem különböztethetők meg egymástól, és így a Sierpinski-háromszögtől sem, amit ez az IFS
előállít.
Megjegyzés. A
(22.15)
halmazok az IFS A „végtermékének” egyre pontosabb közelítései. Az IFS-ábrákon a (22.15) mint egymást követő
pillanatfelvételek sorozata jelenik meg.
2. A Koch-görbére vezető sorozat elemei közötti távolság (22.3b ábra). Ekkor a B háromszög és a W(B) közötti
távolság (az ábrán közötti távolság) a sorozat két egymás után következő eleme közötti távolság
egyre csökken, mégpedig mindig az előzőnek a harmada lesz. Így
(22.16)
Ebből az is következik, hogy bármilyen kis ϵ > 0-t is veszünk, A + ϵ, az ϵ-nal növelt A, tartalmazni fogja a W[n](B)
halmazokat valamely n-től kezdve. (Miért?) Hasonlóan, mint a Sierpinski-háromszögnél, a (22.16)
egyenlőtlenségből megállapíthatjuk, hogy hányadik iteráció után lesz W[n](B) gyakorlatilag azonos a Koch-
görbével.
A h[B, C] értéket két okból tekinthetjük a B és C távolságának. Az egyik az, hogy megegyezik a vizuális tapasztalattal.
Ha a halmazok (ábrák) h távolsága kicsi, akkor alig tudjuk a halmazokat megkülönböztetni egymástól. A másik ok az, hogy
h kielégíti az ún. metrikus axiómákat, vagyis a következő alaptulajdonságokat:
I. h[B, C] ≥ 0 és h[B, C] = 0 pontosan akkor, ha B = C (vagyis B és C ugyanaz a halmaz);
II. h[B, C] = h[C, B];
III.bármely A, B, C mellett h[A, B] + h[B, C] ≥ h[A, C].
Ezek közül csupán a III., az ún. háromszög-egyenlőtlenség nem teljesen nyilvánvaló. Ennek bizonyítása a következő.
Legyen h[A, B] = tAB és h[B, C] = tBC. Ez azt jelenti, hogy tAB és tBC az a legkisebb érték, amelyre
Az a) és c) alapján A ⊆ C + tBC + tAB; a b) és d) alapján C ⊆ A + tAB + tBC, ami éppen azt jelenti, hogy h[A, C] ≤ tBC + tAB.
A halmazok távolságára vonatkozó legfontosabb tételek.
1. tétel. Ha {Cn; n = 1, 2,…} nem üres kompakt halmazok sorozata,
akkor
Megjegyzések
1. A nem üres. Ez következik a Cantor-axiómából: egymásba skatulyázott kompakt halmazok közös része nem üres
kompakt halmaz.
2. A h[A, Cn] → 0 állítás, köznapi szóhasználattal, azt jelenti, hogy CN tetszőlegesen közel kerül A-hoz, ha elég
messze megyünk a {Cn; n = 1, 2, …} sorozatban. (Ez nem ugyanaz, mint ha azt mondjuk: „egyre közelebb kerül az
A-hoz.”) Így a tétel állítása megegyezik („harmóniában van”) a vizuális tapasztalattal.
(22.17)
Ebből a tételből következik, hogy ha F kontraktív, akkor a (22.8) szerint hozzárendelt halmazfüggvény a Hausdor -
távolságban mérve is kontraktív.
A halmazfüggvényekkel történő számolásokkal kapcsolatban fontos a következő
3. tétel.
(22.18)
vagyis a Bi, illetve Ci halmazok uniója közötti távolság legfeljebb akkora, mint a h(Bi, Ci) távolságok közül a legnagyobb.
Az 1–3. tételek bizonyítása túlnő ennek a fraktálokról szóló fejezetnek a keretein.
(22.19)
Bizonyítás. Azt kell csak belátni, hogy bármilyen kompakt B esetén, az elég nagy K körlap választása mellett kapott A a
(22.19) határértéke.
Legyen B ≠ K. A (22.17) és (22.18) alapján
(22.20)
Ezért, r < 1 esetén, W[n] (B) és W[n] (K) tetszőlegesen közel kerül egymáshoz, ha n elég nagy, és így a {W[n] (B); n = 1, 2,…}
és a {W[n] (K); n = 1, 2, …} sorozatoknak ugyanaz a határértéke.
2. tétel. Ha A az {Fi; i = 1, 2, …, N} leképezésekkel (függvényekkel) meghatározott IFS invariáns halmaza, vagyis W[n] (B)
→ A, akkor
(22.21)
Bizonyítás. Ekkor
(22.22)
(22.23)
mivel W[n + 1] (B) = W ○ W[n] (B), és W folytonos (mivel kontraktív). A (22.22) és a (22.23) összehasonlításából következik
(22.21).
3. tétel. Minden IFS-hez pontosan egy invariáns halmaz tartozik.
Bizonyítás. Legyen a W kontraktív,
(22.24)
(22.25)
A (22.24) és (22.25) összefüggés összehasonlításából h[A, B] ≤ rh [A, B], ami csak h[A, B] = 0 esetben állhat fenn, és így A =
B.
A (22.19) összefüggés a háttere annak, hogy ha a
sorozat konvergens, és az A határérték független a B megválasztásától, akkor az A kompakt halmazt az IFS attraktorának
vagy invariáns halmazának nevezzük.
(22.26)
ami azt jelenti, hogy ha {Fi; i = 1, 2,…, N} hasonlósági leképezések, akkor az A halmaz az A arányosan kicsinyített
másolataiból van összerakva. Pontosabban,
az A halmaz az A-val hasonló halmazok uniója.
A (22.26) egyenlőséget kielégítő A halmazt önhasonlónak (self-similar) nevezzük.
Példák
1. A Sierpinski-háromszög három, a Sierpinski-háromszöggel hasonló halmaz uniója, amelyeknek a lineáris mérete
feleakkora, mint a Sierpinski-háromszög.
2. A 22.16. ábra önhasonló halmaza, amit csillárnak nevezünk, öt vele hasonló halmaz uniója, különböző
hasonlósági tényezőkkel: r1 = 0,6, ri = 0,2 (i = 2, 3, 4, 5).
22.16. ábra
része.
A vázolt gondolatmenetből több is következik, mint amit szemléletből megállapíthatunk. A Sierpinski-háromszögben
tetszőlegesen kis átmérőjű Sierpinski-háromszögek vannak, és ezek uniójaként is előáll a Sierpinski-háromszög. Ugyanez
mondható minden önhasonló halmazról, csupán az arányossági tényezők lesznek mások. Például, a Koch-görbénél az
átmérők a felezések helyett harmadakkorák lesznek, és mindig négy kisebb Koch-görbe adja a nagyobbikat. A csillárnál
felváltva 0,25 és 0,5 arányossági tényezőket alkalmazunk.
A Sierpinski-háromszög, a Koch-görbe és a csillár fent vázolt tulajdonságát határtalanul nagyíthatónak nevezzük.
Bebizonyítható, hogy minden önhasonló halmaz határtalanul nagyítható.
A 22.7. fejezetben megmutattuk, hogy ha {Fi; i = 1, 2, …, N} hasonlósági leképezések, akkor az IFS-modellel előállott
halmazok önhasonlók. Ennek a megfordítása is igaz: minden önhasonló halmazt IFS-modellel állíthatunk elő. (Ennek
bizonyítása: mivel {Fi; i = 1, 2, …, N} kontraktív leképezések, ezért van olyan kompakt halmaz, legyen ez C, amelyre W[n] (B)
→ C, és a C független B-től. Ám a 22.6. fejezetben mondottak alapján ekkor C a W invariáns halmaza, és minden W-nek
pontosan egy invariáns halmaza van. Ezért C = A.)
Vegyük észre, hogy a 22.7. és a 22.8. fejezetben mondottak minden IFS-modellre érvényesek, nemcsak azokra, ahol {Fi;
i = 1, 2, …, N} hasonlósági leképezések. Ha {Fi; i = 1, 2, …, N} (nem önhasonló) a n leképezések, akkor az A halmazt
öna nnak nevezzük.
Például a fa (22.17. ábra) és a páfrány (22.18. ábra) szemmel láthatóan is nem önhasonló. Ugyanis a 22.17. ábrán az F1 az
egységnégyzetet a (0,195, 0,344), –0,488, 0,443) vektorokkal adott paralelogrammába képezi le, és az Fi (i = 2, 3, 4, 5)
leképezések is nem négyzetbe, hanem egy általános paralelogrammába képezik le a négyzeteket.
Az öna n halmazok is határtalanul nagyíthatók, hiszen nagyításkor egyre több részlet bukkan fel a halmazban. Ezek a
részletek azonban nem hasonlók A-val, hanem olyan torzulásokon mennek át, mint amikor a négyzetből valamilyen
paralelogramma lesz. Ezért egy öna n halmaz sokkal változatosabb lehet, mint egy önhasonló halmaz.
22.17. ábra
22.18. ábra
Megjegyzések
1. Vannak források, amelyek minden IFS invariáns halmazát önhasonlónak nevezik, függetlenül attól, hogy {Fi; i =
1, 2, …, N} hasonlósági leképezések vagy sem, hiszen bármely kontraktív {Fi; i = 1, 2, …, N} mellett is többé-
kevésbé érvényesek a 22.6–22.8. fejezetben leírt tulajdonságok. Szokásosabb terminológia az A invariáns halmazt
önhasonló jellegűnek (quasi self-similar) nevezni, ha {Fi; i = 1, 2, …, N} nem hasonlósági leképezések.
2. Vannak önhasonló halmazok, amelyeknél nem látjuk a határtalan nagyíthatóság jelenségét. Ilyen például egy
négyzet vagy háromszöglap.
Önhasonló (öna n) halmazokkal a megtévesztésig közelíthetők körülöttünk látható halmazok, amint azt a faág, fa
vagy a csillár példája mutatja. Önhasonló (öna n) halmazok még sincsenek a valóságban, mivel tetszőlegesen kicsi
átmérőjű halmaz sem állítható elő. Ennek határt szab a képernyő vagy más megjelenítő eszköz felbontóképessége. Így
önhasonló halmazok csak tetszőleges pontossággal hozhatók létre (állíthatók elő). Viszont az IFS attraktorai (invariáns
halmazai) önhasonlónak látszanak. Mit jelent ez?
A Sierpinski-háromszög szürkével fedett része a 22.1. ábrán (lineárisan) felére kicsinyített mása a Sierpinski-
háromszögnek. A 22.3a ábrán, a Koch-görbék szürkével fedett részei a Koch-görbével hasonló halmazok. Ugyanez áll az
22.4c ábrán a faág szürkével fedett részeire is.
Alaposabban meg gyelve ezeket az ábrákat azonban észrevehetjük, hogy ez nem egészen így van. A Sierpinski-
háromszög szürke részében kevesebb háromszöget számolhatunk össze, mint magában a Sierpinski-háromszögben, és a
Koch-görbe meg a csillár bekeretezett részei sem az egész A halmaz pontos kicsinyített másai. A felbonthatóság korlátai
miatt a kicsinyített részen bizonyos részletek eltűntek.
Az elmondottak alapján önhasonló halmazok nem léteznek a valóságban, hanem az önhasonló halmaz csupán egy
matematikai modell, amely tetszőleges pontossággal megközelíthető. Mégis szemléltethetjük ezt a következő számítógépes
kísérlettel.
Menjünk el az önhasonló (vagy öna n) A-t előállító {W[n] (B); n = 1, 2, …} sorozatban éppen addig, hogy az egymás után
következő ábrák már ne legyenek megkülönböztethetők egymástól. Ezután nagyítsuk az ábrát úgy, hogy közben az
iterációt is folytatjuk. Ha e két művelet szinkronban van, akkor a felnagyított ábrákat egyformán részletdúsnak látjuk,
ellentétben egy papírfénykép nagyításával, ahol a nagyítás során a részletek elveszni látszanak. A kísérlet során azt fogjuk
látni, hogy a nagyításkor az ábra újabb és újabb részletei bukkannak fel. Vagyis mégis látni fogjuk a 22.6–8. fejezetben leírt
tulajdonságokat.
22.9. A fraktáldimenziók
A különböző fraktáldimenziók közül elsősorban a boxdimenziót tárgyaljuk. Ez elemi eszközökkel számítható és a
leggyakrabban alkalmazott fraktáldimenzió. Olyan halmazokon fogjuk bemutatni a boxdimenzió tulajdonságait és
kiszámítását, amelyek szerkezetét tetszőleges nomságú négyzethálók határozzák meg úgy, hogy belőlük, különböző
rekurzív szabállyal, négyzetek sorozatát töröljük. Amint látni fogjuk, ezek a halmazok eléggé változatosak ahhoz, hogy a
boxdimenzió minden problémája bemutatható rajtuk, viszont eléggé szabályosak, hogy bemutatásukhoz a matematikai
analízis és mértékelmélet elkerülhető.
A négyzethálók szerkesztését a 22.19. ábra mutatja be. Az egységnégyzetet a 0, 1, 2, 3 jelekkel látjuk el úgy, ahogy azt a
22.19a ábrán látjuk, majd a következő rekurzív szabállyal folytatjuk. Ha En a sorozat n-edik eleme, akkor az En minden
négyzetét lineárisan felezzük, majd az így kapott négy négyzethez jelsorozatot rendelünk úgy, hogy a felosztás előtti
négyzet C jeléhez, a 22.19c ábra szerint, hozzáfűzzük a 0, 1, 2, 3 jel egyikét. A négyzetekhez rendelt jelsorozatokat kódoknak
fogjuk nevezni.
22.19. ábra
Az eljárás heurisztikus, vizuális háttere. Az eljárással a 0, 1, 2, 3 jelekből alkotott szavak (véges jelsorozatok)
mindegyikét el tudjuk helyezni az egységnégyzeten. A szavak egyre hosszabbak lesznek, a négyzetháló egyre sűrűbb lesz az
eljárás folyamán, és gyorsan eljutunk a megjelenítő eszköz (papír, képernyő stb.) felbonthatóságának a határáig. A
négyzetrács azonban határtalanul nagyítható. Nagyításkor egyre több részlet bukkan fel, és megjelennek az egyre hosszabb
szavakkal kódolható négyzetek. Például a 00122311 kód egy
oldalú négyzet kódja. Egy normál rajzlap méretű négyzeten, sőt az 1280 × 1024 pixelméretű képernyőn csupán néhány
milliméter ennek a négyzetnek az átmérője. A négyzethálót nagyítva nemcsak elhelyezhető a 00122311 kódhoz tartozó
négyzet, hanem újabb, az ennél hosszabb kódokhoz tartozó négyzetek is felbukkannak.
Miután a 0, 1, 2, 3 jelekkel felírható szavakat a leírt módon elhelyeztük az egységnégyzeten, hozzáfoghatunk
törtdimenziós halmazok előállításához. Megadunk egy szót (véges jelsorozatot), amelyet tiltott szónak fogunk nevezni,
majd törlünk minden olyan négyzetet, amelynek kódja tartalmazza a tiltott szót.
1. Első példaként töröljük mindazokat a négyzeteket, amelyek kódjában a 3 szerepel. Ez például a 22.20. ábrán
szemléltetett rekurzív eljárással végezhető el. A rekurzív szabály ekkor az lesz, hogy minden lépés után, a lineáris felezéssel
kapott négy négyzet közül pontosan egyet (a lineáris felezés után kapott jobb felső négyzetet) töröljük. Ugyanis, a rekurzív
lépéssel kapott négy négyzet közül pontosan ennek a kódja tartalmaz 3 jelet.
22.20. ábra
A 3 jelet tartalmazó összes négyzet törlésével kapott részhalmaz, a Sierpinski-háromszög területe csak 0 lehet. Ugyanis
a rekurzív szabállyal kapott négy új négyzet közül pontosan egy olyan van, amelynek kódja tartalmazza a 3 jelet. Ezért
minden lépésben, a 3 jelet tartalmazó négyzetek törlése után megmaradó halmaz területe az előző háromnegyede lesz.
A szerkesztés során kapott sokszögek kerülete egyre növekszik, mindegyik közelítés kerülete az előzőnek legalább
másfélszerese (22.20. ábra). Ezért minden M pozitív számhoz van n, hogy az n-edik rekurzív lépés után kapott sokszögek
összkerülete nagyobb, mint M. A Sierpinski-háromszög méretére vonatkozó megállapításainkat röviden így fejezzük ki
(22.27)
2. Most töröljük az összes olyan négyzetet, amelyek kódjában egy megadott kétjegyű szám szerepel. Legyen ez például
20. A 22.21. ábrán láthatjuk ezt a rekurzív folyamatot. A szürke halmazok azoknak a négyzeteknek az uniója, amelyek kódja
tartalmazza a 20 jelet. Ellentétben a Sierpinski-háromszög esetével, itt már nem annyira nyilvánvaló, hogy a négyzetek
törlése után mennyi lesz a megmaradó halmaz területe.
22.21. ábra
Hogyan oldottunk meg hasonló problémát az előző példa, a Sierpinski-háromszög esetében? Az előző példában az
egyre hosszabb szavak törlése után megmaradó halmazok területei geometriai sorozatot alkotnak, ahogyan azt a 22.2. ábra
is mutatja, a megfelelő halmazok kerületei viszont nem. Ezt a problémát úgy oldottuk meg, hogy kerületek helyett a
kerületek olyan részeit emeltük ki, amelyek mérőszámai geometriai sorozatot alkotnak (22.20b ábra). Ezek voltak a
vastagított részek.
Próbáljunk itt is hasonló utat követni. Nem az összes olyan négyzetet töröljük, amelynek a kódja tartalmazza a 20 szót,
hanem azoknak csupán egy olyan részhalmazát, amelyek törlése után megmaradó halmazok területei geometriai sorozatot
alkotnak.
A rekurzív szabály páros számú alkalmazásával minden előző négyzet helyére 16 új négyzet kerül, amelyek közül
pontosan egy olyan van, amelynek kódja 20-ra végződik. Így a 20-ra végződő kódokhoz tartozó négyzetek törlésével,
minden páros számú lépés után, a megmaradó halmaz területe az előző halmaz területének tizenöt tizenhatod része lesz
(22.22. ábra). Így a megmaradó halmazok területei egy hányadosú geometriai sorozatot alkotnak. Ebből következik,
pontosan úgy, ahogy a Sierpinski-háromszögnél, hogy az eljárás végén megmaradó halmaz területe, azaz annak a
halmaznak a területe, ami azután marad az egységnégyzetből, miután mindazokat a négyzeteket töröltük, amelyeknek a
kódja páros hosszúságú és 20-ra végződik, csak 0 lehet.
22.22. ábra
A kerület hosszának vizsgálatánál is ugyanígy járhatunk el. A szerkesztés során kapott sokszögek kerületének
vastagított részei tizenöt negyedszeresen növekednek (22.22. ábra). Így akármilyen nagy pozitív számot mondunk, elég sok
rekurzív lépés után, a kapott sokszögek összkerülete ennél is nagyobbá válik. Ezért a „a terület 0, a kerület ∞” tulajdonság
itt is érvényes. Ez a tulajdonság akkor is érvényes, amikor azt a halmazt tekintjük, amely akkor marad meg az
egységnégyzetből, ha az összes 20 jelet tartalmazó négyzetet töröljük. Hiszen több négyzet törlésével a kapott halmaz
területe csökken, és kerülete pedig növekszik.
A (22.27) heurisztikus, vizuális háttere. A 20 kód (szó) törlésével kapott halmaz is határtalanul nagyítható. Ha a
halmazból kezdetben csupán a legfeljebb hat hosszú szóval kódolt négyzetek láthatók, akkor nagyításkor előbukkannak az
egyre hosszabb kódokhoz tartozó négyzetek is, mellettük a törölt négyzetek helyén támadt lyukakkal. Egyre több ilyen lyuk
bukkan elő, rohamosan csökkenő átmérőkkel. Ebből a képből alakulhat ki az a sejtés, amit a fentiekkel igazoltunk, hogy a
terület csakis nulla lehet, dacára a halmaz látszólag nagy kiterjedésének.
3. A 22.23. ábrán az egységnégyzet különböző részhalmazait látjuk, amelyek úgy keletkeztek, hogy töröltük
mindazokat a négyzeteket, amelyek kódja azokat az egy vagy több kétjegyű számokat tartalmazza, amelyek a halmaz képe
alatt láthatók.
(A link honlapomon található „Fractalshift” szoftverrel tömegesen gyárthatók ilyen mintázatok.)
Megjegyzés. A „Fractalshift” kódolása különbözik a 22.19. ábra kódolásától. A 22.20a ábrán 0123 helyett 2031 áll.
Ezután a rekurzív szabály ezekkel a jelekkel folytatódik.
22.23. ábra
Feladatok
1. Igaz-e, hogy a 22.23. ábra (világos) halmazainak a területe is csak nulla lehet?
2. Töröljük mindazokat a négyzeteket a négyzethálókból, amelyek kódjában 33 áll. Mennyi lehet ekkor a kódolt
négyzethálók közös részének a területe?
3. Töröljük mindazokat a négyzeteket a négyzethálókból, amelyek kódjában 3333333 áll (hét darab 3 jel követi
egymást). Mennyi lehet ekkor a kódolt négyzethálók közös részének a területe?
4. Van-e olyan szó, amelynek az a tulajdonsága, hogy törölve minden olyan négyzetet, amelynek kódja ezt a szót
tartalmazza, pozitív területű halmaz marad az egységnégyzetből? Ha igen, akkor adjunk meg ilyen szavakat.
Megmutattuk, hogy a tiltott kódokhoz tartozó négyzetek törlésével nulla területű halmazokat kapunk, pedig ezek a
halmazok nagyon különböző kiterjedésűek, különböző méretűnek látszanak (22.23. ábra). Hogyan lehet méret szerint
megkülönböztetni az ilyen halmazokat?
a szóban forgó halmazok területének a közelítő értéke. Ez az érték annál pontosabb, minél kisebb az r. Esetünkben ez a
képlet csődöt mondott, hiszen a legváltozatosabb kiterjedésű halmazokra ugyanazt az értéket, a nullát adja. Mégis, az
intuíciónk azt sugallhatja, hogy további meggondolásainkat erre az értékpárra építsük, hiszen az r élű négyzeteknek az Nr
száma, különböző r értékek mellett szoros kapcsolatban van a szóban forgó halmazok kiterjedésével. Néhány tipikus esetre
megvizsgáljuk az r és az Nr kapcsolatát (22.24. ábra).
Az egyenesszakasz esetén (az egyenesszakasz úgy is szerkeszthető, hogy a 3,0 jelek valamelyikét tartalmazó
négyzeteket töröljük a négyzethálók sorozatában)
ha ,
amely a következő rekurzív formula megoldása
22.24. ábra
Így, a felezésekkel kapott egyre sűrűbb négyzethálóból megmaradó négyzetlapok száma 2, 4, 8, 16, …
A Sierpinski-háromszögnél, amikor a 3 jelet tartalmazó összes négyzetet töröltük, a rekurzív szerkesztésből
következik:
ha
ahol
Ekkor az Nr-hez tartozó rekurzív formula
Így a felezésekkel kapott egyre sűrűbb négyzethálóból megmaradó négyzetlapok száma 3, 9, 27, 81, …
A 20 kódot tartalmazó összes r élű négyzet törlése után megmaradó r élű négyzetek számának a meghatározása az
előzőknél kicsit több megfontolást igényel. Legyen
Ugyanis feleakkora élű négyzetekben mérve, az eddig törölt négyzetek száma négyszeres lesz, amihez hozzájönnek
azok a négyzetek, amelyek éle r = 2–n, kódja 20-ra végződik, és egyetlen 20 jelet tartalmaznak. Ez utóbbiak száma pontosan
. Könnyen ellenőrizhető, hogy az eddig törölt négyzetek és azok a négyzetek, amelyek éle r = 2–n, kódja 20-ra
végződik, és egyetlen 20 jelet tartalmaznak, diszjunkt halmazok, és uniójuk minden olyan négyzetet tartalmaz, amelyek
kódjában a 20 jel szerepel.
A mondottak alapján a 20 jelet tartalmazó összes r élű négyzet törlése után megmaradó r élű négyzetek számára a
következő rekurzív formulát kapjuk
(22.28)
Megjegyzés. A (22.28) formulában azért indulunk az kezdő feltételből (az helyett), mert a 20 n = 2-nél
bukkan fel először.
Az Nr értékek sorozata azt mutatja, hogy dacára annak, hogy minden bemutatott halmaz területe csak nulla lehet, az r
élű négyzetek száma különbözik egymástól a bemutatott halmazoknál. Az Nr értékek sorozata gyorsabban növekszik
akkor, amikor nagyobbnak látjuk az egyformán nulla területű halmazt. Pontosabban, a halmaz területét egyre jobban
közelítő Nrr2 értékek a nullához közelednek mindhárom halmazban, ezért mindhárom halmaz területe csak nulla lehet.
Adott r értékre viszont a területük közelítő értéke egymástól különböző, nagyobb akkor, ha a halmaz nagyobbnak látszik.
Feladatok
1. Adjunk meg rekurzív formulát a 33 tiltott szóhoz tartozó {Nr; r = 2–n, n = 1, 2, …} sorozatra!
2. Adjuk meg azokat a σ tiltott szavakat, amelyekhez tartozó halmazok {Nr; r = 2–n, n = 1, 2, …} sorozata megegyezik a
20 tiltott szóhoz tartozó sorozattal, vagyis (22.28)-cal!
3. Töröljünk a négyzethálókból minden olyan négyzetet, amelynek kódja tartalmazza a 3333333 szót (ahol hét darab
3 jel követi egymást)! Adjunk meg rekurzív formulát az {Nr; r = 2–n, n = 1, 2, …} sorozatra!
22.11. A boxdimenzió
A tárgyalt halmazok méretét jellemző {Nr; r = 2–n, n = 1, 2, …} sorozat elemei, az egyenesszakasz, a Sierpinski-háromszög és
a négyzetlap esetén, a rekurzív formula mellett, egyetlen hatványfüggvénnyel is jellemezhetők. Azt kaptuk, hogy
Sajnos, ezek egyike sem jó megoldás, hiszen ezekkel felírva a rekurzív sorozat első két elemét, azok
lesznek.
Észrevétel. Bármely α, β számpárra
is megoldása (22.28)-nak.
Ezt az észrevételt alkalmazva, keressük azt az α, β számpárt, amelyre
(22.29)
és a (22.29) egyenletrendszernek pontosan egy α, β megoldása van. Továbbá, nagy n-re a 0,268n tag elenyészik. Például n ≥ 16
esetén 0,268n < 10–9.
Arra az eredményre jutottunk, hogy az {Nr; r = 2–n, n = 1, 2, …} sorozat, a 20 tiltott szóhoz tartozó halmaz esetén, nagy n
értékekre (vagyis elég sűrű négyzetrács esetére) egyetlen hatványfüggvénnyel jellemezhető:
jó közelítéssel. (32 × 32 hálózat esetén az eltérés kisebb, mint egy ezred, 128 × 128 hálózat esetén az eltérés kisebb, mint
tízezred, egységnek véve a négyzet oldalát.)
Mindhárom példánkban az {Nr; r = 2–n,, n = 1, 2, …} növekedése egyetlen nem negatív számmal, az s boxdimenzióval
jellemezhető.
Azt a tulajdonságot, hogy
ha r elég kicsi, hatványszabálynak és az s értéket a halmaz boxdimenziójának nevezzük.
Feladat. Adjuk meg az egységnégyzetnek a 33 tiltott szóhoz és adjuk meg a 3333333 tiltott szóhoz tartozó
részhalmazainak a boxdimemzióját!
(22.30)
feltevésre építve.
Éppúgy, mint a négyzethálós halmazoknál, amelyeket a 22.9–12. fejezetekben tárgyaltunk, a halmaz méretét az s kitevő
jellemzi. Ezt kétféle módon határozhatjuk meg.
1. gra kus eljárás. Egy törtkitevőjű hatványfüggvény gra konja és vizsgálata és így az s meghatározása bonyolultnak
látszik. A probléma megoldása arra az ötletre épül, hogy ha Nr ≈ αrs, akkor
(22.31)
Vagyis a
(22.32)
22.25. ábra
Az elmondottak alapján az s boxdimenzió a (22.32) pontok által adott egyenes iránytangense (meredeksége).
Megjegyzés. Amint azt a 22.10–11. fejezetben láttuk, a (22.32) pontok sokszor csak közelítőleg és kis r értékekre
illeszkednek az s meredekségű egyenesre. Ezért kell több pont az egyenes meghatározásához és a (22.32) pontokhoz
tartozó regressziós egyenest vesszük, vagyis azt az egyenest, amelytől a (22.32) pontok négyzetes eltérése minimális
(22.25. ábra).
amiből
(22.33)
A boxdimenzió de níciója. Fedjük le a B halmazt legfeljebb r átmérőjű halmazokkal. Ez azt jelenti, hogy vegyünk
olyan Hk (k = 1, 2, …, N) halmazokat, amelyek átmérője legfeljebb r, és
Minden r-hez nyilván van olyan lefedése B-nek, amely a legkevesebb halmazból áll. Ezt minimális r-lefedésnek
nevezzük.
Legyen halmaz minimális r-lefedése. Ekkor a B halmaz boxdimenziója (capacity dimension, box-counting
dimension)
(22.34)
(22.35)
22.26. ábra
(22.36)
értéket tekinthetjük. Ezt a mérési sokszög hosszának nevezik. Nagyon zegzugos partvonalak esetén, mint amilyen például
Norvégia vagy Izland partvonala, vagy egy zegzugos folyó, a mérési sokszög hosszával nem kapható meg a partvonal hossza
megfelelő pontossággal. Ennek oka egyrészt az, hogy a méréseknél felvehető ugyanazon d távolságban, de különböző
helyeken kijelölve ezeket a mérési pontokat az (1) értékek lényegesen eltérnek egymástól, ha a partvonal nagyon zegzugos,
másrészt, ekkor a d csökkentésével a mérési sokszög hossza lényegesen
22.27. ábra
megváltozik. Így a mérési sokszög hossza nem ad kellő tájékoztatást a partvonal hosszáról (22.27. ábra). Ebben az esetben,
ha a mérési sokszög hossza mellett a görbe egy fraktáldimenzióját is feltüntetjük, akkor felvilágosítást adunk a mérés
pontosságáról is.
A görbének ez a fraktáldimenziója, amit kompasz- (tájoló) dimenziónak nevezünk, hasonlóan épül fel az L(d), d párra,
mint ahogyan a boxdimenzió az Nr, r párra. Itt az az észrevétel, hogy a (log M(d), log d) pontok (közelítőleg) egy egyenesen
vannak. Az egyenes meredeksége a görbe dimenziója.
A dimenzió megállapításának a legegyszerűbb módja, hogy különböző d1 és d2 mellett meghatározzuk a hozzájuk
tartozó mérési sokszögek L(d1) és L(d2) hosszát. Összevetjük a sokszögek éleinek a csökkenését a hozzájuk tartozó ívhossz
növekedésével. Pontosabban a
(22.37)
ami a (–log d, log M(d)) pontokkal meghatározott egyenes h iránytangense, vagyis a görbe dimenziója.
Megjegyzés. A (23.37) a mérési sokszögek hosszának a relatív növekedését adja, ami gazdagabb információ, mintha
csupán az L(d1) és L(d2) hányadosát adjuk meg, hiszen tekintetbe veszi azt is, hogy a d milyen változásához tartozik a
növekedés. A logaritmus bevetését a hatványszabály indokolja.
Térképek készítésénél a következő szerepe lehet a kompaszdimenziónak. Ha egy kisebb léptékű térkép alapján egy
nagyobb léptékűt készítünk, akkor a térkép vonalai „megrövidülnek”. Rövid, éles kanyarok a folyókon vagy egy partvonal
kisméretű öblei eltűnhetnek a nagyobb léptékű térképen. A vonalhossz megváltozásának a mértékét ekkor a
kompaszdimenzió adja, és a térképszerkesztés jóságának egyik paramétere, hogy a szerkesztés során mennyire változik
meg a görbék dimenziója.
23. Kombinatorika
A kombinatorika a matematika viszonylag atal és gyorsan fejlődő területeihez tartozik, akárcsak a gráfelmélet, illetve a
kódelmélet, valamint a valószínűség-számítás és a statisztika is. Gyökerei azért régre nyúlnak vissza, csak szisztematikus
tárgyalása és felhasználása legújabb kori. Szokás az úgynevezett véges matematikához sorolni, mivel nem végtelen
halmazokkal foglalkozik, mint az analízis, a geometria és legtöbbször az algebra. Azonban szinte minden matematikai
területen felbukkan, mint például a kombinatorikus geometria, számelmélet, topológia vagy például a kombinatorikus
halmazelmélet. Általánosan megfogalmazva: a kombinatorika véges halmazok bizonyos tulajdonságú elrendezései
számosságának a meghatározásával foglalkozik. A következő alfejezetben a legegyszerűbb, középiskolában megismert
esetekkel foglalkozunk, s később fogunk egyes összetettebb eseteket tárgyalni, természetesen csak a legalapvetőbbeket,
illetve néhány más területen történő alkalmazást.
Példa. Az angol betűkészlet első három betűjéből (a, b, c) hány hárombetűs különböző betűsorozat képezhető. Ilyen
kis elemszámú esetben a megoldást a lehetőségek szisztematikus felsorolásával is elvégezhetjük. Az első helyen lehet
az a, a b, illetve a c betű bármelyike. Rögzítsük le az a-t. Ekkor a második helyre kerülhet a b vagy a c. Azaz két
lehetőségünk van a-val kezdeni: abc, illetve acb. Mivel ez hasonló a b-vel, illetve a c-vel kezdés esetén, ezért összesen
3 · 2 = 6 lehetőségünk van. Felsorolva: abc, acb, bac, bca, cab, cba. Látható, hogy ezek mindegyike más sorozat, és
sehogy másképpen nem lehet a három betűt egymás után felsorolni. Így tehát az esetek száma: 6.
Válasszunk nagyobb elemszámú példát, ahol az összes eset felsorolása már igen sok időt igényelne. Az egyjegyű pozitív
egész számokat hányféleképpen lehet felsorolni? Kilenc elemünk van, az 1, 2, 3,…, 9 számok. Ezeket kellene sorba rendezni.
Az előző példa ad egy rekurzív gondolatot. Az első helyre 9-féleképpen lehet elhelyezni számot. Ha ebből egyet
kiválasztunk, akkor a maradék 8 helyre 8 elemet kell sorba rakni, azaz a kilenc elem sorba rendezéseinek számát
megkaphatjuk, ha 9-cel szorozzuk 8 elem sorba rendezéseinek a számát. Ez azonban tovább vihető lefelé, a nyolc elemből 8-
féleképpen lehet az elsőt kiválasztani, s a maradék hét elem sorba rendezéseinek száma marad hátra. Ezt a gondolatot
folytatva végül: 9 · 8 · 7 · … · 2 · 1 lehetőség adódik. Mivel az ilyen számok gyakran előfordulnak a kombinatorikában, egy
szimbólumot vezettek be rá.
Az első n szám szorzatát n!-lel jelöljük, olvasva n faktoriális. Felsoroljuk az első néhány faktoriális értéket: 1 ! = 1, 2 ! = 2,
3 ! = 6, 4 ! = 24, 5 ! = 120, …, 9 ! = 362 880, …
Láthatóan nagyon gyorsan növekszik, majd a későbbiekben látunk egy csak n-től függő becslést n ! konkrét numerikus
értékére. A valószínűség-számításban is fontos szerepet kap majd ez a formula. Az eddigieket összefoglalva bevezetünk egy
új fogalmat.
Egy n elemű halmaz elemeinek egy lehetséges sorrendben való felsorolását permutációnak nevezzük.
Az ilyen permutációk számát jelöli Pn (ahol n az elemszámra utal), és a következő tételt mondhatjuk ki:
A bizonyítást teljes indukcióval végezzük, n = 1-re nyilván igaz a felírt formula. Tegyük fel, hogy n = k esetén igaz,
akkor belátjuk, hogy n = k + 1 esetén is igaz. Ez utóbbi azonban könnyen adódik, hiszen egy k + 1 elemű halmaz esetén az első
helyre k + 1-féleképpen választhatunk ki egy elemet, s a maradék k helyre a maradék k elemet a feltétel szerint k !-
féleképpen rakhatjuk le. Mivel minden kezdőelemhez k !-féle folytatás van, ezért összesen (k + 1) · k ! = (k + 1) !-féle sorba
rendezés lehetséges. Éppen ezt akartuk belátni. Lehet a tétel konkrét esetben történő illusztrációjára egy fát (lásd a 24.2.
fejezetben) is rajzolni, amelynek a „tetejétől az utolsó soráig” minden egyes útnak egy permutáció felel meg, s láthatóan az
utak száma 4 ! = 24 (23.1. ábra). A végén levő „leveleket” kell leszámolni. Látszik, hogy minden szinten eggyel kevesebb
elágazás van, így adódik a faktoriális.
23.1. ábra
A másik alapfeladat a kiválasztás. Adott elemszámú halmazból hányféleképpen lehet egy másik adott elemszámú
részhalmazt kiválasztani? Nézzünk erre is először egy egyszerű példát!
Példa. Négy különböző betűből hányféleképpen lehet két betűt kiválasztani? Mint a permutációk esetén, itt is
először készítsünk egy minden esetet éppen egyszer tartalmazó felsorolást. Legyen a négy betű most is az angol
betűkészlet első négy betűje: a, b, c, d! Ebből kettőt kell kiválasztani. Nézzük aszerint, hogy az a betű szerepel-e. Ha
igen, akkor a másik háromból kell egyet kiválasztani, amit nyilván háromféleképpen lehet: b, c vagy d. Ha nem
szerepel a, akkor a maradék háromból kettőt kell kiválasztani, de az ugyanaz, mintha egyet kihagyunk, tehát
háromféleképpen, azaz ez ismét három eset, tehát összesen hatféleképpen. A teljes felsorolás a fenti logikával: {a, b};
{a, c}; {a, d}; {b, c}; {b, d}; {c, d}.
Kombinációnak nevezzük, amikor egy adott elemszámú halmazból adott elemszámú részhalmazokat kell az összes
lehetséges módon kiválasztani. A két paraméter a halmaz elemszáma, illetve a részhalmaz elemszáma. Jelölése:
elem k-ad osztályú kombinációinak száma. Ezt szokás az – kiolvasva n alatt a k – is jelölni.
Mivel éppen ezek a számok alkotják a binomiális tétel megfelelő együtthatóit, szokásos a binomiális együttható
elnevezés is. Mielőtt elkezdenénk a binomiális együtthatók kiszámításával foglalkozni, néhány elemi és fontos
összefüggést írunk fel velük kapcsolatban. A bizonyítások teljesen egyszerűek, egy-két esetben megemlítjük legalább az
alapgondolatot, a többiben az olvasóra bízzuk.
(23.1)
hiszen egy halmazból 0 elemű részhalmazt csak egyféleképpen lehet kiválasztani, s ez az üres halmaz, míg n elemű
részhalmaz is egy van, maga a halmaz. Hasonló okból még egy, értelmesen csak egyféleképpen de niálható eset, az üres
halmazból egyetlen 0 elemű részhalmazt, az üres halmazt lehet kiválasztani. Formálisan
(23.2)
(23.3)
Könnyen látható, hogy ha egy (n + 1) elemű halmazból (k + 1) elemű részhalmazokat kell kiválasztani, akkor ezek
számát egy ügyes ötlettel úgy is leszámolhatjuk, hogy kijelölünk egy elemet az (n + 1)-ből, s azt nézzük, hogy a (k + 1) elemű
részhalmaz tartalmazza-e ezt az elemet. Két lehetőség van. Ha tartalmazza, ebből annyi eset van, ahányféleképpen a
maradék n elemű halmazból k elemű részhalmazokat lehet kiválasztani, hiszen az (n + 1)-edik elem lesz a (k + 1)-edik eleme
a részhalmaznak. Ha nem tartalmazza, akkor a maradék n elemből kell mind a (k + 1) elemet kiválasztani. Ezzel be is láttuk
a rekurzív összefüggést. A gondolat elég általános, és sokszor előfordul a matematikában, különösen a kombinatorikában,
ezért a következőkben megfogalmazzuk. Ha ugyanazt a leszámolást két különböző módon végezzük el, akkor az eredmény
ugyanaz kell hogy legyen. Így mindig azonosságokat kapunk, amiknek a fenti egy egyszerű példája.
(23.4)
Belátása evidens a kiválasztás és a bennmaradás szimmetriája miatt. Ahányféleképpen kiválasztok egy k elemű
részhalmazt, éppen annyiféleképpen hagyok meg egy (n – k) elemű részhalmazt. További összefüggések:
(23.5)
Bizonyítása a fent emlegetett kétféle leszámolási elvvel egyszerűen végiggondolható. A bal oldalon egy (n + k) elemű
halmazból kiválasztható összes l elemű részhalmazok száma áll. Ugyanez van másképp leszámolva a bal oldalon, azzal a
gondolattal, hogy képzeletben szétválasztjuk egy n és egy k elemű részre az eredeti halmazt. Az eredetileg l elemű
részhalmazokat aszerint számoljuk le, hogy hány elemet tartalmaz az n, és hányat a k elemű részből. Ez a gondolat csak
akkor használható, ha teljesül az l ≤ min {n, k} feltétel. Ebből adódik két további összefüggés még, ami jól használható: az
első, ha k = l < n
(23.6a)
(23.6b)
Ez már nem egy egyszerű kezdő feladat. Az első egyenlőség (23.5) miatt, a második egyenlőség (23.4) miatt érvényes.
Példák. Egy 8 elemű halmaznak hány 3 elemű részhalmaza van? A fentiek szerint 56. Két egyaránt 20 fős
osztályból kell egyetlen 20 fős csoportot kialakítani. Hányféleképpen lehet ezt megtenni? A (23.4) összefüggés adja
Newtontól származik az ún. binomiális tétel, amely két tag magasabb hatványainak kifejtését adja meg:
A bizonyítást lehet teljes indukcióval végezni, használva a binomiális együtthatókra vonatkozó rekurziót. Nyilván n = 1
esetén igaz. Tegyük fel, hogy n = m-re is igaz, azaz . Ekkor igazolnunk kell, hogy öröklődik
(m + 1)-re is.
Szorozzuk be a jobb oldalt (x + y)-nal. Ekkor egy xkym + 1–k tag együtthatója (mivel vagy xkym–k-t szoroztuk y-nal, vagy
xk–1ym + 1–k-t x-szel, ezért a két tag együtthatóját össze kell adni), lesz az együttható, ez azonban (23.3)
Példa. (x + y)2 = x2 + 2xy + y2, illetve (x + y)3 = x3 + 3x2y + 3xy2 +y3. Ezekre szemléletes bizonyítás is van
téglalapterületek, illetve téglatest-térfogatok felhasználásával.
(23.8)
(23.9)
Az eddigi példánkat vegyük újra, az angol ábécé első négy betűjéből kétbetűs „szavakat” készítsünk. Ekkor nyilván a
sorrend is számít, tehát {a, b} esetéből kettő is lesz: ab, illetve ba. Így 12 lesz az összes eset: ab, ba, ac, ca, ad, da, bc, cb,
bd, db, cd, dc.
Hogyan lehet ezt kiszámolni? Az első helyre 4 betű kerülhet, a másodikra viszont 3. Bármelyikhez a négyből három,
azaz 4 · 3=12 eset lesz.
Variációról beszélünk, ha egy n elemű halmazból k elemet úgy választunk ki, hogy a kiválasztott elemek sorrendje is
lényeges. Ezután n elem k-ad osztályú variációja ezeknek a lehetőségeknek a számát jelenti, amit szokás
jelölni.
(23.10)
(23.11)
hiszen a kiválasztott k elem sorrendjeinek száma k!, ennyiszer számolunk egy esetet a variáció esetén. Ebből adódik a
binomiális együtthatók kiszámítására egy csak n-et és k-t tartalmazó formula:
(23.12)
(23.13)
igazolása azonnal adódik a fenti formulából. Indukcióval könnyen belátható az is, hogy
(23.14)
természetesen i ≤ k ≤ n mellett.
Ezek alkalmazása vezet a 26. fejezetben a binomiális eloszlás várható értéke és szórása kiszámításánál is hasznos
következő összefüggésekhez.
(23.15)
(23.16)
Igazolásuk a következőképpen történhet, most nézzük csak az elsőt, a másikat az olvasó elvégezheti hasonlóképpen
maga is.
(23.17)
(23.18)
Ez az összefüggés kétféle leszámlálással adódik. Ha (n + 1) elemből (k + 1)-et kell kiválasztani (ez áll a jobb oldalon),
akkor ezt a kiválasztott maximális elem szerint rendszerezhetjük. A maximum lehetséges értéke k + 1 (ennél kevesebb nem
lehet), ez csak 1-féleképpen lehet, mert a többi k elemet k-ból kell választani, azaz mindet ki kell venni. Ha a maximum k +
2, akkor a maradék k elemet k + 1-ből kell választani, azaz -féleképpen lehet, s így tovább, ha a maximum n + 1
(ennél nagyobb nem lehet), akkor a többi k elemet -féleképpen lehet kiválasztani. S éppen ez az összeg a bal oldal.
(23.19)
(23.20)
igazolása:
Polinomiális-tétel:
Igazolása a tagok száma szerinti teljes indukcióval megy, két tagra igaz. Ha s tagra igaz, akkor s + 1-re kell belátni az
indukciós szabály szerint. Ez viszont viszszavezethető két tagra:
S itt írhatunk n – l = ks + 1-et. Feltételeztük, hogy s tagra, minden n vagy annál kisebb hatványra fennáll a polinomiális-
tétel. Azaz tulajdonképpen kettős indukció s-re és n-re.
(23.22)
és ebből
(23.23)
(23.24)
Ez utóbbi összefüggés a közvélemény-kutatás során merül fel. Tudjuk, hogy egy n elemű mintában k valamire igent
mondó személy van. Tegyük fel, hogy a teljes populációban (sokaságban, lásd 27.1 fejezetet) az N személy közül J igent
mondó van. Az összeg a Bayes-tételhez kell (26.3. fejezet), hogy milyen súllyal szerepelnek az egyes J értékek az összes
lehetséges esetből, amelyek számát a fenti összeg adja meg. Bizonyítása több úton is elképzelhető. Lásd a 27.9. fejezetet is.
Egy külön esete ennek a három eddig tárgyalt feladatnak, amikor ismétlődés is fellép. Ilyenkor ismétléses
permutációról, ismétléses variációról és ismétléses kombinációról beszélünk. A következőkben ezeket tárgyaljuk.
Ismétléses permutációról beszélünk, ha van n elemünk, de csak r különböző fajta, s az egyes fajtákból rendre k1, k2, …,
kr darab. Ezek lehetséges sorrendjeinek száma a kérdés.
Azaz például van három a, két b és két c betűnk, tehát összesen 7 betű. Hány különböző sorrendben lehet ezeket
felsorolni? Erre a kérdésre válaszol az ismétléses permutációk száma:
(23.25)
Példa. Az említett esetben, ahol három a, két b és két c betűnk van, ott a lehetséges hétbetűs szavak száma a fenti
összefüggést használva: .
Ismétléses kombinációról beszélünk, ha n különböző elemből kell k darabot kiválasztani úgy, hogy ismétlődés is
megengedett, feltéve még, hogy mindegyik fajta elemből van legalább k darab. Azaz akár egy fajtából is vehetünk k
darabot. Az ismétléses kombinációk számát jelöljük: -val.
Korábbi példánkat tekintve (a négy betűből kettőt választani), de most ismétlődéssel, akkor a hat ismétlés nélkülihez
hozzájön még az alábbi négy pár: {a, a}; {b, b}; {c, c} és {d, d}. Tehát 10 eset van.
Általában több elem esetén ez a módszer elég nehézkes, azaz külön leszámolni a mind különböző, egyből kettőt, a
többiből egyet, s így tovább. Egy másik gondolattal viszont megmutatható, hogy
(23.26)
A bizonyítás gondolatmenete a következő. Ha a k kiválasztott elemet úgy kódoljuk, hogy ennyi darab 1-est írunk, n – 1
függőleges vonal közé, amivel n részre osztunk egy szakaszt. Az első vonal elé annyi 1-et teszünk, ahányszor az első elemét a
halmaznak kiválasztottuk, ha ez egyszer sem történt meg, akkor nincs egyetlen 1 sem az első függőleges vonal előtt.
Hasonlóan az első és a második közötti 1-ek száma mutatja, hogy hányszor választottuk a második elemet. Hasonlóan a
többit is. Ekkor k darab 1-est és n – 1 darab függőleges vonalat kell elhelyezni az összes lehetséges módon. Ezek száma éppen
az állításban felírt binomiális együttható.
Végezetül a sorrendet is gyelembe vevő kiválasztást, a variációt vegyük.
Ismétléses variációról beszélünk, ha n különböző elemből k-t választunk ki úgy, hogy minden elem akárhányszor
ismétlődhet, és a kiválasztás sorrendje is számít. Ezeknek a számát szokás -vel jelölni.
Mivel az első elem n-féle lehet, a második, a lehetséges ismétlődés miatt ismét, hasonlóan tovább, egészen a k-adik
elemig, így kapjuk a fenti formulát az ismétléses variációra. A téma középiskolai lezárásához vegyünk egy olyan példát,
amin az összes lehetséges esetet szemléltethetjük, különböző kérdésfeltevésekkel.
Példa. Egy fagylaltárusnál ötféle fagyi van. Lehet tölcsérbe kérni akárhány gombócot (már amennyi egyáltalán a
legnagyobb tölcsérbe belefér), illetve kehelybe. Az első esetben számít a gombócok sorrendje, hiszen nem mindegy,
hogy melyik van a tetején. A kehelyben ez nem lényeges. Nézzük a kérdéseket!
a) Egy vevő kér ötgombócos tölcséres fagyit úgy, hogy minden gombóc különböző fajta legyen. Hányféleképpen
szolgálhatják ki?
b) Egy vevő kér ötgombócos tölcséres fagyit úgy, hogy kedvencéből, a csokiból hármat szeretne. Hányféleképpen
szolgálhatják ki?
c) Egy vevő három különböző gombócos fagyit szeretne tölcsérbe. Hányféleképpen szolgálhatják ki?
d) Egy vevő háromgombócos tölcséres fagyit kér. Hányféleképpen szolgálhatják ki?
e) Egy vevő három különböző gombócos kelyhes fagyit kér. Hányféleképpen szolgálhatják ki?
f) Egy vevő háromgombócos kelyhes fagyit kér. Hányféleképpen szolgálhatják ki?
A válaszok:
a) Mivel a sorrend lényeges, és nincs ismétlődés, a válasz 5 ! = 120.
b)
Itt is lényeges a sorrend, de van egy elem (a csoki), amelyik 3-szor ismétlődik, tehát .
c) Hármat kell kiválasztani, és a sorrend is lényeges, tehát variáció: 5 · 4 · 3 = 60 lehetőség van.
d) Ekkor lehet akár három egyforma is, és mindenféle egyéb, tehát ismétléses variáció, mind a három gombóc ötféle
lehet: azaz 53 = 125 eset van.
e) Mivel kelyhes a fagyi, ezért nem számít a sorrend, ismétlődés nincs, tehát 5 elem harmadosztályú
Fibonacci-sorozat
Skatulyaelv (Dirichlet)
Logikai szitaformula
Általános elhelyezési probléma
Számpartíciók
A Pólya-féle leszámolási módszer
Fibonacci-sorozat
További problémák, amelyek kicsit tovább vezetnek már.
1. Egy 20 emeletes házat kell kifesteni két színnel úgy, hogy az egyik szín nem ismétlődhet két egymás utáni szinten.
Hányféleképpen festhető ki az épület?
2. Egy 2 × n-es táblát kell 2 × n-es dominókkal kirakni. Hányféleképpen lehet?
3. Egy n hosszú lépcsőn szeretnénk felmenni úgy, hogy egyszerre vagy egy lépcsőfokot haladunk, vagy kettőt.
Hányféleképpen juthatunk a lépcső tetejére?
A válasz mindhárom feladatban a következő rekurzió: f(n) = f(n – 1) + f(n – 2). Nézzük például a másodikat, ha az utolsó
dominó állított helyzetben van, akkor ebből annyi eset van, ahányféleképpen a 2 × (n – 1)-es dominót ki lehet rakni. Ha a
végén két egymáson levő fekvő dominó van, akkor meg éppen az előtte levő 2 × (n – 2)-es tábla kirakásainak a száma adja
meg ezen lehetőségek számát. Nyilván a kettő összege adja meg az összes lehetőséget. Ez egy igen nevezetes rekurzió, amely
a Fibonacci-sorozathoz vezet, ha az első két eleme 1, 1 (az első elemet 0 indexszel véve). Esetünkben ez eggyel el van tolva,
mert az 1 és 2 a kezdő elemek. A folytatás ismert: 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987…
Rekurzívan megadott egy sorozat, ha a sorozat n-edik tagját a megelőző elemekből egy meghatározott szabály szerint
számíthatjuk ki.
Példa. A fenti sorozat mellett nagyon sokféle ilyen megadás lehet. Például az ismert mértani sorozatokat
megadhatjuk úgy, hogy adott a1 a sorozat első eleme, valamint a következő szabály: a = an–1q, ahol a q egy tetszőleges
nem zérus valós szám.
Megjegyzés: A Fibonacci-sorozat elnevezése a középkorból való. A sorozatnak nagyon sok nevezetes tulajdonsága
van, szoros a kapcsolata a Pascal-háromszöggel is.
Kezdjük az összefüggések felsorolását talán a legnevezetesebbel, az explicit formulával, amellyel bármely n-re meg
tudjuk adni fn értékét.
(23.28)
Bizonyítás: A fontossága miatt mutatjuk meg az ötletet. Keressük először azokat a mértani sorozatokat, amelyek eleget
tesznek a Fibonacci-sorozat rekurziós összefüggésének.
Ekkor teljesül: a1qn = a1qn–1 + a1qn–2, ahonnan – mivel az első tag nem lehet 0, hasonlóan q sem, ezt gyelembe véve –
osztásokkal adódik: q2 = q + 1. Tehát azok a mértani sorozatok jönnek szóba, melyek hányadosa a másodfokú egyenlet
gyöke, azaz , illetve . Látszik, hogy az első tag tetszőleges. Nyilván, ha két sorozat teljesíti a
Fibonacci-féle rekurziót, akkor a lineáris kombinációjuk is, azaz a Fibonacci-sorozatok egy vektorteret alkotnak. Ebben a
fenti két hányadosú mértani sorozat lesz egy bázis, azaz kétdimenziós vektorteret kapunk (lásd a 11.3. fejezetet).
Van még egy összefüggésünk, az első két tagra. Kihasználva azt a szabadsági fokot, hogy mindkét mértani sorozat első
tagja szabadon választható, így legyen az egyik , míg a másik a . Ezek összege legyen a
keresett Fibonacci-sorozat, akkor a következő két egyenletet kapjuk az első két tagra:
második 0-hoz tart, ha n tart végtelenbe. Formálisan igaz: , ami egyben az aranymetszés
arányszáma (lásd az 5.6. fejezetet).
Néhány további érdekesség a Fibonacci-sorozat elemeivel kapcsolatban. A már példaként említett 2., dominóval
kapcsolatos feladatot meg lehet oldani egy másik gondolattal is, amely a binomiális együtthatókkal hozza kapcsolatba a
sorozat elemeit. Érvényes a következő:
(23.29)
Ez azt jelenti, hogy ha a Pascal-háromszögben a háromszög bal széléről bármelyik sorból elindulunk „lóugrásban”
jobbra felfelé, amíg a másik szélére nem érünk, akkor az összeg éppen egy Fibonacci-szám lesz.
A bizonyítás gondolata a következő: aszerint számoljuk le az eseteket, hogy hány fekvő dominó van. Ha nincs fekvő
dominó, akkor mind az n dominó áll, ami egy eset, felírható formában. Ha egy fekvő dominó van, akkor annyi eset
van, ahányféleképpen ez elhelyezhető, ami, lévén, hogy most összesen csak n – 1 egységünk lesz, n – 2 álló és egy fekvő
dominópár, ezért -féleképpen rakható le, hiszen azt az egy helyet kell kiválasztani, ahová a fekvő pár kerülhet.
Hasonlóan két fekvő pár esetén lehetőség lesz. Ezt vihetjük tovább, legfeljebb darab fekvő dominópárig,
(fn, fm) = 1 akkor és csak akkor, ha (n, m) = 1, ahol (n, m) szokásosan a két szám legnagyobb közös osztóját jelenti. (23.30)
Azaz két Fibonacci-szám akkor és csak akkor relatív prím, ha indexeik azok. Tehát például a hetedik (13) és a
tizenkettedik (144) relatív prím, hiszen a 13 prím és 144 nem osztható 13-mal, míg az ötödik (5) és a tizedik (55) nem relatív
prím, hiszen közös osztójuk 5.
Lásd például: 5 | 10és f5 | f10. Vagy 4 | 8 és f4 | f8 is fennáll. Ezek nem véletlenek, hanem a bizonyítható (23.31)
összefüggés következményei. Az okoskodáshoz azt kell használni, hogy milyen rekurzió adja a sorozat elemeit, s akkor
látszik, hogy ha például a legegyszerűbb oszthatóságot, a 2n-edik és az n-edik tagot nézzük:
és a vége nyilván osztható fn-nel. Ezzel egy konkrét esetben beláttuk az állítást. Általában hasonló módon mutatható ki, ha
m = kn, akkor fkn akár fm-nek, akár fn-nek többszöröse, ami éppen a bizonyítandó állítás.
Több is igaz, ennek az állításnak a megfordítása is áll, tehát
(23.32)
(23.33)
(23.34)
(23.35)
(23.36)
(23.37)
(23.38)
Bizonyítása a (23.36) és (23.37) összefüggések, valamint a pitagoraszi számhármasok explicit formulája segítségével
történhet.
Sok helyen lehet ennek a sorozatnak az alkalmazásairól beszélni, kezdve a biológiát, informatikát egészen a zenéig
bezárólag, ahol zeneművek felépítésében (pl. ütemek száma) bukkannak fel ezek a számok. (Lásd még erről Rényi A.:
Variációk egy Fibonacci-témára. Természet Világa, 1967.)
Példák. A virágszirmok száma gyakran Fibonacci-szám. Például a liliom, nőszirom 3 szirmú, a harangláb vagy a
vadrózsa 5, a szarkaláb és a vérpipacs 8, a körömvirág 13, az őszirózsa és a cikória 21, útilapu és egyes százszorszépek
34, míg más százszorszépeknek 55 vagy 89 szirma van. Fontos tudni, hogy ritka az a virágfajta, amelyiknek nem
Fibonacci-szám a szirmainak száma. Ha ez nem így lenne, akkor a fenti tények egyszerűen abból adódhatnának,
hogy a Fibonacci-számok is természetes számok. Egy másik terület a Fibonacci-spirális, ahol a csavarodások szöge
alkot aranymetszést. Ez azt jelenti, hogy fölülről nézve két ág úgy osztja az egész kört, hogy a kisebbik ív úgy aránylik
a nagyobbhoz, mint az egész körhöz. A növények szárán az egymást követő levelek elfordulása (phyllotaxis)
többnyire (egyes becslések szerint 90%-ban) Fn/Fn + 2 alakúak (pl. szilfa és hárs esetén 1/2, bükknél, mogyorónál és
szedernél 1/3, tölgynél, almánál, cseresznyénél és meggynél 2/5, nyárnál, rózsánál és baracknál 3/8, fűznél és
mandulánál 5/13). Ezek az arányok éppen a Φ–2 lánctörtbe fejtésekor kapott közelítő törtek (ahol Φ az aranymetszés
aránya).
A fenyőtobozokban a pikkelyek száma, vagy az ananász pikkelyeinek száma is általában Fibonacci-számok. A
zenéből két Bartók művet említsünk, egy korait, az Allegro barbarót, ahol hol 3, hol 5, hol 8, hol 13 ütemes
csoportokba rendeződik a mű, illetve a Zene húros-, ütőhangszerekre és cselesztára című művét, amelyben az I.
tételben összesen 144 ütem van, ami éppen Fibonacci-szám, míg a mű csúcspontja az 89. ütemben található, ami az
előző Fibonacci-szám. Így még az is igaz, hogy a mű csúcspontja kb. a mű „aranymetszeténél” van. Ez más Bartók-
művekre is jellemző (lásd Lendvai E.: Bartók költői világa. Szépirodalmi Kiadó, Budapest, 1971). Az érdeklődők a
keresőbe az aranymetszést vagy a Fibonacci-sorozatot beírva több tízezer alkalmazást találhatnak az interneten is.
Skatulyaelv (Dirichlet)
Nézzük a következő kérdést! Hány ember van a teremben, ha tudjuk, hogy legalább három ugyanazon a napon született?
Mivel a szökőévet is gyelembe véve 366 napon lehet születni, ha 733 ember van, akkor biztos lesz olyan nap, amelyen
hárman születtek, hiszen ha minden napra legfeljebb kettő esne, akkor legfeljebb 732 személy lehetne. Ez az egyszerű
gondolat a következő formában fogalmazható meg általában:
Ha van n skatulyánk (osztályunk) és nk + 1 tárgyunk (elemünk), akkor létezik olyan skatulya, amelybe legalább k + 1
tárgy esik. Ezt szokás skatulyaelvnek is mondani.
Példák
1. Egy tudományos tény, hogy senkinek sincs 500 000 szálnál több haja a fejbőrén. Igaz-e, hogy van két budapesti,
akinek azonos számú hajszála van? Ez a skatulyaelvből adódik, hiszen ma kb. 1 700 000 budapesti lakos van. Mivel
legfeljebb 500 000 skatulyánk van, valamelyikben több mint 1 elem van. Sőt mivel több mint háromszor annyi a
budapestiek száma, mint a maximális hajszálak száma, még az is igaz, hogy lesz legalább négy olyan ember,
akinek ugyanannyi szál haja van (esetleg 0, azaz tökéletesen kopasz).
2. Biztos, hogy minden racionális szám vagy véges tizedes tört alakban, vagy egy valahonnantól periodikus végtelen
tizedes tört alakban felírható. Mivel a maradékos osztásnál legfeljebb q – 1 különböző maradék lép fel, ezért
legkésőbb a q-adik lépésben ismétlődés lép fel. Azaz periodikus lesz. Ha valamikor fellép a 0 maradék, akkor pedig
véges. Előbbire példa az 1/7, utóbbira a 3/25.
Logikai szitaformula
Ez a formula igen sokszor használatos mind metrikus feladatoknál, mind számossággal vagy valószínűségekkel
kapcsolatban (lásd pl. 26.2. fejezet). Általában n halmazra vonatkozik, és most véges számosságokkal fogalmazzuk meg.
Jelöljön A1, A2, …, An véges számosságú halmazokat, az uniót most + jellel, míg a metszetet a halmazok közvetlen egymás
mellé írásával jelöljük:
(23.39)
Példák
1. Legyen egy osztályban 3-féle nyelvcsoport, angol, német és francia. Minden tanuló legalább egy nyelvet tanul.
Tudjuk, hogy angolul 18-an, németül 13-an, franciául 12-en tanulnak. Angolul és németül 6, angolul és franciául 2,
és németül és franciául mindössze 1 tanuló tanul. Mindhárom nyelvet senki sem tanulja. Hány fős az osztály? A
formulánk szerint az osztálylétszámot úgy kapjuk meg, hogy összeadjuk az egyes csoportok létszámát, ami
esetünkben 43, majd ebből levonjuk a két nyelvet tanulók számát, akik ezúttal 9-en vannak, azaz marad 34. Ehhez
kellene hozzáadni a mindhárom nyelvet tanulók számát, akiknek a száma most 0, tehát 34 fős osztályról van szó.
2. Hány 5-tel vagy 3-mal osztható pozitív szám van 1000-ig?
Nyilván ami 5-tel osztható, a számok ötöde 200. Ami 3-mal az 333, hiszen 3-tól 999-ig ennyi pozitív egész szám
van. Ebből 200 + 333 = 533 szám adódna, de a 15-tel oszthatókat kétszer számoltuk, egyszer az 5-tel, egyszer a 3-mal
oszthatók között, tehát ezek számát le kell vonni a szitaformula szerint az 533-ból. Ilyen szám éppen 66 van 15-től
990-ig. Tehát a keresett szám 533 – 66 = 467.
3. A relatív prímek száma (Euler-féle φ függvény), lásd a 13.2. fejezetben.
Legyen az n szám kanonikus alakja: . A nem relatív prímeket fogjuk megszámolni, s majd az n
számból ezek számát levonva kapjuk a φ(n) értékét. Először leszámoljuk 1-től n-ig a p1-gyel, a p2-vel és így tovább,
a pk-val osztható számok számát. Ekkor a két prímmel oszthatókat többször számoltuk, azokat le kell vonni, a
három különböző prímmel oszthatókat újra hozzáadni, tehát a szitaformulát használjuk.
Ezzel .
A következőkben megfogalmazunk egy igen általános feladatot, amelynek nagyon sok alkalmazása van a
legkülönbözőbb területeken, például a statisztikus zikában vagy a részecske zikában, de más hétköznapi helyzetekben is.
Maximum 1 k(k – 1) … (k – n + 1) 1
Minimum 1
(1) (2)
Tetszőleges kn
(3)
Egyforma golyók
Minden dobozba
számozott dobozok egyforma dobozok
Maximum 1 1
Tetszőleges
(4)
A megjelölt mezőkhöz tartozó magyarázatokkal foglalkozunk az alábbiakban, amelyek nem egyszerűen adódnak már
eddig tárgyalt esetekből, mint a többi jelöletlen mező értékei.
Az (1)-ben szereplő számokat elsőfajú Stirling-számoknak mondjuk, és általában s(n, k)-val jelöljük. Szokásos
de níciójuk a következő.
(23.40)
Az első kettő nyilvánvaló a de nícióból, a harmadik az [r]n+1 = (r – n) [r]n egyenlőség mindkét oldalán fellépő rk tag
együtthatójának összehasonlításából adódik. Még megállapodunk abban, hogy s(n, k) = 0, ha n < k. Néhány elsőfajú
Stirling-féle szám látható a következő táblázatban:
s(n, k) K=0 1 2 3 4 5 6 7
N=1 0 1 0 0 0 0 0 0
2 0 –1 1 0 0 0 0 0
3 0 2 –3 1 0 0 0 0
4 0 –6 11 –6 1 0 0 0
5 0 24 –50 35 –10 1 0 0
6 0 –120 200 …
7 0 …
Egy n elemű halmaz k számú osztályt tartalmazó osztályozásainak számát jelöljük S(n, k), amit szokás másodfajú
Stirling-féle számnak is mondani.
Mivel az osztályok között nem teszünk különbséget, ez éppen (2)-nek felel meg, azaz (2) elemeit nevezzük másodfajú
Stirling-számoknak, s így érvényes:
(23.42)
A bizonyítást illetően lásd Vilenkin, N. J.: Kombinatorika. Műszaki, Budapest, 1987, 48.
További fontos összefüggés az elsőfajú Stirling-féle számok analógiájára:
(23.43)
Az S(n, k) számok előbb növekednek, majd csökkennek, s a maximumuk, amelytől kezdve csökkennek, legfeljebb
, és ha n tart a végtelenhez, akkor aszimptotikusan tart -hez, ahol a nevezőben a természetes (e-
alapú) logaritmus szerepel.
Egy n elemű X halmaz valamely osztályozását 1λ12λ23λ3 … kλk-típusúnak nevezzük, ha λ1 számú osztály egy elemet, λ2
számú osztály két elemet, …λk számú osztály pedig k darab elemet tartalmaz. Mivel az osztályok páronként
diszjunktak, így az elemek összegére igaz lesz, hogy λ1 + 2λ2 + … + kλk = n.
Egy n elemű X halmaz -típusú osztályozásainak számára (ahol λ1 + 2λ2 + … + kλk = n) igaz, hogy
(23.44)
A következő kérdés egy n elemű X halmaz összes lehetséges osztályozásáról szól. Ez szerepel a korábbi táblázatban (3)
alatt.
Egy n elemű halmaz összes lehetséges osztályozásainak számát szokás Bn-nel jelölni és Bell-féle számnak mondani.
Mivel az n elemű X halmaz bármely osztályozása egy vagy két, …, vagy n számú osztályt tartalmaz, azért Bn = S(n, 1) +
S(n, 2) + … + S(n, n), ahol az S(n, k) számok a fent tárgyalt másodfajú Stirling-féle számok.
(23.45)
A tétel igazolásához gyeljük meg, hogy Bn + 1 = S(n + 1, 1) + S(n + 1, 2) + … + S(n + 1, n + 1) és használjuk fel a (23.43)
összefüggést, azaz
De mivel a belső második összegzés éppen Bi'' továbbá megállapodás szerint B0 = 1, ezzel készen is vagyunk.
Megjegyzés. A Bell-féle Bn számok éppen egy n elemű halmazon értelmezhető összes ekvivalenciarelációk számát is
megadják. Ez egy másik fontos tulajdonságuk.
A Bn-nel jelölt számok egy E. T. Bell által észrevett érdekes tulajdonsága az, hogy ezek a számok az függvény
Taylor-féle sorfejtésének együtthatói. Ezen észrevétel miatt tiszteletből nevezik a fenti számokat Bell-féle számoknak. Így
ezt a függvényt a Bn számok generátorfüggvényének nevezzük.
(23.46)
Legyen n ∈ N és a ∈ R ! Ekkor legyen a következő de nícióval az eddig használt binomiális együttható fogalma
kibővítve:
Ismert, hogy az (1 + x)α függvény (a ∈ R, |x| < 1) a következőképpen fejthető sorba (általános binomiálistétel):
. A későbbiekben még szükség lesz rá, ezért írjuk fel konkrétan az esetet.
Feladat. Hány olyan 2n hosszú, 1 és –1 számokból álló sorozat van, melynek az összege 0, és minden részletösszege
nem negatív?
Megoldás. Jelöljük az ilyen sorozatok számát cn-nel. Nyilván c0 = 1 és c1 = 1. A 2n hosszúságú sorozatokat osztályozzuk
aszerint, hogy melyik az utolsó 0 részletösszegük a teljes összeg előtt (természetesen csak páros sok tag esetén lehet a
részletösszeg 0).
, amiből
A másodfokú egyenlet másik megoldása nem jöhet szóba, mert annak abszolút értéke 0-ban végtelenhez tart. A
függvény a következőképpen fejthető sorba:
így
Számpartíciók
Gyakori kérdés, hogy egy n természetes számot hányféleképpen lehet felbontani pozitív egészek összegére. Ha még egy
korlátozásunk is van a legnagyobb összeadandóra, amit k-val jelölünk, akkor a lehetséges felbontások számát Pk(n)-nel
jelölve a következő állítás igaz:
(23.47)
Megjegyzés: tehát a felbontások számának ismerjük a generátorfüggvényét (ez a jobb oldal), s ebből számíthatunk
konkrét eseteket (lásd a bizonyítás utáni példát).
A bizonyításhoz tekintsük a
függvényt. Egyfelől ez a függvény megegyezik állításunk jobb oldalával, másrészt xn együtthatója a szorzás elvégzésekor
éppen annyi, ahányféleképpen az n számot elő lehet állítani nem negatív egészek összegeként és legfeljebb k nagyságú
összeadandókból.
Példa. Bontsuk fel a 7-et úgy pozitív egészek összegére, hogy a legnagyobb összeadandó a 3 legyen, azaz n = 7, k = 3.
Ekkor a nevező mindössze háromtényezős szorzatból áll, s keressük a kifejtés 7-edfokú tagjának az együtthatóját. A
nevező polinomja: 1 – x – x2 + x4 + x5 – x6. Ezt kell egy végtelen polinommal szorozni, hogy az eredmény 1 legyen.
Ennek a végtelen polinomnak az eleje (ameddig nekünk kell a 7. tagig): 1 + x + 2x2 + 3x3 + 4x4 + 5x5 7x6 + 8x7 + …. Tehát
a számolás eredménye 8, ami közvetlenül is adódik, hiszen ilyenkor még nem nehéz a teljes felsorolás sem. (Az egyes
esetek rendre: 3 + 3 + 1, 3 + 2 + 2, 3 + 2 + 1 + 1, 3 + 1 + 1 + 1 + 1, 2 + 2 + 2 + 1, 2 + 2 + 1 + 1 + 1, 2 + 1 + 1 + 1 + 1 + 1 és végül 1 + 1 + 1 +
1 + 1 + 1 + 1.) Egyébként a következő együttható 10, ami azt jelenti, hogy a 8-at már 10-féleképpen lehet pozitív egészek
összegére bontani úgy, hogy a legnagyobb összeadandó a 3.
Egy másik ellenőrzése a formulának az a speciális eset, ha a megengedett maximális tag 1. Ekkor bármilyen számot
egyféleképpen lehet felbontani, csupa egyesre. Ekkor a végtelen polinom minden együtthatója 1, ami meg is felel
válasznak, hiszen:
Ha g ∈ G, és λ1(g) jelöli a g permutálás i hosszúságú ciklusainak számát, akkor a G csoport ciklusmutató polinomján a
Legyen n tárgy és m szín, valamint G az n tárgy egy permutációcsoportja. Ekkor a G szerinti színezési sémák száma a
ciklusmutató polinom P(G; m, m, … m) számértékével egyenlő.
Példa. Vegyünk egy kockát, amelynek lapjait például két különböző színnel akarjuk kiszínezni. Hányféleképpen
tehető ez meg, ha a kocka azon színezéseit, amelyeket egy mozgással egymásba vihetünk, nem tekintjük
különbözőeknek?
Megoldás. Pólya módszerének alkalmazásához először a kocka forgáscsoportját kell meghatározni. Legyenek a kocka
csúcsai szokásosan: A, B, C, D, E, F, G, H! A forgáscsoport elemeinek száma 24. A ciklusmutató polinom alakja:
Könnyen ellenőrizhetjük, hogy ez helyes szám, mert két szín esetén tényleg fel is lehet sorolni az összes lehetséges
színezéseket. Ezt az olvasóra hagyjuk.
A Pólya-módszer egyébként lehetővé teszi vegyületek izomerjeinek a megszámolását is.
További érdekes problémákat találunk Vilenkin, N. J.: Kombinatorika (Műszaki, Budapest, 1987), illetve Elekes Gy.:
Véges matematika (ELTE, Budapest, 2002) és Lovász–Pelikán–Vesztergombi: Diszkrét matematika (Typotex, 2006) című
munkákban.
Véges geometriák
A sík és a tér felbontásai
A konvex kombinatorikus geometria alaptétele
Euler-féle poliédertétel
Véges geometriák
A H véges alaphalmaz E1, E2, …, Em részhalmazainak a rendszerét véges geometriának nevezzük, ha fennáll
1. i ≠ j esetén | Ei ∩ Ej| = 1, és
2. x∈H y ∈ H esetén Ǝi úgy, hogy {x, y} ⊆ Ei.
A de níció a projektív geometriák illeszkedési axiómáiból adódik, azaz, hogy bármely két egyenesnek van pontosan
egy közös pontja, és bármely két ponton át fektethető egy egyenes. Nyilván az E-vel jelölt halmazok az egyenesek, és H
elemei a pontok.
Triviális vagy elfajuló véges geometriáról beszélünk, ha vagy m = 1 és E1 = H, vagy Ei = {x, y) (i = 1, 2, …, m – 1}, Em = {y1,
y0, …, ym–1} (lásd a 23.2. ábrát).
23.2. ábra
Egy érdekes kérdés, hogy hány pont esetén létezik véges nem triviális geometria. Mielőtt erre a kérdésre válaszolnánk,
még néhány fogalmat vezessünk be.
Egy véges geometria valahány eleme általános helyzetű, ha közülük semelyik három nem esik ugyanabba az Ei
halmazba.
Egy véges geometria nem elfajuló, ha létezik négy általános helyzetű eleme.
Ebből a következő alaptétel adódik. Minden nem elfajuló véges geometriához van olyan q természetes szám, hogy
Megjegyzés. Érdekes, hogy a sorozat első két tagja: 2, 4, éppen kettő hatványok, hajlamosak lennénk ezt folytatni és
8-cal, 16-tal folytatni a valóságos 7, 11 helyett. Nem exponenciálisan nő a tartományok száma, csupán polinomiálisan
egy másodfokú polinom szerint.
Hány részre osztja a teret n általános helyzetű sík? Ennek megoldásakor az előző síkbeli eredményt fogjuk erősen
használni. Ezúttal a keresett választ g(n)-nel jelöljük. Ismét rekurziót építünk, amelyben az (n + 1)-edik síkon lévő n
metszésvonalat tekintve annyi új tartomány lesz, ahány részre ezt a síkot ez az n egyenes bontja, azaz:
. Ebben az esetben is igaz, hogy egy sík két részre bont, azaz g(1) = 2. Ismét
a rekurzió feloldása lépésről lépésre következik, most csak az eredményt közöljük:
ahonnan
Megjegyzés. Még érdekesebb, mint az előbb, hogy most az első három kettő hatvány adódik, ha az n = 1, 2, 3 esetet
nézzük: 2, 4, 8, de 4-re már csak 15. Ezúttal sem exponenciális, de most harmadrendű polinomiális a növekedés
mértéke.
Hasonló kérdéseket lehet feltenni, például körök esetén vagy térben gömbökkel. Ezek azonban már túlnyúlnak jelen
könyvünk keretein.
Legyen adott n intervallum egy egyenesen. Ha bármely kettőnek van közös pontja, akkor mindnek is van közös pontja.
Legyen n konvex ponthalmaz a síkon. Ha bármely háromnak van közös pontja, akkor az összesnek van.
Legyen n konvex ponthalmaz a térben. Ha bármely négynek van közös pontja, akkor az összesnek van.
Legyen n konvex ponthalmaz a k dimenziós euklideszi térben. Ha bármely (k + 1)-nek van közös pontja, akkor mind az
n ponthalmaznak van közös pontja.
Példa. Ha van 10 körlemez a síkon úgy, hogy bármely 3-nak van közös pontja, akkor mind a 10-nek van közös pontja.
Ezt például a következő problémában használhatjuk. Egy adott területen 10 rádióadó sugároz. Ha tudjuk, hogy egy
adott körben foghatók az adók, és azt is, hogy bármely három adó mindegyike fogható valahol, akkor van olyan hely,
ahol mind a tíz adó is fogható.
A bizonyítás magasabb dimenzióban indukciós, egy dimenzióban igen egyszerű, így a kétdimenzióst vázoljuk. Az
egydimenzióst úgy is fogalmazhatjuk, hogy ha egy könyvtárba érkeznek látogatók, s tudjuk, hogy bármely kettő
találkozott, akkor volt időpillanat, amikor mindnyájan a könyvtárban voltak. Vegyük a legelső érkezőt, mivel neki a
legutolsóval is kellett találkoznia, ezért csak később mehetett el, mint ahogy az utolsó érkezett. Akkor az utolsó
érkezésekor mindnyájan a könyvtárban kell hogy legyenek, különben aki nincs ott, az nem találkozott az utolsóval. Ami
ellentmond a feltételnek.
Két dimenzióban az indukcióhoz belátjuk, hogy ha négy síkbeli konvex halmaz közül bármelyik háromnak van közös
pontja, akkor mind a négynek is van. Jelöljön Pi egy olyan pontot, ami az i-edik halmazt kivéve a másik háromnak közös
pontja. Ez a négy pont vagy egy konvex négyszöget alkot, vagy három pont alkotta háromszög tartalmazza a negyedik
pontot (23.4. ábra).
23.4. ábra
Mindkét esetben találunk közös pontot, hiszen ha négyszög, akkor a P2P4 átló minden pontja benne kell legyen a
konvexitás miatt az első és a harmadik halmazban, míg a P1P3 átló minden pontja a második és a negyedik halmazban.
Ekkor az átlók P metszéspontja mind a négy halmaznak közös pontja. Ha mondjuk a P1P2P3 háromszög tartalmazza a P4
pontot, akkor pl. a P1P4 egyenes P2P3-mal alkotott P metszéspontja lesz egy olyan pont, amely mind a négy halmazba benne
kell legyen.
Ezután jön az indukció. Tegyük fel, hogy n konvex alakzat közül bármelyik háromnak van közös pontja, akkor a
„mindnek van teljesül”, s bizonyítani szeretnénk n + 1 halmazra, melyekről tudjuk, hogy köztük is bármely háromnak van
közös pontja. Jelöljük Ki-vel az alakzatokat! Legyen K = Kn ∩ Kn+1, amely szintén egy konvex halmaz, és nyilván nem üres,
hiszen bármely háromnak van közös pontja, akkor kettőnek még inkább. Vegyük most a K1, K2, …, Kn–1, K halmazokat!
Ezek közül bármely háromnak van közös pontja, mivel ha nincs köztük K, akkor nyilván a feltétel miatt, ha viszont benne
van K, akkor meg amiatt, hogy 4 halmazra már beláttuk, tehát pl. K1, K2, Kn, Kn+1 négyesnek is van közös pontja, ha
bármelyik háromnak, s így, ha K-t vesszük két másik halmazzal, akkor lesz közös pont. Ezzel véges sok halmazra
bizonyítottuk Helly tételét két dimenzióban. Hasonló a bizonyítás tér esetében is.
Ennek a Helly-tételnek az alkalmazásával érdekes további tételek bizonyíthatók konvex alakzatokra, amelyek már
inkább geometriai, mint kombinatorikai eredmények, mégis közöljük őket, a bizonyításukban szerepel a Helly-tétel.
Blaschke-tétel. Ha egy konvex tartomány szélessége d, akkor a tartományban elhelyezhető egy d/3 sugarú kör.
Egy t területű korlátos S alakzathoz mindig található a síkjában egy olyan O pont, hogy az O-n átmenő valamennyi
egyenes úgy vágja szét S-et, hogy az egyenes mindkét oldalán S-nek legalább t/3 területű része lesz.
Megjegyzés. Utóbbi tételhez sem a konvexitás, sem az alakzat összefüggősége nem kell. Azt mutathatjuk meg, hogy a
sík összes olyan félsíkja, amelyik S-nek legalább a 2/3 területű részét tartalmazza, olyan tulajdonságú, hogy bármely
három metszete nem üres. Ebből már adódik az állítás.
Megemlítünk még magyar vonatkozásai miatt két másik, konvexitással kapcsolatos problémát.
Nevezzük általános helyzetűnek a sík azon ponthalmazát, ahol semelyik három pont nem illeszkedik egy egyenesre.
Konvex helyzetűnek mondunk a síkban egy olyan ponthalmazt, amelyek egy konvex sokszög csúcsai.
A kérdés az, hogy vajon hány darab általános helyzetű pontot kell felvennünk, ha azt akarjuk, hogy köztük legyen
legalább egy konvex sokszög. Pontosan megfogalmazva, ha egy konvex n-szöget szeretnénk garantálni, akkor létezik-e
olyan K(n) szám, melyre igaz, hogy bárhogyan veszünk fel egy K(n) elemű általános helyzetű ponthalmazt, közülük mindig
kiválasztható egy konvex n-szög.
Ez kis n-ekre még egyszerű, n = 2-re nyilván K(n) = 2 és n = 3-ra K(n) = 3. Már nem teljesen triviális az n = 4 eset sem, erre
Klein Eszter adott választ bebizonyítva, hogy K(4) = 5. Ennek bizonyítása a következő gondolaton alapul. Ha az öt pont
konvex burka négy- vagy ötszög, akkor készen vagyunk, hiszen akkor ki lehet választani konvex négyszöget. Egy eset
marad, ha a konvex burok egy háromszög (23.5. ábra).
23.5. ábra
Ekkor a háromszög belsejében lévő két pontot összekötő egyenes kettévágja a konvex burok háromszöget, s az a két
háromszögcsúcs, amelyik az egyik oldalára esik, plusz a belső két pont alkot ekkor konvex négyszöget.
Általánosan igaz az Erdős–Szekeres-tétel, mely szerint
minden n ≥ 3 esetén létezik olyan K(n) szám, hogy minden K(n) elemű általános helyzetű ponthalmaz tartalmaz n
konvex helyzetű pontot.
23.6. ábra
Ha n páratlan, akkor a pontok elhelyezhetők úgy, hogy csak n – 1 különböző irány keletkezik (23.7. és 23.8. ábra).
23.7. ábra
A 23.7. ábrán az egyenesen egyenlő közönként helyezkednek el a csillaggal jelölt pontok, és az egyenesen kívül, a
középső pont által meghatározott merőleges tengelyen van a maradék két pont. Ekkor éppen n – 1 irány lesz, mert az alsó és
felső pont egyenesbeli pontokkal való összekötése esetén lesznek egyirányú párok.
Egy másik konstrukció a következő.
23.8. ábra
A 23.8. ábrán az összes többi pontpár összekötésével keletkező irány megegyezik valamelyik, az ábrában berajzolt
iránnyal. Az olvasó ellenőrizheti az állítás igazságát. Scott sejtését Ungár bizonyította a permutációk segítségével. Csak a
konstrukciót mutatjuk meg.
Legyen adott a síkon n darab nem kollineáris pont. Ha n = 2k vagy n = 2k + 1, akkor az n pont legalább 2k különböző
irányt határoz meg (Ungár tétele).
Elegendő az n = 2k esetben bizonyítani. Vetítsük a pontokat minden lehetséges irányban egy egyenesre! A pontok
vetületeinek a sorrendje az egyenesen (feltéve, hogy minden pont képe különböző) a pontok egy permutációját határozza
meg. Az egyenest forgatva e permutáció változásaihoz pontosan azok a vetítési irányok tartoznak, amelyeket az n pont
határoz meg. A permutáció egy ilyen változását lépésnek nevezzük. Egy 180 fokos fordulathoz tartozó lépések száma tehát
megegyezik a pontok által meghatározott különböző irányok számával. A 180 fokos fordulat de niálja a pontok
permutációinak egy sorozatát, amely a következő tulajdonságokkal rendelkezik:
1. Az utolsó permutáció az elsőnek a megfordítottja.
2. Egy lépésben szomszédos pontokból álló diszjunkt blokkok sorrendje fordul meg. (Egy ilyen blokkban kollineáris pontok
találhatók. Két vagy több blokk ugyanabban a lépésben fordul meg, ha a hozzájuk tartozó egyenesek párhuzamosak.)
3. Nem fordíthatjuk meg egyszerre az összes elemet, hiszen nem minden pont esik egy egyenesre.
4. Bármely két pont egymáshoz viszonyított helyzete a permutációban pontosan egyszer változik.
Nevezzük középpontnak az egyenesnek egy olyan pontját, amelynek mindkét oldalán k darab pont fekszik.
Átmenetnek meg nevezzük azt, hogy ha egy pont egy lépés által átkerül a permutáció első feléből a második felébe, azaz
balról jobbra átugorja a középpontot.
Egy fontos segédtétel, amelyből lényegében már könnyen adódik az állításunk, a következő. Ha bármely lépés által s
darab, majd egy későbbi lépés által t darab átmenet történik, akkor a két lépés között van legalább további s + t – 1 lépés, ami
egyetlen átmenetet sem tartalmaz. Bizonyítását lásd Elekes Gy.: Véges matematika. ELTE, Budapest, 111–112.
Ugyanez a tétel tisztán kombinatorikai megfogalmazásban zárja ezt a paragrafust.
Ha 2k elem permutációinak sorozata rendelkezik az előző tételben szereplő 1 – 4. tulajdonságok mindegyikével, akkor
ez a sorozat legalább 2k permutációból áll (Ungár-tétel).
Euler-féle poliédertétel
Végül egy poliéderekkel kapcsolatos kérdéskör (igazából az algebrai topológia területe), ami poliéderek határoló
alakzatainak számai közötti összefüggést ad meg. A kérdéskört sokan vizsgálták, de első explicit megfogalmazójáról Euler-
féle poliédertételnek nevezik. Ez a következőt mondja ki:
Egy közönséges, egyszerű poliéder csúcsai, élei és lapjainak száma (jelölje ezeket a számokat rendre: c, e és l) között a
(23.48)
következő összefüggés érvényes: c + l – e = 2.
23.9. ábra
24. Gráfok
24.1. Alapfogalmak
24.2. Gráfok összefüggősége, fák, erdők
24.3. A gráfok bejárásai
24.4. Speciális gráfok és tulajdonságaik
24.5. Irányított gráfok
24.6. Szállítási problémák modellezése gráfokkal
24.7. Véletlen gráfok
24.8. Gráfok alkalmazásai
24.9. Gráfok és mátrixok
24.1. Alapfogalmak
Ez a téma egy újabb fejezete a matematikának, ahol a mindössze 250 évet mondjuk újnak. Az első kérdés, amelynek
megválaszolásához gráfokat használt Leonhard Euler, az ún. königsbergi hidak problémája (1736-ban jelent meg). Ebben
fordul elő olyan helyzet, ahol pontokkal és az azokkal jelölt dolgok között levő kapcsolatokat szimbolizáló élekkel lehet
modellezni a valóságot, s aztán ezen a modellen sikerül egy egyszerű okoskodással egy lehetetlenséget igazolni. Lássuk a
problémát!
24.1. ábra
A poroszországi Königsberg városában (ma Kalinyingrád, Oroszország) folyik a Pregel folyó, amelyet – a 24.1. ábrán
látható módon – hét híd ível át. A város polgárai azt kérdezték, lehet-e olyan sétát tervezni, amelyik minden hídon éppen
egyszer halad át. A kérdés a szentpétervári akadémia tanárához, Eulerhez került.
Ennek a problémának a modellezéséből adódott a következő fogalom. Ha adva van egy halmaz, valamint e halmaz
elempárjainak egy sorozata (ahol az „elempáron” ugyanazon elem kétszeri megismétlését is értjük), akkor gráfról
beszélünk. Ezt pontosan a következőképpen fogalmazhatjuk meg:
Legyen adva egy diszjunkt P és E halmaz, valamint egy leképezés, amely E minden eleméhez egy P-beli – nem
szükségképpen különböző elemekből álló – elempárt rendel hozzá. A G = (P, E, ) rendezett hármast gráfnak
nevezzük, ahol a P halmaz elemeit a gráf csúcspontjainak vagy röviden pontjainak vagy csúcsainak, míg az E halmaz
elemeit a gráf éleinek nevezzük. A leképezés éppen azt jelenti, hogy az éleknek pontosan két ún. végpontja van,
azaz pontpárok (nem feltétlenül különbözőek) jelentik az éleket.
A königsbergi hidak esetében P a szigetek, E a hidak halmaza, és minden hídhoz azt a 2 szigetet rendeli, amiket az
összeköt. Ez a de níció megenged ún. hurokéleket, amikor a pontpár két eleme azonos, illetve többszörös éleket, amikor
különböző élekhez is ugyanazt a pontpárt rendeljük. Amennyiben a leképezés egy-egyértelmű, akkor nincs többszörös
él, s ha nem fordul elő a pontpárok között azonos elem, akkor hurokmentes gráfról beszélünk.
A fentivel azonos, de más megközelítésű de níció a következő.
Legyen adva egy P halmaz, valamint egy sorozat, amelynek elemei a P kételemű részhalmazai közül valók. A
A P halmaz elemeit mondjuk a gráf csúcspontjainak és az sorozat elemeit a gráf éleinek. Azért beszélünk
sorozatról, hogy többszörös élek is megengedhetők legyenek.
Az ej = (X, X) élt hurokélnek nevezzük, míg a sorozat azonos elemeit mondjuk többszörös éleknek.
24.2. ábra
III.Számítástechnikában egy szimmetrikus négyzetes mátrixszal lehet megadni egy gráfot. A sorai és az oszlopai egyaránt a P
halmaz elemeivel indexelendők, míg az aij mátrixelem értéke k ∈ N, mely 0, ha nincs él a Pi és a Pj csúcspontok között, 1 ha
van egy él, és ha többszörös él van, akkor k ≥ 2. Ezt a gráf szomszédsági (adjacencia) mátrixának nevezzük.
Ismét az I. szerinti gráfot adjuk meg ezen a módon: . Számítógépben általában így reprezentálódik
egy gráf. (Természetesen sok más mód is lehetséges, lásd például a Prüfer-kódokat a 24.8. fejezetben.)
Az ilyen egyszerű gráfok alkalmasak lehetnek például egy alaphalmaz elemei közötti kapcsolatok modellezésére, így
ismeretségek, sportversenyeknél lejátszott mérkőzések vagy települések közötti kapcsolatok, pl. vasútvonalak, utak, víz-,
gázvezetékek stb.
Teljes gráf az olyan egyszerű gráf, amelyben minden csúcs minden másik csúccsal össze van kötve éllel. Mátrixa a
Megadható egy elemi összefüggés a gráfok éleinek a számára, amelyhez azonban még egy új fogalom szükséges.
Egy gráf egy P pontjának fokszáma a belőle induló élek számát jelenti. Jelölése többnyire gr (P) vagy d(P).
(24.1)
Példa. A gráfok megadásánál használt minta gráf esetén (lásd a 24.2. ábrán) a fokszámok rendre gr(A) = 2, gr(B) = 4,
gr(C) = gr(D) = 1. Nyilván ekkor a fokszámok összege 8, s így az élek száma ennek a fele, azaz 4. Az ábra mutatja, hogy
valóban ennyi él van, egy hurokél és három további él.
Két hasonló, egy egyszerűbb és egy mélyebb állítás, az utóbbi igazolás nélkül.
Nem létezik olyan egyszerű gráf, melyben minden pont foka különböző.
Hiszen ennek (n pontszámú gráf esetén) lenne 0 és n – 1 fokszámú pontja is, s így az előbbi semelyik, az utóbbi
mindegyik másik ponttal szomszédos lenne, ami egyszerre lehetetlen.
Nem létezik olyan n csúcsú e élű egyszerű gráf sem, mely csúcsai kettő olyan k és n – k számú csúcsból álló részekre
Egy egyszerű gráf komplementere az a gráf, melynek csúcsai ugyanazok, mint a megadott egyszerű gráfé, élei viszont
pontosan azok, amelyek a másik gráfból hiányoznak. Azaz egy egyszerű gráfot és a komplementerét egyesítve éppen a
teljes gráfot kapjuk.
Példák. Két ötpontú gráf látható a 24.3. ábrán, melyek egymás komplementerei. A szaggatott élek csak a
komplementerképzés világosabbá tételét szolgálják. A bal oldali gráf a vastag élű, s ennek komplementere a jobb oldali
vastag élű.
24.3. ábra
Ha egy n pontú egyszerű gráf éleinek száma e, akkor a komplementer éleinek száma:
Reguláris egy gráf, ha minden csúcsának azonos a fokszáma. Ha jelölni akarjuk azt is, hogy mennyi ez a közös
fokszám, akkor k-reguláris gráfról beszélünk. Ilyenkor minden csúcsból k él indul ki.
Minden teljes gráf reguláris, hiszen minden pontjából ugyanannyi él indul, szám szerint n – 1, feltéve, hogy a csúcsok
száma n.
Megjegyzés. (2k + 1)-reguláris gráf csúcsainak száma csak páros lehet, hiszen különben a fokszámok összege nem
lenne páros. Így például 7 pontú 3-reguláris gráf nem létezik. Példa nem teljes 3-reguláris gráfra a 24.4. ábrán látható
8 pontú 3-reguláris gráf.
24.4. ábra
Egy gráf részgráfja az a gráf, amelynek csúcsai az eredeti gráf csúcsainak egy részhalmazát alkotják, míg élei az eredeti
gráf azon élei közül kerülnek ki, melyeknek mindkét végpontja az eredeti gráf kiválasztott csúcsa.
A 24.5. ábrán példák láthatók különböző részgráfokra. A bal oldali gráfnak részgráfjai a jobb oldali gráfok, az elsőnek
ugyanannyi csúcsa is van, a másodiknak kevesebb csúcsa, de azok között minden eredeti él megmaradt.
24.5. ábra
Végezetül egy fontos fogalom a gráfok azonossága, ha a csúcsait nem különböztetjük meg (pl. két szénatom vagy két
hidrogénatom egymástól nem különböztethető meg, lásd később a kémiai molekulák példáit).
Legyen G1 és G2 két gráf. Ha létezik G1 és G2 csúcsai között egy olyan egy-egyértelmű leképezés (bijekció), amely
„éltartó”, azaz pontosan akkor köt össze él két (nem feltétlen különböző) pontot G1-ben, ha a leképezés szerint nekik
megfelelő pontokat is él köti össze G2-ben, akkor a két gráfot izomorfnak mondjuk.
Példa. A 24.6. ábrán két izomorf, a 24.7. ábrán két nem izomorf gráfot látunk. Az elsőnél a leképezést a
következőképpen adhatjuk meg: A → C, B → D, C → B, D → E, E → A. Ekkor a 7 él is megfelelő élbe megy: AB, AC, AD
átmegy rendre: CD-be, BC-be, CE-be; BC és BD BD-be és DE-be; míg CE és DE pedig AB-be és AE-be. A másik ábrán
nem izomorfak a gráfok, mert az első fokszámai rendre: 4, 2, 2, 4, 2, míg a másodiké 3, 2, 3, 3, 3. Triviális, hogy nem
lehetnek izomorfak, hiszen annak minimális feltétele a fokszámsorozatok elemeinek azonossága.
24.6. ábra
24.7. ábra
Megjegyzés. Két gráf izomor ájának a kérdése általában igen nehéz, nem ismerünk szükséges és elégséges feltételt
rá. (Természetesen ekvivalens de níciók vannak, például 2 gráfot izomorfnak mondunk, ha létezik csúcsaik és éleik
halmazainak uniói közötti olyan bijekció, amely csúcshoz csúcsot, élhez élt rendel, és megtartja a csúcs-él
illeszkedéseket. Ez bizonyos értelemben szükséges és elégséges feltétel.) Ezzel szemben sok szükséges feltétel van,
ezek közül néhány egyszerűbbet felsorolunk: nyilván azonos csúcsszám, azonos élszám, ha a pontok fokszámait
felsoroljuk, akkor mindkét gráfra ugyanazon elemekből álló sorozatot kell kapnunk. Ezek az izomor ánál
„megmaradó” (invariáns) mennyiségek. A felsoroltak elég triviális szükséges feltételek, vannak jóval ravaszabbak is,
de azokhoz már mélyebb ismeretek kellenek a gráfokról. Tény viszont, hogy még számítógéppel sincs polinomiális
idejű program a kérdés eldöntésére, így nagy gráfok esetén nagyon sok idő kell a kérdés eldöntésére, ha az egyáltalán
lehetséges.
Könnyen látható, hogy az út egyben vonal is, hiszen ha minden csúcson csak egyszer mehetünk át, akkor élt sem
érinthetünk kétszer.
Példa. A 24.8. ábrán a vastag vonallal jelölt élek a bal oldali ábrán egy olyan vonalat, amely nem út (amelynek
sorrendje 1-2-3-4-5 élek), illetve a jobb oldalin egy utat példáznak (itt is a sorrendet jelöli az 1-2-3-4-5).
24.8. ábra
A fenti fogalmakat használva, az Eulernek feltett kérdés így hangzik: A königsbergi hidak és szigetek alkotta gráfban
van-e olyan vonal, amely minden élt tartalmaz?
Fontos fogalom egy gráf összefüggősége is. Erről szemléletesen is meg lehet győződni úgy, hogy akárhogyan is rajzolom
le egy síklapra a gráfot, annak nincsenek különböző, egymástól elszigetelt darabjai (az ábrán). Ezt matematikailag a
következőképpen fogalmazhatjuk meg.
Egy gráfot összefüggőnek mondunk, ha bármely két csúcsa között létezik séta, azaz egymáshoz kapcsolódó élek
sorozatán egyikből a másikba juthatunk.
Példa összefüggő és nem összefüggő gráfra. A 24.9. ábrán két különböző összefüggő gráfot, míg a 24.10. ábrán egy
nem összefüggő gráfot látunk, aminek három komponense van (lásd a következő bekezdést és de níciót). Mindkét
ábrán van többszörös és hurokél is, jelezve, hogy tetszőleges gráfokra de niálható az összefüggőség és a komponens
fogalma, nemcsak egyszerű gráfok esetén.
24.9. ábra
Nem összefüggő gráfokat is lehet az összefüggőség szempontjából osztályozni úgy, hogy megnézzük, hány „darabból”
állnak.
24.10. ábra
Egy gráf egy maximális összefüggő részgráfját komponensnek mondjuk. Maximálisan összefüggő részen azt értjük,
hogy összefüggő, de a gráf bármelyik további csúcsát hozzá véve, már nem összefüggő, azaz nem bővíthető úgy, hogy
összefüggő marad. Más szóval a komponensből nem vezet él a gráf további, rajta kívül eső csúcsaihoz.
Szélsőséges esetben egy komponens állhat egyetlen hurokél nélküli pontból; ezt izolált pontnak nevezzük.
A gráf egy élét hídélnek (vagy elvágó élnek) mondjuk, ha törlésével az őt tartalmazó komponens összefüggősége
megszűnik, és így a gráf komponenseinek a száma eggyel nő. Egy pontot elvágó pontnak mondunk a gráfban, ha azt és
a belőle kiinduló éleket törölve nő a gráf komponenseinek a száma.
Minden gráf egyértelműen felbontható komponensekre. Így egy gráfot az is jellemez, hogy hány komponense van.
Véges gráfnak (csúcsainak és éleinek a száma is véges) magától értetődően csak véges sok komponense lehet.
Példa kettő, illetve négy komponenst tartalmazó gráfra (24.11a és 24.11b ábra).
24.11. ábra
Megjegyzés. Az előző fejezet végén emlegetett izomor a esetén az itt de niált fogalmak is megmaradó mennyiségek.
Tehát az összefüggőség vagy a komponensek száma invariáns az izomor ára nézve, illetve ha egy gráfban három
hídél van, akkor a vele izomorfban is annyi. Egyébként úgy is fogalmazhatunk, hogy a gráfelmélet olyan fogalmakat
alkot, s azokkal foglalkozik, amelyek az izomor ára nézve invariánsak.
Egy nevezetes, sokszor használható, egyszerű összefüggés egy gráf és a komplementere között a következő.
Igazolása egyszerű. Ha a gráf nem összefüggő, akkor k ≥ 2 komponense van (amelyek között nincsen él). Ekkor a
komplementer biztosan összefüggő, hiszen két különböző komponensbe eső pont között a komplementerben közvetlen él
fut, az egy komponensbe eső két pont pedig egy tetszőleges másik komponens bármelyik pontján keresztül 2-hosszú úton
elérhető. Azaz ekkor a komplementer lesz összefüggő.
24.12. ábra
A 24.12. ábrán a gráf élei a folytonos vonalak, a komplementernek csak néhány élét rajzoltuk be, amelyek már
összefüggővé teszik azt. Ezek a vékony pontozott élek. Láthatóan az eredeti gráf két komponensből áll, s a szövegnek
megfelelően látszik, hogy ekkor a komplementere viszont valóban összefüggő.
Egy érdekes és fontos kérdés, hogy ha n pontunk van, akkor minimum hány él kell ahhoz, hogy összefüggő gráf
szülessen. A válasz a következő tétel.
Összefüggő n pontú gráfnak legalább n – 1 éle van. Azaz ha egy gráfban túl kevés az él, akkor nem lehet összefüggő. Ez
nem fordítható meg, egy gráf lehet nem összefüggő még akkor is, ha éleinek száma jóval több, mint n – 1.
Igazolása (a pontok száma szerinti) teljes indukcióval lehetséges: 1 pontra triviális, 2 pont esetén legalább 1 él kell, hogy
összefüggő legyen. Ha igaz n pontra, akkor vegyünk egy tetszőleges (n + 1) pontú összefüggő gráfot. Belátható, hogy ennek
minden esetben létezik olyan pontja, melyet a hozzá kapcsolódó élekkel együtt elhagyva a keletkező n pontú gráf is
összefüggő. Ez a pont legalább 1 éllel kapcsolódik a többihez. Az így keletkezett n pontú gráfnak feltételünk szerint legalább
(n – 1) éle van, így hozzávéve az elhagyott pontot és éleket legalább n élünk lesz.
Példa minimális összefüggő gráfra minden egyszeres kötést tartalmazó kémiai molekula, vagy megfelelő úthálózat,
vagy egy családfa stb. Sok élű, nem összefüggő gráfra példa a 24.13. ábra, ahol 7 pontunk van, s az élek száma 9. Azaz
3-mal is több a minimálisan szükséges 6-nál, mégsem összefüggő. Egy szélsőséges helyzet egyszerű gráfok esetén, ha
van egy (n – 1) pontú teljes gráfunk és egy izolált pont. Ekkor az összes pontok száma n, míg az éleké jóval több mint
(n – 1), hiszen (n – 1)(n – 2)/2.
24.13. ábra
Példa. Az ország 11 nagyobb városát távközlési kábelekkel akarják összekötni. Bármely két város között maximum
egy kábel épülhet. 46 kábelt már kiépítettek. Biztos, hogy már használható a kábelrendszer bármely két város között
(akár egy harmadik városon keresztül)?
Igen, hiszen a 11 pontú teljes gráf éleinek száma 55. Ha 46 kábel-összeköttetés már elkészült, akkor csak 9 van hátra.
Ez a komplementer gráf (tehát a még meg nem építettek gráfja) nem lehet összefüggő az előző tétel miatt, hiszen
akkor legalább 10 éle lenne, és csak 9 van. Ekkor viszont a komplementere, azaz a megépítettek (gráfja) összefüggő
hálózatot alkot.
Egy másik irányból is közelíthetünk a minimális élszámú összefüggő gráfokhoz. Nem minimális élszámú az olyan
összefüggő gráf, amiben van „körút”, azaz két pont között többféle úton is eljuthatunk.
Körnek mondjuk a gráf olyan útját, amelynek kezdő- és végpontja azonos. Hasonló módon beszélünk körvonalról és
körsétáról. Az előbbi olyan vonal, az utóbbi pedig olyan séta, melynek kezdő- és végpontja azonos.
Indirekt úton könnyen igazolható, hogy ha egy gráfban nincs kör, akkor van olyan csúcsa, melynek fokszáma
legfeljebb 1. Ennek felhasználásával és indukcióval igazolható a következő.
Az olyan n pontú gráfnak, melyben nincs kör, legfeljebb n – 1 éle van. Azaz ha túl sok az él egy gráfban, akkor nem lehet
körmentes. Ugyanakkor egy gráf tartalmazhat kört még akkor is, ha jóval kevesebb éle van, mint n – 1. (Vegyünk hozzá
egy körhöz izolált pontokat.)
A legutóbbi 2 tételben szereplő eredményeket összevetve adódnak az alábbiak, melyek segítségével egy újabb nagyon
fontos gráfosztályt nevezünk meg.
Ha egy n pontú összefüggő gráfnak éppen maximális számú, azaz n – 1 éle van, akkor nincs benne kör (azaz a gráf fa).
Hasonlóan, ha egy n pontú, kört nem tartalmazó gráfnak éppen minimális számú, azaz n – 1 éle van, akkor összefüggő.
Könnyen igazolható ezeknek a megfordítása a Frobenius-tétel és azon állítás felhasználásával, mely szerint ha a G
gráfban van független teljes élhalmaz, akkor G csúcsainak száma páros:
Ha egy n pontú gráf összefüggő és nincs benne kör, akkor n – 1 éle van.
A fa olyan gráf, amely összefüggő és nincs benne kör. A fentiek értelmében ezzel egyenértékű de níció a fára, hogy az
egy olyan gráf, amely minimális számú éllel összefüggő, illetve az is, hogy olyan gráf, amely maximális számú éllel
körmentes.
Megjegyzés. Könnyen meggondolható, hogy szintén a fentiekkel ekvivalens de níció a következő: olyan gráf,
melynek bármely 2 pontja között pontosan 1 út vezet. A fentiek alapján nyilvánvaló, hogy bármely n csúcsú fának n –
1 éle van.
Ha a körmentességet nem kapcsoljuk az összefüggőséggel, akkor egy új fogalmat kapunk. Mivel ha nem összefüggő a
gráf, akkor komponensekre bomlik, amelyek már összefüggők, és mivel a körmentesség nyilván minden egyes
komponensre is igaz, ezért mondhatjuk, hogy a körmentes gráfok komponensei fák. Mivel az erdő éppen fákból áll, ez
indokolja a következő fogalom nevét.
A körmentes gráfokat erdőnek mondjuk. Speciálisan az egykomponensű erdő a fa. Tehát a gráfelméletben a fa is
erdő, nemcsak bizonyos számú fa esetén használjuk az erdő fogalmát.
Sokszor fontos lesz egy gráf minimális összefüggő részgráfjait vizsgálni. Erre is bevezetünk egy fogalmat.
Egy összefüggő gráf favázán egy olyan részgráfját értjük, amely körmentes, összefüggő, és a gráf minden csúcsát
tartalmazza. Belátható, hogy minden összefüggő gráfnak van faváza, és ha nem összefüggő a gráf, akkor az egyes
komponenseinek lesz faváza. Szokás ezt a favázat feszítőfának is, tetszőleges gráf esetén a komponensek egy-egy
feszítőfáiból álló gráfot pedig feszítőerdőnek mondani.
A fának egy másik egyszerű karakterizációja, hogy összefüggő és minden éle hídél. Hiszen, mivel minimális
összefüggő gráf, ha bármelyik élét töröljük, akkor szétesik komponensekre. Továbbá megfordítva is igaz, hiszen ha egy
összefüggő gráfban van kör, akkor a kör egyik éle sem lehet hídél, mivel azt törölve az összefüggőség megmaradna. Így
adódik a következő tétel.
Egy gráf akkor és csak akkor fa, ha összefüggő és minden éle hídél.
Nevezetes példák fákra a nyílt láncú szénhidrogének szerkezete (24.14a–c ábra), minimális összefüggő hálózatok
(telefon-, elektromos- és gázvezeték-hálózatok). Itt említhető meg az előző fejezetben bemutatott gráfos modellje a
permutációknak (23.1. fejezet).
Érdekes kérdés, hogy hány különböző (egymással nem izomorf) n pontú fa létezik. Speciális esetben, ha ismerjük az
egyes csúcsok fokszámait, akkor mit mondhatunk? Ezekre a kérdésekre általános válasz a mai napig nincs. Egy példa a
telített szénhidrogének, ahol ismerjük az egyes csúcsok fokszámait (vegyérték). A 24.14a–c ábra mutatja a sorozat első hat
elemét.
Az ábrákon a CH4, C2H6, C3H8, C4H10, C5H12, C6H14 molekulák lehetséges izomerjeit látjuk, ahol a szénhez négy, a
hidrogénhez mindig egy kapcsolódás van (ezt mondják vegyértéknek). Tehát ez esetben olyan speciális fák számát
keressük, amik meghatározott számú első- és szintén meghatározott számú negyedfokú pontokból állnak, és az azonos
fokú pontok között nem teszünk különbséget. Az egyszerűség kedvéért csak a szénatomokat jelöljük, az élek másik vége,
ahol nincs betű, a hidrogént jelöli. Az első három molekula esetén csak egy-egy lehetőség van. A negyedikből két darab van,
egy lineáris és egy elágazó. A következőből már három. Végül az utolsó, hatodik molekula már ötféle lehet. Látszik, hogyan
bonyolódik a helyzet. A felsorolást a szénlánc maximális hossza szerint végeztük. A 24.14a ábrán CH4, C2H6, C3H8, C4H10
lehetséges változatait láthatjuk, a 24.14b ábrán a három lehetséges C5H12 molekulát, míg a 24.14c ábrán az öt lehetséges
C6H14 molekulát.
24.14. ábra
A folytatás elemszámai még egy ideig meghatározhatók, de általános képlet nem ismert. Válasz arra a némileg
módosított kérdésre van, amikor számozott pontú különböző fák számát szeretnénk megtudni, ahol a pontok száma adott,
de az egyes pontok fokszámai nem. (Itt akkor tekintünk „azonosnak” 2 számozott fát, ha az azonos sorszámú pontok azonos
sorszámúakkal vannak éllel összekötve.) Ez nem modellezi a fentihez hasonló kémiai szituációkat, de konkrét személyek
vagy objektumok esetén lényeges lehet. Például nem mindegy, hogy hat különböző település között hogyan épül ki egy
minimális összefüggő hálózat, azaz milyen lehetséges fák vannak, ha nemcsak izomor a erejéig számolunk, mint a fenti
kémiai molekulák esetén, hanem a csúcsok számozottak, azaz megkülönböztettek. Erre vonatkozik egy nevezetes tétel.
Cayley tétele. A számozott (azaz megjelölt) n csúcsú különböző fák száma pontosan nn–2.
A bizonyítás többféle gondolatmenettel is elvégezhető, de mindegyik nagyon bonyolult. Egyik talán legszemléletesebb
módja a Prüfer-kódokkal történik (lásd a 24.8. fejezetben), ami egyben fák számítógépes tárolását is lehetővé teszi.
A számozatlan csúcsú fák esete, mint már említettük, megoldatlan, de azért legalább némi eredmény van azt illetően,
hogy milyen intervallumban lehet a megoldás. Jelöljük Fn-nel az n számozatlan csúcsú egymással nem izomorf fák számát
(most a fokszámok nem adottak). Ekkor igaz a következő:
(24.2)
A gyökértől indulva „járjuk körbe” a gráfot úgy, hogy a „fal” mindvégig jobb kéz felől legyen; ekkor minden élen
pontosan kétszer megyünk át. Nevezzük lépésnek a körút egy élre eső szakaszát. Mivel a fának n – 1 éle van, ezért 2(n –
1) lépés után érünk vissza a gyökérponthoz. Minden olyan lépés esetén, amikor a gyökértől távolodunk, akkor írjunk le
egy 1-est, és amikor közeledünk, egy 0-t. Így egy 2(n–1) hosszúságú „01” sorozatot kapunk, amit szokás a fa planáris
kódjának nevezni. (Egy gráfban 2 pont távolságának a köztük lévő legkevesebb élből álló út éleinek a számát nevezzük.)
Egy ilyen bejárást mutatunk be a 24.15. ábrán, ahol egy csillag jelöli a gyökérpontot, és egy bejárást mutatnak a
nyilazott szaggatott szakaszok. Az ábra planáris kódja eszerint a következő: 1111100100011011010000.
24.15. ábra
A legfontosabb állítás, melynek egy lehetséges bizonyítása Lovász L.–Pelikán J.–Vesztergombi K.: Diszkrét matematika
című könyvében olvasható (Typotex, Budapest, 2006, 162.), a következő:
Példa. Legyen a planáris kód a következő: 1101101001100100. Mivel 16 hosszú, ezért ez egy 9 pontú fa lesz, 8 éllel (mert
ezek számának kétszerese a kód hossza). A megoldás a 24.16. ábrán látható.
24.16. ábra
Mivel a planáris kódok száma 22(n+1) = 4n–1, ezért ennél több fa biztos nem lehet. Sajnos ezek között lehetnek bőven
izomorfak, mert egy fának több különböző planáris kódja is lehet attól függően, hogy melyik csúcsát választjuk gyökérnek,
illetve hogy merre megyünk. Így a pontos számot ebből nem lehet megmondani, de ez egy felső korlát. Ezzel beláttuk a
(24.2) összefüggést.
Megjegyzésként elmondható, hogy a felső korlát még javítható, hiszen csak azok a planáris kódok jöhetnek szóba, ahol
a 0-k és 1-esek száma azonos (igaz ebből van a legtöbb), azaz a felső korlát javítható: -re. Ami nagyobb n-ekre
ismét a Stirling-formulát használva:
Ezen túl még a magyar származású Pólya György Fn aszimptotikus viselkedését is meghatározta, anélkül hogy
bármilyen képletet ismernénk a számozatlan csúcsú fák számára:
(24.3)
ahol a és b két valós, bonyolult módon de niált konstans, értékük néhány tizedesjegyre: a = 0,5349…; míg b = 2,9557…
„Mohó algoritmus”
1. Válasszuk ki a legolcsóbb élt. (Ezt megépítjük.)
2. Folytassuk tovább ismét a legolcsóbbal, ha ez a már kiválasztott élekkel nem alkot kört.
3. Ha kört alkot, akkor hagyjuk ki, s vegyük azt a következő legolcsóbbat, amellyel még körmentes marad a hálózat.
4. Ezt addig folytassuk, amíg elérünk a feszítőfa utolsó éléig. (Ha a gráf n pontú volt, akkor az n – 1-edik élig.
Megjegyzések
1. A bizonyítás nem túl bonyolult, még középiskolai jegyzetben is megtalálható „optimista eljárás” megnevezéssel.
(Lovász L.–Pelikán J.–Vesztergombi K.: Kombinatorika az általános és középiskolai matematikai szakkörök
számára. Typotex, 2003, 89.)
2. Egy másik algoritmus is célra vezet. Ebben sorban töröljük a legdrágább éleket, amíg csak összefüggő marad a
hálózat. Ha egy él törlésével szétesne, akkor azt meghagyjuk, és a következő legdrágábbat töröljük és így tovább,
amíg egy fa nem marad a végén. Belátható, hogy ez éppúgy egy minimális költségű feszítőfához vezet (,,
pesszimista eljárás”).
Példa a Kruskal-algoritmusra. Legyen egy 7 pontú teljes gráfunk s hozzá az élköltségeket tartalmazó mátrix.
Kövessük végig az algoritmust, amíg meg nem találjuk a minimális értékű feszítőfát. A sorban megépítendő éleket
jelöljük a mellékelt gráfon az építés menetét jelző sorszámmal (24.17. ábra).
Megjegyzés. Ha nem teljes a gráf, akkor a nem létező élekhez a legdrágább él költségénél eggyel nagyobb számot írva
és ezeket az éleket hozzávéve kapunk egy teljes gráfot, ami az alábbi mátrixhoz hasonlóan csak a főátlóban tartalmaz
0-kat, és persze szimmetrikus erre, hiszen két település között „mindkét irányban” ugyannyiba kerül az él
megvalósítása. E gráf minimális költségű feszítőfája nyilván megegyezik az eredetiével.
24.17. ábra
Megjegyezzük, hogy szaggatott élekkel olcsóbb vagy ugyanilyen árú lett volna a hálózat. Viszont tovább kellett volna
építeni, mert nem feszítőfa (hiszen kört tartalmazott volna, és így vagy nem lett volna összefüggő, vagy több élt
kellett volna „megépíteni”). A CG él ára 6 egység, és mégis kimaradt, helyette a 7 egységárú BD él került, mert CG a
már kiválasztott olcsóbb BC és BG élekkel kört alkotott volna, ezért átugrottuk. Hasonló igaz CF élre is (CBGFC kör
lett volna), helyette választottuk EG élt, ami ugyan drágább, de nem jön létre kör. Végül EG egy árban van AB és AC
élekkel, így azokat is választhattuk volna, csakhogy AB esetén ABDA kör lenne, míg AC esetén ACBDA kör lenne. Így
csak EG választható, és ezzel kész is vagyunk. A teljes költség: 3 + 4 + 4 + 5 + 7 + 8 = 31 egység. Ennél olcsóbb a tétel
szerint nem lehet.
Természetesen biztonsági okokból sokszor többet építenek meg, hiszen ha a feszítőfában egy él kiesik, sérülés vagy
utak esetén pl. baleset miatt, akkor a hálózat már nem bejárható, így sokszor néhány nem túl drága élt mint
biztonsági tényezőt még megépítenek, megszüntetve ezzel a körmentességet. Általában az úthálózatoknak legfeljebb
a legalsóbb rendű részei fák (lásd „zsákfaluk” esete, ami a világvégét jelenti), általában sok lehetőség van valahonnan
valahová eljutni.
Ha a minimális költségű feszítőfa egyértelmű, azaz minden lépésben csak azt lehet tenni, amit az algoritmus szerint
elvégzünk, akkor az említett második algoritmus, amelyikkel a legdrágább éleket törölve, de mindig összefüggőnek
hagyva a maradék gráfot dolgozunk, ugyanehhez vezet. Ha nem egyértelmű a szituáció, azaz több egyenlő minimális
költségű feszítőfa van, akkor a két algoritmus különböző feszítőfákhoz vezethet. Például az előbb vizsgált 7 pontú
gráfban ez az algoritmus (hosszabb, mint a másik, hiszen ott 6 élt kellett megépíteni, itt viszont törölni kell 21 – 6 = 15
élt, ami több munka) ugyanarra a gráfra vezet. Felsoroljuk a törölt éleket: BF, DG, CD, DE, BE, AE, AF, AG, CE, DF, EF,
AB, AC, CF (EG helyett, mert akkor szétesne, ha azt törölnénk, ugyanígy BD-vel is), CG. A maradék gráf: AD, BC, BD,
BG, EG, FG. Ez a fa éppen a Kruskal-algoritmussal kapott feszítőfa.
24.3. A gráfok bejárásai
Az eredeti königsbergi probléma megoldása egy általános tétel következménye, amit előzzön meg a rövidebb leírhatóság
miatt két de níció.
Egy gráf Euler-vonala egy olyan vonal, amely minden élét érinti (pontosan egyszer).
Amennyiben a vonal kezdő- és végpontja megegyezik, akkor Euler-körvonalról beszélünk.
Azt a gráfot, amelyet végig lehet járni egy Euler-vonal mentén, Euler-féle gráfnak vagy röviden Euler-gráfnak
mondjuk.
Euler-tétel. Ha egy összefüggő gráfban kettő kivételével minden pont foka páros, akkor létezik Euler-vonal a gráfban,
de Euler-körvonal nem létezik. A két páratlan fokú csúcs lesz a kezdő- és a végpont. Amennyiben minden pont foka
páros, akkor Euler-körvonal is létezik, azaz a vonal kezdő- és végpontja azonos lesz.
Fordítva is igaz, ha egy gráfban van Euler-vonal, de nincs Euler-körvonal, akkor a gráf összefüggő, és kettő kivételével
minden csúcs foka páros, míg ha a kezdő- és a végpont megegyezik, azaz Euler-körvonal van a gráfban, akkor minden
pont foka szükségképpen páros, és nyilván ekkor is összefüggő a gráf.
Ez a tétel választ ad arra a problémára is, hogy az íróeszköz felemelése nélkül mikor rajzolható le úgy egy gráf a síkba,
hogy minden élét csak egyszer rajzoljuk meg, és a teljes gráf ábrája elkészül. Lásd például a boríték esetét (bal oldali kép,
nem rajzolható le) vagy Mohamed kézjegyét (jobb oldali kép, lerajzolható) a 24.18. ábrán.
24.18. ábra
A tétel igazolásának egyik iránya egyszerű. Ha több mint két páratlan fokú pont van, akkor nem lehet bejárni, hiszen
minden bejárás esetleg a kezdő- és a végpont kivételével minden pontba „bemegy” és „kijön”, azaz páros sokszor érinti. 1
páratlan fokú csúcs nem lehet, 0 páratlan fokú csúcs esetén visszaérünk a kiindulópontba, 2 esetén nem. Ha a gráf nem
összefüggő, nyilván szintén nem tartalmazhat Euler-vonalat. Az elégségesség egy kicsit nehezebb, de bízunk az olvasóban.
E kérdéskör általánosítása a kínai postás problémája, mely tetszőleges összefüggő gráfban keres a gráf minden élét
tartalmazó vonalat a lehető legkevesebb élismétléssel.
Ha egy gráf bejárásánál minden él helyett minden ponton szeretnénk pontosan egyszer végigmenni, szintén élek
mentén haladva, Hamilton-út vagy Hamilton-körút létezésének és keresésének, illetve a Hamilton-féle gráfok
karakterizálásának a problémájával foglalkozunk, ahol tehát olyan sétát keresünk, mely minden csúcsot pontosan egyszer
tartalmaz. Az „utazó ügynök problémáját” még W. R. Hamilton, a neves ír matematikus és zikus vetette fel, s néhány
konkrét esetben meg is oldotta, de általános szükséges és elégséges feltételt, mint az előbbi Euler-féle probléma esetén, a
mai napig nem sikerült adni.
A probléma a következő. Egy ügynök végig akar járni néhány nagyvárost, hogy bemutasson egy mintadarabot, és
vevőket toborozzon. Adott, hogy mely városok között van közvetlen légi kapcsolat, amit használhat, hogy lehetőleg
gyorsan végezhessen. Megtervezhető-e úgy az útja, hogy minden várost pontosan egyszer látogat meg (és a végén ugyanoda
ér vissza)?
A gráfok nyelvére lefordítva, adva van egy n pontú gráf, ahol két pont akkor van éllel összekötve, ha van köztük
közvetlen légi összeköttetés. A kérdés, hogy bejárhatók-e a gráf csúcsai úgy, hogy mindenhol pontosan egyszer járunk (és a
végén ugyanoda érkezünk, ahonnan indultunk). Azaz egy olyan utat (kört) keresünk, amelyre az összes csúcs felfűzhető.
Az utazó ügynök problémáján szokták érteni azt az általánosabb szituációt is, amikor a városok közötti távolság vagy az
egyikből a másikba jutás költsége is számít, és a legrövidebb vagy legkisebb összköltségű olyan utat (körutat) keressük, ami
minden várost pontosan egyszer érint.
A gráfok nyelvén ez azt jelenti, hogy a gráfon kívül adott egy, az élek halmazán értelmezett úgynevezett
költségfüggvény is, és keressük a legkisebb összköltségű és minden csúcsot pontosan egyszer tartalmazó utat (kört).
Egy gráf Hamilton-féle, ha van benne az összes csúcsot tartalmazó út. Ezt Hamilton-útnak nevezzük. Ha az út még
záródik is, azaz a kezdő- és a végpont megegyezik, akkor Hamilton-körről beszélünk.
Néhány tételt ismerünk meg a továbbiakban, amelyek garantálják, hogy egy gráfban van Hamilton-kör. Ezek mind
csak elégséges feltételek. Erre mutatunk példákat is.
G. A. Dirac tétele. Ha egy n ≥ 3 pontú egyszerű gráf minden pontjának foka legalább , akkor van benne Hamilton-
kör.
Példa arra, hogy a feltétel nem szükséges. Vegyünk egy szabályos n-szöget, amelynek a csúcsai a gráf csúcsai és az
oldalai legyenek a gráf élei. Itt a feltétel nyilván nem teljesül, ha legalább ötszöget választunk (hiszen ekkor minden
pont foka csak 2), és mégis triviális Hamilton-út, sőt körút is van benne.
A bizonyítás a leghosszabb út elvére épül; megmutatható, hogy ha a leghosszabb út nem tartalmazná az összes csúcsot,
akkor a fokszámokra tett feltevés alapján lehetne bővíteni egy csúccsal az utat, ami ellentmond a maximalitásnak.
További elégséges feltételeket adó tételek, amelyek az előző tétel valamilyen élesítéséből adódnak:
Pósa L. tétele. Legyen n > 2 egész szám. Ha egy n pontú egyszerű gráfban bármely -nél kisebb pozitív k esetén a k-
nál nem nagyobb fokú pontok száma kisebb, mint k, akkor a gráfnak van Hamilton-köre.
Ez azt jelenti, hogy a Hamilton-kör létezésének elégséges feltétele, hogy a gráfban 0 darab 0 vagy 1 fokszámú, legfeljebb
1 darab 2 fokszámú, legfeljebb 2 darab 3 vagy annál kisebb fokszámú, legfeljebb 3 darab 4 vagy annál kisebb fokszámú stb.,
legfeljebb darab vagy annál kisebb fokszámú csúcs van, a többi csúcs fokszáma pedig legalább
.
Egy másik hasonló tétel
Erdős P. tétele. Legyen n > 2. Ha egy n pontú egyszerű gráfban bármely -nél kisebb pozitív egész k esetén a k-
nál nem nagyobb fokú pontok száma legfeljebb k, akkor a gráfnak van Hamilton-útja.
És végül
O. Ore tétele. Ha egy n ≥ 3 pontú egyszerű gráfra teljesül, hogy bármely kettő olyan pontot véve, amelyek nincsenek
éllel összekötve, azok fokszámainak az összege legalább n, akkor van a gráfban Hamilton-kör.
Megjegyezzük, hogy a fenti tételek között az alábbi logikai kapcsolat áll fenn: (Pósa tétele) ⇒ (Ore tétele) ⇒ (Dirac
tétele).
A fordított irányú összefüggések (szükséges feltételek) közül néhány könnyen adódik, mind általános esetben, mind
speciális típusú gráfok esetén. Például nem összefüggő gráfnak biztosan nincs Hamilton-útja, illetve páros gráfok közül a
páratlan csúcsszámúakban nincs Hamilton-kör (de Hamilton-út lehet). Hasonlóan könnyű belátni, hogy egy fában nincs
Hamilton-kör, illetve hogy pontosan mikor tartalmazhat egy fa Hamilton-utat. Ezek belátását az olvasóra bízzuk. Külön
kiemeljük a következőt:
Ha egy G gráfban létezik Hamilton-kör, akkor minden S ⊂ V (a csúcsok halmaza) esetén a G-ből S (és az S-beli végpontú
élek) törlésével keletkező gráf komponenseinek száma legfeljebb |S|.
Bizonyításának alapgondolata, hogy egy út egy pontját törölve az 1 vagy 2 útra esik szét.
Megjegyzés. A tétel segítségével lehet bizonyítani elegánsan, hogy egy 4 x 4-es tábla egy lóval (huszár) nem járható
be. A tábla gráfja az, amelyikben azokat a mezőket reprezentáló csúcsokat kötjük össze, melyek lóugrással elérhetők
egymásból. Így a gráfnak 16 csúcsa lesz, az éleket a 24.19. ábrán látjuk. Ha a belső 4 „b” jelű pontot elhagyjuk, akkor a
maradék gráf komponenseinek száma 6, így még Hamilton-út sem lesz, nemhogy kör.
24.19. ábra
Végül néhány irányított gráfokra vonatkozó tétel (a de níciókat lásd a 24.5. fejezetben, ahol az irányított gráf
de nícióját és fontosabb tulajdonságait adtuk meg).
Kőnig D. tétele. Egy legalább 2 pontú teljes gráf bármilyen irányítása révén nyert irányított gráfnak van irányított
Hamilton-útja.
Megjegyzés. Ez utóbbi tétel azt jelenti, hogy ha van egy körmérkőzéses bajnokság, azaz mindenki mindenkivel
játszik, akkor biztosan felsorolhatók úgy a csapatok egyetlen láncban, hogy mindenki legyőzte a közvetlenül
mögötte állót. Ennél majd élesebbet is állítunk a 24.5. fejezetben, Az újságíró paradoxona cím alatt.
Ha egy n pontú egyszerű irányított gráf minden pontjának be-foka is és ki-foka is legalább , akkor van a gráfnak
irányított Hamilton-köre.
Ha egy n pontú egyszerű, irányított, erősen összefüggő gráf minden pontja ki-fokának és be-fokának összege legalább
n, akkor van a gráfnak irányított Hamilton-köre.
Az erősen összefüggő gráf fogalmát lásd a 24.5. fejezetben, az irányított gráfok tulajdonságainál. Az előző tétel
módosításával létrejövő Hamilton-út létezésére vonatkozó tétel a következő:
Ha egy n ≥ 2 pontú egyszerű, irányított gráf minden pontja ki-fokának és be-fokának összege legalább n – 1, akkor van a
gráfnak irányított Hamilton-útja.
Megjegyzés. Ebben a tételben nem kell az erősen összefüggő feltétel, mint az előző Hamilton-körös tételben.
Páros gráfok
Síkba rajzolható gráfok
Extremális gráfok
Páros gráfok
Egy, a mindennapokban gyakran előforduló gráftípust de niálunk a következőkben.
Egy gráfot párosnak mondunk, ha csúcsainak halmazát két diszjunkt részhalmazra bonthatjuk úgy, hogy élek
legfeljebb a két különböző részhalmazba tartozó csúcsok között futnak, míg az egy részhalmazba esők között nincsen
él.
Megjegyzés. Ha az említett két különböző részhalmaz között sem fut él, tehát egyetlen éle sincs a gráfnak, akkor az
üres gráfot kapjuk, amely szintén páros.
A 24.20. ábrán látunk egy páros gráfot; a két csúcshalmazt, melyeken belül nem fut él, az ábrázolás struktúrája miatt
szokás alsó és felső csúcshalmaznak mondani.
24.20. ábra
Járjuk végig egy K kör éleit. Ekkor felváltva leszünk a páros gráf alsó vagy felső csúcsaiban, tehát mindig páros sok él
után érünk ugyanarra a „szintre”. Mivel a kör kezdő- és végpontja azonos, ezért ha pl. a felsőből rajtoltunk, akkor oda is
kell visszafutnunk, s ezért az élek száma valóban páros.
Példák
1. Legyenek a gráf csúcsai egy adott cég álláshirdetéseire jelentkezett személyek és a meghirdetett munkahelyek!
Éllel kössük össze a jelentkezett személyeket azokkal a munkahelyekkel, amit képesítésük és jelentkezésük
alapján betölthetnek. Ez páros gráf lesz, hiszen személyeket egymással nem köt össze él, sem munkahelyeket
egymással. Él csupán személyek és munkahelyek között megy.
2. Hasonló a helyzet egy házasságközvetítő irodában, ahová fér ak és nők jelentkeznek. Mindenki felírja az adatait
és elképzeléseit. Azokat kötjük össze éllel, akik elvileg a kívánságaik alapján összeismertethetők. Mivel egyelőre
Magyarországon még egynemű házasság nem köthető, ezért fér t fér val, illetve nőt nővel biztosan nem kötünk
össze. Így a jelentkezők fenti módon elkészített gráfja biztosan páros lesz.
További példákat találhatunk a következő művekben: Ore, O.: Gráfok és alkalmazásaik. Gondolat, Budapest, 1972
vagy Andrásfai B.: Ismerkedés a gráfelmélettel. Tankönyvkiadó, Budapest, 1985. Lásd még a 24.20. ábrát, ahol a
két diszjunkt csúcshalmazt egy-egy ellipszissel jelöltük.
Páros gráfok esetében az egyik legfontosabb kérdés, hogy létrehozható-e a gráfban olyan párosítás, hogy a fenti első
példában vagy mindenki kap munkát (ez a munkavállalók szemszöge), vagy minden munkahelyet sikerül a jelentkezőkkel
betölteni (ez a munkaadó szempontja). Akármelyikre, de egyszerre csak az egyikre ad szükséges és elégséges feltételt a
következő tétel.
Kőnig–Hall-tétel. Ha egy páros gráfban teljesül az a feltétel, hogy bármiképpen választunk ki néhány, akár az összes
csúcsot az egyik részhalmazból (C1-ből), s vesszük az összes belőlük induló élek végpontjait a másik részhalmazban (C2-
ben), ennek számossága legalább akkora, mint ahány pontot C1-ből választottunk, akkor létezik C1-et fedő párosítás a
páros gráfban. Azaz egy kételemű komponensekből álló egyszerű részgráfot tudunk megadni úgy, hogy C1 minden
csúcsa szerepel benne. Igaz ennek a megfordítása is.
Ha azonos a jelentkezettek száma a munkahelyek számával, akkor esetleg mindkét szempont is teljesíthető. Kérdés,
hogy ez mikor áll fenn. Erre van egy nevezetes tétel, amely szükséges és elégséges feltételt biztosít a kívánt párosítás
létezésére.
Frobenius tétele. Ha egy páros gráfban teljesül a Hall-feltétel valamelyik részhalmazra (C1-re vagy C2-re a fenti
jelölésekkel), és a 2 részhalmaz számossága egyenlő, akkor létezik teljes párosítás a páros gráfban. Azaz egy olyan
kételemű komponensekből álló egyszerű részgráfot tudunk megadni, mely a gráf összes csúcsát tartalmazza. Itt is igaz
ennek a megfordítása is.
Példa. Legyen a gráfunk a 24.21. ábrán látható páros gráf. Itt van teljes párosítás, mert teljesülnek a feltételek (egy
lehetségest vastag vonallal be is rajzoltunk). Ezzel szemben a 24.22. ábra gráfján nem teljesül a házasodási feltétel, így
nem is érdemes keresni párosítást (az A, B, C jelű „alsó” csúcsokhoz, bár három van, mégis csak két csúcs tartozik,
ami azt jelenti, hogy nem teljesül a tétel feltétele, így biztosan nem lehet párokra bontani a páros gráfot).
24.21. ábra
24.22. ábra
A G páros gráf éleinek M részhalmazát párosításnak mondjuk, ha M semelyik két élének nincs közös végpontja.
Tetszőleges gráfban a párosításnak ugyanez a meghatározása, azzal a kiegészítéssel, hogy annak egyik eleme sem lehet
hurokél.
Más szóval, M elemei párosítják (egymáshoz rendelik) a G páros gráf bizonyos csúcspontjait. M-et teljesnek mondjuk,
ha G összes csúcsát párosítja, más szóval, ha M lefedi G csúcsait, s maximálisnak, ha nem létezik M-nél nagyobb elemszámú
M′ párosítása G-nek. Triviális, hogy a teljes párosítás maximális. Valójában a Frobenius-tétel azt mondja ki, hogy ha
teljesül a Hall-feltétel, akkor a maximális párosításban a gráf minden csúcsa szerepel, azaz teljes.
A G gráf éleinek M halmazát függetlennek is nevezzük, ha M semelyik két élének nincs közös végpontja, és nem
tartalmaz hurokélt. Az M független élhalmazt (párosítást) teljesnek mondjuk, ha M végpontjai között G minden pontja
szerepel.
Az M elemei két azonos számosságú részhalmazra bontják G pontjait, ezért nyilván igaz a következő állítás.
Ha a G gráfban van független teljes élhalmaz (teljes párosítás), akkor G csúcsainak száma páros.
Az M független élhalmazt (párosítást) maximálisnak mondjuk, ha G éleinek nincs olyan M′ részhalmaza, mely
független, és több eleme van, mint M-nek. Az M élhalmaz számosságát általában v(G)-vel vagy fémax(G)-vel jelöljük. A
G gráf csúcspontjainak valamely S részhalmazát lefogó ponthalmaznak nevezzük, ha G bármely élének legalább az
egyik végpontja S-ben van. S számosságát szokás τ(G)-vel vagy lpmin(G)-vel jelölni.
Kőnig D. tétele. Bármely páros gráf független éleinek maximális száma egyenlő az éleket lefogó pontok minimális
számával.
Azaz a jelöléseinkkel: v(G) = τ(G) (fémax(G) = lpmin(G)).
Az, hogy v(G) ≤ τ(G) (fémax(G) ≤ lpmin(G)), a de nícióból közvetlenül adódik (tetszőleges gráf esetén is). Kőnig Dénes és
Egerváry Jenő az 1930-as években kifejlesztettek egy módszert a maximális független élek meghatározására, melyet magyar
módszernek is szoktak nevezni. E módszerrel lehet a fordított irányú τ(G) ≤ v(G) egyenlőtlenséget bizonyítani.
24.23. ábra
Maximális számú élt tartalmazó párosítás keresése a magyar módszerrel. Tegyük fel, hogy a páros gráfunk csúcsai A,
illetve B nem üres diszjunkt halmazoknak az elemei, és A-ból A-ba, illetve B-ből B-be nem fut él. Az A és B halmazok
pontjait két egymással párhuzamos egyenesen vettük fel az ábrán, a szemléletesség kedvéért. Legyen adott G-nek egy M
párosítása (M lehet üres is). G-nek valamely e1 e2, e3, e4, …, ek élekből álló útját alternáló útnak fogjuk nevezni, ha az élek
felváltva elemei E(G)/M-nek, illetve M-nek, például e1 ∉ M, e2 ∈ M, e3 ∉ M, e4 ∈ M. A 24.23. ábrán vastag vonallal jelöltük
M éleit, valamint A1-gyel és B1-gyel az A, illetve a B csúcshalmazok M által le nem fedett pontjaiból álló halmazokat. Ha
találunk olyan e1 e2, e3, e4, …, ek alternáló utat, amely B1-ből indul és A1-ben végződik (ezt javító útnak is szokták nevezni),
akkor az e1 e2, e3, e4, …, ek út M-ben lévő, azaz páros indexű éleit cseréljük ki a nem M-ben lévő, azaz páratlan indexűekre.
Az így nyert új M′ párosítása G-nek, és M′-nek eggyel több eleme van, mint M-nek. A következő lépésben meghatározzuk az
M′-höz tartozó A1′, B1′ halmazokat, és keresünk olyan alternáló utat, mely B1′-ből indul és A1′-ben végződik. Az alternáló út
páros indexű éleit M′-ből törölve és M′-höz csatolva az út páratlan indexű éleit, a G-nek egy M ˝ párosítását kapjuk, melynek
eggyel több eleme van, mint M′-nek.
Az algoritmust nyilván addig lehet folytatni, amíg találunk a fent említett típusú alternáló utakat. Megjegyezzük, hogy
természetesen egyetlen B1 és A1 között futó él is megfelelő alternáló út, az algoritmust ezen éleknek a párosításhoz való
hozzávételével szokták kezdeni. Meg lehet mutatni, hogy amikor már nem lelünk alkalmas alternáló utat, akkor az utolsó
lépésben kapott M(n) párosítás maximális párosítás. Ezt az algoritmust könnyű programozni, s ezzel lehet maximális
párosításokat keresni számítógéppel. Ezzel a módszerrel lehet igazolni Kőnig Dénes tételét, másrészt ezzel a módszerrel
lehet bizonyítani a Kőnig–Hall-tételt is, megmutatva, hogy ha alternáló úttal nem növelhetjük tovább az M(n) párosítást
M(n+1)-re, akkor nem lehet, hogy M(n) ne fedje le B-t. A téma egy felbukkanását lásd még a 24.6. fejezetben.
Egy gráfot síkba rajzolhatónak mondunk, ha létezik olyan síkbeli reprezentációja, ahol a csúcsoknak a sík
meghatározott pontjai, míg éleinek a megfelelő csúcsokat összekötő folytonos, önmagukat nem metsző síkgörbék
(nem szükségképpen egyenes szakaszok!) felelnek meg, és két síkgörbének csak a csúcsokban van közös pontja, azaz
másutt nem metszik egymást.
A síkba rajzolható gráfok megfelelő reprezentációi a síkot tartományokra osztják, melyeket a csúcsoknak megfelelő
síkbeli pontok és az éleknek megfelelő síkgörbék határolják, keletkezik egy végtelen tartomány is.
Ezek a tartományok fontos szerepet kapnak később a 24.8. fejezetben, az Euler-féle poliéderformula cím alatt.
Két nevezetes, síkba nem rajzolható viszonylag egyszerű gráf a teljes ötszög, azaz az ötpontú teljes gráf (24.24. ábra) és
az ún. „három ház és három kút” gráf (24.25. ábra). Utóbbi gráfban három pont mindegyike másik három pont
mindegyikével össze van kötve. Állítás, hogy ezek nem síkba rajzolható gráfok.
24.24. ábra
24.25. ábra
A 24.24. ábrán azt látjuk, hogy az A és a D jelű csúcsokat bárhogyan is akarjuk összekötni, mivel a már behúzott élek
által elszeparált részekben vannak, így mindenképpen metszeni fogjuk a tizedik éllel valamelyik már behúzott élt. A 24.25.
ábrán ugyanez a probléma a III és az 1 jelű ház, illetve kút között lép fel. A szaggatott éleket bárhogy húzzuk is be,
mindenképpen létrejön egy metszéspont, azaz nem lehet lerajzolni. Ez illusztráció csupán, hiszen az elején önkényesen
kezdtük el rajzolni az éleket; a teljes bizonyítást, felhasználva, hogy egy gráf pontosan akkor síkba rajzolható, ha gömbre
rajzolható, később az Euler-féle poliédertételből vezethetjük le. (Lásd a 24.8. fejezetben, az Euler-féle poliéderformula című
rész végén szereplő alkalmazást.)
Ha egy gráf élét egy legalább 2 hosszú úttal helyettesítjük, vagy fordítva, egy, a végpontjai kivételével csupa 2 fokszámú
csúcsból álló útját egy éllel helyettesítjük, az így kapott gráf nyilván pontosan akkor síkba rajzolható, ha az eredeti gráf is.
Sőt, ha G′ úgy keletkezik G-ből, hogy csak e fenti két transzformációt alkalmazom egymás után valahányszor, abban az
esetben is G pontosan akkor rajzolható síkba, ha G′ is. Ekkor a G és G′ gráfokat egymással topologikusan izomorfaknak
mondjuk. (Minden gráf önmagával is topologikusan izomorf.) A síkba rajzolhatóság tehát egy, a topologikus izomor ára
nézve megmaradó (invariáns) tulajdonság. Nem síkba rajzolhatók tehát a teljes ötszöggel vagy a „három ház és három kút”
típusú grá al topologikusan izomorf részgráfok sem. Meglepő, hogy minden más gráf viszont igen.
Ezt foglalja össze egy nevezetes, Kuratowskitól származó tétel:
Egy gráf akkor és csak akkor síkba rajzolható, ha sem a teljes ötszöggel, sem a „három ház és három kút” grá al
topologikusan izomorf részgráfot nem tartalmaz.
A tétel egyik iránya nyilvánvaló, hiszen mivel ezzel a két grá al topologikusan izomorf gráfok nem síkba rajzolhatók,
ezért ha a gráf ilyet tartalmaz részgráfként, akkor már az a része sem „rajzolható le a síkba”, tehát nyilván maga a gráf sem
síkba rajzolható. A nehezebb felét most sem bizonyítjuk, a sík bizonyos topológiai tulajdonságait kell kihasználni.
Ez egy viszonylag könnyen ellenőrizhető feltétel, így viszonylag nagy gráfokról is el lehet dönteni, hogy síkba
rajzolhatók-e. Még egy érdekes tétel a következő, amely a folytonos vonalat szakaszra redukálja.
Fáry–Wagner tétele. Ha egy G egyszerű gráf síkba rajzolható, akkor van olyan síkba rajzolása is, melynél minden él
egyenes szakasz.
Ez azt jelenti, hogy ha valahogyan síkba rajzolható, akkor ez „sokszögszerűen” is megtehető. Azaz olyan szakaszokkal,
melyek egymást sehol sem metszik. Ezt a tényt felhasználjuk a fák planáris kódjánál a 24.8. fejezetben, A Prüfer-kód és a
számozott pontú fák cím alatt.
Extremális gráfok
A gráfelméletben gyakran előfordulnak olyan kérdések, amikor azt vizsgáljuk valamilyen típusú gráfok körében, hogy
rendelkezik-e a gráf valamely tulajdonsággal, például hogy tartalmaz-e valamilyen speciális típusú részgráfot. Egy ilyen
eset a következő: rögzített csúcsszámú gráfok körében hogyan függ az élek számától az, hogy biztosan tartalmaz-e a gráf
kört. Láttuk, hogy ha valamely élszámra biztosan van a gráfban kör, akkor nagyobb élszámra is, és így ha valamely élszám
esetén lehetséges a körmentesség, akkor kisebb élszám esetén is. Ebből kifolyólag a fő kérdésünk az volt, melyik az a
legnagyobb élszám, amire még lehet körmentes a gráf. Így jutunk el a fákhoz. Azt is mondhatjuk, hogy a fa-gráf a probléma
szempontjából a „szélsőséges”, extrém eset, a „fordulópont”. Az ilyen típusú problémákat ezért extremálisnak vagy
szélsőérték-problémáknak nevezzük, és a „szélsőséges” számértékkel rendelkező gráfot pedig extrém gráfnak. A
továbbiakban két újabb ilyen problémakörbe pillantunk be.
Ramsey-típusú problémák
Háromszögek gráfokban – egy Turán-típusú probléma
Ramsey-típusú problémák
Feladat. Egy legalább hattagú társaságban mindig igaz, hogy vagy van három ember, akik kölcsönösen ismerik
egymást, vagy van három, akik közül egyik sem ismeri a másikat (24.26. ábra) (mindkettő egyszerre is előfordulhat).
Az ismeretségről feltesszük, hogy kölcsönös. Ezt a gráfok nyelvére a következőképpen fordíthatjuk le. Ha egy
legalább hatpontú gráfot veszünk, akkor vagy a gráfban, vagy a komplementerében van háromszög (háromcsúcsú
teljes gráf).
A megoldás egyszerű, ha észrevesszük, hogy bármely pontját kiválasztva az ismeretségeket ábrázoló gráfnak, abból
vagy legalább 3 él indul, vagy legfeljebb két él indul (ebben az esetben a komplementerben lesz három kiinduló él).
Válasszunk ki egy tetszőleges pontot! Első esetben, ha az ebből kiinduló legalább 3 él végpontjai között van egy él,
akkor megvan a háromszög, ha nincs, akkor viszont megvan az üres háromszög, akik nem ismerik egymást, ami a
komplementerben alkot háromszöget. Második esetben, ha a komplementer gráfban indul három él a kiválasztott
pontból, akkor ezek másik három végpontjára lehet az előbbi gondolatmenetet elvégezni. Ha közöttük a
komplementerben egyetlen él is fut, akkor megvan a komplementerben a háromszög, s így találtunk az eredetiben
üres háromszöget, vagy ha a három pont között a komplementerben nincs egyetlen él sem, akkor viszont az
eredetiben találtunk háromszöget (lásd a vastag vonallal jelölt háromszögeket a jobb oldali komplementer gráfban).
24.26. ábra
Az előbbi feladat elmondható úgy is, hogy ha egy legalább hatpontú teljes gráf éleit két különböző színnel színezzük,
azaz minden gráfél valamelyik színű, akkor bárhogyan is színeztük ki, van egyszínű háromszög. Ötpontú teljes gráfra nem
igaz ugyanez, például ha a teljes ötszög „oldalait” az egyik, „átlóit” a másik színnel színezzük, akkor nem lesz benne
egyszínű háromszög. Így nyilván ötnél kevesebb pontú teljes gráfra sem igaz, mert ha igaz lenne, akkor ötpontúra is igaz
lenne, az ugyanis tartalmaz részgráfként minden nála kevesebb pontú teljes gráfot.
Ez azt jelenti, hogy ha két színnel színezzük a teljes gráfok éleit, akkor van egy olyan pozitív egész szám, hogy annál
nagyobb vagy egyenlő csúcsszámúakban bármilyen színezés esetén van vagy ilyen, vagy olyan színű háromszög, esetleg
mindkettő, de az annál kisebb teljes gráfokat lehet úgy színezni, hogy ne legyen. Általánosítva a problémát, kérdés, hogy
tetszőleges m ≥ 2 és k ≥ 2 egész számok esetén létezik-e olyan n egész szám, melyre teljesül a következő. Egyrészt bármely
legalább n csúcsú teljes gráf éleit két színnel színezve, biztosan keletkezik bennük vagy teljes m csúcsú gráf (röviden m-
gráf) csupa azonos színű éllel, vagy teljes k-gráf, melynek minden éle a másik színnel lett színezve, másrészt az n-nél
kevesebb csúcsú teljes gráfoknak van olyan színezése, melyre ez nem igaz (tehát n a legkisebb szám, amelyre igaz). Erre a
kérdésre F. P. Ramsey közgazdász, matematikus adta meg az igenlő választ az 1920-as években. Ezt, illetve ennek
általánosításait nevezzük Ramsey-tételnek.
A továbbiakban elnevezéseket vezetünk be, megemlítünk néhány fontos állítást, köztük e tétel igazolásának főbb
gondolatait, majd becsléseket keresünk ezekre a számokra, melyek létezését állítja tételünk.
Legyen n(m, k) az a legkisebb egész szám, amely azzal a tulajdonsággal bír, hogy ha bármely legalább n(m, k)-pontú
teljes gráf éleit két színnel színezzük, akkor létrejön részgráfként vagy piros teljes m-gráf, vagy kék teljes k-gráf,
amennyiben létezik ilyen szám. Extrém gráfok azok a kétszínű (piros-kék) teljes n(m, k) – 1-gráfok, amelyek nem
tartalmaznak sem piros teljes m-gráfot, sem kék teljes k-gráfot. (Pontosabban azok az n(m, k) – 1-gráfok, melyeknek
nincs teljes m-gráf részgráfjuk és a komplementerüknek nincs teljes k-gráf részgráfjuk.) Az n(m, k) számokat nevezzük
Ramsey-számoknak.
Ezt úgy is lehet fogalmazni, hogy n(m, k) az a legkisebb pozitív egész szám, amelyre igaz, hogy minden legalább n(m,
k)-pontú gráf tartalmaz teljes m-gráfot, vagy k páronként független pontot (azaz komplementere tartalmaz teljes k-gráfot),
lásd a bevezető feladatot. A bevezető feladat megoldása szerint tehát n(3, 3) = 6. A két szín felcserélésével kapjuk a következő
összefüggést.
Minden m ∈ N és k ∈ N esetén, ha n(m, k) létezik, akkor n(k, m) is, és n(m, k) = n(k, m).
Mondhatjuk, hogy a teljes 1-gráf, ami mindössze 1 pont, minden éle piros vagy éppen kék, hiszen nincsen éle. Ezért n(1,
k) = 1. Ha egy teljes gráf nem tartalmaz piros teljes 2-gráfot, az azt jelenti, hogy nincs piros éle.
Érdekes, hogy mindössze néhány esetben ismerjük a Ramsey-számok pontos értékét. (Ezért fogunk a továbbiakban
csak becsléseket keresni.) Néhány ilyen eset:
Ha n(m – 1, k) és n(m, k – 1) létezik, akkor n(m, k) is létezik, és fennáll, hogy n(m, k) ≤ n(m – 1, k) + n(m, k – 1). Továbbá,
ha mind n(m – 1, k), mind n(m, k – 1) páros, akkor n(m, k) < n(m – 1, k) + n(m, k – 1) (szigorúan kisebb).
A fentiek segítségével igazolható a téma következő két alapvető tétele.
Igazolása egy érdekes indukciós okoskodás következménye, melynek alapgondolata a bevezetőben leírt
gondolatmenethez hasonló.
Ez a tétel ugyanúgy indukcióval igazolható, mint a létezést kimondó Ramsey-tétel, felhasználva, hogy
Az előzőek alapján:
(24.4)
létezik határérték.
További általánosítása a problémakörnek, hogy ha egy teljes gráfot k színnel színezünk, akkor legkevesebb hány pontú
teljes gráf esetén van biztosan egyszínű teljes k + 1 részgráf (két szín esetén a teljes 3-gráf a háromszög). Még tovább
általánosítva, ha k színnel színezünk, legkevesebb hány pontú G teljes gráf esetén van biztosan első színű teljes m1-gráf,
második színű teljes m2-gráf, …, k-adik színű teljes mk-gráf közül legalább egy részgráfként G-ben.
Ha egy G egyszerű gráf pontjainak száma 2k (k ≥ 2), és minden P pontjára igaz, hogy gr(P) > k, akkor a gráf tartalmaz
háromszöget.
Eszerint, páros csúcsszám esetén, ha létezik extrém gráf, akkor annak kell hogy legyen olyan csúcsa, melynek a
fokszáma legfeljebb a csúcsok számának a fele. A többi csúcs fokszámáról semmit nem állít, így az élek számáról sem;
páratlan csúcsszám esetére pedig nem mond semmit a tétel.
Háromszöget nem tartalmazó n pontú és e élű G egyszerű gráfra , ahol α(G) jelöli a gráf független
pontjainak maximális számát.
Itt már nyertünk egy felső becslést extrém gráfunk éleinek a számára (ha létezik). Egy további tétel, amely már éles
felső becslést ad az élek számára, és ismertet is ennek megfelelő extrém gráfot, a következő, amelyik a Turán-tétel egy
speciális esete.
Háromszöget nem tartalmazó n pontú és e élű G egyszerű gráfra , ha n páros szám, illetve
Ebben a gráfban nincs háromszög, páros gráf, és éleinek száma 20, ami éppen a formula felső korlátja. Annak
igazolása, hogy más (ezzel nem izomorf) extrém gráf nincs, nehezebb.
24.27. ábra
Végül vizsgáljuk az „elég sok” élű gráfokat aszerint, hogy legalább milyen hosszú utakat (köröket) tartalmaznak.
Ha egy legalább 2k + 1 (k pozitív egész szám) pontú összefüggő egyszerű gráf minden pontjának foka legalább k, akkor
van a gráfban 2k hosszúságú út.
Ha egy n-pontú egyszerű gráf nem tartalmaz k-nál hosszabb utat (k ≥ 1), akkor éleinek számára fennáll, hogy
. Extrém gráfok (amelyekre egyenlőség áll) rögzített k mellett azok, amelyeknek minden komponense teljes (k + 1)-
gráf; más extrém gráf nincs.
Ugyanúgy, ha egy gráfban elég sok él van, akkor lesz benne elég hosszú kör is. Erről szól fejezetünk utolsó tétele.
Ha egy n-pontú egyszerű gráf nem tartalmaz k-nál hosszabb kört (k ≥ 2), akkor éleinek számára fennáll, hogy
. Extrém gráfok (amelyekre egyenlőség áll) azok az összefüggő gráfok, amelyeknek minden tagja teljes
k-gráf; más extrém gráf nincs (lásd a 9-pontú 3-nál hosszabb kört nem tartalmazó extrém gráfot a 24.28. ábrán).
24.28. ábra
Legyen adva egy diszjunkt P és E halmaz, valamint egy leképezés, amely E minden eleméhez egy P-beli – nem
szükségképpen különböző elemekből álló – rendezett párt rendel hozzá. A G = (P, E, ) rendezett hármast irányított
gráfnak nevezzük, ahol a P halmaz elemeit a gráf csúcspontjainak vagy röviden pontjainak, míg az E halmaz elemeit a
gráf irányított éleinek nevezzük, melyeknek – nem szükségképpen különböző – kezdő- és végpontjaik vannak.
Ismét megadjuk az irányított gráfok lehetséges ábrázolásait a már tárgyalt gráfok mintájára. Irányított gráfot
megadhatunk:
I. Ha megadjuk a P, E halmazt és a leképezést.
Példa: P = {A, B, C, D}, E = {e, f, g, h} és a : E ↦ P × P leképezés pedig:
, ahol a rendezett párokat 〈X, Y〉 jelöli.
II. Lehet rajzzal is megadni a síkon, ahol a csúcsokat a sík jelölt pontjai, az éleket pedig a pontok között vezető irányított
folytonos, és önmagukat nem metsző görbék reprezentálják. Az előbbi gráf ezen a módon a következőképpen néz ki (24.29.
ábra); a hurokél irányítását nem jelöltük, mert ott érdektelen (akár azt is mondhatjuk, hogy a hurokélt nem irányítjuk).
24.29. ábra
III.Számítástechnikában egy négyzetes mátrixszal lehet megadni egy irányított gráfot. A sorai és az oszlopai egyaránt a P
halmaz elemeivel indexelendők, míg az aij mátrixelem értéke k ∈ N, amely 0, ha nincs irányított él a Pi pontból a Pj
csúcspontba, 1, ha van egy irányított él, és ha többszörös irányított él van, akkor k ≥ 2.
Ismét az I.-beli gráfot adjuk meg ezen a módon: . Számítógépben általában így reprezentálódik egy
irányított gráf. Jegyezzük meg, hogy ez a mátrix már nem feltétlen lesz szimmetrikus, hiszen „iránya” van az éleinek.
Ha szimmetrikus a irányított gráf mátrixa, az azt jelenti, hogy tetszőleges A és B gráfbeli pontok esetén, pontosan
akkor megy él A-ból B-be, ha B-ből is megy él A-ba (az ábráján minden vonal kétfelé irányított). Ekkor (és csak ekkor) -
nek kölcsönösen egyértelműen megfeleltethető egy azonos csúcsszámú G (irányítatlan) gráf, melyben azok a pontok
vannak éllel összekötve, melyeknek megfelelők között megy (mindkét irányba) él -ben. Az (irányítatlan) gráfokat így
„tekinthetjük” szimmetrikus mátrixú irányított gráfoknak, s ekkor azokra mint speciális irányított gráfokra gondolhatunk
(például egy csupa kétirányú utcából álló úthálózat).
Egy irányított gráf egy pontjának ki-foka az a száma, ahány irányított él abból a pontból indul. Hasonlóan a pont be-
foka az a szám, ahány élnek ez a pont a végpontja.
Minden irányított gráfban a ki-fokok összege is és a be-fokok összege is az élek számát adja.
Példa. Az alábbi gráfban hat csúcs van, s a ki-fokok sorozata: 2, 1, 3, 1, 3, 2; hasonlóan a be-fokok sorozata 1, 2, 2, 2, 2, 3.
Látható, hogy mindkettő összege 12, s ez éppen az élek száma. Egyébként egy kettős él van a 24.30. ábrán, ellentétesen
irányítva a P3-mal és a P6-tal jelölt pontok között.
24.30. ábra
Egy irányított gráfot egyszerűnek nevezünk, ha nem tartalmaz sem hurokélt, sem két olyan irányított élt, melyeknek
ugyanaz a kezdő- és a végpontjuk. Kétszeres éleket tehát tartalmazhat, de csak ellentétes irányítással.
Egy irányított gráf éleinél eltekinthetünk a kezdő- és végpont megkülönböztetésétől, azaz eltávolíthatjuk az
irányítását, s ekkor egy egyértelműen meghatározott G (irányítatlan) gráfot kapunk. Fordítva, egy (irányítatlan) gráf éleit
is irányíthatjuk, ekkor azonban általában sokféle irányított gráfot kaphatunk, pontosan 2e–h-félét, (e az élek, h a hurokélek
száma) attól függően, hogy hogyan irányítottuk az éleket.
Egy irányított gráfban (irányítatlan) élsorozatnak nevezzük az irányított élek egy olyan részhalmazát, amely a
megfelelő G irányítatlan gráfban egy sétát alkot.
Ha egy élsorozat irányítása olyan, hogy az irányított élek egymáshoz irányítottan csatlakoznak, akkor irányított
sétáról vagy irányított élsorozatról beszélünk, illetve ha ennek kezdő- és végpontja azonos, akkor irányított
körsétáról. Ha semelyik él nem ismétlődik, akkor irányított vonalról, illetve ha a kezdő- és a végpont megegyezik,
akkor irányított körvonalról van szó. Hasonlóan, a pontismétlés nélküli irányított sétát irányított útnak, illetve
kezdő- és végpontegyezés esetén irányított körnek mondjuk.
Gráfok irányításai
Ha egy teljes gráf éleit valahogyan irányítással látjuk el, akkor bárhogyan is tesszük, mindenképpen lesz benne egy
irányított Hamilton-út, tehát a gráf összes csúcsát tartalmazó irányított út. Ez volt Kőnig Dénes irányított gráfokra
vonatkozó tétele.
Ez azt jelenti, hogy ha egy egyfordulós bajnokság résztvevőit vesszük, akkor mindig fel lehet őket sorolni úgy, hogy a
sorban egymás után következők legyőzték az utánuk állókat. Itt most feltételezzük, hogy döntetlen nem lehet, tehát
például kosárlabda- vagy teniszbajnokság esetén lehet használni ezt az eredményt.
A 24.3. fejezetben további három tételt fogalmaztunk meg irányított Hamilton-utak és Hamilton-körök létezésére
vonatkozóan.
Egy fontos kérdés például egy városi közlekedés egyirányúsításánál, hogy lehet-e az éleket (utcák, hidak) úgy
irányítani, hogy bármely pontból bármely pontba el lehessen jutni irányított éleken (úton) keresztül.
Egy irányított gráfot erősen összefüggőnek nevezünk, ha bármely pontjából bármely másik pontjába el lehet jutni
irányított úton.
Nyilvánvaló, hogy egy erősen összefüggő irányított gráf esetén a megfelelő G irányítatlan gráf összefüggő, tehát
nem összefüggő gráfnak nem létezik olyan irányítása, hogy az így kapott gráf erősen összefüggő legyen, hiszen egy -
beli irányított út irányítás nélküli megfelelője egy út G-ben. Ugyanakkor a G gráf összefüggősége nem elegendő feltétele
annak, hogy erősen összefüggő legyen, és hasonlóan, egy összefüggő gráfnak nem feltétlenül létezik erősen
összefüggő irányítása, hiszen ha egy él hídél az irányítatlan gráfban, akkor azt csak valamerre lehet irányítani, s akkor a
másik irányban nem lehet e két rész között közlekedni.
Összevetve egyrészt azt kaptuk tehát, hogy egy irányított gráf erősen összefüggőségének szükséges feltétele, hogy
G összefüggő legyen, és ne tartalmazzon hidat; másrészt annak, hogy egy gráfnak létezzen erősen összefüggő irányítása,
szükséges feltétele, hogy a gráf összefüggő legyen, és egyik éle se legyen hídél. Igaz az utóbbinak (de csak annak) a
megfordítása is; így kapjuk az alábbi tételeket.
Egy gráf pontosan akkor irányítható úgy, hogy az így kapott irányított gráf erősen összefüggő legyen, ha összefüggő, és
nem tartalmaz hidat.
Ha egy irányított gráf erősen összefüggő, akkor a neki megfelelő G irányítatlan gráf összefüggő, és egyetlen éle
sem hídél.
Megjegyzés. Itt nem teljesül a megfordítás. Ellenpélda egy olyan irányított háromszög, ahol az egyik csúcs felé mutat
mindkét arra illeszkedő él, mert ekkor ebből a csúcsból nem vezet sehova irányított él (út).
A 24.31. ábrán a bal oldali gráf egy irányítása a jobb oldali. Mivel itt mindenhonnan mindenhová eljutunk irányított
út mentén, ezért erősen összefüggő. Látható ez abból, hogy a bal oldali összefüggő, és nincsen hídéle.
24.31. ábra
Az újságíró paradoxona
Egyszer egy sportújságíró észrevette, hogy egy körmérkőzéses bajnokság résztvevőit a következő paradox módon lehet
felsorolni. Legelöl áll az utolsó helyezett, utána következik egy csapat, akit legyőzött, azután egy, a második helyen álló
által legyőzött és így tovább, s végül utoljára a bajnok, akit a sorrendben őt közvetlenül megelőző győzött le. Az ilyen
paradox felsorolás létezésének a szükséges és elégséges feltétele előtt de niáljunk két fogalmat.
Nevezzük alsóháznak a bajnokság végén álló csapatok halmazát, ha ők együttesen sem győztek le egyetlen csapatot
sem az őket a bajnokságban megelőzők közül, és azok halmaza nem üres. Hasonlóan nevezzük felsőháznak a tabella
elején álló csapatok társaságát, ha senki sem győzte le őket az alattuk levők közül (amely halmaz szintén nem üres).
Megjegyzés. E feltétel mellett, ha van alsóház egy bajnokságban, akkor az ezen kívül eső csapatok természetesen
felsőházat alkotnak, tehát ez a két fogalom egymás létezését kölcsönösen tételezi. Ha van az egyik, akkor van a
másik. Vagy egyik sincs.
Példa. Kis módosítással (a döntetlenek miatt szükséges) a futballal is lehet dolgozni. Vegyük egy bajnokság őszi
végeredményét, s ahol döntetlen volt, ott a tavaszi eredmény alapján jelöljük ki a győztest. A táblázatban a csapatok a
bajnokság végeredménye szerint vannak felsorolva, tehát az MTK az első és a DVFC az utolsó helyen áll. Látható,
hogy fel lehet sorolni a csapatokat a paradoxonnak megfelelő módon.
A keresett lánc a következő: DVFC – BHFC – TFC – KRFC – FCF – VSC – ETO – PMFC – DVTK – UTE – DVSC – FCS – REAC
– PSE – ZTE – MTK. Az eredmények rendre: 3 : 1; 2 : 1; 4 : 2; 1 : 0; 2 : 0; 3 : 2; 0 : 0*; 3 : 1; 1 : 0; 2 : 0; 6 : 1; 3 : 1; 4 : 3; 2 : 0; 1 : 0. A *-
gal jelölt eredmény mindkét mérkőzésen döntetlen, de az ETO előrébb végzett, így jobbnak vettük. Az olvasóra hagyjuk
további hasonló lista elkészítését.
E példa után álljon itt a főállítás, amit a sportújságíró paradoxonának mondanak, hiszen elég meglepőt állít, ami csak
„a jobbnak lenni valakinél” reláció tranzitivitásának feltételezése miatt tűnik ellentmondásnak, ez azonban a sportban
nem tranzitív.
Ha egy körmérkőzéses, döntetlent nem tartalmazó bajnokság végeredményét tekintve nem létezik alsó-, illetve
felsőház, akkor mindig fel lehet a csapatokat sorolni a következő módon. Minden csapat legyőzte a felsorolásban
közvetlenül utána következőt, s a sorban első a bajnokság utolsó helyezettje, míg az utolsó a bajnok. Nyilván egyszerre
létezik alsó-, illetve felsőház egy döntetlent nem tartalmazó bajnokságban.
Az világos, hogy miért szükséges feltétele a paradox felsorolásnak az, hogy ne létezzen alsó-, illetve felsőház. Hiszen ha
léteznek, akkor biztosan nem lehet kívánt felsorolás, mivel az utolsóval kezdve egyszer csak elakadunk, legkésőbb, amikor
felsoroltuk az egész alsóházat, mert azok már senkit sem győztek le a bajnokságban előttük levők közül. Az érdekes, hogy
ez elégséges feltétel, s ennek belátását az olvasóra bízzuk, vagy ajánljuk Ore, O.: Gráfok és alkalmazásaik című könyvét
(Gondolat, Budapest, 1972), amelyben elolvasható a tétel bizonyítása.
Hogyan szervezzünk körmérkőzéses bajnokságot?
Egy alapvető kérdés a fentihez hasonló körmérkőzéses bajnokságok esetén, hogy hogyan szervezzük meg a fordulókat. Ha a
csapatok száma páros (és ez az általános), akkor egy fordulón azt értjük, hogy minden csapat játszik valakivel egy
mérkőzést. Nyilván ha a csapatok száma 2n, akkor fordulónként n mérkőzés van. Öszszesen 2n – 1 mérkőzést kell játszania
minden csapatnak, tehát ennyi fordulóban lehet lebonyolítani a bajnokságot. A kérdés, hogy ez megoldható-e mindig. Azaz
nem lesz-e olyan eset, hogy egy fordulót a vége felé nem tudunk megszervezni, mert olyan párosítások lennének, amelyek
már voltak. Be fogunk mutatni egy módszert, amivel megvalósítható, hogy ez ne forduljon elő.
Ha páratlan sok csapat lenne, akkor egy ktív csapatot vegyünk hozzájuk, neve legyen „Pihenőnap”, így már páros
sokan vannak, s aki a pihenővel kerül össze, az abban a fordulóban nem játszik. Egy konkrét párosítás a következő
példában egy 8 csapatos 7 fordulós bajnokság esetén:
1. forduló: 1 : 8; 2 : 7, 3 : 6, 4 : 5
2. forduló: 1 : 7, 2 : 8, 3 : 5, 4 : 6
3. forduló: 1 : 6, 2 : 5, 3 : 7, 4 : 8
4. forduló: 1 : 5, 2 : 6, 3 : 8, 4 : 7
5. forduló: 1 : 4, 2 : 3, 5 : 6, 7 : 8
6. forduló: 1 : 3, 2 : 4, 5 : 7, 6 : 8
7. forduló: 1 : 2, 3 : 4, 5 : 8, 6 : 7
Megfeleztük a 8 csapatot, és először az első 4-hez sorsoljuk a második négyet a párosításban látható szisztéma szerint,
így jött létre az első 4 forduló. Ezután már csak az első négyet egymással és a második négyet egymással kell párosítani, így
kapjuk az utolsó három fordulót, hármat, mert ekkor önmagával senki sem játszhat. Ez könnyen általánosítható, amit itt
most nem adunk meg, de a módszer teljesen hasonló. Lásd még Ore, O.: Gráfok és alkalmazásaik. Gondolat, Budapest, 1972.
Hálózati folyamok
A maximális folyam problémája
A maximális folyam problémájának néhány következménye: Menger tételei
A maximális folyam problémájának néhány általánosítása
Minimális költségű folyam – a híres szállítási probléma
Hálózati folyamok
A gráfelmélet II. világháború során történt nagy előrelépése a következő problémák megoldását hozta magával.
Az eredményes hadviselés megkívánja, hogy a hadsereg egységeit szükség esetén gyorsan át tudjuk csoportosítani.
Hasonlóan, logisztikai és áruszállító cégek hatékony működésének feltétele, hogy gyorsan, nagy mennyiségű árut
juttassanak el a gyártóktól a fogyasztókhoz. Ez általában közúton, vasúton, vízi úton és légi úton történhet, kiindulási
helyek és célállomások közötti előre adott, egymással esetleg máshol is találkozó útvonalak mentén. A gyorsaság több
tényező függvénye. Függ az adott útvonalszakaszokon rendelkezésre álló szállítóeszközök számától és azok
befogadóképességétől, melyek együttesen tekinthetők az egyes útvonalszakaszt jellemző mennyiségnek, az útvonalszakasz
kapacitásának. Függ továbbá több útszakasz találkozási helyeinek, azaz a csomópontoknak a kapacitásától, amely a
csomópontot jellemző mennyiség. Ezek a csomópontok városokat, repülőtereket, vasút- és hajóállomásokat jelentenek, de
lehetnek akár egy városon belüli helyszínek vagy az útvonalak egyéb elágazásai is. Fontos probléma az optimális szállítás
meghatározása, vagyis hogy egy folyamatos szállítást feltételezve (mely persze a valóságban mindig csak adott ideig tart,
vagy időközönként ismétlődik) mely útszakaszokon mennyi katonát, árut stb. szállíthatunk egyszerre úgy, hogy adott
időegység alatt a lehető legtöbb érjen célba.
A fenti problémákhoz hasonlóak (főleg azok általánosításai) felmerülnek például vízvezeték-, elektromos, illetve
telekommunikációs vagy egyéb információs hálózatok tervezésekor is. Mindegyik alkalmazásban felmerülnek olyan
problémák, ahol a kiindulási és célállomásokat, illetve a csomópontokat egy gráf csúcsainak, a közöttük futó
útvonalszakaszokat (vagy vezetékrészeket, információs csatornákat stb.) pedig a gráf éleinek tekintve modellezhetjük egy
irányított grá al a feladatot. Ennek a gráfnak az éleihez, illetve a csomópontokat reprezentáló csúcsaihoz pozitív valós
számokat rendelünk, melyek a megfelelő útvonalszakaszon (vezetékrészen) szállítható, illetve a megfelelő csomóponton
átküldhető mennyiségek mérőszámainak felső határai. (A további általánosításokat lásd később.)
Az optimális szállításra vonatkozó tételek, illetve az azt eredményező algoritmus L. R. Ford, Jr. és D. R. Fulkerson
amerikai matematikusokhoz fűződnek, de meg kell jegyezni, hogy már a század elején, ha nem is ebben a formában, de
logikailag ekvivalens módon K. Menger osztrák matematikus is felfedezte eredményeik lényegét. Az ő munkájában Kőnig
Dénes fedezett fel egy hiányosságot, melyet könyvében pótolt, s azóta bizonyítását, illetve a bizonyítás során vázolt
algoritmikus eljárást magyar módszernek nevezik. Ez sok más területen is felhasználható, lásd a 24.4. fejezetben, a Páros
gráfok cím alatt. (Ehhez az ott bevezetett fogalmakon túl még kettőre van szükség.)
Ha adott egy irányított gráf, s és t két egymástól különböző kijelölt pontjával (s a kiindulási, t a célállomásnak felel
meg) és egy éleinek halmazán értelmezett pozitív valós értékű c függvény (az útvonalszakaszok kapacitásai az
egyes élekhez rendelt értékek), akkor a rendezett négyest hálózatnak nevezzük.
s-et forrásnak, t-t nyelőnek mondjuk, de szokásos még s-re a termelő és t-re a fogyasztó elnevezések használata is. A c
függvényt kapacitásfüggvénynek, egy élhez rendelt értékét az él kapacitásának nevezzük.
Megjegyezzük, hogy szokás hálózatként ennél általánosabb struktúrákat is de niálni, melyek közül néhányról a
maximális folyam problémájának általánosítása kapcsán később említést teszünk.
Példa. Ez egy lehetséges modellje például egy vízvezeték-rendszernek, ahol az élek kapacitásai mutatják, hogy az
élekkel reprezentált csővezetékrészeken időegység alatt legfeljebb mennyi víz folyhat át. Annak leírására, hogy
ténylegesen mennyi víz folyik át a rendszer működésének különböző állapotaiban, bevezetünk újabb fogalmakat.
Nyilvánvaló, hogy amennyiben nem számolunk például csőrepedéssel, feltehetjük, hogy a vezetékek valamely
találkozási pontjánál (a forrást és a nyelőt leszámítva) amennyi víz befolyik a különböző csöveken, pontosan
ugyanannyi folyik tovább.
Folyamnak nevezünk egy hálózat éleinek halmazán értelmezett pozitív valós értékű f függvényt, ha esetleg a forrás és
a nyelő kivételével bármely v pontjára teljesül, hogy (megmaradási feltételek) és 0 ≤ f(e) ≤
c(e) a hálózat minden élére, ahol c a kapacitásfüggvény.
Szokásos a megengedett folyam elnevezés is, és ekkor a folyamra az utóbbi feltételt nem követelik meg. Ez értelmet
nyerhet például akkor, ha lehetőség van az élkapacitások növelésére, például egy esetleges felújítás folyamán.
Célunk olyan folyam keresése, amelynél a nyelőbe beáramló víz mennyiségéből levonva az onnan visszaáramló víz
mennyiségét, az így kapott érték a lehető legnagyobb. Ha a csővezetékek találkozási helyeinek halmazát két részre osztjuk
úgy, hogy az egyikben a forrás, a másikban a nyelő van, és megnézzük, hogy a két rész közötti vezetékekben összesen
mennyi víz áramlik a nyelőt tartalmazó rész felé, levonva a forrást tartalmazó felé áramló mennyiséget, akkor nyilván
ennél nem lehet nagyobb a keresett érték.
Osszuk a hálózat csúcsainak halmazát két diszjunkt részre, S-re és T-re úgy, hogy S az s forrást, T a t nyelőt
tartalmazza. Ekkor az összes S és T között futó hálózatbeli élek alkotta V halmazt s – t vágásnak nevezzük.
értéket a V s – t vágás kapacitásának nevezzük, és c(V)-vel jelöljük. Egy V s – t vágás kapacitása tehát a
V-beli, azaz az S-beli pontból T-beli pontba mutató élek kapacitásainak összege.
Egy adott f folyam és V s – t vágás esetén a értéket nevezzük az f folyam V vágáson felvett
értékének.
Adott hálózatban, bármely folyam és bármely V s – t vágás esetén a folyam V vágáson felvett értéke
legfeljebb annyi, mint a vágás kapacitása.
Ha egy tetszőleges V s – t vágás és egy szintén tetszőleges f folyam esetén a T\{t} halmaz v csúcsaira felírt
értéket, akkor a következőt kapjuk. Egyrészt az f folyamnak minden, a T\{t} halmaz két pontja
között futó élén felvett értéke pontosan egyszer szerepel pozitív és pontosan egyszer negatív előjellel az így kapott egyenlet
bal oldalán, másrészt a T\{t} és t közötti éleken vett folyamértékeket, szintén a bal oldalon, pontosan egyszer vettük pozitív
és pontosan egyszer negatív előjellel. Így ezekkel egyszerűsítve a bal oldalon a különbség,
tehát az f folyam V vágáson felvett étéke marad, a jobb oldalon pedig a érték. Ebből következik
az alábbi állítás.
Egy hálózat bármely folyamára igaz, hogy annak bármely vágáson felvett értéke ugyanannyi. Ez az érték tehát csak a
folyamtól függ, a vágástól nem.
Mint korábban említettük, adott hálózat (és így adott vágások és adott vágáskapacitások) esetén olyan folyam
megtalálása a célunk, amelynél ez az érték a legnagyobb, tehát maximális értékű folyamot keresünk. Az eddigiek
értelmében igaz a következő fontos tétel:
Kérdés, hogy a határ minden hálózat esetén elérhető-e, és létezik-e algoritmikus módszer a maximális értékű folyam
megtalálására. A válasz mindkettőre igen, és Ford–Fulkerson-tétel és algoritmus néven váltak ismertté. Ezek precíz
belátását az olvasóra bízzuk, csupán az ezekhez szükséges további fogalmakat vezetjük be, kimondjuk az ide kapcsolódó
főbb tételeket, és vázlatosan ismertetjük a bizonyítási gondolatmenetek fő pontjait, illetve az említett algoritmust,
melynek első lépéseként egy tetszőleges f1 folyamot veszünk. (A minden élen 0 értéket felvevő folyam például tökéletesen
megfelel.)
Legyen adott egy hálózat és ezen egy f folyam. Ha létezik a -nek megfelelő G irányítatlan gráfban egy
olyan s – t út, melynek minden e élére teljesül, hogy amennyiben annak -beli irányítása az út mentén t felé mutat,
akkor f(e) < c(e), ha pedig s felé, akkor f(e) > 0, akkor ezen út -beli megfelelőjét javító útnak nevezzük a
hálózatban, az f folyamra nézve.
A javító út mentén tehát, ismét vízvezeték-hálózatos példánkkal szemléltetve, minden élen vagy kevesebb víz folyik t
felé, mint amennyi legfeljebb folyhat, vagy folyik visszafelé víz (esetleg mindkettő).
Ha találunk egy ilyen utat valamely fk folyam esetén, akkor keressük meg a „t felé mutató” e élekre a c(e) – fk(e), az „s
felé mutató” e élekre pedig az fk(e) számok legkisebbikét, és vegyük e kettő közül is a nem nagyobbat (mk). Ezután az előbbi
éleken ennyivel növeljük, az utóbbiakon pedig ennyivel csökkentsük a folyam szerinti értéket (míg a többi élen hagyjuk
változatlanul azt). Így kapunk egy új fk+1 folyamot – hiszen minden élhez rendelt érték 0 és c(e) között marad, és a
megmaradási feltételek is ismét teljesülnek –, és fk+1 értéke nagyobb (mk-val), mint fk értéke.
Az algoritmus során ilyen javító utaknak legalább a kezdeményeit igyekszünk felépíteni s-ből indulva, melyek esetleg
nem t-ben végződnek (ezért kezdemények), de a javító út minden más feltételének eleget tesznek. Ha találunk olyat, amely
eljut t-ig, akkor a fentiek értelmében „javítunk” a folyamon, nagyobb értékűt veszünk helyette.
Megmutatható (ezt bízzuk az olvasóra), hogy ha nem létezik s – t javító út a kezdemények között, akkor a javítóút-
kezdemények végpontjai (s-et is idevéve) által alkotta csúcsok halmaza és a hálózat maradék csúcsainak halmaza között
futó élek alkotta vágás kapacitása egyrészt minimális a hálózat összes vágáskapacitása között, másrészt egyenlő a folyam
értékével, amely így a maximális folyamérték, tehát megtaláltuk, amit kerestünk, véget ért az algoritmus.
Ennek megfelelően igaz a következő tétel.
Egy hálózatban egy f folyam értéke akkor és csak akkor maximális, ha nincs s – t javító út, ami akkor és
csak akkor teljesül, ha létezik olyan vágás, melynek kapacitása egyenlő az f folyam értékével.
Legyenek s és t egy irányított gráf két különböző pontja. Az s – t irányított utakat lefogó élhalmaz éleinek
olyan halmaza, amely tartalmazza minden s – t irányított útnak legalább egy élét. Jelöljük ezt LÉ(s – t)-vel.
Egy G irányítatlan gráfban hasonlóan de niáljuk az s – t utakat lefogó élhalmazt (az irányított jelzők elhagyásával), és
szintén LÉ(s – t)-vel jelöljük. Ez utóbbi esetben s és t sorrendje nem számít, de irányított gráfnál természetesen igen.
Feltehetjük, hogy az mindig adott és egyértelmű, hogy mely, tehát az is, hogy irányított vagy irányítatlan gráfról van
szó.
Irányított gráfban élfüggetlen s – t irányított utak halmazán olyan s – t irányított utak halmazát értjük, amelyek közül
semelyik kettőnek nincs közös éle. Jelölése: ÉFU(s – t). Hasonlóan de niáljuk és jelöljük irányítatlan gráf élfüggetlen s
– t útjainak halmazát.
Egy irányított gráfban az s – t irányított utakat lefogó ponthalmaz olyan pontjainak halmaza, amely nem
tartalmazza s-et és t-t, de tartalmazza minden s-t irányított útnak legalább egy pontját. Jelöljük ezt LP(s – t)-vel.
Egy G irányítatlan gráfban hasonlóan de niáljuk az s – t utakat lefogó ponthalmazt, és szintén LP(s – t)-vel jelöljük.
Irányított, illetve irányítatlan gráfban pontfüggetlen s – t irányított, illetve irányítatlan utak halmazán olyan s – t
irányított, illetve irányítatlan utak halmazát értjük, amelyek közül semelyik kettőnek nincs közös belső pontja (persze
közös s és t), jelben PFU(s – t).
Ha adott egy irányított gráf és két kijelölt pontja, akkor az éleinek halmazán értelmezett azonosan 1 értékű
függvénnyel együtt ez egy hálózatot alkot, melyre alkalmazhatjuk a Ford–Fulkerson-tételt. Irányítatlan gráf esetén,
minden élét ellentétesen irányított kettős élekkel helyettesítve egy irányított gráfot kapunk. Ezek segítségével igazolható a
következő tételpár.
Ha s és t egy irányított gráf 2 tetszőleges pontja, akkor max | ÉFU(s – t) = min | LÉ(s – t)|. Ugyanez teljesül tetszőleges
irányítatlan gráf esetén.
Ha egy irányított gráf minden v pontját „széthúzzuk” egy v1 és v2 pontokból és egy v1-ből v2-be mutató irányított élből
álló részgrá á úgy, hogy az eredetileg v-be menő élek v1-be menjenek, és az eredetileg v-ből kiinduló pontok v2-ből
induljanak ki az új gráfban, akkor az előző tételpár segítségével igazolható a következő. Irányítatlan esetben a
„pontszéthúzás” és a „duplázó élirányítás” technikákat együttesen kell alkalmazni, mely alapján:
Ha egy irányított gráfban s és t nem szomszédosak (azaz nincs közöttük él), akkor max | PFU(s – t) | = min | LP(s – t)|.
Ugyanez teljesül irányítatlan gráfok esetén.
Részletes bizonyítások olvashatók Katona Gy.–Recski A.–Szabó Cs.: A számítástudomány alapjai című könyvében
(Typotex, 2006, 69–70.). Megjegyezzük, hogy ez utóbbi tételpárban max | PFU(s – t) | ≤ min | LP(s – t)| közvetlenül is
könnyen belátható.
A G = G(A, B) teljes páros gráf, ha csúcsai A = {A1, A2, …, Am}, valamint B = {B1, B2, …, Bn} és élei (Ai, Bj) minden
lehetséges i ∈ {1, 2, …, m} és j ∈ {1, 2, …, n} párra.
Ennek az irányítása révén nyert azon irányított grá al, amelyben minden él A-ból B-felé, tehát a termelőtől a
fogyasztó felé van irányítva, megfogalmazhatjuk a szállítási feladatot.
Az Ai termelőkhöz rendelt egész értékű α(Ai) > 0 készletekből kell a Bj fogyasztókhoz rendelt egész értékű β(Bj) > 0
igényeket ellátni az 〈Ai, Bj〉 éleken történő szállítással, tehát egy folyam megadásával, mely az élek halmazán
értelmezett pozitív egész értékű függvény, aminek korlátait most a készletek és az igények adják. Ha az 〈Ai, Bj〉 élen
szállítunk, akkor azt egységenként az él ρij költségével terheljük, így ha f(〈Ai, Bj〉) = fij mennyiséget szállítunk ezen az
élen, azaz az f folyam szerint az 〈Ai, B 〉 élhez rendelt érték fij, akkor annak költsége
j
mátrixot költségmátrixnak nevezzük.
A folyam költségén a értéket értjük. A folyam értéke így a folyam költsége egy
élköltségekkel súlyozott folyamértéknek is tekinthető; ez a szállítás összköltsége.
Mint említettük, az a célunk, hogy optimális módon, tehát ez esetben a lehető legkisebb költséggel szállítsunk.
Minimális költségű az az f folyam, amelyre ρ(f) minimális, feltételezve, hogy a készletek, az igények és a költségmátrix
adottak.
Élünk végül azzal a feltételezéssel, hogy ami az előző feltétellel együtt azt jelenti,
hogy összesen a lehető legnagyobb mennyiséget szállítjuk, tehát csak olyan folyamokat vizsgálunk, amelyek súlyozatlan
értéke α(A). Így egy minimális költségű folyam kiválasztása azt jelenti, hogy az élek halmazának egy olyan részhalmazát
választjuk ki, melyen a rögzített összsúlyú súlyozott összköltség minimális.
Olyan általánosított hálózatunk van tehát, melynek gráfja egy „egyirányúsított” páros gráf ( ), az egyik rész
minden csúcsa forrás, a másiké nyelő, nincs kapacitásfüggvény, van viszont készlet-igény függvény a csúcsok és
költségfüggvény az élek halmazán. A teljes készlettel kielégítünk minden igényt, és ezek közül keressük a legkevesebb
ráfordítással létrejövőt. A következő algoritmus adja a megoldást.
Vonjunk ki az M költségmátrix i-edik sorának minden eleméből 1-et, ekkor kapjuk az M1 mátrixot. Vegyük észre, hogy
az így kapott ρ1(f) = ρ(f) – α(Ai) megváltozott költség nem függ f-től, ezért p(f) akkor és csak akkor minimális, ha ρ1(f)
minimális, mindegy tehát, hogy a kettő közül melyik költségmátrix esetén határozzuk meg a minimális költségű
folyamot. Sor helyett oszlopra is hasonló gyelhető meg. Így kivonásokkal elérhető, hogy minden sorban és minden
oszlopban legyen 0. Így kapjuk a k-adik lépésben Mk-t és ρk-t. Ezután a 0 költségű éleken szállítunk úgy, hogy a
szállított mennyiség pont α(A) legyen. Ezt úgy érjük el, hogy ebből a módosított általánosított hálózatból elkészítünk
egy még újabb, költség-függvénnyel kiegészített „hagyományosat”. Vegyük G-nek azt a részgráfját, amelyik csak a 0
költségű éleket tartalmazza. Felveszünk két új pontot: az új forrást, jelölje X, és az új nyelőt, amit Y jelöl, valamint az
〈 〉 〈 〉
X, Ai és Y, Bj éleket, minden i ∈ {1, 2, …, m} és j ∈ {1, 2, …, n} párra. Ez lesz az új, G0 gráfunk, új hálózatunk
gráfja. De niálunk egy kapacitásfüggvényt ennek élei halmazán. A régi éleken „elég nagy” kapacitást írunk elő, az
〈 〉 〈 〉
újakon pedig: c( X, Ai ) = α(Ai) i = 1, 2, …, m és c( Y, Bj ) = β(Bj) j = 1, 2, …, n. Ez lesz az új 〈G , X, Y, c〉 hálózat.
0
Ebben keresünk maximális értékű f0 folyamot, melynek értéke a Ford–Fulkerson-tétel szerint egyenlő a minimális
vágáskapacitással, ami nyilván α(A), ha a régi élekre tényleg elég nagy kapacitásokat írtunk. Ezt az említett tétel előtt
vázlatosan ismertetett algoritmussal megtehetjük.
f0 A és B közötti -beli éleken vett értékét rendelve ezekhez az élekhez, a többi -beli élhez pedig 0-t rendelve
kapjuk a -ben minimális költségű folyamot.
Adott n és N pozitív egész számok esetén egymással számozott értelemben nem izomorf N élű (hagyományos
értelemben vett) egyszerű gráf létezik n számozott ponttal. Legyen G(n, N) az a „módosított gráf”, amely ezek közül
véletlenszerű kiválasztás révén keletkezik, feltételezve, hogy mindegyik kiválasztásának a valószínűsége azonos.
Legyen adott n számozott pont és egy (hagyományos értelemben vett) teljes gráf. Ennek éle közül válasszunk
egyet véletlenszerűen úgy, hogy bármelyik él kiválasztásának a valószínűsége azonos legyen. Válasszunk lépésenként
további éleket úgy, hogy minden egyes lépésben az addig ki nem választott élek közül azonos valószínűséggel
választunk egyet. Folytassuk ezt addig, hogy végül összesen N élt választunk ki. Így is G(n, N)-et kapjuk.
Ez a struktúra egy olyan „módosított gráf”, mely úgy jön létre, hogy veszünk egy teljes (hagyományos értelemben vett)
számozott csúcsú gráfot, majd sorba megyünk az élein, és p(0 < p < 1) valószínűséggel meghagyjuk, és 1 – p
valószínűséggel töröljük őket egymástól függetlenül.
Ugyanezt kapjuk, ha egy üres gráf éleit húzzuk be egymástól függetlenül p valószínűséggel. (Mint fentebb említettük,
fontos, hogy itt is a csúcsok száma rögzített, az nem véletlen kísérlet eredménye.)
Véletlen gráfunkra úgy is gondolhatunk, mint egy adott valószínűséggel létező „hagyományos értelemben vett”
egyszerű n pontú gráfra. Ez a valószínűség a véletlen gráf valószínűsége. E modell szokásos jelölése G(n, p).
Ennek legegyszerűbb esete, amikor p = ½. Foglalkozzunk a következőkben csak ezzel az esettel, tehát továbbiakban n
pontú véletlen gráfon G(n, ½)-et értünk. A számozott n csúcsú egyszerű gráfok száma (egymástól függetlenül két
lehetőség van minden pontpárra, vagy összekötjük őket éllel, vagy nem), és mint véletlen gráf nyilván mindegyik
egyformán valószínű (p = ½ miatt), tehát egy konkrét véletlen gráf valószínűsége: . Véletlen gráfok esetén
vizsgálhatunk bizonyos tulajdonságokat, például a csúcsok fokszámai, összefüggő-e a gráf stb., s megnézhetjük, hogy azok
milyen valószínűségűek.
Tipikusnak mondjuk azokat a T tulajdonságokat, amelyek „nagyon nagy” véletlen gráfok esetén „majdnem biztosak”.
Ennek értelmezése a következő (továbbra is csak a p = ½ esetben).
Jelöljük k(GnT)-vel a T tulajdonságú egyszerű n számozott pontú gráfok számát. Vezessük be a következő
valószínűséget:
Egy másik fontos vizsgálódás, hogy ha bizonyos T tulajdonságú („hagyományos értelemben vett”) gráfok létezését
akarjuk bizonyítani, akkor elég belátni, hogy Pn (T) > 0. Ezt a módszert először Erdős Pál alkalmazta, konstruktív úton
nehezen vagy egyáltalán nem megadható gráfok létezését illetően.
Megjegyzés. A téma egyik első és legnevesebb eredménye az Erdős–Rényi-tétel, amely szerint ha egy véletlen gráfot
veszünk n ponttal és p = c/n élvalószínűségekkel, akkor „madártávlatból”, nagyon durván, az így megkonstruált
véletlen gráf c-től függően kétféleképpen nézhet ki, ha feltesszük, hogy c ≠ 1. (Természetesen még az sem magától
értetődő, hogy van tipikus gráf ebben az esetben.) Ha c egy 1-nél kisebb konstans, mondjuk 0,999, akkor nagy
valószínűséggel csak nagyon pici, log n nagyságú komponensek (összefüggő részgráfok) vannak. De ha c akár egy
kicsit is nagyobb, mint 1, mondjuk 1,001, akkor van egy óriási, konstansszor n nagyságú komponens, és az összes
többi megint pici, legfeljebb log n nagyságú.
A bizonyításhoz az kell, hogy egy egyszerű véletlen gráf adott pontjának fokszáma egy (n – 1)-edrendű ½-paraméterű
binomiális eloszlást követ (lásd 26.5. fejezet), és a fenti állítás lényegében arról szól, hogy teljesül a nagy számok (gyenge)
törvénye.
Itt is hasonló módon járhatunk el, mint az előző tételnél. Annak a valószínűsége, hogy két különböző pontnak Q egy
közös szomszédja ¼. Így a szomszédos pontok száma egy (n – 2)-edrendű ¼-paraméterű binomiális eloszlást alkot, innen
ismét a nagy számok törvénye biztosítja az állítást, csak most az ¼ körül, ezért szerepel a feltételként megadott
egyenlőtlenségben ezúttal ¼.
Egy tetszőleges gráfban két pont távolságán az őket összekötő utak hosszának minimumát értjük. Ha nincs közöttük
út, akkor végtelennek mondjuk a távolságot, illetve egy pont önmagától vett távolsága 0. A pontpárok távolságának
maximumát a gráf átmérőjének nevezzük.
Példa. Az alábbi véges és összefüggő gráf (24.32. ábra) pontpárjai távolságát mutatja a mellékelt mátrix, és ebből
adódik, hogy az átmérő 3, mivel ennél nagyobb távolság nem lép fel a pontok között.
24.32. ábra
Nyilván elég az átmérőre vonatkozó állítást igazolni, hiszen ha nem összefüggő, akkor az átmérő végtelen. Azt
igazoljuk először, hogy nem nagyobb 2-nél, majd azt, hogy nem lehet 1. Így adódik az állítás. Ha a P1 P2 pontok távolsága
nagyobb, mint 2, akkor bármely Q pontot is választva, vagy a P1Q, vagy a P2Q él nem tartozik a G gráfhoz, hiszen ha
mindkettő él lenne, akkor a távolságuk 2 volna. Mivel ez n – 2 különböző pont esetén így van, ezért ennek az esélye
Annak az esélye pedig, hogy létezik két ilyen távoli pont, azaz az átmérő nagyobb, mint 2, (az
esélyű), mivel ennyi pontpár van. Ez pedig tart a 0-hoz, ha n tart a végtelenbe, azaz ekkor annak a valószínűsége, hogy
nagyobb, mint 2, az átmérő 0-hoz tart. Vagyis kisebb vagy egyenlő, mint 2. Mivel az átmérő csak akkor lehet 1, ha teljes a
gráf, ennek pedig szintén 0-hoz tart az esélye (hogy minden élt behúzunk), tehát a „jellemző” átmérő a 2.
Meglepő, hogy míg az a kérdés, hogy egy gráf tartalmaz-e Hamilton-utat vagy kört, általában nem megoldott, addig a
következő állítás viszont bizonyítható.
A G(n, p) modellre átfogalmazva a problémát, az élek behúzásának p valószínűségét pedig úgy kell megadni, hogy
várhatóan éppen c · n · log n élünk legyen. Az olvasóra bízzuk ennek meghatározását. Másrészt, a majdnem biztosan azt
jelenti, hogy bármilyen ϵ > 0 esetén a Hamilton-kör létezésének valószínűsége nagyobb, mint 1 – ϵ, feltéve, hogy n „elég
nagy”.
Számozzuk meg az n pontú F fa pontjait 1-től n-ig, és az n-edik pontot nevezzük el gyökérnek. Az így kapott fa-gráfot a
pontjaihoz rendelt számokkal együtt számozott fának nevezzük. A pontokhoz rendelt a számok a pontok indexei.
Két számozott fát egymással (számozott értelemben) izomorfnak mondunk, ha létezik csúcshalmazaik között olyan
egy-egyértelmű leképezés, amely „éltartó” és az egymásnak megfeleltetett csúcsok számozása azonos. (Lásd a 24.1.
fejezet végén található de níciót.)
Ha két számozott fa izomorf, akkor tehát biztos, hogy a nekik megfelelő számozatlan fák is izomorfak (utóbbi a 24.1.
fejezetben levő de níció szerinti értelemben). Egymással izomorf fáknak viszont létezhetnek olyan számozásaik, melyek
révén nyert számozott fák nem lesznek egymással izomorfak. Az egymással nem izomorf fákat, mindkét értelmezés esetén,
különbözőknek is szoktuk mondani. A fentiek értelmében rögzített n csúcsszám esetén legalább annyi különböző
számozott n csúcsú fa van, ahány számozatlan.
A továbbiakban hozzárendelünk egy véges számsorozatot a számozott pontú fához, ami az azt reprezentáló kód lesz. Ez
felhasználható egyrészt a 24.2. fejezetben levő Cayley-tétel bizonyítására, másrészt fák számítógépes tárolására.
Az n számozott pontú F fa esetén hagyjuk el a legkisebb indexű elsőfokú pontot, és írjuk fel a szomszédjának a számát,
legyen az v1. Ismételjük ezt a maradék fával, míg csak egy pont marad. Ennek indexe biztosan n, hiszen mindig van
legalább két elsőfokú pont, és az n-nel indexelt soha nem lehetett a kisebb indexű, tehát nem hagyhattuk el. Ezt már
nem is írjuk le (többnyire). Az így kapott n – 2 hosszúságú 〈v , v , v , …, vn– 〉 számsorozatot az F fa Prüfer-kódjának
1 2 3 2
nevezzük.
Példa. A 24.33. ábrán látható fa Prüfer-kódja: 〈3, 3, 3, 3, 6, 6〉, ha leírnánk a végét is: 〈3, 3, 3, 3, 6, 6, 8〉.
24.33. ábra
Könnyen látható a most vázolt eljárásból, hogy minden számozott csúcsú fának létezik Prüfer-kódja, és adott
számozott csúcsú fa esetén az eljárás a kódot egyértelműen meghatározza. A témakör legfontosabb tétele ennek
„megfordítása”:
Bármely, az 1 és n közötti egész számokból álló, n – 2 tagú sorozat egy n pontú számozott fa Prüfer-kódja, és ez a kód a
számozott fát egyértelműen meghatározza.
Megjegyzés. A sorozat természetesen nem kell hogy minden 1 és n közötti számot tartalmazzon, és a számok többször
is szerepelhetnek. Továbbá, az egyértelműség itt számozott értelemben vett izomor a erejéig érvényes.
Bizonyítás. Ha megmutatjuk, hogy egy tetszőleges megfelelő sorozatból (a Prüfer-kódból) a fa egyértelmű visszaállítása
miként történik, akkor beláttuk, hogy ez egy egyértelműen meghatározott számozott fa Prüfer-kódja, tehát készen van a
bizonyítás. Ehhez a következő algoritmust lehet megadni:
1. Legyen (v a Prüfer-kód) adott egy megfelelő, n – 2 tagú sorozat. Legyen továbbá C = {v1, v2,…, vn} a csúcsok halmaza.
Induljunk ki egy n csúcsú, 0 élű gráfból.
2. Vegyük a sorozat első elemét. Kössük össze az ezzel a sorszámmal indexelt pontot (ezt a sorszámot) a C halmaznak azzal a
legkisebb x sorszámú pontjával, amely sorszám nem szerepel a sorozatban.
3. Hagyjuk el a sorozat első elemét, és töröljük az x sorszámú pontot a C halmazból. Az így kapott új sorozattal és a C-ből kapott
új ponthalmazzal ismételjük a 2. és 3. lépést addig, amíg a sorozat elemei el nem fogynak.
4. A legutoljára elhagyott sorszámú pontot kössük össze vn-nel.
Gondoljuk végig, hogy minden lépésnél egyértelmű, hogy mely sorszámú csúcsokat kötjük össze, és a végén egy
összefüggő és körmentes gráfot kapunk!
Az utóbbi igazolása: A Prüfer-kód mindig n csúcsú, n – 1 élű gráfot ad, ha belátjuk, hogy nincs benne kör, akkor biztos,
hogy fa az eredmény. Indirekt tegyük fel, hogy van kör az eredményben: x, y, z. Ilyenkor a kódban x, y, z sorrendben kell
szerepelniük. y-hoz x-et kötjük, z-hez y-t, viszont x-hez z-t kellene kötni, ami tőle jobbra szerepel.
Példa. Határozzuk meg a következő Prüfer-kóddal rendelkező fát: {4, 2, 4, 6, 3, 4}. Nyilván 8 csúcsa lesz a fának,
hiszen a csúcsszám a Prüfer-kód hossza plusz kettő. Lerajzoljuk a 4-es csúcsot, és hozzákötjük az 1-et, mivel az nem
szerepel tőle jobbra a sorszámok adott sorozatában. Ezután jön a 2, és azt az 5-tel kötjük össze, mivel az a legkisebb
sorszám, ami nem szerepel utána (az 1-en kívül, de az 1-es sorszámú csúcsot már töröltük). Majd ismét a 4-est kötjük
össze a 2-essel, majd a 6-ost a 7-essel, utána a 3-ast a 6-ossal, végül 4-est a 8-assal. Azaz a 24.34. ábra gráfját kapjuk.
24.34. ábra
Ellenőrzésként, a legkisebb elsőfokú pont az 1-es, tehát a kód a szomszédjának sorszámával, 4-gyel kezdődik. A
maradék fa legkisebb sorszámú elsőfokú csúcsa az 5-ös, ennek szomszédja a 2-es, tehát a kód kezdete: {4, 2, …. Ezután
a maradék fa legkisebb sorszámú elsőfokú csúcsa a 2-es, tehát a szomszédjának sorszáma, a 4 következik, {4, 2, 4, … a
kód következő lépése. Ezután már csak egy utunk van: 8-4-3-6-7, ahol a kisebbik vége a 7, ennek szomszédja a
maradék út kisebbik vége, a 6, majd annak szomszédja a (kisebb) 3, s végül annak a 4, tehát a teljes kód: {4, 2, 4, 6, 3,
4}, ebből indultunk.
A korábban leírt tételből és az előtte említett, könnyebben igazolható állításból következik, hogy egy-egyértelmű
megfeleltetés létezik természetes számokból álló (véges) sorozatok (Prüfer-kódok) és a számozott csúcsú fák között. Innen
már csak egyetlen lépés a Cayley-tétel. Mivel minden helyen szerepelhet 1-től n-ig bármelyik szám, ezért nn–2 különböző
Prüfer-kód van rögzített n esetén. Mivel mindegyikhez tartozik pontosan egy számozott csúcsú fa, ezzel beláttuk a Cayley-
tételt, amely ilyen fák számát határozta meg.
Megjegyzések
1. A Prüfer-kódot először Heinz Prüfer német matematikus alkalmazta 1918-ban, melynek segítségével éppen a
Cayley-formulát bizonyította.
2. Ez a kód a fák számítógépes tárolásának is a legkisebb tárigényű módja, hiszen ha például szomszédsági
mátrixszal adjuk meg, akkor, mivel szimmetrikus a mátrix, és az átlójában is 0-k vannak, összesen
bitet kell tárolni, ennyi a 0-k és az egyesek száma összesen. A Prüfer-kód esetén egy n– 2 hosszú sorozatot kell
vennünk, de ennek tagjai 1-től n-ig terjedő számok, amik kettes számrendszerben [log 2n] hosszú sorozatok, azaz
a teljes tárolás mérete: , ami nagy n-ekre kb. n log2 n, ami jóval kevesebb, mint a kb.
tárigény.
24.35. ábra
Ezzel a módszerrel zegzugos barlangokból, labirintusokból is garantáltan ki lehet jutni. Az angol Longleat House-ban
található a világ egyik leghosszabb labirintusa, amit sövényből alakítottak ki. Egy másik híres labirintus az ókori görög
mitológiából ismert krétai labirintus, ahonnan Ariadné egy gombolyag fonal segítségével szabadította ki Thészeuszt. Egy
ilyenféle labirintust láthatunk a 24.36. ábrán.
24.36. ábra
Euler-féle poliéderformula
Egy fontos, matematikán belüli alkalmazása a gráfelméletnek a nevezetes Euler-féle poliédertétel bizonyítása (lásd még a
23.4. fejezet végén leírtakat is). E tétel egyik fontos következménye a szabályos testek karakterizációja. A bizonyítás
lényege, hogy miként a következő pontban a térképek színezésénél, egy síkba rajzolható gráfot tudunk a poliéderhez
rendelni. Ebben a gráfban a minimális (további köröket nem tartalmazó) köröket és az egyetlen maximális (minden más
kört tartalmazó) kört, más megfogalmazásban a tartományokat feleltetjük meg a lapoknak, míg a csúcsoknak és az éleknek
rendre a gráf csúcsait és éleit az alábbi módon. A fő lépés a poliéder levetítése egy síkra, amely minden közönséges poliéder
esetén megtehető, amely topologikusan izomorf egy gömbbel, szemléletesen, felfújható egy gömbbé. Ez két lépésben
történik. Először a poliédert egy gömb belsejébe helyezzük, majd „felfújjuk”, hogy hálója a gömb felszínére „simuljon”.
Ekkor egy gömbre rajzolását kapjuk testháló meghatározta gráfnak. Ezután egyik gömbfelszíni tartományának egy belső
pontjából (É-i sark) sztereogra kus projekcióval levetítjük az említett ponton és a gömb középpontján átmenő egyenesre
merőleges és a gömböt (a D-i sarkban) érintő síkra. Belátható, hogy a kapott kép egy síkba rajzolása a gráfnak. A lényeg,
hogy e hozzárendelések kompozíciója olyan bijekció, amely a csúcs-él, az él-tartomány (és a tartomány-csúcs)
illeszkedéseket megtartja. Emiatt a gráfokra vonatkozó tételből következik annak a poliéderre vonatkozó megfelelője. A
gráfokra vonatkozó tétel ezután így hangzik:
Gráfokra vonatkozó Euler-formula. Egy összefüggő síkba rajzolható gráf, amelynek n csúcsa, e éle és t tartománya van
(beleértve a külső végtelen tartományt is), eleget tesz a következő formulának: n – e + 1 = 2.
Bizonyítás. Ha van benne kör, akkor az a síkot két tartományra osztja, mivel síkba rajzolható. Hagyjunk el a körből egy
tetszőleges élt, ekkor a gráf összefüggő marad, és az élek és a tartományok száma is eggyel csökken, tehát n + t – e értéke
nem változik. Ilyen lépésekkel az összes kört megszüntetve egy körmentes összefüggő gráfot, azaz fát kapunk (a gráf
feszítőfáját). Erre igaz a formula, ugyanis t = 1 és e = n – 1. Ennek általánosításaként könnyen adható hasonló formula: k
komponensből álló, n csúcsú, e élű és t tartományú síkbeli gráfokra: n – e + t = k + 1.
A fenti gondolatmenet annyiban módosul, hogy az utolsó kör megszüntetése után egy k darab fából álló erdő marad,
ahol t = 1 és e = n – k.
A gráfokra vonatkozó Euler-formulából levezethető, hogy
Legyen a gráf tartományainak a száma l. Ha e ≥ 3, akkor minden tartományt legalább 3 él határol (hurokél egyedül,
kétszeres él ketten határolnának egy tartományt, de ezeket kizártuk, a végtelen tartományra pedig a feltétel miatt), ezért ez
összesen legalább 3l élt jelentene. Mivel minden él 1 vagy 2 tartományt határol (azok az élek, melyek nem részei körnek, 1-
et, a „külső” végtelen tartományt, amelyek valamely kör élei, pontosan 2-t), tehát legfeljebb 2-t, így az élek számának
legfeljebb kétszerese, az legalább 3l, amiből . Ha e = 2, akkor, mivel egyszerű gráf, csak egy 2 hosszú út lehet, tehát l
= 1, és ugyanezt az egy tartományt csak 2 él határolja, de behelyettesítve ekkor is igaz, hogy . Másrészt az Euler-
Ez az összefüggés hasonlóan látható be, felhasználva, hogy páros egyszerű gráfban a legrövidebb kör négy élből állhat.
Alkalmazásként megmutatjuk, hogy a 24.4. fejezetben a Síkba rajzolható gráfok cím alatt szereplő teljes ötszög és a
„három ház és három kút” gráfok nem síkba rajzolhatóak. Ennek most egyszerű bizonyítása adódik az utóbbi két (keretben
kiemelt) összefüggés alapján. Az elsőnél 5 pont van és 10 él. A vonatkozó tétel szerint legfeljebb 3 · 5 – 6 = 9 éle lehet egy 5
pontú síkba rajzolható gráfnak, tehát 10 nem; míg a másik gráf páros (házakat házakkal és kutakat kutakkal nem kötünk
össze), tehát itt pedig a síkba rajzolhatóság esetén maximum 2 · 6 – 4 = 8 éle lehet a páros gráfnak. Nekünk viszont 3 · 3 = 9
élünk van, nem lehet tehát síkbeli.
Térképek színezése
A kérdés még 1850 körül az angol királyi földrajzi társaság egy ülésén vetődött fel, hogy vajon minimálisan hány színnel
lehet egy térképet kiszínezni. Természetesen szomszédos országoknak különböző színt kell adni, különben
összemosódnának. Itt szomszédoson azt értjük, hogy van közös határszakaszuk. Ha két ország határvonala csak egy
pontban közös, akkor lehetnek egyszínűek.
Könnyű felrajzolni négy országot úgy, hogy bármely kettőnek van közös határszakasza, valós európai példa is könnyen
adódik: Luxemburg és közvetlen szomszédjai. Tehát van olyan térkép, amihez legalább négy szín kell. A kérdés, hogy van-e
olyan térkép, amihez legalább öt szín kell, vagy néggyel már minden térkép kiszínezhető a megfelelő módon.
Arthur Cayley angol matematikus, a gráfelmélet egyik úttörője írt erről a négyszín-problémáról egy cikket 1879-ben.
Ekkor már a sejtés megvolt, nevezetesen, hogy négy szín mindig elegendő.
Azt könnyebb belátni, hogy öt biztosan elegendő, ennek a gondolatmenetét meg is mutatjuk majd. Azt, hogy négy is
elég, csak 1979-ben sikerült Appel és Haken holland matematikusoknak egy számítógép segítségével igazolniuk. A mai
napig nincs rá „gépmentes” bizonyítás. Ezért sokan kételkednek is a probléma elintézettségében. A programot sokan
nézték már át, s egy kisebb hiányosság javításától eltekintve hibátlannak találták. A gép pedig 24 óra munkával ellenőrizte
mindazt, amire ember a mai napig nem képes. Fogalmazzuk ezt meg egy tétel formájában.
Minden gömbre rajzolható térkép, melyen szomszédos két ország akkor, ha van közös határoló görbeszakaszuk,
kiszínezhető négy színnel úgy, hogy minden ország ezek valamelyikét kapja, és két szomszédos ország különböző
színű.
Ennél egyszerűbb a következő, gyengébb állítás, ahol a bizonyítás gondolatmenetét röviden be is mutatjuk.
Minden gömbre rajzolható térkép, melyen szomszédos két ország akkor, ha van közös határoló görbeszakaszuk,
kiszínezhető öt színnel úgy, hogy minden ország ezek valamelyikét kapja, és két szomszédos ország különböző színű.
A térképet modellezhetjük egy olyan síkba rajzolható grá al, melynek tartományai felelnek meg az országoknak, két
tartományt elválasztó él felel meg a megfelelő országok közös határszakaszának, és csúcs felel meg legalább három ország
közös találkozási pontjának. Így valóban egy síkba rajzolható gráfot kapunk. Nevezzük ezt a térkép gráfjának. Ennek
segítségével az utóbbi két tétel tisztán matematikai fogalmak használatával is kimondható (például tartományokhoz egy
négy, illetve egy öt elemszámú halmaz elemeit rendelve), ezt az olvasóra bízzuk.
Készíthetünk a térkép gráfjához (és a térképhez) tartozó újabb gráfot a következőképpen.
Adott tehát egy síkba rajzolható G gráf. G′ legyen az a gráf, melynek pontjai G tartományai, és 2 pontja pontosan akkor
van éllel összekötve, ha a megfelelő G-beli tartományok szomszédosak, azaz van közös határoló élük. G′ élei
kölcsönösen egyértelműen megfelelnek G éleinek, és szintén nem metszik egymást a csúcsokon kívül, tehát G′ is síkba
rajzolható, tartományai G csúcsainak felelnek meg. G′-t nevezzük a G síkba rajzolható gráf duálisának.
Nyilvánvaló, hogy egy gráf duálisának a duálisa az eredeti gráf, G és G′ tehát egymás duálisai.
A térképen úgy tudjuk ezt elképzelni, hogy minden országnak megfeleltetjük pl. a fővárosát, és a szomszédos országok
fővárosai között vasútvonalakat építünk. Lásd a 24.37. ábrán Közép-Európát és a megfelelő duális gráfot.
Így a színezési probléma a duális gráf színezésére redukálódik. Az alábbi tétel ekvivalens a gömbre rajzolható térképre
vonatkozó első összefüggéssel. Ezeket négyszín-tételnek szoktuk nevezni.
Minden síkba rajzolható gráf csúcsai színezhetők négy színnel úgy, hogy bármely két szomszédos csúcs különböző
színű lesz.
24.37. ábra
Megjegyzés. Ennek egy következménye, hogy ha egy gráf síkba rajzolható, akkor nem tartalmazhat részgráfként
teljes ötszöget, s így nem lehet öt páronként szomszédos ország a földgömbön, hiszen ha ez lehetne, akkor már a gráf
eme részének pontjait sem tudnánk négy színnel úgy kiszínezni, hogy azonos színűek ne legyenek összekötve éllel.
Ezt a következményt az Euler-formula segítségével már igazoltuk, amit beláttunk, ellentétben a négyszín-tétellel.
A gyengébb, általunk is bizonyítandó állítással az alábbi tétel ekvivalens. Közös nevük ötszín-tétel.
Minden síkba rajzolható gráf csúcsai színezhetők öt színnel úgy, hogy bármely két szomszédos csúcs különböző színű
lesz.
Egy síkba rajzolható gráfnak mindig van legalább egy olyan pontja, amely legfeljebb ötödfokú.
Indirekt tegyük fel, hogy minden pont legalább hatodfokú. Ekkor a gráf éleinek száma legalább 3 n, ha n csúcsa van. Ez
azonban ellentmond annak, hogy egy n pontú síkbeli gráfnak legfeljebb 3n – 6 éle van (lásd a tételt az Euler-féle
poliéderformula cím alatt).
Megjegyzés. Ez egyszerű közönséges poliéderekre azt jelenti, hogy mindig van olyan csúcsuk, amelybe legfeljebb 5 él
fut be, vagy a dualitás miatt azt is, hogy van olyan lapjuk, amelyik legfeljebb ötszög. Azaz nincs olyan poliéder,
amelynek minden lapja hatszög (vagy még nagyobb oldalszámú sokszög). (Ez utóbbinál Euler poliédertételének
segítségével erősebb állítás is igazolható, nevezetesen, hogy 3l3 + 2l4 + l5 ≥ 12, ahol lk jelenti a k oldalú sokszöglapok
számát.)
Tehát a gráfban mindig van legfeljebb ötödfokú pont. Ezután indukcióval bizonyítunk. 5 vagy annál kevesebb pontú
gráf kiszínezhető öt színnel. Tegyük fel, hogy minden n-nél kevesebb pontú gráf kiszínezhető öt színnel. Ha most veszünk
egy (n + 1) pontú gráfot, akkor ennek van olyan pontja, amely legfeljebb ötödfokú. Ha van alacsonyabb fokú, akkor készen
vagyunk, mert azt éleivel együtt elhagyva, az így kapott gráf az indukciós feltétel szerint öt színnel színezhető, s akkor az
eredetiben a többi pontot ugyanígy színezve, ennek a plusz egy pontnak a színe olyan lehet, amelyikkel egy olyan csúcsot
színeztünk, amely nem szomszédja. Ha öt szomszédja van, akkor ravaszabbul járunk el. Biztosan van két nem szomszédos
szomszédja, hiszen a teljes ötszöggráf nem síkba rajzolható. Hagyjuk el magát a pontot a belőle induló élekkel, és ezt a két
szomszédját „húzzuk össze” egy ponttá úgy, hogy minden ezekből induló él ebbe az összevont pontba fusson. Ez újra síkba
rajzolható gráf lesz, n-nél kisebb pontszámmal, ami a feltételünk szerint kiszínezhető öt színnel; színezzük ki tehát. Utána
újra húzzuk szét a két szomszédot, melyek most egyszínűek (közös pont voltak), így amikor a kihagyott pontot és éleit
visszatesszük, az öt szomszédjából kettő azonos színű, tehát marad egy ötödik szín erre a pontra. Ezzel beláttuk az ötszín-
tétel állításait.
Még néhány, színezésekkel kapcsolatos tétel, összefüggés, bizonyítás nélkül.
Ha egy gráf összefüggő, minden pontjának fokszáma legfeljebb d, és van legalább egy pontja, melynek fokszáma
határozottan kisebb, mint d, akkor a gráf csúcsai kiszínezhetők d színnel úgy, hogy bármely két szomszédos csúcs
különböző színű lesz (kiszínezhető d színnel).
24.38. ábra
Egy gráf pontosan akkor színezhető ki két színnel, ha nem tartalmaz páratlan hosszúságú (élszámú) kört.
Az egyik irány bizonyítása könnyű. Két színnel való színezés esetén egy kör mentén haladva felváltva kell a két színnel
színezni a csúcsokat, de páratlan hosszú körben ez lehetetlen.
Megjegyzések. A két színnel való kiszínezhetőség azt jelenti, hogy a gráf csúcshalmaza két diszjunkt részhalmazra
osztható úgy, hogy az azonos részhalmazba eső csúcsok között nem megy él, vagyis hogy a gráf páros. Így e tétel
annak az állításnak, mely szerint ha a G páros gráf, akkor bármely K körének az éleinek száma páros, egy más
megfogalmazását és egyben kibővítését jelenti, mert tartalmazza annak megfordítását is. Továbbá, itt nem
szükséges síkbeli gráfokra szorítkoznunk, mert nem síkbeli gráfban biztosan van páratlan hosszú kör, és ez biztos,
hogy nem színezhető ki két színnel a megfelelő módon.
Végezetül megemlítjük, hogy ha olyan gráfokat, illetve ezeknek megfelelő térképeket vizsgálunk, melyek síkba vagy
ami ezzel ekvivalens, gömbre ugyan nem rajzolhatóak, de tóruszra igen, akkor öt szín nem feltétlen elegendő, sőt hat sem,
tehát van olyan eset, amikor legalább hét szín kell. P. J. Heawood brit matematikus megmutatta, hogy ennyi elegendő is
minden esetben.
Az n csúcsú G (irányítatlan) gráf csúcsmátrixán vagy adjacenciamátrixán, vagy még másként szomszédsági mátrixán
értjük azt az négyzetes mátrixot, amellyel a gráf reprezentálható, lásd 24.1. fejezet III. pont. Irányított
gráfok esetén aij jelentse a Pi-ből a Pj-be vezető irányított élek számát.
E de níció alapján egy (számozatlan csúcsú) gráf csúcsmátrixa nem egyértelműen meghatározott; függ attól, hogy a
csúcsoknak milyen sorrendben „feleltetjük meg” a mátrix sorait (az oszlopokat ekkor már mindenképpen ugyanebben a
sorrendben). Ez azonban nem okoz bonyodalmakat, mert, bár nem bizonyítjuk, a továbbiakban tárgyalt összefüggések
függetlenek attól, hogy egy gráf melyik csúcsmátrixával dolgozunk, feltéve persze, hogy egy gondolatmenet során végig
csak eggyel.
Irányítatlan gráf szomszédsági mátrixa mindig szimmetrikus, azaz aij = aji i, j ∈ {1, …, n}.
Nyilván egyszerű gráf mátrixában a főátlóban végig 0 van, hiszen nincsenek hurokélek, míg a többi elem is csak 0 vagy
1, hiszen nincsenek többszörös élek sem. Meggondolható, hogy az A2 : = [aij(2)] mátrix aij(2) eleme éppen a Pi-ből Pj-be vezető
2-hosszúságú, azaz 2 élből álló séták számát jelöli, hiszen a mátrixszorzás de níciója szerint aij(2) = ai1a1j + ai2a2j+ … + ainanj,
amelyben a k-adik tag éppen a Pk csúcson keresztül vezető 2-hosszú Pi–Pk séták számát jelenti. Hiszen ha a k-adik csúcsba az
i-edikből aik darab él vezet, valamint a k-adikból a j-edikbe akj darab él, akkor a szorzási szabály alapján e számok szorzata
adja a Pk-n keresztüli összes 2 élből álló séták számát Pi-ből Pk-ba. Az összeg pedig akkor éppen a fenti állítást igazolja. Ez a
gondolatmenet irányított és irányítatlan gráfokra egyaránt érvényes a benne szereplő fogalmaknak rendre irányított,
illetve irányítatlan értelemben való használatával. Ebből adódik indukcióval, és a k = 1 triviális eset meggondolásával a
következő egyszerű tétel:
Legyen egy irányítatlan gráf csúcsmátrixa A, és minden pozitív egész k-ra mátrix. Ekkor a(k)ij
éppen a Pi-ből a Pj-be vezető k hosszúságú séták számát jelöli. Irányított gráf esetén a megfelelő irányított séták számát
kapjuk.
Három következményét említjük meg ennek a tételnek. Az első egyszerű, a második összefüggő, a harmadik irányított
gráfokra vonatkozik.
Ha az egyszerű irányítatlan gráf csúcsmátrixa , akkor gr(Pi = a(2)ii). Azaz a csúcsok fokszámát a
csúcsmátrix négyzetének főátlójából olvashatjuk ki.
Ha egy összefüggő gráf csúcsai: P1, P2, …, Pn, akkor Pi és Pj távolsága i ≠ j esetén (a legrövidebb út hossza) az a legkisebb
egész m szám, amelyre Am-ben a(m)ij ≠ 0.
A irányított gráfban akkor és csak akkor nincs irányított kör, ha van olyan k0 pozitív egész, hogy minden k ≥ k0
esetén a csúcsmátrixa k-adik hatványa zérusmátrix.
Ez a tétel ekvivalens azzal, hogy pontosan akkor létezik irányított kör a gráfban, ha létezik bármilyen hosszú
irányított séta -ben. Ennek igazolását az olvasóra bízzuk. (Megjegyezzük, hogy végtelen csúcsú gráfokra nem igaz a
tétel.)
Legyen adott az R (valós számok halmaza) feletti Rn vektortér a szokásos műveletekkel (a vektorösszeadás
koordinátánként R-beli összeadást, Rn-beli vektor R-beli skalárral való szorzása pedig szintén koordinátánként R-beli
szorzást jelent). Ekkor Rn lineáris transzformációinak egy-egyértelműen és művelettartóan megfeleltethetőek az R feletti n
× n-es mátrixok. Mint minden ilyen négyzetes mátrixnak, így az n csúcsú G gráf A csúcsmátrixának is de niálni lehet a
szokásos módon a sajátértékeit, illetve sajátvektorait, azokat a λ valós számokat és Rn-beli v ≠ 0 vektorokat, melyekre Av =
λv. Megjegyezzük, hogy R helyett C-t (komplex számok) is vehetjük, a lényeg, hogy egy N-et (természetes számok halmaza)
tartalmazó kommutatív test felett vizsgálódjunk.
A G gráf szomszédsági mátrixának sajátértékeit a gráf sajátértékeinek, a mátrix sajátvektorait a gráf sajátvektorainak
nevezzük.
A gráf sajátértékeinek halmaza a gráf spektruma.
Lehet a gráf spektrumán olyan matematikai objektumot is érteni, mely a sajátértékek mellett azok multiplicitásait is
tartalmazza, így például egy olyan halmazt, melynek elemei olyan rendezett párok, melyek első tagjai a sajátértékek,
második tagjai pedig a hozzájuk tartozó multiplicitások;
vagy azt a kétsoros mátrixot, melynek első sorában a sajátértékek, míg a második sorban a multiplicitásaik
szerepelnek.
Szokás nem gráfok által meghatározott mátrixok esetében is a sajátértékek halmazát a mátrix spektrumának nevezni,
így beszélhetünk a csúcsmátrix spektrumáról is.
ahol E jelöli az ún. egységmátrixot, melynek a főátlójában 1-esek állnak, és a többi eleme 0. Ez λ n-edfokú polinomja,
melynek főegyütthatója (–1)n, és konstans tagja det(A), az A mátrix determinánsa.
Példák
1. Legyen a gráfunk egy kétpontú gráf, ahol a két pont között fut egy él, és az egyik csúcsban van egy hurokél. Ekkor
24.40. ábra
Egy egyszerű n-pontú gráf karakterisztikus polinomjában az (n – 1)-edfokú tag együtthatója 0, az (n – 2)-edfokú tag
együtthatója a gráf élei számának a (–1)-szerese, míg az (n – 3)-adfokú tag együtthatója a gráf háromszögei számának a
(–2)-szerese.
A bizonyításhoz egyrészt azt kell felhasználni, hogy az A – λE mátrixban a főátlón kívül nem szerepel λ. Így
determinánsának de níció szerinti felírásában (n – 1) db λ szorzótényezőt tartalmazó tag csak a főátlókból vett λ-kal jöhet
létre. Ott egyszerű gráf esetén végig csupa –λ áll, ebből vehetünk tehát (n – 1)-et, de akkor az utolsót is onnan kell venni,
mivel minden sorból és oszlopból pontosan egy elem szerepel egy tagban, mint szorzótényező, s így csak (–1)n λn jöhet létre,
λn–1-es tag nem, tehát a karakterisztikus polinomnak sem lehet (n – 1)-edfokú tagja. Másrészt, λn–2-os tag a
determinánsban, mint szorzat úgy jöhet létre, hogy a főátlóból (n – 2) elemet veszünk s hozzá két nem főátlóbelit. Ha az aii
, ha nincs. Ezeket összeadva kapjuk, hogy az (n – 2)-edfokú tag együtthatója olyan 2 × 2-es
determinánsokat kell néznünk (n alatt a 3 darabot), ahol az átlóban végig 0 van, és ezek közül a -ek lesznek
csak nem 0-k, hiszen mind szimmetrikus, és ha bármelyik szimmetrikus egyes párt 0-ra változtatjuk, akkor már 0 a
determináns értéke. Ezeknek értéke azonban 2, viszont páratlan sok – λ szorzata negatív előjelű, és annyi van belőlük,
ahány három olyan pont van, melyek közül bármely kettő között megy él (a fenti mátrixhoz pontosan egy háromszög
tartozik, hiszen mindhárom él be van húzva), ezért a karakterisztikus polinomban az együttható –2-szerese lesz a
háromszögek számának. Ezzel be is fejeztük a bizonyítást.
Reguláris gráfok esetén további nevezetes tételek mondhatók még ki, és igen érdekes problémák vetődnek fel.
Ha egy egyszerű gráf k-reguláris (azaz minden pont foka k), akkor
1. k sajátértéke G-nek;
2. ha G összefüggő is, akkor a k sajátérték multiplicitása 1;
3. G bármely λ sajátértékére | λ | ≤ k.
Nem bizonyítjuk, de mutatunk egy példát. Legyen G egy szabályos négyszöggráf (egy négy hosszú kör), aminek minden
pontja másodfokú, azaz 2-reguláris.
Ennek mátrixa a következő , és így a karakterisztikus polinomja: λ4 – 4λ2, amit ki lehetett volna abból
is találni, hogy 4 éle van, ezért a másodfokú tag együtthatója –4, mivel egyszerű, ezért harmadfokú tag nincs, és nincs
háromszöge sem, ezért lineáris tag sincs. A konstans pedig 0, hiszen a csúcsmátrix determinánsa 0. Sajátértékei a
karakterisztikus polinom gyökei: 2; 0; 0; –2. Teljesül, hogy a k = 2 sajátérték, egyszeres multiplicitású (G összefüggő), és a
többi sajátértékre teljesül, hogy abszolút értékben kisebbek, mint 2.
További összefüggés a következő:
A bizonyítások elolvashatók például Andrásfai B.: Gráfelmélet – folyamok, mátrixok című könyvében (Akadémiai
Kiadó, Budapest, 1983).
Az előző példánkban a komplementer 1-reguláris nem összefüggő gráf lesz. Sajátértékei a tétel szerint 1; 1; –1; –1. Nem
összefüggő, így nem egyszeres az 1, mint sajátérték. De a maximális az 1, és mindegyik abszolút értéke legfeljebb 1.
Zárjuk a szomszédsági mátrixszal kapcsolatos részt egy nevezetes reguláris gráfokra vonatkozó tétellel és egy máig
nyitott kérdéssel. Továbbiak olvashatók Hraskó András a budapesti Fazekas Mihály Fővárosi Gyakorló Gimnázium és
Általános Iskola honlapján található előadásában is.
Ho mann–Singleton-tétel. Ha egy k-reguláris 2 átmérőjű (bármely két csúcs között van legfeljebb 2-hosszú út) gráfnak
k2 + 1 csúcsa van, akkor k = 1, 2, 3, 7 vagy 57. Az első négy esetre létezik ilyen gráf, 7-re maguk a szerzők konstruáltak
egyet. A k = 57 máig eldöntetlen, hogy van-e ilyen 57-reguláris gráf 3250 csúccsal.
Végezetül megadunk egy újabb mátrixreprezentációt, és egy ezzel kapcsolatos tételt, bizonyítás és a fontos
alkalmazások ismertetése nélkül.
Az n csúcsú és e élű irányított gráf illeszkedési mátrixán értjük azt az n × e-es mátrixot, ahol
aij = 0, ha az i-edik csúcsra nem illeszkedik a j-edik él,
aij = 1, ha az i-edik csúcs kezdőpontja a j-edik élnek, és
aij = – 1, ha az i-edik csúcs végpontja a j-edik élnek.
Hasonlóan értelmezzük egy G irányítatlan gráf illeszkedési mátrixát, azzal a különbséggel, hogy aij = 1 abban az esetben
is, ha az i-edik csúcs végpontja a j-edik élnek.
Ha egy n pontú irányított gráf nem tartalmaz hurokélt, és komponenseinek a száma k, akkor illeszkedési
mátrixának a rangja n – k.
25.1. Bevezetés
A kódolás önmagában nem annyira matematikai, mint inkább gyakorlati fogalom. Egy adott információt szeretnénk egy
adott helyről máshová eljuttatni, miközben a rendelkezésre álló információs csatorna csak meghatározott jelek
(karakterek) továbbítására képes. Így a továbbítandó információt olyan formába kell átalakítani, hogy az az információs
csatornán átjusson, majd utána értelmezhető legyen. Tipikus példája ennek a morzeábécé: egy börtön szomszédos
celláiban elzárt rabok beszéd formájában nem tudnak egymással kommunikálni, de a falon való kopogással már (jobb
esetben) igen. Ekkor az üzenet küldője a mondanivalóját átalakítja morzejelekké, amit a falon, mint az adott információs
csatornán keresztül átküld a társának, ő pedig a kapott jelsorozatból vissza tud következtetni az eredeti üzenetre.
Ugyanezen az elven működnek a digitális adatrögzítők is, például egy koncertfelvétel hosszú 0–1 sorozat formájában kerül
archiválásra, amit egy megfelelő apparátus (mondjuk egy CD-lejátszó) ismét zenei hanganyaggá változtat vissza. Az
alapszituációt a következő diagrammal szokás ábrázolni:
A kódolás matematikai oldala ott kezdődik, amikor ezt az információtovábbítást megpróbáljuk gazdaságossá, illetve
biztonságossá tenni. Gazdaságossá abból a szempontból, hogy az üzenet kódolt formája lehetőleg ne legyen túl hosszú, így
gyorsan és olcsón eljusson a címzetthez. Biztonságossá pedig abból a szempontból, hogy ha az információs csatornán
valami külső hatásra torzul az üzenet, és nem pont ugyanaz a jelsorozat érkezik meg, mint ami elindult a kódolóból, akkor
ezt a hibát (amennyiben csak kis hibáról van szó) az üzenetmegfejtő berendezés észrevegye, és esetleg még korrigálni is
tudja. Ez a két elv viszont a gyakorlatban egymás ellen dolgozik: a gyorsan továbbítható üzenetkódolási módszerek nem túl
biztonságosak, illetve a biztonságos üzenetkódolás többnyire idő- és helyigényes. Így mindig egy adott szituációtól függ,
hogy a gyorsaság és a biztonságosság közötti középutat hogyan választjuk meg, részben ezért is van az, hogy sokféle
kódolási eljárás létezik.
Egy kód tulajdonképpen nem más, mint egy rögzített karakterkészletből alkotott szóhalmaz. Az adott karakterkészlet
a kódolási ábécé, ez lehet például a magyar vagy az angol ábécé is (beleértve a „szóköz” karaktert), vagy lehet egy
számhalmaz (mondjuk 0-tól 9-ig az egész számok). A leggyakoribb kódolási helyzetekben az információs csatorna
mindössze kétféle jel továbbítására képes, és ebből a két jelből (karakterből) kell a kódszavakat összeállítani. Matematikai
szempontból mindegy, hogy mivel jelöljük ezt a két karaktert, de megszokás, hogy a 0-t és az 1-et használjuk. A 0–1
karakterkészletre épülő kódokat bináris kódoknak nevezzük.
Egy kódban elvileg lehetnek különböző hosszúságú kódszavak. Ami a gyakorlatban fontos, az a következő három
tulajdonság:
- A beérkező jelsorozatból egyértelműen meg lehessen állapítani az egyes kódszavak elejét és végét, azaz a beérkező
jelsorozatot fel lehessen bontani kódszavakra.
- Amenyiben az információs csatorna nem teljesen megbízható, akkor lehetőleg ne legyenek egymáshoz nagyon hasonló
kódszavak, hogy az üzenettovábbítás során esetlegesen bekövetkezett torzulások hatására ne kapjon más értelmet az
üzenet.
- A kódszavak ne legyenek indokolatlanul hosszúak, mert ezzel az üzenettovábbítás időbeli és/vagy anyagi költségei
növekednek.
Felbontható kódnak nevezünk egy olyan kódot, ahol bármilyen jelsorozatot legfeljebb egyféleképpen lehet
kódszavakra bontani. Amennyiben minden kódszó hosszúsága ugyanaz (ezek az állandó hosszúságú kódok), akkor a
felbonthatósággal nincs gond, hiszen tudjuk, hogy a beérkezett jelsorozatban hány karakter után ér véget az első kódszó,
aztán a következő ugyanannyi karakter után ér véget a második kódszó, és így tovább, egyszerűen csak feldaraboljuk a
jelsorozatot az adott hosszúságú szakaszokra.
Példa. A {01, 001, 010} kód nem felbontható, mert például a 01001 jelsorozat kétféleképpen is értelmezhető: lehet 010 –
01 vagy 01 –001. Az {1, 01, 001} kód viszont felbontható, hiszen ebben a kódban az 1 karakter mindig a szó végét jelzi.
Az {100, 010, 001} kód pedig azért felbontható, mert állandó hosszúságú: minden beérkező jelsorozatot
automatikusan három hosszúságú szakaszokra kell bontanunk.
Az állandó hosszúságú kódoknak egy általánosítását jelentik a pre x kódok, ahol csak annyit kötünk ki a
kódszavakról, hogy egyik kódszó se kezdődjön egy másik kódszóval. Tehát ne lehessen egy kódszó végére újabb
karaktereket írni úgy, hogy a végén egy másik kódszót kapjunk eredményül. Egy kódnál szinte alapvető elvárás, hogy
egyértelműen felbontható legyen. A pre x kódok praktikus előnye pedig, hogy nemcsak egyértelműen felbonthatóak, de
ez a felbontás mindig egyszerűen megtehető: egy beérkező kódolt üzenet elejéről egyértelműen leválasztható az első
kódszó anélkül, hogy az üzenet folytatását megtekintenénk. Ezt követően a maradék jelsorozat elejéről ugyanígy
választható le a második kódszó stb.
A kódolás – mint eljárás – matematikai megközelítésben egy olyan függvény, ami üzenetekhez rendel hozzá – adott
kódábécé karaktereiből összeállított – kódszavakat. Ennek a megközelítésnek a leírásához érdemes az alábbi jelöléseket
bevezetni:
- W = {w1, w2, …, wM} az elemi üzenetek halmaza, a forrás. Az elemi üzenetek lehetnek betűk, számok vagy éppen egy adott
nyelv szavai is. A lényeg az, hogy a segítségükkel minden lehetséges üzenetet fel lehessen írni.
- F = {α1, α2, …, αn} a kódábécé, ezek az információs csatornán továbbítható karakterek, és belőlük épülnek fel a kódszavak.
- F* a kódábécé karaktereiből összeállítható szavak halmaza.
A fenti jelölések mellett kódolásnak nevezünk egy f:W → F* függvényt. A kódok vizsgálatánál sokszor nincs
matematikai jelentősége az elemi üzeneteknek, ilyenkor általában csak a kódot, azaz a kódszavak {f(w1), f(w2), …, f(wM)}
halmazát vizsgáljuk, magát az f: W → F* kódolási eljárást nem. Azonban olyan helyzetekben, amikor az elemi üzenetek
különböző gyakorisággal fordulnak elő, és a kódszavak nem feltétlenül egyenlő hosszúak, akkor fontos szerepe lehet a
kódolási eljárásnak, hiszen ha például a gyakoribb forrásüzenetekhez rövidebb kódszavakat rendelünk, akkor ezzel hosszú
távon jelentősen csökkenthetjük az információs csatornán átküldött adatmennyiséget, tehát költséget takaríthatunk meg.
További jelölések és alapfogalmak:
Jelölje Pj a wj elemi üzenet előfordulási valószínűségét (minden 1 és M közötti j egész számhoz), valamint |f(wj| az f(wj)
kódszó hosszát. A W forrás entrópiája
Ha adott l1, l2, …, lM pozitív egész számok mellett létezik olyan f:W → F* egyértelműen felbontható kód, amivel f(wi) =
Kraft-egyenlőtlenség:
Adott l1, l2, …, lM pozitív egész számok mellett akkor és csak akkor létezik olyan f:W → F* pre x kód, amivel
Shannon tétele:
Egy egyértelműen felbontható kód átlagos szóhosszúsága legalább H/log2 n, ahol H az elemi üzenetek halmazának
entrópiáját és n a kódábécé méretét jelöli. Továbbá az elemi üzenetek adott W halmazához mindig létezik olyan kód,
amivel az átlagos szóhosszúság kisebb, mint 1 + H/log2 n.
Hu man-kódok
Hu man-kódok
A Hu man-algoritmus egy olyan eljárás, amivel az elemi üzenetek adott W = {w1 w2, …, wM} halmazához, a pi előfordulási
valószínűségek ismeretében elkészíthetünk egy, a lehető legkisebb átlagos szóhosszúságú pre x kódot. Az algoritmus
lényege, hogy egy gráfot építünk fel, pontosabban egy irányított fát, aminek a levelei az adott elemi üzenetek. Kiinduláskor
legyen Γ0 az a gráf, aminek a csúcsai ezek az elemi üzenetek, és amiben nincs egyetlen él sem. Minden wi csúcsot súlyozzuk
meg a hozzá tartozó pi előfordulási valószínűséggel. Ezt a Γ0 gráfot fogjuk több lépésben átalakítani.
Az első lépésben legyen t az M – 2 szám n – 1-gyel vett osztási maradéka plusz 2 (ahol M az elemi üzenetek számát, n
pedig a kódábécé méretét jelöli). Az összes többi lépésben legyen t = n. Általában, a k-adik lépésben kiválasztjuk a Γk–1 gráf t
legkisebb súlyú összefüggő komponensét, és egy újabb csúcs hozzáadásával egy irányított fát készítünk belőlük, melyben az
újonnan hozzáadott csúcs a gyökér, és ebből minden érintett összefüggő komponens gyökeréhez húzunk egy élt. Ennek az
új irányított fának a súlya a felhasznált összefüggő komponensek súlyösszege.
Könnyen átgondolható, hogy minden egyes lépéssel csökken az összefüggő komponensek száma, amely szám minden
egyes lépés után egy olyan pozitív egész, ami n – 1-gyel osztva 1-et ad maradékul. Továbbá minden lépés eredménye egy
olyan gráf, amiben az összes összefüggő komponens egy irányított fa, melyben a levelektől eltekintve minden csúcs ki-foka
legfeljebb n. Végül pontosan egy összefüggő komponens marad, melynek a súlya pontosan 1.
Ezután címkézzük az irányított éleket az F kódábécé karaktereivel úgy, hogy az azonos csúcsból kiinduló élekhez
mindig különböző karaktereket rendelünk. (Ezt megtehetjük, hiszen a kapott irányított gráfban minden csúcs ki-foka
legfeljebb n.) Majd minden egyes elemi üzenethez, mint a kapott irányított fa egy leveléhez azt a szót rendeljük kódszóként,
amit a gyökértől az adott levélig megtett út során, az érintett élekhez írt karakterekből összeolvasunk. Az így készített
kódokat nevezzük Hu man-kódoknak, az eljárás során elkészített irányított fát pedig Hu man-fának.
Példa. Legyen az elemi üzenetek halmaza W = {a, b, c, d, e, f}, és tegyük fel, hogy a hozzájuk tartozó előfordulási
valószínűségek pedig p(a) = 0,23, p(b) = 0,19, p(c) = 0,14, p(d) = 0,17, p(e) = 0,21 és p(f) = 0,06. A bináris Hu man-kód
elkészítése a következő lépésekből áll:
A kódszavak a kapott Hu man-gráfból olvashatók ki: a → 00, b → 011, c → 110, d → 010, e → 10 és f → 111. Az átlagos
kódhosszúság:
Összehasonlításképp, az entrópia
25.2. Hibajavító kódok
A továbbiakban csak állandó hosszúságú kódokkal foglalkozunk. Ilyenkor egy n hosszúságú kódon egy olyan halmazt
értünk, amiben minden kódszó egy n hosszúságú karaktersorozat. Az üzenet küldője és fogadója közt van egy előzetes
megegyezés a kódszavak listájáról (és azok jelentéséről), azonban az információs csatornán az átküldött kódszavak
torzulhatnak, amin azt értjük, hogy egyes karaktereik esetleg megváltoznak. Így a fogadó fél nem feltétlenül egy olyan szót
kap kézhez, ami szerepel a kódszavak listáján, és ebben az esetben utánanéz, hogy melyik kódszó „hasonlít” a leginkább a
kapott karaktersorozathoz. Ez a művelet a hibajavítás, ami természetesen nem nyújt százszázalékos biztonságot, inkább
csak arra mutat rá, hogy „jó eséllyel” mi lehetett az eredeti üzenet. Ennek a hibajavításnak a matematikai leírásához
néhány alapvető fogalomra van szükségünk.
Két kódszó, x és y távolsága (Hamming-távolsága) azon pozícióknak a száma, ahol a két kódszó eltér egymástól. Ezt a
távolságot d(x, y) jelöli.
A Hamming-távolság tehát azt jelzi, hogy hány karaktert kell megváltoztatni az egyik kódszóban ahhoz, hogy a másik
kódszót kapjuk eredményül. Ha x = x1x2…xn, és y = y1y2…yn, akkor
Egy C kód minimális távolsága pedig a különböző kódszavak közt fellépő legkisebb távolság:
A Hamming-távolság egy metrika egy adott hosszúságú szavak halmazán, azaz rendelkezik az alábbi tulajdonságokkal:
- d(x, y) ≥ 0 bármely x és y szavakra.
- d(x, y) = 0 akkor és csak akkor, ha x = y.
- d(x, y) = d(y, x) bármely x és y szavakra.
- d(x, y) + d(y, z) ≥ d(x, z) bármely x, y és z szavakra.
Egy C kódról azt mondjuk, hogy t hiba-jelző (felismer t hibát), ha t < d(C). Ezen azt értjük, hogy ha egy küldött szóban t
karakter megváltozik, és ez a t szám kisebb a kód minimális távolságánál, akkor a fogadó fél által kapott szó nem lehet még
véletlenül sem egy másik kódszó, így a fogadó fél tisztában van azzal, hogy az üzenet hibásan érkezett, és jobb esetben
ilyenkor az üzenet újbóli elküldését kérheti.
Egy C kód t hiba-javító(korrigál t hibát), ha bármelyik, a kódnak megfelelő hosszúságú w szóhoz legfeljebb egy olyan x
kódszó létezik, amivel d(w, x) ≤ t. Ekkor ha egy elküldött kódszóban t karakter megváltozik, a fogadó fél nemcsak azt ismeri
fel, hogy a kódszó hibásan érkezett, hanem vissza is tud következtetni az eredetileg küldött szóra. Egy C kód pontosan
akkor t hiba-javító, ha 2t < d(C).
A legegyszerűbb példái a hibafelismerő, illetve hibajavító kódoknak az ismétlő kódok. Például ha minden kódszó
ugyanannak a betűnek az n-szeri elismétlése, azaz C = {aa…a | a ∈ F}, ahol F a kódábécét jelöli, akkor bármely két
különböző kódszó távolsága pontosan n, így d(C) = n. Ekkor a C kód t hiba-felismerő, amennyiben t < n, illetve t hiba-javító,
amennyiben 2t < n. Ezeknek az ismétlő kódoknak az előnye, hogy kis számú hibát egyszerűen fel lehet ismerni, illetve ki
lehet javítani velük: ha a beérkező szóban a karaktereknek több mint a fele ugyanaz, akkor valószínűleg annak a
karakternek az ismétléséből állt az eredeti üzenet. Azonban az ismétlő kódoknak van egy nagy hátránya is: helyigényesek.
Kicsit másképp fogalmazva, a használt kódhosszúsághoz képest csak kevés kódszó áll rendelkezésünkre.
Példa. A C = {000000, 010101, 101010, 111111} kód szigorú értelemben nem ismétlő kód, de ismétlésen alapszik: minden
kódszóban az első két karakter ismétlődik meg háromszor. Itt a kódtávolság három, tehát C egy 1 hiba-javító kód. Ez
a kód azért nem gazdaságos, mert egy négy kódszóból álló, 1 hiba-javító kódot rövidebb kódhosszúsággal is
készíthetünk, például {00000, 11100, 00111, 11011}. Itt a minimális távolság szintén három, a kódhossz viszont csak öt.
Egy (n, M, d) kódon egy M darab n hosszúságú kódszóból álló és d minimális távolságú kódot értünk. Jó esetben az n
szám viszonylag kicsi (rövidebb kódszavakkal időt és anyagi költségeket takaríthatunk meg), az M szám viszonylag nagy
(minél több kódszó áll rendelkezésünkre, annál többféle üzenetet tudunk megfogalmazni), és végül a d számról szintén azt
szeretnénk, hogy lehetőleg minél nagyobb legyen, hiszen így válik a kód biztonságossá a hibafelismerés, illetve a
hibajavítás szempontjából. A gyakorlati probléma abból adódik, hogy ezt a három törekvést nehéz egyszerre szem előtt
tartani: bármely két paraméter megadása esetén a harmadik paraméternek már megvannak a korlátai. A hibajavító kódok
elméletének az egyik fő célja lényegében az, hogy ezeket a korlátokat megtaláljuk. Tehát például arról van szó, hogy adott n
kódhossz és előírt M kódszómennyiség mellett maximálisan mekkora lehet a d kódtávolság, vagy ha a d kódtávolságot és az
M kódszómennyiséget írjuk elő, akkor minimálisan mekkora hosszúságú kódszavakat kell használnunk. A leginkább
vizsgált kérdéskör viszont a harmadik felállás, amikor is adott n kódhossz és előírt d kódtávolság mellett szeretnénk
megállapítani, hogy maximálisan hány szóból állhat a kód.
Aq (n, d) jelöli a legnagyobb olyan M számot, amivel létezik egy q karakterre épülő (n, M, d) kód. Amennyiben ilyen kód
nincs, akkor Aq (n, d) sincs értelmezve.
Abban a két szélsőséges esetben, amikor d = 1 vagy d = n, ez az Aq(n, d) érték egyszerűen átgondolható: Aq(n, 1) = qn és
Aq(n, n) = q. (Az összes n hosszúságú szó halmaza qn elemű és 1 minimális távolságú, illetve az azonos karakterekből álló
szavak halmaza q elemű és n minimális távolságú.) Továbbá az is igaz, hogy Aq(n, 2) = qn–1, azonban általános képlet nincs
Aq(n, d)-re. Sőt, nagyobb kódhosszúságok mellett ez az érték már csak bizonyos speciális esetekben ismert, általában már
azzal is be kell érnünk, hogy ha az Aq(n, d) értékekre bizonyos alsó, illetve felső korlátokat tudunk megadni.
Példa. A2(5, 3) = 4. Négy kódszóból álló, 5 hosszúságú és 3 távolságú kódot egy korábbi példában már láttunk: {00000,
11100, 00111, 11011}. És viszonylag könnyen átgondolható, hogy négy kódszó a maximum: öt szóból álló, 5 hosszúságú
és 3 távolságú bináris kód már nem létezik.
Az alábbi táblázat összefoglalja a jelenleg ismert A2(n, d) értékeket n ≤ 20 és d = 3, 5, 7, 9, 11, 13 és 15 mellett. (Ahol két
szám van megadva, ott a pontos érték egyelőre nem ismert, a két szám közül értelemszerűen az egyik alsó, a másik felső
korlát.) A páros d számokhoz tartozó A2(n, d) értékek szintén kiolvashatók ebből a táblázatból: amennyiben d páros, akkor
A2(n, d) = A2(n – 1, d – 1).
3 2 – – – – – –
4 2 – – – – – –
5 4 2 – – – – –
6 8 2 – – – – –
7 16 2 2 – – – –
8 20 4 2 – – – –
9 40 6 2 2 – – –
10 72 12 2 2 – – –
11 144 24 4 2 2 – –
12 256 32 4 2 2 – –
13 512 64 8 2 2 2 –
14 1024 128 16 4 2 2 –
15 2048 256 32 4 2 2 2
Egyszerű átalakítások
Korlátok Aq (n, d)-re
Egyszerű átalakítások
Adott kódokból az alábbi egyszerű átalakításokkal újabb kódokat kaphatunk.
1. Egy rögzített permutációt végrehajtunk az összes kódszón belül az egyes pozíciókra. Ha σ az {1, 2, …, n} számoknak egy
permutációja és x = x1x2…xn egy n hosszú szó, legyen xσ=xσ(1)xσ(2)…xσ(n). Ekkor tetszőleges n hosszúságú C kód esetén Cσ=
{xσ | x ∈ C} egy szintén n hosszúságú kód, aminek a további paraméterei (kódszavak mennyisége, minimális távolság) is
megegyeznek az eredeti kód paramétereivel.
2. Az ábécé elemeit permutáljuk meg egy rögzített pozícióban. Ha τ az F ábécé elemeinek egy permutációja, 1 ≤ i ≤ n és x = x1x2…
xn egy n hosszú szó, legyen xτ,i = x1 … xi–1 τ(xi)xi+1… xn. Ekkor tetszőleges n hosszúságú C kód esetén Cτ,i = {xτ,i | x ∈ C}
szintén egy olyan kód, aminek a paraméterei megegyeznek az eredeti kód paramétereivel.
3. Egy pozíciót törlünk. Rögzített 1 ≤ i ≤ n mellett az n hosszúságú C kód összes szavából töröljük az i-edik pozíciót, az
eredményül kapott kód n – 1 hosszúságú, és a minimális távolsága vagy változatlan, vagy 1-gyel kisebb, mint az eredeti kód
minimális távolsága. A kódszavak mennyisége általában nem változik, kivéve azt az egy esetet, amikor az eredeti minimális
távolság 1 volt, és létezett két olyan kódszó, amik csak az i-edik koordinátában tértek el egymástól. Ekkor ugyanis ebből a két
szóból a törlés után ugyanaz marad meg.
4. Ha kiválasztunk olyan kódszavakat, amik egy rögzített i-edik pozícióban ugyanazt a karaktert tartalmazzák, majd ezekből
állítjuk össze az új kódot az i-edik pozíció törlésével, akkor a kódhosszúság 1-gyel rövidül, és a kódszavak száma jelentősen
csökkenhet, viszont a kapott kód minimális távolsága egész biztosan nem csökken. Így például egy bináris (n, M, d) kódból
kaphatunk egy bináris kódot, hiszen ha nincs kódszó, ami 0-t tartalmaz az i-edik pozícióban,
akkor biztosan van kódszó, ami 1-et tartalmaz az i-edik pozícióban.
5. Paritás-ellenőrző bit hozzáadása. Ezt a műveletet bináris kódokra alkalmazhatjuk: minden kódszó végéhez hozzáírunk még
egy 0-t vagy 1-et aszerint, hogy a kódszó páros vagy páratlan 1-est tartalmazott. Az eredményül kapott kódban minden szó
páros sok 1-est fog tartalmazni, így annak a minimális távolsága biztosan egy páros szám lesz (ami nem lehet kisebb, mint az
eredeti kód minimális távolsága). Ezt a műveletet tehát páratlan minimális távolságú kódokon érdemes végrehajtani: ha C
egy bináris (n, M, d) kód, és d egy páratlan szám, akkor a paritás-ellenőrző bit hozzáadása egy (n + 1, M, d + 1) kódot ad
eredményül.
Két kódot ekvivalensnek nevezünk, ha egymásból megkaphatók a fenti lista első és második műveleteinek (esetleg
többszöri) alkalmazásával. Ezekre a műveletekre azért lehet szükség, mert így egy tetszőlegesen rögzített szót bevihetünk
egy kódba. Ha C egy n hosszú kód, és x = x1x2…xn egy ugyanarra az ábécére épülő szó, akkor van olyan C-vel ekvivalens kód,
ami tartalmazza az x szót. Speciálisan minden bináris kód ekvivalens egy olyan kóddal, ami tartalmazza a csupa nulla szót.
A harmadik, negyedik és ötödik műveletekből az alábbi egyenlőtlenségek, illetve egyenlőségek vezethetők le:
- Aq(n – 1, d – 1) ≥ Aq(n, d);
- q · Aq(n – 1, d) ≥ Aq(n, d);
- ha d egy pozitív páros szám, akkor A2(n – 1, d – 1) = A2(n, d).
Az utolsó átalakítási módszert, az ellenőrző bit hozzáadását akkor is meg tudjuk tenni, ha az F ábécé egy tetszőleges
test (például F = {0, 1, …, q – 1} valamilyen q prímszám mellett, és mint látni fogjuk, az algebrai kódelmélet nagyrészt ilyen
kódokkal foglalkozik), ilyenkor a kódszavak végére azt a karaktert írjuk, amivel a karakterek összege 0-t eredményez. Egy n
hosszúságú C kód ellenőrző bittel kiterjesztett kódja:
Ha C egy (n, M, d) kód, akkor C̄ egy (n + 1, M, d̄) kód, ahol d értéke vagy d, vagy d + 1, viszont nincs általános módszer
annak a megállapítására, hogy a kettő közül melyik.
Ennek a korlátnak a hátterében az az észrevétel áll, hogy egy q elemű ábécét használó n hosszúságú kód minden
tagjának az e sugarú hibakörnyezete (azon szavak halmaza, amik az adott kódszótól legfeljebb e távolságra állnak)
pontosan szót tartalmaz. És amennyiben a kódszavak egymástól mért távolsága mindig legalább 2e + 1,
akkor ezek az e sugarú hibakörnyezetek diszjunktak, így az együttes méretük nem lehet több, mint amennyi n hosszú szó
van összesen, azaz qn. Azokat a kódokat, amiknek a mérete pontosan a Hamming-korlát által megadott felső határ, perfekt
kódoknak nevezzük.
A Singleton-korlát pedig azon a tényen alapszik, hogy egy n hosszúságú és d távolságú kód bármely két tagja az első n –
d + 1 pozíció valamelyikében eltér egymástól (a maradék d – 1 pozícióból már nem jöhet össze a szükséges d távolság). Az
első n – d + 1 pozícióra pedig qn–d+1 lehetőség van, így:
Azokat a kódokat, amiknek a mérete pontosan a Singleton-korlát által megadott felső határ, MDS kódoknak nevezzük.
(Ez az angol „maximum-distance separable” kifejezés kezdőbetűiből adódik.)
A Plotkin-korlátok nagyjából csak azokra az esetekre vonatkoznak, amikor a minimális távolság legalább a kódhossz
fele:
-
Ha d páros és n < 2d, akkor
- Ha d páros, akkor A2(2d, d) ≤ 4d.
-
Ha d páratlan és n < 2d + 1, akkor
- Ha d páratlan, akkor A2(2d + 1, d) ≤ 4d + 4.
A Gilbert–Varshamov-korlát alsó korlátot szolgáltat az Aq(n, d) értékekre. Két változata van, az egyik erősebb korlát,
de azzal a feltevéssel, hogy q prímhatvány, míg a másik kicsit gyengébb, de általános korlát.
- Ha q egy prímhatvány, és
Ezekkel a műveletekkel Fn egy n dimenziós vektortér F felett. (Vektorterekről bővebben a 11. fejezetben olvashatunk.)
Egy n hosszúságú és F karakterkészletű C kód lineáris, ha altere az Fn vektortérnek, azaz nem üres, zárt az összeadásra
és zárt a skalárokkal való szorzásra is.
Egy lineáris kód tehát saját maga is vektortér F felett, és ha a dimenziója k, akkor az elemszáma qk. A szokásos jelöléssel
C ekkor egy lineáris [n, k]-kód, illetve ha a d kódtávolságra is szeretnénk hivatkozni, akkor C egy lineáris [n, k, d]-kód.
Példa. A C = {00000, 11100, 00111, 11011} kód egy lineáris [5, 2, 3]-kód az F = {0, 1} kételemű test felett. Bináris kódról
lévén szó, itt a skalárszorosokról igazából nincs értelme beszélni, hiszen minden szónak csak két skalárszorosa van:
az 1-szerese, ami önmaga és a 0-szorosa, ami a csupa nulla szó, és ez valóban eleme C-nek. Továbbá az is könynyen
ellenőrizhető, hogy bármely két C-beli szó összege is valamelyik C-beli szót eredményezi.
Egy lineáris kód mindig tartalmazza a csupa nulla szót (amit 0-val jelölünk, és ez az Fn vektortér nullvektora), hiszen
bármelyik kódszóval együtt annak minden skalárszorosát, speciálisan a 0-szorosát is tartalmaznia kell. Ezért aztán ha a
minimális kódtávolság d, akkor minden más kódszóban szükségszerűen lennie kell legalább d nem nulla karakternek.
Egy x ∈ Fn szó súlya a benne szereplő nem nulla karakterek száma. Ezt a számot w(x) jelöli. Egy C lineáris kód
minimális súlya, w(C) a benne szereplő 0-tól különböző kódszavak súlyainak a minimuma.
Tehát w(x) nem más, mint az x szó távolsága a 0 szótól: w(x) = d(x, 0). Megfordítva, két szó távolságát is ki lehet fejezni a
súly fogalmával: d(x, y) = w(x – y). Továbbá az is igaz, hogy egy lineáris kód minimális távolsága és minimális súlya
megegyezik: d(C) = w(C).
Ez utóbbi észrevételben jelentkezik a lineáris kódok egyik nagy előnye: ahhoz, hogy a kódtávolságot megállapítsuk,
elég a kódszavak súlyait megvizsgálni. Általában, egy M szóból álló kód minimális távolságának a meghatározásához az
összes lehetséges szópár távolságát meg kell nézni, ez pedig M(M – 1)/2 vizsgálat. Egy M szóból álló lineáris kód esetén
azonban ennél lényegesen kevesebb munkát, pontosabban M – 1 vizsgálatot jelent a minimális távolság meghatározása,
hiszen ehhez csak a nem nulla kódszavak súlyaira van szükségünk.
Egy másik előnye a lineáris kódoknak, hogy a precíz meghatározásukhoz nem kell az összes általuk tartalmazott
kódszót felsorolni. Mivel egy lineáris kód egyben egy vektortér is, ezért tartalmaz bázist: egy olyan vektorhalmazt, aminek
az elemeiből minden kódszó pontosan egyféleképpen állítható elő lineáris kombinációval. Egy lineáris [n, k]-kód tehát
meghatározható k darab n hosszú vektor segítségével, amikből már az összes kódszót elő tudjuk állítani.
Egy lineáris [n, k]-kód generátormátrixa egy olyan k×n méretű mátrix, aminek a sorai az adott lineáris kódnak egy
bázisát alkotják.
Példák
1. Az n hosszú ismétlő kód egy lineáris [n, 1]-kód, a generátormátrixa (1 1 … 1).
2.
A C = {00000, 11100, 00111, 11011} lineáris [5, 3, 2]-kódnak egy lehetséges generátormátrixa .
3.
mátrix által generált bináris lineáris kód egy [7, 4]-kód, összesen 24 = 16 kódszóból
áll.
A generátormátrixon elemi sorátalakításokat hajthatunk végre anélkül, hogy a generált kód megváltozna, és mivel
minden (test feletti) mátrix elemi sorátalakításokkal redukált lépcsős alakra hozható, így ebből következik, hogy minden
lineáris kódnak van redukált lépcsős alakú generátormátrixa. Amennyiben a generátormátrixban oszlopcseréket hajtunk
végre, akkor általában megváltozik a generált kód is, viszont a fontosabb tulajdonságai (hossz, kódszavak száma,
minimális távolság) változatlanok maradnak. Egy, az eredetivel ekvivalens kódot kapunk. Az oszlopcserék alkalmazása
pedig azért lehet praktikus, mert így a redukált lépcsős alakra hozott generátormátrixból egy olyan mátrixot készíthetünk,
aminek a bal oldalán egy egységmátrix szerepel.
Minden lineáris [n, k, d]-kód ekvivalens egy olyan lineáris [n, k, d]-kóddal, aminek létezik (Ek | A) alakú
generátormátrixa, ahol A egy k × (n – k) méretű mátrix, Ek pedig a k × k méretű egységmátrix. Az ilyen generátormátrixra
azt mondjuk, hogy standard alakú.
Példa. Az előző példában már láttuk, hogy a C = {00000, 11100, 00111, 11011} lineáris [5, 3, 2] = kódnak egy lehetséges
Duális kód
Hamming-kódok
Golay-kódok
Perfekt kódok
BCH-kódok
Duális kód
Az Fn vektortérben természetes módon értelmezhetünk egy skalárszorzást: ha x = x1x2…xn és y = y1y2…yn, akkor x · y = x1y1
+ x2y2+ … + xnyn. Két vektor merőleges egymásra, ha skalárszorzatuk nulla.
Azok a vektorok, amik egy adott C ⊂ Fn kód összes elemére merőlegesek, szintén egy alteret alkotnak Fn-ben, ez a C
merőleges altere, kódelméleti nyelven duális kódja, jelölése C┴.
Ahhoz, hogy egy v ∈ Fn vektor benne legyen a duális kódban, elég, ha az eredeti kód egy generátormátrixának minden
sorára merőleges, ebből ugyanis már következik, hogy merőleges az összes kódszóra is. Ha C egy [n, k]-kód, akkor C┴ egy
[n, n – k]-kód, továbbá C┴ duális kódja maga az eredeti C kód. A C┴ duális kód egy generátormátrixát C ellenőrző
mátrixának nevezzük:
Egy lineáris [n, k]-kód ellenőrző mátrixa egy olyan (n – k) × n méretű H mátrix, amivel tetszőleges x vektor esetén xHT =
0 pontosan akkor teljesül, ha x egy kódszó.
Egy lineáris [n, k]-kód H ellenőrző mátrixa standard alakú, ha H = (B | En–k) valamilyen alkalmas (n – k) × k méretű B
mátrixszal.
Ha G = (Ek | A) egy generátormátrixa a C lineáris [n, k]-kódnak, akkor H = (– AT | En–k) egy generátormátrixa a C┴ duális
kódnak.
Ha egy lineáris kód ellenőrző mátrixában van d lineárisan összefüggő oszlop, de bármely d – 1 oszlop lineárisan
független, akkor a kód minimális távolsága pontosan d.
Egy fontos gyakorlati alkalmazás pedig, hogy meghatározott minimális távolságú kódokat tudunk készíteni alkalmas
ellenőrző mátrixokból kiindulva.
Példa. Az F = {0, 1} kételemű test feletti mátrix egy standard alakú ellenőrző mátrix, és
bármely két oszlopa lineárisan független. Lineárisan öszszefüggő oszlophármast viszont már tartalmaz, pl. a
második, harmadik és negyedik oszlop összege a nullvektort eredményezi. A H-hoz mint standard ellenőrző
Legyen C egy lineáris [n, k]-kód, és H egy ellenőrző mátrixa. Egy tetszőleges Fn-beli y vektor C-hez tartozó
szindrómavektora az S(y) = y · HT sorvektor.
Ez a szindrómavektor általában függ H megválasztásától, viszont pontosan akkor a nullvektor, ha y egy C-beli kódszó.
Illetve két vektor, x és y szindrómája pontosan akkor egyezik meg, ha az x – y különbségvektor egy C-beli kódszó. Ez a tény
megkönnyíti a dekódolás folyamatát, ugyanis ha ismerjük a lehetséges hibavektorok szindrómáit, akkor egy beérkezett
üzenetszó szindrómáját kiszámítva nemcsak az derül ki, hogy történt-e torzulás az átviteli csatornán, hanem vissza is
tudunk következtetni az esetleges hibára. Ha az elküldött üzenet az x kódszó, ami menet közben egy e hibavektorral
változott, így az y = x + e szó érkezett meg, akkor ennek a szindrómája S(y) = S(x)+ S(e) = S(e). Amennyiben
rendelkezésünkre áll a lehetséges hibavektorok szindrómáinak a listája, akkor e lista alapján az S(e) szindrómából kiderül,
hogy mi lehetett az e hibavektor, amit aztán a beérkezett y vektorból levonva megkapjuk az eredetileg küldött üzenetet: x =
y – e.
Hamming-kódok
A Hamming-kódok lineáris egy hiba-javító kódok, amiket bármilyen F véges test felett de niálhatunk. Elméleti
jelentőségük, hogy perfekt kódok (azaz a Hamming-korlát által megengedett lehető legtöbb kódszót tartalmazzák),
praktikus szempontból pedig azért fontosak, mert igen egyszerű eljárással elvégezhető a hozzájuk tartozó kódolási,
hibajavítási és dekódolási folyamat.
Legyen F egy q elemű véges test, r egy pozitív egész és H egy olyan mátrix, aminek r sora és oszlopa van:
valamilyen sorrendben azok az F feletti r hosszú nem nulla oszlopvektorok, amelyeknek az első 0-tól különböző eleme
1. Ekkor a H-hoz mint ellenőrző mátrixhoz tartozó lineáris kód egy Hamming-kód, jelölése Ham (r, q).
Ez a kód tehát nem egyértelmű (csak ekvivalencia erejéig az), hiszen a H mátrix oszlopainak a sorrendje szabadon
megválasztható, így precízen fogalmazva Ham (r, q) valójában kódoknak egy osztályát jelöli. A lényeg, hogy a de nícióban
szereplő H mátrixhoz tartozó Hamming-kód azokból a kódszavakból áll, amik minden H-beli sorra merőlegesek. Ez a kód
A Hamming-korlát szerint egy n hosszúságú, 3 távolságú kód legfeljebb kódszót tartalmazhat. Mivel itt
n = (qr – 1)/(q – 1), ebből a felső korlátból egyszerűsítés után qn – r adódik, ami pontosan a Ham (r, q) kód szavainak a száma.
A Hamming-kódok tehát perfekt kódok: az adott kódhosszúság mellett a lehető legtöbb kódszót tartalmazzák.
generátormátrixa
A Hamming-kódok egy hiba-javító kódok, így a dekódolásukhoz abból a feltevésből kell kiindulnunk, hogy az
információs csatornán átküldött kódszavakon legfeljebb egy hiba történik, azaz legfeljebb egy karakter változik meg. És
perfekt kódokról lévén szó, minden (a kódnak megfelelő hosszúságú) szó benne van valamelyik kódszó egy sugarú
hibakörnyezetében: vagy maga egy kódszó, vagy pontosan egy pozícióban tér el egy kódszótól. Tehát a lehetséges
hibavektorok azok a vektorok, amiknek pontosan egy nullától különböző koordinátájuk van. Ezeknek a
szindrómavektorait könnyen le tudjuk írni: ha ei jelöli azt a vektort, aminek az i-edik koordinátája 1, és a többi koordinátája
mind nulla, továbbá b ∈ F, akkor S(bei) az ellenőrző mátrix i-edik oszlopának a b-szerese, sorvektorként felírva.
(Precízebben: az ellenőrző mátrix transzponáltjában az i-edik sor b-szerese.) A dekódolás folyamata ezek után a következő:
a kapott y vektornak kiszámítjuk az S(y) = y · HT szindrómavektorát, ahol H az ellenőrző mátrix. Ha ez a nullvektor, akkor
y egy kódszó, és feltételezhetjük, hogy nem történt hiba az adatátvitelben. Ha S(y) ≠ 0, akkor jelölje b az első nullától
különböző koordinátáját, és jelölje i azt a számot, amire b–1 S(y) megegyezik a HT mátrix i-edik sorával. (Ilyen i létezik, mert
b–1 S(y) első nullától különböző koordinátája 1.) Ebből már következik, hogy a hiba az i-edik pozícióban történt, a mértéke
pedig b, azaz a küldött kódszó x = y – bei.
Golay-kódok
A kibővített bináris Golay-kód, G24 egy 24 hosszúságú lineáris kód, aminek a generátormátrixa G = (E12 |A), ahol E12 a 12 × 12
méretű egységmátrix és
A kódszavak száma 212 = 4096, és annyit érdemes még tudni erről a kódról, hogy duálisa saját magának (G⊥24 = G24),
minden benne szereplő kódszó súlya osztható 4-gyel, továbbá a minimális távolsága 8, azaz G24 egy [24, 12, 8]-kód. Ebből
egyszerűen úgy kapjuk meg a G23 bináris Golay-kódot, hogy a kódszavak utolsó koordinátáit elhagyjuk, tehát G23 egy
lineáris [23, 12, 7]-kód.
A Hamming-korlát alapján egy 23 hosszúságú és 7 minimális távolságú kód mérete legfeljebb
A G23 kódban pedig pontosan ennyi kódszó van, így G23 egy perfekt kód.
A kibővített ternér (ternáris) Golay-kód, G12 egy 12 hosszúságú lineáris kód a háromelemű F = {0, 1, 2} test felett, aminek
a generátormátrixa G = (E6 | B), ahol E6 a 6 × 6 méretű egységmátrix és
A kódszavak száma 36 = 729, ez a kód is duálisa saját magának (G⊥12 = G12), és a minimális távolsága 6, azaz G12 egy [12, 6,
6]-kód. Ebből egyszerűen úgy kapjuk meg a G11 ternér Golay-kódot, hogy a kódszavak utolsó koordinátáit elhagyjuk, tehát
G11 egy lineáris [11, 6, 5]-kód.
A Hamming-korlát alapján egy 11 hosszúságú és 5 minimális távolságú ternér kód mérete legfeljebb
A G11 kódban pedig pontosan ennyi kódszó van, így G11 szintén egy perfekt kód.
Perfekt kódok
Mint már említettük korábban, egy q elemű ábécére épülő, n hosszú és e hiba-javító kód mérete a Hamming-korlát alapján
legfeljebb , és amenynyiben pontosan ennyi, akkor a kódot perfekt kódnak nevezzük. A perfekt
kódoknak egy másik lehetséges de níciója:
Egy n hosszúságú és e hiba-javító C kód perfekt, ha bármely n hosszú x szóhoz pontosan egy olyan C-beli c kódszó
létezik, amivel d(x, c) ≤ e.
Vannak bizonyos triviális (és nem éppen praktikus) perfekt kódok, ezek három típusba sorolhatók:
- Ha e = 0: Az összes n hosszú szót tartalmazó C = Fn kód egy 0 hiba-javító perfekt kód.
- Ha egy kód csak egy darab n hosszú kódszót tartalmaz, akkor az egy perfekt n hiba-javító kód.
- Ha n = 2e + 1, akkor az n hosszú bináris ismétlő kód, C = {00 … 0, 11 … 1} (illetve bármely ezzel ekvivalens kód) egy perfekt e
hiba-javító kód.
A már tárgyalt Hamming- és Golay-kódokon kívül léteznek még nem triviális perfekt kódok, viszont érdekes módon az
ismert nem triviális perfekt kódok paraméterei mind megegyeznek valamelyik Hamming-kód vagy Golay-kód
paramétereivel. Azt nem tudjuk, hogy van-e olyan, aminek az ábécéje nem prímhatvány elemszámú. A prímhatvány
elemszámú ábécére épülő perfekt kódokról pedig a következő igaz:
Ha C egy q elemű ábécé feletti nem triviális perfekt kód, ahol q egy prímhatvány, akkor C paraméterei (hosszúsága,
mérete és minimális távolsága) megegyezik valamelyik Hamming-kód vagy Golay-kód paramétereivel.
Ezt a tételt 1973-ban van Lint és Tietäväinen bizonyították először, illetve tőlük függetlenül Zinovjev és Leontyev.
Ennél kicsit több is igaz, a két Golay-kód ugyanis bizonyos értelemben egyértelmű, ezt Sover, Delsarte és Goethals
bizonyították 1973-ban, illetve 1975-ben.
Minden perfekt (23, 4096, 7)-kód ekvivalens a G23 bináris Golay-kóddal, és minden perfekt (11, 729, 5)-kód ekvivalens a
G11 ternér Golay-kóddal.
BCH-kódok
A BCH-kódokat először Hocquenghem fedezte fel 1959-ben, majd tőle függetlenül Bose és Ray-Chaudhuri 1960-ban. (A BCH
elnevezés a neveik kezdőbetűiből tevődik össze.)
Legyen q egy tetszőleges prímhatvány, d egy 1-nél nagyobb pozitív egész, n egy d-nél nem kisebb és q-hoz relatív prím
pozitív egész, és jelölje e a q szám rendjét modulo n (azaze a legkisebb olyan pozitív egész, amivel qe – 1 osztható n-nel).
Továbbá legyen α egy generátoreleme a qe elemű test multiplikatív csoportjának (azaz egy olyan elem, aminek a
hatványaiként a test összes nullától különböző eleme előáll) és β egy olyan elem, amivel Fq[β] = . (Ez azt jelenti, hogy
az test minden eleme előáll c0 + c1 β + … + ce–1βe–1 alakban valamilyen ci ∈ Fq együtthatókkal.) Ezek után legyen H a
következő e(d – 1) × n méretű, Fq feletti mátrix:
Ez a mátrix úgy értendő, hogy az összes αk hatvány helyébe azt az oszlopvektort írjuk, aminek a c0, c1, …, ce–1
koordinátáival c0 + c1β + … + ce–1βe–1 = αk. A H ellenőrző mátrix által meghatározott lineáris kód egy n hosszúságú és d
távolságú kód, aminek a dimenziója legalább n – e(d – 1). Ez az n hosszúságú és előírt d távolságú BCH-kód.
A Reed–Solomon-kódok a BCH-kódoknak azt a speciális esetét képezik, amikor n = q – 1. Ekkor q rendje 1 modulo n, így
az ellenőrző mátrix mérete (d – 1) × n, és a kapott kód egy lineáris [n, n – d + 1, d]-kód. A Reed–Solomon-kódok tehát MDS-
kódok: a Singleton-korlát által megengedett lehető legtöbb kódszót tartalmazzák.
Abban az esetben, amikor q egy prímszám, és Fq = {0, 1,…, q – 1}, a H ellenőrző mátrix oszlopcserék után a következő
alakban írható fel:
Egy lineáris kód ciklikus, ha bármely kódszónak tetszőleges ciklikus eltoltja is egy kódszó.
A ciklikus tulajdonsághoz természetesen elég, ha a0a1… an–1 ∈ C-ből következik an–1a0 a1 … an–2 ∈ C. A továbbiakban az
n hosszú sorvektorok koordinátáit 0-tól n – 1-ig fogjuk indexelni, ciklikus kódoknál ezt az indokolja, hogy a
sorvektoroknak polinomokat feleltetünk meg: az a0a1 … an–1 sorvektornak megfelelő polinom a0 + a1x + … + an–1xn–1.
Ezt a megfeleltetést átvihetjük egy, az Fn vektortér és az F[x]/(xn – 1) faktorgyűrű közötti megfeleltetésbe, ami már
kölcsönösen egyértelmű: az a0a1… an–1 sorvektornak az a0 + a1x + … + an–1xn–1 polinom mellékosztálya felel meg. (Mivel egy
n-edfokú polinom által generált ideállal faktorizáltunk, így minden mellékosztály egyértelműen reprezentálható egy
legfeljebb n – 1-edfokú polinommal.) A továbbiakban jelölje Rn az F[x]/(xn – 1) faktorgyűrűt, amit tulajdonképpen
azonosíthatunk a legfeljebb n – 1-edfokú, F feletti polinomok halmazával, amiben a szorzás művelet elvégzésekor xn
helyébe 1, xn+1 helyébe x, és általában xn+i helyébe xi írandó.
Egy Rn-beli C kód pontosan akkor ciklikus, ha gyűrűelméleti értelemben egy ideál.
Mint minden kommutatív gyűrűben, Rn-ben is bármelyik elem generál egy főideált, így azt is mondhatjuk, hogy
minden legfeljebb n – 1-edfokú polinom generál egy n hosszú ciklikus kódot. Sőt, mivel n-től és q-tól függetlenül Rn minden
ideálja főideál, így minden ciklikus kód generálható egy polinommal. (Viszont nem minden polinom elég szerencsés
ahhoz, hogy egy használható ciklikus kódot generáljon.)
Legyen C egy legalább kételemű Rn-beli ciklikus kód és g(x) a C-beli legkisebb fokú normált polinom. Ez a g(x) polinom
egyértelmű, generálja C-t, és F[x]-ben osztója az xn – 1 polinomnak.
Egy azonnali következmény, hogy az n hosszúságú ciklikus kódok kölcsönösen és egyértelműen megfeleltethetők az xn
– 1 polinom F[x]-beli normált osztóinak. Ebben a megfeleltetésben a konstans 1 polinomhoz az összes n hosszú szót
tartalmazó triviális kód tartozik, míg az (xn – 1)/(x – 1) = 1 + x + x2 + … +xn–1 polinomhoz az azonos karakterekből álló szavak
kódja, az ismétlő kód.
Példa. Legyen F a kételemű {0, 1} test és n = 4! Ekkor x4 – 1 felbontása F felett (x + 1)4, tehát azok a 4-nél kisebb fokú
normált polinomok, amik osztói x4 – 1-nek: 1, x + 1, (x + 1)2 = x2 + 1 és (x + 1)3 = x3 + x2 + x + 1. Így a triviális {0000} kódon
kívül három 4 hosszúságú bináris ciklikus kód létezik. A konstans polinom a teljes R4-et generálja, az x + 1 polinom a
páros súlyú szavak nyolcelemű halmazát, az x2 + 1 polinom a négyelemű {0000, 0101, 1010, 1111} kódot, míg x3 + x2 + x +
1 a kételemű {0000, 1111} ismétlő kódot.
Egy Rn-beli C ciklikus kód ellenőrző polinomja az az F[x]-beli h(x) polinom, amivel g(x) · h(x) = xn – 1.
Az ellenőrző polinom egyértelműen meghatározza magát a kódot, amennyiben a kódhosszúság is adott. Ha C egy n
hosszúságú ciklikus kód, és h(x) az ellenőrző polinomja, akkor egy Rn-beli f(x) polinom pontosan akkor tagja C-nek, ha Rn-
ben f(x) · h(x) = 0. (Ez azt jelenti, hogy F[x]-ben az f(x) · h(x) szorzatnak osztója xn – 1.)
A generátor-, illetve ellenőrző polinomok ismeretében könnyen megadhatjuk a ciklikus kódok egy-egy generátor-,
illetve ellenőrző mátrixát. Amennyiben
az n hosszú ciklikus C kód generátor- és ellenőrző polinomjai, akkor az alábbi (n – k) × n méretű G mátrix, illetve k × n
méretű H mátrix egy-egy generátormátrixa, illetve ellenőrző mátrixa C-nek.
Ebből látszik, hogy a C┴ duális kódnak a generátorpolinomja a h(x) polinom reciprok polinomjának a normáltja:
. (Az a tény, hogy h(x) osztja az xn – 1 polinomot, garantálja
hogy h0 ≠ 0.) Tehát a h(x) polinom által generált ciklikus kód általában nem azonos a C┴ duális kóddal, viszont ekvivalens
vele.
A BCH-kódokat ciklikus kódként is de niálhatjuk. A korábbi jelöléseket használva, legyen γ egy n rendű elem az
test multiplikatív csoportjában és a tetszőleges pozitív egész! Továbbá legyen g(x) a γa, γa+1, …, γa + d – 2 elemek Fq feletti
minimálpolinomjainak a legkisebb közös többszöröse! Ekkor a g(x) által generált n hosszúságú ciklikus kód nem más, mint
az előírt d távolságú BCH-kód.
A Golay-kódok szintén ciklikusak, és a Hamming-kódok közül azok a Ham (r, q) kódok, ahol r és q – 1 relatív prímek.
26. Valószínűség-számítás
26.1. Alapfogalmak, bevezetés
26.2. Valószínűségi mező, események, eseményalgebra
26.3. Feltételes valószínűség, függetlenség
26.4. Valószínűségi változók
26.5. Nevezetes diszkrét eloszlások
26.6. Nevezetes folytonos eloszlások
26.7. Az eloszlások legfontosabb jellemzői: a várható érték és a szórás
26.8. A nagy számok törvényei
26.9. Nevezetes határeloszlás-tételek
26.10. Korreláció, regresszió
26.11. Egyszerű véletlen folyamatok matematikai leírása
26.1. ábra
Az ókorban azonban mégis mindössze Platónnál jelenik meg egy olyan szövegrészlet, amit a véletlennel, illetve a
valószínűség-számítással kapcsolatba lehet hozni, bár nem teljesen egyértelműen. A Timaioszban (Platón összes művei. 3.
kötet. Európa, Budapest, 1984, 356–362., lásd még Rényi A.: Levelek a valószínűségről. Typotex, Budapest, 1994)
olvashatjuk: „ahogyan aránylik a keletkezéshez a lét, úgy viszonylik a hiedelemhez az igazság”.
Azután a XVII. század közepe felé kezdődött egy nagy fejlődés, melynek a francia Blaise Pascal az egyik fő alakja, aki
először fogalmazta meg a valószínűség-számítás alapfogalmait és összefüggéseit. Később az a Jacob Bernoulli emelhető ki,
akitől a téma első könyve származik „Ars conjectandi”, azaz a sejtés művészete címmel. Ebben olyan alapvető, ma már a
középiskolában is tanult témák vannak, mint a binomiális eloszlás, illetve a nagy számok éppen róla elnevezett „Bernoulli-
féle” törvénye. Ezután sok minden történt ezen a területen még a XVIII. században, pl. Thomas Bayes, de főleg a XIX.
században, Laplace, vagy később az orosz iskola (Markov, Csebisev, Bernstein és társaik) emelhetők ki a teljesség igénye
nélkül. Az alapkérdések azonban, mint a véletlen fogalma és a valószínűség de níciója, hosszan foglalkoztatták
matematikusok egész sorát a XX. század elején, köztük R. von Misest, aki közel is jutott egyfajta megoldáshoz, végül mégis
A. N. Kolmogorov volt, aki az axiomatikus valószínűség-számítást megalkotta 1933-ban, amivel végleges polgárjogot nyert
a téma a matematikában. Azóta egy hatalmas fejlődésen ment keresztül, s mára a matematika egyik hatalmas, virágzó
ágává vált, hihetetlenül széles körű matematikai és matematikán kívüli alkalmazásokkal, például a számelméletben, a
geometriában vagy a bizonyításelméletben, illetve a genetikában, a részecske zikában vagy a közgazdaságtanban. A
továbbiakban térjünk vissza a XVII–XVIII. századi kezdetekhez.
Alapvetően olyan eseményekről fogunk beszélni, amelyek bekövetkezéséről nem tudunk biztosan nyilatkozni, de
mégis szeretnénk valahogyan mérni a bekövetkezésük lehetőségét, más szóval „esélyét”. Ezen egy 0 és 1 közötti számot
értünk, ahol a lehetetlennek a 0 esélyt szánjuk, míg a biztosnak az 1-et. A többi esemény esélye a kettő között van. Az első
modellje valamiféle valószínűség-számításnak, amely az esélyekkel foglalkozik, a következőképpen adható meg:
Egy véletlen esemény valószínűsége (esélye) nem más, mint az esemény szempontjából kedvező kimenetelek száma
osztva az összes kimenetelek számával.
Ez a Laplace-féle modell egy kombinatorikus elképzelés, lényegében Pascalra megy vissza. Gyengéje, hogy egy szűk
fogalom, hiszen csak akkor tudunk valószínűségről beszélni eszerint, ha véges sok kimenetelünk van, s valamiféle okból
ezek egyenértékűeknek tekinthetők, más szóval egyenlő esélyűek.
Megjegyzés. Például már a következő két egyszerű esetben sem tudjuk használni a fenti fogalmat. Valaki arra
kíváncsi, vajon mekkora az esélye, hogy a következő pillanatban rászakad a mennyezet, mondjuk egy földrengés
következtében. Két eset lehetséges, vagy rám szakad, vagy nem. Természetesen józanul nem gondoljuk, hogy ennek
tényleg ½ az esélye, mint mondjuk egy fej dobásának egy pénzérmével. Hiszen a valószínűségnek van egy
interpretációja, miszerint ha egy szituáció sokszor ismétlődik, akkor a bekövetkezés relatív gyakorisága a
valószínűség közelében ingadozik. Ha sok-sok napot gyelembe véve eddig még sosem következett be a földrengés,
akkor jóval kisebb esélyűnek gondoljuk.
Hasonló példa lehet egy másik helyzet, ahol arra vagyunk kíváncsiak, hogy másnap milyen eséllyel lesz viharos szél.
A lehetőségek száma itt is kettő (lesz vagy nem), de akár több is lehet, hiszen mondhatjuk, hogy szélcsendes idő,
enyhe szél, élénk szél, illetve viharos szél lesz a meteorológusok szerinti kategorizálással. Ekkor a 4 lehetőség közül a
klasszikus modell szerint ¼ lenne a viharos szél esélye. Ha megnézzük az előrejelzéseket, nagyon ritkán olvasunk
erre 25% esélyt, azaz a modell itt sem alkalmazható.
Vannak azonban esetek, ahol azért némi ügyességgel használható ez a modell. Vegyük a következő eseményt: négy
szabályos pénzérmét feldobva 2 fej és 2 írás lesz. Mekkora ennek az esélye? A fejek száma szerint például 5 eset
lehetséges: 0, 1, 2, 3, 4. Ekkor a modellünk szerint 1/5 lenne a kérdezett esély. Ezt könnyen ellenőrizhetjük
kísérletekkel, hogy nem reális elképzelés. Van azonban egy másik modell, nem ezt az öt esetet tekintjük
kimenetelnek, hanem a következő 16-ot: FFFF, FFFI, FFIF, FIFF, IFFF, FFII, FIFI, FIIF, IFFI, IFIF, IIFF, FIII, IFII, IIFI,
IIIF, IIII. Azaz minden pénzérme megkülönböztethető a másiktól, és egyformán lehet fej vagy írás. Ekkor a kérdezett
esély 6/16 = 3/8 = 0,375. A kísérletek azt mutatják, hogy ez már jó modell. Az előző két példát azonban nehéz lenne
ilyen elemibb és teljesen egyenértékű esetekre bontani.
Ez sok szerencsejáték esetén egy plauzibilis feltételezés, innen eredhetett a fogalom. Később azonban általánosabb
modellre volt szükség.
húzzák ki az öt nyerő számot. Tehát a nevező, feltéve, hogy bármely számötös húzása egyenlő esélyű: ,
míg a számláló a kedvező esetek, ez lehet mind az öt szám, ez 1 eset, illetve lehet négy találatunk, ami 5 · 85 = 425
eset, hiszen 5-féleképpen választható ki a nem eltalált szám, s azt 85-féleképpen „téveszthettük el”. Tehát 426 eset
a kedvező, hogy legalább négy találatunk van, aminek tehát az esélye eszerint: , némileg
felkerekítve egy százezred. Hasonló számolással a legalább kéttalálatos, tehát „nyerő” szelvény esélye: 0,022, azaz
kb. egy ötvened. Azt mondhatjuk, hogy évente egy kettes találat nem meglepő, ha minden héten egy szelvénnyel
játszunk, lévén 52 hét egy évben.
2. Egy társaság 32 lapos magyar kártyával játszik. Ebből osztanak a három játékosnak 10–10 lapot, 2 pedig az ún.
talon. Mi az esélye, hogy az egyik játékos a négy szín egyikéből mind a 8 lehetséges lapot megkapja (7, 8, 9, 10, alsó,
felső, király, ász)? Ismét kezdjük a modellel. Ahányféleképpen a 32 lapból 10-et kiválasztunk, annyi az összes
leosztási lehetőség az első játékos számára. Kedvező, ha a négy szín valamelyikéből (négy lehetőség a szín
választása) 8 lapot kap, s a maradék kettőt a maradék 24 lapból.
Azaz , azaz a gyakoriságok nyelvén minden millió partiból 17-szer fordul elő. Elég ritkának
mondható. De például 6 egyszínű a 10-ből már nem anynyira ritka, hiszen azaz már száz
partiból is akár kétszer előfordulhat.
3. Egy ötfős baráti társaság a kölcsönös karácsonyi ajándékozást úgy tervezi, hogy mind az ötük nevét beteszik egy
kalapba, és sorban egyet húznak, s annak a személynek veszik ők az ajándékot. Mi az esélye, hogy ebből egy
tényleges ajándékozás adódik, azaz senki sem húzza saját magát?
A modell a következő. Számozzuk meg az öt személyt az 1, 2, 3, 4, 5 számjegyekkel. Ekkor az öt egymás utáni húzás
megfelel egy rendezett számötösnek, az öt szám egy permutációjának, amiből 5 ! = 120 van összesen. Ebből
nekünk kedvező az ún. xpontmentes permutációk száma, tehát ahol az i-edik helyen nem az i számjegy van (i = 1,
2, 3, 4, 5). Ezeket kicsit nehezebb összeszámolni. Két módszert is veszünk, az egyik könnyen általánosítható n
személyre, a másik nagyon komplikált, ha sokan vannak. Kezdjük ez utóbbival. Esetszétválasztással fogunk
dolgozni. Tegyük fel, hogy az első nem önmagát húzta, hanem például a másodikat. Ekkor két eset lehet, vagy a
második kihúzta az elsőt, ez egy ún. kételemű ciklus, és akkor marad három elem, amelyeknek a xpontmentes
permutációit kell leszámolni, ez azonban egyszerű, a 6-ból mindöszsze a 2, 3, 1 és a 3, 1, 2 felel meg. Tehát ilyen 2
eset van, de kettő hosszú ciklus 4-féle lehet, hiszen az első nemcsak a 2, hanem a 3, 4, 5 jelű társát is húzhatta, s ha
az éppen őt húzta ez a kettő hosszú ciklus. Ebből tehát 4 · 2 = 8 eset van. Ha három hosszú ciklust veszünk, például
1 húzza a 2-t, 2 a 3-at és 3 az 1-et, akkor a maradék két elemnek csak 1 xpontmentes permutációja van, ha
felcseréljük őket. 3 hosszú ciklus 4·3 = 12 van, tehát eddig 8 + 12 = 20 esetnél tartunk. Négy hosszú ciklus nem
lehet, mert akkor az ötödik elem xpont lesz, tehát csak az öt hosszú ciklus maradt, ami 4! = 24 eset, hiszen az első
helyen 4-féle lehet, a második helyen sem az első, sem a második, tehát csak 3-féle s így tovább adódik a 24 eset.
Azaz a kedvező esetek száma 20 + 24 = 44. Így a keresett esély 44/120 = 11/30 ≈ 0,367.
Ez általánosítható, bár rekurzívan elég nehéz kiszámolni gép nélkül. Ha f(n) jelöli n elem xpontmentes
permutációinak számát, akkor érvényes a következő rekurzív formula:
Az f(1)-es tagot ki sem írtuk, mivel f(1) = 0. Ezt lehet csupán faktoriálisok használatával is felírni:
A másik megoldás a következő, logikai szitaformulán alapuló gondolatmenet. Ezt mindjárt általánosan adjuk
meg. A xpontmentes permutációk száma nem más, mint az összes permutációk száma mínusz a xpontos
permutációk száma. Fixpont lehet általában az első, a második stb. az n. elem. Jelölje Ai azt az eseményt, hogy az
i-edik elem a helyén maradt a permutáció során. Ekkor a xpontot tartalmazó permutációk száma az
halmaz számossága, ami a logikai szitaformula szerint (lásd 23.3. fejezet):
Innen mivel bármelyik Ai azonos számosságú, hasonlóan a metszetekkel, ezért a következőket kapjuk:
Ha ezt osztjuk az összes esetek számával, azaz n !-sal, akkor adódik egy szép formula:
Ha n = 5, akkor ebből is 44/120 = 11/30 adódik, mint a korábbi módszerrel. Ebből az alakból azonban látszik egy
másik érdekesség, hogy ha a résztvevők száma minden határon túl nő, akkor ez a valószínűség konvergál az l/e
számhoz, ahol e az Euler-szám (a természetes logaritmus alapszáma). Tehát nagyszámú résztvevő esetén már alig
változik a valószínűség, ami egyáltalán nem magától értetődő. Az ember elsőre azt gondolná, hogy minél többen
vannak, annál kevésbé húzza ki valaki a saját nevét. Ez így is van egy kiválasztott személy esetén, de itt egyszerre
kell mindenkinek mást húznia.
4. Mit gondol hány ember esetén igaz a következő állítás? Egy teremben n ember van, és annak az esélye, hogy
kettőnek ugyanaz a születésnapja (megegyezik a hónap és a nap) éppen több legyen, mint 0,5.
Ismét először modellezzük a helyzetet. Az egyszerűség kedvéért tegyük fel, hogy bárki ugyanolyan eséllyel
születhet az év bármelyik napján. A szökőévektől eltekintve a 365 nap bármelyikén születhet az ember. Feltéve,
hogy nincsenek ikrek a teremben, és mindenki mindennap ugyanolyan eséllyel születhet. Ekkor az n ember
összes lehetőségeinek száma 365n. Annak az esélyét kiszámolni, hogy van legalább két ember azonos
születésnappal, jóval nehezebb közvetlenül, mint azt, hogy mindenki más napon született. Hiszen akkor a
kedvező esetek száma: 365 · 364 · … (365 – n + 2) · (365 – n + 1). Ha annak az esélye, hogy van két egy napon született,
kicsivel több, mint 0,5, akkor annak az esélye, hogy nincs, egy kicsit kevesebb, mint 0,5. Ez utóbbi esély a
egy napon született . Ez először akkor lesz ½-nél kisebb, ha n = 253 vagy annál több, tehát egy
nagyságrenddel nagyobb szám jön ki, mint a 23 volt. Egy pár tehát 364/365 eséllyel nem egy napon születik, és n
kifejezés nagyobb, mint 253, akkor már az n ember között lesz két egy napon született. Ennek
megoldása: n(n – 1) ≥ 506, ahonnan – mivel n pozitív szám – adódik, hogy . Tehát ebből is a 23
adódik, amit már számoltunk. A paradoxon abból adódik, hogy a két kérdést, „velünk egy napon” vagy „csak
bármely két személy egy napon” születik, ezt keverjük.
Lényegében a Laplace-modellnek van egy folytonos változata is, az ún. geometriai valószínűség. Itt a következőről van
szó. Véletlenül választunk egy pontot egy adott síkbeli vagy térbeli (általában akár n-dimenziós euklideszi térbeli)
alakzatból. Ebben ki van jelölve egy részalakzat, s az adott esemény bekövetkezése azt jelenti, hogy ebbe a részhalmazba
esik a véletlen pont. Az esemény valószínűségéhez a következő konstrukcióval juthatunk.
Geometriai valószínűségről beszélünk, ha adott egy korlátos, mérhető (Jordan- vagy akár Lebesgue-mérték szerint) n-
dimenziós térbeli alakzat mint eseménytér, amit A-val jelölünk. Ennek mérhető részhalmazai az események, nyilván
értelmesek a szokásos halmazműveletek. Ekkor az E esemény valószínűségén a következő hányadost értjük:
Példák
1. Két jó barát megbeszéli, hogy 4 és 5 között fog találkozni a városban. Tegyük fel, hogy egymástól függetlenül
tömegközlekedéssel érkeznek, és a megbeszélt helyen egy negyedórát várnak, azután elmennek, ha a másik nincs
ott.
A geometriai modell szerint egy egységnégyzet pontja reprezentálja érkezésüket, az első koordináta az első, a
második a másik érkezését. A 26.2. ábrán szaggatott vonallal határolt tartományba esik a találkozás, hiszen, ha a
két koordináta különbsége kisebb vagy egyenlő, mint 0,25 (negyedóra), akkor találkoznak, különben nem. Ennek
esélye, mivel a négyzet területe 1, ezért közvetlenül a tartomány területe, azaz , kicsivel
kevesebb, mint 44%.
26.2. ábra
2. Tegyük fel, hogy egy gépi programmal választunk véletlenül két számot a [0; 1] intervallumból. Ezek három
szakaszt határoznak meg. Mi az esélye, hogy ebből a három darabból egy háromszög szerkeszthető?
A geometriai modell itt azt jelenti, hogy egy (x, y) párost választunk az egységnégyzetből, hiszen mindkét
„koordináta” 0 és 1 közé esik. Háromszög akkor szerkeszthető, ha mindhárom háromszög-egyenlőtlenség
teljesül.
a) Ha x < y, akkor a következők:
1. x + (y – x) > 1 – y
2. x + (1 – y) > y – x
3. (y – x) + (1 – y) > x,
b) Ha x ≥ y, akkor pedig:
1. y + {x – y) > 1 – x
2. y + (1 – x) > x – y
3. {x – y) + (1 – x) > y,
rendezve
Mindkét szituáció egy ábrán (26.3. ábra) szemléltethető, ahol a satírozott tartomány adódik „kedvező” esetre,
melynek területe ¼, az egész négyzet 1, tehát a keresett esély ¼.
26.3. ábra
3. Egy körvonalon véletlenül válasszunk három pontot. Mi az esélye, hogy a háromszög hegyesszögű, azaz a kör
középpontját tartalmazza?
Modellünk most már, mivel három pont van, háromdimenziós lesz, (α, β, γ) jelölje a háromszög szögeit. Ekkor
már csak azt kell megfogalmazni, hogy mikor esik a kör középpontja a háromszög belsejébe. Ez a 2π élhosszúságú
kocka egy részhalmaza lesz. Van azonban egyszerűbb megoldás is. A körszimmetria miatt az első pontot vehetjük
rögzítettnek, s csak a másik két ponttal foglalkozunk. Ekkor kétdimenziós ismét a probléma, s a megoldás is
egyszerűbb. Ráadásul a két eset, hogy hegyes- vagy tompaszögű a háromszög, egyenlően valószínű, míg a
derékszögű eset 0 valószínűséget képvisel. Ami egy példája annak, hogy a 0 valószínűségű esemény nem
lehetetlen.
A véletlen kísérlet kapcsán egy lehetséges kimenetelt elemi eseménynek fogunk nevezni, s ebben a kontextusban egy
tetszőleges eseményt bizonyos kimenetelek együttese, azaz elemi események egy összessége jelent majd. Az összes
lehetséges kimenetelek halmaza alkotja a valószínűségi alaphalmazt vagy eseményteret, amit általában Ω-val
jelölünk.
Ennek az algebrának a szokásos jele az algebra szó kezdőbetűjéből: .Így tehát eddig van egy (Ω, A) algebránk.
Ha az (Ω, ) algebrán létezik egy P leképezés a [0; 1] intervallumra úgy, hogy minden A és B eleme esetén, ha
A ∩ B = Ø, akkor P(A ∪ B)= P(A) + P(B), valamint P(Ø) = 0 és P(Ω) = 1, úgy az (Ω, , P) hármast valószínűség-
algebrának nevezzük.
Megjegyzés. Fontos hangsúlyoznunk, hogy a lehetetlen esemény esélye ugyan 0, de a 0 valószínűség nem jelent
lehetetlent (lásd a 26.1. fejezet utolsó példáját, ahol a három pont 0 valószínűséggel alkot derékszögű háromszöget, de
az mégis előfordulhat). Hasonlóan abból, hogy valaminek 1 az esélye, nem következik, hogy biztos esemény volna.
Lásd az előző példa komplementerét, azaz a háromszög hegyes- vagy tompaszögű 1 valószínűséggel, mégis lehet
derékszögű is.
Lássunk néhány példát a fent de niált valószínűségi mezőre.
1. Egy szabályosnak mondott pénzérme feldobását az alábbi valószínűségi mező reprezentálja: Ω = {F, I}, = {Ø;
{F}; {I}; {F, I}} (azaz az összes részhalmazok halmaza), míg végül a P leképezést a következőképpen adjuk meg: P(Ø)
= 0, P(F) = 1/2, P(I) = 1/2, és P(Ω) = 1.
2. Egy lap húzása egy 32 lapos magyar kártyából. Ennek modellje is egyszerű: az eseménytér 32 elemű halmazból áll,
ennek összes részhalmaza alkotja az algebrát, és a valószínűség a részhalmazok elemszáma osztva az összes
elemek számával, 32-vel. Itt nem írjuk le a hihetetlenül nagy elemszámú algebra elemeit, hiszen 232 ≈ 4 · 230 ≈ 4 ·
109, tehát milliárdos nagyságrendű.
3. Legyen az eseménytér egy dobókocka feldobása addig, amíg az első hatos nem jön ki. Ekkor az alaphalmaz
végtelen lesz, mivel nem tudjuk biztosan garantálni, hogy például 136 dobáson belül kijöjjön az első hatos. Itt az
elemi események a következőképpen néznek ki: {6}, {1, 6}, {2, 6}, {3, 6}, …, {1, 1, 6}, {1, 2, 6}, …, {1, 1, 1, 6}… és így
tovább. Egyelemű 1 van, kételemű 5, háromelemű 25 és így tovább. Az események ezen elemi események
egyesítésével jönnek létre. A valószínűségek pedig az elemi eseményeken a következők: az egyelemű {6} esélye
. A kételemű kimenetelek esélyei , és van belőlük 5. A háromeleműeké , és van belőlük 25, általában
egy n eleműé , és van belőlük 5n darab. Láthatóan rendben leszünk, hiszen a megszámlálható elemi
események halmazán igaz lesz, hogy . Folytonos eseménytérre példa lehet a 26.1.
fejezet három geometriai szituációja, az utolsó három probléma, nézzünk egy még egyszerűbbet.
4. Egy véletlenül választott valós szám a [0; 1] intervallumból. Ez már önmagában elég absztrakt, hiszen nem tudunk
olyan tényleges eljárást, amivel ez végrehajtható lenne. Egy számítógép legfeljebb véges sok tizedesjegyét tudja
produkálni, bármilyen hosszú ideig fut is a kiválasztási program. Mégis bizonyos feladatokban használunk ilyen
modelleket, ezért most a „ zikai” megvalósítás lehetetlenségétől tekintsünk el.
Ebben az esetben Ω = [0; 1]. A lehetséges algebrával baj lesz, mivel a [0; 1] intervallum összes részhalmazaiból álló
halmaz minden eleme nem mérhető (bármilyen mértéket is vennénk alapul), ezért csak például a Lebesgue-
mérhető részhalmazok halmazát vegyük, az lehet a megadott σ-algebra Végül a Lebesgue-mérték lesz a P.
Így annak az esélye, hogy mondjuk az intervallumba esik a kiválasztott szám, annak a
valószínűsége, annak viszont, hogy a ra náltan konstruált Cantor-halmazba esik, 0. Hiszen mint tudjuk, a
Cantor-halmaz mérhető, s mivel komplementere, amit kiveszünk a [0; 1] intervallumból, az 1 mértékű, ezért a
maradék a Cantor-halmaz 0 mértékű.
Minden A eseményre igaz, hogy P(A) + P(Ā) = 1, vagy szokásosabb módján a komplementer valószínusége P(Ā) = 1 – P(A).
Példák
1. Mekkora eséllyel fordul elő, hogy királyt vagy pirosat húzunk egy 32 lapos magyar kártyapakliból?
Mivel 8 piros van és 4 király a 32 lapból, ezért P(P + K) = P(P) + P(K) – P(PK) =
Két mélyebb tétel a valószínűség-algebra köréből, az első az előző tétel általánosításaként született Poincaré-formula.
Ekkor ahol
és az összegzés úgy értendő, hogy az (i1, i2, …, ik) az 1, 2,…, n számok öszszes k-adrendű ismétlés nélküli kombinációján
fut végig. Szokás ezt valószínűség-számítási szitaformulának is mondani.
Jelölje annak a valószínűségét, hogy az A1, A2, …, An események közül pontosan r következik be. Ekkor
Példák
1. A fejezet elején levő, a xpontmentes permutációk számára vonatkozó 3. feladat megoldása a Poincaré-formula
segítségével is megadható.
2. Legyen a kísérlet egy dobókocka 6-szori feldobása, míg az események Ai = {dobtunk i-t}. Kérdés, hogy mi annak a
valószínűsége, hogy mind a hat szám előfordul? Mi annak az esélye, hogy pontosan 3 szám fordul elő a hatból?
Az elsőre a válasz formula nélkül is megadható, az összes eset nyilván 66, a kedvező, hogy mind a hat szám éppen
egyszer, tehát ahányféleképpen sorba rakhatjuk a 6 számot, ami 6 !, vagyis az esély: . A formulával
számolva:
ahol r = 6 és n = 6.
Tehát annak a valószínűsége, hogy pontosan három szám fordul elő a 6-ból, kb. 0,23. Ugyanezzel a technikával
számolható a többi eset is, a mind a hatot már számoltuk az első részben, hátra lenne a pontosan 5, a 4, a 2 és az 1.
Nyilván 0 szám nem lehet, hiszen 6 dobásnál valaminek ki kell jönnie. Az 1 esélye is könnyű, mert mindössze 6
kedvező eset van: 111111, 222222, 333333, 444444, 555555, 666666, azaz 0,00013 az esélye. Érdekes kérdés, hogy hány
szám előfordulása a legvalószínűbb. Annak igazolását, hogy a válasz 4, az olvasóra bízzuk.
Az esélyek a formula segítségével (vagy más, néhány esetben egyszerűbb módon):
Mind a 6 0,0154
5 0,2315
4 0,5015
3 0,2315
2 0,03
1 0,00013
0 0
3. Egy korábbi, már említett példában (ahol egy ötfős csoport kölcsönös ajándékozást tervez, és sorshúzással
döntenek, ki kinek vesz ajándékot) mi az esélye, hogy pontosan két tag húzza saját magát. Az eseményeket jelölje
A1, A2, A3, A4, A5, ha 1, 2, 3, 4 és 5 jelöli az öt csoporttagot, és Ai pedig azt, hogy az i-edik személy saját magát húzza.
Jordán Károly formulája esetünkben a következőképpen néz ki:
Tehát annak, hogy pontosan 2 ember húzza saját magát, 1/6 a valószínűsége. Annak, hogy senki, azt már
kiszámoltuk: 11/30. A többit (1 fő húzza magát, 3 fő vagy 5 fő; 4 fő nem lehet, mert akkor az ötödiknek sem marad
más) a következőképpen számolhatjuk:
Az utolsó eset, hogy mind az öt magát húzza, szintén egyszerű: . A három húzza saját magát,
rövidebben adódik a fenti módszerrel, csak három tag lesz, az eredmény: 1/12. Így mivel az összeg 1 kell legyen,
ezért annak az esélye, hogy pontosan egyvalaki húzza saját magát: 3/8. Ez a legvalószínűbb is egyben, hiszen
0,375, míg a „senki sem húzza magát” eset egy leheletnyivel kevesebb csak: 0,367. A két fő, mint láttuk, 0,167.
Azonban általában nem elegendő csak véges sok esemény metszetének és uniójának a valószínűségét meghatározni.
Ezért szükség volt egy általánosabb valószínűségimező-fogalomra, amelyben a már említett σ-algebrának fontos szerep jut.
Ismételjük meg:
Egy algebrát σ-algebrának mondunk, ha nemcsak véges sok, hanem megszámlálhatóan sok halmaz unióját is
tartalmazza, azaz formálisan, ha Ai ϵ , i ϵ N, akkor .
Ehhez kapcsolódik a következő, hogy a valószínűség is σ-additiv halmazfüggvény legyen, tehát a Kolmogorov-féle
valószínűségi mezőben a következőknek kell teljesülnie mint axiómáknak:
Kolmogorov-féle valószínűségi mező az (Ω, , P) hármas, ahol Ω egy tetszőleges halmaz, egy σ-algebra, és
természetesen (utóbbi az összes részhalmazok halmazát jelöli), valamint P teljesíti a következő
feltételeket:
1. P(Ø) = 0 és P(Ω) = 1. (Tehát P 1-re normált mérték.)
2. Ha A ∈ ,B∈ és A ⊂ B, akkor P(A) ≤ P(B) (monotonitás).
3.
Ha Ai megszámlálható sok diszjunkt halmazt jelöl, akkor (σ-additivitás).
a tüdőrák fennállását, D azt, hogy valaki dohányzik, akkor a keresett esélyt a következő hányados adja: .
Általában is így de niáljuk a feltételes valószínűséget.
A T esemény D pozitív valószínűségű esemény mint feltétel melletti valószínűségét P (T|D)-vel jelöljük, és
kiszámításának módja: .
Megjegyezzük, hogy ha T 0 valószínűségű eseményt jelöl, akkor nyilván a P(T | D) feltételes valószínűség is 0 lehet
csak. Létezik a valószínűség-számításnak egy olyan felépítése is, ahol nem a valószínűség, hanem a feltételes valószínűség
az alapfogalom, ezt például Rényi Alfréd vagy Dennis Lindley könyveiben olvashatjuk. A 26.4. ábra mutatja, hogy ha az
eseményteret leszűkítjük, akkor az új esély a metszet viszonyát fejezi ki a feltételhez. Nézzünk két egyszerű példát!
26.4. ábra
1. Valaki megtudja, hogy a héten mind az öt kihúzott lottószám páros lett. Mi ekkor az esélye, hogy barátjának ötöse
lett, ha tudjuk, csak páros számokat szokott jelölni, valamilyen egyéni megfontolásból? Ez esetben a kihúzható öt
páros szám és a tipp közös része egyelemű, hiszen csak egy számötöst jelölt az illető. Azaz ,
, ebből a formulánk szerint adódik, hogy az esély az információnk birtokában -re nőtt,
ami az eredeti esélynek körülbelül 32-szerese.
2. Legyen egy dobókocka feldobása a véletlen kísérlet. Legyen az A esemény, hogy párosat dobunk, a B esemény,
Ha egy A esemény valószínűsége ugyanannyi, mint a B esemény melletti feltételes valószínűsége, formálisan, ha P(A|B)
= P(A), akkor azt mondjuk, hogy az A esemény független B-től.
Könnyen látható, hogy eseményeknek ez a függetlensége szimmetrikus reláció a pozitív valószínűségű eseményeken,
tehát ha A független B-től, akkor B is független A-tól. Hiszen, ha P(A|B) =P(A), akkor P(AB) = P(A)P(B), de ebből
adódik, hiszen AB = BA, mivel a metszet kommutatív. Viszont a bal oldal éppen P(B|A), s így levezettük,
hogy P(B|A) = P(B), azaz a B is független A-tól. Egyébként de nícióként a közbülső P(AB) = P(A)P(B) egyenlőséget is szokták
venni, azaz
Ennek előnye, és ezért általánosan elterjedt, hogy itt nem kell kikötni a valószínűségek pozitivitását. Nézzünk egy
példát konkrét eseményekkel!
Legyen az eseménytér Ω = {1, 2, 3, 4, 5, 6} egy szabályos dobókocka feldobása. Legyen A esemény: a dobott szám prím,
és a B esemény: a dobott szám 3-mal osztható. Ezek függetlenek, mivel A = {2, 3, 5}, B = {3, 6}, míg AB = {3}, azaz
szabályos kockát feltételezve:
Fontos tény, hogy a függetlenség nem tranzitív, azaz ha A független B-től, B független C-től, akkor A nem feltétlen
független C-től.
Ellenpélda. Legyen az eseménytér egy egység sugarú kör egy pontjának a véletlen kiválasztása. Három eseményt
adunk meg. Legyen az A esemény, hogy a felső félkörből választjuk a pontot, B az az esemény, hogy a jobb oldali
félkörből, míg C az az esemény, hogy az alsó félkörből (26.5. ábra). Ekkor . Hasonló
26.5. ábra
Ez a fogalom igen fontos a mindennapokban, sokszor éppen azt kutatjuk, hogy vajon két tényező között van-e a
kapcsolat vagy sem. Ez a statisztika egyik fontos feladata is, lásd a 27.5. fejezetet.
A függetlenség fogalma több eseményre is kiterjeszthető egy gyengébb és egy erősebb feltétel teljesülése esetén. Előbb
nézzük a gyengébbet!
Példa páronként független, de nem totálisan független eseményekre, illetve totálisan független eseményekre
1. Páronként független, de nem totálisan független események. Legyen az eseménytér egy négyzet pontjai közül
egynek a véletlen választása. Az A esemény jelölje a „bal alsó sarok felét” a négyzetnek, a B esemény a „jobb alsó
sarok felét” és a C pedig egy „homokóraszerű” részt (26.6. ábra). Ekkor bármely kettő független, mert
mindegyiknek ½ az esélye, és a páronként vett metszetek mindhárom esetben ¼ esélyűek. Ám a hármas metszet
is ¼, hiszen mindhárom halmazpár metszete azonos(!), míg a szorzat 1/8, azaz nem totálisan függetlenek.
26.6. ábra
2. Totálisan független események. Legyen az eseménytér ezúttal is egy egységnégyzet pontjaiból való véletlen
választás. Az A, B, C események rendre a négyzet alsó fele, a jobb oldali fele, illetve a felezőpontok által
meghatározott középvonal négyzet (26.7. ábra). Ez a három esemény totálisan független lesz, mivel mindegyik
valószínűsége ½, a páronként vett metszeteik ¼ valószínűsége ¼, tehát páronként függetlenek. A hármas
metszet valószínűsége viszont 1/8, ami éppen a három valószínűség szorzata.
26.7. ábra
A következőkben mutatunk egy érdekes jelenséget a függetlenség fogalmára. Tekintsük a háromgyerekes családokat,
és tegyük fel, hogy a nemek valószínűsége egymástól függetlenül minden gyermekre ½ (lehet három pénzérme feldobását
is tekinteni, akkor ez inkább teljesül). Legyen H az az esemény, hogy mindkét nemű gyermek van a családban (mind fej,
mind írás előfordul a dobásnál), míg az A esemény, hogy legfeljebb egy lány van (legfeljebb egy fejet dobunk). Ekkor a két
esemény független, mivel egyrészt:
, hiszen két esetet zárunk ki a nyolcból, a három ú és a három lányt; és , hiszen a legfeljebb
egy ú komplementere, és a szimmetria mindkettő esélye egyenlő. Másrészt , hiszen ez a pontosan egy lány
esete, ami éppen háromféleképpen képzelhető el, vagy az első, vagy a második, vagy a harmadik gyerek lehet lány. Tehát
teljesül a függetlenség feltétele.
A meglepő, hogy ez csak háromgyerekes családokra (három pénzérme egyszerre történő feldobására) igaz. Erre nehéz
magyarázatot adni, hogy miért független ilyenkor, a többi esetben viszont nem. Általában n gyerek (érme) esetén,
ugyanúgy H legyen az az esemény, hogy mindkét nemű gyermek van a családban (mind fej, mind írás előfordul a dobásnál),
míg az A esemény, hogy legfeljebb egy lány van (legfeljebb egy fejet dobunk). Ekkor
Megjegyzés. A teljes eseményrendszer fogalma kiterjeszthető nem véges eseményrendszerre is. A feltétel csak a
páronkénti diszjunktság, és hogy az összes uniója kiadja a teljes eseményteret (az Ω-t).
Halmazelméleti nyelven azt is mondhatjuk, hogy a teljes eseményrendszer egy diszjunkt partíciója az Ω halmaznak.
Ezzel már megfogalmazhatjuk és bebizonyítjuk az első tételt.
Ekkor .
26.8. ábra
Megjegyzés. A tétel kimondható megszámlálhatóan végtelen sok esemény esetén is, ha azok teljes eseményrendszert
alkotnak, ekkor .
Példa. Legyen a következő kísérlet az, hogy húzunk egy kártyát a 32 lapos pakliból, az egyik esemény, hogy pirosat
húzunk, a másik, hogy ászt. Ezek függetlenek, mert pontosan egy piros ász van, ennek az esélye 1/32, míg a pirosé 1/4,
az ászé 1/8, s a szorzat 1/32. Azaz a szín független a gurától. Ha most két lapot húzunk visszatevés nélkül, akkor az
eseménytér az összes lehetséges kártyapáros. Legyen az egyik eseményünk az, hogy az első lap piros (A), míg a másik
eseményünk, hogy a második lap ász (B). Állításunk igazolására használjuk majd a fenti tételt. Ehhez szükségünk
van három valószínűségre:
1. P(A) = l/4
2.
, ahol C1 jelöli, hogy az első húzás ász, míg a
komplementere a szokásos felülvonás, tehát hogy nem ász. Itt használtuk a teljes valószínűség tételét először.
Azaz másodikra ászt húzni ugyanolyan valószínű, mint elsőre!
3.
, ahol D jelöli azt az esemény, hogy az első
húzás a piros ász, és ismét a teljes valószínűség tételét használtuk.
Azaz a két esemény független egymástól, hiszen P(AB) = P(A)P(B).
Egy másik példa a következő. Van három ók, az elsőben két arany- és egy ezüstérme, a másodikban egy-egy arany és
ezüst, míg a harmadikban egy arany és három ezüst, amelyek tapintásra egyformák. Ha véletlenszerűen választunk
egy ókot s abból egy érmét, akkor mekkora eséllyel lesz ez aranyérme?
A teljes valószínűség tételét alkalmazzuk az A1, A2, A3 eseményekre, amelyek rendre az első, a második, illetve a
A másik tételt is előzze meg egy észrevétel. Ez abból adódik, hogy észrevesszük a közös tényezőt a következő két
feltételes valószínűségben. Mivel és , ezért a közös rész valószínűsége, amely
a metszet kommutativitása miatt triviálisan egyenlő, azt kapjuk, hogy P(A|B)P(A) = P(B|A)P(B). Ez lehetőséget ad például a
Bayes-tétel
Bizonyítás. Az észrevételünk szerint az első egyenlőség nyilvánvaló, míg a második egyenlőség a teljes valószínűség
tételének alkalmazása.
választását. Előzetesen , és jelölje Bi azt az eseményt, hogy a 10 dobás során éppen i fej született.
Ekkor tudjuk, hogy
ami 1024/7585-tel egyenlő, megközelítőleg 0,13. Ekkor a „cinkelt” választására (ami az előbbi komplementere) 0,87
adódik. Azaz közel 1:7 lett az eredetileg 1:1 viszony. Az eredmény alapján jóval inkább a „cinkelt” pénz választására
gondolunk. Még élesebb eredmény adódna, ha pl. 100 dobásból 80 fejet dobnánk. Ekkor már közel 95% az esélye,
hogy a „cinkelt”-tel dobtunk.
Látható, hogy a bayesi gondolat olyankor használható, ha van egy véletlen alaphelyzet, s a következmények attól
függnek, hogy melyik alapesemény következett be. Ebben az esetben, ha az alaphelyzet eseményeinek ismerjük a
valószínűségét, valamint azt is, hogy azokból milyen eséllyel adódik valamelyik következmény, akkor a következmény
ismeretében megváltozik az alaphelyzet eseményeinek a bekövetkezési valószínűsége. Bővebben a 27. fejezetben
olvashatunk majd erről.
Egy másik fontos alkalmazási példa a mindennapi életből. Vizsgáljunk meg egy gyakori szituációt, egy orvosi
tesztvizsgálatot, például egy vérvizsgálatos AIDS-tesztet. Arra leszünk kíváncsiak, hogy ha valakinek pozitív az
AIDS-tesztje, akkor ennek a közhiedelem (beleértve sok orvost is!) szerint nagy esélyű következménye, hogy HIV-
fertőzött, hiszen a teszt két hibája egyaránt kicsi, mind az, hogy ne jelezzen pozitívot a fertőzés fennállása esetén,
mind az, hogy a nem fertőzöttre is riasszon. Természetesen a nagyon speci kus, érzékeny és csak HIV-re érzékeny
teszt igen drága, ezért általában elsőre olcsóbbként egy olyat választanak, ahol a fertőzés jelzése általában 99% körüli
a bemérések szerint, viszont más is kiválthatja a pozitív reakciót, így 5% körüli hamis riasztás is előfordul. Ezeket az
adatokat formálisan a következőképpen modellezzük: P(T+ | F) = 0,99 és P(T+ | F) ≈ 0,05, ahol T+ jelenti a pozitív
teszteredményt, F azt, hogy az illető fertőzött, és non F azt, hogy nem fertőzött. A kérdés ezek után az, hogy P(F | T+)
≈?
A válasz meglepő, mivel „intuíciónk szerint” kicsi hibák kicsi hibát okoznak, tehát az lenne esetünkben a hiba, hogy
valaki pozitív, mégsem fertőzött, akkor ez kicsi esélyű, tehát a kérdezett esély elég nagy, pl. 90% körüli. Meglepő
elsőre, hogy ez nem igaz. Elég kicsi a kérdezett esély. Írjuk fel a Bayes-tételt!
kicsit kevesebb, mint 1%, szemben a várt magas értékkel. Azaz egy pozitív
teszteredmény még nem jelent nagy eséllyel fertőzöttséget.
Egy másik példa egy bírósági ügyben került elő. Egy fér t egy asszony meggyilkolásával vádolnak. A nő körme alatt
pontosan olyan vércsoportú vért találnak, mint a fér é, a fér ruháján pedig a nő vércsoportjához tartozó
vérnyomokat. A fér vércsoportjának előfordulása 0,173, a nő vércsoportja 0,157, nagyobb statisztikát alapul véve. A
helytelen következtetés a bíróságon az volt, hogy ekkor ez a független egybeesés a kettő szorzata, azaz 0,027. Vagyis
véletlenül csak ennyi volna az esélye ennek, tehát valószínűleg a fér a gyilkos. (El is ítélték 1973-ban, s aztán néhány
év múlva előkerült az igazi gyilkos, s akkor elengedték.) A tényleges esély, hogy a fér pusztán ezek alapján gyilkos
lenne, mindössze 0,1% és 3,5% között van, néhány becslés bizonytalanságát gyelembe véve. Formalizálva, legyen θ1
az a feltételezés, hogy a gyanúsított a gyilkos, míg θ2, hogy nem ő. Jelöljük X-szel a vércsoport megegyezését. Ekkor a
kérdésünk P(θ1 | X) értéke. A Bayes-tétel szerint ez a következőképpen írható fel:
A kérdés a jobb oldali valószínűségek értéke. A P(θ1) értéke attól függ, hogy
a tetthely elérhető környezetében hány szóba jöhető fér lakik. A feladathoz illeszkedő szám 10–7, mivel kb. 107 fér
egyformán szóba jöhetett. Ekkor nyilván P(θ2) = 1 – 10–7. Az első feltételes valószínűség értéke maximum 1, ha tényleg
ő a tettes, és létrejött a karmolás, és vér került a ruhájára, akkor az biztos ilyen vércsoportú. De ez nem biztos,
hasonló bűncselekmények vizsgálatával az mondható, hogy az esetek 50%-ában létrejön hasonló helyzet, vér a
köröm alatt (védekezés), és gyilkosságnál kifröccsenő vér a ruhán. Így ez a szám 0,5 és 1 között lehet. Ha nem ő a
gyilkos, akkor szintén két szélső helyzetet tekintve 2,72 · 10–5 és 2,72 · 10–6 között lesz a második feltételes
valószínűség értéke. Ebben arra való statisztikát is használtunk, hogy általában egy embernek milyen eséllyel van
vér a kabátján. Kihasználtuk a vércsoportok gyakoriságát is. Ezzel a képlet szerint 0,0018 és 0,035 adódik.
Gyakran hasznos az indukcióval bizonyítható alábbi „szorzási szabály” a feltételes valószínűségek felhasználásával:
Példa. Keressük annak a valószínűségét, hogy egy pakli magyar kártyából háromszor egymás után húzva rendre egy
pirosat (A1), egy ászt (A2) és egy hetest (A3) húzunk. Használva a formulát és azt, hogy ,
, tehát mindössze 1000-ből 4-szer következik be, azaz minden kb. 250.
esetben.
Az ilyen függvényt, amely az eseménytéren értelmezett és értékei számok, általánosságban valós számok,
valószínűségi változónak mondjuk, ha teljesít egy feltételt, nevezetesen minden valós c-re az {ω | ξ(ω) < c} halmaz
hozzátartozik az Ω-beli σ-algebrához, azaz -mérhető.
Megjegyzés. Olyan véges eseménytéren, ahol minden részhalmaz hozzátartozik a valószínűségi algebrához, minden
valós függvény valószínűségi változó, mivel a mérhetőségi feltétel biztosan teljesül. Végtelen eseménytér esetén már
nem feltétlenül lesz minden azon értelmezett függvény valószínűségi változó, hiszen ha veszünk egy nem mérhető
halmazt, akkor az a függvény, amely akkor 1, ha az elemi esemény ehhez a nem mérhető halmazhoz tartozik,
különben pedig 0, az nem valószínűségi változó.
Példák
1. Dobjunk fel egy dobókockát addig, amíg az első hatost nem kapjuk meg. Az eseménytér nem lesz véges, hiszen
elvileg akármeddig dobálhatunk. Elemi események az n – 1 hosszúságú {1, 2, 3, 4, 5} halmaz elemeiből álló
rendezett sorozatok, melyek végén az n-edik helyen 6 áll. Minden sorozathoz rendeljük hozzá a hosszát! Ez egy
valószínűségi változó lesz, hiszen minden véges c valós számra a legfeljebb ilyen hosszú sorozatok száma véges és
mérhető is. Pontosan meg is mondható, hogy milyen értékeket milyen valószínűséggel vesz fel, hogy ha X-szel
jelöljük a sorozat hosszát, akkor . A későbbiekben arról is lesz szó, hogy az ilyen típusú
változót szokás geometriai eloszlásnak is mondani.
2. Vegyünk véletlenszerűen egy pontot a [0; 1]-ből. Ekkor az eseménytér a [0; l], a σ-algebrát a Lebesgue-mérhető
halmazok alkotják. A valószínűségi változónk a pont az intervallum két végpontjától vett távolságának
négyzetösszege. Ez tényleg valószínűségi változó lesz, hiszen minden {ω | ξ(ω) < c} halmaz mérhető.
Egy speciális valószínűségi változó, amelyet egy E esemény generál aszerint, hogy ha E bekövetkezik, akkor a változó 1
értéket vesz fel, ha nem, akkor 0 értéket.
de niáljuk:
Az azonos valószínűségi mezőn értelmezett X, Y valószínűségi változókat akkor nevezzük függetlennek, ha minden
valós x és y esetén {ω | X(ω) < x} és {ω | Y(ω) < y} események egymástól függetlenek. Azaz minden x és y esetén a
következő egyenlőség teljesül: P({ω|x(ω) < x} és {ω | Y(ω) < y}) = P({ω|X(ω) < x}) P({ω|Y(ω) < y}).
Megjegyzés. Két esemény függetlenségének szükséges és elégséges feltétele a hozzájuk tartozó két karakterisztikus
valószínűségi változó függetlensége. A következőkben egy-egy példát látunk független, illetve nem független
valószínűségi változóra.
Példák
1. Legyen Ω egy szabályos dobókocka feldobásánál született eredmény. Az E esemény legyen, hogy prímet dobunk
(2, 3, 5), míg F esemény, hogy 5-nél kisebbet (1, 2, 3, 4). Mivel E és F függetlenek, ezért a megjegyzés szerint a
következőképpen megadva:
míg a másik:
A valószínűségi változó eloszlásfüggvénye a következő függvény: Fξ(x) = P({ω|ξ(ω) < x}), ahol az értelmezési
tartomány természetesen a valós számok halmaza.
A fogalom fontos lépés abban az irányban, hogy a konkrét valószínűségi mező vizsgálata helyett sok esetben
áttérhetünk az eloszlások vizsgálatára, amellyel a valós függvénytan terepére kerülünk, illetőleg a mértékelmélet egy
speciális alkalmazásaként is tekinthető a vizsgálódás.
nem negatív. Emellett igaz, hogy , ahonnan mivel F határértéke a +∞-ben 1, tehát .
Igaz a következő tétel.
Ha f valós függvényre igaz, hogy f(x) ≥ 0 minden valós x-re, és , akkor létezik olyan ξ valószínűségi
változó, amelynek f a sűrűségfüggvénye.
Ez lényegében azonos módon bizonyítható, mint az eloszlásfüggvényre vonatkozó előző tétel. Megjegyezzük, hogy
diszkrét (azaz véges vagy megszámlálhatóan végtelen értékkészletű) valószínűségi változók esetén az eloszlást szokás
egyszerűen egy sorozat formájában megadni.
Ha az X valószínűségi változó értékkészlete x1, x2, …, xn, …, akkor a P(X = xi) számokat pi-vel jelöljük, és a következő
kétsoros mátrixot hívjuk a diszkrét változó eloszlásának:
2. Mi az eloszlás- és sűrűségfüggvénye a [0; 1] szakaszon véletlenszerűen választott pont segítségével keletkező két
szakasz közül a kisebbik hosszának? Nyilván a hossza legalább 0 és legfeljebb ½, tehát
Együttes eloszlás
Az (X, Y) vektorváltozó vagy kétdimenziós változó együttes eloszlását nem határozzák meg külön-külön az egyes változók
eloszlásai. Ekkor a következőképpen de niáljuk a vektorváltozó (kétváltozós) eloszlásfüggvényét:
Az (X, Y) vektorváltozó együttes eloszlásfüggvényén a következő függvényt értjük: P(X < x, Y < y) = H(x, y).
Amennyiben az együttes eloszlásfüggvény mindkét változójában parciálisan di erenciálható, akkor a vegyes parciális
deriváltnak külön neve van.
Amennyiben egy kétváltozós függvény integrálható, és megvan a fenti tételben megadott két tulajdonsága, tekinthető
egy vektorváltozó sűrűségfüggvényének.
Az együttes eloszlásfüggvény meghatározza az egyes koordináták ún. eloszlását is.
Ha F(x), illetve G(y) di erenciálható, akkor az f(x) = F′(x), illetve g(y) = G′(y) függvényeket peremsűrűség-
függvényeknek nevezzük.
Példák
1. Nem független eloszlásra. Legyen az (X, Y) vektorváltozó együttes sűrűségfüggvénye:
Feltételes eloszlások
Az együttes eloszlásokból lehet de niálni a feltételes eloszlást. Valójában, ha két változó van, akkor az egyiknek a másikra
(amelyik abszolút folytonos eloszlású) vonatkozó feltételes eloszlását a következőképpen de niáljuk:
Ha létezik az együttes sűrűségfüggvény h(x, y), akkor a következő alakban adható meg az X változó Y = y feltétel
melletti sűrűségfüggvénye:
Tehát a feltételes sűrűségfüggvényekből előáll a két változó peremsűrűség-függvénye. Ezt jól lehet használni a
következő valószínűségi változókkal végzett műveletek esetén is.
Példa. Vegyük a kaszinókból ismert craps játékot, ahol két kockát dobnak fel, és az összegük különböző értékeire
nyerünk, vesztünk vagy tovább dobnak. Nyilván, mivel mindkét kockán 1-től 6-ig terjednek a számok, ezért az összeg
2-től 12-ig terjed. Ha készítünk egy táblázatot, akkor az esélyeket is ki lehet számolni, feltéve, hogy a két kockán
dobott szám értéke egymástól független.
X + Y összeg X Y Esély
2 1 1 1/36
3 1; 2 2; 1 2/36
4 1; 2; 3 3; 2; 1 3/36
5 1; 2; 3; 4 4; 3; 2; 1 4/36
6 1; 2; 3; 4; 5 5; 4; 3; 2; 1 5/36
7 1; 2; 3; 4; 5; 6 6; 5; 4; 3; 2; 1 6/36
8 2; 3; 4; 5; 6 6; 5; 4; 3; 2 5/36
9 3; 4; 5; 6 6; 5; 4; 3 4/36
10 4; 5; 6 6; 5; 4 3/36
11 5; 6 6; 5 2/36
12 6 6 1/36
Legyen az X változó értékkészlete: x1; x2; x3; …, xn, míg az Y változóé y1; y2; y3; …, ym. Ekkor, ha Z az összegük, akkor
értékei z1; z2; z3; …, zk, és természetesen minden zi-hez létezik legalább egy olyan xg és yh érték, hogy zi = xg + yh. Ekkor
a Z eloszlása a következő lesz:
Példánkban mindkét változó az {1, 2, 3, 4, 5, 6} halmazon egyenletes eloszlás volt, s összegük a táblázatban szereplő
eloszlás lett. Érdekes ezt tovább folytatni, s három kocka összegét, négy kocka összegét vizsgálni. Érdekes
meg gyelést tehetünk, az eloszlás egyre inkább „harangszerű” lesz. Majd később a centrális határeloszlás tétele
kapcsán derül fény a jelenségre.
Jelölje X sűrűségfüggvényét f, és a tőle független Y-ét g. Az összegüket jelölje Z, sűrűségfüggvényét h. Erre igaz lesz,
hogy .
A Z valószínűségi változót az azonos valószínűségi mezőn értelmezett X és Y változók különbségének mondjuk, ha Z(ω)
= X(ω) – Y(ω) minden ω > Ω esetén.
Példa. Vegyünk egy játékost, aki a bankkal a következőt játssza. A játékvezető és ő is feldob egy-egy kockát.
Nyereménye (vesztesége) a két dobott szám különbsége, mégpedig mindig a játékos által dobott számból kell a
játékvezető által dobott számot kivonni. Milyen lehetőségek adódnak és milyen valószínűség-eloszlással?
Megoldás. A lehetőségek a két dobott szám különbségei, ami a következő táblázat szerint alakulhat:
1 0 1 2 3 4 5
2 –1 0 1 2 3 4
3 –2 –1 0 1 2 3
4 –3 –2 –1 0 1 2
5 –4 –3 –2 –1 0 1
6 –5 –4 –3 –2 –1 0
Ebből adódik, hogy a különbség lehetséges értékei és valószínűségeik, a kockák szabályosságát és a dobások
függetlenségét feltételezve:
Folytonos esetben a különbség sűrűségfüggvénye hasonló, mint az összegé, ha függetlenek a változók, és a következő
alakban írható fel:
Jelölje X sűrűségfüggvényét f, a tőle független Y-ét g. Ha a szorzatukat Z jelöli, sűrűségfüggvényét pedig h, akkor igaz
lesz, hogy
Példánk legyen a bevezető téglalapos feladat. Mivel mindkét szám 0 és 1 közötti, ezért a szorzat is 0 és 1 között lesz.
Feltéve az egyenletes eloszlás f(x) = g(x) = 1 a [0; 1] intervallumon. A h sűrűségfüggvényre igaz lesz a következő
, ahol 0 < z ≤ 1. Tehát annak a valószínűsége, hogy például a terület legfeljebb ½, nem más,
mint , azaz elég valószínű. Nyilván egynél kisebb számok szorzata még
kisebb lesz, nem egyenletes a szorzat eloszlása.
Egy diszkrét példa, ha két kockával dobunk, és a dobások szorzata lesz a nyereményünk.
Vajon milyen eloszlású a nyeremény?
1 1 2 3 4 5 6
2 2 4 6 8 10 12
3 3 6 9 12 15 18
4 4 8 12 16 20 24
5 5 10 15 20 25 30
6 6 12 18 24 30 36
Ez tehát a szorzat eloszlása. Nyilván a többféleképpen bontható számok szerepelnek nagyobb eséllyel, a 4 kivételével
öt négyzetszám pedig 1/36 eséllyel (a 4 bontható 4 × 1-ként is, ezért 3/36 az esélye).
minden ω ∈ Ω esetén. Természetesen fel kell tételeznünk, hogy az Y változó a 0 értéket nem veszi fel,
mert ott értelmetlen a hányados.
Jelölje X sűrűségfüggvényét f, a tőle független Y-ét g. Ha hányadosukat Z jelöli, míg annak sűrűségfüggvényét h, akkor
igaz lesz, hogy
Példa. Egy diszkrét eset a következő. Legyen X egy dobókockával dobott szám értéke, míg Y két pénz feldobása esetén
a fejek száma +1. Azaz Y lehetséges értékei 1, 2, 3, az esélyeik rendre: ¼; ½; ¼. Ekkor a hányados eloszlása a
következő:
Legyen X egy valószínűségi változó és ψ: U ⊆ R ↦ R mérhető valós függvény. Ekkor az Y = ψ(X) is egy valószínűségi
változó lesz.
Nézzünk két példát erre! Elsőként vegyünk egy (0; 1)-en egyenletes eloszlású változót (lásd a 26.6. fejezetben),
valamint a transzformációt. Mi lesz a transzformált eloszlás sűrűségfüggvénye? Nyilván a tételt
használva adódik, hogy minden 0 < y < 1-re, mivel f(x) = 1 minden x-re. Így például annak
a valószínűsége, hogy választva véletlenszerűen egy négyzetet, melynek területe 0 és 1 egység közé esik, annak az
, illetve a feltétel.
A legegyszerűbb diszkrét változó a már szerepelt ún. karakterisztikus valószínűségi változó, amelyet egy A esemény
karakterizál, értéke 1, ha A bekövetkezett, és 0, ha nem,
Ilyenkor mindössze kételemű az értékkészlet (ennél kisebb számosságú csak a konstans valószínűségi változó
értékkészlete). Ennek eloszlásfüggvénye is egyszerű,
Diszkrét egyenletes eloszlás. Adott valahány kimenetel, s mindegyiknek ugyanannyi az esélye. Ha a felvett értékek
rendezve az x1, x2, …, xn számok, akkor az eloszlása:
Eloszlásfüggvénye:
A következő két eset nagyon fontos, és sok véletlen jelenségnek a modellje.
Visszatevéses urnamodell
Visszatevés nélküli urnamodell
Geometriai eloszlás
Poisson-eloszlás mint határeloszlás és mint „önálló változó”
Multinomiális eloszlás
Visszatevéses urnamodell
Egy urnában van N számú golyó, s köztük K piros. Ebből húzunk n-szer úgy, hogy minden húzás után visszatesszük a kivett
golyót, és megkeverjük az urnában levő golyókat. Azaz minden húzás ugyanolyan összetételű urnából történik. A ξ
valószínűségi változó legyen a húzott pirosak száma. Nyilván ξ értékei 0, 1, 2, …, n természetes számok lehetnek. Diszkrét
esetről lévén szó, a P(ξ = i} valószínűségeket kell megadnunk a lehetséges i értékekre. Ehhez ismét a kombinatorikus
Laplace-modellt használjuk fel. Az elemi események olyan rendezett szám n-esek, ahol P(iros), N(em piros) lehet az egyes
„koordináták” helyén. Mivel K piros és N – K nem piros golyó van, ezért minden piros húzás K-féleképpen, minden nem
piros N – K-féleképpen valósulhat meg. Így ha éppen i pirosat húztunk, akkor lévén, hogy -féleképpen lehet a piros
húzásokat rögzíteni az n húzás között, a keresett esély:
eséllyel, a benne szereplő binomiális együtthatóra utalva, szokás binomiális eloszlásnak nevezni.
Megjegyzés. Elterjedt egyébként a Bernoulli-eloszlás szóhasználat is, Jacob Bernoullira utalva, aki először
foglalkozott ezzel az eloszlással, és nagyon fontos tételeket bizonyított be.
Az eloszlás „egycsúcsú”, azaz egy maximális értékig nő, azután csökken (később látni fogjuk, hogy nagy n értékekre
harangszerűen, lásd a 26.10a–b ábrát). Ez a maximális érték az np szorzat egész része „körül van”. Ennek igazolása egy
egyenlőtlenség megoldásán alapul, vizsgáljuk meg, hogy mikor érvényes az
Például, ha n = 3 és , akkor a négy tag esélye rendre: . Azaz két maximális érték van, hasonlóan,
mint pl. ha n = 5 és , ekkor a hat tag esélye rendre: , itt is két maximum van,
hiszen (n + 1)p egész szám.
26.10. ábra
Gra kus kalkulátorok ezt binomcdf jelzéssel adják meg, pontosan, ha megadjuk az n és p paraméterek értékét,
Ez az eloszlás is, hasonlóan a binomiálishoz, egycsúcsú, azaz egy bizonyos k értékig nő, azután csökken. Speciális
esetben két azonos valószínűségű k maximumhely lehet. Hasonló az okoskodás, mint a binomiális esetén, vizsgáljuk a
Geometriai eloszlás
Vizsgáljuk a következő szituációt. Addig kísérletezünk, amíg egy bizonyos p valószínűségű E esemény be nem következik. A
valószínűségi változó legyen a kísérletek száma. Nyilván ebben az esetben diszkrét, de végtelen változóról van szó, hiszen
elvileg előfordulhat, hogy akármilyen nagy számnál többet kell kísérletezni, amíg az első E-re nézve pozitív eredmény
adódik. Vizsgáljuk meg annak az esélyét, hogy éppen k kísérletet kell elvégeznünk. Ez azt jelenti, hogy az első k – 1
kísérletben nem következett be az E esemény, ennek esélye független kísérleteket feltételezve (1 – p)k–1, míg a k-adik
kísérletben bekövetkezik, azaz ennek p az esélye, s így felírható, hogy P(ξ = k) = p(1 – p)k–1. Ez valóban eloszlás lesz, hiszen
Azt az eloszlást, amely az 1, 2, 3, …, n, … természetes számokat P(X=i) = p(1 – p)i–1 valószínűséggel veszi fel, geometriai
eloszlásnak nevezzük.
Talán meglepő, éppen olyan gyerekkori játékokból, amikor csak 6-os dobással lehet játékba kerülni, hogy ez
legvalószínűbben az első dobásra következik be. Azaz a fenti eloszlás szigorúan monoton csökkenő, bármilyen p
valószínűségű eseményről is van szó. Azaz, ha minden játékban rögzítenénk, hogy hányadikra jutottunk be, akkor az 1
szerepelne leggyakrabban. Közben viszont olyan esetek is vannak, amikor elég sokat kell dobni, s ezért van az az érzésünk,
hogy várhatóan többet kell dobni. Egyébként a várható dobásszám nem is az 1, hanem 6, mint majd később látjuk.
Ahol az utolsó tényező határértéke a következő átalakítással adódik egy ismert határértékből:
Ezt az eloszlást, amely nem negatív egész számokat vesz fel valószínűséggel, Poisson-eloszlásnak
nevezzük, H. Poisson nyomán, aki a fenti határértéket először határozta meg.
Példa. Poisson-eloszlású a sajtóhibák száma egy könyv lapján, egy folyadékrészben levő idegen részecskék vagy
buborékok száma, egy telefonközpontba beérkező hívások száma adott időegység alatt, bizonyos idő alatt elbomlott
radioaktív atomok száma. Mekkora a valószínűsége, hogy egy üzletbe péntek délután 3 és 4 között, amikor a
tapasztalatok szerint átlagosan 5 vevő szokott jönni, most pontosan 3-an jönnek? Legvalószínűbben hányan jönnek?
Megoldás. Mint 26.7. fejezetben látni fogjuk, a várható érték éppen λ, így ha az átlagot ennek becsléseként tekintjük
(lásd még nagy számok törvénye), akkor az első kérdésre a válasz . Míg a másodikhoz meg kell
vizsgálni az eloszlás maximumát, ahogyan a binomiális, illetve a hipergeometriai eloszlás esetén láttuk. Itt
Mivel a matematikai statisztikában fontos szerepet játszik, ezért még szót ejtünk a binomiális eloszlás egy
általánosításáról, a multinomiális eloszlásról.
Multinomiális eloszlás
Legyen A1, A2, …, A, ≥ 3 egy teljes eseményrendszer, és jelöljük a P(Aj) valószínűségeket rendre pi-vel, ahol 1 ≤ i ≤ r.
Ismételjünk meg egy kísérletet ezen az eseménytéren N-szer egymástól függetlenül. Jelölje Xi az Ai esemény
bekövetkezéseinek számát az N kísérlet során. Az (X1, X2, …, Xt) vektorváltozó együttes eloszlása N, és p1, p2, …, pr
paraméterű multinomiális eloszlású:
ahol ki: 1 ≤ i ≤ r nem negatív egész számok azzal a feltétellel, hogy összegük N.
Egyenletes eloszlás
Exponenciális eloszlás
Γ-eloszlás
Normális eloszlás
Cauchy-eloszlás
Lognormális eloszlás
χ2-eloszlás
Student-féle t-eloszlás
F-eloszlás
β-eloszlás
Egyenletes eloszlás
Az [a, b] intervallumon egyenletes eloszlásúnak nevezzük azt a valószínűségi változót, aminek konstans a
Példa. Valaki a villamosmegállóban várakozik. Ha egyenletes eloszlás szerint érkeznek a villamosok percben mérve a
[0, 10]-ban, akkor mi a valószínűsége annak, hogy legalább 4 percet kell várni? Vajon mennyi annak, hogy legalább 3
és legfeljebb 7 percet?
Mivel a [4, 10] az első kérdésre a válasz, ennek hossza 6, az egész szakaszé pedig 10 perc, tehát 0,6 a kérdezett esély. A
[3, 7]-ba esés esélye hasonlóan 0,4, amit úgy is megkaphatunk, hogy integráljuk a sűrűségfüggvényt, azaz:
Exponenciális eloszlás
Exponenciális eloszlásúnak mondjuk azt a nem negatív értékeket felvevő valószínűségi változót, amelynek
várhatóan elbomlani. Tehát a Tf felezési időre érvényes a következő összefüggés: , ahonnan –ln 2 = –
λTf, azaz , vagy a paraméter szempontjából . Azaz adataink szerint (az időt években mérve,
hamarabb bomlik el, mint x, ennek az esélye: 1 – e–λx. Mivel ennek várható értéke , ezért azt is mondhatjuk, hogy
az első elbomlott atomra éppen ideig kell várni. Azaz ha pl. egy óra alatt 5 atom bomlik el átlagosan, akkor az
első atomra 1/5 órát, azaz átlagosan 12 percet kell várni (ez nem túl meglepő!). Ezt általánosítva kimondhatjuk a
következő tételt a Poisson- és az exponenciális eloszlás kapcsolatáról.
Ha valamilyen történések száma akármilyen időintervallum esetén az intervallum hosszával arányos paraméterű
Poisson-eloszlású, akkor az első történésig eltelt idő exponenciális eloszlású változó lesz, melynek paramétere
megegyezik az egységnyi idő alatt várható történések Poisson-eloszlásának paraméterével. Így az első történésig
várható időtartam hossza ennek reciproka lesz.
Példa. Statisztikák alapján az egy év alatt bekövetkező halálos közúti balesetek száma Poisson-eloszlású λ = 240
paraméterrel. Mikor várható januárban az első halálos baleset? A válasz, hogy az év 240-edrésze múlva, azaz 365/240
kb. 1,52 nap múlva, vagyis már január 2-án.
Egy másik nevezetes karakterisztikus tulajdonsága az exponenciális eloszlásnak az ún. „örökifjúság”, ami azt jelenti,
hogy ha élettartamot jelöl a változónk, akkor annak a valószínűsége, hogy egy t + τ időtartamot túléljen a vizsgált
objektum, ugyannyi, mint hogy a τ időtartamot túléli, feltéve, hogy a t-t túlélte. Formálisan:
Egy X nem negatív valószínűségi változót „örökifjúnak” nevezünk, ha igaz rá, hogy minden t, τ pozitív valós szám
esetén P(X ≥ t + τ|X ≥ t) = P(X ≥ τ).
Ez azért igaz, mert az örökifjúság feltételét eloszlásfüggvényre átfogalmazva azt kapjuk, hogy 1 – F(t + τ) = (1 – F(t)(1–
F(τ)), amelyből az exponenciális eloszlás esetében az e–λ(t + τ) = e–λt · e–λτ azonosságot kapjuk, amely természetesen fennáll.
Mivel folytonos függvények körében a G(x + y) = G(x)G(y) egyenlet egyetlen megoldása az exponenciális függvény, ezért a
tétel megfordítása is igaz.
, különben f(x) = 0.
Normális eloszlás
A leggyakoribb folytonos eloszlás, jelentőségét a centrális határeloszlás tételének általános alakja hangsúlyozza, mely
szerint sok apró hatás együttes eredménye nagyon széles tartományban normális eloszláshoz vezet (lásd 26.9. fejezetben).
Az első felismerés a binomiális eloszlás határeloszlásaként való felbukkanása volt, illetve Gauss mérési hibákkal
kapcsolatos vizsgálódásai vezettek el ide.
Gauss-féle vagy normális eloszlásúnak mondjuk azt a valószínűségi változót, amelynek sűrűségfüggvénye a
következő: ahol μ tetszőleges valós szám, míg σ > 0 valós. Ezek a normális eloszlás
paraméterei.
Eloszlásfüggvényét azért nem adtuk meg, mert zárt alakban a primitív függvénye egy nevezetes analízisbeli tétel
szerint nem kifejezhető elemi függvények és a szokásos műveleti jelek (összeadás, szorzás, gyökvonás stb.)
felhasználásával.
Azt a speciális esetet, amikor a μ paraméter 0, és σ = 1, standard normális eloszlásnak nevezzük, s ennek
sűrűségfüggvényét általánosan elterjedt φ(x)-szel jelölni. Az eloszlásfüggvényt, amelyet csak numerikus módszerekkel
Valójában minden X (μ, σ) paraméterű normális eloszlású változóból lehet standard normális eloszlást képezni a
következő eljárással: . Az így kapott X* változó már standard normális eloszlású lesz, hiszen a várható
értéke 0 és a szórása 1, ahogyan azt a következő fejezetben látni fogjuk.
A normális eloszlás eloszlásfüggvényének értékeit 4 vagy több tizedesjegyre táblázatokban szokás megadni. A
négyjegyű függvénytáblázatban is megtaláljuk. Ezzel különböző intervallumba esési valószínűségeket lehet számolni, mint
a következő példákban láthatjuk. Megjegyezzük, hogy az eloszlás szimmetriája miatt Φ(–x) = 1 – Φ(x), amit gyakran
kihasználunk, s ezért általában helytakarékosságból a táblázatok csak pozitív értékekre tartalmazzák a normális eloszlás
eloszlásfüggvényének értékeit.
Példák
1. Egy gép által töltött liszteszacskók tömege normális eloszlásúnak vehető μ = 1 kg, σ = 0,01 kg paraméterekkel. Mi a
valószínűsége, hogy egy véletlenül választott liszteszacskóban legfeljebb 0,97 kg liszt legyen? Mi a valószínűsége,
hogy legalább 1,01 kg liszt van benne?
Cauchy-eloszlás
Megjegyzés. A Cauchy-eloszlás, bár történetileg korábbi, mint a Student-féle t-eloszlás, ezért is szerepel előbb, de
annak egy speciális eseteként az n = 1 szabadsági fokhoz tartozik.
Példa Cauchy-eloszlásra. Nézzük két standard normális eloszlás hányadosát! Ekkor
Lognormális eloszlás
Lognormális eloszlásúnak nevezzük azt a valószínűségi változót, amely egy normális eloszlású változónak, az y = ex
függvény szerinti transzformáltjával egyezik meg. Sűrűségfüggvénye a következő alakú, felhasználva a
transzformációra vonatkozó tételt:
, különben pedig 0.
A következő eloszlások főleg a matematikai statisztikában játszanak komoly szerepet (27. fejezet), mindegyike a
normális eloszlásból származik valamilyen módon.
χ2-eloszlás
Elsőrendű χ2-eloszlásról beszélünk, ha egy standard normális eloszlású változót az y = t(x) = x2 leképezéssel
transzformáljuk. Használva a transzformációra bemutatott eljárást (26.4. fejezet) kapjuk, hogy a sűrűségfüggvénye:
Általában n-edrendű vagy n szabadsági fokú χ2-eloszlásról beszélünk, ha n darab független standard normális eloszlású
változó négyzetének összegét veszszük, azaz
26.11. ábra
Megjegyzés. Valójában azt is mondhatjuk, hogy n darab független elsőrendű χ2-eloszlás összege az n-edrendú.
Sűrűségfüggvénye akkor n-szeres konvolúcióval kapható meg az előbb látott elsőrendű χ2-eloszlás
sűrűségfüggvényéből. A χ2-eloszlás fontosabb értékeit különböző szabadsági fokok mellett táblázatban szokás
megadni, lásd a 27. fejezet végén megadott táblázatot.
Student-féle t-eloszlás
A változónkat t-eloszlásúnak vagy Student-eloszlásúnak mondjuk, ha egy X standard normális eloszlású változóból és
A t-eloszlás sűrűségfüggvénye n = 4 szabadsági fokkal a 26.12. ábrán látható (ahol a szaggatott görbe a standard
normális eloszlást jelöli).
26.12. ábra
A különböző szabadsági fokú t-eloszlásfüggvény értékeit szintén táblázatban szokás megadni, lásd a 27. fejezet végén.
F-eloszlás
F-eloszlásúnak nevezzük a két különböző szabadsági fokú χ2-eloszlásból a következő módon kapott valószínűségi
változó eloszlását: , ahol X egy n1, míg Y egy n2 szabadsági fokú χ2-eloszlású változó, amelyek függetlenek.
Ilyenkor (n1 – 1, n2 – 1) paraméterű F-eloszlásról beszélünk. Általában az (n, m) paraméterű F-eloszlás
sűrűségfüggvénye a következő alakú:
, x > 0, egyébként f(x) = 0.
26.13. ábra
Az eloszlás értékeit szintén táblázatban szokás megadni, mivel csak számítógép segítségével numerikus módszerekkel
számolható. Lásd a 27. fejezet végén levő F-táblázatot.
Végül egy a Bayes-statisztikában (lásd 27.8. fejezet) fontos szerepet játszó eloszlást de niálunk.
β-eloszlás
sűrűségfüggvénnyel: .
26.14. ábra
Megjegyzés. A „feltéve, hogy létezik” fontos feltétel, mert ez nem szükségszerű. A következőkben példákat mutatunk
olyan diszkrét, illetve folytonos változóra, amelyeknek nem létezik várható értéke.
1. Legyen a változó egy rulettjáték esetén az első feketéig tartó duplázó stratégia tétértéke, azaz először felteszünk
egy egységnyi pénzt a feketére, ha elsőre kijön, akkor a tét 1 volt, ha 2-re, akkor 1 + 2 = 3, ha 3-ra, akkor 1 + 2 + 4=7,
általában, ha n-edikre jön ki a fekete, akkor 1 + 2 + 22 + … + 2n–1 = 2n – 1 pénzegység. Ekkor az összes tétünk várható
hogy tényleg 0 és 1 között van, monoton növő, tehát valódi eloszlás.) Ekkor minden valós x-re. A
várható értékhez a következő integrált kellene kiszámolni: . Ezt viszont lehet integrálni,
hiszen van primitív függvénye, az függvény, amit deriválással könnyen ellenőrizhetünk. Viszont
a logaritmus a végtelenben nem korlátos, azaz az improprius integrálnak nem lesz határértéke, így nincsen véges
várható értéke a Cauchy-eloszlásnak.
Nevezetes eloszlások várható értékeit a következőkben a bemutatott összefüggések és a szórás fogalmának bevezetése
után adjuk meg.
Sokat használt összefüggés a „várható érték operátor” linearitása, ami azt jelenti, hogy ha
ξ és η két tetszőleges valószínűségi változó, melyeknek létezik várható értéke, akkor a lineáris kombinációjuknak is
létezik, és értéke E(aξ + bη) = aE(ξ) + bE(η).
Ha a ξ és az η változók függetlenek, és létezik a várható értékük, akkor igaz, hogy E(ξη) = E(ξ)E(η).
Még egy fontos fogalmat vezetünk be, a feltételes várható érték fogalmát.
Egy X valószínűségi változó egy A eseményre vonatkoztatott feltételes várható értéke az X-nek az A eseményre
feltételes eloszlása folytonos, akkor , ahol f(x | A) jelöli az X változó A feltételre vonatkoztatott
feltételes sűrűségfüggvényét.
Ekkor, ha A1, A2, … egy teljes eseményrendszer, akkor a teljes valószínűség tételéből következik, hogy
Ezt értelmezhetjük úgy is, hogy az Ak események jelölik egy másik Y diszkrét változónak a lehetséges értékeit, azaz Ak =
{ω|Y(ω) =yk}, ahol az Y változó lehetséges értékeit jelöltük yk-val. Ez azonban további általánosítást indukál, hogy mi
lenne, ha Y folytonos lenne. Erre az esetre is bevezetjük az X valószínűségi változó Y változóra vonatkoztatott feltételes
várható értékét a következőképpen.
Ha X és Y együttes eloszlása h(x, y) folytonos, és akkor az X változó Y = y feltételre vonatkoztatott feltételes várható
Emlékeztetünk a 26.4. fejezet Feltételes eloszlások című részére, ahol láttuk, hogy .
Ha tehát ezt g(y)-nal, az Y sűrűségfüggvényével megszorozzuk, és y szerint kiintegráljuk, akkor megkapjuk X várható
értékét, azaz igaz a következő összefüggés:
A feltételes várható értékre még a 26.10. fejezetben a regresszió kapcsán viszszatérünk.
A valószínűségi változó szórása fogalom a statisztika empirikus szórásának (lásd a 27.4. fejezetben) a valószínűség-
elméleti megfelelője.
Egy valószínűségi változó szórása a változó várható értéktől való négyzetes eltérése átlagának négyzetgyöke. Jele a
dispersio szóból D. Írjuk fel formálisan az előbbieket:
ahol a második egyenlőség a várható érték operátor korábban emlegetett linearitásából adódik. Utóbbi forma a kiszámítás
leggyakoribb módja is egyben. Azaz, ha a várható érték megvan, akkor a szóráshoz már csak a változó négyzetének a
várható értékét kell kiszámolni.
Tulajdonságok:
A négyzetgyök alatti kifejezést szokás varianciának is mondani, vagy szórásnégyzetnek, jelölése D2(ξ). Erre független
változók esetén van egy fontos azonosság, ami a várható értékkel szemben azonban csak független (pontosabban
korrelálatlan) változók esetében működik.
Ennek a bizonyításnak a gondolatát bemutatjuk, hogy látható legyen, miért is kell a függetlenség.
Az első két-két tag éppen a bizonyítandó összefüggés jobb oldala. Ha független a két változó, akkor a szorzatuk várható
értéke a várható értékek szorzata (lásd 26.2. fejezet), ekkor tehát az utolsó kétszeres tag értéke 0.
Ennek a két tételnek a segítségével lehet független véges összegként is előállítható valószínűségi változók szórását
egyszerűen kiszámolni. Legegyszerűbb példa erre a binomiális eloszlás, ami n darab ζi független karakterisztikus változó
összegének tekinthető. Egy karakterisztikus változó szórásnégyzete egyszerűen p(1 – p), hiszen a négyzetének várható
értéke maga a várható értéke, azaz p. Így D2(ζi) = p–p2 = p(1 – p).
Függetlenség esetében áll a fentiekben belátott linearitás, azaz a binomiális eloszlás szórásnégyzete: np(1 – p), azaz a
szórása: . Lásd később a 26.7. fejezetben Generátorfüggvény cím alatt is, ahol egy másik számolási móddal is
megadjuk a binomiális eloszlás várható értékét és szórását.
Példa. Egy várhatóan egy év alatt elbomló radioaktív atom esetén mi az esélye, hogy már fél év alatt elbomlik? A
várható érték 1 év, ennek reciproka is 1, tehát λ = 1, azaz a kérdés P(X < 0,5) = 1 – e–0,5 ≈ 0,3935. Azaz közel 40% eséllyel
már fél év alatt elbomlik. Egy év alatt az esély 0,6321, tehát közel kétharmad eséllyel bomlik el egy év alatt.
éppen lesz, mivel dx helyett 2du írandó a helyettesítés miatt. Így az eredmény:
. Tehát E(X) = n.
n szabadsági fokú t-eloszlás
Ha n = 1, akkor nincsen várható értéke, egyébként pedig E(t) = 0, ha n > 1.
F-eloszlás (n, m) szabadsági fok esetén , ha n > 2, ha az első (számláló) szabadsági foka 1 vagy 2, akkor
nincsen várható értéke.
A β-eloszlás várható értéke:
adódik, azaz megegyezik a várható értékkel. Az exponenciális eloszlás paramétere tehát egyidejűleg a várható
értéke, illetve a szórás reciproka.
Legyen Z (μ, σ) paraméterű normális eloszlású változó. Ekkor igaz, hogy
t-eloszlás szórásnégyzete csak legalább három szabadsági fok esetén létezik, azaz , ha n ≥ 3. Különben
nem létezik.
F-eloszlás (n, m) paraméterrel, szórása csak akkor létezik, ha legalább 5 a számlálójának a szabadsági foka, tehát ha n ≥
5, akkor létezik a szórásnégyzet, és értéke:
A diszkrét eloszlások várható értékének, illetve szórásának meghatározása sokféleképpen történhet, az alábbi
generátorfüggvényeken alapuló számítás egy lehetőség, amely sok más, olykor igen trükkös ötletet elkerül.
Generátorfüggvény
Diszkrét nem negatív egész értékű eloszlások kezelésének egy analitikus útja az ún. generátorfüggvénnyel történik.
Amennyiben a diszkrét valószínűségi változó a természetes számokat veszi fel, akkor értelmezhető az alábbi
hatványsor: , ahol az i értéket pi eséllyel veszi fel a változó. Feltesszük, hogy |x| ≤ 1, mert ekkor biztos
konvergens. Ezt a függvényt a ξ diszkrét változó generátorfüggvényének mondjuk.
Egyenletes eloszlás
Binomiális eloszlás
Hipergeometriai eloszlás
Geometriai eloszlás
Poisson-eloszlás
Egyenletes eloszlás
ahonnan , tehát a várható érték és a szórásnégyzet: , és
Binomiális eloszlás
Hipergeometriai eloszlás
Látható, hogy ha N jóval nagyobb, mint n, akkor az utolsó tört 1-hez közeli szám, s ahogyan a hipergeometriai eloszlás
ilyenkor a binomiálissal közelíthető, úgy a szórása is a binomiális eloszlás szórásához, np(1–p)-hez lesz közel, ahol nyilván
Geometriai eloszlás
Poisson-eloszlás
, ahonnan
G′(x) = λeλ(x–1) és G″(x) = λeλ(x–1).
Ebből adódik, hogy E(ξ) = λ és D2(ξ) = λ2 + λ – λ2 = λ.
Azaz a Poisson-eloszlás várható értéke és szórásnégyzete egyaránt a paraméterével, λ-val egyenlő. A szórás pedig a
várható érték négyzetgyöke.
Végezetül foglalkozzunk még a multinomiális eloszlással (lásd a 26.5. fejezetben).
Nyilván X1 + X2 + … + Xr = N is fennáll, így bármely r – 1 komponens meghatározza az eloszlást. Néhány nevezetes
tulajdonsága az eloszlásnak.
1. E(Xi) = Npi és D2(Xi) = Npi (1 – pi).
2. Xi és Xj együttes eloszlása i ≠ j esetén:
Egy adott hatványsorba fejthető G(x) függvény generátorfüggvény, ha teljesül, hogy G(1) = 1, illetve minden
együtthatója nem negatív.
A továbbiakban még egy fontos, sokat használt összefüggést mutatunk be a generátorfüggvények és valószínűségi
változók között.
Két független diszkrét valószínűségi változó összegének generátorfüggvénye a két változó generátorfüggvényeinek
szorzata. Formálisan, ha a két független változó generátorfüggvényei: Gξ(x) és Gη(x), akkor az összegük Gξ+η(x)
generátorfüggvényére igaz lesz: Gξ+η(x) = Gξ(x)Gη(x), minden |x| ≤ 1-re.
Két Poisson-eloszlású független változó összege is Poisson-eloszlású a két eloszlás paraméterének összegével mint
paraméterrel.
A bizonyításhoz csak annyi kell, hogy a fent levezetett generátorfüggvényeket összeszorozzuk, azaz
-et kapjuk. Ez viszont éppen egy λ1 + λ2 paraméterű Poisson-eloszlás generátorfüggvénye.
Hasonlóan két független, azonos p paraméterű n1, illetve n2 rendű binomiális eloszlás összege is binomiális eloszlású
lesz, mégpedig szintén p paraméterrel és n1 + n2 renddel.
A karakterisztikus függvény
A generátorfüggvények általánosításaként tekinthetjük folytonos eloszlások esetén a karakterisztikus függvényt, amely
nemcsak nem negatív egész értékű valószínűségi változók esetében értelmezett, hanem tetszőleges valószínűségi
változóra. Ennek de níciójával és legfontosabb tulajdonságaival foglalkozunk a következő pontban. Természetesen, mint a
generátorfüggvények esetén tettük, itt is megadjuk a legfontosabb eloszlások karakterisztikus függvényét.
Megjegyzés. Az előbbi tétel megfordítása nem igaz, tehát lehet két változó összegének a karakterisztikus függvénye az
egyes változók karakterisztikus függvényeinek szorzata, és a változók nem függetlenek. Lásd ellenpéldaként a Cauchy-
eloszlás karakterisztikus függvénye utáni példát.
Ha a és b konstansok, és ha
(26.1)
Ha az X valószínűségi változó várható értéke létezik, akkor φx(t) di erenciálható, és fennáll, hogy φ′x(0) = iE(X).
Hasonló igaz magasabb momentumokra is.
Egy igen fontos tétel, hogy a karakterisztikus függvényből meghatározhatjuk a valószínűségi változó eloszlását. Ezen
kívül egy konvergenciára vonatkozó tétel következzen még, amelyet majd határeloszlás-tételek bizonyításánál
használhatunk.
Jelölje φ(t) az F(x) eloszlásfüggvény karakterisztikus függvényét, és legyen a és b (a < b) az F(x) eloszlásfüggvény két
folytonossági helye, akkor
(26.2)
Végül
Az Fn(x) eloszlásfüggvények (n = 1, 2, …) akkor és csak akkor konvergálnak egy F(x) eloszlásfüggvényhez F(x) minden
folytonossági pontjában, ha az Fn(x) eloszlásfüggvények φn(t) karakterisztikus függvényei n → ∞ esetén olyan φ(t)
függvényhez konvergálnak, amely a t = 0 pontban folytonos. Ebben az esetben φ(t) az F(x) karakterisztikus függvénye,
és a φn(t) karakterisztikus függvények konvergenciája minden véges intervallumban egyenletes.
Ennek alapján lehet eloszlásokra vonatkozó konvergenciatételeket karakterisztikus függvény módszerrel vizsgálni és
sok esetben bizonyítani.
Néhány fontos eloszlás karakterisztikus függvénye következik, melyeket levezetés nélkül megadunk, az olvasó
utánaszámolhat vagy számos könyvben utána is nézhet.
A karakterisztikus függvények és a valószínűségi változók összege közötti kapcsolatot leíró tétel miatt az is azonnal
adódik, hogy n független azonos eloszlású exponenciális változó összege ξn egy n-edrendű várható értékű Γ-eloszlás,
Megjegyezzük, hogy ebből következik a karakterisztikus függvények és a valószínűségi változók összege közötti
kapcsolatot leíró tétel megfordításának legegyszerűbb ellenpéldája. Legyen ξ1 = ξ2, ekkor ξ1 + ξ2 = 2ξ1, amelynek
karakterisztikus függvénye (26.1) összefüggés szerint (a = 2 és b = 0 mellett) éppen , azaz éppen a
két azonos változó karakterisztikus függvényeinek szorzata. Mégis biztosan nem függetlenek, hiszen önmagától semmi
nem lehet független, éppenséggel ez a maximális függőség esete.
Megjegyzés. Független Cauchy-eloszlások átlaga ismét Cauchy-eloszlás, hiszen karakterisztikus függvénye ugyanaz.
Alkalmazásként megmutatunk néhány fontos, normális eloszlású változókra érvényes tételt, ahol a bizonyítás a
karakterisztikus függvények segítségével és sok más, olykor igen mély, analízisbeli segédeszköz felhasználásával történik.
A bizonyítások igen hosszadalmasak (lásd például Rényi A.: Valószínűségszámítás. Tankönyvkiadó, Budapest, 1973, 271–
295.), itt lemondunk róluk.
Ha ξ és η független azonos eloszlású és véges szórású valószínűségi változók, továbbá ξ + η és ξ – η függetlenek, akkor ξ
és η eloszlása is normális.
Ez a tétel Bernsteintől származik, és karakterizálja a normális eloszlást, hiszen ha ξ és η független, normális eloszlású
változók, akkor ξ + η és ξ – η is függetlenek. A fenti tétel szerint ez megfordítható, tehát akkor és csak akkor típusú állítás.
Továbbá igaz az alábbi két tétel is.
Legyenek ξ és η független azonos eloszlású valószínűségi változók 0 várható értékkel és véges szórással! Tegyük fel,
Például, ha két különböző irányból érkező folyó összefolyik, és azt tapasztaljuk, hogy az év adott időpontjaiban a
közös szakaszon mért vízállás normális eloszlású, és valamiért elfogadható az a feltételezés, hogy függetlenek a
folyók vízállásai (más területről jönnek), akkor a két folyó korábbi szakaszain is normális eloszlású lesz a vízállás.
Konkrétan a Duna Budapesten és a Tisza Szegeden mért vízállását nem ismernénk, de a Duna Titel után valahol
mért vízállása normális, akkor erre következtethetünk Budapesten és Szegeden is persze a megfelelő idővel korábbi
vízállásokra (ami a folyók sebességétől függ).
Ha a ξ1, ξ2, …, ξr valószínűségi változók függetlenek, az a1, a2, …, ar, b1, b2, …, br számok 0-tól különbözőek, továbbá
Legyenek a ξ1, ξ2, …, ξn valószínűségi változók függetlenek és azonos eloszlásúak, és legyen várható értékük és
szórásuk. A ξ1, ξ2, …, ξn valószínűségi változók akkor és csak akkor normális eloszlásúak, ha
függetlenek.
Legyen X egy nem negatív valószínűségi változó, amelynek létezik véges várható értéke, amit jelöljünk m-mel,
valamint egy λ > 1 valós szám! Ekkor a következő, Markovról elnevezett egyenlőtlenség fennáll: .
A bizonyítás egyszerű, a várható érték fogalmán és egy nagyon durva becslésen alapul. Azért, hogy ne kelljen
szétválasztani a diszkrét és a folytonos esetet, eloszlásfüggvény szerinti integrállal fogunk dolgozni.
ahonnan egyszerűen adódik a bizonyítandó állítás. Ebből viszont levezethető a következő, Csebisevről elnevezett
egyenlőtlenség.
Legyen X valószínűségi változó, amelynek létezik mind a várható értéke, mind a szórása. Ekkor igaz, hogy
Az igazoláshoz elegendő a Markov-egyenlőtlenséget használni a nem negatív értékű (X–E(X))2 változóra, melynek
várható értéke éppen D2(X), azaz Markov szerint: , amiből azonnal adódik az állítás
egy négyzetgyökvonással a nagy zárójelen belül.
Ha ezt az egyenlőtlenséget alkalmazzuk a binomiális eloszlásra, akkor megkapjuk az első nagy számok törvényét,
melyet Bernoulli jóval komplikáltabban bizonyított.
Először szorozzunk be n-nel, majd emeljünk négyzetre, akkor kapjuk, hogy a következő egyenlőtlenséget kell
belátnunk:
Mivel a gyakoriság binomiális eloszlású éppen np várható értékkel és np(1 – p) szórásnégyzettel, ezért a Csebisev-
egyenlőtlenség szerint igaz lesz, hogy
Ha még felhasználjuk, hogy , akkor a bal oldalon egy p-től független mennyiséget kapunk, tehát ha
Példák
1. Hányszor kell feldobni egy dobókockát ahhoz, hogy a 6-os dobás relatív gyakorisága és a valószínűség eltérése
kisebb legyen, mint 0,01 legalább 0,95 biztonsággal?
Válasz: Ez azt jelenti, hogy δ = 0,01 és , ahonnan n ≥ 50 000, tehát 50 000 dobás esetén biztosan
teljesül a feltétel. Ha a pontosabb egyenlőtlenséggel számolunk, akkor feltéve a kocka szabályosságát p = 1/6, tehát
, azaz ekkor n ≥ 27 778, azaz pontosabb számítás szerint elegendő ennyi dobás. Majd később a
centrális határeloszlás tétele segítségével még kisebb érték fog adódni, mivel a Csebisev-egyenlőtlenség bizonyos
esetekben durva felső becslés.
2. Mennyire becsüli 0,95 biztonsággal annak az eseménynek a valószínűségét, amely egy 2000 terjedelmű
kísérletsorozatban 743-szor következett be?
Válasz: Ez azt jelenti, hogy most csak a egyenlőtlenséget tudjuk használni. Ebből n =
2000, és a hányados értéke 0,05-nek vehető, mivel 0,95 a biztonság, hogy az eltérés kisebb, mint δ. Ebből adódik,
hogy δ = 0,05. Azaz a valószínűség eszerint a relatív gyakoriságtól 0,95 biztonsággal legfeljebb
0,05-tel tér el, tehát becslésünk szerint [0,3215, 0,4215] intervallumba esik.
Mielőtt általánosítanánk tetszőleges eloszlású valószínűségi változókra, fogalmazzuk meg a már szerepelt
sztochasztikus konvergencia fogalmát.
Azt mondjuk, hogy az X1, X2, X3, …, Xn, … valószínűségi változók sorozata sztochasztikusan konvergál egy X
valószínűségi változóhoz, ha minden pozitív ϵ számra teljesül, hogy . Jelölése
vagy egyszerűen Xn ⇒ stX.
Ez tovább általánosítható azzal, hogy a változók nem azonos eloszlásúak, de függetlenek, és mindegyiknek létezik a
várható értéke és korlátos a szórásnégyzetek összege.
Legyenek X1, X2, X3, …, Xn, … független valószínűségi változók rendre mi várható értékkel és σi szórással. Ha a
és a jobb oldal 0-hoz tart, hiszen ha egy pozitív sor korlátos, akkor konvergens is, és a
sorozat ún. farka 0-hoz tart (lásd még a 16. fejezetet). Tehát P(A) = 0.
Mivel , ezért elég belátni, hogy , mivel ebből adódik, hogy P(Ā) = 0, amiből pedig
az állítás. Ez viszont a következők miatt igaz:
Felhasználtuk, hogy az események totálisan függetlenek egymástól. Az utolsó tag viszont 0-hoz tart, mivel
.
A két lemma összefoglalva és kicsit gyengítve a következőt mondja ki. Ha az események totálisan függetlenek, akkor a
sor konvergens vagy divergens voltától függően P(A) = 0 vagy P(A) = 1. Ennek általánosítása lesz a „nulla vagy
egy törvény” (lásd még Kolmogorov 0 vagy 1 törvényét). Fogalmazzuk meg ezután a fejezet fő tételét.
Legyenek X1, X2, X3, …, Xn, … teljesen független, egyforma eloszlású valószínűségi változók, s tegyük fel, hogy létezik a
Ekkor .
Az állítást a nagy számok erős törvényének mondják, mivel ebből következik a gyenge törvény, fordítva viszont nem,
tehát ez tényleg többet mond, innen az elnevezés.
Legyenek X1, X2, X3, …, Xn, … teljesen független valószínűségi változók, melyeknek létezik a várható értéke E(Xn) = Mn,
és a szórása D(Xn) = Dn.
Legyenek X1, X2, X3, …, Xn, … teljesen független, egyforma eloszlású valószínűségi változók! Az
valószínűségi változók egy C konstanshoz tartanak pontosan akkor, ha létezik E(Xn) = M, s ekkor C = M;
.
Ez a tétel azt jelenti, hogy a nagy számok erős törvényében a szórásokra vonatkozó feltevés ejthető, a szórás létezése
nélkül is igaz az 1 valószínűségű konvergencia.
A továbbiakban még megemlítjük, hogy a nagy számok erős törvényei is tovább élesíthetők, az egyik ilyen az iterált
logaritmus tétele.
Legyenek X1, X2, X3, …, Xn, … korlátos, teljesen független, egyforma eloszlású valószínűségi változók! Legyenek E(Xn)
= M, és D(Xn) = D, valamint de niáljuk az Yn valószínűségi változót a következő egyenlőséggel:
Kolmogorov 0 vagy 1 törvénye. Legyenek A1, A2, …, An, … teljesen független események sorozata; jelöljük J(n)-nel az An
… mindegyikét tartalmazó legszűkebb σ-algebrát, és legyen B egy olyan esemény, amelyik mindegyik J(n) σ-
+ 1, An + 2,
algebrában benne van! Ekkor P(B)(1 – P(B)) = 0, azaz P(B) = 0 vagy 1.
Kolmogorov háromsor tétele. Legyenek X1, X2, X3, …, Xn, … teljesen független valószínűségi változók, és legyen K
tetszőleges adott pozitív szám. Értelmezzük az valószínűségi változókat a következőképpen:
A sor pontosan akkor konvergens 1 valószínűséggel, ha a következő három sor konvergens minden K-ra:
1.
Centrális határeloszlás-tétel. Legyenek X1, X2, X3, …, Xn, … azonos eloszlású, egymástól független valószínűségi
Ennek a tételnek igen nagy jelentősége van a matematikai statisztikában is, ahol a becsléselméletben nevezetes
eloszlások a t-, a χ2-vagy az F-eloszlás közelíthető lesz a normális eloszlással, amelynek értékeit nagy pontossággal
ismerjük, s ezt fel fogjuk tudni használni a centrális határeloszlás-tétel miatt. Jóval előbb bizonyítottak már egy fontos
tételt, amely a binomiális eloszlásra vonatkozott, és azt mondta ki, hogy a binomiális eloszlás nagy n-re konvergál a
normális eloszláshoz. Ezt a felfedezőiről nevezték el.
Legyen adott egy X valószínűségi változó, ismeretlen F-eloszlásfüggvénnyel! Végezzünk n meg gyelést, melyek
mindegyike egy-egy realizációja az X-nek, azaz az X1, X2, X3, …, Xn egymástól független valószínűségi változók, azonos
F-eloszlásfüggvénnyel. Legyen , tehát azon valószínűségi változók száma, amelyek kisebbek egy
megadott x értéknél osztva a meg gyelések számával (minta elemszáma). Az így megadott Fπ(x) függvényt empirikus
eloszlásfüggvénynek vagy a minta tapasztalati eloszlásfüggvényének mondjuk.
Glivenko tétele. Legyenek az X1, X2, X3, …, Xn egymástól független valószínűségi változók, azonos F-
eloszlásfüggvénnyel! Ha Fn(x) az előző de nícióban megadott tapasztalati eloszlásfüggvény, akkor 1 valószínűséggel
igaz, hogy Fn(x)e → F(x), ahol e → jelöli az ún. egyenletes konvergenciát, azaz ha
Említsünk meg még egy, a multinomiális eloszlásra vonatkozó határeloszlástételt. Emlékeztetünk, hogy az X = (X1, X2,
…, Xn) vektorváltozót akkor nevezzük multinomiális eloszlásúnak, ha
Legyen X1, X2, …, Xi multinomiális eloszlású N és p1, p2, …, pr paraméterekkel, feltéve, hogy pi > 0 minden 1 ≤ i ≤ r-re.
Y↓ X → 0 1 2 Y peremeloszlása
A kovariancia normálásával kapjuk a korrelációt, melyről belátható, hogy csak –1 és 1 közötti értékeket vehet fel.
Ahogyan a kovarianciánál már említettük, a korreláció lehet 0, ha nem függetlenek a változók. Egy lehetséges
általánosítása a függetlenségnek, ha csak annyit követelünk meg, hogy a korrelációjuk legyen 0.
Természetesen ha X és Y függetlenek, akkor korrelálatlanok is, fordítva azonban nem. Szokás még gyengén
korreláltnak mondani két változót, ha a korrelációjuk abszolút értéke kisebb, mint 0,3, és erősen korreláltnak mondani, ha
abszolút értéke 0,7-nél nagyobb.
Példa. Vegyük az alábbi két változót, melynek együttes eloszlását a következő táblázat tartalmazza:
X ↓ / Y→ 1 2 3 4 ∑
Számoljuk ki a két változó korrelációját! Ehhez a várható értékek és a szórások mellett még a szorzatuk várható
értéke is kell. Egyszerű számolással adódik, hogy E(X) = 1,4; E(Y) = 2,85; D(X) ≈ 0,49; D(Y) ≈ 1,01; végül E(XY) = 3,85.
Ezzel a korrelációjuk r ≈ –0,28. Azaz gyengén korrelált a két változó.
Ha X és Y két valószínűségi változó, melyek négyzeteinek létezik a várható értéke, akkor fennáll a következő
egyenlőtlenség:
Bizonyítása azon múlik, hogy bármely λ valós szám esetén (X – λY)2 ≥ 0, tehát
, amiből már azonnal adódik az állítás. Ebből viszont következik, hogy |r(X, Y) | ≤ 1.
Amennyiben a két változó korrelációja 1 vagy – 1, akkor szokás lineáris kapcsolatról beszélni, mivel ilyenkor egy
lineáris összefüggés áll fenn a két változó között. Előbb a fordítottját mutatjuk meg.
Ha Y = bX + a, ahol a és b valós számok, míg X és Y két valószínűségi változó, akkor r(X, Y) = +1, ha b > 0, és ha b < 0,
akkor –1. Ha b = 0, akkor nincs értelmezve a korreláció.
Igazolása elég egyszerű, hiszen ha felírjuk, hogy mi a korreláció ebben az esetben, akkor
Ha | r(X, Y) | = 1, akkor léteznek olyan b ≠ 0 és a valós számok, amelyekkel Y = bX + a. Vagyis az egyik változó a másik
lineáris függvénye.
Ez azonban mutatja a korreláció elégtelenségét is, mivel nemcsak lineáris, hanem más függvényszerű kapcsolat lehet a
két változó között, s mégsem lesz a korreláció a maximális függést jelentő ±1, ez is hiányosság, valamint az is, hogy nemcsak
a függetlenség esetén lesz 0. Mégis ezt a jellemzőt használjuk valószínűségi változók függőségének mérésére.
A kovariancia kiszámítására megadunk még két összefüggést, diszkrét és abszolút folytonos esetre.
Legyenek X1, X2, X3, …, Xn valószínűségi változók, és páronkénti kovarianciáit, illetve korrelációs együtthatóit egy-egy
szimmetrikus mátrixba rendezzük úgy, hogy de níció szerint az átlóban cii = D2(Xi), illetve rii = 1 értékeket írjuk, míg cij
= c(Xi, Xj) (természetesen (cij = cji)), valamint rij = r(Xi, Xj)(rij = rji). Jelölje a kovariancia- és
a korrelációs mátrixát az n változónak.
Vezessük be az X1, X2, X3, …, Xn valószínűségi változókhoz tartozó szórásmátrixot, S-et a következőképpen:
Emellett a következő két tételben fogalmazhatjuk meg ezeknek a mátrixoknak a legfontosabb tulajdonságait (a
fogalmakat lásd a 12. fejezetben).
Még egy további fogalom, amely a kétdimenziós esetben bevezetett fogalmak általánosításaként fogható fel.
Nem nehéz belátni, hogy a kovarianciamátrix determinánsa nem nagyobb az egyes szórásnégyzetek szorzatánál, azaz
. Másrészt igaz a C = SRS összefüggés miatt, hogy .
Tehát mivel , ezért |R| ≤ 1 mindig teljesül. Azaz a szóródási együttható is mindig 0 és 1 között lesz,
mivel nem negatív. Ha 0, akkor a valószínűségi változók lineárisan függőek, másrészt, ha 1, akkor és csak akkor a
valószínűségi változók korrelálatlanok. Azaz a szóródási együttható azt méri, hogy milyen erős a valószínűségi
változók lineáris függetlensége. Speciálisan ha az n = 2 esetben az r12 = r21 = r jelölést vezetjük be, akkor
Kétváltozós regresszió
Tegyük fel, hogy van két valószínűségi változónk, X és Y, s az Y értékét akarjuk valahogyan becsülni X értéke alapján. Mint
a statisztikai következtetéseket általában, ezt is megelőzi valamilyen elméleti megfontolás, melynek részeként valamilyen
függvénykapcsolatot feltételezünk a két mennyiség között. Azaz megpróbáljuk Y-t X valamilyen függvényeként tekinteni,
azaz Y ~ f(X)-ből indulunk ki. Az alapvető kérdés, hogy minek alapján írjunk fel egy ilyen függvényt. Ha csak az Y
változóval volna dolgunk, akkor leginkább a várható értékével becsülnénk. Mivel azonban X is rendelkezésünkre áll, ezért
célszerűnek tűnik az E(Y|X) feltételes várható értéket használni. (Lásd még a 26.4. fejezetben.)
Példák
1.
Legyen az együttes eloszlása a két diszkrét, független Poisson-eloszlású változónak:
. Ekkor az Y X-re vonatkoztatott regressziója, ha X = i:E(Y|X = i) = μ.
2. Másik példánk legyen egy folytonos eset: (X, Y) normális eloszlású vektorváltozó az alábbi együttes
Általában is a regressziót, mint függvényt, egy görbével ábrázolhatjuk. Függetlenül attól, hogy a két változó közötti
kapcsolat lineáris függvény-e, lehet, mint az analízisben a di erenciálszámításnál, valamilyen értelemben legjobban
illeszkedő lineáris kapcsolatot keresni a két változó között. Szokás ezt lineáris regressziónak is mondani. Ennek lényege,
hogy keressük azt az Y = bX + a alakú kapcsolatot, amelyre igaz, hogy E((Y – bX – a)2) várható érték minimális. Konkrét
alkalmazását adott adatok esetén megtalálja az olvasó a 27.5. fejezetben a Lineáris regresszió és korreláció cím alatt. Itt
most csak megjegyezzük, hogy megmutatható, hogy az a lineáris függvény, amely legjobban illeszkedik a két változóhoz, a
feljebb említett minimális várható érték értelemben a következő:
Azaz a keresett b meredekség és a konstans meghatározható a két változó várható értékeivel, szórásaival és korrelációs
. A főátlóban két l-es van, ez mindig a nyelő állapotot jellemzi, hiszen ott 1
valószínűséggel maradunk, és sehová nem lépünk, tehát minden más elem a sorban 0. Természetesen minden sor összege
0, hiszen 1 valószínűséggel lépünk valahová tovább (beleértve a helyben maradást is). Mivel a folyamatok nem érnek véget
egy lépésnél, érdekes kérdés, hogy miként írható fel a kétlépéses átmenetmátrix. Jelölje azt a valószínűséget, hogy a
rendszer az i-edik állapotból pontosan két lépésben a j-edikbe jut. Ezt a teljes valószínűség tételével (lásd a 26.3. fejezetben)
adhatjuk meg, nevezetesen , amiről felismerhetjük, hogy éppen az átmenetmátrixunk önmagával vett
szorzatának egy elemét kaptuk. Általában igaz, hogy ha a kétlépéses átmenetvalószínűséget egy mátrixba rendezzük, és
P(2)-vel jelöljük, akkor
P(2) = P2, ahol P jelöli az egylépéses átmenet-valószínűségek mátrixát, míg a bal oldalon álló P(2) a kétlépéses átmenetek
mátrixát.
Mivel a kezdeti állapot az A1, s a számunkra érdekes végállapot az A5, ezért arra vagyunk kíváncsiak, hogy vajon n
lépésben mekkora eséllyel jutunk el oda, ezt a P(n) mátrix második sorának utolsó eleme mutatja meg. Amennyiben n tart a
végtelenbe, akkor megkapjuk az A nyerésének a keresett valószínűségét. Ezt egy gra kus számológéppel eljátszva már
viszonylag kis n-ek esetén is (pl. n = 100 vagy 200) láthatóan stabilizálódik az érték, és 0,2 közelében lesz. Majd a
későbbiekben belátjuk, hogy az átmenetmátrix n-edik hatványa milyen feltételek mellett konvergál, s ez esetünkben
teljesül is.
Előbb azonban gondoljunk végig egy másik utat is, amelyik a végtelent ügyesen kizárja a játékból. Jelöljük pi-vel, hogy
az i-edik állapotból az A játékos nyer. Ekkor nyilván p0 = 0. A p1 meghatározása a kérdésünk. A következő egyenleteket
írhatjuk fel:
p1 = 0,5p2 + 0,5 · 0
p2 = 0,5p3 + 0,5p1
p3 = 0,5p4 + 0,5p2
p4 = 0,5p5 + 0,5p3
p5 = 1
innen az első egyenletből p2 = 2p1, a másodikból, ezt is felhasználva p3 = 3p1; a harmadikból p4 = 4p1, végül a negyedikből p5
= 5p1. Másrészt az ötödik egyenletből p5 = 1, tehát a keresett p1 értéke 1/5 (= 0,2). Tehát az A játékos 1/5 eséllyel nyer. Vegyük
észre, hogy a nevező éppen az összes pénzük, míg a számláló éppen A pénze. Bebizonyítható a következő tétel.
Egy kétszemélyes játékban, feltéve, hogy minden körben egyenlő eséllyel nyer a két játékos, és mindig egy egységnyit
tesznek fel, valamint az elsőnek T1, a másodiknak T2 a tőkéje (pénze), akkor az első játékos nyerési esélye ,
Megjegyzés. Mohó stratégiával más a helyzet, ha A mindig minden pénzét felteszi, akkor csak a következő állapotok
lehetnek (1; 4), (2; 3), (4; 1) és (5; 0). Ilyenkor 1/8 eséllyel nyer, mert háromszor egymás után nyernie kell, hiszen ha
csak egyszer veszt, akkor mindene elveszett, azaz vége a játéknak. Tehát 0,2 helyett ekkor csak 0,125 a nyerés esélye.
Ha van egy rendszer, amelynek A1, A2, …, An állapotai vannak, és tudjuk, hogy két A1-vel és Aj-vel jelölt állapot között
milyen valószínűséggel lehet átmenet – amely független a rendszer addigi történetétől –, amit pij-vel jelölünk, akkor
ezen átmenet-valószínűségeket egy mátrixba rendezhetjük, amelyet P-vel jelölünk, és átmenetmátrixnak hívjuk.
Tehát . Az ilyen rendszereket homogén Markov-láncoknak nevezzük.
Legyen továbbá az n lépéses átmeneteket jelölő valószínűségek mátrixa P(n), ahol értelemszerűen P(1) = P.
Ha egy mátrix elemei nem negatívak, és minden sor összege 1, akkor azt a mátrixot sztochasztikus mátrixnak
mondjuk. Ha még az oszlopok összegei is 1-et adnak, akkor duplán sztochasztikus mátrixról beszélünk.
Megjegyzés. Természetesen minden sztochasztikus mátrix tekinthető egy átmenetmátrixnak, azaz készíthető hozzá
egy rendszer, melynek állapotai közötti átmenet-valószínűségeket adják a sztochasztikus mátrix elemei.
Ha a kezdeti állapot is véletlenszerű, akkor azt egy valószínűségi vektorral adhatjuk meg, amely megmondja, hogy
milyen eséllyel tartózkodunk az egyes állapotokban. Ezt a vektort jelöljük p = p(0)-lal. Természetesen, ha biztosan tudjuk,
honnan indulunk, akkor a vektor egy koordinátája 1, a többi 0 lesz.
Ha a rendszer kezdeti állapotát a p = p(0) vektor adja meg, akkor egy lépés múlva az eloszlását a p(0)P vektor mint a p
vektor és a P mátrix szorzata adja meg.
Általában pedig n lépés után indukcióval belátható, hogy p(n) = p(0)pn lesz az egyes állapotokban tartózkodás
valószínűség-eloszlása. Így az első feladatunk úgy is megfogalmazható, hogy keressük, ha létezik a vektort. Ezt
tesszük a következő tétel megfogalmazásával. Előtte még egy de níció.
Egy Markov-láncot regulárisnak mondunk, ha átmenetmátrixának van olyan hatványa, ahol minden mátrixelem
pozitív. Legegyszerűbb eset, ha ez már magára az átmenetmátrixra is teljesül.
Ha P reguláris átmenetmátrix, akkor a Pn hatványok sorozata konvergál egy V mátrixhoz, melynek minden sora
ugyanaz a v vektor, melynek minden komponense pozitív. Ez a v vektor nem más, mint a P mátrix egyetlen
sajátvektora, azaz vP=v.
Ezt szokás a Markov-láncok határeloszlás-tételének is nevezni. Ebben az esetben azonban nincsenek nyelők, hiszen van
olyan hatvány, ahol mindenhonnan mindenhová nem 0 eséllyel lépünk. Kicsit összetettebb a kezdeti feladatunk, amikor
nyelő is van, tehát nem reguláris az átmenetmátrix. Ennek tárgyalása előtt azonban nézzünk egy példát.
Példa. Vegyük a következő háromállapotú rendszert, amelynek átmenetmátrixa reguláris, mert már maga P minden
eleme pozitív: . Megjegyezzük, hogy P duplán sztochasztikus mátrix, hiszen az oszlopok összege is
1.
amelyből kapjuk, hogy az egyetlen sajátvektor az vektor, tehát hosszú idő után bárhonnan is indulunk,
mind a három állapotban ugyanazzal az 1/3 valószínűséggel található a rendszer. A hosszú idő nem is olyan nagy,
már 20-30 lépés után közel vagyunk az 1/3-hoz.
Folytassuk most a nyelő állapotokat tartalmazó Markov-folyamatokkal, amilyen a bevezető példánk volt.
Egy Markov-lánc egy állapota elnyelő állapot, ha ebből lehetetlen átmenni egy másikba. Egy Markov-láncot elnyelő
láncnak nevezünk, ha
1. van legalább egy elnyelő állapota, és
2. bármely állapotból el lehet jutni valamely elnyelő állapotba (nem feltétlenül egy lépésben).
Azt, hogy a folyamat egy elnyelő állapotba jutott, úgy is fogalmazhatjuk, hogy a folyamat befejeződött.
azaz , ahol a* is egy mátrixot jelöl, de arra nincs szükségünk. Qn elemei adják meg, hogy az egyes nem
elnyelő állapotokból n lépés után milyen eséllyel leszünk egy másik nem elnyelő állapotban. A fenti tétel szerint (hogy az
elnyelő Markov-láncban a folyamat befejeződésének a valószínűsége 1) 1 valószínűséggel elnyelődünk, tehát Qn minden
eleme 0-hoz kell tartson, azaz Qn maga is 0-hoz tart. Ebből viszont következik, hogy az (I–Q)–1 inverzmátrix létezik, amelyet
A-val jelölünk, és az elnyelő lánc alapmátrixának nevezzük. Esetünkben ez az alapmátrix a következő:
Az A mátrix elemei megadják azoknak az eseteknek a várható számát, amelyekben a lánc az egyes nem elnyelő
állapotokból kiindulva a különböző nem elnyelő állapotokba jut. Továbbá ha e egy csupa l-esből álló oszlopvektort
jelöl, akkor az Aevektor komponensei megadják, hogy a lehetséges nem elnyelő állapotokból várhatóan hány lépés
után fejeződik be a folyamat.
A B = AR mátrix elemei megadják azokat a valószínűségeket, mellyel egy adott nem elnyelő állapotból egy adott elnyelő
állapotba jutunk a folyamat során.
Így megoldottuk ezen az úton is a bevezető feladatunkat, hiszen a B mátrix b32 eleme mutatja meg a keresett
valószínűséget, amire éppen 0,2 adódik, amit már megkaptunk más úton is.
Ezzel befejeztük bevezetőnket a Markov-láncok tanulmányozásába, és egyben végére értünk a valószínűség-számítás
fejezetnek is.
27. Matematikai statisztika
Ez a fejezet sokban kapcsolódik az előzőhöz, amit a középiskolai tantervek és az érettségi követelmények is mutatnak,
hiszen egy témakörnek tekintik a valószínűség-számítást és a statisztikát. A. Engel neves német múlt századi valószínűség-
elméleti szakember fogalmazott egyszer a következőképpen, ami elég tömören, aforisztikusan fejezi ki a lényeget: „A
valószínűség-számításban megadott valószínűségekből különböző módszerekkel újabb valószínűségeket számolunk ki. A
statisztika feladata ezeknek az adott valószínűségeknek a meghatározása.” Érdemes egy kiegészítést tenni – ezzel
kiterjesztve az Engel-idézet tartalmát – s ezt is a matematikai statisztika feladataként tekinteni. Mára a mindennapi élet, a
média, a marketing és társaik a statisztikának ezt a kiegészítő és kisebb matematikai igényű ágát, a leíró statisztikát
fejlesztették nagy ütemben. Ehhez a számítógépek térhódítása és hatalmas adatbázisok létrejötte is hozzájárult, illetve
lehetővé tette, hogy ilyenekkel is tudjunk dolgozni. A következőkben éppen ezzel a témával fogunk kezdeni, s csak a
második részben lesz szó az idézetben említett szigorúbb értelemben vett matematikai statisztikáról, melynek valóban egy
fő feladata ismeretlen valószínűségek, illetve paraméterek becslése, illetve a becslés jóságának a „mérése”.
Végül a statisztika szó különböző jelentéseit vegyük szemügyre. A szó maga a status (állam) szóból származik, ami arra
utal, hogy először az adatokat az állam gyűjtötte (a statisztikai hivatal ma is állami intézmény). Mára három értelemben is
használjuk a szót. Időjárási, gazdasági adatokat, amelyek valójában egyszerűen számok, szokás statisztikának mondani
vagy olykor statisztikai adatokról beszélni e számok kapcsán. A következőkben ilyenkor az adat szót fogjuk használni.
Másrészt ezekből az adatokból különböző módszerekkel jellemzőket készítenek, ezt is szokás statisztikának nevezni, ilyen
például egy munkakörben az átlag zetés, a hőmérsékleti adatok sokéves átlaga vagy az árak szóródása. Erre a statisztikai
jellemzők kifejezést fogjuk használni a következőkben. Harmadrészt statisztikán adatok elemzését, ezekből
következtetések levonását értjük (gyakran a bizonyosság hiánya miatt valószínűségi megfontolásokkal). Igazából ezt a
jelentést fogjuk a következőkben használni. Kicsit általánosabban fogalmazva a statisztika az a tudomány, amely az
adatgyűjtéssel, azok rendszerezésével és interpretációjával foglalkozik.
Fejezzük be ezt a bevezetőt H. G. Wells szavaival: „a statisztikai gondolkozás egy nap éppen olyan szükséges lesz egy
sikeres polgárnak, mint az írni és olvasni tudás.” Azt hiszem ez a nap elérkezett.
Ezt a csoportot a statisztika sokaságnak hívja. A sokaság elemei az egyedek. A sokaság elemszámát a statisztikai
sokaság méretének nevezzük.
Ha van egy szempont, egy adott tulajdonság, ami szerint egy sokaságot vizsgálunk, például Veszprém lakóit koruk vagy
nemük szerint szeretnénk osztályozni, akkor a kor vagy a nem lesznek az adott tulajdonságok.
A következőkben vizsgáljuk meg az ismérvek (s ennek megfelelően az adatok) fajtáit. Az ismérv lehet minősítéses,
amikor még ha számmal fejezzük is ki, de mégsem szám jellegű adatról van szó. Ilyen lehet például a nem, a hajszín, egy
városban a kerület megnevezése, ahol lakik valaki. Ezeknek még rendezése sincs, mert nincs közvetlen tartalma annak,
hogy az I. kerület „kisebb” lenne, mint a II. kerület, vagy sokkal kisebb, mint a XXII. kerület. Hasonlóan a nemet sem lehet
sorba rendezni, legalábbis a mai egyenjogú világban.
A nem számmal kifejezhető vagy számmal jelölt, de mégsem szám jellegű ismérveket, minősítéses ismérveknek
nevezzük.
Példák. Az említett nemek vagy „a X. kerületben lakik” ismérvek mellett például ilyen a hord-e kalapot, vagy a
milyen mosóport használ, jár-e moziba, színházba, melyik pártot támogatja stb. tulajdonságok mind minősítéses
ismérvek.
Példák. A tanulók testmagassága, kora, tv-nézéssel naponta eltöltött idő, a Duna budapesti vízállása, a reggel mért
hőmérséklet stb. mind méréses ismérvek.
Vannak speciális esetek, amikor egy minősítéses ismérv (akár számmal jellemzett, de nem számként használt)
lehetséges értékei (adatai) rendezhetőek. Például szállodák esetén a * beosztás, van **-os vagy ******-os szálloda. Ilyenkor a
csillagszám kifejez egy rangsort, a magasabb csillagszámú szálloda magasabb minőséget jelent és persze drágább is.
Hasonlóan van I., II. és III. osztályú áru. Itt hasonlóról van szó, ezek nem „számok” valójában, de egy rendezést azért
tartalmaznak.
Az olyan minősítéses ismérvet, amelynek adatai rendezhetők rendezhető minősítéses ismérvnek hívjuk.
Természetesen minden méréses ismérv egyben rendezhető is, mert a számoknak van egy megszokott rendezése, lásd a
számegyenest. Sok ismérv esetén azonban még rendezés sem képzelhető el. Pártpreferencia, hajszín, kedvenc zeneszerző
stb. A méréses ismérveknek létezik még egy osztályozása aszerint, hogy értékei egy véges vagy megszámlálhatóan végtelen
számhalmazból kerülnek ki, avagy bármilyen valós szám lehet.
Azokat a méréses ismérveket, amelyekhez tartozó adatok értékei egy legfeljebb megszámlálható számhalmaz elemei
közül kerülnek ki, diszkrét ismérveknek, illetve a hozzátartozó adatokat diszkrét adatsokaságnak mondjuk.
Ha az értékek nem megszámlálható halmazból kerülnek ki (valós vagy komplex számok halmaza), akkor folytonos
ismérvről (adatsokaságról) beszélünk.
Példák. Folytonos ismérv az idő, a tömeg, a távolság. Sok esetben azonban diszkrétként jelenik meg. Bár elvileg
mérhetnénk nagyon pontosan valakinek a testmagasságát, mégis csak centiméterben mért egész számokat adunk
meg, azaz diszkrét ismérvnek kell mondanunk a testmagasságot.
Megjegyzés. A mai zika álláspontja szerint nincs akármilyen kis tér és időelem, azaz minden kvantált. Így végül is
ez utóbbi megkülönböztetés értelmét veszti, valójában minden adat diszkrét, nincsenek folytonos mennyiségek.
Mégis az analízis hatalmas fejlődése és eredményei akkor használhatók fel, ha eltekintünk attól, hogy pontosan nem
így van a világban, de ez egy leíráshoz jól használható „nyelv”. Tehát valójában minden valóságos adat diszkrét,
hiszen csak elvileg képzelhető el végtelen pontos mérés.
Egy fontos kérdés, milyen módon juthatunk adatokhoz. Ennek különböző lehetőségei vannak. Kérdőív, interjú,
számítógépes megkérdezés, tényleges megmérés. Itt merül fel egy fontos kérdés, hogy ha idő, vagy pénz, vagy mindkettő
hiányában nem tudunk mindenkit megkérdezni, megmérni stb., akkor hogyan válasszuk ki azokat, akiket bevonunk a
vizsgálatba.
Mintavételnek nevezzük azt, amikor egy sokaságból valamilyen eljárással egy általában jóval kisebb terjedelmű
részhalmazt kiválasztunk. A részhalmazt nevezzük mintának. Tehát a minta mindig a sokaság részhalmaza.
Amennyiben a mintavétel során valamilyen véletlen eljárást használunk, aminek a lényegét később, de még ebben a
fejezetben tisztázzuk, akkor véletlen mintavételről beszélünk.
Példák. Legyen a sokaság a magyar háztartások összessége. Ekkor, ha valaki telefonkönyvből kiválaszt valahogyan
1500 nevet, s azokat felhívva érdeklődik a szabadidő-eltöltési szokásaikról, akkor ezek a családok lesznek a minta
elemei, a minta terjedelme pedig 1500. Nyilván ha véletlenül az egyik telefon egy olyan helyen csörög, ahol egy kínai
család bérel 1 hónapra egy lakást, akkor őket nem vesszük be, mivel a sokaság a magyar háztartások voltak, s így a
minta nem lenne részhalmaza ennek. Természetesen, ha a kínai család letelepedett már, s magyar állampolgárok,
akkor belekerülhetnek a mintába.
Egyszerű véletlen minta, amikor minden egyed ugyanolyan eséllyel kerül be a mintába. Szisztematikus minta, ha
például egy rendezett sokaság minden 100. elemét választjuk ki (minőség-ellenőrzés). Például az árukód alapján a
gyártott 00 végű elemek adják a minden 100. elemet.
Rétegzett minta, amikor a sokaságot rétegekbe soroljuk, mert úgy ítélik meg, hogy ezek befolyásolnak egy jelenséget, s
mindegyikből akarnak megfelelő számú reprezentánst, amelyet a rétegek terjedelme szab meg, s végül ezekből
választunk véletlenszerűen az arányok gyelembevételével.
Klaszterminta, amikor a sokaságot osztályokba, úgynevezett klaszterekbe osztják, s ezekből választanak.
Az adatsokaság rendszerezése többféle módon történhet. Például a különböző lehetséges adatok gyakoriságának
megadása.
Ezek után az adathalmaz egy rendezett reprezentációja, ha megadjuk egy táblázatban az egyes adatokat és mellettük az
előfordulásuk gyakoriságát.
A gyakorisági táblázat a lehetséges különböző adatokat és a hozzájuk tartozó gyakoriságokat tartalmazza. A táblázatot
gyakorisági eloszlásnak is nevezzük.
Példa. 100 megkérdezett egyetemista arra a kérdésre adott válaszának gyakorisági táblázata, hogy hányszor megy
bulizni havonta:
0 5
1 2
2 4
3 2
4 29
5 13
6 8
7 9
8 19
10 4
12 2
15 3
Már ebből is sok minden kiolvasható, például, hogy a leggyakoribb válasz a havi 4, ami kb. heti egy bulit jelent. De
elég nagy a heti kétszer bulizók száma is: 19.
Már az előbbi példánál is felmerülhet az adatok osztályozása, ráadásul nyilván pontos számot nehezen is tud mondani
a megkérdezett. Ilyenkor szokás már a kérdést is másként feltenni, vagy a válaszok alapján osztályokat képezni. Például az
előző példában azt lehet mondani, hogy soha, ritkán, hetente, hetente többször is, nagyon gyakran (legalább két-három
naponta).
Osztályközös gyakoriságnak mondjuk azt a táblázatot, amely az egyes osztályok – amelyekbe az adatokat soroltuk –
gyakoriságait tartalmazza.
Példa. Az előző táblázat sűrítéséről, tömörítéséről van most szó. Az első sor megmarad (soha), a második sor lesz a
ritkán, amibe az 1, 2, 3 adatai kerülnek, a hetente megmarad, utána a hetente többször is (5, 6, 7, 8) adatainak összege,
végül az utolsó három sor egyesítése a két-három naponta osztály.
Soha 5
Két-három naponta 9
Megjegyzés. Természetesen nincs előre általános és minden esetben használatos szabály az osztályok képzésére.
Egyfelől a gyakorlati probléma, amelyből az adatok származnak, indokolhatja az osztályozás módszerét, más
esetekre van egy-két szem előtt tartandó elv. Ha lehet, akkor egy nagyobb csomóban levő adatot ne vágjunk szét,
tehát ha lehet, az osztályhatárokat úgy válasszuk, hogy az egymás közelébe eső adatokat lehetőség szerint ritkán
vágjuk szét. Ez főleg folytonos adatok esetén fontos, és a számegyenesen való ábrázolással szemléltethető is.
A 27.1. ábrán egy „jól” osztályokra felbontott és egy „rosszul” felbontott adatsokaság látható. A felső adathalmaz
értelmesen bontott, az alsónál több helyen is összefüggőnek látszó darabot vágunk szét, ezért nem szerencsés.
27.1. ábra
A gyakoriságnál sokszor többet mond, hogy a gyakoriság az összes adathoz képest mekkora. Ez egy nagyon fontos
fogalom, amely igen sokszor szerepel (egyébként még a valószínűség-számításban is).
Egy adat (vagy osztály) relatív gyakorisága az adat (osztály) gyakorisága és az adatsokaság terjedelmének hányadosa.
Ha a gyakoriságot k-val, az adatok számát (terjedelmét) n-nel jelöljük, akkor a relatív gyakoriság a hányados lesz.
Szokás még ezt a számot gyakoriságsűrűségnek is nevezni.
Megjegyzés. A relatív gyakoriság természetesen egy 0 és 1 közé eső szám (hasonlóan a valószínűséghez). A relatív
gyakoriságot szokás még százalékban is megadni. Gyakran mondjuk, hogy az adat relatív gyakorisága 27%.
A bulizás esetén az osztályközös relatív gyakoriságok százalékosan könnyen megadhatók, hiszen lévén éppen 100
adat, az egyes értékek éppen a százalékos relatív gyakoriságok, tehát soha nem bulizik 5%, ritkán 8%, hetente egyszer
29%. Ha őket tekintjük mérsékelteknek, akkor együtt 42%-ot tesznek ki. Hetente esetleg kétszer, de azért nem
háromszor 49%, és végül a notórius bulizok a maradék 9%.
Azt a táblázatot, amely az adatok relatív gyakoriságait tartalmazza, relatív gyakorisági táblázatnak hívjuk.
Példa
Milyen gyakran bulizik havonta Osztályközös relatív gyakoriság
Soha 0,05
Ez egy mindennapi téma, ha egy újságot felnyitunk, akkor biztos találunk benne valamilyen gra kus ábrázolást egy
adatsokaságról, például a tőzsdeindex (BUX) változása (27.2. ábra) vagy a munkanélküliség %-os alakulása Európában és
hazánkban (27.3. ábra). Ezek közös lényege, hogy valamilyen adatsort vagy időbeli változást próbálnak látványosan,
mindenki számára informatívan bemutatni. Természetesen gyakran más hatást kelt, mint amit az adatokból ténylegesen
kiolvashatunk, ilyenkor beszélünk manipulációról, melynek különféle lehetőségeit a fejezet végén foglaljuk össze.
27.2. ábra
27.3. ábra
Oszlopdiagram
Hisztogram
Kördiagram
Sávdiagram
Vonaldiagram
Piktogram
Összetett gra konok
Lorenz-görbe és koncentráció
Gra kus manipulációk az egyes diagramfajták esetén
Oszlopdiagram
Ebben az ábrázolásban a gyakoriságokat az oszlopok magassága szemlélteti. Nézzük a következő példát! Egy országban a
közlekedési baleseteket okozóik kora szerint csoportosítva adták meg. Eszerint a következő táblázatot közölték:
A felelős kora 16–20 21–30 31–50 51–60 61–80 81–
Az ehhez tartozó oszlopdiagramot a 27.4a ábrán, hézagmentes ábrázolásban a 27.4b ábrán látjuk.
27.4. ábra
Hisztogram
Ez valójában egy speciális oszlopdiagram, ahol azonban az oszlopok nem egyenlően szélesek, és a gyakoriságsűrűséget
ábrázoljuk, azaz ilyenkor a téglalap területe a gyakorisága az adott osztálynak. Az előző példában a baleseteknél nem
egyforma az egyes korosztályok szélessége, így az oszlopdiagram helyett hisztogramot a következőképpen kapunk. Az első
oszlop szélessége öt évfolyamnyi, a másodiké tíz, a harmadiké húsz, aztán ismét tíz, majd kétszer húsz. Így az öt
évfolyamnyira normálva, a második oszlopot fele magasságúra, aztán negyed, majd ismét fél, s végül két negyed
következik. Ez adja a hisztogramot, ahol tehát az oszlopok területe adja a balesetek gyakoriságát, nem a magassága. Ezt a
területarányos ábrázolást mondjuk hisztogramnak (27.5. ábra).
27.5. ábra
Kördiagram
Ez a diagram alkalmas arra, hogy az egyes osztályok, csoportok gyakoriságának az egészhez való viszonyát szemléltessük.
Például ha 5 nagy cég felosztja a piacot, akkor hasznos látni, hogy az egyes cégek mekkora részt hasítanak ki maguknak. A
gyakoriságokat körcikkekkel ábrázoljuk, mégpedig úgy, hogy a 360 fokot osztjuk fel arányosan a gyakoriságokkal.
Példa. Legyen az öt nagy cég részesedése rendre 40%, 25%, 20%, 10% és 5%. Ekkor a legnagyobbhoz tartozó
középponti szög 144°, aztán a 25% (negyedrész) éppen 90°, a következő három pedig rendre 72°, 36° és 18° (27.6a ábra).
27.6. ábra
Megjegyzés. Nagyon gyakran nem kördiagramot, hanem annak térbeli „torta” vagy „sajt” változatát közlik az
újságok. Ez éppen azért, mert a megjelenítés nem szögtartó, a lényegét veszti el, nevezetesen, hogy szemléletesen
láthatók az egyes gyakoriságok egészhez való viszonyai. Az előbbi diagram ilyen „torzított változatban” látható a
27.6b ábrán. Ránézésre például a részesedés sorrendje szerinti második cég piaci része majdnem akkorának tűnik,
mint az elsőé, tehát eltorzult a viszonyuk. A harmadiké kb. fele akkorának tűnik, mint a másodiké, pedig csak 5%-kal
kevesebb.
Sávdiagram
Hasonlóan a kördiagramhoz, itt is az egészhez való viszonyt ábrázoljuk, de hogy ne kelljen szögekkel bajlódni, ezért egy
téglalapot osztunk fel „sávokra”, szeletekre. Az előző ábra sávdiagram-változatát mutatja a 27.7. ábra.
27.7. ábra
Ezen az ábrázoláson talán kicsit kevésbé látszik az egészhez való viszony, ez hátrány a kördiagrammal szemben, előny
azonban, hogy lineáris szakaszhosszakat kell csak összehasonlítani a bonyolultabb (és eszközigényes) szögmérés helyett.
Vonaldiagram
Ez a diagramfajta főleg időbeli változások ábrázolására alkalmas. Legnevezetesebb példák a lázgörbe (27.8. ábra), a
hőmérsékleti görbe egy adott napon vagy a születések száma egyes egymás utáni időtartamokban, például az egyes
években.
27.8. ábra
A személysérüléses közúti balesetek számát 1990-től 2004-ig a 27.9a ábra mutatja. Itt az egyéves időtartam alatt
bekövetkezett baleseteket ábrázoltuk. Ebben az esetben szerencsésebb az oszlopdiagram, mivel így úgy tűnhet, hogy a
közbülső pontokban, ahol a szakasz halad is, van értelme a függvényértéknek, ahogyan a láznál reggel 9 és 12 között is volt
testhőmérséklet, csak arra nincsen adatunk, s egy lineáris approximációval élünk, amikor a lázgörbét rajzoljuk. A
balesetek ábrázolásánál például az egyik adat az 1993-ban, a másik az 1994-ben történt balesetek száma. Így tehát a
vonaldiagram, bár eléggé elterjedt (nyilván a tendencia kifejezésére, hogy lássuk, nőtt vagy csökkent-e a balesetek száma és
milyen arányban az előző év(ek)hez képest), mégsem szerencsés ábrázolás és kerülendő is. Sosem szabad összekötni olyan
pontokat, amelyek nem időpillanatbeli, hanem időtartambeli adatokat jelölnek. Így a következő diagram ellenpéldának
tekinthető.
A megfelelő ábrázolást ugyanezekkel az adatokkal a 27.9b ábra mutatja.
27.9. ábra
Piktogram
Ez egy szemléletes ikonszerű ábrázolás, ahol általában amiről szó van, annak egy vizuális megjelenítése képezi az ábrázolás
alapegységét. Például, ha egy országban a háztartásokban nyilvántartott macskák számáról akarunk egy szemléletes
ábrázolást, akkor egy macska jelképezi a diagram egységét, például egy adott méretű macska jelent 100 000 valódi macskát.
Ebben az esetben, ha Magyarországon 207 000 macskát tartanak nyilván a háztartásokban, akkor ez 2 macskát és még vagy
hét darab kisebb macskát (tizedrésze a nagynak) jelent, vagy egy nagy macska egy részét vesszük a 7000 szemléltetésére. A
27.10. ábra néhány európai ország macskatartását illusztrálja (itt most kerekítéssel).
27.10. ábra
Az éves átlagos sörfogyasztás szemléltetése esetén például, ahol egy tele korsó jelent 10 liter sört, ha az átlag 156,9 liter,
akkor 15 darab tele korsót és egy kb. kétharmadig töltött korsót rajzolnak az adott ország neve mellé.
Kartogram
Radar- (pókháló-) vagy sugárdiagram
Kartogram
Ezt olyan szituációban használjuk, amikor valaminek a földrajzi eloszlása az érdekes. Például Magyarországon a
villamosenergia-fogyasztást regionális nagyvállalatok, a fogyasztás mértéke és típusa szerint akarjuk ábrázolni (27.11.
ábra), vagy például az európai unió kisebbségeit szeretnénk szemléltetni (27.12. ábra). A 27.11. ábrán a körök területe a
fogyasztott energia nagyságával arányos (pl. az ELMŰ a legnagyobb), míg a körcikkek a fogyasztás típusát szemléltetik.
Kartogramnak nevezünk egy olyan statisztikai diagramot, ahol az adatok földrajzi elhelyezkedését is szeretnénk
szemléltetni. Mindig szerepel valamilyen térkép az ábrán.
27.11. ábra
27.12. ábra
Radar- (pókháló-) vagy sugárdiagram
Ez a diagramfajta akkor használatos, amikor két, esetleg több adatsort szeretnénk összehasonlítani egyetlen diagramon, s
minden egyes komponens esetén érdekel az egymáshoz viszonyítás, pontosabban hogy van-e valamiféle arányosság vagy
párhuzamosság. Például két cég négy-öt különböző szegmensbeli összehasonlítása, pl. forgalom, nyereség, beruházás,
hitelállomány, foglalkoztatottak száma stb. A 27.13. ábra csupán szemlélteti ennek a diagramfajtának a megjelenését.
27.13. ábra
Lorenz-görbe és koncentráció
Sokszor fontos lehet egy eloszlás egyenletességének mérése. Egyes országok például összehasonlíthatók azzal, hogy a
jövedelmek mennyire egyenletesen oszlanak el az egyes szereplők között. Nagy eltérés van például a skandináv országok és
egyes dél-amerikai országok jövedelemeloszlása között. Egy másik példán láthatjuk, amit a következőkben majd be is
mutatunk, hogy a Föld népességének és energiafelhasználásának eloszlása mennyire egyenletes. Ezeket lehet a Lorenz-
görbével szemléltetni és számszerűen a Gini-féle együtthatóval kifejezni.
Vegyük a Föld kontinensei népességének és az energiafelhasználásuknak a viszonyát. Az ábrázoláshoz célszerű minden
egyes kontinensre meghatározni az egy főre eső energiafelhasználást, ezt sorba rendezni, s utána a következőképpen
meghatározott gra konon megadni. Az x tengelyen a kontinensek népességét a teljes Föld népessége százalékában
szemléltetjük, összegezve, tehát a legkisebb egy főre jutó energiafelhasználású kontinens ahányad része a teljes
népességnek, az lesz x1. A második kontinens (egy főre jutó energiafelhasználás szerint) népességének arányát hozzáadjuk
az elsőéhez (kumulált népesség), és ez adja x2-t (azaz a második kontinens népessége x2–x1 lesz). És így tovább, ezek lesznek
a diagram pontjainak első koordinátái. Az y tengelyen fogjuk mérni az egyes kontinensek teljes energiafelhasználását,
szintén a Föld teljes energiafelhasználásának százalékában, így ezen a tengelyen is 0 és 1 közötti értékek lesznek. Az első
kontinens teljes energiafelhasználásának az egész felhasználáshoz viszonyított aránya adja y1-et. Ismét kumulatív módon
járunk el, tehát y2 az első két kontinens összegzett energiafogyasztásának az egészhez viszonyított arányát jelzi. Így nyilván
az utolsó kontinens koordinátái (1; 1) lesznek, azaz általában az n-edik érték (1; 1) ponttal jelölődik ezt a módszert követve.
Ehhez általában némi számítást kell végezni, hiszen a „nyers” táblázat ezeket az adatokat nem tartalmazza, csupán az
egyes kontinensek adatait, amiből, mivel egy főre jutó felhasználás van, ki kell számolni az egyes kontinensek teljes
energiafelhasználását és annak százalékos arányait az egészhez. Emiatt kibővítettük két oszloppal és az utolsó sorral az
eredeti adatokat tartalmazó táblázatot.
Lakosok száma (millió fő), a Föld népességének Energiafelhasználás Teljes energia Százalékos
Kontinensek
százalékában (t**) (mt) arány
Ázsia, Ausztrália és
3260; 0,616 0,808 2634,08 0,2759
Óceánia
** Az energiafelhasználást egy tonna kőszén elégetésének energiatartalma szerint mérték, tehát fejenként hány tonna kőszenet égetnének
el.
Lorenz-görbének hívjuk a megadott eloszlás fentiekben leírt módon ábrázolt sorba rendezett pontjai által
meghatározott töröttvonalat.
A koncentráció mértékére létezik egy numerikus mérőszám is, amit a következőképpen adunk meg.
A Lorenz-terület nagyságát a maximális koncentrációs területhez képest (ami elméletileg legfeljebb 0,5 lehet) Gini-
együtthatónak nevezzük, azaz
Nagyon egyenlőtlen eloszlást jelentenek az 1-hez közeli értékek, és minél közelebb vagyunk a 0-hoz, annál
egyenletesebb az eloszlás. Jegyezzük meg, hogy az első tényező éppen az egyik mérték adatait jelöli, hiszen a kumulált
eloszlás különbségei éppen az egyes értékek. A második két egymás utáni kumulált érték összege.
Példa. Esetünkben az energiafelhasználást tekintve a következőt kapjuk: 0,64. Ez elég egyenlőtlen eloszlást jelent,
hiszen a 0-tól (egyenletes) nagyon messze esik. Általában 0,5 felett már nagyon egyenlőtlen az eloszlás.
27.15. ábra
A bal oldali ábrán az origó a helyén van, a jobb oldalin 30-nál indul az y tengely, és a lépték a kétszerese, látható, hogy
mennyire más vizuális kép adódik. Például a 4. oszlop az 5. oszlop háromszorosának tűnik, miközben csak 30%-kal több,
ami az első helyes ábrázoláson jól látható is.
A másik gyakori manipuláció az egységválasztás, ami az előző jobb oldali ábra hatását tovább fokozta. Ezzel egy
nyújtást végzünk az oszlopdiagramon vagy vonaldiagramon. A változások mértékét befolyásolja: felnagyítja vagy
kicsinyíti.
Példa. Nézzük például a Vonaldiagram cím alatti balesetes példát más-más léptékkel, mennyire más képet kapunk.
Kisebb léptékkel, alig látszik valami változás, enyhe csökkenés, kisebb hullámzással (27.16. ábra). Nagyobb léptékkel
egész jelentősnek tűnik az ingadozás mértéke (27.17. ábra).
27.16. ábra
27.17. ábra
Ha még az origót is eltoljuk, akkor végképp eltorzulnak az arányok, és hatalmas különbségeket sugall a gra kus
ábrázolás, szemben a valóságos viszonyokkal, például az első évben (1990-ben) több mint négyszer annyi balesetet
valószínűsítünk az ábra alapján, mint pl. a 11. évben (2000-ben), ami abszolút téves. Az ábrázolás elvileg lehetséges, de meg
kell nézni, hol az origó, és mi a lépték (27.18. ábra).
27.18. ábra
Egy másik, a sajtóban nagyon gyakran meg gyelhető torzítás a térbeliség imitálásával jön létre. A látványosság
kedvéért az oszlop- és kördiagramok helyett térbeli alakzatok, például hasábok és hengerek vannak. Általában
axonometrikus ábrázolásban (lásd 7.3. fejezet) jelennek meg a testek, melyeknek méretei jelölnék az adatokat (magasság,
illetve a kördiagramnál szög). Az a fő probléma, hogy az axonometriánál sem az egyes irányok méretaránya, sem a szög
nem invariáns (állandó), így az első benyomásunk ezekről nagyon eltérő lehet a korrekt téglalap, illetve kördiagramos
ábrázoláshoz képest. Teljesen megfordulhatnak az ábrán látottak. Nem egyszerűen csak az arányok, hanem akár meg is
fordulhatnak a viszonyok, tehát kisebbnek látszó szög valójában nagyobb, mint a nagyobbnak látszó. Nézzünk két példát
ezekre, a környezetszennyező anyagok kibocsátását, illetve a magyarországi erőművek nettó hatásfokának alakulását
(27.19. és 27.20. ábra).
A 27.19. ábráról igen nehéz leolvasni bármit is, a térbeliség zavaró hatását fokozza, hogy három különböző hasábsort
látunk egymás mögött, más-más árnyalatban, és a por hasábsorának takarása miatt az első öt évben nem lehet látni a
nitrogén-oxid-kibocsátás alakulását.
27.19. ábra
A 27.20. ábrán az oszlopdiagram el van forgatva 90 fokkal, ami nehezíti a diagram olvasását, emellett a függőleges
segédvonalak csak zavarnak, hiszen a tényleges összehasonlításhoz az oszlopok jobb végének ferde vonalát kell
levetíteni az alapsíkra, s ott lehet az értékeket megbecsülni.
27.20. ábra
Minden adathalmaz esetén létezik a módusz, ami a sokaság leggyakoribb értéke. Amennyiben több ilyen adat is van,
akkor többmóduszú sokaságról beszélünk.
Példa. Hajszín tekintetében a svédek körében valószínűleg a szőke a módusz, míg az olaszoknál a fekete. Itt jegyezzük
meg, hogy az ilyen kijelentések, mint hogy a svédek szőkék, statisztikailag akkor mondható megalapozottnak, ha a
módusza az adott tulajdonságnak a sokaságban éppen a mondott adat.
Méréses adatoknál is van természetesen módusz, a leggyakoribb lábméret vagy a leggyakoribb ruhaméret stb. Ha az
adathalmaz rendezhető (rendezhető minősítéses), akkor az egyes adatokat sorba rendezhetjük nagyság szerint. Ebből is
adódik egy jellemző „középérték”, a medián.
Ha egy rendezhető minősítéses adathalmazt sorba rendezünk, akkor a középső adatot (amennyiben létezik)
mediánnak nevezzük. Ha nincs középső, akkor szétvágjuk két egyenlő terjedelmű részre (ilyenkor mindig páros a
méret, páratlannál van középső), és a „vágás” mellett álló két szám átlaga a medián. Jelölése Me.
Példák
1. A magyar szállodalánc jellemzése csillagszám szerinti. Ekkor a medián a minőség szerint sorba rakott szállodák
közül a középső csillagértéke.
2. Amikor diákok sorba állnak testnevelés órán, vagy katonák egy díszszemlén, akkor általában szintén nagyság
szerint állnak. Ilyenkor könnyen leolvasható az osztály vagy a katonai egység testmagasságainak mediánja,
hiszen az a középen álló (állók átlaga) testmagassága.
A legelterjedtebb középérték, mint jellemző, a számtani közép vagy egyszerűen csak „átlag”. Ez természetesen csak
méréses ismérvek esetén értelmezhető.
Adatok átlaga vagy számtani közepe, méréses adatok esetén az adatok számtani közepe, azaz ,
illetve ha az egyes adatok többször fordulnak elő, akkor
Példa: egy busz átlagsebessége ugyanazon az úton két irányban más sebességgel haladás esetén. Ha az egyik irányban
az átlagsebessége v1, ugyanezen az úton visszafelé v2, akkor a teljes útra vett átlagsebessége:
, azaz a harmonikus közepe a két sebességnek.
Példa: átlagkamat a bankban vagy átlaghozam, átlagin áció stb. Legyen három egymás utáni évben rendre 5, 9 és
12% az éves in áció. Mennyit romlott a pénz értéke évente átlagosan? Ugyanazon áru értéke a három év alatt 1,05 ·
1,09 · 1,12-szeresére változott. Az átlagos éves in áció azt jelenti, hogy minden évben ennyi lett volna a pénzromlás,
akkor most ugyanott tartanánk, mint a megadott három in áció hatására. Tehát ha az átlagos in áció p, akkor igaz
lesz, hogy p3 = 1,05 · 1,09 · 1,12, azaz a három érték mértani közepe. A fenti számokkal
egyébként 8 adódik, míg ha gondolkodás nélkül a helytelen számtani közepet használnánk, akkor 8,67% átlagos
in áció adódna.
Példa: molekuláris zika, a molekulák átlagsebessége adja meg a hőmérsékletet, mivel a hőmérséklet a belső
energiával kapcsolatos, az pedig az egyes részecskék mozgási energiájából adódik, ami, mint tudjuk: .
Példa. Egy kis cégnél van 10 minimálbéren bejelentett dolgozó 65 000 Ft havi bérrel, 2 alkalmazott 100 000 Ft-os
zetéssel, míg a vezetőt havi 450 000, a könyvelőt pedig 300 000 Ft-tal alkalmazzák. Az átlag zetés 155 000 Ft a fenti
eloszlás esetén, míg a medián és egyben a módusz is 65 000 Ft. A 155 000 Ft a két magas vezetői zetés miatt jött ki.
Hogyan változnak a jellemző középértékek, ha adathalmazokat egyesítünk? Ebben a tekintetben az átlag az egyetlen
középérték, amelyre valamit mondani lehet. A módusz és a medián megjósolhatatlanul, a számtani közép viszont szépen
viselkedik.
Ha az egyik sokaság terjedelme n, és az átlaga x̄, míg a másiké m és ӯ, akkor az egyesített halmaz átlaga:
(27.1)
Ebből az is következik, hogy az egyesített átlag mindenképpen a két rész átlaga közé kell hogy essen, ami sem a
mediánra, sem a móduszra nem igaz. A számított középértékekre lesz csak hasonló igaz, tehát akármilyen közepet veszünk
a fent de niáltak közül, az egyesített halmaz középértéke a két rész középértéke közé esik.
Példa a módusz „rossz viselkedésére”. Legyen A = {1, 1, 1, 4, 4}; illetve B = {2, 2, 2, 4, 4}. Ekkor A módusza 1, B módusza
2. Az egyesített adathalmazé viszont 4 (hiszen ebből 4 lesz, míg 1-ből és 2-ből csak három-három darab lesz), ami nem
esik 1 és 2 közé! Még extrémebb példa: C = {1, 1, 1, 3, 3, 23, 23}, illetve {2, 2, 2, 4, 6, 23, 23}, itt is az első módusza az 1, a
másodiké a 2, míg az egyesítetté a 23. Tehát nagyon eltérhet, a két ismert módusz semmilyen kapcsolatban nincs
vele.
Példa a medián „rossz viselkedésére”. Legyen D = {2, 4, 5, 23, 25}, és E = {6, 7, 7, 40, 41}. Ekkor a mediánok 5 és 7, míg az
egyesített adathalmazé szintén 7:F = {2, 4, 5, 6, 7, 7, 23, 25, 40, 41}.
Speciális esetben, ha mindkét rész átlaga ugyanannyi, akkor az egyesített halmaz átlaga is. Ez azért igaz lesz a
móduszra is, hiszen ha ugyanaz az érték a leggyakoribb mindkét részben, akkor az egyesített halmazban is. A medián is
hasonlóan viselkedik, tehát ezekkel akkor van baj, ha különböző értéket vesznek fel a két részhalmazban, mert akkor nem
tudunk semmit az egyesítésről.
Kvantilisek és kvartilisek
Szokásos még az adathalmazt nemcsak megfelezni a mediánnal, hanem például a felet tovább felezni. Ebből adódik az alsó
és a felső kvartilis fogalma.
A medián alatti elemek mediánját nevezzük alsó kvartilisnek (magyarul alsó negyedelő, hiszen a fél fele a negyed).
Szokásos jelölése Q1. A medián feletti elemek mediánját pedig felső kvartilisnek (felső negyedelő), jelölése Q3. Ezzel a
jelöléssel a mediánnak a Q2 felel meg, azaz Me = Q2.
Példa. Legyen a következő adathalmaz egy osztály tanulóinak magasságai cm-ben már sorba rendezve: 160; 161; 161;
162; 162; 164; 167; 170; 170; 171; 172; 173; 174; 174; 175; 175; 176; 176; 176; 178; 179; 180; 182; 184; 190. A létszám láthatóan 25
fő. Ekkor a 13. tanuló a középső, azaz a medián 174, az alsó kvartilis a 7. tanuló 167, míg a felső kvartilis a 19. tanuló,
aki 176 cm magas. Mivel 25 egy 4k + 1 alakú szám, itt mind a kvartilisek, mind a medián könnyen adódik. Ha csak 24-
en vannak, az egyszerűség kedvéért a legnagyobbat kivesszük az osztályból, akkor a medián a 12. és 13. között lenne,
így ezek átlaga 173,5. Az alsó kvartilis az első 12 tanuló felénél, azaz a 6. és 7. között lenne, tehát 164 és 167 átlaga: 165,5;
míg a felső kvartilis a 18. és 19. között lenne: mivel mindkettő 176, ezért átlaguk is 176.
Általában a p-edik kvantilis jelentése, hogy az adathalmazt úgy bontjuk fel két részre, hogy a rendezett minta alsó p-
edrésze legyen alatta, s a felső (1 – p)-edrész felette. Ekkor, ha p = ½, akkor éppen a mediánt kapjuk, ami tehát 0,5-
kvantilis, míg ha p = ¼, akkor az alsó, és ha p = ¾, akkor a felső kvartilist kapjuk.
Ezek után megemlítünk egy érdekes ábrázolási módot, az ún. sodrófadiagramot (az angolszász irodalomban „box-plot”
néven szerepel).
Rajzolunk egy téglalapot, amelynek két széle az alsó és a felső kvartilis. Ebben a téglalapban egy függőleges osztóvonal
a medián. Két irányban, mint egy-egy antenna, jelezzük a legkisebb és a legnagyobb adatot, amit még nem tekintünk
kiugrónak (outlier, extrém). Az így kapott diagramot sodrófadiagramnak (box-plot) mondjuk.
Szokás a kiugró adat meghatározása is, ennek egy lehetséges módja a következő.
Ha egy adat nagyon eltér a többitől, azaz például a szórás legalább 3-4-szeresével tér el az átlagtól, akkor kiugró
adatnak nevezzük. Ezeket általában valamilyen külön jellel jelölik a sodrófadiagram esetén.
A legtöbb gra kus kalkulátoron található ilyen funkció, statisztikai üzemmódban megrajzolja ezt a diagramot, ha az
adatokat bevittük (egyébként több lista esetén is lehet, s összehasonlíthatók is a diagramok). Nagyon jól használható
hasonló típusú adathalmazok szemléletes összehasonlítására.
Példa. Legyen adathalmazunk a már említett sörfogyasztás, lásd a 27.2. fejezetben Piktogram cím alatt.
Csehország 156,9
Írország 131,1
Németország 115,8
Ausztrália 109,9
Ausztria 108,3
Nagy-Britannia 99,0
Belgium 93,0
Dánia 89,9
Finnország 85,0
Luxemburg 84,4
Szlovákia 84,1
Spanyolország 83,8
USA 81,6
Horvátország 81,2
Hollandia 79,0
Új-Zéland 77,0
Magyarország 75,3
Lengyelország 69,1
Kanada 68,3
Portugália 59,6
Itt Csehország már kb. 3-szoros szórással tér el az átlagtól, tehát kiugrónak mondható. Így a sodrófa felső
antennája a második helyezett Írországnál van, az alsó Portugália, amelyik viszont egyáltalán nem kiugró adat lefelé.
Aszimmetria vagy ferdeségi mutató
Annak mérésére, hogy egy eloszlás mennyire aszimmetrikus, többféle mutató is létezik. Egy ilyen, a ferdeséget jellemző
mérték, amely kevésbé érzékeny a kiugró adatokra, a sodrófadiagramban is szereplő kvartilisek és a medián
elhelyezkedéséből határozható meg.
Rendezett ferdeségen értjük a következőképpen de niált mérőszámot: . Ez akkor mutat balra ferde
eloszlást, ha 1-nél kisebb, szimmetrikus, ha 1, és jobbra ferde, ha 1-nél nagyobb.
Ezt a mértéket a kiugró adatok semmilyen módon nem befolyásolják, az adatok középső 50%-ának elhelyezkedése
határozza meg.
Példa. Legyen egy kis adathalmaz hét, egymás utáni év júliusi átlaghőmérséklete: 27,2; 24,5; 28,1; 29,2; 26,1; 28,8; 29,7.
Ekkor a medián a 4., azaz 28,1. Az alsó kvartilis a 2. és 3. átlaga 26,65; míg a felső az 5. és 6. átlaga 29. Ekkor az rF
mutató értéke 0,9/1,45 = 0,62 < 1, tehát ez balra ferde eloszlást mutat.
A jellemző középértékek „jóságát”, tehát hogy mennyire jól jellemzik a teljes adathalmazt, azzal mérhetjük, hogy
valamilyen szóródási mértéket is de niálunk, amivel azt mérjük, hogy a középértéktől mennyire térnek el általában az
adatok. Különböző lehetőségek adódnak erre is. A legegyszerűbb a terjedelem.
Természetesen méréses adatok esetén értelmes csak. Fontos megjegyzés, hogy nem keverendő a minta méretével (az
adatok száma), amit néha szintén terjedelemnek mondanak. Még további két szóródási mértéket adunk meg.
Egy adathalmaz egy adott a számtól való átlagos négyzetes eltérését a következőképpen de niáljuk:
. Amennyiben az a szám éppen az átlag, tehát a = x̄ esetén az átlagos négyzetes eltérés neve
empirikus szórás vagy tapasztalati szórás. Jele általában: sn vagy σn, ahol az index az adatok számára utal. A
tapasztalati szórás négyzete a tapasztalati szórásnégyzet.
A legtöbb zsebszámológépen ma már van statisztikai üzemmód, amellyel az átlag mellett a szórást is egy
gombnyomással számíttathatjuk, ha bevittük az adatokat. A gépen is az említett két jel valamelyike mutatja meg a
megfelelő gombot.
Egy adathalmaz egy adott a számtól való átlagos abszolút eltérését az alábbi formulával de niáljuk:
Két tételt is megemlítünk, melyek bizonyítását az olvasó a de níciók felhasználásával és az abszolút érték, valamint a
másodfokú függvény tulajdonságaiból könnyen levezethet.
Egy adott adathalmaz esetén az N(a) függvény minimumhelye éppen a = x̄. Hasonlóan az A(a) függvény minimuma
éppen az adathalmaz mediánja.
Ebből adódik, hogy ha párosítani akarjuk egy méréses adathalmaz esetén a jellemző középértékeket a szóródási
mértékekkel, akkor az átlaghoz szórás, a mediánhoz a mediántól vett átlagos abszolút eltérés passzol. Mivel a szórás
számítása nagyon elterjedt, egy fontos összefüggést mutatunk, amivel sokszor könnyebben lehet számolni.
Ha elvégezzük a gyökjel alatt a négyzetre emeléseket és az összeadást, akkor
(27.2)
A korábban bevezetett jelöléssel azt is mondhatjuk, hogy az adatok négyzetes közepének négyzete az átlag négyzetének
és a szórásnégyzetnek az összege.
Szóródási mértékek alakulása, az adathalmazok egyesítése esetén a középértékeknél is nehezebb eset. A terjedelemre
nincs szabály, a szórásra van, de nem egyszerű, a mediántól vett átlagos abszolút eltérésre szintén nincs, hiszen már a
mediánra sem volt.
Az egyetlen tétel a következő.
Ha két n, illetve m terjedelmű adathalmazunk van, amelyeknek az átlagai x̄ és ӯ szórásai rendre: σx, σy, akkor az
Ebből rögtön látszik, hogy az egyesített adathalmaz szórása nem feltétlenül esik a két szórás közé, lehet mindkettőnél
nagyobb is. Nyilván, ha elég messze vannak az átlagok egymástól, akkor az egyesített adathalmaznál még inkább így lesz a
formula szerint is.
Példa. Legyen X = {4; 5; 5; 6} és Y = {9; 11; 12; 16}, x̄ = 5; ӯ = 12, . Ezek felhasználásával az egyesített
adathalmaz átlaga (amelynek négyzete a második kivonandó): 8,5, és így a keresett szórásnégyzet: ,
ami mindkettőnél nagyobb. Ha a hozzáadandó 0, akkor lesz az egyesített szórásnégyzet a legkisebb, s ekkor a kettő
közé esik, hiszen súlyozott közepe lesz a két kiinduló szórásnégyzetnek. Erre példa az X = {1; 3; 8} és az Y = {3; 4; 5}.
Fontos észrevétel, hogy a szórást ahhoz viszonyítsuk, mekkora adatokról van szó. Két adathalmaz esetén az
összehasonlításnál nagyon lényeges, hogy nem az abszolút szórásokat kell alapul vennünk.
Példa. Vegyük a következő két tíz-tíz elemű adathalmazt: A = {1,2; 1,4; 1,1; 1,6; 0,9; 1,2; 1,6; 1,3; 1,2; 1,9}, illetve B = {940;
1351; 1023; 987; 1213; 1534; 897; 1123; 1265; 1034}. Mindkettő esetén számoljuk ki a szórást, az első esetben σA = 0,28, míg
az átlag x̄A = 1,34. A második esetben σB = 191,9, míg az átlag x̄A = 1136,7. Ha csak az abszolút szórást néznénk, akkor a
második adathalmazé majdnem négy nagyságrenddel nagyobb. Ám ott jóval nagyobb számokról is van szó. A szórást
éppen ezért célszerű az átlaghoz viszonyítva is megadni.
Példánkban az A adathalmaz esetén a relatív szórás kerekítve 0,21, míg a második B esetén még felfelé kerekítve is csak
0,17. Azaz a második halmaz adatai relatíve kevésbé szórnak, mint az elsőé. Hasonló igaz mérési eredmények esetén a
hibákra is. A relatív hiba értékelhetőbb számot ad az összehasonlításokhoz.
Megjegyzés. Más szóródási mérőszámok is léteznek. Egy ilyen a Gini-féle együttható, amelynek kiszámításához az
ismérv értékeinek egymáshoz viszonyított különbségeit használjuk. Képletszerűen:
Ez tehát minden adat minden másiktól való eltérésének átlagát mutatja. Előző példánkra alkalmazva GA = 0,152
(kevesebb, mint a szórás), illetve GB = 105,7 (itt arányaiban még kevesebb, mint a szórás). Módosítható, ha a 0-kat
kivesszük, s így n(n – 1)-gyel osztunk. Lehet eltérésnégyzet-összegekkel és végül gyökvonással is dolgozni, ahogyan az
empirikus szórásnál járunk el. Ezt azonban már az olvasóra bízzuk. Nem szokásos a használata.
Látható, hogy itt az átlagtól való nagy eltérések jelentőségét a harmadik hatvány megnöveli, viszont a szórás köbével
való osztás éppen ezt kompenzálandó került a formulába.
Példa. Legyen ismét adathalmazunk az egymás utáni évek júliusi átlaghőmérséklete: 27,2; 24,5; 28,1; 29,2; 26,1; 28,8;
29,7. Átlaguk: 27,66; míg Fe = –3,1/6,39 = –0,485, azaz az eloszlás balra ferde. Emlékeztetünk, hogy ugyanezt kaptuk a
rendezett ferdeség alkalmazásakor is.
27.4. Idősorok
Nagyon gyakran jön elő statisztikai elemzések során az időbeliség, hogyan változik valami az idő múlásával, múltbeli
ismeretekből hogyan lehet jövőbeni következtetéseket tenni, trendeket felismerni.
Idősornak hívjuk valamely jelenségnek egymástól általában egyenlő távol levő időpontokban vagy időtartamokban
mért értékeit. Szokás ezt indexeléssel jelezni, azaz Xt jelöli az idősor egyes adatait, ahol t = 1, 2, …, n, nyilván n jelöli az
idősor „hosszát”.
Állapotidősornak mondjuk, ha adott időpillanatokban rögzítünk egy ismérvértéket. Egy üzletláncban például az
egyes árukészletnagyságok, minden este záráskor.
Tartamidősor egy adott időtartamban bekövetkezett események adataiból áll. Például hány gyermek született 1998-
ban, 1999-ben stb.
Dátum Hőmérséklet
1. 13,7
2. 12,9
3. 12,5
4. 12
5. 13,5
6. 12,8
7. 12,7
8. 10,8
9. 10
10. 8,2
11. 5,8
12. 6,2
13. 7,4
14. 7,4
15. 6
16. 4,2
17. 5,6
18. 1,5
19. 2,2
20. 6,6
21. 6,3
22. 0,6
23. -0,4
Dátum Hőmérséklet
24. 0,7
25. 0,8
26. 0,3
27. 0,8
28. 0,1
29. 2,6
30. 5,7
Megjegyezzük, hogy az eloszlás is változik, míg a vendégéjszakák száma folyamatosan növekedett, addig az egyes
kategóriák nem, a kétcsillagos például folyamatosan csökkent, a teljes növekedést csak a négycsillagos kategória
mutatta, tehát a szerkezet is átalakult, növekedik a minőségi turizmus.
Feladatunk ezen idősorok elemzésének alapeszközeit bemutatni. Ezek a dinamikus viszonyszámok, a gra kus
ábrázolások és az átlagok, melyeket most sorra veszünk.
Dinamikus viszonyszámok
Idősorok gra kus ábrázolása
Idősorok elemzése átlagokkal
Szezonális változások számítása
Dinamikus viszonyszámok
Kettőnél több adatból álló idősor esetén két dinamikus viszonyszámot de niálhatunk a bázis- és a láncviszonyszámot.
Bázisviszonyszám az idősor egyes adatainak a bázisul választott kezdő időszak (időpont) adatához viszonyított arányát
fejezi ki. Formulával: , ahol gyakran b = 1, de természetesen bármely más elemhez is viszonyíthatunk, mint
bázishoz, nemcsak az idősor első eleméhez.
Láncviszonyszámok az idősor egyes adatainak az azokat közvetlenül megelőzőhöz viszonyított arányát fejezi ki,
jelölése .
Ha valaki ismeri vagy a láncviszonyszámokat, vagy a bázisviszonyszámokat, akkor a másikat könnyen kiszámolhatja
anélkül, hogy az idősor adatait ismerné.
A következő összefüggések könnyen láthatók, ha a bázisnak választott elem az idősor első tagja: , illetve
fordítva .
Példaként vegyük a keresetek alakulását 1990-től, amit bázisévnek veszünk. A bal oldali táblázat minden adatot
ehhez viszonyít, míg a jobb oldali táblázat az előző évhez, tehát a bal oldali táblázat bázisviszonyszámokat, a jobb
oldali pedig láncviszonyszámokat tartalmaz. Ellenőrizhetjük az összefüggést is.
Idősorok gra kus ábrázolása
Általában vonaldiagrammal történik, ahol a töröttvonal az (i, Xi) pontokra illeszkedik egy szokásos derékszögű Descartes-
féle koordináta-rendszerben. Ilyet is láttunk már a vonaldiagramok bemutatásánál. Erről leolvashatók tendenciák,
trendek, csak vigyázni kell a gra kus manipulációkkal. A vendégéjszakás példánkat vegyük újra, ezúttal gra kusan a
táblázat helyett (27.21. ábra). Az első adatsor az összes, majd a 2. az öt-, a 3. a négy- és így tovább, a 6. az egycsillagos
hotelekben töltött vendégéjszakák száma szintén ezerben.
27.21. ábra
A korábban mondottak leolvashatók az ábráról. Nevezetesen, hogy nem párhuzamosan változik az egyes
szállodatípusok vendégéjszakáinak száma, de az összegük végig nő.
módon, amikor a két időszak adatának hányadosát vesszük. Formálisan dt = Xt – Xt–1 az abszolút és a relatív
változás.
A fejlődés átlagos üteme, amit szokás l̄-sal jelölni és következőképpen de niálni: . Mivel ,
ezért kifejezhető alakban is.
27.22. ábra
Ebben az esetben trendeket az azonos szezonra vonatkozó adatokkal érdemes készíteni, tehát lehet például egyenest
illeszteni az első, a második, a harmadik és végül a negyedik negyedéves adatokra (27.23. ábra).
Ezekre azután (persze jobb lenne nagyobb adathalmazt vizsgálni) meg lehet próbálni egyenest illeszteni vagy egyéb
függvényt. A módszer lényege, hogy valamiféle periodikusság észrevételével az egyes hasonló periódusokat külön kezeljük.
Ez a módszer lényege, amivel most többet nem kívánunk foglalkozni.
27.23. ábra
A kontingenciaanalízis elemei
Lineáris regresszió és korreláció
Egyéb nem lineáris regressziófajták
Exponenciális és logaritmikus regresszió számítás
A kontingenciaanalízis elemei
Vizsgáljuk 120 felnőtt, köztük 54 fér és 66 nő kozmetikai kiadásainak alapján a nem és a kozmetikai kiadások kapcsolatát.
Az adatokat az alábbi táblázat tartalmazza:
Fér 20 28 6
Nő 7 38 21
Az ilyen többmezős táblázat esetén egy plusz sort és oszlopot fogunk hozzáfűzni, amely a sorban, illetve az oszlopban
levő számok összegét mutatja majd. Esetünkben a kibővített táblázat a következőképpen néz ki:
Fér 20 28 6 54
Nő 7 38 21 66
Oszlopösszeg 27 66 27 120
Itt az oszlopösszegek eloszlása mutatja, hogy összesen (fér ak és nők együtt) hányan költenek 2500 Ft alatt, 2500 és
5000 Ft között, illetve 5000 felett havonta. A sorösszegek azt mutatják, hogy mennyi a fér ak és a nők száma a
megkérdezettek között.
Mind az ún. peremsor és oszlop kifejezhető százalékosan is, gyelembe véve a 120-as számot, mint a minta terjedelmét.
Ekkor az oszlopösszegekből rendre 22,5 – 55,0 – 22,5%, míg a sorösszegekből 45, illetve 55% lesz.
Ha függetlennek feltételeznénk a nemet és a kozmetikai kiadásokat egymástól, akkor a táblázat belső mezőiben a
peremeloszlások szorzata jelenne meg (lásd a 26.2. fejezetet). Azaz 0,225 és 0,45 szorzata 0,101, ami 120-nak kb. 10%-a, tehát
12. Így rendre a következő egészre kerekített számoknak kellene állnia a táblázatban:
12 30 12
15 36 15
természetesen N a táblázatban szereplő elemek összege (az összes vizsgált egyed: , míg a Vij szám a
függetlenség feltételezése esetén várhatóan ott álló számot jelöli, amit úgy kapunk meg, hogy a peremeloszlásokat
Könnyen látható, hogy χ2 = 0 csak akkor lép fel, ha minden különbség 0, azaz független egymástól a vizsgált két dolog
(jelen esetben a nem és a kozmetikai érdeklődés). χ2-nek van azonban egy hátrányos tulajdonsága, hogy a függőséget
viszont nem jól méri, mivel végtelen naggyá is válhat. Ezért „normálni” próbáljuk, mint korábban a valószínűséget is, s ezt
a célt szolgálja a kontingenciaegyüttható.
Kontingenciaegyütthatónak nevezzük a következő mértéket: , mivel Pearson vezette be, ezért szokás
Pearson-féle kontingenciaegyütthatónak is nevezni.
Látható, hogy ez már legfeljebb 1-hez tart, ha χ2 tart a végtelenhez, azaz teljesül: 0 ≤ K ≤ 1. Még egy korrekcióval azt is el
lehet érni, hogy az 1-et felvegye, ehhez képezzük a korrigált kontingenciaegyütthatót.
kozmetikára költött pénz mint változók. Egyébként ettől alig tér el a korrigált együttható, , ami
szintén elég kicsi érték.
Vannak más lehetőségek is, ilyen például a Spearman-féle rangkorreláció, amelyet szintén lehet minősítéses
ismérveknél használni, vagy a Cramer-féle együttható, amit C-vel szokás jelölni.
ahol χ2 a korábbiakban de niált, N és k ismét az összes adatok számát, illetve k = min{n; m}, azaz a sorok oszlopok
száma közül a kisebbiket jelölik.
Előnye, hogy mindenféle korrekció nélkül igaz, hogy 0 ≤ C ≤ 1, és természetesen, ha függetlenek, akkor 0, hiszen ekkor
χ2 = 0.
Szokás még, mivel a kétszer kettes táblázatok gyakran fordulnak elő, ezekre egy konkrét formulát adni a Cramer-féle
együttható használatával. Legyenek a, b, c, d pozitív egész számok, melyek egy 2 × 2-es táblázatban szerepelnek, akkor erre
a konkrét esetre a Cramer-együtthatót szokás φ-vel jelölni, s a következőképpen lehet számolni:
Megjegyzés. Használatára általánosan elfogadott, hogy legalább 25 adat esetén számoljuk ki, azaz N > 25. Továbbá, ha
Fér 14 18 32
Nő 16 12 28
Összesen 30 30 60
Legyen 15 fér testmagassága és lábmérete a következő: (181, 43); (176, 41); (184, 42); (172; 40); (186, 44); (180, 42); (166,
41); (181, 43); (176, 41); (182, 44); (180, 43); (169, 40); (192, 46); (188, 43); (177, 41).
27.24. ábra
Már közvetlenül is leolvasható több fontos dolog a pontfelhődiagramról (27.24. ábra). Így bizonyos trendek, továbbá a
szétszórtsága is jellemző. Ha van valamilyen trend, mondjuk lineáris kapcsolat, akkor egy egyenessel jól közelíthetők a
pontok. Ezt az egyenest nevezzük regressziós egyenesnek, s a következőkben egy módon de niáljuk is. Ehhez először egy
Gauss által használt módszert, a legkisebb négyzetek módszerét hívjuk segítségül. Fogalmazzuk ezt meg most
matematikailag két esetben is. Egyszer, amikor az egyik, egyszer, amikor a másik koordináta egyenestől való eltérésének
minimalizálását célozzuk.
Megjegyzés. Természetesen nézhetnénk mást is, például egy harmadik eset lehetne, hogy olyan egyenest keresünk,
amelytől a pontfelhő pontjainak távolsága összege minimális, tehát ekkor a Pitagorasz-tétel szerint mindkét
koordináta eltérésének négyzetösszegét kellene minimalizálni. Ez jóval bonyolultabb feladat, s ezért is terjedt el
inkább a fenti, két eltéréssel operáló módszer.
Legyenek Pi(xi, yi) a sokaságot X és Y ismérv szerint jellemző pontok egy koordináta-rendszerben. Azt az y = ax + b
alakú egyenest keressük, amelytől vertikálisan a legkevésbé térnek el ezek a pontok, amit az y koordináták eltérésének
Teljesen hasonló módon megy, ha az x koordináták különbségeinek négyzetösszegével dolgozunk. Ez vezet a következő
fogalomhoz.
Legyenek Pi(xi, yi) a sokaságot X és Y ismérv szerint jellemző pontok egy koordináta-rendszerben. Azt az x = a* y + b*
alakú egyenest keressük, amelytől horizontálisan a legkevésbé térnek el ezek a pontok, amit az x koordináták
eltérésének négyzetösszegével mérünk. Tehát azt az a* és b* valós számot keressük, amire az
A következőkben megmutatjuk, hogyan lehet ezeket az egyeneseket meghatározni. Kétváltozós függvény szélsőértékét
kell megkeresni, s mivel másodfokú polinomfüggvényekről van szó, melyek di erenciálhatók, így lehet az analízisben
tanult módszereket használni. Ehhez először a minimalizálandó függvényt alakítsuk át egyszer úgy, hogy az a változója
szerint, egyszer úgy, hogy a b szerint könnyen di erenciálható legyen.
illetve
Szélsőérték létezésének szükséges feltétele, hogy ezek a parciális deriváltak 0-val egyenlők legyenek. Így az alábbi
lineáris egyenletrendszert kapjuk a keresett a és b értékre:
Ennek megoldása:
Megmutatható például további di erenciálással vagy az előjelváltás módszerével, hogy ez valóban minimumhely, a
Hesse-mátrix pozitív lesz. Azaz megtaláltuk az első regressziós egyenes két paraméterét.
Ugyanezzel a módszerrel kaphatjuk meg a második regressziós egyenes *-gal jelölt paramétereit:
Általában ez a két regressziós egyenes nem esik egybe. Annál szorosabb azonban a lineáris kapcsolat a két ismérv
között, minél kisebb a két egyenes meredekségének az eltérése.
Mivel a második korrelációs egyenest nem y függvényében adtuk meg, ezért végezzünk el először egy átalakítást, a
második egyenes szokásos egyenlete:
A két meredekség (azaz az első és a második regressziós egyenes meredeksége) arányát, tehát az
mennyiséget szokás r2-tel jelölni és ennek négyzetgyökét, |r|-t Pearson-féle lineáris korrelációs együtthatónak
nevezni. Azaz .
Szélsőséges esetben, ha az adatok tényleges egy egyenesre illeszkednek, akkor természetesen mindkét regressziós
egyenes ezzel egybeesik, azaz ekkor , vagyis r = 1. Ilyenkor maximális lineáris korreláció (összefüggés) van a két
ismérv között. A másik szélsőséges eset, ha a két regressziós egyenes merőleges egymásra (két egyenes esetén ennél
nagyobb szöget nem tudunk elképzelni), ilyenkor a lineáris korreláció r = 0. Ebben az esetben gyakorlatilag semmilyen
lineáris összefüggésről nem beszélhetünk.
Általában pedig természetesen a két határeset, a 0 és az 1 közé esik a Pearson-féle lineáris korrelációs együttható.
A Pearson-féle korrelációs együtthatót kifejezhetjük közvetlenül az adatainkkal is, s ekkor előjele is lesz, ha elhagyjuk
Ez utóbbi mennyiséget egyszerűsítve kapjuk a Spearman-féle korrelációs együtthatót. Könnyen látható, hogy erre az
együtthatóra is teljesül a – 1 ≤ rs ≤ 1 egyenlőtlenség. De két előnye is van a Pearson-félével szemben:
1. nemcsak méréses ismérvek esetén használható, tehát szélesebb körű,
2. lényegesen kisebb a számolásigénye, mindössze n különböző rangszám-di erencia négyzetösszegét kell képezni, s
abból már könnyen adódik.
Ezért vezetjük be tehát a következő fogalmat:
Példa méréses adathalmazra, ahol mindkét együttható számolható. Vegyük a 12 legnagyobb járműgyártó
multinacionális céget, és vizsgáljuk meg, milyen korreláció van a foglalkoztatottak száma és az éves forgalom között.
Az alábbi táblázat tartalmazza a megfelelő adatokat.
Láthatóan eltérnek egymástól. Csak a Spearman-féle korreláció számolható ki minden olyan esetben, ahol csak
rendezéses adataink vannak.
Ha ebből határozzuk meg a három keresett paramétert Cramer-szabállyal, akkor felhasználva a következő egyszerűsítő
jelöléseket a hatványösszegekre
hasonlóan
és
Bonyolultságuk miatt ezeket a számításokat (ahogyan már a lineáris regreszsziót is) általában számítógéppel
számítják.
Példa. Az egyszerűség kedvéért nézzünk egy mindössze négy adatpáros esetet, amiről azt gondoljuk, hogy
másodfokú a kapcsolat a két változó között. Adataink a következők, melyek négy tó hossza km-ben (legnagyobb
távolság a partján lévő települések között) és a vízfelületük nagysága km2-ben adódnak: (72; 256), (45; 168), (13; 85), (6;
28). Ekkor a megfelelő hatványösszegek rendre: s4 = 31 004 338; s3 = 466 786; s2 = 7414 és s1 = 136, míg t2 = 1 682 677; t1 =
12 865; t0 = 537. Ezekkel a három együtthatóra adódik, mint legjobban illeszkedő másodfokú függvény paramétereire:
a = 1,4916; b = –332,13; c = 1338,122.
A standardizálás módszere
A standardizálás módszere
Ebben a fejezetben először arra ismerünk meg egy magyar statisztikus, Kőrösy József által kidolgozott módszert, amikor
két időszak között nemcsak az egész sokaságra jellemző átlagok változnak meg, hanem a sokaság bizonyos csoportjainak
egymáshoz viszonyított helyzete is. Például Magyarországon 1999-hez képest 2000-ben nőtt a gazdasági teljesítmény, de ez
nem egyenletesen történt az egész országban, azaz bizonyos régiók közötti különbségek tovább nőttek, mások csökkentek.
Egy másik példa, hogy ha a reálbérek növekedését külön a fér akra és a nőkre vizsgáljuk, akkor szintén eltérő
eredményeket kaphatunk, mint az egész lakosságra vonatkozó átlagok gyelembevételével. Ráadásul időnként egészen
paradox jelenségeknek lehetünk szemtanúi. Vegyünk két vállalkozást, és hasonlítsuk össze a dolgozók átlagkereseteit nem
szerinti megoszlásban, tehát külön a fér ak és külön a nők esetén. Eredményeinket a következő táblázat tartalmazza.
Nő 600 10 2275 35
Ha most a következő táblázatban az átlagokat adjuk meg ezen adatok alapján, akkor találkozunk a paradox jelenséggel.
Nő 60 000 65 000
Azaz mind a fér ak, mind a nők jobban keresnek a második cégnél, mégis az egész cégre vett jövedelemátlag
tekintetében az első cég a jobb. Tehát a részletek ismerete nélkül, pusztán a céges átlagok alapján azt mondhatnánk, hogy
az első cég jobban zet. A részletek tanulmányozása azonban arra vezet, hogy ezt felülbíráljuk. Ezt a különös jelenséget
nevezik Simpson-paradoxonnak, arról a statisztikusról elnevezve, aki először tanulmányozta a jelenséget komolyabban.
Első cikke 1951-ben jelent meg, bár már Yule észrevette, és írt róla egy kevéssé ismert tanulmányt 1900 körül. Ez azt
mutatja, hogy egy-egy összehasonlítandó sokaság főátlagaiból nem lehet önmagában következtetést levonni, mivel
valamilyen szempont szerinti felbontásuk esetén akár az is előfordulhat, mint példánkban, hogy a főátlag szerint jobb
sokaság minden egyes megfelelő részcsoportjában alacsonyabb átlagokat mérünk. Ez mindig olyankor lép fel, ha nagyon
eltérőek a csoportlétszám-arányok a két sokaságban. Példánkban az első cégnél jelentős fér többség van, míg a másikban a
nők vannak többségben. A két főátlag eltérése nem magyarázható tehát a részátlagok eltérésével, hanem a részek eltérő
aránya is szerepet játszik. Így megállapításainkhoz mindkét tényezőt gyelembe kell venni. Ezt a két hatást, tehát a nemi
különbségek és a nemek eloszlásának arányát külön kell választani. Ezt a módszert fogjuk standardizálásnak nevezni.
A standardizálás módszerével időben (térben) eltérő főátlagok (összetett intenzitási viszonyszámok) közötti
különbséget (vagy hányadost) összetevőkre (tényezőkre) bontjuk.
Kőrösy a különböző területeken élők halálozási arányszámait (1000 főre eső halálozás adott években) vizsgálta
Magyarországon területi eloszlásban. Eközben vette észre, hogy helytelen eredményre vezet, ha csak ezeket a számokat
hasonlítja össze, gyelmen kívül hagyva az egyes területek életkörülményeiben meglévő különbségeket, a lakosság időbeli
változását egy adott területen vagy például az egészségügyi ellátás különbözőségeit. Ennek kiküszöbölésére vezette be a
standardizálást, ahol a különböző területek népességének átlagos halálozási arányszámát úgy értelmezte, mint az egyes
életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyet a részviszonyszámok nagysága és
a népesség kor szerinti összetétele együttesen határoz meg. Egy érdekes mai példa, hogy Svédországban jóval magasabb
halálozási számokat mérhetünk, mint Mexikóban. Ez azonban nem arra vezethető vissza, hogy sokkal jobb az életminőség
vagy az egészségügyi ellátás Mexikóban, mint a jóléti Svédországban, hanem arra, hogy a svéd lakosság nagyon
elöregedett. Mexikóban igen nagy a atalok aránya, akik körében bár jóval magasabb a halálozási arány, mint svéd
kortársaiknál (de azért természetesen kisebb, mint a 70 év felettieknél, ahol egyébként szintén Mexikóban rosszabb az
elhalálozási arány), de olyan sokan vannak, hogy ez a teljes halálozási arányt megjavítja.
Általában a térbeli elemzésnél az átlagok különbségeire, míg az időbelinél az egyes időtartamokban mért átlagok
arányainak meghatározására koncentrálunk. Ezért a következő táblázatban mindkettőt együtt mutatjuk be.
Összetett intenzitási viszonyszámok meghatározása és összehasonlítása
ahol a 8. és 9. oszlopban levő számok jelentése: Kj = Vj1 – Vj0, illetve valamint az utolsó sorban K = V̄1 – V̄0, illetve
. A szóban forgó okok hatását úgy fogjuk kimutatni, hogy mind a K különbséget, mind az I hányadost két
„összetevőre” K′ és K″, illetve I′ és I″ bontjuk úgy, hogy
1. K = K′ + K″, illetve I = I′ · I″, valamint
2. az egyes összetevők (tényezők) közül az első K′ (I′) a megfelelő részviszonyszámok közötti átlagos különbséget
(hányadost), míg a második K″ (I″) a két sokaság eltérő összetételének a hatását mérje.
A különbségfelbontást általában a térbeli, míg a hányadost az időben zajló jelenségeknél használjuk.
Valójában arra vagyunk kíváncsiak, hogy az átlagok eltérését mennyire okozza a szerkezeti különbség a két sokaság
között, s mennyire az egyes elemek eltérő tulajdonságai. Ezért úgy bontunk különbséget (hányadost) összetevőkre
(tényezőkre), hogy azok ezt a két okot valahogyan elkülönítsék, amit sokszor hasznos tudni az elemzőnek, aki a statisztikai
átlagokat használja. Első példánkban, a szupermarketek összehasonlításakor arra vagyunk kíváncsiak, hogy az átlagos
vásárlás értékében mutatkozó eltérés milyen mértékben függ a vevők eltérő vásárlási szokásaitól (kártya vagy készpénz), s
mennyire attól, hogy más anyagi erővel rendelkező vevők látogatják az egyik, illetve a másik üzletet.
Példa
Látható, hogy az A szupermarketben mindkét kategóriában alacsonyabb az egy vevőre eső vásárlás értéke. Másrészt
viszont elég eltérőek a vásárlási szokások, az elsőben nagyarányú a bankkártyás zetés, a másikban jóval
alacsonyabb. Emiatt az átlagos vásárlás értéke paradox módon magasabb lesz mégis az elsőben. De akkor ezt az eltérő
szerkezet nagyobb hatása okozza. Ha tehát csak az egy főre jutó vásárlást néznénk, akkor azt gondolnánk, hogy az
első szupermarketbe járnak a jobb módú emberek. Lényegében az első komponenst úgy számoljuk, hogy a második
szupermarketet alapul véve kiszámoljuk az egy főre jutó vásárlást a két eloszlás szerint súlyozva, s ennek különbsége
adja majd K′-t. Azaz 2300 · 0,333 + 11 000 · 0,667 – 3000 · 0,333 + 12 000 · 0,667 = – 900, tehát ha a második
szupermarketbeli vásárlás megoszlását vesszük alapul, akkor –900 Ft lenne a különbség. Ezután K″ meghatározása
következik, ahol az első szupermarket egy főre jutó vásárlását vesszük alapul, és a két különböző megoszlással
számoljuk a különbséget: 2300·0,083 + 11 000·0,917 – 2300·0,333 + 11 000·0,667 = 2175.
Azaz az 1275 eltérés az első szupermarket javára úgy jön ki, hogy az egy főre eső vásárlás hatása –900 Ft-ot ad (azaz
ebből a szempontból a B szupermarketbe járnak a nagyobb pénzű emberek), míg a kártya miatti nagyobb vásárlási
kedv hatása a két üzlet viszonylatában 2175 Ft az első szupermarket javára. A kettő összege 1275 Ft. Tehát a két hatás
együttese így bontható fel a komponensek hatására.
A táblázatunk jelöléseit használva a komponensekre bontás a különbség (K) esetén a következőképpen zajlik.
súlya a j-edik csoportnak, pl. Bj(st) = Bj1. Hasonlóképpen adható meg , ahol Vj(st)
az egyes csoportok választott standard részviszonyszáma, pl. Vj(st) = Vj0. Fontos, hogy ha K′-nél standardnak az 1-es
sokaságot vettük, akkor K″-nél a 0-st kell venni. Természetes fordítva is lehet, ha az elsőnél a 0-st, akkor a másodiknál
az 1-est kell venni. Könnyen látható, hogy ekkor teljesül a K = K′ + K″ egyenlőség.
Következő példánkban időbeli különbség miatt intenzitásokat vizsgálunk, tehát az arányt a különbség helyett.
Az otthonban lakók 1 főre jutó átlagos gyógyszerfogyasztása (ezer Ft) Az otthon lakóinak száma (fő)
Életkor
2000 2003 2000 2003
60–70 2 1 50 40
71–80 4 3 30 80
81– 8 7 20 80
tehát , azaz 10,5%-kal nőtt az egy főre eső átlagos gyógyszerfogyasztás. (Ezt fogjuk
főátlagindexnek nevezni.) Ez az adatokat nézve elsőre meglepő, hiszen ismét minden korosztály esetén csökkent az
egy főre vetített átlagos gyógyszerfogyasztás költsége. Ne feledjük, hogy változott viszont az otthon lakóinak kor
szerinti összetétele. Ismét próbáljuk szétválasztani a csoportonkénti részátlagok arányainak hatását és a
csoportösszetétel-változás hatását. Ehhez nézzük meg először, hogy a részátlagindex mekkora, azaz milyen hatást
gyakorolnak a részviszonyszámok változásai az összetett viszonyszám (főátlagindex) változására.
Mindig a tárgyidőszakot, esetünkben a 2003-as évet választjuk bázisnak, amikor az összetételt vesszük alapul. Tehát
Számításuk a következőképpen történik: , ahol mindig Bj(st) = Bj1. Hasonlóképpen adható meg
Paramétertérnek nevezzük mindazon értékek halmazát, amelyek szóba jöhetnek, jelölése általában Θ.
A nullhipotézis mindig ennek a paramétertérnek egy részhalmaza, amit Θ0-lal szokás jelölni.
Esetünkben egyetlen elemű: Θ0 = {0,5}.
Ha a nullhipotézis egyelemű halmaz, akkor a nullhipotézis egyszerű, ellenkező esetben összetett. Hasonlóan az
alternatív hipotézis is lehet egyszerű vagy összetett.
Ha H0: ϑ = ϑ0 nullhipotézis és H1: ϑ > ϑ0 (vagy H1: ϑ < ϑ0) alternatív vagy ellenhipotézis, akkor egyoldali ellenhipotézisről,
illetve egyoldali próbáról, míg a H0: ϑ = ϑ0 nullhipotézis és H1: ϑ ≠ ϑ0 alternatív hipotézis esetén kétoldali
ellenhipotézisről, illetve kétoldali próbáról beszélünk.
Ha az eredmény az elfogadási tartományba esik, amit szokás C0-lal jelölni, akkor elfogadjuk a hipotézist (innen a név),
ellenkező esetben elvetjük, ekkor a kritikus tartományba esik a kísérlet során született eredmény, amit C1-gyel
jelölünk.
Ezeket mindig a kísérlet előtt szokták rögzíteni, amihez a következő de nícióban szereplő próbaterjedelem játssza a fő
szerepet (ez sem tévesztendő össze a terjedelemmel mint szóródási mértékkel!).
A Pϑ (C1) ≤ α, ϑ Θ0 relációt teljesítő α számot a próba terjedelmének hívjuk. Ha a próba terjedelme α, akkor az 1 – α
értéket a próba szintjének nevezzük, szokás szigni kanciaszintnek is mondani.
A lényege az, hogy előre eldöntünk egy biztonsági szintet (próbaszintet), ez hagyományosan leggyakrabban 95% vagy
esetleg 99%. Megnézzük, hogy a hipotézis feltételezése mellett milyen elfogadási tartományba kell, hogy essen a fejek
száma nagy valószínűséggel (0,95 vagy 0,99). Tehát mindig abból indulunk ki, hogy a hipotézis „igaz”, és e feltevés mellett
számoljuk ki a kísérleti eredmények valószínűségeit. Ha ezen kívül esik, akkor azt mondjuk, hogy az eredmény
szigni káns, és elvetjük a hipotézist. Ha nem, akkor nem mondhatjuk azt, hogy igazoltuk, de nincs nyomós okunk az
elvetésére sem. Esetleg új kísérleteket kell végezni, esetleg más hipotézist választani.
Legyen elsőre a dobások száma 10. Ekkor a hipotézisünk szerint binomiális eloszlású lesz a kísérleti eredmény.
Legvalószínűbb az 5 fej, 5 írás lesz. Nyilván a szélső esetek a kevésbé hihetőek, a 0,1, illetve 9 és 10 fej dobásának esélye
együttvéve is kevesebb, mint 5%, a nullhipotézis teljesülése esetén, ekkor tehát a következő döntési szabályunk lesz erre a
kísérletre.
Ha az eredmény a [2; 8] intervallumban van (elfogadási tartomány), akkor nem tudjuk elutasítani a szabályosság
hipotézisét (ezzel persze nem igazoltuk azt!). Viszont, ha ezen kívül esik az eredmény (kritikus tartomány), akkor ezt olyan
hihetetlennek véljük, hogy inkább a hipotézist tartjuk tévesnek, mint ezt az eredményt lehetségesnek. Ilyenkor
szigni kánsnak mondjuk a kísérletet, és a pénzérmét nem tekintjük szabályosnak. Természetesen ebben van
hibalehetőség, hiszen 0,03 eséllyel lehetséges a 0, 1, 9, 10 fej esete is. Ez a tévedés valószínűsége (a próba terjedelme), de ez
viszonylag kicsi szám, tehát ha sokszor kell döntenünk, akkor az esetek nagy részében, több mint 95%-ában helyesen
fogunk dönteni.
Ez a sheri lozó a lényege. Természetesen nagyon sok alkalmazása van, amire a következőkben mutatunk még két
példát. A következőkben majd még néhány fontos esetet szisztematikusan végigveszünk.
Ha az eredmény nem szigni káns, de például 8 fej van, azt tarthatjuk gyanúsnak, és elvégezhetünk további 10
kísérletet. Ekkor a 20 dobás elfogadási tartományát kell meghatároznunk. Némi számolás után látható, hogy 95%
biztonsággal a [6; 14] intervallum lesz az elfogadási tartomány (pontosan 0,9586 a valószínűség). Azaz nagyobb
kísérletszámnál arányaiban szűkebb intervallum adódik (20 kísérletnél a 21-ből 9 eset, kb. 43%, míg az előző 10 kísérletnél a
11-ből 7 elfogadható volt, ami még kb. 64%). Éppen a nagy számok törvénye (lásd 26.8. fejezet) garantálja, hogy arányaiban
mindig egyre szűkebb lesz az elfogadhatósági intervallum, ha a kísérletek számát növeljük. Azonban a sok kísérlet
többnyire sok pénz és idő, tehát szükséges valamilyen észszerű kompromisszumot találni. Egyébként álljon még itt 100
feldobás esetén (ami még messze nem „nagy szám”) a 95%-os elfogadási tartomány, ami a [40; 60], és ez már csak kb. 21%-a
az összes lehetséges esetnek.
További példánk legyen egy Poisson-eloszlásra vonatkozó hipotézisteszt! Valaki azt állítja, hogy egy
telefonközpontba hétköznap délután 3 és 4 között 140 hívás érkezik várhatóan. Tudjuk, hogy jó közelítéssel a
telefonhívások száma Poisson-eloszlású éppen a várható hívásszámmal mint paraméterrel. Egy ellenőr másnap,
lévén hétköznap, ellenőrzi a központ hívásainak számát. Vajon mikor tudja elutasítani a hipotézist, azaz milyen
eredmény lenne szigni káns 0,95 biztonsággal?
Nyilván kellene konstruálnunk egy olyan intervallumot, amelybe legalább 95% eséllyel a λ = 140 paraméterű Poisson-
eloszlás beleesik. A legvalószínűbb érték a 140, ekörül érdemes „keresgélni”. Számítógép vagy gra kus kalkulátor
segítségével kapjuk, hogy [120; 168] intervallumba kb. 0,951 eséllyel esik. Azaz az eredmény szigni káns, és a
hipotézis el lesz vetve, ha másnap nem esik a [120; 168] intervallumba a hívások száma.
A módszernek objektivitást kölcsönöz az a tény, hogy a kísérlet előtt rögzítve van, hogy mikor mit teszünk, nem
egyénileg döntünk, így objektívnek véljük az eljárást. Az értelmezésnél azonban gyakran hibát követ el a felhasználó. Az
előző példánk ellenőre nem mondhatja azt, hogy a hipotézis kevesebb, mint 5% eséllyel igaz, ezért elvetettük. Ilyen
kijelentés nem is tehető, hiszen a hipotézis vagy igaz, vagy hamis, nem a véletlentől függ, ezért nincs is valószínűsége.
Összetettebb a helyes interpretáció. A szigni káns eredmény (például 95%-os szinten) azt jelenti, hogy a hipotézis
fennállása esetén csupán 5% valószínűségű eredményt kaptunk, s ezt nem akarjuk elhinni, ezért elvetjük a hipotézist.
Csupán annak 5% az esélye, hogy sok-sok ilyen hipotézisvizsgálatból tévedünk, azaz 100 ilyen hipotézisvizsgálat közül kb. 5-
ben tévesen döntünk a hipotézis elvetésével, de hogy egy konkrét esetben mi a tévedés esélye, arról nem is lehet beszélni.
Mégis igen gyakran így értelmezik a hipotézisvizsgálat módszerét, helytelenül. Ilyen interpretáció csak a Bayes-statisztika
esetén van, de ott más valószínűségfogalommal van dolgunk, lásd részletesebben a 27.8. fejezetben.
A következőkben sorra vesszük a normális eloszlással kapcsolatos leggyakrabb hipotézisteszteket. Előtte egy fogalom.
Statisztikai próbának hívjuk azt az eljárást, amikor egy minta segítségével döntünk egy hipotézisről. Amennyiben az
eloszlás jellege ismert, és nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, paraméteres próbáról
beszélünk.
Egymintás u-próba
Kétmintás u-próba
Egymintás t-próba (Student)
A várható értékek egyezőségének ellenőrzése (kétmintás t-próba)
F-próba
Nem paraméteres próbák
Tiszta illeszkedés vizsgálat
Függetlenségvizsgálat
A becsléselmélet elemei
Egymintás u-próba
Alkalmazásként nézzünk egy ismert σ0 szórású normális eloszlású változót, melynek várható értékére vonatkozik a
hipotézisünk: H0: E(X) = m0. Az alternatív hipotézis lehet kétoldali: H1: E(X) ≠ m0 vagy egyoldali: H1:E(X) < m0 (vagy H1: E(X)
> m0). Foglalkozzunk most a kétoldali esettel, és készítsünk egy (1 – α)-szintű próbát egy n elemű, az eloszlás szerinti
sokaságból vett minta alapján! Tudjuk, hogy normális eloszlású változók összege is az, így az változó is
próbastatisztika standard normális eloszlású, így megadható az az uα/2 érték, amelyre igaz, hogy 1 – α =
P(–uα/2 < U < uα/2|H0) = F(uα/2) – Φ(–uα/2) = 2Φ(uα/2) – 1, ahol Φ(z) a standard normális eloszlásfüggvényt jelöli. Azaz az
elfogadási tartomány:
Kétmintás u-próba
Ebben az esetben két mintánk van, mindkettőről feltételezzük, hogy normális eloszlású és ismert szórásúak. A hipotézis
az, hogy a várható értékeik azonosak, az ellenhipotézisünk pedig, hogy nem azonosak. Formálisan legyen X m1, σ1, míg Y
m2, σ2 paraméterű normális eloszlások. Ezekből veszünk egy n1, illetve n2 elemű, egymástól függetlenül választott mintát.
Legyen a próba szintje 1 – α. Hipotézisünk H0: m1 = m2 és kétoldali próba, mert ellenhipotézisünk H1: m1 ≠ m2. A
próbastatisztika az lesz. Ez H0 fennállása esetén szintén standard normális eloszlású, mint az egymintás
u-próba esetén, mivel normális eloszlású változók különbsége is az, a hipotézis miatt a várható értéke 0, s a nevező
biztosítja, hogy a szórás 1 legyen. Így lehet ismét a Φ eloszlásfüggvényt használni, és eljárásunk ugyanaz lesz, mint az
egymintás esetben.
Példa. Legyen a két független minta az 5 elemű {4,2; 6,1; 5,3; 6,8; 3,9}, illetve a 4 elemű {4,6; 7,1; 5,8; 6,5}! Tegyük fel,
hogy tudjuk, hogy az első minta szórása 2,4, míg a másodiké 3,2. Vajon tekinthető-e a két minta azonos várható
értékűnek? A mintaátlagok rendre 5,26, illetve 6. Ekkor az u próbastatisztika felhasználva a szórásadatokat is: –
0,383. Legyen a szigni kanciaszint 0,95, ekkor a megfelelő érték, aminél a 0,383-nak kisebbnek kell lennie, hogy
elfogadhassuk a hipotézist, 1,96. Mivel ez bőven teljesül, ezért nem vethetjük el azt a hipotézist, hogy azonos várható
értékű a két minta hátterében álló két normális eloszlás.
kritikus érték, amelyre fennáll. A kritikus tartomány tehát, ahol szigni kánsan elvethető a
hipotézis:
Példaként vegyük a következő helyzetet! Szeretnénk ellenőrizni, hogy az 1 kg-os cukrot töltő automata jól működik-
e. Véletlenszerűen egymástól függetlenül kiválasztunk 10 zacskót. Ezzel a mintával azt szeretnénk tesztelni, hogy
valóban 1 kg-e a termék tömege, és a következő adatokat kaptuk grammban mérve a tömeget: 966, 1004, 996, 992,
1004, 966, 988, 982, 1010, 972.
Döntsük el 95%-os szinten, hogy 1 kg lesz-e a várható érték. Az adatokból x̄ = 988 és adódik, így
, míg a táblázatból 95%-os szinten n – 1 = 9 esetén 2,262 kritikus értéket kapunk, azaz az
eredmény nem szigni káns. Elhihető, hogy 1 kg a termékek várható tömege, annak ellenére, hogy a mintaátlag 12
grammal kisebb, mint a várható érték. Ez még nem szigni káns. Ha gyanúnk van, akkor további méréseket kell
végezni, azaz nagyobb mintát választani.
A várható értékek egyezőségének ellenőrzése (kétmintás t-próba)
Ez egy olyan hipotézis ellenőrzésére való, hogy két normális eloszlásúnak tekinthető sokaságból van egy-egy független
mintánk, s azt szeretnénk tesztelni, hogy a várható értékeik azonosak-e. Ez a következő szituációt jelenti.
Adott az X normális eloszlású változó m1, σ1 paraméterekkel és egy Y normális eloszlású változó m2, σ2
paraméterekkel. Ezekből van egy n1, illetve n2 elemű független mintánk. A hipotézisünk H0: m1 = m2, és az ellenhipotézis
H1:m1 ≠ m2, azaz kétoldali próbáról van szó. Legyen a próba szintje szokásosan 1 – α. Három esetet különböztetünk meg:
a) Az ismeretlen szórások azonosak σ1 = σ2, amit a következő fejezetben bemutatott F-próbával tesztelhetünk.
b) Az ismeretlen szórások nem azonosak σ1 ≠ σ2, de a minták elemszáma igen, azaz n = n1 = n2.
c) Sem a szórások, sem a minták elemszáma nem azonos (Sche é módszere).
Vegyük sorra az eseteket!
a) Ha a nullhipotézis fennáll, akkor a
Példa. Két különböző fejfájás elleni gyógyszer gyorsaságát akarják összehasonlítani. Egy próbát végeznek 9-9
fejfájással küzdő betegen, mérve a bevételtől a fájdalom megszűnéséig eltelt időt percben. Legyenek az adataink az
első gyógyszer esetében: 30, 32, 15, 54, 28, 25, 40, 26, 20; míg a második gyógyszert kipróbáló páciensek esetében: 33,
35, 28, 40, 29, 30, 38, 34, 30. Normális eloszlást feltételezve lehet-e szigni káns hatásgyorsasági különbséget mondani
közöttük?
Most az ismeretlen szórások azonosságára vagy különbözőségére nincs szükségünk, mint az előző példában, hiszen a
minta elemszáma azonos, tehát alkalmazhatjuk a különbségekre az egymintás t-próbát. A különbségek: –3, –3, –13,
14, –1, –5, 2, –8, –10. Hipotézisünk az, hogy nincs lényeges különbség, tehát egy 0 várható értékű mintából
származnak a különbségek. Gyors számolás mutatja, hogy a különbségek átlaga: –3, korrigált tapasztalati szórása:
7,87. –gy az egymintás t-próba számított értéke , aminek abszolút értéke 1,14. Ha a
szigni kanciaszintnek a szokásos 95%-t választjuk, akkor a t-táblázat 8 szabadsági fokánál a 2,306 áll (kétoldali
próba!), ami szerint ez az eltérés nem szigni káns. Tehát nem mondható egyik gyógyszer sem gyorsabb
hatékonyságúnak e kísérlet alapján. Egyébként a 8 szabadsági fokú t-eloszlásnál a számított 1,14 szigni káns a 0,85-
nél lenne, ami szerint 70%-os szigni kancia esetén lehet elvetni a hipotézist. A meg gyelések alapján tehát
sejthetjük, hogy az első gyógyszer gyorsabban hat, azonban az eredmény ezt nem támasztja alá egyértelműen. Ilyen
esetben javasolható további kísérletek elvégzése.
c) Legyen n1 < n2 (ez feltehető, hiszen ha fordítva állna fenn, akkor cseréljük meg a két minta elnevezését), és
de niáljuk a Z1, Z2, változókat a következő módszerrel:
Belátható hogy Zi normális eloszlású, E(Zi) = m1 – m2, mivel a várható érték lineáris operátor, és ebből
. Így ezek a Zi-k azonos normális eloszlású mintaelemek, melyek várható értéke és szórásnégyzete
ismeretlen. Erre viszont már az egymintás t-próba alkalmazható, a következő hipotézisre H0: E(Z) = 0 (m1 – m2), míg az
alternatív hipotézis a nem egyenlő, azaz kétoldali eset.
Példa. Vizsgáljunk két különböző típusú hangyacsapdát! Az egyiket 9 hasonló helyen, a másikat pedig 16 helyen
állítottuk fel. Egy óra múlva néztük az eredményt. Az első típusú 9 csapda rendre: 8, 12, 4, 15, 8, 9, 11, 7, 7 hangyát
fogott, míg a második típusú 3, 8, 6, 15, 4, 18, 7, 12, 11, 6, 2, 8, 13, 10, 14, 7 hangyát. Ezúttal a Sche é-módszer marad,
mert a következő pontban bemutatott F-próba szerint ezek a szórások nem tekinthetők azonosnak, és a minta
elemszám sem. Azaz képezni kell a c) pontban megadott Zi értékeket.
Ezek a következők lesznek: , ami esetünkben, mivel az első 9 hangyafogó a
második típusból összesen 84-et, míg mind a 16 darab összesen 144-et fogott, ezért elég egyszerű formula lesz, hiszen
F-próba
Két független normális eloszlású változó szórásainak egyenlőségét teszteli az úgynevezett F-próba.
Legyenek X és Y független normális eloszlású változók m1, σ1, illetve m2, σ2 paraméterekkel. A belőlük választott két
Tudjuk, hogy és χ2-eloszlásnak (n1 – 1), illetve (n2–1) szabadsági fokkal, és függetlenek.
Mivel is ugyanúgy F-eloszlású, csak (n2 – 1, n1 – 1) paraméterrel, ezért minden olyan k értékre, amelyre
szórásnégyzete kisebb, mint Y-é, akkor ez nem támasztja alá, hogy D2(X) > D2(Y). Ha , akkor a kritikus
tartomány , ahol .
Példák. Vizsgáljuk meg az előző pontban példaként említett hangyacsapdák szórásának egyenlőségét! Az első típusú
csapda eredményei: 8, 12, 4, 15, 8, 9, 11, 7, 7, ebből , a második fajta csapda eredményei: 3, 8, 6, 15, 4, 18, 7,
12, 11, 6, 2, 8, 13, 10, 14, 7, ebből .
Azaz most a második a nagyobb, tehát az 1/F-et kell néznünk, ami 1,403, és a paraméterek (15, 8). A táblázatban a
0,975-ös szinten (kétoldali próba) 3,2 található, ennél kisebb az arány, tehát lehet azonos szórásúnak venni őket.
Ebből az adódik, hogy lehetett volna az a) esetre is visszavezetni. Ott ha a szórásokat egyenlőnek vehetjük, akkor
utolsó levonandó éppen a 10 átlaga, 80,5; míg a harmadik tag az első 9 tag összege osztva . Az első 9
összege: 724, így a hozzáadandó érték: 76,31. Tehát a következő értékeket kell számolnunk:
A szabadsági fok 8 és a t-érték: , ami kevesebb, mint 2,306, amit a táblázat ad kritikus
értékként, tehát nem szigni káns az eltérés 95%-on. Látszik, mennyire nem lehet érzéssel dolgozni, hiszen ebben az
esetben az ember hajlamos lett volna már szigni kánsnak venni az eltérést.
Utolsó példánkban kétfajta nemesített búza terméshozamát szeretnénk összevetni, hogy szigni kánsan
termékenyebb-e valamelyik. Az egyikből hasonló területen 9 különböző mintánk van, a másikból ugyanott, másik
parcellából 12 minta. A kérdés, hogy – feltételezve a normális eloszlást – várható értékeik egyenlők-e. Az első minta:
30,3; 28,3; 29,6; 28,4; 31,1; 26,4; 28,4; 32,2; 26,2. A másik: 22,5; 40,3; 46,2; 21,6; 41,2; 21,9; 38,7; 39,6; 40,8; 48,2; 42,1; 30,8.
Első lépésben teszteljük, hogy szigni kánsan különböznek-e a szórások, s így szükséges-e a c)-beli Sche é-módszer,
vagy lehet az a)-béli t-próbát használni. Tehát F-próbával kezdünk. Az első minta átlaga és korrigált empirikus
szórásnégyzete: 28,99; 2,016. A másodiké 36,158; illetve 9,51. Nyilván a második szórás a nagyobb, tehát vizsgáljuk
meg a 9,51/2,016 hányadost, értéke 4,37. Mivel a táblázatban ehhez a két paraméterértékhez 3,35 van megadva 95%-os
szigni kanciaszinten, ezért mondhatjuk, hogy szigni kánsan nagyobb a második minta szórása. Ezért tehát a c)-beli
módszerrel kell eldönteni, hogy a várható értékben látszó különbség a második javára szigni káns-e.
értéke (átlaga a második adatsornak): 36,158; míg az első 9 tag összege 312,8, amit -mal kell szorozni, kb. 30,1
adódik. Így a következőket kell számolnunk: Zi = Xi–0,866 Yi–6,058, i = 1, 2, …, 9. Ebből most a következő 9 érték
adódik: 4,757; –12,658; –16,467; 3,636; –10,637; 1,377; –11,172; –8,152; –15,191. Ha hipotézisünk, hogy a két fajta hozama
nem szigni kánsan eltérő 0,95-ös szinten, akkor az itteni 9 adatból készített értéke a 8 szabadsági fokú
t-eloszlás kritikus értékénél kevesebb kell legyen. A kritikus érték: 2,306, mint már többször szerepelt, esetünkben
viszont az átlag: –7,167, a korrigált szórásnégyzet pedig: 8,23. Azaz , így abszolút értékben 2,61
adódik, ami nagyobb, mint 2,306, tehát ebben az esetben szigni kánsan nagyobb a második fajta hozama, hiszen
átlagértéke nagyobb volt, de most szigni káns eredmény. Tehát a termesztő valószínűleg ez utóbbit választja majd,
ha más egyéb ellene szóló tényező nincs.
Befejezésül tekintsünk át néhány nem paraméteres tesztet is! Ekkor nem egy ismert eloszlás paramétereit szeretnénk
becsülni, hanem éppen azt, hogy a minta tekinthető-e egy bizonyos eloszlásból származónak, vagy független-e két
tulajdonság a minta adatai alapján. Először éppen az eloszlásilleszkedést, majd a függetlenséget fogjuk vizsgálni.
Legyen adva egy teljes eseményrendszerünk A1, A2, …, Ar és a p1, p2, …, pr pozitív számok a következő feltétellel:
. Döntenünk kell a H0: P(Ai) = pi, i = 1, 2, …, r hipotézis érvényességéről. Hajtsuk végre a fenti
eseményrendszert tartalmazó kísérletet N-szer, és jelöljük ki-vel az Ai bekövetkezéseinek számát. Képezzük a
Megjegyzés. Az illeszkedésvizsgálatot eloszlások esetén használjuk még, itt a teljes eseményrendszer valószínűségei
alkotják az eloszlást. Később további példákat látunk majd.
Példa. Dobjunk fel egy kockát 600-szor, és vizsgáljuk a szabályossági hipotézist! Jelölje ki az i szám gyakoriságát a 600
dobás közül, nyilván i = 1, 2, 3, 4, 5, 6. A következő eredmény esetén mit mondhatunk a kockáról: k1 = 83, k2 = 91, k3 =
122, k4 = 107, k5 = 74, k6 = 123. A χ2-statisztika ebben az esetben:
értéke 21,08. Ha megnézzük az 5 szabadsági fokú (hiszen 6 – 1 = 5) χ2-eloszlás kritikus értékeit, még 99,9%-os szinten
(ami már igen-igen magas!) is csak 20,51, aminél 21,08 nagyobb. Tehát ez az eredmény a kocka szabályosságának
hipotézisét cáfolni látszik.
Térjünk rá az eloszlásilleszkedésre! Ezt szeretnénk az előzőre visszavezetni. Egy kézenfekvő lehetőség felosztani az
eloszlás értékkészletét r különböző diszjunkt halmazra, melyek az értékkészletet együttesen lefedik. Meghatározzuk, hogy
az eloszlás szerint ezekbe milyen eséllyel kellene, hogy beleessen a változó, ha tényleg ez az eloszlása. Utána végzünk N
meg gyelést, s mint az előző esetben, leszámoljuk, hogy az egyes események hányszor következnek be, s ezt összevetjük a
hipotézis szerinti valószínűségekkel. A kérdés, hogy a χ2-statisztikára kapott érték hogyan viszonyul a χ2-táblázat adott
szinthez tartozó kritikus értékeihez.
Vizsgáljuk meg valamelyik paraméterbecslés eloszlását, ahol elég nagy a minta, hogy az nem mond-e ellent a normális
eloszlásból származásnak.
Vegyük a hangyacsapdás példa második adatsorát, bár a 16 nem igazán nagyszámú mintaelem. Ha viszonylag kis
számú tartományra bontjuk a normális eloszlás értékkészletét, például legyenek A1 = (–1; 1), A2 = (–2; –1) ∪ (1; 2), A3 = (–
3; –2) ∪ (2; 3), végül A4 = (–∞; –3) ∪ (3; ∞), intervallumok, ekkor a megfelelő valószínűségek rendre: P(A1) = 0,6826;
P(A2) = 0,2718; P(A3) = 0,043; P(A4) = 0,0026. Ezután transzformáljuk standard normális eloszlásúvá az adatokat, tehát
vonjuk le az átlagot, és osszunk az empirikus szórással, ekkor a következő standardizált 16 értéket kapjuk. Az eredeti
adatsor: 3, 8, 6, 15, 4, 18, 7, 12, 11, 6, 2, 8, 13, 10, 14, 7. Ennek standardizált változata a korrigált szórással osztva: –1,32; –
0,22; –0,66; 1,32; –1,10; 1,98; –0,44; 0,66; 0,56; –0,85; –1,97; –0,28; 1,13; 0,28; 1,41; –0,56. Eszerint k1 = 9, k2 = 7, k3 = 0, k4 =
Diszkrét eloszlások esetén, ha nem túl sok értéket vesz fel az eloszlás, akkor lehet teljes illeszkedés vizsgálat, ha nem,
akkor, mint azt az előbbi normális eloszlásos példánál láttuk, tartományokat képezünk összevonva bizonyos értékeket.
Általában érdemes a kis valószínűségűeket összevonni, mert ha nem nagyon nagy a minta, akkor ezeket úgysem igen
gyeljük meg. Azaz az előző példánál a második felbontással végzett teszt hasznosabb, mint az elsővel, ahol két 0 értéket is
regisztráltunk, ami nem megengedett, mivel legalább 5, de még jobb, ha 10 meg gyelés van az egyes osztályokban
minimálisan.
Függetlenségvizsgálat
Már többször beszéltünk róla, és a kontingenciaanalízis, valamint részben a korrelációszámítás is ezzel a témával
foglalkozott. Most egy olyan próbát mutatunk, amely az illeszkedésvizsgálat módszerét viszi át a függetlenség vizsgálatára,
bár csak elég nagy minták esetén (legalább) alkalmazható, az aszimptotikusan χ2-eloszlás miatt. Ezt is az
illeszkedésvizsgálatra vezetjük vissza. Legyen A1, A2, …, Ar és a B1, B2, …, Bs két teljes eseményrendszer. Ezek
függetlenségét vizsgáljuk. Azaz a hipotézis:
Két eset lehetséges: vagy ismertek a két teljes eseményrendszerhez tartozó valószínűségek, vagy nem.
a) Ha ismertek, akkor H0 = P(AiBj) = piqj, i = 1, 2, …, r, j = 1, 2, …, s, ahol pi = P(Ai), qj = P(Bj) előre adott számok. Mivel itt a
különböző metszetek szintén egy teljes eseményrendszert alkotnak, és adott ehhez a valószínűség-eloszlás is, hiszen a
megfelelő valószínűségek szorzata adja, ezért egy tiszta illeszkedés vizsgálat, mely a hipotézis fennállása esetén
lesz.
b) Gyakoribb az az eset, hogy a pi, qj számok sem adottak, s azt is a mintából kell becsülni. Hajtsuk végre a kísérletet N-
szer, és készítsük el a kontingenciatáblázatot:
B1 B2 … Bs ∑
⋮ …
Így az Ai ∩ Bj meg gyelt kij értékének a hipotézis fennállása esetén közel -nek kell lennie. Így a χ2-
statisztika
ahol az ismeretlen paraméterek száma r + s, de ezek között két összefüggés van, mind a p-k, mind a q-k összege 1, így r + s –
2, így aszimptotikusan a , azaz eloszlású lesz a statisztikánk. Tehát más kritikus értékek
lesznek, mint a tiszta illeszkedés vizsgálatnál a más szabadsági fok miatt. Nyilván nagyobb eltérés lesz még elfogadható,
hiszen a valószínűségek is csak a relatív gyakoriságokkal becsültek, ami növeli az eltérést.
Példa. Vajon független-e a szemszín a hajszíntől? Egy 200 fős mintát vizsgáltunk, és meg gyeléseinket a táblázat
szerinti kategóriákba osztottuk.
Kék szem 39 29 6 74
Ekkor
Mivel a szabadsági fok (2 – 1) (3 – 1) = 2, ezért a -statisztikát kell nézni, a kritikus értékek legnagyobbika is 15,20,
és ez már 0,9995-ös igen magas szigni kanciaszint, s még ezen is el kell vetni a hipotézist, mivel 29,44 nagyon magas
érték. Azaz ezen adatok alapján nem tekinthető függetlennek a szemszín és a hajszín.
Megjegyzés. A függetlenségvizsgálat fontos esete két valószínűségi változó függetlenségének vizsgálata. Ugyanúgy
kell eljárni, mint az eloszlásilleszkedésnél. Felbontjuk a számegyenest (a változó értékkészletét) r, illetve s részre: –∞
= a0 < a1 < a2 < … < ar = ∞, illetve –∞ = b0 < b1 < b2 < …< bs = ∞. Legyen Ai =: {ai–1 ≤ X ≤ ai}, i = 1, 2, …, r és Bj =: {bj–1 ≤ Y ≤ bj},
j = 1, 2, …, s. Az X és Y változó függetlenségének vizsgálatát helyettesítsük a fenti két teljes eseményrendszer
függetlenségének vizsgálatával. Fontos megjegyezni, hogy a függetlenségvizsgálathoz a két változót egyszerre kell
meg gyelni, így a minta (Xi, Yi) párokból áll.
Az utolsó alkalmazás, amit a fenti módszerrel némi ügyeskedéssel el lehet végezni, az az ún. homogenitásvizsgálat.
El kell eldönteni, hogy két változó, X és Y eloszlása megegyezik-e. Vegyünk mintát X-re: X1, X2, …, Xn és Y-ra: Y1, Y2, …,
Ym. Osszuk fel a számegyenest r részre: C1, C2, …, C1. Legyen ki az {X ∈ Ci} esemény gyakorisága és li az {Y ∈ Ci}
Példa. Vajon származhat-e azonos eloszlásból a következő két minta: x1 = 12,6; x2 = 10,4; x3 = 9,7; x4 = 14,1; x5 = 11,2; x6 =
8,9, illetve y1 = 13,1; y2 = 10,8; y3 = 14,4; y4 = 10,8; y5 = 9,2.
Mivel az adatok a 8,9 és 14,4 intervallumba esnek, ezért legyenek az intervallumok: (–∞, 9), (9, 11), (11, 12), (12, 14), (14,
∞). Ekkor n = 6, m = 5 és k1 = l, k2 = 2, k3 = l, k4 = 1, k5 = 1, míg l1 = 0, l2 = 3, l3 = 0, l4 = 1, l5 = 1, azaz a statisztika:
A becsléselmélet elemei
A hipotézisvizsgálat fejezetet fejezzük be néhány becsléselméleti fogalommal és összefüggéssel. Egy paraméter becslésére
valamilyen statisztikát használunk, ami ebben az esetben azt jelenti, hogy a rendelkezésre álló adatok egy függvényét
vesszük, s annak a megfelelő helyettesítési értéke a becslésünk.
Példák
1. Szeretnénk egy dobókocka esetén a hatosdobás valószínűségét becsülni, mert a kocka nem tűnik szabályosnak
(cinkelt). Rendelkezésünkre áll 100 dobás eredménye. Szokás a hatosdobás relatív gyakoriságával becsülni a
valószínűséget, ilyenkor a függvény a hatosok száma osztva a dobások számával.
2. Az előző példából legyen most a kockán kidobott szám várható értéke a kérdés, az egyes számok valószínűségétől
függetlenül. Ekkor nyilván a dobott számok átlaga lesz az egyik legkézenfekvőbb lehetőség a várható érték
becslésére, azaz a függvény a dobott számok (változók) összege osztva a számukkal, formálisan:
. Nyilván a becslés konkrét értéke a megfelelő értékek behelyettesítésével
adódik, ahol esetünkben minden xi érték az {1, 2, 3, 4, 5, 6} halmaz elemei közül kerül ki, ez az értelmezési
tartománya a függvény változóinak.
Ha a becslésre használt statisztika várható értéke a paraméter, akkor a becslést torzítatlannak mondjuk.
Példák
1. Egy esemény relatív gyakorisága a valószínűség torzítatlan becslése.
2. A Poisson-eloszlás paraméterének az átlag torzítatlan becslése.
3. Legyen egy 1-től n-ig sorszámozott sokaság, amelyből k elemet kiválasztunk visszatevés nélküli mintavétellel
(mint a különböző lottók). Jelölje ezeket x1, x2, …, xk. Hogyan becsüljük meg ebből n értékét? Két torzítatlan
statisztikát is mutatunk.
a)
Mivel az várható értéke a várható érték additivitása miatt , ezért a 2x̄ - 1 egy
olyan becslés, amelynek várható értéke n, azaz torzítatlan becslés.
b)
Vegyük a max {x1, x2, …, xk} becslést. Megmutatható, hogy ennek várható értéke , azaz n-nek a
Sok esetben a becslés nem torzítatlan, csak ha nagyon sok kísérletet végzünk, akkor az n növekedésével válik egyre
torzítatlanabbá. Erre szolgál a következő fogalom.
A becslésre használt statisztika aszimptotikus torzítatlan, ha a becslés várható értékének határértéke tart a
becsülendő paraméterhez.
A torzítatlan becslések „jóságát” a szórásukkal lehet mérni. Amelyiknek kisebb a szórása, azt jobb becslésnek
tekintjük. Ezen alapszik két fogalom.
Megjegyzés. A torzítatlan becslésre vonatkozó 3. példából b) hatásosabb becslés, mint a), mert szórása kisebb.
Végezetül, ha létezik olyan becslés, amely bármely becslésnél hatásosabb, akkor azt a legjobb becslésnek tekintjük.
Ennek megfogalmazása a következő:
Egy B torzítatlan becslés hatásos, ha bármely másik torzítatlan becslésnél kisebb a szórása.
Természetesen érdekes kérdés, hogyan lehet hatásos (és torzítatlan vagy legalább aszimptotikusan torzítatlan)
becsléseket készíteni. Ennek elméletére vonatkozóan néhány fogalom és tétel.
Maximum-likelihood becslés. Igen gyakori, amikor becsült értékként a legvalószínűbbet választjuk, pontosabban,
amely esetén a kísérlet eredménye a legvalószínűbb. Nézzünk erre egy példát!
Példa. Legyen egy tóban ismeretlen a harcsák száma. Ennek becslésére a következőt tesszük. Kifogunk n = 50
harcsát, és ezeket megjelöljük, majd visszaengedjük a tóba. Kellő időt várva (hogy elkeveredhessenek a jelölt és a
nem jelölt harcsák) kifogunk 100 harcsát. Közöttük 13 jelöltet találunk. Mekkorára becsüljük a tóban levő harcsák
számát? Azt az N számot keressük, amelyre a legvalószínűbb a 100-ból 13 jelölt. Ha N harcsánk van, akkor ebből
Általában maximum-likelihood becslésnek nevezzük az ismeretlen paraméternek azt az értékét, amelyre a kapott
mintastatisztika a legvalószínűbb.
Diszkrét esetben az L(a) = p(x1, a)p(x2, a) … p(xn, a) szorzatfüggvényt hívjuk likelihood-függvénynek, ahol p(xi, a) jelöli
az a paraméter mellett az xi mintaeredmény valószínűségét. Folytonos esetben sűrűségfüggvények szorzata lesz a
likelihood-függvény: L(a) = f(x1, a)f(x2, a) … f(xn, a).
Ennek a függvénynek a maximuma ugyanott van, ahol a szigorúan monoton logaritmusának a maximuma, így
Megjegyzés. A szorzat alakot a meg gyelések független volta indokolja, tehát ha ez nem teljesül, akkor ezt a
módszert nem lehet használni.
Példa. A binomiális eloszlás p paraméterének maximum-likelihood becslése a következő. Legyen N kísérletünk,
amelyet egymás után n-szer ismétlünk, és az eredmények rendre k1, k2, …, kn. Ekkor a likelihood-függvény:
.
Ennek logaritmusát deriválva, s azt 0-val egyenlővé téve kapjuk a likelihood-egyenletet:
ahonnan
Ha létezik az ismeretlen paraméternek egy minimális szórású, tehát hatásos becslése, akkor a likelihood-egyenletnek
egy megoldása van, és ez éppen a hatásos becslés, tehát a hatásos becslés egyben maximum-likelihood becslés is.
Egy példa a már szerepelt relatív gyakorisági becslés a valószínűségre, ami egyben maximum-likelihood becslés is,
A Bayes-statisztika alapjai
A valószínűség fogalma
Bayes-módszer
Klasszikus kontra Bayes-statisztika
A Bayes-statisztika alapjai
Ennek a fejezetnek a célja röviden összefoglalni egy XX. századi statisztikai elmélet alapfelfogását, amely T. Bayes tételén
alapul (innen származik az elnevezése is), de abban a valószínűséget jelentősen tágabban értelmezve, mint azt maga T.
Bayes, illetve az előző két fejezetben bemutatott ún. klasszikus elmélet hívei. Az a kiindulópont, hogy minden olyan
fogalom, amely kielégíti a Kolmogorov-axiómákat, valószínűségnek tekinthető, így az ún. igazságos fogadás eszméjén
alapuló, az illető informáltságától is függő, ún. szubjektív valószínűség fogalma is. A módszer bár technikailag sokszor
nehezebb, mégis könnyebben érthető és természetesebb, mint az eddigiekben látott klasszikus eljárások. Amelyek
egyébként talán jobban érthetőek, ha ezt is ismerjük. Éppen ez indokolja, hogy bemutassuk, annak ellenére, hogy még a
felsőoktatásban sem elterjedt elméletről van szó.
A valószínűség fogalma
A klasszikus elmélet csak a valószínűség ún. objektív, tehát a véletlen kísérletekhez kötött fogalmát használja. Ez a vizsgált
rendszernek tőlünk független (ezért mondjuk objektívnek) tulajdonsága. Például, hogy egy dobókocka milyen eséllyel esik
úgy, hogy a 6-os legyen felül, ez a dobókocka sajátossága (ha feltesszük, hogy a dobás módja nagyjából állandó, és nem
befolyásolja az eredményt). Ebben a felfogásban a valószínűség egy, csak a véletlen rendszertől függő paraméter, tehát
adott, de mi általában nem ismerjük. Éppen az a célunk, hogy valahogy mégis meghatározzuk.
Ebben az értelemben például egy hipotézisnek nincs is valószínűsége, hiszen az vagy igaz, vagy hamis, csak éppen nem
tudjuk, hogy melyik eset áll fenn. Ha mégis használunk esélyeket ilyen esetekben, az csak szubjektív, tehát a meg gyelőtől
függő mérték lehet. Ennek a fogalomnak a sajátja, hogy a kapott információk függvényében változik (tehát nem egy
objektív állandó), viszont megadottnak vehető. Itt most nem akarjuk bebizonyítani, hogy a Kolmogorov-axiómákat
kielégíti egy ilyen szubjektív (az igazságos fogadások felhasználásával de niálható) „valószínűség”-fogalom is. Ezt
elfogadva ugyanúgy számolhatunk vele (pl. a Bayes-tételben), mint a korábbi „objektívnek” mondott valószínűség-
fogalommal.
Vegyünk egy olyan konkrét szituációt, amelyen be tudjuk mutatni az elmélet lényegét. Valaki szeretne két különböző
szituációban dönteni:
a) egy önmagát zeneértőként bemutató személyről, illetve
b) egy önmagát parafenoménnak nevező személyről eldönteni, vajon igazat mond-e.
A módszer nyilván, mint eddig is láttuk, csak az lehet, hogy egy kísérletet tervezünk a személyekkel, s annak
eredményétől függően valahogyan döntünk. Természetesen tisztába kell lennünk azzal, hogy bizonyos eséllyel tévedünk.
Klasszikusan a hipotézisvizsgálat módszerét alkalmazzuk (lásd a 27.7. fejezetet). A kísérlet legyen a következő! Tíz
egymástól független alkalommal teszteljük a „szakértelmet”, a zeneértőnek el kell találnia, hogy milyen művet hall, a
jósnak meg kell mondania, hogy mi fog történni egy érmefeldobáskor, azaz érmedobás eredményét jósolja meg.
Megszámoljuk, hogy hány sikeres kísérlet volt, s ennek alapján döntünk.
A klasszikus hipotézisvizsgálat abból indul ki, hogy nem szakértő az illető, tehát tippel, és 50-50% eséllyel talál vagy
téved. A kérdés, hogy milyen eredmény az, amit már nehéz ilyen feltétellel elhinni. A tíz kísérlet a hipotézisünk mellett
binomiális eloszlású n = 10, paraméterekkel. Nyilván a szakértelem a minél több találat. Véletlenül legfeljebb 9
találat esélye 0,989, a legfeljebb 8 találaté pedig 0,945. Azaz annak az esélye, hogy véletlenül 9 vagy 10 találatot ér el, csak
0,011, a 8, 9 vagy 10 találaté már 0,055. Tehát a „szokásos” 0,95-ös szigni kanciaszinten a 9 és 10 találat esetén már elvetjük a
tippelés hipotézist, tehát valamilyen szakértelmet szigni kánsnak tartunk.
Ez mindkét esetben így van, azaz akár a jós, akár a zenész esetével állunk szemben. Ez némileg ellentmond a
mindennapi értékítéletünknek, mivel nem nagyon hisszük, hogy egy ember jövőbe látó lenne, ezért még 10 találat esetén is
azt mondjuk, hogy nem hisszük, hogy jóssal állunk szembe, míg a zeneértő esetén elhisszük hasonló esetben a
szakértelmét. Mégis hogyan lehetne megkülönböztetni ezeket az eseteket. Nos éppen erről szól a Bayes-statisztika,
amelynek módszerét a következőkben mutatjuk be.
Bayes-módszer
Itt a koncepció az, hogy már a kísérlet elvégzése előtt van egy elképzelésünk a szituációról, jelen esetben valószínűleg
eléggé eltérő. Általában hajlamosak vagyunk zeneértőket felismerni, és tudjuk, hogy ilyen emberek vannak. Míg
jövőmondó ember, ha egyáltalán elhisszük, hogy van ilyen, akkor is nagyon ritka. Azaz kezdetben kicsi esélyt adunk arra,
hogy valaki ilyen képességgel rendelkezik. Míg a másik esetben ez az esély lehet nagyobb. Mindenképpen szubjektív
esélylatolgatásról van azonban szó, hiszen más-más ember másképp ítéli meg ezeket a helyzeteket. Azt az esélyt, amit a
kísérlet elvégzése előtt az adott tényállás megítélésére használunk a priori valószínűségnek nevezzük Kant nyomán.
Megjegyzés. Kant használta az a priori, illetve az a posteriori kifejezéseket, ahol az első a tapasztalást megelőző, míg
a második a tapasztalat (érzékelés) utáni állapotot jelenti.
Két különböző szituációban használhatjuk tehát az esély vagy valószínűség szót. Az egyik, amikor egy véletlen
kísérletben egy esemény bekövetkezésének az esélyéről van szó. Ezt szokás „objektív” valószínűségnek is mondani,
vagy esemény-valószínűségnek. Ez a klasszikus valószínűség-számításban szereplő fogalom. Sajnos általában
számunkra ismeretlen.
A másik eset, amikor véletlenről szó sincs, csupán a világ egy (számunkra ismeretlen) állapotának a valószínűségéről
akarunk beszélni. Fog-e holnap esni? Mi az esélye, hogy egy adott érme szabályos és így tovább. Ezek nem ismételhető
véletlen kísérletek, csupán számunkra jelenleg ismeretlen tényállások, amelyeket informáltságunktól függően
másképp ítélünk meg. Éppen ezért ezeket szubjektív vagy szerencsésebben állapot-valószínűségeknek nevezzük.
Ezek számunkra ismertek, de általában különböző emberek esetén különbözők.
Egy tényállás vagy a világ egy tetszőleges állapotának fennállására vonatkozó bármilyen elvégzendő kísérletet
megelőző tudásunk kifejezését szolgáló szubjektív esélyt (valószínűséget) a priori valószínűségnek nevezünk. Ez
genuin szubjektív valószínűség-fogalom, hiszen a megismerő személytől függ még akkor is, ha mindenki ugyanúgy
ítélné is meg a helyzetet. Ez utóbbi esetben az interszubjektív megegyezés esete áll fenn. De ez sem lehet objektív, éppen
természete miatt.
Például a bevezető feladatunk esetén annak megítélése, hogy X zeneértő, illetve hogy Y jós, személyenként változó, de
általában az előbbit jóval valószínűbbnek gondoljuk, mint az utóbbit, mivel zeneértőket ismerünk, jövőbe látó
parafenoméneket pedig ritkán, s azokról is gyakran derül ki a csalás. Tehát az egyik esetben annak a valószínűsége, hogy a
zeneértő állapot fennáll X esetében (jelölje X = 1), egy valahogyan számszerűsíthető esély, legyen ez P(X = 1) = 0,01. Míg a
másik esetben, ha egyáltalán hiszünk ilyesmiben, akkor is nagyon kevés ilyen ember lehet, tehát P(Y = 1) = 10–9, azaz azt
gondoljuk, hogy a 6 milliárd ember között kb. 6 ilyen lehet. (Természetesen mindkét esetben az olvasó maga választhat
tetszőleges, számára egy igazságos fogadás esetén elfogadható értéket.) Ezután végezzük el a kísérletet, s annak eredménye
legyen 10-ből 10 találat mindkét esetben. Ekkor az elején említett klasszikus szigni kanciateszt esetén azt kell mondanunk,
hogy mindkét személy esetén egyformán elvetjük a véletlen tippelést mint hipotézist még 99%-os szigni kanciaszinten is.
Azaz mindkét személyt szakértőnek mondjuk a maga nemében.
A bayesi gondolkodás azonban különbséget tesz. Ugyanis a 10 találat utáni új szubjektív valószínűséget mindkét
esetben a Bayes-tétellel lehet kiszámolni:
Azaz az első esetben a 10 találat után a zeneértőt szakértőnek mondjuk 91,2% eséllyel. Míg a jövendőmondás esélye még
mindig csak egymilliomod körül maradt. (Persze azért kb. 1000-szeresére nőtt!) Vagyis a két eset (ahogyan az életben is)
megkülönböztethető. Ez az egyik nagy előnye a Bayes-statisztika gondolkodásmódjának. A következő példánk előtt
de niáljuk még ezeket az új szubjektív valószínűségeket.
Kiszámítására tehát a következő formula írható fel, ahol K = k jelöli a kísérletben meg gyelt gyakoriságot.
A bal oldalon találjuk az a posteriori valószínűséget, a jobb oldalon pedig az a priori valószínűségek a kísérlet
eredményének az esélyével súlyozva szerepelnek. Természetesen lehet olyan eset, ahol nem két állapot van (szakértő vagy
nem szakértő), hanem több, esetleg megszámlálhatóan végtelen (ezek a diszkrét esetek) vagy akár nem megszámlálhatóan
végtelen is. Például egy ismeretlen valószínűség a [0; 1] intervallum tetszőleges eleme lehet. Ilyenkor az előző formula
általánosított változatát használjuk. Előbb azonban néhány fogalom.
Legyen a lehetséges állapotok száma legfeljebb megszámlálhatóan végtelen. Azaz Θ = {θ1, θ2, …, θn, …}. Ekkor a kísérlet
előtti állapotra vonatkozó előismereteinket, tudásunkat (vagy nem tudásunkat) egy ún. a priori eloszlás formájában
fejezzük ki. Azaz a P(θi) = pi, i = 1, 2, …, n, … eloszlást a priori eloszlásnak nevezzük.
Ezek után legyen egy kísérlet eredménye k, amelynek segítségével az egyes állapotok kísérlet utáni „új” valószínűségeit
számolni szeretnénk. Ekkor igaz lesz a következő összefüggés a Bayes-tétel alapján:
(27.3)
Megjegyzés. Az ún. információhiányos állapot esetén, tehát amikor semmit nem tudunk az egyes állapotokról, akkor
szokás az egyenletes eloszlást a priori eloszlásnak választani.
Minden részletes indoklás nélkül közöljük az ún. folytonos állapotra vonatkozó esetet, tehát ha az állapottér
kontinuum számosságú, akkor az a priori eloszlást egy sűrűségfüggvénnyel fejezzük ki.
Ha Θ = {θα: α ϵ R}, és előzetes informáltságunkat az alábbi állapot-valószínűségeket összegző f(x) sűrűségfüggvény fejezi
ki, akkor f(x) a priori sűrűségfüggvény.
(27.4)
A (27.4) képlet bal oldalán szereplő feltételes sűrűségfüggvényt a posteriori sűrűségfüggvénynek nevezzük.
Megjegyzés. Természetesen, ha többszöri kísérletet végzünk egymás után, akkor a második kísérlet előtti a priori
eloszlás (sűrűségfüggvény), az első kísérlet utáni a posteriori eloszlás (sűrűségfüggvény). A második után kapott új
eloszlás (sűrűségfüggvény) lesz a második kísérlet utáni a posteriori eloszlás (sűrűségfüggvény). Ezt az eljárást
akárhányszor iterálhatjuk.
Ha van két kísérletünk egy állapottér esetén, akkor mindegy, hogy egymás után dolgozzuk fel az eredményt vagy
összegezve, tehát ugyanoda jutunk mindkét esetben. Formálisan ez a következőt jelenti:
, azaz kifejtve:
.
Állításunk, hogy P(1) = P(2), azaz a két a posteriori eloszlás megegyezik.
Ha valójában a világ a θi állapotban van, és elég sok kísérletet végzünk, azaz a kísérletek száma n → ∞, akkor az a
posteriori eloszlás sztochasztikusan konvergál valamilyen i esetén a P(θi) = 1, P(θj) = 0, ha i ≠ j, egy pontra koncentrált
eloszláshoz, függetlenül attól, hogy milyen a priori eloszlásból indulunk ki, feltéve, hogy semelyik állapot
valószínűségét nem vettük 0-nak (azaz minden állapot a priori valószínűsége pozitív).
Megjegyzés. A második tétel lényegében a nagy számok törvényének a Bayes-szituációra vonatkozó alakja. Ebből az
következik, hogy elég sok tapasztalat után bármilyen „előítéletünk” is volt, feltéve, hogy semmit nem zártunk ki
(minden a priori valószínűség pozitív), akkor végül a valóságos állapothoz jutunk, tehát ez az emberi megismerésre
nézve egy igen pozitív tétel.
Példák
1. Legyen adva három átlátszó urnánk, az elsőben a sárga és a zöld borsószemek aránya 3:7, a másodikban fele-fele,
míg a harmadikban 6:4. Valaki egyet kiválaszt belőlük, majd abból visszatevéssel húz 5-ször, s eredményül 4
zöldet és 1 sárgát kap. Ezután mi az esélye, hogy az első, a második vagy a harmadik urnát választotta?
Nézzünk két különböző megközelítést! Először induljunk ki abból, hogy semmi előzetes információnk nincs,
melyik urnát választották ki, amelyikből aztán húztak. Ezt az egyenletes eloszlással lehet modellezni, tehát az a
priori eloszlás a három urna választására: . Nézzük hogyan adható meg az a posteriori
eloszlás:
Tehát ahogy azt gondoljuk is, az az urna vált a legvalószínűbbé, ahol a zöldek vannak többségben. A kezdeti
33,3%-ról majdnem a duplájára nőtt az esélye, 60,7%-ra. A másik kettő csökkent, a fele sárga, fele zöld (második)
csak néhány százalékot, 26,3%-ra, míg a sárga többségű harmadik urna esélye lecsökkent 13%-ra. Második
változatként vegyük azt, hogy valaki az átlátszó urnán át úgy vélte, hogy a sárgák vannak többségben. Ezért az
alábbi a priori eloszlást választotta: P(θ1) = 0,1; P(θ2) = 0,2; P(θ3) = 0,7. Nézzük, hogy ő mit mond a kísérlet után. Az
előző esethez hasonlóan, csak most a számolás kicsit bonyolultabb, mivel nem lehet az egyenlő a priori értékekkel
osztani a Bayes-tételben, adódik:
Végül az eredetileg legvalószínűbbnek tartott urna esélye 0,7-ről lecsökkent 0,21-re a kísérlet következtében.
Látszik, hogy még ekkor is a legvalószínűtlenebbnek tartott első urna esélye 0,1-ről 0,423-ra nőtt.
2. Legyen adott egy pénzérme, amelynél a fej dobásának esélyét akarjuk meghatározni. Ehhez egy dobássorozatot
végzünk, ahol a 100 dobásból 63 fej. Mit gondoljunk a pénzérméről?
Első esetben itt is válasszuk az a priori egyenletes eloszlást a fej valószínűségére, ami a [0; 1] intervallumban egy
valós szám lehet. Az a priori sűrűségfüggvény az f(x) = 1 lesz. Ekkor az eredmény után az a posteriori feltételes
sűrűségfüggvény:
Egy ún. béta-függvény lesz, ahol a c konstans, a nevezőben levő integrál értékének reciproka: . Tehát
az eredeti egyenletes eloszlás helyett (ami szintén tekinthető egy béta-eloszlásnak a 0; 0 paraméterpárral) egy
másik béta-eloszlást kaptunk, amely azonban a maximumát a 0,63-nál veszi fel, és elég hegyes görbe.
Ha most a szabályosságot a 0,49 és 0,51 közötti fej dobás valószínűségére fogadnánk el, akkor ezen eredmény után
Erre az esetre a [0,49; 0,51] intervallumba esés valószínűségére a fenti kísérlet után 0,000 021 adódik, míg a [0,45;
0,55] intervallumra 0,000 148, tehát még kevesebb, mint az egyenletes eloszlással.
Példa. .
III. táblázat. Az F-próba kritikus értékei ϵ=0,05-re f1 a nagyobb empirikus szórásnégyzetű minta elemszámának, f2 pedig a
másik minta elemszámának eggyel kisebbített értéke
IV. táblázat. A t-(Student-) próba kritikus értékei 80%-os (90%-os), 90%-os (95%-os), 95%-os (97,5%-os), 98%-os (99%-os), 99%-os
(99,5%-os), 99,9%-os (99,95%-os) kétoldali (egyoldali) szintre
Statisztikai biztonság
Szabadsági fok, f
80% 90% 95% 98% 99% 99,9%
-->