Matematika by Bereczky Áron Gerőcs László Vancsó Ödön

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 850

MATEMATIKA

Impresszum
Előszó
A kötetben használt jelölések

1. Halmazok

2. Logikai alapok

3. Számtan, elemi algebra

4. Polinomok és komplex számok algebrája

5. A sík elemi geometriája

6. A tér elemi geometriája

7. Ábrázoló geometria

8. Vektorok

9. Szögfüggvények

10. Analitikus geometria

11. Lineáris algebra

12. Absztrakt algebra

13. Számelmélet

14. Számsorozatok

15. Elemi függvények és tulajdonságaik

16. A valós analízis elemei

17. Di erenciálszámítás és alkalmazásai

18. Integrálszámításéés alkalmazásai

19. Közönséges di erenciálegyenletek

20. Parciális di erenciálegyenletek

21. Komplex függvénytan

22. Fraktálgeometria

23. Kombinatorika

24. Gráfok
25. Kódelmélet

26. Valószínűség-számítás

27. Matematikai statisztika


A kiadásért felelős az Akadémiai Kiadó Zrt. igazgatója Szerkesztette: Stark Mariann Felelős szerkesztő: Tárnok Irén
Termékmenedzser: Egri Róbert Vizuális koncepció, tipográ a: Czakó Zsolt Nyomdai előkészítés: Starkiss Stúdió A
nyomdai munkálatokat az Akadémiai Nyomda Kft. végezte Felelős vezető: Ujvárosi Lajos Martonvásár, 2010
Kiadványszám: KM070006 Megjelent 91,25 (A/5) ív terjedelemben
Impresszum
A jelen digitális kiadás alapjául a 2010-ben megjelent Matematika (Akadémiai Kiadó, Budapest) című mű szolgált
Főszerkesztő
Gerőcs László, Vancsó Ödön
Írták
Bereczky Áron, Csányi Tibor, Gerőcs László, H. Temesvári Ágota, Katona Dániel, Kós Géza, Lerchner Szilvia, Máté László,
Nagy Noémi, Németh László, Szakál Péter, Szűcs Zsolt, Vancsó Ödön
Lektorálták
Arató Miklós, Bátkay András, Gyenes Zoltán, Hortobágyi István, Katona Dániel, Sigray István
ISBN 978 963 05 9767 8
Kiadja az Akadémiai Kiadó,
az 1795-ben alapított
Magyar Könyvkiadók és Könyvterjesztők Egyesülésének tagja
1117 Budapest, Prielle Kornélia u. 21–35.
www.akademiai.hu
Első magyar nyelvű digitális kiadás: 2016

© Szerzők, 2010
© Akadémiai Kiadó, 2016

A kiadásért felelős az Akadémiai Kiadó Zrt. igazgatója

Minden jog fenntartva, beleértve a sokszorosítás, a nyilvános előadás, a rádió- és televízióadás, valamint a fordítás jogát, az
egyes fejezeteket illetően is.
Előszó
Az Akadémiai kézikönyvek sorozat Matematika című kötetét tartja kezében az olvasó. Bár kétségtelen, hogy több, jól
használható matematikai kézikönyv is található a könyvpiacon, a kiadó mégis úgy gondolta, hogy a sorozatból nem
maradhat ki éppen a matematika. Egy olyan matematikai ismereteket tartalmazó kötet, amely a XXI. század kihívásainak
megfelelően a hagyományos alapismeretek mellett a kor néhány újabb matematikai területét is tárgyalja, és ezek alapvető
fogalmaival igyekszik megismertetni az érdeklődőket. Ennek megfelelően a kötetben a hagyományosan tanultak (a
felsőoktatási intézmények BSc fokozatáig bezárólag): a legfontosabb fogalmak, tételek, eljárások és módszerek kapják a
hangsúlyosabb szerepet, de mindezek mellett igyekeztünk olyan (már inkább az MSc fokozatba tartozó) ismereteket is
érinteni, melyek nagyobb rálátást, mélyebb betekintést kínálnak a kötet olvasóinak. Fontosnak tartottuk azt is, hogy a
kötetbe bekerüljenek középiskolai szinten is azok a témakörök, melyek az új típusú érettségi követelményrendszerben is
megjelentek (például a statisztika vagy a gráfelmélet). Mindezek mellett – bár érintőlegesen – a matematikai kutatások
néhány újabb területét (kódoláselmélet, fraktálelmélet stb.) is bemutatjuk.
Könyvünk 27 fejezetből áll. Az első fejezetekben az elemi számolási fogalmak és szabályok szerepelnek, majd a
továbbiak elsősorban a középiskolai tananyagban előforduló legfontosabb területeket tárgyalják. A kötet második felében
találjuk a felsőoktatási tematikáknak megfelelő témákat tárgyaló fejezeteket. Ez alól kivétel a 23., 24., 26. és 27. fejezet, ahol
a középiskolai és a felsőoktatási anyag egy egységben szerepel. Az egyes fejezetekben levő fogalmakat gyakran
magyarázattal is elláttuk. Sok esetben a fontosnak tartott tételek bizonyítását is megadtuk, hol csak vázlatosan, hol teljes
részletességgel.
Mivel néhány felsőoktatási intézményben alapvetően fontos témakör az ábrázoló geometria, és a jelenleg forgalomban
levő matematikai kézikönyvek általában nem vagy csak nagyon érintőlegesen tárgyalják, ezt a témakört kicsit
részletesebben kifejtjük. Ezzel elsősorban a műszaki jellegű felsőoktatási intézményekben tanulóknak szeretnénk
segítséget nyújtani.
Az egyes fejezeteken belül részletesen kidolgozott mintapéldák vannak a tárgyalt elméleti anyag alkalmazására,
melyek áttanulmányozása nagyban hozzájárulhat az elméleti problémák mélyebb megértéséhez.
Kötetünknek több szerzője van. Ennek megfelelően a stílus, a szövegformálás (ami nyilván szubjektív elemeket is
hordoz) az egyes fejezeteket illetően eltérő lehet. Mindez azonban, reményeink szerint, nem megy az élvezhetőség és a
megértés rovására.
Reméljük, hogy egy olyan könyv kerül az olvasó kezébe – legyen általános vagy középiskolás diák, egyetemi hallgató
vagy az idősebb generációhoz tartozó, de a tárgyat valaha komolyabban tanuló és értő felnőtt –, mely kellő eligazodást
nyújt számára, akár egy számonkérésre való felkészüléshez, akár régen tanult, de valamelyest elfelejtett ismeretek
felelevenítéséhez. Így akár érettségire készüléshez, akár egyetemi vizsgához is hasznos segédeszköz lehet. Az áttekintést
segíti, hogy minden de níciót szürke tónusú kiemeléssel jeleztünk, minden tétel keretbe került, a példákat pedig más
betűméret jelzi. A legfontosabb jelölések jegyzéke és egy tárgymutató is könnyíti a keresést és eligazodást ebben az
egyébként igen vaskosra sikerült kötetben. A könyv a szokásos kézikönyveknél kissé részletesebben fejti ki az egyes témák
matematikai tartalmát, és főleg a sok példával az alkalmazásokat támogatja, ami a mai matematikaoktatás egyik fontos,
korábban kissé elhanyagolt területe.

Budapest, 2009 októbere


A szerkesztők
A kötetben használt jelölések
Halmazok, logika, általános jelölések
Elemi algebra, számelmélet
Geometria, vektorok
Függvények, matematikai analízis, valós és komplex függvények
Fraktálok
Kombinatorika, valószínűségszámítás
Algebra, kódelmélet
A görög ábécé betűi

Halmazok, logika, általános jelölések

Ø üres halmaz

A∪B két halmaz uniója

A∩B két halmaz metszete

A\B két halmaz különbsége

Ā komplementer halmaz

A×B két halmaz direkt szorzata

⊂ részhalmaz (valódi)

⊆ részhalmaz

∈ eleme

∉ nem eleme

= egyenlő

≠ nem egyenlő

≥ nagyobb-egyenlő

> nagyobb

≤ kisebb-egyenlő

< kisebb

≈ közelítőleg egyenlő

¬,˄,˅ logikai tagadás, „és”, „vagy”

→, ↔ logikai következtetés, ekvivalencia

∃, ∀ logikai „létezik” és „minden” kvantorok

∞ végtelen

N természetes számok halmaza

N+ pozitív egész számok halmaza

Z egész számok halmaza

Z+ pozitív egész számok halmaza

Q racionális számok halmaza

Q+ pozitív racionális számok halmaza

Q* irracionális számok halmaza

R valós számok halmaza

C komplex számok halmaza

[a, b] zárt intervallum

]a, b[ nyílt intervallum

[a, b[ balról zárt, jobbról nyílt intervallum


|a| abszolút érték

% százalék

Elemi algebra, számelmélet

a|b a osztója b-nek

(k, n) = lnko(k, n) legnagyobb közös osztó

[k, n] = lkkt(k, n) legkisebb közös többszörös

d(n) osztók száma

am hatvány

négyzetgyök

n-edik gyök

loga b a alapú logaritmus b

lg 10-es alapú logaritmus

ln e-alapú logaritmus

2 × 2-es mátrix

2 × 2-es determináns

a1 + a2 + a3+… + an

a1 · a2 · a3 · … · an

Geometria, vektorok

┴ merőleges

║ párhuzamos

Δ háromszög

≈ hasonló

≅ egybevágó

∠ szög

° fok

AB A, B szakasz

az AB szakasz hossza

π pi(≈ 3,1415…)

P(x; y) síkbeli P pont koordinátái

P(x, y, z) térbeli P pont koordinátái

sin α szinusz alfa

cos α koszinusz alfa

tg α tangens alfa

ctg α kotangens alfa

arcsin α árkusz szinusz alfa


arccos α árkusz koszinusz alfa

arctg α árkusz tangens alfa

arcctg α árkusz kotangens alfa

a, b vektormennyiségek

a0 a irányú egységvektor

i, j, k térbeli koordinátatengelyek tengelyirányú egységvektorai

|a| vektor abszolút értéke (hossza)

a · b = < a; b > vektorok skaláris szorzata

a×b vektorok vektoriális szorzata

abc = (a × b) · c vegyes szorzat

Függvények, matematikai analízis, valós és komplex függvények

sup A az A halmaz felső határa

inf A az A halmaz alsó határa

int A az A halmaz belső pontjainak halmaza

H′ a H halmaz torlódási pontjainak halmaza

az (an) sorozat határértéke

az (an) sorozat limesz inferiorja

az (an) sorozat limesz szuperiorja

az f függvény határértéke x0-ban

az f függvény jobb oldali határértéke x0-ban

az f függvény bal oldali határértéke x0-ban

B(x; ϵ) az x pont ϵ sugarú környezete

f′(x0) az f függvény x0 helyen vett di erenciálhányadosa

az f függvény x0 helyen vett jobb oldali di erenciálhányadosa

az f függvény x0 helyen vett bal oldali di erenciálhányadosa

az f függvény x0 helyen vett di erenciálhányadosa

az f függvény x0 helyen vett di erenciálhányadosa

D(f), Df az f függvény értelmezési tartománya

[xo;xo + ϵ) balról zárt, jobbról nyílt intervallum

sh x szinusz hiperbolikus függvény

ch x koszinusz hiperbolikusz függvény

th x tangens hiperbolikusz függvény

cth x kotangens hiperbolikusz függvény

arcsh x az sh x függvény inverz függvénye

f○g az f és g függvényekből alkotott közvetett (összetett) függvény

f–1 az f függvény inverz függvénye

f′(n) az f függvény n-edik deriváltja

Cn(I) az I intervallumon n-szer folytonosan di erenciálható függvények halmaza


az f függvény i-edik változó szerinti parciális deriváltja

az f függvény i-edik parciális deriváltjának j-edik parciális deriváltja

fj az f (Rn → Rk) függvény j-edik koordinátafüggvénye

∫ f(x) dx az f függvény primitív függvényeinek halmaza

az f függvény [a; b] intervallumra vonatkozó határozott integrálja

sf(Φ) az f függvény Φ felosztáshoz tartozó alsó közelítő összege

Sf(Φ) az f függvény Φ felosztáshoz tartozó felső közelítő összege

f*g az f és g függvények konvolúciója

L(f) az f függvény Laplace-transzforrnáltja

L–1(F) az F inverz Laplace-transzformáltja

Rn függvénysor n-edik maradékösszege

Sk függvénysor k-adik részletösszege

S(x) függvénysor összegfüggvénye

grad f az f függvény gradiense

div f az f függvény divergenciája

rot f az f függvény rotációja

∇ nabla operátor

az f függvény φ görbén vett vonalintegrálja

Re z a z komplex szám valós része

lm z a z komplex szám képzetes része

a z komplex szám konjugáltja

arg z a z szám argumentuma

B(a; r) az a középpontú, r sugarú nyílt körlemez

az a középpontú, r sugarú zárt körlemez

az f függvény reziduuma az a pontban

Laplace-operátor

Fraktálok

d[a,b] a és b távolsága

F(H) a H halmaz képe az F leképezésnél

A IFS invariáns halmaza

H(B, C) B és C ponthalmazok Hausdor -távolsága

W(B) leképezések uniója

W[n](B) a W n-edik iteráltja

s boxdimenzió

Nr egy halmazt lefedő r élő négyzetek száma


Kombinatorika, valószínűségszámítás

n! n faktoriális

n alatt a k

Pn n elem ismétlés nélküli permutációinak a száma

n elem ismétléses permutációinak a száma

n elem ismétlés nélküli k-ad osztályú variációinak a száma

n elem ismétléses k-ad osztályú variációinak a száma

n elem ismétlés nélküli k-ad osztályú kombinációinak a száma

n elem ismétléses k-ad osztályú kombinációinak a száma

Ω eseménytér

P valószínűség

P(A|B) feltételes valószínűség

ξ, η valószínűségi változók

ξE az E eseményhez tartozó karakterisztikus valószínűségi változó

F(x|y) feltételes eloszlásfüggvény

f(x|y) feltételes sűrűségfüggvény

lim st sztochasztikus konvergencia

Φ standard normális eloszlás eloszlásfüggvénye

E(ξ) a ξ valószínűségi változó várható értéke

D(ξ) a ξ valószínűségi változó szórása

Gξ(x) a ξ diszkrét valószínűségi változó generátorfüggvénye

φξ(t) a ξ valószínűségi változó karakterisztikus függvénye

c(X, Y) X és Y valószínűségi változók kovarianciája

γ(X; Y) X és Y valószínűségi változók korrelációja

átmenetvalószínűségek mátrixa

Algebra, kódelmélet

Φn(x) körosztási polinom

R(f(x), g(x)) polinomok rezultánsa

D(f(x)) polinom diszkriminánsa

P′(x) polinom formális deriváltja

σi(x1, x1, …, xn) elemi szimmetrikus polinomok

AT mátrix transzponáltja

det(A), |A| négyzetes mátrix determinánsa

kA(x), mA(x) négyzetes mátrix karakteriszikus polinomja és minimálpolinomja

kφ(x), mφ(x) lineáris transzformáció karakterisztikus és minimálpolinomja

En egységmátrix

≤ altér, részcsoport, részgyűrű, részmodulus

⊲ normálosztó (csoportban), ideál (gyűrűben)

≅ izomor a (algebrai struktúrák közt)


〈X〉 részhalmaz által generált altér, illetve részcsoport

G/N faktorcsoport

R/I faktorgyűrű

W┴ merőleges altér

U⊕W alterek direkt összege

dim(V) vektortér dimenziója

Ker(φ), Im(φ) leképezés magja és képe

φ* lineáris transzformáció adjungáltja

R[x] polinomgyűrű (gyűrű felett)

o(g), |g| elem rendje csoportban

CG(g) elem centralizátora csoportban

Z(G) csoport centruma

Sn, An szimmetrikus csoport, alternáló csoport

T|F testbővítés

[T:F] testbővítés foka

F(S) generált résztest

Gal(K|F) testbővítés Galois-csoportja

˄, ˅ metszet és unió műveletek hálóban

φ(n) Euler-függvény

μ(n) Möbius-függvény

π(x) x-nél nem nagyobb pozitív prímek száma

≡ kongruenciareláció

ā kongruenciaosztály

ordm a a rendje modulo m

indr a index (diszkrét logaritmus)

Legendre-szimbólum

d(x, y) Hamming-távolság

d(C) kód minimális távolsága

w(x) kódszó súlya

w(C) kód minimális súlya

C┴ duális kód

S(y) szindrómavektor

Ham(r, q) Hamming-kód

G11, G12, G23, G24, Golay-kódok

A görög ábécé betűi

A, α alfa

B, β béta

Γ, γ gamma

Δ, δ delta

E, ϵ epszilon

Z, ζ zéta

H, η éta
Θ, θ théta

I, ı ióta

K, κ kappa

Λ, λ lambda

M, μ mű

N, ν nű

Ξ, ξ kszi

O, o omikron

Π, π pi

P, ρ rhó

∑, σ szigma

T, τ tau

Y, υ üpszilon

Φ, φ

X, χ khi

Ψ, ψ pszi

Ω, ω ómega
1. Halmazok
1.1. Alapfogalmak
1.2. Műveletek halmazokkal
1.3. A természetes számok halmaza, oszthatóság, számelmélet
1.4. További számhalmazok, halmazok számossága

1.1. Alapfogalmak
A valamilyen szempontból azonos tulajdonsággal rendelkező dolgok összességét halmaznak mondjuk. A halmaz fogalmát
nem de niáljuk, a halmaz és a halmazhoz való tartozás fogalmakat a szemléletből fogadjuk el. Ha egy dolog valamely
halmazhoz tartozik, azt mondjuk, hogy eleme a halmaznak. Egy halmazt akkor tekintünk adottnak, ha minden dologról
egyértelműen eldönthető, hogy eleme (vagy nem eleme) ennek a halmaznak. Pl. „Magyarország templomai”-ból halmazt
alkothatunk, mert minden dologról egyértelműen eldönthető, hogy magyarországi templom vagy sem. De a „magas úk”-
ból nem alkothatunk halmazt, mert nem dönthető el egyértelműen, hogy „valami” magas ú vagy sem. A halmazokat
általában az ábécé nagybetűivel, a halmaz elemeit pedig az ábécé kisbetűivel jelöljük. Ha a eleme az A halmaznak, akkor azt
így jelöljük: a ∈ A, ha a nem eleme az A halmaznak, akkor: a ∉ A. A halmazokat általában kapcsos zárójelben, vagy az egyes
elemeket vesszővel elválasztva, vagy a halmaz elemeinek közös tulajdonságát leírva adjuk meg. A halmazokat szokásos
különböző zárt görbékkel szemléltetni. Az ilyen szemléltetést Venn-diagramnak nevezzük.

1.1. ábra

Példák
Hány eleműek az alábbi halmazok?
A: = {a, b, c, d, e},
B: = {Az egyjegyű, pozitív páros számok halmaza},
C: = {A 0 ≤ x ≤ 1 valós számok halmaza},
D: = {A–12-nél kisebb pozitív egész számok halmaza} stb.

Az A halmaznak 5 eleme van: a, b, c, d és e. A B halmaznak 4 eleme van: a 2, 4, 6 és 8. A C halmaznak végtelen sok


eleme van, míg a D halmaznak egyetlen eleme sincs.

Az olyan halmazt, melynek egyetlen eleme sincs, üres halmaznak nevezzük; jele: Ø. Ha egy halmaz elemeinek a száma
véges, véges halmaznak mondjuk, ha a halmaz elemeinek a száma végtelen, végtelen halmaznak nevezzük.

A fenti példákban az A és B halmazok véges halmazok, a C halmaz végtelen halmaz, míg a D halmaz üres halmaz.
Két halmazt egyenlőnek mondunk, ha ugyanazok az elemei. Ha A és B egyenlő halmazok, akkor azt így jelöljük: A = B.

Egy A halmaz a B halmaznak részhalmaza, ha az A halmaz minden eleme eleme a B halmaznak is, vagy másként
fogalmazva, ha A-nak nincs olyan eleme, mely a B-nek ne lenne eleme. E részhalmazviszonyt így jelöljük: A ⊆ B.

Mindebből következik, hogy


- az üres halmaz minden halmaznak részhalmaza;
- minden halmaz részhalmaza önmagának;
- ha egy halmaz nem az üres halmaz, akkor legalább két részhalmaza van;
- ha A ⊆ B és B ⊆ A, akkor A = B;
- ha A ⊆ B és B ⊆ C, akkor A ⊆ C.

Az A halmazt a B halmaz valódi részhalmazának mondjuk, ha A részhalmaza B-nek, de az A halmaz nem azonos a B
halmazzal. Ennek jele: A ⊂ B.

Példák
1. Legyenek az A és B halmazok a következők:
A: = {A pozitív páros számok halmaza},
B: = {A pozitív, 4-gyel osztható számok halmaza}.
Ekkor nyilván B ⊂ A.
2. Legyen az A halmaz egy adott osztály tanulóinak a halmaza, a B halmaz ezen osztály lánytanulóinak a halmaza, C
halmaz pedig az osztály Katalin keresztnevű tanulóinak a halmaza. Ekkor nyilván C ⊆ B ⊆ A. (Természetesen
előfordulhat ebben az esetben, hogy C az üres halmaz.)
3. Legyen A : = {x | 1 ≤ x ≤ 6}, B : = {x | 2 ≤ x ≤ 5}! Ekkor B ⊂ A.
4. Írjuk fel egy 4 elemű halmaz összes részhalmazát. Legyen A : = {1, 2, 3, 4}. Az A halmaz részhalmazai:
{Ø}, {1}, {2}, {3}, {4}, {1, 2}, {1, 3}, {1, 4}, {2, 3}, {2, 4}, {3, 4}, {1, 2, 3}, {1, 2, 4}, {1, 3, 4}, {2, 3, 4}, {1, 2, 3, 4}.
Tehát az A halmaznak 16 részhalmaza van.

Könnyen igazolható, hogy

egy n elemű halmaz részhalmazainak a száma: 2n.

Ha ugyanis az A halmaznak n eleme van, akkor


0 elemű részhalmaza 1 db van: az üres halmaz.
1 elemű részhalmaza n db van.

2 elemű részhalmaza db van, hiszen az n elemből ennyiféleképpen lehet kiválasztani (a kiválasztás sorrendjére
való tekintet nélkül) 2 db-ot.

Általában k elemű részhalmaza db van.


Tehát az n elemű halmaz részhalmazainak a száma:

Valamely A halmaz részhalmazainak halmazát az A halmaz hatványhalmazának nevezzük.

nbsb

Ha a H halmaznak az A halmaz egy részhalmaza, akkor a H halmaz azon elemeinek a halmazát, melyek A-nak nem
elemei, az A halmaznak H-ra vonatkozó komplementer halmazának mondjuk. Ilyenkor a H halmazt alaphalmaznak
nevezzük. Az A halmaz komplementerét Ā-sal jelöljük.

1.2. ábra

Ha például az A halmaz a pozitív egész számok halmaza, a B halmaz pedig a pozitív páros számok halmaza, akkor a B̄
halmaz (vagyis a B halmaz A halmazra vonatkozó komplementere) a pozitív páratlan számok halmaza. Nyilván A̿ = A.

1.2. Műveletek halmazokkal


A halmazok között műveleteket végezhetünk.

Két halmaz uniója (egyesítése): Az A és B halmaz uniója olyan halmaz, melynek elemei vagy az A, vagy pedig a B
halmazba beletartoztak. Az unió jele: A ⋂ B.
Két halmaz metszete (közös része): Az A és B halmazok metszete olyan halmaz, melynek elemei az A halmazba is és
a B halmazba is beletartoznak. A metszet jele: A ⋃ B.

1.3. ábra

Hasonlóan értelmezhetjük 2-nél több (de véges sok) halmaz metszetét és unióját is.
Ha A és B két halmaz, továbbá Ø az üres halmaz, akkor igazak az alábbi halmazegyenlőségek:

Könnyen belátható az alábbi két halmazegyenlőség:

Bármely A, B és C halmazokra igazak az alábbi egyenlőségek:


a) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C),
b) (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C).

1.4. ábra

Két halmaz különbsége. Az A és B halmazok különbsége olyan halmaz, melynek elemei az A halmazba beletartoznak,
de a B halmazba nem. A különbséghalmaz jele: A \ B.

1.5. ábra

Míg két halmaz uniója és a metszete kommutatív művelet, két halmaz különbsége már nem az: A\B≠B\A.
Igazak az alábbi azonosságok:

(A két utóbbi azonosságot de Morgan-azonosságoknak nevezzük.)


Értelmezünk még egy szorzási műveletet két halmaz között.
Az A és B halmazok direkt szorzata (vagy más néven Descartes-féle szorzata) olyan rendezett párok halmaza, mely
párok első eleme az A halmaznak, második eleme pedig a B halmaznak eleme. Ennek jelölése: A × B.

Ha például A : = {1, 2, 3} és B : = {5, 6}, akkor

E meghatározásból következik, hogy a direkt szorzat nem kommutatív. Könnyen megmutatható, hogy e művelet nem
is asszociatív.

Példák
1. Egy sport tagozatos osztályban – ahol mindenki sportol – atletizálnak, birkóznak és cselgáncsoznak a tanulók.
Négy olyan diák van, aki mindhárom sportot űzi. Akik pontosan 2 sportot űznek, 13-mal kevesebben vannak,
mint azok, akik pontosan egy sportot űznek. Akik csak birkóznak, háromszor annyian vannak, mint akik csak
atletizálnak, és harmadannyian vannak, mint akik csak cselgáncsoznak. Melyik állítás lehet igaz?
a) Osztálylétszám: 40 fő,
b) osztálylétszám: 41 fő,
c) osztálylétszám: 42 fő,
d) osztálylétszám: 43 fő,
e) osztálylétszám: 44 fő.
Készítsünk halmazábrát a feladat szövege alapján!

1.6. ábra

A feltételek szerint: a + b + c + 13 = x + 3x + 9x = 13x.


Az osztálylétszám: a + b+ c + 13x + 4 = 13x–13 + 13x + 4 = 26x–9.
Ez nyilván egész szám, így az egyes pontokban szereplő osztálylétszámok közül csak olyan jöhet számításba,
melyhez 9-et hozzáadva 26-tal osztható számot kapunk. Ez csak a d) esetben teljesül: 26x – 9 = 43, azaz x = 2. Tehát
az osztálylétszám csak 43 lehet.
2. Egy 28 fős sport tagozatos osztályban minden diák sportol: 11-en atletizálnak, 13-an birkóznak és 15-en
cselgáncsoznak. 19 diák egy sportot űz, és azok száma, akik pontosan két sportot űznek 5-tel nagyobb, mint azok
száma, akik mindhárom sportot űzik. Hány olyan diák van az osztályban, akik pontosan két sportot űznek?
Készítsünk az adatoknak megfelelő halmazábrát!

1.7. ábra

Vagyis azok száma, akik pontosan két sportot űznek: 7.


1.3. A természetes számok halmaza, oszthatóság, számelmélet
A természetes számok halmaza a nem negatív egész számokat tartalmazza. Ennek jele: N. Tehát a természetes számok
halmaza: N : = {0, 1, 2, 3, 4, 5, …}. A természetes számok halmaza végtelen halmaz.
A természetes számok halmazának elemei között műveleteket értelmezünk. Kezdjük ezt az összeadás és a szorzás
műveletével!
Ha a és b ∈ N, akkor a + b és ac szintén az N halmaznak eleme.
E műveletek tehát nem vezetnek ki a természetes számok halmazából.
Azt mondjuk, hogy ha egy halmazbeli művelet eredménye nem vezet ki a halmazból (tehát a művelet eredménye
szintén eleme a kérdéses halmaznak), akkor e halmaz erre a műveletre nézve zárt halmaz. Ha a művelet eredménye már
egy másik (általában bővebb) halmazba is tartozhat, akkor azt mondjuk, hogy e halmaz erre a műveletre nézve nyílt
halmaz.
Tehát a természetes számok halmaza az összeadásra és a szorzásra nézve zárt halmaz.
E két művelet fontos tulajdonságai

Tehát az összeadás és a szorzás művelete kommutatív (felcserélhető), asszociatív (csoportosítható), és az összeadás a


szorzásra nézve disztributív.

Legyen a, b ∈ N. Azt mondjuk, hogy az a szám osztható b-vel, ha létezik olyan c ∈ N, melyre a = b · c. Ilyenkor a b
számot az a szám osztójának, az a számot a b szám többszörösének nevezzük, mindezt így jelöljük: b | a.

Tehát egy természetes szám osztói azok a természetes számok, amelyek maradék nélkül megvannak benne. Nyilván
minden szám osztható 1-gyel és önmagával, ezért e két osztót a kérdéses szám nem valódi osztóinak mondjuk, míg e két
osztón kívül a többi osztót valódi osztónak nevezzük.
Fontosak az alábbi oszthatósági szabályok.
2-vel a páros számok (és csak ezek) oszthatók (vagyis azok a számok, amelyek utolsó számjegye páros).

Például: 3874, 29 016, 10 203 040 oszthatók 2-vel, de 5431, 37 567, 20 067 nem oszthatók 2-vel.

3-mal azok és csak azok a számok oszthatók, melyek számjegyeinek összege is osztható 3-mal.

Például: 34 581 osztható 3-mal, mert 3 + 4 + 5 + 8+1 = 21 osztható 3-mal, de 2896 nem osztható 3-mal, mert 2 + 8 + 9 + 6 =
25 nem osztható 3-mal.

4-gyel azok és csak azok a számok oszthatók, melyek utolsó két jegyéből alkotott kétjegyű szám osztható 4-gyel.

Például: 125 060 osztható 4-gyel, mert 60 osztható 4-gyel, de 3986 nem osztható 4-gyel, mert 86 nem osztható 4-gyel.

5-tel azok és csak azok a számok oszthatók, melyek 5-re vagy 0-ra végződnek.
6-tal azok és csak azok a számok oszthatók, melyek 2-vel is és 3-mal is oszthatók.

Például: 2988 osztható 6-tal, mert páros, és 2 + 9 + 8 + 8 = 27 osztható 3-mal, de 5860 nem osztható 6-tal, mert ugyan
páros, de 5 + 8 + 6 + 0 = 19 3-mal nem osztható.

7-tel azok és csak azok a számok oszthatók, melyek számjegyeit (hátulról kezdve) hármasával csoportosítva, majd az így
nyert csoportokat váltakozó előjellel összeadva, a kapott eredmény (vagy annak abszolút értéke) osztható 7-tel.

Például: 12 348 567 osztható 7-tel, mert 567 – 348 + 12 = 231 = 210 + 21 osztható 7-tel.

8-cal azok és csak azok a számok oszthatók, melyek utolsó három jegyéből alkotott háromjegyű szám osztható 8-cal.

Például: 12 880 osztható 8-cal, mert 880 osztható 8-cal, de 3454 nem osztható 8-cal, mert 454 nem osztható 8-cal.

9-cel azok és csak azok a számok oszthatók, melyek számjegyeinek összege is osztható 9-cel.

Például: 45 729 osztható 9-cel, mert 4 + 5 + 7 + 2 + 9 = 27 osztható 9-cel, de 32 892 nem osztható 9-cel, mert 3 + 2 + 8 + 9 +
2 = 24 nem osztható 9-cel.
10-zel azok és csak azok a számok oszthatók, melyek utolsó számjegye 0.
11-gyel azok és csak azok a számok oszthatók, melyeknél a páratlan helyen álló számjegyek összegének és a páros helyen
álló számjegyek összegének különbsége osztható 11-gyel.

Például: 7 381 968 osztható 11-gyel, mert 7 + 8 + 9 + 8 = 32, 3 + 1 + 6 = 10 és 32 – 10 = 22 osztható 11-gyel, de 6459 nem
osztható 11-gyel, mert 6 + 5 = 11, 9 + 4 = 13, és 13 – 11 = 2 nem osztható 11-gyel.

További fontos oszthatósági szabályok még:


- ha n osztója a-nak és n osztója b-nek, akkor n osztója a ± b-nek;
- ha n osztója a-nak és a osztója b-nek, akkor n osztója b-nek.
Bevezetjük a prímszám fogalmát.

Prímszámnak nevezzük azokat az 1-nél nagyobb egész számokat, melyek csak 1-gyel és önmagukkal oszthatók. (Az 1
nem prímszám.)

Tehát azok a számok a prímszámok, melyeknek nincs valódi osztójuk, vagy másképpen fogalmazva pontosan két
osztójuk van. Azokat az 1-nél nagyobb pozitív egészeket, melyek nem prímszámok, összetett számnak nevezzük.
Az első néhány prímszám:

Könnyen belátható, hogy

végtelen sok prímszám van.

Vajon hogyan dönthető el egy aránylag nagyobb természetes számról, hogy prímszám vagy összetett szám? Erre az
alábbi módszer igen jól alkalmazható:

Az N természetes szám legkisebb prímosztója nem nagyobb .

Ezek szerint, ha egy N természetes számról el akarjuk dönteni, hogy prímszám vagy sem, elegendő
prímosztót keresni, s ha addig nem találunk prímosztót, akkor N biztosan prímszám.

Példa. Vizsgáljuk meg ebből a szempontból az N = 1999 számot. Mivel ezért elegendő az 1999-nek 43-
nál kisebb prímosztóját keresni. A 43-nál nem nagyobb prímek:

s – amint az könnyen ellenőrizhető – az 1999 ezek egyikével sem osztható, ezért az 1999 biztosan prímszám.

Az összetett számok prímtényezők szorzatára bontásáról szól a számelmélet alaptétele:

Minden összetett szám egyértelműen felbontható prímszámok szorzatára (a tényezők sorrendjére való tekintet
nélkül).

Ez tehát azt jelenti, hogy egy összetett számot bárhogyan is kezdünk több tényezős szorzatra bontani, ha az eljárást
addig folytatjuk, amíg az egyes tényezők már mind prímszámok, akkor a végeredményben kapott szorzat (a tényezők
sorrendjétől eltekintve) mindig ugyanaz lesz.

Példa. Adjuk meg az alábbi számok prímtényezős alakját.


1. 2400 = 24 · 100 = 3 · 8 · 4 · 25 = 3 · 23 · 22 · 52 = 25 · 3 · 52,
2. 3995 = 5 · 799 = 5 · 17 · 47.

Azokat a prímszámokat, melyek között a különbség 2, ikerprímeknek nevezzük.

Bár a prímszámokról tudjuk, hogy végtelen sokan vannak, az ikerprímekkel kapcsolatban még nincs eredmény arról,
hogy ezek száma véges vagy végtelen.
Az első néhány ikerprímpár:
Megjegyzés. Látjuk, hogy két szomszédos prímszám között „kicsi“ különbségek is lehetnek. A legkisebb különbség 1,
a 2 és a 3 között. Az ikerprímek között a különbség 2. Ugyanakkor az is igaz, hogy két szomszédos prímszám között
„akármilyen nagy“ különbségek is lehetnek. Ha N egy tetszőleges természetes szám, akkor megadható N db egymás
utáni szomszédos természetes szám úgy, hogy mindegyikük összetett szám, vagyis egyetlen prímszám sincs
közöttük. Tekintsük ugyanis az alábbi N db egymást követő szomszédos egész számot:

Az első 2-vel, a második 3-mal, a harmadik 4-gyel stb., az utolsó előtti N-nel, az utolsó pedig N + 1-gyel osztható,
vagyis mindegyik összetett szám. Így valóban két szomszédos prímszám között akármilyen nagy különbségek is
lehetnek.

Két vagy több szám legnagyobb közös osztója az a szám, mely a vizsgált számok mindegyikének osztója (tehát e
számoknak közös osztója), s az ilyen közös osztók közül a legnagyobb.

Az a és b természetes számok legnagyobb közös osztóját gömbölyű zárójellel jelöljük: (a; b).

Két vagy több szám legnagyobb közös osztóját úgy kapjuk, hogy a számokat prímtényezők szorzatára bontjuk, majd a
közös prímtényezőket az előforduló legkisebb hatványkitevőn összeszorozzuk.

Példa. Legyen A = 2460, B = 5430. Ekkor A és B prímtényezős alakja:

Mivel a közös prímtényezők: 2, 3, 5, így ezek előforduló legkisebb kitevőn vett szorzata: 30. Tehát 2460 és 5430
legnagyobb közös osztója: (2460; 5430) = 30.

Két számot relatív prímnek mondunk, ha nincs közös valódi osztójuk, vagyis ha a legnagyobb közös osztójuk 1.

nbsb
A relatív prímszámokkal kapcsolatosak az alábbi oszthatósági szabályok:
- ha n osztója ab-nek, és (n; a) = 1, akkor n osztója b-nek;
- ha a osztója n-nek és b is osztója n-nek, továbbá (a; b) = 1, akkor ab is osztója n-nek.
Két szám legnagyobb közös osztóját könnyen meghatározhatjuk az euklideszi algoritmus segítségével is. Ennek
lényege a következő. A nagyobbik számot elosztjuk a kisebbikkel. Ha megvan benne maradék nélkül, akkor nyilván a
kisebb szám a legnagyobb közös osztó. Ha a maradék m, akkor az előbbi osztót elosztjuk m-mel. Ha ennek az osztásnak a
maradéka m1, akkor az utolsó osztás osztóját elosztjuk m1-gyel. Az eljárást egészen addig folytatjuk, amíg maradékul 0-t
kapunk. Az ezen eljárás végén az utolsó osztó (azaz az utolsó még nem 0 maradék) lesz a két szám legnagyobb közös osztója.

Példa. Legyen A = 2460, B = 5430, az előbbi példánkban vett két szám.


Tehát a két szám legnagyobb közös osztója a 30.

Két (vagy több) szám közös többszörösének nevezzük az olyan számot, mely minden vizsgált számnak többszöröse,
azaz melyben minden vizsgált szám megvan maradék nélkül. Nyilván két (vagy több) számnak végtelen sok közös
többszöröse van, hiszen a vizsgált számok szorzata nyilván közös többszörös, s így e szorzat minden többszöröse is közös
többszörös. Érdemes vizsgálni a közös többszörösök közül a legkisebbet.

Két vagy több szám legkisebb közös többszöröse az a szám, mely mindegyik számnak többszöröse, s az ilyen
többszörösök közül a legkisebb.

Az a és b természetes számok legkisebb közös többszörösét szögletes zárójellel jelöljük: [a; b].

Két vagy több szám legkisebb közös többszörösét úgy kapjuk meg, hogy a kérdéses számokat prímtényezőkre bontjuk,
s az egyes számokban előforduló valamennyi prímszámot az előforduló legnagyobb hatványkitevőn összeszorozzuk.

Ezek szerint tehát a legkisebb közös többszörös képzésénél – ellentétben a legnagyobb közös osztóval – nemcsak a közös
prímeket, hanem az előforduló valamennyi prímet gyelembe kell venni.

Példa. Határozzuk meg 1840 és 3400 legkisebb közös többszörösét!

Az összes előforduló prímek: 2, 5, 17, 23. Ezek legnagyobb előforduló kitevőn vett szorzata:

A legnagyobb közös osztó és legkisebb közös többszörös néhány fontos tulajdonsága:


- ha b | a, akkor [a; b] = a,
- ha (a; b) = 1, akkor [a; b] = ab,
-
ha (a; b) = d > 1, akkor .

Megjegyzés. A természetes számok prímtényezős felbontása sok egyéb kérdés megválaszolására is jól alkalmazható.
Ilyen például annak eldöntése, hogy egy természetes számnak hány db osztója van.

Ha valamely N természetes szám prímtényezős felbontása:


,
akkor az N szám osztóinak a száma: (k1 + 1) (k2 + 1) (k3 + 1) … (kr + 1).

Legyen például N = 3500! E szám prímtényezős alakja: 3500 = 22 · 53 · 7. Ezek szerint 3500 osztóinak a száma: (2 + 1)(3 +
1) (1 + 1) = 24.
Legyen most valamely természetes szám prímtényezős felbontása:

Ekkor N2 prímtényezős alakja:

Azt látjuk tehát, hogy a négyzetszámok prímtényezős felbontásában minden hatványkitevő páros, és nyilván e
tulajdonság csak a négyzetszámokra igaz. (Hasonló megfontolásból arra a következtetésre jutunk, hogy minden
köbszám prímtényezős alakjában minden prím hatványkitevője 3-mal osztható, s általában, ha valamely
természetes szám n-edik hatvány, akkor a prímtényezős felbontásában minden hatványkitevő osztható n-nel.)
Nézzük most meg a négyzetszám osztóinak a számát:

Mivel e szorzat minden tényezője páratlan, ezért a négyzetszámoknak (és csakis a négyzetszámoknak) páratlan
számú osztójuk van. A négyzetszámokról mondottakból az is következik, hogy ha egy p prímszám osztója egy
négyzetszámnak, akkor p2 is osztója kell, hogy legyen.
Egyéb módon is eldönthető sok esetben egy természetes szám négyzetszám volta. Vizsgáljuk meg, hogy a természetes
számok négyzetének utolsó számjegyei milyen számok lehetnek!

n n2

…1 …1

…2 …4

…3 …9

…4 …6

…5 …5

…6 …6

…7 …9

…8 …4

…9 …1

…0 …0

A táblázatból kiolvasható, hogy egy természetes szám négyzetének utolsó számjegye nem lehet 2, 3, 7 vagy 8.
Ugyancsak a prímtényezős felbontás segítségével állapíthatjuk meg egy természetes szám osztóinak az összegét. Ha
valamely N természetes szám prímtényezős felbontása:

akkor az N szám osztóinak összege:

Az elmúlt évezredek kutatásai során számtalan sok érdekes tulajdonsággal rendelkező természetes szám került elő.
Ilyenek például a tökéletes számok és a barátságos számok.

Egy számot tökéletes számnak nevezünk, ha egyenlő a nála kisebb osztóinak az öszszegével.

Az első 4 tökéletes szám: 6, 28, 496, 8128. Ezeket már az ókorban is ismerték. Az ötödik tökéletes számot J. M.
Regiomontanus fedezte fel a XVI. században; az ötödik tökéletes szám: 33 550 336. Eukleidész (Kr. e. 300 körül)
kimutatta, hogy ha valamely p prímszámra pk+1 – 1 ugyancsak prímszám, akkor pk(pk+1 – 1) biztosan tökéletes szám.
Leonard Euler (1707–1783) svájci származású matematikus bebizonyította, hogy Eukleidész állításának megfordítása
is igaz, vagyis minden páros tökéletes szám a fenti alakú, ahol pk+1 – 1 prímszám. Páratlan tökéletes számot még nem
sikerült találni, ami nem mond ellent annak, hogy végtelen sok létezzen.
A ma ismert legnagyobb tökéletes szám: 230402456 · (230402457 – 1). (2005. októberi adat.)

Két természetes számot barátságos számoknak mondunk, ha az egyik nála kisebb osztóinak összege egyenlő a
másikkal és fordítva.

A legismertebb barátságos számpárok:


Példák
1. Igazoljuk, hogy bármely páratlan szám négyzete 8-cal osztva 1 maradékot ad! Legyen a vizsgált páratlan szám 2k
+1. Ennek négyzete:

A kapott kéttagú összeg első tagja osztható 8-cal, hiszen k és k + 1 két szomszédos egész szám, így valamelyik
biztosan páros. Tehát a kérdéses páratlan szám négyzete 8-cal osztva valóban 1-et ad maradékul.
2. Jelöljük d(N)-nel az N természetes szám osztóinak a számát! Bizonyítsuk be, hogy ha valamely N természetes
számra d(d(N)) = 3, akkor N nem osztható 30-cal!
Ha d(d(N)) = 3, akkor d(N) prímtényezős alakja d(N) = p2. Ez azt jelenti, hogy N prímtényezős alakja N = qp2-1 vagy
N = q1p-1·q2p-1, ahol q, q1 és q2 prímszámok és q1≠q2. Ezek szerint ha d(d(N)) = 3, akkor N prímtényezős
felbontásában legfeljebb két különböző prímszám szerepelhet csak. Mivel 30 = 2 · 3 · 5, vagyis 30 prímtényezős
felbontásában három különböző prím szerepel, így valóban, ha d(d(N)) = 3, akkor N nem lehet 30-cal osztható.
3. Igazoljuk, hogy 5 db egymást követő egész szám négyzetének összege nem lehet négyzetszám! Legyen az 5 egymás
utáni pozitív egész szám közül a középső n. Ekkor azt kell belátnunk, hogy nincs olyan pozitív egész k, amelyre

Ez utóbbi egyenlőség akkor és csak akkor teljesül, ha n2 + 2 osztható 5-tel, azaz utolsó számjegye 0 vagy 5. Ez
viszont azt jelentené, hogy n2 utolsó jegye 8 vagy 3. De tudjuk, hogy négyzetszám nem végződhet sem 3-ra, sem 8-
ra, így n2 + 2 nem lehet 5-tel osztható, így valóban: öt egymást követő természetes szám négyzetének összege nem
lehet négyzetszám.

A természetes számok vizsgálata során számtalan állítást, tételt fogalmazhatunk meg. Közülük soknak a
bizonyításánál használhatjuk a teljes indukciós bizonyítási eljárást. Ennek lényege a következő:
1. A bizonyítandó állítást először ellenőrizzük néhány kezdő pozitív egészre: n = 1-re, n = 2-re.
2. Feltételezzük, hogy k egy olyan természetes szám, melyre igaz az állítás (tudjuk, hogy ilyen k szám létezik, hiszen 1.-ben ezt
ellenőriztük).
3. Megmutatjuk, hogy ha k-ra igaz az állítás, akkor a rákövetkező természetes számra, k + 1-re is igaz.
Ekkor a kérdéses állítás minden természetes számra igaz.

Példák
1. Igazoljuk az első n db pozitív egész szám köbének összegéről szóló alábbi egyenlőséget:

n = 1-re, illetve n = 2-re az állítás igaz, hiszen

Legyen k egy olyan természetes szám, melyre teljesül:

Most ezt felhasználva igazoljuk, hogy e tulajdonság öröklődik k + 1-re, vagyis igazoljuk, hogy

A bal oldali első k db tag helyébe beírhatjuk az előző egyenlőséget (az ún. indukciós feltevést). Azt kapjuk:

Mindkét oldalt elosztva (k + 1)2-nel:


Tehát az állítás k-ról k + 1-re öröklődik, így valóban minden pozitív egész számra igaz.
2. Bizonyítsuk be, hogy ha n pozitív egész szám, akkor 32n+1 + 40n – 3 osztható 64-gyel. n = 1-re az állítás igaz, hiszen
33 + 40 – 3 = 64, ami nyilván osztható 64-gyel.
Legyen k egy olyan természetes szám, melyre 32k+1 + 40k – 3 osztható 64-gyel, és ezt felhasználva vizsgáljuk meg
32(k + 1) + 1 + 40(k + 1) – 3 osztható-e 64-gyel.

A kapott öttagú összeg első három tagja – feltevésünk szerint – osztható 64-gyel, így már csak azt kell belátnunk,
hogy 8 · 32k+1 + 40 osztható 64-gyel. Ez utóbbi állítás igazolásához alkalmazzuk újra a teljes indukció módszerét!
k = 1-re igaz az állítás, hiszen 8 · 27 + 40 = 256 = 256 = 4 · 64. Legyen r egy olyan természetes szám, melyre 8 · 32r+1 +
40 osztható 64-gyel, és ezt felhasználva vizsgáljuk meg, vajon 8 · 32(r+1) + 1 + 40 osztható-e 64-gyel.

A kapott háromtagú összeg első két tagja – indukciós feltevésünk miatt – osztható 64-gyel, az utolsó tag pedig
nyilván 64-nek többszöröse. Ezzel az eredeti állítás bizonyítását elvégeztük.

1.4. További számhalmazok, halmazok számossága


A kivonás műveletét vizsgálva arra jutunk, hogy ha a és b ∈ N, akkor a – b már nem biztos, hogy eleme lesz az N
halmaznak. Tehát a kivonás művelete kivezethet a természetes számok halmazából: így jutunk el a negatív egész számok
halmazához. Ezek a 0-nál nagyobb egész számok ellentettjeként foghatók fel.
A negatív és pozitív egész számokat és a 0-t egész számoknak nevezzük. E halmaz jele: Z. A Z halmaz az összeadásra, a
szorzásra és a kivonásra nézve zárt halmaz, és a Z halmazban továbbra is igazak a korábbi tulajdonságok: ha a, b és c ∈ Z,
akkor

Az osztásra nézve a Z halmaz már nem zárt: ha a és b ∈ Z, akkor a : b már nem biztos, hogy eleme a Z halmaznak. Az új,

alakú számok a törtszámok. Legyenek a, b, c és d pozitív egész számok és b ≠ 0, d ≠ 0. Ekkor az törtek akkor
és csak akkor egyenlők, ha ad = bc.

Az alakú számokat, ahol a és b ∈ Z és b ≠ 0 racionális számoknak nevezzük. A racionális számok tehát olyan
számok, melyek felírhatók két egész szám hányadosaként.

A racionális számok halmazát Q-val jelöljük. Ha p és r ∈ Q (r ≠ 0), akkor a

számok is a Q halmaz elemei. Mondhatjuk tehát, hogy a Q halmaz a négy alapműveletre nézve zárt halmaz.

Mivel a 0 · x = a (a ≠ 0) egyenletnek nincs megoldása, hiszen 0 · x minden x-re 0, ezért az hányadosnak nincs
értelme. (A 0 · x = 0 egyenletnek minden Q-beli elem megoldása lenne, vagyis nem lenne egyértelmű.) Mivel így a 0 · x = a
egyenletnek vagy nincs megoldása, vagy minden x ∈ Q megoldása, ezért a Q halmazon a 0-val való osztást nem
értelmezzük.

A négyzetgyökvonás a Q halmazon nem mindig végezhető el. Ha p ∈ Q, akkor nem biztos, hogy eleme a Q
halmaznak. Ez tehát azt jelenti, hogy ha egy szám felírható két egész szám hányadosaként, a négyzetgyöke nem biztos,
hogy felírható két egész szám hányadosaként.

Azokat a számokat, melyek nem írhatók fel két egész szám hányadosaként, irracionális számoknak nevezzük.

Az irracionális számok halmazát Q*-gal jelöljük.

Irracionális számok például: stb.

Megmutatjuk, hogy irracionális szám.


A szám irracionális, azaz nem írható fel két egész szám hányadosaként.

A bizonyítást indirekt úton végezzük. Tegyük fel – az állítással ellentétben –, hogy felírható két egész szám

hányadosaként: , ahol a p és q egészek relatív prímek.

(Ha p és q nem relatív prímek, akkor a törtet addig egyszerűsítjük, míg azok lesznek.)
Ekkor 2q2 = p2, ami azt jelenti, hogy p2, azaz p is páros szám: p = 2k. Ezzel

Ez utóbbi egyenlőség viszont azt jelenti, hogy q2, azaz q is páros szám. Ha tehát felírható két relatív prím egész
szám hányadosaként, akkor mindkét szám páros. Ez nyilvánvaló ellentmondás, amit csak úgy oldhatunk fel, hogy
kiindulási feltételezésünk helytelen volt, vagyis valóban irracionális.
Általában ha n egy természetes szám, akkor vagy egész szám, vagy irracionális szám. Ha n négyzetszám: n =
k2 valamilyen k pozitív egész számra, akkor nyilván egész szám. Ha viszont n nem négyzetszám; n ≠ k2, akkor

irracionális szám.

Mivel minden természetes szám egész szám, és minden egész szám racionális, ezért az N, Z és Q halmazok
részhalmazviszonyban vannak egymással. De a Q és Q* halmazok diszjunkt halmazok (azaz a metszetük az üres halmaz),
így a fent vázolt halmazokat az alábbi módon szemléltethetjük:

1.8. ábra

A racionális és irracionális számok halmazának unióját a valós számok halmazának mondjuk, és R-rel jelöljük: R = Q ∪
Q*.

Gyakran használjuk a valós számok halmaza elemeinek tizedes tört alakját. Ha valamely valós szám tizedes tört alakja
véges vagy végtelen szakaszos, akkor a kérdéses valós szám biztosan felírható két egész szám hányadosaként, tehát az ilyen
szám biztosan racionális szám. Ha a valós szám tizedes tört alakja végtelen, nem szakaszos tizedes tört, akkor a kérdéses
valós szám nem írható fel két egész szám hányadosaként, azaz irracionális szám.
A valós számok halmazának elemei, valamint a számegyenes pontjai között kölcsönösen egyértelmű megfeleltetést
hozhatunk létre, így a valós számokat a számegyenesen szemléltethetjük.

1.9. ábra

Szemléltessük a számegyenesen pl. a irracionális számnak megfelelő pontot!

1.10. ábra
Egy halmaz elemeinek a számát a halmaz számosságával jellemzünk. Ha az A halmaz véges, n elemű halmaz, akkor
számossága: n, vagyis az elemeinek a száma.

A végtelen halmazok számosságát másképpen kell meghatároznunk.

Ha két halmaz elemei között kölcsönösen egyértelmű megfeleltetés létesíthető, akkor azt mondjuk, hogy e két halmaz
számossága egyenlő.

Példaként nézzük a pozitív egész számok halmazát (N+), és legyen P a pozitív páros számok halmaza. Minden N+-beli n
elemhez hozzárendelhetjük a P-beli 2n elemet. Ekkor bármely N+-beli elemnek lesz megfelelője P-ben, és bármely P-beli
elemnek lesz megfelelője N+-ban, továbbá N+ két különböző elemének P-ben is két különböző elem felel meg és fordítva.
Ezek szerint N+ és P elemei között egy kölcsönösen egyértelmű megfeleltetést hoztunk létre, így az N+ és a P halmazok
számossága megegyezik.
Sok esetben járhatunk el hasonlóképpen, és így sok végtelen halmaz elemei és N+ elemei között létrehozhatunk
kölcsönösen egyértelmű megfeleltetést.

Ha valamely H halmaz számossága megegyezik az N+ halmaz számosságával, akkor H-t megszámlálható


számosságúnak mondjuk.

A pozitív racionális számok halmaza megszámlálható számosságú halmaz.

E tétel tehát azt mondja ki, hogy a Q+ halmaz számossága megegyezik N+ számosságával, azaz e két halmaz elemei
között létesíthető kölcsönösen egyértelmű megfeleltetés.

Azt kell megmutatnunk, hogy az alakban felírt pozitív racionális számok és az n pozitív egész számok között
létesíthető kölcsönösen egyértelmű hozzárendelés.

Tekintsük az alábbi végtelen számtáblázatot, mely nyilván tartalmazza az összes pozitív racionális számot. Pl. a

az 5. sorban a 4. helyen van, s általában az racionális szám a k-adik sorban az n-edik helyen található.

Írjuk le a táblázatban levő egyes törteket a nyilakkal jelölt vonalak mentén haladva. Ekkor az alábbi számsorozatot
kapjuk:

Számítsuk ki, hogy pl. a racionális szám e sorozatnak hányadik tagja! Könnyen észrevehetjük, hogy a
táblázatban egy-egy ferde vonal mentén található számokban a számláló és a nevező összege állandó: az n-edik ferde

vonal mentén ez az összeg éppen n + 2. Mivel 77 + 3 = 80, ezért a tört a 78. ferde sorban foglal helyet. A 78. ferde
vonalat megelőző ferde vonalakon levő racionális számok száma:
Mivel a 78. ferde vonalon az első racionális szám , a második racionális szám , a harmadik , így a

kérdéses racionális szám, a fenti számsorozatnak a 3084. tagja. Teljesen hasonló gondolatmenettel
kiszámolható, hogy a számsorozatnak melyik racionális szám lesz az n-edik tagja.

A most bemutatott eljárásból látható, hogy a pozitív egész számok halmazának elemei és a pozitív racionális számok
halmazának elemei között valóban létesíthető kölcsönösen egyértelmű hozzárendelés, így a racionális számok halmaza
valóban megszámlálható számosságú. Ugyanakkor kimutatható, hogy a valós számok halmaza és a pozitív egész számok
halmaza között nem létesíthető kölcsönösen egyértelmű hozzárendelés, így a valós számok halmaza már nem
megszámlálható (más néven kontinuum) sokaságú halmaz.

Ennek igazolásához elegendő megmutatnunk, hogy a]0; 1[intervallumban levő valós számokat nem lehet sorba
rendezni, azaz e számhalmaz elemei és a természetes számok halmazának elemei között nem létesíthető kölcsönösen
egyértelmű megfeleltetés.
Tegyük fel – indirekt –, hogy létezik egy ilyen kölcsönösen egyértelmű hozzárendelés, és legyen ez a következő:

Ha a]0; 1[intervallumban levő valós számok halmaza megszámlálható, akkor megadható e sorozat úgy, hogy az a
kérdéses valós számok mindegyikét tartalmazza.
Megmutatjuk, hogy létezik olyan 0 < a < 1 valós szám, mely nem szerepel az itt felsoroltak között. Legyen a kérdéses
valós szám tizedes tört alakja:

ahol a1 ≠ x11, a2 ≠ x22, és általában ai ≠ xii. Az így megadott tizedes tört a fenti sorozat minden tagjától különbözik.
Ebből következik, hogy a]0; 1[valós számok halmaza és a természetes számok halmaza között nem létesíthető
kölcsönösen egyértelmű megfeleltetés, így a]0; 1[valós számok halmaza nem megszámlálható, kontinuum
számosságú halmaz.

Nagy jelentőségű és fontos számhalmaz még a komplex számok halmaza. E számhalmazzal részletesebben majd a 4.
fejezetben foglalkozunk.
2. Logikai alapok
2.1. Állítások logikai értéke, logikai műveletek
2.2. Predikátumok és kvantorok
2.3. Bizonyítási módszerek

2.1. Állítások logikai értéke, logikai műveletek


Logikai szempontból állításon egy olyan kijelentést értünk, ami vagy igaz, vagy hamis, de nem lehet egyszerre mindkettő.
Például „2 · 2 = 5“ egy állítás, az igazságértékét tekintve hamis. Viszont „x > 3“ önmagában nem egy állítás, mert nincs
igazságértéke mindaddig, amíg nem ismerjük az x változó értékét. (Az ilyen kijelentéseket, amelyek egy vagy több változót
tartalmaznak, és alkalmas behelyettesítésekkel állításokat kapunk belőlük, predikátumoknak nevezzük, ezekkel a
későbbiek folyamán még részletesen foglalkozunk.)
Az állításokkal műveleteket végezhetünk el, amiknek az eredményeképp újabb állításokat kapunk. Ezek a műveletek:
- Tagadás: ¬p a p állítás tagadása.
- Logikai ''és'' (diszjunkció): p ˄ q jelentése „p és q“.
- Logikai ''vagy'' (konjunkció): p ˅ q jelentése „p vagy q, esetleg mindkettő“.
- Következtetés (implikáció): p → q jelentése „ha p, akkor q“.
- Kétirányú következtetés (ekvivalencia): p ↔ q jelentése „p pontosan akkor, ha q“.
Ezek közül a tagadás az egyetlen egyváltozós művelet, és ¬p igazságértéke mindig az ellentettje p igazságértékének: ha
p igaz, akkor ¬p hamis, ha pedig p hamis, akkor ¬p igaz. A többi művelet eredményének az igazságértékét az alábbi táblázat
foglalja össze.

p q p˄q p˅q p↔q

I I I I I I

I H H I H H

H I H I I H

H H H H I I

Minden olyan állítást, amiben egy vagy több művelet elvégzése szerepel, összetett állításnak nevezünk. Ha egy állítás
több műveletet is használ, természetesen tisztázni kell, hogy ezeket milyen sorrendben végezzük el. Ahogyan az egész
számokon értelmezett műveletek körében is van egy elfogadott elvégzési sorrend (hatványozás – szorzás – összeadás),
hasonló a helyzet a logikai műveleteknél is, ahol az elsőbbségi sorrend:

Azonos műveletek közül mindig a bal oldalit végezzük el előbb. Ha ezen szabályoktól eltérő sorrendben akarjuk egy
összetett állítás műveleteit elvégezni, akkor zárójelezést használunk.
Például a p → ¬q ˅ r formula szerint p-ből következik a „nem q vagy r“ állítás. Ha a műveleteket az előírt elsőbbségi
sorrendtől eltérően akarjuk elvégezni, azt megfelelő zárójelezéssel tehetjük meg. Ugyanezt a példát tekintve, ha azt akarjuk
kifejezni, hogy p-ből következik a „q vagy r“ állítás tagadása, akkor a „q vagy r“ állítást zárójelbe tesszük: p → ¬ (q ˅ r). Ha
pedig azt szeretnénk állítani, hogy „p-ből következik ¬q, vagy r“, akkor a következtetést tesszük zárójelbe: (p → ¬q) ˅ r.
Egy logikai formula (azaz egy logikai állításokat jelképező változókból logikai műveletek elvégzésével alkotott formula)
igazságértéke a benne szereplő állításváltozók igazságértékétől függ, és a már ismertetett szabályok alapján vázolható egy
igazságtáblázatban.

Példa. Készítsük el a p → ¬q ˅ r formula igazságtáblázatát!


A p, q és r állítások igazságértékeit tekintve összesen 8 lehetőség van, ezeket 8 különböző sorban vizsgáljuk. Az
oszlopok pedig az adott formula felépítésének a menetét követik.

p q r ¬q ¬q ˄ r p → ¬q ˅ r

I I I H I I
I I H H H H

I H I I I I

I H H I I I

H I I H I I

H I H H H I

H H I I I I

H H H I I I

Tehát a p → ¬q ˅ r formula csak abban az esetben hamis, ha p és q igazak, míg r hamis, minden más esetben igaz.

Egy összetett logikai formula érvényes (általános érvényű), illetve érvénytelen (ellentmondásos), ha benne szereplő
állításváltozók igazságértékétől függetlenül mindig igaz, illetve mindig hamis. Két logikai formula ekvivalens, ha az
igazságértékük mindig ugyanaz. Az ekvivalencia jelölése: A ≡ B. Például p ˅ ¬p egy általános érvényű, míg p ˄ ¬p egy
ellentmondásos formula. A p → q implikáció ekvivalens a ¬p ˅ q összetett állítással. Az alábbiakban felsoroljuk a
leggyakrabban használt logikai ekvivalenciákat. (Kényelmi szempontból érdemes bevezetni az I és H konstansokat,
amiknek az igazságértéke a betűjeleknek megfelelően igaz, illetve hamis.)
- Identitásszabályok: p ˄ I ≡ p, p ˅ H ≡ p.
- Dominálási szabályok: p ˅ I ≡ I, p ˄ H ≡ H.
- Ismétlés kiküszöbölése: p ˄ p ≡ p, p ˅ p ≡ p.
- Kettős tagadás: ¬p ≡ ¬p.
- Felcserélhetőségi szabályok: p ˄ q ≡ q ˄ p, p ˅ q ≡ q ˅ p.
- Asszociatív szabályok: (p ˄ q) ˄ r ≡ p ˄ (q ˄ r), (p ˅ q) ˅ r ≡ p ˅ (q ˅ r).
- Disztributív szabályok: (p ˄ q) ˅ r ≡ (p ˅ r) ˄ (q ˄ r), (p ˅ q) ˄ r ≡ (p ˄ r) ˅ (q ˄ r).
- De Morgan-szabályok: ¬ (p ˄ q) ≡ ¬p ˅ ¬q, ¬ (p ˅ q) ≡ ¬p ˄ ¬q.
- Elnyelési (abszorpciós) szabályok: p ˄ (p ˅ q) ≡p, p ˅ (p ˄ q) ≡ p.
- Implikáció kiküszöbölése: p → q ≡ ¬p ˅ q.
- Ekvivalencia kiküszöbölése: p ↔ q ≡ (p → q) ˄ (q → p).
- Kontrapozíció :p → q ≡ ¬q → ¬p.
Ezen ekvivalenciák bármelyike egyszerűen ellenőrizhető azzal, hogy a kétoldalt álló formulák igazságtáblázatát
elkészítjük és meggyőződünk arról, hogy az adott formuláknak megfelelő oszlopok megegyeznek. További ekvivalenciákat
pedig levezethetünk a fenti ekvivalenciák segítségével, vagy szintén a megfelelő igazságtáblázatok kitöltésével.

Példa. Igazoljuk, hogy a (p → ¬q) ˄ (q → r) és q → ¬ (r → p) logikai formulák ekvivalensek!


Először kiküszöböljük az implikációkat: (p → ¬q) ˄ (q → r) ≡ (¬p ˅ ¬q) ˄ (¬q ˄ r), majd az első zárójeles tényező tagjait
felcserélve a disztributív szabálynak megfelelően kiemeljük ¬q-t. Ezzel azt kapjuk, hogy (p → ¬q) ˄ (q → r) ≡ ¬q ˅ (p ˄
r). Visszatérve az implikációra, ez azzal ekvivalens, hogy q → (¬p ˄ r), végül egy kettős tagadás beillesztésével és a De
Morgan-szabály alkalmazásával ¬p ˄ r ≡ ¬p ˄ ¬ ¬r ≡ ¬ (p ˅ ¬r) ≡ ¬ (¬r ˅ p) ≡ ¬ (r → p).

2.2. Predikátumok és kvantorok


Predikátum egy olyan kijelentés, ami változót tartalmaz (esetleg többet is), és alkalmas behelyettesítésekkel igaz vagy
hamis állításokat eredményez. Az egyes változók értelmezési tartománya nem feltétlenül kell, hogy ugyanaz legyen,
például a P(f, z): „f(2) < z“ kétváltozós predikátum első változójának az értelmezési tartománya állhat mindazon f
függvényekből, amikre f(2) létezik és valós, a második változójának az értelmezési tartománya pedig a valós számok ℝ
halmaza.
A predikátumokból nemcsak behelyettesítésekkel, hanem kvanti kációval is állításokat kaphatunk. Kétféle
kvanti káció van: az univerzális és az egzisztenciális.

A P(x) egyváltozós predikátum univerzális kvanti kációja a „P(x) minden x-re igaz“ állítás, ennek a jelölése: ∀xP(x). A
P(x) egyváltozós predikátum egzisztenciális kvanti kációja a „P(x) valamely x-re igaz“ állítás, ennek a jelölése: ∃xP(x).
A ∀ és ∃ jeleket nevezzük kvantoroknak.

Természetesen a „minden“ és a „valamely“ szavak a fenti de nícióban a predikátum adott változójának az értelmezési
tartományára vonatkoznak. Az értelmezési tartomány megváltoztatásával a kvanti káció igazságértéke is megváltozhat,
például a „∀x(x2 ∈ [0, ∞))“ univerzális állítás igaz a valós számok ℝ halmazán, de hamis a komplex számok ℂ halmazán. A
„∃x(x2 = 2)“ egzisztenciális állítás pedig hamis az egész számok ℤ halmazán, de igaz a valós számok ℝ halmazán.
Egy kvanti káció igazságértékének a meghatározása néha körülményes feladat (néha meg egyenesen lehetetlen), de a
következő alapelveket érdemes követni:
- Ha a ∀xP(x) univerzális állítás igaz, akkor ennek a megállapításához vagy végig kell ellenőriznünk, hogy az értelmezési
tartomány minden x elemére P(x) egy igaz állítás, vagy egy általános érvelést kell megadnunk arra, hogy P(x) az x
megválasztásától függetlenül mindig igaz. (Végtelen értelmezési tartomány esetén csak az utóbbi jöhet szóba.)
- Ha a ∀xP(x) univerzális állítás hamis, akkor ennek a megállapításához elég egy ellenpéldát találni, azaz egy olyan értéket x-
re, amivel P(x) hamis. Esetenként előfordulhat, hogy egy ilyen példa megadása nagyon körülményes vagy lehetetlen,
viszont valamilyen érveléssel meg tudjuk indokolni, hogy az állítás nem lehet igaz az értelmezési tartomány minden
elemére.
- Ha a ∃xP(x) egzisztenciális állítás igaz, akkor ennek a megállapításához elég egy példát találni, azaz egy olyan értéket x-re,
amivel P(x) igaz. Itt szintén előfordulhat, hogy nehéz egy konkrét példát felmutatni, viszont valahogyan meg tudjuk
indokolni, hogy miért létezik egy, az állítást alátámasztó példa.
- Ha a ∃xP(x) egzisztenciális állítás hamis, akkor ennek a megállapításához vagy végig kell ellenőriznünk, hogy az értelmezési
tartomány minden x elemére P(x) egy hamis állítás, vagy egy általános érvelést kell megadnunk arra, hogy P(x) az x
megválasztásától függetlenül mindig hamis.
Ezeket az alapelveket az alábbi egyszerű táblázatban is összefoglalhatjuk:

Állítás \ Kvantor Univerzális (∀) Egzisztenciális (∃)

igaz érvelés példa

hamis ellenpélda érvelés

A fentiekből már látható, hogy egy univerzális állítás tagadása ekvivalens egy egzisztenciális állítással, és fordítva, egy
egzisztenciális állítás tagadása ekvivalens egy univerzális állítással. Ezt formulákkal is kifejezhetjük:

Többváltozós predikátumokból többféle módon képezhetünk logikai állításokat oly módon, hogy mindegyik változóra
vagy egy behelyettesítést, vagy egy kvanti kációt végzünk el. Pl. a Q(x, y): „x3 > y + 5“ (valós számokon értelmezett)
predikátumból képezhetünk állításokat kettős kvanti kációval: ∀x∀yQ(x, y), ∃x∀yQ(x, y) stb. vagy úgy, hogy az egyik
változót rögzítjük, és csak a másikra alkalmazunk kvanti kációt: ∃xQ(x, 8), ∀yQ(2, y) stb. és természetesen úgy is, hogy
mindkét változóra behelyettesítünk. A kettős kvanti kációkat a következőképp értelmezzük:
- A ∀x∀yQ(x, y) állítás jelentése, hogy minden x és y mellett Q(x, y) igaz.
- A ∀x∃yQ(x, y) állítás jelentése, hogy minden x-hez van olyan y, amivel Q(x, y) igaz.
- A ∃x∀yQ(x, y) állítás jelentése, hogy van olyan x, ami mellett minden y-ra Q(x, y) igaz.
- A ∃x∃yQ(x, y) állítás jelentése, hogy van olyan x és y, amik mellett Q(x, y) igaz.
Tehát többszörös kvantorok esetén azokat balról jobbra olvassuk. Az azonos kvantorok felcserélhetők:

viszont különböző kvantorok felcserélése már általában megváltoztatja az állítás értelmét. Például a valós számokon
értelmezett ∀x∃y(x3 > y + 5) állítás igaz (mert x tetszőleges megválasztása után y = x3 – 6 mellett igaz, hogy „x3 > y +5 “),
azonban a ∃y∀x(x3 > y + 5) állítás már hamis (mert x3 tetszőleges valós értéket felvehet, és y + 5 soha nem lehet kisebb
minden valós számnál).
Az igazságérték megindoklásánál ugyanazok az elvek vannak érvényben, amiket korábban az egyváltozós
predikátumoknál kifejtettünk, azaz minden változóra nézve vagy egy általános érvelést, vagy egy példát/ellenpéldát kell
szolgáltatnunk aszerint, hogy a változó melyik kvantorral szerepel az állításban, illetve hogy maga az állítás igaz vagy
hamis.
Visszatérve a ∃y∀x(x3 > y + 5) állításra, mivel ez egy hamis állítás, ezért ennek a precíz igazolásához az egzisztenciális
kvantorral ellátott y változóra általános érvelést, míg az univerzális kvantorral ellátott x változóra pedig egy ellenpéldát
szolgáltatunk, azonban ez a példa már függhet az y változótól. (Például: bármely y mellett az választással az „x3 >
y + 5“ állítás hamis, tehát nincs olyan y, amivel minden x-re „x3 > y + 5“ igaz lenne.) Viszont azt is megtehetjük, hogy az
eredeti állítás tagadásáról mutatjuk meg, hogy igaz: ¬∃y∀x(x3 > y + 5) ≡ ∀y(¬∀x(x3 > y + 5)) ≡ ∀y∃x ¬ (x3 > y + 5) ≡ ∀y∃x(x3 ≤ y +
5). Ezúttal egy igaz állítással van dolgunk, tehát univerzális kvantorral ellátott y változóra általános érvelést, míg az
egzisztenciális kvantorral ellátott x változóra pedig egy példát szolgáltatunk, ami lényegében ugyanaz, mint az előbbi
érvelés.

2.3. Bizonyítási módszerek


Matematikai bizonyításon egy olyan érvelést értünk, ami adott feltevésekből indul ki, és egy adott állítást igazol vagy cáfol.
Úgy is fogalmazhatnánk, hogy egy bizonyítás egy állítás igazságértékét határozza meg más állítások feltételezett
igazságértéke alapján. A feltevések halmazába általában beleértünk bizonyos axiómákat (alapigazságokat, amikről külön
bizonyítás nélkül elfogadjuk, hogy igazak), illetve az érvelésben támaszkodhatunk már korábban bizonyított állításokra is.
A legegyszerűbb bizonyítási eljárás a direkt bizonyítás, amikor is a feltevésekből kiindulva matematikai
következtetésekkel eljutunk a bizonyítandó állításhoz. Például az az állítás, hogy „ha n páros szám, akkor n2 is páros szám“,
direkt módon igazolható. Ha n páros, akkor n = 2k valamilyen k egész számmal, és így n2 = (2k)2 = 4k2 = 2(2k2) szintén páros,
mivel egy egész szám kétszerese.
Tekintsük az előző állítás megfordítását: „ha valamely n egész számra n2 egy páros szám, akkor n is páros.“ Ha ezt
próbáljuk meg direkt módon igazolni, gondba kerülünk, ugyanis az n2 páros volta azt jelenti, hogy n2 = 2l valamilyen l egész
számmal, ebből , és így nem fog kijönni, hogy n is felírható egy egész szám kétszereseként. Az indirekt
bizonyítás lényege, hogy egy adott következtetésnek a kontrapozícióját igazolja: p → q helyett a ¬q → ¬p állítást. Az iménti
állítás kontrapozíciója: „ha egy n egészre n nem páros szám, akkor n2 sem páros.“ Azaz „ha n egy páratlan szám, akkor n2 is
páratlan“. Ezt már sokkal kényelmesebb igazolni, ugyanis ha n páratlan, akkor n = 2k + 1 valamilyen k egész számmal, és
ebből n2 = 2(2k2 + 2k) + 1, tehát egy egész szám kétszeresénél eggyel nagyobb, így páratlan.
Ellentmondáson alapuló bizonyítás az, amikor a bizonyítandó állítás tagadásából vezetünk le egy hamis állítást. Ha
ugyanis ¬p → q egy matematikailag helyes következtetés, és q egy hamis állítás, akkor szükségszerűen ¬p is hamis, tehát p
igaz. (A magyar nyelvű szakirodalomban sok helyen ezt a bizonyítástípust nevezik indirekt bizonyításnak.)

Példa. Igazoljuk, hogy irracionális szám!


Ellentmondást fogunk levezetni az állítás tagadásából. Feltesszük, hogy racionális szám lenne, és ekkor =
a/b olyan alkalmas a és b egészekkel, amiket úgy is megválaszthatunk, hogy az a/b tört már nem egyszerűsíthető.
Ekkor az egyenlet átrendezésével azt kapjuk, hogy a2 = 2b2, tehát a2 egy páros szám, és ebből mint már az előbb
láttuk, a is páros kell, hogy legyen: a = 2k valamilyen k egésszel. Most ezt helyettesítsük be az a2 = 2b2 egyenlőségbe,
és azt kapjuk, hogy 4k2 = 2b2, 2-vel osztva 2k2 = b2. Ez azt jelenti, hogy b2 is páros szám, amiből pedig – mint tudjuk –
következik, hogy b is páros. Így levezettük azt az állítást, hogy a és b mindketten párosak, miközben az a/b tört nem
egyszerűsíthető, és ez nyilvánvalóan egy ellentmondás (azaz olyan állítás, ami biztosan nem igaz). Mivel az eredeti
állítás tagadása ellentmondáshoz vezet, így az állítás maga igaz: egy irracionális szám.

Bizonyos állításoknál célszerű az esetekre bontott bizonyítás: ilyenkor különböző eseteket vizsgálunk meg, amelyek
valamelyike biztosan fennáll, és minden esetre külön igazoljuk a bizonyítandó állítást. Tehát ha a q ˅ r diszjunkció biztosan
igaz, és a q → p és r → p következtetések is matematikailag igazolhatók, akkor a p állítás is igaz.

Példa. Igazoljuk, hogy bármely x valós számra |x| + |6| – x| ≥ 6!


Ha x negatív, akkor 6 – x > 6 és így |x| + | 6 – x | ≥ |6 – x| > 6. Ha 0 ≤ x ≤ 6, akkor x és 6 – x mindketten nem negatívak, így
|x| + | 6 – x | = x + (6 – x) = 6. Végül pedig ha x > 6, akkor |x| + 6 – x ≥ |x| > 6. A fentieken kívül más lehetőség nincs x-re,
az állítást ezzel igazoltuk.

Gyakran találkozunk olyan matematikai állításokkal, amik a természetes számokra mondanak ki egy általános
igazságot. Ezek formálisan ∀nP(n) alakban írhatók le, ahol P egy olyan predikátum, aminek az értelmezési tartománya a
természetes számokból áll. A teljes indukció elvét ilyen típusú állítások bizonyításakor próbálhatjuk meg alkalmazni: Ha a
P predikátum értelmezési tartománya a pozitív egész számok halmaza, P(1) egy igaz állítás, és bármely k pozitív egészre
matematikailag helyes a P(k) → P(k + 1) következtetés, akkor a ∀nP(n) állítás is igaz, azaz P(n) igaz minden n pozitív egészre.

Példa. Igazoljuk, hogy bármely n pozitív egész számra 2 · 6n ≤ 5n + 7n!


Az állítás n = 1-re igaz, hiszen 2 · 6 = 12 = 5 + 7. És amennyiben egy adott k pozitív egészre is igaz az állítás, azaz 2 · 6k ≤
5k + 7k, akkor 2 · 6k+1 = 2 · 6k · 6 ≤ (5k + 7k) · 6 = = 5k · 6 + 7k · 6 = 5k(5 + 1) + 7k(7–1) = 5k+1 + 7k+1 + (5k – 7k) < 5k+1 + 7k+1. Ezzel
beláttuk az indukciós lépést: a 2 · 6k ≤ 5k + 7k egyenlőtlenségből következik 2 · 6k+1 ≤ 5k+1 + 7k+1. Így az eredeti 2 · 6n ≤ 5n
+ 7n egyenlőtlenség minden pozitív egész n-re igaz.

A teljes indukciónak egy erősített változata a következő: Ha a P predikátum értelmezési tartománya a pozitív egész
számok halmaza, P(1) egy igaz állítás, és bármely k pozitív egészre matematikailag helyes a P(1) ˄ P(2) ˄ … ˄ P(k) → → P(k + 1)
következtetés, akkor a ∀nP(n) állítás is igaz, azaz P(n) igaz minden n pozitív egészre.

Példa. Igazoljuk, hogy minden 1-nél nagyobb egész szám előáll prímszámok szorzataként! (Magukat a prímszámokat
egytényezős szorzatnak tekintjük.)
Mivel az állítás az 1-nél nagyobb számokra vonatkozik, először n = 2-re vizsgáljuk meg, amire az állítás nyilván igaz,
hiszen 2 egy prímszám. Amennyiben pedig feltesszük, hogy az állítás 2-től valamely k egészig minden egész számra
igaz, úgy k + 1-re is igazolni tudjuk. Ugyanis ha k + 1 egy prímszám, akkor egytényezős prímszorzat, ha pedig nem
prímszám, akkor előáll a · b szorzat alakban, ahol 2 ≤ a ≤ b ≤ k. Az indukciós feltevésünk szerint a és b felírhatók
prímszámok szorzataként, így aztán a k + 1 = a · b szorzat szintén prímszámok szorzata. Ezzel beláttuk az indukciós
lépést, így az eredeti állításunk igazolást nyert.
3. Számtan, elemi algebra
3.1. Elemi számtan (a számok írásának kialakulása, műveletek különböző számokkal,
negatív számok, törtek, tizedes törtek), kerekítés, százalékszámítás
3.2. Arányok (egyenes és fordított arányosság, az aranymetszés, a π), nevezetes közepek
3.3. Algebrai kifejezések és műveletek, hatványozás, összevonás, szorzás, kiemelés,
nevezetes azonosságok
3.4. Gyökvonás, hatványozás, logaritmus és műveleteik
3.5. Számrendszerek
3.6. Egyenletek, egyenletrendszerek (fogalom, mérlegelv, osztályozás fokszám és
egyenletek száma szerint, első- és másodfokú egyenletek, exponenciális és
logaritmikus egyenletek)
3.7. Harmad- és negyedfokú egyenletek (speciális magasabb fokú egyenletek)

3.1. Elemi számtan (a számok írásának kialakulása, műveletek különböző


számokkal, negatív számok, törtek, tizedes törtek), kerekítés,
százalékszámítás
A szám absztrakció útján született elvont fogalom. Az emberiség történetének kezdetén még kevés számnév volt ismert,
ezek is inkább csak minőséget jelöltek, mint „sok“, „kevés“ stb. A számok írásának, jelölésének kialakulása és fejlődése a
különböző kultúrákban is különböző utat járt be. Az egyiptomi Rhind-papírusz tanúsága szerint Egyiptomban Kr. e. 2000
körül már kialakult 10-es számrendszerben írták a számokat, habár a 0 és a helyi érték fogalmát még nem ismerték.
Minden magasabb tízes egységet (tehát 10 hatványait) külön szimbólummal jelölték (3.1–2. ábra), s minden egyes
szimbólumból annyit írtak le, amennyi szerepelt a kérdéses számban.

3.1. ábra

Az egyes szimbólumokat nagyság szerint növekvő sorrendben, jobbról balra haladva írták le, s ha valamely 10-
hatványból nem szerepelt a kérdéses számban, az annak megfelelő szimbólumot egyszerűen kihagyták. Egyiptomban
ekkor tehát a következőképpen írták le az alábbi két számot:

3.2. ábra
Az ókori Kínában szintén ismerték a 10-es számrendszert, de a 0 és a helyi érték fogalma náluk is ismeretlen volt. Ők
szintén egy-egy szimbólummal jelölték 10 megfelelő hatványait, de külön szimbólumaik voltak az egyes számjegyekre is.
Így a leírandó számban a kérdéses 10-hatványt nem annyiszor írták le, ahányszor szerepelt a számban, hanem a megfelelő
egyes szimbólummal jelölték, hogy hány db van a megfelelő 10-hatványból (3.3. ábra).

3.3. ábra

E szimbólumokkal az ókori Kínában így írták le pl. a 4672 és 2007 számokat (3.4. ábra):

3.4. ábra

Ilyen rendszerben már jóval kevesebb szimbólumot kellett használniuk az egyes számok leírásához, mint az ókori
Egyiptomban, bár az ilyen módon leírt számokkal való műveletek elvégzése még mindig igen nehézkes lehetett. Érdekes
módon végezték el a szorzást, ehhez szorzópálcikákat használtak. Vizsgáljuk például a 13 • 24 szorzatot (3.5. ábra):

3.5. ábra

A szorzás műveletét keresztbe elhelyezett pálcikákkal végezték az ábrán látható módon. Azt számolták, hogy az egyes
kereszteződésekben hány metszéspont található. Az egyesek (3 és 4) kereszteződésében összesen 12 metszéspont van, tehát
a szorzat 2-re végződik, és a tízesek száma eggyel nő. Az egyesek és tízesek kereszteződésében (1, 4 és 2, 3) 10 metszéspont
van, ehhez hozzáadva az előbbi 1-et, a szorzat utolsó előtti jegye 1 és a százasok szintén eggyel növekednek. A tízesek
kereszteződésében (1 és 2) 2 metszéspont van, ehhez hozzáadva az előbbi 1-et, a szorzat első jegye 3. Tehát a szorzat
eredménye 312. Ezzel a módszerrel nagyobb számokat is össze tudtak szorozni.
Sajátos számírást használtak a Római Birodalomban; az ún. római számokat, melyek Európában egészen a XIV.
századig elterjedtek voltak, csak akkor kezdték kiszorítani őket az ún. arab számok. A római számok még ma is
használatosak bizonyos számok jelölésére: általában sorszámozásra, könyvek fejezeteinek számozására, de találkozunk
velük uralkodói dinasztiák neveiben, vagy éppen régi épületek építési éveinek jelölésében. Az ókori Rómából származó
számjelölési rendszer alapelvei szerint néhány kiválasztott betűnek számértéket adtak (általában 10 hatványainak és ezek
5-szöröseinek), és ezek bizonyos kombinációival fejezték ki a felírandó számot. A leggyakoribban használt római számok:

I 1

V 5

X 10

L 50

C 100

D 500

M 1000

Nagyobb számok leírására a következő szabályt használták: először leírták pl. az ezreseket, aztán a százasokat, majd a
tízeseket, végül az egyeseket. Az 5 és 10 közötti (V és X közötti) számokból az 5 (V) után írt egy, két vagy három 1-essel (I-vel)
írták le a 6, 7, 8 számokat, míg a 9-est a 10 (X) elé írt 1-essel (I-vel) jelölték:
Hasonlóképpen jártak el az 50 és a 100 (L és C) közötti, valamint az 500 és az 1000 (D és M) közötti számok jelölésekor.
Ebből következik, hogy az I csak V vagy X előtt állhat, az X csak L és C előtt, C pedig csak D vagy M előtt állhat. Például:

Érdekes a második szám (999) leírása. Több dokumentumban is találkozunk ennek IM alakjával annak ellenére, hogy
(bár egyértelmű) ez az írásmód nem felel meg a római számok leírási szabályainak.
A nagyobb számok leírására a rómaiak az alábbi módszert használták: ha egy szám fölé egy vízszintes vonalat írtak,
akkor az a szám ezerszeresét jelentette. Például 000. Ha a számot két függőleges vonal közé helyezték, akkor az a
szám milliószorosát jelentette. Például |VI| = 6 000 000. Ezek szerint
.
A 0 „felfedezése“ nagyban megkönnyítette a számok leírását, s egyben megnyitotta az utat a ma is használt helyi
értékes 10-es számrendszer kialakulásához. Mindez a Kr. u. VI–VII. században élt kiváló hindu matematikus, Brahmagupta
nevéhez fűződik. Ő azt találta, hogy elegendő csak az egyeseket jelző szimbólumokat használni, s hogy a kérdéses
szimbólum milyen 10-hatványt jelöl, az attól függ, hogy a szám leírásának sorrendjében a szimbólum éppen hol foglal
helyet. Ha tehát egy ezres nagyságrendű számról van szó, akkor legelőre írjuk az ezresek számának megfelelő szimbólumot,
második helyre a százasok számát jelölő szimbólumot, és így tovább. Így ha valamely 10-hatványból nem szerepelt a
kérdéses számban, akkor annak helyét nem kihagyni kell (ez félreértésre adhat okot), hanem a „semmit“, vagyis e 10-
hatvány hiányát egy újabb szimbólummal jelölni kell. Vélhetően így jutott el a „nulla“ fogalmához, s azt bevezetve
megszületett a helyi értékes 10-es számrendszer.
Érdekes, hogy az általunk arab számoknak nevezett számjegyek is eredetileg az ősi Indiából származnak. Indiából
Perzsián keresztül jutott el az arab világba, majd az arab hódítások révén került előbb Spanyolországba, onnan pedig a XI–
XII. században elindult egész Európába.

Műveletek a természetes számok halmazán

Műveletek a természetes számok halmazán

Összeadás
Kivonás
Szorzás
Osztás
Zárójelek használata, a műveletek sorrendje
Műveletek előjeles számokkal
Műveletek törtszámokkal
Tizedes törtek, műveletek tizedes törtekkel

Összeadás
Ha két (vagy több) pozitív mennyiséget együttesen tekintünk, akkor a mennyiségek összegét vizsgáljuk.
Bélának 38, Csabának 44 eurója van. Mennyi pénzük van összesen? A két ú összes pénzét az egyes úk pénzének
összege adja: 38 + 44 = 82. Az egyenlőség bal oldalán levő két mennyiséget összeadandóknak (vagy az összeg tagjainak)
nevezzük, a jobb oldali mennyiséget az összeadandók összegének mondjuk. Nem változik az összeg, ha az összeadandók
sorrendjét felcseréljük. Az összeadás művelete felcserélhető (kommutatív) művelet:

Ha az összeg három tagból áll, akkor közülük bármely két tag összegéhez hozzáadva a harmadik tagot, az összeg nem
változik. Az összeadás csoportosítható (asszociatív) művelet.

Az összeadás műveletét (többtagú és többjegyű tagok esetén) az alábbi módon végezzük el. Az összeadandókat
egymás alá írjuk úgy, hogy az azonos helyi értékű számjegyek egymás alá kerüljenek. Az összeadandókat aláhúzzuk,
e vonal alá kerül az összeg. Például

Az összeadást az egyesekkel kezdjük: 2 + 9 + 7 = 18. Az egyesek összege 8 egyest és egy tízest tartalmaz, tehát az egyesek
alá leírjuk a 8-at, az egy tízest pedig hozzáadjuk a tízesek összegéhez: 7 + 7 + 4 + 1 = 19. Tehát 19 tízesünk (vagyis 9
tízesünk és egy százasunk) van. A 9 tízest leírjuk a tízesek alá, az egy százast hozzáadjuk a százasok összegéhez, és így
tovább.

Kivonás
Ha valamely mennyiségből elvesszük annak egy részét, a kivonás műveletét hajtjuk végre. Úgy is fogalmazhatnánk:
kivonáskor ismerjük a kéttagú összeg egyik tagját, az összeget, és keressük a másik tagot. Az összeget kisebbítendőnek, az
ismert tagot kivonandónak, az ismeretlen tagot különbségnek nevezzük. A különbség értéke nem változik, ha a
kisebbítendőhöz és a kivonandóhoz ugyanazt a számot hozzáadjuk vagy ugyanazt a számot kivonjuk belőlük.

Többjegyű számok kivonását az alábbi módon végezhetjük el. A számokat helyi értéküknek megfelelően egymás alá
írjuk, majd az egyes helyi értékeknek megfelelően az 1-esekkel kezdve az egyes helyi értékek kivonását elvégezzük.
Például

3-ból 2-t az 1, 4-ből 3-t az 1, 9-ből 6-ot az 3, 6-ból 4-et az 2.


Ha a kisebbítendő valamely számjegye kisebb a kivonandó megfelelő helyi értékű számjegyénél, akkor
felhasználjuk azt, hogy a különbség nem változik, ha a kisebbítendőt és a kivonandót ugyanazzal a számmal
növeljük. Például

A kivonás természetesen nem felcserélhető, azaz nem kommutatív művelet. A természetes számok halmazán a kivonás
csak akkor végezhető el, ha a kisebbítendő legalább akkora, mint a kivonandó.

Szorzás
Ha egy többtagú összeg minden tagja ugyanaz a szám, akkor az összeadás műveletét szorzással is elvégezhetjük. Például

Az azonos tagokat szorzandónak, azt a számot, ahányszor vennünk kell e tagokat, szorzónak nevezzük. A szorzandót és
szorzót közös néven szorzótényezőknek hívjuk. A művelet eredménye a szorzat. A szorzótényezőket egy ponttal választjuk
el egymástól; ez a szorzás műveleti jele:

A szorzás művelete kommutatív, vagyis a szorzat értéke nem változik, ha a szorzandót és a szorzót felcseréljük. Például

A szorzás művelete asszociatív. Ez azt jelenti, hogy több tényezőt tartalmazó szorzás esetében a szorzat nem változik,
ha az egyes tényezőket tetszés szerint csoportosítjuk. Például

Ha valamelyik szorzótényező többtagú összeg, akkor vagy e tagokat összeadjuk és a kapott összeget megszorozzuk a
másik szorzótényezővel, vagy pedig az összeg minden tagját megszorozzuk a másik tényezővel, s az így kapott szorzatokat
összeadjuk. A szorzás e tulajdonságát disztributivitásnak nevezzük. Például

Ha többjegyű számot (szorzandó) szorzunk egy egyjegyű számmal (szorzó), akkor a szorzandó jegyeit az egyesektől
kezdve megszorozzuk a szorzóval, vigyázva arra, hogy a helyi értékeket is gyelembe vegyük. Például

7-szer 6 az 42 egység, tehát leírjuk a 2-est, a 4 tízes pedig „átmegy” a következő helyi értékbe. 7-szer 7 az 49, plusz az
„átjövő“ 4 az 53. Tehát leírjuk a 3-ast, az 5 százas pedig „átmegy“ a következő helyi értékbe. 7-szer 2 az 14 plusz az
„átjövő“ 5 százas az 19. Mivel több szorzótényező számjegy nincs, így e 19-et leírjuk: a szorzás végeredménye 1932.

Ha többjegyű számot (szorzandó) szorzunk többjegyű számmal (szorzó), akkor a szorzandó minden számjegyét
megszorozzuk a szorzó minden számjegyével, majd az így nyert részletszorzatokat egymás alá írjuk és összeadjuk. De
vigyáznunk kell arra, hogy a részletszorzatok egymás alá írásakor az azonos helyi értékű számjegyek egymás alá
kerüljenek. Ha például a szorzást a szorzó legnagyobb helyi értékű számjegyével kezdjük, akkor az egyes részletszorzatokat
egy-egy helyi értékkel balra írjuk. (Természetesen, ha a szorzást a szorzó legkisebb helyi értékű számjegyével kezdjük,
akkor az egyes részletszorzatokat egy-egy hellyel balra írjuk). Például

Osztás
Ha valamely szorzás esetében ismerjük az egyik tényezőt, valamint a szorzatot, akkor a másik szorzótényezőt az osztás
műveletével határozhatjuk meg. A szorzat neve: osztandó, az ismert szorzótényező neve: osztó, a keresett szorzótényezőt
(vagyis az osztás eredményét) pedig hányadosnak hívjuk. Az osztás műveleti jele az osztandó és az osztó közé írt
„kettőspont“, vagy az osztandó és az osztó közé írt törtvonal

Maradék nélküli osztás esetében a hányados értéke nem változik, ha az osztandót és az osztót ugyanazzal a 0-tól
különböző számmal megszorozzuk.
Ha többjegyű számot egyjegyű számmal osztunk, akkor az osztást az osztó legmagasabb helyi értékű számjegyével
kezdjük. Például

1-ben nincs meg a 8, így gyelembe vesszük a következő jegyet is. 19-ben a 8 megvan 2-szer. Leírjuk a 2-est, majd
„visszaszorzunk“ vele: 2-szer 8 az 16, ezt kiegészíjük 19-re, az így adódó 3-ast leírjuk a 9-es alá. Eztán a 3-as mellé írjuk
az osztandó következő jegyét, jelen esetben a 7-est. 37-ben a 8 megvan 4-szer, így a hányadosban leírjuk a 4-est, majd
„visszaszorzunk“: 4-szer 8 az 32, ehhez, hogy 37 legyen kell 5. Leírjuk az 5-öst a 7-es alá, majd melléírjuk az osztandó
soron következő jegyét, jelen esetben a 6-ot. 56-ban a 8 megvan 7-szer. Leírjuk a 7-est, aztán 7-szer 8 az 56. Ehhez,
hogy 56 legyen, nem kell semmi. Tehát a hányados 247, a maradék 0.

Ha az osztandó is és az osztó is többjegyű szám, akkor az osztandóban a legmagasabb helyi értékű jegytől számítva
annyi jegyet választunk, hogy ebben az osztó meglegyen legalább egyszer, de legfeljebb 9-szer, s eztán az előbb ismertetett
módszert alkalmazva végezzük el az osztást. Például
Most először az osztandó első két jegyét kell gyelembe vennünk. 32-ben a 26 megvan 1-szer. Leírjuk az 1-est, majd
„visszaszorzunk“. 1-szer 26 az 26; ehhez, hogy 32-t kapjunk, kell 8. Leírjuk a 8-ast, majd mellé írjuk az osztandó
következő számjegyét, a 6-ot. 86-ban a 26 megvan 3-szor. Leírjuk az eredménybe a 3-ast, majd „visszaszorzunk“: 3-
szor 26 az 78, ehhez 8-at kell adnunk, hogy 86 legyen. Leírjuk ezt a 8-ast, majd mellé írjuk az osztandó következő
jegyét, a 4-est. 84-ben a 26 megvan 3-szor. Leírjuk a 3-ast a hányados következő helyére és „visszaszorzunk“: 3-szor 26
az 78, ehhez 6-ot kell adnunk, hogy 84 legyen. Leírjuk a 6-ost, majd mellé írjuk az osztandó következő jegyét, a 7-est.
67-ben a 26 megvan 2-szer. Leírjuk a hányados megfelelő helyére a 2-est, majd: 2-szer 26 az 52, ehhez, hogy 67 legyen,
kell 15. Ezzel az osztást elvégeztük. 32 647-ben a 26 megvan 1332-szer, a maradék 15.

Zárójelek használata, a műveletek sorrendje


Ha a kiszámítandó mennyiség több műveletet is tartalmaz, akkor három fontos szabályt kell gyelembe vennünk.
1. Ha egyes műveletek zárójelben szerepelnek, akkor először azokat a műveleteket kell elvégeznünk.
2. A szorzás és az osztás magasabb rendű műveletek, mint az összeadás és a kivonás, így először ezeket a műveleteket végezzük
el.
3. Ha nincsenek zárójelek a műveletsorban, akkor az ún. „balról jobbra“ szabályt alkalmazzuk, ami azt jelenti, hogy a
műveleteket balról jobbra haladva egymás után végezzük el, természetesen gyelembe véve a 2. szabályt. Például

Előfordulhat, hogy egy műveletsorban csak szorzás és osztás szerepel. Ilyenkor (ha nem tettünk ki zárójelet, amely
utalna a műveletek elvégzésének sorrendjére) is a balról jobbra szabályt alkalmazzuk. Például

Gyakran előfordul, hogy egy zárójelen belül is külön kiszámítandó műveletek, azaz újabb zárójelek szerepelnek.
Ilyenkor általában a szögletes [] vagy, ha még szükséges, akkor a kapcsos {} zárójelet használjuk. Több egymásba
skatulyázott zárójel esetén belülről kifelé haladva először a belső, aztán a közbülső zárójelek értékét határozzuk meg, végül
pedig a legkülső zárójelben szereplő mennyiségeket, majd ezek után a kapott mennyiségeket a megfelelő szabályok szerint
összevonjuk. Például

Műveletek előjeles számokkal


A mindennapi életben számtalan olyan kérdés, probléma vetődik fel, melyek indokolják a negatív számok bevezetését. Pl. a
bevételek és kiadások egyenlegének vezetésénél vagy a különböző hőmérsékletek jelölésére a pozitív számok mellett
szükség van a negatív számokra is. Ha n egy pozitív egész szám, akkor a számegyenesen e számnak megfelelő pontot a 0-ra
tükrözve az n szám – n ellentettjét kapjuk, s „mínusz n”-nek mondjuk. A számegyenesen a 0-tól jobbra (pozitív irányban) a
pozitív, a 0-tól balra (negatív irányban) a negatív számok helyezkednek el. A pozitív és a negatív számok együttesen
alkotják az egész számok Z halmazát. E halmaz az összeadás, kivonás és szorzás műveleteire nézve zárt halmazt alkot.

Megjegyzés. A negatív számok először Kínában jelentek meg Kr. e. a II. században az elsőfokú egyenletrendszerek
vizsgálatakor. Indiában az V–VI. században alkalmazták először a negatív számokat. Európában sokáig nem
ismerték a negatív számokat, vagy egyszerűen „abszurd“ vagy „ ktív“ számoknak nevezték őket. A XIV–XV.
században a virágzó kereskedelem egyre inkább megkívánta a negatív számok használatát. A negatív számok igazi
létjogosultságot Cardano és Viète munkássága után nyertek.

Mielőtt rátérünk az egész számok Z halmazán végzett műveletekre, meg kell ismerkednünk az abszolút érték
fogalmával. Bár egyelőre csak a Z halmazban dolgozunk, az abszolút érték fogalmát minden valós számra értelmezzük. Az a
valós szám abszolút értékét így jelöljük: |a|, és az a szám előjel nélküli értékét értjük alatta. Pontosabban

Az a valós szám abszolút értéke egyenlő a-val, ha a ≥ 0, és –a, ha a < 0.


Például

Azonos előjelű számokat úgy adunk össze, hogy a számok abszolút értékét öszszeadjuk, majd az összeget az eredeti
számok előjelével látjuk el. Például

Két különböző előjelű számot úgy adunk össze, hogy a nagyobb abszolút értékű szám abszolút értékéből kivonjuk a
kisebb abszolút értékű szám abszolút értékét, majd e különbséget a nagyobb abszolút értékű szám előjelével látjuk el.
Például

Előjeles számok kivonásánál úgy járunk el, hogy a kivonandót az ellentétére változtatjuk, és így hozzáadjuk a
kisebbítendőhöz. Így tehát az előjeles számok kivonását az előjeles számok összeadására vezetjük vissza. Például

Előfordulhat, hogy egy kifejezésben több előjeles számmal kell a műveleteket elvégeznünk. Ekkor a következőképpen
járunk el: ha a zárójelen belüli előjel és a zárójel előtti műveleti jel megegyezik, akkor a zárójel elhagyásával a kérdéses
számot + előjellel vesszük; ha a zárójelen belüli előjel és a zárójel előtti műveleti jel különböző, akkor szintén elhagyjuk a
zárójelet és a kérdéses számot – előjellel látjuk el. Ezek után külön összeadjuk a + előjellel szereplő számokat, a – előjellel
szereplő számokat, majd a már korábban ismertetett módon összeadjuk e két eredményt. Például

Előjeles számok szorzását és osztását az alábbi módon végezzük el.


Azonos előjelű számokat úgy szorzunk, hogy a számok abszolút értékét összeszorozzuk, majd a kapott eredményt +
előjellel vesszük. Különböző előjelű számokat úgy szorzunk, hogy a számok abszolút értékét összeszorozzuk, majd az
eredményt – előjellel látjuk el. Például

Ha több tényezőből álló szorzást kell elvégeznünk, akkor először a tényezők abszolút értékét összeszorozzuk, majd ha a
negatív tényezők száma páros, akkor + előjellel látjuk el a szorzatot, ha a negatív tényezők száma páratlan, akkor pedig –
előjellel látjuk el a szorzatot.
Ha az osztás a Z halmazban elvégezhető, akkor két előjeles számot úgy osztunk, hogy a számok abszolút értékével
elvégezzük az osztást, majd ha az osztó és osztandó előjele megegyezik, akkor a hányadost + előjellel, ha az osztó és az
osztandó előjele különböző, akkor a hányadost – jellel látjuk el. Például
Műveletek törtszámokkal
Gyakran előfordul, hogy egy egész számot úgy kell egyenlő részekre osztanunk, hogy e részek száma nem osztója a kérdéses
egész számnak. Ha pl. 2 egyforma kör alakú tortát szeretnénk 5 gyerek között egyenlő mértékben elosztani, vagy ha pl. egy
görögdinnyét szeretnénk egy 6 tagú család tagjai között egyenlő mértékben elosztani.
Az egész számok Z halmazán az osztás nem minden esetben végezhető el, vagyis a Z halmaz az osztás műveletére nézve

nem zárt halmaz. Legyen n és k eleme a Z halmaznak. Ha az n számot k egyenlő részre akarjuk osztani, akkor azt -val

jelöljük, és törtszámnak nevezzük. A törtvonal fölötti szám neve: számláló, a törtvonal alatti szám neve: nevező. Az
alakú számok (k ≠ 0) a törtek vagy racionális számok. A racionális számok Q halmazában az összeadás, kivonás, szorzás és
osztás elvégezhető, vagyis e műveletekre nézve a racionális számok halmaza zárt halmaz.
Ha a tört számlálója és a nevezője pozitív és a számláló kisebb, mint a nevező, akkor valódi törtről van szó, ha a
számláló nagyobb mint a nevező, akkor a törtet áltörtnek mondjuk. Például

A valódi tört értéke 1-nél kisebb, az áltört értéke 1-nél nagyobb. Ha egy tört számlálója egyenlő a nevezőjével, akkor a
tört értéke 1. Így az áltörteket felbonthatjuk egy egész szám és egy valódi tört összegére. Például

Az áltörtek ilyen alakját vegyes számnak mondjuk. Vegyes számot úgy alakíthatunk át áltörtté, hogy annak egész
részét megszorozzuk a törtrészének nevezőjével, majd az eredményt hozzáadjuk a törtrész számlálójához. A kapott
eredmény lesz az áltört számlálója, a törtrész nevezője lesz az áltört nevezője. Például

Egy tört értéke nem változik, ha a számlálóját és a nevezőjét ugyanazzal a 0-tól különböző számmal megszorozzuk. Ezt
a műveletet a tört bővítésének nevezzük.
Például

Az első törtet 11-gyel, a másodikat 3-mal bővítettük. Ebből következik, hogy egy racionális számnak végtelen sok alakja
van.
Egy tört értéke nem változik, ha a számlálóját és a nevezőjét ugyanazzal a 0-tól különböző számmal elosztjuk. Ezt a
műveletet a tört egyszerűsítésének nevezzük.
Például

Az első törtet 4-gyel, a másodikat 5-tel, a harmadikat pedig 3-mal egyszerűsítettük.


Két valódi törtet szeretnénk nagyság szerint összehasonlítani. Ha a két tört különböző előjelű, akkor nyilván a pozitív
tört a nagyobb. Ha a törtek egyező előjelűek, akkor ha mindkettő pozitív, az a nagyobb, melynek abszolút értéke nagyobb;
ha mindkettő negatív, az a nagyobb, melynek abszolút értéke kisebb.
Ha két pozitív tört nevezője egyenlő, akkor az a nagyobb, melynek a számlálója nagyobb. Ha e törtek különböző
nevezőjűek, akkor a törteket közös nevezőre hozzuk. A két tört közös nevezője: a két nevező legkisebb közös többszöröse.
Tehát mindkét törtet bővítjük egy-egy alkalmas számmal úgy, hogy a nevezők megegyezzenek. Ezek után az a tört a
nagyobb, melynek a számlálója a nagyobb.

Például melyik tört nagyobb:


E két tört közös nevezője (azaz 18 és 22 legkisebb közös többszöröse): 198. Tehát az első törtet bővítjük 11-gyel, a
másodikat pedig 9-cel:
Mivel .

Törtek összeadása és kivonása. Egyenlő nevezőjű törteket úgy adunk össze (vagy vonunk ki egymásból), hogy a
számlálókat a megfelelő módon összeadjuk (kivonjuk), a nevezőt pedig változatlanul leírjuk. Például

Különböző nevezőjű törteket úgy adunk össze (vonunk ki egymásból), hogy először a nevezőket közös nevezőre
hozzuk, majd e közös nevezőnek megfelelő számmal bővítjük az egyes törteket. Így elérjük, hogy az összeadandó
(kivonandó) törtek közös nevezőn legyenek, s ekkor az előbbi szabály szerint adjuk össze (vonjuk ki) a törteket. Például

Törtek szorzása és osztása. Törtet egész számmal úgy szorzunk, hogy a tört számlálóját megszorozzuk a kérdéses egész
számmal. (Természetesen azt is megtehetjük, hogy ha a tört nevezője osztható az egész számmal, hogy a számláló szorzása
helyett a tört nevezőjét elosztjuk az egész számmal.) Például

Törtet törttel úgy szorzunk, hogy a számlálót a számlálóval, a nevezőt a nevezővel összeszorozzuk. Például

Egy törtszám (valós szám) reciprokán azt a törtet (valós számot) értjük, mellyel a kérdéses törtet megszorozva
eredményül 1-et kapunk. Ebből következik, hogy egy tört reciprokát úgy kapjuk, hogy a számlálóját és a nevezőjét
felcseréljük. Mivel az egész számok olyan törnek foghatók fel, melyek nevezője 1, ezért az egész szám reciproka olyan tört,
melynek a számlálója 1, a nevezője pedig maga a kérdéses egész szám. Például

Törtet egész számmal úgy osztunk, hogy a tört nevezőjét megszorozzuk az egész számmal, vagy másként fogalmazva,
törtet egész számmal úgy osztunk, hogy a törtet megszorozzuk az egész szám reciprokával. Egész számot törttel úgy
osztunk, hogy az egész számot megszorozzuk az osztó reciprokával.
Általában törtet törttel úgy osztunk, hogy az osztó reciprokával szorzunk. Például

Ha a törteket tartalmazó kiszámítandó mennyiség több műveletet is tartalmaz, akkor a már az egész számoknál
megismert szabályok szerint járunk el. Például

Először kiszámítjuk a zárójelekben levő mennyiségeket:

Tehát a kiszámítandó mennyiség:

Tizedes törtek, műveletek tizedes törtekkel


A mindennapi életben igen gyakran használunk tizedes törteket. Ha pl. szobánk egyik oldala 6 méter és 36 cm, akkor azt
gyakran így fejezzük ki: 6,36 méter; ha egy időtartam 2 óra és 24 percig tart, azt így is írhatjuk: 2,4 óra, vagy ha télire
vásárolunk 2 mázsa és 75 kg tüzelőt, azt így is kifejezhetjük: 2,75 mázsa.
Azokat a törteket, melyek nevezője 10, 100, 1000 stb. (tehát 10-nek valamely egész kitevős hatványa), tizedes törteknek
nevezzük.

A 10-es számrendszerben valamely számjegytől balról jobbra haladva az egymást követő számjegyek mindegyike 10-
szer kisebb, mint a kérdéses számjegyet megelőző számjegy. Az egyesektől jobbra tizedek, századok, ezredek stb.
következnek, és az egyes helyi értékű számjegytől e tizedesjegyeket vesszővel (tizedesvesszővel) választjuk el.
A tizedes tört értéke 10-szeresére, 100-szorosára, 1000-szeresére stb. nő, ha a tizedesvesszőt 1-gyel, 2-vel, 3-mal stb.
jobbra visszük, illetve tized-, század-, ezredrészére csökken, ha a tizedesvesszőt 1-gyel, 2-vel, 3-mal stb. balra visszük.
Tizedes törtek összeadásánál és kivonásánál ugyanúgy járunk el, mint egész számok összeadásánál, illetve
kivonásánál: a tizedes törteket helyi értéküknek megfelelően egymás alá írjuk, és elvégezzük a kérdéses műveletet, nagyon
vigyázva arra, hogy a tizedesvessző a két számban egymás alá kerüljön. Az összegben (különbségben) a tizedesvessző az
eredeti tizedes törtekben szereplő helyen áll. Például

Tizedes törtek szorzásánál ugyanúgy járunk el, mint egész számok szorzásánál, de vigyáznunk kell arra, hogy a
szorzatban (jobbról balra haladva) annyi tizedesjegyet jelöljünk ki, amennyi a szorzandókban együttvéve volt. Például

(Mivel az egyik szorzótényezőben 2 tizedesjegy volt, a másikban egy, ezért a szorzatban összesen három tizedesjegyet
veszünk.)
Tizedes törtet egész számmal úgy osztunk, mintha egész számot osztanánk egész számmal, ügyelve arra, hogy amikor
az első tizedesjegyet (tehát a tizedeket) leírjuk, akkor az eredményben is ki kell tennünk a tizedesvesszőt. Tizedes törtet
tizedes törttel úgy osztunk, hogy az osztót és az osztandót is megszorozzuk 10-nek annyiadik hatványával, ahány
tizedesjegy az osztóban szerepel, ezzel az osztó egész számmá válik, így tizedes törtnek egész számmal való osztására
vezetjük vissza ezt az osztást. Például

Gyakran fordul elő, hogy egy valódi törtet (áltörtet vagy vegyes törtet) kell átváltanunk tizedes törtté vagy fordítva.
Egy közönséges tört átváltása tizedes törtté egy egyszerű osztást jelent: a számlálót elosztjuk a nevezővel. Ha az osztás
során véges számú lépés után 0 maradék adódik, akkor az eredmény egy véges tizedes tört. Ha az osztás során soha nem
adódik 0 maradék, akkor végtelen tizedes tört a hányados. Ekkor minden esetben az utolsó tizedesjegy (illetve a
tizedesjegyek egy csoportja) végtelen sokszor periodikusan ismétlődik. Az ilyen tizedes törtet végtelen szakaszos tizedes
törtnek mondjuk.
Közönséges törtek tizedes törtté alakítása során a tizedes tört minden esetben véges vagy végtelen szakaszos tizedes
tört lesz. A végtelen szakaszos tizedes törtekben az utolsó leírt periódus első és utolsó számjegye fölé egy-egy pontot írunk,
ezzel jelezve, hogy e periódus ismétlődik végtelen sokszor. Például

Tizedes törtek közönséges törtté alakításakor a következőképpen járunk el: ha a tizedes tört véges, akkor a közönséges
tört számlálójába beírjuk a tizedesjegyekből álló számot, a nevezőbe pedig 10-nek annyiadik hatványát írjuk, ahány
tizedesjegy áll az eredeti tizedes törtben a tizedesvessző után. Például

Végtelen szakaszos tizedes törtet közönséges törtté úgy alakítunk át, hogy a tizedesvessző utáni számjegyekből a
számlálóba annyit írunk le, amennyi tartalmaz egy szakaszt az ismétlődő periódusokból, majd ebből levonjuk az
ismétlődést megelőző számjegyekből adódó számot, végül a nevezőbe annyi kilencest írunk ahány jegyből áll egy periódus,
majd annyi nullát írunk utána, ahány tizedesjegy szerepel az ismétlődések előtt. Például
A mindennapok gyakorlatában általában nem pontos számokkal, hanem azok közelítő értékeivel számolunk. Például a
különböző hosszúság-, súly- vagy hőmérsékletméréskor mérőeszközeink pontatlansága miatt csak közelítő értékekkel
számolhatunk. A közelítő értékek jelölésére a ≈ jelet használjuk. Az ilyen értékekkel való számolási műveletek eredményei
természetesen szintén csak közelítő értékek lesznek. Amennyiben megadjuk, hogy a kérdéses számra milyen pontossággal
(hány tizedesjegy pontossággal) van szükségünk, akkor alkalmazhatjuk az alábbi kerekítési szabályokat.
Ha az elhagyandó első számjegy 5 vagy annál nagyobb, akkor a megmaradó utolsó számjegyet 1-gyel megnöveljük. Ha
az elhagyandó első számjegy 5 vagy annál kisebb, akkor a megmaradó számjegyeket változatlanul leírjuk.

Példa. Kerekítsük 2 tizedesjegy pontosságúra a 24,5761 számot! Mivel ennek első elhagyandó tizedesjegye 6, ami 5-nél
nagyobb, ezért a 2 tizedesjegyre kerekített érték: 24,58. Ez az érték közelebb van az eredeti szám valódi értékéhez,
mint ha az eredeti szám első 2 tizedesjegy értékét vennénk csak gyelembe, vagyis 24,57-et írnánk.
Kerekítsük 3 tizedesjegy pontosságúra a 6,789 28 számot! Most az elhagyandó első számjegy 2, így a kerekített érték:
6,789.

Igen gyakran használjuk számításainkban (elsősorban a számok, mennyiségek nagyságrendjének érzékeltetésére) az


olyan közönséges törteket, melyek nevezője 100. Az ilyen törtekkel való számolást százalékszámításnak nevezzük. Ezek
jelölésére a % szimbólumot használjuk. A százalék századrészt jelent. Azt az a mennyiséget, melynek bizonyos százalékát
(századrészét) keressük, százalékalapnak nevezzük. Azt a p számot, ahány százalékát keressük az alapnak, százaléklábnak
nevezzük. Az a alap p százalékának neve: százalékérték:

Ha egy a mennyiséget p%-kal megnövelünk, akkor a megnövelt érték:

Példák
1. Kovács úr bruttó zetése 128 600 Ft. Január elején kapott 12%-os zetésemelést. Mekkora lesz ezután Kovács úr
bruttó zetése? Az új zetés az eredeti zetés és annak 12%-ának összege, vagyis

2. Egy akció során egy kerékpár árát 20%-kal csökkentették. Hány %-kal kell növelni a kerékpár akciós árát, hogy az
akció lejárta után a kerékpár az eredeti árába kerüljön? Legyen x a kerékpár eredeti ára, p pedig az a százalékláb,
amennyivel emelni kell az árat az akció végén. Az akció során a kerékpár ára:

Ha ezt az akciós árat p%-kal megnövelve az eredeti ár visszaáll, akkor

A kapott egyenlet mindkét oldalát x-szel eloszthatjuk, így azt kapjuk:

Tehát az akció végén 25%-kal kell emelni a kerékpár árát, hogy az eredeti ár visszaálljon.
3. András és Béla ugyanazt a távolságot becsülték meg. Ha András 10%-kal nagyobbat mondott volna, akkor
pontosan eltalálta volna a távolságot. Ha Béla 10%-kal kevesebbet mondott volna, akkor ő is talált volna.
Melyikük tévedett nagyobbat?
Mivel András kevesebbet, Béla pedig többet mondott a tényleges távolságnál, ezért András kisebbet mondott,
mint Béla. Mivel kisebb mennyiség 10%-a kisebb, mint a nagyobb mennyiség 10%-a, ezért Béla többet tévedett,
mint András.

3.2. Arányok (egyenes és fordított arányosság, az aranymetszés, a π), nevezetes


közepek

Nevezetes arányok
Nevezetes közepek

Nevezetes arányok
Két mennyiség egyenesen arányos, ha az egyik mennyiséget valahányszorosára növelve (csökkentve) a másik mennyiség
ugyanannyiszorosára növekszik (csökken). Másként fogalmazva:

Két mennyiség, a és b egyenesen arányos, ha hányadosuk állandó:

Egyenesen arányos mennyiségek pl. egyenes vonalú egyenletes mozgás esetében az út és a megtételéhez szükséges idő.
Ezek hányadosa a sebesség. Ugyancsak egyenesen arányos mennyiségek: az áru és annak az ára. Ha ugyanis k-szor annyi
árut vásárolunk, az ár is k-szorosára növekszik. Szintén egyenesen arányos mennyiségek: az erő és az általa létrehozott
gyorsulás. Ha az erőt k-szorosára növeljük, akkor az általa létrehozott gyorsulás is a k-szorosára nő.
Ha az y és x valós számok egyenesen arányosak, akkor hányadosuk állandó:

Innen látható, hogy az egyenesen arányos mennyiségek gra kus képe egy origón áthaladó félegyenes, feltételezve,
hogy x és y nem negatívok (3.6. ábra).

3.6. ábra

Két mennyiség fordítottan arányos, ha az egyik mennyiséget valahányszorosára növelve (csökkentve) a másik
mennyiség ugyanannyiad részére csökken (növekszik). Másképpen fogalmazva:

Két mennyiség, a és b fordítottan arányos, ha szorzatuk állandó:

Fordítottan arányos mennyiségek pl. egy adott út megtétele esetén a megtételre fordított idő, illetve az utazás
sebessége; ha ugyanis a sebességet k-szorosára növeljük, akkor az út megtételéhez szükséges idő a k-ad részére csökken.
Ugyancsak fordítottan arányos mennyiségek az adott hőmérsékleten levő gáz nyomása és térfogata; ha a térfogatot a k-ad
részére csökkentjük, akkor a nyomás a k-szorosára növekszik.
Ha az x és y pozitív mennyiségek fordítottan arányosak, akkor
Innen kiolvasható, hogy a fordított arányosság gra kus képe egy fél hiperbolaág (3.7. ábra).

3.7. ábra

Egy különleges arány a matematikában az ún. „aranymetszés”.

Aranymetszésnek nevezzük egy mennyiségnek (pl. egy szakasznak) két olyan részre bontását, melyek közül a kisebbik
úgy aránylik a nagyobbhoz, mint a nagyobbik az egészhez, vagy másképpen fogalmazva: az a és b mennyiségek
aranymetszeti arányban állnak, ha

Legyen az aranymetszés kisebbik darabja 1, a nagyobbik pedig x, ekkor

Ez utóbbi másodfokú egyenlet pozitív gyöke:

Tehát az aranymetszés aránya kb. 1 : 1,618.


Az aranymetszésnek nagy jelentősége van a matematikában, az építészetben, a művészetekben, sőt a természetben is
gyakran találkozunk olyan növényekkel, állatokkal, melyek alaki felépítésében felfedezhető az aranymetszés aránya. A
matematikán belül fontos szerep jut az aranymetszeti aránynak a szabályos öt- és tízszögek szerkesztésénél.

Megjegyzés. Megszerkesztjük egy adott a szakasz aranymetszeti felbontását. Az AB = a szakasz A végpontjába

emeljünk egy rá merőleges szakaszt, majd O köré rajzoljunk egy sugarú kört. A BO egyenes e kört E-
ben és F-ben metszi. A BE = x sugarú kör az AB szakaszt C-ben metszi (3.8. ábra).

3.8. ábra

A BAE és BAF háromszögek hasonlók, hiszen B-nél közös szögük van, az F-nél és A-nál levő szögek pedig egyenlők
(lásd azonos íven nyugvó kerületi szögek). Ezek szerint írhatjuk az alábbi aránypárt:

(Már ez utóbbi egyenlőség is mutat egy aranymetszeti arányt; nevezetes az x szakasz és az eredeti a szakasz ilyen
arányát.) A fenti egyenlőségből azt kapjuk:
innen pedig

Ez pedig éppen azt fejezi ki, hogy az AB szakasznak C pont az aranymetszés szerinti osztópontja, mégpedig AC a
kisebb, BC pedig a nagyobb aranymetszeti darab.
Ugyancsak aranymetszeti szakaszokhoz jutunk, ha megrajzoljuk egy szabályos háromszög köré írt körét, valamint a
háromszög egyik középvonalának egyenesét (3.9. ábra).

3.9. ábra

Mivel EP · EQ = EB · EC (lásd pont körre vonatkozó hatványa), ezért

Ez utóbbi egyenlőség pedig pontosan azt fejezi ki, hogy az ábra EP és EF szakaszai aranymetszeti arányban állnak
egymással.

Rendkívül fontos arány a matematikában a kör kerületének és átmérőjének aránya. Ezt az arányszámot (a görög
periféria = kerület szó kezdőbetűjéről) π-vel szokás jelölni. A π szám irracionális, azaz nem írható fel két egész szám
hányadosaként, tizedes tört alakja végtelen nem szakaszos. Értéke 4 tizedesjegy pontosságig: π ≈ 3,1415…

Megjegyzés. Már az ókorban is sokat foglalkoztak a kör kerületének meghatározásával, így a π szám közelítő
értékének kiszámításával. Az ókori Egyiptomban π-t 3,1605-nek vették. Indiában a közelítést használták.
Az ókori Kínában már a körbe írható és a kör köré írható szabályos sokszögekkel közelítették meg a π-t: a III.
században Liu Huj már 5 tizedesjegy pontossággal határozta meg a π-t. A XVII. században Lambert kimutatta, hogy a
π irracionális szám, a XIX. században pedig az is kiderült, hogy a π transzcendens szám, azaz semmilyen racionális
együtthatós polinomnak nem lehet gyöke. Ma már több milliárd tizedesjegye ismert a π-nek, melyeket számítógépek
segítségével határoznak meg.

Nevezetes közepek

Ha a1, a2, …, an pozitív számok, akkor ezek S számtani, M mértani, H harmonikus és N négyzetes közepe:

Ezen középarányosok között fennáll az alábbi egyenlőtlenségláncolat:


Ennek bizonyítását 2 tagra (n = 2) végezzük. Ha a és b pozitív valós számok, akkor

Az egyenlőtlenségláncolatot könnyen igazolhatjuk algebrai úton, mi most egy geometriai úton végezzük el a
bizonyítást. Elemezzük a 3.10. ábrát!

3.10. ábra

A COD derékszögű háromszögben (lásd Pitagorasz-tétel)

Az OEC derékszögű háromszögben

Az OEC háromszögben (lásd befogótétel)

Mivel bármely derékszögű háromszögben az átfogó a leghosszabb oldal, ezért a CDO, CEO, CEF háromszögekre

Az egyenlőtlenségláncolatban az egyenlőség akkor és csak akkor teljesül, ha a = b.


Megjegyzés. A most ismertetett nevezetes közepeket számtalan helyen használják a matematikában. A számtani
közép elsősorban az átlagok kiszámításánál használatos. A mértani közepet átlagos növekedési ütem kiszámítására
használjuk. Legyenek adottak például egy ország in ációs adatai:

Mennyi ebben az országban az átlagos in áció? A kérdés tehát az, mekkora az az átlagos in áció, amelyre teljesül,
hogy ha mind az 5 évben ugyanannyival növekszik, akkor is ugyanazt a teljes in ációt érjük el az öt év során, mint
amennyi a valóságban is bekövetkezett. Ha ez az átlagos in áció p, akkor

vagyis az egyes évek in ációjának mértani közepe. A harmonikus közepet használjuk pl. az átlagsebesség
kiszámítására. Ha valamely S utat egy alkalommal v1, egy más alkalommal v2, egy harmadik alkalommal pedig v3
sebességgel tettünk meg, akkor kérdezhetjük, hogy mennyi volt az átlagsebességünk. Ez nyilván nem a sebességek
átlaga, hanem a teljes út és a ráfordított idő hányadosa. Az egyes időtartamok:

Így az átlagsebesség:
vagyis az eredeti sebességek harmonikus közepe.
A négyzetes közepet elsősorban a statisztikában használjuk főleg a statisztikai adatsokaság szórásának
kiszámítására.

3.3. Algebrai kifejezések és műveletek, hatványozás, összevonás, szorzás,


kiemelés, nevezetes azonosságok
Az általánosabb matematikai összefüggések leírására általában betűket használunk a matematikában. Az egyes betűk
többfajta tartalommal is rendelkezhetnek: egy algebrai kifejezésben szereplő betű jelölhet ismeretlent (vagy más néven
változót); ezekre általában az x, y, z … betűket használjuk, de jelenthetnek a betűk ismert mennyiségnek tekintendő ún.
paramétert is.
A 3.1. fejezetben megismert műveletek ugyanúgy használatosak az algebrai kifejezések körében is, azzal a
megjegyzéssel, hogy szorzás esetében nem mindig írjuk ki a szorzás jeleként a pontot, hanem a szorzótényezőket
közvetlenül egymás mellé írjuk. Például

Ha egy algebrai kifejezésben szereplő mennyiségeket csak a szorzás vagy osztás jelével kapcsoltuk össze, akkor azt
egytagú algebrai kifejezésnek mondjuk. Például

Ha az algebrai kifejezésünkben szereplő egyes mennyiségeket a + vagy a – műveleti jel is összeköti, akkor többtagú
algebrai kifejezésünk van. Például

Az első példa egy kéttagú algebrai kifejezés, a másik háromtagú, míg a harmadik egy olyan egytagú kifejezés, mely
kéttényezős szorzat: első tényezője egy kéttagú, másik tényezője egy háromtagú összeg.

A betűkifejezés előtt álló szorzót együtthatónak nevezzük, valamely kifejezés jobb felső sarkában szereplő számot (vagy
betűt) hatványkitevőnek nevezzük.

Legyen n > 1 pozitív egész szám. Ekkor an olyan n-tényezős szorzat, melynek minden tényezője a:

A hatványozás pozitív egész kitevőre történő de níciójából egyenesen következnek a hatványozás alábbi azonosságai.

1. Azonos alapú hatványokat úgy szorzunk, hogy az alapot a kitevők öszszegére emeljük:

2. Hatványt úgy hatványozunk, hogy az alapot a kitevők szorzatára emeljük:

3. Szorzatot úgy hatványozunk, hogy a szorzat minden tényezőjét a megfelelő hatványra emeljük:
4. Törtet úgy hatványozunk, hogy a számlálót is és a nevezőt is a megfelelő hatványra emeljük:

5. Azonos alapú hatványokat úgy osztunk, hogy az alapot a számláló és a nevező kitevőinek különbségére emeljük:

Példák
1. x8 · x11 = x8+11 = x19, (y6)3 · (y5)2 = y18 · y10 = y28,

2. Döntsük el, melyik szám nagyobb: 1020 vagy 2010? A megfelelő azonosság szerint 1020 így írható: 1020 = 102 · 10 =
(102)10 = 10010. Mivel 100 > 20, ezért 10010 > 2010, tehát 1020 > 2010.
Megjegyzés. A fentiekben a hatványozás fogalmával és szabályaival foglalkoztunk olyan esetekben, amikor a
hatványkitevő pozitív egész szám. A hatványfogalom kiterjesztését negatív egészekre, racionális és irracionális
kitevőkre a 3.4. fejezetben fogjuk megtenni.

Ha az algebrai kifejezésünkben a változó helyére beírunk egy valós számot, akkor az algebrai kifejezésnek a kérdéses
valós számon vett helyettesítési értékét kapjuk.

Például 6ax2 + 3a2x + 4a – 5x és x = 1, ekkor az algebrai kifejezés helyettesítési értéke:

Ha két egytagú algebrai kifejezés legfeljebb csak az együtthatókban különbözik egymástól, akkor egynemű
kifejezéseknek mondjuk őket. (Tehát két algebrai kifejezés akkor egynemű, ha pontosan ugyanazok a betűk szerepelnek
mindkettőben, és a megfelelő azonos betűk ugyanazon a hatványkitevőn vannak.)

Például 3a4b2, – 7a4b2 vagy 5x2y3, 12x2y3 egynemű kifejezések.

Az egynemű algebrai kifejezéseket összevonhatjuk. Ez azt jelenti, hogy az együtthatóikkal elvégezzük a megfelelő
összeadási és kivonási műveleteket, majd ezek eredménye mögé írjuk változatlan formában a kérdéses algebrai kifejezést.
A nem egynemű algebrai kifejezések nem vonhatók össze. Ha egy többtagú összegben van többfajta egynemű algebrai
kifejezésünk, akkor az egyneműeket külön-külön összevonjuk.

Példák
1. 5a – 6b + 8a + 4b = 13a – 2b.
2. 3x2y – 4xy2 + 6x2y + 8xy2 = (3x2y + 6x2y) + (8xy2 – 4xy2) = 9x2y + 4xy2.
3. 5a3b – 2a2b2 + 8ab3 + 4a2b2 + 3a3b – 7ab3 =
= (5a3b + 3a3b) + (4a2b2 – 2a2b2) + (8ab3 – 7ab3) =
= 8a3b + 2a2b2 +ab3.

Egytagú algebrai kifejezéseket úgy szorzunk, hogy az együtthatókat összeszorozzuk, majd az azonos alapú hatványokat
is összeszorozzuk, a különböző alapú hatványok szorzását pedig a szorzásjellel jelöljük.

Példák
1. 5a2x3y · 3a4y2z = 15a6y3x3z,
2.

Egytagú kifejezéseket úgy osztunk, hogy az együtthatókat, valamint az azonos alapú hatványokat elosztjuk egymással,
a különböző alapú hatványok osztását pedig törtvonallal kijelöljük.

Példák
1.

2. 112a5p4s6q : 14ap2s3 = 8a4p2s3q.


Egytagú kifejezést többtagú kifejezéssel úgy szorzunk, hogy az egy tagot a több tag minden tagjával megszorozzuk. Ezt
a szabályt pozitív számok esetén szemléletesen is beláthatjuk (3.11. ábra).

3.11. ábra

Az ábrán látható téglalap területe egyenlő egyrészt a két oldalának szorzatával, másrészt a két résztéglalap területének
összegével, vagyis

Ha egy tagot szorzunk egy n tagú összeggel, akkor a szorzat n tagú összeg lesz.

Példák
1. a2b(a + 3b – ab2) = a3b + 3a2b2 – a3b3;
2. xy(x2 – 2xy + 3y2) = x3y – 2x2y2 + 3xy3;
3.

4.

5. abc(a2b + a2c + ab2 + ac2 + b2c + bc2) =


= a3b2c + a3bc2 + a2b3c + a2bc3 + ab3c2 + ab2c3.

Többtagú kifejezést többtagú kifejezéssel úgy szorzunk, hogy az egyik tényező minden tagját a másik tényező minden
tagjával megszorozzuk. E szabályt – az előzőhöz hasonlóan – ugyancsak szemléltethetjük pozitív számok esetére (3.12.
ábra).

3.12. ábra

A téglalap területe egyrészt két oldalának szorzata, másrészt pedig a négy db résztéglalap területének összege:

Megjegyzés. A gyelmetlenségek elkerülése érdekében érdemes a szorzást ilyenkor úgy végezni, hogy az egyik
tényező (pl. a bal oldali tényező) első tagjával végigszorozni a jobb oldali tényező minden tagját, majd a bal oldali
tényező második tagjával végigszorozni, és így tovább addig, amíg a bal oldali tényező utolsó tagjához nem érünk;
ezzel is végigszorozzuk a jobb oldali tényező minden tagját. Így biztos, hogy minden tagot minden taggal
megszoroztunk, és pontosan egyszer.

Ha egy n tagú összeget szorzunk egy k tagú összeggel, akkor az összeg egy legfeljebb n + k tagú összeg lesz, hiszen a
szorzás elvégzése után lehetnek összevonható tagok.

Példák
1. (a + b)(2a2 – ab + 3b2) = 2a3 – a2b + 3ab2 + 2a2b – ab2 + 3b3 =
= 2a3 + a2b + 2ab2 + 3b3.
2. (x2 + 2xy)(x3 – 3xy2 + 2y) = x5 – 3x3y2 + 2x2y + 2x4y – 6x2y3 + 2xy2.
3. (2x – y2 + y)(3x – 2xy + y2) =
= 6x2 – 4x2y + 2xy2 – 3xy2 + 2xy3 – y4 + 3xy – 2xy2 + y3 =
= 6x2 – 4x2y – 3xy2 + 2xy3 – y4 + 3xy + y3.
4.

5.

Sok esetben az lehet a cél, hogy többtagú algebrai kifejezésünket szorzattá alakítsuk. Ezt akkor tehetjük meg, ha a
többtagú összeg valamennyi tagjában szerepel ugyanaz a szorzótényező. Ezt a műveletet kiemelésnek nevezzük. Az alábbi
egyszerű példában egy olyan 3 tagú összeg szerepel, melynek mindhárom tagjában szerepel az a szorzótényező, így ezt
kiemelve az összeget szorzattá alakíthatjuk:

Példák
1. ax2 + 2a2bx – 3acx = ax(x + 2ab – 3c);
2. 4p2qr + 2pq2r – 6pqr2 + 2xpqr = 2pqr(2p + q – 3r + x);
3. ax + by + bx + ay = x(a + b) + y(b + a) = (a + b)(x + y);
4. 2a2x + 6by – a2z – 2bz + 4bx + 3a2y = a2(2x – z + 3y) + 2b(2x – z + 3y) =
= (2x – z + 3y)(a2 + 2b).
Megjegyzés. A 3. példában először az első és a negyedik tagból emeltünk ki a-t, majd a második és a harmadik tagból
b-t. A kapott kéttagú összeg mindkét tagjában szorzótényezőként szerepel (a + b), így második lépésként ezt is
kiemelhettük. A 4. példában előbb az első, a harmadik és a hatodik tagból emeltünk ki a2-et, majd a második, a
negyedik és az ötödik tagból 2b-t, majd a kapott kéttagú összeg mindkét tagjából emeltünk ki 2x – z + 3y-t.

A matematika számos területén igen gyakran előkerülnek az alábbi nevezetes szorzatok.


Két tag összegének négyzete egyenlő az első tag négyzetének, a második tag négyzetének és a két tag szorzata
kétszeresének összegével:

Két tag különbségének négyzete egyenlő az első tag négyzetének és a második tag négyzetének az összegéből kivonva a
két tag szorzatának kétszeresét:

Két tag összegének és ugyanazon két tag különbségének szorzata egyenlő a két tag négyzetének különbségével:

Példák
1. (2x + 3y)2 = 4x2 + 9y2 + 12xy;
2. (3a2b + 4ab2)2 = 9a4b2 + 16a2b4 + 24a3b3;
3.

4. (5x – 4y)2 = 25x2 + 16y2 – 40xy;


5. (6ab2 – 5ab3)2 = 36a2b4 + 25a2b6 – 60a2b5;
6.

7. (3x – 4y)(3x + 4y) = 9x2 – 16y2;


8.
További fontos nevezetes szorzatok: két tag összegének és különbségének a köbe, továbbá két tag köbének összege,
illetve különbsége:

Általában: két tag n-edik hatványának különbsége minden n-re osztható a – b-vel:
an – bn = (a – b)(an–1 + an–2b + an–3b2 + an–4b3 + … + a2bn–3 + abn–2 + bn–1).
Érdemes meg gyelni, hogy a második zárójelben egy olyan n tagú összeg szerepel, melyben az a hatványkitevője
rendre eggyel csökken, míg ezzel párhuzamosan a b kitevője eggyel növekszik.
Míg két tag n-edik hatványának különbsége minden n-re osztható az alapok különbségével, addig ugyanez két tag n-
edik hatványának összegéről már nem mondható el. Két tag n-edik hatványának összege akkor és csak akkor osztható az
alapok összegével, ha n páratlan. Ekkor

Megjegyzés. Két tag összegének, illetve különbségének harmadik, negyedik és általában n-edik hatványát a 23.,
Kombinatorika című fejezetben tárgyaljuk.
Példák
1. Igazoljuk, hogy 1313 + 1 osztható 14-gyel!
Mivel 1 minden hatványa 1, ezért írhatjuk: 1313 + 113. A hatványkitevő mindkét tagban páratlan, így a kéttagú
összeg osztható az alapok összegével, azaz 14-gyel.
2. Igazoljuk, hogy 1818 –1 osztható 323-mal!

A kapott kéttényezős szorzat első tényezője osztható az alapok különbségével, azaz 17-tel. A második tényező
viszont osztható az alapok összegével, 19-cel, hiszen a hatványkitevő páratlan. Ezek szerint a szorzat osztható 17-
tel és 19-cel. Mivel e két szám relatív prím, így a szorzat osztható 17 · 19 = 323-mal.

Fontos nevezetes azonosság még három-, négy-, illetve többtagú összeg négyzete.
Többtagú összeg négyzetében szerepel minden tag négyzete, valamint bármely két tag szorzatának kétszerese:

Ennek megfelelően egy n tagú összegben az egyes tagok négyzetének összege n tagú összeg, az egyes kétszeres szorzatok
száma pedig

Tehát az n tagú összeg négyzete tagú összeg.

Példák
1. (x + 2y – z)2 = x2 + 4y2 + z2 + 4xy – 2xz – 4yz;
2. (3x – 4xy + 2y – y2)2 =
= 9x2 + 16x2y2 + 4y2 + y4 – 24x2y + 12xy – 6xy2 – 16xy2 + 8xy3 – 4y3 =
= 9x2 + 16x2y2 + 4y2 + y4 – 24x2y + 12xy – 22xy2 + 8xy3 – 4y3.

Többtagú algebrai kifejezés osztása egytagú algebrai kifejezéssel úgy történik, hogy az osztandó minden tagját
elosztjuk az egytagú osztóval, majd az így kapott hányadosokat összeadjuk.

Példák
1.
2.

Többtagú algebrai kifejezés osztása több taggal már kicsit bonyolultabb, nagy oda gyelést igényel. Mielőtt az osztást
elvégezzük, érdemes az osztót és az osztandót is valamelyik, de ugyanazon változó szerint fogyó hatványokként sorba
rendezni. Ezek után az osztást a következő módon végezzük el. Az osztandó első tagját elosztjuk az osztó első tagjával, így
megkapjuk a hányados első tagját. A kapott taggal megszorozzuk az osztó minden tagját, majd a kapott szorzatot kivonjuk
az osztandóból. A maradék rendezése után annak első tagját újra elosztjuk az osztó első tagjával, az eredmény lesz a
hányados második tagja. Ezzel ismét megszorozzuk az osztó minden tagját, s a kapott szorzatot levonjuk az utolsó
maradékból. Ezt az eljárást egészen addig folytatjuk, amíg a maradék vagy 0 lesz, vagy egy, az osztónál alacsonyabb fokú
algebrai kifejezés.

Példa

Tehát arra jutottunk, hogy

Algebrai törtnek mondjuk az olyan algebrai kifejezéseket, melyek számlálójában is és nevezőjében is egy- vagy
többtagú algebrai kifejezések szerepelnek. Ilyenek például az alábbi törtek:

Az algebrai törteknek természetesen csak akkor van értelmük, ha a nevezőjük nem 0. Az algebrai tört értelmezési
tartománya a valós számoknak az a részhalmaza, melynek elemeire az algebrai tört nevezője nem 0. A fenti példák közül az
első tört értelmezhető minden olyan x és y valós számra, melyekre y ≠ – 2x, a második tört minden olyan a és x valós számra
értelmezhető, melyekre 2x ≠ a, a harmadik tört pedig minden p valós számra értelmezhető, hiszen p2 + 1 > 0 minden p
esetén.
Az algebrai törteket – ugyanúgy, ahogyan ezt a 3.1. fejezetben is láttuk – bővíthetjük és egyszerűsíthetjük, de
vigyáznunk kell arra, hogy bővítés vagy egyszerűsítés esetén a tört értelmezési tartománya megváltozhat. Bővítéskor a
számlálót és a nevezőt ugyanazzal a 0-tól különböző algebrai kifejezéssel szorozzuk, egyszerűsítéskor pedig a számlálót és a
nevezőt ugyanazzal a nem 0 algebrai kifejezéssel osztjuk. Leggyakrabban az egyszerűsítés igénye merül fel, így sok esetben
célszerűnek látszik a tört számlálóját is és a nevezőjét is megpróbálni szorzattá alakítani. Ehhez, ha lehet, a kiemelés
módszerét vagy pedig a már ismertetett nevezetes szorzatokat alkalmazzuk.

Példák. Egyszerűsítsük a következő törteket!


1.

2.

3.

4.

5.

6.
Megjegyzés. A 6. példa esetén a számlálóban és a nevezőben is az első három tag egy-egy teljes négyzet, először ezeket
írtuk ki. Ezután a számlálóban és a nevezőben is két négyzet különbsége jelent meg, melyet már könnyen szorzattá
alakíthattunk.

Az algebrai törtek összeadása és kivonása ugyanúgy történik, ahogyan azt a 3.1. fejezetben egész számok esetében
láttuk. Az azonos nevezőjű törtek számlálóival elvégezzük a megfelelő összeadási, kivonási műveleteket, a kapott
eredmény lesz a számláló, a nevezőt pedig változatlanul leírjuk.
Különböző nevezőjű törtek esetében először meghatározzuk a közös nevezőt. Ez a nevezők legkisebb közös többszöröse
lesz. Az egyes törteket bővítjük azzal a mennyiséggel, mellyel a kérdéses tört nevezőjét megszorozva az a közös nevezővé
válik. Ez után a törtek már azonos nevezőjűek lesznek, így már csak – az előbb írtak alapján – a számlálóikat kell
összevonnunk.

Példák
1.

2.

3.

4.

Algebrai törtek szorzásánál és osztásánál a 3.1. fejezetben már megismert szabályt használjuk.
Törtet egésszel úgy szorzunk, hogy a számlálót megszorozzuk a kérdéses egésszel, a nevezőt változatlanul hagyjuk.
Törtet törttel úgy szorzunk, hogy a számlálókat is és a nevezőket is összeszorozzuk. A számlálók szorzata lesz a szorzat
számlálója, a nevezők szorzata lesz a szorzat nevezője.
Törtet egésszel úgy osztunk, hogy a tört nevezőjét megszorozzuk az osztóval.
Törtet törttel úgy osztunk, hogy az osztandó törtet megszorozzuk az osztó tört reciprokával.

Megjegyzés. Mivel az algebrai „egész“ kifejezés úgy is értelmezhető, hogy olyan tört, melynek a nevezője 1, ezért e
mostani szabályok röviden így is összefoglalhatók: törtet törttel úgy szorzunk, hogy a számlálót a számlálóval,
nevezőt a nevezővel szorozzuk, illetve törtet törttel úgy osztunk, hogy az osztó reciprokával szorzunk.
Példák
1.

2.

3.

4.

Gyakran előfordul, hogy olyan törttel van dolgunk, melynek a számlálójában és/vagy a nevezőjében is egy-egy tört
szerepel. Az ilyen törteket emeletes törteknek nevezzük. Az emeletes törtek vizsgálatánál célszerű úgy eljárni, hogy a
számlálót elosztjuk a nevező reciprokával, így könnyebben kezelhető algebrai törtet kapunk:

Ha a számláló vagy a nevező nem tört, hanem algebrai egész, akkor nagyon fontos legelőször megállapítanunk, hogy
melyik törtvonal az ún. „fő törtvonal“; ez alapvetően befolyásolja a tört értékét. Például
Példák
1.

2.

3.

4.

Az algebrai kifejezésekkel, algebrai törtekkel való műveletek gyakorlására tekintsük az alábbi összetettebb kidolgozott
példákat.

Példák
1. Hozzuk egyszerűbb alakra az alábbi algebrai kifejezést:

Először a zárójelekben levő összeadást, illetve kivonást végezzük el.

Tehát a következő osztást kell elvégeznünk:

A megfelelő nevezetes szorzatokat és a törttel való osztás szabályát alkalmazva azt kapjuk:

2. Hozzuk egyszerűbb alakra az alábbi algebrai kifejezést:

Először most is a zárójelben levő kifejezést vonjuk össze.

Tehát

3. Határozzuk meg az alábbi kifejezés értékét, ha a = 2, b = – 3:


Először a zárójelben levő törtek nevezőjét szorzattá alakítva a törteket közös nevezőre hozzuk, majd a törteket
összeadjuk:

Tehát az elvégzendő művelet:

4. Bizonyítsuk be, hogy ha k egy 0-tól különböző egész szám, akkor az alábbi kifejezés értéke is egész szám!

A zárójelekben levő mennyiségek összevonása után alkalmazzuk az a3 + b3 összegre vonatkozó azonosságot.

Tehát a vizsgált algebrai kifejezés:

A kapott eredményről látszik, hogy egész k esetén az eredmény is egész szám.


5. Határozzuk meg a következő kifejezés értékét, ha a = 0,5, b = 2,5:

Először az emeletes törteket alakítjuk át, majd közös nevezőre hozva a zárójelben levő két törtet összeadjuk:

Ezek szerint az alábbi műveletet kell elvégeznünk:

3.4. Gyökvonás, hatványozás, logaritmus és műveleteik


Ha az an = b (a > 0) egyenlőségben a az ismeretlen, n és b ismert mennyiségek, akkor gyökvonással kapjuk meg az
ismeretlen értékét. Ha az egyenlőségben b ismeretlen, a és n ismert, akkor hatványozásról van szó, ha pedig az a és ab
ismert, n az ismeretlen, akkor a logaritmus fogalmának segítségével jutunk el az ismeretlen mennyiséghez.

Gyökvonás
A hatványozás kiterjesztése
Logaritmus

Gyökvonás
Először ismerkedjünk meg a négyzetgyök fogalmával.
(„négyzetgyök a“) az a nem negatív valós szám, melynek négyzete a.

Mivel egy valós szám négyzete nem lehet negatív, ezért -nak csak akkor van értelme, ha a ≥ 0. Tehát a

vonatkozásában a „nem negatív“ kitétel kétféle értelemben szerepel: egyrészt, nem negatív, másrészt a nem
negatív. Mindebből következnek az alábbi egyszerű példák:

A négyzetgyök fogalmából adódnak a négyzetgyökvonás azonosságai.

Ha valamely négyzetgyökös kifejezés előtt álló szorzótényezőt be akarjuk vinni a négyzetgyök alá, akkor azt négyzetre
kell emelnünk. Ha a négyzetgyök alatti szorzótényezőt ki akarjuk vinni a négyzetgyök előtti szorzóvá, akkor abból
négyzetgyököt kell vonnunk.

Példák. (Az alábbi példákban szereplő négyzetgyökök mindegyike értelmezhető.)


1.

2.

3.

4.

A négyzetgyök mintájára de niáljuk az n-edik gyök fogalmát.

(„n-edik gyök a”)


- ha n páros, n = 2k, az a nem negatív valós szám, melynek n-edik hatványa a,
- ha n páratlan, n = 2k + 1, az a valós szám, melynek n-edik hatványa a.

Az kifejezésében szereplő n-et gyökkitevőnek hívjuk. Azt látjuk, hogy páratlan n esetén értéke lehet
negatív, amiből következik, hogy ekkor a is lehet negatív. Például:

Az n-edik gyök de níciójából adódnak a gyökvonás azonosságai (a ≥ 0, b ≥ 0).

Mindebből következik, hogy nem változik egy mennyiség értéke, ha abból n-edik gyököt vonunk, majd ezt követően az
n-edik hatványra emeljük a kérdéses mennyiséget.
Ha valamely n-edik gyökös kifejezés előtt álló szorzótényezőt be akarjuk vinni az n-edik gyök alá, akkor azt n-edik
hatványra kell emelnünk. Ha az n-edik gyök alatti szorzótényezőt ki akarjuk vinni az n-edik gyök előtti szorzóvá, akkor
abból n-edik gyököt kell vonnunk.

Példák (Az alábbi példákban szereplő gyökös kifejezések mindegyike értelmezhető.)


1.
2.
3.

4.
5.
6.

7.
8.

Gyakran előfordul, hogy különböző gyökkitevőjű kifejezéseket kell összeszoroznunk vagy osztanunk. Ilyenkor a
következőképpen járunk el: az egyik (esetleg mindkét) tényezőből megfelelő gyökkitevőjű gyököt vonva és ugyanannyiadik
hatványra emelve elérjük, hogy mindkét tényező ugyanannyiadik gyök alatt szerepeljen. Így elérve, hogy már közös
gyökkitevőn vannak a tényezők, elvégezzük a szorzást, illetve az osztást. A közös gyökkitevő általában az egyes
gyökkitevők legkisebb közös többszöröse lesz.

Példák
1.
2.
3.
4.

A törtkifejezésekkel kényelmesebben tudunk számolni, ha a tört nevezője nem tartalmaz gyökös kifejezést. Ezért
gyakran fordul elő, hogy el akarjuk érni a nevező gyöktelenítését. Amennyiben a tört nevezője egytagú négyzetgyökös
kifejezés, akkor könnyű dolgunk van; egyszerűen bővítjük a törtet a nevezővel, azaz a számlálót is és a nevezőt is
megszorozzuk a tört nevezőjével.

Példák
1.

2.

3.

4.

Ha a tört nevezője kéttagú kifejezés, melyek közül az egyik tag (esetleg mindkettő) négyzetgyökös kifejezés, akkor az (a
+ b) (a – b) = a2 – b2 azonosság felhasználásával bővítjük a törtet a nevező konjugáltjával, azaz, ha a nevező x + y alakú, akkor
x – y-nal, ha a nevező x – y alakú, akkor x + y-nal.

Példák
1.

2.

3.

4.

Ha a tört nevezője háromtagú, akkor először két tagot egynek tekintve (zárójelbe téve a két tagot), első lépésben
elérjük, hogy már csak kéttagú gyökös kifejezés lesz a nevezőben, majd az eljárást megismételve elérjük, hogy a nevező már
nem tartalmaz négyzetgyököt. Szintén két lépésben érjük el a négyzetgyökmentes nevezőt, ha a nevezőben egytagú gyökös
kifejezés áll, de e négyzetgyök alatt két vagy többtagú összeg szerepel.
Példák
1.

2.

A hatványozás kiterjesztése
A 3.3. fejezetben megismerkedtünk a hatványozás fogalmával és legfontosabb azonosságaival abban az esetben, amikor a
hatványkitevő pozitív egész szám. Most rátérünk a hatványozás fogalmának kiterjesztésére bármilyen egész, illetve
racionális, irracionális hatványkitevőre.

Ezen de níciók alapján most már bármilyen racionális számra értelmezni tudjuk a hatványozást. A hatványozás
fogalmának kiterjesztésekor alapvető cél, hogy a hatványozás 3.1. fejezetben megismert azonosságai továbbra is érvényben
maradjanak. Bizonyítható, hogy ha a 0, negatív, illetve tört kitevőjű hatványokat a fenti módon de niáljuk, akkor a
hatványozás eddigi azonosságai érvényben maradnak.

Megjegyzés. Nem értelmezzük negatív számok tört kitevőjű hatványát. Ennek oka a következő: nyilvánvaló ennek
értelmezése nem függhet attól, hogy a kitevőben levő törtet milyen alakban adjuk meg.

Például nyilván nem értelmezhető. De ha a hatványkitevőt más alakban adjuk meg:

már értelmezhető. Innen már látható, hogy negatív szám tört kitevőjű
hatványának nem tudunk használható módon értelmet adni.
Példák
1.

2. Írjuk fel az alábbi kifejezéseket tört és negatív kitevőjű hatványok nélkül!

3. Írjuk fel gyökjelek nélkül az alábbi kifejezéseket!

4. Hozzuk egyszerűbb alakra a következő kifejezést:


5. Végezzük el a következő szorzást a tört kitevőjű hatványok alkalmazásával:

Logaritmus
Ha az an = b egyenlőségben ismert az a alap, valamint a hatvány értéke b, és keressük az n hatványkitevő értékét, akkor a
logaritmus fogalma vezethet el bennünket az ismeretlenhez.

Legyenek a > 0, b > 0 és a ≠ 1. Ekkor logab („a alapú logaritmus b”) jelenti azt a hatványkitevőt, melyre a-t emelve b-t
kapunk:

Mivel bármely pozitív szám 0-dik hatványa 1, továbbá bármely pozitív szám első hatványa magával a számmal egyenlő,
ezért

Leggyakrabban a 10-es alapú, valamint a természetes e alapú logaritmusokat használjuk; ezeket megkülönböztetésül
lg-vel, illetve ln-nel jelöljük: log10… = lg … és loge … = ln …

Példák
1.

2.

3.

Megjegyzés. A logaritmus fogalma és a vele való számolási eljárás a XVI. században alakult ki Joost Bürgi (1552–1632)
és John Napier (1550–1617) munkássága kapcsán. Bürgi svájci órásmester volt, két évtizeden át Kepler munkatársa. A
hosszadalmas számítások megkönnyítésére keresett valamilyen megoldást, amikor észrevette, hogy ha a kérdéses
számokat valamilyen szám hatványaként írja fel, s a számításokat a hatványkitevőkkel való számolásra vezeti vissza,
akkor az egyes műveletek (hatványozás, szorzás) rendre alacsonyabb rendű műveletek végzésére vezetődik vissza,
így jóval egyszerűbbé válnak a számítások. Ennek megfelelően elkészítette az első logaritmustáblázatokat. Napier
skót matematikus volt, aki Bürgihez hasonló gondolatmenet alapján jutott el a logaritmus fogalmához. Ő már
szögfüggvények logaritmusaival is foglalkozott.

A logaritmus azonosságai közül a legfontosabbak a következők.

Szorzat logaritmusa egyenlő a tényezők logaritmusának összegével:

Tört logaritmusa egyenlő a számláló és a nevező logaritmusainak különbségével:


Hatvány logaritmusa egyenlő a hatványalap logaritmusának és a hatványkitevőnek a szorzatával:

Megjegyzés. Vigyázzunk! Hatvány logaritmusa, illetve logaritmus hatványa két lényegesen különböző dolgot
jelentenek. Hatvány logaritmusánál először a hatványozást végezzük el, majd a kapott hatványnak keressük a
megfelelő alapú logaritmusát. Logaritmus hatványánál először a logaritmust számoljuk ki, majd a kapott
mennyiséget hatványozzuk. Például

Példaként bebizonyítjuk az első azonosságot. Legyen loga x = c és loga y = d! Ekkor x = ac és y = ad. E két utóbbi
egyenlőséget összeszorozva azt kapjuk: xy = ac · adac+d. Ez viszont a logaritmus de níciója alapján azt jelenti, hogy
loga (xy) = c + d. Ha most visszaírjuk c és d jelentését, megkapjuk a bizonyítandó állítást:

A másik két azonosság bizonyítása teljesen hasonló módon történhet.

Példák
1. a)

b)

c)

2. a) Adjuk meg lg 56 közelítő értékét, ha lg 2 ≈ 0,301 és lg 7≈0,8451!

b) Mivel egyenlő lg (10!), ha lg 2 = a, lg 3 = b és lg 7 = c?

3. Írjuk fel az alábbi kifejezéseket 10-es alapú logaritmusként!


a)

b)

c)

4. Az alábbi kifejezéseket írjuk fel egyetlen kifejezés 10-es alapú logaritmusaként!


a)

b)
c)

Gyakran előfordul, hogy egy logaritmikus kifejezés értékét kell meghatároznunk, de a kifejezésben szereplő
logaritmus alapjával rendelkező táblázatunk nincs. (A kézi számológépek is általában 10-es és e alapú logaritmusra vannak
csupán beprogramozva.) Ilyenkor használhatjuk az új alapra való áttérés tételét.

Legyenek a > 0, b > 0, a ≠ 1 és c tetszőleges pozitív, 1-től különböző szám. Ekkor

Legyen ugyanis logab = x. Ekkor ax = b. Vegyük ez utóbbi egyenlőség mindkét oldalának c alapú logaritmusát: logc ax

= logc b, innen x logc a = logc b, ahonnan .


Példa. Igazoljuk, hogy loga b · logb c · logc a = 1! Térjünk át a háromtényezős szorzat második és harmadik
tényezőjében a alapra!

Számolás 10-es alapú logaritmussal. A gyakori és nehézkes számolások elvégzéséhez elsősorban a 10-es alapú
logaritmustáblázatok, illetve a 10-es alapra programozott zsebszámológépek nyújtanak segítséget. Ehhez először a kérdéses
valós számokat át kell írnunk normálalakra.

Minden pozitív valós szám felírható két olyan szám szorzataként, melyek közül az egyik 1 és 10 közötti szám, a másik
pedig 10-nek egész kitevőjű hatványa. A számok ilyen alakját a szám normálalakjának mondjuk.

Például: 3456 = 3,456 · 103, 534,62 = 5,3462 · 102, 0,000 382 = 3,82 · 10–4. Ha most ezeknek a számoknak 10-es alapú
logaritmusát szeretnénk közelítőleg megkapni, akkor a következőképpen járhatunk el: alkalmazva a logaritmus
megfelelő azonosságait, valamint a logaritmus fogalmát:

Most nézzük visszafelé: ha ismerjük valamely szám 10-es alapú logaritmusát, akkor azt átírva 10 hatványaként,
táblázat vagy számológép segítségével meghatározhatjuk a kérdéses számot. (Természetesen az esetek többségében
csak e számok közelítő értékét.) Ha lg x = 3,2245, akkor x = 103,2245 = 103+0,2245 = 103 · 100,2245 ≈ 1000 · 0,67 687 ≈ 676,87.
Ha lg x = –2,145, akkor x = 10–2,145 = 10–3+0,855 = 10–3 · 100,855 ≈ 10–3 · 7,1614 ≈ 0,007 1614. Példák
1. Számítsuk ki x közelítő értékét a 10-es alapú logaritmus segítségével!

Először a logaritmus megfelelő azonosságainak alkalmazásával határozzuk meg lg x-et, majd az egyes számok 10-
es alapú logaritmusát zsebszámológép segítségével meghatározva és elvégezve a műveleteket megkapjuk lg x
numerikus értékét. Ezután x-et 10 hatványaként felírva eljutunk x értékéhez:

Mivel lg 23 ≈ 1,3617 és lg 2546 ≈ 3,4058, így azt kapjuk:


2. Számítsuk ki y közelítő értékét a 10-es alapú logaritmus segítségével!

3. Kísérleti úton állapították meg az ún. lehűlési törvényt, mely szerint az ahhoz szükséges t idő (percekben mérve),
hogy egy T0 hőmérsékletű tárgy K hőmérsékletű környezetben T hőmérsékletre lehűljön:

ahol k egy, a kérdéses anyagra jellemző állandó. Kb. mennyi idő alatt hűl le a sütőből kivett sült kacsa 95 °C-ról 60
°C-ra, ha a konyha hőmérséklete 22 °C, és a sült kacsa esetében k ≈ 22,4 perc?
Esetünkben T0 = 95 °C, K = 22 °C, T = 60 °C. Tehát a szükséges t idő:

Térjünk át 10-es alapú logaritmusra:

4. Tapasztalati mérések alapján a tücsök H ciripelési frekvenciájának mérőszáma a °C-ban mért t hőmérséklettől és
a tengerszint feletti méterben mért m magasságtól függ az alábbi módon:

ahol k a kérdéses tücsökfajtára jellemző állandó. H0 a tengerszinten mért frekvencia, m a tengerszint feletti
magasság méterben, t pedig a °C-ban mért hőmérséklet. Egy tücsök ciripelési frekvenciája 320 m magasságon 110.
Mekkora itt a hőmérséklet, ha e tücsökfajtára nézve k = 6,8 és H0 = 80?
A feladat feltételei szerint a egyenletet kell megoldanunk.

Innen
Vegyük mindkét oldal 10-es alapú logaritmusát:

Mivel lg 6,8 ≈ 0,8325, és , így azt kapjuk:

3.5. Számrendszerek
A számok jelzésére, leírására a különböző korok, különböző civilizációk különféle módszereket dolgoztak ki. Valamennyi
módszer lényege az volt, hogy a kérdéses mennyiséget (darabszámot) csoportokba sorolták, s valamilyen módon azt
jelezték, hogy az egyes csoportból hány darab keletkezett. Legtöbb helyen a 10-es számrendszer alakult ki, de használatos
volt pl. a 6-os, 12-es vagy éppen a 60-as számrendszer is.
Vizsgáljuk meg például a 10-es számrendszer működését. Legyen egy nagyobb mennyiségű korongunk. Ezeket először
10-es csoportokba rakjuk (természetesen előfordulhat, hogy az utolsó csoportba már nem jut 10 db, csak annál kevesebb).
Ezután a 10-es csoportokat 10-esével csomagokba helyezzük; így egy csomagban már 102 = 100 db korong lesz. Utána a
csomagokat 10-esével dobozokba helyezzük, így egy dobozban 103 = 1000 db korong lesz, és így tovább folytatjuk az eljárást,
amíg a korongok elfogynak. Így lesznek 1-esek, 10-esek, százasok, ezresek stb. Természetesen mindegyikből legfeljebb 9
lehet, hiszen, ha valamelyik fajtából 10 (vagy annál több) lenne, akkor az már egy nagyobb egységet alkotna. Ezek szerint a
10-es számrendszerben 10 db számjegyet különböztethetünk meg. Egy számjegynek van alaki értéke, ami megmutatja,
hogy a kérdéses 10-hatványból hány darab szerepel a kérdéses számban, és van helyi értéke, ami azt mutatja meg, hogy
(jobbról balra haladva) a kérdéses számjegy 10 hányadik hatványának a mérőszámát jelenti. Például

Hasonló gondolatmenettel jutunk a 2-es számrendszerhez. Itt – az előbbi gondolatmenetet követve – a korongokat nem
10-esével, hanem 2-esével csoportosítjuk, ennek megfelelően a 2-es számrendszerben csak két számjegy létezik: a 0 és az 1. A
2-es számrendszerben az egyes helyi értékek 2 hatványai lesznek: 1, 2, 22, 23, 24 stb.
Általában, ha a számrendszer alapszámát c-vel jelöljük, akkor ebben a számrendszerben c db számjegy létezik, és az
egyes helyi értékek c hatványai: 1, c, c2, c3, c4 stb. A leírt számok jobb alsó sarkában jelezzük, hogy a kérdéses számot melyik
számrendszerben írtuk fel. 23024 a 4-es, 11011012 a 2-es, 530416 a 6-os számrendszerben felírt számok.
Vizsgáljuk meg, hogyan tudunk átváltani 10-es számrendszerbeli számot 2-es számrendszerbeli számra és fordítva.
Legyen pl. 3761 egy 10-es számrendszerben felírt szám, és váltsuk ezt át 2-es számrendszerbeli számmá.

2 hatványai:

20 21 22 23 24 25 26 27 28 29 210 211

1 2 4 8 16 32 64 128 256 512 1024 2048

A 3761-be „beleférő“ legnagyobb 2-hatvány: 211 = 2048, tehát 211-ből lesz 1 db. A még megmaradt szám: 3761–2048 = 1713.
Ebbe „belefér“ 210 = 1024, tehát ebből is lesz 1 db. A megmaradó szám: 1713 – 1024 = 689. Ebbe belefér a 29 = 512, tehát ebből is
lesz egy db. A megmaradó szám: 689 – 512 = 177. Ebbe a 28 = 256 nem fér bele, így 28-ból nem lesz (azaz 0 db lesz). A következő
helyi érték, a 27 = 128, ami belefér a 177-be, így 27-ből lesz 1 db, és a megmaradó szám 177 – 128 = 49. Ebbe 26 = 64 nem fér bele,
tehát 26-ból is 0 db lesz, de 25 = 32 belefér, így 25-ből lesz 1 db. A megmaradó szám: 49 – 32 = 17. Ebbe belefér a 24 = 16, tehát 24-
ből is lesz 1 db, a megmaradó szám: 17 – 16 = 1. Ebbe sem 23, sem 22, sem 21 nem fér bele, így ezekből 0 db lesz, végül
megmaradt a 20 = 1.
Tehát 3761 a 2-es számrendszerben így néz ki:

Most vizsgáljuk fordítva: mi lesz a 10-es számrendszerben az 11001012 2-es számrendszerben felírt szám? Látható, hogy
a felírt számban szerepel 26, 25, 22 és 20. Tehát

Az alábbi táblázat a 2-es, 3-as, 6-os, 8-as és a 10-es számrendszer első néhány helyi értékét tartalmazza.

Helyi érték a különböző számrendszerekben

2-es 3-as 6-os 8-as 10-es

számrendszer

0. 1 1 1 1 1

1. 2 3 6 8 10

2. 4 9 36 64 100

3. 8 27 216 512 1 000

4. 16 81 1 296 4 096 10 000

5. 32 243 7 776 32 768 100 000

6. 64 729 46 656 262 144 1 000 000

7. 128 2187 279 936 2 097 152 10 000 000

8. 256 6561 1 679 616 16 777 216 100 000 000

Példák
1. Írjuk át 10-es számrendszerbe az alábbi számokat:
a) 330214, b) 2100123, c) 51036,
b) 330214 = 3 · 44 + 3 · 43+0 · 42+2 · 41 + 1 · 40 = 768 + 192 + 8 + 1 = 969,
c) 2100123 = 2 · 35 + 1 · 34 + 0 · 33 + 0 · 32 + 1 · 31 + 2 · 30 = 486 + 81 + 3 + 2 = 542,
d) 51036 = 5 · 63 + 1 · 62 + 0 · 61 + 3 · 60 = 1080 + 36 + 3 = 1119.
2. Végezzük el az alábbi 10-es számrendszerbeli összeadást! Ezután írjuk át az összeadandókat 2-es számrendszerbe,
végezzük el ott is az összeadást, és ellenőrizzük, hogy a 2-es számrendszerben kapott eredmény egyenlő a 10-es
számrendszerben kapott eredménnyel!

Az összeadandók a 2-es számrendszerben:

Most adjuk össze e két 2-es számrendszerbeli számot! (Vigyázzunk! A „tízes átlépés“ most kettes átlépés, hiszen a
számrendszer alapszáma most 2.)

És most írjuk „vissza“ a kapott eredményt a 10-es számrendszerbe!

3. Egy derékszögű háromszög oldalai egész számok, valamely számrendszerben: 12, 110, 111. Mekkorák az oldalak a
10-es számrendszerben?
Legyen a számrendszer alapszáma x, és írjuk fel e háromszögre Pitagorasz tételét (lásd 5.4. fejezet)

Mindezt részletesen kiírva:

Ez utóbbi másodfokú egyenlet megoldásai (lásd a 3.6. fejezetet) x1 = 3, x2 = –1. A negatív megoldás nyilván nem
jöhet számításba, így a számrendszer keresett alapszáma: x = 3.
4. Melyik az a számrendszer, amelyben az 1122 alakú szám nagyobb, mint a kétszer akkora alapú számrendszerben
felírt 112 alakú szám?
Most az 1122x < 1122x egyenlőtlenséget kell megoldanunk. Kiírva részletesen:

Mivel x 1-nél nagyobb pozitív egész szám, ezért azt kapjuk:

vagyis a kívánt egyenlőtlenség bármely 3-nál nagyobb alapú számrendszerben teljesül.

3.6. Egyenletek, egyenletrendszerek (fogalom, mérlegelv, osztályozás fokszám


és egyenletek száma szerint, első- és másodfokú egyenletek, exponenciális és
logaritmikus egyenletek)
Ha két olyan algebrai kifejezést, melyekben betű vagy betűk szerepelnek, az egyenlőség jelével kötünk össze, egyenletet
kapunk. Az egyenletben szereplő betűk lehetnek ismeretlenek, de lehetnek ismert mennyiségnek tekintendő paraméterek.
A paramétereket tartalmazó egyenletet paraméteres egyenletnek nevezzük.
Egy algebrai kifejezés értelmezési tartománya a valós számok halmazának az a legbővebb részhalmaza, melynek
elemeit a megfelelő változó, illetve változók helyére behelyettesítve konkrét, értelmezhető értéket kapunk. Az egyenlet
értelmezési tartománya a benne szereplő algebrai kifejezések értelmezési tartományának a metszete.
Az egyenlet megoldásai (gyökei) azok a számok vagy betűkifejezések, amelyeket az ismeretlen helyébe helyettesítve az
egyenlőség igazzá válik. Másképpen fogalmazva, azok a számok vagy betűkifejezések, amelyek az egyenletet kielégítik, az
egyenletnek eleget tesznek.
Az egyenletet megoldani annyit jelent, mint megkeresni az egyenlet megoldásait, vagyis azokat a számokat,
betűkifejezéseket, melyek az egyenletet igazzá teszik. Ha valamely egyenletet az értelmezési tartományának bármely eleme
kielégíti, akkor azt azonosságnak nevezzük.
Az egyenletek megoldása során lépésről lépésre arra törekszünk, hogy az olyan egyszerű alakot öltsön, melyből már
közvetlenül kiolvashatjuk az eredeti egyenletet igazzá tevő valós számot vagy számokat. Az egyenletek megoldásakor
használt leggyakoribb módszer az ún. mérlegelv. (Az egyenlőség szimbolizálhat számunkra egy egyensúlyban levő
mérleget. Nyilván ez az egyensúly nem változik meg, ha a mérleg mindkét serpenyőjébe ugyanazt a mennyiséget
beletesszük, vagy ugyanazt a mennyiséget elvesszük, vagy mindkét serpenyő tartalmát ugyanannyiszorosára növeljük,
vagy ugyanannyiad részére csökkentjük.)
Ha az egyenlet mindkét oldalához ugyanannyit hozzáadunk, vagy mindkét oldalból ugyanannyit elveszünk, vagy
mindkét oldalt ugyanazzal a 0-tól különböző számmal osztjuk vagy szorozzuk, akkor az egyenlőség továbbra is fennáll.
Ugyancsak fennáll az egyenlőség, ha mindkét oldalból ugyanannyiadik gyököt vonunk, vagy mindkét oldalnak vesszük
ugyanolyan alapú logaritmusát, vagy mindkét oldalnak vesszük a reciprokát.
Fontos lépés az egyenlet gyökeinek ellenőrzése. Ez azt jelenti, hogy azokat a megoldásokat, melyek elemei az
értelmezési tartománynak, visszahelyettesítjük az eredeti egyenletbe, és így győződünk meg arról, hogy a kapott gyökök
valóban kielégítik az eredeti egyenletet.

Példák. Vizsgáljuk meg az alábbi egyenleteket a valós számok halmazán!


1. (x – 3)2 = x2 – 6x + 9. Az egyenlet értelmezési tartománya minden valós szám. Mivel ennek az egyenletnek minden
valós szám eleget tesz, ezért ez azonosság.
2. lg(x – 2)2 = 2lg(x – 2). Most az egyenlet értelmezési tartománya az x > 2 feltételnek eleget tevő valós számok
halmaza. Mivel minden, e feltételnek eleget tevő valós szám kielégíti az egyenletet, ezért ez is azonosság.
3. 10x – 6 = 2 · (5x – 2). A jobb oldali zárójelet felbontva: 10x – 6 = 10x – 4. Ez utóbbi egyenletet egyetlen valós szám sem
elégíti ki, így ennek az egyenletnek nincs megoldása.
4. . A négyzetgyök alatti mennyiség teljes négyzet:
x2 + 4x + 4 = (x + 2)2.
Tehát az értelmezési tartomány – úgy tűnik – minden valós szám. Így azt gondolnánk, hogy – négyzetre emelés
után – olyan egyenlethez jutunk, melynek minden valós szám eleget tesz. De vigyázzunk! A négyzetgyök fogalma
miatt szükséges, hogy x + 2 > 0, azaz x > –2 legyen. E feltétel mellett már az eredeti egyenlet valóban azonosság.
5. (x + 3) (x – 6) = (5 – x) (x – 6). Az egyenlet értelmezési tartománya minden valós szám. Most nagy lehet a csábítás,
hogy mindkét oldalt osszuk el x – 6-tal. Ekkor azonban nem kapunk az eredetivel ekvivalens egyenletet, hiszen
meg kell vizsgálnunk, hogy amivel osztunk, lehet-e 0 (vagyis gyököt veszítünk). Inkább vegyük el mindkét
oldalból a jobb oldalt, és alakítsuk a kapott kifejezést szorzattá.

Mivel egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, ezért az eredeti egyenlet gyökei: x = 6 és x = 1.

Az egyenletek osztályozásánál két szempont szerint járunk el. Osztályozhatjuk az egyenleteket a bennük szereplő
ismeretlenek száma szerint: vagyis megkülönböztetünk egy- vagy többismeretlenes egyenletet, illetve egyenletrendszert.
Osztályozhatjuk az egyenleteket a bennük szereplő ismeretlenek fokszáma szerint: így megkülönböztetünk első-, másod-,
n-edfokú algebrai egyenleteket.

Elsőfokú egyenletek, egyenletrendszerek


Másodfokú egyenletek
Egyenlőtlenségek

Elsőfokú egyenletek, egyenletrendszerek


Elsőfokú egyismeretlenes egyenletnek mondjuk az olyan egyenletet, melyben csak egy ismeretlen szerepel, és ez az
ismeretlen csak az első hatványon fordul elő. Minden elsőfokú egyenlet

alakú, vagy ekvivalens átalakítások után ilyen alakra hozható, ahol a ≠ 0. Innen először mindkét oldalból b-t elvéve, majd
mindkét oldalt a-val elosztva kapjuk az egyenlet megoldását:
Ez valóban kielégíti az eredeti egyenletet, hiszen

Az elsőfokú egyismeretlenes egyenletek megoldása során általában a következő lépéseket célszerű követni.
1. Először törtmentesítjük az egyenletet (ez általában az egyenletben előforduló törtek közös nevezőjével való szorzást jelenti).
2. Elvégezzük a kijelölt műveleteket (ez általában az egyenletben előforduló zárójelek felbontását jelenti).
3. Összevonjuk az egyenlet mindkét oldalán az összevonható tagokat.
4. Megfelelő átalakításokkal elérjük, hogy az ismeretlen csak az egyik oldalon, az ismertnek tekinthető mennyiségek pedig a
másik oldalon szerepeljenek (ez után a lépés után jutunk el az ax = –b alakra).
5. Mindkét oldalt elosztjuk az ismeretlen együtthatójával.
6. Elvégezzük az ellenőrzést.

Példák. Oldjuk meg az alábbi egyenleteket a valós számok halmazán!


1.
.
Először megszorozzuk mindkét oldalt 12-vel, a közös nevezővel, majd mindkét oldalon összevonunk

Most az ismeretleneket egy oldalra, egyebeket a másik oldalra csoportosítjuk, azaz elveszünk mindkét oldalból
9x-et, és mindkét oldalhoz hozzáadunk 4-et:

végül mindkét oldalt elosztjuk –13-mal:

Utolsó lépésként következne a kapott megoldás ellenőrzése, amit az olvasóra bízunk.


2. 2{2x + 3[x – 4(x + 2)]} = 7(7 – 2x).
Az egyenlet megoldását a zárójelek felbontásával kezdjük, belülről kifelé haladva:

Ez utóbb kapott egyenlőséget egyetlen valós szám sem elégíti ki, így az eredeti egyenletnek nincs valós száma.
3. ax + b = x + 2b.
Vonjunk ki mindkét oldalból x-et és b-t. Azt kapjuk: ax – x = b.
Emeljük ki a bal oldalon x-et:

Most szeretnénk elosztani mindkét oldalt a – 1-gyel, de meg kell vizsgálnunk, hogyan alakul az eredeti egyenlet,
ha ez 0, azaz a = 1. Ekkor az eredeti egyenlet

Ha most b = 0, akkor az eredeti egyenletet bármely valós szám kielégíti. Ha b ≠ 0 akkor az egyenletnek nincs
megoldása.
Ha a ≠ 1 akkor oszthatunk a – 1-gyel, így ekkor az eredeti egyenlet megoldása:

Ellenőrizzük a kapott gyököt:

4.
Mindkét oldalt megszorozzuk a közös nevezővel, ab-vel:

Alakítsuk szorzattá mindkét oldalt:

Most szeretnénk osztani mindkét oldalt b – a-val. Ha ez 0, azaz a = b, akkor az eredeti egyenlet így alakul:

tehát ekkor az egyenlet azonosság. Ha a ≠ b, akkor oszthatunk b – a-val: x = –ab.

Ellenőrzés:
5. Mekkora legyen az a paraméter értéke, hogy az alábbi egyenlet megoldása x = 1 legyen?

Először oldjuk meg az egyenletet! 2a-val szorozva mindkét oldalt:

Könnyen ellenőrizhetjük, hogy 5 + 2a ≠ 0, így . Ez akkor és csak akkor lesz 1, ha

Legyenek a, b, c (a ≠ 0, b ≠ 0) ismert valós számok, x és y ismeretlenek. Ekkor elsőfokú kétismeretlenes egyenletnek


nevezzük az

(3.1)

alakú egyenleteket, ahol tehát két ismeretlen szerepel és mindkettő első fokon. Ennek az egyenletnek a megoldása x-re
nézve:

Ha most y-nak tetszőleges értéket adunk, akkor x-re más és más értékeket kapunk. Az így adódó x, y rendezett
számpárok adják a (3.1) egyenlet megoldáshalmazát. Tehát a (3.1) egyenletnek végtelen sok megoldása van.
Legyen adott két kétismeretlenes elsőfokú egyenlet, és keressük azokat az x, y rendezett számpárokat, melyek mindkét
egyenletet kielégítik. Ekkor elsőfokú kétismeretlenes egyenletrendszert kapunk:

(3.2)

Az egyenletrendszer megoldásai számának tekintetében három eset lehetséges.


1. Ha az egyik egyenlet bal oldala nem számszorosa a másik egyenlet bal oldalának

akkor az egyenletrendszernek van egyértelmű megoldása, vagyis egyetlen olyan x, y számpár, mely mindkét egyenletet
kielégíti.
2. Ha az egyik egyenletet valamilyen számmal megszorozva éppen a másik egyenletet kapjuk, vagyis
akkor az egyenletrendszernek végtelen sok megoldása van. (Ekkor tulajdonképpen – bár formailag két egyenletünk van –
csak egy egyenlet áll rendelkezésünkre.)
3. Ha az egyik egyenlet bal oldala számszorosa a másik egyenlet bal oldalának, de a jobb oldal nem, vagyis

akkor a két egyenlet ellentmond egymásnak, vagyis az eredeti egyenletrendszernek nincs megoldása.
A (3.2) egyenletrendszer megoldására több módszer ismeretes, mi most három módszert mutatunk be.
Egyenlő együtthatók módszere. E módszernek az a lényege, hogy valamelyik egyenletet (esetleg mindkettőt) szorozzuk
meg egy-egy alkalmas számmal úgy, hogy a szorzás után valamelyik ismeretlen együtthatói megegyezzenek. Ezután a két
egyenletet kivonva egymásból, az egyik ismeretlen kiesik (éppen az, amelynek együtthatói egyenlők), így egyismeretlenes
egyenlethez jutunk; ezt megoldjuk, majd a kérdéses ismeretlen kapott értékét visszahelyettesítjük az eredeti (3.2)
egyenletrendszer valamelyik egyenletébe, így eljutunk a másik ismeretlenhez is.
Behelyettesítő módszer. Valamelyik egyenletből kifejezzük az egyik ismeretlent, majd azt behelyettesítjük a másik
egyenletbe. Ezáltal egy egyismeretlenes egyenlethez jutunk, azt megoldjuk, s a kapott gyököt visszahelyettesítjük
valamelyik eredeti egyenletbe, így eljutunk a másik ismeretlenhez is.

Példák. Oldjuk meg az 1. és a 2. egyenletet az egyenlő együtthatók módszerével, a 3. és a 4. példát a behelyettesítő


módszerrel!
1. 2x – 7y = –20,
4x + 5y = 17.
Ha az első egyenlet mindkét oldalát megszorozzuk 2-vel, akkor az x ismeretlen együtthatója mindkét egyenletben
ugyanannyi lesz. Ekkor a két egyenletet egymásból kivonva már csak az y ismeretlen marad meg.

E két egyenlet különbsége: 19y = 57, ahonnan y = 3. Ezt visszahelyettesítve pl. az első egyenletbe: 2x – 21 = –20,

ahonnan . Tehát az eredeti egyenletrendszer egyetlen megoldása: , y = 3.


2. 3x + 5y = 13,
4x – 7y = –10.
Szorozzuk meg az első egyenletet 4-gyel, a másodikat pedig 3-mal (természetesen azt is tehetnénk, hogy az első
egyenletet –7-tel, a másodikat 5-tel szorozzuk):

A kapott két egyenlet különbsége: 41y = 82, ahonnan y = 2. Ezt valamelyik (pl. az első) egyenletbe
visszahelyettesítve x = 1 adódik. Tehát az egyenletrendszer megoldása: x = 1, y = 2.
3. 2x – y = 12,
3x + 4y = 34,5.
Legcélszerűbb az első egyenletből y-t kifejezni, hiszen ennek együtthatója –1. y = 2x – 12. Ezt a második egyenletbe
helyettesítve azt kapjuk:

Ezt pl. az első egyenletbe visszahelyettesítve: 15 – y = 12, azaz y = 3.


4.

Először mindkét egyenletet ax + by = c alakra kell hoznunk. Az első egyenletet 5-tel, a másodikat 30-cal szorozva,
majd megfelelően rendezve az egyenleteket azt kapjuk:

Most fejezzük ki az első egyenletből y-t, és helyettesítsük be a második egyenletbe:


Ez utóbbi egyenletet 3-mal szorozva:

Ezt visszahelyettesítve pl. az eredeti első egyenletbe: –16 – 3y = 5, ahonnan y = –7.

Determinánsmódszer. Tekintsük az alábbi 2 × 2-es számtáblázatot, az ún. kétszer kettes D determinánst:

Minden ilyen determinánshoz hozzárendelünk egy valós számot a következőképpen:

Tekintsük most a (3.2) egyenletrendszert, illetve a benne szereplő együtthatók D determinánsát:

Ezek után képezzük a Dx determinánst oly módon, hogy a D determinánsból elhagyjuk az x együtthatóit, és helyükre a
jobb oldali c konstansokat írjuk:

Teljesen hasonlóképpen kapjuk a Dy determinánst:

Mármost az eredeti (3.2) egyenletrendszer megoldása:

Ez az ún. Cramer-szabály. Világos, hogy az egyértelmű megoldás szükséges és elégséges feltétele, hogy

Példa. Oldja meg az alábbi egyenletrendszert a determinánsok segítségével:

Az egyes determinánsok:

Az egyenletrendszer megoldása:

Megjegyzés. A három ismeretlent tartalmazó, három egyenletből álló, illetve n ismeretlent tartalmazó, n
egyenletből álló n ismeretlenes elsőfokú (lineáris) egyenletrendszerekkel, a hozzájuk tartozó determinánsokkal és
azok tulajdonságaival a 11. fejezetben fogunk megismerkedni.
Másodfokú egyenletek
Egyismeretlenes másodfokú egyenletnek mondjuk az

(3.3)

alakú, vagy ilyen alakra hozható egyenleteket. Tehát azokat az egyenleteket, melyekben az ismeretlen legmagasabb fokon a
másodikon szerepel.
A (3.3) egyenlet tiszta másodfokú egyenlet, ha az elsőfokú tag együtthatója 0, b = 0. Ekkor

Innen mindkét oldalból c-t elvéve, majd mindkét oldalt a-val elosztva

A kapott gyökökből világos, hogy az ilyen típusú egyenletnek akkor és csak akkor van valós megoldása, ha a c konstans
és a másodfokú tag a együtthatójának előjele különböző.
A (3.3) egyenletet hiányos másodfokú egyenletnek nevezzük, ha (3.3)-ban c = 0. Ekkor

Emeljünk ki bal oldalon x-et:

Mivel egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, kapjuk az egyenlet két valós gyökét:

A hiányos másodfokú egyenletnek a 0 mindig gyöke.


Ha a (3.3) egyenletben egyik együttható sem 0, akkor vegyes másodfokú egyenletnek nevezzük. A (3.3) egyenlet
megoldásait az ún. megoldóképlet adja.

Az ax2 + bx + c = 0 (a ≠ 0) másodfokú egyenlet gyökei:

A másodfokú egyenlet megoldásainak a száma a négyzetgyök alatti kifejezéstől függ. A D = b2 – 4ac mennyiséget a
másodfokú egyenlet (másodfokú kifejezés) diszkriminánsának nevezzük. Ha ez negatív, akkor a négyzetgyökvonás nem
végezhető el a valós számok körében, így ekkor a (3.3) egyenletnek nincs valós megoldása.
Ha D > 0, akkor a másodfokú egyenletnek két különböző valós gyöke van.
Ha D = 0, akkor a másodfokú egyenletnek egy valós gyöke van.
Ha D < 0, akkor a másodfokú egyenletnek nincs valós gyöke.

Megjegyzés. D < 0 esetén a négyzetgyök alatti negatív számnak a négyzetgyöke komplex szám, így ekkor a másodfokú
egyenletnek komplex gyökei vannak (lásd 21. fejezet).
Példák. Oldjuk meg az alábbi másodfokú egyenleteket!
1. 3x2 + 20x – 7 = 0. A megoldóképlet szerint

2.
Mielőtt a megoldóképletet használnánk, az egyenletet (3.3) alakra kell hoznunk:
3. 3x2 + 6x – 1 = 2x2 + 8x – 8. először ismét 0-ra rendezzük az egyenletet: x2 – 2x + 7 = 0. Mivel a kapott egyenlet D
diszkriminánsa: D = 4 – 28 = –24 < 0, ezért az egyenletnek nincs valós gyöke.
4.
. Az egyenletnek csak akkor van értelme, ha .
Ezek után szorozzuk meg mindkét oldalt a bal oldal nevezőjével, majd hozzuk az egyenletet (3.3) alakra.

Mindkét gyök kielégíti az eredeti egyenletet.


5. Öt db egymást követő egész szám közül az első három négyzetének összege egyenlő az utolsó kettő négyzetének
összegével. Melyek ezek a számok?
A feltételek szerint

Végezzük el a négyzetre emeléseket, majd rendezzük 0-ra az egyenletet!

Tehát a keresett öt db szám: –2, –1, 0, 1, 2, vagy pedig 10, 11, 12, 13, 14.

Fontos összefüggések a másodfokú egyenlet együtthatói és gyökei között az ún. Viète-formulák.

Ha az ax2 + bx+c = 0 másodfokú egyenlet valós gyökei x1 és x2, akkor

Megjegyzés. Ha a másodfokú egyenlet diszkriminánsa negatív, vagyis nincsenek valós gyökök, Viète formulái akkor
is igazak. Ekkor a gyökök ún. konjugált komplex számok (lásd 21. fejezet). Könnyen kimutatható, hogy az ilyen
komplex számok összege és szorzata is valós szám.

Induljunk most ki a (3.3) egyenletből, és osszuk el a-val mindkét oldalt:

Felhasználva az előbb ismertetett Viète-formulákat, ez az egyenlet így írható:

Ez utóbbi egyenlet első két tagjából x-et, utolsó két tagjából –x2-t kiemelve a következőt kapjuk:

Tehát

Ezt nevezzük a másodfokú egyenlet gyöktényezős alakjának. Ennek segítségével – a gyökök meghatározása után – a
másodfokú kifejezést könnyen felbonthatjuk két elsőfokú szorzatára.

Példák
1. Állítsuk elő az ax2 + bx + c = 0 másodfokú egyenletben a Viète-formulák segítségével
a) a gyökök reciprokának összegét,
b) a gyökök négyzetének összegét!
a)

b) A gyökök négyzetösszegének előállításához vegyük először a gyökök összegének négyzetét:

Most felhasználva a Viète-formulákat:

2. Az x2 + px + 8 = 0 másodfokú egyenlet egyik gyöke 2-vel nagyobb a másik gyöknél. Határozzuk meg a p paraméter
értékét! Írjuk fel egyenletünkre a Viète-formulákat, tudva, hogy x2 = x1 + 2.

A második egyenlet x1-re nézve egy másodfokú egyenlet, melynek gyökei: x1 = 2 vagy x1 = –4. Ezeket az értékeket az
első egyenletbe helyettesítve kapjuk: p = –4 vagy p = 6.
3.
Egyszerűsítsük a következő törtet:
Alakítsuk a számlálót is és a nevezőt is szorzattá a gyöktényezős alak segítségével. A számláló gyökei: 2 és –6, a
nevező gyökei 2 és 9. Tehát a tört így írható:

Ezek szerint, ha x ≠ 2, akkor

Egyenlőtlenségek
Egyenlőtlenségnek nevezzük az olyan relációt, melyben két algebrai kifejezés a > (nagyobb), < (kisebb), ≥ (nagyobb-
egyenlő), vagy ≤ (kisebb-egyenlő) jelek valamelyikével van összekapcsolva. Az egyismeretlenes egyenlőtlenségek
megoldásánál az a célunk, hogy meghatározzuk mindazon valós számokat, melyeket az ismeretlen helyére beírva az
egyenlőtlenség teljesül.
Egyenlőtlenségek megoldása során ugyanazokat a lépéseket tehetjük meg, amelyeket az egyenleteknél a mérlegelv
alapján, csupán arra kell vigyáznunk, hogy
1. az egyenlőtlenség iránya megfordul, ha az egyenlőtlenség mindkét oldalát ugyanazzal a negatív számmal osztjuk vagy
szorozzuk;
2. az egyenlőtlenség iránya megfordul, ha az egyenlőtlenség mindkét oldalának a reciprokát vesszük.
Egyidejűleg több egyenlőtlenséget, ún. egyenlőtlenség-rendszert is vizsgálhatunk. Ekkor az a célunk, hogy
meghatározzuk azon számok halmazát, melyek az összes vizsgált egyenlőtlenséget kielégítik. Ez pontosan azt jelenti, hogy
meg kell keresnünk az összes egyenlőtlenséget külön-külön kielégítő számhalmazt, majd vennünk kell e halmazok
metszetét.

Megjegyzés. 1. A másodfokú egyenlőtlenségek általános alakja: ax2 + bx + c ≥ 0 vagy ≤ 0 (vagy ugyanezek egyenlőség
nélkül). Ennek megoldásához legkézenfekvőbb a másodfokú függvény gra konjából kiindulnunk (lásd 15. fejezet),
majd a zérushelyek meghatározása után a gra konról könnyen leolvashatjuk az egyenlőtlenségben feltett kérdésre a
választ.
2. Egyenlőtlenség-rendszer vizsgálatakor érdemes a benne szereplő egyenlőtlenségek megoldáshalmazát külön-
külön ábrázolni a számegyenesen, mert így jóval áttekinthetőbben leolvashatjuk az egyes megoldáshalmazok
metszetét.

Példák
1. Oldjuk meg az alábbi egyenlőtlenséget a valós számok halmazán

Szorozzuk meg mindkét oldalt 3-mal, majd vonjuk össze a két oldalt:
Most osszuk el mindkét oldalt –8-cal, de vigyázzunk, mivel negatív számmal osztunk, a relációjel megfordul!

2. Határozzuk meg azokat a valós számokat, melyek mindkét egyenlőtlenséget kielégítik:

Az első egyenlőtlenségből azt kapjuk:

A második egyenlőtlenségből

Az egyenlőtlenségek ábrázolása a számegyenesen (3.13. ábra):

3.13. ábra

Tehát mindkét egyenlőtlenséget kielégítő számhalmaz: .


3. Határozzuk meg a következő kifejezés értelmezési tartományát: Az adott kifejezés értelmezési
tartományának minden olyan valós szám eleme, melyekre

A másodfokú kifejezés zérushelyei a megoldóképlet alapján: x1 = 4, x2 = –3, tehát a gyöktényezős alakot


felhasználva

Mármost egy szorzat akkor és csak akkor legalább 0, ha mindkét tényezője legalább 0, vagy mindkét tényezője
legfeljebb 0.

vagy pedig

Tehát az eredeti kifejezés értelmezési tartománya:

Az olyan nem algebrai egyenletet, amelyekben az ismeretlen csak a hatványkitevőben szerepel, exponenciális
egyenletnek hívjuk. Ha egyenletünk olyan, hogy abban az ismeretlennek valamilyen alapú logaritmusa szerepel, akkor
logaritmikus egyenletnek nevezzük. Az exponenciális és a logaritmikus egyenletek megoldására általános eljárás nem
adható, de sokszor előfordul, hogy az ilyen típusú egyenleteket – a hatványozás és a logaritmus fogalma, valamint az ismert
azonosságok segítségével – jóval egyszerűbb algebrai egyenletekre vezethetjük vissza. A leggyakrabban előforduló esetek:
1. Ha az egyenlet két oldalán egy-egy azonos alapú exponenciális kifejezés szerepel – vagy a megfelelő azonosságokkal az
egyenlet ilyen alakra hozható –, akkor az alapok elhagyásával a kitevők egyenlővé tehetők, vagyis ha ax = ay (a > 0), akkor
vagy x = y, vagy pedig a = 1.
2. Ha az exponenciális egyenlet a1 · a2x+ a2 · ax + a3 = 0 alakra hozható, ahol a > 0, továbbá a1, a2, a3 adott valós számok, akkor az
ax = y helyettesítéssel másodfokú egyenletre vezethetjük vissza eredeti egyenletünket.
3. Ha az egyenletben ugyanannak az ismeretlennek ugyanolyan alapú logaritmusai szerepelnek – vagy az egyenlet ilyen alakra
hozható –, akkor megfelelő új ismeretlen bevezetésével könnyebben kezelhető első- vagy másodfokú algebrai egyenletté
alakítható az eredeti egyenlet.
4. Ha különböző alapú logaritmusok szerepelnek az egyenletben, de ezek új alapra való áttéréssel azonos alapra hozhatók,
akkor ugyancsak egyszerűbb algebrai egyenletet kaphatunk eredeti egyenletünkből.
Nézzünk az elmondottakra néhány példát!

Példák
1. Oldjuk meg az alábbi egyenletet a valós számok halmazán!

Az an+k = an · ak azonosságot felhasználva az egyenlet így alakítható:

Ellenőrzés: 53 + 3 · 52 – 4 · 5 = 125 + 75 – 20 = 180.


2. Oldjuk meg a következő egyenletet a valós számok halmazán:

Érdemes észrevenni, hogy az is és a 0,25 is felírható 2 hatványaként:

Az ellenőrzést az olvasóra bízzuk.


3. Mely valós számok elégítik ki az alábbi egyenletet?

Először próbáljuk elérni a megfelelő azonosságok alkalmazásával, hogy a kitevőkben csak az x ismeretlen
szerepeljen.

Mivel 4x = (2x)2, ezért, ha bevezetjük a 2x = y új ismeretlent, akkor egy másodfokú egyenlethez jutunk.

Mivel y = 2x minden valós x esetén pozitív, ezért a negatív megoldás nem jöhet számításba,

Ellenőrzés: .
4. Oldjuk meg a következő egyenletet a valós számok halmazán:

Az egyenletben szereplő logaritmusok miatt szükséges, hogy

legyen. Az egyenlet értelmezési tartománya e számhalmazok metszete, azaz x > 4. A logaritmus megfelelő
azonosságait felhasználva egyenletünk így írható:
Innen
A –5 nem tartozik bele az egyenlet értelmezési tartományába, így az nem megoldás. Az x = 13 kielégíti az eredeti
egyenletet, amint azt az alábbi ellenőrzés is mutatja.
Ellenőrzés:

5. Oldjuk meg az egyenletet a valós számok halmazán:

Térjünk át a bal oldal mindhárom tagjában 3-as alapra.

Innen a logaritmus fogalmából adódik

Emeljük négyzetre az egyenlet mindkét oldalát:

Az ellenőrzést ismét az olvasókra bízzuk.

3.7. Harmad- és negyedfokú egyenletek (speciális magasabb fokú egyenletek)


Az egyismeretlen es harmadfokú egyenlet általános alakja

ahol a, b, c, d adott valós számok, és a ≠ 0. Az egyenlet megoldását kezdjük azzal, hogy megpróbáljuk a másodfokú tagot
„eltüntetni“ az egyenletből. Először osszuk el mindkét oldalt a-val, akkor

alakra jutunk. Ha most bevezetjük az új változót, a következőt kapjuk:

Azt látjuk, hogy a másodfokú tag kiesik, az elsőfokú tag együtthatóját p-vel, a konstans tagot q-val jelölve az alábbi
egyenlethez jutunk:

(3.4)

A (3.4) egyenlet megoldását keressük y = u + v alakban. Induljunk ki az alábbi azonosságból


tehát

Ha ez utóbbi egyenletet egybevetjük a (3.4) egyenlettel, arra jutunk, hogy

Ezek szerint – a másodfokú egyenleteknél megismert Viète-formulák alapján – u3 és v3 az alábbi másodfokú egyenlet
megoldásai:

Tehát

Innen

Ez az ún. Cardano-képlet.

Megjegyzés. A képletben szereplő kifejezés fontos mennyiség a harmadfokú egyenletben. Ha a


(3.4) egyenlet együtthatói valósak, akkor három eset lehetséges.
1. Ha D > 0, akkor az egyenletnek egy valós és két konjugált komplex gyöke van.
2. Ha D = 0, akkor az egyenletnek három valós gyöke van, de közülük legalább 2 egyenlő.
3. Ha D < 0, akkor az egyenletnek három különböző valós gyöke van.
A harmadfokú egyenlet gyökeinek számáról, a gyökök természetéről részletesen szólunk a komplex számokról
szóló 4. fejezetben. A harmadfokú egyenletek általános megoldásával először Niccolo Fontana (Tartaglia) (1500–1557)
olasz számolómester foglalkozott, majd az ő munkássága alapján Geronimo Cardano (1501–1576) itáliai orvos,
lozófus, matematikus dolgozta ki a megoldóképletet. Érdekes, hogy éppen abban az esetben, amikor a valós
együtthatós harmadfokú egyenlet gyökei valósak, vagyis amikor D ≤ 0, nem tudtak mit kezdeni a megoldóképlettel.
A harmadfokú egyenlet megoldásának teljes elemzése jóval később, a Gauss munkássága során megszülető komplex
számok ismerete után történt.

Az egyismeretlenes negyedfokú egyenlet általános alakja

(3.5)

ahol a, b, c, d és e adott valós számok és a ≠ 0. Először elosztjuk az egyenlet mindkét oldalát a-val, majd a harmadfokú

egyenletnél már használt ötlettel élve vezessünk be egy új ismeretlent; legyen . Könnyen ellenőrizhető, hogy
ezzel a (3.5) egyenlet olyan alakúvá válik, melyben eltűnik a harmadfokú tag, azt kapjuk:

(3.6)
Mint látni fogjuk, a negyedfokú egyenlet általános megoldóképletét már nem érdemes felírni, mert rendkívül hosszú,
bonyolult lenne. Ehelyett egy lehetséges megoldási eljárást mutatunk be a (3.6) egyenlet megoldására. Célunk az lesz, hogy
a (3.6) egyenlet bal oldalát írjuk fel két másodfokú kifejezés szorzataként:

Ha ezt sikerül elérni, akkor két másodfokú egyenlet megoldására vezethetjük vissza a (3.6) egyenlet megoldását. A
szorzást elvégezve és a megfelelő tagok együtthatóit a (3.6)-ban szereplő együtthatókkal összehasonlítva egy olyan
harmadfokú négyismeretlenes egyenletrendszerre jutunk, mely visszavezethető egy egyismeretlenes harmadfokú egyenlet
megoldására. Ezt megoldva megkapjuk az A, B, C és D ismeretleneket p, q, r függvényében, ami azt jelenti, hogy a
negyedfokú egyenletet visszavezethetjük egy harmadfokú és két másodfokú egyenlet megoldására.

Megjegyzés. A negyedfokú egyenlet megoldásának módszerét először Lodovico Ferrari (1522–1565) olasz
matematikus, Cardano tanítványa dolgozta ki. Lényegében a fent ismertetett eljárással először megmutatta, hogy
bármely negyedfokú egyenlet visszavezethető olyan negyedfokú egyenletre, melyben eltűnik a harmadfokú tag,
majd egy paraméter bevezetésével, egy harmadfokú egyenlet megoldásával két másodfokú egyenletre vezette vissza
az eredeti negyedfokú egyenletet.

Az ötöd- vagy annál magasabb fokú egyismeretlenes egyenleteknek nem létezik általános megoldóképletük.
Ugyanakkor bizonyos speciális esetekben mégis meg tudjuk oldani az ilyen egyenleteket, s bizonyos esetekben a harmad- és
negyedfokú egyenletek is jóval egyszerűbbé válnak. Az ilyenekre mutatunk néhány példát.
Előfordulhat, hogy egy harmadfokú egyenletnek „ránézésre“ meg tudjuk mondani valamelyik gyökét. Legyen például

(3.7)

Mivel az egyenletben szereplő együtthatók összege 0, ezért a (3.7) egyenletnek az x = 1 biztosan megoldása. Ezek szerint
a (3.7) egyenlet bal oldalán szereplő harmadfokú kifejezés felbontható egy másodfokú és egy elsőfokú szorzatára, ahol az
elsőfokú tényező: x – 1. Legyen a másodfokú tényező: ax2 + bx+ c, így írhatjuk a következőt:

A megfelelő együtthatókat összehasonlítva a következőt kapjuk:

Innen x – 1 = 0 (amit persze eddig is tudtunk) vagy

Ez utóbbi másodfokú egyenlet gyökei: 3 és –7, tehát az eredeti (3.7) egyenlet megoldásai:

Könnyen megoldhatjuk a másodfokúra redukálható negyedfokú egyenleteket. Ezek olyan egyismeretlenes negyedfokú
egyenletek, melyekben nem szerepel sem harmad-, sem elsőfokú tag. Általános alakja:

(3.8)

ahol a, b és c adott valós számok és a ≠ 0. Ha a (3.8) egyenletben bevezetjük az y = x2 új ismeretlent, akkor y2 = x4, így (3.8)
egyenletből az

másodfokú egyenlethez jutunk. Ennek gyökeit y1-gyel és y2-vel jelölve az eredeti (3.8) egyenlet gyökei:
Ugyancsak egyszerűen megoldhatók a páros fokú ún. szimmetrikus egyenletek (vagy más néven reciprokegyenletek).
Azokat az algebrai egyenleteket hívjuk így, melyekben a tagokat csökkenő hatványok szerint sorba rendezve, az
együtthatók szimmetrikusan helyezkednek el. (A reciprok elnevezés onnan ered, hogy, amint látni fogjuk, ha valamely
valós szám gyöke egy ilyen egyenletnek, akkor annak reciproka is gyöke lesz.)
Nézzük példaként a negyedfokú reciprok egyenleteket! Ezek általános alakja:

(3.9)

Világos, hogy x = 0 nem megoldása az egyenletnek, így osszuk el mindkét oldalt x2-tel:

Most emeljük ki az azonos együtthatókat a megfelelő tagokból:

(3.10)

Ha most bevezetjük az új ismeretlent, akkor

Ezzel a (3.10) egyenlet így alakul:

E másodfokú egyenlet gyökei legyenek y1 és y2; ezek után az

másodfokú egyenleteket kell megoldanunk.


Tehát a negyedfokú szimmetrikus egyenlet megoldása visszavezethető három másodfokú egyenlet megoldására.
Könnyen megmutatható, hogy bármely 2n-ed, páros fokú szimmetrikus egyenlet megoldása visszavezethető egy n-edfokú
és n db másodfokú egyenlet megoldására.
Mindezek ismeretében a páratlan fokú szimmetrikus egyenleteket is könnyen tudjuk kezelni. Legyen például

(3.11)

Amint az könnyen ellenőrizhető, az ilyen típusú egyenletnek az x = –1 mindig megoldása. Így a (3.11) egyenletet elosztva
az (x + 1) tényezővel, már páros fokú egyenletet kapunk, s az is megmutatható, hogy az így nyert páros fokú egyenlet
ugyancsak szimmetrikus lesz, melyre így a páros fokúakra fent leírt eljárás már alkalmazható.

Példák
1. Oldjuk meg a valós számok halmazán az alábbi egyenletet!

Azonnal látszik, hogy negyedfokú szimmetrikus egyenlettel van dolgunk. Osszuk el mindkét oldalt x2-tel:

Legyen , ekkor , így arra jutunk, hogy


Azt kaptuk tehát, hogy

Az első egyenlet gyökei: –2 és , a második egyenlet gyökei: 4 és . Tehát az eredeti egyenlet megoldásai:

2. Oldjuk meg az 2x5 – 7x4 + 5x3 + 5x2 + 7x + 2 = 0 egyenletet a valós számok halmazán! Most páratlan fokú
szimmetrikus egyenlettel van dolgunk. Ennek – mint láttuk, de egyszerű számolással ellenőrizhető – az x – 1
megoldása, így elosztva az egyenlet bal oldalát az (x + 1) gyöktényezővel az alábbi alakra jutunk:

ahonnan x + 1 = 0 vagy 2x4 – 9x3 + 14x2 – 9x + 2 = 0. Látjuk, hogy a második tényező egy negyedfokú, ugyancsak
szimmetrikus egyenlet. Osszuk el ennek mindkét oldalát x2 ≠ 0-val, azt kapjuk:

és most emeljük ki a megfelelő együtthatókat:

Legyen , ekkor , tehát azt kapjuk:

Arra jutottunk tehát, hogy

Első esetben x = 1, a második esetben x = 2 vagy .


Tehát a feladatban kitűzött eredeti egyenlet gyökei:
4. Polinomok és komplex számok algebrája
4.1. Műveletek polinomokkal, oszthatóság, legnagyobb közös osztó
4.2. Szorzatfelbontás, felbonthatatlan polinomok
4.3. Komplex számok
4.4. Polinomok zérushelyei
4.5. Többváltozós polinomok

4.1. Műveletek polinomokkal, oszthatóság, legnagyobb közös osztó


Az egyváltozós valós függvényeknek egy fontos és speciális osztályát alkotják a p(x) = anxn + an–1 xn–1 + … + a2x2 +a1x + a0
alakban felírható függvények, ahol x a változó (határozatlan) és an, an–1, …, a2, a1, a0 valamilyen valós számok. Az ilyen
függvényeket polinomfüggvényeknek nevezzük, a függvényt de niáló algebrai kifejezést pedig polinomnak. Egy polinom
(első megközelítésben) tehát olyan algebrai kifejezés, amit egy adott változóból és valós számokból készíthetünk el szorzás
és összeadás segítségével. Az an, an–1, …, a2, a1, a0 számok a p(x) polinom együtthatói, ezek közül az első nullától különböző
a főegyüttható, a0 pedig a konstans tag. Ha an ≠ 0, akkor az n nem negatív egész szám a p(x) polinom foka (fokszáma). Egy
p(x) polinom foka lehet nulla, ebben az esetben egy nem nulla konstans függvényről beszélünk; lehet egy, amikor p(x) = ax+
b valamilyen a és b számokkal, ahol a ≠ 0, és így tovább. Egyedül az azonosan nulla, p(x) ≡ 0 polinomnak nincs fokszáma.
Egy polinom normált, ha a főegyütthatója 1.
A 12. fejezetben majd általánosítani fogjuk a polinomok fogalmát, például az együtthatók tartományát illetően, ebben a
fejezetben azonban először csak valós együtthatós polinomokkal foglalkozunk, illetve miután bevezettük a komplex
számokat, említést teszünk majd a komplex együtthatós polinomokról is. További általánosítási lehetősége a
polinomoknak, ha több változót (határozatlant) is megengedünk, erről szintén lesz majd szó a fejezet végén.
A polinomok elméletében az egyik első fontos kérdés az, hogy miként lehet egy megadott valós együtthatós
polinomfüggvényt ábrázolni a koordinátasíkon. Ehhez szorosan kapcsolódik a zérushelyek (gyökök) megtalálásának a
problémája, ugyanis ezekben a pontokban metszi a függvénygörbe az x tengelyt. A függvénygörbe ábrázolásához
ugyancsak fontos annak a megállapítása, hogy az adott függvény hol növekszik és hol csökken, hol vannak a lokális
maximum- és minimumhelyei, illetve hogy a görbülete hol konkáv és hol konvex. Mindez a polinomok analitikus
vizsgálatához vezet, azonban algebrai megközelítéssel is vizsgálhatjuk a polinomokat, amennyiben nem egy darab
megadott polinomra koncentrálunk, hanem összességében a polinomok halmazára, amely halmazban bizonyos
műveleteket természetszerűen lehet értelmezni, mint például az összeadás és a szorzás. Ezen a ponton érdemes bevezetni
néhány jelölést arra vonatkozóan, hogy mit is értünk „polinomok halmazá“-n. Az összes valós együtthatós polinom
halmazát ℝ[x]-szel szokás jelölni, míg ℚ[x] és ℤ[x] jelölik a racionális, illetve egész együtthatós polinomok halmazát. Ebben
a fejezetben – amint azt a cím is jelzi – elsősorban a polinomok algebrai vizsgálatával foglalkozunk. Azt azonban fontos
megjegyeznünk, hogy a polinomok algebrai elmélete jóval tovább megy ennek a fejezetnek a keretein, és a későbbiekben (a
12. fejezetben) majd látni fogjuk, hogy szerves részét képezi az absztrakt algebra egyik meghatározó ágának, a
gyűrűelméletnek.

Műveletek polinomokkal, oszthatóság


Legnagyobb közös osztó, legkisebb közös többszörös

Műveletek polinomokkal, oszthatóság


Az összeadást, kivonást és szorzást a polinomokkal mint algebrai kifejezésekkel végezzük el, miközben csak a szokásos
egyszerűsítési szabályokat kell szem előtt tartanunk. Azaz két azonos fokú tagot össze tudunk vonni: axk +bxk = (a + b)xk és
ha az x változó két hatványát szorozzuk, abból ismét egy x hatványt kapunk: xk · xl = xk+l
Speciálisan, ha egy polinomot szorzunk egy valós számmal (mint konstans polinommal), az csak annyit tesz, hogy a
polinom összes együtthatóját megszorozzuk az adott számmal. Ugyanígy tudunk egy polinomot egy nullától különböző
számmal osztani is: az együtthatókat külön-külön leosztjuk az adott számmal.

Egy polinom normáltja az a polinom, amit a főegyütthatójával való osztás eredményeképp kapunk.
Egy f(x) = anxn + an–1 xn–1 + … +a1x + a0 polinom eltoltjai a g(x) = f(x – c) = an(x – c)n + + an–1 (x – c)n–1 + … +a1 (x – c) + a0
képlettel megadható polinomok. Továbbá ha an, a0 ≠ 0, akkor f(x) reciprok polinomja a0xn + a1xn–1 + … +an–1 x + an.

Két polinom hányadosa sajnos ritkán eredményez ismét egy polinomot, így az osztást mint műveletet nem
értelmezhetjük a polinomok halmazán, helyette csak az oszthatóság fogalmáról beszélhetünk, illetve a maradékos
osztásról.

Egy f(x) (nem azonosan nulla) polinom osztója a g(x) polinomnak, ha valamely alkalmas h(x) polinommal g(x) = f(x)
h(x). Ekkor a h(x) polinom a g(x) és az f(x) hányadosa.

Ez a de níció ugyan leírja az oszthatóság fogalmát, azonban sokszor kicsit árnyaltabban kell majd fogalmaznunk,
amikor oszthatóságról beszélünk. Pontosabban arról van szó, hogy az oszthatóság fogalmát külön is lehet de niálni a
valós, racionális, illetve az egész együtthatós polinomok körében. Előfordulhat például, hogy g(x) és f(x) egész együtthatós
polinomok, f(x) osztja g(x)-et, viszont a hányadosuk nem egy egész, hanem csak racionális együtthatós polinom. Ekkor azt
mondhatjuk, hogy f(x) csak a racionális együtthatós polinomok körében osztja g(x)-et, az egész együtthatós polinomok
körében már nem.
A maradékos osztás a következőt jelenti:

Legyen g(x) és f(x) két valós együtthatós polinom, f(x) nem azonosan nulla. Ekkor léteznek olyan h(x) és m(x) szintén
valós együtthatós, f(x) és g(x) által egyértelműen meghatározott polinomok, amikkel g(x) = f(x) · h(x) + m(x), továbbá
m(x) vagy azonosan nulla, vagy pedig a fokszáma kisebb f(x) fokszámánál.

A tételben szereplő h(x) polinom neve hányados, az m(x) polinom neve maradék. Amennyiben a maradékos osztást
racionális együtthatós polinomokkal végezzük el, úgy a hányados és a maradék szintén racionális együtthatósak lesznek.
Ugyanez az egész együtthatós polinomokra már nem mondható el: két egész együtthatós polinom hányadosáról és
maradékáról csak annyi garantálható, hogy racionális együtthatósak. Az m(x) maradék polinom pontosan akkor lesz az
azonosan nulla polinom, ha f(x) osztója g(x)-nek.
A gyakorlatban egy maradékos osztást többlépcsős algoritmusban végezhetünk el. Amennyiben g(x) foka kisebb f(x)
fokánál, akkor nincs mit számolni: a hányados nulla, a maradék pedig g(x). Ha pedig g(x) foka legalább annyi, mint f(x)
foka, akkor az első lépésben g(x) és f(x) legmagasabb fokú tagjait osztjuk, ezzel megkapjuk a hányados legmagasabb fokú
tagját, majd g(x)-ből levonjuk ennek a tényezőnek az f(x)-szel vett szorzatát. A következő lépésben a kapott eredmény
helyettesíti a g(x) polinomot (amennyiben a fokszáma még mindig legalább annyi, mint f(x) fokszáma), és ezt a műveletet
ismételjük mindaddig, amíg lehetséges. Az egyes lépésekben a legmagasabb fokú tagok osztásából kapott hányadosok adják
ki a hányados polinomot, és az utolsó lépés eredménye – ami már f(x)-nél alacsonyabb fokú – a maradék.

Példa. Végezzük el a maradékos osztást a g(x) = 2x4 – x3 – 6x2+ 5x+3 és az f(x) = x2 + x – 2 polinomokkal.
A legmagasabb fokú tagok hányadosa 2x4/x2 = 2x2, első lépésben ennek az f(x)-szeresét kell levonni a g(x) polinomból:

A második lépésben g(x)-et már ez az eredmény helyettesíti, ezúttal a legmagasabb fokú tagok hányadosa –3x3/x2 = –
3x és

Végül x2/x2 = 1 és (x2 – x + 3) – 1 (x2 + x – 2) = –2x + 5, ennek a fokszáma már kisebb f(x) fokszámánál, tehát ez a polinom
a maradék, a hányados pedig a legmagasabb fokú tagok osztásaiból kapott h(x) = 2x2 – 3x + 1. Összegezve:

Ezt a maradékos osztást úgy is felírhatjuk, hogy

A fenti számolásnak egy rendezettebb formában való összegzése:


A szintetikus osztást (a magyar nyelvű szakirodalomban többnyire Horner-elrendezésként szerepel) abban a speciális
esetben alkalmazhatjuk, amikor egy x – c alakú polinommal (tehát egy normált elsőfokú polinommal) osztunk
maradékosan. Ennek a lényege, hogy a számolást kevesebb helyigénnyel, mindössze három sorban végezzük el, és
végeredményül ugyanúgy megkapjuk a hányadost és a maradékot. (Mivel elsőfokú polinommal osztunk, a maradék egy
konstans polinom, azaz egy valós szám lesz.)
Ha az f(x) = anxn + an–1xn–1 + … + a1x + a0 polinomot osztjuk maradékosan x – c-vel, az alábbi táblázatot készítjük el:

Tehát a legfelső sorba az f(x) polinom együtthatóit írjuk a főegyütthatóval kezdve, ezt a főegyütthatót írjuk a harmadik
sor elejére is, ezek után balról jobbra haladva töltjük ki a második és harmadik sort, minden oszlop második eleme az előző
oszlop harmadik elemének a c-szerese, majd az alatta levő harmadik elem az oszlop első két elemének az összege. A
harmadik sorban megkapott számok a hányados polinom együtthatói, illetve a maradék:

A harmadik sor végén megjelenő b0 maradék ebben az esetben nem más, mint az f(x) polinom c helyen felvett
helyettesítési értéke: b0 = f(c). Amennyiben c az f(x)-nek egy zérushelye, azaz f(c) = 0, akkor azt kapjuk, hogy f(x) felírható
olyan szorzatként, aminek az egyik tényezője x – c.

Egy f(x) polinom akkor és csak akkor osztható az x – c polinommal, ha c egy zérushelye f(x)-nek.

Amennyiben f(x) az x – c polinomnak egy magasabb hatványával is osztható, akkor c egy többszörös zérushely:

Ha a c valós és m pozitív egész számmal (x – c)m osztója az f(x) polinomnak, viszont (x – c)m+1 már nem, akkor azt
mondjuk, hogy a c szám m-szeres multiplicitással gyöke f(x)-nek.

Úgy is fogalmazhatnánk, hogy c egy m-szeres gyöke az f(x) polinomnak, ha f(x) = (x – c)m h(x) egy olyan h(x)
polinommal, amire h(c) ≠ 0.
Ha egy polinomnak több gyökét is ismerjük (esetleg multiplicitásukkal együtt), akkor egy magasabb fokú osztót is
garantálhatunk:

Ha egy f(x) polinomnak c1, c2, …, ck különböző gyökei és ci multiplicitása legalább mi (i = 1, 2, …, k), akkor f(x) osztható
az
polinommal.

Példa. Osszuk el maradékosan az f(x) = 3x5 + 5x4 – 4x3 + 7x + 3 polinomot x + 2-vel.

A fenti jelölésekkel itt c = –2, a táblázat pedig . Ebből

Legnagyobb közös osztó, legkisebb közös többszörös

A d(x) normált polinom az f(x) és g(x) polinomok legnagyobb közös osztója, ha d(x) |f(x), d(x) |g(x) és az f(x) és g(x)
polinomok bármely közös osztója osztja d(x)-et is. A t(x) normált polinom az f(x) és g(x) polinomok legkisebb közös
többszöröse, ha f(x) | t(x), g(x) | t(x) és az f(x) és g(x) polinomok bármely közös többszöröse osztható t(x)-szel.
Ha az f(x) és g(x) polinomok közül legalább az egyik nem azonosan nulla, akkor a legnagyobb közös osztójuk létezik,
egyértelmű és egyenlő a legkisebb fokú olyan normált polinommal, ami felírható a(x)f(x) + b(x) g(x) alakban (ahol a(x) és
b(x) is polinomok). Jelölése: lnko(f(x), g(x)). (Az angol nyelvű irodalomban gcd(f(x), g(x)), ami a „greatest common divisor“
kifejezésre utal.) Ha az f(x) és g(x) polinomok egyike sem azonosan nulla, akkor a legkisebb közös többszörösük létezik,
egyértelmű, jelölése lkkt(f(x), g(x)) (az angol nyelvű irodalomban lcm(f(x), g(x)), ami a „least common multiple“ kifejezésre
utal). Továbbá lnko(f(x), g(x)) · lkkt(f(x), g(x)) megegyezik az f(x) · g(x) szorzat normáltjával, tehát az egyik ismeretében a
másikat már könnyen ki tudjuk számítani.
Két adott polinom, f(x) és g(x) legnagyobb közös osztóját az euklideszi algoritmus segítségével számíthatjuk ki. Ennek
az a lényege, hogy ha f(x) ≢ 0, akkor maradékos osztások sorozatát végezzük el a következőképpen: először g(x)-et osztjuk
maradékosan f(x)-szel, majd minden egyes következő lépésben az előző lépés osztója és maradéka között végezzük el ismét
a maradékos osztást. Ezt folytatjuk mindaddig, amíg egyszer nullát kapunk maradékul. Tehát

Mivel a maradékok fokszámai egy szigorúan csökkenő sorozatot alkotnak, előbb-utóbb mindenképp elérkezünk egy
olyan lépéshez, ahol a maradék nulla. Az utolsó nem nulla maradék normáltja az f(x) és g(x) polinomok legnagyobb közös
osztója. (Amennyiben már rögtön az első maradék nulla, úgy f(x) osztja g(x)-et, és akkor természetesen lnko (f(x), g(x)) nem
más, mint az f(x) polinom normáltja.)

Példa. Számítsuk ki az f(x) = x3 + x2 – 5x + 3 és g(x) = 2x3 + 7x2 – x – 12 polinomok legnagyobb közös osztóját és legkisebb
közös többszörösét!
Az euklideszi algoritmus a következőt adja:

Az utolsó nem nulla maradék , és ennek a polinomnak a normáltja x + 3. Tehát lnko(x3 + x2 – 5x + 3, 2x3 +
7x2 – x – 12) = x + 3, a legkisebb közös többszörös pedig

4.2. Szorzatfelbontás, felbonthatatlan polinomok


Egy polinom szorzatfelbontásán (vagy egyszerűen csak felbontásán) azt értjük, hogy más polinomok (általában
alacsonyabb fokú polinomok) szorzataként állítjuk elő. Ahhoz azonban, hogy egy polinom lehetséges szorzatfelbontásairól
beszéljünk, mindig tisztáznunk kell, hogy a szorzat tényezőiben milyen együtthatókat engedünk meg: csak egész számokat
vagy racionális számokat, esetleg tetszőleges valós számokat is. Más szóval: nem mindegy, hogy egy felbontást ℤ[x]-ben,
ℚ[x]-ben vagy ℝ[x]-ben szeretnénk elvégezni. Például az x2 – 3 polinomot egész együtthatókkal már nem tudjuk kisebb fokú
polinomok szorzatára bontani, még racionális együtthatókkal sem, viszont valós együtthatókkal már igen:
. Az x2 + 3 polinomot még valós együtthatókkal sem lehet kisebb fokú polinomok
szorzatára bontani, viszont miután bevezettük a komplex számokat, komplex együtthatókkal már ez a polinom is felírható,
mint két elsőfokú polinom szorzata. A következőkben külön-külön tárgyaljuk a polinomok felbontását (és
felbonthatóságát) az egész, racionális, illetve valós együtthatós polinomok körében, majd a komplex számok bevezetése
után a komplex együtthatós polinomok felbonthatóságáról is összefoglaljuk a lényegesebb tudnivalókat.

Egész együtthatós polinomok felbontása


Racionális együtthatós polinomok felbontása
Valós együtthatós polinomok felbontása

Egész együtthatós polinomok felbontása


Az egész együtthatós polinomok közt két olyan polinom van, ami az összes többi polinomnak osztója: a konstans 1 és a
konstans –1 polinom, ezek az egységpolinomok. Egy egész együtthatós polinomot ℤ[x]-ben felbonthatatlannak (az egész
számok felett felbonthatatlannak) nevezünk, ha egyrészt nem egységpolinom, másrészt pedig csak úgy lehet egész
együtthatós polinomok szorzatára bontani, ha az egyik tényező egység, azaz 1 vagy –1. (Tehát ℤ[x]-ben nem tekintjük
felbonthatatlannak az olyan polinomokat, amikből kiemelhető egy 1-nél nagyobb pozitív egész szám.)
A konstans polinomok körében így azok a ±p alakú polinomok a felbonthatatlanok, ahol p egy prímszám. Az elsőfokú,
ax + b alakú polinomok közül pedig azok felbonthatatlanok, ahol a és b legnagyobb közös osztója 1, ellenkező esetben
ugyanis a legnagyobb közös osztó kiemelhető a polinomból. Ehhez az észrevételhez kapcsolódik a következő de níció:

Egy egész együtthatós polinom primitív, ha az együtthatóinak a legnagyobb közös osztója 1.

Egy Gaussnak tulajdonított lemma szerint:

Két tetszőleges primitív polinom szorzata szintén egy primitív polinom.

Ebből már következik, hogy akárhány primitív polinom szorzata is primitív polinomot eredményez. Egy ℤ[x]-beli
felbonthatatlan polinom tehát szükségszerűen primitív (különben kiemelhető belőle az együtthatók legnagyobb közös
osztója), viszont nem minden primitív polinom felbonthatatlan, és erre az egyik legegyszerűbb példa x2 – 1 = (x + 1) (x – 1).
Egy legalább másodfokú felbonthatatlan polinomról az is elmondható, hogy nem rendelkezhet racionális zérushellyel,
ha ugyanis az f(x) egész együtthatós polinomnak az a/b racionális szám egy zérushelye, ahol a és b relatív prím egészek,
akkor f(x) felírható (bx – a)g(x) szorzat alakban valamilyen szintén egész együtthatós g(x) polinommal. Ennek az állításnak
a megfordítása is igaz: ha f(x) = (bx – a)g(x), akkor a/b természetesen egy zérushelye f(x)-nek.
Mivel egy másod- vagy harmadfokú polinom szorzatfelbontásában szükségszerűen szerepelnie kell egy legfeljebb
elsőfokú tényezőnek is, ezen polinomok közül viszonylag egyszerűen jellemezhetjük a felbonthatatlanokat:

Egy másodfokú, illetve egy harmadfokú egész együtthatós polinom pontosan akkor felbonthatatlan az egészek felett,
ha primitív és nincs racionális zérushelye.

Negyedfokú, illetve annál magasabb fokú polinomokra ez a jellemzés már nem áll, például x4 – 4 = (x2 + 2) (x2 – 2) egy
primitív polinom, nincs racionális gyöke, viszont felbontható. Ennek ellenére gyakran hasznos, ha egy adott egész
együtthatós polinom racionális zérushelyeit meg tudjuk találni, és ebben a következő tétel az irányadó:

Ha a c/d racionális szám – ahol c és d relatív prím egészek – gyöke az f(x) egész együtthatós polinomnak, akkor c osztja
f(x) konstans tagját, és d osztja f(x) főegyütthatóját.

Ez a tétel természetesen nem garantálja egyetlen racionális gyök létezését sem, mindössze leszűkíti azon racionális
számok körét, amiket érdemes megvizsgálni, mint lehetséges zérushelyeket. Tehát ha egy adott egész együtthatós polinom
első és utolsó együtthatóinak az osztóit ismerjük, akkor készíthetünk egy listát azon racionális számokról, amiknek a
számlálója osztja a konstans tagot, és a nevezője osztja a főegyütthatót, majd az így listázott racionális számokat az adott
polinomba helyettesítve kiderül, hogy van-e egyáltalán racionális zérushely, illetve ha van, akkor ezeknek a teljes listáját is
megkapjuk.

Példa. Keressük meg a p(x) = 5x4 + 2x3 – 5x2 – 32x – 12 polinom racionális gyökeit! A konstans tag osztói: ±1, ±2, +3, ±4,
±6 és ±12, ezek szerepelhetnek egy racionális zérushely számlálójában, a főegyüttható osztói pedig ±1 és ±5, ezek
szerepelhetnek egy racionális zérushely nevezőjében. Így a következő racionális számokat kell megvizsgálnunk:

. Ez ugyan egy hosszadalmas lista, de a már korábban


bemutatott szintetikus osztással viszonylag kényelmesen ellenőrizhetjük a felsorolt számokat. Az első zérushely a 2,
erre a szintetikus osztás a következőt adja:

A jobb alsó sarokba kapott 0 jelzi, hogy 2 valóban gyök, és a 3. sor alapján

Ezek után már elég a q(x) = 5x3 + 12x2 + 19x + 6 polinom racionális gyökeit keresni, tehát a fenti listából elhagyható a
±12 és a ±12/5. A megmaradtak közül egyedül a –2/5 bizonyul zérushelynek, a szintetikus osztással:
Ebből p(x) = (x – 2) (x + 2/5) (5x2 + 10x + 15) = (x – 2) (5x + 2) (x2 + 2x + 3). Az x2 + 2x + 3 polinomnak már nincs valós gyöke,
így a p(x) polinom racionális gyökei 2 és –2/5.

Ahogy azt az iménti példában is láttuk, ha egy polinom főegyütthatójának vagy konstans tagjának sok osztója van,
akkor igen hosszú lehet azon racionális számoknak a listája, amiket ellenőriznünk kellene, mint lehetséges zérushelyeket.
A következő tétellel azonban jelentősen szűkíthetjük ezt a listát.

Ha a c/d racionális szám – ahol c és d relatív prím egészek – gyöke az f(x) egész együtthatós polinomnak, akkor
tetszőleges m egész szám mellett c + md osztója f(–m)-nek.

Példa. Tekintsük újra a korábbi példát: p(x) = 5x4 + 2x3 – 5x2 – 32x – 12.
Mivel p(–1) = 18, a már listázott racionális számok közül, ahol c osztja 12-t, és d osztja 5-öt, elhagyhatjuk azokat,
ahol a számláló és a nevező összege, c + d nem osztja 18-at.

Így a következők maradnak meg: .


Ezek után, mivel p(1) = –42, a megmaradt listából elhagyhatjuk azokat a számokat is, ahol a számláló és a nevező

különbsége, c – d nem osztja 42-t. Ami marad: . Ennek a négy számnak az ellenőrzése a szintetikus
osztással már nem igényel sok időt, de akár tovább is szűkíthetjük a listát azzal, hogy p(–2) = 96 miatt töröljük azon

törteket, ahol c + 2d nem osztja 96-ot. Így már csak a 2 és maradnak, amik valóban gyökök.

Mint már említettük, a legalább negyedfokú (egész együtthatós) polinomoknál a lehetséges racionális zérushelyek
vizsgálata nem mindig dönti el a felbonthatóság kérdését. Ha találunk racionális gyököt, akkor a polinom garantáltan
felbontható, de ha nem találunk racionális gyököt, akkor az még csak annyit jelent, hogy elsőfokú tényezőt tartalmazó
felbontás nincs. Sokszor az a legegyszerűbb módja a felbonthatóság eldöntésének, hogy határozatlan együtthatókkal írjuk
fel a polinomot szorzatként, amiből a szorzás elvégzésével egy egyenletrendszert kapunk a felhasznált határozatlanokra.
Például ha az f(x) = a4x4 + a3x3 + a2x2 + a1x + a0 negyedfokú polinomról szeretnénk eldönteni, hogy felírható-e két
másodfokú polinom szorzataként, akkor az

feltételezett szorzatfelírásból egy egyenletrendszert kapunk az a, b, c, d, e, f ismeretlenekre. Ugyanis ha elvégezzük a


szorzást a jobb oldalon:

Ebből pedig az adódik, hogy

Mivel ezt az egyenletrendszert az egész számok körében szeretnénk megoldani, az a4 és a0 együtthatók lehetséges
szorzatfelbontásai véges sok lehetséges értéket adnak meg az a, d, c és f számokra. Ezekre a lehetséges értékekre pedig
külön-külön vizsgálhatjuk meg, hogy a fennmaradó három egyenletnek létezik-e b-re és e-re megoldása.

Példa. Igazoljuk, hogy p(x) = 2x5 + 3x2 – 7 felbonthatatlan az egészek felett!

Először is, azok a racionális számok, amiknek a számlálója osztja 7-et és a nevezője osztja .

Ebből elhagyjuk azokat a c/d alakú számokat, ahol c – d nem osztja p(1) = –2-t, marad a –1 és , majd szintetikus
osztással könnyen ellenőrizhetjük, hogy ezek egyike sem gyök. A p(x) polinomnak tehát nincs racionális gyöke, így
elsőfokú és negyedfokú tényezők szorzatára nem bontható fel.
Marad az a lehetőség, hogy p(x) = (ax3 + bx2 +cx + d) (ex2 +fx + g) valamilyen a, b, c, d, e, f, g egészekkel, és ekkor a
jobb oldal kiszorzásából, illetve a p(x) ismert együtthatóiból az adódik, hogy ae = 2, af + be = 0, ag + bf + ce = 0, bg + cf +
de = 3, cg + df = 0 és dg = –7. Feltehetjük, hogy a szorzatfelbontás mindkét tényezője pozitív főegyütthatós, így az ae =
2 egyenlet alapján az a két eset lehetséges, hogy a = 2 és e = 1, vagy a = 1 és e = 2. Az első esetben a második egyenletből
2f + b = 0, azaz b = –2f, majd a harmadik egyenletből 2g + (–2f)f + c = 0, azaz c = 2f2 – 2g. Ezután a negyedik egyenletből
(–2f)g + (2f2 – 2g)f + d = 3, d = 3 + 4f g – 2f3, és az ötödikből (2f2 – 2g)g + (3 + 4fg – 2f3)f = 0, azaz 6f2 g – 2g2 + 3f – 2f4 = 0.
Ebből látszik, hogy f csak páros szám lehet (mert itt a 3f kivételével minden tényező páros), viszont akkor d – 3 = 4f g –
2f3 már 8-nak is többszöröse, ami pedig ellentmondáshoz vezet, ugyanis dg = –7 miatt d értéke csak ±1 és ±7 lehet.
Hátravan még annak az esetnek a vizsgálata, amikor a = 1 és e = 2. Ekkor a második egyenletből f + 2b = 0, azaz f = –2b,
majd a harmadik egyenletből g + b (– 2b) + 2c = 0, azaz g = 2b2 – 2c. Ekkor viszont az utolsó egyenletből d(2b2 – 2c) = –7,
ami nem lehet, hiszen –7 nem osztható 2-vel. Ezzel beláttuk, hogy a megadott p(x) polinom nem bontható fel egy
másodfokú és egy harmadfokú tényező szorzatára az egész számok felett. Korábban azt is beláttuk, hogy elsőfokú és
negyedfokú tényezők szorzatára sem bontható, így p(x) = 2x5 + 3x2 – 7 felbonthatatlan ℤ[x]-ben.

Minél magasabb fokú egy polinom, annál fáradtságosabb az imént tárgyalt módszert alkalmazni a felbonthatóság
eldöntésére, ugyanis pl. egy hatodfokú polinomnál már külön meg kellene vizsgálnunk, hogy felbontható-e két
harmadfokú tényezőre, illetve egy másodfokú és egy negyedfokú tényező szorzatára, egy tizedfokú polinom esetében pedig
már négy különböző lehetőséget kellene vizsgálnunk a felbontási tényezők fokszámait illetően (miután már a lehetséges
racionális zérushelyeket előzőleg végignéztük).
A Schönemann–Eisenstein-kritérium ettől a fáradtságos munkától kímél meg minket bizonyos speciális esetekben:

Ha f(x) egy legalább elsőfokú, egész együtthatós primitív polinom, és van olyan p prímszám, ami nem osztja f(x)
főegyütthatóját, viszont osztja az összes többi együtthatót, továbbá p2 nem osztja a konstans tagot, akkor f(x)
felbonthatatlan az egészek felett.

Ez alapján például tetszőleges n nem negatív egész mellett xn + 2 egy ℤ[x]-ben felbonthatatlan polinom: p = 2-vel
alkalmazható rá a fenti Schönemann–Eisenstein-kritérium.
Ha egy f(x) egész együtthatós polinom felbonthatatlan az egészek felett, akkor ugyanez igaz tetszőleges f(x – c), (c ∈ ℤ)
alakú eltoltjára és a reciprok polinomjára is. Fordítva, ha egy egész együtthatós polinomnak valamelyik egész számmal
való eltoltja felbonthatatlan ℤ[x]-ben, vagy ha a konstans tagja nem nulla, és a reciprok polinomja felbonthatatlan ℤ[x]-
ben, akkor ugyanez igaz f(x)-re is.
Előfordulhat, hogy egy polinomra nem tudjuk közvetlenül alkalmazni a Schönemann–Eisenstein-kritériumot, viszont
a reciprok polinomjára vagy egy alkalmas eltoltjára már igen. Például ha f(x) = x4 + 4x3 + x – 2, akkor

és ez a polinom felbonthatatlan az egészek felett: a p = 3 választással alkalmazható rá a Schönemann–Eisenstein-kritérium.


Következésképp f(x) is felbonthatatlan ℤ[x]-ben.
Az egyértelmű felbontás tétele ℤ[x]-re:

Ha f(x) egy egész együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és ℤ[x]-ben felbonthatatlan,
pozitív főegyütthatós primitív polinomok szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.

Racionális együtthatós polinomok felbontása


A racionális együtthatós polinomok közt a nem nulla konstans polinomok azok, amik az összes többi polinomnak osztói,
így ℚ[x]-ben ezek az egységpolinomok.
Egy racionális együtthatós polinomot ℚ[x]-ben felbonthatatlannak (a racionális számok felett felbonthatatlannak)
nevezünk, ha egyrészt nem konstans polinom, másrészt pedig csak úgy lehet racionális együtthatós polinomok szorzatára
bontani, ha az egyik tényező konstans.
Előfordulhat, hogy egy egész együtthatós polinom a racionális számok felett felbonthatatlan, az egészek felett viszont
nem, amennyiben az együtthatóinak a legnagyobb közös osztója 1-nél nagyobb. Pl. p(x) = 2x + 6 egy ilyen polinom, ugyanis a
2(x + 3) szorzatra bontás ℤ[x]-ben tekintve nem tartalmaz egységet, viszont ℚ[x]-ben tekintve az egyik tényezője egység.
A racionális számok felett tehát nincs konstans felbonthatatlan polinom (mivel minden konstans vagy nulla, vagy
egység). Az elsőfokú polinomok viszont mind felbonthatatlanok, hiszen nem lehet őket két alacsonyabb fokú polinom
szorzataként felírni.
A racionális együtthatós polinomok (racionális számok feletti) felbonthatósága visszavezethető az egész együtthatós
polinomok egészek feletti felbonthatóságára:

Ha f(x) egy legalább elsőfokú racionális együtthatós polinom, akkor pontosan egy olyan r racionális szám van, amivel r
· f(x) egy primitív egész együtthatós polinom. Ez az r · f(x) polinom akkor és csak akkor felbonthatatlan az egészek
felett, ha f(x) felbonthatatlan a racionális számok felett.

A gyakorlatban úgy kapunk primitív egész együtthatós polinomot egy racionális polinomból, hogy azt először
megszorozzuk az együtthatók nevezőinek a legkisebb közös többszörösével, majd az így kapott (immár egész együtthatós)
polinomot az együtthatók legnagyobb közös osztójával leosztjuk. Az eredmény így egy primitív ℤ[x]-beli polinom, aminek
az egészek feletti felbonthatóságát a már korábban részletezett módokon vizsgálhatjuk. Amennyiben ez a polinom
felbomlik két alacsonyabb fokú egész együtthatós polinom szorzatára, úgy az eredeti polinom is felbomlik két alacsonyabb
fokú racionális együtthatós polinom szorzatára, ellenkező esetben az eredeti polinom ℚ[x]-ben felbonthatatlan.
Tehát nem fordulhat elő, hogy egy egész együtthatós polinom felbonthatatlan lenne az egész számok felett, de
felbomlana kisebb fokú polinomok szorzatára a racionális számok felett. Ez a tény szintén Gauss-lemma néven ismert, és
pontosan a következőt állíthatjuk:

Ha f(x) nullától különböző egész együtthatós polinom, és valamilyen racionális együtthatós g(x) és h(x) polinomokkal
f(x) = g(x) · h(x), akkor létezik olyan r racionális szám, amivel r · g(x) és (1/r) · h(x) mindketten egész együtthatósak, azaz
f(x) = (r · g(x)) · ((1/r) · h(x)) egy egészek feletti felbontása f(x)-nek.

Az egyértelmű felbontás tétele ℚ[x]-re:

Ha f(x) egy racionális együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és normált, ℚ[x]-ben
felbonthatatlan tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.

Valós együtthatós polinomok felbontása


A valós együtthatós polinomok közt szintén a nem nulla konstans polinomok azok, amik az összes többi polinomnak
osztói, így ℝ[x]-ben ezek az egységpolinomok.
Egy valós együtthatós polinomot ℝ[x]-ben felbonthatatlannak (a valós számok felett felbonthatatlannak) nevezünk,
ha egyrészt nem konstans polinom, másrészt pedig csak úgy lehet valós együtthatós polinomok szorzatára bontani, ha az
egyik tényező konstans.
A valós számok felett minden felbonthatatlan polinom első- vagy másodfokú. Az elsőfokú polinomok mind
felbonthatatlanok, egy ax2 + bx + c másodfokú polinom pedig akkor és csak akkor felbonthatatlan, ha a diszkriminánsa, b2
– 4ac negatív.
Az egyértelmű felbontás tétele ℝ[x]-re:

Ha f(x) egy valós együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans, normált elsőfokú és
normált felbonthatatlan másodfokú tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.

Egy ilyen felírás általános alakja tehát

ahol minden 1 ≤ i ≤ s egészre. Ebből a felírásból kiolvasható, hogy f(x) foka r + 2s, a főegyütthatója a, a
konstans tagja (–1)r ac1 … cre1 … es és a (valós) zérushelyei c1, c2, …, cr.

4.3. Komplex számok


Mielőtt precízen de niálnánk a komplex számokat, elöljáróban a legfontosabbak: a valós számoknak egy olyan
kibővítéséről van szó, ahol a gyökvonás mindig elvégezhető. Speciálisan minden negatív valós számnak is van a komplex
számok körében négyzetgyöke, és ennek köszönhetően itt minden valós együtthatós másodfokú egyenlet megoldható, még
akkor is, ha a diszkrimináns negatív. A komplex számokat általában a + bi alakban írjuk fel, ahol a, b valós számok és i egy
olyan komplex számot jelöl, aminek a négyzete –1. Az így felírt komplex számokkal értelemszerűen végezzük el az
összeadást és a szorzást, gyelembe véve azt, hogy i2 = –1:

Ahhoz, hogy ez az i szimbólum létjogosultságot nyerjen, a komplex számokat egy konstruktív módon de niáljuk:

A komplex számok a valós számokból alkotott (a, b) számpárok, amiknek a körében a következő összeadás és szorzás
műveleteket értelmezzük:

Ezekkel a műveletekkel teljesülnek a valós számok körében megszokott műveleti alaptulajdonságok (axiómák):
- Tetszőleges két komplex számra z1 + z2 = z2 + z1 és z1 · z2 = z2 · z1. (A két művelet kommutatív.)
- Tetszőleges három komplex számra (z1 + z2) + z3 = z1 + (z2 + z3), (z1 · z2) · z3 = = z1 · (z2 · z3), (z1 + z2) · z3 = z1 · z3 + z2 · z3 és z1 · (z2 +
z3) = z1 · z2 + z1 · z3. (A két művelet asszociatív és a szorzás az összeadásra nézve disztributív.)
Az így de niált számhalmazban az (a, 0) alakú számok részhalmaza azonosítható a valós számok ℝ halmazával, ugyanis a
fent bevezetett műveletek alapján

Ily módon a komplex számokat tekinthetjük a valós számok bővítésének, ahol a 0 és az 1 továbbra is neutrális elemek az
összeadásra, illetve a szorzásra nézve:

Az i = (0, 1) jelöléssel i2 = (0, 1) · (0, 1) = (–1, 0) és ez a pár a valós –1 számnak felel meg, továbbá bármely (a, b) számpár
felírható úgy, mint

A továbbiakban már eltekintünk a (kissé körülményes) számpáros jelöléstől, és az a + bi jelölést fogjuk használni, amit
a komplex számok algebrai alakjának (vagy kanonikus alakjának) nevezünk. A komplex számok halmazának a jelölése: ℂ.

Egy z = a + bi (a, b ∈ ℝ) komplex szám valós része: Re(z) = a, képzetes része: Im(z) = b, konjugáltja pedig z̄ = a – bi.

A konjugált első praktikus haszna a komplex számok osztásánál jelentkezik: ahhoz hogy egy
tört kanonikus alakját megkapjuk, általában a nevező konjugáltjával szorozzuk a számlálót és a nevezőt egyaránt:

A konjugáltakkal kapcsolatos alaptulajdonságok:


- Minden z ∈ ℂ számra z̿ = z, azaz konjugált konjugáltja az eredeti szám.
-
Bármely x, y ∈ ℂ számokra , és ha y ≠ 0, akkor .
- z̄ = z akkor és csak akkor, ha z valós; z̄ = –z akkor és csak akkor, ha z képzetes.
- z + z̄ mindig egy valós szám, z · z̄ mindig egy nem negatív valós szám.
Ahogy a valós számokat egy számegyenesen szokás ábrázolni, a komplex számokat a Descartes-féle kétdimenziós
koordináta-rendszerben ábrázolhatjuk: az a + bi (a, b ∈ ℝ) komplex számnak az (a, b) koordinátájú pontot feleltetjük meg
(illetve gyakran az ebbe a pontba mutató helyvektort), és ezzel egy kölcsönösen egyértelmű megfeleltetést hoztunk létre a
komplex számok és a sík pontjai között.

4.1. ábra A komplex számsík

Ebben a megfeleltetésben a valós számok a vízszintes tengely pontjainak felelnek meg, a képzetes számok pedig a
függőleges tengely pontjainak. Továbbá egy z = a + bi szám konjugáltja, z̄ = a – bi nem más, mint z-nek a vízszintes tengelyre
vonatkozó tükörképe.

Egy z = a + bi (a, b ∈ ℝ) komplex szám abszolút értéke a komplex számsíkon a 0-tól vett távolsága: , és
ha z ≠ 0, akkor az argumentuma (irányszöge), arg(z) a z-be mutató helyvektornak a valós tengely pozitív felével bezárt
szöge.

Ez a szög természetesen nem egyértelmű, hiszen 2π bármely egész számszorosának a hozzáadásával ugyanazt az irányt
kapjuk meg, azonban a szög szinusza és koszinusza már egyértelműen meghatározottak.
Egy nem nulla komplex szám valós része (a), képzetes része (b), abszolút értéke (r) és irányszöge (ø) közt a következő
összefüggések állnak fenn:
Így a z = a + bi algebrai alak mellett minden nullától különböző komplex szám trigonometrikus alakban is felírható:

4.2. ábra Komplex számok trigonometrikus jellemzése

Ha z = r (cos ø + i sin ø), és w = s (cos γ + i sin γ) trigonometrikus alakban megadott nem nulla komplex számok, akkor
- z · w = rs(cos (ø + γ) + i sin (ø + γ)),
-
,
- zn = rn (cos (nø) + i sin (nø)) tetszőleges egész n számmal.
Ez utóbbi Moivre képlete. Szavakban összefoglalva, két komplex szám szorzásánál az abszolút értékek szorzódnak, és a
szögek összeadódnak; osztásnál az abszolút értékek hányadosát kell venni és a szögek különbségét; egész kitevős
hatványozásnál pedig az abszolút értéket az adott kitevőre emeljük, a szöget pedig szorozzuk a kitevővel.
Minden nullától különböző komplex számnak pontosan n darab n-edik gyöke van (ha n tetszőleges pozitív egész), és
amennyiben z = r(cos ø + i sin ø), akkor ezek az n-edik gyökök az alábbi módon írhatók fel:

A komplex számsíkon ez az n szám egy origó középpontú és sugarú körön helyezkedik el úgy, hogy egy szabályos
n-szög csúcsait alkotják.

Komplex n-edik egységgyökön egy olyan ϵ komplex számot értünk, ami az 1-nek n-edik gyöke, azaz ϵn = 1. Ha ϵn = 1 és
bármilyen n-nél kisebb pozitív egész k-ra ϵk ≠ 1, akkor ϵ egy primitív komplex n-edik egységgyök.

A komplex n-edik egységgyökök trigonometrikus alakja:

A k = 0 esetben magát az 1 számot kapjuk vissza, a k = 1 esetben mindig egy primitív n-edik egységgyököt kapunk.

Polinomok komplex zérushelyei


Komplex együtthatós polinomok felbontása
A körosztási polinom

Polinomok komplex zérushelyei


Mint tudjuk, vannak olyan valós együtthatós (nem konstans) polinomok, amiknek nincs zérushelye a valós számok
körében. Például ha egy másodfokú ax2 + bx+ c polinom diszkriminánsa, b2 – 4ac negatív, akkor itt nincs valós zérushely. És
általánosabban, egy valós együtthatós polinomnak akkor nincs valós zérushelye, ha a polinom egy nullától különböző
konstans, vagy ha ℝ[x]-ben olyan másodfokú tényezők szorzatára bomlik fel, amik mind negatív diszkriminánssal
rendelkeznek.
A komplex számok azonban a valós számoknak egy olyan bővítését adják, ahol már kizárólag csak a nullától különböző
konstans polinomoknak nincs zérushelyük. Ez az algebra alaptétele:

Minden legalább elsőfokú, komplex együtthatós polinomnak van komplex zérushelye.

A másodfokú polinomok körében ez egyszerűen azért igaz, mert a megoldóképletben a gyökvonást mindig el lehet
végezni.
Példák
1. Adjuk meg a p(x) = x2 + 4x + 7 polinom komplex zérushelyeit!
A másodfokú egyenlet megoldóképlete alapján

2. Adjuk meg a g(x) = 2x2 + (1 – 2i)x – (3 – 2i) polinom komplex zérushelyeit! Szintén a megoldóképlettel kezdünk:

A 21 –20i komplex szám négyzetgyökeit egy kétismeretlenes egyenletrendszer megoldásával kaphatjuk meg: ha (a
+ bi)2 = 21 – 20i, és a, b ∈ ℝ, akkor a négyzet kibontásával (a2 – b2) + 2abi = 21 – 20i, és ebből a2 – b2 = 21, 2ab = –20.
Ennek az egyenletrendszernek két megoldása van: a = 5, b = –2, illetve a = –5, b = 2. Ezután visszatérhetünk a

megoldóképlethez: .
Az egyik megoldás tehát

a másik

Komplex együtthatós polinomok felbontása


A komplex együtthatós polinomok körében az alapműveleteket (összeadás, kivonás, szorzás), illetve a maradékos osztást
ugyanúgy el lehet végezni, mint a valós együtthatós polinomokkal. Az oszthatóság fogalma is értelmezhető: az f(x) (nem
azonosan nulla) polinom osztója a g(x) polinomnak, ha valamely alkalmas komplex együtthatós h(x) polinommal g(x) = f(x)
· h(x). Továbbá a megszokott módon de niálhatjuk két komplex együtthatós polinom legnagyobb közös osztóját és
legkisebb közös többszörösét is.
A komplex együtthatós polinomok ℂ[x] halmazában (hasonlóan a valós, illetve a racionális együtthatós polinomokhoz)
a nem nulla konstans polinomok az egységek: ezekről mondható el, hogy az összes polinomnak osztói. Egy komplex
együtthatós polinomot ℂ[x]-ben felbonthatatlannak (a komplex számok felett felbonthatatlannak) nevezünk, ha egyrészt
nem konstans polinom, másrészt pedig csak úgy lehet komplex együtthatós polinomok szorzatára bontani, ha az egyik
tényező konstans.
Az algebra alaptételének köszönhetően:

Egy komplex együtthatós polinom akkor és csak akkor felbonthatatlan a komplex számok felett, ha elsőfokú.

Ha ugyanis f(x) egy tetszőleges, nem konstans komplex együtthatós polinom, akkor a komplex számok körében van
egy α zérushelye, és így (x – α) kiemelhető f(x)-ből. És ha f(x) legalább másodfokú, akkor ez a kiemelés már egy felbontása
f(x)-nek, alacsonyabb fokú polinomok szorzatára.
Az egyértelmű felbontás tétele ℂ[x]-re:

Ha f(x) egy komplex együtthatós, nem azonosan nulla polinom, akkor felírható egy konstans és normált elsőfokú
tényezők szorzataként. Ez a felírás a tényezők sorrendjétől eltekintve egyértelmű.

Egy ilyen felírás általános alakja tehát

Ez az f(x) polinom gyöktényezős alakja, és ebből a felírásból kiolvasható, hogy f(x) foka r, a főegyütthatója a, a
konstans tagja (–1)r ac1 … cr és a (komplex) zérushelyei pedig c1, c2, …, cr. Ez a lista a zérushelyekről természetesen
tartalmazhat ismétlődést, amennyiben egy (x – ci) tényezőnek magasabb hatványa is osztja f(x)-et, azaz ha ci többszörös
gyöke az f(x) polinomnak. A komplex zérushelyek száma és a fokszám közötti összefüggés a következő:

Egy komplex együtthatós, nem azonosan nulla polinom zérushelyeinek a száma (multiplicitással számolva)
megegyezik a polinom fokával.
Az egyértelmű felbontás tételét – amint az eddigiekben láttuk – valamilyen formában mind az egész, mind a racionális,
valós, illetve komplex együtthatós polinomokra ki lehet mondani. Egy egész együtthatós polinomnak így akár négy
különböző felbontása is lehet attól függően, hogy ℤ[x]-ben, ℚ[x]-ben, ℝ[x]-ben vagy ℂ[x]-ben kívánjuk a felbontást
elvégezni. Ebből az első két felbontás csak konstans szorzókkal térhet el egymástól, hiszen egy egészek felett
felbonthatatlan polinom a racionális számok felett is felbonthatatlan, amennyiben legalább elsőfokú. Ha egy racionális
együtthatós polinom ℚ[x]-beli felbontása ismert, akkor az egy használható kiindulópont az ℝ[x]-beli felbontáshoz: a
racionális számok felett felbonthatatlan tényezőket kell lehetőség szerint tovább bontani a valós számok felett. Ez a tovább
bontás akkor lehetséges, ha egy tényező foka legalább három, illetve ha a tényező másodfokú, és a diszkriminánsa pozitív.
(Egy ℚ[x]-ben felbonthatatlan másodfokú polinom diszkriminánsa sosem lehet nulla, ha pedig negatív, akkor a polinom
ℝ[x]-ben is felbonthatatlan.) Végül, ha egy valós együtthatós polinom ℝ[x]-beli felbontása ismert, akkor itt már csak
elsőfokú és (negatív diszkriminánsú) másodfokú tényezők szerepelhetnek, az előbbiek természetesen ℂ[x]-ben is
felbonthatatlanok, míg az utóbbiak a komplex számok felett felbomlanak két elsőfokú tényező szorzatára.

Példák
1. A 6x – 10 polinom felbontása az egész számok felett 2(3x – 5), ebből 2 egy felbonthatatlan konstans polinom, és 3x –
5 egy primitív elsőfokú (és így szintén felbonthatatlan) polinom ℤ[x]-ben. A 6x – 10 polinom felbontása a
racionális számok felett 6(x – 5/3), ebből 6 a kiemelhető konstans (egység), és x – 5/3 egy normált felbonthatatlan
polinom.
2. A p(x) = x4 – 4x3 + 4x2 – 16 polinom felbontása az egészek, illetve a racionális számok felett egyaránt p(x) = (x2 – 2x +
4) (x2 – 2x – 4). Az első tényező diszkriminánsa negatív, a második tényezőé pozitív, így ez tovább bomlik ℝ[x]-ben:

Tehát p(x) felbontása a valós számok felett:

A komplex számok felett a maradék másodfokú tényező is elsőfokúak szorzatára bomlik:

A körosztási polinom
Már említettük korábban a komplex n-edik egységgyököket (n tetszőleges pozitív egész), mint az 1 szám n-edik gyökeit a
komplex számok körében. Mivel pontosan n darab van belőlük, és ezek éppen az xn – 1 polinom (komplex) zérushelyei, ezzel
meg is kaptuk xn – 1 gyöktényezős felbontását:

Az xn – 1 polinom valós, illetve egész számok feletti felbontása ettől általában lényegesen különbözik. Az ℝ[x]-beli
felbontás komponensei az x – 1; ha n páros, akkor az x + 1, illetve általában az 1 ≤ k < n/2 egészekre az

alakú másodfokú polinomok.


Az egész számok feletti felbontáshoz pedig a körosztási polinomok fogalmára van szükségünk.

Ha n egy tetszőleges pozitív egész, az n-edik körosztási polinom, Φn(x) azon x – ϵk komplex elsőfokú polinomok
szorzata, ahol ϵk egy primitív n-edik egységgyök.

A primitív n-edik egységgyökök száma megegyezik az n-nél nem nagyobb és n-hez relatív prím pozitív egészek
számával. Ez a szám φ(n), ahol φ az ismert Euler-féle függvény, erről bővebben a 13. fejezetben esik szó.
Amennyiben p egy prímszám, akkor az 1 kivételével mindegyik komplex p-edik egységgyök primitív, így xp – 1 = (x – 1) ·
Φp(x), és ebből pedig
Kissé meglepő módon a körosztási polinomok mind egész együtthatósak, továbbá mind felbonthatatlanok az egész
számok felett (és ennélfogva a racionális számok felett is). Az xn – 1 alakú polinomok ℤ[x]-beli felbontását is a körosztási
polinomok szolgáltatják.

Legyen n egy tetszőleges pozitív egész. Ekkor az xn – 1 polinom felbontása felbonthatatlan polinomok szorzatára az
egész számok felett:

A tételben szereplő szorzat tehát azon Φd(x) körosztási polinomokból áll, ahol d egy pozitív osztója az n számnak. A
gyakorlatban ebből a képletből tudjuk kiszámolni a körosztási polinomokat, például n = 6-ra:

4.4. Polinomok zérushelyei


A legfeljebb negyedfokú polinomok zérushelyeit mindig ki lehet számolni az együtthatók alapján a négy alapművelet
(összeadás, kivonás, szorzás, osztás) és gyökvonások segítségével. Egy elsőfokú, ax + b (a ≠ 0) alakú polinom soha nem
okozhat gondot, egy zérushelye van: x = – b/a. Egy másodfokú, ax2 + bx+ c (a ≠ 0) alakú polinom gyökeit az ismert
megoldóképlettel kapjuk meg:

A harmadfokú polinomok gyökeit a Cardano-képlet segítségével számíthatjuk ki. De mielőtt a Cardano-képletet


használni tudnánk, a polinomot redukált alakra kell hoznunk a következő módon: az adott ax3 + bx2 + cx + d (a ≠ 0)
harmadfokú polinomot az x = y – b/3a helyettesítéssel átírva

Ha még az a főegyütthatóval leosztunk, akkor az y3 +py + q polinomot kapjuk, ahol

Így először az y3 + py + q = 0 egyenletet oldjuk meg, majd az x = y – b/3a helyettesítés megadja az eredeti polinom
zérushelyeit. (Ezzel tulajdonképpen egy tetszőleges harmadfokú egyenlet megoldását visszavezettük egy négyzetes tag
nélküli harmadfokú egyenlet megoldására.) Az y3 + py + q = 0 egyenlet megoldásai pedig a Cardano-képlet alapján

Ez a képlet ebben a formában nem teljesen egyértelmű, hiszen a komplex számok körében a nulla kivételével minden
számnak két négyzetgyöke és három köbgyöke van. A két köbgyökös kifejezésen belüli + és – különbség arra utal, hogy a
q2/4 + p3/27 szám két négyzetgyöke közül – amik egymásnak ellentettjei – az egyik az első, a másik pedig a második
köbgyökös kifejezésben szerepeljen. Ezek után, ha a két harmadik gyököt úgy választjuk meg, hogy a szorzatuk –p/3, akkor
(és csak akkor) kapjuk meg az y3 + py + q = 0 egyenlet egy megoldását. Tehát az első köbgyöknek a komplex számok körében

három lehetséges értéke van, legyenek ezek α1, α2 és α3, és így a megoldások:
Ha az y3 + py + q = 0 egyenlet valós együtthatós, akkor a valós gyökök számát illetően két eset lehetséges: vagy egy gyök
valós, vagy mindhárom az. Ez utóbbi eset pontosan akkor áll fenn, ha a négyzetgyök alatt álló q2/4 + p3/27 szám negatív
vagy nulla. Három különböző valós gyök esetén q2/4 + p3/27 szigorúan negatív, és így ahhoz, hogy ezt a három valós gyököt
megkapjuk, komplex (és nem valós) számokból kell köbgyököt vonnunk.
A negyedfokú polinomok gyökeinek a keresését szintén egy helyettesítéssel érdemes kezdeni: egy adott ax4 + bx3 + ex2 +
dx + e = 0 egyenlet az x = y – b/4a helyettesítéssel, majd az a főegyütthatóval történő leosztással y4 + py2 + qy + r = 0 alakra
hozható. Ha találunk olyan u, v, w számokat, amikkel

akkor y = u + v + w egy megoldás, mégpedig a következő azonosság alapján:

Ahhoz, hogy a fenti egyenletrendszert u, v, w-re megoldjuk, egy harmadfokú egyenlet gyökeit kell megtalálnunk,
ugyanis ekkor a p(z) = (z – u2) (z – v2) (z – w2) polinom kiszorozva:

Tehát a 64z3 + 32pz2 + (4p2 – 16r)z – q2 = 0 egyenlet megoldásaiból megkapjuk az u2, v2, w2 értékeket, ez ugyan nyolc
lehetőséget szolgáltat az u, v, w számhármasra, de ebből csak négy teljesíti az előírt –8 u v w = q feltételt (a másik négyre 8 u
v w = q). Ennek megfelelően négy eredményt kapunk az y = u + v + w értékre, ezek az y4 + py2 + qy + r = 0 egyenlet
megoldásai. Végül az x = y – b/4a helyettesítéssel megkapjuk az eredeti negyedfokú polinom gyökeit.
Az ötödfokú, illetve az annál magasabb fokú polinomok zérushelyeire már nincs általános megoldóképlet, ami az
együtthatók, a négy alapművelet, illetve gyökvonások segítségével tenné kiszámíthatóvá egy adott polinom gyökeit. Ennek
ellenére számos olyan tétel van, amikkel egy adott polinom zérushelyeiről értékes információkat kaphatunk.
Fontos szerepet játszik a zérushelyek vizsgálatában a polinomok deriváltjának a fogalma, amit itt most algebrai
módon, formálisan de niálunk:

Ap(x) = anxn + an–1xn–1 + … + a2x2 + a1x + a0 polinom deriváltja

A magasabb rendű deriváltakat rekurzív módon de niáljuk:

Egy p(x) polinom nulladik deriváltja saját maga, és bármely pozitív egész k-ra a k-adik deriváltja a (k – 1)-edik derivált
deriváltja. A k-adik derivált jelölése: p(k) (x).

Ha f(x) és g(x) polinomok, valamint c egy tetszőleges konstans, akkor (cf) (x) = c · f(x), (f + g) (x) = f(x) + g (x), (f · g) (x) =
f(x) · g(x) és (f ○ g) (x) = f(g(x)) szintén polinomok, és a deriváltjaik az alábbi szabályokkal kaphatók meg f(x) és g(x)
deriváltjaiból:
- (cf)′(x) = c · f′(x),
- (f + g)′(x) = f′(x) + g′(x),
- (f · g)′ (x) = f′(x) · g(x) + f(x) · g′(x),
- (f ○ g)′(x) = f′(g(x))′g′(x).

Ha egy c szám k-szoros multiplicitással gyöke az f(x) polinomnak, akkor (k – 1)-szeres multiplicitással gyöke f′(x)-nek.

Tehát ha egy f(x) polinomnak van többszörös gyöke, akkor az szükségszerűen f′(x)-nek is gyöke, így f(x) és f′(x)
legnagyobb közös osztójának is.

Egy f(x) polinomnak pontosan akkor van többszörös gyöke, ha lnko(f (x), f′(x)) legalább elsőfokú. Minden többszörös
gyök szintén zérushelye az lnko(f (x), f′(x)) polinomnak is (eggyel kisebb multiplicitással, mint f(x)-ben), továbbá az f(x)
és f(x)/lnko(f (x), f′(x)) polinomok gyökei ugyanazok, ez utóbbiban viszont minden gyök egyszeres.

Az f(x) = anxn + an–1xn–1 + … + a1x + a0 és g(x) = bmxm + bm–1xm–1 + … + b1x + b0 (an ≠ 0, bm ≠ 0) polinomok rezultánsa az az
(n + m) × (n + m) méretű determináns, aminek 1 ≤ i ≤ m esetén az i-edik sorában i – 1 db 0-t az f(x) együtthatói követnek
sorban a főegyütthatóval kezdve, és a maradék m – i db elem ismét 0, valamint 1 ≤ j ≤ n esetén az m + j-edik sorában j – 1 db 0-
t a g(x) együtthatói követnek (szintén sorban, a főegyütthatóval kezdve), és a maradék n – j db elem ismét 0. Ezt a rezultánst
R(f(x), g(x)) jelöli (vagy röviden R(f, g)).
Amennyiben az f(x) polinom (komplex) gyökei α1, α2, …, αn és a g(x) polinom gyökei β1, β2, …, βm (a többszörös
gyököket multiplicitásuknak megfelelő számban szerepeltetve), tehát

és

akkor

Következésképp:

Az R (f(x), g(x)) rezultáns akkor és csak akkor nulla, ha a két polinomnak van közös zérushelye, azaz lnko(f(x), g(x))
legalább elsőfokú.

Abban a speciális esetben, amikor g(x) = f′(x), a következő tételt kapjuk:

Egy f(x) polinomnak akkor és csak akkor van többszörös zérushelye, ha R(f(x), f′(x)) = 0.

Az f(x) = anxn + an–1xn–1 + …+ a1x + a0 (an ≠ 0) polinom diszkriminánsa:

Amennyiben az f(x) polinom (komplex) gyökei α1 α2, …, αn (multiplicitásuknak megfelelő számban szerepeltetve),
tehát f(x) = an(x – α1) (x – α2) … (x – αn), akkor

Ha f(x) másodfokú polinom, tehát f(x) = ax2 + bx + c és a ≠ 0, akkor f′(x) = 2ax + b, és visszakapjuk az ismert
diszkriminánsfogalmat:

Egy f(x) = x3 + px + q alakú polinom diszkriminánsa pedig

Ez éppen a Cardano-képletben a négyzetgyök alatt szereplő q2/4 + p3/3 kifejezés –108-szorosa. Tehát az x3 + px + q
polinomnak akkor és csak akkor van többszörös zérushelye, ha a Cardano-képletben a négyzetgyök alatt nulla szerepel.

Valós együtthatós polinomok zérushelyei


Valós együtthatós polinomok zérushelyei
Megemlítünk néhány olyan tételt, ami valós együtthatós polinomok zérushelyeire vonatkozik. Az egyik legalapvetőbb
tény, hogy egy valós együtthatós polinomnak minden komplex zérushelyével együtt annak a konjugáltja szintén egy
zérushely.

Ha f(x) ∈ ([x], és valamilyen α komplex számmal f(α) = 0, akkor f(ᾱ) = 0.

Mivel így a nem valós zérushelyek párba állíthatók konjugáltság szerint, a valós gyökök számáról a következőt
állíthatjuk:

Egy páros fokú valós együtthatós polinomnak páros sok, egy páratlan fokú valós együtthatós polinomnak páratlan sok
valós gyöke van (multiplicitásokkal számolva). Így minden páratlan fokú valós együtthatós polinomnak van legalább
egy valós gyöke.

Descartes tétele arról szól, hogy külön a pozitív, illetve negatív gyökök számának a paritását is meg tudjuk állapítani
az együtthatókból:

Ha f(x) = anxn + an–1xn–1 + … + a2x2 + a1x + A0 egy valós együtthatós polinom és az an, an–1, …, a2, a1, a0 sorozat
előjelváltásainak a száma d, akkor f(x) pozitív zérushelyeinek a száma (multiplicitásokkal számolva) d-vel egyező
paritású, és legfeljebb d.

Ennek a tételnek a párja:

Ha f(x) = anxn + an–1xn–1 + … + a1x + a0 egy valós együtthatós polinom és a (–1)nan, (–1)n–1an–1, …, a2, –a1, a0 sorozat
előjelváltásainak a száma d, akkor f(x) negatív zérushelyeinek a száma (multiplicitásokkal számolva) d-vel egyező
paritású, és legfeljebb d.

Előjelváltásnak kell számolni azt, amikor a sorozatban pozitív tagot negatív vagy negatív tagot pozitív követ, illetve
amikor egy 0 tag (vagy több 0-ból álló részsorozat) előtt és után különböző előjelű tagok állnak.
A Boudan–Fourier-tétel egy tetszőleges intervallumon belüli zérushelyek számára vonatkozik. Ha f(x) egy adott n-
edfokú polinom, jelölje df(γ) tetszőleges γ valós szám esetén az f(γ), f′(γ), f(2) (γ), …, f(n) (γ) sorozat előjelváltásainak a számát.
Amennyiben az α < β valós számok egyike sem gyöke f(x)-nek, akkor az (α, β) intervallumba eső zérushelyek száma
legfeljebb df(α) – df(β), és ezzel a számmal egyező paritású.
A Sturm-módszer ennél kicsit körülményesebb, viszont pontosan kiadja egy intervallumon belüli zérushelyek számát.
Egy adott f(x) polinomhoz konstruálunk egy g0(x), g1(x), g2(x), …, gr(x) polinomsorozatot a következőképp:
Legyen g0(x) = f(x)/lnko(f(x), f′(x)), g1(x) = g′0(x), és i ≥ 2 esetén gi(x) legyen a gi–2(x) polinom gi–1(x)-szel vett maradékos
osztásából kapott maradékának a negatívja. A sorozat tagjai tehát szigorúan csökkenő fokszámú polinomok, és mivel g0 (x)-
nek nincs többszörös gyöke, így Inko(g0(x), g1(x)) = 1, ezért pedig az utolsó nem nulla tag, gr(x) egy konstans polinom lesz.
Ezek után jelölje df(γ) tetszőleges γ valós szám esetén a g0(γ), g1(γ), g2(γ), …, gr(γ) sorozat előjelváltásainak a számát. Ha
most az α < β valós számok egyike sem gyöke f(x)-nek, akkor az (α, β) intervallumba eső zérushelyek száma pontosan df(α) –
df(β).
Ez az eredmény a multiplicitásokat gyelmen kívül hagyja, viszont utólag, külön munkával megkaphatjuk a kétszeres
gyökök számát, ha lnko(f(x), f′(x)) gyökeit számoljuk meg ugyanabban az intervallumban, illetve a háromszoros gyökök
számát, ha az lnko(f(x), f′(x)) polinomnak vesszük a deriváltjával a legnagyobb közös osztóját stb.

4.5. Többváltozós polinomok


Többváltozós polinomnak nevezünk minden olyan algebrai kifejezést, amit konstansokból és két vagy több változóból
(határozatlanból) készíthetünk el az összeadás és szorzás műveleteket használva. Két változó (x és y) esetén a polinom aijxiyj
alakú tagok összegéből áll, ahol i, j nem negatív egészek, és az aij együtthatók lehetnek egész, racionális, valós vagy akár
komplex számok. Három változó (x, y és z) esetén a polinom aijlxiyjzl alakú tényezők összege, illetve általánosan, n változó
(x1, x2, …, xn) esetén a polinom általános alakja

Az tag foka (amennyiben az együttható nullától különböző) d1 + d2+ … +dn, a


polinom foka pedig a benne szereplő tagok fokának a maximuma. A konstans nulla polinomnak tehát ezúttal sem
de niáljuk a fokát. Egy többváltozós polinom homogén, ha minden tagjának a foka ugyanaz. Minden polinom az ún.
homogén komponenseinek az összege, ahol bármely k pozitív egészhez a polinom fc-adfokú homogén komponense a
benne szereplő k-adfokú tagok összege.

Példa. Az f(x, y, z) = 2x2yz + y2z2 – xy2 + 3z3 + x – 5 háromváltozós polinom foka 4, a negyedfokú homogén komponense
2x2yz + y2z2, a harmadfokú, másodfokú, elsőfokú és konstans homogén komponensek pedig rendre –xy2 + 3z3, 0, x és
–5.

Az x1, x2, …, xn változók (határozatlanok) egész együtthatós polinomjainak a halmazát ℤ[x1, x2, …, xn] jelöli, és
hasonlóan ℚ[x1, x2, …, xn], ℝ[x1, x2, …, xn], illetve ℂ[x1, x2, …, xn] jelölik a racionális, valós és komplex együtthatós
polinomok halmazát.

Egy többváltozós polinom szimmetrikus, ha bármely két változójának a felcserélése a polinomot magát változatlanul
hagyja.

Az x1, x2, …, xn változók elemi szimmetrikus polinomjai:

Általában, a k-adik elemi szimmetrikus polinom – amit σk jelöl – a különböző változókból készült összes lehetséges k-
tényezős szorzat összege.
A szimmetrikus polinomok alaptétele:

Minden szimmetrikus polinom egyértelműen írható fel az elemi szimmetrikus polinomok polinomjaként. Ha f(x1, x2,
…, xn) szimmetrikus, akkor létezik pontosan egy olyan g(x1, x2, …, xn) polinom, amivel f(x1, x2, …, xn) = = g(σ1, σ2, …,
σn).

A tételben szereplő g(x1 x2, …, xn) polinom együtthatói az adott f(x1, x2, …, xn) szimmetrikus polinom együtthatóiból
összeadás és kivonás útján kaphatók meg, így ha f(x1, x2, …, xn) egész együtthatós, akkor ugyanez igaz g(x1, x2, …, xn)-re is,
illetve ha f(x1, x2, …, xn) racionális, valós vagy komplex együtthatós, akkor ugyanaz mondható el a g(x1, x2, …, xn)
polinomról is.

Példa. Az f(x, y, z) = x3y2z + x3z2y + y3z2x + y3x2z + z3x2y + z3y2x szimmetrikus polinom előállítása elemi szimmetrikus
polinomokkal:

Így a g(x, y, z) = xyz – 3z2 polinommal f(x, y, z) = g(σ1, σ2, σ3).

Speciális szimmetrikus polinomok a k-adik hatványösszegek (ahol k tetszőleges pozitív egész szám):

A szimmetrikus polinomok alaptétele szerint ezek is kifejezhetők az elemi szimmetrikus polinomokból. Erre
vonatkoznak a Newton–Girard-formulák, amik segítségével rekurzív módon tudjuk sorra kiszámítani az Sk = Sk(x1, x2, …,
xn) hatványösszegek előállítását az elemi szimmetrikus polinomokkal:

Példa. Az x, y, z, w változók első négy hatványösszege:


Végül érdemes megemlítenünk azt a tényt, hogy egy polinom (komplex) gyökeinek az elemi szimmetrikus polinomjai
szoros összefüggésben állnak az együtthatókkal.

Ha f(x) = anxn + an–1xn–1 + … + a1x + a0 (an ≠ 0) polinom gyöktényezős alakja f(x) = an(x – α1) (x – α2) … (x – αn), akkor
tetszőleges 1 ≤ i ≤ n egészre σi(α1, α2, …, αn) = (–1)i · an–i/an.

Speciálisan egy normált polinom együtthatói éppen a gyökök elemi szimmetrikus polinomjai váltakozó előjelekkel.
5. A sík elemi geometriája
5.1. A geometria rövid története
5.2. Geometriai alapfogalmak
5.3. Geometriai transzformációk
5.4. Háromszögek, nevezetes vonalak, pontok, körök, egyéb nevezetes objektumok
5.5. Négyszögek
5.6. Sokszögek, szabályos sokszögek, aranymetszés
5.7. A kör és részei, kerületi és középponti szögek, húr- és érintőnégyszögek
5.8. Geometriai szerkesztések, speciális szerkesztések

5.1. A geometria rövid története


A geometria a matematika egyik legkorábban kialakult ága. Eredeti jelentése: földmérés, ami arra utal, hogy a geometriai
ismeretek legelőször a különböző alakú földterületek mértékét, annak nagyságát, kerületét vizsgálta. A Mezopotámiából,
illetve Egyiptomból származó legősibb írásos emlékek tanúsága szerint ezekben a kultúrákban már ismerték bizonyos
derékszöggel rendelkező síkidomok területének és kerületének kiszámítási módját, néhány konkrét számra ismerték a
pitagoraszi összefüggést. Tisztában voltak néhány egyszerűbb test térfogatának kiszámításával, és bizonyos konkrét
feladatok kapcsán használták a hasonlóság fogalmát is. Egyiptomban Kr. e. 2000-ben már jó közelítéssel használták a π
értékét (π ≈ 3,16), és aránylag pontosan tudták számítani gúlák, csonka gúlák térfogatát is. A mezőgazdasági munkálatok
szükségessé tették a csillagászat fejlődését, aminek fontos feltétele volt a szög fogalmának, a szögek mérésének ismerete.
Természetesen ebben a korban még nem lépett fel a geometriai ismeretek, tételek általános megfogalmazása és
bizonyítása, de a konkrét esetekben használt eljárások, módszerek meglehetősen magas szintű geometriai ismeretekről
tanúskodnak.
Igazi tudománnyá az ókori görög matematikában nőtt a geometria. A görögöknél merült fel először a különböző
geometriai tételek általános megfogalmazása, a bizonyítás igénye. Hippokratész (Kr. e. V. század) már egyenes
szakaszokkal és körívekkel határolt síkidomok területét vizsgálta, s igazolta, hogy hasonló körcikkek, körszeletek
területének aránya az általuk meghatározott húrok négyzetének arányával egyenlő. Ebben a korban születtek a híres
déloszi problémák: a kör négyszögesítése, a szögharmadolás, valamint a kocka kettőzésének kérdése. Ezek a problémák
sok-sok ezer éven át lázban tartották a matematika művelőit, s bár csak a XIX. században jutott el a tudomány e kérdések
megoldhatatlanságának tényéig, az addig eltelt 2-3000 évben e területek kutatása rendkívül sok egyéb felfedezéshez, új
kutatási területek felismeréséhez vezetett el. Kr. e. a II. században Eukleidész megalkotta Sztoikheia (Elemek) című
munkáját, mely a legelső igazi tudományos mű, amely szigorúan deduktív módon tárgyalja, építi fel a geometria akkor
ismert tudományát. Ezt követően sorra jelentek meg az új geometriai vizsgálatok, tételek, bizonyítások. Appolóniusz (Kr. e.
III. század) körökkel, kúpszeletekkel foglalkozik, míg Héron a szabályos testek tulajdonságait fedezi fel. Kr. u. az I.
században Claudiosz Ptolemaiosz a húrnégyszögek vizsgálata során jutott fontos eredményekhez; sokat tett a geometria
tudományának fejlődéséért a Kr. u. III. században Alexandriában élt Hüpatia is, a matematika tudományának első
nőalakja.
Ezt követően kb. egy évezreden át nem sok minden történt a geometria tudományában. Valamikor az újkor kezdete
tájékán, a zika és általában a természettudományok gyors fejlődése következtében új lendületet kapott a geometria
tudománya is. Descartes munkássága alapján megszületett az analitikus geometria, de sorra születtek az elemi geometria
területén is újabb és újabb eredmények. Ismertté váltak a háromszögek nevezetes objektumai (pontok, vonalak, körök) és
ezek tulajdonságai. A XVIII. században megszületett az ábrázoló geometria elsősorban Monge (1746–1818) munkássága
alapján, és nem sokkal később Poncelet (1788–1867) felfedezi a projektív geometriát, s kb. ugyanebben az időben születik
meg a topológia és a di erenciálgeometria tudománya is. A XIX. században Bolyai János és Lobacsevszkij felfedezik az
abszolút geometriát, mellyel több évezredes kérdést sikerült tisztázniuk.

5.2. Geometriai alapfogalmak

Pontok, egyenesek, szakaszok


Szögek, szögpárok

Pontok, egyenesek, szakaszok


A geometria a tér pontjaiból álló alakzatokkal (ponthalmazokkal), azok tulajdonságaival (hosszúság, terület, térfogat,
felület stb.) foglalkozik. A legalapvetőbb térelemek: a pont, az egyenes, a sík; ezeket nem de niáljuk, általában a
szemléletünkből fakadóan ismert alapfogalomként kezeljük őket. A pontokat dőlt nagy betűkkel, az egyeneseket dőlt kis
betűkkel jelöljük. Fontos alapfogalom még az illeszkedés fogalma; ha két térelem közül az egyik tartalmazza a másikat,
akkor azt mondjuk, hogy e két térelem illeszkedik egymáshoz.

5.1. ábra

Az egyenest egy pontja két félegyenesre bontja. E pont a két félegyenes kezdőpontja. Ha kijelölünk egy egyenesen két
pontot: A-t és B-t, akkor ezek az egyenest két félegyenesre és egy szakaszra bontják (5.1. ábra).
Egy egyenes a síkot két félsíkra bontja. Ez az egyenes a két félsík határoló egyenese. Ha egy szakaszt egységnyi
hosszúságúnak választunk, akkor egy tetszőleges szakasz hosszát azzal a számmal jelöljük, ahányszor rámérhető az
egységnyi hoszszúságú szakasz.
A későbbiekben fontos lesz számunkra a távolság fogalma.

Két ponthalmaz távolsága, a pontjaikat összekötő szakaszok közül a legrövidebb.

Megjegyzés. Tisztáznunk kell a „legrövidebb“ kifejezés jelentését. Ez úgy értendő, hogy a két ponthalmaz pontjait
összekötő szakaszok között a távolságnál nincs rövidebb szakasz. Ha pl. egy egyenesen kijelölünk két pontot: A-t és B-
t, és kivesszük az egyenesből e két pont közötti pontokat (vagyis az AB szakaszt az A és B pontok nélkül), akkor a
kapott két félegyenes távolsága az AB távolság. Ha azonban az A és B pontokat is tartalmazó szakaszt vesszük el,
akkor a megmaradó két „félegyenes“ pontjai között nincs „legkisebb“ távolság, így e két ponthalmaznak ilyen
módon nem értelmezzük a távolságát.

5.2. ábra

Két síkbeli egyenes metszi egymást, ha egy közös pontjuk van (5.2a ábra). Két síkbeli egyenes párhuzamos, ha nincs
közös pontjuk (5.2b ábra). A párhuzamosságjele: e║f.
Ha több szakaszt egymáshoz csatlakoztatunk, akkor töröttvonalat kapunk. Ha az egymáshoz csatlakoztatott szakaszok
közül az első kezdőpontja egybeesik az utolsó végpontjával, akkor zárt töröttvonalat (sokszöget, poligont), egyébként nyílt
töröttvonalat kapunk (5.3a–b ábra).

5.3. ábra

Szögek, szögpárok
A sík egy pontjából kiinduló két félegyenes a síkot két tartományra osztja; ezeket szögnek vagy szögtartománynak
nevezzük. Közülük az általunk vizsgálandó szöget körívvel jelöljük. A két félegyenest a szög szárainak, a közös
kezdőpontjukat a szög csúcsának mondjuk (5.4. ábra).
5.4. ábra

Szokás úgy is jelölni a szöget, hogy az egyik, illetve a másik szögszáron levő pontok közé írjuk a szög csúcsát jelölő
pontot. Így az 5.4. ábrán látható szöget jelölhetjük így is: AOB ∠ vagy BOA ∠.
Ha a két szögszár egybeesik és az általuk meghatározott nagyobbik síkrészt tekintjük, annak neve: teljesszög. Ha a két
szögszár egy egyenesbe esik, akkor a kapott szög neve: egyenesszög (5.5a–b ábra).

5.5. ábra

Ha az egyenesszöget két egybevágó szögtartományra bontjuk (azaz olyan szögtartományokra, melyek egymással
fedésbe hozhatók) derékszöget kapunk. A derékszögnél kisebb szöget hegyesszögnek, a derékszögnél nagyobb, de az
egyenesszögnél kisebb szöget tompaszögnek, a tompaszögnél nagyobb szöget homorúszögnek nevezzük (lásd 5.6a–d ábra).
A derékszöget megkülönböztetésül a szöget jelölő körívbe rajzolt ponttal jelöljük az ábrákon.
Gyakran előfordul, hogy egy szög egy félegyenesnek a végpontja körüli elforgatásával keletkezik; az ilyen szöget
irányított szögnek nevezzük. Amennyiben a forgatás iránya az óramutató járásával ellenkező, akkor pozitív irányítású, ha
a forgatás az óramutató járásával megegyező, akkor negatív irányítású szögről van szó.

5.6. ábra

A szögeket mérni tudjuk. A szögmérés egysége az 1 fok (1°). Ez a teljesszög 360-ad része. Ennek megfelelően az
egyenesszög mértéke 180°, a derékszög mértéke 90°. Az 1° 60-ad része a szögperc (′), a szögperc 60-ad része a szögmásodperc
(˝).
A szög mértékének másik jelölésére használjuk az ívmértek fogalmát. Ennek egysége az 1 radián. Vegyünk fel egy O
középpontú kört, majd annak valamely A pontjából kiindulva mérjük fel azt az AB ívet, melynek hossza egyenlő a kör
sugarával. Az így kapott AOB szög mértéke az 1 radián (5.7. ábra).

5.7. ábra

5.8. ábra

Mivel a kör kerületére a sugár 2π-szer fér rá, ezért a teljesszög mértéke 2π radián, az egyenesszög π radián, a derékszög

radián.
Ha két egyenes metszi egymást, akkor a metszéspontjuk 4 db szög csúcsa. Azokat a szögeket, melyeknek nincs közös
száruk, csúcsszögeknek nevezzük. Azokat a szögeket, melyeknek van egy-egy közös száruk mellékszögeknek nevezzük (5.8.
ábra).
A csúcsszögek mindig egyenlők. A mellékszögek összege mindig 180°.

Az olyan szögeket, melyeknek szárai párhuzamosak és azonos irányúak, egyállású szögeknek, amelyeknek szárai
párhuzamosak, de ellentétes irányúak, váltószögeknek nevezzük (5.9a–b ábra).

5.9. ábra

Az egyállású szögek egyenlők, a váltószögek egyenlők.

Ha két szög szárai merőlegesek egymásra, akkor lehet mindkét szög hegyesszög, mindkét szög tompaszög vagy az egyik
szög hegyes-, a másik pedig tompaszög (5.10a–c ábra).

5.10. ábra

A merőleges szárú hegyesszögek és a merőleges szárú tompaszögek mindig egyenlők. Ha a merőleges szárú szögek
egyike hegyesszög, a másik tompaszög, akkor a két szög összege 180°.

5.3. Geometriai transzformációk


Ha a sík pontjaihoz vagy a sík bizonyos pontjaihoz egyértelműen hozzárendeljük a sík bizonyos pontjait, akkor
transzformációról (leképezésről) beszélünk. Olyan pontot, melyhez hozzárendelünk, tárgypontnak, olyan pontot, melyet
hozzárendelünk valamely tárgyponthoz, képpontnak nevezünk. Azt is mondhatnánk, hogy a geometriai transzformáció
egy olyan függvény, melynek értelmezési tartománya a sík valamely ponthalmaza, értékkészlete pedig ugyancsak a sík
valamely ponthalmaza. Ha valamely transzformáció a P ponthoz a P′ pontot rendeli, akkor azt így jelöljük:

Ha egy transzformáció során bármely P pont P′ képével a transzformációt még egyszer végrehajtva az eredeti ponthoz
jutunk vissza, azaz P ˝ ≡ P, akkor a transzformációt szimmetrikus transzformációnak nevezzük. Ha egy transzformáció
során valamely P pont képe önmaga, azaz P ≡P′, akkor e P pontot xpontnak nevezzük. Ha egy transzformáció során
valamely alakzat képe önmaga, akkor az alakzatot invariáns alakzatnak nevezzük. (Természetesen, ha egy alakzat minden
pontja xpont, akkor invariáns alakzatról van szó.)
Nagyon fontos transzformációk a távolságtartó transzformációk. Ezek legfőbb jellemzője, hogy bármely két pont
képének a távolsága megegyezik az eredeti tárgypontok távolságával. Az ilyen transzformációkat egybevágósági
transzformációknak nevezzük. Ilyenek pl. a tengelyes tükrözés, a középpontos tükrözés, az eltolás és a pont körüli
elforgatás.
Az egyes transzformációk vizsgálata során az alábbi tulajdonságok lesznek számunkra a legfontosabbak.
Van-e a transzformáció végrehajtása során xpont, azaz olyan pont, melynek képe önmaga? (Találhatók-e invariáns
alakzatok, azaz olyan alakzatok, melyeknek képe maga az eredeti alakzat.)
Szimmetrikus-e a transzformáció, azaz bármely P pont képének a képe azonos-e az eredeti P ponttal?
Egyenes és szakasz képe hogyan alakul?
Szög képe hogyan alakul?
Változik-e a transzformáció során az alakzat körüljárásának iránya? (Ez azt jelenti, hogy ha pl. egy A1A2 … An sokszöget
valamely, pl. az A1 pontból kiindulva körbejárunk pl. az óramutató járásával ellentétes irányban, akkor a képalakzat A′1
pontjából kiindulva, az egyes csúcspontokat a megfelelő sorrendben körüljárva az alakzatot, az óramutató járásával
ellenkező irány marad-e, vagy ez megváltozik.)

Tengelyes tükrözés
Középpontos tükrözés
Pont körüli elforgatás
Eltolás
Középpontos hasonlóság
Merőleges a nitás
Inverzió

Tengelyes tükrözés

Legyen adott a síkon egy t egyenes (tengely). A sík tetszőleges P pontjához hozzárendeljük azt a P′ pontot, mely a P-ből
t-re állított merőleges egyenes t-n túli meghosszabbításán van t-től ugyanolyan távolságra, mint az eredeti P pont (5.11.
ábra). Ekkor tengelyes tükrözésről beszélünk.

5.11. ábra

A tengelyes tükrözés esetében xpont: a t tengely összes pontja, és csak ezek a pontok. Ugyanakkor vannak invariáns
alakzatok. Invariáns egyenes pl. maga a t tengely, hiszen minden pontja xpont. De invariáns egyenes minden olyan
egyenes, mely a t tengelyre merőleges. Invariáns szakasz minden olyan szakasz, melynek a t tengely felező merőlegese.
Invariáns kör pl. minden olyan kör, melynek középpontja illeszkedik a t tengelyre.
A tengelyes tükrözés szimmetrikus transzformáció, azaz bármely P pont P′ képének a P ˝ képe az eredeti P ponttal
azonos.
Egyenes képe egyenes. Ha az eredeti e egyenes párhuzamos a t tengellyel, akkor annak e′ képe is párhuzamos a t
tengellyel. Ha az eredeti e egyenes nem párhuzamos a t tengellyel, akkor e és e′ a t tengelyen metszik egymást (5.12a–b ábra).

5.12. ábra

A tengelyes tükrözés távolságtartó, szögtartó transzformáció, mely a körüljárás irányát megváltoztatja (5.13. ábra).

Megjegyzés. Ha valamely alakzathoz található olyan egyenes, melyre nézve az alakzat invariáns alakzat, azaz melyre
az alakzatot tengelyesen tükrözve a képe önmaga, akkor az alakzatot tengelyesen szimmetrikus alakzatnak, a
kérdéses egyenest pedig az alakzat szimmetriatengelyének nevezzük. Tengelyesen szimmetrikus alakzat pl. az
egyenlő szárú háromszög egy szimmetriatengellyel, a négyzet 4 db szimmetriatengellyel, a rombusz két
szimmetriatengellyel, a kör végtelen sok szimmetriatengellyel (5.14. ábra). Ha egy véges (korlátos) alakzatnak több
szimmetriatengelye van, akkor ezek mindig egy pontban metszik egymást.
5.13. ábra

5.14. ábra

Példák
1. Adott egy t egyenes és két partján egy-egy pont: A és B. Szerkesszünk olyan egyenlő szárú háromszöget, melynek t
a szimmetriatengelye, továbbá A az egyik csúcsa, és B pont a háromszög másik száregyenesére illeszkedik.
Az egyenlő szárú háromszög a t tengelyre tengelyesen szimmetrikus, így az egyik szárnak a t tengelyre vonatkozó
tükörképe a másik szár. Ebből következik, hogy az egyik pontnak (pl. B-nek) t-re vonatkozó tükörképe rajta van a
másik száron (5.15. ábra). A szerkesztés menete: B-t tükrözzük a t tengelyre, a tükörkép B′ pontot A-val összekötve
megkapjuk a háromszög C csúcsát. Eztán a C-t B-vel összekötő egyenes és A-ból a t-re állított egyenes
metszéspontja egyértelműen megadja a háromszög harmadik A′ csúcsát. Ha a B pont t-re vonatkozó tükörképe
azonos az A ponttal, akkor végtelen sok megoldást kapunk. Ha a B pont ugyanolyan távol van t-től, mint az A
pont, de egymásnak nem tükörképei, akkor az AB′ egyenes párhuzamos lesz t-vel, így ez esetben nincs megoldás.
2. A térképen egy t egyenes jelöl egy folyót, és a folyó ugyanazon partján két pont, A és B jelöl egy-egy falut. AB
faluban tűz ütött ki, az A faluban laknak a tűzoltók. Hogyan juthatnak

5.15. ábra

el a tűzoltók a leggyorsabban (azaz a legrövidebb úton) A-ból B-be, ha közben a folyóról vizet is kell venniük.
Tükrözzük a két pont egyikét (pl. A-t) t-re, majd az A′ pontot kössük össze B-vel. Ha az A′B egyenes t-t M-ben
metszi, akkor az AM–MB út a legrövidebb. Legyen ugyanis Q egy M-től különböző pont (5.16. ábra).
5.16. ábra

A tükrözés miatt AM = A′M és AQ = A′Q. Az A′QB háromszögben – a háromszögegyenlőtlenség miatt –A′B = A′M +
MB < A′Q + QB. Ezek szerint

Középpontos tükrözés

Adott egy O pont (a tükrözés centruma). A sík tetszőleges P pontjához hozzárendeljük azt a P′ pontot, mely a PO
félegyenes O-n túli meghosszabbításán van, és amelyre PO = P′O. Az így megadott transzformációt középpontos
(centrális) tükrözésnek nevezzük.

A középpontos tükrözésnél xpont az O pont és csak az O pont. Megemlítünk néhány invariáns alakzatot: invariáns
egyenes minden az O ponton áthaladó egyenes. Invariáns szakaszok azok a szakaszok, melyeknek felezőpontja az O pont.
Invariáns körök azok a körök, melyek középpontja az O pont.
A középpontos tükrözés szimmetrikus transzformáció, mert bármely P pont képének a P ˝ képe azonos az eredeti P
ponttal.
Egyenes képe vele párhuzamos egyenes.
A középpontos tükrözés távolságtartó, szögtartó transzformáció, mely a körüljárás irányát nem változtatja meg (5.17.
ábra).

Megjegyzés. Ha valamely alakzathoz található olyan O pont, melyre nézve az alakzat invariáns (azaz, amelyre
középpontosan tükrözve a képe önmaga), akkor az alakzatot középpontosan szimmetrikus alakzatnak nevezzük, a
kérdéses pontot szimmetria-középpontnak (szimmetriacentrumnak) nevezzük. Középpontosan szimmetrikus
alakzatok pl. a paralelogramma, a kör, a páros oldalszámú szabályos sokszög stb. Ha egy véges alakzatnak több
szimmetriatengelye van és középpontosan is szimmetrikus, akkor a szimmetriatengelyek metszéspontja a
szimmetriacentrumban van.

5.17. ábra

Példák
1. Adott két egymásra merőleges egyenes e és f, melyek az M pontban metszik egymást, továbbá adott egy P pont. A
P pontnak e-re vonatkozó tükörképe P′, P′-nek f-re vonatkozó tükörképe P ˝. Igazoljuk, hogy P ˝ az eredeti P
pontnak O-ra vonatkozó centrális tükörképe.
Tekintsük az 5.18. ábrát! A tükrözés miatt PM = P′M = P ˝M, továbbá a PMP′ szögnek e, a P′MP ˝ szögnek f
szögfelezője. Mivel α + β = 90°, vagyis 2α + 2β = 180°, ez pedig éppen azt jelenti, hogy a P pontnak az M pontra
vonatkozó tükörképe P ˝.
2. Adott egy hegyesszög és annak belsejében a P pont. Szerkesszünk olyan P ponton átmenő egyenest, melynek a
szögszárak közé eső darabját a P pont felezi!
Legyen O a szög csúcsa, e és f a két szögszár. Ha a P pont felezi a szerkesztendő egyenesnek a szögszárak közé eső
darabját, akkor ennek az egyenesnek az egyik szögszárral való metszéspontjának P-re vonatkozó tükörképe éppen
az egyenesnek a másik

5.18. ábra

5.19. ábra

szögszárral való metszéspontja lesz (5.19. ábra). Így ha az egyik szögszárat (pl. e-t) tükrözzük P-re, akkor az e''
tükörkép fogja kimetszeni a keresett egyenes és az f szögszár M metszéspontját.

Pont körüli elforgatás

Adott egy O pont és egy α irányított szög. A sík tetszőleges P pontjához hozzárendeljük az alábbi P'' pontot: O-ban
felmérjük az OP félegyenesre az irányított α szöget, majd az új szögszárra felmérjük az OP′ = OP szakaszt. Az így
megadott transzformációt pont körüli elforgatásnak nevezzük.

Ha az elforgatás szöge 360°, vagy annak egész számú többszöröse, akkor a sík minden pontja xpont. Egyébként a pont
körüli elforgatás esetében egyedül az O pont xpont. Ez a transzformáció általában nem szimmetrikus, vagyis valamely P
pont képének a képe általában nem azonos a P ponttal. Kivétel az az eset, amikor az elforgatás szöge 180° vagy annak egész
számú többszöröse.
Egyenes képe olyan egyenes, melynek az eredeti egyenessel bezárt szöge megegyezik az elforgatás szögével. A pont
körüli elforgatás távolság- és szögtartó transzformáció. A pont körüli elforgatás a körüljárás irányát megtartja (5.20. ábra).

Megjegyzés. Ha valamely alakzathoz található olyan O pont, mely körül α < 360° szöggel elforgatva az alakzat
önmagába megy át, forgásszimmetrikus alakzatnak nevezzük. Ha az alakzatot az O pont körül n-szer elforgatva úgy
megy át önmagába, hogy a megfelelő pontok a megfelelő pontokba mennek át, akkor az alakzat n-ed rendben
forgásszimmetrikus. Minden szabályos n oldalú sokszög n-ed rendben forgásszimmetrikus alakzat.
Példák
1. Adott két nem párhuzamos, egyenlő hosszúságú szakasz. Határozzuk meg a sík azon O pontját, mely körül
alkalmas forgatással az egyik szakasz a másikba vihető!
Ha valamely P′ pont egy adott P pont elforgatott képe, akkor a forgatás O középpontjának rajta kell lennie a PP′
szakasz felező merőlegesén. Ezek szerint az elforgatás O középpontja a két szakasz megfelelő végpontjai által
meghatározott szakaszok felező
5.20. ábra

merőlegeseinek a metszéspontja. Mivel a két szakasz nem párhuzamos, ezért ez a pont egyértelműen
meghatározható.
2. Adott három párhuzamos egyenes: e, f és g. Szerkesszünk olyan szabályos (egyenlő oldalú) háromszöget, melyek
csúcsai egy-egy egyenesre illeszkednek!
Vegyünk fel a középső f egyenesen egy tetszőleges P pontot, és forgassuk el P körül 60°-kal az e és g egyenesek
egyikét (pl. g-t)! (Az elforgatást úgy tudjuk a legegyszerűbben végrehajtani, hogy P-ből merőlegest állítunk g-re,
majd e merőleges T talppontját forgatjuk el 60°-kal, s a kapott T′ pontban merőlegest állítunk a PT′ szakaszra; az
így kapott egyenes lesz a g egyenes P körüli 60°-os elforgatottja.) Az 5.21. ábrán a g egyenesnek és g′
elforgatottjának metszéspontját E′-vel jelöltük.
Ha most az E′ pontot elforgatjuk P körül –60°-kal, akkor a kapott E pont a g egyenesen lesz. Mivel PE′ = PE és E′PE
∠ = 60°, ezért az E′PE háromszög egyenlő oldalú háromszög.

5.21. ábra

Eltolás
Az irányított szakaszt vektornak nevezzük. A vektor tehát olyan mennyiség, melynek nagysága, állása és iránya van. A
vektorokat (kezdő- és végpontjukat érzékeltetve) nyíllal szemléltetjük. Jelölésükre vastag betűt használunk, vagy pedig a
kezdő- és végpontját jelölő pontok fölé írt nyíllal szemléltetjük (5.22. ábra).
Két vektor akkor és csak akkor egyenlő, ha nagyságuk, állásuk és irányuk is megegyezik. Ha valamely vektor hossza 0,
akkor nullvektornak nevezzük, melynek iránya tetszőleges.

Megjegyzés. A vektorokkal, legfontosabb tulajdonságaikkal, a velük való műveletekkel részletesebben a 8. fejezetben


foglalkozunk.

Adott egy v vektor. A sík tetszőleges P pontjához hozzárendeljük a P pontból induló v vektor P′ végpontját. Az így
de niált transzformációt eltolásnak nevezzük.

5.22. ábra

Ha az eltolás vektora nullvektor, akkor a sík minden pontja xpont. Ha az eltolás vektora nem nullvektor, akkor az
eltolásnál nincs xpont. Invariáns egyenes minden olyan egyenes, mely párhuzamos az eltolás vektorával. Bármely
egyenes képe párhuzamos az eredeti egyenessel. Az eltolás távolság- és szögtartó transzformáció. Az eltolás a körüljárás
irányát nem változtatja meg (5.23. ábra).
5.23. ábra

Megjegyzés. Érdemes kiemelni, hogy – ellentétben a korábbi transzformációkkal – ha az eltolás vektora nem
nullvektor, akkor nem létezik véges invariáns alakzat.
Példák
1. Adott két pont: O1 és O2. A sík egy tetszőleges P pontját centrálisán tükrözzük O1-re, majd a kapott P′ képpontot
ugyancsak centrálisan tükrözzük O2-re. Igazoljuk, hogy az így végrehajtott két transzformáció helyettesíthető
egyetlen eltolással! Adjuk meg az eltolás vektorát is!
Az 5.24. ábrát elemezve észrevehetjük, hogy a PP′P ˝ háromszögnek O1O2 egy középvonala, így PP ˝ szakasz
párhuzamos az O1O2 szakasszal, és hossza az O1O2 szakasz hosszának kétszerese.
Ez azt jelenti, hogy a két transzformáció helyettesíthető egy olyan eltolással, melynek vektora az O1O2 vektor
kétszerese: v = 2O1O2. (Könnyen ellenőrizhető, hogy ez akkor is igaz lesz, ha a P pont az O1O2 szakasz egyenesére
illeszkedik, vagyis a P, P′, P ˝ pontok egy egyenesre illeszkednek.)

5.24. ábra

5.25. ábra

2. Az 5.25. ábrán egy folyót látunk, annak két partján egy-egy falut: A-t és B-t. Hová építsék a folyóra merőleges
hidat, hogy a lehető legrövidebb úton el lehessen jutni A-ból B-be?
Toljuk el a folyó egyik partját és valamelyik (pl. az A) pontot a folyó irányára merőleges és a folyó szélességével
egyenlő nagyságú vektorral, majd az A pont A′ képét kössük össze a B ponttal. Ha ez az A′B szakasz a folyó másik
partját M-ben metszi, akkor M-ben kell a folyóra merőleges hidat építeni, hogy a legrövidebb utat megkapjuk A és
B között. Tekintsük ugyanis az 5.26. ábrát! Azt kell megmutatnunk, hogy bármely más Q pont esetén
5.26. ábra

Az eltolás miatt ANMA′ és AQPA′ paralelogramma, így AN = A′M és AQ = A′P. Így

De NM = QP, így a háromszög-egyenlőtlenség miatt A′M + MB = A′B < A′P + PB.

Az eddig megismert transzformációk fontos tulajdonsága, hogy távolságtartó leképezések, azaz egybevágósági
transzformációk. A továbbiakban néhány nem egybevágósági transzformációt tárgyalunk.

Középpontos hasonlóság

Adott egy O pont és egy k > 0 valós szám. A sík tetszőleges P pontjához hozzárendeljük az OP félegyenes azon P′ pontját,
melyre OP′ = k · OP. Az így de niált transzformációt középpontos hasonlóságnak nevezzük.

Az O pontot a középpontos hasonlóság középpontjának, a k számot a hasonlóság arányának mondjuk. Ha k > 1, akkor a
középpontos hasonlóság nagyítás, ha k < 1, akkor kicsinyítés.
Középpontos hasonlóság esetén xpont egyedül az O pont. (Kivéve, ha k = 1, ekkor a sík minden pontja xpont.) Ha k ≠
1, akkor nincs invariáns alakzat.
E transzformáció nem szimmetrikus, azaz nincs olyan P pont, amely P′ képének a P ˝ képe azonos az eredeti P ponttal.
Egyenes képe mindig egyenes, mégpedig az eredeti egyenessel párhuzamos egyenes. Szakasz képének a hossza az
eredeti szakasz hosszának a k-szorosa. A középpontos hasonlóság szögtartó.
A középpontos hasonlóság a körüljárás irányát nem változtatja meg (lásd 5.27. ábra, melyen az ABC háromszögre k = 2
arányú nagyítást szemléltettünk).

5.27. ábra

A középpontos hasonlóság egy fontos alkalmazása a párhuzamos szelők, illetve a párhuzamos szelőszakaszok tétele.

Ha egy szög szárait párhuzamosokkal metsszük, akkor az egyik szögszáron keletkező szakaszok aránya egyenlő a
másik szögszáron keletkező szakaszok arányával.
Ha egy szög szárait párhuzamosokkal metsszük, akkor a szárak között keletkező szakaszok aránya egyenlő a szárakból
lemetszett szakaszok arányával.

Az 5.28. ábra jelöléseivel tehát e két tétel azt jelenti, hogy


5.28. ábra

Igaz a párhuzamos szelők tételének alábbi megfordítása is.

Ha egy szög szárait úgy metsszük el két egyenessel, hogy a szög száraiból a csúcsoktól mérve a levágott szakaszok
aránya egyenlő, akkor a két metsző egyenes párhuzamos.

A párhuzamos szelők tételének segítségével igazolhatjuk a szögfelezőtételt.

A háromszög szögfelezője a szemközti oldalt két olyan szakaszra bontja, melyek aránya egyenlő a megfelelő
szomszédos oldalak arányával.

Mérjük fel az ABC háromszög b = AC oldalának C-n túli meghosszabbítására a CE = a szakaszt (5.29. ábra), és legyen p
és q az a két szakasz, melyre a C-ből induló szögfelező a szemközti c oldalt bontja.

5.29. ábra

A BCE háromszög egyenlő szárú. Mivel ECB ∠ = 180° – γ, ezért . Ez viszont azt jelenti, hogy az EB
szakasz párhuzamos az ABC háromszög C-ből induló szögfelezőjével. E két párhuzamos szakaszt felhasználva írjuk
fel a párhuzamos szelők tételét:

Példák
1. Az AB szakasz végpontjaiban merőlegeseket állítunk a szakaszra a szakasz ugyanazon oldalának irányában.
Ezekre felmérjük az a = AE és b = BF szakaszokat. Legyen M az AF és BE szakaszok metszéspontja! Milyen távol van
az M pont az AB egyenestől (5.30. ábra)? Az EBA, majd az FAB szögekre alkalmazva a párhuzamos
szelőszakaszokról szóló tételt, azt kapjuk:

Adjuk össze e két egyenlőséget:

2. Az ABC háromszög AB oldalának felezőpontja F. Az AB oldal egy tetszőleges belső P pontján keresztül CF-fel
párhuzamos egyenes AC oldal egyenesét M-ben, BC oldal egyenesét N-ben metszi. Igazoljuk, hogy a PM + PN
összeg állandó, azaz független a P pont választásától! Tekintsük az 5.31. ábrát!
5.30. ábra

5.31. ábra

A CAB, illetve CBA szögekre

(5.1)

Mivel , így az (5.1) két egyenletének összege

Tehát a PM + PN összeg valóban független a P pont választásától.

Merőleges a nitás

Adott a síkon egy t egyenes és egy k > 0 valós szám. A sík tetszőleges P pontjához hozzárendeljük az alábbi P′ pontot: P-
ből merőlegest állítunk a t egyenesre, ennek talppontja legyen T; P′ a TP félegyenes azon pontja, melyre TP′ = k · TP. Az
így megadott transzformációt merőleges a nitásnak nevezzük.

A t egyenest az a nitás tengelyének, a k számot az a nitás arányának nevezzük. Ha k = 1, akkor a sík minden pontja
xpont. Ha k ≠ 1, akkor e transzformáció xpontjai a t tengely és csak a t tengely pontjai. Invariáns egyenes a t tengely
(hiszen minden pontja xpont), valamint a t tengelyre merőleges egyenesek.
Ez a transzformáció nem szimmetrikus, hiszen nincs olyan P pont, mely képének a képe azonos P-vel.
A merőleges a nitás esetén egyenes képe egyenes, de nem távolságtartó és nem is szögtartó transzformáció.

A transzformáció a körüljárás irányát megtartja (5.32. ábra, melyen a merőleges a nitás aránya ).
5.32. ábra

Megjegyzés. A merőleges a nitás nem távolságtartó transzformáció. A tengellyel párhuzamos szakasz képének
hossza egyenlő az eredeti szakasz hosszával, de a tengellyel nem párhuzamos szakasz hossza már eltér az eredeti
szakasz hosszától. Ha k < 1, akkor a szakasz képe rövidebb az eredetinél; a legnagyobb a rövidülés, ha az eredeti
szakasz merőleges a tengelyre; ekkor a kép hossza az eredeti szakasz hosszának k-ad része, k > 1 esetén pedig a szakasz
képének hossza az eredeti szakasz hosszának a k-szorosa. Szokás a merőleges a nitást k > 1 esetben „nyújtásnak“, k <
1 esetén pedig „zsugorításnak“ nevezni. Kimutatható, hogy a merőleges a nitás körhöz ellipszist rendel.

Inverzió

Adott egy O középpontú r sugarú kör. A sík – O-tól különböző – tetszőleges P pontjához hozzárendeljük az AP félegyenes
azon P′ pontját, melyre OP · OP′ = r2. Az így de niált transzformációt inverziónak nevezzük.

Az O pont az inverzió pólusa, a kör az inverzió alapköre, az r2 pedig az inverzió hatványa. (Szokás az inverziót körre
vonatkozó tükrözésnek is nevezni.) Ez a transzformáció a kör O középpontjához nem rendel pontot, a kör többi belső
pontjához körön kívüli pontot rendel, a körön kívüli ponthoz pedig a kör egy belső pontját rendeli; mondhatjuk: a sík
körön kívüli pontjait a kör belsejébe képezi le (5.33. ábra).
Az inverzió meghatározásából következik, hogy xpontok az alapkör pontjai és csakis ezek a pontok. Invariáns
egyenesek a póluson áthaladó egyenesek, kivéve belőlük magát a pólust. Az inverzió szimmetrikus transzformáció:
bármely P pont P′ képének a P ˝ képe maga a P pont.
A póluson át nem haladó egyenes képe póluson áthaladó kör, míg a póluson áthaladó kör képe póluson át nem haladó
egyenes (5.34. ábra).

5.33. ábra

5.34. ábra
5.4. Háromszögek, nevezetes vonalak, pontok, körök, egyéb nevezetes
objektumok

A háromszög fogalma, háromszögek osztályozása


Összefüggések a háromszög oldalai és szögei között
A háromszög területe, háromszögek egybevágósága, hasonlósága
Derékszögű háromszögek
A háromszög nevezetes objektumai

A háromszög fogalma, háromszögek osztályozása

A háromszög olyan síkidom, melynek három nem egy egyenesre illeszkedő csúcsa, három oldala és három szöge van.

A háromszög csúcsait nagybetűkkel, egy-egy csúccsal szemközti oldalait kisbetűkkel, az egyes csúcsoknál levő
megfelelő szöget görög kisbetűkkel jelöljük (5.35. ábra).

5.35. ábra

A háromszögeket osztályozhatjuk oldalaik és szögeik szerint. Oldalaik szerint két speciális háromszöget
különböztetünk meg.
Az egyenlő szárú háromszög olyan háromszög, melynek két oldala egyenlő. Az egyenlő szárú háromszög egyenlő
oldalait száraknak, a harmadik oldalt alapnak nevezzük; a szárakkal szemközti szögek egyenlők. Az egyenlő szárú
háromszög tengelyesen szimmetrikus alakzat, szimmetriatengelye az alap oldalfelező merőlegese (5.36a ábra).

5.36. ábra

Az egyenlő oldalú (szabályos) háromszög mindhárom oldala és mindhárom szöge egyenlő, szögei 60°-osak. Az egyenlő
oldalú háromszög tengelyesen szimmetrikus alakzat, három szimmetriatengelye van (5.36b ábra).
Szögei szerint a háromszög hegyes-, derék- vagy tompaszögű.
A hegyesszögű háromszög minden szöge hegyesszög (5.37a ábra). A derékszögű háromszög egyik szöge 90°, másik két
szöge hegyesszög (5.37b ábra). A derékszöget közrefogó oldalak a derékszögű háromszög befogói, a derékszöggel szemközti
oldal a háromszög átfogója. A tompaszögű háromszög egyik szöge 90°-nál nagyobb, másik két szöge pedig hegyesszög (5.37c
ábra).

5.37. ábra

Összefüggések a háromszög oldalai és szögei között


Mivel két pont között a legrövidebb út az egyenes szakasz, ezért bármely háromszögre fennállnak a háromszög-
egyenlőtlenségek.

A háromszög bármely két oldalának összege nagyobb a harmadik oldalnál:

Egyszerű algebrai átrendezéssel kapjuk, hogy a háromszög bármely két oldalának különbsége kisebb a harmadik
oldalnál.

A háromszög belső szögeinek összege 180°.

Húzzunk ugyanis a háromszög egyik (pl. C) csúcsán keresztül egy párhuzamost a szemközti oldallal (5.38. ábra)!

5.38. ábra

Az α-val jelölt szögek, illetve a β-val jelölt szögek egyenlők, hiszen egyállású szögek, a γ-val jelölt szögek pedig azért
egyenlők, mert csúcsszögek. Az ábrából látható:

Bármely háromszögben nagyobb oldallal szemben nagyobb, kisebb oldallal szemben kisebb szög van.

A háromszög egy oldalának meghosszabbításakor a belső szög mellékszögét a háromszög egy külső szögének mondjuk.

A háromszög külső szöge egyenlő a nem mellette fekvő belső szögek összegével.

Tekintsük az 5.39. ábrát, melyen a B csúcsnál levő külső szöget φ-vel jelöltük!

5.39. ábra

Példák
1. Az ABC háromszög B, illetve C csúcsainál levő külső szögek: 103°, illetve 130°. Mekkora a háromszög A csúcsnál
levő belső szöge?
A B és C csúcsoknál levő belső szögek: 77°, illetve 50° (5.40. ábra).
5.40. ábra

Mivel a belső szögek összege 180°, ezért az A csúcsnál levő φ szögre

2. Az ABCD négyszög A csúcsnál levő belső szöge 72°, a C és D csúcsoknál levő külső szögek: 85°, illetve 80°. Az ACD
szög 40°. Mekkora a B csúcsnál levő belső szög?
Tekintsük az 5.41. ábrát! A D csúcsnál levő belső szög 100°, így az ADC háromszög A csúcsnál levő belső szöge 40°,
tehát az ABC háromszög A csúcsnál levő szöge 32°. Mivel a négyszög C csúcsnál levő belső szöge 95°, ezért az ABC
háromszög C csúcsánál levő belső szöge 55°. Ezek szerint a B csúcsnál levő keresett szög: φ = 180° – 32° – 55° = 93°.

5.41. ábra

3. Egy háromszög szögei egy számtani sorozat egymást követő tagjai, legnagyobb szöge 82°. Mekkora a háromszög
másik két szöge?
Legyen α a háromszög „középső“ szöge, és legyen d a sorozat di erenciája! Ekkor

Ha a legnagyobb szög 82°, akkor a di erencia 22°, tehát a legkisebb szög 38°.
4. Az ABC egyenlő szárú hegyesszögű háromszög alapja AB. A BC szárra emeltük a BCE szabályos háromszöget.
Mekkora az EAB szög?
Elemezzük az 5.42. ábrát! Ha az AB alapon fekvő két szög α, akkor a C csúcsnál levő belső szög 180° – 2α. Mivel AC =
CB = CE, ezért az ACE háromszög egyenlő szárú. E háromszög C csúcsnál levő belső szöge 240° – 2α, ezért az ACE
háromszög A csúcsnál levő szöge:

A keresett φ szögre: φ = CAB∠ – CAE ∠ = α – (α – 30°) = 30°.

5.42. ábra

A háromszög területe, háromszögek egybevágósága, hasonlósága


A háromszög területe egyenlő valamely oldal és a hozzá tartozó magasság szorzatának a felével (5.43. ábra).

Ebből következik, hogy ha két háromszög egy-egy oldala egyenlő, akkor területeik aránya az egyenlő oldalakhoz
tartozó magasságok arányával egyenlő, ha pedig két háromszög egy-egy oldalához tartozó magasságai egyenlők, akkor a
háromszögek területének aránya az egyenlő magasságokhoz tartozó oldalak arányával egyenlő. Mindezek segítségével
igazolhatjuk a bizonyítási feladatoknál igen hasznos Ceva-tételt.

Legyen P az ABC háromszög egy tetszőleges belső pontja; az AP, BP, CP egyenesek a szemközti oldalait A1, B1, illetve C1
pontokban metszik. Ekkor

Tekintsük az 5.44. ábrát, melyen a keletkező részháromszögek területeit t1, t2, …, t6-tal jelöltük.

5.43. ábra

5.44. ábra

Az APC1 és BPC1 háromszögek AC1 és BC1 oldalaihoz tartozó magasságaik egyenlők. De ugyanez elmondható az AC1C,
illetve BC1C háromszögekről is, így írhatjuk az alábbi egyenlőségeket:

(5.2)

Teljesen hasonló módon kapjuk:


(5.3)

Az (5.2) és (5.3) egyenlőségeket összeszorozva azt kapjuk:

Igaz a Ceva-tétel megfordítása is: ha az ABC háromszög AB oldalának C1, BC oldalának A1, CA oldalának B1 pontjaira
fennáll az

egyenlőség, akkor az AA1, BB1, CC1 egyenesek egy ponton haladnak keresztül.

Két háromszög egybevágó, ha


- oldalai páronként egyenlők;
- két-két oldala és a közbezárt szög páronként egyenlő;
- egy-egy oldaluk és a rajta levő szögek páronként egyenlők;
- két-két oldaluk és a nagyobbikkal szemközti szögek egyenlők.
Ha a fenti négy feltétel bármelyike teljesül, akkor mind a négy teljesül, s a két háromszög egybevágó. Egybevágó
háromszögek területe egyenlő.
Két háromszög hasonló, ha
- szögeik megegyeznek;
- két-két oldalának aránya és a közbezárt szög egyenlők;
- megfelelő oldalaik aránya egyenlő;
- két-két oldal aránya éa a nagyobbikkal szemközti szög egyenlők.
Ha a fenti négy feltétel bármelyike teljesül, akkor mind a négy teljesül, s a két háromszög hasonló.

Hasonló háromszögek területeinek aránya a hasonlóság arányának négyzetével egyenlő.

Megjegyzés. Érdemes megvizsgálni a háromszögek egybevágóságánál, illetve hasonlóságánál említett negyedik


feltételt. Miért kell (pl. az egybevágóság esetében), hogy a nagyobbik oldallal szemközti szögek legyenek egyenlők?
Tekintsük az 5.45. ábrát!

5.45. ábra

Az ABC és ABC′ háromszögekben két-két oldal és a kisebbikkel szemközti szögek egyenlők, de a két háromszög
nyilvánvalóan nem egybevágó. A B csúccsal szemközti szög lehet hegyesszög (ABC′ háromszög), de lehet tompaszög
is (ABC háromszög). Ha azonban megköveteljük, hogy a nagyobbik oldallal szemközti szögek legyenek egyenlők,
akkor ez már nem fordulhat elő. Háromszögek hasonlóságánál pontosan ugyanezzel a helyzettel állunk szemben.
Példák
1. Az ABC háromszög AC oldalának felezőpontja F, BC oldalának felezőpontja E. Az EFC háromszög területe
hányadrésze az ABC háromszög területének?

Mivel E és F felezőpontok, ezért (5.46. ábra).


5.46. ábra

Ezek szerint az ABC és EFC háromszögek hasonlók, és a hasonlóság aránya 1 : 2, így a két háromszög területének
aránya 1 : 4, vagyis az EFC háromszög területe az ABC háromszög területének a negyedrésze.
2. Az ABCD trapéz átlóinak metszéspontja M. Igazoljuk, hogy az AMD és a BMC háromszögek területe egyenlő,
mégpedig az ABM és CDM háromszögek területeinek a mértani közepe.
Az ABC és ABD háromszögek területe egyenlő, hiszen AB oldaluk közös, és az ezekhez az oldalakhoz tartozó
magasságok egyenlők. Ha mindkét háromszögből elvesszük az ABM háromszöget, akkor egyenlő területek
maradnak vissza, tehát az AMD háromszög területe valóban egyenlő a BMC háromszög területével. Jelöljük ezt a
területet tx-szel (5.47. ábra)!

5.47. ábra

Az AMD és MCD háromszögek területeire, valamint ABM és BMC háromszögek területeire

Derékszögű háromszögek
Különösen fontos tulajdonságaik miatt részletesebben foglalkozunk a derékszögű háromszögekkel.
Thalész tétele.

Ha egy kör egy átmérőjének két végpontját összekötjük a körív bármely más P pontjával, akkor a P pontnál derékszög
keletkezik.

Ennek igazolása végett tekintsük az 5.48. ábrát!


Az AOP és BOP háromszögek egyenlő szárú háromszögek, hiszen AO, OP és OB egyaránt a kör sugarával egyenlő.
Ezek szerint az egyenlő módon jelölt szögek egyenlők. Az ABP háromszög belső szögeire:

5.48. ábra
Thalész tétele tehát azt is jelenti, hogy ha egy körbe derékszögű háromszöget írunk, akkor annak átfogója áthalad a kör
középpontján. Egy szakaszra mint átmérőre rajzolt kört a szakasz Thalész-körének nevezzük.
A matematika, a zika és általában a természettudományok szinte valamennyi területén nagyjelentőségű Pitagorasz
tétele.

Bármely derékszögű háromszög befogói négyzetének összege egyenlő az átfogó négyzetével, azaz (az 5.49. ábra
jelöléseivel) a2 + b2 = c2.

5.49. ábra

Az 5.50a és 5.50b ábrákon két a + b oldalú egybevágó négyzetet vettünk fel.


A két négyzet egybevágó, területeik egyenlők. Az 5.50a ábra négyzetében két kisebb négyzet foglal helyet; ezek
területei: a2, illetve b2, valamint négy db a, b befogójú, c átfogójú egybevágó derékszögű háromszög. Az 5.50b
ábrában helyet foglal négy db a, b befogójú, c átfogójú egybevágó derékszögű háromszög, valamint egy olyan
négyszög, melynek minden oldala c. Ha a két egyenlő területű négyzetből elvesszük a 4-4 egybevágó derékszögű
háromszöget, akkor egyenlő területek maradnak vissza. Az 5.50a négyzetből visszamaradó terület a2 + b2, az 5.50b
négyzetből visszamaradó terület egy c oldalú rombusz. Mivel a derékszögű háromszögben a hegyesszögek összege
90°, ezért – amint az ábráról leolvasható – a rombusz szögei derékszögek, így e rombusz négyzet, tehát a területe c2.

5.50. ábra

Vagyis azt kaptuk, hogy a2 + b2 = c2.


Igaz Pitagorasz tételének megfordítása is:

ha egy háromszög két oldala négyzetének összege egyenlő a harmadik oldal négyzetével, akkor a háromszög
derékszögű.

Alkalmazások
1. Pitagorasz tételének alkalmazásaként könnyen meghatározhatjuk az a oldalú négyzet átlóját, az a oldalú
szabályos háromszög magasságát, valamint az a élű kocka testátlójának a hosszát (5.51. ábra).

5.51. ábra

2. Igazoljuk, hogy a paralelogramma oldalai négyzetének összege egyenlő az átlók négyzetének összegével! Legyen a
paralelogramma két-két oldala a és b, átlói e és f hoszszúak (5.52. ábra)!
5.52. ábra

Írjuk fel Pitagorasz tételét az APC és BDT derékszögű háromszögekre!

(5.4)

Az (5.4) egyenlőségeket összeadva

A BPC derékszögű háromszögben Pitagorasz tétele szerint b2 = x2 + m2; ezt felhasználva azt kapjuk:

3. A háromszög oldalainak ismeretében kiszámíthatjuk a háromszög területét a Héronképlettel. Tekintsük az 5.53.


ábrát!

5.53. ábra

Írjuk fel Pitagorasz tételét a CTA és BTA derékszögű háromszögekre!

A jobb oldali szorzótényezők számlálójában több nevezetes szorzat is felfedezhető:

Ha bevezetjük a félkerületre az alábbi jelölést: , akkor kapjuk Héron képletét:

(5.5)

Ha a derékszögű háromszögnek megrajzoljuk az átfogóhoz tartozó magasságát, ez a háromszöget két derékszögű


háromszögre bontja. E háromszögek minden esetben hasonlók egymáshoz és az eredeti háromszöghöz is, hiszen (5.54.
ábra) a BAC és BCT szögek merőleges szárú hegyesszögek, tehát egyenlők, így az ATC és a BTC derékszögű háromszögeknek
egy-egy hegyesszögük egyenlő, tehát minden szögük páronként egyenlő, vagyis a két háromszög hasonló. De e két
háromszög hasonló az eredeti ABC háromszöghöz is, hiszen az is derékszögű, s annak mindkét háromszöggel van egy-egy
közös szöge.
5.54. ábra

E hasonlóságokat felhasználva igazolhatjuk a magasságtételt és a befogótételt.

Magasságtétel: A háromszög átfogóhoz tartozó magassága az átfogót két olyan szakaszra bontja, melyek mértani
közepe a magasság.
Befogótétel: A derékszögű háromszög befogója mértani közepe az átfogónak és a befogó átfogóra eső merőleges
vetületének.

Az 5.55. ábra BTC és ATC háromszögei hasonlók, így írhatjuk:

5.55. ábra

A BTC és ABC, valamint az ATC és ABC háromszögek hasonlóságából pedig az alábbi egyenlőségek következnek:

A befogótétel két egyenletét négyzetre emelve, majd elosztva egymással, a következőt kapjuk:

Ez utóbbi egyenlőség azt fejezi ki, hogy a derékszögű háromszög átfogójához tartozó magassága az átfogót két olyan
szakaszra bontja, melyek aránya egyenlő a megfelelő szomszédos oldalak négyzeteinek arányával.
Példák
1. Az 5.56. ábrán egy tetőszerkezet keresztmetszete látható. A ferde tetősíkok merőlegesek egymásra; a födémtől a
tető csúcsáig merőlegesen állított g tartógerenda hoszsza 4 m, a födém szélessége 9 m. Mekkorák az ábrán AT-vel,
illetve BT-vel jelölt szakaszok?

5.56. ábra

Ha az AT szakasz hosszát x-szel jelöljük, akkor BT = 9 – x. A magasságtétel szerint


Tehát a g gerenda a födémet egy 6,56 és egy 2,44 méteres darabra bontja.
2. Adott az egységnyi hosszúságú szakasz, valamint egy a hosszúságú szakasz. Szerkesszük meg a hosszúságú
szakaszt!
Vegyünk fel egy AB = 1 + a hosszúságú szakaszt, majd emeljünk rá egy félkört, és állítsunk egy merőlegest a
szakaszra az 5.57. ábra szerint!

5.57. ábra

Thalész tétele miatt az ABC háromszög derékszögű. A magasságtételből következik:

3. Egy O középpontú AB szakaszra rajzoltunk egy félkört, valamint ugyanazon oldalra az OB szakaszra is rajzoltunk
egy félkört. Az AB szakasz egy tetszőleges belső P pontjában OB-re állított merőleges a kisebb félkört M-ben, a
nagyobb félkört N-ben metszi. Igazoljuk, hogy

Az 5.58. ábra BMO és BNA háromszögei derékszögűek Thalész tétele alapján. Írjuk fel a befogótételt az OBM és
ABN háromszögekre!

5.58. ábra

(5.6)

Az (5.6) egyenleteket elosztva egymással azt kapjuk:

De AB = 2OB, így azt kaptuk:

A háromszög nevezetes objektumai


A háromszögnek több mint 3000 nevezetes pontja ismert, továbbá sok nevezetes vonala, köre, háromszöge stb. E nevezetes
objektumok közül említünk néhányat – természetesen a teljességre való törekvés igénye nélkül. Több helyen a
bizonyításokat is vázoljuk.

Oldalfelező merőlegesek
Szögfelezők
Középvonalak
Magasságvonalak
Súlyvonalak
Euler-egyenes
Feuerbach-kör
A háromszög talpponti háromszöge
Simson-egyenes
Szimedián-egyenes
A háromszög Torricelli-pontja
A háromszög Napóleon-háromszögei

Oldalfelező merőlegesek

A háromszög oldalfelező merőlegesei egy pontban metszik egymást. Ez a pont a háromszög köré írható körének a
középpontja.

Az 5.59. ábrán két oldalfelező merőlegest rajzoltunk be, ezek metszéspontja K.

5.59. ábra

KA = KB, hiszen K rajta van AB felező merőlegesén. De KA = KC, hiszen K rajta van AC felező merőlegesén is. Ezek
szerint KB = KC, ami azt jelenti, hogy K-nak illeszkednie kell a BC oldal felező merőlegesére is. Mivel a K pont a
háromszög mindhárom csúcsától egyenlő távolságra van, ezért a K középpontú AK sugarú kör áthalad a háromszög
B és C csúcsain is, vagyis a K pont a háromszög köré írható körének a középpontja.
Megjegyzés. A háromszög köré írható körének K középpontja hegyesszögű háromszög esetén a háromszög belső
pontja, derékszögű háromszög esetén az átfogó felezőpontja, tompaszögű háromszög esetében a háromszögön kívüli
pont (5.60a–c ábra).

5.60. ábra

Ha a háromszög oldalai a, b, c, területe T, akkor köré írható körének R sugara:

Tekintsük ugyanis az 5.61. ábrát, melyen berajzoltuk az ABC háromszög köré írható körének C-ből induló átmérőjét.
5.61. ábra

Thalész tétele miatt CAP ∠ = 90°, továbbá PAC ∠ = CBT ∠ (azonos íven nyugvó kerületi szögek), ezért a CTB és CAP
háromszögek hasonlók. Felírhatjuk az alábbi egyenlőséget:

(5.7)

Az ABC háromszög T területe: , ahonnan .


Ezt (5.7) egyenletbe helyettesítve kapjuk:

Szögfelezők

A háromszög belső szögfelezői egy pontban metszik egymást. Ez a pont a háromszög beírható körének a középpontja
(5.62a ábra).
A háromszög egy belső és másik két külső szögfelezője egy pontban metszik egymást. Ez a pont a háromszög egyik
hozzá írható körének középpontja (5.62b ábra).

5.62. ábra

E két tétel igazolása teljesen hasonló gondolatmenettel végezhető el, mint az oldalfelező merőlegesek esetében.

Megjegyzés. A háromszög beírható körének r sugarát könnyen megkapjuk, ha felírjuk az 5.62a ábra ABO, BCO és CAO
háromszögeinek a területét:

E három terület összege egyenlő az eredeti ABC háromszög területével:

(5.8)

Hasonló gondolatmenettel juthatunk el az a, b és c oldalakat érintő hozzá írható körök ra, rb, rc sugaraihoz. Az APOQ
négyszög területét kétféleképpen írjuk fel: egyrészt az APO és AQO derékszögű háromszögek összegeként, másrészt
az eredeti háromszög, valamint a BPOT és CQOT deltoidok területének összegeként. Eszerint

De a körhöz egy külső pontból húzott érintőszakaszok egyenlősége miatt x + y = a, ezért

ahonnan
A másik két oldalhoz hozzáírható körök sugaraira hasonlóképpen

Középvonalak

A háromszög középvonala két oldal felezőpontját összekötő szakasz.

A háromszögnek tehát három középvonala van. Ezek nem egy pontban metszik egymást.

A háromszög középvonala párhuzamos a háromszög egyik oldalával, és hossza ezen oldal hosszának a fele.

Az 5.63. ábrán megrajzoltuk az ABC háromszög mindhárom középvonalát. E középvonalak a háromszöget négy
egybevágó háromszögre bontják. E háromszögek mindegyike hasonló az eredeti háromszöghöz; a hasonlóság aránya
1 : 2.

5.63. ábra

Magasságvonalak

A háromszög magasságvonala valamely csúcsból a szemközti oldal egyenesére állított merőleges egyenes.

Megkülönböztetjük a háromszög magasságvonalát a háromszög magasságától. A magasságvonal egy egyenes, a


magasság pedig ennek az egyenesnek a csúcstól a szemközti oldalig terjedő darabja (ezt használjuk pl. a háromszög
területének a kiszámításánál).

A háromszög magasságvonalai egy pontban metszik egymást.

Húzzunk az ABC háromszög csúcspontjain keresztül egy-egy párhuzamost a szemközti oldallal (5.64. ábra)!
5.64. ábra

A keletkező PQR háromszögnek az AB, BC, CA oldalak középvonalai, vagyis a PQR háromszögnek az A, B, C pontok
oldalfelező pontjai. Ebből következik, hogy az ABC háromszög magasságvonalai a PQR háromszögben oldalfelező
merőlegesek, amelyekről tudjuk, hogy egy pontban metszik egymást.

Az ABC háromszög magasságvonalainak metszéspontját a háromszög magasságpontjának nevezzük.

Megjegyzés. Hegyesszögű háromszög magasságpontja mindig a háromszög belső pontja, derékszögű háromszög
magasságpontja a derékszögű csúcsban van, tompaszögű háromszög magasságpontja a háromszögön kívül
helyezkedik el (5.65. ábra).

5.65. ábra

Az 5.65. ábrából azt is kiolvashatjuk, hogy ha megrajzoljuk az ABC háromszög M magasságpontját, akkor a kapott
négy db pont közül bármely hármat kiválasztjuk, akkor a kiválasztott pontok alkotta háromszög magasságpontja
éppen a negyedik (ki nem választott) pont.

Súlyvonalak

A háromszög súlyvonala valamely csúcsból a szemközti oldal felezőpontjába húzott szakasz.

A háromszögnek három súlyvonala van. E súlyvonalak bármelyike mindig felezi a háromszög területét.

A háromszög súlyvonalai egy pontban metszik egymást, ez a pont (súlypont) minden súlyvonalon a csúcstól távolabbi
harmadoló pont.

Az 5.66. ábrán két súlyvonalat rajzoltunk meg. Azt mutatjuk meg, hogy ezek S metszéspontja mindkét súlyvonalon a
csúcstól távolabbi harmadoló pont. Legyen P és Q az AS, illetve BS szakaszok felezőpontja, és húzzuk be még a
háromszög EF középvonalát!
5.66. ábra

Az EF középvonal párhuzamos AB-vel és fele olyan hosszú. Az ABS háromszögben PQ ugyancsak középvonal, tehát
párhuzamos AB-vel és fele olyan hosszú. Ebből következik, hogy az EF és PQ szakaszok párhuzamosak és egyenlőek,
vagyis a PQFE négyszög paralelogramma. Mivel annak átlói felezik egymást, azért AP = PS = SF és BQ = QS = SE, tehát
az S pont mindkét súlyvonalon a csúcstól távolabbi harmadoló pont.
Ugyanez a gondolatmenet nyilván az A-ból és C-ből induló súlyvonalakra is elmondható. Mármost ha a C-ből induló
súlyvonal nem haladna át az S ponton, akkor az A-ból induló súlyvonalnak két „csúcstól távolabbi harmadoló
pontja” lenne, ami lehetetlen. Tehát a súlyvonalak egy pontban metszik egymást.
Megjegyzés. Pitagorasz tételének felhasználásával kiszámolhatjuk a háromszög egyes súlyvonalainak a hosszát.
Tükrözzük az ABC háromszöget a c oldal F felezőpontjára (5.67. ábra). Az eredeti háromszög és tükörképe együttesen
egy paralelogrammát határoznak meg. A paralelogrammáról ismert, hogy oldalai négyzetének összege egyenlő az
átlók négyzetének összegével (lásd 5.52. ábra). Tehát jelen esetben

5.67. ábra

(5.9)

Természetesen a másik két súlyvonalra hasonló képletek érvényesek:

Euler-egyenes

A háromszög M magasságpontja, köré írt körének K középpontja és S súlypontja egy egyenesbe esik. (Ezt az egyenest
nevezzük a háromszög Euleregyenesének.)

Elemezzük az 5.68. ábrát, melyen E, F, G-vel jelöltük az ABC háromszög oldalfelező pontjait!
5.68. ábra

A középvonalak alkotta EFG háromszög hasonló az ABC háromszöghöz, és a hasonlóság aránya 1:2. AKF szakasz

megfelelője a CM szakasz, így Mivel és a KFS ∠ = SCM ∠, ezért a KFS és MCS háromszögek
is hasonlók, tehát megfelelő szögeik egyenlők, vagyis KSF ∠ = MSC ∠, ez pedig éppen azt jelenti, hogy a K, S és M
pontok egy egyenesbe esnek, és az S pont a KM szakasznak K-hoz közelebbi harmadoló pontja.

Feuerbach-kör

A háromszög oldalfelező pontjai, magasságainak talppontjai, valamint a magasságpontot a csúcsokkal összekötő


szakaszok felezőpontjai egy körön vannak.

Ezt a kört (5.69. ábra) szokás a háromszög Feuerbach-körének vagy más néven kilencpontos körnek nevezni. A
Feuerbach-kör érinti a háromszög beírható, valamint hozzá írható köreit. A Feuerbach-kör sugara fele akkora, mint
a köré írható kör sugara.

5.69. ábra

A háromszög talpponti háromszöge

A hegyesszögű háromszög talpponti háromszöge a magasságok talppontjai alkotta háromszög.

A hegyesszögű háromszögbe írható háromszögek közül a talpponti háromszögének a legkisebb a kerülete. A


talpponti háromszög egy érdekes tulajdonsága a következő.

A hegyesszögű háromszög talpponti háromszöge beírható körének középpontja az eredeti háromszög magasságpontja.

Tekintsük az 5.70. ábrát!


A TBPM négyszög húrnégyszög, hiszen két szemközti szöge derékszög. Így MTP ∠ = MBP ∠. Az ATMQ ugyancsak
húrnégyszög, ezért QAM ∠ =QTM ∠. De CAM ∠ = CBQ ∠ = 90°– γ, ezért QTM ∠ = PTM ∠. Azt kaptuk, hogy az ABC
háromszög magasságai a PTQ háromszögben szögfelezők, ami azt jelenti, hogy az ABC háromszög M magasságpontja
a talpponti PQT háromszög beírható körének középpontja.
5.70. ábra

Ha egybevetjük ezt az eredményt azzal, hogy a háromszög köré írható körének középpontja a középvonalai alkotta
háromszög magasságpontja (5.64. ábra), akkor kimondhatjuk, hogy a hegyesszögű háromszög köré írt körének
középpontja a középvonalai alkotta háromszög talpponti háromszögének a beírható körének a középpontja.

Simson-egyenes

Állítsunk merőlegeseket a háromszög köré írt köre tetszőleges P pontjából az oldalegyenesekre. E merőlegesek
talppontjai mindig egy egyenesre illeszkednek.

Ezt az egyenest nevezzük a háromszög P ponthoz tartozó Simson-egyenesének. Az 5.71. ábrán az ABC háromszög
köré írt köre egy P pontjához tartozó Simson-egyenest szemléltettük. A Simson-egyenes egy érdekes tulajdonsága a
következő: ha a P pontot elforgatjuk a kör középpontja körül α szöggel, akkor a P ponthoz tartozó Simson-egyenes
szöggel fordul el.

5.71. ábra

Szimedián-egyenes

A háromszög szimedián-egyenese: valamely súlyvonalának a vele azonos csúcsból induló szögfelezőre vonatkozó
tükörképe.

A háromszögnek három szimedián-egyenese van.

A háromszög szimedián-egyenesei egy pontban metszik egymást.

Ezt a pontot szokás a háromszög Lamoine-féle pontjának nevezni. Tekintsük az 5.72. ábrát, melyen az s súlyvonal, f
szögfelező és d szimedián-egyenes talppontjait rendre F-fel, E-vel, D-vel jelöltük.
Az ADC és BDC, valamint az AFC és BFC háromszögekre felírva e háromszögek trigonometrikus területet, arra

jutunk, hogy , vagyis a szimedián-egyenes a szemközti oldalt két olyan szakaszra bontja, melyek aránya
egyenlő a megfelelő szomszédos oldalak négyzetének arányával. Innen már következik – Ceva tételének
alkalmazásával –, hogy a szimedián-egyenesek egy pontban metszik egymást.

5.72. ábra

A háromszög Torricelli-pontja

A hegyesszögű háromszög Torricelli-pontja (izogonális pontja) a háromszögnek az a belső pontja, melyből a


háromszög oldalai 120°-os szögben látszanak.

Ha keressük a hegyesszögű ABC háromszög azon belső P pontját, melyet a csúcsokkal összekötve a PA + PB + PC
összeg a legkisebb, kimutatható, hogy ez a P pont éppen a háromszög Torricelli-pontja.

A háromszög Napóleon-háromszögei

Emeljünk egy-egy szabályos háromszöget a háromszög oldalaira kifelé. Az így kapott szabályos háromszögek
súlypontjai szabályos háromszöget alkotnak.

Ezt a háromszöget nevezzük az eredeti háromszög külső Napóleon-háromszögének. Az 5.73. ábrán az ABC
háromszög külső Napóleon-háromszögét szemléltettük.
Megjegyzés. Ha a háromszög oldalaira nem kifelé, hanem befelé emeljük a szabályos háromszögeket, akkor ezek
súlypontjai is szabályos háromszöget alkotnak; ezt nevezzük az eredeti háromszög belső Napóleon-háromszögének.
Kimutatható, hogy a háromszög külső és belső Napóleon-háromszögei területének a különbsége mindig egyenlő az
eredeti háromszög területével.

5.73. ábra

5.5. Négyszögek

A négy szakaszból álló olyan zárt töröttvonalat, melyek oldalai egymást nem metszik, négyszögnek nevezzük.
A négyszögnek négy oldala, négy szöge és négy csúcsa van. A négyszöget konvexnek mondjuk, ha minden szöge kisebb
180°-nál. Ha a négyszögnek van 180°-nál nagyobb szöge, akkor konkáv négyszögnek hívjuk (5.74. ábra).

5.74. ábra

Egy alakzat konvex, ha bármely két pontját összekötő szakaszt az alakzat magában tartalmazza. Egy alakzat konkáv, ha
van két olyan pontja, amelyeket összekötő szakasznak van olyan pontja, melyet az alakzat nem tartalmaz.

A négyszög átlójának nevezzük a szemközti csúcsait összekötő szakaszt, ha az a négyszög belsejében van. Konvex
négyszögnek két átlója van, konkáv négyszögnek egy átlója van. Speciális tulajdonságaik miatt az alábbi négyszögeket
emeljük ki.

Trapéz
Paralelogramma
Téglalap
Rombusz
Négyzet
Deltoid

Trapéz

A trapéz olyan négyszög, melynek van két szemközti párhuzamos oldala.

A trapéz párhuzamos oldalait a trapéz alapjainak mondjuk, a másik két oldala a trapéz szárai, a párhuzamos oldalak
távolsága a trapéz magassága. A szárak felezőpontjait összekötő szakaszt a trapéz középvonalának nevezzük. A trapéz
középvonala párhuzamos az alapokkal, és hossza az alapok hosszának a számtani közepe. A trapéz egy száron levő
szögeinek összege 180°.
Tekintsük az 5.75. ábrát, melyen az ABCD trapézt centrálisan tükröztük a trapéz BC szárának F felezőpontjára.

5.75. ábra

Az ABCD trapéz és A′CBD′ tükörképe együttesen paralelogrammát alkotnak. E paralelogrammában az EE′ szakasz
párhuzamos és egyenlő az AD′, illetve A′D oldalakkal. Ezek szerint

A trapéz átlói a trapézt négy db háromszögre bontják (5.76. ábra). E háromszögek közül az alapokra illeszkedő
háromszögek mindig hasonlók, a szárakra illeszkedő háromszögek területe mindig egyenlő.

5.76. ábra

Az 5.75. ábrán látható AD′A′D paralelogramma területe az ABCD trapéz területének kétszerese. A paralelogramma T
területe (a + b) · m = 2k · m, így az ABCD trapéz területe:
Paralelogramma

A paralelogramma olyan négyszög, melynek szemközti oldalai párhuzamosak.

A paralelogramma középpontosan szimmetrikus alakzat, szimmetriacentruma az átlók metszéspontja. Ebből


következnek a paralelogramma legfontosabb tulajdonságai:
- szemközti oldalai egyenlők;
- szemközti szögei egyenlők;
- szomszédos szögei 180°-ra egészítik ki egymást;
- átlói felezik egymást.
A paralelogramma magasságának nevezzük a szemközti oldalak távolságát. Ennek megfelelően a paralelogrammának
két magassága van. A paralelogramma területe egy oldalának és a hozzá tartozó magasságának szorzata (5.77. ábra).

5.77. ábra

Téglalap

A téglalap olyan paralelogramma, melynek minden szöge derékszög.

A téglalap átlói egyenlő hosszúak. A téglalap területe: két szomszédos oldalának szorzata: T=ab (5.78. ábra).

5.78. ábra

Rombusz

A rombusz olyan paralelogramma, melynek oldalai egyenlők.

A rombusz átlói merőlegesen felezik egymást. A rombusz területe egyenlő az átlók szorzatának a felével:
(5.79. ábra).

5.79. ábra
Négyzet

A négyzet olyan téglalap, melynek oldalai egyenlők.

A négyzet tehát paralelogramma és egyben rombusz is. A négyzet területe egyenlő az oldalának a négyzetével: T= a2
(5.80. ábra).

5.80. ábra

Deltoid

A deltoid olyan négyszög, melynek két-két szomszédos oldala egyenlő.

A deltoid átlói merőlegesek egymásra, egyik átlója felezi a másikat. A deltoid lehet konvex, de lehet konkáv is (5.81.

ábra). A konvex deltoid területe az átlók szorzatának a fele:

5.81. ábra

Megjegyzés. A körrel kapcsolatos speciális négyszögeket (húrnégyszög, érintőnégyszög) a körrel kapcsolatos 5.7.
fejezetben tárgyaljuk.
Példák
1. Egy trapéz párhuzamos oldalai 18 cm és 10 cm. A trapéz szárai 6 cm hosszúak. Mekkora a trapéz területe?

Mivel a trapéz szárai egyenlők, ezért Írjuk fel Pitagorasz tételét az 5.82. ábra CTB derékszögű
háromszögére. A trapéz TABCD területe:

5.82. ábra

2. Adott három nem egy egyenesbe eső pont. Szerkesztendő olyan pont, hogy az a megadott három ponttal együtt
paralelogrammát alkosson.
Legyenek az adott pontok A, B és C! Mivel a paralelogramma átlói felezik egymást, ezért az ABC háromszög egyik
(pl. AB) oldalának F felezőpontjára tükrözve a C pontot, a keresett ponthoz (D pont) jutunk (5.83. ábra).
5.83. ábra

(Természetesen azt is megtehettük volna, hogy az A pontot tükrözzük a BC szakasz felezőpontjára, vagy a B
pontot tükrözzük az AC szakasz felezőpontjára; így a feladatnak három megoldása van.)
3. Az ABCD trapéz párhuzamos oldalai: AB = 3a, CD = a, szárai AD = a, BC = 2a. Mekkora a trapéz területe?

5.84. ábra

A C ponton át AD-vel húzott párhuzamos az AB oldalt E-ben metszi (5.84. ábra). Az AECD négyszög rombusz, így
AE = a, vagyis EB = 2a. Arra jutottunk, hogy az EBC háromszög egyenlő szárú háromszög. Húzzuk be az alaphoz
tartozó m1 magasságot – ezt könnyen kiszámíthatjuk Pitagorasz tételével –, majd írjuk fel az EBC háromszög
területét kétféleképpen; így eljutunk a trapéz m magasságához.

Az EBC háromszög területére

A trapéz területe:
4. Az ABCD paralelogramma AB oldalára A-ban, BC oldalára C-ben állított merőlegesek metszéspontja E. Igazoljuk,
hogy ED merőleges AC-re!
Mivel EA merőleges AB-re (5.85. ábra), ezért EA merőleges CD-re is.

5.85. ábra

Az EC merőleges BC-re, ezért EC és AD is merőlegesek egymásra. Mindez azt jelenti, hogy az ACE háromszögben
CD és AD egy-egy magasságvonalra illeszkedik, vagyis e háromszögnek D a magasságpontja. Ha D a
magasságpont, akkor ED illeszkedik az AC oldalhoz tartozó magasságvonalra, vagyis ED merőleges AC-re.

5.6. Sokszögek, szabályos sokszögek, aranymetszés

Az n db szakaszból álló olyan zárt töröttvonalat, melyek oldalai egymást nem metszik, n oldalú sokszögnek nevezzük.

Az n oldalú sokszögnek n csúcsa, n oldala és n szöge van. A sokszöget konvexnek mondjuk, ha minden szöge kisebb,
mint 180°. Ha az n szögnek van 180°-nál nagyobb szöge, akkor konkáv sokszögnek nevezzük. A sokszög valamely csúcsából
valamely vele nem szomszédos csúcsába húzott szakaszt a sokszög egy átlójának nevezzük.
Az n oldalú konvex sokszög átlóinak a száma .

Tekintsük ugyanis az 5.86. ábrát, melyen egy n oldalú konvex sokszöget érzékeltettünk, s meghúztuk az egy csúcsból
húzható átlót.

5.86. ábra

Egy csúcsból (bármely csúcsból) n – 3 átló húzható, hiszen a csúcsból önmagába és két szomszédjába nem húzhatunk
átlót. Így az n db csúcsból összesen n(n – 3) húzható. Ezzel azonban minden átlót kétszer számoltunk, így az összes átlók

száma: .

Megjegyzés. A tétel konkáv sokszögekre már nem igaz, hiszen, ha egy konkáv sokszögnek valamely P csúcsában 180°-
nál nagyobb szöge van, akkor a P csúcs szomszédos csúcsait összekötő szakasz a sokszögön kívül halad, így ez nem
lehet átló.

Az n oldalú konvex sokszög belső szögeinek összege (n – 2) · 180°.

Az n oldalú konvex sokszög egy csúcsból húzott átlói a sokszöget n – 2 db háromszögre bontják (5.86. ábra). A sokszög
belső szögeinek összege ezeknek a háromszögeknek a belső szögeinek összege, vagyis (n – 2) · 180°.

Megjegyzés. A bizonyítás során lényegesen kihasználtuk, hogy a sokszög konvex. A tétel akkor is igaz, ha konkáv
sokszögről van szó.

Az n oldalú konvex sokszög külső szögeinek összege 360°.

Az 5.87. ábrán az n oldalú konvex sokszög külső szögeit szemléltetjük.

5.87. ábra

Ha minden egyes külső szöghöz hozzáadjuk a mellette fekvő belső szöget, akkor minden csúcsnál 180°-os szöget
kapunk. Ezek szerint a külső és a belső szögek összege n·180°,

Szabályos sokszögnek nevezzük az olyan sokszöget, melynek minden oldala és minden szöge egyenlő.
Minden szabályos sokszög konvex. A szabályos sokszög egy szöge (minden szöge)

A szabályos sokszög bármely oldalának felező merőlegese egyben szimmetriatengelye. Páros oldalú szabályos sokszög
esetén egy oldal szimmetriatengelye egyben a szemközti oldalnak is szimmetriatengelye, és ez esetben a szemközti
csúcsokon átmenő egyenesek is szimmetriatengelyek (5.88a ábra). Páratlan oldalú szabályos sokszög esetében egy oldal
felező merőlegese áthalad a szemközti csúcson (5.88b ábra). Mindez azt jelenti, hogy az n oldalú szabályos sokszögnek n db
szimmetriatengelye van. E szimmetriatengelyek egy pontban metszik egymást.

5.88. ábra

Páros oldalú szabályos sokszög esetén ez a pont egyben szimmetriacentrum is; a páros oldalú szabályos sokszögek
középpontosan is szimmetrikusak. A páratlan oldalú szabályos sokszögek középpontosan nem szimmetrikusak. A
szabályos sokszög szimmetriatengelyeinek a metszéspontja egyben a szabályos sokszög be-, illetve köré írható körének a
középpontja. A szimmetriatengelyek metszéspontját a csúcsokkal összekötve a szabályos n szög n db egybevágó egyenlő
szárú háromszögre bontható. n = 6 esetén e háromszögek szabályos (egyenlő oldalú) háromszögek.

Aranymetszés

Aranymetszés

A szabályos ötszög kiemelkedő jelentőségű a szabályos sokszögek közül. Oldalainak átlóihoz való viszonya, az
egymást metsző átlók szeleteinek viszonya, valamint az a tény, hogy a szabályos ötszög az egyetlen olyan szabályos n
szög, melynek átlói ugyancsak szabályos n szöget határoznak meg, az ókortól napjainkig esztétikai élményt nyújt a
szemlélőnek. Ennek hátterében az aranymetszés áll.

Aranymetszésnek nevezzük egy mennyiség (pl. egy szakasz) olyan arányú felbontását, melyben a kisebb darab úgy
aránylik a nagyobbhoz, mint a nagyobb darab az egészhez.

Vegyünk pl. egy egységnyi hosszúságú AB szakaszt, és jelöljük P-vel az aranymetszés szerinti osztópontot, x-szel a
rövidebb szakasz hosszát (5.89. ábra).

5.89. ábra

Ekkor

Nyilván x < 1, így az aranymetszés arányszáma:

A kapott arányszámnak igen nagy jelentősége van a geometriában, a művészetekben, a természetben és még számos
egyéb területen.
Most vizsgáljuk egy szakasz aranymetszeti felbontásának szerkesztését, vagyis szerkesszük meg azt a C pontot, mely
a kérdéses szakaszt aranymetszeti arányban osztja két részre. Vegyünk fel egy AB = a hosszúságú szakaszt, és

állítsunk rá merőlegest egyik (pl. az A) végpontjában. Mérjünk fel erre a merőlegesre távolságot. Ennek O
végpontja mint középpont köré rajzoljunk egy sugarú kört. A körnek az OB egyenessel alkotott metszéspontjai E
és F (5.90. ábra).

5.90. ábra

Az AEB és FAB háromszögek hasonlók, mert B-nél közös szögük van, továbbá EAB ∠ = BFA ∠, hiszen azonos íven
nyugvó kerületi szögek. Ennek megfelelően írhatjuk:

A kapott egyenlőség éppen azt fejezi ki, hogy az AB szakasznak C pontja az aranymetszés szerinti osztópont, ahol AC
a kisebb, BC pedig a nagyobb szelet.
Ha a szabályos ötszög egy oldalának két végpontját összekötjük az ötszög köré írt körének középpontjával, akkor a
középpontnál 360°: 5 = 72° keletkezik. Ezek szerint a szabályos ötszög egy oldalának két végpontját a szemközti
csúccsal összekötve olyan egyenlő szárú háromszöget kapunk, melynek szárszöge 36°, az alapon fekvő szögei 72°-osak
(5.91. ábra).

5.91. ábra

Húzzuk meg e háromszög alapjának valamely végpontjából a szögfelezőt, melynek talppontja legyen D. A keletkező
ABD háromszög szögei megegyeznek az eredeti ABC háromszög szögeivel, így az ABD háromszög szintén egyenlő
szárú és nyilvánvalóan hasonló az eredeti háromszöghöz, továbbá

A szögfelezőtételből

Ez az egyenlőség pedig éppen azt fejezi ki, hogy a D pont a BC szakaszt az aranymetszésnek megfelelő arányban osztja
két részre. Mindezeken túl a szabályos ötszögnek számtalan érdekes tulajdonsága van (5.92. ábra).

5.92. ábra
A szabályos ötszög átlói az aranymetszésnek megfelelő arányban metszik egymást, és e metszet nagyobbik szelete
egyenlő az ötszög oldalával. A szabályos ötszög átlói egy újabb szabályos ötszöget határoznak meg, melynek oldala az
eredeti szabályos ötszög oldalának kisebbik aranymetszete. A kapott eredményekből az is következik, hogy a
szabályos tízszög (melyben valamely oldalhoz tartozó középponti szög 36°) oldala a köré írható kör sugarának
hosszabbik aranymetszete. Ennek birtokában pedig már a szabályos tízszög is könnyen szerkeszthető.
Példák
1. Van-e olyan szabályos sokszög, melynek külső szögei 72°-osak?

Ha a szabályos sokszögnek n oldala van, akkor egy szöge Ekkor a sokszög külső szögei:

Ha ez 72°, akkor

Innen n = 5, tehát a szabályos ötszög külső szögei 72°-osak.


2. Egy szabályos sokszögnek 6-tal több átlója van, mint oldalai számának 4-szerese. Mekkorák e sokszög szögei?
A feltételek szerint

A negatív gyök érdektelen, így a szabályos sokszögnek 12 oldala van. Ekkor egy szöge:

3. Melyek azok az egybevágó szabályos sokszögek, amelyekkel a sík egyrétűen és hézagmentesen lefedhető?
Ha a keresett szabályos sokszögnek n oldala van, és egy csúcsban k db szabályos sokszög érintkezik, akkor

A kapott egyenlet bal oldalát könnyen szorzattá alakíthatjuk:

A 4-et csak háromféleképpen tudjuk két pozitív egész szám szorzatára bontani: 1·4 = 2·2 = 4·1.
Ha k – 2 = 1 és n – 2 = 4, akkor k = 3 és n = 6. Tehát szabályos hatszögekről van szó, és minden csúcsban 3 db
érintkezik egymással.
Ha k – 2 = 2 és n – 2 = 2, akkor k = n = 4. Ekkor négyzetről van szó, és a csúcsokban 4 db érintkezik egymással.
Ha k – 2 = 4 és n – 2 = 1, akkor k = 6 és n = 3. Ekkor szabályos háromszögekről van szó, és minden csúcsban 6 db
érintkezik egymással.
Más egybevágó szabályos sokszögekkel a sík egyrétegűen és hézagmentesen nem fedhető le.

5.7. A kör és részei, kerületi és középponti szögek, húr- és érintőnégyszögek

A kör és részei
Kör és egyenes, két kör viszonylagos helyzete
Érintőnégyszög
Kerületi és középponti szög, húrnégyszög

A kör és részei

A kör a sík azon pontjainak a halmaza, melyek a sík egy adott O pontjától egyenlő távolságra vannak.

Az O pontot a kör középpontjának, az adott távolságot a kör sugarának (rádiusz) nevezzük. A körvonal által határolt
síkrészt körlemeznek (körlap) nevezzük. A kör két pontjára illeszkedő egyenest szelőnek hívjuk; a szelőnek a kör két pontja
közé eső darabját húrnak nevezzük. A kör két pontja közé eső darabjának neve körív. Két sugár és az általuk meghatározott
körív által közbezárt tartományt körcikknek nevezzük, egy szelő által a körlemezből lemetszett síkrész neve körszelet. Az
olyan egyenest, melynek a körrel csak egy közös pontja van, érintőnek nevezzük (5.93. ábra).

5.93. ábra

Kör és egyenes, két kör viszonylagos helyzete


Ha d-vel jelöljük az O középpontú, r sugarú kör és valamely e egyenes távolságát, akkor
- ha d > r, a körnek és az egyenesnek nincs közös pontja (5.94a ábra);
- ha d = r, a körnek és az egyenesnek egy közös pontja van; ekkor az egyenest a kör érintőjének nevezzük; az érintési pontba
húzott sugár az érintőre mindig merőleges (5.94b ábra);
- ha d < r, a körnek és az egyenesnek két közös pontja van; ekkor az e egyenes a körnek egy szelője (5.94c ábra).

5.94. ábra

A körhöz egy külső P pontból két érintő húzható, a P-ből húzott érintőszakaszok (vagyis az érintőnek a külső P ponttól
az érintési pontig tartó szakasza) mindig egyenlők: az 5.95. ábra jelöléseivel: PE1 = PE2.

5.95. ábra

Megjegyzés. Egy külső P pontból a k körhöz érintőt az alábbi módon szerkeszthetünk. Megszerkesztjük a PO szakasz
F felezőpontját (5.95. ábra), majd megrajzoljuk az OP szakasz F középpontú Thalész-körét; ez a kör az eredeti k kört
E1-ben és E2-ben metszi. Thalész tétele miatt az OE1P = OE2P = 90°, ezért az E1 és E2 pontok lesznek az érintési pontok,
tehát a P-ből húzott érintők: a PE1 és PE2 egyenesek.

Legyen P egy körön kívüli pont (5.96. ábra).

Egy külső P pontból a k körhöz húzott szelők szelőszakaszainak szorzata állandó:

A P ponton átmenő szelőszakaszok szorzatát a P pont k körre vonatkozó hatványának nevezzük.


5.96. ábra

A fenti tétel igazolásához azt kell észrevennünk, hogy a PBC és PAC háromszögek hasonlók, hiszen P-nél közös
szögük van, a B-nél és D-nél levő szögek pedig azonos íven nyugvó kerületi szögek. Ezek szerint

Ha a P-n keresztül egy szelőt és egy érintőt húzunk, melynek érintési pontja E, akkor a PEA és PEB háromszögek
hasonlóságából a PA · PB = PE2 egyenlőséghez jutunk (5.97. ábra). Ha a P ponton átmenő átmérő egyenest húzzuk be,
és a P pontnak a kör O középpontjától való távolsága d (5.98. ábra), akkor PA = d – r, PB = d + r, tehát a P pontnak a k
körre vonatkozó hatványa: PA·PB = (d – r)(d + r) = d2 – r2.

5.97. ábra

5.98. ábra

Legyen most P a kör egy belső pontja (5.99. ábra)!


Ebben az esetben a PBD és PCA háromszögek hasonlóságából következik a fenti tétel. Ekkor d2 – r2 < 0. Tehát egy P
pontnak egy adott körre vonatkozó hatványa pozitív, negatív vagy 0 aszerint, hogy külső pontról, belső pontról vagy a
körön levő pontról van szó.
Ha adott egy O1 középpontú, r1 sugarú k1, valamint egy O2 középpontú, r2 sugarú k2 kör, akkor e két körnek 0, egy vagy
két közös pontja lehet (kivéve természetesen azt az esetet, amikor O1 azonos O2-vel, és a körök sugara is egyenlő; ekkor a két
kör egybeesik, vagyis minden pontjuk közös). Legyen d a két kör középpontjainak a távolsága (5.100a–f ábra).

5.99. ábra
5.100. ábra

- Ha d > r1 + r2, akkor a két körnek nincs közös pontja;


- ha d = r1 + r2, akkor a két kör kívülről érinti egymást;
- ha |r1 – r2| < d < r1 + r2, akkor a két kör két pontban metszi egymást;
- ha d = |r1 – r2|, akkor a két kör belülről érinti egymást;
- ha 0 < d < |r1 – r2|, akkor a két körnek nincs közös pontja, az egyik kör a másik belsejében van;
- ha d = 0, akkor két koncentrikus körünk van.
Ha egy egyenes két különböző körnek is érintője, akkor azt közös érintőnek nevezzük. A közös érintő lehet külső közös
érintő vagy belső közös érintő.
- Ha d > r1 – r2, akkor a két körnek két közös külső és két közös belső érintője van (5.101a ábra);
- ha d = r1 + r2, akkor a két körnek két közös külső és egy közös belső érintője van (5.101b ábra);
- ha |r1 – r2| < d < r1 + r2, akkor a két körnek két közös külső érintője van, közös belső érintője nincs (5.101c ábra);
- ha d = |r1 – r2|, akkor a két körnek egy közös külső érintője van (5.101d ábra).

5.101. ábra

Megjegyzés. Két kör közös érintőinek szerkesztését egy kör egy külső pontból húzott érintőinek szerkesztésére
tudjuk visszavezetni. A közös külső érintő szerkesztésekor először csökkentjük mindkét kör sugarát a kisebb kör r
sugarával. Ekkor a nagyobb kör sugara R – r lesz. E körnek megszerkesztjük a kisebb kör O2 középpontjából húzott
érintőit, majd ezeket az érintőket önmagukra merőlegesen r-rel eltolva megkapjuk a két eredeti kör közös külső
érintőit (5.102a ábra). A közös belső érintő esetében a nagyobb kör sugarát növeljük a kisebb kör r sugarával. Ekkor a
nagyobb kör sugara R + r lesz. E körnek megszerkesztjük a kisebb kör O2 középpontjából az érintőket, majd eltoljuk
ezeket önmagukkal párhuzamosan r-rel, így kapjuk a két eredeti kör közös belső érintőit (5.102b ábra).
Példák
1. Egy tengelyesen szimmetrikus trapéz egyben érintőnégyszög. Párhuzamos oldalai 24 és 16. Mekkora a trapézba
írható kör sugara?

Ha a trapéz érintőnégyszög, akkor szemközti oldalainak összege egyenlő, tehát Mivel a trapéz

szimmetrikus, ezért Írjuk fel az 5.103. ábra CTB derékszögű háromszögére Pitagorasz tételét:
m2 +42 =202, ahonnan

5.102. ábra

A beírható kör sugara az m magasság fele, vagyis


5.103. ábra

2. Két kör sugara R és r, középpontjaik távolsága d. Számítsuk ki a közös külső érintőszakaszuk hosszát!
Legyen a két kör sugara R > r, és képzeljük el, hogy mindkét kör sugarát csökkentjük a kisebbik kör r sugarával.
Ekkor a nagyobb kör sugara R – r lesz, a kisebb kör pedig egy pontba, O2-be megy át (5.104. ábra). A keresett x
szakasz az R – r sugarú kör O2-ből húzott érintőszakasza. Írjuk fel Pitagorasz tételét az O1O2T derékszögű
háromszögre:

Megjegyzés. Érdemes megvizsgálni azt az esetet, amikor a két kör érinti egymást. Ekkor d = (R + r), így ekkor a
közös érintőszakasz:

5.104. ábra

3. Adjuk meg a háromszög a) S súlypontjának és b) M magasságpontjának a köré írható körre vonatkozó hatványát!
a) Elemezzük az 5.105. ábrát!

5.105. ábra

Az S pontnak a köré írható körre vonatkozó H(S) hatványa:

(5.10)

Az F pontnak a köré írható körre vonatkozó H(F) hatványa:

Helyettesítsük x most kapott értékét az (5.10) egyenlőségbe:


(5.11)

A háromszög sa súlyvonaláról kimutattuk:

Ezzel az (5.11) egyenlet így alakul:

b) Tekintsük az 5.106. ábrát, melyen berajzoltuk az MK egyenest (Euler-egyenes). Az MK szakasz K-hoz közelebbi
harmadoló pontja a háromszög S súlypontja.

5.106. ábra

Az M magasságpontnak a köré írható körre vonatkozó H(M) hatványa:

A súlypontra felírhatjuk:

Ezt felhasználva:

A háromszög köré írható körének R sugara:

így azt kapjuk:

A kör kerületének és átmérőjének hányadosát π-vel (a görög kerület = periféria szó kezdőbetűjével) jelöljük. Ennek
megfelelően

az r sugarú kör K kerülete, illetve T területe:

Megjegyzés. A π értékének meghatározásával már az ókorban is sokan foglalkoztak. Kr. e. kb. 2000 évvel

Egyiptomban a kör területére a képletet használták, amit az r2π-vel azonosítva π-re kb. 3,1605 érték

adódik. Ugyanakkor Mezopotámiában a értéket használták. Indiában a π-t -nek vették.


Kínában Liu Huj Kr. u. a III. században a körbe írt szabályos 3072 oldalú szabályos sokszöget vizsgálva arra jutott,
hogy π ≈ 3,141 59. Az ókori görögök közül Arkhimédész is a körbe írt szabályos sokszögekkel közelítette meg π értékét,
és azt találta, hogy 3,1408 < π < 3,1428. A későbbi időkben π-hez egyre gyorsabban közelítő sorokat használtak az
egyre pontosabb érték meghatározásához. A XVIII. században Legendre kimutatta, hogy π irracionális szám, majd
Lindemann 1882-ben igazolta, hogy π transzcendens szám, azaz nem lehet racionális együtthatójú algebrai egyenlet
megoldása. Ez egyben azt is jelenti, hogy a π-t euklideszi úton nem lehet megszerkeszteni.

Az alábbiakban a körrel kapcsolatos speciális négyszögekkel foglalkozunk.

Érintőnégyszög

Egy négyszög érintőnégyszög, ha minden oldala ugyanannak a körnek érintője.

Az érintőnégyszög tehát olyan négyszög, melynek van beírható köre.

Egy konvex négyszög akkor és csak akkor érintőnégyszög, ha szemközti oldalainak összege egyenlő.

Fontos feltétel e tételben a négyszög konvexitása, hiszen pl. a konkáv deltoid szemközti oldalainak összege egyenlő,
mégsem érintőnégyszög.

Megmutatjuk, hogy ha a négyszög érintőnégyszög, akkor szemközti oldalainak összege egyenlő. Tekintsük az 5.107.
ábrát! Ezen az azonos módon jelölt szakaszok egyenlők, hiszen a körhöz egy külső pontból húzott érintőszakaszok
egyenlők. A négyszög szemközti oldalainak összege: x + y + t + s = y + t + s + x.

Érintőnégyszög például a négyzet, a konvex deltoid, a rombusz, de érintőnégyszög az olyan tengelyesen szimmetrikus
trapéz, melynek szára egyenlő a középvonalával. Ugyanakkor általában nem érintőnégyszög a téglalap, a paralelogramma,
a trapéz. Az érintőnégyszög beírható körének középpontja mind a négy csúcshoz tartozó szögfelezőre illeszkedik, ezért az
érintőnégyszög szögfelezői egy pontban metszik egymást.

5.107. ábra

Kerületi és középponti szög, húrnégyszög

A kerületi szög olyan szög, melynek csúcsa a kör kerületén van, szárai pedig egy-egy húrra illeszkednek. Az
érintőszárú kerületi szög olyan szög, melynek csúcsa a kör kerületén van, egyik szára érintő, másik szára pedig egy
húrra illeszkedik.

Az 5.108a ábrán egy α kerületi szöget, az 5.108b ábrán egy γ érintőszárú kerületi szöget látunk. Azt mondjuk, hogy a
kerületi szög az AB íven (vagy az AB húron) nyugszik.

5.108. ábra
A középponti szög olyan szög, melynek csúcsa a kör középpontjában van, szárai egy-egy sugárra illeszkednek.

Az 5.109. ábrán az AB ívhez tartozó (az AB íven nyugvó) β középponti szöget rajzoltunk.

5.109. ábra

Nyilvánvaló, hogy egy kör egy AB ívéhez végtelen sok kerületi szög, de csak egyetlen középponti szög tartozik. Az
azonos ívhez tartozó kerületi és középponti szögek közötti fontos összefüggés a kerületi és középponti szögek tétele.

Azonos íven nyugvó kerületi és középponti szögek közül a középponti szög a kerületi szög kétszerese.

A tétel igazolásához négy esetet kell vizsgálnunk aszerint, hogy a) a középponti szög csúcsa illeszkedik-e a kerületi
szög egyik szárára (5.110a ábra), b) a középponti szög a kerületi szög tartományába esik (5.110b ábra), c) a középponti
szög a kerületi szög tartományán kívül esik (5.110c ábra), illetve d) az érintő szárú kerületi szög esetében (5.110d ábra).
a) Az QPB háromszög egyenlő szárú, hiszen OP és OB egyaránt a kör sugarai. Ezek szerint az OPB háromszög B
csúcsnál levő szöge is α. Az AOB középponti szög a POB háromszög egy külső szöge, így β = 2α.
b) A PO egyenes az α kerületi szöget két szögre, α1-re és α2-re, a β középponti szöget β1-re és β2-re bontja. A POB és
POA háromszögek egyenlő szárú háromszögek, hiszen OA, OB, OP egyaránt kör sugarai. Az APO háromszögnek
β1, a BPO háromszögnek β2 egy-egy külső szöge, ezért β1 = 2α1 és β2 = 2α2. Ekkor a középponti szögre

c) Az AOQ szög – az a) eset miatt – 2γ. Ekkor QOB Z =2y + b. Így – ugyancsak az a) eset miatt – 2γ + β = 2(γ + α) = 2γ + 2α,
ahonnan β = 2α.
d) Az kör O középpontjából a P érintési pontba húzott sugár az érintőre merőleges, ezért

5.110. ábra

Ekkor a β középponti szög az APO egyenlő szárú háromszögből:

A kerületi és középponti szögek tételének egy fontos következménye:

Azonos íven nyugvó kerületi szögek egyenlők.

Ez tehát azt jelenti, hogy az 5.111. ábra valamennyi AB íven nyugvó kerületi szöge ugyanakkora, hiszen mindegyik
egyenlő az AB ívhez tartozó középponti szög felével.
Mindebből az is következik, hogy a sík azon pontjainak a halmaza, melyekből az adott AB szakasz egy α < 90°-os
szögben látszik, két, az AB szakaszra szimmetrikus körív pontjai (5.112. ábra).
E köríveket az AB szakasz α szögű látókörének nevezzük. A látókörök belső pontjaiból az AB szakasz α-nál nagyobb
szögben, a látókörökön kívüli pontokból az AB szakasz α-nál kisebb szögben látszik.

Megjegyzés. Az AB szakasz α szögű látókörét a következőképpen szerkeszthetjük meg: állítsunk egy merőlegest az AB
szakasz egyik végpontjában (pl. A-ban) AB-re, majd a másik végpontban szerkesszük meg a 90° – α hegyesszöget
(5.113. ábra)! A megszerkesztett szögszár és az A-ban emelt merőleges P metszéspontjából az AB szakasz éppen α
szögben látszik. Ezek után már csak az ABP derékszögű háromszög köré írható körét kell megszerkesztenünk.

5.111. ábra

5.112. ábra

5.113. ábra

Húrnégyszögnek nevezzük az olyan négyszöget, melynek minden csúcsa ugyanazon a körön van.

A húrnégyszögek oldalai tehát ugyanannak a körnek a húrjai, vagyis a húrnégyszög olyan négyszög, melynek van köré
írható köre. Ebből következik, hogy a húrnégyszög oldalfelező merőlegesei egy pontban metszik egymást. Ez egyben azt is
jelenti, hogy minden húrnégyszög konvex. Húrnégyszög pl. a négyzet, a téglalap, a tengelyesen szimmetrikus trapéz, a
derékszögű deltoid stb. Az azonos íven nyugvó kerületi szögek tételéből az is következik, hogy ha egy négyszög valamely
oldala a másik két csúcsból ugyanakkora szögben látszik, akkor e négyszög húrnégyszög.

Egy négyszög akkor és csak akkor húrnégyszög, ha szemközti szögeinek összege 180°.

Ha tehát egy négyszög húrnégyszög, akkor szemközti szögeinek összege 180°, illetve ha egy négyszög szemközti
szögeinek összege 180°, akkor e négyszög húrnégyszög. Igazoljuk az állítás első részét, tekintsük az 5.114. ábrát!
5.114. ábra

Ha ABC∠ = β, akkor a kerületi és középponti szögek tétele alapján AOC∠ = 2β. Ekkor az AOC homorúszög 360° – 2β. De
ez a szög az AC íven nyugvó kerületi szög, így

Megjegyzés. A húrnégyszögek fontos és hasznos tulajdonságáról szól Ptolemaiosz tétele.

A húrnégyszög szemközti oldalai szorzatának összege egyenlő az átlók szorzatával.

Az 5.115. ábra jelöléseivel e tétel azt mondja ki, hogy AB·CD + BC·AD = AC·BD.
Húzzunk a húrnégyszög valamely csúcsából a vele nem érintkező átlóhoz egy szakaszt úgy (ábránkon ez a DE
szakasz), hogy a keletkező ADE szög egyenlő legyen a BDC szöggel (az valamelyik csúcsból mindig megtehető, kivéve,
ha a húrnégyszög négyzet; ekkor viszont a tétel állítása nyilvánvaló). Az AED és BCD háromszögek hasonlók, hiszen
az EAD és DBC szögek azonos íven nyugvó kerületi szögek, tehát egyenlők. Így írhatjuk:

(5.12)

5.115. ábra

Az ABD és ECD háromszögek is hasonlók, tehát

(5.13)

Az (5.12) és (5.13) egyenleteket összeadva azt kapjuk:

A húrnégyszög területével kapcsolatos Brahmagupta képlete. Eszerint, ha egy húrnégyszög oldalai a, b, c és d, a


kerületének a fele s, akkor e húrnégyszög T területe:
Példák
1. Az ABC háromszög szögei 46°, 80° és 54°. A háromszög szögfelezői a köré írható kört A′, B′ és C′ pontokban
metszik. Számítsuk ki az A′B′C′ háromszög szögeit!
Az azonos íven nyugvó kerületi szögek tételéből következnek az alábbi egyenlőségek (5.116. ábra):

5.116. ábra

tehát az A′B′C háromszög B′-nél levő szöge 27° + 23° = 50°. Hasonlóképpen kapjuk, hogy az A′ csúcsnál levő szög 40°
+ 27° = 67°, a C′ csúcsnál levő szög pedig 40° + 23° = 63°.
2. Egy kör egy AB átmérőjének B-n túli meghosszabbításán felvettünk egy E pontot, majd E-ben az AB egyenesre
állított merőlegesen egy tetszőleges D pontot. A D-t A-val összekötő szakasz a kört P-ben metszi. Igazoljuk, hogy a
BEDP négyszög húrnégyszög! Tekintsük az 5.117. ábrát!

5.117. ábra

Mivel AB a körnek átmérője, ezért Thalész tétele értelmében a P csúcsnál derékszög van: BPD ∠ = 90°. Ezek szerint
a BEDP négyszög két szemközti szögének összege 180°, tehát e négyszög valóban húrnégyszög.
3. Igazoljuk, hogy a hegyesszögű háromszög M magasságpontját valamely oldalra tükrözve a tükörkép illeszkedik a
háromszög köré írható körére! Tekintsük az 5.118. ábrát, melyen a háromszög A csúcsnál levő szögét α-val, az M
magasságpontnak a BC oldalra vonatkozó tükörképét M*-gal jelöltük.

5.118. ábra

Az ATMP négyszög húrnégyszög, hiszen két szemközti szöge derékszög. Ezért

A tengelyes tükrözés miatt BMC ∠ = BM*C ∠ = 180° – α. Azt kaptuk, hogy az ABM*C négyszög két szemközti
szögének összege 180°, így ez a négyszög húrnégyszög. Ebből viszont következik, hogy az M* pontnak rajta kell
lennie az ABC háromszög köré írható körén.
4. Az ABC hegyesszögű háromszög A-ból és C-ből induló magasságainak talppontja P és Q, a háromszög
magasságpontja M, köré írható körének középpontja K. Igazoljuk, hogy a PQ szakasz merőleges a KB szakaszra!
Készítsük el a szükséges ábrát (5.119. ábra)!

5.119. ábra

Az AQPC négyszög húrnégyszög, hiszen – Thalész tétele miatt – az AC oldal P-ből és Q-ból is derékszögben látszik.
Ekkor viszont QPC ∠ = 180° – α, vagyis QPB ∠ = α. Az azonos íven nyugvó kerületi és középponti szögek tétele
miatt BKC ∠ = 2α. Ezt a szöget a BC oldal felező merőlegese felezi, így BKF ∠ = α. Ebből következik, hogy a BKF
derékszögű háromszögben KBF ∠ = 90° – α. Mivel QPB ∠ = α és KBF ∠ = 90° – α, ezért a BK és PQ szakaszok valóban
merőlegesek egymásra.
5. Az ABCD húrnégyszög átlói M-ben merőlegesen metszik egymást. M-ből a húrnégyszög oldalaira állított
merőlegesek talppontjai P, Q, R, S. Igazoljuk, hogy a PQRS négyszög húrnégyszög és egyben érintőnégyszög is!
Legyen CAD ∠ = CBD ∠ = α és ACB ∠ = ADB ∠ = β (5.120. ábra).

5.120. ábra

Az AQMP négyszög húrnégyszög, hiszen két szemközti szöge (P-nél és Q-nál) derékszög, ezért az azonos íven
nyugvó kerületi szögek egyenlősége miatt PQM ∠ = α. Az MQBR négyszög ugyancsak húrnégyszög, mert Q-nál és
R-nél derékszöge van, így MQR ∠ = α. Tehát a PQRS négyszög Q-nál levő szöge 2α. Hasonlóképpen: PMSD
húrnégyszög, ezért MSP ∠ = β, és MRCS szintén húrnégyszög, tehát MSR ∠ = β, vagyis a PQRS négyszög S-nél levő
szöge 2β. E négyszög két szemközti szögének összege 2α + 2β. Mivel az ABCD húrnégyszög átlói merőlegesek
egymásra, ezért α + β = 90°, tehát 2α + 2β = 180°, ami éppen azt jelenti, hogy a PQRS négyszög húrnégyszög.
Az eddigi bizonyítás során láttuk, hogy QM a PQR szög felezője, SM pedig a PSR szög felezője. (Nyilván ugyanerre
a következtetésre jutunk a PM és RM szakaszokat illetően is.) Ezek szerint a PQRS négyszög szögfelezői egy
pontban metszik egymást, ami azt jelenti, hogy e húrnégyszög egyben érintőnégyszög is.

5.8. Geometriai szerkesztések, speciális szerkesztések

Az euklideszi szerkesztés
Alapszerkesztések
Speciális szerkesztések

Az euklideszi szerkesztés
A geometriai alakzatok megrajzolása (szerkesztése) elvégezhető bizonyos – egymásnak ellent nem mondó – adatok
ismeretében. A szekesztéshez két eszközt használhatunk: vonalzót (mely tetszőlegesen hosszú egyenes rajzolását teszi
lehetővé) és körzőt (melyet tetszőlegesen nagy nyílással használhatunk).
A szerkesztések elvégzésekor az alábbi lépések megengedhetők:

1. Két adott ponthoz illesztve vonalzónkat, megrajzolhatjuk e két ponton átmenő egyenest.
2. Két adott pont távolságát körzőnyílásba vehetjük.
3. Adott pont köré, adott körzőnyílással kört rajzolhatunk.
4. Két, egymást metsző egyenes metszéspontját kijelölhetjük.
5. Egy kör és e kört metsző egyenes metszéspontjait kijelölhetjük.
6. Két egymást két pontban metsző kör metszéspontjait kijelölhetjük.
Az olyan szerkesztési eljárást, mely csak ezeket a lépéseket engedi meg, euklideszi szerkesztésnek mondjuk.

Egy alakzatot euklideszi értelemben megszerkeszthetőnek mondunk, ha e hat lépés véges sokszori alkalmazásával
eljuthatunk az alakzatnak a feltételeket kielégítő képéhez.

Megjegyzés. Természetesen nem minden alakzat szerkeszthető meg a fenti hat lépés véges sokszori alkalmazásával.
Erre jó példák az alábbi ókori görög problémák: a kör négyszögesítése, amikor az a kérdés, hogyan lehetne egy adott
körrel egyenlő területű négyzetet szerkeszteni, a szögharmadolás, amikor egy adott szöget szerkesztéssel három
egyenlő részre kellene osztani, kockakettőzés, amikor adott egy kocka éle, s meg kell szerkeszteni egy olyan kocka
élét, melynek térfogata az eredeti kocka térfogatának a kétszerese. Ezek a több ezer éves kérdések – ma már tudjuk –
euklideszi szerkesztéssel nem megoldható kérdések (e problémák nem euklideszi módon történő szerkesztésével e
fejezet végén részletesebben foglalkozunk).

A szerkesztési feladatok megoldása során általában célszerű a már késznek gondolt ábrából kiindulni úgy, hogy
ábránkon az adatok vagy az azokból nyerhető menynyiségek szerepeljenek. Magát a szerkesztést az ábra elemzésével
kezdjük. Ilyenkor geometriai fogalmakra, tételekre épülő kapcsolatokat, összefüggéseket keresünk, melyek segítségével
eljuthatunk az ábra hiányzó elemeinek megszerkesztéséhez. A szerkesztési feladatok általában nagyobb elmélyülést, a
geometriai ismereteink megfelelő mozgósítása révén kellő kreativitást igényelnek, ezért az ilyen feladatok megoldásának
sikeres elsajátításakor fontos betartanunk a fokozatosság elvét.
A szerkesztés befejezése után meg kell vizsgálnunk, hogy a kapott ábránk teljesíti-e a feltételeket, illetve hogy van-e a
feltételeknek megfelelő több megoldása is a problémának. (Általában az egybevágó alakzatokat nem tekintjük különböző
megoldásnak.) Ha nem konkrét számértékekkel adottak a feladat feltételei, hanem adottnak tekintendő mennyiségekkel
(paraméteres adatokkal) dolgozunk, akkor szükséges azt is megvizsgálni, hogy a paraméterek változtatásával hogyan
változik a megoldások száma, illetve lehetnek-e olyan értékei a paramétereknek, melyek esetében nincs megoldása a
feladatnak. Ezt a műveletet diszkussziónak (esetvizsgálat) nevezzük.

Alapszerkesztések
1. Adott egyenes egy adott pontjában az egyenesre merőleges szerkesztése. Az adott P pontba beszúrjuk körzőnket,
tetszőleges körzőnyílással mindkét irányban elmetszük az egyenest egy A, illetve egy B pontban (5.121. ábra).

5.121. ábra

Ezután A körül is és B körül is egy-egy körívet rajzolunk ugyanakkora sugárral, mely az AB távolság felénél nagyobb. E
két körív egy M pontban metszi egymást, a keresett merőleges a PM egyenes.
2. Adott pontból adott egyenesre merőleges egyenes szerkesztése. Az adott P pont körül körívet rajzolunk, melynek
sugara a pont és egyenes távolságánál nagyobb. Ez a körív az egyenest két pontban (A-ban és B-ben) metszi (5.122. ábra).
Ezután A és B körül egy-egy körívet rajzolunk, melynek sugara az AB távolság felénél nagyobb. E körívek M-ben
metszik egymást. A keresett merőleges egyenes a PM egyenes.
3. Szakaszfelező merőleges szerkesztése. Az AB szakasz mindkét végpontja körül egy-egy körívet rajzolunk, melyek
sugara az AB távolság felénél nagyobb (5.123. ábra).
E két körív P-ben és Q-ban metszi egymást. Az AB szakasz felező merőlegese a PQ egyenes.
5.122. ábra

5.123. ábra

4. Szögfelező szerkesztése. A szög O csúcsa körül körívet rajzolunk, mely a szögszárakat A-ban és B-ben metszi (5.124.
ábra).

5.124. ábra

Ezután A és B körül egy-egy körívet rajzolunk, melynek sugara az AB távolság felénél nagyobb. E két körív M
metszéspontját O-val összekötő egyenes lesz a szög felezője.
5. Adott ponton át adott egyenessel párhuzamos egyenes szerkesztése. A 2. pontban leírtak szerint az adott P pontból m
merőleges egyenest szerkesztünk az adott e egyenesre, majd az 1. pontban leírtak szerint P-ben merőlegest szerkesztünk az
előbb szerkesztett m egyenesre. Az így nyert egyenes lesz a P ponton átmenő, e-vel párhuzamos egyenes (5.125. ábra).

5.125. ábra

6. Adott szög másolása adott félegyenes végpontjában. Az adott szög O csúcsa körül körívet rajzolunk, mely a szög
szárait A-ban és B-ben metszi. Ezután az adott félegyenes E végpontja körül ugyanolyan sugárral szintén körívet rajzolunk,
mely a félegyenest M-ben metszi (5.126. ábra).

5.126. ábra
Az AB távolságot körzőnyílásba vesszük, és ekkora nyílással M körül körívet rajzolunk, mely az E körül rajzolt körívet
N-ben metszi. Ekkor az MEN szög egyenlő a másolandó AOB szöggel.
7. Háromszög szerkesztése a három oldal ismeretében. Az adott három oldal (a, b és c) egyikét (pl. c-t) felvesszük,
végpontjai legyenek A és B. Ezután A körül b sugarú, B körül a sugarú körívet rajzolunk. Ezek C metszéspontja lesz a
háromszög harmadik csúcsa (5.127. ábra).

5.127. ábra

Természetesen a szerkeszthetőség szükséges (és elégséges) feltétele, hogy az adott oldalak teljesítsék a háromszög-
egyenlőtlenséget.
8. Háromszög szerkesztése két oldal és a közbezárt szög ismeretében. Felvesszük a háromszög két ismert oldala (a és c)
közül az egyiket (pl. BC = a-t), majd e szakasz egyik végpontjába (pl. B-be) felmásoljuk az adott β szöget (5.128. ábra). A
keletkezett szögszárra B-ből kiindulva felmérjük az adott BA = c szakaszt, így eljutunk a keresett ABC háromszöghöz.

5.128. ábra

9. Adott a szakasz és az egységnyi hosszúságú szakasz ismeretében az a szakasz négyzetének, illetve az a szakasz
reciprokának megszerkesztése. Az a szakasz négyzetének és reciprokának szerkesztéséhez a párhuzamos szelők tételét
használhatjuk. Vegyünk fel egy O csúcspontú szöget, majd egyik szárára mérjük fel az egységnyi szakaszt és közvetlenül
mellé az a hosszúságú szakaszt; a másik szögszárra mérjük fel O-ból kiindulva az a szakaszt (5.129a ábra)!
Az 5.129a ábra A és B pontjait összekötjük, majd C-n keresztül párhuzamost szerkesztünk AB-vel, így jutunk az x=BX
szakaszhoz. A párhuzamos szelők tétele alapján

Az 5.129b ábrán az egyik szögszárra először az a hosszúságú szakaszt, majd közvetlenül mellé az egységnyi szakaszt
mértük fel, a másik szögszárra O-ból kiindulva az egységnyi szakaszt. A P és Q pontokat összekötjük, majd az R ponton
keresztül PQ-val párhuzamost szerkesztünk, így jutunk el az Y ponthoz. A párhuzamos szelők tétele alapján

5.129. ábra

10. Adott szakasz n egyenlő részre bontása. Az adott AB szakasz egyik végpontjából (pl. A-ból) indítunk egy félegyenest,
majd erre A-ból indulva felmérünk n-szer egy tetszőlegesen választott hosszúságú szakaszt (5.130. ábra, ahol n = 6).
Az utolsó szakasz végpontját összekötjük B-vel, majd a félegyenes egyes osztópontjain keresztül ezzel a szakasszal
párhuzamosokat szerkesztünk. A párhuzamos szelők tételből következik, hogy e párhuzamosok az eredeti AB szakaszt n
egyenlő részre bontják.
5.130. ábra

11. Két adott szakasz számtani közepének szerkesztése. A két adott szakaszt (AB-t és CD-t) közvetlenül egymás mellé
mérjük, majd az így kapott AB + CD = AD szakaszt megfelezzük a 3. pontban leírtak szerint, így kapjuk az AB és CD
szakaszok számtani közepét (5.131. ábra).

5.131. ábra

12. Két adott szakasz mértani közepének szerkesztése. Mérjük fel közvetlenül egymás mellé az adott AB = a és CD = b
hosszúságú szakaszokat, majd szerkesszük meg a kapott AB + CD = AD szakasz Thalész-körét (5.132. ábra).

5.132. ábra

A B pontból AD-re állított merőleges a Thalész-kört P-ben metszi. Thalész tétele miatt az APB háromszögnek P-nél
derékszöge van. A magasságtétel szerint e háromszög átfogóhoz tartozó magassága éppen az adott a és b szakaszok mértani
közepe.

Megjegyzés. Érdemes észrevenni, hogy az alapszerkesztések felhasználásával bármely szöget, melynek fokokban vett
mérőszáma 3-mal osztható egész szám, meg tudunk szerkeszteni. Ugyanis 60°-ot könnyen szerkeszthetünk. Az 5.6.
fejezetben leírtak szerint 72°-os szöget is szerkeszthetünk, továbbá tudunk szöget felezni, másolni, így két szög
összegét és különbségét is megszerkeszthetjük. Ha szerkesztünk egy 72°-os szöget, majd azt megfelezzük, 36°-os
szöget kapunk. Ha e 36°-os szögből levonjuk a 60°-os szög felezésével adódó 30°-os szöget, akkor 6°-os szög adódik.
Végül e 6°-os szöget megfelezve 3°-os szöget kapunk, ennek pedig tetszőleges egész számszorosát már könnyen
megkaphatjuk. (Ha lehetne euklideszi szerkesztéssel szöget harmadolni, akkor ezek szerint az 1°-os szög is, tehát
bármilyen, fokokban mérve egész fokú szög megszerkeszthető lenne.)
Példák. Az alábbi feladatokban általános szerkesztési eljárások, ötletek, módszerek kerülnek bemutatásra. Az egyes
feladatokra általában többféle megoldás is adható, mi – helyszűke miatt – csak egy és nem is feltétlenül a
legkézenfekvőbb megoldást adjuk meg. Ahol szükséges, diszkutáljuk is a megoldást.
1. Szerkesztendő háromszög, ha adott egy oldala a, a szemközti szöge α, valamint az oldalhoz tartozó magassága ma.
Vegyünk fel egy e egyenest, és jelöljük ki rajta az adott a = BC oldalt! Ezután szerkeszszük meg az a szakasz α szögű
látókörét! Szerkesszünk egy e egyenessel párhuzamos f egyenest tőle adott ma távolságban (5.133. ábra)!

5.133. ábra

Az f egyenesnek a látókörrel 0, 1 vagy 2 közös pontja van. (Ábránkon két közös pont van: P1 és P2.) Ha nincs közös
pont, akkor a feladatnak nincs megoldása. Ha az f egyenes érinti a látókört, akkor egy db egyenlő szárú
háromszög a megoldás. Ha két metszéspont adódik, akkor a feltételeknek eleget tevő háromszögek az BCP1, illetve
BCP2 egybevágó háromszögek. (Ezeket az egybevágó háromszögeket nem tekintjük lényegesen különböző
megoldásnak.)
2. Szerkesztendő egyenlő szárú háromszög, ha adott az alaphoz tartozó ma magassága és adott a K kerülete.
Vegyük fel az adott K = PQ szakaszt, majd annak T felezőpontjában állítsunk e szakaszra egy ma = TC merőlegest
(5.134. ábra)!

5.134. ábra

Ha ma , akkor a CQ, illetve CP szakaszok felező merőlegesei a PQ szakaszt B-ben, illetve A-ban metszik.
Mivel CB = BQ és CA = AP, ezért PA + AB + BQ = CA+ AB + BQ, vagyis a feltételeknek eleget tevő háromszög az ABC

egyenlő szárú háromszög. A feladatnak akkor és csak akkor van megoldása, ha ma .


3. Szerkesztendő háromszög, ha adott egy oldala a, szemközti szöge α, és adott a háromszög K kerülete. Kezdjük a
szerkesztést egy kész ábra készítésével és elemzésével (5.135a ábra)! Ha a kerületből „levonjuk” az adott α szakaszt,
akkor megkapjuk a másik két oldal, b + c összegét.

5.135. ábra

Hosszabbítsuk meg a háromszög BA oldalát A-n túl az AE = b szakasszal. Ekkor az EAC háromszög egyenlő szárú,

az E csúcsnál levő szöge pedig . Ezek szerint az E pontnak rajta kell lennie az a oldal szögű látókörén.

Ezzel megvan a szerkesztés menete: szerkesszük meg az a oldal α szögű és szögű látókörét, majd ez utóbbi

látókört B körül, rajzoljunk egy b + c sugarú körívet (5.135b ábra). Ahol ez a körív metszi az szögű látókört, ott
lesz a háromszög keresett harmadik csúcsa. Természetesen a szerkeszthetőség feltétele, hogy a < b + c, továbbá,

hogy b + c kisebb legyen az szögű látókör átmérőjénél.


4. Adott a síkon három pont: A, S és O. Az A pont egy háromszög egyik csúcspontja, S a háromszög súlypontja, O
pedig a háromszög köré írt körének a középpontja. Szerkesztendő a háromszög.
Tekintsük késznek a szerkesztést; vegyünk fel egy ABC háromszöget, a köré írható körét, valamint annak S
súlypontját, majd elemezzük az ábrát (5.136. ábra)!
Mivel a súlypont a súlyvonal csúcstól távolabbi harmadoló pontja, ezért az AS szakasz F felezőpontjának S-re
vonatkozó A1 tükörképe az A csúccsal szemközti oldal felezőpontja. Az OA1 szakasz illeszkedik a BC oldal felező
merőlegesére. Ezek a megfontolások már mutatják a szerkesztés menetét. Először megrajzoljuk az O középpontú,
OA sugarú kört. Az AS szakasz F pontját tükrözzük S-re, majd a kapott A1 pontban merőlegest állítunk az OA1
szakaszra; e merőleges a kört a háromszög hiányzó csúcsaiban, B-ben és C-ben metszik. A feladatnak akkor van
megoldása, ha S is és A1 is a köré írható kör belső pontja. (Érdekes eset, ha S pont az AO szakasz O-hoz közelebbi
harmadoló pontja: ekkor A1 azonos O-val; így ebben az esetben minden az A pontot nem tartalmazó átmérő
megoldás, vagyis akkor végtelen sok – derékszögű – háromszög megfelel a feltételeknek.)

5.136. ábra
Speciális szerkesztések
Valamikor a Kr. e. V. században keletkezett a három híres görög szerkesztési probléma, mely hosszú évszázadokon
keresztül tartotta lázban a szakembereket és laikusokat egyaránt.
Ezek a következők: 1. A kockakettőzés, azaz lehet-e körzővel és vonalzóval egy adott kockához kétszer akkora térfogatú
kocka élét megszerkeszteni. 2. A szögharmadolás, azaz lehet-e körzővel és vonalzóval egy tetszőlegesen adott szög
harmadát megszerkeszteni. 3. A kör négyszögesítése, azaz lehet-e körzővel és vonalzóval egy körhöz vele azonos területű
négyzetet szerkeszteni. (Természetesen mindhárom esetben „szerkesztésen” az euklideszi szerkesztési lépések használatát
értjük.) Ma már tudjuk, hogy e problémákat euklideszi úton nem lehet megoldani. De sok évszázadnak kellett eltelnie
ahhoz, hogy mindez kiderüljön, s ez idő alatt a sok-sok kísérlet, kutatás, próbálkozás nagymértékben
„megtermékenyítette” a matematika tudományát, számos új eredmény, algebrai és geometriai tétel megszületése volt
köszönhető e három görög problémakörnek.
A három probléma közül most kettőt: a kör négyszögesítését, illetve a szögharmadolást mint speciális szerkesztéseket
vizsgáljuk részletesebben.

A kör négyszögesítése
Szögharmadolás
Egyéb speciális szerkesztések

A kör négyszögesítése
A kör négyszögesítésének fő akadálya a π számnak körzővel való megszerkesztésében rejlik. Legyen ugyanis valamely kör
sugara 1. Ekkor ennek területe 12 · π. Ha valamely a oldalú négyzet területe megegyezik e kör területével, akkor

Ha a π szakaszt meg tudjuk szerkeszteni, akkor már nem okozhat problémát, hiszen a Thalész-tétel és a
befogótétel segítségével (5.137. ábra) azonnal adódik.

5.137. ábra

A π hosszúságú szakasz megszerkesztésére számos kísérlet született az évszázadok során, mindaddig, míg Evariste
Galois (1811–1832) francia matematikusnak, a modern algebra megteremtőjének kutatásai alapján be nem bizonyosodott,
hogy ez a szám euklideszi módon nem szerkeszthető meg.

A π hosszúságú szakasz megszerkesztésére vonatkozó kísérletek közül tán legérdekesebb a XVII. század második
felében élt lengyel származású matematikus, Kochanski eljárása.
Vegyünk egy egységnyi sugarú, O középpontú kört! Rajzoljuk meg e kör AB átmérőjét, majd rajzoljuk meg a kör B-
beli érintőjét! Ezután húzzuk be a BC = 1 húrt! E húr felező merőlegese az előbbi érintőt P-ben metszi. Legvégül P-ből
kiindulva mérjük fel az ábrán látható módon a PK = 3 szakaszt (5.138. ábra)!
Mivel az OBC háromszög szabályos háromszög, és OB = 1, ezért

Így az AKB derékszögű háromszögre felírva Pitagorasz tételét:


5.138. ábra

innen pedig

Ez az érték pedig csupán az ötödik tizedesjegytől kezdve tér el π valóságos értékétől.

Szögharmadolás
Hogy miként vetődött föl egy adott szög három egyenlő részre osztásának kérdése, nem tudható, bár mindenképpen
gyelemre méltó, hogy ha e szerkesztési eljárás elvégezhető lenne, akkor akárhány (egész számú) fokos szög euklideszi úton
megszerkeszthető lenne. Ennek az az oka, hogy az aranymetszés ismeretében (amit természetesen már a görögök is
ismertek) a 36°-os szög könnyen megszerkeszthető euklideszi úton. Ekkor annak fele, a 18° is megszerkeszthető. Mivel a 60°-
os szöget kétszer megfelezve eljuthatunk az 15°-os szöghöz, így a 18° és a 15° különbségeként megkaphatjuk a 3°-os szöget. Ha
pedig tudnánk szöget harmadolni, akkor a 3°-os szög harmadolásával eljuthatnánk az 1°-os szöghöz, így már valóban
akárhány (egész számú) fokos szög euklideszi úton megszerkeszthető lenne.

A szögharmadolás kérdésében a kutatásokat kezdetben semmiféle siker nem koronázta, mindaddig, míg az ókor
matematikusai ki nem találtak mindenféle segédeszközöket, melyek már lehetővé tették tetszőleges szög
harmadolását. (Természetesen ezzel eltértek az euklideszi szerkesztés megengedhető lépéseitől.) Az első komolyabb
sikert e téren Arkhimédész (Kr. e. III. század) érte el. Ha – Arkhimédész javaslatára – pluszként megengedünk egy
olyan vonalzót, melyen egy előre kijelölt adott szakaszt is felhasználhatunk, akkor a kérdéses szerkesztés már
elvégezhető. Ennek az adott szakasznak a felhasználása úgy értendő, hogy a vonalzón kijelölt szakasz két végpontját
illeszthetjük egy-egy görbére (pl. egy-egy egyenesre vagy egy egyenesre és egy körre) úgy, hogy eközben vonalzónk
áthaladjon egy adott ponton.
Az 5.139. ábrán az O csúcspontú α szöget akarjuk harmadolni, felhasználva ehhez egy olyan vonalzót, melyen egy r
hosszúságú szakaszt előre kijelöltünk. Rajzoljunk O körül egy r sugarú félkört, és hosszabbítsuk meg az egyik
szögszárat! Ezután helyezzük el az r szakaszt tartalmazó vonalzónkat úgy, hogy a szakasz egyik végpontja (P) a
meghosszabbított szögszárra, másik végpontja (Q) a körre illeszkedjen, és a PQ egyenes illeszkedjen az M pontra!
Mivel PQO egyenlő szárú háromszög, ezért QOP ∠ = β. Ekkor az MQO ∠ a PQO háromszögnek egy külső szöge, tehát
MQO ∠ = 2β. Az MQO háromszög ugyancsak egyenlő szárú, így QMO ∠ = MQO ∠ = 2β. Mivel a harmadolandó α szög
az MPO háromszögnek külső szöge, ezért

Az eljárás valóban szellemes, de sajnos az euklideszi szerkesztés nem engedi meg az Arkhimédész által javasolt
„vonalzó” használatát.

5.139. ábra

A matematikai kutatások során a XIX. században bebizonyosodott, hogy egy d racionális számmal jelzett szakaszból
csak a racionális számok, valamint a belőlük a négy alapművelettel és négyzetgyökvonással véges számú lépésben nyert
számok, illetve az ezeknek megfelelő hosszúságú szakaszok szerkeszthetők meg euklideszi szerkesztéssel.
Egyéb speciális szerkesztések
Gyakori speciális szerkesztések az olyan szerkesztési feladatok, amikor a megszerkesztendő objektumhoz a megengedett
két eszköz (körző, vonalzó) közül csak az egyiket használhatjuk. E fejezet zárásaként erre is mutatunk néhány példát.

Példák
1. Adott egy k kör, ennek egy átmérő e egyenese, valamint a körön kívül egy P pont. Szerkesztendő a P ponton
átmenő, e-re merőleges egyenes úgy, hogy a szerkesztéshez csak vonalzót használhatunk.
Legyen A és B az e egyenes és a k kör két metszéspontja (5.140. ábra). A P-t A-val, illetve B-vel összekötő egyenesek
a k kört R-ben, illetve Q-ban metszik.
Legyen M az AQ és RB egyenesek metszéspontja. Thalész tétele miatt ARB ∠ = AQB ∠ = 90°. Ebből következik,
hogy az APM háromszögnek MR és PQ egy-egy magasságvonala, vagyis a B pont e háromszög magasságpontja. De
ha az APM háromszögnek B a magasságpontja, akkor az e egyenes szintén magasságvonal, vagyis az e egyenes
merőleges PM-re.

5.140. ábra

2. Adott két pont: A és B. Szerkesztendők a C és D pontok úgy, hogy ABCD négyzet legyen (A és B szomszédos
csúcsok), és a szerkesztéshez csak körzőt használhatunk.
Vegyük egységnyinek az A és B pontok távolságát, és rajzoljunk A körül és B körül egy-egy AB sugarú kört! Mivel a
kör egy pontjából kiindulva a kör sugarát a körívre pontosan hatszor mérhetjük fel, ezért A-ból, illetve B-ből
kiindulva, a körívekre a sugarat háromszor-háromszor felmérve az A pont B-re vonatkozó A′, illetve a B pont A-ra
vonatkozó B′ képét kapjuk. Ezek után rajzoljunk A′ és B′ körül egy-egy 2 sugarú kört; ezek egyik metszéspontja
legyen P (5.141. ábra)!

5.141. ábra

Az A′PT derékszögű háromszög A′P átfogója 2, A′T befogója Pitagorasz tétele alapján

Az ATP háromszögre felírva Pitagorasz tételét azt kapjuk:

Arra jutottunk, hogy az AP szakasz egyenlő az AB oldalú négyzet átlójával. Ezek szerint, ha A és B körül rajzolunk
egy-egy AP sugarú kört, akkor ezek a meglévő köröket éppen a keresett C és D pontokban fogják metszeni.
3. Adott egy egyenes és egy vele párhuzamos AB szakasz. Szerkesztendő az AB szakasz felezőpontja úgy, hogy a
szerkesztéshez csak vonalzót használhatunk. A szerkesztéshez azt használjuk fel, hogy ha egy trapéz átlóinak M
metszéspontján keresztül párhuzamost húzunk a trapéz alapjaival, akkor e párhuzamosnak a szárak közé eső
darabját az M pont felezi (5.142. ábra).

5.142. ábra

Az ABM és CDM háromszögek hasonlók, a hasonlóság aránya , így ha AM=x, akkor Az AME és
ACD háromszögek is hasonlók, vagyis

Teljesen hasonlóan kapjuk, hogy , vagyis ME = MF.


Ezek után a szerkesztést az alábbi módon végezhetjük el: vegyünk fel egy tetszőleges P pontot az adott AB
szakasznak a vele párhuzamos e egyenes ellentétes oldalán; P-t kössük össze A-val és B-vel, majd a keletkező
QRAB trapéznak rajzoljuk meg az átlóit (5.143. ábra)!
Az átlók M metszéspontját P-vel összekötő szakasz és az AB szakasz F metszéspontja – a párhuzamos
szelőszakaszokról szóló tétel miatt – az AB szakasznak éppen a felezőpontja.
4. Adott két pont: A és B. Szerkesztendő az AB szakasz F felezőpontja úgy, hogy a szerkesztéshez csak körző
használható.
A szerkesztést kezdjük úgy, mint a 3. feladat esetében: A és B körül rajzoljunk egy-egy AB = 1 sugarú kört, majd A-t
B-re, B-t A-ra tükrözve eljutunk az A′ és B′ pontokhoz. Ezután rajzoljunk A′ körül egy AA′ = 2 sugarú kört, mely az
A középpontú kört P-ben és Q-ban metszi (5.144. ábra).

5.143. ábra

5.144. ábra

Az APA′ egyenlő szárú háromszög oldalai 1, 2, 2. Legyen F a P és Q pontok körül rajzolt egységnyi sugarú körök
metszéspontja. Az F pont illeszkedik az AA′ egyenesre. Az APF háromszög szintén egyenlő szárú, melynek szárai
AP = PF = 1 hosszúak. Mivel az APF egyenlő szárú háromszög és a PAA′ egyenlő szárú háromszög alapon fekvő
szögei egyenlők (PAF ∠ = PAA′ ∠), ezért e két háromszög hasonló, és a hasonlóság aránya 1:2. Ez viszont azt jelenti,

hogy , vagyis az F pont éppen az AB szakasz felezőpontja.


6. A tér elemi geometriája
6.1. Alapfogalmak
6.2. Poliéderek
6.3. Görbe felületű testek
6.4. Henger és kúp síkmetszetei

6.1. Alapfogalmak
Ebben a fejezetben a tér elemi geometriai vizsgálatával foglalkozunk. Egyenesek, síkok viszonylagos helyzetét, térelemek
távolságát, hajlásszögét vizsgáljuk. A tér, a sík, az egyenes és a pont fogalmakat nem de niáljuk, azokat a szemléletből
elfogadjuk, ahogyan azt tettük a sík elemi geometriai tárgyalásánál is. Ugyancsak elfogadjuk szemléletből az „illeszkedés”
fogalmát.
Pont és egyenes, valamint pont és sík viszonylagos helyzete egyszerűen tárgyalható, hiszen a pont vagy illeszkedik az
egyenesre (síkra), vagy nem. Ha egy pont nem illeszkedik egy egyenesre, akkor együtt egyetlen síkot határoznak meg.
Két egyenes viszonylagos helyzete háromféle lehet:
a) A két egyenes egy síkban van, de nincs közös pontjuk. Ekkor a két egyenest párhuzamosnak mondjuk. A tér bármely két
párhuzamos egyenese egyértelműen meghatároz egy síkot (6.1. ábra).

6.1. ábra

b) A két egyenes egy síkban van, és van egy közös pontjuk. Az ilyen egyeneseket metsző egyeneseknek nevezzük (6.2. ábra).
Bármely két metsző egyenes egyértelműen meghatároz egy síkot.

6.2. ábra

c) A két egyenes nincs egy síkban. Az ilyen egyeneseket kitérő egyeneseknek nevezzük (6.3. ábra).

6.3. ábra

Általában két egyenesnek 0 vagy 1 közös pontja lehet (esetleg végtelen sok közös pontjuk van; ekkor természetesen
minden pontjuk közös és a két egyenes egybeesik).
Egyenes és sík esetében (ha a sík nem tartalmazza az egyenest) két eset lehetséges:
a) Az egyenesnek nincs közös pontja a síkkal. Ekkor az egyenes párhuzamos a síkkal (6.4. ábra).

6.4. ábra

b) Az egyenesnek és a síknak egy közös pontja van. Ekkor azt mondjuk, hogy az egyenes dö (metszi) a síkot (6.5. ábra).
6.5. ábra

Egy síknak és egy egyenesnek tehát 0, 1 vagy végtelen sok közös pontja van (utóbbi esetben a sík tartalmazza az
egyenest, azaz annak minden pontját).
Két sík vagy párhuzamos helyzetű (6.6. ábra), ekkor e két síknak nincs közös pontja, vagy nem párhuzamosak, ekkor a
két síknak végtelen sok közös pontja van, mely pontok egy egyenest alkotnak. Ezt az egyenest a két sík metszésvonalának
nevezzük (6.7. ábra).

6.6. ábra

6.7. ábra

Térelemek hajlásszöge. Két egyenes hajlásszögének nevezzük a tér egy tetszőleges pontján át az egyenesekkel
párhuzamosan húzott egyenesek hajlásszögét. Ha a két egyenes párhuzamos, akkor hajlásszögük 0°. Két sík hajlásszögét a
következőképpen határozzuk meg: ha a két sík párhuzamos, akkor hajlásszögük 0°. Ha nem párhuzamosak, akkor
metszésvonaluk egy tetszőleges pontjában merőlegest állítunk e metszésvonalra mindkét síkban, s a kapott félegyenesek
hajlásszögét mondjuk a két sík hajlásszögének (6.8. ábra).

6.8. ábra
6.9. ábra

Egyenes és sík hajlásszögén a következőt értjük: ha az e egyenes párhuzamos az S síkkal, akkor hajlásszögük 0°. Ha e
nem párhuzamos az S síkkal, akkor van egy D közös pontjuk. Az e egyenes egy tetszőleges P pontjából merőlegest állítunk
az S síkra. Ennek a merőlegesnek és a síknak M metszéspontját összekötjük D-vel, s az így keletkezett szöget nevezzük az
egyenes és sík hajlásszögének (6.9. ábra).
Egy egyenes és egy sík akkor merőleges egymásra, ha az egyenes a sík minden egyenesére merőleges.

Ha egy egyenes merőleges egy sík két egymást metsző egyenesére, akkor az egyenes merőleges a síkra.

E tétel szerint tehát ha az egyenes merőleges a döfésponton áthaladó két síkbeli egyenesre, akkor minden, a
döfésponton áthaladó egyenesre merőleges; a 6.10. ábra jelöléseivel: ha a h egyenes merőleges az S sík D döféspontján
áthaladó e és f egyenesekre, akkor merőleges a g egyenesre is.

6.10. ábra

Térelemek távolsága. Két pont távolságán a két pontot összekötő szakasz hosszát értjük. Pont és egyenes távolsága a
pontból az egyenesre állított merőleges szakasz hossza. Pont és sík távolsága a pontból a síkra állított merőleges szakasz
hossza.
Két sík távolsága 0, ha a két sík nem párhuzamos. Ha a két sík párhuzamos, akkor az egyik sík bármely pontjából a
másik síkra állított merőleges szakasz hossza ugyanakkora, azaz nem függ a pont választásától. Ennek a merőleges
szakasznak a hosszát mondjuk a két sík távolságának (6.11. ábra).

6.11. ábra

Két egyenes távolsága 0, ha a két egyenes metszi egymást. Ha a két egyenes egy síkban van, de nincs közös pontjuk,
akkor párhuzamosak; ekkor az egyik egyenes egy tetszőleges pontjából a másik egyenesre állított merőleges szakaszt
mondjuk a két egyenes távolságának. Ha két egyenes nincs egy síkban (kitérő egyenesek), akkor távolságukat az alábbi
módon határozzuk meg: bármely két kitérő egyeneshez létezik egyetlen olyan egyenes, mely mindkét eredeti egyenesre
merőleges, és mindkettőt metszi. Ezt az egyenest a két kitérő egyenes normáltranszverzális egyenesének nevezzük. A két
kitérő egyenes távolsága a két metszéspont távolsága (6.12. ábra).

6.12. ábra

Példák
1. Számítsuk ki az egységnyi élű kocka két kitérő éle felezőpontjainak a távolságát! Készítsük el a szükséges ábrát
(6.13. ábra)! Az EF szakasz hosszát kell meghatároznunk.

6.13. ábra

Az EBA derékszögű háromszögből Pitagorasz tétele alapján

Az EFB derékszögű háromszögből pedig

2. A zsámbéki XIII. századi premontrei templom romjának egyik tetőzete olyan négyzet alapú egyenes gúla,
melynek oldaléle az alaplappal 72°-os szöget zár be. Mekkora az oldallap és az alaplap hajlásszöge? Tekintsük a
6.14. ábrát!

6.14. ábra

Mivel , így A CTF háromszögben A két eredményt

egybevetve azt kapjuk: ahonnan tg α = 4,35. Tehát az oldallap és alaplap hajlásszöge α = 77°.
3. Adott három különböző sík: S1, S2, S3. Határozzuk meg azon pontok halmazát, melyek a három sík közül legalább
kettőre illeszkednek! Három különböző sík viszonylagos helyzete négyféle lehet.
1. Ha a három sík mindegyike párhuzamos a másik kettővel, akkor a három sík közül bármely kettő közös
pontjainak a halmaza üres halmaz, így a keresett ponthalmaznak egyetlen eleme sincs (6.15a ábra).
2. Ha a három sík közül kettő párhuzamos, a harmadik nem párhuzamos velük, akkor azok a pontok, melyek
legalább két síkra illeszkednek, két párhuzamos egyenest alkotnak (6.15b ábra).
3. Ha a három sík közül semelyik kettő nem párhuzamos egymással, de az egyik párhuzamos a másik kettő
metszésvonalával, akkor azon pontok halmaza, melyek legalább két síkra illeszkednek, három, páronként
párhuzamos egyenes (6.15c ábra).
4. Ha a három sík közül semelyik kettő nem párhuzamos egymással, és semelyik nem párhuzamos a másik kettő
metszésvonalával, akkor a keresett ponthalmaz három, egymást egy pontban metsző egyenes (6.15d ábra).
Összefoglalva tehát három különböző sík esetén azon pontok halmaza, melyek legalább két síkra illeszkednek,
vagy üres halmaz, vagy két párhuzamos egyenes, vagy három párhuzamos egyenes, vagy pedig három,
egymást egy pontban metsző egyenes.
6.15. ábra

4. Az S1 és S2 síkok merőlegesek egymásra. A két sík metszésvonalának egy P pontjában állítottunk mindkét síkban
egy-egy olyan félegyenest, mely a metszésvonallal ugyanabban az irányban 60°-os szöget zár be. Mekkora e két
félegyenes hajlásszöge?
Mérjük fel a metszésvonal valamely P pontjából a 60°-os szöget bezáró félegyenesekre a PQ = PR = 1 hosszúságú
szakaszokat (6.16. ábra)!

6.16. ábra

Q-ból és R-ből a metszésvonalra állított merőlegesek talppontja egybeesik; legyen ez M. Ekkor ,

így a QNR egyenlő szárú derékszögű háromszögben Írjuk fel a QPR háromszögre a

koszinusztételt (legyen φ a PQ és PR félegyenesek keresett hajlásszöge): QR2 = 1 + 1 – 2 cos φ, ahonnan cos φ = ,


tehát a két félegyenes hajlásszöge φ ≈ 75,5°.
5. Az e és f kitérő egyenesek hajlásszöge 60°, normáltranszverzálisuk hossza d. A normáltranszverzális az e egyenest
P-ben, az f egyenest Q-ban metszi. Az e egyenesen felmérjük P-ből kiindulva a PR = d, az f egyenesen Q-ból
kiindulva a QT = d szakaszokat a 6.17. ábrán látható módon. Milyen hosszú az RT szakasz?
Húzzunk a Q ponton át egy az e egyenessel párhuzamos egyenest (6.17. ábra)! Ekkor RM = d. Az MQT háromszög
szabályos, így MT = d. A TMR háromszög tehát egyenlő szárú derékszögű háromszög, így a keresett RT távolság:
RT =

6.17. ábra

6.2. Poliéderek
Az olyan (korlátos) testet, melyet véges sok sokszöglap határol, poliédernek nevezzük.

A poliédert lapjai, a lapjait élei, az éleit pedig csúcsai határolják. Minden él legalább két lap határán van, minden
csúcsba legalább három él fut össze. Minden poliédernek legalább négy lapja és legalább négy csúcsa van.
A poliéder csúcsait összekötő szakaszok vagy élek (két szomszédos sokszöglap közös oldala), vagy lapátlók (valamely
határoló sokszöglap két nem szomszédos csúcsát összekötő szakasz, vagyis e sokszöglap egy átlója), vagy testátlók, azaz két
olyan csúcsot összekötő szakasz, amelyik nem is él, és nem is lapátló. A testátló lehet belső testátló (ha teljes egészében a
poliéder belsejében van), vagy lehet külső testátló (ha nincs minden pontja a poliéder belsejében vagy határán).

A poliéder konvex, ha bármely két pontját összekötő szakaszt a poliéder tartalmazza.

A konvex poliéder minden testátlója belső testátló. Ha a poliéder nem konvex, akkor konkávnak mondjuk.
A 6.18. ábrán néhány poliédert szemléltettünk. Az a), d) és e) poliéderek konvexek, míg a b) és c) poliéderek nem
konvexek (konkávok).
A poliéder lapjait alkotó sokszögek szögei a poliéder élszögei. Ha egy él két lapban csatlakozik egymáshoz, akkor e
lapok síkjainak hajlásszöge a poliéder egy lapszöge.

Egy konvex poliéder szabályos, ha élei, élszögei és lapszögei egyenlők.

6.18. ábra

Ebből következik, hogy a szabályos poliéder lapjai egybevágó szabályos sokszögek. Szabályos poliéderre példa a 6.18.
ábra a) (kocka) és d) (szabályos tetraéder) esete.
A poliéder csúcsai, lapjai és élei közötti fontos összefüggésről szól Euler poliédertétele.

Ha egy konvex poliéder csúcsainak a száma c, lapjainak a száma l, éleinek a száma e, akkor

(6.1)

Ötféle szabályos poliéder van: tetraéder, hexaéder (kocka), oktaéder, dodekaéder és ikozaéder.

Az egyes szabályos testek elnevezése görög eredetű; az egyes szabályos poliéderek lapszámaira utalnak.

A tétel igazolásához Euler poliédertételét használhatjuk fel. Legyen n a szabályos poliédert határoló szabályos
sokszögek oldalainak a száma. Mivel minden él két lap csatlakozásánál van, ezért a lapok számát szorozva az egyes
lapok oldalainak a számával, éppen az élek számának kétszeresét kapjuk: l·n = 2e. Mivel minden él két csúcsot köt
össze, így, ha az egy csúcsba (minden csúcsba) futó élek száma m, akkor a csúcsok számának m-mel vett szorzata az
élek számának kétszerese: cm = 2e. Euler tétele szerint tehát írhatjuk: l + c = e + 2, azaz

A kapott egyenlet mindkét oldalát 2e-vel osztva azt kapjuk:

Mivel ezért , ahonnan


(6.2)

A (6.2) egyenlet bal oldalának értéke tehát 1, 2, vagy 3.


Ha (m – 2)(n – 2) = 1, akkor m – 2 = n – 2 = 1, tehát m = n = 3. Vagyis a szabályos sokszöget határoló lapok szabályos
háromszögek, és minden csúcsban 3 él fut. Ez a szabályos tetraéder (6.19a ábra).
Ha (m – 2)(n – 2) = 2, akkor m – 2 = 1, n – 2 = 2, vagy m – 2 = 2, n – 2 = 1. Első esetben m = 3, n = 4, vagyis a poliédert
négyzetek határolják, és minden csúcsba három él fut; ez a hexaéder (kocka; lásd 6.19b ábra). Másik esetben m = 4, n
= 3, vagyis a lapok szabályos háromszögek, és minden csúcsba 4 él fut; ez az oktaéder (6.19c ábra).
Ha (m – 2)(n – 2) = 3, akkor m – 2 = 1, n – 2 = 3, vagy m – 2 = 3, n – 2 = 1. Első esetben m = 3, n = 5; vagyis ekkor a poliédert
szabályos ötszögek határolják, és minden csúcsba három él fut; ez a dodekaéder (6.19d ábra). Másik esetben pedig m =
5, n = 3, ekkor tehát szabályos háromszögek határolják a poliédert, és minden csúcsba öt él fut; ennek neve ikozaéder
(6.19e ábra).

6.19. ábra

Az alábbi táblázatokban összefoglaltuk a szabályos poliéderek jellemző adatait, valamint az a oldalú szabályos poliéder
felszínét és térfogatát.

Határoló lapok oldalszáma Egy csúcsba futó élek száma Csúcsok száma Élek száma Lapok száma

3 3 4 6 4 tetraéder

4 3 8 12 6 hexaéder

3 4 6 12 8 oktaéder

5 3 20 30 12 dodekaéder

3 5 12 30 20 ikozaéder

Felszín Térfogat

Tetraéder

Hexaéder 6a2 a3

Oktaéder

Dodekaéder

Ikozaéder

Megjegyzés. Érdekes tulajdonsága a szabályos poliédereknek, hogy bármelyik bármelyikből származtatható.


Példaként szemléltetjük a kocka és a szabályos tetraéder, a kocka és az oktaéder, valamint a kocka és a dodekaéder
kapcsolatát (6.20a–c ábra).
6.20. ábra

Mivel a szabályos tetraéder, az oktaéder, a dodekaéder mindegyike származtatható a kockából (illetve


mindegyikükből származtatható a kocka), ezért ezen alakzatok bármelyike bármelyikükből is származtatható.

Példák
1. Ellenőrizzük Euler tételét a) konvex sokszög alapú gúla esetében, b) konvex sokszög alapú hasáb esetén!
a) A konvex n-szög alapú gúla csúcsainak a száma c = n + 1, lapjainak a száma l = n + 1, éleinek a száma e = 2n. Ekkor
l + c = n + 1 + n + 1 = 2n + 2 = e + 2.
b) A konvex n-szög alapú hasáb csúcsainak a száma c = 2n, lapjainak a száma l = n + 2, éleinek a száma e = 3n. Ekkor
l + c = 2n + n + 2 = 3n + 2 = e + 2.
2. Igazoljuk, hogy nincs olyan poliéder, melynek pontosan 7 éle van!
Minden lap legalább 3 oldalú, így 2e ≥ 3l. Minden csúcsba legalább 3 él fut, így Euler tételét használva 2e ≥ 3c = 3(e–
l + 2) = 3e – 3l + 6, tehát Зl ≥ e + 6. Ezek szerint tehát 2e ≥ 3l ≥ e + 6. Ha most e = 7, akkor 14 ≥ 3l ≥ 13, ami nyilván
lehetetlen.
3.
Legyen li a konvex poliédert határoló lapok közül az i oldalú lapok száma. Igazoljuk, hogy ekkor
A 3 oldalú lapok a poliédernek 3 élét, a 4 oldalú lapok a poliéder 4 élét, az i oldalú lapok a poliéder i db élét

tartalmazzák. Ezek összege a poliédernek minden élét kétszer tartalmazza, tehát valóban
4. Egy konvex poliéder éleinek a száma e, lapjainak a száma l. Mekkora a poliédert határoló sokszögek szögeinek az
összege?
Legyen a 3, 4, …, i oldalú lapok száma l3, l4, …, li. Egy háromoldalú lap szögeinek összege 180°, így a 3 oldalú lapok
összes szögének összege 180°l3. Hasonlóképpen a 4 oldalú lapok szögeinek összege 2 · 180° · l4; általában az i oldalú
lapok szögeinek összege (i – 2) · 180° · li. Ezek szerint az összes lap szögeinek keresett összege:

Ezt az összeget így is írhatjuk:

Az első zárójelben az élek számának kétszerese, a második zárójelben pedig a lapok száma szerepel, így az összes
lap szögeinek összege:

5. Igazoljuk, hogy bármely konvex poliéder esetén minden lap oldalszáma nem lehet 5-nél nagyobb!
Ha a poliédernek nincs sem 3, sem 4, sem 5 oldalú lapja, akkor l3 = l4 = l5 = 0. Ekkor

tehát e ≥ 3l. A 2. feladatban kimutattuk, hogy 3l ≥ e + 6, ahonnan e ≥ 3l – 6. Azt kaptuk, hogy ha minden lap
oldalszáma 5-nél nagyobb, akkor 3l – 6 ≥ e ≥ 3l, ami nyilván lehetetlen.

Speciális poliéderek

Speciális poliéderek

Hasábok
Gúlák, csonka gúlák
Hasábok
Legyen adott egy sokszög. Ennek pontjain át húzzunk olyan párhuzamos egyeneseket, melyek nem párhuzamosak a
sokszög síkjával. Ekkor egy végtelen hasábot kapunk. Ha ezt a végtelen hasábot elmetsszük az alapsokszög síkjával és egy
ezzel párhuzamos síkkal, akkor a kiindulási sokszög és a vele párhuzamos síkmetszet alkotta sokszög egy hasábot határoz
meg (6.21. ábra).

6.21. ábra

A metszősíkokban elhelyezkedő lapok a hasáb alaplapjai. A többi lapot oldallapoknak mondjuk. Az alaplapok síkjainak
távolsága a hasáb magassága. Az oldallapok összességét a hasáb palástjának nevezzük. A származtatáskor használt
egyeneseknek az alaplapok közötti szakaszai a hasáb alkotói. A hasáb alkotói mind egyenlők. Ha az alkotók merőlegesek az
alapsokszögekre, akkor a hasábot egyenes hasábnak mondjuk, ha nem merőlegesek, akkor a hasáb ferde hasáb. Az egyenes
hasáb oldallapjai téglalapok, a ferde hasáb oldallapjai paralelogrammák. Ha a hasábot egy, az alapsokszögekkel
párhuzamos síkkal metsszük, akkor a síkmetszet az alapsokszögekkel egybevágó sokszög.
A paralelogramma alapú hasábot paralelepipedonnak nevezzük (6.22a ábra) A paralelepipedon szemközti lapjai
egybevágó paralelogrammák. Ha az egyenes hasáb alaplapja téglalap, akkor a paralelepipedon lapjai téglalapok, ennek
neve téglatest (6.22b ábra). Ha az egyenes hasáb alaplapja négyzet, akkor négyzetes hasábot kapunk (6.22c ábra), ha e hasáb
oldallapjai is négyzetek, akkor a hasábot kockának mondjuk (6.22d ábra). Természetesen a téglatest, a négyzetes hasáb és a
kocka is paralelepipedon. Minden paralelepipedon középpontosan szimmetrikus alakzat.
A testek térfogatát V-vel, felszínét A-val jelöljük. Minden hasáb térfogata az alapsokszög területének és magasságának
a szorzata. Minden hasáb felszíne a határoló lapok területének az összege. Ennek megfelelően a speciális hasábok térfogata
és felszíne:

kocka:

négyzetes hasáb:

téglatest: (6.3)

6.22. ábra

Két testet hasonlónak mondunk, ha létezik olyan térbeli egybevágósági transzformáció, mely az egyik testet a
másikkal középpontosan hasonló alakzatba viszi át.

Hasonló poliéderek megfelelő lapjai hasonló sokszögek, így ha két poliéder hasonló, akkor felszínük aránya a
hasonlóság arányának négyzetével egyenlő.

Hasonló testek térfogatainak aránya a hasonlóság arányának köbével egyenlő.


Példák
1. Egy kocka élei n cm hosszúak, ahol n egész szám. A kockát zöldre festettük, majd lapjaival párhuzamos síkok
mentén 1 cm élű kis kockákra vágtuk szét. Hány db olyan kis kocka lesz, melynek 3 lapja zöld, amelynek 2 lapja
zöld, amelynek 1 lapja zöld, végül hány db olyan kis kocka lesz, melynek egyetlen zöld lapja sincs? Azok a kis
kockák, melyeknek 3 lapjuk zöld, az eredeti kocka csúcsaiban vannak, tehát ilyenből 8 db van. Azok a kis kockák,
melyeknek két lapjuk zöld, az élek mentén vannak, kivéve a csúcsokban levőket. Egy élen n – 2 db ilyen kis kocka
van. Mivel a kockának 12 éle van, ezért azon kis kockák száma, melyeknek két lapjuk zöld: 12(n – 2). Azoknak a kis
kockáknak a száma, melyeknek egy lapjuk zöld, az eredeti kocka lapjai mentén helyezkednek el, leszámítva
közülük azokat, amelyek élek mentén vannak. Egy lapon (n – 2)2 db ilyen kis kocka van. Mivel a kockának 6 lapja
van, ezért az ilyen kis kockák száma 6(n – 2)2. Végül azoknak a száma, melyeknek egyetlen lapjuk sem zöld, az
eredeti kocka belsejében vannak. Ezek számát megkaphatjuk, ha elképzeljük, hogy „meghámozzuk” az eredeti
kockát, vagyis lefejtjük a legkülső réteget. Ekkor egy kisebb, n – 2 élű kocka marad vissza. Tehát azoknak a kis
kockáknak a száma, melyeknek egyetlen lapja sem zöld (n – 2)3.
2. Egy téglatest lapátlóinak hossza e, f és g. Számítsuk ki a téglatest éleinek a hosszát! Írjuk fel a 6.23. ábra megfelelő
derékszögű háromszögeire a Pitagorasz-tételt!

6.23. ábra

Az első két egyenlet különbségéhez adjuk hozzá a harmadik egyenletet; azt kapjuk: 2a2 = f2 + g2 – e2, ahonnan

Hasonlóképpen kapjuk a másik két élét is a téglatestnek. (Érdemes megjegyezni: a


négyzetgyök alatti mennyiség nem lehet negatív. Ez nem is meglepő, hiszen a 6.23. ábráról látható, hogy a
lapátlókkal mindig szerkeszthető háromszög, sőt a lapátlók alkotta háromszög mindig hegyesszögű háromszög;
erről pedig tudjuk, hogy nemcsak oldalaira, de oldalainak négyzeteire is teljesülnie kell a háromszög-
egyenlőtlenségnek.)
3. Egy konvex sokszög alapú hasáb csúcsainak a száma, lapátlóinak a száma és testátlóinak a száma valamilyen
sorrendben egy számtani sorozat egymást követő tagjai. Hány oldalú a hasáb alapsokszöge?
Ha a konvex sokszög alapú hasáb alapsokszögének oldala n, akkor a csúcsok száma 2n, a testátlók száma

Látszik tehát, hogy lapátlóból van a legtöbb. Ha a csúcsok száma a legkisebb, akkor a következő összefüggést
írhatjuk fel: 2n + 2n + n(n – 3) = 2n(n – 3), ahonnan n = 7. Ha a testátlók száma a legkisebb, akkor a következő
összefüggés igaz: n(n – 3) + 2n + + n(n – 3) = 4n, ahonnan n = 4. Ha tehát a csúcsok, testátlók, lapátlók száma
valamilyen sorrendben egy számtani sorozat szomszédos tagjai, akkor a hasáb alapsokszöge vagy 4 oldalú, vagy 7
oldalú.
4. Adott egy ABCDA′B′C′D′ kocka. Számítsuk ki az A′B′C és A′D′C háromszögek síkjának hajlásszögét! Legyen a kocka
egységnyi oldalú! Az A′B′C és A′D′C háromszögek egybevágó derék szögű háromszögek, melyek oldalai 1,
A két háromszög síkjának hajlásszöge a derékszögű háromszögek átfogóhoz tartozó magasságainak a
hajlásszöge. E magasságok talppontjai nyilván egybeesnek (6.24. ábra).

6.24. ábra
A háromszögek átfogóhoz tartozó magassága Mivel D′B′ = a D′B′T háromszögre felírhatjuk a

koszinusztételt: cos α, ahonnan cos α Tehát a két sík hajlásszöge 120°. (Érdemes
észrevenni, hogy ha a kockát az A′C testátló irányából nézzük, akkor az A′D′C, A′B′C és A′AC egybevágó
háromszögeket egy-egy szakasznak látjuk, melyek forgásszimmetrikusan helyezkednek el, éppen 120°-os szöget
zárnak be egymással.)
5. Az ABCDA′B′C′D′ kocka DD′ élének felezőpontja F, a BCC′B′ oldallap középpontja O. Az FAO háromszög síkja a
kockát két testre vágja szét. Mekkora e testek térfogatának aránya?
Tükrözzük az A pontot az O pontra! A kapott A′ pont illeszkedik a D′C′ egyenesre, és C′-től éppen egységnyi
távolságra van (6.25. ábra).

6.25. ábra

Mivel A′ és F is benne van az FAO háromszög síkjában, ezért az FA′ egyenes is. Ez az egyenes a kocka CC′ élét P-ben

metszi. A PC′ az A′D′F háromszögnek középvonala, így Ha P-t is tükrözzük O-ra, akkor a kapott Q pont

B-től szintén távolságra van. Ezzel megkaptuk a kocka és az FAO háromszög síkjának AQPF metszetét. Most

képzeljük el, hogy a kocka A′B′C′D′ fedőlapját -del lejjebb toljuk. Az így keletkező hasáb térfogatát a

háromszög síkja felezi, így a sík „alatti” térfogat Ezek szerint a keletkező két test térfogatának
aránya: 5:3.

Gúlák, csonka gúlák


Legyen adott egy síkban egy sokszög és a síkon kívül egy pont. Ha a pontból a sokszög pontjain átmenő félegyeneseket
indítunk, akkor egy végtelen gúlafelületet kapunk, ami egy végtelen gúlát határoz meg. E végtelen gúlát a sokszög síkjával
elmetszve egy poliédert kapunk, melyet gúlának nevezünk (6.26. ábra).

6.26. ábra

A sokszöget a gúla alaplapjának nevezzük. A pont, melyből a félegyeneseket indítottuk, a gúla csúcsa. Az alaplap
oldalai a gúla alapélei, a pontból az alaplap csúcsaiba húzott szakaszok a gúla oldalélei. A gúla csúcsából az alaplap két
szomszédos csúcsába futó szakaszok és a kérdéses oldal egy-egy háromszöget határoznak meg; ezek a gúla oldallapjai. Az
oldallapok összessége a gúla palástja. A pont és az alaplap síkjának a távolsága a gúla magassága. Ha az alaplap n oldalú
sokszög, akkor a gúlát egy n oldalú sokszög és n db háromszög határolja. A háromoldalú gúlát tetraédernek is mondjuk. Ha
a gúla alaplapja n oldalú szabályos sokszög, és a pontnak a sokszög síkjára eső merőleges vetülete a szabályos sokszög
középpontja, akkor a gúlát szabályos gúlának mondjuk. A szabályos gúla oldallapjai egybevágó egyenlő szárú háromszögek.
Kimutatható, hogy

ha két tetraéder alapterülete és magassága megegyezik, akkor a két gúla térfogata egyenlő.
Mivel minden gúla tetraéderekre bontható (6.27. ábra), és a gúla térfogata az őt alkotó tetraéderek térfogatának
összege, ezért a gúla térfogatának tárgyalását elegendő tetraéderekre vizsgálni.

6.27. ábra

A tetraéder térfogata alapterülete (A) és magassága (m) szorzatának a harmada:

(6.4)

A tétel igazolásához tekintsük a 6.28. ábra ABCDEF hasábját!

6.28. ábra

Az ABCD és EDFC tetraéderek térfogata egyenlő, hiszen alaplapjaik (ABC és DEF háromszögek) egybevágó
háromszögek, tehát területeik egyenlő. De e két tetraéder magasságai is egyenlők, hiszen e magasságok a hasáb ABC
és DEF párhuzamos síkjainak a távolsága. Tehát VMCD = VDEFC. De a DEFC és DEBC tetraéderek térfogata is egyenlő;
tekintsük ugyanis alaplapjaiknak az EFC és EBC háromszögeket (ezek egybevágók, hiszen a BCFE
paralelogrammának EC egy átlója), e háromszögek egyenlő területűek. Mindkét tetraéder magassága a D csúcsuknak
a BCFE négyszög síkjától való távolsága, vagyis a magasságaik is egyenlők, tehát VEFCD = VEBCD. Azt kaptuk tehát,
hogy VMCD = VEFCD = VEBCD = Vhasáb. Vagyis az egyes tetraéderek térfogata a hasáb térfogatának a harmada.

A háromszögekhez hasonlóan a tetraédernek is értelmezhetjük a súlyvonalát és súlypontját.

A tetraéder egy súlyvonala valamely csúcsból a szemközti oldallap súlypontjába húzott szakasz.

A tetraéder súlyvonalai egy pontban metszik egymást, ez a pont minden súlyvonalon a csúcstól távolabbi negyedelő
pont.

Tekintsük ugyanis a 6.29. ábrát! Legyen F a DC él felezőpontja, vagyis BF, illetve AF a BDC, illetve ADC háromszögek
egy-egy súlyvonala. Mivel a tetraéder ASA és BSB súlyvonalai benne vannak az ABF síkban, ezért van metszéspontjuk
(S). Megmutatjuk, hogy az S pont mindkét súlyvonalon a csúcstól távolabbi negyedelő pont.
6.29. ábra

Mivel ezért a párhuzamos szelők tételének megfordítása miatt SASB párhuzamos AB-vel, és

Ebből az is következik, hogy az SASBS háromszög hasonló az ABS háromszöghöz, és a hasonlóság


aránya 1 : 3, vagyis

tehát az S pont valóban mindkét súlyvonalon a csúcstól távolabbi negyedelő pont. Mivel mindezt bármely két
súlyvonalra elmondhattuk volna, így a súlyvonalak valóban egy pontban metszik egymást.

Ha a gúlát egy olyan síkkal metsszük, mely párhuzamos az alaplappal, akkor a gúla szétesik egy gúlára és egy csonka
gúlára (6.30. ábra). A metszetet a csonka gúla fedőlapjának nevezzük. A csonka gúla alap- és fedőlapja hasonló sokszögek; a
hasonlóság aránya a gúla csúcsának a fedőlaptól, illetve alaplaptól vett távolságának a hányadosa. Az alaplap és a fedőlap
síkjának távolsága a csonka gúla magassága. A csonka gúla oldallapjai trapézok, melyek összessége a csonka gúla palástja.

6.30. ábra

Ha a csonka gúla alaplapjának területe T, fedőlapjának területe t, magassága m, akkor V térfogata

(6.5)

A tétel igazolásához tekintsük a 6.31. ábrát!

6.31. ábra

A csonka gúla térfogatát megkapjuk, ha az eredeti gúla térfogatából (amelyből származtattuk) levonjuk az alaplappal
párhuzamos síkkal való metszés után keletkező gúla térfogatát. Ezek szerint a csonka gúla térfogata:
Tudjuk, hogy hasonló alakzatok területeinek aránya egyenlő a hasonlóság arányának

négyzetével, így írhatjuk: ahonnan

Ezt az előbbi térfogatképletbe helyettesítve, majd -t kiemelve azt kapjuk:

Innen a nevezők gyöktelenítése, majd a megfelelő algebrai átalakítások után kapjuk a tételben szereplő eredményt.

Bizonyos poliéderekhez található olyan gömb, mely a poliédernek minden lapját érinti, akkor e gömböt a poliéder
beírható gömbjének mondjuk. E gömb sugarának meghatározását – a háromszögek beírható köre sugarának
meghatározásához hasonló módon – tetraéderekre mutatjuk meg.

Ha egy tetraéderbe gömb írható, akkor e gömb R sugara:

(6.6)

ahol V a tetraéder térfogata, A pedig a felszíne.

Kössük össze az ABCD tetraéder beírható gömbjének középpontját a csúcsokkal (6.32. ábra)! Így az eredeti tetraéder 4
db kisebb tetraéderre esik szét, melyek alapháromszöge az eredeti tetraéder egyes oldallapjai, csúcsaik pedig minden
esetben a beírható gömb O középpontja. Ebből következik, hogy mind a négy tetraédernek az alaphoz tartozó
testmagassága a beírható gömb R sugara.
Írjuk fel a négy kisebb tetraéder térfogatát, hiszen ezek összege nyilván egyenlő az eredeti tetraéder V térfogatával.

innen

Az egyenlőség bal oldalán a zárójelben az eredeti tetraéder A felszíne áll, így kapjuk:

6.32. ábra

Példák
1. Egy négyzet alapú szabályos gúla alaplapjának oldalai 12 cm hosszúak. Az oldalélek az alaplappal 60°-os szöget
zárnak be. Mekkora a test térfogata és felszíne? Tekintsük a 6.33. ábrát! A térfogat kiszámításához az m

magasságot kell kiszámítanunk. Mivel TC a négyzet átlójának a fele, ezért Az ETC derékszögű

háromszögben tg 60° = , ahonnan Ezzel a gúla V térfogata:


6.33. ábra

A felszín az alapnégyzet területéből és három egybevágó egyenlő szárú háromszög területeinek összegéből áll. A
háromszögek területének kiszámításához meg kell határoznunk e háromszögek m* magasságát. Az ETF
derékszögű háromszögből

Tehát a gúla A felszíne:

2. Az ABCDE négyzet alapú szabályos gúla alapja az a oldalú ABCD négyzet. Legyen F a CE oldalél felezőpontja!
Mekkora a test magassága, ha tudjuk, hogy a BDF háromszög szabályos?
Az F-ből ET-re állított merőleges felezi az m magasságot (6.34. ábra).

6.34. ábra

Mivel BD = , ezért a BDF szabályos háromszög FT magassága Az FGT derékszögű

háromszög FG befogója az alapnégyzet AC átlójának a negyede, vagyis Pitagorasz tétele


szerint

ahonnan a keresett m magasság:


3. Egy négyzet alapú szabályos csonka gúla alapnégyzetének oldala a, fedőnégyzetének oldala b. A gúlába gömb
írható. Mekkora e gömb sugara?
Vegyük a csonka gúla egy olyan síkmetszetét, mely merőleges az alap- és fedőnégyzetre, és áthalad az alapnégyzet
két szemközti oldalának felezőpontján (A-n és B-n) (6.35a ábra). Ez a gúlát egy szimmetrikus trapézban, a beírható
gömböt pedig annak főkörében metszi. E metszetet rajzoltuk meg a 6.35b ábrán. Mivel a trapéz érintőnégyszög,

ezért a szárai hosszúak.

A 6.35b ábra CTB derékszögű háromszögének BT szakasza A beírt gömb keresett sugara a trapéz
magasságának a fele. Írjuk fel Pitagorasz tételét a CTB derékszögű háromszögre:

tehát a beírható gömb R sugara:


6.35. ábra

4. * Egy négyzet alapú szabályos csonka gúlát elvágtunk egy olyan, az alaplapokkal párhuzamos síkkal, mely felezi a
test térfogatát. Igazoljuk, hogy a síkmetszetre emelt kocka térfogata az alaplapokra emelt kockák térfogatának a
számtani közepe!

Azt kell megmutatnunk, hogy ha a síkmetszet oldala x, akkor Vegyük a csonka gúla két szemközti
alapélének felezőpontjain átmenő, az alaplapokra merőleges síkmetszetét (6.36a ábra)! Ez a síkmetszet egy
szimmetrikus trapéz, melyet a 6.36b ábrán látunk.

6.36. ábra

Az ábra jelöléseivel írhatjuk a következőket: Mivel a metsző sík felezi a térfogatot, ezért

azaz
Az előző egyenlettel egybevetve azt kaptuk:

5. Egy szabályos hatszög alapú szabályos gúla alaplapjának oldalai 12 cm hosszúak, oldalélei 18 cm hosszúak.
Mekkora a beírható gömb sugara?
A szabályos hatszög 6 db szabályos háromszögből áll, így a 6.37. ábra ABT háromszögének minden oldala 12.

6.37. ábra

A beírható gömb sugara (6.6) szerint A CTB derékszögű háromszögben m2 = 182 – 122 = 180, tehát a gúla

m magassága A gúla alaplapjának Ta területe: Tehát a gúla Vg

térfogata (6.4) alapján:


A felszín a szabályos alaphatszög és hat db egybevágó egyenlő szárú háromszög területének összege. Egy ilyen
háromszög m* magasságát pl. a 6.37. ábra CTF derékszögű háromszögéből számíthatjuk ki.

tehát m*2 , azaz Tehát a gúla A felszíne:

A beírható gömb R sugara:


6. * Az ABCD tetraéder beírható gömbjének O középpontján és a tetraéder S súlypontján átmenő egyenes
párhuzamos az ABC lappal. Igazoljuk, hogy ekkor az ABC háromszög területe a másik három oldallap-háromszög
területének a számtani közepe!
Tekintsük a 6.38. ábrát! Ha a beírható gömb középpontján és a súlyponton áthaladó egyenes párhuzamos az ABC

síkkal, akkor a tetraéder súlypontjának tulajdonsága miatt a gömb R sugara

6.38. ábra

Mivel a beírható gömb sugara: , ezért

6.3. Görbe felületű testek


A 6.2. fejezetben olyan testekkel foglalkoztunk, melyeket sokszöglapok határoznak meg. E mostani fejezetben azokat a
testeket tekintjük át, melyeket görbült felületek is határolnak.

Henger
Kúp, csonka kúp
Gömb

Henger
Ha egy síkbeli zárt görbe pontjain át olyan párhuzamos egyeneseket fektetünk, melyek a görbe síkjával nem
párhuzamosak, akkor egy végtelen hengerfelületet kapunk. Ha e hengerfelületet elmetsszük két párhuzamos síkkal, akkor
egy véges testet kapunk, melyet hengernek nevezünk (6.39a ábra). A hengerfelületet metsző síkok a hengerfelületből két
egybevágó görbét metszenek ki; ezek a henger alaplapjai. A hengerfelület származtatásában szereplő párhuzamos
egyeneseknek az alaplapok közötti szakaszai a henger alkotói. Az alaplapok síkjainak a távolsága a henger magassága. Ha az
alkotók az alaplapokra merőlegesek, akkor egyenes hengerről, egyéb esetben ferde hengerről beszélünk. Ha az alaplapok
körök, akkor a testet körhengernek nevezzük (6.39b ábra). Az egyenes körhenger (forgáshenger) az alapkörök
középpontjain átmenő egyenesre tengelyesen szimmetrikus alakzat. Ezt az egyenest a henger tengelyének is mondhatjuk.

6.39. ábra

Megjegyzés. A henger származtatásánál hasonlóképpen jártunk el, mint a hasáb származtatásánál, csupán az a
különbség, hogy a hasáb esetében a kiindulási zárt síkidom valamilyen sokszög, míg a henger esetében görbevonallal
is határolt zárt síkgörbe.

A henger térfogata alaplapja területének és a magasságnak a szorzata. Az r sugarú, m magasságú forgáshenger V


térfogata:

(6.7)

Az egyenes körhenger felszíne az alapkörök területének, valamint a palást területének az összege. Az egyenes
körhenger palástja kiterítve egy olyan téglalap, melynek egyik oldala az alapkör kerülete, másik oldala pedig a henger
magassága (6.40. ábra).

Az r sugarú, m magasságú forgáshenger felszíne

(6.8)

6.40. ábra

Példák
1. Egy egyenes körhenger palástja kiterítve 8 cm átlójú négyzet. Mekkora a henger térfogata és felszíne?

Ha a négyzet átlója 8, akkor oldala Ez az alapkör kerülete és egyben a henger magassága is. Ha a

kerület , akkor 2rπ = , ahonnan Tehát a henger V térfogata

cm3. A henger A felszíne:

2. Egy egyenes körhenger alapkörének sugara r = 6 cm, magassága m = 18 cm. A hengert „elvágtuk” egy, a tengelyével
párhuzamos síkkal; a síkmetszet területe 108 cm2. Milyen távol van e metsző sík a henger tengelyétől?
Állítsunk merőleges szakaszt a fedőkör középpontjából a síkmetszet oldalára! Ez a merőleges felezi a kérdéses

húrt. A 6.41. ábra megfelelő derékszögű háromszögére felírhatjuk Pitagorasz tételét. , tehát a
metszet területe: . m = 108, vagyis . 18 = 108. Innen 36 – x2 = 9, vagyis a metszetnek a
henger tengelyétől való távolsága .
6.41. ábra

3. Egy viaszból készült henger alakú gyertya alapkörének sugara 8 cm, magassága 20 cm. A gyertyát felolvasztottuk,
és 6 cm élű kis viaszkockákat öntöttünk ki belőle. Hány db kis kockánk keletkezett?
A felolvasztott viasz térfogata (vagyis a henger térfogata): VH = 82π · 20. Egy kis kocka térfogata: VK = 63. Ezek

szerint a kiönthető kis kockák száma: , vagyis 18 db kis kockát lehet kiönteni.

Kúp, csonka kúp


Legyen adott egy síkban egy zárt síkgörbe és egy, a síkon kívüli pont. Ha a ponton keresztül egyeneseket fektetünk a
síkgörbe pontjain át, akkor egy végtelen kúpfelületet kapunk. Az egyeneseknek a ponttól a síkgörbéig tartó szakaszai és a
síkgörbe egy véges testet határoznak meg, melyet kúpnak nevezünk. A síkgörbe a kúp alaplapja; a pontból indított
egyeneseknek a ponttól a síkgörbéig tartó szakaszai a kúp alkotói (6.42a ábra). A kiindulási pontnak a síkgörbe síkjától vett
távolsága a kúp magassága. A kúpfelületnek a kúpot határoló része a kúp palástja. Ha a síkgörbe kör, akkor körkúpról
(forgáskúp) beszélünk. Ha a pontnak a merőleges vetülete az alapkör középpontjába esik, akkor egyenes körkúpot
mondunk (6.42b ábra).

6.42. ábra

A forgáskúp tengelyesen szimmetrikus alakzat, alkotói egyenlők. Az alkotóknak a tengellyel bezárt szöge a forgáskúp
félnyílásszöge.

A kúp térfogata az alapterület és a magasság szorzatának a harmadrésze. Ha a forgáskúp alapkörének sugara r,


magassága m, akkor térfogata

(6.9)

A forgáskúp palástját kiterítve egy körcikkhez jutunk. A test felszíne az alapkör területének és a palást (tehát e körcikk)
területének az összege.

Az r sugarú, l alkotójú forgáskúp felszíne

(6.10)
Az alapkör területe r2π. A palást egy olyan körcikk, melynek sugara az eredeti kúp alkotója (l), körívének hossza
pedig az eredeti kúp alapkörének a kerülete (2rπ) (6.43. ábra). Ezek szerint a palást területe rlπ, így a kúp felszíne A =
r2π + rlπ = rπ(r + l).

6.43. ábra

Ha egy kúpot elmetszünk egy, az alaplappal párhuzamos síkkal, akkor kapunk egy kúpot és egy másik testet. Ez utóbbi
testet csonka kúpnak nevezzük. Az eredeti kúp alaplapja a csonka kúp alaplapja, a metszet pedig a csonka kúp fedőlapja. A
metsző sík és az eredeti kúp alaplapja síkjának a távolsága a csonka kúp magassága (6.44. ábra). A csonka kúp alap- és
fedőlapja mindig egymáshoz hasonló síkidomok. Az eredeti kúp alkotóinak az alap- és fedőlap közé eső szakaszai a csonka
kúp alkotói. Ha az eredeti kúp forgáskúp volt, akkor egyenes csonka kúpot kapunk.

6.44. ábra

Megjegyzés. A kúp és a csonka kúp származtatásakor ugyanúgy jártunk el, mint a gúla és a csonka gúla
származtatásánál. A különbség csupán az, hogy a gúla és a csonka gúla esetében a kiindulási síkidom sokszög, míg
kúp és csonka kúp esetében görbékkel határolt zárt síkidom.

Ha az egyenes csonka kúp alapkörének sugara R, fedőkörének sugara r, magassága m, akkor térfogata

(6.11)

A tétel bizonyítását a csonka gúla (6.5)-ben ismertetett térfogatának levezetéséhez teljesen hasonló módon tehetjük
meg.

Ha az egyenes csonka kúp alapkörének sugara R, fedőkörének sugara r, alkotója l, akkor felszíne

(6.12)

A felszín az alapkör és a fedőkör területének, valamint a palást területének az összege. A csonka kúp palástja
kiterítve egy körcikkgyűrű (6.45. ábra).
6.45. ábra

A körcikkgyűrűt határoló nagyobbik ív a csonka kúp alapkörének a kerülete, a határoló kisebb ív a fedőkör kerülete,
az íveket összekötő egyenes szakaszok pedig a csonka kúp alkotójával egyenlők. Ha e körcikkgyűrűt kiegészítjük
teljes körcikké, akkor a csonka kúpot teljes kúppá kiegészítő körcikket, azaz a teljes kúppalástot kapjuk. A csonka
kúp palástja tehát a teljes kúppalást és a levágott kúp palást területeinek a különbsége:

R(l + x)π – rxπ = π[Rl + x(R – r)]. A hasonlóság miatt , ahonnan , tehát a palást területe:

. Tehát a csonka kúp felszíne: A = R2π + r2π + lπ(R + r) = π[R2 + r2 + l(R + r)].
Példák
1. Egy forgáskúp alapkörének a sugara r = 6 cm, alkotója l = 10 cm. Mekkora a kúp térfogata és felszíne?
A sugárból és az alkotóból a kúp m magassága: Tehát a kúp V térfogata és A felszíne (6.9)
és (6.10) alapján:

2. Egy egyenes kúp alakú tartályba egy csapon át folyik a víz; óránként 1 liter. A kúp sugara és magassága: r = 1,2 m,
m = 2, 1 m. Közben a tartályban levő víz párolog is, a párolgás mennyisége egyenesen arányos a vízfelszín
nagyságával; 1 m2-re számítva 0,5 liter óránként. Milyen magasan áll a folyadék a tartályban, amikor beáll az
egyensúly? Tekintsük a 6.46. ábrát! Az egyensúly akkor áll be, amikor a befolyó víz mennyisége egyenlő az
elpárolgó víz mennyiségével; ha óránként 1 liter víz folyik be, akkor óránként 1 liter víznek kell elpárolognia.

Ez akkor következik be, amikor a vízfelszín 2 m2, vagyis x2π = 2 ahonnan A 6.46. ábra megfelelő hasonló

háromszögeiből , azaz

6.46. ábra

3. Két egyenes körkúp úgy helyezkedik el, hogy alapköreik párhuzamosak, és mindegyik csúcsa a másik
alapkörének középpontjába esik egymástól m távolságra. Mekkora a kúpok közös részének a térfogata, ha
alapköreik sugara R és r ?
Vizsgáljuk a 6.47. ábrát! A közös rész egy kettős kúp, közös, x sugarú alapkörrel. Ha az egyik kúp magassága d,
akkor a másik kúp magassága m – d. A közös rész V térfogata:

(6.13)
6.47. ábra

A 6.47. ábra megfelelő hasonló háromszögeiből E két egyenletet összeadva azt kapjuk:

, ahonnan Ezt (6.13)-ba helyettesítve a közös rész keresett térfogata:

4. Egy zárt, egyenes körkúp alakú edényben magasságának feléig áll a víz. Milyen magasan áll a víz a kúpban, ha azt
„fejre állítjuk”?
A 6.48a és a 6.48b ábrán szemléltetjük a két helyzetet. A 6.48a ábrán a felső „üres” kúp és az eredeti kúp hasonlók
egymáshoz; a hasonlóság aránya 1: 2, így az üres kúp és az eredeti kúp térfogatának aránya 1 : 8. Tehát az eredeti
kúpban levő víz térfogata a kúp térfogatának a 7-ed része.
A 6.48b ábrán az alsó „vízkúp” hasonló az eredeti kúphoz. Mivel térfogataik aránya 7 : 8, ezért a hasonlóság aránya

, tehát , tehát fejre állítás után a víz magassága a kúp magasságának kb. 95,6%-a.

6.48. ábra

5. A 6.49a ábrán egy olyan 120°-os körcikkgyűrű látható, melynek belső sugara 6 dm, külső sugara 12 dm. A
körcikkgyűrű két szélét összeillesztjük, alap- és fedőkörét befedjük, majd az így kapott zárt edényt megtöltjük
vízzel. Hány liter víz fér az edénybe? A körcikkgyűrűből készült edény egy csonka kúp (6.49b ábra). Ennek
fedőkörének, illetve alapkörének kerülete a körcikkgyűrű kisebb, illetve nagyobb körívének hosszával egyenlő.

Tehát és , ahonnan r = 2 dm és R = 4 dm. A csonka kúp m magassága a 6.49b ábra


megfelelő derékszögű háromszögéből számolható ki Pitagorasz tételével. E háromszög átfogója 6 dm, egyik
befogója R – r = 2 dm. Ennek megfelelően dm. A csonka kúp V térfogata:

. Tehát az ilyen módon készült edénybe kb. 165,8 liter víz fér.

6.49. ábra

6. Egy a oldalú szabályos hatszöget elforgattunk két szemközti oldalának felezőpontján átmenő egyenes körül.
Mekkora a keletkezett test felszíne?
A keletkezett forgástest két egybevágó, alapköreiknél egymáshoz illesztett csonka kúp (6.50. ábra). Mivel a
szabályos hatszög hat db szabályos háromszögből áll, ezért a csonka kúpok alapköreinek sugara a, fedőkörének

sugara alkotója a, magassága A test felszíne a fedőkör területe kétszeresének és egy csonka kúp
palástja területének a kétszerese:
6.50. ábra

Gömb

A gömbfelület a tér azon pontjainak a halmaza, melyek egy adott ponttól egyenlő távolságra vannak.

Az adott pont a gömb középpontja, az adott távolság a gömb sugara, melyet a körhöz hasonlóan R-rel szokás jelölni. A
gömbfelület két pontját összekötő szakasz a gömb húrja. A középponton átmenő húr a gömb átmérője. Az átmérő egyben a
gömb leghosszabb húrja.
Bármely a gömböt metsző síknak a gömbbel vett síkmetszete kör. Ha a metsző sík áthalad a gömb középpontján, akkor
főkörnek nevezzük. A főkör olyan körben metszi a gömböt, melynek középpontja egybeesik a gömb középpontjával, és
sugara egyenlő a gömb sugarával (6.51. ábra).
Ha egy síknak a gömbbel egyetlen közös pontja van, akkor e sík a gömbnek érintő síkja. Az érintő sík érintési pontjába
húzott sugár az érintősíkra merőleges. Ez egyben azt is jelenti, hogy az érintési pontba húzott sugár az érintősík minden
olyan egyenesére is merőleges, mely áthalad az érintési ponton (6.52. ábra).

6.51. ábra

6.52. ábra

Az érintősík érintési pontján áthaladó egyenesei a gömbnek érintő egyenesei (érintői). Természetesen az érintő
egyeneseknek is egyetlen közös pontja van a gömbbel. Általában: egy síknak és egy gömbfelületnek 0, 1 vagy végtelen sok
közös pontja van; egy egyenesnek és egy gömbfelületnek 0, 1 vagy 2 közös pontja van.
A gömbhöz egy külső pontból végtelen sok érintő húzható. Ezen érintőknek a külső pontból az érintési pontig terjedő
szakaszai egy forgáskúppalástot alkotnak, s az érintési pontok egy gömbi körön helyezkednek el. E forgáskúp tengelye
áthalad a gömb középpontján. A külső pontból húzott érintőszakaszok mind egyenlő hosszúak (6.53. ábra).
Ha a gömböt egy síkkal metsszük, akkor a gömböt két testre vágjuk szét, e testeket gömbsüvegnek (gömbszelet)
nevezzük (6.54. ábra). A metsző sík által kimetszett kör a gömbsüvegek alapköre. Az alapkör középpontjában az alapkörre
állított merőleges metszi a gömbsüveget. E metszéspont és az alapkör középpontjának a távolsága a gömbsüveg magassága.
Ha a gömbsüveg alapkörének a sugara a, akkor m2 = 2Rm – a2.

6.53. ábra

6.54. ábra

Ha a gömböt két párhuzamos síkkal metsszük, akkor e síkok a gömböt két gömbsüvegre és egy gömbövre (gömbréteg)
bontják (6.55. ábra).

6.55. ábra

A síkok által kimetszett körök a gömböv alapkörei, a síkok távolsága a gömböv magassága. Legyen a gömböv
alapköreinek sugarai a és b (a ≤ b), magassága m! Ha a gömböv tartalmazza a gömb középpontját, akkor

Ha a gömböv nem tartalmazza a gömb középpontját, akkor

Ha egy lapszög áthalad a gömb középpontján, akkor a gömbből egy gömbgerezdet vág ki (6.56. ábra). A gömbgerezdet
egy gömbkétszög és két félkör határolja.

6.56. ábra
6.57. ábra

Ha egy forgáskúppalást csúcsa a gömb középpontja, alapköre pedig gömbi kör, akkor e kúp, valamint a gömbi körhöz
tartozó, a kúppalástot nem tartalmazó gömbszelet együtt egy gömbcikket határoznak meg (6.57. ábra).
Az alábbi táblázat a most származtatott testek térfogatának és felszínének kiszámítási módját tartalmazza.

Térfogat Felszín

Gömb 4R2π

Gömbszelet mπ(4R – m)

Gömbréteg π(2rm + a2 + b2)

Gömbcikk

Gömbgerezd

Példák
1. Három acélgömböt – melyek sugarai r1 = 1 cm, r2 = 2 cm, r3 = 3 cm – felolvasztottunk, majd egyetlen gömböt
öntöttünk ki az anyagból.
a) Mekkora a keletkezett gömb sugara?
b) Számítsuk ki az eredeti gömbök felszínei összegének és a keletkezett gömb felszínének hányadosát!
a) Ha a keletkezett gömb sugara x, akkor

azaz x3 = 13 + 23 + 33 = 36, ahonnan .


b) Az eredeti gömbök felszíneinek összege: 4π + 4·4π + 4·9π = 56π. A keletkezett gömbfelszíne A

keresett arány:
2. Egy r = 3 cm sugarú, l = 5 cm alkotójú forgáskúp alakú ólomtömbből 2 mm átmérőjű ólomsörét golyókat akarunk
kiönteni. Hány db sörétet kapunk?
A forgáskúp m magassága: mm. Ezek szerint a forgáskúp V térfogata:

mm3. Egy sörét sugara 1 mm, tehát egy sörét térfogata mm3. A kúpból

kiönthető sörétek száma 9001,4, tehát 9001 db.


3. Egy R sugarú félgömböt alapkörével párhuzamos síkkal úgy vágunk ketté, hogy a metsző sík a félgömb
magasságát felezi.
a) Számítsuk ki a keletkező két test térfogatának arányát!
b) Számítsuk ki a keletkező két test felszínének arányát!
Tekintsük a 6.58. ábrát, melyen a feladatban leírt műveletet szemléltetjük.

6.58. ábra
a) A síkmetszet fölötti gömbszelet magassága , így Vsz térfogata a fenti táblázat alapján

A metsző sík alatti gömbréteg Vr térfogatát megkaphatjuk, ha a félgömb

térfogatából kivonjuk a gömbszelet Vsz térfogatát: Ezek szerint a keletkezett két test
térfogatának aránya:Vsz: Vr = 5:11.

b) A gömbréteg fedőlapjának x sugara Ezek után a gömbszelet Asz felszíne a táblázat

alapján A gömbréteg Ar felszíne ugyancsak a táblázat alapján

Tehát a keletkezett két test felszínének aránya: ASZ : Ar = 7:11.


4. Négy egyenlő R sugarú gömb úgy helyezkedik el az asztal lapján, hogy páronként érintik egymást, középpontjaik
egy négyzet csúcsai. Mekkora annak a kis gömbnek a sugara, mely a négy gömb közötti térrészben áll az asztalon,
és mind a négy gömböt érinti?
A négy gömböt oldal- és felülnézetben ábrázoljuk a 6.59. ábrán.

6.59. ábra

A négy gömb középpontjai egy négyzet alapú szabályos gúlát határoznak meg, melyet a 6.60. ábra szemléltet.

6.60. ábra

A gúla alapnégyzetének oldala 2R, így átlójának a fele Ha x a keresett kis gömb sugara, akkor a gúla
oldalélei R + x hosszúak, magassága pedig R – x hosszú. Az ábra megfelelő derékszögű háromszögére felírva
Pitagorasz tételét, azt kapjuk: , azaz 4Rx = 2R2, ahonnan a kis gömb keresett

sugara Tehát az eredeti négy gömb közé behelyezhető kis gömb sugara az eredeti gömbök sugarának a
fele.

6.4. Henger és kúp síkmetszetei


Ha egy forgáshengert különböző – tengelyével nem párhuzamos – síkokkal metszünk, a metszet kör vagy ellipszis.
Amennyiben a metsző sík merőleges a henger tengelyére, akkor a metszet kör.

A forgáshengert tengelyével nem párhuzamos és rá nem merőleges síkkal metszve, a metszet mindig ellipszis.

Ennek igazolásához tekintsük a 6.61a és 6.61b ábrát, melyeken megrajzoltunk egy-egy olyan gömböt, melyek a
hengerpalástot belülről érintik, továbbá érintik a metsző síkot is (e gömböket első alkalmazójukról P. Dandelin
francia-belga mérnökről elnevezve Dandelin-féle gömböknek nevezzük).
6.61. ábra

A gömbök a hengerpalástot belülről egy-egy körben, a k1, illetve k2 körben metszik. Legyen F1 és F2 a metsző sík és a
gömbök érintési pontja. A metsző sík a hengerpalást minden alkotóját metszi; legyen P az egyik alkotóval való
metszéspontja. E P pont tehát illeszkedik az S síkra és illeszkedik a hengerpalástra is. P-ből a k1 körhöz húzott
érintőszakasz éppen PF1, a k2 körhöz húzott érintőszakasz PF2. Mivel egy külső pontból egy gömbhöz húzott
érintőszakaszok egyenlők, ezért PF1 = PA1 és PF2 = PA2 tehát PF1 + PF2 = PA1 + PA2. De PA1 + PA2 összeg állandó, hiszen
ez a k1 és k2 párhuzamos síkok távolsága. Így arra jutottunk, hogy a P pont F1 és F2 pontoktól mért távolságának
összege állandó, vagyis a P pont az F1, F2 fókuszú ellipszis egy pontja.

Ha egy forgáskúpot metszünk egy olyan síkkal, mely nem halad át a forgáskúp csúcsán, akkor a metszet attól függ,
hogy a metsző sík mekkora szöget zár be a forgáskúp tengelyével. Ha a metsző sík e tengelyre merőleges, akkor a metszet
kör.

Ha a forgáskúpot olyan síkkal metsszük, mely nem halad át a kúp csúcsán, és a kúp tengelyére nem merőleges, akkor a
metszet ellipszis, hiperbola vagy parabola aszerint, hogy a metsző sík a kúp tengelyével a fél nyílásszögnél nagyobb,
kisebb vagy azzal egyenlő szöget zár be.

A tételben kimondottak indokolják, hogy a három görbét kúpszeleteknek is nevezzük.

Legyen először a metsző S síknak a kúp tengelyével bezárt szöge nagyobb a kúp félnyílásszögénél! Ekkor a sík a kúp
minden alkotóját metszi. Írjunk a kúpba egy-egy olyan gömböt, mely érinti a kúppalástot (azaz annak minden
alkotóját), és érinti a metsző síkot is (E gömböket Dandelin-féle gömböknek nevezzük.) Tekintsük a 6.62a és 6.62b
ábrát; a 6.62a ábrán a kúpnak a metsző S síkra merőleges tengelymetszetét szemléltetjük; a tengelymetszeten a
Dandelin-gömbök köröknek látszanak. Legyenek F1 és F2 a Dandelin-gömbök és a metsző S sík érintési pontjai!

6.62. ábra

A Dandelin-gömbök a kúppalástot egy-egy körben k1-ben és k2-ben érintik. Legyen P a metsző S sík és a kúppalást
metszetének egy tetszőleges pontja, és tekintsük a kúpnak a P ponton áthaladó alkotóját, legyen A1 és A2 ennek az
alkotónak a k1 és k2 körökkel alkotott metszéspontja! Mivel P az S síkban van, ezért P-ből az egyes gömbökhöz húzott
érintőszakaszok PF1 és PF2. A külső pontból a gömbhöz húzott érintőszakaszok egyenlősége miatt PF1 = PA1 és PF2 =
PA2, vagyis PF1 + PF2 = PA1 + PA2. De a PA1 + PA2 összeg állandó, hiszen ez az összeg a k1 és k2 körök mint alapkörök
által meghatározott csonka kúp alkotója. Ezek szerint a metszet P pontjának F1-től és F2-től vett távolságának összege
állandó, vagyis a P pont az F1, F2 fókuszú ellipszis egy pontja.
Legyen most a metsző S síknak a kúp tengelyével bezárt szöge a kúp félnyílásszögénél kisebb! Ekkor a metsző sík a
kúp mindkét tartományába belevág. Írjunk mindkét tartományba egy-egy olyan gömböt (Dandelin-gömbök), mely
érinti mindkét kúppalástot (azaz minden alkotót), és érinti az S síkot is (6.63a és 6.63b ábra). Legyen az S síknak a
gömbökkel alkotott érintési pontja F1 és F2. A gömbök a kúppalást egy-egy tartományát egy-egy körben, k1-ben és k2-
ben érintik. Ha az S sík és a kúppalást egy közös pontja P, akkor P illeszkedik egy alkotóra. Legyenek A1 és A2 ezen
alkotónak a k1 és k2 körökkel alkotott metszéspontjai!
6.63. ábra

Mivel P az S síkban van, ezért PF1 az egyik, PF2 a másik gömbnek érintője. Mivel a gömb külső pontból húzott
érintőszakaszai egyenlők, ezért PF1 = PA1 és PF2 = PA2. Ezek szerint |PF1 – PF2| = A1A2. De az A1A2 szakasz hossza
állandó (azaz független a P pont választásától), így a metszetgörbe valóban egy hiperbola, melynek fókuszpontjai az
F1 és F2 pontok.
Most legyen a metsző S sík párhuzamos egy alkotóval, azaz a kúp t tengelyével bezárt szöge egyenlő a kúp
félnyílásszögével! Írjunk a kúpba egy olyan gömböt, mely érinti a kúppalástot (azaz minden alkotót), és érinti az S
síkot is (6.64a és 6.64b ábra). E gömb a palástot egy k körben érinti, az S síkot pedig egy F pontban.

6.64. ábra

Legyen P az S sík és a kúppalást egy közös pontja, és legyen a kúp P-n átmenő alkotójának és a k körnek a
metszéspontja A, végül legyen a k kör síkjának és az S síknak a metszésvonala v! PF = PA, hiszen mindkettő a gömb
érintője. Állítsunk merőlegest P-ből a két sík közös v egyenesére, legyen ennek talppontja T! Mivel PA és PT a kúp
tengelyével ugyanakkora szöget zár be (a kúp félnyílásszögét), ezért PA = PT. Ezek szerint PF = PT, vagyis a
metszetgörbe bármely pontja ugyanakkora távolságra van az S sík és a gömb F érintési pontjától, mint a v egyenestől,
így a metszet valóban parabola, melynek F a fókusza és v a vezéregyenese.
Példák
1. Egy kúp félnyílásszöge α. Egy S sík a kúp tengelyével ugyancsak α szöget zár be, és a kúp csúcsától d távolságra
„lép be” a kúpba. Mekkora a síkmetszet parabola paramétere? Használjuk a 6.65. ábra jelöléseit!
A parabola p paramétere az F fókuszpontnak a v vezéregyenestől való távolsága. A parabola tengelypontja az M
pont, így Állítsunk merőlegest M-ből a megfelelő alkotóra, ennek talppontja T, a gömb sugara r. Az
OTM háromszögből MT = 2r = d sin 2α, tehát KF = r = d sin α cos α. Az FKM és OKM hasonló háromszögekből

, ahonnan a parabola keresett p paramétere: p = 2d·sin2 α.

6.65. ábra
6.66. ábra

2. Egy kúp félnyílásszöge α. Egy S sík a kúp tengelyével 3α szöget zár be, és a kúp csúcsától d távolságra „lép be” a
kúpba. Mekkora a metsző sík és a kúp csúcsa közötti térrészbe írható Dandelin-gömb sugara? Legyen K a metsző S
sík és a kúp t tengelyének metszéspontja! A 6.66. ábra jelöléseit használjuk.
Ha az S sík a t tengellyel 3α szöget zár be, akkor az OMT háromszögben OTM ∠ = 2α, vagyis e háromszög egyenlő
szárú: TM = d. E háromszög alapja: OT = 2OQ = 2d cos 2α, ehhez tartozó magassága: MQ = d sin 2α, tehát az OMT
háromszög területe: TOMT = d2 sin 2α cos 2α. A háromszög kerülete: KOMT = 2d + 2d cos 2α. A háromszög beírható
körének r sugara (5.8) alapján

A 6.4. alfejezetet Hajós György Bevezetés a geometriába című könyvének felhasználásával állítottuk össze.
7. Ábrázoló geometria
7.1. Bevezetés
7.2. Ábrázolás két képsíkon
7.3. Axonometrikus ábrázolás
7.4. Néhány görbékre és felületekre vonatkozó feladat
7.5. Kótás ábrázolás
7.6. Néhány további ábrázolási módszer

Irodalom

7.1. Bevezetés
Az ábrázoló geometria története pár ezer éves. Az építészet, a térképészet alakították ki első, talán ma már kezdetlegesnek
tűnő eljárásait. Az alap- és homlokrajz eljárását a középkor építészete bonyolultabb feladatok megoldására is felhasználta.
Később a technika fejlődése is hozzájárult az ábrázolás tudományának kialakulásához. Gaspard Monge (1746–1818) foglalta
tudományos rendszerbe az addigi módszereket, eljárásokat. Munkássága nyomán megszületett az alkalmazott matematika
új ága, amelyet ma ábrázoló geometria néven ismernek. A geometria részterületeként tartják számon, a geometriai
leképezések elméletének egy alkalmazása.
Az ábrázoló geometria célja a térbeli alakzatok elsősorban síkon való ábrázolása. Valamely síkbeli vagy térbeli alakzat
ábrázolásán olyan geometriai alapokra épülő módszereket, eljárásokat értünk, melyek lehetővé teszik a térbeli alakzat
méreteinek, helyzetének, alakjának gra kus szemléltetését, valamint az alakzattal kapcsolatos geometriai feladatok
szerkesztéssel történő megoldását.
Módszere a vetítés, az ábrázolás eredménye az alakzat képe, vetülete (projekció). Az ábrázolási módszerekkel szemben
támasztott legfontosabb követelmények:
- az ábrázolt alakzat geometriai viszonyai a vetületek alapján egyértelműen megállapíthatóak legyenek,
- az ábrázolás eredményeképpen nyert képek lehetőleg szemléletesek legyenek, azaz a vetületek alapján könnyen el tudjuk
képzelni az alakzatot.
A vetítés egyik módja a párhuzamos vetítés. Ennek során adott a K sík és a v egyenes (7.1. ábra), ahol v-nek és K-nak
egyetlen közös pontja van. A tér pontjait v irányú egyenesekkel, a vetítősugarakkal képezzük le a K síkra, a képsíkra. A 7.1.
ábrán a v adott egyenes adja a vetítősugarak irányát. A tér tetszőleges P pontján át fektetett v állású egyenes K-val alkotott
Pa döféspontja a P pont párhuzamos vetülete, a P pont képe. Ha v ⊥ K, akkor merőleges (ortogonális) vetítésről beszélünk,
ha pedig v nem merőleges K-ra, akkor ferde (klinogonális) vetítésről.
A centrális vetítés esetén adott az O pont és a rá nem illeszkedő K sík (7.2. ábra). A tér pontjait az O pontból, a
centrumból vagy vetítési középpontból vetítjük le a K síkra, melyet képsíknak nevezünk. A tér valamely P pontjának Pc
centrális vetülete (centrális képe) az OP egyenes (vetítősugár) és a K képsík közös pontja. A centrális vetítést alkalmazó
ábrázolási módszerrel a 7.5. fejezetben ismerkedünk meg részletesebben.
Valamely alakzat pontjainak vetületei (képei) az alakzat vetületét (képét) alkotják.

7.1. ábra
7.2. ábra

Az ábrázolással szemben támasztott követelmény a rekonstrukció (visszaállítás), vagyis az ábrázolt alakzat térbeli
helyzetére, alakjára, geometriai viszonyaira való visszakövetkeztetés a vetületek ismeretében. A fenti két vetítés nyilván
nem létesít egy-egyértelmű megfeleltetést a tér és a K képsík pontjai között. A különböző ábrázolási módszerek különféle
módon igyekeznek kiküszöbölni ezt a problémát és más-más módon biztosítani az egyértelmű visszaállítást.
A mérnöki munkában, a művészetekben szükségesek olyan képességek is, melyek lehetővé teszik valamely alkotás
elképzelését, rajzban való megfelelő rögzítését még annak megvalósítása előtt. Ehhez egyrészt megfelelő térszemlélet és
geometriai, térgeometriai ismeretanyag szükséges. Ezenkívül el kell sajátítani azokat az alapvető ábrázoló geometriai,
műszaki rajzban használatos módszereket, melyek lehetővé teszik az ábrázolást, szemléltetést. A geometriai, ábrázoló
geometriai ismeretek segítik a számítógéppel való tervezést is.
Az alábbiakban csak a leggyakrabban használt ábrázolási módszerekkel foglalkozhatunk, helyszűke miatt. A megadott
irodalomjegyzék további ismeretek elsajátítására nyújt lehetőséget.

Jelölések, szerkesztések
Néhány geometriai transzformáció, leképezés

Jelölések, szerkesztések
A háromdimenziós euklideszi tér legegyszerűbb geometriai alakzatai, a térelemek: a pont, az egyenes és a sík. A térelemek
jelölése:
- pontok: A, B, C, … (dőlt nagybetűk),
- egyenesek: a, b, c, … (dőlt kisbetűk),
- síkok: A, B, C, … (álló nagybetűk).
A különböző ábrázolási módszerek foglalkoznak a térelemek és azok kölcsönös helyzetének ábrázolásával. Ennek
megfelelően tárgyalják az illeszkedő, a párhuzamos, a metsző térelemek megadásával kapcsolatos kérdéseket, valamint
azt, hogy a vetületekből milyen módon következtethetünk térbeli viszonyaikra.
A szokásos jelöléseket használjuk. A teljesség igénye nélkül néhány példa. A P ∈ e jelölés szerint a P pont illeszkedik az e
egyenesre. Ellenkező esetben P ∉ e. Egyenes és sík illeszkedésének jelölése: e ⊂ S. Az a és b párhuzamos egyeneseket a || b
jelöli. Ha az e egyenes metszi az S síkot, akkor a metszéspont D = e ⋂ S. A D pontot az e egyenes S síkkal való döféspontjának
nevezzük.
Az A és B pontok által meghatározott egyenest AB-vel, az A, B, C nem egy egyenesre illeszkedő pontok által
meghatározott síkot ABC-vel jelöljük. A P pont és a rá nem illeszkedő e egyenes síkja: Pe. Hasonlóan az a és b egyenesek
által meghatározott síkot ab jelöli.
A helyzetgeometriai feladatok megoldásánál nehezebb probléma az ábrázolt alakzatok méreteinek meghatározásával
kapcsolatos szerkesztési feladatok megoldása, illetve adott metrikus tulajdonságokkal rendelkező alakzatok ábrázolása. (Ez
az igény műszaki vonatkozású ábrázolások esetén, a méretezésekkel kapcsolatban fokozottan fellép.) A geometriai alapot a
térelemek távolságainak és szögeinek meghatározásával kapcsolatos de níciók és a vetítés tulajdonságainak ismerete
jelenti. Bizonyos ábrázolási módok esetén fontos szerepet játszik a merőlegesség is, különösen a következő esetben. Az S
síkot metsző n egyenes merőleges a síkra, ha a T = S ⋂ n ponton átmenő, minden S síkbeli egyenesre merőleges. Az S síkra
merőleges n egyenest a sík egy normálisának nevezzük, a T döféspontot pedig n talppontjának.
A fenti feladatok megoldásánál térbeli szerkesztési feladatok lépnek fel, melyeket az adott ábrázolási módszer síkbeli
szerkesztésekre vezet vissza. Ez oly módon történik, hogy a szerkesztés eredménye visszavihető a térbeli alakzatra.
A síkgeometriában a szerkesztések nagy részében úgynevezett euklideszi szerkesztéseket alkalmazzunk. Euklideszi
szerkesztéseket használunk például adott szakasz felező merőlegesének, adott szög szögfelező egyenesének
megszerkesztésénél stb.

Feladat. Adott az e egyenes és a P ∉ e pont. Szerkesszünk P-n át e-vel párhuzamos f egyenest!


Megoldás. Rajzoljunk P középpontú, e-t két pontban (G és F) metsző kört (7.3. ábra)! Írjunk P körül GF sugarú, F
körül GP sugarú kört! Az FGP szögtartományba eső metszéspontjuk legyen N! A PN egyenes a keresett f párhuzamos
egyenes. Másképpen is szerkeszthetünk. Szerkesszünk P-ből e-re merőleges m egyenest, majd ezután m-re merőleges
egyenest P-ben! Ez utóbbi az f egyenes.
Megjegyezzük, hogy szokás a szerkesztés során úgy eljárni, hogy az egyik háromszögvonalzó átfogójának élét az e
egyenesre illesztjük (7.4. ábra), a másik vonalzó egyik élét az első befogójával összeillesztjük. A második rögzített
helyzete esetén az elsőt eltolva párhuzamos egyenest rajzolhatunk P-n át. Ez a szerkesztés nyilván már nem
euklideszi, hiszen az eltolás során végtelen sok helyzetet érintünk.

7.3. ábra

7.4. ábra

Még az elvileg pontos szerkesztések is a gyakorlati végrehajtás során pontatlanná válnak. Megfelelőnek tekintjük a
szerkesztést, ha a pontatlanság nem számottevő. Sokszor alkalmazunk ún. közelítő szerkesztéseket, amikor a szerkesztés
elvileg sem pontos, viszont ez a pontatlanság elhanyagolhatóan kicsi. Körív közelítő hosszának szerkesztésénél
alkalmazhatjuk a következő Snellius-féle szerkesztést. Az O középpontú r sugarú kör α középponti szögéhez tartozó PL ívét
tekintjük (7.5. ábra). Az OL szakasz O-n túli meghosszabbítására felmérjük az r sugár kétszeresét. Az így kapott M pontot

összekötjük P-vel. Legyen Q az MP egyenes és a körhöz az L pontban vont érintő metszéspontja! Ekkor
Ebből adódik, hogy α < 30° esetén a QL szakasz és a PL ív eltérése nem nagyobb, mint r két tizedrésze. A 30°-nál nagyobb
szögeket 30°-nál kisebbekre bontva alkalmazhatjuk az előző szerkesztést.

7.5. ábra

Egy másik megoldás, ha a körívet a körbe beírt, elég nagy oldalszámú sokszög kerületével közelítjük (rekti káljuk),
melyet már könnyen meghatározhatunk. Ezt a módszert alkalmazhatjuk síkbeli görbeívek esetén, ha az íveknek van
ívhosszuk.
A térgeometriai szerkesztések során a síkgeometriai szerkesztési eszközeink, ha nem síkbeli a feladat, nem
alkalmazhatók. Értelmeznünk kell, mit jelent egy térbeli szerkesztést elvégezni. A térben akkor tekintünk
megszerkesztettnek egy alakzatot, ha a kiindulási adatokból a következő, ún. alapszerkesztések véges sokszori
alkalmazásával eljutunk a keresett alakzathoz:
- Egy síkot megszerkesztettnek tekintünk, ha ismerjük a síkot egyértelműen meghatározó adatokat.
- Ha adott két sík, akkor feltételezzük, hogy a metszésvonalukat is meg tudjuk határozni.
- Ha adott a térben egy tetszőleges sík, akkor ebben a síkban minden, a síkgeometriában szokásos szerkesztést végre tudunk
hajtani.
Nézzünk egy példát térbeli szerkesztési feladatra!

Feladat. Adottak az e és f kitérő egyenesek, valamint a rájuk nem illeszkedő P pont. Szerkesszünk P-n át olyan g
egyenest, mely mindkét adott egyenest metszi.
Megoldás. A szerkesztendő g egyenes átmegy P-n, és metszi e-t, tehát benne van a Pe síkban (7.6. ábra). Hasonlóan
benne van a Pf síkban is. Tehát g a két sík metszésvonala. Ha a két sík metszésvonala párhuzamos e-vel vagy f-fel,
akkor nincs megoldás, különben pedig egyetlen megoldás van. Megjegyezzük, hogy az ábrázoló geometria
eszközeivel a fent leírt szerkesztés konkrétan végrehajtható.
7.6. ábra

Néhány geometriai transzformáció, leképezés


A következőkben azokat a geometriai transzformációkat említjük meg, melyek egyrészt a különböző felületek konstrukciói
szempontjából fontosak, másrészt a legalapvetőbb ábrázolási módoknál fellépnek.

Néhány térbeli egybevágósági transzformáció


Síknak síkra való a n transzformációi
Tengelyes a nitások
Általános a n transzformációk
A párhuzamos vetítés és tulajdonságai

Néhány térbeli egybevágósági transzformáció


A távolságtartó transzformációkat neveztük egybevágósági transzformációknak. A síkbeli egybevágósági transzformációk
közül középiskolában is szerepeltek a következők: eltolás, pont körüli forgatás (ezen belül a pontra vonatkozó tükrözés),
tengelyes tükrözés.
A tér OB irányított szakaszával való eltolását a síkbeli esethez hasonlóan értelmezhetjük (sík helyett mindenütt teret
kell gondolni) (7.7. ábra).
A tér t egyenes körüli φ irányított szögű elforgatása során (7.8. ábra) a t egyenes pontjai helyben maradnak. Állítsunk
merőlegest a tér P (P ∉ t) pontjából t-re, a merőleges talppontja legyen T! A transzformáció a tér P pontjához azt a P′ pontot
rendeli, melyre TP = TP′, TP′ ⊥ t és (PTP′) ∠ = φ teljesülnek. A t egyenest forgástengelynek nevezzük.
A csavarmozgás egy tengely körüli forgatás és egy, a tengellyel párhuzamos eltolás egymásutánja (7.9. ábra).

7.7. ábra

7.8. ábra
7.9. ábra

Tekintsünk egy S síkot! Az S síkra vonatkozó tükrözésnél (7.10. ábra) a sík pontjai helyben maradnak, xpontok. Az S
által határolt egyik féltér P pontjához oly módon rendeljük hozzá a másik féltér P′ pontját, hogy PP′ ⊥ S, és ha PP′ talppontja
S-en T, akkor PT = TP′. Az S síkot szimmetriasíknak nevezzük.
A tér O pontjára vonatkozó tükrözésnél O-hoz önmagát rendeljük (7.11. ábra), a tér egy további P pontjához az OP
egyenesnek azt a P′ pontját rendeljük, mely az O kezdőpontú P-t nem tartalmazó félegyenesen van, és amelyre OP = OP′
teljesül.
A térbeli transzformációknál is vizsgáljuk, hogy az orientációt megtartják-e, vagy sem. Ehhez szükség van a
jobbrendszer, illetve balrendszer fogalmára. Legyen O a nem egysíkú e, f, g félegyenesek közös kezdőpontja (7.12. ábra). Ha
g irányával szembe nézve az e félegyenest az f félegyenesbe az O körüli, az ef síkban levő, 180°-nál kisebb, pozitív irányú
(azaz megállapodás szerint az óramutató járásával ellentétes) elforgatás viszi, akkor az e, f, g félegyenesek jobbrendszert
alkotnak. Ellenkező esetben az e, f, g félegyenesek balrendszert alkotnak. Az elnevezés onnan származik, hogy jobb kezünk
hüvelyk-, mutató- és középső ujja jobbrendszert, a bal kezünk hüvelyk-, mutató- és középső ujja balrendszert alkot.

7.10. ábra

7.11. ábra

7.12. ábra

Ha egy térbeli transzformáció az O, A, B, C pontokhoz az O′, A′, B′, C′ pontokat rendeli, és az OA, OB, OC és az O′A′, O′B′,
O′C′ hármasok mindketten jobbrendszert vagy mindketten balrendszert alkotnak, azt mondjuk, hogy a transzformáció az
orientációt megtartja, ellenkező esetben megváltoztatja azt.
A térmozgások (eltolás, tengely körüli forgatás, csavarmozgás) megtartják az orientációt, a síkra, illetve a pontra
vonatkozó tükrözés viszont nem.
Az egybevágósági transzformációk egymás utáni alkalmazásával nyert transzformáció is egybevágósági
transzformáció. Két alakzatot egybevágónak neveztünk, ha van olyan egybevágósági transzformáció, mely egyiket a
másikba viszi át. Ha egy alakzatot egy síkra vagy pontra vonatkozó tükrözés önmagába visz át, akkor síkszimmetrikusnak,
illetve centrálszimmetrikusnak nevezzük. A téglatest testközéppontjára nézve centrálszimmetrikus alakzat. Több
szimmetriasíkja is van (pl. a párhuzamos lapok középpárhuzamos síkjai). Forgásszimmetrikus alakzathoz létezik olyan
tengely körüli elforgatás, mely az alakzathoz önmagát rendeli (de nem minden ponthoz rendeli önmagát). A kocka például
a testátló egyenesei körüli 120°-os elforgatásra nézve forgásszimmetrikus. A gömb bármely, a középpontján átmenő
egyenesre mint tengelyre nézve forgásszimmetrikus. (Más egyéb szimmetriái is vannak.)

Síknak síkra való a n transzformációi


Ebben a szakaszban olyan geometriai transzformációkat vizsgálunk, melyek a következő fejezetek ábrázolási módjainál
fellépnek. Az itt szereplő tényanyag segédeszköz a párhuzamos vetítést alkalmazó ábrázolásoknál. Először síknak síkra
való a n transzformációival foglalkozunk.
Legyen S és S′ két nem feltétlenül különböző sík. Ha az S sík minden egyes pontjához hozzárendeljük S′ egy pontját,
továbbá S′ minden pontja előáll képpontként, akkor ezt a pontonkénti hozzárendelést az S sík S′ síkra való leképezésének
nevezzük. A leképezés egy-egyértelmű vagy bijektív, ha az S két különböző pontjához különböző S′-beli pontokat rendel, és
S′ két különböző képpontja két nem azonos S-beli pont képe. Ha S bármely e egyenese pontjainak képei az S′ sík egy e′
egyenesét alkotják, akkor a leképezés egyenestartó.
Legyenek A és B az e egyenes rögzített pontjai! Az egyenes P pontjának az A és B pontokra vonatkozó (ABP)

osztóviszonyán (7.13. ábra) az AP és PB irányított szakaszok előjeles hosszainak arányát értjük, azaz
Nyilván P ≠ B. Ez a hányados az e egyenes irányításától független. Ha P az AB szakasz pontja (P ≠ B), akkor az osztóviszony
nem negatív. Amennyiben P az e egyenes B kezdőpontú, A-t nem tartalmazó félegyenesének pontja, akkor az osztóviszony
negatív és abszolút értékben 1-nél nagyobb. Az e egyenes A kezdőpontú, B-t nem tartalmazó félegyenesének pontjaira az
osztóviszony negatív és abszolút értékben kisebb 1-nél.

7.13 ábra

A leképezés osztóviszonytartó, ha az S sík bármely e egyenesének tetszőleges A, B, P pontjaihoz a leképezés olyan A′, B′,
P′ ∈ e′ pontokat rendel, melyekre (ABP) = (A′B′P′).
Az S → S′ leképezést a n transzformációnak nevezzük, ha bijektív, egyenestartó és osztóviszonytartó. Megjegyezzük,
hogy az a nitás de níciójában kevesebbet is elegendő lenne megkövetelni, s a fenti tulajdonságok egy része bizonyítható
lenne.
A n transzformációk alkalmazásai során metsző egyenesek képei a metszéspont képén áthaladó egyenesek,
párhuzamos egyenesek a n képei párhuzamos egyenesek. Ha két vagy több a nitást egymás után alkalmazunk, a kapott
transzformáció szintén a nitás.

Tengelyes a nitások
Az S → S′ a n transzformációnak F xpontja, ha F képe F′ = F. Az a nitásnak az f egyenes xegyenese, ha az S → S′
leképezés az f egyenest önmagára képezi le. Pl. az S síkban az O pontra vonatkozó tükrözés a nitás, melynél az O ponton
áthaladó egyenesek xegyenesek. Az egyenesek O-tól különböző pontjai nem xpontok. Ha azonban a t xegyenes minden
pontja xpont, akkor a t egyenest tengelynek nevezzük. Ha egy a nitás rendelkezik tengellyel, tengelyes a nitásnak
nevezzük. Speciális tengelyes a nitás a t egyenesre vonatkozó tükrözés S síkjában. Tekintsük azt az a nitást, melynek
tengelye t, P → P′ és Q → Q′ két megfelelő pontpár (7.14. ábra). Az a nitás tulajdonságaiból adódik, hogy a PQ és a P′Q′
egyenesek L metszéspontja a tengelyen van. Ha PQ || t, akkor P′Q′ || t is teljesül. Az osztóviszonytartásból következik, hogy
(PQL) = (P′Q′L′), amiből PP′ || QQ′ adódik.

7.14. ábra

Legyen S = S′! Ekkor a fent leírt a nitásnál a PP′ egyenes által megadott irányt a tengelyes a nitás irányának
nevezzük. Bebizonyítható, hogy egy tengelyes a nitás egyértelműen megadható a tengellyel és egy megfelelő pontpárral
(t, P → P′). A 7.14. ábráról leolvasható tetszőleges további pont képének megszerkesztése. Ha PP′ || t, akkor elációról
beszélünk.

Tekintsük a hányadost! A párhuzamos szelők tételének egy következménye alapján belátható, hogy a PQ-
val egyállású egyenesek esetén q mindig ugyanaz, függetlenül a PQ szakasz megválasztásától. A PQ szakasz állásának
változásával azonban q is változik. A fenti módon a sík ugyanolyan állású egyeneseit a q értékkel jellemezhetjük. Ez az

adott álláshoz tartozó dilatáció. Az S = S′ esetben nyilván teljesül, hogy a hányados is független a P (P ∉ t, T = PP′
⋂ t) pont megválasztásától. Ezt a λ számot a tengelyes a nitás arányának (karakterisztikus osztóviszonynak) nevezzük.

Általános a n transzformációk
Az S → S′ a nitás az A, B, C nem egy egyenesen fekvő pontokhoz rendre az A′, B′, C′ nem egy egyenesen fekvő pontokat
(7.15. ábra) rendeli. Ezt az a nitást előállíthatjuk két a n transzformáció egymás utáni alkalmazásaként. Az első az S → S′
hasonlósági transzformáció, mely az A, B, C pontokhoz rendre az A1 = A′, B1 = B′, C1 pontokat rendeli. A másik leképezés az
S′ → S′ tengelyes a nitás, melynek tengelye A′B′ egyenese, és egy megfelelő pontpárja C1 → C′. Az is adódik, hogy az S → S′
a nitást egy megfelelő ABC, A′B′C′ háromszögpár egyértelműen meghatározza.

7.15. ábra

Megjegyezzük, hogy az egybevágósági és hasonlósági transzformációk is a nitások.


A fentiek alapján általános a nitás esetén is lehet adott egyenesálláshoz tartozó dilatációról beszélni.

A párhuzamos vetítés és tulajdonságai


A párhuzamos vetítést már értelmeztük a bevezetésben. Most a legfontosabb tulajdonságait adjuk meg, nagyon röviden. A
P pont K képsíkra eső, v irányú párhuzamos vetületét Pa-val jelöltük (7.16. ábra). A v irányú egyenesek, a vetítőegyenesek
vetületei pontok. Az ábrán a w vetítőegyenes vetülete a wa pont. A nem vetítőegyenes helyzetű egyenesek vetületei
egyenesek (az ábrán az e egyenes ilyen).
A párhuzamos vetítés további fontos tulajdonsága az osztóviszonytartás. Ha az A, B, P ponthármast – melynek
tartóegyenese nem merőleges K-ra – a K képsíkra vetítjük, akkor az eredeti és a vetítéssel nyert Aa, Ba, Pa ponthármasra
(ABP) = (Aa Ba Pa) teljesül (7.17. ábra). (Ez a párhuzamos szelők tételéből következik.)
A v-t tartalmazó és a v-vel párhuzamos síkok vetületei egyenesek, ezek a síkok vetítősíkok. Például a V = eea sík (7.16.
ábra) vetítősík.

7.16. ábra

7.17. ábra
Ha az S sík nem vetítősík, akkor párhuzamos vetülete a K képsík (7.18. ábra). A párhuzamos vetítés S és K pontjai között
egy-egyértelmű leképezést létesít, mely egyenestartó és osztóviszonytartó, azaz a nitás. Ha S || K, akkor speciálisan
egybevágóság (eltolás) ez az a nitás. Ha S és K egymást metsző síkok, és m = S ⋂ K, akkor m tetszőleges pontjának képe
önmaga, az m egyenes pontonként xegyenes, vagyis tengely.
Két, egymással párhuzamos vetítőegyenes képe egy-egy pont. Ha a párhuzamos egyenesek nem vetítőegyenesek, de
síkjuk vetítősík, akkor az egyenesek vetületei egybeesnek. Amennyiben az e és f párhuzamos egyenesek nincsenek egy
vetítősíkban, akkor ea és fa vetületeik is párhuzamosak egymással (7.19. ábra). Ugyanis az egyenesek E és F vetítősíkjai
párhuzamos síkok és e síkok és a képsík metszésvonalai, azaz ea és fa is párhuzamosak egymással. Csupán a vetületek
párhuzamosságából azonban nem következik az ábrázolt egyenesek párhuzamossága. Például az e-t metsző g egyenesre ga
|| fa, de g és f kitérő egyenesek.

7.18. ábra

7.19. ábra

Szakasz párhuzamos vetülete lehet nagyobb, egyenlő vagy kisebb az eredeti szakasznál, a vetítés irányától függően. Ha
az AB szakasz K-val párhuzamos, vagy K-ra illeszkedik, akkor biztosan egyenlő vele a képszakasz (de nem csak ekkor).
Hasonlóan a szög vetülete is általában nem egyenlő a kiindulási szöggel. Ha mindkét szögszár K-ban van, vagy K-val
párhuzamos (7.20. ábra), akkor viszont teljesül a szögek egyenlősége (de nem csak ekkor).

7.20. ábra

7.21. ábra

Ha v ⊥ K, akkor merőleges vetítésről beszélünk. Ez a gyakran használt vetítési mód rendelkezik néhány speciális
tulajdonsággal. Szakasz merőleges vetülete kisebb egyenlő, mint a merőlegesen vetített szakasz. Ha egy derékszög egyik
szára párhuzamos a képsíkkal, vagy a képsíkban van (7.21. ábra), akkor a derékszög merőleges vetülete is derékszög
(feltéve, hogy egyik szár egyenese sem vetítőegyenes). A későbbiekben sokszor felhasználjuk ezt a megállapítást.
7.2. Ábrázolás két képsíkon

Térelemek ábrázolása
Helyzetgeometriai feladatok
Metrikus feladatok
Néhány alkalmazás

Térelemek ábrázolása

Képsíkrendszer, pont ábrázolása


Egyenes ábrázolása
Speciális egyenesek
Sík ábrázolása
Speciális síkok
Síkra illeszkedő egyenesek és pontok

Képsíkrendszer, pont ábrázolása


Egyértelműen jellemezhetjük egy P pont térbeli helyzetét, ha két egymásra merőleges képsíkot, képsíkrendszert
alkalmazunk (7.22. ábra). Tekintsünk egy „vízszintesnek” képzelt K1 síkot és egy rá merőleges „függőlegesnek” képzelt K2
síkot! Legyen e két sík a Monge-féle kétképsíkos ábrázolás első, illetve második képsíkja. A képsíkok metszésvonalát, a
képsíktengelyt jelöljük x12-vel. Egy tetszőleges térbeli P pontot vetítsünk merőlegesen mindkét képsíkra! Jelöljük a
merőleges vetületeket rendre P′-vel és P″-vel! Az első vetületet nevezhetjük felülnézetnek, míg a másodikat elölnézetnek. A
P, P′, P″ pontok egy olyan V síkot határoznak meg, mely mindkét képsíkra merőleges. Könnyen belátható, hogy x12
merőleges V-re. A V és a K1 síkok metszetén felvett tetszőleges P′ (P′ ∈ V, P′ ∈ K1) és a V és K2 metszetén felvett tetszőleges P″
(P″ ∈ V, P″ ∈ K2) képpontok a P pont térbeli helyzetét egyértelműen meghatározzák. Ugyanis a P′ pontban a K1 képsíkra, míg
P″-ben a K2 képsíkra állított merőleges egyenesek metszete a térbeli P pont. Így a P ponthoz a (P′, P″) pontpárt kölcsönösen
egyértelműen hozzárendeltük.

7.22. ábra

A P, P′, P″ pontok által meghatározott síknak az x12 képsíktengellyel való metszéspontja legyen a Px pont. Ekkor a P, P′,
P″, Px pontok egy vetítő téglalapot határoznak meg (7.23. ábra). A merőleges vetítés tulajdonságaiból következik, hogy a P
pont K1 képsíktól való távolságát („magasságát”) P″Pz = PP′ adja, míg a K2 képsíktól való távolsága P′Pz = PP″-vel egyenlő. A
képsíktengely által határolt fél képsíkokat előjellel látjuk el. Jelöljük a K1 képsík „hozzánk közelebbi” felét + jellel, a másikat
– jellel, továbbá a K2 képsík „felső” felét + jellel, az „alsót” – jellel, majd a két képsíkot egyesítsük, forgassuk egymásba az x12
képsíktengely körül úgy, hogy a és a , illetve a és a félsíkok fedésbe kerüljenek!

7.23. ábra

A két képsíkot egymásba forgatással egyesítettük, a kapott síkot a rajz síkjának tekinthetjük. A P′P″ szakasz egyenesét
rendezőegyenesnek, az r1 = P′Px szakaszt első rendezőnek, az r2 = P″Px szakaszt második rendezőnek nevezzük. Mivel a P, P′,
P″, Px pontok síkja merőleges mindkét síkra, így az x12 tengelyre is, ezért a rendezők is mindig merőlegesek az x12 tengelyre.
(Az első rendező a térbeli P pont K2 képsíktól való távolságát, a második rendező a P pont K1 képsíktól való távolságát adja.)
7.24. ábra

Ha két különböző térbeli pont első vetületei megegyeznek, azaz közös az első vetítőegyenesük, akkor azokat első
fedőpontoknak, ha a második képeik egyeznek meg, akkor második fedőpontoknak nevezzük. A 7.24. ábrán az U és V
pontok első fedőpontok, az R és S pontok pedig második fedőpontok.

Egyenes ábrázolása
A tér egy általános helyzetű e egyenesének e′ első vetülete az e egyenes első vetítősíkjának az első képsíkkal való metszete.
Az e egyenes e″ második vetülete az e egyenes második vetítősíkjának a második képsíkkal való metszete (7.25. ábra). A
merőleges vetítés tulajdonságaiból következik, hogy egy általános helyzetű e egyenes vetületei egyenesek. (Speciális
esetben lehet pont az egyik vetület.) Az egyenes vetületeiből az egyenes rekonstruálható. Ugyanis, ha az első képsíkra
illeszkedő tetszőleges e′ egyeneshez tartozó első vetítősíknak és a második képsíkra illeszkedő tetszőleges e″ egyeneshez
tartozó második vetítősíknak a metszete egyenes, akkor a metszet a térbeli e egyenes. Ha a két vetítősík egybeesik, akkor
nem egyértelmű a vetületekből történő rekonstrukció. Bármely ebben a közös vetítősíkban fekvő egyenes megfelel. Ha a
két vetítősík párhuzamos, akkor e′ és e″ nem lehetnek egy egyenes vetületei.

7.25. ábra

Az egyenest két pontja egyértelműen meghatározza. Legyen adott a g egyenes P és Q pontjaival (7.26. ábra). Először
ábrázoljuk a pontok vetületeit, majd a kapott vetületek alapján megrajzolhatjuk a g′ = P′R′ és a g″ = P″R″ egyeneseket, melyek
a g egyenes vetületei. Az általános helyzetű g egyenesnek az első képsíkkal való G1 metszéspontját (ha létezik) első
nyompontnak, míg a második képsíkkal való G2 metszéspontját (ha létezik) második nyompontnak nevezzük. A 7.26.
ábráról a nyompontok szerkesztése leolvasható.

7.26. ábra

Speciális egyenesek
Az első képsíkra merőleges v1 egyenest első vetítőegyenesnek, a második képsíkra merőleges v2 egyenest második
vetítőegyenesnek nevezzük. Ábrázoló geometriai szerkesztések során nagyon sokszor használjuk a képsíkokkal
párhuzamos úgynevezett fővonalakat (főegyeneseket). Az első képsíkkal párhuzamos f1 egyenest első fővonalnak, a
másodikkal párhuzamos f2 egyenest második fővonalnak nevezzük. Az x12 képsíktengelyre merőleges p egyenest, amely
nem vetítőegyenes, pro legyenesnek nevezzük.
A v1 első vetítőegyenes első képe pont, második vetülete az x12 képsíktengelyre merőleges egyenes (7.27. ábra). A v2
második vetítőegyenesnél fordított a helyzet. A p pro legyenes mindkét vetülete merőleges x12-re (és a vetületek
egybeesnek).
7.27. ábra

Az f1 első fővonal második, az f2 második fővonalnak pedig az első vetülete párhuzamos a képsíktengellyel (7.28. ábra).

7.28. ábra

Két nem egybeeső egyenes kölcsönös helyzete háromféle lehet, metsző, párhuzamos vagy kitérő. A merőleges vetítés
tulajdonságaiból következik, hogy az általános helyzetű metsző egyenesek mindkét vetülete metsző egyenespár, és a
képegyenesek metszéspontjai egy rendezőegyenesre esnek (7.29. ábra). Teljesül továbbá az is, hogy ha két egyenes mindkét
vetületén a metszéspontok egy rendezőn vannak (kivéve, ha az egyik vagy mindkettő pro legyenes), akkor az egyenesek a
térben is metszik egymást.
Általános helyzetű párhuzamos egyenesek mindkét vetülete párhuzamos egyenespár. Megfordítva, ha két egyenes
mindkét vetülete párhuzamos egyenespár (kivéve a pro legyenesek), akkor a térbeli egyenesek is párhuzamosak. A 7.30.
ábrán a c és a d egyenesek párhuzamosak.
Ha a nem egysíkú, azaz kitérő egyenesek mindkét vetületének van metszéspontja, akkor a metszéspontok nincsenek
egy rendezőn. Speciális helyzetben a kitérő egyenesek valamelyike lehet vetítőegyenes is. A 7.31. ábrán a p és a q egyenesek
kitérő helyzetűek. A fedőpontok vizsgálatával a vetületekből is meg tudjuk állapítani a két kitérő egyenes egymáshoz
viszonyított térbeli elhelyezkedését, és azt a vetületeken szemléltetni is tudjuk. A 7.31. ábrán a P ∈ p és a Q ∈ q első
fedőpontok megkeresésével szemléltetni tudjuk a felülnézeten a két egyenes láthatósági viszonyát.

7.29. ábra

7.30. ábra
7.31. ábra

Sík ábrázolása
Egy sík ábrázolásánál a síkot meghatározó alakzatokat ábrázoljuk. Így két metsző egyenessel, egy párhuzamos
egyenespárral, egy egyenessel és egy rá nem illeszkedő ponttal, három, nem egy egyenesre illeszkedő ponttal
(háromszöggel) (7.32. ábra) adhatjuk meg a síkot.

7.32. ábra

Speciális síkok
A képsíkrendszerhez képest speciálisan elhelyezkedő síkok közé tartoznak a már említett vetítősíkok. Ha egy sík az első
képsíkra merőleges, akkor első, ha a másodikra, akkor második vetítősík. A 7.33. és a 7.34. ábrán metsző és párhuzamos
egyenesekkel megadott első vetítősíkok láthatók. Az egyenesek első vetületei egybeesnek, ezért első fedőegyeneseknek
nevezzük őket. Hasonlóan lehet értelmezni második fedőegyeneseket is.

7.33. ábra
7.34. ábra

Síkra illeszkedő egyenesek és pontok


Ha egy egyenes két pontja illeszkedik a síkot meghatározó alapelemekre, akkor az egyenes is illeszkedik a síkra. A 7.35.
ábrán az a és b párhuzamos egyenesekkel megadott síkra illesztettük az e egyenest. A sík speciális egyenesei a sík első és
második fővonalai. A 7.36. ábrán egy f1 első fővonalat illesztettünk a c és d metsző egyenespárral megadott síkra. Először f1
második képét vesszük fel, mely az x12 képsíktengellyel párhuzamos, majd meghatározzuk a fővonal első vetületét is. (A
metszéspontok képei egy rendezőn vannak.)
Síkra egy általános helyzetű pontot a síkra illeszkedő segédegyenes segítségével tudunk felvenni. Először egy egyenest
illesztünk a síkra, majd egy erre az egyenesre illeszkedő pontot. A 7.37. ábrán az A, B és C pontokkal megadott síkon egy
általános helyzetű P pontot vettünk fel.

7.35. ábra

7.36. ábra

7.37. ábra

Helyzetgeometriai feladatok

Sík és egyenes, síkok párhuzamossága


Metsző térelemek
Új képsíkok bevezetése, nézetek
Képsík-transzformáció általában
Sík és egyenes, síkok párhuzamossága
Egy egyenes akkor és csakis akkor párhuzamos egy síkkal, ha az egyenes párhuzamos a sík egy egyenesével, és nem
illeszkedik a síkra. A 7.38. ábrán a g egyenes párhuzamos az ABC síkkal (a síkra illeszkedő e egyenessel párhuzamos). Két sík
akkor párhuzamos egymással, ha nincs közös pontjuk. A 7.39. ábrán a párhuzamos síkokat két háromszöggel (melyek
megfelelő oldalai párhuzamosak) adtuk meg.

7.38. ábra

7.39. ábra

Metsző térelemek
Metsző egyenesek ábrázolásával már foglalkoztunk. A következőkben egyenes és sík, valamint két sík metszetének
szerkesztését tárgyaljuk.
Sík és egyenes közös pontjának, döféspontjának (metszéspontjának) szerkesztése egyszerű, ha vagy a sík, vagy az
egyenes speciális helyzetű.
Legyen a V sík első vetítősík. A sík első vetülete, a V′ egyenes tartalmazza a sík minden pontjának első képét (7.40.
ábra). Így az e egyenes e′ első képének és V′-nek közös pontja a D = V ⋂ e metszéspont első képe. A döféspont második képét
rendezőegyenessel jelöljük ki az e″ képegyenesen.
Ha az e egyenes vetítőegyenes, akkor a szerkesztés a következő. A 7.41. ábrán a síkot az ABC háromszöggel adtuk meg,
az e egyenes pedig második vetítőegyenes. Ennek második képe az e″ pont. Ez egyben minden pontjának második képe,
tehát a döfésponté (D″) is. A D pontot az s segédegyenessel illesztettük az ABC síkra.
Az általános helyzetű S sík e egyenessel való D döféspontjának szerkesztésénél úgy járunk el, hogy az e egyenesre
illesztünk egy tetszőleges U segédsíkot (7.42. ábra). Megszerkesztjük S és U metszésvonalát, az m egyenest (m = S ⋂ U). Az e
és az m egyenesek metszéspontja eleme az S síknak is és az e egyenesnek is, tehát D = m ⋂ e.

Példa. A szerkesztés konkrét kivitelezésénél az egyszerűség kedvéért az U segédsíkot speciálisan vesszük fel,
általában vetítősíkot célszerű választani. A 7.43. ábrán az S síkot az ABC háromszöglemezzel adtuk meg. Az e
egyenesre az U első vetítősíkot illesztettük, ennek U′ első képe azonos e′-vel. Az m = S ⋂ U egyenes első vetülete
egybeesik az U′ első képpel (m eleme U-nak). Ugyanakkor m benne van az S = ABC síkban is, ezért második képe
megszerkeszthető. Az m″ és e″ képegyenesek közös pontja D″, a sík és egyenes döféspontjának második képe. Ebből a
D′ első képpontrendezéssel adódik. A lemezt átlátszatlannak tekintve szemléltethetjük a síklemez és egyenes térbeli
helyzetét (az elöl- és a felülnézetet is láthatóság szerint kihúztuk). A láthatósági viszonyokat fedőpontok segítségével
állapítottuk meg.

7.40. ábra

7.41. ábra

7.42. ábra

7.43. ábra

Ha ismerjük két sík két közös pontját, akkor ismerjük metszésvonalukat is, ugyanis a két pontot összekötő egyenes a
metszésvonal. Ezért arra törekszünk, hogy megszerkesszük a két sík két közös pontját. Ezt elérhetjük úgy is, hogy
előállítjuk az egyik sík tetszőleges két egyenesének a másikkal alkotott döféspontjait. Egyszerű a metszésvonal
szerkesztése, ha a két egymást metsző sík valamelyike vetítősík. Ekkor a vetítősík egyik képe azonos az m metszésvonal
ugyanazon képével. A másik kép síkra illesztéssel szerkeszthető.

Példa. A 7.44. ábrán a síkokat az A, B és C nem egy egyenesre eső pontokkal, illetve a g és h párhuzamos egyenesekkel
adtuk meg. A két sík metszésvonalát megkapjuk, ha megszerkesztjük az előző feladat alapján a g és h egyeneseknek
az ABC síkkal alkotott G és H döféspontjait.

7.44. ábra

7.45. ábra

Két síkidom metszete a két sík metszésvonalának az a része, melyet mindkét síkidom tartalmaz.

Példa. A 7.45. ábrán az ABC háromszöglemez és az XYZU paralelogrammalemez közös részét, metszetét
szerkesztettük meg. Meghatározása céljából először az XY paralelogrammaoldal egyenesének ABC síkkal való M
döféspontját szerkesztettük meg, majd az UZ oldalegyenes ABC síkkal alkotott N döféspontját (a síkkal, nem a
háromszöglemezzel!). Az MN metszésvonal mindkét síkidomhoz tartozó szakasza a két lemez metszete. A
láthatóságot úgy tüntettük fel, hogy mindkét lemezt átlátszatlannak tekintettük.

Új képsíkok bevezetése, nézetek


Az alakzatot, melyet ábrázolni akarunk, helyezzük el a és a által határolt térrészben, az úgynevezett első
térnegyedben. Mint már említettük, az első vetület a felülnézet, a második vetület az elölnézet. Vegyünk fel egy K1-re és K2-
re merőleges K3 új képsíkot (7.46. ábra)! A K2 és a K3 képsíkok metszete az x23 képsíktengely. Vetítsük a P pontot K3-ra
merőlegesen, a kapott P′″ pont a P pont harmadik vetülete. A P, P″, P′″ pontok által meghatározott síknak az x23
képsíktengellyel való metszete legyen a Py pont. Az r3 = P′″Py szakaszt a P pont harmadik rendezőjének nevezzük. A három
képsíkot egyesítjük a képsíktengelyek körül való forgatással. A K3 képsíkot az x23 képsíktengely körül a K2 képsíkba
forgatjuk be az ábra szerint, majd a K1 és a K2 képsíkokat a szokásos módon egyesítjük. A beforgatás után a P″P′″ szakasz
merőleges x23-ra, és r1 = r3. A fentiek alapján bevezetett harmadik vetületet balnézetnek hívjuk.

7.46. ábra

A 7.47. ábrán egy alakzat három vetülete, elölnézete, felülnézete és balnézete látható.

7.47. ábra

A műszaki ábrázolásban további képsíkokat is bevezetnek. Az alakzat „bal oldalára”, a K1 és a K2 képsíkokra merőleges,
K3-mal párhuzamos K4 negyedik képsíkot a jobbnézet számára. A K1, K2, K3 és K4 képsíkok úgy helyezkednek el, mintha egy
kocka lapjainak síkjai lennének. Ezért szemléletesen az ábrázolni kívánt alakzat, műszaki alkatrész köré egy kockát
képzeljünk el, és ennek lapjaira vetítjük az alakzatot merőlegesen (7.48. ábra). Majd a kocka lapjait (képsíkokat) a kocka élei
(képsíktengelyek) körül egymásba, legvégén az elölnézet síkjába forgatjuk a 7.48. ábrának megfelelően.

7.48. ábra

Már az eddigiekben is találkoztunk olyan szerkesztésekkel (pl. 7.45. ábra), melyeknek megoldása során a
képsíktengelynek semmilyen szerepe nem volt. Ha a képsíktengelyt „lejjebb” vagy „feljebb” vesszük fel, annak
következménye csupán annyi, hogy a képsíkrendszer az ábrázolt alakzathoz képest eltolódik. Mivel számos feladat
szempontjából az alakzatoknak a képsíkrendszerhez viszonyított helyzete egy eltolás erejéig közömbös, ezért bizonyos
esetekben a képsíktengely megrajzolását mellőzhetjük. A továbbiakban, ha nem szükséges, a képsíktengelyeket nem
rajzoljuk meg. Az egyes vetületek között levő képsíktengelyeket a műszaki ábrázolásban nem rajzolják meg.
Az alakzatot használatának megfelelően helyezzük el. Törekedjünk továbbá arra is, hogy az alakzatról az elöl-, felül- és
valamely oldalnézete (lehetőleg a balnézete) a legtöbbet mutasson meg az alakzatból. Ha szükséges, akkor további
nézeteket is alkalmazunk.

Képsík-transzformáció általában
A képsík-transzformáció lényege az, hogy a képsíkrendszer (K1 és K2) valamelyik képsíkjához egy újabb, célszerűen
választott (K5) képsíkot veszünk fel, amely az egyik képsíkra merőleges, de nem feltétlenül merőleges mindkettőre. A 7.49.
ábrán a K1-re merőleges K5 képsíkot vettünk fel, metszetük az x15 képsíktengely. A P pont K5-re való merőleges vetülete a PV
pont. (Több vessző helyett római számokat használunk „felső” indexben.) A K2 képsíkot a szokásos módon, a K5 képsíkot
pedig az x15 képsíktengely körül forgassuk be a K1 képsíkba az ábrának megfelelően! A P″ ponthoz tartozó r2 és a PV ponthoz
tartozó r5 rendező is a P pont K1 képsíktól való távolságával egyenlő, ezért a képsíkok egyesítése után is igaz, hogy r2 = r5.
7.49. ábra

Példa. A 7.50. ábrán a már bemutatott alakzatról készítsünk egy ferde, első képsíkkal párhuzamos nyíl irányú
nézetet! Az alakzat csúcspontjait a 7.49. ábra szerint szerkesztettük meg.

7.50. ábra

A képsík-transzformációt nem csupán az első képsíkra merőlegesen felvett új képsík segítségével alkalmazhatjuk,
hanem a második képsíkra merőlegesen is vehetünk fel új képsíkot. A következőkben erre látunk egy példát.

Példa. Néhány alkatrész esetén az egyes részletek jobb bemutatása, méretezhetősége miatt is szükséges úgynevezett
ferde vetületet, segédnézetet készíteni. A 7.51. ábrán látható alakzatról készítettünk egy olyan új nézetet, melyen a
„ferde rész” is valódi nagyságban látszódik. A szerkesztés az ábráról leolvasható. (Az AV pont szerkesztését
részleteztük, r1 = r5.)

7.51. ábra

Metrikus feladatok
Az alábbiakban három módszert ismertetünk, melyek alkalmazásával poliéderek metrikus adatait szerkeszthetjük meg.

Metrikus adatok szerkesztése képsík-transzformációval


Sík képsíkba forgatása
Különbségi háromszög
Poliéderfelület síkba fejtése

Metrikus adatok szerkesztése képsík-transzformációval


A módszer lényege az, hogy alkalmasan választott képsíkra vetítve, a metrikus adat a vetületi ábrán leolvasható.

Példa. Szerkesszük meg egy ABC alapú, M csúcsú gúla BCM oldallapjának, illetve BM oldalélének az alaplappal
bezárt szögét!
A 7.52. ábrán mindkét szöget egy-egy alkalmas transzformációval határoztuk meg. Az alaplap és a BCM oldallap
közös egyenesének irányával, azaz a BC alapéllel párhuzamosan transzformáljuk a gúlát. (A vetítés irányát az első
képsíkkal párhuzamos 1-es jelű nyíl mutatja.) Az ötödik képen a BC él vetülete egy pont, a keresett két sík szöge α =
AVBVMV. A BM oldalél alaplappal bezárt szögének meghatározásához a BM él vetítősíkjára merőleges irányban
transzformáltunk (a 2-es nyíl B′M′-re merőleges és az első képsíkkal párhuzamos). Az így kapott hatodik vetületen a
keresett szög β=AVIBVIMVI. A képsíktengelyeket nem jelöltük, azok egybeesnek (egybeeshetnek) a gúla alapjának
második, ötödik és hatodik vetületével.
7.52. ábra

Sík képsíkba forgatása


Ha egy síkbeli alakzat a képsíkban vagy a képsíkkal párhuzamos síkban helyezkedik el, akkor a szóban forgó képsíkra eső
merőleges vetülete az alakzattal egybevágó. Ezt a helyzetet úgy érjük el, hogy a sík egy képsíkban fekvő vagy azzal
párhuzamos egyenese körül forgatjuk el a síkot a fenti helyzetbe. A módszert a következő példán keresztül mutatjuk be.

Példa. A 7.53a–b ábrán az ABC alaplapú, M csúcspontú, első képsíkon álló gúla BCM lapjának valódi alakját
szerkesztettük meg. A BC él az első képsíkban van, ezért a BCM oldallapot a BC szakasz egyenese, a forgatás tengelye
körül az első képsíkba tudjuk forgatni. Az így leforgatott képen az oldallap valódi adatait olvashatjuk le. A képsíkba
forgatott pontokat és egyeneseket zárójellel jelöljük.
A forgatás során minden pont egy körív mentén mozog, melynek síkja a forgatás tengelyére merőleges. A 7.53a ábrán
az M ponthoz tartozó körívet rajzoltuk le. Legyen az MY szakasz a BCM lap magassága, azaz MY ⊥ BC, ekkor az (M)
(Y) szakasz a (B)(C)(M) leforgatott lap magassága, azaz (M)(Y) ⊥ BC. Teljesül továbbá, hogy MY = (M)(Y), ez az M
ponthoz tartozó körív sugara.
A fentiek alapján szerkesztettük meg a BCM oldallap leforgatott képét a 7.53b ábrán. A felülnézeten az M′ pontból a
B′C′ egyenesre merőleges egyenest állítva kapjuk az Y′ pontot. A BCM lap második vetítősík, ezért a lap magassága a
második képen valódi méretében látszódik. Így az Y′M″ szakaszt az Y″ ponttól fölmérve az M′Y′ egyenesre kapjuk (M)
-et. A BCM lapra illeszkedő, általános helyzetű X pontot egy rajta áthaladó egyenes segítségével forgattuk le az ábra
alapján. Megjegyezzük, hogy a B′C′M′ oldallap és a (B)(C)(M) leforgatottja között egy merőleges a nitás van,
melynek tengelye a B′C′ egyenes és megfelelő pontpárja M′ és (M).

7.53. ábra

Különbségi háromszög
A metrikus feladatok megoldásának alapvető eleme két pont távolságának, azaz egy szakasz hosszának meghatározása. Két
pont távolságának meghatározásánál gyakran alkalmazzák a különbségi háromszög módszerét.
Példa. A 7.54. ábrán e módszerrel szerkesztettük meg a PQ szakasz valódi hosszát. Ha a P′Q′ vetületet eltoljuk a Q
pontba, akkor térben a PQX derékszögű háromszöget kapjuk, ahol a QX = P′Q′ és a PX=P″X″ = PP′ – QQ′, azaz az egyik
befogó hossza a PQ szakasz felülnézetének hossza, a másik befogó a P és a Q pontok második rendezőinek
különbsége. A PQX derékszögű háromszöget különbségi háromszögnek nevezzük. A 7.54. ábrán a különbségi
háromszöget kétféleképpen is megszerkesztettük.

7.54. ábra

Poliéderfelület síkba fejtése


A poliéderfelületet megfelelő számú él mentén felvágva és a poliéderlapokat a fel nem vágott élek körül elforgatva egy, a
poliéderlapokból álló összefüggő síkbeli alakzatot, a kiterített poliéderfelület hálózatát (síkba fejtését, kiterítését) kapjuk.
A poliéder hálózatának megszerkesztéséhez, a poliéder lapjainak valódi alakját, éleinek valódi hosszát kell
meghatároznunk. A lapokat háromszögekre bontva talán legegyszerűbben a különbségi háromszög módszerét
alkalmazhatjuk.

Példa. A 7.55. ábrán egy ABCD négyszög alapú M csúcspontú gúla palástjának síkba fejtését szerkesztjük meg. A gúla
oldaléleinek hosszát különbségi háromszögek segítségével adjuk meg. Az alapélek az első képsíkra illeszkednek,
ezért felülnézetük hossza a valódi hosszukkal egyenlő. A gúla palástját az AM oldalél mentén vágjuk fel, és az
oldallapokat az ábrának megfelelően egymáshoz illesztve a gúla palástjának síkba fejtett képéhez, az AkBkCkDkAkMk
hatszöghöz jutunk. A hajtáséleket kétpontvonallal jelöljük. Az ABM lapra illeszkedő X pont kiterített képen való
megszerkesztéséhez az X pontra illeszkedő két szakaszra van szükségünk. Az egyik az M ponton átmenő, a másik az
AB alapéllel párhuzamos szakasz. Az ábrán jelölt Yk pont szerkesztésénél vegyük gyelembe, hogy A′Y′ = AkYk. Az X
pontra illeszkedő AB-vel párhuzamos egyenes és az AM alkotó metszete legyen a Z pont. Az MZ szakasz valódi
hosszának megszerkesztéséhez tartozó különbségi háromszöget megkapjuk, ha a Z″ pontot az ábrának megfelelően
(a Z″X″ szakasz meghosszabbításával) átvetítjük az AM jelű élre. Az Xk pont az MkYk szakasz és a Zk ponton áthaladó,
az AkBk-val párhuzamos szakasz metszeteként adódik.

7.55. ábra

Néhány alkalmazás

Poliéderek síkmetszete
Poliéderek áthatása

Poliéderek síkmetszete
A síkmetszet egy vagy több töröttvonalból (metszetsokszög(ek)) áll. Megszerkesztésükre általában az alábbi két módszert
alkalmazzuk.
Lapmódszer. Ebben az esetben a síkmetszet éleit szerkesztjük meg. A síkmetszet élei ugyanis a poliéderfelület lapjainak
metszetei a metszősíkkal. A szerkesztést két sík metszésvonalának megszerkesztésére vezetjük vissza.
Élmódszer. Ilyenkor a síkmetszet csúcsait szerkesztjük meg. A síkmetszet csúcsai a poliéder éleinek a metszősíkkal
való döféspontjai. Azokat a döféspontokat köthetjük össze, melyek a poliéderfelület ugyanazon lapján vannak. Így nyerjük
a síkmetszet éleit. Itt a szerkesztést sík és egyenes döféspontjának szerkesztésére vezetjük vissza.
Ha metszősík első vagy második vetítősík, akkor a fenti metszéspontok szerkesztése egyszerű.

Példa. A 7.56. ábrán az négyoldalú ferde hasáb metszetét szerkesztettük meg a V második vetítősíkkal
az élmódszer alkalmazásával. A szerkesztést az ábrán nyomon követhetjük.

7.56. ábra

A síkba fejtést is elvégezzük, a kiterítésen megjelöljük a síkmetszetet is. Az oldalparalelogrammák valódi alakját a
korábban ismertetett módon szerkesztjük. (Például az lap esetén az háromszög valódi alakját
szerkesztjük, majd paralelogrammává egészítjük ki.) Az alap és a fedőlap kiterítése könnyen elvégezhető, mert a
négyszögek valódi alakja a felvétel miatt az első vetületről leolvasható. A metszet csúcsait segédábra felhasználásával
adtuk meg a kiterítésen.
A hasáb oldalélekre merőleges síkkal való metszete a normálmetszet. Az 7.56. ábrán az S síkkal való metszet
normálmetszet. Az S síkot most könnyen felvehettük, hiszen az ábrán a hasáb oldalélei a második képsíkkal
párhuzamosak, így S második vetítősík, azaz S″ egyenes. A normálmetszet a síkba fejtésen szakasz, mely a hasáb
oldaléleire merőleges. A 7.56. ábrán megadtuk a normálmetszet valódi alakját is képsík-transzformáció
alkalmazásával.

Ha a metszősík általános helyzetű, akkor az általános helyzetű síkot célszerű vetítősíkká transzformálni. Az új
képsíkot a metszősík valamelyik fővonalára merőlegesen vesszük fel. Ezután a fentiek szerint járunk el. Ha egy poliédert
véges síklemezzel metszünk el, akkor itt is célszerű a lemez síkjával való metszetét megszerkeszteni, és csak ezután
gyelembe venni a metszetlemez által tartalmazott részét.

7.57. ábra

Példa. Szerkesszük meg az ABCDEFM szabályos hatoldalú gúlának az 1234 paralelogrammalemezzel való metszetét!
A 7.57. ábrán képsík-transzformációt alkalmazunk, a negyedik képsík a paralelogramma síkjának f1 első fővonalára
merőleges. A paralelogramma 2 és 3 jelű csúcsait transzformáltuk, így szerkesztettük meg az U = 1234 sík negyedik
képét. Az U síkkal való metszet az előbbi résznél leírt módon szerkeszthető. Ez a GHJKLPQ sokszög, melynek oldalait
vékony vonallal jelöltük az ábrán. Ezután vettük a paralelogrammalemez és a GHJKLPQ sokszög metszetét. Ez lesz a
gúlafelület metszete az 1234 lemezzel. Az ábra láthatóság szerinti kihúzásánál a gúlát és a lemezt átlátszatlannak
tekintettük.
Poliéderek áthatása
Két poliéder közös része síkidomok metszésvonalaiból, tehát szakaszokból áll, amely rendszerint térbeli töröttvonal
(esetleg több különálló részből álló töröttvonal rendszeréből áll). Neve áthatási töröttvonal, melyet a következőképpen
szerkeszthetünk meg.
Lapmódszer. Az áthatási töröttvonal éleit szerkesztjük, melyek egy-egy poliéderlap metszeteként keletkeznek. A
szerkesztést két síklemez metszetének szerkesztésére vezethetjük vissza.
Élmódszer. Az áthatási töröttvonal(ak) csúcspontjait adjuk meg oly módon, hogy az egyik poliéder éleinek a másik
poliéder lapjaival való közös pontjait szerkesztjük, majd fordítva. Az áthatási töröttvonal éleit ezen csúcsok megfelelő
öszszekötésével nyerjük. Két csúcsot akkor kötünk össze, ha azok az egyik és a másik poliédernek is ugyanazon lapján
vannak.
Az alábbiakban tárgyalt két példában az élmódszert alkalmazzuk.

Példa. A 7.58. ábrán az első képsíkon álló ABCM háromoldalú gúla és egy háromoldalú hasáb áthatását szerkesztettük
meg, az hasáb e, f, g oldalélei a második képsíkra merőlegesek, az oldallapok második vetítősíkokban
vannak.
Az élmódszerrel járunk el. Az áthatási töröttvonal (poligon) második vetülete rajta van az EFG háromszög második
képén. A gúla élei közül csak az MC él metsz bele a hasábba, mégpedig az 1 és 2 pontokban. Az 1 és 2 pontok második
képei közvetlenül adódnak, az első képeket rendezéssel nyerjük. A hasáb oldalélei közül csak az e jelű metszi a gúlát.
Ez a második vetületről közvetlenül leolvasható. A 3 és 4 döféspontok szerkesztésénél a hasáb e élére az első képsíkkal
párhuzamos V segédsíkot illesztünk. Ennek a gúlafelülettel való metszetét szerkesztjük. A metszet első képének az e′
éllel való metszéspontjai adják a 3 és a 4 pont első vetületét. Megszerkesztettük tehát az áthatási töröttvonal csúcsait.
A 2 és a 3 pontok a gúla ACM lapján, a hasáb eg lapján vannak, így összeköthetők. Hasonlóan az 1 és a 3 pontok
egyrészt a gúla AMC lapján, másrészt a hasáb ef lapján vannak, tehát az áthatási töröttvonal élét határozzák meg.
Könnyen adódik, hogy az áthatási töröttvonal az 1, 3, 2, 4 csúcsokkal rendelkező négyszög lesz.
A láthatóságot úgy tüntettük fel, mintha a hasábot eltávolítottuk, „kitoltuk” volna.
Példa. A 7.59. ábrán az és az háromszög alapú hasábok áthatását szerkesztettük meg.
Az áthatási töröttvonal első vetülete könnyen megadható, hiszen az első vetítő helyzetű hasáb oldallapjai első
vetítősíkokban vannak. A felülnézetről közvetlenül leolvasható, hogy csak az élek metszenek bele a vetítő
helyzetű, a K1-en „álló” hasábba, a metszéspontok 1, 3, 2, 4. Az is leolvasható az első vetületről, hogy az „álló”
hasábnak csak a éle metsz bele a másik hasábba. Ennek 5 és 6 döféspontjait szerkesztjük meg a élre
illesztett első vetítősík alkalmazásával. Ez az hasábból az 1, 2, N csúcsokkal rendelkező
háromszöget metszi ki. Ahol a háromszög második képét B″ metszi, ott van 5″ és 6″. Végül az azonos lapon levő
pontokat összekötve megadjuk az áthatási töröttvonalat. A láthatóságot is feltüntettük, mégpedig oly módon,
mintha a két felületet egyesítettük volna.

7.58. ábra
7.59. ábra

7.60. ábra

A metrikus feladatok és metszési feladatok megoldásánál kedvező volt, ha az alakzatok a képsíkokhoz képest
speciálisan helyezkedtek el. Ennek érdekében sokszor képsík-transzformációt alkalmaztunk.
Képsík-transzformációt alkalmazhatunk azonban a képsíkokhoz képest speciálisan elhelyezkedő alakzatokra annak
érdekében is, hogy szemléletesebb képet szerkesszünk róluk. Ilyenkor esetleg többször is transzformáljuk az alakzatot. A
7.60. ábrán a K6 képsík a K5 képsíkra merőleges.
Szemléltető ábrák szerkesztésére szolgál a következő ábrázolási módszer is.

7.3. Axonometrikus ábrázolás


A műszaki ábrázolásban a képsíkokhoz képest az ábrázolni kívánt tárgyat lehetőség szerint speciálisan veszik fel. Például
azért, hogy a méretezést el lehessen végezni. Ez a képiesség rovására megy, a vetületek alapján nehéz elképzelni a tárgyat,
amit ábrázoltunk. (A pontok vetületeit a műszaki ábrázolásban nem jelöljük betűkkel, számokkal.) Az axonometrikus
ábrázolás módot nyújt arra, hogy egy új, általános helyzetű képsíkon ábrázoljunk speciális vetületekkel megadott
alakzatokat. Ezáltal a kapott kép szemléletesebb lesz.

Ábrázolás általános axonometriában


Speciális axonometriák

Ábrázolás általános axonometriában


Ennél az ábrázolási módszernél az ábrázolni kívánt alakzatot (esetleg célszerűen választott) térbeli derékszögű koordináta-
rendszerbe helyezzük, és ezzel együtt párhuzamosan vetítjük a K képsíkra.
A jobbrendszert alkotó x = OEx, y = OEy, z = OEz páronként merőleges félegyenesek jobbsodrású derékszögű koordináta-
rendszert alkotnak (7.61. ábra). Az O pont a koordináta-rendszer kezdőpontja, az origó. Ha OEx = OEy = OEz = 1, akkor az Ex,
Ey, Ez pontokat egységpontoknak nevezzük. Az OEx, OEy, OEz irányított szakaszok az (O; Ex, Ey, Ez) tengelykeresztet
alkotják. A térbeli P pont derékszögű koordinátáit az előbbi koordináta-rendszerben a következőképpen kapjuk meg.
Jelöljük P′-vel (7.62. ábra) a P pont merőleges vetületét az xy koordinátasíkon. Húzzunk P′-n át az y és az x tengelyekkel
párhuzamos egyeneseket, és keressük meg a tengelyekkel alkotott metszéspontokat, a Px és a Py pontokat. Húzzunk P-n át
OP′-vel párhuzamos egyenest. Ez a z koordinátatengelyt a Pz pontban metszi. Nyilván OPz = P′P. Az OPx, OPy, OPz irányított
szakaszok előjeles hosszai adják a P pont derékszögű koordinátáit. A P pont derékszögű koordinátáit zárójelben a pont jele
mögé írjuk, P(x, y, z). (Megemlítjük, hogy vektorok segítségével is értelmezhetők a derékszögű koordináták.)

7.61. ábra

7.62. ábra

Vetítsük a derékszögű koordináta-rendszert v irányban a K képsíkra. Legyen olyan a koordináta-rendszer és a vetítés


iránya, hogy egyik koordinátasík se legyen vetítősík. A vetítés után az eredetileg egyenlő OEx, OEy, OEz szakaszok már nem
feltétlenül egyenlők. A párhuzamos vetítés osztóviszonytartó és párhuzamosságtartó leképezés. Így az OPxP′P töröttvonal
képét a fentiek alapján könnyen megrajzolhatjuk. Ezáltal a P(x, y, z) pont ismeretében a P pont Pa axonometrikus képe
szerkeszthető. Ugyanis .
A K képsíkot axonometrikus képsíknak, az alakzat vetületét axonometrikus vetületnek (képnek) nevezzük. Ha az
axonometrikus vetítősugár merőleges a képsíkra, merőleges (ortogonális) axonometriáról beszélünk. Más esetben pedig
ferdeszögű (klinogonális) az axonometria.

Példa. Az 7.63a–b ábrán egy alakzat két vetületét adtuk meg, és az ábra szerint vettük fel a derékszögű koordináta-
rendszert. Az alakzat csúcspontjainak derékszögű koordinátáit megadtuk. Például a P pont esetén: (2, 1, 2). Ezután az
axonometrikus kép az adott tengelykereszt ismeretében a már az előzőekben leírt módon szerkeszthető.
Felhasználtuk a párhuzamos vetítés azon tulajdonságát is, hogy nem egy vetítősíkban fekvő párhuzamos egyenesek
vetületei párhuzamos egyenesek.

A műszaki ábrázolásban az alakzat egyértelmű rekonstrukciójához megfelelő számú nézetet adnak meg. Az 7.64. ábrán
egy tárgy három fő nézetét és a képsíkrendszerhez rögzített axonometrikus koordináta-rendszert adtuk meg. Itt is először
az xy síkban levő vetületet szerkesztjük meg. A pontok z koordinátáit az elöl-, illetve oldalnézetek segítségével olvashatjuk
le. Ebben az esetben a tengelyirányú rövidüléseket adtuk meg.

7.63. ábra
7.64. ábra

A tengelyirányú rövidüléseket qx, qy, qz-vel jelöljük és a következőképpen értelmezzük:

A tengelyirányú rövidülés és a tengelyen levő egységpont ismeretében a

koordinátatengely vetületén is megadható az egységpont. Ha például egység, akkor az x tengelyen és

az x tengellyel párhuzamos egyeneseken minden szakasz a felére csökken, .


Az előző példákban tetszőlegesen választottuk meg a tengelykereszt vetületét. Nyilvánvaló a kérdés, megtehetjük-e?
Létezik-e a térben olyan (O; Ex, Ey, Ez) tengelykereszt, melynek párhuzamos vetülete éppen az általunk megadott (
) tengelykereszt? A választ a következő tétel adja meg.

(Pohlke tétele) Ha nem egy egyenesre illeszkedő síkbeli pontok, akkor van olyan térbeli derékszögű (O;
Ex, Ey, Ez) tengelykereszt, melynek párhuzamos vetülete az adott síkbeli ( ) tengelykereszt.

A tétel a térbeli tengelykereszt létezését biztosítja, az egységet azonban nem választhatjuk meg tetszőlegesen. Ez azt
jelenti, hogy az ábrázolt alakzat legfeljebb hasonló az eredetihez.
A tengelyirányú rövidülések azonban nem lehetnek tetszőlegesek.

A tengelyirányú rövidülések négyzetösszege nem kisebb kettőnél, azaz . Egyenlőség csak ortogonális
axonometria esetén lép fel.

Pohlke tétele alapján elvileg tetszőlegesen választhatjuk meg a tengelykereszt vetületét. A gyakorlatban azonban
törekszünk arra, hogy vizuálisan megfelelő legyen a szerkesztett kép. Az 7.65. ábrán szereplő alakzat valóban kocka
benyomását kelti. Itt említjük meg, hogy az axonometrikus vetület esetén is feltüntetjük a láthatóságot. Az ábrán
úgynevezett felülnézeti, illetve alulnézeti képeket adunk meg.

7.65. ábra

Speciális axonometriák
Az axonometrikus képek szerkesztése egyszerűbbé válik, ha a tengelykereszt vetületét speciálisan választjuk meg. Az
axonometriákat osztályozhatjuk a tengelyirányú rövidülések szerint is. Ha qz = qz = qz, akkor az axonometria izometrikus.
Ha csak két tengelyirányú rövidülés egyenlő, dimetrikus axonometriáról beszélünk. A trimetrikus axonometriában a
tengelyirányú rövidülések különbözők.
Az izometrikus axonometria két különleges esete látható a 7.66. ábrán.

7.66. ábra

A dimetrikus axonometriák két esetét mutatja a 7.67. ábra. Az elsőt, a frontális axonometriát gyakran használjuk. Az yz
síkban vagy azzal párhuzamos síkban fekvő alakzat vetülete az eredetivel egybevágó.
7.67. ábra

Ha az axonometrikus képsíkra merőlegesen vetítünk, merőleges axonometriát kapunk. Pohlke tétele nem garantálja,
hogy egy megfelelő síkbeli tengelykereszthez létezik olyan térbeli tengelykereszt, hogy azt merőleges vetítés viszi a
megadottba. Merőleges vetítés esetén nem adhatjuk meg minden további nélkül a tengelykereszt vetületét.

7.68. ábra

Legyen az (O; Ex, Ey, Ez) tengelykereszt az axonometrikus képsíkhoz képest általános helyzetű. Ebben az esetben a
koordináta-rendszer tengelyegyenesei metszik a K képsíkot, rendre az X, Y, Z pontokban. Az XYZ háromszöget
nyomháromszögnek (7.68. ábra) nevezzük. Nyomháromszög nyilván ferde axonometria esetén is létezik, ha a
tengelyegyenesek metszik a képsíkot. A nyomháromszög és a tengelykereszt vetületének megadására vonatkozik a
következő két tétel.

A nyomháromszög hegyesszögű.

Ortogonális axonometriában a koordinátatengelyek vetületei a nyomháromszög magasságvonalai.

Az egységpontok merőleges vetületei nem akárhol helyezkednek el a nyomháromszög magasságvonalainak egyenesein


(a tengelyek merőleges vetületein). A nyomháromszög és az eredeti koordináta-rendszerben az egység a tengelykereszt
vetületét már egyértelműen meghatározza.
A nyomháromszög magasságvonalainak egyenesei az xa, ya, za tengelyvetületek. Forgassuk képsíkba az XY egyenes
körül az xy koordinátasíkot (7.69. ábra)! (Az ábrán és a továbbiakban a szövegben is eltekintettünk az a felső index
jelölésétől.) A koordinátatengelyek leforgatottjai (x) és (y). Metszéspontjuk (O), a koordináta-rendszer kezdőpontjának

leforgatottja, rajta van egyrészt az XY fölé írt Thalész-körön , másrészt az O-ból XY-ra húzott
merőlegesen. Az (x) és (y) félegyenesekre (O)-ból kiindulva felmérhető az e egységszakasz. Az axonometrikus kép és a
leforgatott között XY tengelyű merőleges a nitás áll fenn, ahol O és (O) megfelelő pontok. Ez alapján ex=OEx és ey= OEy
szerkeszthető. Az YZ körüli képsíkba forgatással hasonlóan meghatározható ez= OEz.

7.69. ábra
Megszerkesztettük tehát a tengelykereszt merőleges vetületét az XYZ nyomháromszög és az e egységszakasz
ismeretében. Ezután már az általános esetben leírt módon szerkeszthetjük bármely alakzat axonometrikus képét.

7.4. Néhány görbékre és felületekre vonatkozó feladat


A görbék és a felületek ábrázolásával kapcsolatos alapvető ismeretek tárgyalásához szükséges ismeretek, tételek,
feladatkörök sokfélék és elemi módszerekkel ritkán tárgyalhatók. Ezért a következőkben csak néhány, a műszaki ábrázolás
szempontjából is alapvető görbét és felületet ábrázolunk.

Néhány alapvető görbe ábrázolása


Felületek ábrázolása
Felületek síkmetszete
Felületek áthatása

Néhány alapvető görbe ábrázolása


Görbe ábrázolásán a gyakorlatban azt értjük, hogy elegendő sok pontjának vetületét megszerkesztve és összekötve a görbe
képét megfelelő pontossággal megrajzolhassuk.

Kör, ellipszis
Közönséges csavarvonal

Kör, ellipszis
A kört középpontja, sugara és síkja egyértelműen meghatározza. Ezeket az adatokat vagy külön megadjuk, vagy egy
megfelelő vetületi ábráról leolvashatjuk. Bizonyítható, hogy ha a kör nincs vetítősíkban, akkor a kör párhuzamos vetülete
ellipszis. A kör vetületeinek ábrázolása nem okoz problémát, ha a kör síkja valamely képsíkkal párhuzamos. Ekkor az r
sugarú kör egyik vetülete egy r sugarú kör, a másik pedig egy 2r hosszúságú szakasz.

7.70. ábra

Ha viszont a kör síkja egyik képsíkkal sem párhuzamos, akkor legalább az egyik vetülete ellipszis. A 7.70. ábrán egy r
sugarú K középpontú k kört ábrázoltunk. A kör síkja második vetítősík, mely nem párhuzamos az első képsíkkal. A K
középpontra illeszkedő v2 második vetítőegyenes körül forgassuk a k kört a K1 képsíkkal párhuzamos helyzetbe. Ekkor a (k)
kört kapjuk, melynek felülnézete kör. E körön felveszünk egy tetszőleges (P) pontot. Visszaforgatva a v2 egyenes körül
olyan P pontot kapunk, amelynek P′ vetülete a k′ vetületen (amely ellipszis) van. További pontok szerkesztésével k′ újabb
pontjaihoz jutunk. Mivel a (k)′ kör és a k′ ellipszis pontjai között egy v′2 tengelyű merőleges a nitás áll fenn, ezért az
ellipszis további pontjait az a nitás segítségével is szerkeszthetjük. Ezt a következő részben ismertetjük.
Legyen az ellipszis nagytengelye AB = 2a, kistengelye CD = 2b, középpontja 0 (7.71. ábra). Megadunk egy kört és egy
speciális a nitást, melynél a kör a n képe éppen az adott ellipszis. Ily módon a megfelelő szerkesztéseket elég lesz a körre
elvégezni, majd ennek a n képére áttérni. A k1 kör középpontja O és sugara a. Az a nitás legyen egy AB tengelyű

merőleges a nitás, melynek aránya Bizonyitható, hogy a k1 kör képe a tengelyeivel adott ellipszis. Az ellipszis P
pontbeli érintőjének szerkesztése az ábráról leolvasható. Az is bizonyítható, hogy általános a nitás esetén is kör a n képe
ellipszis.
7.71. ábra

Tekintsük a 7.72. ábrán szereplő kört és körülírt négyzetét. A négyzet képe általános a nitásnál paralelogramma, a
beírt köré pedig ellipszis. A kör merőleges átmérőinek képeit a képellipszis egymáshoz konjugált átmérőinek nevezzük.
Az a nitás osztóviszonytartó leképzés, ezért a konjugált átmérőpárjával adott ellipszis pontjainak szerkesztésére a
következő egyszerű és praktikus, a műszaki ábrázolásban is használatos szerkesztés adódik. Az ellipszis OQ és OP konjugált
félátmérőit ismerjük. Megrajzolhatjuk az ellipszis körülírt érintő paralelogrammáját. Ennek egyik csúcsa U. Osszuk fel az
OP és az UP szakaszokat ugyanannyi egyenlő részre. A 7.73. ábrán 3-3 egyenlő részre osztottuk fel a szóban forgó
szakaszokat. A megfelelő osztópontokat O-ból és U-ból kiindulva megszámozzuk. Kössük össze a S pontot az OP-n lévő i-
edik (i = 1, 2, 3), Q-t pedig az UP-n fekvő i-edik osztóponttal! A két egyenes metszéspontja ellipszispont.

7.72. ábra

7.73. ábra

A fenti szerkesztés a kör axonometrikus ábrázolásánál nyújt segítséget. A legegyszerűbb esetekben a kör síkja az
axonometrikus koordináta-rendszer valamelyik koordinátasíkja. Legyen az r sugarú k kör O középpontja az
axonometrikus koordináta-rendszer kezdőpontja (7.74. ábra), síkja az xy koordinátasík. A kört az x koordinátatengely a T
és a P, az y tengely az S és a Q pontokban metszi. E pontok axonometrikus képeit könnyen szerkeszthetjük, például a
tengelyirányú rövidülések ismeretében. A TP és SQ merőleges körátmérők párhuzamos vetületei (a n képei) a képellipszis
egymáshoz konjugált átmérői. A konjugált átmérők végpontjain át a tengelyekkel húzott párhuzamosokkal megadhatjuk a
k kör egy körülírt négyzetét. Ennek axonometrikus képe az ellipszis egy körülírt paralelogrammája. Ezek ismeretében az
ellipszis pontjai szerkeszthetők.

7.74. ábra
7.75. ábra

7.76. ábra

Ha az m kör síkja az xy síkkal párhuzamos (7.75. ábra), akkor a K középpontján keresztül a tengelyek vetületeivel
párhuzamost húzunk, és ugyanúgy szerkeszthetjük a képellipszis pontjait, mint a fent leírt egyszerű helyzetben. Ha a kör
síkja másik koordinátasíkban van (7.76. ábra), vagy azzal párhuzamos, az axonometrikus kép szerkesztése hasonlóan
történik.
Ha az axonometria olyan, hogy két tengely vetülete merőleges egymásra, és e tengelyekre a rövidülés 1, akkor a két
koordinátatengely síkjában fekvő vagy azzal párhuzamos síkban elhelyezkedő kör képe ugyanolyan sugarú kör. Ez az eset
fordul elő például frontális axonometria (ya ⊥ za, qy = qx = 1) és a katonaperspektíva (xa ⊥ ya, qx = qy = qz = 1) esetén. Ezek
könnyen megrajzolhatók, ezért a műszaki ábrázolásban gyakran használják az előzőekben említett axonometriákat.

Közönséges csavarvonal
A t egyenes körüli elforgatás és a t-vel párhuzamos eltolás egyidejű alkalmazását csavarmozgásnak nevezzük. Ha egy P pont
úgy mozog a térben, hogy a t egyenessel párhuzamos eltolódása a t tengely körüli elfordulás szögével egyenesen arányos, és
mindig ugyanolyan irányú, a pont pályája hengerre írt csavarvonal vagy közönséges csavarvonal. Ha s a tengelyirányú
eltolódás, és φ az elfordulás szöge (radiánban adjuk meg), akkor s = pφ, ahol p állandó (7.77. ábra). A p állandó a
csavarvonal paramétere, t pedig a tengelye. A P pont minden helyzetében t-től ugyanolyan r távolságra van, ez a távolság a
csavarvonal sugara. A φ = 2π szögelforduláshoz tartozó h eltolódás a menetmagasság. Ha a tengely helyén álló szemlélő
számára a jobbról balra történő forgás esetén emelkedik a pont, akkor a csavarvonal jobbmenetű. Ellenkező esetben
balmenetű. Bizonyítható, hogy a közönséges csavarvonal önmagában elmozgatható úgy, hogy tetszőlegesen kiválasztott
két pontja fedésbe kerül, úgynevezett önmagában eltolható görbe (a térgörbék közül az egyetlen).

7.77. ábra

A következőkben egy közönséges csavarvonal két vetületét ábrázoljuk. Legyen egy r sugarú, h menetemelkedésű,
jobbmenetű g csavarvonal t tengelye első vetítőegyenes. A csavarvonal felülnézete egy t′ középpontú, r sugarú kör, mivel
minden pontja t-től r távolságra van. E kört osztjuk fel 12 egyenlő részre (7.78a ábra). A felülnézeten az osztáspontokat 0-tól
11-ig jelöltük jobbmenetnek megfelelően (a 0. és a 12. osztópont megegyezik), az óramutató járásával ellentétesen. Mivel az
alapkört 12 egyenlő részre osztottuk, a h menetemelkedést is 12 egyenlő részre osztjuk. Az elölnézeten minden egyes
osztóponthoz a h magasság 12-ed részét annyiszor mérjük fel, ahányadik osztópontnál tartunk. Az így kapott pontok a
keresett csavarvonal pontjainak elölnézetei lesznek. Ezen pontokat összekötve a keresett g csavarvonal elölnézetének egy
menetét ábrázoltuk (közelítőleg).
Hasonlóan, a görbepontok axonometrikus vetületeit megszerkesztve, majd megfelelően összekötve jutunk a görbe,
természetesen közelítő axonometrikus képéhez (7.78b ábra).

7.78. ábra

A közönséges csavarvonalnál leírt módszer elvileg bármely, vetületeivel adott görbe esetén alkalmazható.

Felületek ábrázolása
Néhány egyszerű, a műszaki ábrázolásban gyakran előforduló felület, test ábrázolásával foglalkozunk. Valamely felület
pontjainak vetületeit az előzőekben leírt módszerek valamelyikével szerkeszthetjük, ehhez nem szükséges új
ismeretanyag.
Vetítsünk egy F felületet párhuzamosan a K képsíkra (7.79. ábra). A vetület az F′ síkidom, melyet valamilyen síkbeli
görbe határol. Ez a felület képhatára a K képsíkon az adott párhuzamos vetítésnél.

7.79. ábra

Az F felületet érintő, a v vetítősugárral párhuzamos egyenesek érintési pontjai a felületen általában egy k görbét
alkotnak, amit kontúrgörbének nevezünk. A k kontúrgörbe vetülete a k′ képkontúr, mely a felületek ábrázolásában jelentős
szerepet játszik. A képkontúr pontjainak megszerkesztése nem mindig egyszerű feladat. Sokszor közelítő megadásával is
megelégszünk. Például a felületen elhelyezkedő, felületi görbék vetületeit adjuk meg, majd ezek burkológörbéjét rajzoljuk
meg (közelítően). A burkológörbe pontjaiban a burkológörbe érinti az ezen a ponton átmenő felületi görbevetületet.

Forgáshenger
Forgáskúp
Gömb
Néhány speciális forgásfelület
Egyenes vonalú csavarfelületek

Forgáshenger
7.80. ábra

A 7.80. ábrán egy r sugarú, h magasságú véges forgáshenger két vetületét ábrázoltuk, melynek t tengelye első
vetítőegyenes. A henger felülnézetének képe egy t′ körül rajzolt r sugarú kör, második képkontúrja a két kontúralkotó
vetülete. Az ábrán az egyik kontúralkotót a-val jelöljük. Az elölnézeten a két alapkör vetülete egy-egy szakasz. Az elölnézeti
képhatár (mely téglalap) szimmetriatengelye a t″ egyenes. A henger palástjára illeszkedő általános helyzetű P pont
felülnézete az ábrának megfelelően mindig az első képkontúrra illeszkedik.
A hengert két különböző helyzetben axonometriában is ábrázoltuk. Először a henger tengelye az x tengely, egyik
alapkörének középpontja az origó. (Frontális izometrikus axonometriában ábrázoltunk, minden tengelyirányú rövidülés
1.) A kontúralkotók vetületei az alapkörök vetületéhez húzott érintők. A másik esetben dimetrikus axonometriában is
ábrázoltuk az előbbi véges hengert. Az alapkörök vetületei ellipszisek, melyeket z tengely irányú eltolással egymásba
vihetünk. Az ellipszisek konjugált átmérőit a kör ábrázolásánál leírt módon kapjuk. Ezek alapján a vetületi ellipszisek
pontjai szerkeszthetők. A kontúralkotók vetületei az alapkörök vetületeihez húzott érintők. (Ezeket is közelítően rajzoltuk
meg, bár szerkesztésük is lehetséges.)
A fenti forgáshenger palástjának síkba fejtése egy téglalap h és 2rπ oldalakkal. Ezt a téglalapot csak közelítőleg tudjuk
megszerkeszteni rekti kálással vagy a Snellius-féle szerkesztés segítségével. A 7.81. ábrán az alapkört 12 egyenlő részre
osztottuk, és a kör 12-ed részét közelítően a Snellius-féle szerkesztéssel határoztuk meg. A henger palástját a 0-ás alkotó
mentén vágtuk fel. A palástra illeszkedő P pont helyzete a P′8′ körív közelítő meghatározásával a vetületekről leolvasható.

7.81. ábra

Forgáskúp
A 7.82a ábrán egy r sugarú, h magasságú, M csúcspontú véges forgáskúp két vetületét ábrázoltuk, melynek t tengelye első
vetítőegyenes. A forgáskúp elölnézetének képkontúrja a két kontúralkotó vetülete, melyek a t″ egyenesre szimmetrikusan
helyezkednek el. Második képhatára egyenlő szárú háromszög, melynek szárai a második képkontúralkotók. Az ábrán az
egyik kontúralkotót a-val jelöljük. A felületet az alapkör határolja, melynek felülnézete egy t′ körül rajzolt r sugarú kör,
második vetülete pedig egy 2r hosszúságú szakasz.
A forgáskúp felületére illeszkedő P pontot két módon is megadhatjuk. A rajta átmenő alkotó segítségével vagy a
tengelyre merőleges metszettel, amely egy p paralel kör. A p″ vetület egy P″-re illeszkedő, t″-re merőleges szakasz, a p′
vetület pedig egy M′ középpontú kör, melynek átmérője a p″ szakasz hosszával egyezik meg.
Legyen a kúp k alapkörének középpontja a koordináta-rendszer kezdőpontja, a kúp tengelye a z koordinátatengely,
mely vetítőegyenes, illetve első vetítőegyenes. A 7.82b ábrán a kúpot frontális axonometriában is ábrázoltuk. A k alapkör
képe O középpontú ellipszis, melynek pontjait a kör vetületénél leírt módon szerkesztettük. A kontúralkotókat úgy kapjuk
meg, hogy az M csúcspont axonometrikus képéből k vetületéhez érintőket húzunk (ha M külső pont). Ez esetben, bár pl.
a nitás alkalmazásával szerkeszthető is lenne, közelítően.

7.82. ábra

A forgáskúp palástjának kifejtésekor az alapkört szintén 12 egyenlő részre osztjuk a 0, 1, 2, …, 11 osztópontokkal (7.83.
ábra). Ezután egy ív hosszát határozzuk meg közelítően. Ezt olyan körcikk ívére mérjük fel 12-szer, melynek sugara a kúp
egy alkotójának hossza. A kúp 0-ás és a 6-os osztópontokhoz tartozó kontúralkotói a második képsíkkal párhuzamosak, így
a második vetületen valódi nagyságban látszódnak. A kúp palástját a 0-ás osztóponthoz tartozó alkotó mentén vágtuk fel. A
Pk pont megszerkesztéséhez először a rajta átmenő alkotó kiterített képét határozzuk meg, majd a PM szakasz hosszát. A P
ponton átmenő p paralel kör minden pontja M-től egyenlő távolságra van, akárcsak pk pontjai az Mk ponttól. A szerkesztés
az ábráról leolvasható. (A kúp palástjának szerkesztésénél a húrokkal való közelítés is elfogadható pontosságú megoldást
ad. Ebben az esetben például a 01 ív hosszát a 01 húrral közelítjük, a véges forgáskúp palástját pedig a 0, 1, 2, …, 11 szabályos
tizenkétszög alapú, M csúcsú gúlapalásttal közelítjük.)

7.83. ábra

Gömb
Az r sugarú K középpontú gömb első kontúrgörbéje az első képsíkkal párhuzamos gömbi főkör, így a felülnézetének
képkontúrja egy K′ középpontú r sugarú kör. Hasonlóan az elölnézeten a képkontúr egy K″ középpontú r sugarú kör. A 7.84.
ábrán k1 az első, k2 a második kontúrkör. Egy általános helyzetű gömbfelületre illeszkedő P pont vetületeit a P ponton
átmenő első képsíkkal párhuzamos gömbfelületre illeszkedő m kör (paralel kör) segítségével szerkesztjük meg, ahol az m″
és k1″ szakaszok párhuzamosak, m′ pedig egy K′ középpontú kör, melynek átmérője m″ hosszával egyezik meg.
Bizonyítható, hogy a gömbfelület nem fejthető síkba.

7.84. ábra

7.85. ábra

A gömbfelület merőleges vetülete egy, a gömbével egyező sugarú kör, melynek középpontja a gömb középpontjának
vetülete. A gömbfelület képkontúrja csak merőleges vetítés esetén kör, mégpedig a gömb sugarával megegyező sugarú kör.
A 7.85. ábrán egy félgömböt ábrázoltunk kétképsíkos rendszerben. A gömbfelület első képsíkkal párhuzamos metszetei
körök, ezek általános axonometriában is ábrázolhatók. Az ábrán megadtuk az axonometrikus koordináta-rendszer
vetületeit. Frontális axonometriában szerkesztettünk szemléltető képet. A metszetkörök axonometrikus képei ellipszisek,
pontjaikat a kör ábrázolásánál leírt módon adtuk meg, majd olyan b görbét rajzoltunk, mely burkolja a vetületi
ellipsziseket (a metszetkörök képeit). Bizonyítható, hogy a b burkológörbe egy ellipszisív. A teljes gömbfelület képkontúrja
ellipszis.
Végül ortogonális axonometriában is ábrázoljuk az O középpontú, r sugarú félgömböt (7.86. ábra). A határoló g főkör
axonometrikus vetületét a kör ábrázolásánál leírt módon szerkesztjük. A félgömbfelület kontúrjának vetületét egyszerűen
megrajzolhatjuk, ez ugyanis az O középpont körül írt, a gömb sugarával egyenlő sugarú félkör. A szerkesztés az ábrán jól
nyomon követhető.
A fenti módszerek általánosabb felületek ábrázolására is alkalmasak. Ezekkel most nincs lehetőségünk foglalkozni.
7.86. ábra

Néhány speciális forgásfelület


Ha egy tetszőleges g görbét egy rögzített t egyenes körül körbeforgatunk, forgásfelület keletkezik (7.87. ábra). Kizárjuk
azokat az eseteket, amikor a g síkgörbe síkja merőleges t-re, vagy ha g = t. A t egyenes a felület tengelye. A g görbe minden, a
t tengelyre nem illeszkedő pontja egy kört ír le, ezek a felület párhuzamos vagy paralel körei. A t tengelyen átmenő síkok a
meridiánsíkok, a felületből a meridiángörbéket metszik ki. A forgásfelületnek minden meridiánsík szimmetriasíkja.
A műszaki életben, a természetben gyakran találkozunk forgásfelületekkel. Ilyenek a különböző esztergályozással
kapott felületek (7.88. ábra). Bizonyos fatörzsek, virágok is közelítően forgásfelület alakúak.
Amennyiben a és t kitérő helyzetűek, egyköpenyű forgáshiperboloid felület keletkezik (7.89. ábra), amely szintén
gyakran előfordul építmények kapcsán.

7.87. ábra

7.88. ábra

7.89. ábra

Legyen egy forgásfelület meridiángörbéje a k kör. Ha k középpontja a t forgástengelyen van, gömbfelület keletkezik. A
7.90. ábrán megrajzoltuk a k kör néhány helyzetét a forgás során, valamint szimmetrikusan elhelyezkedő paralel köröket.
Az ábra hasonlatos a Föld hosszúsági és szélességi köreiből álló rendszerre. Ha a k meridiánkör síkja illeszkedik t-re, de
középpontja nem, akkor a t körüli forgatás során körgyűrűfelület vagy tóruszfelület keletkezik (7.91. ábra).
7.90. ábra

7.91. ábra

Egyenes vonalú csavarfelületek


Adott g sík- vagy térgörbe csavarmozgása során keletkező felületet csavarfelületnek nevezzük. A csavarmozgás tengelye a
csavarfelület tengelye. A g görbe a felület alkotója, tetszőleges P pontja által leírt csavarvonal a P ponthoz tartozó
pályacsavarvonal. A pályacsavarvonalak menetmagasságai azonosak, sugaraik különböznek. A felület aszerint jobb- vagy
balmenetű, hogy a pályacsavarvonal milyen értelmű. A csavarfelület önmagában elmozgatható felület, ez adja műszaki
jelentőségét.
A csavarfelület egyenes vonalú, ha az alkotógörbe egyenes vagy egyenes része. Ha az alkotógörbe merőleges a
tengelyre, a felület laposmenetű, különben élesmenetű. Ha az alkotógörbe metszi a tengelyt a csavarfelület zárt, egyébként
nyitott. A 7.92. ábrán egy nyitott élesmenetű csavarfelület részlete látható.

7.92. ábra

Felületek síkmetszete
Bármely felület és sík közös pontjainak halmaza a felület síkmetszete. Cél a síkmetszet pontjainak szerkesztése, melyeket
megfelelő módon összekötve rajzoljuk meg a síkmetszet görbéjét. A síkmetszet pontjainak megszerkesztésénél általában a
felület alkotógörbéinek metszetét keressük meg a metszősíkkal (7.93. ábra).

7.93. ábra

Forgásfelületek síkmetszeteinek szerkesztésénél azonban a leggyakrabban használt módszer nem a fenti, hanem a
„szeletelő síkos eljárás”. A módszer lényege a következő. A síkmetszet pontjainak szerkesztéséhez olyan segédsíkokat
alkalmazunk (szeletelő síkok), amelyek a felület tengelyére merőlegesek. Ezek a síkok a felületből paralel köröket
metszenek ki. A segédsík és a metszősík metszésvonala a paralel kört a síkmetszet pontjaiban metszi. Kellő számú szeletelő
síkkal való metszés biztosítja a kívánt pontosságot a metszetgörbe közelítő megrajzolásához. A módszer alkalmazását a
következőkben néhány speciális forgásfelület esetében mutatjuk be.

Forgáshenger síkmetszete
Forgáskúp síkmetszete
Egy forgásfelület síkmetszete

Forgáshenger síkmetszete
A 7.94a ábrán egy első képsíkon álló, első vetítőegyenes tengelyű véges forgáshengert ábrázoltunk. Ezt a hengert
elmetszettük egy V második vetítősíkkal. A síkmetszet bizonyíthatóan ellipszis lesz. Ennek az ellipszisnek a második képe
egy szakasz (A″B″), első vetülete pedig egybeesik a henger első képével. A metszetellipszis pontjainak vetületei a
rendezőegyenesek segítségével könnyen megadhatók.
Az ellipszismetszet valódi alakjának megszerkesztését itt a V sík első képsíkkal való metszésvonala, első nyomvonala
(v1) körüli első képsíkba forgatásával határoztuk meg. A henger alapkörét felosztottuk 12 egyenlő részre a 0 – 11
osztópontokkal. Ezeken a pontokon átmenő hengeralkotókon a síkmetszetpontok helyezkednek el. Megadjuk a
pontok második vetületeit. A metszősíkot a pontokkal együtt forgattuk le. A pont leforgatásánál a
pontból húzzunk merőlegest v′1-re! A merőleges és v′1 metszéspontjából mérjük fel a merőlegesre a távolságot! Így a
( ) leforgatott pontot kapjuk. Ezt ismételve szerkesztjük az ( ) pontokat, majd törésmentes ívvel összekötve
közelítően megrajzoljuk az ellipszis ívét.

7.94. ábra

Síkba fejtettük a hengert a metszetgörbével együtt, nyilván közelítően. A 7.94b ábrán a palástot a 0 ponton átmenő
alkotó mentén metszettük fel. Az ellipszismetszetet is kiterítjük úgy, hogy a megfelelő alkotókra felmérjük az V-vel alkotott
metszéspontoknak az alaptól mért távolságát, ami a második képen valódi nagyságban látszik. Tehát például a pontot
úgy kaptuk, hogy a kiterítésen a 0k alkotóra 0k-ból kiindulva felmértük a szakaszt. Bizonyítás nélkül megjegyezzük,
hogy az ellipszis a síkba fejtésen egy szinuszgörbe részlete.

Forgáskúp síkmetszete
Ha egy sík a forgáskúpfelület (végtelen kúpfelület, kettős kúpfelület) csúcsán halad át, akkor a kúpfelületet vagy csak a
csúcsban, vagy két alkotóban metszi, vagy pedig egy kúpalkotó mentén érinti. A tengelyre merőleges metszetek körök.
Bizonyítható, hogy minden más esetben a síkmetszet ellipszis, hiperbola, illetve parabola. Ha a sík minden alkotót metsz,
akkor a síkmetszet ellipszis, ha a metszősík két alkotóval párhuzamos, akkor a metszet hiperbola, ha viszont egy alkotóval
párhuzamos, akkor a metszetgörbe parabola.
Az előzőekben tárgyalt ábrázolásoknál tulajdonképpen nem maga a kúpszelet, hanem annak vetülete jelenik meg.
Bizonyítható, hogy az ellipszis párhuzamos vetülete ellipszis, speciálisan kör, a paraboláé parabola, a hiperboláé pedig
hiperbola. (Ha a metszősík vetítősík, akkor a vetület egy egyenesre esik.)
7.95. ábra

A metszetgörbe pontjait szerkesztjük, majd megfelelő számú pont ismeretében a pontokat törésmentes görbével
összekötjük. A görbét tehát közelítően rajzoljuk. Szerkesztéseinkben a képsíkrendszert úgy vesszük fel, hogy a kúp
tengelye első vetítőegyenes legyen, a metszősík pedig második vetítősík.
A 7.95. ábrán a t tengelyű M csúcspontú kúp és az U második vetítősík metszetét szerkesztettük meg. A sík a kúpfelület
minden alkotóját metszi, a metszetgörbe ellipszis. A metszet második képe az A″B″ szakasz. A metszetellipszis nagytengelye
az AB =A″B″ szakasz. Az ellipszis O középpontjának második vetülete az A″B″ szakasz felezőpontja. Az O ponton átmenő t-re
merőleges szeletelő sík a kúpfelületből a k kört metszi ki. A kistengely végpontjai ezen a körön helyezkednek el. A
kistengely második vetülete, C″D″ egybeesik O″-vel. Első képét a k paralel kör első képe metszi ki a közös
rendezőegyenesből. További ellipszispontok szerkesztése a szeletelő síkos eljárással történhet. A P és Q pontokat az S
szeletelő sík segítségével szerkesztettük meg. Az S sík kúpfelülettel való metszetének első képe az s′ kör, melynek sugara az
elölnézetről leolvasható. Nyilván {P″, Q″} = s″ ⋂ U″. Az első képeket az s′ körön rendezéssel nyerjük.
Megszerkesztettük a metszetellipszis valódi alakját is, képsíkba forgatással. Az első képsíkba forgatás végrehajtása az
ábrán jól követhető.

7.96. ábra

A metszetellipszis F1 és F2 fókuszainak szerkesztéséhez olyan gömböket (Dandelin-gömbök) veszünk fel, melyek a


kúpfelületet és a metszősíkot is érintik. Ezek vetületei körök, melyeket az ábrán megjelöltünk. A gömbök érintési pontjai U-
n adják a metszetellipszis fókuszait. Az első vetületi ellipszis egyik fókusza (bizonyítható) az M′ pont.
A 7.96. ábrán ábrázoltunk egy parabola- és egy hiperbolametszetet. (Ezekben az esetekben is a Dandelin-gömbök
segítségével adhatók meg a metszetgörbék fókuszai.)

Egy forgásfelület síkmetszete


A 7.97. ábrán egy olyan forgásfelületet ábrázoltunk, melynek meridiángörbéje az MQ és QR körívekből áll. (A körök
középpontjai az O1 és az O2 pontok.) A forgásfelület U második vetítősíkkal való metszetét a szeletelő síkos eljárással
határoztuk meg. A síkmetszet általános P pontjának szerkesztését a t forgástengelyre merőleges szeletelő sík felvételével
végeztük. A szerkesztés az ábráról leolvasható. A síkmetszet lényeges pontjai a szimmetriapontok és a kontúrpontok. Az
első kontúrpontokat az O1 és az O2 pontokon átmenő V1 és V2 szeletelő síkok felhasználásával nyertük. A B pont
szimmetriapontja a síkmetszetnek. A 7.98. ábrán szemléltető ábrát láthatunk a síkmetszetről.
7.97. ábra

7.98. ábra

A 7.99–101. ábrákon néhány, gyakorlati jellegű példa szerepel felületek síkmetszeteivel kapcsolatban.

7.99. ábra

7.100. ábra
7.101. ábra

Felületek áthatása
Két felület közös pontjainak halmaza általában görbe, melyet áthatási görbének vagy metszésvonalnak nevezünk. Az
alábbiakban vázolt eljárások több felület áthatása esetén is alkalmazhatók. Az áthatási görbe pontjainak szerkesztése a
következő. Az F1 és F2 felületeket elmetsszük egy S segédfelülettel (7.102. ábra). A metszésvonalak a g1 és a g2 görbék. A két
görbe közös pontjai a két felületnek is közös pontjai, azaz áthatási görbepontok. A 7.102. ábra P pontja ilyen. Újabb
segédfelületekkel tetszőleges számú metszéspont megszerkeszthető. Úgy tűnik, mintha a segédfelület felvételével
bonyolítanánk a helyzetet. Ez azonban nincs így, a segédfelületet ugyanis oly módon választjuk meg, hogy egyszerűen
lehessen megszerkeszteni a g1 = S ⋂ F15 g2 = S ⋂ F2 görbéket. Az S felület általában sík.

7.102. ábra

7.103. ábra

Más mód is van az áthatási görbepontok szerkesztésére. Ekkor az F1 felületen elhelyezkedő speciális görbék (ha lehet,
egyenesek) F2 felülettel való döféspontjait szerkesztjük meg. Ezek nyilván áthatási görbepontok. A 7.103. ábrán az a1, a2, …
görbéket jelöltük meg az F1 felületen, az a1 görbe F2 felülettel való döféspontja D, mely az áthatási görbe pontja. Megfelelő
számú döféspont szerkesztésével az áthatási görbe jó közelítéssel megrajzolható.
Az alábbiakban egy-egy példát mutatunk mindkét módszer alkalmazására.

Példák
1. Egy forgáskúp és egy forgáshenger áthatását szerkesztettük meg a 7.104a–c. ábrán. A metszésvonal második képe
rajta van a henger második vetületén, tehát körív. (Az ábrán vastagon jelölt körív.) Vegyünk fel egy, az első
képsíkkal párhuzamos V1 síkot, mely metszi a felületeket (7.104a ábra)! Ez a sík a kúpból a k paralel kört, a
hengerből az a és b alkotókat metszi ki. A k kör a felülnézeten valódi nagyságban látszik, elölnézetben a k″
szakasz. A henger alkotói a második képsíkra merőlegesek, tehát a″ és b″ pontok, amelyeket V″1 metsz ki a henger
második vetületéből (most egy kör). Ennek alapján az alkotók első vetületei megrajzolhatók. Az áthatási görbe
pontjai a k kör a és b egyenesekkel való metszéspontjai. Az első vetületen k′-nek csak a′-vel vannak közös pontjai,
ezek a P′ és Q′ pontok. További V1-gyel párhuzamos szeletelő síkok felvételével további áthatási görbepontokat
szerkeszthetünk.
7.104. ábra

A V2 szeletelő sík (7.104b ábra) a hengert az első kontúralkotókban metszi. Tehát V2 segítségével adjuk meg a
henger első kontúralkotóin levő A′ és B′ pontokat.
Az S sík mindkét felület szimmetriasíkja. (Ebben az esetben S illeszkedik a kúp tengelyére és merőleges a henger
tengelyére.) Az S síkban fekvő áthatási görbepontok (C és D) a szimmetriapontok. Az áthatási görbét a szerkesztett
áthatási görbepontok összekötésével a 2. kép alapján közelítőleg rajzoltuk meg.
A láthatóságot a henger kitolása után adtuk meg (7.104c ábra).
2. A 7.105a ábrán forgáskúp és forgáshenger testeket ábrázoltunk. Szerkesszük meg az áthatásukat! A felületükön
levő áthatási görbét szerkesztjük meg először, a második módszerrel, azaz a kúp alkotóinak a hengerfelülettel
való metszéspontjait.
Az áthatási görbe első képe egybeesik a henger első vetületével, ezért csak a második vetületet kell szerkeszteni. A
kúp alapkörét a 0, 1, …, 11 pontokkal egyenlő részekre osztottuk. Az M0, M1, …, M11 alkotók első képének a henger
első képével (kör) alkotott metszéspontjai adják az áthatási görbe pontjainak első képét. A második képeket pedig
rendezéssel nyerjük. Az ábrán az M10 alkotónak a hengerfelülettel való A metszéspontját jelöltük csak meg.
Megjegyezzük, hogy a felületek szimmetriája és elhelyezkedésük miatt az áthatási görbe elölnézete kettősvetület,
az elölnézet pontjai, kivéve a henger kontúralkotóin levő pontokat, két-két áthatási görbepont vetületei. A
láthatóságot a henger kitolása után adtuk meg. A kúptestből ekkor egy hengerrészletnyi hiányzik, ennek
kontúrja az elölnézeten megjelenik.

7.105. ábra

A 7.105b ábrán látható a kúppalást és a hengerpalást síkba terítése az áthatási görbével együtt. A kiterített
kúppalást körcikk, melynek sugara a kúp alkotója, íve pedig az alapkör kerületével egyenlő hosszú. Az alkotó
valódi hosszát a második kontúralkotó hossza adja. A kúp alapkörének kiterítését közelítőleg a 0 – 1, 1 – 2, … 11 – 0
ívekhez tartozó húrok hosszának felmérésével nyertük. Az áthatási görbe pontjainak a kúp csúcsától mért
távolságait a második vetületen a kúp tengelye körüli, kontúralkotóra való kiforgatással nyertük. Az ábrán az A
pont esetén tüntettük fel részletesen a szerkesztést. (A kiforgatott pont Ā.)
A hengerpalást síkba fejtésénél téglalap keletkezik, melynek egyik oldala a hengeralkotóval, a másik a henger
alapkörének kerületével egyenlő. A henger felületének síkba fejtését is az áthatási görbéével együtt
szerkesztettük, közelítően. Ehhez a fentiekben megszerkesztett áthatási görbepontokon keresztül vettünk fel
hengeralkotókat. (A henger alapkörén nyilván az ennek megfelelő beosztás nem egyenletes. Az alapkör síkba
fejtésénél a nagyobb ívek esetén rekti kálhatunk.) A szükséges alkotószakaszokat a második vetületről
leolvashatjuk. Az ábrán az A pont esetén tüntettük fel részletesen a szerkesztést.

A gyakorlatban is sokszor előfordulnak áthatások. Erre néhány példát mutatnak a 7.106–110. ábrák.
7.106. ábra

7.107. ábra

7.108. ábra

7.109. ábra

7.110. ábra

7.5. Kótás ábrázolás


A geodézia, bányászat, út- és vasútépítés, térképészet, folyószabályozás, valamint az erdészet bizonyos feladatainak
megoldása az ábrázoló geometria egy különleges ábrázolási módszerét, a kótás (mérőszámos) ábrázolást igényli. Ez az
ábrázolási mód is a merőleges vetítés tulajdonságain alapul. Az alábbiakban, helyszűke miatt, csak vázoljuk legfontosabb
tulajdonságait és alkalmazhatóságát.

Térelemek ábrázolása
Görbék ábrázolása
Felületek ábrázolása
Egyszerű rézsűfelületek
Metszési feladatok

Térelemek ábrázolása
A kótás ábrázolás lényegében egyképsíkos ábrázolási eljárás, mely a tér pontjait merőleges vetületekkel és a vetülethez írt
kótával (másképpen: mérőszámmal) adja meg. Részletesebben: a tér valamely P pontját megadhatjuk a K képsíkon lévő P′
vetületével és a képsíktól mért előjeles távolságával, a „képsík feletti” (vagy alatti) magasságot rögzítő kótával.
A P′ (2) vagy P(2) jel tehát egy, a képsík, a 0-ás szintsík „felett” 2 egység magasságban lévő pontot ad meg (7.111. ábra).
Alkalmazzák a P2 jelölést is. Szó lehet negatív kótáról is, mint a Q pont esetében, Q a képsík „alatt” helyezkedik el, attól
egységnyi távolságra. A továbbiakban lényeges szerepük lesz a képsíkkal párhuzamos, attól 1, 2, … egység távolságban lévő
úgynevezett főszintsíkoknak. Egységként általában a méter vagy alkalmasan választott többszöröse szerepel.

7.111. ábra

A kótás ábrázolásban általában nagy kiterjedésű objektumokat kell ábrázolnunk. Ezeket valódi nagyságukban nem

tudjuk ábrázolni. Ezért minden méretet alkalmasan kicsinyítünk. A tér bármely H hosszúságú szakaszának egy
hosszúságú szakasz felel meg a rajzunkon, ahol a egy adott szám, az arányszám. Az arányszám reciproka a méretarány,
amelynek megadása M 1: a, vagy az M = 1: a formában szokásos.
Kótás ábrázolást alkalmazó rajzokon, térképeken általában feltüntetik a méretarányt, esetleg az 1 m vagy alkalmas
többszörösének rajzi hosszát, a rajzi egységet, melyet 1e-vel jelölünk. Valamely alakzat pontjainak merőleges vetületei
(képei) az alakzat vetületét, képét alkotják.

Példa. A 7.112a ábrán látható szabályos gúla ABCD alapja 5 cm oldalú négyzet, mely a K képsíkban helyezkedik el. Az
alaplap bármely pontjának kótája 0. A gúla magassága 5 cm, így az M csúcspont kótája 5. A méretarány 1:2, tehát a
rajzi egység 0,5 cm. A 7.112b ábra mutatja a gúla vetületét, mellette az 1 cm rajzi megfelelőjét, a rajzi egységet.
Megjegyezzük, hogy később az egyszerűség kedvéért a pont vetülete mellett többnyire már csak a kótát tüntetjük fel.

7.112. ábra

A rekonstrukció a vetületi pont és a kóta ismeretében nyilván egyértelmű.

Görbék ábrázolása
Alapvető fontosságú az egyenes ábrázolása. A g egyenest két pontja, P és Q egyértelműen meghatározza (7.113a ábra).
Legyen a P pont kótája p, a Q ponté pedig q! A 7.113b ábrán a vetületet, a g′ =P′pQ′q egyenest ábrázoltuk. Gyakran vessző
nélkül ugyanazzal a betűvel jelöljük a vetületet is. Hogyan határozzuk meg az egyenes pontjainak kótáit, hogyan veszünk
fel az egyenesen adott kótához tartozó pontot? Mekkora a PQ szakasz valódi hossza?

7.113. ábra

Valamennyi kérdésre választ kaphatunk, ha az egyenes vetítősíkját például g′ körül a 0 kótához tartozó főszintsíkba
forgatjuk.
A P pont képsíkba forgatottját (P)0-lal jelöljük. A (P)0 pont a g′-re merőleges egyenesen helyezkedik el és a P′ (P)0 szakasz
a kótának megfelelő hosszúságú. A g egyenes (g)0 leforgatottjának megadásához az egyenes Q pontját is leforgatjuk.

Példa. Legyen a g = PQ egyenest (7.114a ábra) meghatározó P pont kótája 1, a Q pont kótája 4, P és Q vetületei
egymástól 3 m távolságban vannak. A kótákat méterben adtuk meg, M 1:100. Határozzuk meg a g egyenes az ábrán
vetületben megjelölt B pontjának kótáját! Vegyünk fel az egyenesen 3,2 kótához tartozó C pontot, valamint
határozzuk meg a PQ szakasz hosszát!

7.114. ábra

A 0-ás főszintsíkba forgatjuk g-t a g′ egyenese körül (7.114b ábra). A rajzon 1 méternek 1 cm felel meg, P1Q4 = 3 cm. Ha
a (B)0 pont a g′ egyenestől b távolságra van, akkor B kótája b. Jelen esetben b ≈ 1,75. A 3,2 kótához tartozó
egyenespont (C)0 leforgatottját a g′-vel párhuzamos, tőle 3,2 cm távolságra haladó azon egyenes metszi ki (g)0-ból,
amely (B)0-lal egy félsíkban van. A PQ szakasz hossza egyenlő (P)0(Q)0-lal.
Megemlítjük, hogy az előző szerkesztést, a leforgatott ábrát, máshol is elhelyezhetjük. A 7.114c ábrán egy derékszögű
koordináta-rendszer x tengelyén helyeztük el a g′ egyenest. Az y tengelyen a méretaránynak megfelelően egy
magassági skálát készítünk el. A P1 és a Q4 pontban az x tengelyre merőleges egyenesekre felmérjük (előjelesen) a
kótáknak megfelelő szakaszokat. A kapott pontokat összekötve megkapjuk a (g)0 egyenes megfelelőjét. Minden, az
előzőekben tárgyalt szerkesztés itt is végrehajtható.

Az egyenes azon pontjai, amelyek kótái egész számok, azaz úgynevezett főszintsíkokban vannak, az A, B, C, …
szintpontok (7.115a ábra). A szintpontok vetületei az osztópontok. Az osztópontok kijelölése a graduálás (lépcsőzés).
Graduálhatunk szükség esetén tizedméterenként, de olykor 20 méterenként is.
Ekkor tehát a 0,1 m, illetve 20 m szintkülönbségű szintsíkokban lévő szintpontok vetületeit határozzuk meg. Ha egy
szakasz végpontjainak magasságkülönbsége 1 m, a szakasz vetületi hosszát osztóköznek nevezzük, melyet a továbbiakban

K-val jelölünk. A K osztóköz rajzi hosszát k-val jelöljük. Ha a méretarány M 1 : a, akkor .

7.115. ábra

A graduálást elvégezhetjük oly módon is, hogy az egyenest szintsíkba forgatjuk (7.115b ábra). Az egyenes lejtiránya azt
mutatja, hogy a vetületen milyen irányban haladva jutunk egyre kisebb kótájú pontokhoz. A lejtirányt az egyenes vetülete
mellé rajzolt nyíl jelöli. Az egyenesnek a szintsíkokkal bezárt szöge a dőlésszög vagy lejtszög (ϵ), melyet a 7.115a–b ábrán
ugyancsak megjelöltünk. A műszaki gyakorlatban az egyenes (és a sík) térbeli helyzetét gyakran nem a dőlésszöggel, hanem
annak kotangensével, a rézsűvel, az r = ctg ϵ számmal jellemzik. Például az r = 3 : 2 rézsű azt jelenti, hogy ha az egyenes
valamely szakaszának vetülete 3 egység hosszúságú, akkor a végpontok magasságkülönbsége 2 egység. A rézsű reciproka a
lejtő (másképp: lejtés), a dőlésszög tangense.
Az egyenes meredekségének számszerű jellemzésére szolgál a százalékos lejtés. Az egyenes p%-kal emelkedik, illetve
lejt, ha az egyenes valamely szakaszának 100 egységnyi vetületi hosszához a végpontok p egységnyi magasságkülönbsége
tartozik. A p%-os lejtés és a lejtszög kapcsolata: p = 100·tg ϵ. Ha például a lejtszög ϵ = 10°, akkor a tg 10° = 0,176 326…, a
százalékos lejtés két tizedes pontosságig 17,63 %.
Hasonló fogalom az ezrelékes lejtés. Az egyenes q ezrelékkel (q ‰ ) emelkedik, illetve lejt, ha az egyenes valamely
szakaszának 1000 egységnyi vetületi hosszához a végpontok q egységnyi magasságkülönbsége tartozik. A q ‰-es lejtés és a
lejtszög között a következő kapcsolat van: q = 1000·tg ϵ.
Görbét kótás ábrázolásban merőleges vetületével és megfelelő számú, ismert kótájú pontjának megjelölésével adjuk
meg.

Példa. A 7.116a–b ábrán egy V vetítősíkban fekvő g görbét ábrázoltunk. A görbe adott pontjához tartozó lejtésén,
illetve rézsűjén a pontbeli e érintő lejtését, illetve rézsűjét értjük. Az érintő és ezzel együtt a görbe adott pontbeli
lejtszögét ϵ-nal jelöljük. A g′ vetületet egy derékszögű koordináta-rendszer x tengelyén, a g görbe leforgatottját a
koordináta-rendszerben ábrázoltuk. A magassági skála segítségével közelítően megadtuk a görbe 3,6 kótához tartozó
Z pontját és az Y görbepont közelítő kótáját (~ 1,3). A B görbepontban megrajzoltuk az e érintőt, és jelöltük a lejtszöget
(ϵ).

7.116. ábra

A 7.117a ábrán egy térgörbe g′ merőleges vetületét és néhány pontjának kótáját adtuk meg. A térgörbe pontjait vetítő
egyenesek egy általános hengerfelület alkotói. A merőleges vetület ennek a hengerfelületnek a 0-ás szintsíkkal való
metszete. A hengerfelület görbével együtt való síkba fejtésének műszaki jelentősége van.
A síkba fejtés ívhossztartó leképezés. Ez azt jelenti, hogy a g térgörbe AB ívének hossza megegyezik a gk síkba fejtett
görbe AkBk ívének hosszával. A síkba fejtés szögtartó leképezés is, ezért a g görbe B pontbeli érintőjének a B ponton átmenő
hengeralkotóval bezárt γ szöge is változatlan a síkba fejtés után. Így a gk görbe Bk pontbeli lejtése, illetve rézsűje sem
változik. A gk görbe a g görbe hossz-szelvénye, mely megőrzi a pontok eredeti kótáit, a görbeívek ívhosszait és a

lejtszögeket. A B pontban a lejtszög (7.117b ábra).

7.117. ábra

A szerkesztés konkrét kivitelezése közelítő. Megjegyezzük, hogy a hossz-szelvényt utak tengelyvonalának ábrázolására
is használják. Ebből leolvasható egy-egy útszakasz közelítő hossza és lejtése. Gyakran szakaszokkal kötik össze a
szomszédos pontokat a hossz-szelvényen. Ilyenkor egy-egy szakasz esetén határozható meg közelítően a lejtszög, illetve a
rézsű.
Megemlítjük, hogy de níciója alapján a közönséges csavarvonal hossz-szelvénye egyenes. Ez azt jelenti, hogy lejtése
állandó.

Példa. A 7.118. ábrán egy csavarvonal fél menetének hossz-szelvényét adtuk meg.

7.118. ábra

Felületek ábrázolása
Kótás ábrázolásban a felületeket szintsíkokkal való metszeteikkel, szintvonalaikkal ábrázoljuk általában. A legegyszerűbb
felület, a sík esetében a szintvonalak párhuzamos egyenesek. Általában a főszintsíkokban lévő szintvonalakat tüntetjük fel
(7.119a ábra).

7.119. ábra

A szintvonalakra merőleges síkbeli egyeneseket, vagyis az esésvonalakat, a kótás ábrázolásban nyíllal ellátott kettős
vonallal jelöljük (7.119b ábra). A nyíl az esésvonal lejtirányát jelöli. A síkot gyakran csupán graduált esésvonalával adjuk
meg. Ez már meghatározza az esésvonalra vetületben is merőleges szintvonalak helyzetét. Beszélhetünk a sík osztóközéről,
lejtszögéről (lejtéséről), rézsűjéről, ami esésvonalának osztóköze, lejtszöge (lejtése), rézsűje. Az alábbiakban egy felület
szintvonalrendszerét adjuk meg, példaként.

Példa. Ábrázoljunk szintes tengelyű forgáshengert! A 7.120. ábra hengerének t tengelye az 5-ös szinten van, sugara 4
cm, 1 rajzi egység 0,5 cm. A szintvonalak a megadás miatt hengeralkotók. A szintvonalak megrajzolása érdekében
egy V segédsíkot veszünk fel a henger tengelyére merőlegesen (V vetítősík). A henger V-re való merőleges vetülete
kör, melyet egy szintsíkba forgatunk. A szintsíkok V-re való vetületeit beforgatva V′-vel párhuzamos egyeneseket
kapunk, melyek egymástól való távolságai rendre 1-1 rajzi egységnyiek. Ezek az egyenesek a körből kimetszik a
szintvonalak vetületeinek leforgatottjait. Ezután a szintvonalak már megrajzolhatók. (Ha az ábrán két szintvonal
vetülete ugyanaz, a hozzájuk tartozó kótákat vesszővel választjuk el.)

A természetes földfelületet, az úgynevezett terepfelületet általában kótájukkal ellátott szintvonalaikkal adjuk meg. A
szintvonalak vetületeinek összessége a szintvonalas térkép. A következőkben a szintvonalak merőleges vetületeit adjuk
meg. A szintvonalas térképek felvétele geodéziai módszerekkel történik.

7.120. ábra

Ha a terepfelület C pontja kis környezetében levő tereppontok C-nél alacsonyabban helyezkednek el, akkor C-t
csúcspontnak nevezzük. Az M mélypont kis környezetében levő tereppontok M-nél magasabban vannak. A 7.121. ábrán
csúcsponton és mélyponton kívül ábrázoltunk egy N nyeregpontot. Ebben a pontban két azonos kótához tartozó szintvonal
metszi egymást.

7.121. ábra

Gyakorlati alkalmazásuk miatt két, a terepfelületen elhelyezkedő görbetípust említünk meg. A terepfelület
szintvonalait merőlegesen metsző görbék (a metszéspontban a görbéhez és a szintvonalhoz húzott érintők merőlegesek) az
esésvonalak. Egy közelítő szerkesztésüket láthatjuk a 7.122. ábrán. (Az esésvonal két szintvonal közötti részét körívvel
közelítjük.)
A lejtvonalak olyan terepfelületen haladó görbék, melyek lejtése minden pontban azonos. Utak, csatornák
tengelyvonalainak egyes szakaszai gyakran lejtvonalak.
Közelítő szerkesztésénél a lejtvonal két szomszédos szintvonal közötti részét gondolatban szakasszal helyettesítjük, a
lejtvonalat tehát olyan töröttvonallal, melynek szakaszai ugyanazon osztóközzel rendelkeznek. Ennek megfelelően adott
rézsű esetén az alkalmas osztóközt megszerkesztve és körzőnyílásba véve, az adott pontból kiindulva a szintvonalakon
kijelölhetők a lejtvonal pontjai (7.123. ábra). Ezeket sokszor egy törésmentes görbével kötjük össze (nem a töröttvonalat
rajzoljuk meg). Egy pontból több lejtvonal is indulhat. A gyakorlatban a lehetséges utak közül a „törésmenteset” választják.
(A 7.123. ábrán a d jelű út ilyen.)
7.122. ábra

7.123. ábra

A terepfelület két szintvonal közötti részén további szintvonalakat szerkeszthetünk közelítően, sűríthetjük a
szintvonalrendszert. Szerkesszünk esésvonalakat az említett két szintvonal között! Ezeket az esésvonalíveket
lejtvonalaknak tekintve egyenletesen beosztjuk, majd az azonos kótához tartozó pontokat görbével összekötjük.

Példa. A 7.124. ábrán a 810-es és a 815-ös szintvonalak közötti részen sűrítettük a szintvonalrendszert, a
szintvonalakat méterenként rajzoltuk meg (közelítően). A terepfelület egy nem szintvonalon elhelyezkedő
pontjának kótáját közelítően határozhatjuk meg a szintvonalrendszer sűrítésével. (A 7.124. ábrán a terepfelületen
elhelyezkedő P pont kótája ~ 813,5.)

7.124. ábra

Gyakori feladat a terepfelület vetítősíkkal való metszetének megadása, az úgynevezett szelvény szerkesztése. A V
vetítősík vetülete a V′ egyenes, melynek szintvonalakkal való metszéspontjai adják a terepfelülettel való metszetgörbe
pontjait. Hogy láthatóvá tegyük a szelvény alakját, vagy valamelyik szintsíkba forgatunk, vagy pedig külön ábrán
helyezzük el a metszetet.

Példa. A 7.125a ábrán a szintvonalak kótái méterben szerepelnek, M 1: 200. A szelvényt külön ábrán (7.125b ábra)
helyeztük el, a magassági skálán1 m magasságkülönbségnek 0,5 cm felel meg.

7.125. ábra

Egyszerű rézsűfelületek
A P ponton átmenő, adott rézsűvel rendelkező egyenesek egy P csúcsú forgáskúpfelületet alkotnak, melynek tengelye a
szintsíkokra merőleges (7.126a ábra). Ez a rézsűkúp. Ábrázolhatjuk a főszintsíkokkal való metszeteivel, melyek körök. A
szintkörök vetületei a P pont vetülete körül írt koncentrikus körök, melyek kótáit a körök mellé írjuk.

7.126. ábra
Példa. Legyen P kótája 4 (az adatot méterben adtuk meg). Szerkesszük meg az r = 1 rézsűhöz tartozó rézsűkúp
szintköreit, ha M 1: 200. A P ponton átmenő 1 rézsűhöz tartozó g egyenes vetületét rajzoltuk meg, lejtirányát is
megjelöltük (7.126b ábra). Osztóköze K = 1 m, melynek rajzi hossza k = 1/200 m = 5 mm. Graduálva a g egyenest a
rézsűkúp szintkörei már megrajzolhatók. (A szintkörök sugarai k, 2k, 3k, …) Megjegyezzük, hogy a 3-as és 5-ös, 2-es
és 6-os, … szintkörök vetületei nyilván egybeesnek.

Abban a fontos esetben, amikor f a képsíkkal párhuzamos, úgynevezett szintes egyenes, mindig két r rézsűjű sík
illeszthető f-hez (7.127a–b ábra). A rézsűsíkok szintvonalai párhuzamosak f-fel, és esésvonalaik rézsűje r. Az ábrán az f
egyenes pontjainak kótája 3, a rá illeszkedő adott rézsűjű rézsűsíkok néhány szintvonalát rajzoltuk meg.

7.127. ábra

A következő részben néhány egyszerűen megadható rézsűfelületet használunk fel. Ezeket adott rézsűvel rendelkező
síkok és rézsűkúpok, valamint ezek részletei határolják.

Metszési feladatok
A metszési feladatok megoldása kótás ábrázolásban egyszerű. Ugyanis két felület adott kótához tartozó közös pontjait (ha
léteznek) a felületek adott kótához tartozó szintvonalainak metszéspontjai adják.
Két általános helyzetű sík közös egyenesét mindkét sík szintvonalai graduálják. A metszésvonal pontjait a megfelelő
szintvonalak metszeteiként adjuk meg (7.128a ábra). A metszésvonal vetületét ezért a 7.128b ábrán látható módon
szerkeszthetjük meg. A szerkesztéshez nem szükséges a rajzi egység ismerete.
A következő két feladatban szakaszokból álló egyszerű alakzatokra illesztünk rézsűsíkokat, illetve alkalmazunk
rézsűkúpokat. A fenti módon szerkeszthetők a metszésvonalak.

7.128. ábra

Feladat. Terepfelületen az ABCD négyzet alakú szintes platót szeretnénk kialakítani, AB = 12 m, a plató szintje 200 m.
Fektessünk a négyzet oldalaira rézsűsíkokat r = 2,5 rézsűvel, ha M 1:400. A talaj, mely síknak tekinthető, a 197-es
szinten van.
Megoldás. A 7.129a ábra alapján nyomon követhetjük a megoldást. A rajzon az ABCD négyzet vetületének oldala

. A négyzet oldalaira illesztett síkok esésvonalainak osztóköze a rajzon .A


feltételek miatt a rézsűsíkok 200-nál kisebb kótához tartozó szintvonalait kell megrajzolni. A rézsűsíkok
metszésvonalait is megadtuk. A keletkező felület csonka gúla. Egy szelvényt is készítettünk, melyet a 197-es
szintsíkba forgattunk.

7.129. ábra

Az A, B, C és D csúcsoknál „lekerekíthetjük” a felületet, ha egy-egy negyed rézsűkúpot helyezünk el a megadott


rézsűvel a 7.129b ábra szerint. A 7.130a–b ábra szemlélteti a rézsűfelületeket.
7.130. ábra

A következő feladatban egy felület (rézsűfelület) síkkal való metszetét szerkesztjük a fenti alapelv szerint.

Feladat. Adott egy síknak tekinthető terepfelület (7.131. ábra) szintvonalrendszere a 95-ös szintvonaltól a 140-es
szintvonalig, 5 méterenként. A terepfelületen egy téglalap alakú (ABCD) 40 m × 60 m-es platót szeretnénk kialakítani
120 m magasságban. Végezzük el a földmunkákhoz szükséges szerkesztéseket, ha a feltöltéshez szükséges határoló
rézsűsíkok rézsűje rf = 1,25, a bevágás esetén pedig rb = 1, M 1:1000!

7.131. ábra

Megoldás. A terepfelület és a plató metszésvonala a nullavonal. Ez az EF-fel jelölt szakasz, szintje 120 m. Az ábrán
látható, hogy az A pont kótája kisebb, mint az azonos vetülettel rendelkező tereppont kótája. Így az EABF töröttvonal
környezetében a talajt el kell távolítani, bevágás szükséges.
Az EA, AB, BF szakaszokra emelkedő rézsűsíkokat illesztünk rb rézsűvel. A szintvonalakat 5 méterenként rajzoltuk
meg, majd meghatároztuk az így nyert csonkagúla-felület részlet és a terep metszésvonalát. (A metszésvonal
szakaszait laponként szerkesztettük, felhasználva a síkok metszésvonalánál mondottakat.) Az ED, DC, CF
szakaszokra lejtő rézsűsíkokat illesztettünk kifelé rf rézsűvel. A szintvonalakat itt is 5 méterenként rajzoltuk meg.
Meghatároztuk a csonkagúla-felület részlet és a terep metszésvonalát.
A 7.132. ábrán megadtuk a szerkesztés befejezése után kialakított (mesterséges és természetes) felület egyesített
szintvonalrendszerét.

7.132. ábra

Két felület áthatási görbéjének pontjait a szintvonalrendszerek birtokában a fentiek szerint szerkeszthetjük. Ezt
mutatjuk be a következő példán keresztül.

Példa. Egy forgáskúp- és egy félhengerfelület áthatását szerkesztettük meg a 7.133. ábrán. A kúp alapköre a 0-ás
szintsíkban van, csúcsának kótája 5. A félhenger két határoló alkotójának is 0 a kótája. A rajzi egység 1 cm.
Megadtuk a felületek szintvonalrendszerét. Ehhez a henger alkotóira merőleges V vetítősíkot vettünk fel. A V síkra
merőlegesen vetítettük mindkét forgásfelületet, és V-t a vetületekkel együtt a 0-ás szintsíkba forgattuk. A
főszintsíkokkal való metszetek a kúp esetén paralel körök, a hengernél pedig alkotók. Ezek a már korábban
ismertetett módon megadhatók. A megfelelő (itt a 0, 0,5, 1, 1,5 kótákhoz tartozó) szintvonalak metszéspontjai az
áthatási görbe pontjai. A metszetgörbe további pontjaihoz jutunk, ha a felületek szintvonalrendszerét sűrítjük
(például az 1,3 kótához tartozó szintvonalakat is megrajzoljuk). A szerkesztés kivitelezése az ábráról leolvasható. A
láthatóságot úgy tüntettük fel, hogy a forgásfelületeket átlátszatlannak tekintettük.
7.133. ábra

7.6. Néhány további ábrázolási módszer

Centrális ábrázolás
Sztereogra kus projekció

Centrális ábrázolás
A fotogrammetria, a műszaki szemléltetés, a képzőművészet szempontjából fontos ábrázolási mód a centrális ábrázolás. Az
ebben az ábrázolásban szerkesztett vetületek képiesebb benyomást keltenek, mint az axonometrikus vetületek, az így
szerkesztett ábra többé-kevésbé olyan benyomást kelt, mint a tárgy közvetlen megtekintése. A perspektívában való
ábrázolás főbb szabályait a reneszánsz nagy művészei fedezték fel. A. Dürer alkotásain meg is örökítette azt az eszközt,
mellyel a perspektívaszerkesztések kivitelezhetők (7.134. ábra).

7.134. ábra

Térelemek ábrázolása, ideális térelemek


Néhány perspektívaszerkesztés
Bicentrális ábrázolás
Térelemek ábrázolása, ideális térelemek

7.135. ábra

7.136. ábra

A centrális vetítés során a tér pontjait a centrumból vagy vetítési középpontból vetítjük le egy adott, a centrumra nem
illeszkedő síkra, melyet képsíknak nevezünk (7.135. ábra). Ha O a centrum és K a képsík, akkor a tér valamely O-tól
különböző P pontjának Pc centrális vetülete (centrális képe) az OP vetítősugár és a K képsík közös pontja. A centrumnak a
képsíkon lévő merőleges vetülete az F főpont. Az FO távolság a distancia vagy szemtávolság. Az imént használt „szem” szó
arra utal, hogy egy tárgy centrális vetítéssel nyert képe megfelel annak a látványnak, melyet a tárgy az O pontban
elhelyezkedő szemlélőnek nyújt.
Az általános helyzetű e egyenes nem megy át O-n, és metszi a K képsíkot (7.136. ábra). Az e egyenes pontjaihoz tartozó
vetítősugarak egy, a centrumot tartalmazó síkban, az egyenes centrális vetítősíkjában vannak. Ennek a síknak és a
képsíknak a metszésvonalán vannak az egyenes pontjainak centrális vetületei. Az e egyenes nyompontja az E = e ⋂ K pont.
A nyompont vetülete önmaga. Az e-vel párhuzamos ē vetítőegyenes, az iránysugár, a képsíkot az pontban metszi,
melyet az egyenes iránypontjának nevezünk. Ez a pont egyelőre egyetlen egyenespontnak sem vetülete. Bővítsük ki az e
egyenes pontjait egy úgynevezett ideális ponttal, melyet az e-vel párhuzamos egyenesek közös pontjaként értelmezünk. Így
az e egyenes Ie ideális pontjának centrális vetülete lesz . Az e egyenes képpontjai tehát az egyenesen vannak.
Legyen V az e egyenes olyan pontja, melyre OV || K. A V pont Vc képe, az úgynevezett eltűnési pont, az ec egyenes ideális
pontja. Az e egyenes a vetítési rendszer (O, K), a nyompont és az iránypont ismeretében egyértelműen rekonstruálható.
Kössük ugyanis össze az O és az pontot (iránysugár), majd húzzunk párhuzamost vele az E nyomponton át! Az e
egyenessel párhuzamos g egyenes iránypontja , így vetületeik egy pontban metszik egymást.
Az O ponton átmenő egyenesek vetítőegyenesek, centrális vetületük pont, mely lehet ideális is. Az O pontra nem
illeszkedő, a K képsíkkal párhuzamos egyenes képe egyenes, nyompontja ideális pont.

7.137. ábra
7.138. ábra

A képsíkhoz képest általános helyzetű S sík metszi K-t, és nem illeszkedik O-ra (7.137. ábra). Ábrázolása két különleges
egyenesének képével történhet. Egyik az S sík és a K képsík s metszésvonala, az S sík nyomvonala. A nyomvonal centrális
vetülete nyilván önmaga. A másik a sík iS irányvonala. Ez utóbbi a centrumon átmenő és az S síkkal párhuzamos S̄ sík, az
iránysík és a képsík metszésvonala. Az is egyenesen helyezkednek el az S síkban fekvő egyenesek ideális pontjainak
centrális vetületei. Úgy tekintjük, hogy az S sík ideális pontjai egy egyenesen, a sík ideális egyenesén vannak, és az iS
irányvonal az S sík ideális egyenesének képe. Az O ponton áthaladó, K-val párhuzamos, úgynevezett eltűnési sík (E) metszi
ki S-ből a t egyenest (7.138. ábra), melyet talpvonalnak nevezünk. A t egyenes minden pontjának centrális képe ideális pont.
A nyomvonal és az irányvonal egyértelműen meghatározza a sík térbeli helyzetét. A sík rekonstrukciója a következő: az
irányvonalon és a centrumon át síkot fektetünk, azaz rekonstruáljuk az iránysíkot, majd a nyomvonalon át az iránysíkkal
párhuzamos síkot fektetve kapjuk az ábrázolt síkot. Ha az S sík O-ra illeszkedik, azaz vetítősík, akkor vetülete egyenes
(esetleg ideális egyenes).
Bővítsük ki a K képsík és az S sík pontjait ideális térelemekkel! Az O (O ∉ S) centrumú vetítés S és K pontjai között olyan
megfeleltetést létesít, mely egy-egyértelmű és egyenestartó. Az osztóviszonyt azonban nem tartja meg, mint az a nitások.
Azaz, ha A, B, P egy egyenes pontjai, akkor az Ac, Bc, Pc képpontokra az (ABP) = (AcBcPc) egyenlőség általában nem áll fenn.
Így a centrális vetítésnél már nem az a nitás tulajdonságai teljesülnek, mint ahogy ezt az eddigiek során megszoktuk. A
centrális vetítés geometriája a projektív geometria. Ezért a centrális vetületek rajzolása az eddigiektől különböző
szemléletet igényel.

Néhány perspektívaszerkesztés
Leggyakrabban a centrális vetítés K képsíkja függőleges helyzetű, a szerkesztéshez használt S sík rá merőleges (7.139. ábra).
Az S sík egyeneseinek iránypontjai az O centrumra illeszkedő, S-sel párhuzamos sík és a K képsík közös egyenesén (S
irányvonalán) vannak. Ezt ebben a speciális esetben horizontvonalnak nevezzük, és h-val jelöljük. A főpont a h
horizontvonalon helyezkedik el. Az O pont S-től való távolsága a szemmagasság, melyet m-mel jelölünk. Az S síkot ebben az
esetben alapsíknak nevezzük, és a továbbiakban A-val jelöljük. Az A sík a nyomvonala nyilván h-val párhuzamos, a és h
távolsága m-mel egyenlő.

7.139. ábra

Az alábbi szerkesztések során a centrális ábrázolás vetítőrendszerét (K és O) a Monge-féle kétképsíkos rendszerben


helyezzük el. Vegyük fel a centrális vetület, a perspektív kép szerkesztéséhez a perspektíva K képsíkját K2-vel
párhuzamosan (7.140. ábra), A-t K1-gyel azonosan. Az O centrumból vetítve K-ra a keletkező perspektív kép annak második
vetületével egybevágó. Ez a vetítési rendszer a frontális perspektíva.

7.140. ábra
A 7.141. ábrán a vetítőrendszert és egy P pontot vettünk fel két képével. Nyilván K′ ||x12, a|| x12. A horizontvonal és a
főpont mindkét vetületét szerkeszthetjük. Az O pont és főpont nyilván különbözők, de O″ = F″. A centrális vetítés
de níciója szerint O-t összekötjük P-vel (mindkét vetületet megrajzoljuk), majd megkeressük az OP egyenes K-val való
döféspontját, a Pc pontot. A döféspont első vetülete kijelölhető, Pc′ = O′P′ ⋂ K′. A Pc′ ponton átmenő rendezőegyenes O″P″-
vel való metszéspontja a Pc″ pont.

7.141. ábra

A 7.142. ábrán egy elöl- és felülnézetével adott alakzat (szobabelső) centrális vetületét szerkesztettük meg frontális
perspektívában.

7.142. ábra

7.143. ábra

Helyezzük el a perspektíva K képsíkját az első képsíkra merőlegesen, de a második képsíkkal nem párhuzamosan. Az F
főpont első vetülete az O′ pontból a perspektíva képsíkjának első vetületére, K′-re húzott merőleges talppontja. A 7.143.
ábrán látható alakzat tetszőleges P pontjának perspektív képét a fentiek szerint szerkesztettük, és mindkét vetületen
megjelöltük. A perspektíva K képsíkja a második képsíkkal nem párhuzamos, így a centrális vetület második képe már nem
egybevágó a centrális vetülettel. Helyezzük el a perspektíva képsíkját a rajz síkjában, a horizontvonalon valahol jelöljük
meg az F főpontot! A P pont Pc centrális képét megkaphatjuk, ha meghatározzuk a v = Pc″H″ és az u = Pc′F′ távolságokat a
merőleges vetületeken, és ezeket átmásoljuk.
Párhuzamos egyenesek perspektív képei egy ponton mennek át. Az ábrán a PE egyenes I2 iránypontját könnyen
kijelölhetjük. Az O′ ponton át P′E′-vel húzott párhuzamos egyenes K′-ből kimetszi az I2 iránypont első vetületét. Az I
iránypont a horizontvonalon helyezkedik el, az F′I′2 = FI2 egyenlőség alapján a perspektív képen is megkereshető. Mivel egy
objektumon rendszerint több párhuzamos él van, többnyire kevés iránypont szerkesztésére van szükség.

Bicentrális ábrázolás
A centrális vetítéssel történő ábrázolás során keletkező kép hasonlatos ahhoz, amit egyik szemünkkel érzékelünk. A két
szem által észlelt centrális képek különbözők, ez kelti bennünk a térhatást. Ez a hatás mesterségesen, gra kai, mechanikai
vagy egyéb eszközökkel is elérhető, ha azt tudjuk biztosítani, hogy mindkét szemünk csak a neki megfelelő centrális
vetületet lássa. Ezzel olyan benyomásunk támad, mintha a valóságos tárgyat szemlélnénk.
Ekkor ugyanarról a tárgyról két különböző centrumból szerkesztünk centrális vetületet ugyanarra a képsíkra
vonatkozóan. (A két centrum a két szemünknek, a képsík a rajz síkjának felel meg.) Színezzük ki pirossal a jobb, zöld
színnel a bal szemünknek megfelelő vetítési centrum esetén keletkező képeket! Nézzük az ábrát egy olyan szemüveggel,
melynek bal oldali „üvege” ugyanolyan piros árnyalatú, mint a rajz piros színe, a jobb oldali „üvege” pedig a rajznak
megfelelő zöld árnyalatú. Ekkor a jobb szemünk csak a piros, a bal szemünk csak a zöld ábrát, azaz mindkét szemünk a neki
megfelelő centrális vetületet látja. A térben látszólagosan megjelenő alakzat fekete és erőteljesen térhatású.

Sztereogra kus projekció


Eddig a tér összes pontját párhuzamosan vagy egy centrumból vetítettük egy képsíknak nevezett K síkra, annak érdekében,
hogy síkon ábrázolhassunk, és a szükséges térbeli szerkesztéseket síkbeliekre vezessük vissza. A sztereogra kus projekció
során egy Γ gömbfelület S-től különböző pontjait vetítjük a gömbfelület S pontjából egy, az S-ben vont érintősíkkal
párhuzamos K képsíkra (7.144. ábra). A vetítés a gömbfelület S-től különböző pontjai és a K euklideszi sík pontjai között
egy-egyértelmű megfeleltetést létesít. Tulajdonságai közül mindenképpen említést érdemelnek a következők. Az S ponton
átmenő gömbi körök képei egyenesek (7.145. ábra), az S pontra nem illeszkedő körök képei pedig körök (7.146. ábra). (A K
képsík egyenesei az S ponton átmenő körök képei, K tetszőleges köre pedig a Γ gömbfelület egy körének képe.) Két gömbi
kör szöge (érintőik szöge) egyenlő a képalakzatok szögével. Általában a leképezés szögtartó.

7.144. ábra

7.145. ábra

7.146. ábra

A sztereogra kus projekció egyik legfontosabb gyakorlati alkalmazása a térképkészítés. A 7.147. ábrán a földgömb déli
felének sztereogra kus projekciója látható az északi pólusból, a szélességi és hosszúsági körök vetületeit 10 fokonként
adtuk meg. A 7.148. ábrán a keleti felének a nyugati félteke középpontjából való sztereogra kus projekcióját ábrázoltuk, a
szélességi és hosszúsági körök vetületeit ismét 10 fokonként adtuk meg.
A sztereogra kus projekció jól alkalmazható a matematikán belül is, körökkel és egyenesekkel kapcsolatos problémák
megoldásánál (inverzió, körsorok, Apolloniosz-feladatok, hiperbolikus sík modellezése stb.).
Itt említünk meg egy olyan vetítést, melynél a gömbfelületet egy azt valamely főkörében érintő véges forgáshenger
felületére vetítjük (7.149a ábra). A vetítőegyenesek merőlegesen metszik az érintőhenger tengelyét. A leképezés
területtartó. A hengerpalástot síkba fejtve az úgynevezett Mercator-térképet kapjuk. (A 7.149b ábrán egy félgömbhöz
tartozó 10 fokonkénti hosszúsági és szélességi körök vetületei láthatók a síkba fejtés után.)
7.147. ábra

7.148. ábra

7.149. ábra

Irodalom
Bancsik Zs.–Lajos S.–Juhász I.: Ábrázoló geometria kezdőknek. link, mobiDIÁK könyvtár, Debreceni Egyetem, 2004
Brauner, H.: Lehrbuch der Konstruktiven Geometrie. VEB Fachbuchverlag, Leipzig, 1986
Coxeter, H. S. M.: Projektív geometria. Gondolat Kiadó, Budapest, 1986
Giering, O.–Seybold, H.: Konstruktive Ingenieurgeometrie. Karl Hanser Verlag, München–Wien, 1987
H. Temesvári Á.–Szakál P.–Németh L: Ábrázoló geometria – EMK hallgatóinak. Mezőgazda Kiadó–NyME EMK, Sopron,
2007
H. Temesvári Á.–Szakál P.–Németh L.: Ábrázoló geometria – FMK hallgatóinak. Mezőgazda Kiadó–NyME FMK, Sopron,
2008
Hajdu E.–H. Temesvári Á.: Konstruktív geometria. Mezőgazdasági Szaktudás Kiadó, Budapest, 1995
Hajós Gy.: Bevezetés a geometriába. Tankönyvkiadó, Budapest, 1961
Hohenberg, F.: Konstruktive Geometrie in der Technik. Springer Verlag, Wien–New York, 1966
Horváth J.: Sztereogra kus projekció és alkalmazásai. ELTE, 1980
Juhász I.: Számítógépi geometria és gra ka. Miskolci Egyetemi Kiadó, 1993
Kárteszi F.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1952
Krames, J.: Darstellende und kinematische Geometrie. Deuticke Verlag, Wien, 1952
Müller, E.–Kruppa, E.: Lehrbuch der darstellenden Geometrie. Springer Verlag, Wien, 1948
Nagyné Szilvási M.: CAD-Iskola. TypoTEX Kft. Elektronikus Kiadó, 1991
Pál I.: Térgeometria a műszaki gyakorlatban. Tankönyvkiadó, Budapest, 1973
Petrich G.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1969
Strommer Gy.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1974
Strommer Gy.: Geometria. Tankönyvkiadó, Budapest, 1987
Vermes I.: Geometriai útmutató és példatár (BME egyetemi jegyzet). Tankönyvkiadó, Budapest, 1991
Wunderlich, W.: Darstellende Geometrie. Hochschultaschenbücher–Verlag, Mannheim, 1966
Zigány F.: Ábrázoló geometria. Tankönyvkiadó, Budapest, 1952
8. Vektorok
8.1. A vektor fogalma és jellemzői
8.2. Műveletek vektorokkal, vektorok a koordináta-rendszerben
8.3. Vektorok skaláris szorzata, vektoriális szorzata, vegyes szorzat

8.1. A vektor fogalma és jellemzői


A matematikában, zikában és általában a természettudományokban számos olyan mennyiséggel dolgozunk, amelyeket
nemcsak nagyságukkal és mértékegységükkel jellemezhetünk, hanem irányukkal is. Azokat a mennyiségeket, melyek
jellemzésére csupán egy számértéket és mértékegységet használunk, skaláris mennyiségeknek nevezzük.

Az olyan mennyiségeket, melyek jellemzéséhez a számértéken és mértékegységen túl az irányukra is szükség van,
vektormennyiségeknek nevezzük.

Vektorok pl. az erő, a sebesség, a nyomás, a gyorsulás, a mágneses térerősség stb., míg nem vektor-, azaz skaláris
mennyiségek pl. a tömeg, a terület, a térfogat, a hőmérséklet stb. A vektormennyiségeket egyenesszakasszal szemléltetjük,
mely szakaszt egyik végén – a vektor irányításának megfelelően – egy nyíllal látjuk el. A vektor jelölésére vagy két pontot
használunk (kezdőpontját és végpontját), de gyakran félkövér kisbetűkkel jelöljük a vektorokat. A 8.1. ábrán az A pontból a

B pontba mutat az vektor, a P pontból a Q pontba mutat a vektor. Azt mondjuk, hogy az a vektor
kezdőpontja az A pont, végpontja a B pont, a b vektor kezdőpontja P, végpontja Q.

8.1. ábra

Egy vektort abszolút értékének a vektor hosszát nevezzük és így jelöljük: | a |. Az olyan vektort, melynek kezdőpontja
megegyezik végpontjával, nullvektornak mondjuk. A nullvektor tehát olyan vektor, melynek hossza 0, és megállapodás
szerint iránya tetszőleges. A nullvektor minden vektorral párhuzamos és egyben minden vektorra merőleges.
Két vektor akkor és csak akkor egyenlő, ha nagyságuk, állásuk és irányuk is megegyezik. Ez azt jelenti, hogy ha egy
vektort önmagával párhuzamosan eltolunk a térben, ugyanazt a vektort kapjuk.

8.2. Műveletek vektorokkal, vektorok a koordináta-rendszerben

Vektorok összeadása
Vektorok különbsége
Skalárral való szorzás
Vektorok a koordináta-rendszerben

Vektorok összeadása
A vektorokat kétféleképpen adhatjuk össze: paralelogrammamódszerrel vagy háromszögmódszerrel.

Az a és b vektorok összegét úgy képezzük, hogy az a és b vektorokat közös kezdőpontba toljuk, kiegészítjük
paralelogrammává; az a és b vektorok a + b összege a paralelogramma közös kezdőpontjából induló átlóvektor (8.2a
ábra). Ezt az eljárást paralelogrammamódszernek hívjuk.
8.2. ábra

Az a és b vektorokat úgy is összeadhatjuk, hogy az egyik összeadandó vektort (pl. b-t) úgy toljuk el, hogy annak
kezdőpontja a másik (a) vektor végpontjába essen; a két vektor összege az a vektor kezdőpontjából a b vektor
végpontjába mutató vektor (8.2b ábra). Ezt az eljárást háromszögmódszernek nevezzük.

A háromszögmódszer nagy előnye, hogy segítségével több vektort is gyorsan összeadhatunk; nem kell mást tennünk,
csak az összeadandó vektorokat egymást követően egymáshoz csatlakoztatni, majd az első vektor kezdőpontját az utolsó
vektor végpontjával összekötni (8.3. ábra).

8.3. ábra

A két módszer természetesen ugyanahhoz az eredményhez vezet, s hogy éppen melyik módszert alkalmazzuk két
vektor összegzésekor, azt a konkrét probléma döntheti el. A vektorok összeadása kommutatív (felcserélhető) és asszociatív
(csoportosítható) művelet:

Az összeadás e két tulajdonsága lehetővé teszi, hogy akárhány (de véges sok) vektor összegezésénél az egyes vektorokat
tetszőleges sorrendben, tetszőlegesen csoportosítva adhatjuk össze.

Vektorok különbsége

Az a vektor ellentettje (–1-szerese) az a vektor, melynek nagysága és állása megegyezik az a vektor nagyságával és
állásával, iránya pedig az a vektor irányának ellentéte.

Az a vektor ellentett vektorát –a-val jelöljük. Az a vektor ellentettjének ellentettje maga az a vektor. A 8.4. ábra egy a
vektort és ellentettjét ábrázolja.

8.4. ábra

Az a és b vektorok a – b különbségét úgy képezzük, hogy az a vektorhoz hozzáadjuk a b vektor ellentettjét (8.5a ábra).

8.5. ábra

Az a és b vektorok különbségét úgy is megkaphatjuk, ha a két vektort közös kezdőpontba toljuk; az a – b vektor a
kivonandó vektor végpontjából mutat a kisebbítendő vektor végpontjába (8.5b ábra).
Ezek szerint két vektor összegét és különbségét egyszerre szemléltethetjük, ha a vektorokat közös kezdőpontba toljuk,
kiegészítjük paralelogrammává; e paralelogramma két átlóvektora közül a közös kezdőpontból induló a két vektor összege,
a kisebbítendő vektor végpontjából induló pedig a két vektor különbsége (8.6. ábra).

8.6. ábra

Megjegyzés. Mindebből következnek az alábbi tulajdonságok.


- Ha a ⊥ b, akkor |a + b| = |a – b|, hiszen ekkor a paralelogramma egyben téglalap, melynek átlói egyenlő hosszúak.
- Ha | a | = b, akkor a + b ⊥ a – b, ekkor ugyanis a paralelogramma rombusz, melynek átlói merőlegesek egymásra.

Skalárral való szorzás


A vektorokkal többféle szorzási műveletet de niálhatunk. Ha a vektort valós számmal szorozzuk, akkor e szorzási
műveletet skalárral való szorzásnak nevezzük.

Legyen k egy tetszőleges valós szám. Ekkor a k · a vektor olyan vektor, mely az a vektorral párhuzamos, és hossza az a
vektor hosszának k-szorosa. Ha k pozitív, akkor a k · a vektor az a vektorral egyirányú, ha k negatív, akkor a k · a vektor
az a vektorral ellentétes irányú.

Ha az a vektor a nullvektor, vagy ha k = 0, akkor a szorzás eredménye a nullvektor lesz. E de nícióból az is következik,
hogy ha k és l valós számok, akkor

Ez tehát azt jelenti, hogy valós szám és vektor szorzása a számtényező tagjaira nézve, továbbá a szám és vektor szorzása
a vektortényező tagjaira nézve is disztributív művelet.
Ha az a és b vektorok párhuzamosak, egyikük sem a nullvektor, akkor egyértelműen létezik olyan k valós szám, hogy a
= k · b. Ha az a és b vektorok egyirányúak, akkor k pozitív, ha a és b ellentétes irányú vektorok, akkor k negatív (8.7. ábra).

8.7. ábra

Gyakran van szükségünk egy a vektor irányával megegyező egységvektorra. Ha az a vektort megszorozzuk abszolút

értékének reciprokával, azaz a k skalárszorzó , akkor olyan vektorhoz jutunk, melynek állása és iránya
megegyezik az a vektor állásával és irányával, abszolút értéke pedig 1. Az ilyen vektort mondjuk az a vektor
egységvektorának, és így jelöljük: a0 vagy ea.

Ha a, b és v a sík olyan vektorai, hogy a és b nem párhuzamos, akkor egyértelműen léteznek olyan k és l valós számok,
hogy v = k · a + l · b, másképpen fogalmazva: a sík tetszőleges v vektora egyértelműen felbontható két, nem párhuzamos
vektorral párhuzamos vektorok összegére (8.8. ábra).
8.8. ábra

Ez tehát azt jelenti, hogy ha a sík valamely v vektorára v = k1·a+l1·b = k2·a + l2·b, akkor k1 = k2 és l1 = l2.

Megjegyzés. Ha adottak az a, b és v vektorok, ahol a nem párhuzamos b-vel, akkor a v vektort a következőképpen
bonthatjuk fel a-val és b-vel párhuzamos összetevőkre. Először a három vektort közös kezdőpontba toljuk, majd a v
vektor P végpontján keresztül húzunk egy párhuzamos egyenest b-vel, O kezdőpontján keresztül pedig a-val. E két
egyenesnek lesz egy M metszéspontja, hiszen a és b nem párhuzamosak. Ekkor valamely k és l valós számokra OM =
k · a és MP = l · b, így .

Ha a, b és c térbeli vektorok nincsenek egy síkban, és v a tér egy tetszőleges vektora, akkor egyértelműen léteznek
olyan k, l, m valós számok, hogy

Másképpen fogalmazva: a tér tetszőleges v vektora egyértelműen felbontható három, nem egysíkú vektorral
párhuzamos vektorok összegére (8.9. ábra).

8.9. ábra

Ez tehát azt jelenti, hogy ha

akkor k1 = k2, l1 = l2 és m1 = m2.


Példák
1. Adott az O középpontú A1A2A3A4A5A6 szabályos hatszög. Az A1-ből A6-ba mutató vektor az a vektor, A1-ből A2-be
mutató vektor a b vektor. Legyen F az A4A5 szakasz felezőpontja. Írjuk fel az a és b vektorok segítségével az alábbi
vektorokat:
a) .
Tekintsük a 8.10. ábrát! A szabályos hatszög O középpontját a csúcsokkal összekötve 6 db szabályos háromszöget
kapunk.

8.10. ábra

a) Az A1A2OA6 négyszög rombusz, melynek A1O egy átlója, így .


b)
. Minthogy és , így azt kapjuk:

c) . Mivel és , így azt kapjuk:


.
d)
. Mivel , ezért . Ezek

szerint .
2. Az ABCDA′B′C′D′ kocka egy csúcsból induló élvektorai: a, b, c (8.11. ábra). Legyen O a BCC′B′ oldallap középpontja,
F a C′D′ él felezőpontja. Fejezzük ki az a, b, c vektorokkal az alábbi vektorokat:
a)
b)
c)

8.11. ábra

a)
Mivel ezért .
b)
.
c) .
3. Az előző feladat megadott csúcsaiból indítjuk az alábbi vektorokat. Hol lesz a kérdéses vektor végpontja?
a) B-ből indítva a vektor,
b)
F-ből indítva az vektor,
c)
O-ból indítva a .
a) B-ből indítva a b vektort C-be jutunk, C-ből indítva a c vektort C′-be jutunk, C′-ből indítva a vektort F-be
jutunk. Tehát a kérdéses vektor végpontja az F pont.
b)
Az F-ből indított vektor végpontja a BC él felezőpontja.
c)
Az O-ból indított vektor végpontja a DD′ él D-n túli meghosszabbításán van D-től a kocka éle
felének távolságára.
4. Az ABC háromszög súlypontja S, a BC oldal felezőpontja F. Legyen .
Fejezzük ki az a és c vektorokkal az SF vektort! (lásd 8.12. ábra).

8.12. ábra

Az vektor az vektor kétharmad része, ahol E pont az AB oldal felezőpontja. Mivel , így

. Ezek szerint
5. Legyen O az ABC háromszög síkjának egy tetszőleges pontja. O-ból a háromszög csúcsaiba mutató vektorok: a, b
és c. Határozzuk meg az O-ból a háromszög S súlypontjába mutató vektort!

Legyen F az AC oldal felezőpontja (8.13. ábra)! Ekkor

8.13. ábra
A keresett vektor: . De , tehát

. Tehát

6. Igazoljuk, hogy a háromszög csúcspontjaiból a súlypontba mutató vektorok összege nullvektor!


Legyenek az ABC oldalvektorai a, b és c a 8.14. ábrának megfelelően.

8.14. ábra

Mivel F pont az AB oldal felezőpontja, ezért a vektor . Ezek szerint az x vektor:

. Hasonlóképpen kapjuk, hogy .

Ezek szerint .

Vektorok a koordináta-rendszerben
Ha a vektorokat számokkal akarjuk jellemezni, akkor erre jó lehetőséget ad síkban, illetve térben a derékszögű koordináta-
rendszer. Vegyünk fel a síkban két egymásra merőleges egységvektort (i és j vektort) úgy, hogy az i vektort +90°-os
elforgatás vigye át a j vektorba, majd vegyük az i és j vektorokat tartalmazó egyeneseket! Ezzel megadtunk egy síkbeli
derékszögű koordináta-rendszert, melyben az egység mindkét tengelyen a megadott vektorok hossza. Az i vektort
tartalmazó egyenest szokás x tengelynek (vagy 1-es tengelynek), a j vektort tartalmazó tengelyt y tengelynek (2-es
tengelynek) nevezni. Az i és j vektorokat alapvektoroknak hívjuk. Ezek egyben helyvektorok.

Helyvektornak nevezzük az olyan vektort, melynek kezdőpontja a koordináta-rendszer origójában van. Helyvektor
koordinátái a vektor végpontjának a koordinátái.

Ezek szerint az i vektor koordinátái (1; 0), a j vektor koordinátái (0; 1). Ha valamely v helyvektor koordinátái v1, v2,
akkor azt általában így jelöljük: v(v1; v2). Ha olyan vektort adunk meg a koordináta-rendszerben, melynek kezdőpontja
nem az origó (azaz nem helyvektorról van szó), akkor azt szabadvektornak nevezzük. Egy szabadvektor koordinátái a vele
egyenlő helyvektor koordinátái.
A sík bármely P(v1; v2) pontjába mutató v helyvektor egyértelműen felírható az i, j alapvektorok segítségével v = v1i + v2j
alakban, ahol v1 és v2 a v vektor koordinátái (8.15. ábra).

8.15. ábra

A v vektor hossza, azaz a vektor abszolút értéke:


A koordináta-rendszerben elhelyezett vektorokkal végzett alapműveletek a vektor koordinátáival végzett algebrai
műveletekké válnak.

Két vektor összegének és különbségének koordinátái a megfelelő koordináták összege, illetve különbsége.

E tétel tehát azt jelenti, hogy ha a(a1; a2), b(b1; b2), akkor a + b(a1 + b1; a2 + b2) és a – b(a1 – b1; a2 – b2) (8.16. ábra).

8.16. ábra

Legyen ugyanis a = a1i + a2j és b = b1i + b2j! Ekkor

A kapott egyenlőségek pedig éppen azt mutatják, hogy az összeg-, illetve a különbségvektor koordinátái az eredeti
vektorok megfelelő koordinátáinak összege, illetve különbsége.

Egy vektor számszorosának a koordinátái a vektor megfelelő koordinátáinak számszorosai.

Ha tehát a(a1; a2) és k egy valós szám, akkor k · a(k · a1; k·a2 (lásd 8.17. ábra).

8.17. ábra

Ha ugyanis a = a1i + a2j és k egy valós szám, akkor

Mivel a paralelogramma átlói felezik egymást, így két vektor összegének a fele éppen a közös kezdőpontból induló átló
felezőpontjába mutat, tehát kimondhatjuk:

Az AB szakasz felezőpontjának koordinátái a megfelelő koordináták számtani közepe, azaz, ha A(a1, a2), B(b1; b2), akkor
az AB szakasz F felezőpontja:

Példák
1. Adottak az a(2; –2), b(1; 6), c(–4; 3) vektorok. Határozzuk meg az alábbi vektorok koordinátáit:
a) a + b + c,
b) a – 2b – c,
c)

a) Az a + b + c vektor első koordinátája: 2 + 1 – 4 = –1, második koordinátája: –2 + 6 + 3 = 7, tehát a + b + c(–1; 7).


b) Az a – 2b – c vektor első koordinátája: 2 – 2 + 4 = 4, második koordinátája: –2 – 12 – 3 = –17, tehát a – 2b – c (4; –17).
c)
Az vektor első koordinátája: 1 + 2 + 12 = 15, második koordinátája:

2. Adottak a v(6; –4), a(–2; 1) és b(2; 5) vektorok. Írjuk fel a v vektort az a és b vektorokkal párhuzamos vektorok
összegeként!
Legyen v = k · a + l · b. Ez azt jelenti, hogy

A kapott kétismeretlenes elsőfokú egyenletrendszer második egyenletének kétszeresét az első egyenlethez

hozzáadva azt kapjuk: 12l = 2, ahonnan . Ezt valamelyik eredeti egyenletbe (pl. az elsőbe)

visszahelyettesítve k-ra azt kapjuk: . Tehát a v vektor felbontása:

3. Tükrözzük az A(2; 4) pontot a B(6; 6) pontra, és határozzuk meg a tükörkép koordinátáit! Ábrázoljuk a megadott
pontokat, illetve a tükrözés után kapott A′ pontot egy koordináta-rendszerben! Az A és B pontokba mutató
helyvektorokat jelöljük a-val, illetve b-vel (8.18. ábra)!

8.18. ábra

Az A′-be mutató helyvektor: a′ = a + AA′ = a + 2 · AB. Mivel AB = b – a, így azt kapjuk:

Ezek szerint az A′ pont első koordinátája 12 – 2 = 10, második koordinátája: 12 – 4 = 8. Az A pont B pontra vonatkozó
tükörképe: A′ (10; 8).

Térbeli vektorokkal hasonló módon számolhatunk térbeli koordináta-rendszerben, mint a síkbeli esetben.

Legyen adott a térben három egy pontból induló félegyenes: e, f és g. Ha egy 180°-nál kisebb elforgatás az e egyenest f-be
viszi át, és ez az elforgatás g felől nézve pozitív irányú, akkor az e, f, g egyeneseket jobbrendszernek (jobbsodrású
rendszernek) nevezzük.

Vegyünk fel a térben három, egymásra páronként merőleges egységvektort: i-t, j-t és k-t úgy, hogy az őket tartalmazó
félegyenesek jobbsodrású rendszert alkossanak! Az e vektorokat tartalmazó egyenesek egy térbeli koordináta-rendszert
alkotnak, melyen az egység mindhárom tengelyen a vektorok hossza. E térbeli koordináta-rendszer i, j és k vektorait
alapvektoroknak nevezzük. Ezen alapvektorok térbeli helyvektorok, koordinátáik i(1; 0; 0), j(0; 1; 0), k(0; 0; 1).
A tér tetszőleges v helyvektora egyértelműen felírható az i, j, k alapvektorok segítségével

alakban, ahol v1, v2, v3 a v vektor koordinátái (8.19. ábra).


8.19. ábra

A v(v1; v2; v3) vektor hossza (abszolút értéke): .

Térbeli vektorokkal kapcsolatos műveletekre ugyanazok a tételek érvényesek, mint a síkbeli vektorok esetében.
Az a(a1; a2; a3) és b(b1; b2; b3) vektorok összegének, illetve különbségének koordinátái:

Az a(a1; a2; a3) vektor k- (valós szám) szorosának koordinátái:

8.3. Vektorok skaláris szorzata, vektoriális szorzata, vegyes szorzat


Vektorok között értelmezünk kétféle szorzási műveletet: a skaláris szorzást, valamint a vektoriális szorzást. Az elnevezések
onnan erednek, hogy míg a vektorok skaláris szorzatának eredménye valós szám (skaláris mennyiség), addig két vektor
vektoriális szorzatának eredménye szintén vektor.

Skaláris szorzat
Vektoriális szorzat
Vegyes szorzat

Skaláris szorzat

Az a és b vektorok skaláris szorzata: a · b = | a | · | b | · cos φ, ahol φ a két vektor által közbezárt szög.

Tehát két vektor skaláris szorzata egy háromtényezős szorzat, mely tényezők valós számok.
Ha az a és b vektorok párhuzamosak egymással, akkor φ = 0 vagy φ = 180°, ennek megfelelően cos φ = 1, vagy cos φ = –1.
Ekkor tehát

Ha az a és b vektorok merőlegesek egymásra, akkor cos φ = 0, ekkor tehát a · b = 0. Ennek megfordítása is igaz:

Két vektor akkor és csak akkor merőleges egymásra, ha skaláris szorzatuk 0.

A skaláris szorzat kommutatív művelet: a · b = b · a, hiszen a valós számok körében a szorzás kommutatív és asszociatív
művelet. Igaz továbbá, hogy

Vektorok skaláris szorzata a vektorösszeadásra nézve disztributív művelet:


Ez utóbbi egyenlőséget könnyen beláthatjuk, ha a 8.20. ábrán szereplő b, c és b + c vektorok vetületeit
összehasonlítjuk.

8.20. ábra

A koordináta-rendszer i, j, k alapvektoraira

(8.1)

(Természetesen síkbeli koordináta-rendszerben a k vektort nem vesszük gyelembe.)

Az a(a1, a2; a3) és b(b1, b2; b3) vektorok skaláris szorzata a megfelelő koordináták szorzatainak összege.

A tétel szerint tehát a · b = a1b1 + a2b2 + a3b3.

A tétel bizonyításához felhasználjuk a skaláris szorzat de níciójának (8.1)-ben leírt következményeit.

A tétel lehetőséget nyújt két koordinátáival adott vektor hajlásszögének kiszámítására.

(Természetesen síkbeli vektorok esetében a harmadik koordinátákat elhagyjuk.)


Példák
1. Az ABC szabályos háromszög oldalai 12 egység hosszúak. A BC oldal felezőpontja F. Határozzuk meg az alábbi
skaláris szorzatok értékét:
a) ,
b) ,
c) .
Tekintsüka 8.21. ábrát!
a) Az és vektorok hajlásszöge 60°, így e két vektor skaláris szorzata:

8.21. ábra
b)
Az vektor abszolút értéke: . Az és vektorok hajlásszöge 30°, így e két
vektor skaláris szorzata:

c) A és vektorok nyilvánvalóan merőlegesek egymásra, hiszen F a BC oldal felezőpontja, így AF a


háromszög egy magassága. Ezek szerint .
2. Az ABCDEF szabályos hatszög oldalai 3 egység hosszúak. Határozzuk meg az alábbi skaláris szorzatok értékét:
a) ,
b) ,
c) .
Tekintsük a 8.22. ábrát! A szabályos hatszög középpontját (szimmetriacentrumát) a csúcsokkal összekötve 6 db
szabályos háromszöget kapunk.

8.22. ábra

a) , az és vektorok 60°-os szöget zárnak be egymással, így

b)
. A két vektor hajlásszöge 120°, így

c)
. A két vektor hajlásszöge 30°, tehát

3. Számítsuk ki az alábbi – koordinátáikkal adott – vektorok skaláris szorzatát!


a) a(–3; 2), b(3; –4),
b) a(2; –4; 6), b(3; 1; –1),
c)

a) a · b = –9 – 8 = –17,
b) a – b = 6 – 4 – 6 = –4,
c) a · b = 2n2 + 2n2 + 2n2 = 6n2.
4. Határozzuk meg a b vektorban szereplő b paraméter értékét úgy, hogy a következő két vektor merőleges legyen
egymásra: a(3; –2; 1), b(b; 3; –4).
A két vektor akkor és csak akkor merőleges egymásra, ha skaláris szorzatuk 0, azaz

5. Határozzuk meg a b vektorban szereplő b paraméter értékét úgy, hogy a következő két vektor hajlásszöge 60°
legyen: a(–1; 2), b(1; b).
Az a és b vektorok skaláris szorzata: a · b = –1 + 2b. A két vektor abszolút értéke:

Ezek szerint írhatjuk a következő egyenletet:


(8.2)

Az egyenlet jobb oldala pozitív, így szükséges, hogy legyen. A (8.2) egyenlet mindkét oldalát 2-vel
szorozva, majd mindkét oldalt négyzetre emelve azt kapjuk:

Mivel , így a feltételeknek eleget tevő b paraméter értéke: .


6. * Az ABC derékszögű háromszög AC befogójára kifelé emeltük az CAEF négyzetet, BC befogójára kifelé a CBGH
négyzetet. Legyen M az EG szakasz felezőpontja! Igazoljuk, hogy az M pont illeszkedik az ABC háromszög köré
írható körére!
Mindenekelőtt készítsünk ábrát a feladat szövege alapján! Helyezzük el a háromszöget egy jól választott
koordináta-rendszerben (8.23. ábra)! Ha az EG szakasz M felezőpontja illeszkedik az ABC háromszög köré írható
körére, akkor – Thalész tétele miatt – BMA ∠ = 90° kell, hogy legyen. Ezek szerint azt kell megmutatnunk, hogy az
és vektorok merőlegesek egymásra, vagyis skaláris szorzatuk 0.

Az első koordinátája: ; második koordinátája: .

A vektor első koordinátája: , második koordinátája:

8.23. ábra

A két vektor skaláris szorzata:

Tehát a BMA ∠ = 90°, így az M pont valóban rajta van az ABC háromszög köré írható körén. (Az és
vektorok koordinátáiból az is látszik, hogy e két vektor abszolút értéke egyenlő, vagyis az ABM háromszög
egyenlő szárú.)

Vektoriális szorzat
Két vektor között értelmezünk egy olyan szorzási műveletet, melynek eredménye szintén vektor; ezt a szorzást vektoriális
szorzatnak nevezzük.

Az a és b vektorok vektoriális szorzata olyan vektor,


a) melynek abszolút értéke | a | · | b | · sin φ, ahol φ a két vektor által közbezárt szög,
b) amely merőleges az a és b vektorok által kifeszített síkra,
c) amely vektor olyan, hogy az a, b és a szorzatvektor jobbsodrású rendszert alkot.

Az a és b vektorok vektoriális szorzatának jele: a × b (olvasd: „a kereszt bé”).


A nem párhuzamos a és b vektorokat közös kezdőpontba tolva szemléltethetjük az a × b vektort (8.24. ábra).
8.24. ábra

Ha az a és b vektorok merőlegesek egymásra, akkor | a × b | = | a | · | b |, hiszen ekkor sin 90° = 1.

Két vektor vektoriális szorzata akkor és csak akkor nullvektor, ha a két vektor párhuzamos egymással.

a) Ha ugyanis a két vektor egyike nullvektor, akkor az állítás nyilvánvaló, hiszen a nullvektor tetszőleges irányú, így
a két vektort párhuzamosnak mondhatjuk. Ha egyik vektor sem a nullvektor, akkor a közbezárt φ szögre sin φ =
0, ami azt jelenti, hogy vagy φ = 0°, vagy φ = 180°, tehát a két vektor párhuzamos.
b) Ha a két vektor párhuzamos, akkor vagy az egyikük nullvektor, tehát a szorzat nullvektor, vagy φ = 0°, vagy φ =
180°, tehát ekkor sin φ = 0, így a vektoriális szorzat eredménye nullvektor.

Ha az a és b nem párhuzamos vektorokat közös kezdőpontba toljuk (8.24. ábra), akkor az a × b vektoriális szorzat
abszolút értéke a két vektor által kifeszített paralelogramma területével egyenlő. A vektoriális szorzat de níciójából
egyenesen következik, hogy ez a szorzás nem kommutatív művelet; az a × b és b × a vektorok egymásnak ellentett vektorai:
a × b = – b × a.
A vektoriális szorzat fontos tulajdonságai még:

Bármely a, b és c vektorok és k valós szám esetén

Az első azonosság azt mutatja, hogy a vektoriális szorzat bármely tényezőjét egy valós számmal szorozva az egész
szorzat megszorzódik a kérdéses valós számmal, a másik két azonosság szerint pedig kimondhatjuk, hogy a vektoriális
szorzat bármely tényezőjének tagjaira nézve disztributív művelet. (Az utóbbi két azonosság mindkét tagját ki kell
mondanunk, hiszen a vektoriális szorzat nem kommutatív művelet.)
Ha i, j és k a térbeli derékszögű koordináta-rendszer alapvektorai, akkor a vektoriális szorzat de níciójából következik:

(8.3)

A 3.6. fejezetben megismerkedtünk a másodrendű determináns fogalmával. Mivel a vektoriális szorzat kiszámításánál
elengedhetetlenül szükséges, ezért most tárgyaljuk a harmadrendű determináns fogalmát és kiszámítási módját.
Harmadrendű determinánsnak mondjuk az alábbi típusú 3 × 3-as számtáblázatot:

(8.4)

A (8.4) harmadrendű determinánshoz hozzárendelünk egy valós értéket, melyet az alábbi módon számíthatunk ki:
(8.5)

A harmadrendű determináns értékének meghatározása tehát három db másodrendű determináns értékének


kiszámítására vezethető vissza. Azt mondjuk, hogy a harmadrendű determinást (8.5)-ben az első sor szerint fejtettük
ki. (Kifejthettük volna bármely más sor vagy oszlop szerint is; a determinánsokkal részletesebben a 11.1. fejezetben
foglalkozunk majd.)

A másod-, harmad- és általában az n-edrendű determinánsok két fontos tulajdonsága a következő:

A determináns értéke nem változik, ha valamely sorának (oszlopának) számszorosát hozzáadjuk egy másik sorhoz
(oszlophoz). A determináns értéke –1-szeresére változik, ha két sorát (vagy két oszlopát) felcseréljük.

Az a(a1; a2; a3), b(b1, b2; b3) koordinátákkal adott térbeli vektorok vektoriális szorzata:

Végezzük el az a × b = (a1i + a1j + a3k) × (b1i + b2j + b3k) szorzást tagonként a vektoriális szorzás tulajdonságainak
megfelelően.

Felhasználva a (8.3)-ban leírtakat, azt kapjuk:

A kapott kifejezést (8.5)-tel egybevetve adódik a tételben szereplő állítás.

Példák
1. Számítsuk ki az alábbi vektorok vektoriális szorzatát:
a) a(2; –3; 4), b(2; 0; –3),
b) a(4; 2; –2), b(5; 2; 1)!
a)

tehát a × b(9; 14; 6).


b)

tehát a × b(6; –14; –2).


2. Adottak az a(3; –1; 2) és a b(x;y; 6) vektorok. Határozzuk meg a b vektor hiányzó koordinátáit úgy, hogy a × b = 2 · i
+ 6 · j teljesüljön!
Mindenekelőtt szükséges, hogy az a vektor merőleges legyen az a × b vektorra. Ez teljesül, hiszen skaláris
szorzatuk: a · (a × b) = 3·2–1·6 + 2·0 = 0.
A b vektornak ugyancsak merőlegesnek kell lennie az a × b vektorra, tehát 2x + 6y = 0 kell, hogy legyen, azaz x = –
3y.

Ezt egybevetve az a × b(3; 6; 0) vektorral, azt kapjuk:


ahonnan y = –4, x = 12. Tehát a keresett b vektor: b(12; –4; 6).
3. Adott három vektor: a(3; –1; 4), b(–2; –1; 2), c(4; 2; –4). Számítsuk ki az a × b és c vektorok hajlásszögét!

Az a × b(2; –14; –5) és c(4; 2; –4) vektorok hajlásszögének meghatározásához először számítsuk ki a két vektor
skaláris szorzatát: c(a × b) = 2·4–2·14+ 5·4 = 8–28 + + 20 = 0. Tehát az a × b és c vektorok merőlegesek egymásra.
4. Számítsuk ki az előző feladat a, b, c vektoraival az a) (a × b) × c és az b) a × (b × c) vektorokat!
a) Az a × b vektort az előző feladatban kiszámoltuk: a × b(2; –14; –5). Így

b)

tehát b × c(–2; 4; 0).

5. Az ABC háromszög csúcspontjainak koordinátái A(2; 1; 5), B(4; 3; –1), C(2; 2; 6). Számítsuk ki a háromszög
területét!
Legyenek a, b, c a háromszög megfelelő csúcsaiba mutató helyvektorok (8.25. ábra)! Az A csúcsból induló
oldalvektorok: c – a(0; 1; 1), b–a(2; 2; –6). Az ABC háromszög t területe az A-ból induló oldalvektorok vektoriális
szorzata abszolút értékének a fele.

(8.6)

8.25. ábra

Az oldalvektorok vektoriális szorzatának abszolút értéke:

Ezt (8.6)-ba helyettesítve az ABC háromszög t területe:

Vegyes szorzat
A skaláris szorzat és a vektoriális szorzat bizonyos kombinációjával jutunk el vektorok vegyes szorzatához.
Az a, b és c vektorok vegyes szorzata: abc = (a × b) · c, azaz az első két tényező vektoriális szorzatának a harmadik
tényezővel vett skaláris szorzata.

Az abc jelölés merőben különbözik az (ab)c vagy a(bc) jelöléstől; utóbbi esetekben ugyanis a zárójelben szereplő
tényezők skaláris szorzatával (mint skalárral) szorozzuk a zárójelen kívüli vektort, míg az első esetben az a, b és c vektorok
imént de niált vegyes szorzatáról van szó.
A vegyes szorzat de níciójában két vektor vektoriális szorzatának (tehát egy vektornak) és egy vektornak skaláris
szorzatáról van szó, amiből következik, hogy a vegyes szorzat skaláris mennyiség.
Ha az a és b vektorok párhuzamosak, akkor az a, b és c vektorok egy síkban vannak. Mivel az a × b vektor merőleges
erre a síkra, ezért a × b a c vektorra is merőleges, így az a, b és c vektorok vegyes szorzata 0. Ha az a és b vektorok nem
párhuzamosak, akkor vektoriális szorzatuk merőleges az a és b vektor által kifeszített síkra. A c vektor akkor és csak akkor
merőleges az a × b vektorra, ha c is benne van e síkban. Ekkor viszont a c vektornak a × b-vel vett skaláris szorzata 0. Ezek
szerint kimondhatjuk:

Három vektor akkor és csak akkor van egy síkban, ha vegyes szorzatuk 0.

Ha az a, b és c vektorokat közös kezdőpontba toljuk, akkor együtt egy paralelepipedont feszítenek ki (8.26. ábra).

8.26. ábra

E paralelepipedonnak az a és b vektorok által kifeszített alaplapjának területe |a × b|. Mivel a c vektornak az a×b
vektorra eső merőleges vetülete |c| · cos φ – ahol φ a c vektor és az a × b vektor hajlásszöge –, ami egyben a paralelepipedon
alaplapjához tartozó magassága, így kimondhatjuk az alábbi tételt:

Az a, b és c vektorok vegyes szorzata az a, b és c vektorok által kifeszített paralelepipedon térfogatával egyenlő (feltéve,
hogy az a, b és c vektorok jobbsodrású rendszert alkotnak).

Megjegyzés. Természetesen, ha az a, b és c vektorok nem jobbsodrású rendszert alkotnak, akkor az abc vegyes
szorzat a paralelepipedon térfogatának –1-szeresét adja. A most kimondott tétel természetesen csak nem egy síkban
levő, tehát paralelepipedont kifeszítő vektorokról szól.

Az a(a1; a2; a3), b(b1; b2; b3), c(c1; c2; c3) vektorok vegyes szorzata

A tételben szereplő detertminánst az első sor szerint kifejtve azt kapjuk

(8.7)

Az a és b vektorok vektoriális szorzata

A kapott vektornak a c = c1i + c2j + c3k vektorral vett skaláris szorzata


A kapott hattagú összeg negyedik és ötödik tagjából a1-et, első és utolsó tagjából –a2-t, második és harmadik tagjából a3-
t kiemelve azt kapjuk:

A kapott eredményt (8.7)-tel egybevetve a tétel állítása adódik.


A tétel fontos következménye hogy a vegyes szorzat értéke nem változik, ha tényezőit ciklikusan felcseréljük: abc = bca
= cab. Ugyanis – tudva, hogy a determináns értéke a –1-szeresére változik, ha abban két sort felcserélünk –

Mivel a skaláris szorzat kommutatív, így

(8.8)

De – mint az előbb láttuk – abc = bca = (b × c) · a = a · (b × c). Ezt (8.8)-cal egybevetve azt kapjuk:

Vagyis a vektorok vegyes szorzatában a kétféle szorzás műveletét felcserélve a vegyes szorzat értéke nem változik.
Szokás ezt a vektorok vegyes szorzatára vonatkozó felcserélési tételnek nevezni.
Ha három nem egy síkú vektor között végzünk többszörös vektoriális szorzást, akkor meglehetősen hosszadalmas
számolást kell elvégeznünk. Ennek egyszerűbb elvégzéséről szól a kifejtési tétel.

Megjegyzés. Elegendő csak az egyik (pl. az első) képletet igazolni, ugyanis

A képletek könnyebb megjegyzéséhez segíthet a következő meggondolás: az a × b vektor merőleges az a vektorra és a


b vektorra is. Mivel az (a × b) × c vektor merőleges az a × b vektorra, így az a × b-re merőleges vektorokkal
párhuzamos, vagyis (a × b) × c párhuzamos a-val és b-vel is. Ez viszont azt jelenti, hogy az (a × b) × c vektor az a és b
vektorok valamilyen számszorosainak összegeként állítható elő. Az együtthatók éppen a képletben szereplő skaláris
szorzatok.
Az első egyenlőség bizonyításához megmutatjuk mindkét oldalon az i alapvektor együtthatóinak egyenlőségét. (A j
és k vektorok együtthatóinak egyenlősége hasonlóképpen látható be.)

tehát

Ezzel

A determináns kifejtése után az első tag


(8.9)

Most számítsuk ki az (ac)b – (bc)a vektor első tagját:

A kapott eredményt (8.9)-cel egybevetve kapjuk a kifejtési tétel helyességét az i vektorra. Teljesen hasonló módon
adódik a j és k vektorok együtthatóinak egyenlősége.
Példák
1. Számítsuk ki az alábbi a, b, c vektorok abc vegyes szorzatát!

2. Adottak az a(4; –1; 2), b(1; 2; 3), c(3; 3; c) vektorok. Határozzuk meg a c vektorban szereplő c paraméter értékét úgy,
hogy a három vektor egy síkú legyen! A három vektor akkor és csak akkor egy síkú, ha vegyes szorzatuk 0.

3. Számítsuk ki az A(–2; 4; 3), B(2; 1; –1), C(3; –4; –2) pontok és az origó által meghatározott tetraéder térfogatát!
Legyenek az A, B, C pontba mutató helyvektorok rendre a, b és c. A keresett tetraéder térfogata az a, b és c
vektorok által kifeszített paralelepipedon térfogatának hatodrésze; a paralelepipedon térfogata az abc vegyes
szorzat abszolút értéke:

Tehát a tetraéder V térfogata: .


4. Ellenőrizzük az alábbi a, b, c vektorokkal az a) felcserélési tételt, illetve a b) kifejtési tételt:

a) Először számítsuk ki az (a × b) · c, majd az a · (b × c) skalárok értékét!

(8.10)

A kapott eredményt (8.10)-zel egybevetve az ellenőrzéssel készen vagyunk.


b) Az a × b vektort a feladat a) részében már meghatároztuk.

(8.11)
A kapott eredményt (8.11)-gyel egybevetve valóban (a × b) × c = (ac)b – (bc)a.
9. Szögfüggvények
9.1. A hegyesszög szögfüggvényei
9.2. Szögfüggvények általánosítása
9.3. Szögfüggvények alkalmazása háromszögekkel kapcsolatos problémák
megoldására
9.4. Trigonometrikus egyenletek
9.5. Trigonometrikus függvények és inverzeik
9.6. Gömbháromszögek és tulajdonságaik

9.1. A hegyesszög szögfüggvényei

A trigonometriai ismeretek a csillagászat tudományának megszületésével és fejlődésével együtt jelentek meg a


matematika tudományán belül. A legelső írásos emlék, amely már trigonometriai ismereteket is tartalmaz
Ptolemaiosztól (Kr. u. 100 körül) származik. Az ő munkájában már a mai szinusztáblázatnak megfelelő húrtáblázatok
találhatók, és ismerteti két szög összegének és különbségének szinuszát és koszinuszát is. Később al-Hvarizmi, a
kiváló arab matematikus 820 körül megjelent munkája már nem csak szinusz- és koszinusztáblázatokat, hanem
tangens- és kotagensértékeket is tartalmaz. Az első – csillagászattól független – önálló trigonometriai összefoglaló
művet Regiomontanus (1436–1476) készítette. A trigonometriai jelölések mai végleges alakját Euler dolgozta ki 1748-
ban megjelent könyvében.

Már az ókorban is tudták azt, hogy ha két derékszögű háromszög egy-egy hegyesszögében megegyezik, akkor a két
háromszög hasonló, vagyis megfelelő oldalaik aránya egyenlő. Ez tehát azt jelenti, hogy a derékszögű háromszög valamely
két oldalának arányát a háromszög egyetlen hegyesszöge egyértelműen meghatározza. E felismerés vezetett az első olyan
táblázatok megalkotásához, melyekben a különböző fokokhoz tartozó oldalarányokat (valamely befogó és az átfogó
arányát, két befogó arányát stb.) foglalták össze; így születtek meg az első „szögfüggvény-táblázatok”. Ezek birtokában már
konkrét számításokat lehetett végezni egy derékszögű háromszögben valamely oldal és valamely szög ismeretében. Mivel
bármely sokszög háromszögekre és bármely háromszög derékszögű háromszögekre bontható, így a derékszögű
háromszögekben az oldalak arányának valamely hegyesszöggel való kapcsolata egyre nagyobb jelentőséggel bírt, így
megszületett a háromszögtan, azaz a trigonometria (görögül tri = három, go = szög, metria = mérés).

Legyen α a derékszögű háromszög egyik hegyesszöge. Ekkor

(ejtsd: szinusz alfa, koszinusz alfa, tangens alfa, kotangens alfa, szekáns alfa, koszekáns alfa).
A 9.1. ábrát tekintve tehát a de níció szerint

9.1. ábra
A de níciókból világos, hogy bármely hegyesszög szinusza, koszinusza, tangense és kotangense pozitív mennyiség.
Mivel a derékszögű háromszög átfogója mindig nagyobb bármelyik befogónál, ezért bármely hegyesszög esetében sin α < 1
és cos α < 1. (Ugyanez egy szög tangensének és kotangensének esetében nem mondható el; ezek bármilyen kicsik vagy
bármilyen nagyok lehetnek.)
Pitagorasz tételének ismeretében elegendő lenne egyetlen szögfüggvényt használnunk, mert azzal (bármelyikkel) a
derékszögű háromszög minden adata már kiszámolható lenne, de a számítások meggyorsítása érdekében általában négy
szögfüggvényt használunk: a sin, cos, tg és ctg szögfüggvényeket. A továbbiakban mi is e négy szögfüggvényre
szorítkozunk csak.
A 9.1. ábra jelöléseivel

Mivel β = 90° – α, így kimondhatjuk:

Bármely szög szinusza egyenlő pótszögének koszinuszával, és bármely szög tangense egyenlő pótszögének
kotangensével, vagyis

Most emeljük négyzetre egy hegyesszög szinuszát és koszinuszát, majd adjuk ezeket össze:

ezek összege

Bármely hegyesszög szinuszának és koszinuszának négyzetösszege 1,

(9.1)

A és összefüggésekből azonnal látszik, hogy ugyanannak a szögnek a tangense és


kotangense egymásnak reciproka.

(9.2)

A különböző szögfüggvények közötti újabb összefüggéshez jutunk, ha a tg α-t, illetve ctg α-t de niáló törtek
számlálóját és nevezőjét is elosztjuk a háromszög átfogójával.

Bármely szög tangense egyenlő ugyanazon szög szinuszának és koszinuszának a hányadosával, és bármely szög
kotangense egyenlő ugyanazon szög koszinuszának és szinuszának a hányadosával:
(9.3)

A (9.1), (9.2) és (9.3) összefüggések lehetőséget nyújtanak arra, hogy bármely szögfüggvényt bármely másik
szögfüggvénnyel kifejezhessünk. Fejezzük ki pl. sin α-t tg α-val. (9.3)-ból sin α = tg α · cos α, de (9.1)-ből cos
, így írhatjuk

Mindkét oldalon pozitív mennyiségek szerepelnek, így négyzetre emelve azt kapjuk:

ahonnan

Az egyes szögfüggvényeknek más szögfüggvénnyel való kifejezését a következő táblázat mutatja.

sin α cos α tg α ctg α

sin α sin α

cos α cos α

tg α tg α

ctg α ctg α

Speciális szögek szögfüggvényei

Speciális szögek szögfüggvényei


A sík- és térgeometriában, de általában a természettudományokban gyakran kerülnek elő speciális, nevezetes szögek: ezek
a 30°, 45° és a 60°. Ezek szögfüggvényértékeit könnyen meghatározhatjuk. Tekintsük a 9.2a és 9.2b ábrát! A 9.2a ábrán egy 2
egység oldalú szabályos háromszöget, a 9.2b ábrán pedig egy egységnyi oldalú négyzetet láthatunk. Ezek 30°-os és 60°-os,
valamint 45°-os szögeire alkalmazva a hegyesszög szögfüggvényeinek de nícióját, megkapjuk a megfelelő
szögfüggvényértékeket (lásd az ábra alatti táblázatot).

9.2. ábra
Megjegyzés. Könnyen meghatározhatjuk táblázat és számológép nélkül a 15°, a 75°, a 22,5°, a 72° és a 18°
szögfüggvényeit is.
A 15° és a 75° szögfüggvényeinek meghatározásához vegyünk fel egy olyan derékszögű háromszöget, melynek egyik
szöge 15°, rajzoljuk meg ennek átfogóhoz tartozó magasságát és súlyvonalát (9.3. ábra)!

9.3. ábra

Az AFC háromszög egyenlő szárú háromszög, így FCA∠ = FAC∠ = 15°. Ennek a háromszögnek a TFC szög egy külső
szöge, így TFC∠ = 30°. Ez azt jelenti, hogy TCF∠ = 60°, vagyis a TFC háromszög egy félszabályos háromszög. Ha az
ABC háromszög átfogóhoz tartozó magassága 1, akkor FC = 2 és . Ezek szerint , tehát

Pitagorasz tétele alapján

Ezek után már az ATC derékszögű háromszögből 15° és 75° összes többi szögfüggvénye meghatározható.
(Természetesen ezeket a szögfüggvényeket az egyes szögfüggvényeknek más szögfüggvénnyel való kifejezését
tartalmazó táblázat alapján is meghatározhattuk volna.)
A 22,5° szögfüggvényeinek meghatározásához vegyünk fel egy egységnyi befogójú egyenlő szárú derékszögű
háromszöget, és rajzoljuk be annak egyik befogójához tartozó szögfelezőjét (9.4. ábra)!

9.4. ábra

A háromszög átfogója . Az ABC háromszögre alkalmazva a szögfelezőtételt azt kapjuk, hogy

Így . A 22,5° többi szögfüggvényértékeit pedig vagy az említett táblázat alapján, vagy
pedig Pitagorasz tételének segítségével már könnyen meghatározhatjuk.
A 18° és 72° szögfüggvényeinek meghatározásához vegyünk fel egy olyan egyenlő szárú háromszöget, melynek alapja
1, az alapon fekvő szögei pedig 72°-osak, és rajzoljuk meg az egyik szárhoz tartozó szögfelezőt (9.5.ábra)!
9.5. ábra

A háromszög szárszöge ACB∠ = 36°. Ebből következik, hogy az ADC és az ABD háromszögek is egyenlő szárú
háromszögek, és az ABD háromszög hasonló az eredeti ABC háromszöghöz. Így

Ezzel . Innen pedig a többi szögfüggvény – és egyben a 18° szögfüggvényei is – már az


egyes szögfüggvényeknek más szögfüggvénnyel való kifejezését tartalmazó táblázat alapján meghatározhatók.
(Az addíciós tételek – lásd 9.2. fejezet – segítségével bármely két szög összegének, különbségének vagy bármely szög
kétszeresének a szögfüggvényeit meghatározhatjuk, így akkor már minden olyan szög szögfüggvénye
meghatározható lesz táblázat és számológép nélkül, melyek mérőszáma egész szám és osztható 3-mal.)
Példák
1. Egy teherautó 1,8 m magas platójáról egy 5,2 m hosszú deszkán gurítják le az árut.
Mekkora szöget zár be a deszka a vízszintes talajjal?
A 9.6. ábrát tekintve felírhatjuk

9.6. ábra

2. Mekkorák az R sugarú a) körbe és b) köré írt n oldalú szabályos sokszög oldalai?


a)

9.7. ábra

Az n oldalú szabályos sokszög középpontját a csúcsokkal összekötve n db egyenlő szárú háromszög keletkezik,

melyek szárszöge . A kör R sugara e háromszögek szárával egyenlő. A 9.7a ábra megfelelő háromszögére

, ahonnan a körbe írható szabályos sokszög oldala .


b) A kör köré írható szabályos sokszög esetében az egyenlő szárú háromszögek magassága lesz a kör sugara. A 9.7b

ábra jelöléseivel , ahonnan a kör köré írt szabályos sokszög oldala .


3. Rómeó egy 4,6 m hosszú létra segítségével akart bemászni Júlia ablakának párkányán. Ehhez a létrát a
vízszintessel 52°-os szöget bezárva kell kitámasztani. Sajnos Rómeó elvétette a szöget, és a vízszintessel 32°-os
szöget bezárva támasztotta ki, így tévedésből a dadus ablakának párkányán mászott be. Hány méterrel van
alacsonyabban a dadus ablakának párkánya, mint Júliáé?
Készítsük el a szükséges ábrát a feladat szövege alapján (9.8. ábra)!

9.8. ábra

A BCJ derékszögű háromszögben ahonnan h = 4,6 · sin 52° ≈ 4,6 · 0,788 ≈ 3,62 m. Az ACD

derékszögű háromszögben , ahonnan y = 4,6 · sin 32° ≈ 2,44 m. A két ablakpárkány közti távolság h
– y ≈ 1,18 m.
4. Egy hegycsúcsot két expedíció akart egyszerre meghódítani. Az egyik csapat a keleti oldalról indult, 464 m utat
kellett megtenniük, amely a vízszintessel 28°-os szöget zár be. A másik csapat (ugyanolyan magassági szintről
indulva) a nyugati oldalon mászta meg a hegyet, nekik 38°-os emelkedési szögű utat kellett megtenniük. A keleti
oldalon menők 2,4 km/h sebességgel, a meredekebb nyugati oldalon menők 1,4 km/h sebességgel haladtak.
Melyik csapat ért előbb célba?
Tekintsük a 9.9. ábrát, melyen m-mel jelöltük a hegy magasságát, s-sel a nyugati oldalon haladók által megteendő
utat.

9.9. ábra

Az ATC derékszögű háromszögben , ahonnan m = 464 · sin 28° ≈ 217,8 m.

Tehát a keleti oldalon haladók menetideje: óra. A BTC derékszögű háromszögben

, ahonnan m. Tehát a nyugati oldalon haladók menetideje:


óra. Tehát a nyugati oldalon haladók érkeznek hamarabb a tetőre.
5. Egy derékszögű háromszög befogói 4,2 cm és 8,4 cm. Számítsuk ki a befogókhoz tartozó súlyvonalak hajlásszögét!

Mivel F az AC oldalfelező pontja (9.10. ábra), ezért CF = 4,2 cm. A BCF háromszögben , ahonnan β
= 45°.

9.10. ábra

Az E pont a BC oldal felezőpontja, így EC = 2,1; az AEC háromszögben , ahonnan α ≈ 14°. A β szög az
ASF háromszögnek egy külső szöge, így a súlyvonalak φ hajlásszöge φ = β – α ≈ 45° – 14° ≈ 31°.
6. Egy háromszög egyik oldala a, szemközti szöge α. Igazoljuk, hogy a háromszög köré írt körének R sugara:
Tekintsük a 9.11. ábrát! A kerületi és középponti szögek tételéből következik, hogy BOC ∠ = 2α, tehát BOF ∠ = α. A

BOF háromszögben , ahonnan kapjuk a bizonyítandó állítást: .

9.11. ábra

7. Számítsuk ki
a) az ABCDA’B’C’D’ kocka AC’ testátlójának az ABCD lappal bezárt szögét,
b) az ABCD szabályos tetraéder AD élének az ABC lappal bezárt szögét,
c) a szabályos tetraéder két lapjának hajlásszögét,
d) a négyzet alapú szabályos gúla oldalélének az alaplappal bezárt szögét,
e) a négyzet alapú szabályos gúla oldallapjának az alaplappal bezárt szögét!
a) Legyen a kocka minden éle 1. A 9.12a ábrán α-val jelöltük a keresett szöget. A besatírozott derékszögű

háromszögnek minden oldala ismert, így bármely szögfüggvényt felírhatjuk. , ahonnan α ≈


35,26°.

9.12. ábra

b) Legyen a szabályos tetraéder minden éle 1. A 9.12b ábrán α-val jelöltük az oldalél és az ABC háromszöglap
hajlásszögét. Mivel a D csúcsból induló m magasság T talppontja az ABC háromszögnek súlypontja, ezért

. Az ATD derékszögű háromszögben , innen α ≈ 54,7°.


c) A szabályos tetraéder két oldallapjának hajlásszögét a 9.12b ábrán β-val jelöltük. Mivel F az AB oldal

felezőpontja, ezért . DF az egységnyi oldalú szabályos háromszög magassága; .

Az FTD háromszögben , ahonnan β ≈ 70,5°.


d) Legyen a négyzet alapú gúla minden éle egységnyi. Az oldalél és alaplap hajlásszögét α-val jelöltük a 9.12c

ábrán. Mivel CT az alapnégyzet átlójának a felezőpontja, ezért . Az ETC háromszögben

, ahonnan α = 45°. (Ez egyben azt is jelenti, hogy a CTE háromszög egyenlő szárú, vagyis

.)
e)
Az ETF háromszögben , így , ahonnan β ≈ 54,7°.
8. Egy 24 m magas ház tetejéről a szemközti ház teteje 22°-os emelkedési szögben, a szemközti ház alja 36°-os
depressziós szögben látszik. Milyen magas a szemközti ház? Tekintsük a 9.13. ábrát! A BCD derékszögű
háromszögben BD = h = 24 m.
9.13. ábra

A DT = y szakasz kiszámításához először számítsuk ki a CD = x szakasz hosszát! A BCD háromszögben

, ahonnan m. Ezután a CDT derékszögű háromszögben ,


ahonnan y = 33·tg 22°≈13,3m. A szemközti ház magassága h +y ≈ 24 + 13,3 ≈ 37,3 m.
9. Egy hajó a part felé közeledve a parton álló meredek sziklafal tetejét 34,5°-os emelkedési szögben látja. 200 m-t
közeledve a sziklafal felé a sziklafal tetejét már 48°-os emelkedési szögben látja. Milyen magas a sziklafal? A
feladatban kitűzött problémát a 9.14. ábrán szemléltetjük.

9.14. ábra

ABTC derékszögű háromszögben

(9.4)

Az ATC derékszögű háromszögben

(9.5)

Fejezzük ki x-et (9.4)-ből: . Ezt (9.5)-be helyettesítve azt kapjuk:

10. Egy kálváriadomb tetején áll egy kis kápolna. A dombon a kápolnához vezető út 340 m, ennek emelkedési szöge
22°. A domb aljáról a kápolna teteje a dombhoz viszonyítva 3°-os emelkedési szögben látszik (9.15. ábra). Milyen
magas a kápolna? A 9.15. ábra jelöléseit használjuk. Az ábra megfelelő derékszögű háromszögeiből

9.15. ábra
Innen a kápolna h magassága: h ≈ 0,4663·315,2 – 127,36 ≈ 19,6 m.

9.2. Szögfüggvények általánosítása


Az előző fejezetben hegyesszögek szögfüggvényeit de niáltuk a derékszögű háromszögek oldalai arányainak segítségével. E
mostani fejezetben tetszőleges szög szögfüggvényeit fogjuk de niálni, vizsgáljuk e de níciók következményeit,
forgásszögek szögfüggvényeinek tulajdonságait.
Vegyünk fel a síkbeli derékszögű koordináta-rendszerben egy origó középpontú egység sugarú kört, valamint az x és y
tengelyen az i és j alapvektorokat úgy, hogy az i vektort +90°-os elforgatás vigye át a j vektorba. Ekkor az i és j vektorok
koordinátái: i(1; 0), j(0; 1).
Az i vektort az irányított α szöggel elforgatva az origó körül az e egységvektorhoz jutunk. A szögfüggvények
általánosításához ennek az e vektornak a koordinátáit használjuk (9.16. ábra).

9.16. ábra

sin · α az α irányított szöggel elforgatott i egységvektor második koordinátája,


cos · α az α irányított szöggel elforgatott i egységvektor első koordinátája,

A fenti de níciókból következnek sin α és cos α lehetséges értékei: bármely α szög esetében

Ha az i egységvektort 360°-nál nagyobb szögben forgatjuk el az origó körül, akkor olyan helyzetbe kerül, mely már
korábban előfordult; pontosabban fogalmazva, ha az α irányított szöggel elforgatott i egységvektort akárhányszor és
akármilyen irányban elforgatjuk 360°-kal, akkor ugyanabba a helyzetbe kerül, mint eredetileg, így ennek koordinátái,
tehát a kérdéses szög szinusza, illetve koszinusza nem változik. Azt mondjuk, hogy a szinusz-, illetve koszinuszfüggvények
360°-onként (vagy másképpen 2π szerint) periodikusak.

Mint láttuk tg α csak akkor értelmezhető, ha cos α ≠ 0; ez azt jelenti, hogy , és ctg α csak akkor
értelmezhető, ha sin α ≠ 0, ami azt jelenti, hogy α ≠ k · π, ahol k tetszőleges egész szám.
A 9.2a–b ábra táblázatát most már kiegészíthetjük az alábbiakkal

0° 90° 180° 270° 360°

sin 0 1 0 –1 0

cos 1 0 –1 0 1

tg 0 nem értelmezhető 0 nem értelmezhető 0


0° 90° 180° 270° 360°

ctg nem értelmezhető 0 nem értelmezhető 0 nem értelmezhető

Fontos következményei még a de nícióknak, hogy

Az egyes szögfüggvények előjelét a különböző síknegyedekben a 9.17. ábrán szemléltetjük.

9.17. ábra

Ha az α szög a második síknegyedbe esik, akkor a megfelelő e egységvektort az y tengelyre tükrözve olyan vektorhoz
jutunk, melynek második koordinátája egyenlő az eredeti e vektor második koordinátájával, első koordinátája pedig az
eredeti e egységvektor első koordinátájának ellentettje (9.18. ábra), azaz

9.18. ábra

Hasonló módszerrel vezethetjük vissza a II., a III. és a IV. síknegyedben levő vektorokat első síknegyedbeli vektorokra.
Ezeket a következő táblázat szemlélteti.

II. síknegyed III. siknegyed IV. siknegyed

sin(180c – α) = sin α sin(180c + α) = sin α sin(360° – α) = sin α

cos(180c – α) = cos α cos(180c + α) = cos α cos(360° – α) = cos α

tg(180c – α) = tg α tg(180c + α) = tg α tg(360° – α) = tg α

ctg(180c – α) = ctg α ctg(180c + α) = ctg α ctg(360° – α) = ctg α

Ha az α irányított szöggel elforgatott i egységvektort tükrözzük az y tengelyre, akkor olyan vektorhoz jutunk, melyet az
i egységvektor –α szöggel való elforgatásával nyerünk. Ebből következnek az alábbi egyenlőségek:

Példák
1. Határozzuk meg az alábbi szögfüggvények értékét
a) sin 120°, cos 150°, tg 135°;
b)
;
c) sin 2220°, cos 3000°, tg 1665°;
d)
;
a)
b)

c)

d)

2. Mivel egyenlő α, ha
a)

b)

c)
d)

e)

a)
A sin egyenlőségnek megfelelő vektorokat a 9.19a ábrán szemléltetjük.

9.19 ábra

b)
A cos egyenlőségnek megfelelő vektoroka 9.19b ábrán láthatók.

(Az eredményt így is írhattuk volna: α = ±120° + k · 360°.)


c) Ha tg , akkor α = 120° + k · 180°.
d)
Először meghatározzuk a sin egyenlőségnek megfelelő vektorokat, majd a de níció alapján az
egyenlőtlenségnek megfelelő vektorokat, illetve szögeket (9.20a ábra). Az egyenlőtlenséget kielégítő szögek:
60° + k · 360° ≤ α ≤ 120° + k · 360°.

9.20 ábra

e)
Először – úgy, mint az előző d) feladatban – meghatározzuk a egyenletnek megfelelő szögeket, majd
az egyenlőtlenségnek megfelelő szögeket (9.20b ábra). Az egyenlőtlenséget kielégítő szögek: 60° + k · 360° ≤ α ≤
300° + k · 360°.
3. Számítsuk ki az alábbi kifejezések pontos értékét
a)

b)
c)

a)

b)

c)

4. Határozzuk meg α értékét, ha


a)
;
b) sin α + cos α – sin α cos α = 1;
c) 2 cos2 α + sin α – 1 = 0.
a) Az egyenletnek csak akkor van értelme, ha sin α ≠ 0, α ≠ k · π. Szorozzuk meg mindkét oldalt sin α-val, majd
végezzük el a megfelelő átalakításokat!

A sin2 α+cos2 α = 1 azonosságból sin2α – 1 = –cos2α, tehát egyenletünk így alakul:

Innen cos α = 0, vagy sin α = cos α, azaz tg α = 1. Tehát az eredeti egyenletet kielégítő értékek:

b) Az egyenlet mindkét oldalából 1-et elvéve a bal oldal könnyen szorzattá alakítható:

Innen sin α = 1, vagy cos α = 1. Az eredeti egyenletet kielégítő értékek:

c) Próbáljuk elérni, hogy a megoldandó egyenletben csak egyfajta trigonometrikus kifejezés szerepeljen! Ennek
érdekében írjunk cos2 α helyébe 1 – sin2 α-t!

A kapott sin α-ban másodfokú egyenlet megoldása:

Innen az eredeti egyenlet megoldásai:


Addíciós tételek

Addíciós tételek
Két szög összegének szinusza nem egyenlő a két szög szinuszának összegével. Ezt egy egyszerű ellenpéldán keresztül is
könnyen beláthatjuk. Legyen pl. α = 60°, β = 30°. Ekkor sin(α + β) = sin 90° = 1, de

Természetesen ugyanez az összes többi szögfüggvényről is elmondható.


E fejezetben most két szög összegének és különbségének szögfüggvényeit határozzuk meg az eredeti szögek
szögfüggvényeivel; az ezekről szóló tételeket addíciós tételeknek hívjuk:

(9.6)

Mielőtt rátérünk a tétel igazolására, vegyük gyelembe a következőket: ha egy v(v1; v2) helyvektort elforgatunk +90°-
kal az origó körül, akkor az új vektor koordinátáit úgy kapjuk meg, hogy az eredeti vektor koordinátáit felcseréljük,
majd a csere utáni első koordinátát az ellentettjére változtatjuk. Mindez könnyen kiolvasható a 9.21. ábrából.

9.21. ábra

(Ha a v vektort –90°-kal forgatjuk el az origó körül, koordinátái akkor is felcserélődnek, de ekkor a csere utáni
második koordináta változik az ellentettjére.)
Ezek után az addíciós tételek bizonyításához vegyünk fel egy koordináta-rendszert az i és j alapvektorokkal, majd
helyezzünk el egy origó középpontú, az i vektorral α szöget bezáró a egységvektort, annak + 90°-os elforgatottja
legyen az a* vektor, végül egy, az a vektorral β szöget bezáró b egységvektort (9.22. ábra)!

9.22. ábra

Az a egységvektor az i, j rendszerben
(9.7)

Az a* vektor az a vektor + 90°-os elforgatottja, így

(9.8)

A b vektor az i, j rendszerben

(9.9)

Most írjuk fel a b vektort az a, a* rendszerben:

(9.10)

Most helyettesítsük (9.7) és (9.8) kifejezéseket (9.10) egyenlőségbe, azt kapjuk:

Mivel a b vektornak az i és j vektorokkal való kifejezése egyértelmű, így a kapott egyenlőséget (9.9) egyenlőséggel
egybevetve az i és j vektorok megfelelő együtthatói egyenlők, azaz

Hasonló módon igazolhatjuk az α–β szögfüggvényeire vonatkozó azonosságokat.

A két szög összegének és különbségének tangensére és kotangensére vonatkozó addíciós tételek:

(9.11)

(9.12)

A képletek természetesen csak olyan szögekre érvényesek, melyek esetében a megfelelő tg és ctg szögfüggvények
értelmezhetők.

Az α + β tangensére vonatkozó azonosságot az alábbi módon igazolhatjuk:

Osszuk el a jobb oldali tört számlálóját és nevezőjét is cos α cos β-val:

A többi azonosság hasonlóképpen igazolható.


írjunk a (9.6), (9.7), (9.11) és (9.12) képletekben β helyébe α-t, így megkapjuk a kétszeres szögek szögfüggvényeit:

(9.13)(9.14)

(9.15)(9.16)

Ha a (9.13)–(9.16) egyenlőségekben α helyére írunk, akkor az egyes szögfüggvényeknek a kérdéses szög felére
vonatkozó szögfüggvényeivel való kifejezéseit kapjuk:

Írjunk (9.14) képlet jobb oldalán először cos2 α helyébe 1 – sin2 α-t, majd sin2 α helyébe 1 – cos2 α-t; ekkor a következő
fontos összefüggésekhez jutunk:

(9.17)

illetve

(9.18)

A (9.17) és (9.18) egyenlőségek hányadosát véve arra jutunk:

Gyakran van szükségünk két szög szinusza összegének, különbségének, illetve két szög koszinusza összegének és
különbségének szorzat alakban való előállítására. Erről szólnak az alábbi képletek:

(9.19)

(9.20)

(9.21)
(9.22)

A (9.19) igazolásához vezessük be az és jelöléseket! E két egyenlőséget összeadva, illetve


egymásból kivonva azt kapjuk:

Ezzel a bizonyítandó (9.19) így alakul:

Fejtsük ki a bal oldalt az addíciós tétel szerint, így az alábbi nyilvánvaló azonossághoz jutunk:

A (9.20)–(9.22) képletek hasonló módon, a megfelelő helyettesítéssel igazolhatók.


Példák
1. Határozzuk meg az alábbi szögfüggvények értékét táblázat és számológép használata nélkül:
a) sin 75°;
b) cos 105°;
c) tg 15°.
a) sin 75° = sin (30° + 45°) = sin 30° cos 45° + cos 30° sin 45° =

b) cos 105° = cos (60° + 45°) = cos 60° cos 45° – sin 60° sin 45° =

c)

2. Igazoljuk, hogy sin(30° + α) + sin(30° – α) = cos α!

3. 7 db egybevágó négyzetet helyezzünk egymás mellé a 9.23. ábrán látható módon! Igazoljuk, hogy az ábra α, β, γ
szögeire α + β = γ!

9.23. ábra

Az ECD derékszögű háromszögben . Az EBD derékszögű háromszögben . Az EAD derékszögű

háromszögben . A (9.11) összefüggés szerint

Mivel α + β és γ is hegyesszögek, ezért valóban α + β = γ.


4. Egy nem egyenlő szárú derékszögű háromszög hegyesszögeire cos(α + 2β) = cos(α – 2β). Mekkorák a háromszög
szögei? Fejtsük ki az egyenlőség mindkét oldalát a megfelelő addíciós képlet szerint, majd rendezzük 0-ra és
alakítsuk szorzattá!

Innen vagy sin α – cos α = 0, vagy sin 2β – cos 2β = 0. Első esetben tg α = 1, azaz α = 45° lenne, ami lehetetlen, hiszen
ekkor a háromszög egyenlő szárú lenne. A másik esetben sin 2β = cos 2β, azaz tg 2β = 1. Ekkor 2β = 45°, tehát a
háromszög hegyesszögei: β = 22,5°, α = 67,5°.
5. Állítsuk elő a következő összegeket szorzat alakban:
a) sin x + sin 2x + sin 3x,
b) cos x + cos 2x + cos 3x.
a) Bár használhatnánk a (9.19)-ben leírt képletet, most más ötlettel élünk. Írjunk a sin x helyébe sin(2x–x)-et, a sin
3x helyébe pedig sin(2x+x)-et. A következőt kapjuk:

A jobb oldal első és harmadik tagját fejtsük ki a megfelelő addíciós tétel szerint:

így kaptuk a következő szorzatalakot:

b)

6. Fejezzük ki
a) sin 3α-t sin α-val;
b) cos 3α-t cos α-val;
c) tg 3α-t tg α-val!
a) A (9.6), (9.13) és (9.14) azonosságok felhasználásával a következő átalakításokat végezhetjük el:

A (9.1) azonosság szerint cos2 α = 1 – sin2 α, illetve sin2 α = 1 – cos2 α; ezeket felhasználva azt kapjuk

(9.23)

b) A (9.7), (9.13) és (9.14) azonosságok szerint

Ismét felhasználjuk a (9.1) azonosságot:

(9.24)

c) A (9.11) és (9.15) azonosságokat felhasználva azt kapjuk:


Bővítsük a jobb oldali „emeletes törtet” 1–tg2 α-val.

(9.25)

7. * Az ABCD egységnyi oldalú négyzet BC oldalának B-hez közelebbi harmadoló pontja H, legyen a CD oldal C-n túli

meghosszabbításának E olyan pontja, melyre . Az EB és AH egyenesek metszéspontja M. Igazoljuk, hogy


az M pont illeszkedik a négyzet köré írható körére!
A négyzet átlója a négyzet oldalával 45°-os szöget zár be: ACB ∠ = 45° (9.24. ábra). Az azonos íven nyugvó kerületi
szögek tételéből következik, hogy az M pont akkor és csak akkor illeszkedik az ABCD négyzet köré írható körére,
ha AMB ∠ = 45°; ezt kell tehát igazolnunk.

9.24. ábra

Az AMB ∠ akkor és csak akkor 45°, ha HME ∠ = 135°. Ez viszont akkor és csak akkor teljesül – a HMEC négyszög
belső szögeinek összegét tekintve –, ha α + β = 135°.

Az ECB és ABH derékszögű háromszögekben . Ígya (9.11) azonosság szerint

, így α + β = 135°, tehát az M pont valóban illeszkedik az ABCD négyzet köré írható
körére.

9.3. Szögfüggvények alkalmazása háromszögekkel kapcsolatos problémák


megoldására
Ebben a fejezetben az általános háromszög legfontosabb adatait (oldalait és szögeit) fogjuk meghatározni három független
adat ismeretében: a három oldal ismeretében, vagy két oldal és valamely szög ismeretében, vagy egy oldal és két szög
ismeretében. Ha ismerjük a háromszög két oldalát és valamelyikkel szemközti szöget, akkor a szinusztétel segítségével
határozhatjuk meg a hiányzó adatokat.

A háromszög bármely két oldalának aránya egyenlő a megfelelő szemközti szögek szinuszainak arányával.

A tétel tehát kimondja, hogy (9.25. ábra)


9.25. ábra

A tétel bizonyítását külön vizsgáljuk hegyesszögű háromszög (9.26a ábra) és tompaszögű háromszög (9.26b ábra)
esetében.

9.26 ábra

Hegyesszögű háromszög esetében tekintsük a 9.26a ábrát! Az ABT és ACT derékszögű háromszögekben

A két egyenlőségből

Tompaszögű háromszög esetében a 9.26b ábrát használjuk. A BTC és ATC derékszögű háromszögekben

A két egyenlőségből

(Az utolsó lépésnél felhasználtuk, hogy sin(180° – β) = sin β.)


A szinusztételt elsősorban akkor használhatjuk, ha ismert a háromszög két oldala és ezekkel szemközti valamelyik
szög, vagy ha ismert egy oldal és két szög. Ha két oldal és a nagyobbikkal szemközti szög ismert, akkor a kisebbik oldallal
szemközti szög egyértelműen meghatározható a szinusztétel segítségével. Ha két oldal és a kisebbikkel szemközti szög az
ismert, akkor a nagyobbik oldallal szemközti szögre két érték adódik, melyek egymást 180°-ra egészítik ki.
Ugyancsak a 9.26a, illetve 9.26b ábrát használhatjuk a háromszög trigonometrikus területképletének előállításához.

A háromszög területe egyenlő két oldal és a közbezárt szög szinusza szorzatának a felével.

A 9.26a ábra jelöléseivel tehát a háromszög T területe:

(9.26)

Példák
1. Az ABC háromszög két oldala a = 2,4 cm, b = 4 cm. A b oldallal szemközti szög β = 78°. Számítsuk ki a háromszög
hiányzó oldalait és szögét!
Mivel a nagyobb oldallal szemközti szög adott, ezért az α oldallal szemközti szög csak hegyesszög lehet.
Használjuk a 9.27. ábra jelöléseit!
9.27. ábra

A szinusztétel szerint

ahonnan α ≈ 35,9°. Ezzel a háromszög harmadik szöge: γ ≈ 180°–78°–35,9°≈66,1°. A háromszög harmadik oldalát
ugyancsak a szinusztétel segítségével számítjuk ki:

2. Az ABCD egységnyi oldalú négyzet AC átlójának mely P pontjából látszik az AB oldal 120°-os szögben? Tekintsük a
9.28. ábrát! A PAB háromszögben PAB ∠ = 45°, így PBA ∠ = 15°.

9.28. ábra

Tehát az AC átló megfelelő P pontja az A csúcstól kb. 0,299 távolságra van. (Ez a távolság az átlónak kb. 21%-a.)
3.
Egy nem egyenlő szárú háromszögben, . Igazoljuk, hogy a háromszög derékszögű!

A megadott egyenlőség bal oldalán alkalmazhatjuk a szinusztételt:


Mivel mindkét oldal nem negatív, négyzetre emelhetjük az egyenlőség mindkét oldalát.

Egyszerűsítsünk -val (ez nyilván nem 0):

Most szorozzuk meg mindkét oldalt 2-vel, és alkalmazzuk (9.13)-t.

Ez utóbbi egyenlőségből vagy az következik, hogy α = β, vagy pedig 2α + 2β = 180°. Az első eset nem lehetséges,
hiszen a háromszög nem egyenlő szárú, a második esetből pedig α + β = 90°, ami éppen azt jelenti, hogy a
háromszög derékszögű.
4. Egy háromszög leghosszabb oldala a legrövidebb oldal másfélszerese. A háromszög legnagyobb szöge a legkisebb
szög kétszerese. Mekkorák a háromszög szögei?
A legnagyobb szög a leghosszabb oldallal szemközt, a legkisebb szög pedig a legrövidebb oldallal szemközt van, ha
a a legkisebb szög, felírhatjuk a szinusztételt az alábbi módon
Ekkor a háromszög legnagyobb szöge 2α ≈ 82,8°, a háromszög harmadik szöge pedig 180°–41,4°–82,8°≈55,8°.
5. Egy egység sugarú körbe írt hegyesszögű háromszög szögei α, β és γ. Igazoljuk, hogy ekkor a háromszög T

területe:
A 9.29. ábra jelöléseit használjuk. Az azonos íven nyugvó kerületi és középponti szögek tétele alapján a kör O
középpontjából az egyes oldalak 2α, 2β és 2γ szögben látszanak. Az ABO, BCO, CAO háromszögek területe a
trigonometrikus területképlet alapján

9.29. ábra

E három háromszög területének összege egyenlő az eredeti háromszög területével.

Megjegyzés. Lényegesen kihasználtuk azt, hogy a háromszög hegyesszögű, vagyis hogy a kör középpontja a
háromszög belsejében van. Könnyen megmutatható, hogy az állítás tompaszögű és derékszögű háromszögre is
igaz.
6. * Az ABC háromszög C csúcsból induló f1 és f2 szögharmadolói a szemközti c oldalt c1, c2 és c3 hosszúságú
szakaszokra bontják (9.30. ábra). Igazoljuk, hogy ekkor

Először írjuk fel a szinusztételt az APC és AQC háromszögekre:

(9.27) (9.28)

Most írjuk fel a szinusztételt a BQC és BPC háromszögekre is:

(9.29) (9.30)

Vegyük a (9.27) és (9.29) egyenlőségek, valamint a (9.28) és (9.30) egyenlőségek hányadosát.


9.30. ábra

Ezek szerint

Innen pedig négyzetgyökvonás után adódik a bizonyítandó egyenlőség.

Nem használhatjuk a szinusztételt, ha a háromszögnek két oldala és a közbezárt szög adott, vagy pedig ha a háromszög
három oldala adott. Ilyenkor célszerű alkalmazni a koszinusztételt.

Ha a háromszög két oldala a és b, a közbezárt szög γ, akkor a háromszög harmadik c oldalára

A tétel bizonyítását – ugyanúgy, mint a szinusztétel esetében – külön vizsgáljuk hegyesszögű (9.31a ábra), illetve
tompaszögű háromszög (9.31b ábra) esetében.

9.31 ábra

Írjuk fel Pitagorasz tételét a 9.31a ábra ABT derékszögű háromszögére!

(9.31)

A BCT derékszögű háromszögben

Helyettesítsük m és x most kapott kifejezéseit (9.31)-be

Mivel sin2 γ + cos2 γ = 1, így kapjuk: c2 = a2 + b2 – 2ab cos γ.


A tompaszögű eset igazolásához írjuk fel a Pitagorasz-tételt a 9.31b ábra ABT derékszögű háromszögére!

(9.32)

A BTC derékszögű háromszögben


Helyettesítsük m és x kapott értékét (9.32)-be, felhasználva, hogy

azaz

Megjegyzés. Szokás a koszinusztételt „általános Pitagorasz-tételnek” is nevezni. Ez azért indokolt, mert ha a


háromszög derékszögű, vagyis γ = 90°, akkor cos γ = 0, így éppen a Pitagorasz-tételt kapjuk vissza.
Ha γ > 90°, akkor a képlet jobb oldalán a2+b2 összegből egy negatív számot kell kivonnunk, vagyis c2 > a2+b2. Innen
adódik a koszinusztétel egy fontos következménye: egy háromszög akkor és csak akkor hegyesszögű, ha nemcsak
oldalaira, de az oldalak négyzeteire is teljesül a háromszög-egyenlőtlenség, azaz bármely két oldala négyzetének
összege nagyobb a harmadik oldal négyzeténél.
Természetesen a koszinusztételt a háromszög bármely oldalára alkalmazhatjuk, vagyis igazak az alábbi
egyenlőségek

A koszinusztételt akkor célszerű alkalmazni, ha ismert két oldal és a közbezárt szög, vagy ha három oldal ismert. Ha
a háromszögnek három oldalát ismerjük, akkor valamelyiket (bármelyiket) kiválasztva felírjuk erre az oldalra a
koszinusztételt, abban ismeretlenként a kérdéses oldallal szemközti szög szerepel, így megkapjuk a szemközti szöget,
majd ezután már akár a szinusztétel, akár a koszinusztétel további alkalmazásával eljuthatunk a háromszög többi
oldalához és szögéhez. Valamelyest ritkábban használjuk a „tangenstételt”.
Ha a háromszög két oldala a és b (a≠b), szemközti szögeik α és β, akkor

A bizonyításhoz először osszuk el a bal oldali tört számlálóját és nevezőjét is b-vel, majd alkalmazzuk a szinusztételt!

Bővítsük a kapott törtet sin β-val: . Most alkalmazzuk a jobb oldali tört számlálójában és
nevezőjében a (9.19), illetve (9.20) összefüggéseket.

Példák
1. Egy paralelogramma két oldala a = 2,4 cm, b = 6 cm, a közbezárt szög 62,6°.
a) Mekkorák a paralelogramma átlói?
b) Mekkora az átlók hajlásszöge?
a) Írjuk fel a 9.32. ábra ABD és ABC háromszögeire a koszinusztételt, tudva, hogy a paralelogramma szomszédos
szögei 180°-ra egészítik ki egymást.

9.32. ábra
b) A paralelogramma átlói felezik egymást, így a BMC háromszög oldalai: BC = 2,4, BM ≈ 2,67, MC ≈ 3,705. Írjuk
fel e háromszög BC oldalára a koszinusztételt!

ahonnan az átlók keresett hajlásszöge: φ ≈ 40,3°.


2.
Egy háromszög a, b, c oldalaira fennáll: . Mekkora a háromszög c oldallal szemközti szöge?
Szorozzuk meg mindkét oldalt a bal oldal nevezőjével:

Most alakítsuk szorzattá a bal oldalt:

Írjuk c2 helyébe a koszinusztétel szerinti alakját:

Innen , vagyis a keresett γ szög 60°.


3.
Egy háromszög T területe az alábbi módon számolható ki: . Igazoljuk, hogy a háromszögnek
van 45°-os szöge!
Írjuk c2 helyébe a koszinusztétel szerinti alakját, és írjuk fel a T területet a trigonometrikus területképlettel!

Innen sin γ = cos γ, ahonnan γ = 45°.


4. Egy háromszög két oldala 16 dm és 18 dm, a közbezárt szög 45°. Számítsuk ki e két oldalhoz tartozó magasságok
talppontjainak a távolságát!
Tekintsük a 9.33. ábrát! Az AQC háromszög egyenlő szárú derékszögű háromszög, melynek átfogója 18, így

befogói .

9.33. ábra

Az APB háromszög szintén egyenlő szárú derékszögű háromszög, átfogója 16, tehát . Írjuk fel a
koszinusztételt az AQP háromszög PQ oldalára!

, ahonnan a keresett távolság PQ ≈ 9,29.


5. Az országút egy P pontjából 40°-os szögben leágazik egy út, melyen 2 km-t haladva jutunk az A faluba. Az
országúton P-től továbbhaladva 4 km-t egy Q ponthoz jutunk, melyből 70°-os szögben szintén leágazik egy út; ezen
3 km-t haladva a B faluba jutunk (9.34. ábra). A két falu elöljárói szeretnének egy egyenes utat építeni a két falu
között. Milyen hosszú lesz ez az út?
Első lépésben számítsuk ki az APQ háromszögben az AQ = y szakaszt koszinusztétellel, majd ugyanebben a
háromszögben az AQP ∠ = α szöget (akár szinusz-, akár koszinusztétellel)! Ezzel meglesz az AQB háromszög Q-nál
levő szöge, így y és α ismeretében már számolhatjuk a keresett x szakaszt az ABQ háromszögben koszinusztétellel.
9.34. ábra

Ezzel az AQB háromszögben AQB∠ = 180°–70°–27,5°≈82,5°. Most már írhatjuk a koszinusztételt az x szakaszra: x2 =
2,782 + 32 – 2 · 2,78 · 3 · cos 82,5° ≈ 81,45, ahonnan a két falu távolsága: AB ≈ 9,02 km.
6. Az ABC nem egyenlő szárú háromszög két oldala a és b, a közbezárt szög 120°.

E 120°-os szög felezője f. Igazoljuk, hogy


Írjuk fel a koszinusztételt AEC és BEC háromszögek 60°-os szögeire (9.35. ábra)!

9.35. ábra

(9.33)

(9.34)

A szögfelezőtétel szerint , azaz , így osszuk el egymással a (9.33) és (9.34) egyenlőségeket; azt
kapjuk, hogy

Most szorozzunk keresztbe, egyszerűsítsünk f-fel, majd végezzük el a megfelelő algebrai átalakításokat:

innen pedig

Megjegyzés. Gyorsabban is eljuthatunk a bizonyításhoz, ha felírjuk az AEC, BEC és ABC háromszögekre a


trigonometrikus területképletet (lásd 9.26).
7. Egy háromszög oldalai egymást követő egész számok. A háromszög legnagyobb szöge a legkisebb szög kétszerese.
Mekkorák a háromszög oldalai?
A legnagyobb szög a legnagyobb oldallal, a legkisebb szög a legkisebb oldallal szemközt van. Írjuk fel először a
szinusztételt a 9.36. ábra háromszögére, a megfelelő oldalakra:
9.36. ábra

Most írjuk fel a koszinusztételt a háromszög α szögére:

Tehát a háromszög oldalai: 4, 5, 6.


8. * Egy háromszög oldalai n, n + 2, n + 4, ahol n pozitív egész szám. Igazoljuk, hogy a háromszög legnagyobb szöge
nem lehet 120°-nál nagyobb! Az oldalakra teljesülni kell a háromszög-egyenlőtlenségnek, azaz n + n + 2 > n + 4,
azaz n > 2, vagyis n értéke legalább 3.
Írjuk fel a leghosszabb oldalra a koszinusztételt:

A jobb oldali másodfokú kifejezést felbonthatjuk két elsőfokú szorzatára, ha meghatározzuk zérushelyeit

Mivel n ≥ 3, ezért , vagyis , ami éppen azt jelenti, hogy a háromszög legnagyobb
szöge α legfeljebb 120°.
9.
* Igazoljuk, hogy bármely háromszögben
Próbáljuk elérni, hogy a bizonyítandó egyenlőségben csak oldalak vagy csak szögfüggvények szerepeljenek! Ez
utóbbit könnyen elérhetjük, ha az egyenlőség jobb oldalán alkalmazzuk a szinusztételt:

Mivel α + β + γ = 180°, ezért sin α = sin(β + γ), tehát az egyenlőség így írható:

Alkalmazzuk a bal oldalon a megfelelő addíciós tételeket:

10. * Legyenek a, b és c pozitív valós számok. Igazoljuk, hogy fennáll közöttük az alábbi egyenlőtlenség:

Próbáljunk meg a bizonyítandó egyenlőtlenségben szereplő kifejezéseknek valamilyen geometriai tartalmat adni.
A bal oldalon a négyzetgyökök alatti kifejezések a koszinusztételnek olyan felírásával azonosak, ahol a közbezárt
szög 60°. Ez adja az ötletet: indítsunk egy pontból egy b, a és c hosszúságú szakaszt úgy, hogy b és a, valamint a és c
60°-os szöget zárjanak be egymással (9.37. ábra), és írjuk fel a megfelelő háromszögekre a koszinusztételt!
9.37. ábra

Az OAB háromszögben

az OAC háromszögben

az OBC háromszögben

Mivel a B és C pontok közötti legrövidebb út BC = z, ezért x+y ≥ z, vagyis valóban

Megjegyzés. Az egyenlőség akkor és csak akkor teljesül, ha az A csúcs illeszkedik a BC szakaszra, vagyis ha az a
szakasz a BOC háromszögnek éppen a szögfelezője; ez pedig akkor és csak akkor teljesül (lásd a 6. feladatot), ha

9.4. Trigonometrikus egyenletek


Már az eddig tárgyalt fejezetekben is találkoztunk néhány trigonometrikus egyenlettel, most megpróbáljuk összefoglalni
azokat a legfontosabb ötleteket, módszereket, amelyek segítségével a trigonometrikus egyenletek nagy része megoldható. A
trigonometrikus egyenleteket általában alapegyenletekre vezetjük vissza, azaz – ha lehet, ekvivalens átalakításokkal – az
alábbi egyenletek valamelyikére:

1. Ebben az esetben csak akkor van megoldás, ha |a| ≤ 1. Mivel sin x = sin(π – x) és sin x = sin(x + 2kπ), így ha az
egyenletnek van megoldása, akkor végtelen sok megoldása van, de ezek egy-egy megoldás segítségével általában könnyen
felírhatók. Ha az egyenlet egy megoldása x0, akkor az x0-nak megfelelő egységvektor y tengelyre vonatkozó tükörképe
ugyancsak megoldás, így ekkor az egyenlet összes megoldása:

2. Természetesen ebben az esetben is akkor és csak akkor van megoldás, ha | a | ≤ 1. A cos x = cos(–x) = cos(x + 2kπ)
azonosságokból következik, hogy ha van megoldás, akkor végtelen sok megoldás van. Ha valamely x0 megoldása az
egyenletnek, akkor az xo-nak megfelelő vektor x tengelyre vonatkozó tükörképe is megoldás, így ekkor az egyenlet összes
megoldása:

3. A tg x = tg(– x) = tg(x + kπ) azonosságokból adódik, hogy ha van megoldás, akkor végtelen sok megoldás van; ha x0 egy
megoldás, akkor az összes megoldás: x = x0 + kπ.
4. Ebben az esetben – ugyanúgy, mint a 3. pontban – ha x0 egy megoldás, akkor az összes megoldás: x = x0 + kπ.
A trigonometrikus egyenletek megoldásánál az egyik leggyakrabban alkalmazott eljárás az, hogy megpróbáljuk elérni:
az egyenletben lehetőleg csak egyfajta trigonometrikus kifejezés szerepeljen. Ha ez sikerült, akkor már egy egyszerű
helyettesítéssel algebrai egyenletre vezethetjük vissza az eredeti trigonometrikus egyenletet. Erre mutatunk néhány
példát.

Példák. Oldjuk meg az alábbi egyenleteket!


1. 5 sin x + 1 = –2 cos2 x.
Írjunk a jobb oldalon cos2 x helyébe 1 – sin2 x-et; így csak egyfajta trigonometrikus kifejezés szerepel az
egyenletben. Ezután 0-ra rendezve megoldjuk a sin x-ben másodfokú egyenletet.

Mivel –1 ≤ sin x ≤ 1, ezért a sin x = 3 nem adhat megoldást. Ha , akkor

2. |2cos2x–1| + 4 sin2 x = 1.

Tehát a kitűzött egyenlet így írható: |1 – 4 sin2 x| = 1 – 4 sin2 x. Az |a| = a egyenlet megoldása minden nem negatív
valós szám, így az eredeti egyenlet ekvivalens az 1 – 4 sin2 x ≥ 0 egyenlőtlenséggel. Innen

Az egyenlőtlenség megoldása (ami egyben az eredeti egyenlet megoldásait is jelenti):

A megoldásokat a 9.38. ábrán szemléltetjük.

9.38. ábra

3.
Alakítsuk át az egyes négyzetgyök alatti kifejezéseket úgy, hogy csak egyfajta szögfüggvény szerepeljen bennük! A
bal oldali első tagot így alakíthatjuk:

Hasonlóképpen alakítható a második tag:

Tehát az eredeti egyenlet így alakul:

A sin x és cos x lehetséges értékeit gyelembe véve az abszolút értékeken belül negatív számok szerepelnek, így azt
kaptuk:

nyilvánvaló azonossághoz jutunk. Tehát az eredeti egyenletet minden valós szám kielégíti, vagyis azonosság.

Sok esetben úgy tudjuk a trigonometrikus egyenletet megoldani, hogy az ismert azonosságok, tételek felhasználásával
az egyes oldalakat szorzattá alakítjuk, és egy szorzat egyenlő 0-val alakra hozzuk. Ilyenkor azt vesszük gyelembe, hogy egy
szorzat akkor és csak akkor 0, ha valamelyik tényezője 0. Az is gyakran előfordul, hogy egy tört egyenlő 0-val. Ehhez az
szükséges, hogy a számláló 0 legyen, és ugyanakkor a nevező értéke ne legyen 0. Néhány esetben az az ötlet vezethet el
bennünket a megoldáshoz, ha egy ügyes átalakítással a többtagú összeget az addíciós tétel alkalmazásával egyetlen taggá
alakítjuk, s így egy jóval egyszerűbb egyenletre vezetjük vissza az eredeti egyenletet. Néha csábítónak látszik az egyenlet
mindkét oldalának négyzetre emelése, de vigyáznunk kell, mert ilyenkor rendszerint hamis gyökök is fellépnek. Nézzünk
ezekre is néhány példát!

Példák
1.

Az egyenletnek csak akkor van értelme, ha cos x ≠ 0, ami azt jelenti, hogy Az egyenlet így alakítható:

Ekkor vagy sin x = 0, vagy 2 cos x – 1 = 0, azaz= Így az eredeti egyenlet megoldásai:

2. sin 2x + sin x + 2 cos x = –1.


A bal oldal első tagját fejtsük ki, majd végezzük el a következő átalakításokat:

sin x(2 cos x + 1) + 2 cos x + 1 = 0, szorzattá alakítva (2 cos x + 1) (sin x + 1) = 0.

Ekkor tehát 2 cos x +1 = 0, azaz , vagy sin x = –1. Az eredeti egyenlet megoldásai:

3. sin x + sin 2x + sin 3x = 0.


Írjunk az első tagban x helyébe 2x – x-et, a harmadik tagban pedig 3x helyébe 2x + x-et:

Most az első és a harmadik tagot fejtsük ki az addíciós tételek szerint:

Ha sin 2x = 0, akkor 2x = kπ, ahonnan ha , akkor


Megjegyzés. Úgy is eljuthattunk volna a megoldáshoz, hogy az eredeti egyenlet bal oldalának első és harmadik
tagjára alkalmazzuk a (9.19) azonosságot; ezzel

így egy lépésben eljutunk a (9.34) egyenlethez.


4. sin x – cos x = 1.
Megtehetnénk, hogy mindkét oldalt négyzetre emeljük, de vigyáznunk kell, mert ez esetben hamis gyökök is
belépnek, s ezeket a megoldás végén ki kell szűrnünk. Ehelyett más utat választunk, hogy e kényelmetlenséget
kikerüljük. Osszuk el az egyenlet mindkét oldalát vel:

Mivel sin , ezért az egyenlet bal oldali két tagját az addíciós tétel felhasználásával egy taggá
alakíthatjuk:

Innen vagy Tehát az eredeti egyenlet megoldásai:


5. .

Az előző feladatban használt ötletet alkalmazzuk most is; osszuk el mindkét oldalt 2-vel:

A , így a következőt kapjuk:

azaz ahonnan

Az eredeti egyenlet megoldása:


6.

Állítsuk elő a sin x és cos x negyedik hatványának összegét a sin2 x + cos2 x = 1 azonosság négyzetre emelésével:

Tehát az eredeti egyenlet így írható:

Most szorozzuk meg mindkét oldalt 2-vel, így a bal oldalon sin 2x négyzetét kapjuk.

Ha , akkor vagy .

Ha , akkor vagy .
Az eredeti egyenlet összes megoldása:

7. * Mekkora legyen a p paraméter értéke, hogy a sin6 x + cos6 x = 1 + p egyenletnek legyen megoldása?
Az előző feladathoz hasonlóan állítsuk elő a sin x és cos x hatodik hatványának összegét a sin2 x + cos2 x = 1
azonosság köbre emelésével:

tehát az eredeti egyenlet így írható:

Szorozzuk meg mindkét oldalt 4-gyel:

Mivel 0 ≤ sin2 α ≤ 1, ezért az egyenletnek akkor és csak akkor van megoldása, ha

9.5. Trigonometrikus függvények és inverzeik

Trigonometrikus függvények
A trigonometrikus függvények inverzei

Trigonometrikus függvények
Az y = sin x függvény értelmezési tartománya minden valós szám, értékkészlete: –1 ≤ y ≤ 1. Mivel a függvény periodikus,
periódusa 2π, ezért a függvény menetét elegendő egy periódusban, pl. a [0; 2π] intervallumon vizsgálnunk. A függvény
gra kus képét a 9.39. ábrán szemléltetjük.

9.39. ábra

A függvény zérushelye az x = kπ helyen van. A függvény a intervallumon szigorúan monoton növekvő, a

intervallumon szigorúan monoton csökkenő, a intervallumon ismét szigorúan monoton

növekvő. A függvénynek maximuma van az helyeken, e maximum értéke 1. Minimuma van az

helyeken, a minimum értéke –1.

Mivel , ezért a cos x függvény gra konját könnyen megkaphatjuk a sin x gra konjából egy x

tengely mentén negatív irányban -vel történő eltolással (9.40. ábra).

9.40. ábra

Az y = cos x függvény értelmezési tartománya minden valós szám, értékkészlete – 1 ≤ y ≤ 1. Mivel a cos x függvény
ugyancsak 2π szerint periodikus, ezért elegendő egy periódusban (pl. a [–π; π] intervallumon) vizsgálnunk. A függvénynek

zérushelye van az helyeken. A [–π; 0] intervallumon szigorúan monoton növekvő, a [0; π] intervallumon
szigorúan monoton csökken. A függvénynek maximuma van x = 2kπ-ben, a maximum értéke 1, minimuma van x = (2kπ +
1)π-ben, a minimum értéke –1.
Az y = tg x függvény gra kus képét a 9.41. ábrán szemléltetjük.

9.41. ábra

Mivel a tg x függvény π szerint periodikus, így elegendő egy periódusban (pl. a intervallumon)

vizsgálnunk. A függvény értelmezési tartománya a valós számok halmaza, kivéve a számokat. Értékkészlete a

valós számok halmaza. Az y = tg x függvénynek zérushelye van az x = 2kπ helyeken. A függvény a

intervallumon szigorúan monoton növekvő; 0-ban in exiós pontja van. A intervallumon konkáv, a

intervallumon konvex.

Mivel ctg x = tg , ezért az y = ctg x függvény gra kus képét könnyen megkapjuk az y = tg x

gra kus képéből, ha azt az x tengely mentén pozitív irányban eltoljuk -vel, majd az így kapott gra kont tengelyesen
tükrözzük az x tengelyre (9.42. ábra).

9.42. ábra

Az y = ctg x függvény értelmezési tartománya a valós számok halmaza, kivéve az x = k·π valós számokat, értékkészlete a
valós számok halmaza. A függvény – az y = tg x függvényhez hasonlóan – π szerint periodikus, így elegendő egy periódust
(pl. a [0; π] intervallumot) vizsgálnunk. Egy perióduson belül a függvény szigorúan monoton csökkenő, zérushelye van az

helyeken. E zérushelyek egyben a függvény gra konjának in exiós pontjai. A függvény gra konja a

intervallumban konvex, a intervallumban konkáv.

A trigonometrikus függvények inverzei

Az y = sin x függvény szigorúan monoton növekvő a intervallumon, ezért ott létezik inverz függvénye.

Az y = sin x függvény inverzét árkusz szinusz függvénynek nevezzük és arcsin x-szel jelöljük.

Az y = arcsin x függvény tehát olyan -beli valós számot (ívmértékben mért szöget) jelent, melynek
szinusza x, azaz sin y = x.

A függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete a
intervallumba eső valós számok halmaza. A függvény szigorúan monoton növekvő, zérushelye x = 0-ban van. A függvény
gra konját a 9.43. ábrán szemléltetjük.

A függvény gra konja az y = sin x függvény gra konja intervallumba eső darabjának az y = x egyenesre
vonatkozó tengelyes tükörképe.

Megjegyzés. Az y = sin x függvény természetesen minden intervallumon (ahol k egész


szám) szigorúan monoton (növekvő vagy csökkenő, attól függően, hogy k páros vagy páratlan), így minden ilyen
intervallumon létezik inverze: ezt arcksin x függvénynek nevezzük. Ebben az értelemben tehát a 9.43. ábrán
szemléltetett függvényt arc0sin x függvénynek mondhatjuk. Az sin x függvény menetének alakulásából következik,
hogy
9.43. ábra

Az y = arcksin x függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete

pedig a intervallumba eső valós számok halmaza. A függvénynek csak k = 0 esetén van
zérushelye: x = 0. A függvény szigorúan monoton növekvő, ha k páros, szigorúan monoton csökkenő, ha k páratlan.

Az y = arcsin x függvényhez hasonló módon értelmezhetjük az y = arccos x függvényt. Mivel az y = cos x függvény a [0;
π] intervallumon szigorúan monoton csökkenő, ezért itt van inverze.

Az y = cos x függvény inverzét árkusz koszinusz függvénynek nevezzük és arccos x-szel jelöljük.

Az y = arccos x függvény tehát olyan [0; π]-vel valós számot (ívmértékben mért szöget) jelent, melynek koszinusza x,
azaz cos y = x. A függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete a [–0; π]
intervallumba eső valós számok halmaza. A függvény szigorúan monoton csökkenő, zérushelye x = 1-ben van. A függvény
gra konját a 9.44. ábrán szemléltetjük.

9.44. ábra

Megjegyzés. Az y = arccos x függvény természetesen minden [kπ; (k+1)π] intervallumon szigorúan monoton
(csökkenő vagy növekvő, attól függően, hogy k páros vagy páratlan), így minden ilyen intervallumon létezik inverze:
ezt arckcos x függvénynek nevezzük. Ebben az értelemben tehát a 9.44. ábrán szemléltetett függvényt arc0cos x
függvénynek mondhatjuk. A cos x függvény menetének alakulásából következik, hogy

Az y = arcksin x függvény értelmezési tartománya a [–1; 1] intervallumba eső valós számok halmaza, értékkészlete
pedig a [kπ; (k+1)π] intervallumba eső valós számok halmaza. A függvénynek csak k = 0 esetén van zérushelye: x = 1. A
függvény szigorúan monoton csökkenő, ha k páros, szigorúan monoton növekvő, ha k páratlan.

Az y = tg x függvény minden egész k esetében a intervallumon szigorúan monoton


növekvő függvény, az y = ctg x függvény pedig minden egész k esetében a [kπ; (k+1)π] intervallumon szigorúan
monoton csökkenő függvény, így a tg x és a ctg x függvényeknek is van inverzük a megadott intervallumokban:
ezeket arcktg x, illetve arckctg x függvényeknek mondjuk. A 9.45. ábrán az y = arc0tg x, a 9.46. ábrán pedig az y =
arc0ctg x függvények gra konját szemléltettük. Az y = arc0tg x értelmezési tartománya minden valós szám,

értékkészlete a intervallumba eső valós számok halmaza.

9.45. ábra

Az y = arc0ctg x függvény értelmezési tartománya a valós számok halmaza, értékkészlete a (0; π) intervallumba eső
valós számok halmaza.
9.46. ábra

Az y = tg x, illetve y = ctg x függvények tulajdonságaiból következik, hogy

9.6. Gömbháromszögek és tulajdonságaik

Alapfogalmak
Gömbháromszögpárok

Alapfogalmak
A gömb felületén végezhetünk geometriai vizsgálatokat ugyanúgy, mint síkban. A gömbi geometriában az egyenesek
szerepét a főkörök játsszák, a körök szerepét pedig a gömb felületének többi köre. Gömbi szakasznak a félkörívnél nem
nagyobb főköríveket mondjuk. Két pont távolságát a hozzájuk vezető sugarak hajlásszögével mérjük.
Ha egy konvex háromélű szöglet (triéder) csúcsa egy gömb középpontjában van, akkor e háromélű szöglet élei a
gömböt három pontban metszik. A szöglet lapsíkjai a gömbfelületet egy-egy főkörívben metszik. E főkörívek egy
gömbháromszöget határoznak meg. Az ívek végpontjai a gömbháromszög csúcsai, maguk az ívek a gömbháromszög oldalai
(9.47. ábra).

9.47. ábra

A gömbháromszög oldalait a hozzájuk tartozó középponti szöggel mérjük. Így a 9.47. ábrán látható ABC
gömbháromszög b oldala az AOC szöggel azonos: AOC∠ = b. Ez a szög az O középpontú háromélű szöglet AO és CO éleinek a
hajlásszöge. A gömbháromszög szögei az őt létrehozó háromélű szöglet megfelelő lapszögei. Pl. a 9.47. ábra ABC
gömbháromszögének α szöge az O középpontú szöglet AOB és AOC lapsíkjainak a hajlásszöge. Oldalai szerint
megkülönböztetünk egyenlő oldalú, egyenlő szárú és különböző oldalú gömbháromszöget.
A gömbháromszögek legfontosabb tulajdonságai:

1. A gömbháromszög bármely két oldalának összege nagyobb a harmadik oldalánál.


2. A gömbháromszögben nagyobb oldallal szemben nagyobb, kisebb oldallal szemben kisebb szög van. (Egyenlő
oldalakkal szemközt egyenlő szögek vannak.)
3. A gömbháromszög oldalainak összege nagyobb 0°-nál, de kisebb 360°-nál:

4. A gömbháromszög szögeinek összege nagyobb 180°-nál, de kisebb 540°-nál:


Gömbháromszögpárok
Egy gömbháromszög mellékgömbháromszögének mondjuk azt a gömbháromszöget, mely az eredeti gömbháromszöget
gömbkétszöggé egészíti ki. A 9.48. ábra ABC gömbháromszögének mellékgömbháromszögei az A1BC, B1AC, C1AB
gömbháromszögek. Egy gömbháromszög egy mellékgömbháromszögének mindig van egy közös oldala az eredeti
gömbháromszöggel.

9.48. ábra

Egy gömbháromszög csúcsgömbháromszögének mondjuk az olyan gömbháromszöget, melynek egy csúcsa közös az
eredeti gömbháromszög egy csúcsával. A 9.48. ábra ABC gömbháromszögének csúcsgömbháromszögei például az AB1C1,
BA1C1, CA1B1 gömbháromszögek.
Egy gömbháromszög átellenes gömbháromszögének mondjuk azt a gömbháromszöget, melynek csúcspontjai az
eredeti gömbháromszög csúcsainak átellenes pontjai. A 9.48. ábra ABC gömbháromszögének átellenes gömbháromszöge az
A1B1C1 gömbháromszög. Az átellenes gömbháromszögek az O pontra szimmetrikusak, ilyen értelemben tehát
„egybevágók”, területeik egyenlő.
Egy gömbkétszög felszíne szögével arányos (9.49a ábra). Mivel a gömb felszíne 4r2π, így az r sugarú gömb α szögű
gömbkétszögének Tα területe:

9.49 ábra

A 9.49b ábra gömbháromszögének T területét megkaphatjuk az α, β és γ szögű gömbkétszögekre visszavezetve. A két α


szögű, két β szögű és két γ szögű gömbkétszög együttesen lefedi a gömböt, s a gömbháromszög keresett területét összesen 6-
szor tartalmazza magában. Ebből két terület a gömb felszínéhez tartozik, így felírhatjuk:

innen kapjuk a gömbháromszög T területét:

Az r sugarú gömb α, β, γ szögű gömbháromszögének T területe:

A háromszög oldalai és szögei között a síkgeometriában megismert trigonometrikus összefüggések a


gömbháromszögekkel kapcsolatban is tárgyalhatók. A gömbháromszögek esetében lényegtelen, hogy mekkora a kör
sugara, így az elkövetkezőkben vegyük a gömböt egység sugarúnak. A gömb középpontjából a gömbháromszög csúcsaiba
mutató egységvektorok legyenek az a, b és c vektorok, melyeket úgy választunk meg, hogy ezek ebben a sorrendben
jobbrendszert alkossanak. Ekkor tehát abc > 0. Az a, b, c vektorok hajlásszögei egyben a gömbháromszög oldalai (9.50.
ábra):

(9.35)

A gömbháromszög oldalai és szögei közötti összefüggések a gömbi szinusztétel és gömbi koszinusztételek.

9.50. ábra

(Gömbi szinusztétel) A gömbháromszög oldalai szinuszainak aránya egyenlő a szemközti szögek szinuszainak
arányával:

A tétel igazolásához képezzük az (a × b) × (b × c) szorzatot! E szorzatot a kifejtési tétel szerint így alakíthatjuk:

Mivel b merőleges b × c-re, ezért [b(b × c)] a = 0, tehát

hiszen b egységvektor. Mivel az a×b és b×c vektorok hajlásszöge 180°–β, így írhatjuk:

Ha most ugyanezt a gondolatsort nem az a, b, c vektorokra, hanem rendre a c, a, b vektorokra alkalmazzuk, akkor
azt kapjuk:

De a felcserélési tétel szerint abc = cab, így

(Oldalakra vonatkozó gömbi koszinusztétel) A gömbháromszög a, b, c oldalaira és γ szögére

Természetesen a c oldal helyett bármely másikat is szerepeltethettünk volna, így e tétel a másik két oldalra felírva
A tétel bizonyításához tekintsük az (a×b)(b×c) szorzatot! Előbb a felcserélési tételt, majd a kifejtési tételt alkalmazva
ezt így írhatjuk:

De bb = 1, így azt kapjuk:

Az a, b, c vektorok egységvektorok, az általuk közbezárt megfelelő szögeket (9.35)-ből kiolvasva azt kapjuk:

ez pedig éppen a b oldalra felírt gömbi koszinusztétel.

A gömbháromszögnek nem csak oldalaira, de szögeire is felírhatunk egy koszinusztételt; ezt bizonyítás nélkül
közöljük.

(Szögekre vonatkozó gömbi koszinusztétel) A gömbháromszög α, β, γ szögeire és c oldalára

Természetesen a γ szög helyett bármely másikat is szerepeltethettük volna, így e tételt a másik két szögre is felírhatjuk:

Ha a gömbháromszög három oldala és három szöge közül három adatot ismerünk, akkor a most ismertetett gömbi
szinusz- és koszinusztételek segítségével a többit már meghatározhatjuk.
Alkalmazásként vizsgáljuk meg két földrajzi hely távolságának meghatározását a gömbháromszögek segítségével.
Tételezzük fel, hogy a Föld tökéletes gömb alakú, és képzeljük el e gömb felületén a szokásos szélességi és hosszúsági
köröket. Ekkor két pont távolságát a rajtuk keresztül haladó főkör kisebbik íve adja meg. A 9.51. ábrán a P és Q pontok
meghatározásához vizsgáljuk meg az ÉPQ gömbháromszöget. Ha a P, illetve Q pontok északi szélessége φ1, illetve φ2, akkor
e gömbháromszög két oldala: ÉP = b = 90° – φ1, illetve ÉQ = c = 90° – φ2.

9.51. ábra

Az ÉPQ gömbháromszög α szöge a P és Q pontok keleti hosszúságának különbsége: α = λ2 – λ1. Írjuk fel az oldalakra
vonatkozó koszinusztételt:

de sin α = cos(90° – α), így azt kapjuk

(9.36)

Ezzel az a szöget már meghatározhatjuk, onnan pedig a Föld sugarának ismeretében a PQ ív hosszát is megkaphatjuk.
Határozzuk meg Budapest és Tokió távolságát, ha tudjuk, hogy Budapest helyzete: északi szélesség 47,5°, keleti
hosszúság 19°, Tokió adatai: északi szélesség 35,7°, keleti hoszszúság 139,7°. Az adatokkal (9.36) szerint

A Föld egy főkörének kerületét 40 000 km-nek feltételezve írhatjuk az alábbi arányt:

Példák
1. Számítsuk ki a gömbháromszög hiányzó oldalait és szögeit, ha
a) a = 60°, b = 45°, c = 90°;
b) α = 45°, β = 120°, γ = 45°;
c) α = 120°, β = 60°, γ = 135°.
a) Az oldalakra vonatkozó koszinusztételt írjuk fel először valamelyik (pl. a b) oldalra:

Most írjuk fel a tételt az a oldalra:

A harmadik oldalra felírva a koszinusztételt γ = 125,26° adódik.


(Természetesen az első szög (β) meghatározása után a szinusztétellel is dolgozhattunk volna.)
b) Mivel a = c, írjuk fel a szögekre vonatkozó koszinusztételt az a oldalra:

A b oldalra

c) Először írjuk fel a szögekre vonatkozó koszinusztételt a c oldallal szemközti γ szögre:

Innen akár a szinusz-, akár a koszinusztétel felhasználásával kapjuk: a ≈ 140,35°, b ≈ 39,65°.


2. Egy gömbháromszög oldalai a = 60°, b = 30°, c = 45°. Mekkora az A csúcsból a BC oldal F felezőpontjába húzott AF
főkörív?
Tekintsük a 9.52. ábrát! Ha az F pont felezi a BC főkörívet, akkor a BF és FC főkörívekhez tartozó középponti
szögek egyenlők, tehát BF = FC = 30°. Először kiszámítjuk az ABC gömbháromszög γ szögét a 45°-os oldalra felírt
koszinusztétellel:

9.52. ábra
Most írjuk fel az oldalakra vonatkozó koszinusztételt az AFC háromszög x oldalára:

3. Egy gömbháromszög oldalai a = 30°, b = c = 60°. A B csúcsból merőleges főkörívet állítottunk az AC oldalra; e
merőleges és az AC oldal metszéspontja T. Mekkora a BT főkörív? Tekintsük a 9.53. ábrát! Először kiszámítjuk az
ABC gömbháromszög γ szögét az AB oldalra felírt koszinusztétellel, majd a BTC gömbháromszögre felírva a
szinusztételt, eljutunk a keresett BT főkörívhez:

9.53. ábra

Ezek után írjuk fel a szinusztételt a BCT gömbháromszögre:

4. Egy gömbháromszög oldalai a = 30°, b = c = 60°. A β szöget felező főkörív az AC oldalt E-ben metszi. Mekkora az BE
főkörív?
Először számítsuk ki az oldalakra felírt koszinusztétellel az ABC gömbháromszög β szögét (9.54. ábra):

9.54. ábra

Most írjuk fel a szögekre vonatkozó koszinusztételt a BCE gömbháromszög φ szögére:

Végül írjuk fel a szinusztételt:


5. Igazoljuk az alábbi azonosságokat: ha γ = 90°, akkor
a) sin a = sin a · sin c, b) cos α = sin β · cos a, c) cos c = cos a · cos b.

a) A szinusztételből , de sin 90° = 1, így valóban sin a = sin α · sin c.


b) Írjuk fel a szögekre vonatkozó koszinusztételt az α szögre:

Mivel cos 90° = 0 és sin 90° = 1, így azt kapjuk: cos α = sin β · cos a, éppen, amit bizonyítanunk kellett.
c) A c oldalra írjuk fel az oldalakra vonatkozó koszinusztételt:

Mivel cos 90° = 0, így kapjuk: cos c = cos a · cos b.


6. Egy gömbháromszög minden oldala 30°. Mekkorák a gömbháromszög szögei? Mivel egyenlő oldalú
gömbháromszögről van szó, ezért szögei egyenlők. Írjuk fel az oldalakra vonatkozó koszinusztételt:

Tehát a kérdéses egyenlő oldalú gömbháromszög szögei α = β = γ ≈ 62,35°.


7. Igazoljuk, hogy ha egy gömbháromszög minden szöge egyenlő, akkor e szög nagyobb 60°-nál. Jelöljük az egyenlő
oldalú gömbháromszög szögeit α-val, és írjuk fel a szögekre vonatkozó koszinusztételt:

Nyilvánvalóan cos α + 1 ≠ 0, így azt kapjuk:

Az α oldal koszinuszára kapott érték 1-nél kisebb, tehát

tehát .
Ez utóbbi pedig éppen azt jelenti, hogy a > 60°.
8. Egy r sugarú gömbfelületen egy gömbháromszögben a = 60°, b = 30°, α = 90° (9.55. ábra). Mekkora e
gömbháromszög területe?

9.55. ábra

Először a szinusztétellel számítsuk ki a gömbháromszög β szögét:

Most írjuk fel a 90°-os szögre a koszinusztételt:

Az ABC gömbháromszög T területe:


9. Egy egység sugarú gömb egy gömbháromszögének két szöge 60°, illetve 90°. A gömbháromszög területe .
Mekkorák a gömbháromszög legkisebb oldalai?
A gömbháromszög területéből

Ezek szerint a legkisebb oldal a γ-val szemközti c oldal. Írjuk fel a c oldalra a szögekre vonatkozó koszinusztételt:

Tehát az adott gömbháromszög legkisebb oldala: c≈ 35,26°.


10. Berlin és Isztambul távolsága kb. 1707 km. Berlin helyzete: északi szélesség 52,5°, Isztambulé: északi szélesség
41,3°, keleti hosszúság 28,9°. Számítsuk ki Berlin keleti hosszúsági fokát!
Először ki kell számítanunk azt, hogy a Föld középpontjából hány fokos szögben látszik a Berlin–Isztambul
távolság:

Most írjuk fel a (9.36) összefüggést:

Tehát Berlin keleti hosszúsági foka: λBerlin ≈ 28,9° – 15,48° ≈ 13,42°.


10. Analitikus geometria
10.1. A sík analitikus geometriája (alapfogalmak, szakasz osztópontjai, két pont
távolsága, a háromszög területe)
10.2. Az egyenes egyenletei (két egyenes metszéspontja, hajlásszöge, pont és egyenes
távolsága)
10.3. A kör egyenlete
10.4. Koordinátatranszformációk
10.5. Kúpszeletek egyenletei, másodrendű görbék
10.6. Polárkoordináták
10.7. A tér analitikus geometriája (sík és egyenes, másodrendű felületek, térbeli
polárkoordináták)

10.1. A sík analitikus geometriája (alapfogalmak, szakasz osztópontjai, két pont


távolsága, a háromszög területe)

Alapfogalmak
Osztópontok, két pont távolsága
A háromszög területe

Alapfogalmak

Az analitikus geometria (más néven koordinátageometria) a matematikának az az ága, mely a geometria


törvényszerűségeit az algebra nyelvén fogalmazza meg, mintegy összekapcsolja a geometriát az algebrával. Első jelei
már Kr. e. a II. században meg gyelhetők Hipparkhosz munkáiban, aki a földrajzi helyek rögzítéséhez a földrajzi
hosszúság és földrajzi szélesség fogalmát már használta, ezzel mintegy megalapozva a gömbi koordinátageometriát.
Az első már kifejezetten analitikus geometriai munka Descartes-tól származik. Ő már az algebrai jelölések
fejlődésének köszönhetően fejlett algebrai eszközökkel tárgyalta a különböző geometriai problémákat. Később –
elsősorban Fermat, Newton és Euler munkássága alapján – síkidomok, görbék és felületek tanulmányozásához egyre
fejlettebb algebrai eszközökkel tudták tárgyalni a kérdéses geometriai problémákat, egyre magasabb szintre emelve
ezzel az analitikus geometria tudományát. Az egyszerűbb alakzatok egyenletei mellett megszülettek a bonyolultabb
görbék és felületek egyenletei.

Mindenekelőtt tisztáznunk kell, mit értünk egy alakzat egyenletén.

Egy síkbeli alakzat egyenletén olyan összefüggést értünk, melyet az alakzat pontjainak a koordinátái kielégítenek, és
más pont koordinátái nem elégítenek ki.

Ez tehát azt jelenti, hogy az alakzat minden pontjának a koordinátái kielégítik az egyenletet, illetve ha egy pont
koordinátái kielégítik az egyenletet, akkor az a pont a kérdéses alakzathoz tartozik. Természetesen előfordulhat, hogy
olyan összefüggésünk van, melyet egyetlen pont koordinátái sem elégítenek ki. Ilyen pl. az x2 +y2 + 4 = 0 egyenlet, melyet
nyilván egyetlen (x; y) számpár sem elégít ki. Az is előfordulhat, hogy a megadott összefüggésben csak az egyik koordináta
szerepel, pl. x = 5. Ilyenkor a másik koordináta tetszőlegesen megválasztható, tehát ez egy olyan alakzat egyenlete, melynek
bármely pontjának első koordinátája 5, vagyis az y tengellyel párhuzamos, az x tengelyt x = 5-ben metsző egyenes egyenlete.
Amennyiben az egyenlet azonosság, akkor a sík bármely pontjának koordinátái kielégítik azt, vagyis a kérdéses alakzat
maga a koordinátasík. Ilyen pl. az (x+y)2 = x2+2xy+y2 egyenlet, melyet bármely (x; y) számpár kielégít.
Ha egy alakzat egyenletét valamely 0-tól különböző valós számmal megszorozzuk, ugyanannak az alakzatnak az
egyenletéhez jutunk, hiszen azok és pontosan azok a számpárok elégítik ki az új egyenletet, mint az eredetit is. Ha ismerjük
két alakzat egyenletét, akkor meghatározhatjuk e két alakzat közös pontjainak a koordinátáit. Ehhez a két alakzat
egyenletét egy kétismeretlenes egyenletrendszernek tekintjük, ennek az egyenletrendszernek a megoldásai olyan (x; y)
számpárok (ha léteznek), melyek mindkét egyenletet kielégítik, vagyis mindkét alakzathoz hozzátartoznak.

Megjegyzés. Előfordulhat, hogy az adott összefüggésben nem egyenlőségjel, hanem valamilyen irányú
egyenlőtlenség szerepel. Természetesen az ilyen összefüggésre is érvényes, hogy olyan alakzatot ír le, melynek
koordinátái kielégítik a kérdéses egyenlőtlenséget, és más pont koordinátái nem elégítik ki az egyenlőtlenséget.

Vegyünk fel két egymásra merőleges számegyenest, mindkettőn vegyük fel az egységet úgy, hogy a két egyenes
metszéspontjában legyen mindkét számegyenes 0 pontja. Az így megadott egyenesek egy Descartes-féle derékszögű
koordináta-rendszert alkotnak; a „vízszintes” egyenest szokás abszcisszatengelynek (x tengelynek), a „függőleges”
egyenest pedig ordinátatengelynek (y tengelynek) nevezni. Az x tengelyen jobbra, az y tengelyen fölfelé vannak a pozitív
számok, ellenkező irányokban a negatív számok. A két egyenes metszéspontja a koordináta-rendszer kezdőpontja vagy
más néven origója. Egy ilyen módon megadott koordináta-rendszerben a sík bármely P pontjának helyzetét egyértelműen
meghatározhatjuk két számadattal: az egyes tengelyektől vett előjeles távolságukkal. A P pont y tengelytől vett előjeles
távolságát abszcisszának (x koordinátának), az x tengelytől vett előjeles távolságát ordinátának (y koordinátának)
nevezzük. Ha a P pontnak az y tengelytől vett előjeles távolsága a, az x tengelytől vett előjeles távolsága b, akkor azt így
jelöljük P(a; b).
Így tehát a sík bármely P pontjának helyzete megadható koordinátáival, és bármely rendezett számpárnak megfelel
egyetlen pont a síkon (10.1. ábra).

10.1. ábra

Osztópontok, két pont távolsága


A 8.2. fejezetben láttuk, hogy két síkbeli vektor összegének (különbségének) koordinátái a két vektor megfelelő
koordinátáinak összege (különbsége), illetve hogy egy vektor számszorosának koordinátái az eredeti vektor
koordinátáinak megfelelő számszorosai. Ennek birtokában meghatároztuk bármely szakasz felezőpontjának a
koordinátáit is.
Most meghatározzuk bármely szakasz bármilyen arányú osztópontjának a koordinátáit. Legyen adott a síkbeli
koordináta-rendszerben két pont A(a1; a2) és B(b1; b2), határozzuk meg az AB szakasz azon P pontjának a koordinátáit,

melyre teljesül: .
Tekintsük a 10.2. ábrát! Az AB szakasz r : s arányú osztópontjának meghatározásához használjuk az A és B pontokba
mutató a és b helyvektorokat.

10.2. ábra

A P pontba mutató x helyvektor így írható fel az a és b vektorok segítségével:

(10.1)
A vektor a vektor -szerese, tehát

Helyettesítsük ezt az eredményt a (10.1) egyenletbe:

A kapott vektoregyenletet a megfelelő koordinátákra kiírva kapjuk az AB szakasz s : r arányú P osztópontjának xP és yP


koordinátáit:

(10.2)

A most kapott (10.2) egyenleteket alkalmazva megkapjuk az AB szakasz harmadoló pontjainak koordinátáit.

Az A(a1; a2), B(b1; b2) pontok által meghatározott AB szakasz A-hoz közelebbi HA harmadoló pontjának koordinátái

(10.3)

Az AB szakasz B-hez közelebbi harmadoló pontjának HB koordinátái természetesen

A harmadoló pont koordinátáinak ismeretében könnyen meghatározhatjuk egy csúcspontjaival adott háromszög S
súlypontjának a koordinátáit is. Tekintsük a 10.3. ábrát!

10.3. ábra

A háromszög S súlypontjának a koordinátái a megfelelő koordináták számtani közepe, azaz ha A(a1; a2), B(b1; b2), C(c1,
c2), akkor

(10.4)

A háromszög S súlypontja valamely (pl. a C) csúcsból induló súlyvonalnak a csúcstól távolabbi harmadoló pontja. Az F
pont koordinátái

Ezzel a DF szakasz F-hez közelebbi S harmadoló pontjának koordinátái (10.3) alapján

Gyakran van szükség két koordinátáival adott pont távolságának meghatározására. Ezt pl. Pitagorasz tételének
segítségével tehetjük meg. Foglaljuk bele az AB szakaszt egy olyan derékszögű háromszögbe, melynek befogói
párhuzamosak a koordinátatengelyekkel. Tekintsük a 10.4. ábrát! A létrejött derékszögű háromszög befogói |a1 – b1| és |a2 –
b2|. Írjuk fel Pitagorasz tételét a megfelelő háromszögre:

Az A(a1;a2), B(b1, b2) pontok d távolsága

(10.5)

10.4. ábra

Megjegyzés. Két pont távolságának meghatározásakor azt is megtehettük volna, hogy a két pontba mutató
helyvektorok különbségének abszolút értékét vesszük; természetesen akkor is ugyanerre az eredményre jutunk.
Ha az AB szakasz párhuzamos valamelyik koordinátatengellyel, akkor a szakasz hossza egyszerűen leolvasható a
különböző koordinátákból. Ha pl. az AB szakasz párhuzamos az x tengellyel, akkor nyilván a2 = b2, tehát ekkor az AB
szakasz d hossza: d = |a2 – b2|.

A háromszög területe
Egy háromszög területét többféleképpen is meghatározhatjuk csúcspontjai koordinátáinak a segítségével.
1. A 10.5. ábra ABC háromszögének T területét megkapjuk, ha az APRC trapéz területéből kivonjuk az APQB trapéz t1 és a
BQRC trapéz t2 területét.
10.5. ábra

A zárójelek felbontása, összevonás és megfelelő kiemelés után azt kapjuk:

Ez utóbbi kifejezés viszont azonos az alábbi harmadrendű determinánssal, tehát a háromszög T területe:

(10.6)

Megjegyzés. A (10.6) képlet a háromszög előjeles területét adja, így ha a determináns értéke negatív, akkor annak
abszolút értéke adja meg a kérdéses háromszög területét.

2. Úgy is kiszámíthatjuk a háromszög területét, ha a (10.5) távolságképletet alkalmazva kiszámítjuk mindhárom oldalának a
hosszát, majd az (5.5)-ben leírt Héron-képletet alkalmazzuk.
3. Ha már ismerjük a háromszög oldalainak hosszát, úgy is eljuthatunk a területhez, ha valamelyik oldalra felírva a
koszinusztételt, megkapjuk a szemközti szöget, majd a (9.26)-ban leírt trigonometrikus területképletet alkalmazva
megkapjuk a háromszög területét.

Példák
1. Szemléltessük a koordinátasíkon azokat a pontokat, melyek koordinátái kielégítik az alábbi egyenlőségeket:

a) Egy szorzat akkor és csak akkor 0, ha valamelyik tényezője 0, így vagy x = 0, vagy y = 0. Az x = 0 egyenletnek
eleget tevő pontok az y tengely pontjai, az y = 0 egyenletnek eleget tevő pontok pedig az x tengely pontjai. Így
az eredeti egyenlőségnek eleget tevő pontok a két koordinátatengely pontjai (10.6. ábra).

10.6. ábra

10.7. ábra
b) Ebben az esetben vagy x = 3, vagy y = –2. Az egyenletet kielégítő pontok halmazát vastag vonallal szemléltettük
a 10.7. ábrán.
c) |x| = 1, vagy |y| = 1, tehát x = ± 1, vagy y = ± 1. Az egyenletet kielégítő pontok halmaza két-két, az x tengellyel,
illetve az y tengellyel párhuzamos egyenes (10.8. ábra).

10.8. ábra

2. Szemléltessük a koordinátasíkon azokat a pontokat, melyek koordinátái kielégítik az alábbi egyenlőtlenségeket:

a) Ha egy kéttényezős szorzat értéke kisebb 0, akkor a tényezők különböző előjelűek. Ezek szerint vagy x ≤ 0 és y ≥
0, vagy x ≥ 0 és y ≤ 0. Első esetben az y tengelytől negatív irányban és az x tengelytől pozitív irányban levő
pontokról van szó (tehát a II. síknegyed pontjai), második esetben pedig a IV. síknegyed pontjai, amit a 10.9. ábrán
szemléltetünk (természetesen mindkét esetben a tengely pontjai is beleértendők a kérdéses ponthalmazba).

10.9. ábra

10.10. ábra

b) Most vagy |x| ≤ 1 és |y| ≥ 1, vagy fordítva, |x| ≥ 1 és |y| ≤ 1. Ez tehát azt jelenti, hogy vagy –1 ≤ x ≤ 1 és ugyanakkor
y ≤ – 1 vagy y ≥ 1, vagy pedig –1 ≤ y ≤ 1 és ugyanakkor x ≤ –1 vagy x ≥ 1. Az egyenlőtlenséget kielégítő ponthalmazt a
10.10. ábrán besatírozva láthatjuk.
c) Most x2 – 4 ≥ 0 és 2y – 6 ≥ 0, vagy x2 – 4 ≤ 0 és 2y – 6 ≤ 0. Első esetben |x| ≥ 2 és y ≥ 3, a másik esetben pedig |x| ≤ 2 és
y ≤ 3. Az egyenlőtlenséget kielégítő pontokat a 10.11. ábrán besatírozva szemléltetjük.
10.11. ábra

3. Adott két pont: A(–2; 6), B(5; –4). Számítsuk ki az AB szakasz B-hez közelebbi N negyedelő pontjának a
koordinátáit!
(10.2) alapján a keresett negyedelő pont

4. Az AB szakasz egyik végpontja A(5; –3). A szakasz A-hoz közelebbi P hatodoló pontjának a koordinátái P(3; –2).
Határozzuk meg a szakasz másik végpontjának a koordinátáit!
Legyenek a B pont koordinátái B(b1; b2). A (10.2) képlet alapján felírhatjuk az alábbi egyenleteket:

Tehát a szakasz másik végpontjának a koordinátái B(–7; 3).


5. * Az ABC háromszög AB oldalát B-n túl, BC oldalát C-n túl, CA oldalát A-n túl meghosszabbítottuk; minden oldalt
a háromszorosára. Igazoljuk, hogy az így keletkező PQR háromszög súlypontja megegyezik az eredeti ABC
háromszög súlypontjával! Helyezzük el az ABC háromszöget egy ktív koordináta-rendszerben (10.12. ábra)!

10.12. ábra

Ha a P pont koordinátái P(x; y), akkor a (10.3) képlet alapján írhatjuk

Tehát a P pont koordinátái: P(3b1 – 2a1; 3b2 – 2a2). Hasonlóan kapjuk a Q és R pontok koordinátáit is.
Q(3c1 – 2b1; 3c2 – 2b2), R(3a1 – 2c1; 3a2 – 2c2).
Ezek szerint a PQR háromszög súlypontjának a koordinátái (10.4) alapján

Ezek pedig pontosan megegyeznek az ABC háromszög súlypontjának a koordinátáival, vagyis az ABC és PQR
háromszögek súlypontjai valóban megegyeznek.
6. Számítsuk ki az A és B pontok távolságát, ha A(5; –8), B(–4; 2).
A (10.5) képletet alkalmazva a két pont d távolsága:

7. Egy AB szakasz egyik végpontja A (4; 6). A másik végpont első koordinátája 8. Mekkora a B pont második
koordinátája, ha az AB szakasz hossza 12 hosszúságegység?
Ha a B pont koordinátái B(8; b2), akkor a (10.5) alapján írhatjuk az alábbi egyenletet:
Tehát a B pont koordinátái vagy .
8. Adott három pont: A(–2; 3), B(5; –1), P(6; 6). Milyen távol van a P pont az AB szakasz azon belső pontjától, amelyik
A-tól négyszer olyan távol van, mint B-től?
Az AB szakasz azon belső Q pontja, mely A-tól négyszer olyan távol van, mint B-től, az AB szakasz B-hez közelebbi
ötödölő pontja. Tekintsük a 10.13. ábrát!

10.13. ábra

A Q pont koordinátái (10.2) képlet szerint

A keresett d távolság (10.5) képlet alapján

9. Számítsuk ki az A(2; 2), B(3; –1), C(5; 0) csúcspontokkal rendelkező háromszög területét! A háromszög területének
meghatározásához a (10.6) determináns értékét kell kiszámítanunk.

tehát a háromszög T területe: T = ½·7 = 3,5 területegység.

10.2. Az egyenes egyenletei (két egyenes metszéspontja, hajlásszöge, pont és


egyenes távolsága)

Az egyenes egyenletei
Két egyenes metszéspontja
A párhuzamosság és merőlegesség feltétele
Két egyenes hajlásszöge, pont és egyenes távolsága

Az egyenes egyenletei
Az egyenes egyenletét határozzuk meg. Olyan összefüggést (egyenletet) keresünk, melybe behelyettesítve az egyenes
bármely pontjának koordinátáit, azok igazzá teszik az egyenletet, de bármely az egyenesre nem illeszkedő pont
koordinátáit behelyettesítve, azok nem elégítik ki az egyenletet.
Egy egyenest egyértelműen meghatározhatunk két adott pontjával vagy egy adott pontjával és egy, az egyenessel
párhuzamos helyvektorral.

Az egyenessel párhuzamos helyvektort az egyenes egy irányvektorának nevezzük.


Az egyenesnek végtelen sok irányvektora van, hiszen, ha v(v1; v2) egy irányvektora az egyenesnek, és k egy 0-tól
különböző valós szám, akkor a k·v(v·v1; k·v2) ugyancsak párhuzamos az egyenesünkkel, tehát ez a vektor is az egyenes egy
irányvektora.
Legyen adott az egyenes egy P0(x0; y0) pontja, valamint egy v(v1; v2) irányvektora!

Az adott P0(x0; y0) ponton átmenő, adott v(v1; v2) irányvektorú egyenes egyenlete

(10.7)

Ezt az egyenletet az egyenes irányvektoros egyenletének nevezzük.

Az egyenlet levezetéséhez használjuk a 10.14. ábrát.

10.14. ábra

Az egyenes bármely P pontjába mutató r helyvektorhoz eljuthatunk, ha az adott P0 pontba mutató r0 helyvektorhoz
hozzáadjuk az adott v irányvektor valamely t valós számszorosát. Ha t végigfut a valós számok halmazán, akkor
ilyen módon az egyenes minden pontjához eljutunk. Ezek szerint

(10.8)

A (10.7) egyenletet mondjuk az egyenes vektoregyenletének. A (10.8) egyenletet részletesen kiírva

(10.9)

A (10.9) egyenleteket nevezzük az egyenes paraméteres egyenletrendszerének. A t paraméter kiküszöbölése


érdekében szorozzuk meg az első egyenletet v2-vel, a másodikat pedig –v1-gyel:

A két egyenletet összeadva kapjuk

Legyen adott két pont: A(a1; a2) és B(b1; b2). E két ponton átmenő egyenes egyenletét úgy kaphatjuk meg, hogy először a
két pontba mutató a és b helyvektorok különbségét vesszük. Az így kapott a – b (vagy b – a) vektort használhatjuk
irányvektornak, hiszen ez párhuzamos az egyenessel (adott pontnak akár az A, akár a B pontot használhatjuk). Mivel a–
b(a1–b1; a2–b2), így a két pontjával adott egyenes egyenlete

Ez utóbbi egyenlet bal oldala egyenlő az alábbi determinánssal


Az adott A(a1; a2) és B(b1; b2) pontokon átmenő egyenes egyenlete:

(10.10)

(10.10) birtokában meghatározhatjuk annak szükséges és elégséges feltételét, hogy három pont egy egyenesre
illeszkedjen. Ha a három pont A(a1; a2), B(b1; b2), C(c1, c2) egy egyenesre illeszkedik, akkor az A és B pontokon átmenő
egyenes (10.10) egyenletét a C pont koordinátái kielégítik, vagyis annak szükséges és elégséges feltétele, hogy három pont
egy egyenesre illeszkedjen az, hogy az alábbi determináns értéke 0 legyen:

Gyakran előfordul, hogy nem az egyenessel párhuzamos, hanem az egyenesre merőleges helyvektor adott.

Az egyenesre merőleges n(n1; n2) vektort az egyenes egy normálvektorának nevezzük.

Az egyenesnek – az irányvektorhoz hasonlóan – végtelen sok normálvektora van.

A P0 (x0; y0) ponton átmenő, n(n1; n2) normálvektorú egyenes egyenlete:

(10.11)

Tekintsük a 10.15. ábrát! Mivel az n vektor merőleges a vektorra, ezért skaláris szorzatuk 0.

10.15. ábra

Ezt a megfelelő koordinátákkal kiírva kapjuk

Természetesen bármely irányvektorból tudunk normálvektort, illetve bármely normálvektorból tudunk


irányvektort csinálni. Ehhez csak a kérdéses vektort kell 90°-kal elforgatnunk, azaz koordinátáit felcserélni, majd a
csere utáni koordináták egyikének –1-szeresét venni.
Ha az egyenes (10.7)-ben leírt irányvektoros egyenletének mindkét oldalát elosztjuk v1 ≠ 0-val, akkor a következőt kapjuk:

Az egyenletben szereplő mennyiséget az egyenes iránytényezőjének vagy meredekségének, másképpen


iránytangensének nevezzük. Az utóbbi elnevezés indokolt, hiszen m éppen az egyenes és az x tengely által bezárt szög
tangense (10.16. ábra).

10.16. ábra

Az adott P0(x0;y0) ponton átmenő, m meredekségű egyenes egyenlete

(10.12)

Megjegyzés. Míg egy egyenesnek végtelen sok irányvektora van, addig meredeksége csak egyetlenegy. A meredekség
bevezetésekor feltettük, hogy v1 ≠ 0, ami azt jelenti, hogy az egyenes nem párhuzamos az y tengellyel. Mindebből
következik, hogy az y tengellyel párhuzamos egyeneseknek nincs meredekségük. Ha az egyenes áthalad az origón,
azaz P0(0; 0), akkor egyenlete y = mx alakú. A koordinátatengelyek derékszögét felező egyenesek esetében α = 45°,
vagy α = 135°, így tg α = 1, vagy tg α = –1; ezért az I. és III. síknegyed szögfelező egyenesének egyenlete y = x, a II. és IV.
síknegyed derékszögeit felező egyenes egyenlete y = –x.

A koordinátatengelyekkel párhuzamos egyeneseket szokás speciális helyzetű egyenesnek nevezni. Ha az egyenes


párhuzamos az x tengellyel, akkor v2 = 0, így a (10.7) irányvektoros egyenletből a következőt kapjuk: v1y = v1y0, azaz y = y0.
Ha az egyenes az y tengellyel párhuzamos, akkor v1 = 0; ez esetben az egyenes egyenlete: x = x0.
Sokszor jól alkalmazható az egyenes tengelymetszeti egyenlete.

Ha az egyenes az x tengelyt az (a; 0) pontban, az y tengelyt a (0; b) pontban metszi, akkor egyenlete

(10.13)

A (10.13) egyenlet igazolásához tekintsük a 10.15. ábrát! Az egyenes egy irányvektora v(a; –b). Ezzel az egyenes
egyenlete

(10.14)

A (10.14) egyenlet mindkét oldalát –ab-vel elosztva kapjuk: .

Két egyenes metszéspontja


Két egyenes metszéspontját az egyenleteikből álló kétismeretlenes elsőfokú egyenletrendszer megoldása adja. Ha a két
egyenes egyenlete

akkor az egyenesek M metszéspontjának koordinátái

(10.15)

Ha a nevezőkben levő determináns értéke 0, akkor a két egyenes vagy egybeesik, vagy nincs közös pontjuk, azaz
párhuzamosak.
Két egyenes metszéspontjának ismeretében megadhatjuk annak szükséges és elégséges feltételét, hogy három egyenes
egy ponton haladjon keresztül. Legyen a három egyenes

E három egyenes akkor és csak akkor megy át egy ponton, ha közülük kettőnek (pl. az elsőnek és a másodiknak) a
metszéspontja illeszkedik a harmadik egyenesre. Az első és a második egyenes metszéspontját (10.15)-ben látjuk, ha ez
kielégíti a harmadik egyenes egyenletét, akkor

De ez utóbbi egyenlet bal oldalán éppen egy harmadrendű determináns szerepel, így azt kaptuk: annak szükséges és
elégséges feltétele, hogy három egyenes egy ponton haladjon keresztül, az, hogy az együtthatóikból alkotott harmadrendű
determináns értéke 0 legyen:

A párhuzamosság és merőlegesség feltétele


Egyenesek párhuzamosságának, illetve merőlegességének a feltételét könnyen meghatározhatjuk irányvektoraik, illetve
meredekségeik segítségével is. Ha az egyik egyenes egy irányvektora v(v1; v2), a másik egyenes egy irányvektora v (v1*;v2*),
akkor e két egyenes párhuzamosságának feltétele:

(10.16)

A két egyenes akkor merőleges egymásra, ha az egyik irányvektorát 90°-kal elforgatva a másik egyenes irányvektorával
párhuzamos lesz, azaz ha
(10.17)

Példák
1. Írjuk fel a P(4; –2) ponton átmenő, v(3; 5) irányvektorú egyenes egyenletét! Az egyenes egyenlete (10.7) alapján

2. Írjuk fel az A(–5; 7) ponton átmenő, n(2; –1) normálvektorú egyenes egyenletét. Az egyenes egyenlete (10.11)
alapján

3. Adott a P(3; 5) pont és a –2x + 4y = 7 egyenletű e egyenes. Mekkora területű háromszöget vág le a
koordinátatengelyekből a P ponton átmenő, e-vel párhuzamos egyenes?
A megadott egyenes egy irányvektorát kiolvashatjuk az egyenletéből: v(–4; –2). A keresett egyenes párhuzamos e-
vel, ezért v ennek is egy irányvektora, így a keresett egyenes egyenlete: –2x + 4y = –6 + 20 = 14, azaz –x + 2y = 7. Ez az

egyenes ott metszi az x tengelyt, ahol y = 0, és ott metszi az y tengelyt, ahol x = 0; tehát x = –7, . Ezek
szerint az egyenes és a koordinátatengelyek alkotta háromszög T területe:

4. Adottak a 2x + 5y = –12 és –6x +by = c egyenletű egyenesek. Mekkora legyen a b és c paraméter, hogy
a) különböző párhuzamos egyenesek legyenek,
b) egybeeső egyenesek legyenek,
c) merőleges egyenesek legyenek,
d) sem párhuzamos, sem merőleges ne legyen egymásra a két egyenes.
A különböző feltételeket az egyenesek irányvektorainak, illetve iránytangenseinek vizsgálatával végezzük.
a) Az első egyenes egy irányvektora v(–5; 2), a második egyenes egy irányvektora v*(–b; –6). A két egyenes akkor és

csak akkor párhuzamos, ha , azaz b = –15. Ez egyben azt jelenti, hogy a második egyenlet bal oldala az
első egyenlet bal oldalának –3-szorosa. Amennyiben a jobb oldal is az első egyenlet jobb oldalának –3-szorosa,
akkor a két egyenlet ugyanannak az egyenesnek az egyenlete. Tehát a két egyenes akkor lesz két különböző
párhuzamos egyenes, ha b = –15 és c ≠ 36.
b) A két egyenes akkor lesz egybeeső, ha b = –15 és c = 36.

c) Az első egyenes meredeksége , a második egyenes meredeksége .

A két egyenes akkor és csak akkor merőleges egymásra, ha m1·m2 = –1, tehát , ahonnan és c
tetszőleges valós szám.

d) Ha b ≠ –15 és (c tetszőleges valós szám), akkor a két egyenes sem merőleges, sem párhuzamos nem lesz
egymással.
5. Egy térképhez rögzített koordináta-rendszerben az egység mindkét tengelyen 1,5 km. Az A és B faluk
központjának koordinátái A(2; 6), B(10; 2); az országút egyenlete y = 0, az origó a megyeszékhely központja. Milyen
távol van a megyeszékhely központjától az országúton levő M buszmegálló, ha az az A és B faluk központjától
egyenlő távolságra van?
Tekintsük a 10.17. ábrát! Az x tengely azon M pontját, mely A-tól és B-től egyenlő távolságra van, az AB szakasz
felező merőlegese metszi ki.

10.17. ábra

Az F pont koordinátái F(6; 4). Az AB egyenes egy irányvektora v(8; –4), vagy az egyszerűbb, vele párhuzamos v*(2;
–1). Ez a v* vektor a felező merőlegesnek egy normálvektora, így írhatjuk a felező merőleges egyenletét: 2x – y = 12
– 4 = 8. Ez ott metszi az x tengelyt, ahol y = 0, tehát 2x = 8, azaz x = 4. Ezek szerint az M pont koordinátái M(4; 0).
Mivel az egység másfél km, így az országúton az M buszmegálló a megyeszékhely középpontjától 6 km távolságra
van.
6. Egy háromszög csúcspontjainak a koordinátái A(–2; 2), B(0; 8), C(4; 2). Számítsuk ki a háromszög köré írható köre
középpontjának a koordinátáit, valamint a magasságpontjának a koordinátáit, és igazoljuk, hogy a két pont,
valamint a háromszög súlypontja egy egyenesen van.
Először ábrázoljuk a megadott háromszöget (10.18. ábra). A háromszög AC oldalhoz tartozó magasságvonala az y
tengely, ennek egyenlete x = 0. A BC oldalhoz tartozó magasságvonal merőleges BC-re. A BC egyenes egy
irányvektora v(4; –6), vagy az egyszerűbb (2; –3); ez a vektor a magasságvonalnak egy normálvektora, tehát a BC

oldalhoz tartozó magasságvonal egyenlete 2x – 3y = –10. Mivel x = 0, ezért . Tehát az ABC háromszög

magasságpontja .

10.18. ábra

A köré írható kör K középpontja az oldalfelező merőlegesek metszéspontja. Az AC oldal felezőpontja F1(1; 2); e
felező merőleges párhuzamos az y tengellyel, így e felező merőleges egyenlete x = 1. A BC oldal felezőpontja F2(2;
5), egy irányvektora v(2; –3). Ez az irányvektor a felező merőlegesnek egy normálvektora, tehát a BC oldal felező

merőlegesének egyenlete 2x – 3y = 4–15 = –11. Mivel x = 1, ezért , tehát az ABC háromszög köré írható

körének középpontja . A háromszög súlypontjának a koordinátái . Az M, K és S pontok


akkor és csak akkor illeszkednek egy egyenesre, ha az alábbi harmadrendű determináns értéke 0.

7. A 10.19a ábrán egy tetőszerkezet keresztmetszete látható. A szakemberek szerint ezt a ferde tető felezőpontjában,
rá merőlegesen kell alátámasztani egy g gerendával, hogy a legstabilabb legyen. Milyen hosszú legyen ez a g
gerenda?

10.19a ábra

Helyezzük el az ábrát egy alkalmasan választott koordináta-rendszerben (10.19b ábra). Az egyes csúcspontok
koordinátáit az adatokból könnyen megállapíthatjuk. A g gerenda egyenese a CD szakasz felező merőlegese. A CD
szakasz felezőpontja F(4; 5), a DC egyenes egy irányvektora v(8; –2) vagy az egyszerűbb (4; –1). Ez a vektor a DC
ferde tetőnek egy irányvektora, így a g gerenda egyenesének egyenlete 4x – y = 16 – 5 = 11. Ez az egyenes ott metszi

az x tengelyt, ahol y = 0, tehát .


10.19b ábra

A g gerenda keresett hossza az F és M pontok távolsága.

8. Egy háromszög két csúcspontja A(2; 6), B(6; 4). A háromszög súlypontja S(1; 1). Mekkora a háromszög területe?
Tekintsük a 10.20. ábrát! Megtehetnénk, hogy a háromszög két csúcspontjának és súlypontjának ismeretében
(10.4) segítségével kiszámítjuk a harmadik csúcs koordinátáit, majd alkalmazzuk a (10.6) képletet.

10.20. ábra

De hamarabb eljuthatunk a megoldáshoz, ha meggondoljuk, hogy ha az ABC háromszög súlypontja S, akkor az


ABS háromszög területe az ABC háromszög területének a harmada, hiszen az S pont a súlyvonalon a csúcstól
távolabbi harmadoló pont. Ezek után az ABS háromszög keresett T előjeles területe a (10.6) képlet alapján

Tehát az ABC háromszög területe: TABC = 3 · 11 = 33.


9. Adott két nem párhuzamos egyenes: a1x + b1y = c1 és a2x + b2y = c2. Mi a feltétele annak, hogy e két egyenes az y
tengelyen metssze egymást?
Legyen az y tengelynek az a pontja, ahol a két egyenes metszi e tengelyt (0; y0). Ez azt jelenti, hogy b1y0 = c1 és b2y0

= c2, azaz , ahonnan b1c2 – c1b2 = 0. Ez utóbbi egyenlet bal oldala egy másodrendű determináns
értékével egyenlő, így tehát annak a feltétele, hogy a megadott két egyenes az y tengelyen metssze egymást:

Két egyenes hajlásszöge, pont és egyenes távolsága


Két egyenes hajlásszögét irányvektoraik segítségével határozhatjuk meg, hiszen a két egyenes hajlásszöge irányvektoraik
hajlásszögével azonos (természetesen mindezt elmondhatnánk az egyenesek normálvektoraival is). Ha az egyik egyenes
egy irányvektora v(v1; v2), a másik egyenes egy irányvektora v*(v1*; v2*), akkor ezek skaláris szorzata egyrészt

ahol φ a két egyenes hajlásszöge. Ezeket egyenlővé téve azt kapjuk:


(10.18)

Két egyenes hajlásszögének meghatározásával könnyen eljuthatunk két egyenes párhuzamosságának és


merőlegességének a (10.16)-ban és (10.17)-ben leírt feltételeihez.
Gyakran van szükség egy adott pont és egy adott egyenes távolságának meghatározására.

A P0(x0; y0) pontnak az ax+ by = c egyenestől való d távolsága

(10.19)

Példák
1. Számítsuk ki a 2x – 3y = – 7 és x + 4y = 12 egyenletű egyenesek hajlásszögét!
Az egyenesek normálvektorai n(2; –3) és n*(1; 4). A (10.18) képletet használva azt kapjuk

tehát a két egyenes hajlásszöge: 180° – 132,3° = 47,7°.


2. Adott az e: 4x – 3y = 12 egyenletű egyenes és a P0(3; 4) pont. Számítsuk ki a P0 pont és az e egyenes távolságát!
(10.19) alapján az adott pont és az adott egyenes távolsága

3. Egy háromszög csúcspontjai A(–2; 2), B(4; 4), C(0; 6). Milyen hosszú a háromszög C csúcsból induló magassága?
Tekintsük a 10.21. ábrát! Először felírjuk az AB egyenes egyenletét, majd kiszámítjuk a C pont és az egyenes
távolságát.

10.21. ábra

Az A és B ponton átmenő egyenes egy irányvektora v(6; 2) vagy az egyszerűbb (3; 1) vektor. Tehát az AB egyenes
egyenlete: x–3y = –8. Ezek után a C pontnak az AB egyenestől való távolsága (10.19) alapján

10.3. A kör egyenlete

A kör egyenlete, a kör és a kétismeretlenes másodfokú egyenlet


Kör és egyenes

A kör egyenlete, a kör és a kétismeretlenes másodfokú egyenlet

A kör a sík azon pontjainak a halmaza, melyek egy adott ponttól egyenlő távolságra vannak. Az adott pont a kör
középpontja, az adott távolság a kör sugara.

A kör középpontját általában K-val, sugarát r-rel jelöljük. Ezek szerint a koordináta-rendszerben egyértelműen
megadhatjuk a kört, ha megadjuk a kör K(u; v) középpontját és r sugarát (10.22. ábra).
Egy P(x; y) pont akkor és csak akkor van rajta a körön, ha a K(u; v) középponttól vett távolsága r, azaz

Innen a K(u; v) középpontú, r sugarú kör egyenlete

(10.20)

10.22. ábra

Ha elvégezzük a kör egyenletének bal oldalán szereplő négyzetre emeléseket, és az egyes tagokat a megfelelő módon
rendezzük, a következőt kapjuk

(10.21)

Tehát a kör egyenlete egy kétismeretlenes másodfokú egyenlet. Hasonlítsuk össze ezt az egyenletet a kétismeretlenes
másodfokú egyenlet általános alakjával:

(10.22)

(10.21)-et és (10.22)-t összehasonlítva arra jutunk, hogy egy kétismeretlenes másodfokú egyenlet csak akkor lehet kör
egyenlete, ha a = b és e = 0, tehát a másodfokú tagok együtthatói egyenlők, és nem szerepel benne xy-os tag (ún. vegyes
szorzat). Ha a = b és e = 0, akkor a-val elosztva (10.22) mindkét oldalát

alakra jutunk, melyet teljes négyzetté kiegészítve

alakot kapunk. Ez akkor lesz kör egyenlete, ha a jobb oldalon szereplő tagra s > 0.
Példák
1. Ábrázoljuk az alábbi egyenletekkel megadott köröket:
a)(x+1)2 + (y–2)2 = 4, b)x2+y2–4x+ 6y + 4 = 0.
a) (10.20) alapján a kör középpontja K(–1; 2), sugara r = 2 (10.23. ábra).
b) A megadott kétismeretlenes másodfokú egyenletet először teljes négyzetté kiegészítve (10.20) alakra kell
hoznunk.

A kör középpontja K(2; –3), sugara r = 3 (10.24. ábra).

10.23. ábra

10.24. ábra

Megjegyzés. Érdemes kiemelni, hogy ha a kör középpontja első koordinátájának abszolút értéke egyenlő a kör
sugarával, akkor a kör érinti az y tengelyt, ha pedig a középpont második koordinátájának abszolút értéke
egyenlő a kör sugarával, akkor a kör érinti az x tengelyt; ezt láthattuk a feladat a) és b) részében is.
2. Ábrázoljuk egy koordináta-rendszerben az x2 +y2 – 6x + 8y = 0 kört, és számítsuk ki, hogy e kör mely pontokban
metszi a koordinátatengelyeket!
A kör egyenlete átalakítva (x – 3)2 + (y + 4)2 = 25, tehát a kör középpontja K(3; –4), sugara r = 5. Mivel a P(0; 0) pont
koordinátái kielégítik az egyenletet, ezért a kör áthalad az origón (10.25. ábra).

10.25. ábra

A kör ott metszi az x tengelyt, ahol y = 0, tehát x2 – 6x = 0, ahonnan x1 = 0, x2 = 6. Ott metszi az y tengelyt, ahol x = 0,
tehát y2 + 8y = 0, ahonnan y1 = 0, y2 = –8.
3. Egy kör egy átmérőjének két végpontja A(2; 4), B(6; 1). Írjuk fel a kör egyenletét! A kör középpontja az AB szakasz F
felezőpontja, sugara az AB szakasz fele (10.26. ábra).

Az AB szakasz felezőpontjának koordinátái , az AB szakasz hossza:


Tehát a feltételeknek eleget tevő kör egyenlete: .

10.26. ábra

4. Határozzuk meg a k paraméter értékét úgy, hogy az x2 +y2 – 4x + 8y + k = 0 egyenletű kör érintse az y = –2 egyenletű
egyenest!
A kör egyenlete átalakítva: (x–3)2 + (y + 4)2 = 20–k. Tehát a kör középpontjának a koordinátái K(2; –4), sugara
. Ábrázoljuk a kör középpontját és az y = –2 egyenest (10.27. ábra).

10.27. ábra

Ha a kör érinti az y = –2 egyenletű egyenest, és középpontja K(2; –4), akkor a sugara r = 2, így írhatjuk a következő
egyenletet: , ahonnan k = 16.
5. Egy kör érinti a koordinátatengelyeket, és áthalad a P(1; 2) ponton. Melyik ez a kör? Mivel a P pont az első
síknegyedben van, ezért a keresett kör is az első síknegyedben van. Mivel a kör érinti a koordinátatengelyeket,
ezért középpontjának a koordinátái egyenlők a kör sugarával: u = v = r (10.28. ábra). Ezek szerint a kör egyenlete

(10.23)

alakú egyenlet. Ha a kör illeszkedika P(1; 2) pontra, akkor e pont koordinátái kielégítik a (10.23) egyenletet, tehát
(1 – r)2 + (2 – r)2 = r2, ahonnan r2 – 6r + 5 = 0. E másodfokú egyenlet gyökei

Tehát két olyan kör van, mely megfelel a feladat feltételeinek; ezek egyenlete

A feltételeknek megfelelő köröket a 10.28. ábrán szemléltetjük.

10.28. ábra
6. Határozzuk meg a k paraméter értékét, hogy az alábbi két egyenlettel megadott körök kívülről érintsék egymást:
x2 +y2 – 8x + 6y + 21 = 0, x2 +y2 + 4x – 10y + k = 0.
Alakítsuk át a körök egyenleteit úgy, hogy a középpontok és a sugarak kiolvashatóak legyenek.

Tehát az első kör középpontja K1 (4; –3), sugara r1 = 2, a második kör középpontja K2(–2; 5), sugara
(10.29. ábra).
Ha a két kör kívülről érinti egymást, akkor középpontjaik távolsága egyenlő a sugaraik összegével. A két kör
középpontjának távolsága , tehát , azaz ,
ahonnan k = –35.

10.29. ábra

Kör és egyenes

Kör és egyenes közös pontjainak kiszámítása


Kör érintőjének egyenlete
Két kör közös pontjainak koordinátái
A kör külső pontból húzott érintőjének egyenlete

Kör és egyenes közös pontjainak kiszámítása


A kör egyenlete

(10.24)

típusú kétismeretlenes másodfokú egyenlet; az egyenes egyenlete

(10.25)

típusú kétismeretlenes elsőfokú egyenlet. A kör és egyenes közös pontjainak meghatározásához a (10.24) és (10.25)
egyenletekből álló egyenletrendszert kell megoldanunk. Ehhez először az elsőfokú egyenletből (10.25) kifejezzük az egyik
ismeretlent, majd azt behelyettesítjük a kör (10.24) egyenletébe, így a kör egyenlete egyismeretlenes másodfokú egyenletté
válik, melynek 0, 1 vagy 2 megoldása van aszerint, hogy diszkriminánsa negatív, 0 vagy pozitív. Ez természetesen
összhangban van azzal, hogy a körnek és egyenesnek 0, 1 vagy 2 közös pontja van. Az egyismeretlenes másodfokú egyenlet
megoldásait visszahelyettesítjük az egyenes (elsőfokú) egyenletébe, s így megkapjuk a kör és az egyenes közös pontjainak a
koordinátáit.

Megjegyzés. Az egyismeretlenes másodfokú egyenlet megoldásait azért célszerű az elsőfokú egyenletbe


helyettesítenünk, mert ha a másodfokú egyenletbe (kör) helyettesítenénk, akkor két újabb másodfokú egyenlet
adódik, melyek hamis megoldásokhoz is vezetnek bennünket. Tekintsük pl. a 10.30. ábrát! Ha az egyenes
egyenletéből y-t kifejezzük, majd behelyettesítjük a kör egyenletébe, akkor az x-ben egyismeretlenes másodfokú
egyenlet lesz. Ha ennek az egyenletnek egy megoldása x1, és ezt a kör egyenletébe helyettesítjük vissza, akkor két y
értéket kapunk: egyrészt a keresett metszéspontok egyikének második koordinátáját, másrészt pedig a körnek egy
másik olyan P pontját, melynek első koordinátája x1, de az a körnek és egyenesnek nem metszéspontja.

10.30. ábra

Példa. Számítsuk ki az x2+y2 + 6x – 4y–12 = 0 egyenletű kör és az x+y = 4 egyenletű egyenes közös pontjainak a
koordinátáit!
Bár nem szükséges, ábrázoljuk egy koordináta-rendszerben a megadott kört és az egyenest! A kör egyenletéből (x +
3)2 + (y – 2)2 = 25, tehát a középpont K(–3; 2), a sugár r = 5. Az egyenes meredeksége –1, az y tengelyt a (0; 4) pontban
metszi (10.31. ábra). Az egyenes egyenletéből y = 4–x. Ezt a kör egyenletébe helyettesítve azt kapjuk:

10.31. ábra

A kapott értékeket visszahelyettesítjük az egyenes egyenletébe; kapjuk: y1 = 7, y2 = 2. Tehát az adott kör és az adott
egyenes közös pontjai: M1(–3; 7), M2(2; 2).

Kör érintőjének egyenlete


Adott kör egy adott P0(x0; y0) pontjában húzott érintőjének egyenletét az alábbi módon határozhatjuk meg. Legyen a kör
egyenlete x2 + y2 + ax + by + c = 0. (Természetesen a P0 pont koordinátái kielégítik ezt az egyenletet.) A vektor az
érintőnek egy normálvektora, hiszen a P0 pontba húzott sugár merőleges a P0-beli érintőre (10.32. ábra).

A kör egyenletéből tehát a kör középpontja és sugara:


10.32. ábra

Az érintő egy normálvektora: . Ennek megfelelően a kör P0 pontjában húzott érintőjének


egyenlete:

Példa. Írjuk fel az x2+y2 + 2x – 6y – 15 = 0 egyenletű kör P0(–5; 6) pontjába húzható érintőjének az egyenletét! A kör
egyenletéből a középpont K(–1; 3). Ekkor a vektor: (-4;3). Ez a vektor az érintő egy normálvektora, így a
P0-beli érintő egyenlete: –4x+3y = 38.

Mielőtt a kör egy külső pontból húzott érintőinek egyenleteit tárgyalnánk, nézzük meg két kör közös pontjainak
kiszámítási módját.

Két kör közös pontjainak koordinátái


Legyen adott a két kör egyenlete:

(10.26)

E két egyenlet különbsége

(10.27)

A kapott (10.27) egyenlet egy kétismeretlenes elsőfokú egyenlet, egy egyenes egyenlete. A (10.27) egyenletet nevezzük a
(10.26) egyenletű körök hatványvonalának. Ha a P0(x0; y0) pont illeszkedik mindkét körre, akkor

vagyis a P0 pont illeszkedik a (10.27) egyenesre, vagyis a két kör hatványvonalára is. Természetesen, ha a P1(x1; y1) pont is
közös pontja a két körnek, akkor ugyanez elmondható e P1 pontra is, tehát, ha a köröknek vannak közös pontjai, akkor azok
illeszkednek a körök egyenleteinek különbségéből adódó egyenesre. Ilyen módon a két kör közös pontjainak a kiszámítását
visszavezettük a kör és egyenes közös pontjainak kiszámítására. A gyakorlatban mindez úgy történik, hogy a körök
egyenleteinek különbségét képezve először meghatározzuk (10.27) egyenletet, majd megoldjuk az ezen egyenletből és
valamelyik kör egyenletéből álló egyenletrendszert.

Megjegyzés. Természetesen, ha a két körnek nincs közös pontja, az egyenleteik különbségéből adódó elsőfokú
kétismeretlenes egyenlet akkor is egy egyenes egyenlete, tehát ekkor a két kör hatványvonalának egyik körrel sincs
közös pontja. Kimutatható, hogy két nem koncentrikus kör hatványvonala mindig merőleges a két kör középpontján
áthaladó (centrális) egyenesre. Ha adott három nem koncentrikus kör, akkor ezek páronként vett hatványvonala
mindig egy pontban metszi egymást; ezt a pontot szokás nevezni a három kör hatványpontjának (10.33. ábra). Ha
ugyanis a körök egyenletei
akkor a hatványvonalak egyenletei

10.33. ábra

Ezek együtthatóiról pedig könnyen kimutatható, hogy

Példa. Számítsuk ki az x2 +y2 + 2x – 8y + 7 = 0 és x2 +y2 + 4x – 2y + 1 = 0 egyenletekkel megadott körök közös pontjainak


a koordinátáit! A két kör egyenletének különbsége, vagyis a két kör hatványvonalának egyenlete 6x – 6y + 6 = 0,
ahonnan x = y – 1. Ezt valamelyik (pl. az első) kör egyenletébe helyettesítve azt kapjuk:

A kapott értékeket visszahelyettesítve a hatványvonal egyenletébe kapjuk a két kör közös pontjainak koordinátáit:
M1(2; 3), M2(0; 1) (10.34. ábra).

10.34. ábra

A kör külső pontból húzott érintőjének egyenlete


Thalész tételének segítségével először a külső pontból húzott érintők érintési pontjait határozzuk meg. Tekintsük a 10.35.
ábrát! A kör egyenletéből kiolvassuk a kör K középpontját, majd a külső P0(x0; y0) pontot K-val összekötve felírjuk a P0K
szakasz Thalész-körének egyenletét. (E kör középpontja a P0K szakasz F felezőpontja, sugara pedig a P0K szakasz hosszának
a fele.) A Thalész-kör és az eredeti kör olyan E1 és E2 pontokban metszik egymást, melyekre teljesül, hogy P0E1 és P0E2
merőlegesek a KE1, illetve KE2 sugarakra, így E1 és E2 lesznek az érintési pontok. Ezek után már csak a P0E1 és P0E2
egyenesek egyenleteit kell felírnunk, hiszen ezek az egyenesek lesznek a P0 pontból húzott érintők.
10.35. ábra

Megjegyzés. Egyéb módon is felírhatjuk a kör egy külső P0 pontból húzott érintőinek az egyenletét. Először felírjuk a
P0 ponton áthaladó összes egyenes egyenletét; ehhez egy paramétert használunk, amit legcélszerűbb az m
meredekségnek választani. Ezután e paraméteres egyenletből (ami elsőfokú kétismeretlenes egyenlet) kifejezzük az
egyik ismeretlent, majd azt behelyettesítjük a kör egyenletébe. Így a kör egyenlete egy egyismeretlenes másodfokú
paraméteres egyenlet lesz; melynek megoldásai adják az egyenes és a kör metszéspontjainak a megfelelő
koordinátáit. Mivel azt akarjuk, hogy az egyenes érintő legyen, ezért ennek az egyenletnek csak egy megoldása lehet,
amit úgy tudunk elérni, hogy a diszkriminánsát 0-val tesszük egyenlővé. Ezzel a választott m paraméterre kapunk
egy (általában másodfokú) egyenletet, melyet megoldva megkapjuk a P0 ponton átmenő érintők meredekségét, így
már felírhatjuk a kérdéses érintők egyenletét. (Természetesen ez utóbbi eljárás csak akkor használható, ha egyik
érintő sem párhuzamos az y tengellyel.) Példák
1. Határozzuk meg az x2 + y2 – 8x – 6y + 9 = 0 körnek azokat a pontjait, melyek az A(–3; 2) és B(1; 0) pontoktól egyenlő
távolságra vannak!
Az A és B pontoktól egyenlő távolságra levő síkbeli pontok az AB szakasz felező merőlegesének a pontjai, tehát a
felező merőleges és a kör metszéspontjait kell meghatároznunk. A kör egyenletéből (x – 4)2 + (y – 3)2 = 16, tehát a
kör középpontja K(4; 3), sugara pedig r = 4 (10.36. ábra).

10.36. ábra

Az AB szakasz felezőpontja F(–1; 1), egy irányvektora v(–2; 1). Ez az irányvektor a felező merőlegesnek
normálvektora, így a felező merőleges egyenlete: –2x + y = 3, azaz y = 2x+ 3. Helyettesítsük ezt a kör egyenletébe:

Ezeket az értékeket az egyenes egyenletébe visszahelyettesítve kapjuk a kör és a felező merőleges

metszéspontjainak a koordinátáit: M1(0; 3), .


2. Határozzuk meg annak a körnek az egyenletét, mely érinti az x2+y2 = 1 és (x–3)2+y2 = 4 köröket, továbbá érinti az x
tengelyt. Mindenekelőtt ábrázoljuk a két megadott kört (10.37. ábra)!
A feladat szövegéből adódik, hogy a keresett kör középpontjának első koordinátájára u < 0. Az is világos, hogy
nemcsak a 10.37. ábrán látható (szaggatott vonallal jelzett) kör a megoldás, hanem annak az x tengelyre
vonatkozó tükörképe is. Mivel a keresett kör érinti az x tengelyt, ezért középpontjának második koordinátája
(illetve annak abszolút értéke) egyenlő a kör r sugarával. Írjuk fel Pitagorasz tételét a KTO és a KTO1 derékszögű
háromszögekre:

Az első egyenletből 2r = u2 – 1, a második egyenletből u2 – 6u + 5 = 4r. Az előbbi egyenlet kétszeresét ez utóbbi


egyenletbe helyettesítve azt kapjuk: u2 + 6u – 7 = 0, ahonnan u1 = 1, u2 = –7. Ha u = 1, akkor r = 0. Ez tehát egy
„pontkör”, melynek középpontja (1; 0), sugara 0 (ez természetesen nem megoldás). Ha u = –7, akkor r = 24. Ez
esetben a keresett körök egyenlete:
10.37. ábra

3. Egy város térképéhez rögzített koordináta-rendszerben (ahol az egység mindkét tengelyen 20 m) a városi
körcsarnok egyenlete x2 +y2 – 6x–4y – 12 = 0. A város főútvonalának egyenlete 4x + 3y = 44. A körcsarnok egyik
bejáratát olyan pontba építik, amelyik a legközelebb van a főútvonalhoz. Milyen távol van ez a kapu a
főútvonaltól? A kör középpontja K(3; 2), sugara r = 5. Tekintsük a 10.38. ábrát!

10.38. ábra

A körnek a főúthoz legközelebb eső pontját a kör középpontján átmenő, a főút egyenesére merőleges egyenes
metszi ki a körből. A főút egyenesének egy normálvektora n(–4; 3). Ez a vektor a rá merőleges egyenesnek egy
irányvektora, így a K pontból az egyenesre állított merőleges egyenlete 3x + 4y = 17. A 4x + 3y = 44 és 3x + 4y = 17
egyenletrendszer megoldása, azaz a főút keresett P pontjának a koordinátái P(–5; 8).

Most számítsuk ki a 3x + 4y = 17 egyenes és a kör metszéspontjait. , amit a kör egyenletébe


helyettesítve az adódik:

Ez utóbbi másodfokú egyenlet gyökei: x1 = 7, x2 = –1. Az adatokból nyilván számunkra x2 az érdekes, így a
körcsarnok keresett pontja M2(–1; 5). Az M2P szakasz hossza:

Mivel az egység mindkét tengelyen 20 m, így a körcsarnok bejáratának a főúttól való távolsága 100 méter.
4. Az ABCD téglalap oldalai: AB = 20, BC = 10. Az AB oldalra mint átmérőre egy félkört rajzolunk a téglalap belsejébe.
Az AC és BD átlók e félkört a P és Q pontokban metszik. Mekkora az ABPQ négyszög területe? Helyezzük el a
szükséges ábrát egy koordinátarendszerben (10.39. ábra)!

10.39. ábra

A kérdéses négyszög egy szimmetrikus trapéz, melynek hosszabbik alapja 20. A magasságát és rövidebb alapját
könnyen megkapjuk, ha meghatározzuk a P pont koordinátáit. E P pont a K középpontú, 10 sugarú körnek és az

AC egyenesnek a metszéspontja. Az AC egyenes egyenlete , a kör egyenlete (x – 10)2 +y2 = 102. Az egyenes

egyenletéből y-t a kör egyenletébe helyettesítve: , ahonnan 5x2 = 80x, x1 = 0, x2 = 16. A


(0; 0) metszéspont nekünk érdektelen, így a P pont koordinátái P(16; 8). Ez azt jelenti, hogy a trapéz magassága PT
= 8, rövidebb alapja pedig PQ = 20 – 8 = 12. Tehát a trapéz területe:

5. Egy község tereprendezési tervének a térképén (melyen az egység mindkét koordinátatengelyen 12 m) a


barom telep egyenlete x2 +y2 + 8x–4y – 5 = 0. A telep belsejében a P(–2; 1) pontban van a központi itató. A telepet
egy egyenes kerítéssel két részre akarják bontani úgy, hogy a kerítés áthaladjon az itatón, és a lehető legrövidebb
legyen. Határozza meg a kerítés végpontjának a koordinátáit és a kerítés hosszát! A kör középpontja K(–4; 2),
sugara r = 5. A P ponton áthaladó legrövidebb húr a PK szakaszra merőleges húr (10.40. ábra).

10.40. ábra

APK egyenes egy irányvektora v(2; –1). Ez a vektor a rá merőleges egyenesnek normálvektora, tehát a keresett húr
egyenlete y = 2x + 5. Ezt a kör egyenletébe helyettesítve:

Tehát a kerítés két végpontjának a koordinátái: M1(0; 5), M2(–4; –3).


Az M1M2 távolság: tehát a kerítés hossza: méter.

10.4. Koordinátatranszformációk
Legyen adott egy koordináta-rendszerben egy P0(x0; y0) pont, és azt szeretnénk meghatározni, hogy ugyanennek a pontnak
a koordinátái egy másik koordináta-rendszerben hogyan alakulnak. Ilyenkor koordinátatranszformációt hajtunk végre,
melyek közül a két legfontosabb a kordináta-rendszer párhuzamos eltolása, illetve az origó körüli adott szögű elforgatása.

A koordináta-rendszer origó körüli elforgatása

Párhuzamos helyzetű koordináta-rendszerek

Párhuzamos helyzetű koordináta-rendszerek


Ha az adott x, y tengelyű koordináta-rendszert eltoljuk valamely v(v1;, v2) vektorral, akkor az új koordináta-rendszer x*,y*
tengelyeinek O*(v1; v2) metszéspontja lesz az origója (10.41. ábra).
10.41. ábra

Ekkor az eredeti rendszerben levő P0(x0; y0) pont koordinátái

A koordináta-rendszer origó körüli elforgatása


Most vizsgáljuk meg, hogy az x, y tengelyű koordináta-rendszert az O origó körül elforgatva valamilyen adott a szöggel, az
új x*, y* tengelyű koordináta-rendszerben hogyan alakulnak a P0(x0; y0) pont koordinátái. A 10.42. ábra jelöléseivel

Most szorozzuk meg az első egyenletet cos α-val, a másodikat sin α-val, majd adjuk össze a két egyenlet megfelelő
oldalát; azt kapjuk:

Ha pedig az első egyenletet –sin α-val, a másodikat cos α-val szorozzuk, akkor az adódik

10.42. ábra

Ezek szerint az α szöggel elforgatott koordináta-rendszerben a P0 pont új koordinátái

Példák
1. Egy egyenes egyenlete az x, y koordináta-rendszerben y = –3x + 5. Eltoljuk a koordináta-rendszert önmagával
párhuzamosan úgy, hogy az új x*, y* rendszer origója az eredeti rendszer O*(3; 5) pontjába kerüljön. Mi lesz az
egyenes egyenlete az új rendszerben?

Így az egyenes egyenlete az új rendszerben: y* + 5 = –3(x* + 3) + 5, azaz y* = –3x* + 9.


2. Adott az x, y koordináta-rendszerben az x2 +y2 –4x+ 6y – 3 = 0 egyenletű kör. Elforgatjuk a koordináta-rendszert
60°-kal pozitív irányba. Mi lesz az új x*, y* koordináta-rendszerben a kör egyenlete?
A kör középpontja az eredeti rendszerben K(2; 3), sugara r = 4. A rendszer elforgatásakor a sugár nyilván nem
változik. A középpont koordinátái az új x*, y* rendszerben

Tehát a kör egyenlete az x*, y* rendszerben:


10.5. Kúpszeletek egyenletei, másodrendű görbék
Ha egy végtelen egyenes körkúpot olyan S síkkal metszünk, mely nem illeszkedik a kúp csúcsára, akkor a síkmetszet kör,
parabola, ellipszis vagy hiperbola, aszerint, hogy a metszősík mekkora szöget zár be a kúp tengelyével (10.43. ábra).

10.43. ábra

A kör egyenletével a 10.3. fejezetben foglalkoztunk. Ebben a fejezetben a többi kúpszeletet tárgyaljuk. Először
ponthalmazként de niáljuk e görbéket, majd egyenleteikkel, érintőik egyenletével foglalkozunk. Hogy az alábbiakban
szereplő de nícióknak valóban megfelelnek a kúp különböző síkmetszetei, annak tárgyalását a 6., A tér elemi geometriája
című fejezetben találjuk.

A parabola
Az ellipszis
A hiperbola
Másodrendű görbék

A parabola

A parabola a sík azon pontjainak a halmaza, melyek a sík egy pontjától és egy rá nem illeszkedő síkbeli egyenestől
egyenlő távolságra vannak.

Az adott pontot a parabola F fókuszpontjának nevezzük, az adott egyenes pedig a parabola vezéregyenese (direktrixe).
Ha egy pont a vezéregyenestől ugyanakkora távolságra van, mint a fókuszponttól, akkor e pont egy olyan kör középpontja,
mely érinti a vezéregyenest, és áthalad a fókuszon. Ennek megfelelően a parabolát így is de niálhatjuk:

A parabola egy adott egyenest érintő és egy adott, az egyenesre nem illeszkedő ponton áthaladó körök
középpontjainak a halmaza.

Tekintsük a 10.44. ábrát! Ha P pontja az F fókuszpontú, v vezéregyenesű parabolának, akkor PF = Pv. Ha valamely Q
pontra QF < Qv, akkor e Q pont a parabola belső pontja, ha pedig valamely R pontra RF > Rv, akkor az R pont a parabola
külső pontja.

10.44. ábra

A parabola tengelyesen szimmetrikus alakzat. A szimmetriatengelyével való T metszéspontja a parabola tengelypontja.


Fontos adata a parabolának a fókuszpont és a vezéregyenes távolsága, ezt p-vel jelöljük, és a parabola paraméterének
nevezzük. A parabola paramétere határozza meg, hogy a parabola mennyire „kövér” vagy „sovány”. Kimutatható, hogy
bármely két parabolához létezik olyan egybevágósági transzformáció, mely az egyiket a másikkal középpontosan hasonló
parabolába viszi át, ami azt jelenti, hogy bármely két parabola hasonló egymáshoz.
A parabola szerkesztésén olyan eljárást értünk, mely a parabola bármely pontjához elvezet bennünket. A parabola
pontjainak szerkesztéséhez tekintsük a 10.45. ábrát!

10.45. ábra

Vegyük a vezéregyenes egy tetszőleges (a tengely és a vezéregyenes metszéspontjától különböző) Q pontját, és állítsunk
Q-ban merőlegest a vezéregyenesre. E merőleges és az FQ szakasz felező merőlegese valamilyen P pontban metszik
egymást. A P illeszkedik a felező merőlegesre, ezért PF = PQ. De PQ azonos a P pontnak a vezéregyenestől való távolságával,
így a P pont biztosan illeszkedik a parabolára. Mivel a Q pontot a vezéregyenesen bárhol felvehetjük, így valóban a
parabolának minden pontjához eljuthatunk.
Helyezzük el a parabolát egy koordináta-rendszerben úgy, hogy tengelye az y tengely legyen, tengelypontja pedig az
origóba essen (10.46. ábra)!

10.46. ábra

Ekkor a fókuszpont koordinátái , a vezéregyenes egyenlete .


Ha a P(x; y) pont illeszkedik a parabolára, akkor

Az y tengelyű tengelyponti parabola egyenlete:

(10.28)

Ezt az egyenletet az y tengelyű p paraméterű parabola kanonikus egyenletének is nevezzük.

Megjegyzés. Ha a p paraméter értéke negatív, akkor a parabola „lefelé nyíló”; ekkor egyenlete .
Természetesen ekkor a fókuszpont a tengelypont alatt, a vezéregyenes pedig a tengelypont fölött van.

Hasonló gondolatmenettel jutunk el az x tengelyű, p paraméterű parabola kanonikus egyenletéhez (10.47. ábra).
10.47. ábra

Az x tengelyű tengelyponti parabola egyenlete:

(10.29)

Ha a parabola tengelye párhuzamos az y tengellyel, de tengelypontja nem az origóban van, hanem a T(u; v) pontban
(10.48. ábra), akkor egyenlete

(10.30)

10.48. ábra

Ha a (10.30) egyenletben elvégezzük a kijelölt műveleteket, akkor ax2 + bx + cy + d = 0 alakú egyenlethez jutunk.
Megállapíthatjuk tehát, hogy a parabola egyenlete olyan kétismeretlenes másodfokú egyenlet, melyben az egyik (és csak az
egyik) ismeretlen szerepel a másodfokon, továbbá xy-os tag nem szerepel benne. Ha a parabola tengelye az y tengellyel
párhuzamos, akkor az x szerepel másodfokon, ha pedig a tengely az x tengellyel párhuzamos, akkor y szerepel másodfokon.

A parabola érintője

A parabola érintője

A parabola érintője olyan egyenes, melynek a parabolával egyetlen közös pontja van, és nem párhuzamos a parabola
tengelyével.

Könnyen kimutatható, hogy e de níció egyenértékű az alábbi meghatározással:


A parabola érintője olyan egyenes, melynek a parabolával egyetlen közös pontja van, és minden egyéb pontja a
parabola külső pontja.

Írjuk fel az parabola egy adott P0 (x0; y0) pontjában az érintő egyenletét (10.49. ábra)!

10.49. ábra

Ha a keresett érintő meredeksége m, akkor a P0 ponton átmenő, m meredekségű egyenes egyenlete

(10.31)

A (10.31) egyenletű egyenes és a parabola közös pontjait megkapjuk, ha y-t behelyettesítjük a parabola egyenletébe

Ha az egyenes érintője a parabolának, akkor csak egy közös pontjuk van, vagyis ennek az x2-ben másodfokú
egyenletnek csak egy megoldása lehet, tehát diszkriminánsa 0 kell, hogy legyen.

(10.32)

azaz
Ezt (10.31)-be visszahelyettesítve kapjuk a P0 ponton átmenő érintő egyenletét:

(10.33)

Érdemes meg gyelni, hogy a diszkriminánst 0-val egyenlővé tevő (10.32) egyenlet bal oldala teljes négyzet. Ez nem
meglepő, sőt törvényszerűen így kellett lennie, hiszen ha a (10.32) m-ben másodfokú egyenletnek két megoldása lenne,
akkor a parabola egy P0 pontjába két érintőt húzhatnánk, ha pedig a (10.32) egyenletnek nem lenne megoldása, akkor a P0
pontban egyetlen érintő sem lenne húzható.
A P0-beli érintő (10.33)-beli alakjából számítsuk ki, hol metszi ez az érintő az x tengelyt. Ekkor y = 0, tehát

, ahonnan . Ez lehetőséget nyújt számunkra egy adott parabola valamely P0 pontbeli érintőjének a
megszerkesztésére. A parabola T tengelypontjában merőlegest állítunk a parabola t tengelyére, majd e merőlegesre szintén
merőlegest állítunk a P0 pontból. Ha ez utóbbi merőleges talppontja Q, akkor – az előbb kapott eredmény alapján – a P0-beli
érintőnek át kell haladnia a TQ szakasz F felezőpontján (10.50. ábra). Fontos tulajdonsága még a parabolának, hogy a P0
pontjába húzott érintő felezi az FP0Q szöget.
10.50. ábra

Megjegyzés. A külső pontból húzott érintők egyenletét hasonló gondolatmenettel határozhatjuk meg. A külső P0
ponton átmenő m meredekségű egyenes egyenletéből és a parabola egyenletéből álló egyenletrendszert felírva, az
egyenes egyenletéből y-t kifejezve és behelyettesítve a parabola egyenletébe egy x-ben másodfokú, m paraméteres
egyismeretlenes egyenletet kapunk. Mivel a keresett egyenesnek a parabolával egy közös pontja van, így ennek az
egyenletnek a diszkriminánsa 0 kell, hogy legyen. Ezt felírva, m-re kapunk egy másodfokú egyenletet, melynek
minden esetben lesz két megoldása, így megkapjuk a keresett érintők meredekségét. Példák
1. Írjuk fel annak a felfelé nyitott parabolának az egyenletét, melynek tengelye párhuzamos az y tengellyel,
tengelypontja T(3; 1), paramétere 4.

A parabola egyenlete (10.30) képlet alapján .


2. Egy parabola egyenlete y = –2x2 + 8x – 5. Határozzuk meg a parabola paraméterét, fókuszpontjának a koordinátáit,
valamint vezéregyenesének egyenletét! Alakítsuk át a parabola egyenletét, hozzuk (10.30) alakra:

Innen a parabola paramétere tengelypontja T(2; 3). A parabola lefelé nyitott. Ez azt jelenti, hogy a fókuszpont
a tengelypont „alatt” van a paraméter felével, a vezéregyenes pedig a tengelypont „fölött” van a paraméter

felével. Tehát a parabola fókuszpontja , vezéregyenesének egyenlete .


3. Írjuk fel az y = x2–4x+ 6 egyenletű parabola P(4; 6) pontjába húzott érintőjének egyenletét!
Legyen m az érintő meredeksége, ezzel az érintő paraméteres egyenlete

Ennek az egyenesnek a parabolával alkotott közös pontjait az x2 – 4x + 6 = mx–4m + 6 egyenlet megoldásai adják.
Az egyenletből x2 – (4 + m)x + 4m = 0. Ha az egyenes érintő, akkor csak egy közös pontja van a parabolával, tehát ez
utóbbi egyenletnek csak egy megoldása lehet, ami azt jelenti, hogy a diszkriminánsa 0. (4 + m)2 – 16m = 0, azaz m2
– 8m+ 16 = 0, ahonnan (m – 4)2 = 0, tehát az érintő meredeksége m = 4. Az érintő egyenlete y = 4x – 10.
4.
Az egyenletű parabola minden pontját összekötöttük a fókuszponttal. Mi lesz az így keletkező szakaszok
felezőpontjainak a halmaza?
Tekintsük a 10.51. ábrát! Ha a parabola valamely P0 pontját a fókuszponttal összekötő szakasz felezőpontja Q,

akkor Q koordinátái .
Ezek szerint a keresett ponthalmaz első, illetve második koordinátáira

(10.34)

Fejezzük ki (10.34) első egyenletéből x0-t, és helyettesítsük ezt (10.34) második egyenletébe:
10.51. ábra

A keresett ponthalmaz egy olyan y tengelyű parabola, melynek paramétere az eredeti parabola paraméterének a

fele, tengelypontja pedig . (Érdemes megfogalmazni, hogy tulajdonképpen egy középpontos


hasonlósági transzformációt hajtottunk végre; e transzformáció centruma az eredeti parabola fókuszpontja, a

hasonlóság aránya pedig .


5.
egyenletű parabola két pontja A és B. E pontok merőleges vetülete a vezéregyenesen A* és B*. Igazoljuk
hogy a fókuszponton átmenő, AB-re merőleges egyenes felezi az A*B* szakaszt.

Legyenek az A és B pontok . Ekkor az A* és B* pontok koordinátái

. (10.52. ábra).

10.52. ábra

Az AB egyenes egy irányvektora vagy az egyszerűbb: . Ez a vektor az

fókuszon átmenő, AB-re merőleges egyenesnek normálvektora, így az egyenes egyenlete

azaz .

Ennek az egyenesnek a vezéregyenessel való P metszéspontját megkapjuk, ha y helyébe helyettesítünk.

Ekkor tehát ahonnan .


Tehát a P pont első koordinátája az A* és B* pontok első koordinátájának számtani közepe, ami éppen azt jelenti,
hogy a P pont az A*B* szakasz felezőpontja.
6. * Igazoljuk, hogy a parabola vezéregyenesének bármely pontjából a parabolához húzott érintők merőlegesek
egymásra!

Legyen a parabola egyenlete , és legyen a vezéregyenes egy pontja (10.53. ábra). Ha a Q

ponton átmenő valamely egyenes meredeksége m, akkor ennek az egyenesnek az egyenlete

azaz . Ennek az egyenesnek és a parabolának a közös pontjait (illetve a közös pontok első

koordinátáját) az másodfokú egyenlet megoldásai adják. Az egyenlet tehát

(10.35)

Ha az egyenes érintője a parabolának, akkor (10.35) egyenletnek csak egy megoldása lehet, vagyis diszkriminánsa
0.
10.53. ábra

Ha ez utóbbi m-ben másodfokú egyenlet gyökei m1 és m2, akkor a Viète-formulák alapján ,


tehát a Q pontból húzott érintők meredekségeinek szorzata –1, ez pedig (10.17) alapján éppen azt jelenti, hogy a két
érintő merőleges egymásra.

Az ellipszis

Az ellipszis a sík azon pontjainak a halmaza, melyek két adott ponttól mért távolságainak összege adott, a két pont
távolságánál nagyobb állandó.

A két pont az ellipszis két fókuszpontja, melyeket általában F1-gyel és F2-vel, ezek távolságát F1F2 = 2c-vel, az adott
távolságot pedig 2a-val szokás jelölni (10.54. ábra). Ha tehát adottak az F1, F2 fókuszpontok, továbbá a 2a távolság, akkor az
ellipszis azon P pontok összessége, melyekre PF1 + PF2 = 2a.

10.54. ábra

Az ellipszis valamely pontját a fókuszpontokkal összekötő r1, r2 szakaszokat a P ponthoz tartozó vezérsugárnak
nevezzük. A fókuszpontoknak az O szimmetriacentrumtól való távolságát lineáris excentricitásnak, a lineáris excentricitás
és a fél nagytengely hányadosát pedig numerikus excentricitásnak nevezzük. E numerikus excentricitásra nyilván

.
Minél nagyobb e numerikus excentricitás, annál „laposabb”, elnyúltabb az ellipszis. Ha e tört értéke 0, azaz a
fókuszpontok egybeesnek a szimmetriacentrummal, akkor a nagy- és kistengely egyenlő egymással, ekkor az ellipszis
speciálisan körbe megy át.
Az ellipszis tengelyesen szimmetrikus alakzat, két egymásra merőleges szimmetriatengelye van, melyek metszéspontja
az ellipszis O szimmetriacentruma. A 10.54. ábra R pontjára

így az ellipszis RT szimmetriaátlója éppen az adott 2a távolsággal egyenlő. Az RT szakaszt az ellipszis nagytengelyének, a QS
szakaszt a kistengelyének mondjuk. Ha a kistengely hossza 2b, akkor az OF1Q derékszögű háromszögre

(10.36)

Megjegyzés. Az ellipszis pontjait könnyen megszerkeszthetjük, ha adott a két fókuszpont, valamint adott a 2a
távolság. Rajzoljunk ugyanis az egyik fókusz (pl. F1) körül egy tetszőleges a – c ≤ r1 ≤ a + c sugarú kört, majd F2 körül
egy r2 = 2a – r1 sugarú kört! E körök P1 és P2 metszéspontjai biztosan rajta vannak az ellipszisen, hiszen e pontokra r1 +
r2 = 2a, amit a 10.55. ábráról leolvashatunk. Ilyen módon az ellipszis minden pontjához eljuthatunk.

10.55. ábra

Helyezzük el a 2a nagytengelyű, 2b kistengelyű ellipszist úgy egy koordináta-rendszerben, hogy nagytengelye a


koordináta-rendszer x tengelyére, kistengelye pedig az y tengelyre illeszkedjen (10.56. ábra)!

10.56. ábra

Egy P(x; y) pont akkor és csak akkor illeszkedik az ellipszisre, ha PF1 + PF2 = 2a. Mivel

Emeljük négyzetre mindkét oldalt, majd végezzük el a lehetséges egyszerűsítést, azt kapjuk

Újabb négyzetre emelés, majd átrendezés után

De (10.36) alapján a2 – c2 = b2, így azt kapjuk

ahonnan a2b2-tel osztva kapjuk a tengelyponti ellipszis kanonikus alakját.

A 2a nagytengelyű, 2b kistengelyű, tengelyponti ellipszis kanonikus egyenlete:

(10.37)

Speciálisan, ha a = b, akkor az egyenlet x2 + y2 = a2 alakot ölt, vagyis ekkor egy origó középpontú, a sugarú kör
egyenletét kapjuk.
Ha az ellipszis centruma nem az origóban van, hanem a K(u; v) pontban, 2a nagytengelye az x tengellyel, 2b kistengelye
az y tengellyel párhuzamos (10.57. ábra), akkor egyenlete:

Ha elvégezzük az egyenletben a kijelölt műveleteket, akkor


alakú egyenlethez jutunk. Ez olyan másodfokú kétismeretlenes egyenlet, melyben a másodfokú tagok együtthatói azonos
előjelűek, továbbá nem szerepel benne xy-os tag.

10.57. ábra

Az ellipszis érintője

Az ellipszis érintője
Az ellipszis érintőjének olyan egyenest nevezünk, melynek az ellipszissel egy közös pontja van. Ha a sík valamely P pontjára
PF1 + PF2 < 2a, akkor e P pontot az ellipszis belső pontjának nevezzük, ha PF1 + PF2 > 2a, akkor P az ellipszis külső pontja.
Ilyen módon azt is mondhatjuk: az ellipszis érintője olyan egyenes, melynek az ellipszissel egy közös pontja van, minden
egyéb pontja külső pont.

Legyen az egyenletű ellipszis két pontja P1(x1; y1) és P2(x2; y2), és közülük valamelyiken (pl. a P1-en)
átmenő érintőt szeretnénk meghatározni. A P1 és P2 pontokon átmenő egyenes egyenlete:

(10.38)

A P1 és P2 pontok koordinátái kielégítik az ellipszis egyenletét, vagyis

Vonjuk ki a második egyenletből az elsőt; azt kapjuk

Az utóbb kapott egyenlet jobb oldalán éppen a P1 és P2 pontokon átmenő egyenes meredeksége szerepel. Helyettesítsük
ezt (10.38) egyenletbe:

Ha most a kérdéses egyenes a P1-beli érintő, akkor a P1 és P2 pontok egybeesnek, azaz x1 = x2 és y1 = y2, tehát azt kapjuk:

Átrendezve és a2b2-tel osztva mindkét oldalt:

De a P1 pont illeszkedik az ellipszisre, így koordinátái kielégítik az ellipszis egyenletét, ami azt jelenti, hogy az utóbbi
egyenlet jobb oldalán 1 szerepel. Így az ellipszis P1 pontjára illeszkedő érintő egyenlete:
(10.39)

Fontos tulajdonsága az ellipszisnek, hogy valamely P pontjába húzott érintője felezi a P pontból húzott vezérsugarak
külső szögét (10.58. ábra).

10.58. ábra

Megjegyzés. Kimutatható, hogy az 5.3. fejezetben tárgyalt merőleges a nitás körhöz ellipszist rendel. Ha az ellipszis

nagytengelye 2a, kistengelye 2b, akkor az r = a sugarú kör valamely átmérő egyenesére vonatkozó arányú
merőleges a nitás a körhöz éppen az előbbi ellipszist rendeli. Mivel e transzformáció egyeneshez egyenest rendel,
így a kör egy P pontjába húzott érintőjének a n képe a keletkező ellipszis megfelelő P′ pontjába húzott érintője lesz.
Példák
1.
Határozzuk meg az egyenletű ellipszis fókuszpontjainak a koordinátáit! A fókuszpontok
koordinátái F1(c; 0) és F2(–c; 0), ahol (10.36) szerint c2 = a2 – b2. Ezek szerint c2 = 10–4 = 6, tehát . Tehát a
fókuszpontok koordinátái:

2. Egy tengelyponti ellipszis nagytengelyének egyik végpontja (6; 0), egyik fókuszpontjának a koordinátái F(4; 0).
Írjuk fel az ellipszis egyenletét!
A feltételek szerint a = 6 és c = 4. (10.36) alapján b2 = a2–c2, tehát b2 = 36–16 = 20. Így az ellipszis egyenlete:

3.
Írjunk négyzetet az egyenletű ellipszisbe! Igazoljuk, hogy e négyzet T területére .
Tekintsük a 10.59. ábrát! Az ellipszis beírható négyzetének a csúcsait az y = x és y = –x egyenletű egyenesek metszik
ki az ellipszisből.

10.59. ábra

Ezek szerint pl. azaz a2x2 + b2x2 = a2b2, ahonnan .

A négyzet T területe T = 4x2, tehát .


4. Egy ellipszis minden pontját összekötjük a nagytengely végpontjaival. Mi lesz az így keletkező háromszögek
súlypontjainak a halmaza?

Legyen az ellipszis az egyenletű ellipszis! Ha ennek valamely (pl. első síknegyedbeli) P pontjának

első koordinátája x0, akkor a P pont második koordinátája (10.60. ábra).


Ekkor az ABP háromszög S súlypontjának első és második koordinátája:
10.60. ábra

Az első egyenletből x0 = 3xs; ezt a másodikba helyettesítve, majd négyzetre emelve azt kapjuk

A keresett ponthalmaz tehát egy olyan kanonikus helyzetű ellipszis, melynek nagy- és kistengelye az eredeti
ellipszis nagy- és kistengelyének a harmada, kivéve az AB szakaszra eső pontokat.
5.
Írjuk fel az egyenletű ellipszis x = 4 abszcisszájú pontjaiba húzható érintőinek az egyenletét!

Ha x = 4, akkor , tehát az adott ellipszis megfelelő pontjai:

A két érintő egyenlete (10.39) alapján .

A hiperbola

A hiperbola a sík azon pontjainak a halmaza, melyeknek a sík két adott pontjától mért távolságai különbsége
(különbségének abszolút értéke) a két pont távolságánál kisebb állandó.

Az adott F1 és F2 pontok a hiperbola fókuszpontjai. A két fókuszpont távolságát 2c-vel jelöljük. A hiperbola valamely P
pontját a fókuszpontokkal összekötő r1 és r2 szakaszok a P ponthoz tartozó rádiuszvektorok (10.61. ábra)

10.61. ábra

A hiperbolának két ága van, tengelyesen szimmetrikus a fókuszpontokon áthaladó egyenesre, valamint a
fókuszpontok által meghatározott szakasz felező merőlegesére. E két tengely O metszéspontja a hiperbola centruma. A
fókuszpontoknak a centrumtól vett távolságát a hiperbola lineáris excentricitásának nevezzük. De níciónk szerint tehát,
ha az adott távolság 2a, akkor a hiperbola bármely P pontjára

(10.40)

A hiperbola két ágának a fókuszpontokon átmenő egyenessel alkotott metszéspontjainak távolsága éppen a megadott
2a, hiszen pl. (a 10.61. ábra jelöléseivel)
A fókuszpontokat tartalmazó egyenest a hiperbola valós tengelyegyenesének nevezzük, az AB = 2a szakaszt a hiperbola
valós tengelyének mondjuk. A fókuszpontokat összekötő szakasz felező merőlegese a hiperbola képzetes tengelyegyenese.
A képzetes tengelyegyenesre a hiperbola O centrumából mindkét irányban felmért b szakasz, melyre

(10.41)

a hiperbola képzetes tengelye (10.62. ábra).

10.62. ábra

Ennek megfelelően a hiperbola de níciójában megadott 2a szakasz felét, a-t a hiperbola valós féltengelyének, a (10.41)-
ben de niált b-t képzetes féltengelynek nevezzük.

Ha adott a hiperbola két fókuszpontjának 2c távolsága, valamint a valós tengely 2a hossza, akkor könnyen
megszerkeszthetjük a hiperbola tetszőlegesen sok pontját. Ha az egyik fókuszpont körül rajzolunk egy r1≥c – a sugarú
kört, majd a másik fókuszpont körül egy r2 = r1 + 2a sugarú kört, e körök biztosan metszik egymást, s a
metszéspontok a de níció alapján a hiperbola pontjai. E szerkesztési eljárással a hiperbola tetszőlegesen sok pontját
megszerkeszthetjük, s a hiperbola bármely pontjához eljuthatunk.

Helyezzük el a hiperbolát úgy egy koordináta-rendszerben, hogy valós tengelyegyenese az x tengely, képzetes
tengelyegyenese az y tengely legyen. Ekkor a hiperbola centruma a koordináta-rendszer origójába kerül. Ha a hiperbola
fókuszpontjainak a távolsága 2c, valós tengelye 2a, akkor

a hiperbola kanonikus egyenlete:

(10.42)

A bizonyításhoz tekintsük a 10.63. ábrát!


Ha a P(x; y) pont illeszkedik a hiperbolára, akkor |PF1 – PF2| = 2a, legyen PF1 > PF2, így ekkor PF1 –PF2 = 2a. A fókuszpont
koordinátái F1(–c; 0), F2(c; 0). Ekkor

10.63. ábra
Innen négyzetre emelés után azt kapjuk

Elvégezve a megfelelő összevonásokat, majd ismét négyzetre emelve

De (10.41) alapján c2 – a2 = b2, így azt kapjuk

x2b2 – a2y2 = a2b2, ahonnan a2b2-tel osztva mindkét oldalt


Ha a hiperbola centruma nem az origóban van, hanem a K(u; v) pontban, valós tengelye az x tengellyel, képzetes
tengelye az y tengellyel párhuzamos (10.64. ábra), akkor egyenlete

10.64. ábra

Ha elvégezzük a kijelölt műveleteket, akkor

alakú egyenletet kapunk. Ez olyan kétismeretlenes másodfokú egyenlet, melyben a másodfokú tagok együtthatói
különböző előjelűek, és nem szerepel benne xy-os tag.

A hiperbola érintője, aszimptotái

A hiperbola érintője, aszimptotái


A parabola érintőjéhez hasonlóan de niálhatjuk a hiperbola érintőjét. Ha a sík valamely P pontjának a hiperbola
fókuszpontjaitól mért távolsága r1, illetve r2, és |r1 – r2| > 2a, akkor a kérdéses pontot a hiperbola belső pontjának nevezzük,
ha |r1 – r2| < 2a, akkor a P pont a hiperbola külső pontja. Ezek után a hiperbola érintője olyan egyenes, melynek csak egy
közös pontja van a hiperbolával, és minden egyéb pontja külső pont. Az ellipszis érintőjének egyenleténél használt
módszert alkalmazva igazolhatjuk, hogy a hiperbola P0(x0; y0) pontjában húzott érintőjének egyenlete

(10.43)

Érdekes tulajdonsága a hiperbolának, hogy bármely P pontjába húzott érintője felezi a P pontból húzott
rádiuszvektorok hajlásszögét (10.65. ábra).
10.65. ábra

A parabola és az ellipszis esetében bármely külső pontból két érintő húzható a kérdéses alakzathoz. A hiperbola
esetében vannak olyan külső pontok, melyekre ez nem teljesül. Az ilyen pontok két egyenest alkotnak, melyek a hiperbola
centrumában metszik egymást. Ezeket az egyeneseket a hiperbola aszimptotáinak nevezzük (10.66. ábra).

10.66. ábra

A centrumból nem húzható érintő a hiperbolához, az aszimptoták egyéb pontjaiból pedig egy érintő húzható a
hiperbolához. A hiperbola ágai a végtelenbe tartva tetszőlegesen megközelítik az aszimptotákat, így mondhatjuk, hogy az
aszimptoták a végtelenben érintik a hiperbolát.

egyenletű hiperbola aszimptotáinak egyenlete és .

Példák
1. Írjuk fel a hiperbola kanonikus egyenletét, ha a valós tengelye 8, képzetes tengelye 6.

A feltételek szerint a = 4, b = 3, tehát a hiperbola egyenlete .


2.
Egy hiperbola egyenlete . Határozzuk meg valós és képzetes tengelyének hosszát, valamint a
fókuszpontok távolságát!
Most a = 2, b = 3, tehát a valós tengely 4, a képzetes tengely 6. (10.41) alapján c2 = a2 + b2, jelen esetben
. Tehát a parabola fókuszpontjainak a távolsága .
3.
Írjuk fel az hiperbola P(0; 1) pontból húzható érintőinek az egyenletét!
Legyen az érintő meredeksége m. Ekkor egyenlete y – 1 = mx, azaz y = mx + 1. Ennek az egyenesnek és a

hiperbolának a közös pontjait, illetve a közös pontok x koordinátáit az egyenlet adja. Innen

Ha az egyenesnek egy közös pontja van a hiperbolával, akkor ennek az egyenletnek csak egy megoldása lehet,

vagyis diszkriminánsa 0; 182m2 + 180(4 – 9m2) = 0, ahonnan . Ezek szerint az érintők egyenlete:

, illetve .
4.
Kössük össze az egyenletű hiperbola minden pontját a fókuszpontokkal! Mi lesz az így keletkező
háromszögek súlypontjainak a halmaza?
Tekintsük a 10.67. ábrát! Ha a hiperbola valamely (pl. első síknegyedbe eső) P0 pontjának első koordinátája x0,

akkor második koordinátája .


10.67. ábra

Az F1F2P0 háromszög S súlypontjának első, illetve második koordinátája , illetve .

Ekkor x0 = 3xs, tehát azaz 9a2y2, = = 9b2x2 – 9a2b2, ahonnan azt kapjuk: . Ez
utóbbi egyenlet egy olyan kanonikus helyzetű hiperbola egyenlete, melynek valós tengelye és képzetes tengelye az
eredeti hiperbola valós és képzetes tengelyének a harmada (kivéve a valós tengelyegyenesre eső pontokat).
Természetesen a kapott hiperbola fókuszpontjainak a távolsága ugyancsak harmada az eredeti hiperbola
fókuszpontjai távolságának.
5.
Az egyenletű hiperbola valamely P pontjából állítsunk merőleges egyenest a valós
tengelyegyenesre! Igazoljuk, hogy ennek az egyenesnek az aszimptoták közé eső darabját a P pont két olyan részre
bontja, melyek mértani közepe b. Tekintsük a 10.68. ábrát! Ha a P0 pontjának első koordinátája x0, akkor második

koordinátája

10.68. ábra

Az M1 és M2 pontok koordinátái , illetve . Ezek szerint

és Ekkor

tehát

Másodrendű görbék
Másodrendű görbének mondjuk az olyan (valós vagy képzetes) görbéket, melyek általános egyenlete

vagy a későbbiekben hasznos jelöléssel

(10.44)

ahol a11, a12 és a22 nem mindegyike 0. (A bal oldali 2., 4. és 5. tagban azért szerepeltettünk egy-egy 2-es szorzót, mert a
későbbiekben közlendő képletek leírásához ez hasznos lesz majd számunkra.)
A (10.44) egyenletben feltehetjük, hogy a11 ≥ 0, ellenkező esetben az egyenletet –1-gyel szorozva ezt elérjük. Ha a11 = 0,
akkor feltételezzük, hogy a22 ≥ 0. Az a12 = 0 esettel e fejezet előző részeiben (kör, parabola, ellipszis, hiperbola) már
foglalkoztunk; ekkor ugyanis a megfelelő tagokat teljes négyzetté alakítva tudtuk a kérdéses alakzatokat kanonikus alakra
hozni a megfelelő általános másodfokú kétismeretlenes egyenletet, így legyen a12 ≠ 0.
A (10.44) egyenlet együtthatóiból képezzük az alábbi A harmadrendű determinánst, és ennek A11, A22, A33
aldeterminánsait!
E determinánsok mindegyike főátlójára szimmetrikus; segítségükkel a (10.44) egyenlet által meghatározott görbéket az
alábbiakban foglalhatjuk össze.
1. Ha A > 0, akkor a kérdéses görbe
a) A33 > 0 esetén képzetes ellipszis,
b) A33 = 0 esetén parabola,
c) A33 < 0 esetén hiperbola.
2. Ha A = 0, akkor a görbe
a) A33 > 0 esetén képzetes egyenespár (valós metszésponttal),
b) A33 = 0 esetén valós egyenespár, vagy képzetes párhuzamos egyenespár vagy egybeeső egyenespár attól függően, hogy A11
+ A22 < 0 vagy A11 + A22 > 0 vagy A11 + A22 = 0,
c) A33 < 0 esetén valós metsző egyenespár.
3. Ha A < 0, akkor a görbe
a) A33 > 0 esetén valós ellipszis,
b) A33 = 0 esetén parabola,
c) A33 < 0 esetén hiperbola.

Példák
1. Állapítsuk meg, hogy az alábbi kétismeretlenes másodfokú egyenlet milyen másodrendű görbét határoz meg!
a) 2x2 – 4xy+ 3y2 – 4x + 6y – 1 = 0

Tehát a kétismeretlenes másodfokú egyenlet egy valós ellipszis egyenlete.


b) 7x2 + 8xy – 5y2 – 16x – 16y + 7 = 0

Így az egyenlet hiperbola egyenlete.


c) x2 – 2xy + y2 + 4x – 4y – 8 = 0

Tehát a kétismeretlenes másodfokú egyenlet egy valós párhuzamos egyenespár egyenlete.

10.6. Polárkoordináták
Ha a síkon felveszünk egy derékszögű koordináta-rendszert, akkor a sík pontjait egyértelműen megadhatjuk egy rendezett
számpárral, vagyis a koordinátáikkal. De egyéb módon is megadhatjuk egyértelműen a sík pontjait; legyen a sík egy
tetszőleges P pontjának az O origótól vett távolsága r, az OP félegyenesnek az x tengely pozitív irányú félegyenesével bezárt
szöge α. Ekkor a P(r; α) módon jelölt adatokkal ugyancsak egyértelműen megadtuk a sík kérdéses pontját, s ilyen módon a
sík valamennyi pontját jellemezhetjük. Az r és α koordinátákat a P pont polárkoordinátáinak nevezzük. Sok matematikai,
zikai, tájékozódási, technikai probléma esetén célszerűbb és könnyen kezelhetőbb a polárkoordinátákkal való számolás,
mint a derékszögű koordináták alkalmazása.
A P pont x, y derékszögű és r, α polárkoordinátái között az alábbi összefüggések állnak fenn (10.69. ábra):

(10.45)
illetve

(10.46)

10.69. ábra

Ha a derékszögű koordinátákról polárkoordinátákra akarunk áttérni, akkor a (10.46) összefüggést használjuk, ha pedig
polárkoordinátákról derékszögű koordinátákra, akkor a (10.45) összefüggés használatos.

Példák
1. Számítsuk ki a P(6; –2) derékszögű koordinátákkal adott pont polárkoordinátáit! (10.46) alapján a

polárkoordináták:
2. Írjuk át a következő alakzatok egyenletét polárkoordinátás alakra!
a) x2+y2 = 9.
Az egyenlet egy origó középpontú, 3 sugarú kör egyenlete. (10.45) alapján

A polárkoordinátás egyenlet független α-tól, vagyis az alakzat olyan pontok összessége, melyek az origótól 3
egység távolságra vannak.
b) y = 3x.

A polárkoordinátás egyenlet r-től független, egy 3 meredekségű, origón átmenő egyenes egyenlete.
c) x2+ y2 – 10x = 0.
A megadott egyenlet egy K(5; 0) középpontú, 5 sugarú kör egyenlete. Áttérve polárkoordinátákra

d)
.
Az egyenlet egy origó centrumú ellipszis egyenlete. (10.45) alapján

10.7. A tér analitikus geometriája (sík és egyenes, másodrendű felületek, térbeli


polárkoordináták)
Egy P pont síkbeli helyzetének a meghatározásához két merőleges síkbeli egyenest (síkbeli koordináta-rendszert) vettünk
fel. A pont térbeli helyzetének a meghatározásához most vegyünk fel három irányított egyenest úgy, hogy páronként
merőlegesek legyenek egymásra, és egy ponton haladjanak keresztül. E három egyenes páronként egy-egy koordinátasíkot
határoz meg, együttesen pedig megadnak egy térbeli koordináta-rendszert. A tengelyeket x, y, z-vel jelölve a tér egy
tetszőleges P pontjának x, y és z koordinátái az egyes koordinátasíkoktól vett előjeles távolsága: a P pont x koordinátája az
yz síktól vett távolság, az y koordináta az xz síktól vett távolság, a z koordináta pedig az xy síktól vett távolság (10.70. ábra).
A tengelyek metszéspontját most is origónak mondjuk, és O-val jelöljük. Ilyen módon a tér bármely pontjának megfelel egy
rendezett számhármas, illetve bármely rendezett számhármasnak egyértelműen megfelel a tér egy pontja.

10.70. ábra

A térbeli koordináta-rendszer alkothat jobbrendszert, de alkothat balrendszert is, ami azt jelenti, hogy az x tengelyt az
y tengelybe forgatva a kisebb szöggel, e forgás a z tengely pozitív irányából pozitív vagy negatív forgásnak látszik. Az esetek
többségében a térgeometriai problémák koordinátákkal való leírásánál jobbrendszert alkotó térbeli koordináta-rendszert
használnak – mi is ezt fogjuk használni.
A három egymásra merőleges koordinátasík a teret 8 részre, ún. térnyolcadokra osztja. Egy P pont egyes
koordinátáinak előjele attól függ, hogy a P pont melyik térnyolcadban van. Az egyes térnyolcadok és az egyes koordináták
előjelviszonyait az alábbi táblázat szemlélteti.

I. II. III. IV. V. VI. VII. VIII.

x + – – + + – – +

y + + – – + + – –

z + + + + – – – –

Térbeli pontok távolsága, szakasz osztópontjai


A sík egyenletei
Az egyenes egyenletei
Másodrendű felületek
Térbeli polárkoordináták

Térbeli pontok távolsága, szakasz osztópontjai


Először egy P(x; y; z) pontnak az O origótól vett távolságát határozzuk meg. Ha a P pontba mutató helyvektor r(x; y; z),
akkor a 10.71. ábra OPT és OTQ derékszögű háromszögeire felírva Pitagorasz tételét azt kapjuk:

10.71. ábra
Legyenek a térbeli koordináta-rendszerben az A és B pontok koordinátái A(a1; a2; a3) és B(b1; b2; b3), és mutasson az A
pontba az a, a B pontba a b helyvektor! Az A pontból a B pontba mutató vektor

Kaptuk tehát, hogy

a térbeli A(a1; a2; a3) és B(b1; b2; b3) pontok távolsága

(10.47)

Legyenek adottak ismét a térbeli koordináta-rendszerben az A és B pontok koordinátái A(a1; a2; a3) és B(b1; b2; b3), és
mutasson az A pontba az a, a B pontba a b helyvektor! Keressük az AB szakasz azon P pontját, mely az AB szakaszt ismert p :

r arányban osztja két részre, vagyis, melyre . A 10.1. fejezetben leírt gondolatmenetet követve arra jutunk, hogy

a térbeli A(a1; a2; a3) és B(b1; b2; b3) pontok által meghatározott szakasz p : r arányú osztópontjának a koordinátái

(10.48)

Példák
1. Számítsuk ki az A(–2; 1; 6) és B(4; 5; 0) pontok által meghatározott szakasz felezőpontjának az origótól mért
távolságát!
Egy AB szakasz F felezőpontjának a kiszámításához a (10.48) képletet használhatjuk, amikor speciálisan p = r = 1.
Így esetünkben az AB szakasz F felezőpontja F(1; 3; 3). Az F pontnak az origótól való távolsága:
.
2. Adott két pont: A(–4; 3; 1) és N(2; 2; 0). Az N pont egy AB szakasz A-hoz közelebbi negyedelő pontja. Határozzuk
meg a B pont koordinátáit!
Legyenek az A, B és N pontokba mutató helyvektorok a, b és n. Ha az N pont az AB szakasz A-hoz közelebbi

negyedelő pontja, akkor ahonnan b = 4n – 3a. Ennek megfelelően a B pont koordinátái B(20; –1; –3).
3. Határozzuk meg az x tengelynek azt a pontját, mely az A(2; 3; 0) és B(5; –2; 6) pontoktól egyenlő távolságra van.
Ha az x tengely keresett pontja P(x0; 0; 0), akkor a PA = PB egyenlőség (10.47) alapján
, x20 – 4x0 + 13 = x20 – 10x0 + 65, ahonnan az x tengely keresett pontja

.
4. Melyik az a pont az y tengelyen, amelyik az A(3; 4; –1) ponttól kétszer olyan távol van, mint a B(5; 0; 2) ponttól?
Legyen az y tengely keresett pontja P(0; y0; 0)! A feltételek szerint PA = 2PB, vagyis
, azaz 10 +(4 – y0) = 4(29 + y20).
2

Innen 3y20 + 8y0 + 90 = 0. Ez utóbbi másodfokú egyenlet diszkriminánsa negatív, tehát nincs valós megoldása, ami
azt jelenti, hogy nincs az y tengelynek olyan pontja, mely az adott A ponttól kétszer olyan távol van, mint az adott
B ponttól.

A sík egyenletei
Egy adott S síkra merőleges 0-tól különböző vektort a sík egy normálvektorának nevezzük. Mutasson az r0 helyvektor a sík
egy adott P0(x0; y0; z0) pontjába, s legyen a síknak n(A; B; C) egy normálvektora. Ekkor a sík tetszőleges P(x; y; z) pontjába
mutató r vektorra teljesül, hogy
(10.49)

Ezt az egyenletet a sík P0 pontján átmenő, n normálvektorú vektoregyenletének mondjuk (10.72. ábra).

10.72. ábra

A (10.49) egyenletet a skaláris szorzat szerint kifejtve kapjuk, hogy

a P0(x0;y0; z0) ponton átmenő, n(A; B; C) normálvektorú sík egyenlete

(10.50)

A (10.50)-ben szereplő műveleteket elvégezve (és feltételezve, hogy az A, B, C együtthatók nem mindegyike 0)

(10.51)

alakú egyenletet kapunk. Ez azt jelenti, hogy a sík egyenlete egy háromismeretlenes elsőfokú egyenlet, és minden ilyen
egyenlet egy sík egyenlete.
Gyakran használjuk a sík tengelymetszeti egyenletét. A (10.51)-ben leírt sík ott metszi az x tengelyt, ahol y = z = 0, az y
tengelyt, ahol x = z = 0, a z tengelyt, ahol x = y = 0. Ezek szerint a tengelyekkel való metszéspontok

Ezek szerint, ha a kérdéses sík az x tengelyt a-ban, az y tengelyt b-ben, a z tengelyt c-ben metszi, akkor tengelymetszeti
egyenlete:

Könnyen kimutatható, hogy az A(a1; a2; a3), S(b1; b2; b3), C(c1, c2; c3), D(d1; d2; d3) pontok akkor és csak akkor vannak
egy síkon, ha

(10.52)

továbbá, ha a fenti A, B és C pontok nincsenek egy egyenesen, akkor az általuk meghatározott sík egyenlete
(10.53)

Megjegyzés. Ha a vizsgált sík párhuzamos valamelyik koordinátatengellyel, akkor n(A; B; C) normálvektorának


valamelyik koordinátája 0. Ha pl. a sík párhuzamos a z tengellyel, akkor normálvektora n(A; B; 0) alakú, s így a (10.51)
egyenlet is ennek megfelelően alakul. Amennyiben a vizsgált sík párhuzamos valamelyik koordinátasíkkal, akkor
normálvektorának két koordinátája 0. Ha pl. a sík párhuzamos az xy koordinátasíkkal, akkor normálvektora n(0; 0;
C), így a P0(x0; y0; z0) ponton átmenő, n(0; 0; C) normálvektorú sík egyenlete z = z0 (10.73. ábra).

10.73. ábra

Érdemes megjegyezni, hogy amennyiben ismerjük a sík három nem egy egyenesre illeszkedő pontját, akkor nem
érdemes a (10.53) determinánst kiszámolnunk, ha fel akarjuk írni a sík egyenletét. Gyorsabban érünk célt, ha a
három pont valamelyikéből a másik két pontba mutató vektort írjuk fel, majd kiszámoljuk e két vektor vektoriális
szorzatát. E vektoriális szorzat merőleges a két vektor által kifeszített síkra, így a sík egy normálvektora lesz, majd
kiválasztva a három pont valamelyikét (10.50) egyenletbe helyettesítve megkaphatjuk a sík egyenletét.

Az egyenes egyenletei
A térbeli egyenes egyenletét akarjuk felírni. Ehhez ismernünk kell az egyenes egy P0(x0; y0; z0) pontját, valamint egy v(v1;
v2; v3) irányvektorát. Ha a P0 pontba mutat az r0 helyvektor, akkor az egyenes bármely P(x; y; z) pontjába mutató r vektort
felírhatjuk

(10.54)

alakban, ahol t tetszőleges valós szám (10.74. ábra)

10.74. ábra

A (10.54) egyenletet a P0 ponton átmenő, v irányvektorú térbeli egyenes paraméteres vektoregyenletének mondjuk. A
(10.54) egyenletet koordinátákra kiírva kapjuk a térbeli egyenes paraméteres egyenletrendszerét:
Ha e három egyenlet mindegyikéből kifejezzük a t paramétert, kapjuk az egyenes egyenletét.

Legyen v(v1; v2; v3), P0(x0; y0; z0), ahol a v vektor nem minden koordinátája 0. A P0 ponton átmenő, v irányvektorú
egyenes egyenlete:

(10.55)

Megjegyzés. Ha az egyenes párhuzamos valamelyik koordinátasíkkal, akkor (10.55) egyenletrendszer nem


használható, hiszen az irányvektor valamelyik koordinátája ez esetben 0. Ha pl. az egyenes párhuzamos az xy
koordinátasíkkal, akkor v3 = 0.

Ebben az esetben az egyenes egyenlete z = z0 . Ha az egyenes valamelyik koordinátatengellyel


párhuzamos, akkor irányvektorának két koordinátája is 0. Ha pl. egyenesünk párhuzamos a z tengellyel, akkor v1 =
v2 = 0 és v3 ≠ 0, így ez esetben az egyenes egyenlete x = x0 és y = y0.
Példák
1. Írjuk fel a sík egyenletét, ha normálvektora n(–2; 3; 6), és a sík illeszkedik a P(4; 0; –2) pontra.
A (10.50) képlet alapján a sík egyenlete –2(x–4) + 3y + 6(z + 2) = 0, azaz

2. Írjuk fel az A(2; 2; 4), B(–1; 4; 2), C(3; 0; –4) pontokra illeszkedő sík egyenletét! Kétféleképpen járhatunk el. Vagy a
(10.53) képlet alapján kifejtjük az alábbi determinánst

vagy kiszámítjuk az és vektorokat és e két vektor vektoriális szorzatát. E vektoriális szorzat merőleges
a kérdéses síkra, így használhatjuk normálvektornak. Ezután valamelyik pontot kiválasztva (10.50) alapján
írhatjuk a sík egyenletét. (–3; 2; –2), (1; –2; –8).

Tehát a sík egy normálvektora n(–20; –26; 4). A C pontot választva a sík egyenlete

3. Számítsuk ki az A(–3; 4; 4) és B(5; 2; 6) pontokra illeszkedő egyenes egyenletrendszerét, és számítsuk ki, hogy ez az
egyenes hol metszi az xy koordinátasíkot!
Az egyenes egy irányvektora (8, –2; 2) vagy az egyszerűbb (4;–1; 1). A B pontot választva az egyenes

egyenletrendszere . Ez az egyenes ott metszi az xy koordinátasíkot, ahol z = 0, tehát

, azaz x = –3 és y = 4. Tehát a kérdéses egyenes az xy koordinátasíkot a P(–3; 4; 0) pontban


metszi.
4. Számítsuk ki az x + 2y – z – 7 = 0, 2x – y + 3z + 6 = 0 és –x + 3y + z – 3 = 0 egyenletekkel megadott három sík közös
pontjának a koordinátáit!
A síkok egyenleteiből álló háromismeretlenes elsőfokú egyenletrendszert kell megoldanunk. Az első egyenletből
x = z + 7 – 2y; ezt a másik két egyenletbe helyettesítve azt kapjuk

Ezt az előző egyenletbe helyettesítve: z = –2, és így x = z + 7 – 2y = –2 + 7–4 = 1. Tehát a megadott három sík közös
pontja M(1; 2; –2).
5. Adott két sík egyenleteikkel: 3x – 4y + 2z + 8 = 0 és x –3y + 4z – 6 = 0. Számítsuk ki a két sík metszésvonalának
egyenletrendszerét!
A két sík metszésvonala egyenletrendszerének felírásához az egyenes egy pontjára és egy irányvektorára van
szükségünk. Mivel ez az egyenes mindkét síkban benne van, ezért a két sík normálvektorának vektoriális
szorzata a metszésvonalnak egy irányvektora (10.75. ábra).

Tehát a két sík metszésvonalának egy irányvektora n(–10; –10; –5) vagy az egyszerűbb (2; 2; 1). A metszésvonal egy
pontjának meghatározásához rögzítsük valamelyik koordinátát; legyen pl. x = 0! Ekkor – 4y+2z – 8 = 0, azaz –2y + z
= 4, és – 3y + 4z = 6. Az első egyenlet –4-szeresét a második egyenlettel összeadva azt kapjuk: 5y = –10, ahonnan y = –
2, és ezzel z = 0. Tehát a metszésvonal egy P pontja P(0; –2; 0). A két sík metszésvonalának egyenletrendszere:

10.75. ábra

6. Számítsuk ki az A(–1; 2; 6) és B(3; –6; 8) pontok által meghatározott szakasz felező merőleges síkjának egyenletét,
és számítsuk ki, hogy ez a sík hol metszi a z tengelyt! Tekintsük a 10.76. ábrát! Az AB szakasz F felezőpontja
illeszkedik a síkra, és az AB szakasz

10.76. ábra

egyenesének egy irányvektora a síknak normálvektora. A felezőpont koordinátái F(1; –2; 7). vAB(4; –8; 2), így a sík
egy normálvektora n(2; –4; 1). Ezzel a sík egyenlete (10.50) alapján

A kapott sík ott metszi a z tengelyt, ahol x = y = 0, tehát a z tengellyel való M metszéspont M(0; 0; 17).
7. Az 5x + 3y – 4z + 2 = 0 egyenletű sík mekkora térfogatú tetraédert vág le a koordinátatengelyekből? A kérdéses
síknak a koordinátatengelyekkel alkotott metszéspontjai és az origó egy derékszögű tetraédert határoznak meg.
Legelőször a tengelyekkel alkotott metszéspontokat kell kiszámítanunk (10.77. ábra).

10.77. ábra
A sík az x tengelyt ott metszi, ahol y = z = 0, tehát az y tengelyt ott metszi, ahol x = z = 0, tehát a

z tengelyt ott metszi, ahol x = y = 0, tehát . Ezekkel a tetraéder V térfogata:


térfogategység.
8.
Számítsuk ki a 4x + 2y – 4z+ 9 = 0 egyenletű sík és egyenletrendszerű egyenes
döféspontjának a koordinátáit!
A problémát egy ktív ábrán szemléltetjük (10.78. ábra). Először az egyenes egyenletrendszerét írjuk át

paraméteres egyenletrendszerré. Ha az M döféspont koordinátái M(x0;y0;z0), akkor ,


tehát x0 = 2t + 1, y0 = 4t – 3, z0 = t + 2.

10.78. ábra

Az M pont koordinátái kielégítik a sík egyenletét, így írhatjuk: 4(2t + 1) + 2(4t – 3) – – 4(t + 2) + 9 = 0, azaz 12t – 1 = 0,

ahonnan a t paraméter értéke: . Ezzel a metszéspont koordinátái:

tehát a sík és az egyenes M döféspontja .


9. Adott a P(–2; 3; 3) pont és a 3x + 2y – Az –17 = 0 egyenletű sík. Számítsuk ki a P pontnak a síktól való távolságát!
Először számítsuk ki a P ponton átmenő, a síkra merőleges egyenes egyenletrendszerét, majd ennek az
egyenesnek és a síknak az M döféspontját (10.79. ábra)!

10.79. ábra

A sík n(3; 2; –4) normálvektora az egyenesnek egy irányvektora, tehát az egyenes egyenletrendszere

. Legyen az egyenes és a sík M döféspontja M0(x0; y0; z0), és térjünk át az egyenes

paraméteres egyenletrendszerére! ahonnan x0 = 3t – 2, y0 = 2t + 3, z0 = –4t + 3. Az


M pont koordinátái kielégítik a sík egyenletét, tehát 3(3t – 2) + 2(2t + 3) –4(–4t + 3) –17 = 0, ahonnan 29t = 29, tehát t
= 1. Ezek szerint az M döféspont koordinátái M(1; 5; –1). A P pontnak a síktól való d távolsága:

10.
Adott az egyenletrendszerű egyenes. Írjuk fel annak a síknak az egyenletét, mely
illeszkedik az egyenes és az xy koordinátasík döféspontjára, és amely sík merőleges a megadott egyenesre.
Először kiszámítjuk, hogy a kérdéses egyenes mely pontban dö az xy koordinátasíkot. Ez a döféspont illeszkedik
a keresett síkra. Az egyenes irányvektora a síknak egy normálvektora, így a sík egy pontjának és
normálvektorának ismeretében már írhatjuk a sík egyenletét (10.80. ábra).

10.80. ábra
Az egyenes ott dö az xy koordinátasíkot, ahol z = 0, tehát . Innen . Tehát a

döféspont M koordinátái . Az egyenes egy irányvektora v(2; 3; 4), ami a keresett síknak egy

normálvektora. Ezzel a sík egyenlete , ahonnam .

Másodrendű felületek
A másodrendű görbék térbeli megfelelői a másodrendű felületek. Másodrendű felületnek nevezzük azokat a térbeli
alakzatokat, amelyeknek az egyenlete a koordinátákban másodfokú. A másodrendű felületek egyenletének általános alakja

(10.56)

ahol nem minden másodfokú tag együtthatója 0, vagyis az a, b, c, d, e, f együtthatók egyszerre nem lehetnek 0-k.
Ha tekintjük a másodrendű felületnek a z = 0 síkkal való metszetét, akkor (10.56) egyenlet így alakul

Ez az egyenlet általában egy másodrendű görbe egyenlete lesz, de lehet valamely egyenes egyenlete vagy a teljes xy
koordinátasík egyenlete, esetleg lehet üres alakzat egyenlete is. Általában elmondhatjuk, hogy egy másodrendű felületnek
és egy térbeli egyenesnek mindig 0, 1 vagy 2 közös pontja van, vagy pedig az egyenes illeszkedik a másodrendű felületre.

Gömb
Forgásparaboloid
Forgásellipszoid
Forgáshiperboloid
Másodrendű kúpfelület

Gömb
A legismertebb másodrendű felület a gömb.

A K(u; v; w) középpontú, r sugarú gömb egyenlete

(10.57)

Tekintsük ugyanis a 10.81. ábrát! Egy P(x; y; z) pont akkor és csak akkor illeszkedik a K(u; v; w) középpontú, r sugarú
gömbre, ha PK = r. Ez viszont (10.57) szerint éppen azt jelenti, hogy
10.81. ábra

Ha egy Q(x; y; z) pont a gömb belső pontja, akkor

ha egy R(x; y; z) pont a gömbön kívüli pont, akkor

Ha a (10.57) egyenletben elvégezzük a négyzetre emeléseket és összevonásokat, akkor

(10.58)

alakú kétismeretlenes másodfokú egyenletet kapunk. A gömb tehát olyan másodrendű felület, melynek egyenletében a
másodfokú tagok együtthatói egyenlők, nem szerepelnek benne „vegyes” szorzatok (xy, xz és yz). Természetesen nem
minden ilyen másodfokú kétismeretlenes egyenlet lesz gömb egyenlete (ahogyan ezt a kör esetében is láttuk). Ha a (10.58)
egyenletet teljes négyzetté kiegészítéssel

alakra hoztuk, akkor K > 0 esetén gömb egyenlete, K = 0 esetén egy pont (a középpont) adódik, míg K < 0 esetén üres alakzat
egyenlete.

Példák
1. Adott az x2+y2 + z2 – 4x + 6y – 8z + 13 = 0 egyenletű gömb. Számítsuk ki a gömb K középpontjának koordinátáit, a
gömb r sugarát, valamint azt, hogy milyen alakzatban metszi e gömb az xy koordinátasíkot.
A gömb egyenlete átalakítva: (x – 2)2 + (y + 3)2 + (z – 4)2 = 16, tehát a gömb K középpontja és r sugara: K(2; – 3; 4), r = 4
(10.82. ábra).

10.82. ábra

A gömb azokban a pontokban metszi az xy koordinátasíkot, melyekre x = 0. Ezzel a gömb egyenlete: x2+y2 – 4x+
6y+ 13 = 0, azaz (x – 2)2 + (y + 3)2 = 0. Tehát a gömb egyetlen pontban, a (2; –3) pontban érinti az xy koordinátasíkot.
(A kapott eredmény természetesen nem meglepetés, hiszen a középpont harmadik koordinátája egyenlő a gömb
sugarával, így törvényszerűen ezt az eredményt kellett kapnunk.)
2. Írjuk fel a gömb egyenletét, ha egy átmérőjének két végpontja A(2; –3; 6), B(–4; 5; 12). A gömb középpontja az AB
szakasz F felezőpontja, sugara pedig az AF = BF szakasz hossza. Az F pont koordinátái F(–1; 1; 9).
. Tehát a gömb egyenlete:

3. Határozzuk meg a p paraméter értékét úgy, hogy az x2 +y2 + z2 – 4x – 8y – 6z + 20 = 0 egyenletű gömb kívülről
érintse az x2 +y2 + z2 – 2x – 2y – 4z + p = 0 egyenletű gömböt. Alakítsuk át a megadott egyenleteket! (x – 2)2 + (y – 4)2 +
(z – 3)2 = 9 az első gömb egyenlete és (x – 1)2+ (y – 1)2 + (z – 2)2 = 6–p a másiké. Tehát az egyik gömb középpontja és
sugara K1(2; 4; 3), r1 = 3, a másikgömbé pedig K2(1; 1; 2), (10.83. ábra).
Ha a két gömb kívülről érinti egymást, akkor középpontjaik távolsága egyenlő a sugarak összegével: K1K2 = r1 + r2.
A középpontok távolsága: .
Tehát írhatjuk: , ahonnan .
10.83. ábra

4.
Mekkora húrt metsz ki az egyenletrendszerű egyenes az x2 +y2 + z2 – 4x – 4y + 2z – 40 = 0
egyenletű gömbből?
Először számítsuk ki az egyenes és a gömb döféspontjainak, M1 és M2 koordinátáit (10.84. ábra)!

10.84. ábra

Írjuk az egyenes egyenletrendszerét paraméteres alakban, és legyen az egyenes és a gömb egy közös pontja M1(x0;

y0; z0): ahonnan x0 = 8t + 4, y0 = t + 5, z0 = 3t + 5. Ezeket az értékeket a gömb


egyenletébe helyettesítve azt kapjuk, hogy

Tehát az egyenes és a gömb döféspontjai: M1(4; 5; 5), M2(–4; 4; 2). Az egyenesből a gömb által kimetszett húr d
hossza: .
5. Adott az x2 +y2 + z2 – 4x + 6y – 2z – 22 = 0 egyenletű gömb és ennek egy P0 pontja: P0(6; 1; –1). Számítsuk ki a gömböt
P0-ban érintő sík egyenletét!
A gömb egyenletéből (x – 2)2 + (y + 3)2 + (z – 1)2 = 36, tehát a gömb K középpontja K(2; –3; 1). Készítsünk egy ktív
ábrát (10.85. ábra)! Mivel a gömböt érintő sík merőleges az érintési pontba húzott sugárra, így a vektor az
érintő síknak egy normálvektora.

10.85. ábra

tehát a sík egy normálvektora n(2; 2; –1). Ezzel és a P0 pont koordinátáival az érintő sík egyenlete
(10.50) alapján: 2(x – 6) + 2(y – 1) – (z+ 1) = 0, azaz 2x + 2y–z–15 = 0.
6. Határozzuk meg annak a gömbnek az egyenletét, amelyik érinti a koordinátasíkokat, és illeszkedika P(1; 1; 4)
pontra.
Legyen a gömb középpontja K(u; v; w), sugara r! Ha a P(1; 1; 4) pont illeszkedik a gömbre, akkor e gömb csak az első
síknyolcadban lehet. Mivel érinti a koordinátasíkokat, ezért u = v = w = r (10.86. ábra).
10.86. ábra

A gömb egyenlete tehát (x – r)2 + (y – r)2 + (z – r)2 = r2. Behelyettesítve a P pont koordinátáit:

Tehát egyetlen olyan gömb van, mely áthalad a P ponton, és érinti a koordinátasíkokat; e gömb egyenlete

Megjegyzés. Talán meglepő, hogy csak egyetlen gömböt kaptunk eredményül; szemléletünk azt sugallhatná, hogy
két megoldása lesz a feladatnak, ahogyan a síkbeli esetben is két megoldás adódott. Gondoljuk meg: ha egy
végtelenül pici sugarú gömböt (mely érinti a koordinátasíkokat) folyamatosan nagyítunk az origóból, akkor minden
olyan gömbhöz eljutunk, mely ebben a térnyolcadban van és érinti a koordinátasíkokat. Az így keletkező gömbök
burkolója egy végtelen kúppalástot határoz meg, mely palást érinti a koordinátasíkokat. Így a kúppalást és a
térnyolcad közötti térrész pontjain egyetlen olyan gömb sem haladhat át, mely érinti a koordinátasíkokat; a
kúppalást pontjain egyetlen ilyen érintő gömb halad át, míg a kúppalást belső pontjain két olyan gömb halad át, mely
érinti a koordinátasíkokat (10.87. ábra).

10.87. ábra

A továbbiakban megemlítünk még néhány másodrendű felületet. Mielőtt ezekkel megismerkednénk, de niáljuk a
térbeli merőleges a nitást.

Legyen adott egy S sík és egy k > 0 valós szám. Merőleges a nitásnak nevezzük azt a térbeli transzformációt, mely az
adott sík pontjait helyben hagyja, s a tér bármely P pontjához a következő P′ pontot rendeli: ha P-ből S-re állított
merőleges talppontja T, akkor P′T :PT = k.

Az S síkot az a nitás alapsíkjának, a k > 0 valós számot pedig az a nitás arányának nevezzük. Egy alakzat pontjainak

a n képe az alakzat pontjaihoz rendelt pontok halmaza. A 10.88. ábrán a P pontnak arányú a n képét
szemléltettük az S síkra vonatkozóan.

10.88. ábra

Ha k < 1, akkor az a nitás az S sík irányában történő zsugorítást („összenyomást”) jelent, ha pedig k > 1, akkor
széthúzást.
Ha olyan merőleges a nitást alkalmazunk egy felületre, melynek alapsíkja az xy koordinátasík, és aránya k, akkor a
felület a n képének pontjaira teljesül, hogy x és y koordinátái változatlanok maradnak, z koordinátája pedig értékre
változik.

Megjegyzés. Néha megengedjük az a nitás arányának a k < 0 valós számot is. Ilyenkor a |k| arányú a nitást még
egy S síkra való tükrözés is követi.

Forgásparaboloid
Forgásparaboloid úgy származtatható, ha egy parabolát tengelye körül körbeforgatunk. Legyen a p paraméterű

tengelyponti parabola az xz koordinátasíkban; ekkor egyenlete .


Forgassuk körbe e parabolát a z tengely körül! Egy P(x; y; z) pont akkor és csak akkor van rajta a kapott felületen, ha a P

pont az eredeti parabola F fókuszpontjától ugyanolyan távolságra van, mint a síktól (10.89. ábra).

10.89. ábra

Ezek szerint .

ahonnan, a forgásparaboloid egyenlete


Ha a forgásparaboloidra alkalmazunk egy olyan merőleges a nitást, melynek alapsíkja tartalmazza a forgástengelyt,
akkor általánosabb elliptikus paraboloidot kapunk. Ha a z tengelyű tengelyponti forgásparaboloidra alkalmazzuk a
megfelelő a nitást, akkor a keletkező elliptikus paraboloid egyenlete

ahol az a és b 0-tól különböző értékeket az a nitás aránya határozza meg.


Ha két parabola tengelyének iránya megegyezik, síkjaik merőlegesek egymásra, és az egyik parabolát úgy mozgatjuk,
hogy tengelypontja a másik parabolát írja le, akkor elliptikus paraboloidot kapunk, és minden elliptikus paraboloid
előállítható ilyen módon (10.90. ábra).

10.90. ábra

Ha két parabolát úgy mozgatunk, hogy tengelyeik iránya ellentétes, síkjaik merőlegesek egymásra, és az egyik parabola
tengelypontja a másik parabolát írja le, akkor a kapott felület neve hiperbolikus paraboloid (nyeregfelület) (10.91. ábra).

10.91. ábra

Ha megfelelő koordináta-rendszert választunk, akkor a hiperbolikus paraboloid egyenlete


A hiperbolikus paraboloid minden pontján áthalad két olyan egyenes, melyet a felület teljes egészében tartalmaz. Így a
hiperbolikus paraboloid vonalfelület, ami azt jelenti, hogy valamely egyenes megfelelő mozgatásával az egész felület
származtatható. Az ilyen egyeneseket a hiperbolikus paraboloid alkotóinak nevezzük.

Forgásellipszoid
A forgásellipszoidot úgy származtatjuk, hogy az ellipszist körbeforgatjuk valamelyik tengelye körül. Ha az xy
koordinátasíkban levő a és b féltengelyű tengelyponti ellipszist forgatjuk körbe a nagytengelye körül (10.92. ábra), akkor a
kapott forgásellipszoid egyenlete

10.92. ábra

Alkalmazzunk egy merőleges a nitást, melynek alapsíkja az xy koordinátasík, aránya pedig . Ekkor általános

ellipszoidhoz jutunk (10.93. ábra), melynek egyenlete .

10.93. ábra

Amennyiben a = b = c, akkor az ellipszoid természetesen a sugarú gömbbe megy át. Ez egyben azt is jelenti, hogy az
általános ellipszoidot úgy is származtathatjuk, hogy egy gömbre alkalmazunk egymás után két merőleges síkra vonatkozó
merőleges a nitást.

Forgáshiperboloid
A forgáshiperboloidot úgy származtatjuk, hogy a hiperbolát valamelyik tengelye körül körbeforgatjuk. Ha a hiperbolát a
képzetes tengelye körül forgatjuk körbe, akkor a forgáshiperboloidot egyköpenyűnek (egypalástú) nevezzük (10.94. ábra),
ha a hiperbolát a valós tengelye körül forgatjuk körbe, akkor kétköpenyű hiperboloidnak (kétpalástú) nevezzük (10.95.
ábra).
Ha a forgáshiperboloidra alkalmazunk egy olyan merőleges a nitást, melynek alapsíkja tartalmazza a hiperboloid

forgástengelyét, akkor általános hiperboloidhoz jutunk. Ha az a nitás aránya , alapsíkja az xz koordinátasík,


akkor valós tengelye az x tengely, képzetes tengelye a z tengely. Ekkor a hiperboloid egyenlete: egyköpenyű:

, kétköpenyű: .
Az egyköpenyű hiperboloid egy fontos tulajdonsága, hogy – a hiperbolikus paraboloidhoz hasonlóan – bármely pontján
áthalad két olyan egyenes, melyet a hiperboloid tartalmaz. Ezeket az egyeneseket a hiperboloid alkotóinak mondjuk. Ez azt
jelenti tehát, hogy az egyköpenyű hiperboloid vonalfelület.
10.94. ábra

10.95. ábra

Másodrendű kúpfelület
A másodrendű kúpot úgy származtatjuk, hogy egy ellipszis (vagy kör) középpontjában az ellipszisre (körre) merőlegest
állítunk, és e merőleges valamely (a középponttól különböző) pontját összekötjük az ellipszis (kör) pontjaival (10.96. ábra).

10.96. ábra

Megfelelő koordinátatengelyt választva a másodrendű kúp egyenlete

Minden másodrendű kúp vonalfelület.

Példák
1.
Az egyenletű másodrendű kúpfelületet elmetszük a síkkal. Mi lesz a keletkezett
síkmetszet (10.97. ábra)?
10.97. ábra

Helyettesítsük a sík egyenletét a kúpfelület egyenletébe; azt kapjuk:

A kapott egyenletet még így is írhatjuk:

Eredményül egy olyan, a síkban levő ellipszist kaptunk, melynek nagy és kis féltengelye az eredeti
ellipszis nagy és kis féltengelyének a fele. Az eredmény természetesen nem meglepő, hiszen az eredeti ellipszist a

koordináta-rendszer kezdőpontjából arányban kicsinyítve éppen az eredményben leírt ellipszishez jutunk.


2.
Egy forgásellipszoid egyenlete . A forgásellipszoidba olyan kockát írunk, melynek csúcsai
illeszkednek a felületre. Mekkora e kockának a felszíne? A kocka egy testátlójának végpontjai illeszkednek az x = y
= z egyenesre (10.98. ábra).

10.98. ábra

Ezt behelyettesítve az ellipszoid egyenletébe azt kapjuk: ahonnan 49x2 = 36, tehát

. A kapott érték a kocka élének a fele, vagyis a kocka éle , így felszíne:

3.
Egy egyköpenyű hiperboloid egyenlete . Egy egyenes egyenletrendszere .
Számítsuk ki az egyenes és a hiperboloid közös pontjainak a távolságát!
Tekintsük a 10.99. ábrát! A hiperboloid és az egyenes M1 és M2 közös pontjainak meghatározásához először
térjünk át az egyenes egyenletrendszerében paraméteres egyenletrendszerre. Az egyenes egyenletrendszeréből: x
= 2t, y = t, z = t + 1. Helyettesítsük ezeket az értékeket a hiperboloid egyenletébe; azt kapjuk:

, azaz t2 – 2t – 2 = 0. E másodfokú egyenlet gyökei:


10.99. ábra

A t paraméterre kapott értékekkel a metszéspontok koordinátái:

A döféspontok távolsága:

Térbeli polárkoordináták
Ahogyan a sík pontjait síkbeli polárkoordinátákkal is jellemezhettük, ugyanígy a tér pontjait is egyértelműen megadhatjuk
térbeli polárkoordinátákkal is. Legyen a P pont merőleges vetülete az xy koordinátasíkon T, legyen α a TO egyenesnek az x
tengely pozitív félegyenesével bezárt szöge, legyen a PO egyenesnek a z tengellyel bezárt szöge φ, és végül legyen a P
pontnak az origótól való távolsága r! Ekkor a P(r; α; φ) rendezett adathármassal egyértelműen megadhatjuk bármely térbeli
pont helyzetét (10.100. ábra).

10.100. ábra

A TOP és TOQ derékszögű háromszögek segítségével könnyen találhatunk összefüggést a P pont x, y, z koordinátái,
valamint a P pont polárkoordinátái között.
11. Lineáris algebra
A lineáris algebra egyik fontos kiindulópontjának tekinthetjük azt az észrevételt, hogy a Descartes-féle koordináta-
rendszerben a sík vektorai számpárokkal, míg a tér vektorai számhármasokkal jellemezhetők. Sőt, ezzel a jellemzéssel a
vektorok körében értelmezett műveleteket kényelmesen el is végezhetjük, ugyanis a számmal való szorzás, illetve
összeadás komponensenként történik: az (a, b) koordinátájú vektor t-szerese a (ta, tb) koordinátájú vektor, illetve az (a, b)
és (c, d) koordinátájú vektorok összege az (a + c, b + d) koordinátájú vektor. (Minderről részletesebben a 8. fejezetben
olvashatunk.)
Ez az egyszerű észrevétel kínálja a lehetőséget arra, hogy „magasabb dimenziós” vektorokról is beszélhessünk, amiket
már nem iránnyal és hosszúsággal jellemezhető geometriai objektumként képzelünk el, hanem mint véges sok
koordinátából álló számsorozatokat kezelünk. Rögzített dimenzió, azaz koordinátamennyiség mellett a vektorok körében
bevezetett két műveletet továbbra is el tudjuk végezni, koordinátánként tudunk egy vektort számmal szorozni, illetve két
vektort összeadni. Ezzel az általánosítással a vektorok jelentősége már nem annyira geometriai, mint inkább algebrai:
elsősorban a lineáris (elsőfokú) egyenletrendszerek vizsgálatánál játszanak fontos szerepet, de a matematika sok más
területén is jelen vannak.
A modern lineáris algebra aztán tovább bővíti a vektor fogalmát minden olyan matematikai rendszer elemeire, ahol
valamilyen módon értelmezni tudjuk a számmal való szorzást és az összeadást, illetve ahol erre a két műveletre teljesülnek
bizonyos – a vektorműveletektől elvárható – tulajdonságok (lásd a 11.3. fejezetet). Ebben a formában a lineáris algebra
viszonylag „új” tudomány – az absztrakt vektortér fogalmát Peano vezette be 1888-ban –, a lineáris algebra eszköztárának
bizonyos elemeit azonban már évszázadokkal korábban is használták. A Gauss-eliminációs módszert háromismeretlenes
egyenletrendszerek megoldására az időszámítás előtti kínai kultúrában is ismerték (Gauss maga 1800 körül dolgozta ki a
később róla elnevezett módszert), a determinánsok számolása pedig az 1600-as évek végére nyúlik vissza, ismereteink
szerint Seki Kowa japán matematikus és Leibnitz használták először munkáikban a determináns fogalmát. A mátrixok
precíz bevezetése egészen az 1800-as évek közepéig várt, és hamarosan komoly elméletük alakult ki, leginkább Cayley
munkásságának köszönhetően, igaz, kimondatlanul már Lagrange is használt mátrixokat – mint kettős indexeléssel
ellátott változórendszereket – a XVIII. század végén.
A XX. században további bővülésen ment át a vektorok, illetve a vektorterek fogalma abban az értelemben, hogy a
„számok” alatt (amikkel a vektorokat szorozhatjuk) már nem feltétlenül kell valós számokat értenünk, hanem inkább
skalárokról beszélünk, amik egy olyan matematikai rendszer elemei lehetnek, amely bizonyos értelemben a valós számok
halmazához hasonló tulajdonságokkal rendelkezik. (Lásd bővebben a 12. fejezetben a testekről szóló részt.) Ebben a
fejezetben viszont a könnyebb érthetőség kedvéért ettől az általánosítástól eltekintünk, és csak valós vektorokkal, illetve
vektorterekkel foglalkozunk, tehát a skalárral való szorzás mindig egy valós számmal való szorzást fog jelenteni. Mielőtt
rátérnénk az absztrakt vektorterek vizsgálatára, először az eszköztárral ismerkedünk meg: mátrixokkal,
determinánsokkal és lineáris egyenletrendszerekkel.

11.1. Mátrixok és determinánsok


11.2. Lineáris egyenletrendszerek
11.3. Vektorterek
11.4. Lineáris leképezések
11.5. Bilineáris függvények
11.6. Euklideszi terek

Ajánlott irodalom

11.1. Mátrixok és determinánsok

Egy m×n méretű valós mátrix valós számoknak m sorba és n oszlopba rendezett, zárójelek közé foglalt táblázata.

Hasonlóan de niálhatjuk a komplex mátrixokat is, sőt, bármely adott H halmaz felett is de niálhatunk mátrixokat,
mint az adott halmaz elemeiből álló téglalap alakú táblázatokat. (Többnyire elvárás, hogy a halmaz elemeit lehessen
összeadni, illetve szorozni, és ez azért fontos, hogy a mátrixokon is bizonyos műveleteket értelmezhessünk.) Ebben a
fejezetben viszont a könnyebb érthetőség kedvéért csak valós mátrixokkal foglalkozunk. Egy m×n méretű valós mátrix
általános alakja tehát
Kisebb alakú mátrixoknál természetesen elkerülhető az indexelés, használhatunk különböző betűket a mátrix
elemeire, például egy 2 × 3-as mátrix általános alakja

Nagyobb (vagy határozatlan) méretű mátrix elemeit pedig úgy indexeljük, hogy a kettős index első tagja utal a
sorszámra és a második tagja az oszlopszámra. Az A mátrix i-edik sorában és j-edik oszlopában álló elemre használjuk az
(A)ij jelölést, illetve fordítva, az aij elemekből összerakott m×n méretű mátrix jelölése (aij)m×n.

Mátrixműveletek
Oszlopvektorok algebrája
Determináns
Invertálható mátrixok
Mátrixok rangja
Speciális mátrixok

Mátrixműveletek
A valós mátrixokkal elvégezhetünk bizonyos műveleteket: transzponálás, számmal szorzás, összeadás és szorzás, ez utóbbi
kettő azonban nem végezhető el bármely két mátrixszal. Az A + B mátrixösszeg akkor és csak akkor létezik, ha az A és B
mátrixok mérete ugyanaz, az A·B mátrixszorzat létezésének a feltétele pedig, hogy az A mátrix oszlopainak a száma
megegyezzen a B mátrix sorainak a számával. (Másképp fogalmazva: az A mátrix sorainak a hossza egyenlő kell, hogy
legyen a B mátrix oszlopainak a hosszával.)

Az A = (aij)m×n mátrix transzponáltja az az n × m méretű mátrix, aminek az i-edik sorában a j-edik elem aji. Jelölése:
AT.

A transzponált mátrix sorai megegyeznek az eredeti mátrix oszlopaival, illetve az oszlopai megegyeznek az eredeti
mátrix soraival.
Egy mátrixot valós számmal úgy szorzunk, hogy a mátrix minden elemét szorozzuk ugyanazzal a számmal:

Ha az A és B mátrixok mérete megegyezik, akkor az összegüket az egyes pozíciókban elvégzett összeadással képezzük:

Ezt a három műveletet röviden úgy foglalhatjuk össze, hogy (AT)ij = (A)ji, (cA)ij = c(A)ij, és (A + B)ij = (A)ij + (B)ij. Ha pedig
az A mátrix mérete m × n, és a B mátrix mérete n × k, akkor az A·B szorzat egy m × k méretű mátrix, amiben az i-edik sor j-
edik eleme az A mátrix i-edik sorának és a B mátrix j-edik oszlopának a skaláris szorzata:
Tehát az A mátrix i-edik sorában és a B mátrix j-edik oszlopában az egymásnak megfelelő elemeket összeszorozzuk (az
első elemet az elsővel, a másodikat a másodikkal stb.), és végül ezeket a szorzatokat összeadjuk. A gyakorlatban ez úgy
végezhető el kényelmesen, hogy az A mátrix jobb felső sarkát és a B mátrix bal alsó sarkát egymáshoz illesztjük, a
szorzatmátrixot pedig az A-tól jobbra lévő és a B alatti helyre számoljuk ki. Ekkor az A·B mátrix mindegyik elemét a vele
vízszintesen egy vonalban lévő A-beli sor és a vele függőlegesen egy vonalban lévő B-beli oszlop határozza meg.

Példa. Számítsuk ki az és a mátrixok szorzatát!


A szorzat létezik, mert az A mátrix oszlopainak a száma, illetve a B mátrix sorainak a száma egyaránt három.
Továbbá az A·B mátrix mérete 2 × 4, mivel az A mátrixnak két sora és B mátrixnak négy oszlopa van. Tehát összesen 8
pozíció értékét kell kiszámolnunk, például az első sor első eleme az A mátrix első sorából és a B mátrix első
oszlopából (AB)11 = 3·1 + (–1) · 2 + 6·3 = 19, az első sor második eleme az A mátrix első sorából és a B mátrix második
oszlopából (AB)12 = 3·0 + (–1) – 1+6·2 = 11, stb. Az eredmény

Érvényesek az alábbi műveleti tulajdonságok, ahol c és d valós számokat, míg A, B és C mátrixokat jelölnek (és az
egyenlőségek úgy értendők, hogy ha legalább az egyik oldaluk értelmezhető, akkor a másik oldal is létezik, és a két oldalon
ugyanaz a mátrix szerepel):
- A + B = B+A és ( A + B) + C = A + (B + C),
- c(A + B) = cA + cB és (c + d)A = cA + dA,
- c(AB) = (cA)B = A(cB),
- (A + B)C = AC+BC és A(B + Q = AB+AC,
- (AB)C = A(BC),
- (cA)T = cAT, (A + B)T = AT + BT és (AB)T = BTAT.
Rögzített m és n pozitív egészek mellett ℝm×n jelöli az m×n méretű valós mátrixok halmazát. A műveletek de níciói
alapján ez a halmaz zárt az összeadásra és a számokkal való szorzásra. Egy speciális eleme az m×n méretű nullmátrix
(jelölése 0m×n, vagy egyszerűen csak 0), aminek minden eleme nulla. Ezzel a mátrixszal c0 = 0 és A + 0 = A bármely c valós
szám, illetve (egy ugyanolyan méretű) A mátrix mellett. A nullmátrixokon kívül kitüntetett szerepe van a négyzetes
egységmátrixoknak. Ezekben a főátló – a bal felső sarkot a jobb alsó sarokkal összekötő átló – mindegyik eleme 1, és a

főátlón kívüli elemek mindegyike 0. Az n × n méretű egységmátrix: .


Egy egységmátrixszal való szorzás – amennyiben a méretek alapján elvégezhető – nem változtat az eredeti mátrixon,
azaz bármely m×n méretű A mátrixra A·En = A és Em · A = A.

Oszlopvektorok algebrája
Speciális típusú mátrixok a sorvektorok, illetve az oszlopvektorok, amiknek a mérete 1 × n, illetve m × 1 valamilyen n vagy
m pozitív egész számmal. Tehát az előbbiek egyetlen sorból, míg az utóbbiak egyetlen oszlopból állnak. Az m hosszúságú
oszlopvektorok halmazára ℝm×1 helyett egyszerűen az ℝm jelölést használjuk. Mint már említettük, ez a halmaz zárt az
összeadásra és a valós számmal való szorzásra, így e két műveletnek bármely kombinációjára is: ha v1, v2, ...,vk mind ℝm-
beli oszlopvektorok, és c1, c2, ..., ck valós számok, akkor c1v1 + c2v2 + ... + ckvk szintén egy ℝm-beli oszlopvektor.

A v1; v2, ..., vk oszlopvektorok lineáris kombinációi azok az oszlopvektorok, amik előállíthatok c1v1 + c2v2 + ... + ckvk
alakban alkalmas c1, c2, ...,ck együtthatókkal.

Speciálisan a csupa 0 koordinátából álló nullvektor – amit 0m vagy egyszerűen 0 jelöl – oszlopvektorok bármely
rendszerének lineáris kombinációja, mivel előáll úgy, ha mindegyik oszlopvektor együtthatóját 0-nak választjuk.

A v1; v2, ...,vk oszlopvektorok lineárisan függetlenek, ha a 0 vektor csak oly módon állítható elő c1v1+c2v2 +... +ckvk
alakban, hogy mindegyik ci együttható 0. Ellenkező esetben az adott oszlopvektorok lineárisan összefüggőek.

Az egy oszlopvektorból álló {v} halmaz akkor és csak akkor lineárisan összefüggő, ha v = 0, egy legalább kéttagú
vektorrendszer pedig pontosan akkor lineárisan összefüggő, ha valamelyik tagja előáll a többi lineáris kombinációjaként.
Sorvektorok körében a lineáris kombináció, illetve a lineáris függetlenség fogalma ugyanígy értelmezhető. Könnyen
átgondolható, hogy sorvektoroknak egy rendszere pontosan akkor lineárisan független, ha a sorvektorok transzponáltjai
mint oszlopvektorok egy lineárisan független rendszert alkotnak az oszlopvektorok körében.

Példa. Állapítsuk meg, hogy az ℝ3-beli vektorok lineárisan függetlenek-e!


A kérdés az, hogy az au + bv + cw = 0 vektoregyenlet megoldható-e úgy, hogy az a, b és c számok nem mind nullák. Az
egyenlet bal oldalán szereplő vektor

ezért tulajdonképpen a egyenletrendszer lehetséges megoldásait keressük. A második


egyenletből b = –2a, ezt az első, illetve a harmadik egyenletbe helyettesítve egyaránt a 3a = 2c összefüggéshez jutunk.
Így az a szám tetszőleges értéke mellett b = –2a és c = 3a/2 az egyenletrendszernek és a vektoregyenletnek egyaránt
egy megoldását szolgáltatja. Például az a = 2 választással azt kapjuk, hogy 2u – 4v + 3w = 0, tehát a három megadott
vektor lineárisan összefüggő.

Determináns
Négyzetes mátrixok determinánsának a bevezetéséhez szükségünk van a permutációk, illetve azok inverziószámának a
fogalmára. Egy tetszőleges halmaz permutációján annak egy önmagába történő kölcsönösen egyértelmű leképezését
értjük. Például az {1, 2, ..., n} halmaznak egy permutációja egy olyan τ függvény, amivel a τ(1), τ(2), ...,τ(n) számsorozat az 1,
2, .., n számoknak egy átrendezése. (Ezért szokás a permutációkat néha átrendezéseknek is tekinteni.) Az {1, 2, ..., n} halmaz
egy τ permutációjának az inverziószáma azoknak az (i, j) számpároknak a száma, amikre i < j és τ(i) > τ(j). Az inverziószám
tehát azt adja meg, hogy az átrendezésből hány olyan számpár választható ki, amiben a nagyobb tényező megelőzi a
kisebbiket. Ha ez az inverziószám páros, akkor τ egy páros permutáció, ha pedig az inverziószám páratlan, akkor τ egy
páratlan permutáció.

Példa. Az 1, 2, 3, 4, 5 számok 3, 1, 5, 4, 2 átrendezése arra a τ permutációra utal, amivel τ(1) = 3, τ(2) = 1, τ(3) = 5, τ(4) = 4
és τ(5) = 2. Ekkor az átrendezés inverzióban levő párjai (3, 1), (3, 2), (5, 4), (5, 2) és (4, 2), tehát τ inverziószáma 5, és így τ
egy páratlan permutáció.

Az n×n méretű A = (aij) mátrix determinánsa:

ahol σ az {1, 2, ..., n} halmaz összes permutációján végigfut, és I(σ) jelöli a σ permutáció inverziószámát.

A determinánst jelöli, ha a mátrixot függőleges vonalak közé rakjuk:


Egy 1×1-es mátrix determinánsa egyszerűen a mátrix egyetlen eleme: ha A = (a), akkor det(A) = a. Egy 2 × 2-es vagy 3 × 3-
as determináns is könnyen kiszámolható:

Tehát egy 2 × 2-es determináns a főátló elemeinek a szorzatából kivonva a mellékátló elemeinek a szorzata, egy 3 × 3-as
determináns kiszámolásához pedig pozitív előjellel vesszük a főátló és eltoltjainak az elemeiből vett szorzatokat (aei, bfg,
cdh), és negatív előjellel vesszük a mellékátló és eltoltjainak az elemeiből vett szorzatokat (ceg, afh, bdi). Nagyobb méretű
determinánsok esetében sajnos már nem támaszkodhatunk ilyen egyszerű szabályokra, bizonyos speciális mátrixok
determinánsai azonban könnyen kiszámolhatók.

Egy négyzetes mátrix felső-háromszögmátrix, ha a főátló alatt mindegyik eleme nulla, illetve alsó-háromszögmátrix,
ha a főátló felett mindegyik eleme nulla. Egy négyzetes mátrix diagonális, ha a főátlón kívül mindegyik eleme nulla.

Tehát egy A = (aij)n×n mátrix felső-háromszögmátrix, ha i > j esetén aij = 0; alsó-háromszögmátrix, ha i < j esetén aij = 0,
illetve diagonális mátrix, ha i ≠ j esetén aij = 0.

Egy felső-háromszögmátrix, illetve egy alsó-háromszögmátrix determinánsa egyenlő a főátlóbeli elemek szorzatával.

Egy általános négyzetes mátrix determinánsának a kiszámolása mindig visszavezethető egy felső-háromszögmátrix
determinánsára, de mielőtt erre rátérünk, felsoroljuk a determinánsok alaptulajdonságait (ezek természetesen kizárólag
négyzetes mátrixokra vonatkoznak):
- Ha egy mátrix valamely sorában minden elem 0, akkor a determináns nulla.
- Ha egy mátrix valamely sorát egy c számmal végigszorozzuk, akkor a determináns is a c-szeresére változik.
- Ha egy mátrix két sora egyenlő, illetve ha az egyik sora egy másik sor számszorosa, akkor a mátrix determinánsa nulla.
- Ha egy mátrix két sorát felcseréljük, akkor a determináns a negatívjára változik.
- Ha egy mátrix egyik sorában minden tagot összegre bontunk, akkor a determinánsa is két determináns összegére bontható:
az egyikben az adott sor tagjainak az első tényezői, míg a másikban az adott sor tagjainak a második tényezői állnak.
- Ha egy mátrix egyik sorához egy másik sor számszorosát hozzáadjuk, a determináns nem változik.
- A fenti tulajdonságok mindegyike sorok helyett oszlopokra is igaz.
- Egy mátrix determinánsa megegyezik a transzponáltjának a determinánsával.
Egy tetszőleges négyzetes mátrixból kiindulva, abból elemi sorátalakításokkal (sorok cseréje, sor szorzása egy nullától
különböző számmal, illetve egy sor számszorosának a hozzáadása egy másik sorhoz) eljuthatunk egy felső-
háromszögmátrixhoz, miközben nyomon követhetjük a determináns alakulását. Ezután a kapott háromszögmátrix
determinánsából vissza tudunk következtetni az eredeti mátrix determinánsára.

Példa. Elemi sorátalakításokkal hozzuk felső-háromszögmátrix alakra az adott mátrixot:

Az első sorból vonjuk ki a másodikat, hogy a bal felső sarokba 1-et kapjunk, ezután az első sor kétszeresét vonjuk ki a
második sorból, illetve az ötszörösét a harmadik sorból:

Végül a második sor 4,5-szeresét kivonjuk a harmadik sorból, és az eredmény . Mivel egyik
elvégzett sorátalakítással sem változott a determináns, az eredeti mátrix determinánsa az eredményül kapott
háromszögmátrix determinánsával egyenlő: det(A) = 1 · (–2) · 27,5 = –55. Természetesen ugyanezt az eredményt a már
korábban említett képletből is megkaphatjuk:
Nagyobb méretű mátrixok esetében a determináns kiszámítása általában sokkal gyorsabb a felső-háromszögmátrix
alakra hozással, mint a de níció képletének alkalmazásával.

Determinánsok számolását elvégezhetjük a determinánskifejtés szabályának (esetenként halmozott) alkalmazásával


is. Ennek a lényege, hogy egy adott determináns kiszámolása visszavezethető kisebb méretű determinánsokra. Ahhoz,
hogy ezt az eljárást megértsük, szükségünk van az aldetermináns fogalmára.

Az n×n méretű A = (aij) mátrix i-edik sorának és j-edik oszlopának az elhagyásából kapott (n–1) × (n–1)-es determináns (–
1)i+j-vel vett szorzatát Aij jelöli, ez az (i, j) pozícióhoz tartozó előjeles aldetermináns.

Legyen A egy n×n méretű mátrix, továbbá i és j egész számok az [1, n] intervallumban! Ekkor az A mátrix
determinánsának az i-edik sor, illetve a j-edik oszlop szerinti kifejtése:

illetve

Ferde kifejtésről beszélünk, amennyiben egy adott sor (illetve oszlop) elemeit egy másik sorhoz (illetve oszlophoz)
tartozó előjeles aldeterminánsokkal szorozzuk, ilyenkor az eredmény mindig nulla. Tehát ha i ≠ l, akkor

és ha j ≠ l, akkor

Példa. Számítsuk ki az mátrix determinánsát!


Érdemes a determinánst a harmadik oszlop szerint kifejteni, ugyanis ekkor a négy tényezőből kettő nulla. Tehát
det(A) = a13A13 + a23A23 + a33A33 + a43A43 = 0·A13 + 2·A23 + + 3·A33 + 0·A43. Ebből a 3 × 3-as aldeterminánsokat a már
ismertetett módokon kiszámíthatjuk:

Így det(A) = 2·(–3) + 3·3 = 3.

Invertálható mátrixok

Egy n×n méretű négyzetes A mátrix invertálható, ha van olyan szintén n×n méretű B mátrix, amivel AB = En és BA =
En. Ekkor az A és B mátrixok inverzei egymásnak.

Nincs minden négyzetes mátrixnak inverze, de ha van, akkor az egyértelmű (azaz minden mátrixnak legfeljebb egy
inverze lehet). Az invertálható A mátrix inverzét A–1 jelöli.

Egy n×n méretű négyzetes A mátrix pontosan akkor invertálható, ha det(A)≠0.

Egy invertálható n×n -es mátrix inverzének a kiszámítására konkrét képlet is van:
Tehát A–1 = (1/det(A)) Ā, ahol az Ā mátrix i-edik sorában és j-edik oszlopában lévő elem az eredeti mátrix fordított
indexelésű előjeles aldeterminánsa: (Ā)ij = Aji.
Ezek után egy négyzetes mátrix hatványait a következőképp értelmezhetjük:
- Ha k pozitív egész, akkor Ak = A·A·... ·A (k tényezős szorzat).
- A0 = En, ahol n×n az A mátrix mérete.
- Ha A invertálható mátrix, és k egy pozitív egész, akkor A–k = A–1 · A–1·... ·A–1 (k tényezős szorzat).

Példa. Számítsuk ki az mátrix inverzét!


A mátrix determinánsa det(A) = 2, előjeles aldeterminánsai pedig

A fentebb említett képlet alapján

Mátrixok rangja
Visszatérve tetszőleges méretű mátrixokra, a lineáris függetlenség és a determináns fogalmának ismeretében
de niálhatjuk bármely mátrix rangját.

Egy mátrix oszloprangja az oszlopaiból kiválasztható lineárisan független oszlopvektor-rendszerek maximális


elemszáma. Egy mátrix sorrangja a soraiból kiválasztható lineárisan független sorvektor-rendszerek maximális
elemszáma.

Tehát ha a mátrix oszlopaiból kiválasztható k darab független oszlopvektor, de k + 1 már nem, akkor az oszloprang k.
Ha pedig a sorokból választható ki l darab független sorvektor, de l + 1 már nem, akkor a sorrang l.

Egy mátrix determinánsrangja a sorok és oszlopok elhagyásával kapott invertálható részmátrixok maximális mérete.

Tehát ha a mátrix alkalmas sorainak és oszlopainak az elhagyásával kaphatunk egy r×r méretű invertálható mátrixot,
de egy (r + 1) × (r + 1) méretű invertálható mátrixot már nem kaphatunk, akkor a determinánsrang r.

Bármely mátrix oszloprangja, sorrangja és determinánsrangja megegyezik.


Ezt a számot nevezzük a mátrix rangjának.

Az A mátrix rangját r(A) jelöli.

Speciális mátrixok
Néhány speciális mátrixtípust érdemes még megemlítenünk, egyelőre csak a de níciók szintjén.

Egy négyzetes A = (aij) mátrix szimmetrikus, ha szimmetrikus a főátlójára nézve, azaz minden (i, j) indexpárra aji = aij
Az A = (aij) négyzetes mátrix ferdén szimmetrikus, ha minden (i, j) indexpárra aji = –aij.

Tehát egy A mátrix szimmetrikus, ha AT = A, és ferdén szimmetrikus, ha AT = –A.


Egy valós négyzetes A mátrix ortogonális, ha A és AT egymásnak inverzei, azaz ATA = E és AAT = E. Egy valós négyzetes
A mátrix normális, ha felcserélhető a transzponáltjával, azaz AAT = ATA.

Egy szimmetrikus mátrix számszorosa is mindig szimmetrikus, illetve egy ferdén szimmetrikus mátrix számszorosa
mindig ferdén szimmetrikus. Két azonos méretű szimmetrikus mátrixnak az összege is szimmetrikus, a szorzatuk viszont
már nem feltétlenül az. Konkrétabban annyi igaz, hogy ha A és B mindketten n×n méretű szimmetrikus mátrixok, akkor az
A·B szorzat akkor és csak akkor szimmetrikus, ha A és B a szorzásra nézve felcserélhetőek, azaz A·B = B·A. Hasonlóan, két
azonos méretű ferdén szimmetrikus mátrix összege is ferdén szimmetrikus, és ha ezen kívül a szorzásra nézve
felcserélhetőek, akkor a szorzatuk egy szimmetrikus mátrix. Továbbá egy páratlan méretű ferdén szimmetrikus mátrix
determinánsa mindig nulla.
Egy ortogonális mátrix számszorosai közül csak saját maga és a –1-szerese ortogonális, és a determinánsa csak 1 vagy –1
lehet. Két azonos méretű ortogonális mátrix összege nagyon ritkán lesz ismét ortogonális, viszont két azonos méretű
ortogonális mátrix szorzata mindig egy ortogonális mátrixot eredményez.

11.2. Lineáris egyenletrendszerek


Az n ismeretlenből és m egyenletből álló lineáris egyenletrendszer általános alakja

(11.1)

ahol x1, x2, ..., xn az ismeretlenek, és az aij együtthatók, valamint a bi konstansok adott valós számok. Az egyenletrendszer
együtthatómátrixa, illetve kibővített együtthatómátrixa:

Az egyenletrendszer egy megoldása alatt olyan behelyettesítési értékek megadását értjük, amivel a fenti egyenlőségek
mindegyike igaz. Az egyenletrendszer általános megoldása pedig az, hogyha az összes megoldást megadjuk, esetenként egy
vagy több szabadon választható paraméter segítségével. A megoldások számát illetően háromféle eset lehetséges: vagy
nincs megoldás, vagy pontosan egy megoldás van, vagy pedig végtelen sok megoldás létezik, és azt, hogy egy adott
egyenletrendszernél melyik eset áll fenn, a kibővített együtthatómátrix vizsgálatával meg tudjuk állapítani.

A Gauss-eliminációs módszer
Homogén egyenletrendszerek
Lineáris egyenletrendszerek többféle alakja
Cramer-szabály

A Gauss-eliminációs módszer
Két egyenletrendszer ekvivalens, ha ugyanazok a megoldásaik. Egy adott egyenletrendszerrel ekvivalens
egyenletrendszert kapunk, ha a következő elemi átalakítások valamelyikét vagy ezek bármely kombinációját hajtjuk végre:
- Két egyenletet felcserélünk.
- Ha az egyik egyenletben az összes együttható és a jobb oldalon álló konstans nulla, akkor azt az egyenletet elhagyjuk.
- Az egyik egyenletet végigszorozzuk egy nullától különböző valós számmal.
- Az egyik egyenlethez hozzáadjuk egy másik egyenlet számszorosát.
Ez utóbbi átalakítás úgy értendő, hogy ha (11.1) egyenletrendszer i-edik egyenletéhez hozzáadjuk a j-edik egyenlet c-
szeresét, akkor az eredmény

A fenti elemi átalakításokkal a kibővített együtthatómátrix a következőképp változik:


- Két sort felcserélünk.
- Egy csupa nulla sort elhagyunk.
- Az egyik sort végigszorozzuk egy nullától különböző valós számmal.
- Az egyik sorhoz hozzáadjuk egy másik sor számszorosát.
Ezekkel az elemi átalakításokkal tetszőleges mátrix (így speciálisan az egyenletrendszerek kibővített
együtthatómátrixa is) mindig egy olyan mátrix alakra hozható, amiben minden sor első nem nulla eleme 1 – ezt hívjuk a sor
vezéregyesének –, továbbá a második sortól kezdve minden sor vezéregyese az előző sor vezéregyesétől jobbra helyezkedik
el. Az ilyen mátrix az eredeti mátrix lépcsős alakja. A lépcsős alak pedig tovább alakítható egy ún. redukált lépcsős alakra,
ahol minden vezéregyes oszlopában az összes többi elem nulla. A lépcsős, illetve a redukált lépcsős alakból rögtön
kiolvasható az eredeti mátrix rangja.

Bármely mátrix rangja megegyezik a (redukált) lépcsős alakjában szereplő vezéregyesek számával.

Példa. Az alábbi egyenletrendszer kibővített együtthatómátrixát hozzuk redukált lépcsős alakra:

A kibővített együtthatómátrix: Az első sor vezéregyesét például úgy kaphatjuk meg, hogy

az első és a második sort felcseréljük: de azt is tehettük volna, hogy az első sorból
kivonjuk a harmadik sor kétszeresét, vagy az első sort végigosztjuk 5-tel. (Ez utóbbi csak azért nem praktikus, mert
azzal törtszámok kerülnek a mátrixba, és ez a további számolásokat igencsak megnehezítené.) Ezután az első oszlop
többi elemét kinullázzuk úgy, hogy a második és a harmadik sorból kivonjuk az első sor ötszörösét, illetve

kétszeresét, a negyedik sorhoz pedig hozzáadjuk az első sor kétszeresét: . Itt


észrevehetjük, hogy a második sort érdemes 7-tel végigosztani (azaz 1/7-del végigszorozni), ugyanis minden tagja a 7-

nek többszöröse. Az állás ekkor . Ahhoz, hogy a második sor vezéregyesét megkapjuk,
ismét több lehetőség közül választhatunk, például szorozhatjuk a sort 3-mal, majd hozzáadhatjuk az utolsó sort.

Ekkor a kapott mátrix . A következő lépésben az új vezéregyes oszlopában nullázzuk ki a


többi elemet, a második sor 3-szorosát hozzáadjuk az első sorhoz, 13-szorosát kivonjuk a harmadik sorból, illetve a 8-

szorosát hozzáadjuk a negyedik sorhoz: . Most osszuk el a harmadik sort –4-gyel, és a kapott

új sor háromszorosát vonjuk ki az utolsó sorból: .Végül elhagyhatjuk a csupa nullából álló
utolsó sort, illetve kinullázzuk a harmadik vezéregyes oszlopának a többi elemét azzal, hogy az első sorból kivonjuk a

harmadikat. Az eredmény a redukált lépcsős alak: .

A redukált lépcsős alak kiszámításához a legegyszerűbb általános stratégia az, amit az előbbi példában is követtünk:
először az első sor vezéregyesét rögzítjük, majd ennek a segítségével kinullázzuk a vezéregyes oszlopának a többi elemét,
ezután a második sor vezéregyesét hozzuk létre, és így tovább. Felülről lefelé haladva, az alkalmazható elemi átalakítások
valamilyen kombinációjával létrehozzuk a sorok vezéregyeseit, majd mindegyik vezéregyes oszlopában az adott vezéregyes
segítségével minden más elemet kinullázunk. Ez a módszer a Gauss-elimináció (Gauss-kiküszöbölés).
A kibővített együtthatómátrix redukált lépcsős alakjából már egyenesen kiolvasható az eredeti egyenletrendszer
általános megoldása, illetve az, hogy az egyenletrendszer egyáltalán megoldható-e.
A megoldhatóság azon múlik, hogy a redukált lépcsős alaknak az utolsó oszlopában van-e vezéregyes. Ha igen, akkor ez
azt jelenti, hogy annak a vezéregyesnek a sorában minden más elem nulla, tehát a sor (0 0 ··· 0 | 1) alakú, ez pedig ahhoz az
egyenlethez tartozik, miszerint 0x1 + 0x2 + · · · + 0xn = 1. Az ilyen egyenletnek (ahol az összes ismeretlen együtthatója nulla,
az egyenlet jobb oldalán pedig egy nullától különböző szám áll) nyilván nincs megoldása, és így akkor az eredeti
egyenletrendszernek sincs.
Amennyiben a redukált lépcsős alak utolsó oszlopában nincs vezéregyes, akkor az egyenletrendszer megoldható, és a
megoldások száma attól függ, hogy van-e az utolsó oszlopon kívül minden más oszlopban vezéregyes: ha igen, akkor
pontosan egy megoldás létezik, ha pedig nem, akkor végtelen sok megoldása van az egyenletrendszernek. Mivel – mint már
említettük – a vezéregyesek száma a mátrix rangjával egyenlő, az egyenletrendszer megoldhatóságát az alábbi tételben is
öszszefoglalhatjuk.

Egy egyenletrendszer pontosan akkor oldható meg, ha az együtthatómátrixának a rangja megegyezik a kibővített
együtthatómátrixának a rangjával. Ebben az esetben, ha ez a rang egyenlő az ismeretlenek számával, akkor a megoldás
egyértelmű, ha pedig kisebb az ismeretlenek számánál, akkor végtelen sok megoldás van.

A (11.1) egyenletrendszer xi ismeretlene egy szabad változó, ha a kibővített együtthatómátrix redukált lépcsős
alakjában az i-edik oszlop nem tartalmaz vezéregyest.

Egy egyenletrendszer általános megoldását a kibővített együtthatómátrix redukált lépcsős alakjának soraiból felírt
egyenletek szolgáltatják. Konkrét megoldásokat pedig úgy kaphatunk, hogy a szabad változók értékeit tetszőlegesen
megválasztjuk, majd a többi ismeretlen értékét ezen egyenletek alapján számoljuk ki.

Példa. Írjuk fel az előző példában szereplő egyenletrendszer általános megoldását, majd adjunk meg három
különböző konkrét megoldást!

A kibővített együtthatómátrix redukált lépcsős alakja , az ebből kapott egyenletek pedig:

. Tehát x3 egy szabad változó, és az általános megoldás: x1 = 2 + 3x3, x2 = 1 – x3 és x4 = 7. Konkrét


megoldásokat kaphatunk például az x3 = –1, 0, 1 választásokkal: (x1; x2, x3, x4) = (–1, 2, –1, 7), (2, 1, 0, 7), illetve (5, 0, 1, 7).
Természetesen végtelen sok megoldás létezik, mivel x3 értéke tetszőlegesen megválasztható.

A Gauss-eliminációs módszer alkalmazható invertálható négyzetes mátrixok inverzeinek a kiszámítására.

Ha A egy n×n méretű invertálható mátrix, akkor az (A | E) mátrix redukált lépcsős alakja (E | A–1), ahol E az n×n méretű
egységmátrixot jelöli.

Homogén egyenletrendszerek

Egy lineáris egyenletrendszer homogén, ha mindegyik egyenletében a konstans tag nulla.

Tehát egy homogén lineáris egyenletrendszer általános alakja

Ilyenkor mindig van legalább egy megoldás: x1 = x2 = ... = xn = 0. Természetesen előfordulhat, hogy végtelen sok
megoldás van, attól függően, hogy az ismeretlenek közt szerepel-e szabad változó. Például ha egy homogén
egyenletrendszerben az ismeretlenek száma nagyobb, mint az egyenletek száma, akkor biztosan végtelen sok megoldás
létezik, ugyanis ilyenkor garantált, hogy a redukált lépcsős alakban nem jut minden oszlopra egy vezéregyes.

Lineáris egyenletrendszerek többféle alakja


Egy lineáris egyenletrendszer többféle formában is felírható mátrixok, illetve oszlopvektorok segítségével. A (11.1) egyenlet
például ekvivalens az alábbi vektoregyenlettel:

A megoldhatóság tehát attól függ, hogy az

jelölésekkel előállítható-e a b oszlopvektor az a1, a2, ..., an oszlopvektorok lineáris kombinációjaként. Amennyiben igen,
úgy a felhasznált együtthatók az eredeti (11.1) lineáris egyenletrendszernek egy megoldását adják.
A (11.1) lineáris egyenletrendszer továbbá ekvivalens az A · x = b mátrixegyenlettel is, ahol A az egyenletrendszer
együtthatómátrixa, x ∈ ℝn és b ∈ ℝm pedig az ismeretlenekből, illetve a konstans tagokból szerkesztett oszlopvektorok:

A lineáris egyenletrendszereknek egy speciális esete, amikor az ismeretlenek száma megegyezik az egyenletek
számával, és az együtthatómátrix invertálható. Ekkor az egyenletrendszernek garantáltan egy megoldása van, amit a már
ismertetett Gauss-eliminációs módszeren kívül más úton is megkaphatunk. Például ha az egyenletrendszerrel ekvivalens A
· x = b egyenlet mindkét oldalát balról szorozzuk az A együtthatómátrix inverzével: A–1 · (A·x) = A–1·b, ennek az egyenletnek
a bal oldalán pedig A–1 · (A · x) = (A–1 · A) · x = E · x = x. Így – amennyiben az együtthatómátrix inverzét ismerjük – a megoldás
egyetlen mátrixszorzásból megkapható: x = A–1·b.

Példa. Oldjuk meg az alábbi egyenletrendszert:

Az egyenletrendszerrel ekvivalens mátrixegyenlet: , az együtthatómátrix inverzét már egy

korábbi példában kiszámoltuk, azt az eredményt felhasználva . A megoldás:


y = –8, z = 10 és w = 5.

Cramer-szabály
Ugyancsak a négyzetes együtthatómátrix esetére vonatkozik a Cramer-szabály. Az n ismeretlent és n egyenletet tartalmazó

egyenlet együtthatómátrixát jelölje A, és a k = 1, 2,..., n számokhoz legyen Ak az a mátrix, amit úgy kapunk, hogy az A
mátrix k-adik oszlopát kicseréljük a bi konstansok által alkott oszlopra. Tehát

A Cramer-szabály szerint:

Ha det(A) ≠ 0, akkor az egyenletrendszernek pontosan egy megoldása van, amikor is minden k-ra xk = det(Ak)/det(A).
Ha det(A) = 0, és legalább az egyik k-ra det(Ak) ≠ 0, akkor az egyenletrendszernek nincs megoldása.

A Cramer-szabály nem mond semmit arra az esetre, amikor A, A1 A2, ...,An mind nulla determinánsú mátrixok.

Példa. Az előbbi példában vizsgált egyenletrendszert oldjuk meg a Cramer-szabály segítségével!


Az egyenletrendszer, az együtthatómátrixa, illetve a konstansok oszlopvektora tehát

Mint már korábban kiszámoltuk, det(A) = 2, az A1, A2 és A3 mátrixok determinánsai pedig:

11.3. Vektorterek

Valós vektortérnek nevezünk egy V halmazt a rajta értelmezett összeadás (+) művelettel és valós számokkal való
szorzással együtt, ha a következő axiómák teljesülnek:
1. Minden v, w ∈ V esetén v+w ∈ V.
2. Tetszőleges u, v, w ∈ V elemekre (u + v) + w = u + (v + w).
3. Tetszőleges v, w ∈ V elemekre v + w = w + v.
4. Van egy 0 ∈ V elem, amivel minden v ∈ V elemre 0 + v = v.
5. Minden v ∈ V elemhez van olyan w ∈ V, amivel v + w = 0.
6. Minden v ∈ V és a valós szám esetén a · v ∈ V.
7. Tetszőleges v ∈ V elemre és a, b valós számokra a · (b · v) = (a · b) · v.
8. Tetszőleges v ∈ V elemre és a, b valós számokra (a + b) · v = a · v + b · v.
9. Tetszőleges v, w ∈ V elemekre és a valós számra a · (v + w) = a · v + a · w.
10. Tetszőleges v ∈ V elemre 1 · v = v.
Egy (valós) vektortér elemeit vektoroknak nevezzük.

Ebben a fejezetben csak valós vektorterekről lesz szó, de a komplex vektortereket (aminek az elemeit tetszőleges
komplex számmal lehet szorozni) is ugyanígy értelmezhetjük. Sőt, tetszőleges test (lásd a 12. fejezetet) felett is
de niálhatunk vektortereket.
A fenti axiómák közül az első és a hatodik csak azt a követelményt fogalmazzák meg, hogy egy vektortér legyen zárt az
összeadásra és számmal való szorzásra. A második axiómában a zárójelezés az összeadások elvégzésének a sorrendjére utal,
és az axióma szerint mindegy, hogy először az u + v összeget vesszük, és ehhez adjuk hozzá a w vektort, vagy pedig az u
vektorhoz adjuk hozzá a v+w összeg eredményét. Ebből a tulajdonságból levezethető, hogy tetszőlegesen hosszú
vektorösszegnél is elhagyható a zárójelezés, ugyanis az egyes összeadások elvégzésének a sorrendje nem változtat a
végeredményen. Ez az asszociatív tulajdonság.
A harmadik axióma a kommutatív tulajdonság: egy összeg tagjai felcserélhetőek, és ez az előbbi axiómával együtt már
azt eredményezi, hogy egy akárhány tagú összegben is tetszőlegesen felcserélhetőek a tagok anélkül, hogy az eredmény
változna.
A negyedik axióma a nullvektor létezését írja elő, az ötödik pedig azt, hogy minden vektornak legyen negatívja
(ellentettje). Bár az axiómákban nincs külön megfogalmazva, viszont levezethető, hogy egy vektortérben csak egy
nullvektor létezik, illetve minden vektornak pontosan egy negatívja van. Egy v vektor negatívját –v jelöli.
A hetedik axióma szerint akkor sincs szükség zárójelezésre, ha egy vektort több számmal szorzunk egymás után.
Viszont szükséges a zárójelezés, ha egy összeget szorzunk (összegvektort számmal vagy számösszeget vektorral). A
nyolcadik és kilencedik axiómák erről az esetről szólnak: összeggel való szorzás esetén elvégezhetjük a szorzást külön-
külön az összeg tényezőivel, és itt szintén levezethető, hogy ez a szabály (amit disztributív tulajdonságnak nevezünk)
akárhány tagú öszszeggel való szorzásra is vonatkozik.
A kivonás mint művelet nem szerepel az axiómákban, azonban kényelmi okokból érdemes bevezetni: a v és w vektorok
különbsége v – w = v + (–w).
Az axiómákból bizonyos alapvető tulajdonságok gyorsan levezethetők:
- Tetszőleges v ∈ V vektorra 0 · v = 0, és tetszőleges a számra a · 0 = 0. Fordítva, ha egy a számmal és v vektorral a · v = 0, akkor
vagy a = 0, vagy v = 0.
- Tetszőleges v, w ∈ V vektorokra –1 · v = –v, –(–v) = v, (–v) + (–w) = –(v + w) és –(v–w) = –v+w.
- Tetszőleges u, v, w ∈ V vektorokra és a ≠ 0 számra az u + v = u + w, illetve az a · v = a · w egyenlőségek bármelyikéből
következik v = w.
Néhány közismertebb példa vektorterekre:
- Bármely m pozitív egészhez az m hosszú valós oszlopvektorok ℝm halmaza, a már ismert összeadás és számmal való szorzás
műveletekkel.
- Bármely m és n pozitív egészekhez az m×n méretű valós mátrixok ℝm×n halmaza a már bevezetett összeadás és számmal
való szorzás műveletekkel.
- Az origóból kiinduló síkvektorok halmaza a szokásos összeadással és számmal való szorzással.
- Az origóból kiinduló térvektorok halmaza a szokásos összeadással és számmal való szorzással.
- A valós együtthatós polinomok ℝ [x] halmaza a 4. fejezetben bevezetett együtthatónkénti összeadással és számmal való
szorzással.
- A valós számokon értelmezett függvények a szokásos függvényösszeadással és számmal való szorzással. ((f+g)(t) = f(t) + g(t)
és (cf)(t) = c · f((t).)
- A valós számsorozatok a tagonkénti összeadással, illetve a számmal való tagonkénti szorzással.
- A komplex számok a szokásos műveletekkel.

Alterek
Speciális vektorrendszerek, lineáris függetlenség
Dimenzió
Bázistranszformációk

Alterek

A V vektortér egy W részhalmaza altér V-ben, ha maga is vektortér a V-ben értelmezett műveletekkel. Ennek a
kapcsolatnak a jelölése: W ≤ V.

Minden vektortérnek altere saját maga, illetve a nullvektorból álló egyelemű {0} halmaz. További tipikus példa altérre,
ha egy rögzített v vektor összes számszorosát vesszük: W = {a · v | a ∈ ℝ}. Ez a v vektor által generált altér, a jelölése: 〈v〉.
Egy V vektortér W részhalmaza pontosan akkor altér, ha tartalmazza a nullvektort, bármely elemével együtt annak az
összes számszorosát is, illetve bármely két elemével együtt azoknak az összegét is. Néhány tipikus példa:
- Azon ℝn-beli oszlopvektorok halmaza, amiknek az első koordinátája nulla. Általánosabban: rögzített 1≤i≤n mellett azon ℝn-
beli oszlopvektorok halmaza, amiknek az i-edik koordinátája nulla.
- Azon ℝn-beli oszlopvektorok halmaza, amiknek a koordinátaösszege nulla.
- A síkvektorok (vagy térvektorok) vektorterében egy adott egyenessel párhuzamos vektorok halmaza a nullvektorral együtt.
- A térvektorok vektorterében egy adott, origót tartalmazó sík vektorai.
- Tetszőleges nem negatív egész n mellett a valós polinomok ℝ [x] vektorterében a legfeljebb n-edfokú polinomok a konstans
nulla polinommal együtt.
- A valós polinomok ℝ [x] vektorterében azok a p(x) polinomok, amikre p(1) = 0. (Ez a példa az 1 helyett tetszőleges valós
számmal egy alteret szolgáltat.)
- A valós függvények vektorterében azok az f(x) függvények, amikre f(1) = 0. (Ez a példa is ugyanúgy egy alteret ad, ha az 1
helyett egy másik valós számot választunk.)
- A valós függvények vektorterében a polinomfüggvények.
- A valós függvények vektorterében a páros függvények, illetve a páratlan függvények.
- Tetszőleges pozitív egész mellett az n×n méretű valós mátrixok ℝn×n vektorterében a szimmetrikus, illetve a ferdén
szimmetrikus mátrixok halmaza.

Egy V vektortér v1, v2, ..., vn vektorainak a lineáris kombinációi a c1v1 + c2v2 + ... + cnvn alakú vektorok, ahol c1, c2,...,
cn tetszőleges valós számok.
Speciálisan a nullvektor egy lineáris kombinációja bármely vektorrendszernek, mert megkaphatjuk úgy, hogy az
együtthatókat mind 0-nak választjuk.
Adott H ⊆ V nem üres vektorhalmaz mellett a H-beli vektorok összes lehetséges lineáris kombinációi egy alteret
alkotnak V-ben, ez a H halmaz által generált altér, a jelölése: 〈H〉. (A H halmaz lehet végtelen, azonban a vektoraiból
alkotott lineáris kombinációk csak véges összegek lehetnek.) Ez az altér a „legkisebb” H-t tartalmazó V-beli altér abban az
értelemben, hogy bármely H-t tartalmazó W altér automatikusan tartalmazza a H által generált alteret is. Másképp
fogalmazva, ha egy W altér tartalmazza a V vektortér vl5 v2, ..., vn vektorait, akkor azoknak tetszőleges c1v1 + c2v2 + ... +
cnvn lineáris kombinációja is W-ben van.
Az üres halmaz által generált altér az egyelemű triviális {0} altér. Amennyiben H = {v} egy egyelemű halmaz, akkor
〈 〉 〈〉 〈 〉 〈 〉
H = v = {cv| c ∈ ℝ}, ha H = {v, w} egy kételemű halmaz, akkor H = v, w = {av + bw | a, b ∈ ℝ}, stb.
Ha U és W két altere a V vektortérnek, akkor U ∩ W szintén egy altér V-ben, az uniójuk által generált altér pedig U ∪ 〈

W = U + W = {u + w | u ∈ U, w ∈ W}. (Két altér uniója csak abban az esetben lehet ismét altér, ha az egyikük tartalmazza a
másikat.) Az U + W alteret az U és W alterek összegének nevezzük, illetve direkt összegének abban az esetben, ha U ∩ W =
{0}. A direkt összeg jelölése: U⊕W. Ha egy V vektortér U és W altereinek a metszete {0}, akkor az U⊕W direkt összeg
minden vektora pontosan egyféleképpen állítható elő egy U-beli vektor és egy W-beli vektor összegeként.

Példa. Az ℝ3 vektortérben a 0 koordinátaösszegű vektorok egy alteret alkotnak, ami nem más, mint az é

vektorok által generált altér. Ugyanis e két vektor tetszőleges lineáris

kombinációjában a koordinátaösszeg c + (d–c) + (–d) = 0, és fordítva, ha egy vektor koordinátaösszege nulla:

a + b + c = 0, akkor c = –a–b és , tehát benne van a két vektor által generált

altérben. Jelöljük ezt az alteret U-val, és legyen továbbá W az vektor által generált altér! Megmutatjuk, hogy
ℝ3 = U⊕W.

Először is, a két altér metszete csak a nullvektort tartalmazza. Ugyanis ha akkor a + b + c = 0, másrészt ha

, akkor az vektornak számszorosa, ami pedig csak akkor lehet, ha a = b = c. Így viszont az a + b + c

= 0 és a = b = c egyenlőségekből következik, hogy a = 0, b = 0, c = 0, és . Beláttuk tehát, hogy U W = {0}, a


két altér összege így egy direkt összeg. Viszont tetszőleges ℝ3-beli vektor előáll (pontosan egyféleképpen) egy U-beli

és egy W-beli vektor összegeként: , ez pedig azt jelenti, hogy U + V = ℝ3.

Speciális vektorrendszerek, lineáris függetlenség

Egy V vektortér v1, v2, ..., vn vektoraiból álló halmaz generátorrendszer V-ben, ha minden V-beli vektor előáll mint a
v1, v2, ..., vn vektorok lineáris kombinációja.

A lineáris függetlenséget ugyanúgy de niáljuk, mint azt tettük korábban az oszlopvektorok körében:

Egy V vektortér v1, v2, ..., vn vektorai lineárisan független rendszert alkotnak, ha a 0 vektor csak oly módon állítható
elő c1v1 + c2v2 + ... + cnvn alakban, hogy mindegyik ci együttható 0. Ellenkező esetben az adott vektorok rendszere
lineárisan összefüggő.

A lineáris függetlenséget, illetve összefüggőséget végtelen vektorrendszerekre is lehet értelmezni aszerint, hogy az
adott rendszer egy alkalmas véges részrendszeréből előállítható-e a 0 vektor nem triviális lineáris kombinációval. (A „nem
triviális” lineáris kombináción az értendő, hogy legalább az egyik vektor előtt nem nulla együttható áll.)
Az egy vektorból álló {v} halmaz akkor és csak akkor lineárisan összefüggő, ha v = 0, egy legalább kéttagú
vektorrendszer pedig pontosan akkor lineárisan összefüggő, ha valamelyik tagja előáll a többi lineáris kombinációjaként.

Egy V vektortér vektoraiból álló {v1, v2, ..., vn} rendezett halmaz bázis V-ben, ha lineárisan független
generátorrendszer.

Minden vektortér tartalmaz bázist. Egy bázis segítségével nemcsak, hogy minden vektor felírható lineáris
kombinációként, hanem ez a felírás mindig egyértelmű (azaz pontosan egyféleképpen tehető meg). Így egy rögzített bázis
szerint a vektortér vektorai koordinátázhatóak: ha ugyanis B = {v1, v2,..., vn} egy bázisa a V vektortérnek és v ∈ V, akkor
pontosan egy olyan c1, c2, ..., cn (valós számokból álló) együttható-sorozat van, amivel c1v1 + c2v2 + ... + cnvn = v. Az ezekből
az együtthatókból készített n hosszú oszlopvektor – amit [v]B jelöl – a v vektor B bázis szerinti koordinátavektora. Könnyen
átgondolható, hogy tetszőleges B bázis, v, w vektorok és c valós szám mellett igazak a következő egyenlőségek:

Egy vektortérnek általában végtelen sok bázisa van, bizonyos vektorterekben azonban vannak kitüntetett szerepű
bázisok. Például az ℝn vektortér kanonikus bázisa:

Tehát az ei vektor az n×n méretű egységmátrix i-edik oszlopa: az i-edik koordinátája 1, a többi koordinátája pedig 0.
Ezzel a bázissal tetszőleges oszlopvektor könnyen előállítható lineáris kombinációként:

Ugyancsak egy természetes bázist alkotnak a legfeljebb n-edfokú valós polinomok vektorterében az 1, x, x2,..., xn
polinomok.

Példa. Az (3 vektortérben jelöljük W-vel a 0 koordinátaösszegű vektorok alterét, ebben a és


vektorok egy bázist alkotnak, mivel lineárisan függetlenek és – mint azt korában már igazoltuk – generálják W-t. A

vektor eleme W-nek, így előállítható a B = {v1, v2} bázisból, konkrétan v = 2v1 – 3v2. Így a v vektor B

szerinti koordinátavektora: . Általánosabban, egy W-beli vektor (a + b + c = 0)

koordinátavektora , mivel .

Az n hosszúságú oszlopvektorok ℝn vektorterében egy adott vl5 v2,..., vm vektorrendszerről determinánsszámolással is


eldönthető, hogy bázist alkotnak-e ℝn-ben:

Az (n-beli v1, v2, ..., vm vektorok rendszere akkor és csak akkor bázis ℝn-ben, ha m = n, és a vektorokból mint
oszlopokból összerakott n×n méretű mátrix determinánsa nem nulla.

A lineárisan független vektorrendszerek, a generátorrendszerek, illetve a bázisok közötti összefüggéseket az


alábbiakkal összegezhetjük:
- Minden lineárisan független vektorrendszer kiegészíthető bázissá. Így ha v1, v2, ..., vk lineárisan független vektorok egy V
vektortérben – és önmagukban még nem alkotnak bázist –, akkor alkalmas vk+1, ..., vn vektorok hozzávételével kaphatunk
egy v1, v2,..., vn bázist. (Előfordulhat viszont, hogy végtelen sok vektorral kell a rendszert kiegészíteni.)
- Minden generátorrendszer tartalmaz egy bázist. Tehát egy V vektortér tetszőleges generátorrendszeréből – ha az nem egy
bázis már önmagában – elhagyható egy vagy több vektor úgy, hogy a maradék egy bázist alkosson V-ben.
- Egy generátorrendszer elemszáma mindig legalább akkora, mint egy lineárisan független rendszer elemszáma. Így ha a V
vektortérben v1, v2, ..., vm egy generátorrendszer, és w1, w2, ..., wk lineárisan független vektorok, akkor m ≥ k.
Az első két állítást magába foglalja az alábbi tétel:

Ha a V vektortérnek a G részhalmaza egy generátorrendszer, és az F részhalmaza egy független rendszer, akkor F


kiegészíthető G-beli elemekkel egy bázissá.

(Ebből a tételből az első állítás a G = V, a második állítás pedig az F = Ø választással következik.)


A harmadik állítás pedig a kicserélési tétel egyenes következménye, miszerint:

Ha a V vektortérben v1, v2, ..., vm egy generátorrendszer, és w1, w2, ...,wk lineárisan független vektorok, akkor ez
utóbbi rendszerből bármely wi vektort elhagyva található a generátorrendszernek egy olyan vj vektora, amivel a w1,
w2,..., wi–1, vj, wi+1, ..., wk vektorrendszer továbbra is független.

Ha B1 és B2 két bázis ugyanabban a vektortérben, akkor mivel mindketten lineárisan független generátorrendszerek, a
fenti tételek alapján |B1| ≥ |B2| és |B2| ≥ |B1| egyaránt teljesül, így |B1| = |B2|.

Egy vektortér bármely két bázisának az elemszáma megegyezik.

Dimenzió

Egy V vektortér dimenziója a bázisainak az elemszáma (illetve számossága, végtelen bázisok esetén). Ezt a számot
dim(V) jelöli.

Egy vektortér tehát lehet véges vagy végtelen dimenziós attól függően, hogy benne egy bázis véges vagy végtelen
elemszámú. Minden pozitív egész n-hez létezik n-dimenziós vektortér, például az n hosszúságú valós oszlopvektorok ℝn
tere. A valós polinomok ℝ [x] vektortere végtelen dimenziós, a legfeljebb n-edfokú valós polinomok vektortere pedig n + 1
dimenziós. (Ez utóbbiban az 1, x, x2,..., xn polinomok egy n + 1 elemű bázist alkotnak, az előbbiben pedig az összes nem
negatív kitevőjű x-hatvány egy végtelen elemszámú bázist.)
Egy altér dimenziója sohasem lehet nagyobb az őt tartalmazó vektortér dimenziójánál, tehát W ≤ V esetén dim(W) ≤
dim(V). Itt a dimenziók közti egyenlőség csak akkor állhat fenn, ha W = V, vagy ha V végtelen dimenziós.
A triviális {0} vektortér dimenziója nulla, mivel ebben az üres halmaz egy bázis. Ha egy vektortér dimenziója egy,
akkor egy nullától különböző vektor generálja, tehát az egész vektortér egy nem nulla vektor számszorosaiból áll.
Általában egy n elemű vektorrendszer által generált altér dimenziója legfeljebb n, és pontosan akkor n, ha a rendszer
lineárisan független.
Ha egy V vektortér dimenziója n, akkor igazak a következő állítások:
- V-ben bármely valódi altér dimenziója kisebb, mint n.
- V-ben bármely lineárisan független vektorrendszer legfeljebb n elemű.
- V-ben bármely generátorrendszer legalább n elemű.
- V-ben bármely n elemű független rendszer egyben egy bázis.
- V-ben bármely n elemű generátorrendszer egyben egy bázis.
Két altér metszetének és összegének a dimenziója között van egy ismert összefüggés:

Speciálisan, ha V = U⊕W, akkor dim(V) = dim(U) + dim(W).

Bázistranszformációk
Ha B = {v1, v2, ...,vn} és B′ = {v′1, v′2, ...,v′n} két bázis egy V vektortérben, akkor tetszőleges v ∈ V vektor koordinátázható
mindkét bázis szerint, a kapott [v]B és [v]B''oszlopvektorok viszont általában nem ugyanazok. Azonban van köztük
összefüggés, megkaphatók egymásból olyan mátrixok segítségével, amik csak a B és a B′ bázisoktól függnek.

Legyen B = {v1, v2, ..., vn} és B′ = {v′1, v′2, ..., v′n} egy V vektortér két bázisa. A B → B′ báziscsere átmenetmátrixa a [v′1]B′
[v′2]B′..., [v′n]B oszlopokból összerakott n×n méretű mátrix.

Ha P jelöli a B → B′ báziscsere és Q jelöli a B′ → B báziscsere átmenetmátrixát, akkor P és Q inverzei egymásnak, továbbá


bármely v ∈ V vektorra [v]B′ = Q · [v]B = P–1 · [v]B, illetve [v]B = P · [v]B′ = Q–1 · [v]B′.
Amennyiben B′ = B, tehát a két bázis ugyanaz, akkor az átmenetmátrix az egységmátrix. Továbbá ha B, B′, B″ három
bázisa ugyanannak a vektortérnek, és P jelöli a B → B′ báziscsere, Q pedig a B′ → B″ báziscsere átmenetmátrixát, akkor a B →
B″ báziscsere mátrixa P · Q.
Egy speciális típusa a báziscserének az elemi bázistranszformáció, amikor is egy adott bázisnak csak az egyik tagját
cseréljük ki egy másik vektorra. Ha B = {v1, v2, ..., vn} egy bázis a V vektortérben, és v ∈ V egy további vektor, akkor – mint
már tudjuk – v előáll a bázisvektorok lineáris kombinációjaként: v = c1v1 + c2v2 + ... + cnvn valamilyen ci együtthatókkal.
Most tekintsük a B′ = {v1, ..., vt–1, v, vt+1,..., vn} vektorrendszert, amit egyszerűen úgy kapunk meg B-ből, hogy a vt vektort
lecseréljük v-re! Ez a B′ vektorrendszer pontosan akkor bázisa V-nek, ha a v = c1v1 + c2v2 + ... + cnvn előállításban ct ≠ 0.
Ekkor tetszőleges x = x1v1 + ... +xt_1vt_1 + xtvt+xt+1vt+1+ ... +xnvn az új, B′ bázis szerint felírva:

Tehát a koordinátavektorok az alábbi képlet szerint változnak:

Az alábbiakban egy példán illusztráljuk, hogy az elemi bázistranszformáció többszöri alkalmazásával hogyan lehet két
tetszőleges bázis közti átmenetmátrixot kiszámítani, illetve amint azt majd látni fogjuk, ez a módszer általában négyzetes
mátrixok inverzeinek a kiszámítására is alkalmazható.

Példa. Legyen B = {e1, e2, e3} a kanonikus bázis ℝ3-ban és , . elemi


bázistranszformáció alkalmazásával megmutatjuk, hogy B′ = v1, v2, v3} szintén egy bázisa ℝ3-nak, és egyben a B′ → B
báziscsere átmenetmátrixát is kiszámítjuk. Kezdetnek egy táblázatban összefoglaljuk az e1, e2, e3 és v1, v2, v3
vektorok koordinátáit a B bázis szerint:

e1 e2 e3 v1 v2 v3

e1 1 0 0 3 2 1

e2 0 1 0 5 4 1

e3 0 0 1 1 0 2

Első csereként az e1 bázisvektort lecseréljük v1-re (ezt megtehetjük, mert v1 előállításában e1 nem nulla együtthatóval
szerepel), és az elemi bázistranszformáció képletét követve kiszámítjuk az e1, e2, e3 és v1, v2, v3 vektorok új
koordinátáit:

e1 e2 e3 v1 v2 v3

v1 1/3 0 0 1 2/3 1/3

e2 –5/3 1 0 0 2/3 –2/3

e3 –1/3 0 1 0 –2/3 5/3


Második cserének az e2 bázisvektort cseréljük le v2-re, ez szintén megtehető, mert v2 aktuális előállításában e2 nem
nulla együtthatóval szerepel.

e1 e2 e3 v1 v2 v3

v1 2 –1 0 1 0 1

v2 –5/2 3/2 0 0 1 –1

e3 –2 1 1 0 0 1

Végül az e3 bázisvektort cseréljük le v3-ra:

e1 e2 e3 v1 v2 v3

v1 4 –2 –1 1 0 0

v2 –9/2 5/2 1 0 1 0

v3 –2 1 1 0 0 1

Mivel minden egyes elemi bázistranszformáció egy újabb bázist eredményez a táblázat bal szélső oszlopában, így B′ =
{v1, v2, v3} egy bázisa ℝ3-nak, a B′ → B báziscsere átmenetmátrixa pedig leolvasható:

Ez mellesleg a B → B′ báziscsere átmenetmátrixának az inverze (amit korábban már más úton is kiszámoltunk):

Az elemi bázistranszformáció első ránézésre kicsit körülményes műveletnek tűnik, azonban kis gyakorlás után már
nem több egy egyszerű rutinszámolásnál. Amikor az ei bázisvektort cseréljük a vj vektorra – amit akkor tehetünk meg, ha
az ei sorában és a vj oszlopában egy 0-tól különböző szám áll –, akkor először is ezzel a számmal osztjuk le az érintett sort,
míg vj. oszlopában a többi elem 0-ra változik. A táblázat többi rubrikájából pedig képzeletben húzunk egy függőleges és egy
vízszintes vonalat, amik valahol metszik ei sorát, illetve vj oszlopát. Az itt található számok szorzatát elosztjuk a már
említett kulcspozícióban (ei sorában és vj oszlopában) lévő számmal, majd a kapott hányadost vonjuk ki az adott rubrika
eredeti értékéből.

11.4. Lineáris leképezések

Egy φ: V → W leképezés lineáris leképezés a V és W valós vektorterek között, ha bármely V-beli u és v vektorokra,
illetve bármely c valós számra φ(u + v) = φ(u) + φ(v) és φ(cv) = cφ(v). Egy vektortér önmagába történő lineáris
leképezését lineáris transzformációnak nevezzük.

Egy φ: V → W lineáris leképezés a V-beli nullvektort a W-beli nullvektorba képezi le, azaz φ(0) = 0. A leképezés magtere,
Ker(φ) = {v ∈ V| φ (v) = 0} nemcsak egy részhalmaza V-nek, hanem mindig egy altér V-ben. A leképezés képtere, Im(φ) =
{φ(v) | v ∈ V} pedig egy altér W-ben. A képtér és a magtér dimenziói közötti összefüggés:

Az azonosan nulla leképezés (amikor is φ(v) = 0 minden V-beli v vektorra) egy lineáris leképezés bármely V
vektortérből tetszőleges W vektortérbe, ekkor Ker(φ) = V és Im(φ) = {0}.
Egy φ: V → W lineáris leképezés pontosan akkor szürjektív (ráképezés), ha Im(φ) = W, és pontosan akkor injektív, ha
Ker(φ) = {0}.

Egy kölcsönösen egyértelmű lineáris leképezés neve izomor zmus. Két vektortér izomorf, ha létezik köztük egy
izomor zmus.
Ha a V és W vektorterek izomorfak, azt V ≅ W jelöli.

Egy φ: V → W lineáris leképezés izomor zmus, ha Ker(φ) = {0} és Im(φ) = W.

Az izomor zmus egy ekvivalenciareláció a valós vektorterek halmazán, ugyanis két izomor zmus kompozíciója is
izomor zmus, egy izomor zmus inverze is izomor zmus, továbbá bármely vektortéren az identikus leképezés is egy
izomor zmus. Az ekvivalenciaosztályokat is pontosan meg tudjuk határozni:

Két valós vektortér akkor és csak akkor izomorf egymással, ha a dimenziójuk egyenlő.

Ez a tétel végtelen dimenziós vektorterek esetén úgy értendő, hogy két végtelen dimenziós vektortér akkor és csak
akkor izomorf, ha a dimenziójuk mint számosság egyenlő.
Néhány ismert példa lineáris leképezésekre:
- Ha A egy tetszőleges m×n méretű mátrix, akkor a φA: ℝn → ℝm, φA(v) = A · v leképezés lineáris, ugyanis bármely v, w ∈ ℝn
oszlopvektorok és c valós szám mellett

- Az előbbinél kicsit általánosabban, ha A egy tetszőleges m×n méretű mátrix és k egy pozitív egész, akkor a φ : (n×k → (n×k,
φ(M) = A·M leképezés lineáris.
- Tetszőleges c valós szám mellett az fc: ℝ [x] → ℝ, fc(p(x)) = p(c) behelyettesítés egy lineáris leképezés a valós együtthatós
polinomok vektorteréből az egydimenziós ℝ vektortérbe.
- Tetszőleges q(x) (nem konstans) valós együtthatós polinom mellett az a leképezés, ami egy p(x) polinomhoz hozzárendeli a
q(x)-szel vett maradékos osztásának a maradékát, egy lineáris leképezés ℝ [x]-ből a q(x)-nél kisebb fokú valós együtthatós
polinomok vektorterébe.
- A deriválás egy lineáris transzformációja az ℝ [x] vektortérnek, illetve a mindenütt akárhányszor di erenciálható valós
függvények vektorterének is.
- Tetszőleges n-dimenziós V vektortér és annak egy B = {v1, v2, ..., vn} bázisa mellett a B szerinti koordinátázás egy V → ℝn
izomor zmus.
Egy φ: V → W lineáris leképezést már egyértelműen meghatároznak egy rögzített V-beli bázison felvett értékei, azaz ha
B = {v1, v2, ..., vn} egy bázis V-ben, akkor φ(v1), φ(v2), ..., φ(vn) ismeretében bármely v ∈ V vektor φ(v) képe kiszámítható.
Ugyanis v előáll a bázisvektorok lineáris kombinációjaként: v = c1v1 + c2v2 + ... + cnvn valamilyen ci valós együtthatókkal,
ebből a felírásból pedig következik, hogy

Tehát φ(v) csak a v vektor B szerinti koordinátáitól, illetve a bázisvektorok képeitől függ.
A bázisvektorok képeire viszont semmilyen általános megkötés nincs. Ha a V vektortérnek B = {v1, v2, ..., vn} egy
bázisa, és w1, w2, ..., wn tetszőleges vektorok egy W vektortérben, akkor létezik (pontosan egy) olyan φ: V → W lineáris
leképezés, amivel φ(v1) = w1, φ(v2) = w2, ..., φ(vn) = wn. Ez a leképezés a

képlettel adható meg. Az így de niált φ: V → W lineáris leképezés képtere a w1, w2, ..., wn vektorok által generált W-beli
altér, tehát φ pontosan akkor ráképezés, ha w1, w2,..., wn egy generátorrendszere W-nek. Továbbá pontosan akkor
injektív, ha a w1, w2, ..., wn vektorok egy lineárisan független rendszert alkotnak W-ben.

Egy φ: V → W lineáris leképezés pontosan akkor izomor zmus, ha V-nek valamely B = {v1, v2, ..., vn} bázisa mellett a
φ(v1), φ(v2), ..., φ(vn) vektorok szintén egy bázist alkotnak W-ben.

Itt a „valamely” szó helyett a „minden” szót is használhatnánk, ugyanis ha a tétel állításában szereplő feltétel egy
bázisra teljesül, akkor már az összesre is.

Lineáris leképezések mátrixa


Műveletek lineáris leképezésekkel
Sajátvektorok és sajátértékek, karakterisztikus polinom
Diagonalizálható transzformációk
Minimálpolinom
Lineáris leképezések mátrixa
Ha dim(V) = n és S = {v1, v2, ..., vn} egy bázis V-ben, valamint dim(W) = m és T = {w1, w2, ..., wm} egy bázis W-ben, akkor a φ:
V → W lineáris leképezés S és T szerinti mátrixa az az m×n méretű mátrix, aminek az oszlopai a [φ(v1)]T, [φ(v2)]T, ...,
[φ(vn)]T koordinátavektorok. A mátrix jelölése T[φ]S. Ekkor bármely V-beli v vektorra igaz, hogy [φ(v)]T = T[φ]S · [v]S.
Természetesen más bázisok választása mellett a φ: V → W lineáris leképezés mátrixa is más lesz. Tegyük fel, hogy a
fenti S és T bázisok mellett S′ = {v′1, v′2, ..., v′n} és T′ = {w′1, w2,..., w′m} szintén bázisai V-nek, illetve W-nek. Legyen továbbá
P az S → S′ és Q a T → T′ báziscsere átmenetmátrixa. Ekkor T′ [φ]S′ = Q–1 ·T[φ]S·P.
Abban az esetben, amikor φ: V → V egy lineáris transzformáció, akkor φ-nek egy rögzített V-beli B = {v1, v2, ..., vn}
bázisa szerint is vehetjük a mátrixát, amit [φ]B jelöl, és aminek az oszlopai a [φ(v1)]B, [φ(v2)]B, ..., [φ(vn)]B
koordinátavektorok. Egy lineáris transzformáció mátrixa mindig négyzetes: ha dim(V) = n, akkor bármely φ: V → V
lineáris transzformáció mátrixa n×n méretű. Speciálisan az I: V → V identikus leképezés mátrixa (bármely bázis szerint) az
En egységmátrix.
Ha B′ = {v′1, v′2, ..., v′n} szintén egy bázis a V vektortérben, és P a B → B′ báziscsere átmenetmátrixa, akkor egy φ: V → V
lineáris transzformáció B, illetve B′ szerinti mátrixai közt az összefüggés: [φ]B′ = P–1 · [φ]B·P.

Egy φ: V → W lineáris leképezés tetszőleges bázispár szerinti mátrixának a rangja megegyezik a leképezés képterének a
dimenziójával. Speciálisan egy lineáris leképezés izomor zmus, ha a mátrixa egy nem nulla determinánsú négyzetes
mátrix.

Ezen a ponton érdemes megjegyezni, hogy egy φ: V → V lineáris transzformációra ekvivalensek a következő
tulajdonságok (azaz bármelyikből következik a többi):
1. φ egy izomor zmus,
2. Ker(φ) = {0},
3. Im(φ) = V,
4. bármely V-beli B bázissal a [φ]B mátrix invertálható (azaz nem nulla determinánsú).

Példa. Legyen V a legfeljebb másodfokú valós polinomok vektortere, ebben – mint már említettük – B = {1, x, x2} egy
bázis. A B′ = {(x–1)2, x2, (x + 1)2} vektorrendszer szintén egy bázis, és ezt a következő módon igazolhatjuk: a B′-beli

vektorok B szerinti koordinátáiból alkotott determinánsa –4 (a lényeg, hogy nem nulla), így a φ(1)
= (x–1)2, φ(x) = x2, φ(x2) = (x + 1)2 feltételekkel megadott φ:V → V lineáris transzformáció egy izomor zmus. Tehát B′,
mint a B bázis képe, szintén egy bázis. Egyben a fenti P mátrix a B → B′ báziscsere átmenetmátrixa, így tetszőleges
p(x) = ax2 + bx + c valós polinomra

Ez azt jelenti, hogy a p(x) polinom előállítása a B′ bázis vektoraiból:

Műveletek lineáris leképezésekkel


Lineáris leképezések kompozíciója szintén egy lineáris leképezés, ennek a mátrixa kifejezhető a kompozíció tényezőinek a
mátrixával. Ha φ: V → W és ψ: W → U lineáris leképezések és S, T, illetve Z ebben a sorrendben bázisok a V, W és U
vektorterekben, akkor Z[ψ ○ φ]S = Z[ψ]T·T[φ]S.
Rögzített V és W vektorterek mellett a V → W lineáris leképezések halmazát Hom(V, W) jelöli. (Ez a jelölés a
„homomor zmus” szóból ered, így nevezzük ugyanis az algebrai struktúrák közötti művelettartó leképezéseket. Erről a
fogalomról bővebben a 12. fejezetben olvashatunk.) A Hom(V, W) halmazon értelmezhetjük az összeadást és valós
számokkal való szorzást:
- A φ: V → W és ψ: V → W lineáris leképezések összege a (φ + ψ):V → W leképezés, amivel bármely v ∈ V vektorra (φ + ψ)(v) =
φ(v) + ψ(v).
- A c valós szám és a φ: V → W lineáris leképezés szorzata a (cφ):V → W leképezés, amivel bármely v ∈ V vektorra (cφ)(v) =
cφ(v).
Az így de niált műveletekkel Hom(V, W) egy vektortér. Ha V és W véges dimenziósak, akkor dim(Hom(V, W)) =
dim(V)·dim(W). Sőt, ha dim(V) = n, dim(W) = m és S, illetve T egy-egy bázisa V-nek és W-nek, akkor a φ → T[φ]S
megfeleltetés egy izomor zmus a Hom(V, W) és ℝm×n vektorterek között.
Sajátvektorok és sajátértékek, karakterisztikus polinom

Egy φ: V → V lineáris transzformációnak sajátvektora a v ∈ V vektor, ha v ≠ 0 és φ(v) = cv valamilyen c valós számmal.


Ekkor c a v vektorhoz tartozó sajátérték.

Ha φ: V → V egy lineáris transzformáció, és c egy tetszőleges valós szám, akkor a Vc = {v ∈ V | φ(v) = cv} halmaz egy
altér V-ben, ami tulajdonképpen nem más, mint a cI – φ lineáris transzformáció magtere, ahol I az identikus leképezést
jelöli. (Ugyanis a φ(v) = cv feltétel ekvivalens azzal, hogy (cI – φ)(v) = 0).) Amennyiben ez az altér legalább egydimenziós
(azaz tartalmaz a 0 vektoron kívül más vektort is), akkor c egy sajátértéke φ-nek, a Vc pedig a c-hez tartozó sajátaltér. Egy c
valós szám tehát akkor és csak akkor sajátértéke a φ: V → V lineáris transzformációnak, ha a cI – φ transzformáció
valamely B bázis szerinti [cI – φ]B mátrixa nulla determinánsú. Mivel [cI – φ]B = c[I]B – [φ]B = cE – [φ]B, ez a feltétel azt
jelenti, hogy a cE – [φ]B mátrix determinánsa nulla.

Egy n×n méretű A valós mátrix karakterisztikus polinomja kA(x) = det(xE–A), ahol E az n×n méretű egységmátrix.

Tehát ha

akkor

Ez egy n-edfokú normált polinom (azaz a főegyütthatója 1).

Egy lineáris transzformáció (valamely bázis szerinti) mátrixának a karakterisztikus polinomja független a bázis
választásától.

Ez azt jelenti, hogy ha S és T két különböző bázis a V vektortérben, és φ: V → V egy lineáris transzformáció, akkor a
[φ]S és [φ]T mátrixok karakterisztikus polinomja ugyanaz. Ez a φ transzformáció karakterisztikus polinomja:

Egy φ:V → V lineáris transzformáció karakterisztikus polinomja a transzformáció bármely bázis szerinti mátrixának
a karakterisztikus polinomja. Jelölése: kφ(x).

A karakterisztikus polinomból pedig meghatározhatók a sajátértékek.

Egy c valós szám akkor és csak akkor sajátértéke a φ: V → V lineáris transzformációnak, ha kφ(c) = 0, azaz c gyöke a
transzformáció karakterisztikus polinomjának.

Ebből már következik, hogy egy n-dimenziós vektortér lineáris transzformációinak legfeljebb n sajátértéke lehet.
Azonban a sajátérték létezése egyáltalán nem garantált: amennyiben a karakterisztikus polinomnak nincs valós gyöke, úgy
a lineáris transzformációnak sincs sajátértéke.
Egy adott sajátérték ismeretében a kapcsolódó sajátvektorok meghatározása már viszonylag egyszerű feladat, mivel
ezek cI – φ transzformáció magterének a nullától különböző vektorai. A gyakorlatban tehát úgy kaphatjuk meg a
sajátvektorokat, hogy rögzítünk egy V-beli B = {v1, v2, ..., vn} bázist, kiszámítjuk a φ: V → V lineáris transzformáció B
szerinti [φ]B mátrixát, majd megoldjuk a (cE – [φ]B) · x = 0 homogén lineáris egyenletrendszert. Amennyiben egy ℝn-beli d
oszlopvektor megoldása az egyenletrendszernek, akkor a koordinátáival alkotott V-beli v = d1v1 + d2v2 + ... + dnvn vektor
egy sajátvektora φ-nek.

Példa. Legyen φ: ℝ3 → ℝ3 az mátrixszal megadott v ↦ Av lineáris transzformáció. (Ennek a


transzformációnak az ℝ3-beli kanonikus bázis szerinti mátrixa éppen A.) Az A mátrix – és egyben a φ transzformáció
– karakterisztikus polinomja

A sajátértékek tehát ennek a polinomnak a zérushelyei: 2 és 4. Ahhoz, hogy a 2 sajátértékhez tartozó sajátvektorokat
megtaláljuk, a (2E–A)v = 0 egyenletet kell megoldanunk v-re:

Tehát a 2 sajátértékhez tartozó sajátvektorok azok a vektorok, amiknél az első és harmadik koordináta egymás
negatívjai (a nullvektor kivételével, ugyanis a de níció alapján a nullvektor nem számít sajátvektornak). A 4
sajátértékhez tartozó sajátvektorokhoz pedig a (4E–A)v = 0 egyenletet kell megoldanunk v-re:

Az a – c = 0, 2b – a – c = 0 és c – a = 0 feltételek akkor és csak akkor teljesülnek, ha a = b = c, így a 4 sajátértékhez tartozó


sajátvektorok azok a vektorok, amiknek mindhárom koordinátája ugyanaz a szám (megintcsak a nullvektor
kivételével). A sajátalterek:

Diagonalizálható transzformációk

Egy lineáris transzformáció diagonalizálható, ha alkalmas bázis szerinti mátrixa egy diagonális mátrix.
Egy n×n méretű A mátrix diagonalizálható, ha a φ : ℝn → ℝn, φ(v) = A · v lineáris transzformáció diagonalizálható.

Lineáris transzformációknál a diagonalizálhatóság ekvivalens egy sajátvektorokból álló bázis létezésével. Ha ugyanis
egy φ: V → V transzformáció mátrixa a B = {v1, v2,..., vn} bázis szerint

akkor ez azt jelenti, hogy φ(v1) = d1v1, φ(v2) = d2v2, ..., φ(vn) = dnvn, tehát a B bázis sajátvektorokból áll. Megfordítva is igaz,
hogy ha B egy sajátvektorokból álló bázis, akkor [φ]B egy diagonális mátrix, a főátlóban a báziselemekhez tartozó
sajátértékekkel.

Egy n×n méretű A mátrix diagonalizálható, ha alkalmas szintén n×n méretű P invertálható mátrixszal a P–1 A · szorzat
diagonális mátrix.

Egy P–1 · A·P szorzatmátrix pedig pontosan akkor diagonális, ha a P mátrix oszlopai az A mátrix sajátvektoraiból álló
bázist alkotnak ℝn-ben.
Egy diagonalizálható φ : V → V lineáris transzformáció tetszőleges bázis szerinti mátrixa természetesen nem mindig
diagonális, viszont annyi igaz, hogy mindig egy diagonalizálható mátrix. Megfordítva, ha egy lineáris transzformáció
valamely bázis szerinti mátrixa diagonalizálható mátrix, akkor a transzformáció maga is diagonalizálható.
A diagonalizálhatóság jellemzése a sajátalterek segítségével:

Egy V vektortér φ: V → V lineáris transzformációja akkor és csak akkor diagonalizálható, ha a φ sajátértékeihez


tartozó sajátalterek dimenzióinak az összege megegyezik a V vektortér dimenziójával.

A diagonalizálhatóság eldöntésének az általános módszere a sajátértékek, illetve a hozzájuk tartozó sajátalterek


dimenzióinak vizsgálatán alapszik. Van azonban néhány speciális mátrixtípus, ami garantálja a diagonalizálhatóságot,
például minden szimmetrikus mátrix, illetve minden idempotens mátrix (egy olyan P mátrix, amivel P2 = P)
diagonalizálható.

Példa. Az előző példában vizsgált φ: ℝ3 → ℝ3, φ(v) = Av leképezés – ahol – egy diagonalizálható

lineáris leképezés, ugyanis a , és sajátvektorai ℝ3-ban egy bázist alkotnak. Ebben

a bázisban a φ transzformáció mátrixa , mivel φ(v1) = 2v1; φ(v2) = 2v2 és φ(v3) = 4v3. Ez az A mátrixra

vonatkozóan azt jelenti, hogy a sajátvektorbázisból összerakott mátrixszal a P–1AP szorzat


ugyanezt a diagonális mátrixot kell, hogy eredményezze. Valóban:

Minimálpolinom
Bármely négyzetes valós mátrix behelyettesíthető egy valós együtthatós polinomba, aminek eredménye szintén egy
ugyanolyan méretű négyzetes mátrix. Ha ugyanis p(x) = amxm+am_1xm–1 + ... +a1x+a0∈ ℝ [x] és A ∈ ℝn×n, akkor

A p(A) mátrixra úgy is tekinthetünk, mint az ℝn×n vektortérben az En, A, A2, ..., Am vektoroknak az a0, a1, ..., am
együtthatókkal vett lineáris kombinációjára, és fordítva, az A mátrix nem negatív egész kitevős hatványainak bármely
lineáris kombinációja ugyanaz, mint a megfelelő együtthatókkal de niált valós polinom A-nál vett helyettesítési értéke.
Mivel ℝn×n egy véges dimenziós vektortér, amiben az A mátrix hatványai egy végtelen (és ennek következtében lineárisan
öszszefüggő) rendszert alkotnak, valamilyen alkalmas nem triviális lineáris kombinációjuk kiadja a 0 mátrixot, azaz
létezik olyan valós együtthatós p(x) polinom, amivel p(A) = 0.
Hasonlóan, egy valós vektortéren értelmezett lineáris transzformáció behelyettesíthető bármely valós együtthatós
polinomba, aminek eredménye szintén egy lineáris transzformáció. Ha ugyanis p(x) = amxm + am_1xm–1+... +a1x + a0 ∈ ℝ [x],
V egy valós vektortér és φ ∈ Hom(V, V), akkor

Itt φ hatványait úgy értelmezzük, hogy tetszőleges pozitív egész k szám esetén φk a k-tényezős φ ○ φ ○ ... ○ φ
kompozíció. A p(φ) leképezésre úgy is tekinthetünk, hogy ez a Hom(V, V) vektortérben a φm, φm–1, ..., φ, I vektoroknak egy
lineáris kombinációja. És ha rögzítünk V-ben egy B bázist, és eszerint vesszük φ, illetve p(φ) mátrixát, akkor azt kapjuk,
hogy [p(φ)]B = p([φ]B).
Amennyiben V véges dimenziós, úgy Hom(V, V) is véges dimenziós, így φ hatványainak végtelen sorozata Hom(V, V)-
ben egy lineárisan összefüggő rendszert alkot, ez pedig azt jelenti, hogy az azonosan nulla lineáris transzformáció előáll a
φ véges sok hatványának nem triviális lineáris kombinációjaként. Tehát létezik olyan valós együtthatós p(x) polinom,
amivel p(φ) = 0.

Az n × n méretű A mátrix minimálpolinomja az a legkisebb fokú normált polinom, amibe A-t behelyettesítve a
nullmátrixot kapjuk. A minimálpolinom jelölése: mA(x).

A V véges dimenziós vektortér egy φ lineáris transzformációjának a minimálpolinomja az a legkisebb fokú normált
polinom, amibe φ-t behelyettesítve az azonosan nulla transzformációt kapjuk. A minimálpolinom jelölése: mφ(x).

Egy lineáris transzformáció, illetve annak bármely bázis szerinti mátrixa ugyanazt a minimálpolinomot szolgáltatja,
azaz ha V egy véges dimenziós valós vektortér, B egy bázisa V-nek és φ: V → V egy lineáris transzformáció, aminek a B
szerinti mátrixa A, akkor mφ(x) = mA(x).
Bármely négyzetes A mátrix minimálpolinomja egyértelmű és tetszőleges p(x) ∈ ℝ [x] polinomra p(A) = 0 akkor és csak
akkor teljesül, ha mA(x) osztja p(x)-et. Továbbá az mA(x) minimálpolinom és a kA(x) karakterisztikus polinom (valós és
komplex) gyökei ugyanazok.

Ezt a tételt érdemes lineáris transzformációkra is kimondani:

Bármely φ lineáris transzformáció minimálpolinomja egyértelmű és tetszőleges p(x) ∈ ℝ [x] polinomra p(φ) = 0 akkor
és csak akkor teljesül, ha mφ(x) osztja p(x)-et. Továbbá az mφ(x) minimálpolinom és a kφ(x) karakterisztikus polinom
(valós és komplex) gyökei ugyanazok.

A Cayley–Hamilton-tétel szerint:

Tetszőleges A négyzetes mátrix mA(x) minimálpolinomja osztója a kA(x) karakterisztikus polinomnak.

Illetve ugyanez lineáris transzformációkra:

Tetszőleges φ lineáris transzformáció mφ(x) minimálpolinomja osztója a kφ(x) karakterisztikus polinomnak.

Példa. A korábbi példákban már vizsgált mátrix karakterisztikus polinomja kA(x) = x3 – 8x2 + 20x –
16 = (x – 2) (x – 4), így 2 és 4 az mA(x) minimálpolinomnak szintén gyökei. Így (x – 2)(x – 4) = x2 – 6x + 8 mindenképpen
2

osztja mA(x)-et, ami viszont a Cayley–Hamilton-tétel miatt osztja a kA(x) = (x – 2)2(x – 4) polinomot. Ebből következik,
hogy a minimálpolinom csak (x – 2)(x – 4) vagy (x – 2)2(x – 4) lehet. Ha az előbbi (a kisebb fokú) polinomba
helyettesítjük be az A mátrixot, az eredmény

Tehát az A mátrix – és egyben a hozzá tartozó φ : ℝ3 → ℝ3, v → Av lineáris transzformáció – minimálpolinomja:


mA(x) = (x – 2)(x – 4) = x2 – 6x + 8.

11.5. Bilineáris függvények

Legyen V egy valós vektortér. A B : V × V → ℝ leképezés egy bilineáris függvény, ha bármelyik változóját rögzítve a
másik változóra nézve egy lineáris függvényt kapunk.

A gyakorlatban ez azt jelenti, hogy bármely u, v, w ∈ V vektorokra és c valós számra


1. B(u + v, w) = B(u, w) + B(v, w),
2. B(cv, w) = cB(v, w),
3. B(u, v+w) = B(u, v)+B(u, w),
4. B(v, cw) = cB(v, w).
Néhány példa:
- Ha a vektortér ℝn, akkor tetszőleges n×n méretű M valós mátrixhoz természetes módon konstruálható egy B ℝn×ℝn → ℝ
bilineáris forma a B(v, w) = vT·M·w képlettel. (Itt a jobboldalt szereplő szorzat egy 1×1 méretű mátrixot eredményez, és az
egyenlőség úgy értendő, hogy B(v, w) az ebben szereplő szám.)
- Ha V egy rögzített (a, b) intervallumon értelmezett valós függvényeknek a vektortere (vagy ennek a vektortérnek egy altere)
és c ∈ (a, b), akkor a B(f, g) = f(c) · g(c) képlettel megadott függvény egy bilineáris függvény V-n.
-

Ha V a valós polinomok ℝ[x] vektortere, és a, b rögzített valós számok, akkor a képlet egy
bilineáris függvényt ad meg V-n.
A fenti de níció után felsorolt tulajdonságokból következik, hogy ha B: V×V → ℝ egy bilineáris függvény, akkor
bármely v ∈ V vektorra B(v, 0) = 0 és B(0, v) = 0, továbbá ha vektorok lineáris kombinációit helyezzük az egyes változók
helyébe, akkor a B függvény értéke kifejthető:
Így egy V-beli bázis vektorpárjain felvett értékek már meghatározzák a bilineáris függvényt: ha S = {v1, v2, ..., vn} egy
bázis V-ben, akkor a B(vi, vj) értékekből tetszőleges (v, w) vektorpár képe kiszámítható. A B(vi, vj) értékekre viszont
semmilyen megkötés nincs, tetszőlegesen megadott bij ∈ ℝ (1 ≤ i, j ≤ n) számokhoz létezik (pontosan egy) olyan B: V × V → ℝ
bilineáris függvény, amivel minden (i, j) indexpárra B(vi, vj) = bij. z a bilineáris függvény a

képlettel adható meg.


A fentiek alapján ha V egy n-dimenziós vektortér, akkor bármely S = {v1, v2,..., vn} bázisa egy kölcsönösen egyértelmű
megfeleltetést létesít a vektortér bilineáris függvényei és az n × n méretű valós mátrixok halmaza között. Egy B: V × V → ℝ
függvénynek megfeleltetett mátrix

Ekkor tetszőleges v, w ∈ V vektorokra B(v, w) = [v]TS · [B]S · [w]S. (Az egyenlet jobb oldalán a mátrixok méretei 1×n,
n×n, illetve n×1, a szorzat eredménye tehát egy 1×1 méretű mátrix, és az egyenlőség úgy értendő, hogy ennek a mátrixnak az
egyetlen eleme megegyezik a B(v, w) számmal.)
Ily módon különböző bilineáris függvényekhez különböző mátrixok tartoznak, illetve minden n×n méretű valós
mátrix egy alkalmas bilineáris függvény S szerinti mátrixa.
Ha Z egy másik bázisa ugyanannak a vektortérnek, és P az S → Z báziscsere átmenetmátrixa, akkor [B]Z = PT· [B]S·P.

Egy B : V × V → ℝ bilineáris függvény szimmetrikus, ha bármely v, w ∈ V vektorokra B(w, v) = B(v, w), illetve ferdén
szimmetrikus, ha bármely v, w ∈ V vektorokra B(w, v) = –B(v, w).

Egy szimmetrikus bilineáris függvény mátrixa bármely bázis szerint egy szimmetrikus mátrix és fordítva,
szimmetrikus mátrix csak szimmetrikus bilineáris függvényhez tartozhat. Hasonlóan, a ferdén szimmetrikus bilineáris
függvényekhez a ferdén szimmetrikus mátrixok tartoznak.

Merőlegesség, ortogonális bázisok


Kvadratikus alakok

Merőlegesség, ortogonális bázisok

Egy V vektortér v és w vektorai a B : V × V → ℝ bilineáris függvény szerint ortogonálisak (merőlegesek), ha B(v, w) = 0


és B(w, v) = 0.

Szimmetrikus és ferdén szimmetrikus bilineáris függvényeknél a B(v, w) = 0 feltételből már természetesen következik
B(w, v) = 0, általában azonban ez nincs mindig így.

Egy V vektortér S = {v1, v2, …, vn} bázisa ortogonális bázis a B : V × V → ℝ bilineáris függvényre nézve, ha a vi vektorok
B szerint egymásra ortogonálisak.

Ha egy B : V × V → ℝ bilineáris függvényhez létezik ortogonális bázis, akkor ezen bázis szerint B mátrixa egy diagonális
mátrix. (Az, hogy a főátlón kívüli elemek mind nullák, éppen azt jelenti, hogy a bázis vektorai egymásra merőlegesek.)
Mivel minden diagonális mátrix szimmetrikus, ami csak szimmetrikus bilineáris függvényhez tartozhat, így ortogonális
bázisa is csak szimmetrikus bilineáris függvénynek lehet.

Legyen B egy V valós vektortéren értelmezett bilineáris függvény. Ha V-nek létezik B szerint ortogonális bázisa, akkor
B szimmetrikus. Fordítva, ha B szimmetrikus, akkor létezik V-nek egy B szerint ortogonális bázisa.

Ugyanez mátrixokra megfogalmazva:


Egy négyzetes valós M mátrix akkor és csak akkor szimmetrikus, ha alkalmas (ugyanolyan méretű) invertálható P
mátrixszal a PT·M·P szorzat diagonális.

Ennél egy kicsit több is igaz:

Ha V egy valós vektortér, és B : V × V → ℝ egy szimmetrikus bilineáris függvény, akkor létezik olyan S = {v1, v2, …, vn}
bázis V-ben, ami ortogonális, és azon kívül minden i-re B(vi, vi) vagy –1, vagy 0, vagy 1.

Ugyanez mátrixokra:

Ha M egy négyzetes szimmetrikus valós mátrix, akkor létezik olyan invertálható P mátrix, amivel PT·M·P diagonális,
és a főátlójában minden elem vagy –1, vagy 0, vagy 1.

Jóllehet a fenti tételekben sem az S bázis, sem a P mátrix általában nem egyértelmű (azaz többféle alkalmas választás is
létezhet ezekre), azonban a kapott diagonális mátrixban a –1-ek, a 0-k és az 1-ek száma már egyértelmű, csak az adott
szimmetrikus bilineáris függvénytől, illetve szimmetrikus mátrixtól függ. Ezt mondja ki a Sylvester-féle tehetetlenségi
törvény:

Egy valós vektortéren értelmezett szimmetrikus bilineáris függvény bármely diagonális mátrixában a pozitív, a
negatív és a nulla elemek száma egyértelműen meghatározott, nem függ az alkalmas bázis választásától.

A ferdén szimmetrikus (szimplektikus) bilineáris függvényekhez mindig található olyan bázis, ami szerinti
mátrixukban a mellékátlón kívüli elemek mind nullák, és a mellékátlóban minden elem vagy –1, vagy 0, vagy 1.

Ha V egy valós vektortér, és B : V × V → ℝ egy ferdén szimmetrikus bilineáris függvény, akkor létezik olyan S = {v1, v2,
…, vn} bázis V-ben és olyan egész szám, hogy az i = 1, 2, …, k egészekre B(vi, vn–i) = 1, B(vn–i, vi) = –1 és
ezeken kívül minden más B(vj, vl) érték nulla.

Egy B : V × V → ℝ bilineáris függvény szinguláris (elfajuló), ha van olyan v ∈ V vektor, amivel minden w ∈ V vektorra
B (v, w) = 0.

Ilyenkor az is igaz, hogy van olyan u ∈ V vektor, amivel minden w ∈ V vektorra B(w, u) = 0, továbbá:

Egy B : V × V → ℝ bilineáris függvény akkor és csak akkor szinguláris, ha valamely bázis szerinti mátrixa szinguláris
(azaz nulla determinánsú).

Természetesen ha valamely S bázis szerinti mátrix szinguláris, akkor bármely más bázis szerinti mátrix is az. Ugyanis
ha Z egy másik bázis, akkor, mint már korábban említettük, alkalmas P mátrixszal [B]Z = PT·[B]S·P, és így det([B]Z) =
det([B]S)·det(P)2.
Konkrétan, ha az S = {v1, v2, …, vn} bázis szerinti [B]S mátrix szinguláris, akkor a sorvektorainak valamely c1, c2, …, cn
együtthatókkal vett lineáris kombinációja a nulla sorvektor, és ebből az következik, hogy a v = c1v1 + c2v2 + … + cnvn vektor
balról merőleges a vektortér összes vektorára. Hasonlóan a [B]S mátrix oszlopainak valamely d1, d2, …, dn együtthatókkal
vett lineáris kombinációja a nulla oszlopvektor, és ekkor az u = d1v1 + d2v2 + … + dnvn vektor jobbról merőleges a vektortér
összes vektorára.
Adott B : V × V → ℝ bilineáris függvény mellett a V vektortér tetszőleges U részhalmazához tekinthetjük az

részhalmazokat, amik valójában alterek V-ben. Ha B szimmetrikus vagy ferdén szimmetrikus, akkor ez a két altér
megegyezik, és az U halmaz merőleges alterének nevezzük. A {0}⊥ = V azonosság mindig fennáll, és B pontosan akkor
szinguláris, ha dim(V⊥) ≥ 1. Egy nem szinguláris bilineáris függvény esetében minden U ⊆ V részhalmazra dim( U ) + 〈 〉
dim(U⊥) = dim(V), ahol 〈U〉 a szokásos módon az U által generált alteret jelöli.

Kvadratikus alakok

Egy V valós vektortéren értelmezett B : V × V → ℝ szimmetrikus bilineáris függvényhez tartozó kvadratikus alak a
Q(v) =B(v, v) képlettel megadott Q : V → ℝ függvény.
Tehát minden szimmetrikus bilineáris függvényhez tartozik egy kvadratikus alak, és az is igaz, hogy különböző
szimmetrikus bilineáris függvényekhez különböző kvadratikus alakok tartoznak. Ugyanis egy kvadratikus alak már
egyértelműen meghatározza a szimmetrikus bilineáris függvényét a 2B(v, w) = Q(v + w) – Q(v) – Q(w) képlettel. (Ugyanis Q(v
+ w) = B(v + w, v + w) = B(v, v) + B(v, w) + B(w, v) + B(w, w) = Q(v) + Q(w) + 2B(v, w).)
A valós vektorterek kvadratikus alakjait (illetve a hozzájuk tartozó szimmetrikus bilineáris függvényeket) ötféle
kategóriába soroljuk:
- A Q kvadratikus alak pozitív de nit, ha minden 0-tól különböző v vektorra Q(v) > 0.
- A Q kvadratikus alak negatív de nit, ha minden 0-tól különböző v vektorra Q(v) < 0.
- A Q kvadratikus alak pozitív szemide nit, ha minden 0-tól különböző v vektorra Q(v) ≥ 0, és van olyan 0-tól különböző v
vektor, amivel Q(v) = 0.
- A Q kvadratikus alak negatív szemide nit, ha minden 0-tól különböző v vektorra Q(v) ≤ 0, és van olyan 0-tól különböző v
vektor, amivel Q(v) = 0.
- A Q kvadratikus alak inde nit, ha nem tartozik az előző négy kategóriába, azaz pozitív és negatív értéket is felvesz.
Az, hogy egy adott kvadratikus alak ezen osztályok közül melyikbe tartozik, azzal van összefüggésben, hogy a hozzá
tartozó szimmetrikus bilineáris függvény valamely diagonális mátrixában hány pozitív, negatív, illetve nulla elem
szerepel. Ha B : V × V → ℝ egy szimmetrikus bilineáris függvény, Q : V → ℝ a hozzá tartozó kvadratikus alak, és D egy
alkalmas bázis szerinti diagonális mátrixa B-nek, akkor a következő összefüggések állnak fenn Q és D között:
- Q pozitív de nit, ha D főátlójában minden szám pozitív.
- Q negatív de nit, ha D főátlójában minden szám negatív.
- Q pozitív szemide nit, ha D főátlójában van nulla, de nincs negatív szám.
- Q negatív szemide nit, ha D főátlójában van nulla, de nincs pozitív szám.
- Q inde nit, ha D főátlójában van pozitív és negatív szám is.
Továbbá egy kicsit körülményesebb módon B-nek tetszőleges bázis szerinti M mátrixából is megállapítható, hogy Q
de nit alak-e. Ehhez az M mátrix bal felső sarkában lévő 1 × 1, 2 × 2 stb. méretű mátrixok determinánsait kell ismerni,
beleértve M-et magát is.
- Q pozitív de nit, ha ezen determinánsok mindegyike pozitív.
- Q negatív de nit, ha a szóban forgó determinánsok közül a páratlan méretűek negatívak és a páros méretűek pozitívak.
A kvadratikus alakok egy másik lehetséges megközelítésben másodfokú homogén többismeretlenes polinomok. Az x1,
x2, …, xn ismeretlenek homogén másodfokú polinomjai olyan összegek, amelyek xi xj, illetve x2i alakú tagok

számszorosaiból állnak. Általános alakjuk tehát . Ez a polinom valójában egy Q : ℝn

→ ℝ függvény, ahol . Ez a függvény pedig egy kvadratikus alak, az

szimmetrikus mátrixszal megadott B : ℝn × ℝn → ℝ, B(x, y) = xTAy bilineáris függvény kvadratikus alakja.


Fordítva, ha egy V valós vektortéren Q : V → ℝ egy kvadratikus alak, a hozzá tartozó szimmetrikus bilineáris függvény
pedig B : V × V → ℝ, aminek a mátrixa egy rögzített S = {v1, v2, …, vn} bázis szerint [B]S = (bij), akkor egy tetszőleges v vektor

Q(v) képe a vektor S szerinti koordinátáinak egy homogén másodfokú polinomja:

A már korábban említett tétel, miszerint minden szimmetrikus bilineáris függvény alkalmas bázis szerinti mátrixa
olyan diagonális mátrix, ahol a főátlóbeli számok mindegyike –1, 0 vagy 1, a homogén másodfokú polinomok számára a
következőt jelenti:

Minden valós együtthatós n-ismeretlenes homogén másodfokú polinom felírható legfeljebb n darab elsőfokú kifejezés
előjeles négyzetösszegeként.
Példa. Az szimmetrikus mátrixhoz tartozó B : ℝ4 × ℝ4 → ℝ bilineáris függvény képlete:

Az ehhez tartozó kvadratikus Q : ℝ4 → ℝ forma képlete:

Egy lehetséges módja annak, hogy ezt előjeles négyzetösszeggé alakítsuk, hogy először az x1-et tartalmazó tagokat
teljes négyzetté egészítjük ki:

majd az x2-t tartalmazó tagokat egészítjük ki teljes négyzetté, stb. Végül

Természetesen nem ez az egyetlen módja az előjeles négyzetösszeggé alakításnak, egy másik lehetséges eredmény
például

Nem véletlen, hogy itt mind a két előjeles négyzetösszegre bontásban három tényező szerepel, és ezek közül kettő
pozitív, egy pedig negatív előjellel. A Sylvester-féle tehetetlenségi törvényből adódó általános szabály az, hogy ha a
bilineáris függvény mátrixának a rangja r, akkor a kvadratikus alak legkevesebb r darab tényező előjeles
négyzetösszegére bontható, és bármely két r darab tényezőre bontásban a pozitív előjeles, illetve a negatív előjeles
tagok száma megegyezik.

11.6. Euklideszi terek

Egy pozitív de nit szimmetrikus bilineáris függvénnyel ellátott valós vektortér neve valós euklideszi tér.

Tehát egy V valós vektortér euklideszi tér egy adott B : V × V → ℝ szimmetrikus bilineáris függvénnyel, ha tetszőleges
nem nulla v vektorra B(v, v) > 0. Ekkor a B függvényt egy belső szorzatnak (skalárszorzatnak) nevezzük, és mivel
kitüntetett szerepe van az összes többi bilineáris függvény közt, a jelölésében általában elhagyjuk a B betűt és egyszerűen
(v, w)-t írunk B(v, w) helyett.
A legismertebb példák euklideszi terekre:
- Tetszőleges pozitív egész n mellett az ℝn vektortér a szokásos skalárszorzattal:

- A síkvektorok, illetve a térvektorok vektortere a geometriából ismert skalárszorzással: (v, w) = ||v|| · ||w|| · cos(v, w), ahol
||v|| és ||w|| a két vektor hosszát jelölik.
- Tetszőleges rögzített a, b valós számok mellett az (a, b) intervallumon folytonos függvények vektortere az

belső szorzattal.
Általában egy n-dimenziós valós euklideszi tér lényegében ugyanúgy néz ki, mint a fent említett ℝn példa a
skalárszorzattal. Mint korábban már említettük, tetszőleges B : V × V → ℝ szimmetrikus bilineáris függvényhez található
olyan S = {v1, v2, …, vn} bázis, ami szerint B mátrixa diagonális, és a főátló minden eleme –1, 0 vagy 1. Mivel esetünkben
most B pozitív de nit, így ebben a diagonális mátrixban a főátló minden eleme 1, és ekkor az S bázis szerint koordinátázva a
V-beli vektorokat, pont a fenti skalárszorzat képletét kapjuk B-re. Tehát ha

Egy valós euklideszi tér v vektorának a normája (hossza) , két vektor távolsága pedig d(v, w) = ||v – w||.
Egy w vektor egységvektor, ha ||w|| = 1.

Speciálisan az ℝn térben:

A síkgeometriából ismert háromszög-egyenlőtlenség, miszerint egy háromszög két oldalhosszának az összege


nagyobb a harmadik oldal hosszánál (illetve elfajuló háromszög esetén lehet éppen egyenlő is) akárhány dimenziós valós
euklideszi terekre is általánosítható:

Egy valós euklideszi tér tetszőleges v és w vektoraira ||v + w|| ≤ ||v|| + ||w||.

Egy másik ismert, normákra vonatkozó tétel a Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenség:

Egy valós euklideszi tér tetszőleges v és w vektoraira | (v, w) | < ||v||·||w||.

Ennek a tételnek egy következménye, hogy tetszőleges x1, x2, …, xn és y1, y2, …, yn valós számokra

Ugyanis ha a v ∈ ℝn vektor koordinátái az xi, a w ∈ ℝn vektor koordinátái pedig az yi számok, akkor ennek az
egyenlőtlenségnek a bal oldala (v, w)2, jobb oldala pedig ||v||2·||w||2.
További következménye a Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenségnek, hogy tetszőleges valós euklideszi
térben de niálhatjuk a vektorok közti szög fogalmát.

Egy valós euklideszi tér v és w (0-tól különböző) vektorai által bezárt szög az a 0 és π közti φ szög, amivel

A Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenség értelmében a jobb oldalon álló kifejezés értéke a [–1, 1]


intervallumba esik, így a két vektor közti szög egyértelműen meghatározott. Speciálisan a v és w vektorok szöge π/2
(derékszög), ha (v, w) = 0.

Egy V valós euklideszi tér v és w vektorai ortogonálisak (merőlegesek), ha (v, w) = 0. Továbbá tetszőleges U ⊆ V
részhalmaz merőleges altere U⊥ = {v ∈ V | ∀u ∈ U : (u, v) = 0}.

Tehát U⊥ azokból a vektorokból áll, amik minden U-beli vektorra merőlegesek. Korábban már megjegyeztük, hogy
ezek a vektorok V-nek mindig egy alterét alkotják.

Egy V valós euklideszi tér tetszőleges W alterére (W⊥)⊥ = W és V = W ⊕ W⊥.

Ez azt jelenti, hogy a vektortér bármely v vektora felírható v = w + w'' összegként, ahol w ∈ W és w'' ∈ W⊥, továbbá ez
az összegre bontás egyértelmű. A w összetevő a v vektor merőleges vetülete W-re, ennek a vetületnek a jelölése: projw(v).
Egy valós euklideszi tér v1, v2, …, vk vektorai egy ortogonális vektorrendszert alkotnak, ha egymásra merőlegesek,
azaz 1 ≤ i, j ≤ k és i ≠ j esetén (vi, vj) = 0. Ha ezenkívül a rendszer mindegyik tagja egységvektor, akkor v1, v2, …, vk egy
ortonormált vektorrendszer. Egy egymásra merőleges vektorokból álló bázist ortogonális bázisnak, egy egymásra
merőleges egységvektorokból álló bázist ortonormált bázisnak nevezünk.

Tehát egy valós euklideszi tér S = {v1, v2, …, vn} bázisa pontosan akkor ortogonális bázis, ha a belső szorzat S szerinti
mátrixa diagonális, illetve pontosan akkor ortonormált bázis, ha a belső szorzat S szerinti mátrixa az egységmátrix. Mint
már említettük, minden véges dimenziós valós euklideszi térnek létezik ortonormált bázisa, és ez igaz végtelen dimenziós
euklideszi terekre is.
Érdemes még megjegyezni, hogy az ortogonális tulajdonságból következik a lineáris függetlenség, azaz egy ortogonális
vektorrendszer mindig független is.

Gram–Schmidt-ortogonalizáció, merőleges vetület


Speciális lineáris transzformációk
Egyenletrendszerek közelítő megoldásai

Gram–Schmidt-ortogonalizáció, merőleges vetület


A Gram–Schmidt-ortogonalizáció egy olyan eljárás, amivel tetszőleges bázisból kiindulva készíthetünk egy ortogonális
bázist. Tegyük fel, hogy W a V valós euklideszi tér egy véges dimenziós altere, és {w1, w2,…, wk} egy bázis W-ben.
De niáljuk a W-beli w′1, w′2 …, w′k vektorokat a következőképp: legyen w′1 = w1 és i = 2, 3, …, k-ra

Az így kapott {w′1, w′2 …, w′k} vektorrendszer egy ortogonális bázisa W-nek. Ebből már könnyen kaphatunk egy
ortonormált bázist is, ha a w′i vektorokat normáljuk, azaz mindegyiket leosztjuk a saját hosszával. Tehát ha i = 1, 2, …, k-ra

akkor {v1, v2, …, vk} már egy ortonormált bázis W-ben. Mellesleg ez az egyetlen olyan ortonormált
bázisa W-nek, amivel mindegyik 1 és k közötti i egész számra

Egy praktikus haszna annak, ha egy altér ortogonális bázisát ismerjük, hogy annak a segítségével bármelyik vektor
merőleges vetületét ki tudjuk számítani. Ha ugyanis W altér a V valós euklideszi térben, és {w1, w2, …, wk} egy ortogonális
bázisa W-nek, akkor tetszőleges v ∈ V vektor merőleges vetülete W-re:

Az előbb ismertetett Gram–Schmidt-ortogonalizáció lényege is az, hogy az adott bázis minden vektorából kivonjuk az
őt megelőző bázisvektorok által generált altérre vett merőleges vetületét, és így eredményül egy erre az altérre merőleges
vektort kapunk.

Speciális lineáris transzformációk

Egy V valós euklideszi téren értelmezett φ : V → V lineáris transzformáció szimmetrikus, ha tetszőleges v ∈ V vektorra
(v, φ(v)) = (φ(v), v), illetve ortogonális, ha tetszőleges v ∈ V vektorra ||φ(v)|| = ||v||.

A szimmetrikus tulajdonságból már következik, hogy tetszőleges v, w ∈ V vektorokra (v, φ(w)) = (φ(v), w), illetve az
ortogonális tulajdonságból következik, hogy tetszőleges v, w ∈ V vektorokra (φ(v), φ(w)) = (v, w), továbbá a φ(v) és φ(w)
vektorok által bezárt szög megegyezik a v és w vektorok által bezárt szöggel.
Egy véges dimenziós, valós V vektortér φ : V → V lineáris transzformációja akkor és csak akkor szimmetrikus, ha egy
ortonormált bázis szerinti mátrixa szimmetrikus, illetve akkor és csak akkor ortogonális, ha egy ortonormált bázis
szerinti mátrixa ortogonális mátrix.

Az „egy” helyett használhatnánk a „minden” szót is, ugyanis egy szimmetrikus lineáris transzformáció bármely
ortonormált bázis szerinti mátrixa szimmetrikus, illetve egy ortogonális lineáris transzformáció bármely ortonormált
bázis szerinti mátrixa ortogonális mátrix. (Emlékeztetőül, egy M valós mátrix szimmetrikus, ha MT = M, illetve
ortogonális, ha MT·M=E. Ez utóbbi pontosan akkor teljesül, ha az M mátrix oszlopai ℝn-nek a szokásos skalárszorzatra
nézve egy ortonormált bázisát alkotják.)
Speciálisan tetszőleges n pozitív egész mellett, ha A egy szimmetrikus és Q egy ortogonális n × n méretű mátrix, akkor
az ℝn vektortéren értelmezett v ↦ A·v lineáris transzformáció szimmetrikus, illetve a v ↦ Q·v lineáris transzformáció
ortogonális.

Egy V valós euklideszi tér φ : V → V lineáris transzformációjának az adjungáltja az a φ* : V → V lineáris


transzformáció, amivel bármely v, w ∈ V vektorokra (v, φ(w)) = (φ*(v), w).

Minden lineáris transzformációnak van adjungáltja, és egy ortonormált bázis szerint az adjungált, illetve az eredeti
lineáris transzformációk mátrixai egymásnak transzponáltjai. Tehát ha S egy ortonormált bázisa a V vektortérnek, és φ : V
→ V egy lineáris transzformáció, akkor [φ*]S = [φ]TS. Egy φ : V → V lineáris transzformáció pontosan akkor szimmetrikus,
ha φ* = φ, illetve pontosan akkor ortogonális, ha φ* = φ–1.
Korábban már említettük, hogy ha egy lineáris transzformáció valamely bázis szerinti mátrixa szimmetrikus, akkor a
transzformáció diagonalizálható, azaz létezik a vektortérnek olyan bázisa is, ami az adott transzformáció sajátvektoraiból
áll. Így egy valós euklideszi tér szimmetrikus transzformációi is diagonalizálhatók (mivel minden ortonormált bázis
szerinti mátrixuk szimmetrikus), tehát létezik hozzájuk sajátvektorbázis. Ennél több is igaz:

Egy valós euklideszi tér szimmetrikus lineáris transzformációjához mindig található sajátvektorokból álló
ortonormált bázis.

Ugyanez a tétel mátrixokra vonatkozva a következőt jelenti:

Ha A egy n × n méretű szimmetrikus valós mátrix, akkor A diagonalizálható egy ortogonális mátrixszal, azaz létezik
olyan n × n méretű ortogonális Q mátrix, amivel a Q–1AQ szorzat diagonális.

Érdemes még megemlíteni, hogy ha egy φ : V → V szimmetrikus lineáris transzformációnak v és w két különböző
sajátértékhez tartozó sajátvektora, akkor szükségszerűen merőlegesek egymásra, azaz (v, w) = 0.
Az ortogonális lineáris transzformációk nem feltétlenül diagonalizálhatók, viszont mindig található hozzájuk olyan
bázis, amely szerinti mátrixukban a főátló mentén

típusú 2 × 2-es blokkok, illetve 1 vagy –1 található, ezeken kívül pedig minden más elem nulla.

Egyenletrendszerek közelítő megoldásai


Ha a Gram–Schmidt-ortogonalizációt egy nem nulla determinánsú A mátrix oszlopaira alkalmazzuk, akkor az eredményül
kapott oszlopvektorok normáltjaiból összerakott Q mátrix ortogonális, továbbá QTA egy felső-háromszögmátrix.
Általánosabban:

Ha az m × n méretű A mátrix rangja n, akkor felírható Q · R szorzat formájában, ahol Q ∈ ℝm × n, QT·Q = En és R ∈ ℝn × n


egy nem nulla determinánsú felső-háromszögmátrix.

Ha egy egyenletrendszer együtthatómátrixának létezik, és ismert ez a típusú felbontása, akkor a megoldás már
könnyen kiszámítható. Tekintsük ugyanis az A·x = b mátrixegyenlettel megadott, m egyenletből álló n ismeretlenes
egyenletrendszert, ahol A egy m × n méretű mátrix, x az ismeretlenek n hosszú oszlopvektora, b pedig az egyenletek
konstans tényezőinek m hosszú oszlopvektora. Amennyiben A = Q·R, ahol Q és R a fenti tételben leírt mátrixok, akkor az
egyenletrendszer mindkét oldalát Q transzponáltjával balról szorozva az R·x = QT·b mátrixegyenletet kapjuk. Ehhez a
mátrixegyenlethez egy n egyenletből álló egyenletrendszer tartozik, ami gyorsan és kényelmesen megoldható: mivel R egy
felső-háromszögmátrix, az utolsó egyenletben az ismeretlenek közül csak xn szerepel, az utolsó előttiben xn–1 és xn stb. Így
az utolsó egyenlettől visszafelé haladva sorra megkapjuk az xn, xn–1, …, x1 ismeretlenek értékeit.
Abból a feltevésből, hogy az m×n méretű A együtthatómátrix rangja n (azaz A oszlopai lineárisan függetlenek)
következik, hogy az A·x = b egyenletrendszernek legfeljebb egy megoldása lehet. Ha pontosan egy megoldás létezik, akkor
ezt a megoldást kapjuk az R·x = QT·b egyenlet megoldásával is. Azonban előfordulhat, hogy az A·x = b egyenletrendszernek
nincs megoldása, az R·x = QT·b egyenlet viszont így is szolgáltat egy megoldást. Az így kapott x1, x2, …, xn értékek az eredeti
egyenletnek az ún. közelítő megoldását adják.

A (11.1) lineáris egyenletrendszernek egy közelítő megoldásán olyan x1, x2, …, xn értékek megadását értjük, amikkel az
egyenletek bal és jobb oldalainak a különbségeiből alkotott négyzetösszeg a lehető legkisebb.

Ez a négyzetösszeg képlettel kifejezve . Ugyanezt a minimalitási feltételt a


mátrixegyenletek, illetve az euklideszi terek nyelvén sokkal egyszerűbben is megfogalmazhatjuk.

Az A·x = b (A ∈ ℝm×n, b ∈ ℝm) egyenletrendszernek z ∈ ℝn egy közelítő megoldása, ha ||A·z – b|| a lehető legkisebb.

Amennyiben az egyenletrendszer megoldható, akkor a közelítő megoldások maguk a valódi megoldások, közelítő
megoldásról tehát akkor érdemes beszélni, ha az adott egyenletrendszer nem oldható meg. Mivel az A·v (v ∈ ℝn) alakú
vektorok egy alteret alkotnak ℝm-ben – jelöljük ezt az alteret W-vel, és ez nem más, mint az A mátrix oszlopai által generált
altér –, az ||A·z – b|| távolság pontosan akkor a lehető legkisebb, ha A·z megegyezik a b vektornak W-re vett merőleges
vetületével, azaz A·z = projw(b). Korábban már leírtuk, hogy egy adott vektor adott altérre vett merőleges vetülete miként
számítható ki, így tehát bármely egyenletrendszer közelítő megoldásait meg tudjuk adni: az A·x = b egyenlet helyett
egyszerűen az A·x = projw(b) egyenletrendszert oldjuk meg, ahol W az A mátrix oszlopai által generált altér. Ez a módszer a
gyakorlatban – a merőleges vetület kiszámítása miatt – kicsit körülményes, azonban egy ekvivalens egyenletrendszerhez
jutunk azzal az észrevétellel, hogy A·x= projw(b) pontosan akkor teljesül, ha A·x–b merőleges a W altérre, azaz merőleges az
A mátrix összes oszlopára. Ez a feltétel mátrixegyenlettel kifejezve AT· (A·x – b) = 0, átrendezés után ATA·x = ATb.

Ha adott egy A·x = b, (A ∈ ℝm×n, b ∈ ℝm) valós egyenletrendszer, akkor az (ATA)·x = ATb egyenletrendszernek
garantáltan van megoldása (egy vagy végtelen sok), és minden megoldása az eredeti egyenletrendszernek egy közelítő
megoldása.

A közelítő megoldás pontosan akkor egyértelmű, ha az együtthatómátrix oszlopai lineárisan függetlenek, és ebben az
esetben ATA egy invertálható négyzetes mátrix.

Ajánlott irodalom
Davaadorzsin, M.: Valós lineáris algebra és lineáris programozás. Műszaki Könyvkiadó, Budapest, 2001
Fagyejev, D. K.–Szominszkij, I. Sz.: Felsőfokú algebrai feladatok. Typotex Kiadó, Budapest, 2000
Freud R.: Lineáris algebra. ELTE Eötvös Kiadó, Budapest, 2006
Fried E.: Algebra I. Elemi és lineáris algebra. Nemzeti Tankönyvkiadó, Budapest, 2000
Kirchner I.: Lineáris algebra és vektoralgebra. Nemzeti Tankönyvkiadó, Budapest, 2007
Kuros, A. G.: Felsőbb algebra. Tankönyvkiadó, Budapest, 1967
Obádovics J. Gy.: Lineáris algebra példákkal. Scolar Kiadó, Budapest, 2001
Obádovics J. Gy.: Mátrixok és di erenciálegyenlet-rendszerek. Scolar Kiadó, Budapest, 2005
Rózsa P.: Bevezetés a mátrixelméletbe. Typotex Kiadó, Budapest, 2009
Scharnitzky V.: Mátrixszámítás. Műszaki Kiadó, Budapest, 2006
Scharnitzky V.: Vektorgeometria és lineáris algebra. Nemzeti Tankönyvkiadó, Budapest, 2006
12. Absztrakt algebra
12.1. Az algebrai struktúrákról általában
12.2. Gyűrűelmélet, alapfogalmak
12.3. Kommutatív egységelemes gyűrűk
12.4. Csoportelmélet, alapfogalmak
12.5. További témák a csoportelméletből
12.6. Testek és Galois-csoportok
12.7. Modulusok
12.8. Hálók és Boole-algebrák

12.1. Az algebrai struktúrákról általában


Műveletekkel ellátott halmazok – röviden így lehet (és szokás) jellemezni az absztrakt algebra vizsgálati tárgyát, az algebrai
struktúrákat. Ennél azonban többről van szó, ugyanis a műveletektől bizonyos tulajdonságokat (axiómákat) várunk el,
amikre fel lehet építeni egy adott struktúra, illetve struktúratípus elméletét. Az egyik legismertebb algebrai struktúra az
egész számok halmaza az összeadás és a szorzás műveleteivel ellátva, de ugyanezekkel a műveletekkel szintén algebrai
struktúrát alkot a valós számok, illetve a komplex számok halmaza is. Jellegében kicsit másfajta struktúrát kapunk, ha egy
adott halmaz részhalmazainak a halmazát tekintjük az unió és metszet műveletekkel, vagy ha, mondjuk, a valós számokon
értelmezett függvényeket vesszük a kompozícióval mint egy darab művelettel. Az absztrakt algebra azonban attól
„absztrakt”, hogy az egyes struktúrákat nemcsak önmagukban vizsgáljuk, hanem osztályozzuk őket a rajtuk értelmezett
műveletek száma és tulajdonságai alapján, és aztán olyan elméleteket építünk fel, amelyek egy-egy egész
struktúraosztályra vonatkoznak.

Egy nem üres S halmazon értelmezett n-változós műveleten az S halmaz n-tényezős S × S × … × S Descartes-féle
szorzatának egy S-be történő leképezését értjük. Ha egy halmazon legalább egy (akárhány változós) művelet
értelmezve van, akkor az a halmaz a rajta értelmezett művelet(ek)kel együtt egy algebrai struktúra.

Mint már utaltunk rá, egy adott algebrai struktúra vizsgálatakor fontos szempont annak a kérdésnek a
megválaszolása, hogy a struktúrán értelmezett művelet(ek)ről milyen tulajdonságok mondhatók el. Elvileg egy algebrai
művelet akárhány változós lehet, de mivel a klasszikus algebrai struktúrák többnyire kétváltozós műveleteken alapszanak,
így ebben a fejezetben mi is csak kétváltozós műveletekkel foglalkozunk. Egy S halmazon értelmezett kétváltozós művelet
tehát az S × S halmaznak egy S-be történő leképezése. Az S × S-beli (x, y) elem képének a jelölésére ebben a szekcióban az x *
y és x⊙y kifejezéseket fogjuk használni (az általánosság kedvéért), de természetesen a közismert algebrai struktúrákon
értelmezett műveleteknek mind megvan a maguk általánosan elfogadott standard jelölése (x + y, x · y, x ∪ y, x ∩y stb.).

Egy S halmazon értelmezett * művelet kommutatív, ha bármely S-beli x és y elemekre x * y = y * x. A * művelet


asszociatív, ha bármely S-beli x, y és z elemekre (x * y) * z = x *(y * z).

Jóllehet az asszociatív tulajdonság csak háromtényezős műveletsorokra mondja ki, hogy a zárójelezés nem változtat az
eredményen, ebből már következik, hogy akárhány tényezős műveletsornál is elhagyható a zárójelezés: a műveletek
tetszőleges sorrendbeni elvégzése mindig ugyanahhoz az eredményhez vezet, feltéve hogy a tényezők sorrendje
változatlan. Például (a * b) * (c * d) = a * ((b * c) * d). Ha az asszociatív és a kommutatív tulajdonság egyszerre áll fenn, akkor a
többtényezős műveletsorokban a tényezők sorrendje is lényegtelen. Amennyiben viszont a kommutatív tulajdonság nem
teljesül, akkor a tényezők sorrendjére szigorúan ügyelni kell!

Egy S halmazon értelmezett * műveletre nézve az S-beli e elem egy egységelem (neutrális elem), ha bármely S-beli x
elemre e * x = x * e = x. Amennyiben csak annyit kötünk ki, hogy bármely S-beli x elemre e * x = x, akkor e egy bal oldali
egységelem, ha pedig azt kötjük ki, hogy bármely S-beli x elemre x * e = x, akkor e egy jobb oldali egységelem.

Az egységelem létezése maga után vonja annak egyértelműségét is, illetve kicsit több is igaz: ha létezik egy bal oldali és
egy jobb oldali egységelem, akkor azok egyenlők, s ez az elem (általános) egységelem. Viszont előfordulhat, hogy egy
struktúrában van több bal oldali egységelem és nincs jobb oldali, vagy fordítva.
Egy S halmazon értelmezett * műveletre nézve az S-beli x és y elemek inverzei egymásnak, ha ugyanarra a műveletre
nézve van egy e egységelem és x * y = y * x = e. Amennyiben csak annyit teszünk fel, hogy x * y = e, akkor x egy bal oldali
inverze y-nak és y egy jobb oldali inverze x-nek.

Az inverzelem létezése ugyancsak maga után vonja annak egyértelműségét. Általánosabban: ha egy adott elemnek
létezik bal oldali és jobb oldali inverze is, akkor azok egyenlők.

Egy adott S halmazon értelmezett * művelet disztributív az (ugyancsak S-en értelmezett) ⊙ műveletre nézve, ha
bármely S-beli x, y és z elemekre (x ⊙ y) * z = (x * z) ⊙ (y * z) és z* (x ⊙ y) = (z * x) ⊙ (z * y). Jobb oldali, illetve bal oldali
disztributív tulajdonságról beszélhetünk, ha ezen azonosságok közül csak az első, illetve csak a második érvényes.

A már felsorolt művelettulajdonságokkal kényelmesen de niálhatjuk a közismertebb algebrai struktúratípusokat:


- Félcsoport: egy olyan (S, *) algebrai struktúra, ahol * asszociatív művelet.
- Csoport: egy olyan (G, *) algebrai struktúra, ahol * asszociatív művelet, létezik egységelem, s erre nézve minden elemnek
van inverze.
- Kommutatív csoport: egy olyan (G, *) csoport, ahol a művelet kommutatív.
- Gyűrű: egy olyan (R, +, ·) algebrai struktúra, ahol (R, +) egy kommutatív csoport, (R, ·) egy félcsoport és a · művelet
disztributív a + műveletre nézve.
- Félháló: egy olyan (S, *) félcsoport, ahol * kommutatív művelet, és minden S-beli x elemre x * x = x.
- Háló: egy olyan (L, ˄, ˅) algebrai struktúra, ahol (L, ˄) és (L, ˅) félhálók, a műveletek disztributívak egymásra nézve,
valamint bármely L-beli x és y elemekre x ˅ (x ˄ y) = x ˄ (x ˅ y) = x.
Az algebrai struktúrák elméletében fontos szerepet játszanak a részstruktúrák és a faktorstruktúrák
(hányadosstruktúrák), valamint a különböző struktúrák közötti művelettartó leképezések (homomor zmusok). Ezekre a
fogalmakra külön gyelmet fogunk fordítani a gyűrűk és a csoportok vizsgálatánál, de nagy általánosságban a
következőket mondhatjuk.
Ha egy adott típusú algebrai struktúra alaphalmazának valamely részhalmaza ugyanolyan típusú algebrai struktúrát
alkot ugyanazokkal a műveletekkel, akkor ezt az (eredeti műveletekkel ellátott) részhalmazt egy részstruktúrának
nevezzük.
Egy algebrai struktúra S alaphalmazán értelmezett ρ ekvivalenciareláció egy kongruenciareláció, ha tetszőleges olyan
a, b, c és d S-beli elemekre, amikre aρc és bρd teljesül, bármely, a struktúrán értelmezett * művelettel (a * b)ρ(c * d) is
teljesül. Ebben az esetben a ρ által meghatározott ekvivalenciaosztályok egy ugyanolyan típusú algebrai struktúrát
alkotnak, ez az S/ρ faktorstruktúra. Az S/ρ faktorstruktúra a műveleteit az S struktúrától örökli: ha ā és b̄ jelöli az S-beli a
és b elemek ekvivalenciaosztályait, akkor . (És ez a művelet pontosan a fentebb előírt kritérium miatt lesz
jól de niált, azaz ̄ esetén garantált, hogy .)
Az (S, *) és (T, ⊙) algebrai struktúrák közti művelettartó leképezés egy olyan φ : S → T függvény, amivel tetszőleges S-
beli x és y elemekre φ (x * y) = φ (x) ⊙ φ(y). A φ : S → T függvény egy homomor zmus, ha S és T azonos típusú algebrai
struktúrák alaphalmazai, minden S-en értelmezett műveletnek van egy T-n értelmezett megfelelője, és φ mindre nézve
művelettartó.
Egy φ : S → T homomor zmusnak a képe, Im(φ) = {φ(s)|s ∈ S} mindig egy részstruktúra T-ben. A faktorstruktúrákhoz
mindig tartozik egy természetes (kanonikus) homomor zmus: egy algebrai struktúra S alaphalmazán értelmezett ρ
kongruenciareláció mellett a φ(x) = x̄ módon de niált φ : S → S/ρ leképezés egy olyan homomor zmus, aminek a képe S/p.

12.2. Gyűrűelmélet, alapfogalmak

Gyűrűnek nevezünk egy R halmazt a rajta értelmezett összeadás (+) és szorzás (·) műveletekkel együtt, ha a következő
axiómák teljesülnek:
1. Minden a, b ∈ R esetén a + b ∈ R.
2. Tetszőleges a, b, c ∈ R elemekre (a + b) + c = a + (b + c).
3. Tetszőleges a, b ∈ R elemekre a + b = b + a.
4. Van egy 0 ∈ R elem, amivel minden a ∈ R elemre 0 + a = a.
5. Minden a ∈ R elemhez van olyan b ∈ R, amivel a + b = 0.
6. Minden a, b ∈ R esetén a·b ∈ R.
7. Tetszőleges a, b, c ∈ R elemekre (a·b)·c = a·(b·c).
8. Tetszőleges a, b, c ∈ R elemekre (a + b)·c = a·c + b·c és c·(a + b) = c·a + c·b.

A fentieket röviden úgy lehetne összegezni, hogy az (R, +, ·) algebrai struktúra egy gyűrű, ha (R, +) egy kommutatív
csoport, (R, ·) egy félcsoport, és a szorzás az összeadásra nézve disztributív.

Kommutatív gyűrűn egy olyan gyűrűt értünk, ahol a szorzás is kommutatív: tetszőleges a, b ∈ R elemekre a·b = b·a.
Egységelemes gyűrűn egy olyan gyűrűt értünk, amiben a szorzásra nézve is van egységelem: 1 ∈ R, amivel minden a ∈
R elemre 1 · a = a · 1 = a, és ez az elem különbözik a 0-tól.
Testen egy olyan kommutatív egységelemes gyűrűt értünk, ahol a nullától különböző elemeknek van multiplikatív
inverze: minden 0 ≠ a ∈ R elemhez van olyan b ∈ R, amivel a·b = b·a = 1. Ha eltekintünk a kommutatív tulajdonságtól,
akkor ferdetestről beszélünk.

A gyűrűaxiómák közül az első és hatodik jelentése egyszerűen csak annyi, hogy az R halmaz az összeadásra és a
szorzásra nézve zárt, azaz bármely művelet elvégzése olyan eredményhez vezet, ami szintén eleme az R-nek. Ez következik
abból, ahogy a művelet fogalmát de niáltuk a fejezet elején, viszont szokás ezt a feltételt is belevenni az axiómák közé
(hangsúlyozva annak fontosságát). A második és hetedik axióma elvárása, hogy az összeadás és a szorzás asszociatív
műveletek legyenek. Ennek eredményeképp egy tetszőleges tagot számláló összegben (illetve szorzatban) felesleges a
zárójelezés, azaz lényegtelen, hogy az egyes összeadásokat (illetve szorzatokat) milyen sorrendben végezzük el. (Azonban
ha egy kifejezés mind a két műveletet tartalmazza, azok elvégzésének a sorrendje már lényeges. Ilyenkor a szorzás élvez
prioritást az összeadással szemben, kivéve ha a kifejezésben használt zárójelezés másképp rendelkezik.) A harmadik
axióma szerint az összeadásnak kommutatívnak kell lennie: így egy tetszőleges tagot számláló összegben lényegtelen a
tagok sorrendje, egy esetleges átrendezés nem változtat az eredményen. A negyedik és az ötödik axióma azt a feltételt köti
ki, hogy léteznie kell egy nullelemnek a gyűrűben, és erre nézve minden elemnek kell, hogy legyen negatívja. Jóllehet ezen
axiómákban a nullelem és a negatívok egyértelműsége nincs szó szerint kimondva, de ez az egyértelműség
kikövetkeztethető az axiómarendszerből: egy gyűrűben pontosan egy nullelem létezik, és erre nézve minden elemnek
pontosan egy negatívja van. Megszokott, hogy általában egy x elem negatívját –x jelöli. Végül a nyolcadik axióma a két
művelet kapcsolatáról szól: a szorzás disztributív az összeadásra nézve. A „kivonás” mint művelet nem szerepel az
axiómákban, mégis praktikus okokból érdemes használni az a – b jelölést az a + (–b) elemre. Továbbá ha n egy természetes
szám, és a egy gyűrűbeli elem, akkor an az n-tényezős a·a·…·a szorzatot, na az n-tényezős a + a+ … +a összeget, –na pedig az
n-tényezős (–a) + (–a) + … + (–a) összeget jelöli.
Egy gyűrűben lehetnek bizonyos speciális elemek, amiknek külön elnevezésük van. Egy x elem nullosztó, ha x ≠ 0, és
alkalmas nem nulla y elemmel x · y = 0 vagy y·x = 0; nilpotens, ha x ≠ 0, de valamelyik hatványa egyenlő 0-val; és
idempotens, ha x2 = x.
Néhány példa gyűrűre a legfontosabbak közül:
- Az egész / racionális / valós / komplex számok az összeadással és szorzással: (ℤ, +, ·), (ℚ, +, ·), (ℝ, +, ·) és (ℂ, +, ·).
- Az egész / racionális / valós / komplex együtthatós polinomok az összeadással és szorzással: (ℤ[x], +, ·), (ℚ[x], +, ·), (ℝ[x], +, ·)
és ℂ([x],+, ·).
- Az egész / racionális / valós / komplex együtthatós formális hatványsorok az összeadással és szorzással: (ℤ[[x]], +, ·), (ℚ[[x]]
+, ·), (ℝ[[x]], +, ·) és (ℂ[[x]], +, ·).
- Bármely n pozitív egész szám mellett az egész / racionális / valós / komplex n×n méretű mátrixok a mátrixösszeadással és a
mátrixszorzással: (Mn(ℤ), +, ·), (Mn(ℚ), +, ·), (Mn(ℝ), +, ·) és (Mn(ℂ), +, ·).
- Bármely nem üres halmazon értelmezett valós függvények a függvényösszeadással és a függvényszorzással.
- Bármely nem üres X halmaz hatványhalmaza (részhalmazainak a halmaza) a szimmetrikus di erencia- és a
metszetműveletekkel: (P(X), ⊕, ∩).
Az axiómákból bizonyos alapvető tulajdonságok gyorsan levezethetők:
- A nullelem és minden elemnek az additív inverze (negatívja) egyértelmű.
- Tetszőleges a ∈ R elemre –(–a) = a, 0·a = a·0 = 0, valamint ha a gyűrű egységelemes, akkor (–1) ·a = a· (–1) = –a.
- Tetszőleges a, b ∈ R elemekre (–a) + (–b) = –(a + b), –(a – b) = –a + b, a · (–b) = (–a) · b = (–a · b) és (–a) · (–b) = a · b.
- Tetszőleges a, b, c ∈ R elemekre az a + c = b + c egyenlőségből következik a = b.
Ez utóbbi az összeadás egyszerűsítési szabálya. Ezzel szemben a szorzás egyszerűsítési szabálya nem minden gyűrűben
érvényes: az a·c = b·c egyenlőségből általában nem következik a = b, még akkor sem, ha feltesszük, hogy c ≠ 0. Ez azzal az
egyszerű észrevétellel van összefüggésben, hogy általában egy szorzat akkor is lehet nulla, ha egyik tényező sem nulla.

Egy gyűrűt nullosztómentesnek nevezünk, ha két nem nulla elemének a szorzata sosem egyenlő nullával.

Nullosztómentes gyűrűkben érvényes az egyszerűsítési szabály: az a·c = b·c egyenlőség átrendezhető (a – b) · c = 0


alakba, és ekkor valóban vagy c = 0, vagy a – b = 0, azaz a = b.

Két gyűrű, A és B direkt szorzatát az A × B Descartes-féle szorzaton úgy de niálhatjuk, hogy a műveleteket
koordinátánként végezzük el.

Tehát A × B = {(a, b)| a ∈ A, b ∈ B}, (a1, b1)+ (a2, b2) = (a1 + a2, b1 + b2), és (a1, b1) · (a2, b2) = {a1·a2, b1·b2). A direkt szorzat
nulleleme (0, 0), és egy (a, b) elemének a negatívja –(a, b) = (–a, –b). Ha A és B egységelemes gyűrűk, akkor A × B is
egységelemes, továbbá A × B akkor és csak akkor kommutatív, ha A és B mindketten azok.

Részgyűrűk, ideálok
Homomor zmusok
Polinomgyűrűk

Részgyűrűk, ideálok

Ha az R gyűrűnek egy T részhalmaza maga is gyűrűt alkot az R-beli műveletekkel, akkor T egy részgyűrű R-ben, és ezt
a kapcsolatot T ≤ R jelöli.

Minden gyűrűnek részgyűrűje saját maga, illetve a {0} halmaz. Egy T részgyűrű R-ben valódi részgyűrű, ha T ≠ R (és ez
esetben a T < R jelölést is használhatjuk). Ahhoz, hogy egy T ⊆ R részhalmaz részgyűrű legyen, tartalmaznia kell a gyűrű
nullelemét, továbbá mindegyik elemével együtt annak a negatívját, valamint bármely két elemének az összegét és a
szorzatát is. Néhány közismert példa részgyűrűkre:
- (ℤ. +, ·) < (ℚ, +, ·) < (ℝ, +, ·) < (ℂ, +, ·)
- (ℤ[x], +, ·) < (ℚ[x], +, ·) < (ℝ[x], +, ·) < (ℂ[x], +, ·)
- (Mn(ℤ), +, ·) < (Mn(ℚ), +, ·) < (Mn(ℝ), +, ·) < (Mn(ℂ), +, ·) tetszőleges n pozitivív egész mellett,
- (ℤ, +, ·) < (ℤ[x], +, ·); (ℝ, +, ·) < (ℝ[x], +, ·); (ℂ, +, ·) < (ℂ[x], +, ·).

Az R gyűrűnek egy I részhalmazát ideálnak nevezzük, ha


1. nem üres, azaz I ≠ Ø;
2. bármely x, y ∈ I esetén x – y ∈ I;
3. bármely x ∈ I és r ∈ R esetén rx ∈ I és xr ∈ I.

Az ideál tulajdonság jelölése: I ◃ R. Minden gyűrűnek ideálja a {0} egyelemű halmaz, illetve a gyűrű maga. Ha ezeken
kívül más ideál nincs az R gyűrűben, akkor R egy egyszerű gyűrű. Egy ideál mindig egyben részgyűrű is, de a szorzásra
nézve a részgyűrűknél sokkal szigorúbb feltételt teljesít, így egy részgyűrűről ritkán mondható el, hogy ideál is lenne. Ha
az első két feltétel mellett a harmadik feltételből csak annyi teljesül, hogy bármely x ∈ I és r ∈ R esetén rx ∈ I (illetve xr ∈
I), akkor I egy bal oldali ideál (illetve jobb oldali ideál).

Egy I ideál szerinti kongruencia a következőképp de niált: a gyűrűben két elem kongruens egymással modulo I, ha a
különbségük benne van I-ben. Ennek a relációnak a jelölése: a ≡ b (mod I).

Egy adott ideál szerinti kongruencia mindig ekvivalenciareláció, sőt, a gyűrű műveletei átvihetők az
ekvivalenciaosztályok halmazára. Amennyiben ā jelöli az a elem ekvivalenciaosztályát, azaz

úgy az összeadást és a szorzást a következőképp értelmezzük az ekvivalenciaosztályokon:

Itt fontos tisztában lenni azzal, hogy ez a műveletértelmezés jól de niált, azaz ha akkor garantált,

hogy . Továbbá a kongruenciaosztályok fenti jelölése csak akkor praktikus, ha


egyértelmű, hogy melyik ideál szerinti kongruenciáról van szó. Ha az ideál megjelölése is fontos, akkor érdemes a + I-vel
jelölni az a elem I ideál szerinti kongruenciaosztályát.

Az R gyűrű I ideálja szerinti kongruenciaosztályok az imént de niált műveletekkel szintén egy gyűrűt alkotnak: az R/I
faktorgyűrűt.

Egy gyűrű ideáljai között is értelmezhetünk összeadást és szorzást:

Bármely I és J ideálokra I + J, I·J és I ∩J szintén ideálok ugyanabban a gyűrűben.

Az R gyűrűnek egy M ideálja maximális ideál, ha M ≠ R, és más (R-től különböző) ideál nem tartalmazza M-et
részhalmazként.

Az R gyűrűben egy M ideál pontosan akkor maximális, ha R/M egyszerű gyűrű.


Homomor zmusok

Egy φ : R → T leképezés homomor zmus az (R, +, ·) és (T, +, ·) gyűrűk között, ha az R gyűrű bármely két, x és y elemére
φ(x + y) = φ(x) + φ(y) és φ(x · y) = φ(x) · φ(y).

Egy φ : R → T homomor zmusra mindig igaz, hogy az R-beli nullelem képe a T-beli nullelem (azaz φ(0) = 0), és bármely
R-beli x elemre φ(–x) = –φ(x). A φ : R → T homomor zmus képe: Im(φ) = {φ(r) | r ∈ R} mindig egy részgyűrű T-ben. A φ : R
→ T homomor zmus magja: Ker(φ) = {r ∈ R | φ(r) = 0} mindig egy ideál R-ben. Megfordítva, minden R-beli I ideál magja
egy alkalmas homomor zmusnak: de niáljuk az R gyűrűnek az R/I faktorgyűrűbe való kanonikus homomor zmusát úgy,
hogy tetszőleges r elem képe legyen az kongruenciaosztály. Ez a leképezés valóban egy homomor zmus, és a magja
pontosan az I ideál. (A képe pedig az egész R/I.)
Bizonyos speciális típusú homomor zmusokra külön elnevezéseket használunk.
- Endomor zmus: homomor zmus egy adott gyűrűn belül (φ : R → R).
- Izomor zmus: homomor zmus, ami egyben egy bijektív leképezés.
- Automor zmus: izomor zmus egy adott gyűrűn belül.

Ha az R és T gyűrűk közt létezik egy izomor zmus, akkor azt mondjuk, hogy R és T izomorf egymással, és ezt a
kapcsolatot R ≅ T jelöli.

Az izomor a egy ekvivalenciareláció a gyűrűk osztályán (mivel egy izomor zmusnak az inverze is mindig
izomor zmus, két izomor zmus kompozíciója is mindig izomor zmus, továbbá bármely gyűrűn értelmezett identikus
leképezés egy izomor zmus).
Izomorf gyűrűk közt strukturális szempontból nincs különbség: ha R ≅ T, akkor bármely algebrai tulajdonság, ami az
egyik gyűrű struktúrájáról elmondható, garantáltan igaz a másikra is.

Első izomor zmustétel: tetszőleges φ : R → T gyűrű-homomor zmus esetén

Általában igaz, hogy ha egy R gyűrűben I ideál és T részgyűrű, akkor T ∩I egy ideál T-ben, illetve a T + I = {t + i | t ∈ T, i
∈ I} halmaz egy részgyűrű R-ben, ami tartalmazza az I ideált.

Második izomor zmustétel: ha I egy ideál, és T egy részgyűrű az R gyűrűben, akkor

Ha I egy ideál az R gyűrűben, akkor az R gyűrű I-t tartalmazó részgyűrűi kölcsönösen és egyértelműen
megfeleltethetők az R/I gyűrű részgyűrűivel úgy, hogy egy I-t tartalmazó T részgyűrűnek az R/I-beli T/I részgyűrű felel
meg. Ebben a megfeleltetésben R-beli (I-t tartalmazó) ideálok R/I-beli ideálokhoz kapcsolódnak.

Harmadik izomor zmustétel: ha I és J ideálok egy R gyűrűben, és I ≤ J, akkor

Polinomgyűrűk
A gyakorlatban egy R-beli együtthatós polinom alatt – ahol R egy tetszőleges gyűrűt jelöl – egy anxn + an–1xn–1 + … + a1x + a0
alakú kifejezést szoktunk érteni, ahol az ai „együtthatók” R-beli elemek, és x pedig egy „szimbólum”, szigorú matematikai
értelemben viszont ez nem tekinthető precíz de níciónak.

Egy R gyűrű feletti polinom egy R-beli elemekből álló végtelen (a0, al, a2, …) sorozat, ha létezik olyan pozitív egész n
szám, hogy minden i > n egészre ai = 0. Tehát a sorozatnak legfeljebb véges sok tagja lehet 0-tól különböző. Az ai elemek
a polinom együtthatói. Az (a0, a1, a2, …) polinom foka n, ha n a legnagyobb olyan egész szám, amire an ≠ 0. (Ha nincs
ilyen egész, azaz mindegyik együttható nulla, akkor a polinom foka nem de niált.)
Az R gyűrű feletti polinomok halmazán értelmezhetjük az összeadás és a szorzás műveleteket:

Az összeadást koordinátánként végezzük el, a szorzat pedig az a (c0, c1, c2, …) polinom, aminek az együtthatóira

teljesül. Ezekkel a műveletekkel az R feletti polinomok halmaza egy gyűrű: az R feletti polinomgyűrű.
Ezt a gyűrűt R[x] jelöli, és általánosan elfogadott, hogy az (a0, a1, a2, …) polinomra a

jelölést használjuk, amennyiben minden i > n egészre ai = 0. Az R[x] gyűrű nulleleme a zérus polinom, aminek minden
együtthatója nulla, és egy a0 + a1x + a2x2 + …+anxn polinom negatívja –a0 – a1x – a2x2 – … –anxn. Ha R egységelemes gyűrű,
akkor az x szimbólum tulajdonképpen a (0, 1, 0, 0, …) elsőfokú polinomra utal. Ekkor ugyanis a polinomok körében
értelmezett szorzás művelettel x-nek bármelyik pozitív egész kitevős xk hatványa az a polinom, amiben a k-adik együttható
1 és az összes többi 0. (Így a fentebb bevezetett jelölés valójában egy R[x]-beli egyenlőség.) Konstans polinomoknak
nevezzük a nulla fokú polinomokat, valamint a zérus polinomot. A konstans polinomok egy részgyűrűt alkotnak R[x]-ben,
és ez a részgyűrű izomorf az eredeti R gyűrűvel.
Az R[x] polinomgyűrű pontosan akkor kommutatív, ha R kommutatív, és pontosan akkor egységelemes, ha R
egységelemes.

12.3. Kommutatív egységelemes gyűrűk


Ebben a szekcióban kizárólag kommutatív egységelemes gyűrűket tárgyalunk, így ezt a két tulajdonságot az arra való külön
utalás nélkül is mindig feltesszük az éppen szóban forgó gyűrű(k)ről.
Egy kommutatív R gyűrű tetszőleges x elemére azRx = {rx | r ∈ R} halmaz egy ideál. Általánosabban, a gyűrű
tetszőleges x1, x2, …, xk elemei mellett az

halmaz egy ideál R-ben, méghozzá a legkisebb olyan ideál, ami tartalmazza az xi elemeket. Ezért ezt nevezzük az x1, x2, …,
xk elemek által generált ideálnak.

Az R gyűrűnek egy I ideálja végesen generált, ha alkalmas k pozitív egész és R-beli x1, x2, …, xk elemek mellett I = Rx1 +
Rx2 + … + Rxk. Egy I ideál főideál, ha egy elem generálja. Az R gyűrűnek egy P ideálja prímideál, ha P ≠ R, és tetszőleges
a · b szorzat a gyűrűben csak úgy lehet eleme P-nek, ha a ∈ P vagy b ∈ P. Az R gyűrűnek egy Q ideálja primer ideál, ha
tetszőleges a · b szorzat a gyűrűben csak úgy lehet eleme Q-nak, ha a ∈ Q vagy valamilyen k pozitív egész számmal bk ∈
Q.

Ezeket az ideáltípusokat a faktorgyűrűk segítségével is lehet karakterizálni: az R gyűrűben egy P ideál prímideál, ha
R/P nullosztómentes; és egy Q ideál primer ideál, ha R/Q-ban minden nullosztó nilpotens. Továbbá egy M ideál maximális,
ha R/M test. Egy maximális ideál mindig egyben prímideál is, és egy prímideál mindig egyben primer ideál is.

A kommutatív nullosztómentes gyűrűk neve integritási tartomány. Egy egységelemes integritási tartomány
főideálgyűrű, ha minden ideálja főideál. Egy kommutatív gyűrű Noether-gyűrű, ha minden ideálja végesen generált.

Oszthatóság
Euklideszi gyűrűk
Egyértelmű felbontási tartományok

Oszthatóság
Az oszthatóság fogalmát bármilyen (kommutatív) gyűrűben lehet de niálni, viszont komoly elmélete az oszthatóságnak
csak integritási tartományokban van, így ennek a témakörnek az áttekintésekor mi is csak integritási tartományokra
szorítkozunk.

Egy R integritási tartományban az x elem osztója az y elemnek (y többszöröse x-nek), ha alkalmas R-beli z elemmel y =
x · z. Ezt a kapcsolatot x | y jelöli. Az e elem egy egység, ha minden gyűrűbeli elemnek osztója. Az x és y elemek
asszociáltak (jelben x ~ y), ha egymás osztói.

Az oszthatóságot főideálokkal is lehet jellemezni: az x elem osztója az y elemnek, ha y eleme az Rx főideálnak.


Egységelemes gyűrűkben ez azzal ekvivalens, hogy Ry ⊆ Rx. Továbbá x és y asszociáltak, ha Rx = Ry, az e elem pedig egység,
ha Re = R, és ehhez annyi elég, hogy e | 1. Amennyiben x és y asszociáltak, azaz x = a · y és y = b · x alkalmas a és b elemekkel,
akkor ebből következik, hogy a és b egységek, sőt a · b = 1. Az asszociáltság egy ekvivalenciareláció.
Az a és b elemeknek egy legnagyobb közös osztója a d elem, ha d | a és d | b, továbbá d többszöröse az a és b elemek
összes közös osztójának. Az a és b elemek legkisebb közös többszöröse az m elem, ha a | m és b | m, továbbá m osztója az a és
b elemek összes közös többszörösének. Sem a legnagyobb közös osztó, sem a legkisebb közös többszörös létezése nem
garantált egy integritási tartományban. És az is előfordulhat, hogy két elemnek több legnagyobb közös osztója vagy több
legkisebb közös többszöröse van. Viszont annyi biztos, hogy ebben az esetben a legnagyobb közös osztók (illetve a legkisebb
közös többszörösök) asszociáltak egymással, pontosabban fogalmazva az asszociáltsági reláció egy-egy
ekvivalenciaosztályát alkotják.
Főideálgyűrűben bármely két (nem nulla) elemnek van legnagyobb közös osztója: az a és b elemek által generált Ra +
Rb ideál is egy főideál kell legyen, tehát alkalmas d elemmel Ra + Rb = Rd, és könnyen belátható, hogy ekkor d teljesíti a
legnagyobb közös osztó feltételeit. Hasonlóan, Ra ∩ Rb = Rm alkalmas m elemmel, és ekkor m egy legkisebb közös
többszöröse a-nak és b-nek.

Egy f elem felbonthatatlan (irreducibilis), ha nem nulla, nem egység, és csak úgy állítható elő x·y szorzatként, ha vagy
x, vagy y asszociáltja f-nek. Egy p elem prím, ha nem nulla, nem egység, és csak úgy lehet osztója egy ab szorzatnak, ha
p | a vagy p | b.

Egy felbonthatatlan elemnek az összes asszociáltja is felbonthatatlan, és egy prím elemnek az összes asszociáltja is
prím. Minden prím elem felbonthatatlan, de ennek a megfordítottja már nem minden integritási tartományban igaz.

Főideálgyűrűkben minden irreducibilis elem prím, így az irreducibilis és a prím elemek halmaza megegyezik.

Euklideszi gyűrűk
A maradékos osztás fogalmát a következőképp tudjuk értelmezni:

Egy E integritási tartomány euklideszi gyűrű, ha létezik olyan Ψ : E– {0} → ℤ ≥ 0 függvény, hogy bármely E-beli nem
zéró x és y elemekre Ψ (x) ≤ Ψ (xy), továbbá bármely E-beli a és b ≠ 0 elemekhez léteznek olyan h (hányados) és m
(maradék) elemek, amikkel a = bh + m és vagy m = 0, vagy Ψ (m) < Ψ(b).

A fenti elvárást teljesítő Ψ függvényt euklideszi függvénynek (vagy euklideszi normának) nevezzük.
Euklideszi gyűrűkre példák az alábbiak:
- (ℤ, +, ·) a szokásos maradékos osztással, ekkor Ψ (x) = |x|.
- A Gauss-egészek (ℤ[i], +, ·) gyűrűje, ahol Ψ(x) = |x|2.
- (ℚ[x], +, ·), (ℝ [x], +, ·), illetve (ℂ[x], +, ·), ahol az euklideszi függvény a fokszámot rendeli hozzá az egyes polinomokhoz.

Minden euklideszi gyűrű főideálgyűrű.

Ebből következik, hogy az euklideszi gyűrűkben is bármely két elemnek van legnagyobb közös osztója, ami
(asszociáltság erejéig) a szokásos euklideszi algoritmussal meg is kapható.

Egyértelmű felbontási tartományok

Egy R integritási tartomány egyértelmű felbontási tartomány (EFT), ha minden nullától és egységektől különböző
elem előáll irreducibilis elemek szorzataként, és ez az előállítás a szorzatbeli tényezők sorrendjétől és asszociáltságtól
eltekintve egyértelmű.

Az egyértelműségen azt értjük, hogy ha egy R-beli r elemnek r = p1 · p2·… ·ps és r = q1 · q2 · … ·qt egyaránt irreducibilis
tényezők szorzataként való előállítása, akkor s = t és az {1, 2, …, s} halmaznak egy alkalmas π permutációjával minden 1 ≤ i ≤
s egészre pi és qπ(i) asszociáltak.
Minden főideálgyűrű EFT.

És mivel minden euklideszi gyűrű főideálgyűrű, az euklideszi gyűrűk is mind egyértelmű felbontási tartományok.
További egyértelmű felbontási tartományokat kaphatunk a polinomgyűrű-konstrukcióval:

Ha R egy EFT, akkor az R [x] polinomgyűrű szintén EFT.

Az egyértelmű felbontási tartományokat a következőképp lehet általánosan jellemezni:

Egy R integritási tartomány pontosan akkor EFT, ha a következő két feltétel teljesül rá:
1. R-ben minden irreducibilis elem prím.
2. Az R-beli főideáloknak nincs végtelen, a tartalmazásra nézve szigorúan növekvő lánca.

A tételben szereplő második feltétel szerint az R-beli főideáloknak bármely növekvő I1⫅ I2 ⫅I3⫅ … láncához van olyan
pozitív egész k, hogy a lánc Ik-nál stabilizálódik, azaz Ik = Ik+1 = Ik+2 = …. Ezt a koncepciót általánosítva azt mondjuk, hogy
egy R gyűrű ideáljaira teljesül a növekvő láncfeltétel, ha R-beli tetszőleges ideáloknak nincs a tartalmazásra nézve
szigorúan növekvő végtelen lánca, azaz bármely növekvő ideállánc egy ponton stabilizálódik.

Egy kommutatív gyűrű pontosan akkor Noether-gyűrű, ha az ideáljaira teljesül a növekvő láncfeltétel.

Természetesen minden főideálgyűrű Noether-gyűrű is egyben (és így minden euklideszi gyűrű is), azonban nem
minden EFT Noether-gyűrű, és fordítva sem igaz, hogy minden Noether-gyűrű EFT lenne. Annyi igaz, hogy egy Noether-
gyűrűben minden nullától és az egységektől különböző elem előáll irreducibilis elemek szorzataként. A Noether-
tulajdonság is öröklődik polinomgyűrűkre:

Ha R egy Noether-gyűrű, akkor R[x] szintén Noether-gyűrű.

12.4. Csoportelmélet, alapfogalmak

Csoportnak nevezünk egy G halmazt egy rajta értelmezett * művelettel, ha a következő axiómák teljesülnek:
1. Minden a, b ∈ G esetén a * b ∈ G.
2. Tetszőleges a, b, c ∈ G elemekre (a * b) * c = a * (b * c).
3. Van egy olyan e ∈ G, amivel minden a ∈ G elemre e * a = a * e = a.
4. Minden a ∈ G elemhez van olyan b ∈ G, amivel a * b = b * a = e.

Az első axióma azt mondja ki, hogy a G halmaz zárt az adott * műveletre. (Jóllehet ez automatikusan következik abból,
ahogy a műveleteket de niáltuk a fejezet elején, ezt a feltételt is szokás a csoportaxiómák közé sorolni.) A második axióma
a művelet asszociatív voltát követeli meg. Ennek eredményeképp egy tetszőleges tagot számláló műveletsorban felesleges a
zárójelezés feltüntetése: a műveletek elvégzésének sorrendje nem változtat az eredményen, amennyiben a tényezők
sorrendje változatlan, pl. (a * b) * (c * (d * e)) = a * ((b * c) * (d * e)). A harmadik axióma az egységelem létezéséről szól, és ebből
következik annak az egyértelműsége is. Ha ugyanis e és f mindketten egységelemek G-ben, akkor e egységelem volta miatt e
* f = f, és f egységelem volta miatt e * f = e, tehát e = f. Hasonlóan, az axiómákból az is következik, hogy minden elemnek az
inverze egyértelmű: ha b és c inverzei a-nak, akkor

A (G, *) csoport kommutatív (Abel-csoport), ha tetszőleges a, b ∈ G elemekre a * b = b * a.

Kommutatív csoportban a többtényezős műveletsoroknál a tényezők sorrendje is lényegtelen a végeredmény


szempontjából.
Néhány példa csoportra a legfontosabbak közül:
- Az egész / racionális / valós / komplex számok az összeadással: ℤ + = (ℤ, +), ℚ+ = (ℚ, +), ℝ+ = (ℝ, +) és ℂ+ = (ℂ, +).
- A nullától különböző racionális / valós / komplex számok halmaza a szorzással: ℚx = (ℚ – {0}, ·), ℝx = (ℝ – {0}, ·) és ℂx = (ℂ –
{0}, ·).
- Tetszőleges m ≥ 2 pozitív egész esetén a modulo m kongruenciaosztályok halmaza az összeadással: ℤ+m = (ℤm, +).
- Tetszőleges m ≥ 2 pozitív egész esetén a multiplikatív inverzzel rendelkező modulo m kongruenciaosztályok halmaza a
szorzással: ℤ×m.
- Az egész / racionális / valós / komplex együtthatós polinomok az összeadással: (ℤ[x], +), (ℚ[x], +), (ℝ [x], +) és (ℂ [x], +).
- Bármely n pozitív egész szám mellett az egész / racionális / valós / komplex n × n méretű mátrixok a mátrixösszeadással:
(Mn(ℤ), +), (Mn(ℚ), +), (Mn(ℝ), +) és (Mn(ℂ), +).
- Bármely n pozitív egész szám mellett a racionális / valós / komplex n × n méretű nem nulla determinánsú mátrixok halmaza
a mátrixszorzással: GLn(ℚ), GLn(ℝ) és GLn(ℂ). (A GL betűk az angol general linear kifejezésből erednek.)
- Bármely nem üres halmaz permutációi a függvénykompozícióval.
Ez utóbbi kivételével a fenti példákat egy-egy ismert egységelemes gyűrű szolgáltatja: kommutatív csoportot kapunk,
ha csak az összeadás művelettel tekintjük egy adott gyűrű alaphalmazát, illetve csoportot kapunk úgy is, hogy a szorzás
művelettel tekintjük a gyűrű inverzzel rendelkező elemeinek a halmazát. Ezen két típus közül az előbbieket additív
csoportoknak, az utóbbiakat multiplikatív csoportoknak nevezzük.
Általánosabban additív csoportról beszélünk, ha a csoport kommutatív és a műveletét a + (összeadás) szimbólum jelöli.
Ebben az esetben az egységelemet nullelemnek nevezzük és 0-val jelöljük, egy tetszőleges a elem inverzét pedig az a
negatívjának nevezzük és –a-val jelöljük. Továbbá bármely pozitív egész n szám esetén na az n-tényezős a + a + …+ a
összegre és –na pedig az n-tényezős (–a) + (–a) + … + (–a) összegre utal. Ha pedig a csoport műveletét a · (szorzás) szimbólum
jelöli, akkor azt mondjuk, hogy a csoport multiplikatív.
Az alapértelmezés az, hogy ha egy csoportról nincs külön leszögezve, hogy additív, akkor a csoport műveletét
szorzásnak hívjuk, és eltekintünk a jelölésétől, az egységelemre az 1 szimbólumot használjuk, egy tetszőleges a elem inverze
pedig a–1. Továbbá bármely pozitív egész n szám esetén an az n-tényezős aa … a szorzatra és a–n pedig az n-tényezős a–1a–1 …
a–1 szorzatra utal. Az így de niált hatványozásra érvényesek a következő alapszabályok:
1. Bármely n egész számra az an elem inverze a–n.
2. Bármely m és n egész számokra aman = am+n és (am)n = amn.
Vigyázni kell viszont az (ab)n típusú kifejezésekkel! Ugyanis (pozitív egész n esetén) (ab)n a 2n-tényezős abab …ab
szorzatot jelenti, ami általában nem rendezhető át aa … abb … b = anbn alakba. Amennyiben viszont a és b felcserélhető
elemek, azaz ab = ba, akkor ez az átrendezés megtehető, és ekkor valóban (ab)n = anbn.
Egy további alapszabály, hogy szorzat inverze az inverzek fordított sorrendbeni szorzata: (ab)–1 = b–1a–1 (hiszen (ab)b–1a–
1 = 1 és b–1a–1(ab) = 1). Ez az elv többtényezős szorzatokra is alkalmazható: (a a … a )–1 = a –1 … a –1a –1.
1 2 n n 2 1
Egy adott a = b egyenlőséget jobbról is és balról is beszorozhatunk bármely c elemmel, tehát tetszőleges a, b, c ∈ G
elemekre a = b esetén ac = bc és ca = cb. Fordítva, az egyszerűsítés lehetősége is fennáll: az ac = bc, illetve a ca = cb
egyenlőségek bármelyikéből következik a = b. (Az első egyenlőséget jobbról érdemes beszorozni a c–1 elemmel, a másodikat
pedig balról.) Az ac = cb egyenlőség viszont általában nem egyszerűsíthető, mivelhogy a c–1 elemmel való szorzással csak
annyi következik, hogy a = cbc–1, illetve c–1ac = b.

Egy G csoport rendje az elemeinek a száma, ezt |G| jelöli.

A továbbiakban azokat a csoportelméleti alapfogalmakat tekintjük át, amik részcsoportokra, elemekre, illetve
csoportok közötti művelettartó leképezésekre vonatkoznak.

Részcsoportok
Mellékosztályok, Lagrange tétele
Normális részcsoportok
Elemek rendje
Ciklikus csoportok
Homomor zmusok
Konjugáltsági osztályok

Részcsoportok

Ha egy G csoportnak egy H részhalmaza maga is csoportot alkot a G-beli művelettel, akkor H egy részcsoport G-ben, és
ezt a kapcsolatot H ≤ G jelöli.

Minden csoportnak részcsoportja saját maga, illetve az {1} halmaz. Ez utóbbi a triviális részcsoport. Egy H részcsoport
G-ben valódi részcsoport, ha H ≠ G (és ez esetben a H< G jelölést is használhatjuk).
Ahhoz, hogy egy H ⊆ G részhalmaz részcsoport legyen, tartalmaznia kell a csoport egységelemét, továbbá mindegyik
elemével együtt annak az inverzét, valamint bármely két elemének a szorzatát is. (Egy alternatív részcsoportteszt: ha H egy
nem üres részhalmaza a G csoportnak, és bármely x, y ∈ H esetén xy–1 is eleme H-nak, akkor H garantáltan egy
részcsoport.) Néhány közismert példa részcsoportokra:
- (ℤ, +)<(ℚ, +)<(ℝ, +) < (ℂ, +)
- ℚx < ℝx < ℂx
- GLn(ℚ) < GLn(ℝ) < GLn(ℂ)

Egy csoportban tetszőleges számú részcsoport metszete is részcsoport.

Egy csoportnak bármely eleme generál egy részcsoportot: ha G egy csoport és g ∈ G, akkor a g elem összes hatványából
álló {gn | n ∈ ℤ} halmaz egy részcsoport G-ben. Ezt a g elem által generált ciklikus részcsoportnak nevezzük, jelölése (g).
(Két elem akkor és csak akkor generálja ugyanazt a részcsoportot, ha egymásnak hatványai.) A generálás fogalmát
tetszőleges részhalmazra is kiterjeszthetjük: ha G egy csoport és X ⊆ G, akkor az összes X-et tartalmazó G-beli részcsoport
metszetét nevezzük az X által generált részcsoportnak, amit 〈X〉 jelöl. (Ha X = {g} egyelemű halmaz, akkor könnyen
igazolható, hogy az X-et tartalmazó részcsoportok metszete valóban megegyezik g hatványainak a halmazával.)
Csoportok elemeinek, illetve részhalmazainak a segítségével más módon is de niálhatunk részcsoportokat. Ha G egy
csoport és X ⊆ G, az X halmaz G-beli centralizátora azokból az elemekből áll, amik X-nek minden elemével felcserélhetők:

Az x elem centralizátora CG(x) = {g ∈ G | xg = gx}. A G csoport centruma pedig a G minden elemével felcserélhető
elemek részcsoportja: Z(G) = {g ∈ G | ∀ x ∈ G(xg = gx)}.

Mellékosztályok, Lagrange tétele


Ha H egy részcsoport a G csoportban és g ∈ G, akkor a gH = {gh | h ∈ H} halmaz a H részcsoport g szerinti bal oldali
mellékosztálya, míg a Hg = {hg | h ∈ H} halmaz a g szerinti jobb oldali mellékosztálya. Egy mellékosztály elemszáma mindig
megegyezik az eredeti részcsoport elemszámával. Két jobb oldali mellékosztály, Hx és Hy mindig vagy diszjunktak, vagy
egyenlők. És pontosan akkor áll fenn a Hx = Hy egyenlőség, ha xy–1 ∈ H. Továbbá a jobb oldali mellékosztályok uniója
megegyezik G-vel (egy g elem mindig benne van a Hg mellékosztályban), így azok a G csoport alaphalmazának egy
partícióját alkotják. Ugyanez igaz a bal oldali mellékosztályokra is, azzal a kis különbséggel, hogy az xH = yH egyenlőség
akkor és csak akkor áll fenn, ha y–1 x ∈ H. A H szerinti bal oldali és a H szerinti jobb oldali mellékosztályok száma mindig
ugyanaz.

Egy G csoport H részcsoportjának az indexe a H szerinti (jobb oldali) mellékosztályok száma, amit | G : H | jelöl.

Abból a tényből, hogy a G csoport H szerinti mellékosztályok diszjunkt uniójaként áll elő, következik Lagrange tétele.

Ha H egy részcsoport a G csoportban, akkor |H| · |G : H| = |G|.

Speciálisan egy véges csoportban minden részcsoport rendje osztja a csoport rendjét.

Példák
1. A ℤ+12 additív csoportban a részcsoportnak három különböző mellékosztálya van:
és , tehát |ℤ+12 : H| = 3. (Mivel a csoport
kommutatív, a bal oldali és a jobb oldali mellékosztályai ugyanazok.)
2. A ℤ+21 multiplikatív csoportban (ami szintén kommutatív), a részcsoportnak négy különböző
mellékosztálya van: , , és
, tehát |ℤ+21 : H | = 4.

Poincaré tétele alapján egy (nem feltétlenül véges) csoport véges sok véges indexű részcsoportjának a metszete is véges
indexű:

Ha egy G csoport H és K részcsoportjai véges indexűek, akkor

Egy további fontos tény, hogy részcsoport részcsoportja esetén az indexek szorzódnak: ha H egy részcsoport a G
csoportban, és K egy részcsoport H-ban, akkor |G : K| = |G : H| · |H : K|.
Normális részcsoportok

Egy G csoport N részcsoportja normális részcsoport (vagy normálosztó), ha bármely g ∈ G elemre gN = Ng. Ezt a
kapcsolatot N ◃ G jelöli.

Tehát egy részcsoport normális, ha a jobb oldali mellékosztályai megegyeznek a bal oldali mellékosztályokkal. Evidens,
hogy kommutatív csoportban minden részcsoport normális, illetve tetszőleges G csoportban saját maga és az {1} triviális
részcsoport mindig normális részcsoportok. Egy csoport egyszerű, ha nincs valódi, nem triviális normális részcsoportja.
Egy G csoport N részcsoportjára az alábbi állítások ekvivalensek:
- Bármely g ∈ G elemre gN = Ng.
- Bármely g ∈ G elemre g–1Ng = N.
- Bármely g ∈ G elemre g–1Ng ⊆ N.
Ebben az esetben (tehát amikor N normálosztó G-ben) az N szerinti mellékosztályok egy kongruenciarelációt
határoznak meg a G csoport elemein. Ezen reláció szerint az x és y elemek pontosan akkor kongruensek (modulo N), ha
ugyanabban az N szerinti mellékosztályban vannak, azaz xN = yN.

Egy G csoport N normális részcsoportja szerinti mellékosztályok az (aN)(bN) = abN szorzási szabállyal csoportot
alkotnak, ez a G/N faktorcsoport.

Példa. Legyen G a valós 2 × 2-es invertálható felső-háromszögmátrixok csoportja, azaz

Ez egy részcsoportja GL(2, ℝ)-nek, az egységeleme , és egy elemének az inverze

. Ebben a csoportban egy normális részcsoport: tartalmazza


G egységelemét, bármelyik m és n elemével együtt az mn–1 elemet is, továbbá tetszőleges g ∈ G és n ∈ N elemekre g–
1ng ∈ N. (Ez utóbbi tényből következik, hogy minden g ∈ G-re g–1Ng ⊆ N.)

Elemek rendje

Egy G csoport g elemének a rendje a g különböző hatványainak a száma, amit |g| (vagy o (g)) jelöl.

Mivel g hatványainak a halmaza éppen a 〈g〉 részcsoport, úgy is fogalmazhatunk, hogy a g elem rendje a 〈g〉
részcsoport rendjével egyenlő. Így Lagrange tételének egy speciális esete a következő:

Véges csoportban egy elem rendje mindig osztja a csoport rendjét.

Legyen g egy G csoport tetszőleges eleme. Ha 〈g〉 véges, akkor


- 1|g| a legkisebb olyan pozitív egész k szám, amivel gk = 1.
- gn = 1 akkor és csak akkor teljesül, ha |g| osztja n-et.
- gm = gn akkor és csak akkor teljesül, ha m ≡ n (mod |g|).
〈〉
Ha g végtelen, akkor
- gn = 1 akkor és csak akkor teljesül, ha n = 0.
- gm = gn akkor és csak akkor teljesül, ha m = n.
Ha g egy véges rendű elem, akkor bármely hatványának a rendje megkapható g rendjéből és a kitevőből:

Ha g egy végtelen rendű elem, akkor természetesen bármely nem triviális hatványa szintén végtelen rendű.
Ciklikus csoportok

Egy G csoport ciklikus, ha alkalmas g ∈ G elemmel G = 〈g〉.


Minden ciklikus csoport kommutatív, ugyanis egy adott elem hatványai mindig felcserélhetők egymással: gkgl = gk+l =
gl+k = glgk.

Példa. A modulo 18 invertálható kongruenciaosztályok csoportja ciklikus, ugyanis


minden eleme előáll alkalmas hatványaként:

Tehát . Egyébként az is igaz, hogy .

Tetszőleges pozitív egész n számhoz van n rendű ciklikus csoport, pl. ℤ+n. Ezt a csoportot ugyanis az elem mindig
generálja. Abban az esetben, ha n prímszám, sokkal több is igaz:

Minden prímrendű csoport ciklikus.

Ciklikus csoportok részcsoportjairól a csoportrendtől függően egy teljes listát lehet készíteni. Legyen G = 〈g〉 egy
ciklikus csoport. Ha G véges, akkor minden részcsoportja H = 〈gd〉 alakban adható meg, ahol d a | g | elemrend egy
pozitív osztója. Ekkor a H részcsoport rendje | g | /d. Ha G végtelen, akkor minden részcsoportja H = (gk) alakban adható
meg, ahol k egy nem negatív egész. Ekkor a k = 0 eset kivételével (amikor is H = {1}) H szintén végtelen. Röviden összegezve:

Egy ciklikus csoport minden részcsoportja is ciklikus.

Példa. Mint korábban láttuk, egy 6 rendű ciklikus csoport. A csoportrend osztói: 1, 2, 3 és 6, ennek
megfelelően ebben a ciklikus csoportban négy részcsoport van: {1} rendje 1, rendje 2,
rendje 3 és ℤ×18 = 〈5̄〉 rendje 6. Hasonlóan, minden 6 rendű ciklikus csoportban négy
részcsoport van, amiknek a rendjei 1, 2, 3 és 6.

Ha G = 〈g〉 egy véges ciklikus csoport, természetesen mindegyik eleme generál egy részcsoportot, így bármely k egész
számhoz található olyan d osztója a csoport rendjének, amivel 〈gk〉 = 〈gd〉. Ez a d osztó pedig nem más, mint a
csoportrend és a k kitevő legnagyobb közös osztója:

Homomor zmusok

Egy φ : G → H csoportok közötti leképezés homomor zmus, ha a G csoport bármely két, x és y elemére φ(xy) =
φ(x)φ(y).

Fontos tisztában lennünk azzal, hogy a φ(xy) = φ(x)φ(y) egyenlőség bal oldalán a G-beli művelet, a jobb oldalán pedig a
H-beli művelet elvégzése szerepel. Az alapértelmezés szerint ezeket a műveleteket nem tüntettük fel, de ha mondjuk a G
csoport műveletét *, a H csoport műveletét pedig ⊙ jelöli, akkor egy φ: G → H homomor zmusnak a φ(x * y) = φ(x) ⊙ φ(y)
egyenlőséget kell teljesítenie minden x, y ∈ G elemekre.
Egy φ : G → H homomor zmusra mindig igaz, hogy a G-beli egységelem képe a H-beli egységelem (azaz φ(1) = 1), és
bármely G-beli x elemre φ(x–1) = φ(x)–1. A φ : G → H homomor zmus képe: Im(φ) = {φ(g) |g ∈ G} mindig egy részcsoport H-
ban. A φ: G → H homomor zmus magja: Ker(φ) = {g ∈ G | φ(g) = 1} mindig egy normális részcsoport G-ben. Megfordítva,
minden G-beli N normális részcsoport magja egy alkalmas homomor zmusnak: de niáljuk a G csoportnak a G/N
faktorcsoportba történő kanonikus homomor zmusát úgy, hogy tetszőleges g elem képe legyen a gN mellékosztály. Ez a
leképezés valóban egy homomor zmus, és a magja pontosan az N normálosztó. (A képe pedig az egész G/N.)

Példák
1. Legyen n egy pozitív egész. Ekkor a det: GL(n, ℂ) → ℂx determináns leképezés egy homomor zmus, hiszen
bármely két n × n méretű komplex mátrixra det(AB) = det(A)det(B). Ennek a homomor zmusnak a magja SL(n,
ℂ), az 1 determinánsú komplex mátrixok halmaza, ami tehát így egy normális részcsoport GL(n, ℂ) -ben. (Az SL
betűk az angol special linear kifejezésből erednek.)
2. Ha G = 〈g〉 egy m rendű és H = 〈h〉 egy n rendű ciklikus csoport, a φ(gk) = hk leképezési szabály akkor és csak
akkor ad meg egy jól de niált φ : G → H leképezést, ha n osztója m-nek. (Ugyanis szükséges, hogy gk = gl esetén
mindig hk = hl is teljesüljön.) Ekkor viszont φ egy homomor zmus: bármely k és l egészekre

3. Az abszolút érték függvény egy ℂx → ℝx homomor zmus, hiszen komplex számokra |xy| = |x| · |y| mindig
teljesül. Ennek a homomor zmusnak a képe a pozitív valós számok multiplikatív csoportja, a magja pedig a
komplex egységkör: {x ∈ (: |x| = 1}.

Akárcsak a gyűrűknél, a csoportok esetében is endomor zmusnak nevezünk egy adott G csoporton belüli φ : G → G
homomor zmust, izomor zmusnak nevezünk egy olyan homomor zmust, ami egyben egy bijektív leképezés, és
automor zmusnak nevezünk egy adott csoporton belüli izomor zmust.

Ha a G és H csoportok közt létezik egy izomor zmus, akkor azt mondjuk, hogy G és H izomorf csoportok, és ezt a
kapcsolatot G ≅ H jelöli.

Az izomor a egy ekvivalenciareláció a csoportok halmazán (mivel egy izomor zmusnak az inverze is mindig
izomor zmus, és két izomor zmus kompozíciója is mindig izomor zmus, továbbá bármely csoporton értelmezett
identikus leképezés egy izomor zmus).
Izomorf csoportok közt strukturális szempontból nincs különbség: ha G ≅ H, akkor bármely algebrai tulajdonság, ami
az egyik csoport struktúrájáról elmondható, garantáltan igaz a másikra is.
Itt érdemes megjegyezni, hogy két azonos rendű ciklikus csoport mindig izomorf egymással. (A fenti 2. példában m = n
esetén egy izomor zmust kapunk.)

Első izomor zmustétel: tetszőleges φ : G → H csoporthomomor zmus esetén

Általában igaz, hogy ha egy G csoportban N normálosztó és H részcsoport, akkor a H ∩N részcsoport normális H-ban,
illetve a HN= {hn | h ∈ H, n ∈ N} halmaz egy részcsoport G-ben.

Második izomor zmustétel: ha N egy normálosztó és H egy részcsoport a G csoportban, akkor

Ha N egy normális részcsoport a G csoportban, akkor a G csoport N-et tartalmazó részcsoportjai kölcsönösen és
egyértelműen megfeleltethetők a G/N csoport részcsoportjaival úgy, hogy egy N-et tartalmazó H részcsoportnak a G/N-beli
H/N részcsoport felel meg. Ebben a megfeleltetésben G-beli (N-et tartalmazó) normálosztók G/N-beli normálosztókhoz
kapcsolódnak.

Harmadik izomor zmustétel: ha N és M normális részcsoportok egy G csoportban és N ≤ M, akkor

Bármely G csoport automor zmusai szintén csoportot alkotnak (a kompozíció műveletével), amit G
automor zmuscsoportjának nevezünk, és a jelölése Aut(G). Ennek a csoportnak az egységeleme az I : G → G identikus
leképezés. Továbbá minden g ∈ G elem meghatároz egy τg : G → G automor zmust a τg(x) = g–1xg leképezési szabállyal. Egy
ilyen típusú automor zmus neve belső automor zmus, magát a leképezést pedig a g elemmel való konjugálásnak
nevezzük. A belső automor zmusok egy normális részcsoportot alkotnak az Aut(G) automor zmuscsoportban, amit
Inn(G) jelöl.

Konjugáltsági osztályok
Egy G csoport x és y elemei konjugáltak egymással, ha alkalmas g ∈ G elemmel y = g–1xg. Adott G csoporton belüli
konjugáltság egy ekvivalenciareláció a csoport elemei között, egy ehhez tartozó ekvivalenciaosztály neve konjugáltsági
osztály (vagy konjugáltosztály). Ha G egy véges csoport, x ∈ G és Cx az x elem G-beli konjugáltosztálya, akkor fennáll az
alábbi egyenlőség:

Tehát az x elem konjugáltjainak a száma megegyezik a centralizátorának az indexével.


A konjugálást részcsoportokon is lehet értelmezni: ha H egy részcsoport a G csoportban és g ∈ G, akkor a g–1Hg = {g–1hg
| h ∈ H} halmaz szintén egy részcsoport G-ben, ezt a H részcsoport g elemmel való konjugáltjának hívjuk. Konjugált
részcsoportok rendje megegyezik: | g–1Hg | = | H |. A részcsoportok halmazán értelmezett konjugáltság szintén egy
ekvivalenciareláció.

12.5. További témák a csoportelméletből


Ebben a fejezetben először a szimmetrikus csoportokról ejtünk pár szót, majd néhány olyan tételt említünk meg, amik a
véges csoportok struktúráiba nyújtanak valamelyest egy kis betekintést. A szimmetrikus csoportok fontosságát az adja,
hogy viszonylag könnyen érthető példákat nyújtanak véges és nem kommutatív csoportokra.

Szimmetrikus csoportok
Direkt szorzat
Cauchy és Sylow tételei

Szimmetrikus csoportok

Bármely nem üres T halmaz összes permutációjának a halmaza a kompozíció műveletével csoportot alkot. Ezt a
csoportot a T halmaz szimmetrikus csoportjának nevezzük, általános jelölése ST.

Az ST csoport egységeleme az I : T → T identikus leképezés, amire minden t ∈ T esetén I(t) = t. Továbbá minden ST-beli
permutációnak mint T → T leképezésnek létezik inverze, ami szintén egy permutáció (így eleme ST-nek), valamint két
permutáció kompozíciója ugyancsak egy permutáció.
Ha n egy pozitív egész, az Sn n-edfokú szimmetrikus csoport alatt a T = {1, 2, … …, n} halmaz permutációinak csoportját
értjük. Ennek a csoportnak a rendje n!.
A T = {1, 2, …, n} halmaznak egy f : T → T permutációját jelölhetjük az

mátrixszal vagy ciklusfelbontással. Ez utóbbinak a lényege, hogy egy (a1, a2, …, ak) ciklus arra a p permutációra utal, amivel
p(a1) = a2, p(a2) = a3, …, p(ak) = a1. Természetesen nem minden permutáció egy ciklus, de minden permutáció felírható
diszjunkt ciklusok szorzataként, és ez az előállítás a ciklusok sorrendjétől eltekintve egyértelmű.

Példa. A T = {1, 2, 3, 4, 5, 6} halmazon de niált permutáció ciklusfelbontása f = (1, 5)(2, 3, 6)


(4), ugyanis f(1) = 5, f(5) = 1, f(2) = 3, f(3) = 6, f(6) = 2 és f(4) = 4. Kicsit rövidebben írhatjuk azt is, hogy f = (1, 5) (2, 3, 6), a
(4) „ciklus” elhagyása ugyanis arra utal, hogy f(4) = 4.

A kettő hosszúságú ciklusok neve transzpozíció. Minden permutáció előáll transzpozíciók szorzataként. Jóllehet ez az
előállítás távolról sem egyértelmű, viszont a szorzatban szereplő transzpozíciók számának a paritása már az: egy
permutáció vagy csak páros sok, vagy csak páratlan sok transzpozíciónak lehet a szorzata. Az előbbi esetben azt mondjuk,
hogy a permutáció páros, az utóbbi esetben a permutáció páratlan.

Példa. Az előbbi f = (1, 5) (2, 3, 6) permutáció páratlan, ugyanis előállítható három transzpozíció szorzataként: f = (1, 5)
(2, 6)(2, 3). (Amennyiben a transzpozíciók kompozícióját jobbról balra haladva végezzük el.)

Két páros vagy két páratlan permutáció szorzata páros. Páros és páratlan permutáció szorzata páratlan. Páros
permutáció inverze páros, és páratlan permutáció inverze páratlan. Ezt úgy is összegezhetjük, hogy tetszőleges pozitív
egész n esetén a

leképezés egy csoporthomomor zmus Sn-ből a multiplikatív {1, –1} csoportba. Ennek a leképezésnek a magja, ami a
szimmetrikus csoport páros permutációiból áll, az An n-edfokú alternáló csoport. Ha n ≥ 2, az An csoport rendje n!/2.
Egy permutáció ciklusfelbontásából több, az adott permutációra vonatkozó hasznos információ kiolvasható:
- Egy permutáció akkor és csak akkor páros, ha a ciklusfelbontásában páros sok páros hosszúságú ciklus szerepel.
- Egy f permutáció rendje az f ciklusfelbontásában szereplő ciklusok hosszainak a legkisebb közös többszöröse.
- Két permutáció akkor és csak akkor konjugált az Sn szimmetrikus csoportban, ha a ciklusszerkezetük megegyezik.

Direkt szorzat

Két csoport, A és B direkt szorzatát az A × B Descartes-féle szorzaton úgy de niálhatjuk, hogy a műveletet
koordinátánként végezzük el.

Tehát A × B = {(a, b) | a ∈ A, b ∈ B} és (a1, b1) · (a2, b2) = (a1, a2, b1b2). A direkt szorzat egységeleme (1, 1), és egy (a, b)
elemének az inverze (a, b)–1 = (a–1, b–1). Az A × B csoport akkor és csak akkor kommutatív, ha A is és B is az. A direkt szorzatot
nemcsak két, hanem több csoport esetében is megkonstruálhatjuk: a csoportok alaphalmazának Descartes-féle szorzatán a
csoportműveletet koordinátánként végezzük el. Egy direkt szorzat rendje megegyezik a tényezők rendjeinek a szorzatával,
a direkt szorzat elemeinek a rendjét meg az | (a, b) | = lkkt (|a|, |b|) képlettel kaphatjuk meg. Illetve többtényezős direkt
szorzat esetén is igaz, hogy a direkt szorzat egy elemének a rendje a koordináták rendjeinek a legkisebb közös többszöröse.
Az A × B direkt szorzatban az Ā = {(a, 1) |a ∈ A} halmaz egy A-val izomorf, a halmaz pedig egy B-
vel izomorf normális részcsoportot alkot, amikre igaz, hogy és . Ennek az észrevételnek a
megfordítása a következőképp igaz:

Ha a G csoportban M és N normális részcsoportok, amikre M ∩N= {1} és MN = G, akkor G izomorf az M × N direkt


szorzattal.

Minden véges kommutatív csoport megkonstruálható ciklikus csoportokból a direkt szorzat segítségével, erről szól a
véges Abel-csoportok alaptétele.

Minden véges kommutatív csoport prímhatvány rendű ciklikus csoportok direkt szorzatával izomorf. Továbbá ez a
felbontás direkt szorzatra a tényezők sorrendjétől eltekintve egyértelmű.

Példa. Összesen hat 200 rendű kommutatív csoport van (izomor a erejéig), és ezek a következők: C8 × C25, C2 × C4 ×
C25, C2 × C2 × C2 × C25, C8 × C5 × C5, C2 × C4 × C5 × C5 és C2 × C2 × C2 × C5 × C5, ahol Ci általában egy i rendű ciklikus
csoportot jelöl.

Az m és n rendű ciklikus csoportok Cm × Cn direkt szorzata akkor és csak akkor izomorf a Cmn ciklikus csoporttal, ha m
és n relatív prímek.

Cauchy és Sylow tételei


Végül azt a kérdéskört tekintjük át, hogy Lagrange tétele (a véges csoportok részcsoportjainak és elemeinek rendjeiről)
mennyire fordítható meg. Mint azt Lagrange tétele kimondja, egy véges csoportban az elemek és részcsoportok rendjei
osztják a csoport rendjét. Az általában nem igaz, hogy ha egy k pozitív egész szám osztja a G véges csoport rendjét, akkor G
tartalmazna k rendű elemet vagy k rendű részcsoportot. Viszont bizonyos speciális esetekben garantálható az adott rendű
elem, illetve részcsoport létezése.
Cauchy tétele:

Ha egy p prímszám osztja a G véges csoport rendjét, akkor G-ben van p rendű elem.

Sylow első tétele:


Ha egy p prímszám valamely pa hatványa osztja egy G véges csoport rendjét, akkor G-ben van pa rendű részcsoport.

Legyen p egy tetszőleges prímszám. Egy G véges csoport P részcsoportja Sylow p-részcsoport G-ben, ha P rendje
megegyezik a legnagyobb, G rendjét osztó p-hatvánnyal. Ezen részcsoportok halmazát Sylp (G) jelöli.

Egy Sylow p-részcsoportnak természetesen minden konjugáltja is Sylow p-részcsoport (hiszen konjugált részcsoportok
rendje megegyezik). Viszont az is igaz, hogy egy adott Sylow p-részcsoportból konjugálással már minden Sylow p-
részcsoport megkapható. Ezt mondja ki Sylow második tétele:

Egy véges G csoport bármely két Sylow p-részcsoportja konjugált G-ben.

Azaz ha P1 és P2 ugyanazon p prímszámhoz tartozó Sylow részcsoportok G-ben, akkor alkalmas G-beli g elemmel P2 = g–
1P g. Következésképp:
1

Egy P Sylow p-részcsoport akkor és akkor normálosztó a G csoportban, ha az az egyetlen G-beli Sylow p-részcsoport.

Tehát előfordulhat, hogy egy csoportban (adott p prímszám mellett) csak egyetlen Sylow p-részcsoport van. Általában
a Sylow p-részcsoportok lehetséges számáról szól Sylow harmadik tétele:

Egy G véges csoport p prímszámhoz tartozó Sylow részcsoportjainak a száma egyrészt osztja a G rendjét, másrészt
kongruens 1-gyel modulo p.

Példa. Bizonyítjuk, hogy minden 15 rendű csoport ciklikus. Legyen ugyanis G egy tetszőleges 15 rendű csoport, ekkor
Sylow első tétele alapján G tartalmaz egy 3 rendű M és egy 5 rendű N részcsoportot. Továbbá Sylow harmadik tétele
miatt a Sylow 3-részcsoportok száma 15-nek egy olyan osztója, ami kongruens 1-gyel modulo 3, így ez csak 1 lehet.
Hasonlóan, a Sylow 5-részcsoportok száma 15-nek egy olyan osztója, ami kongruens 1-gyel modulo 5, ami megint
csak 1 lehet. Így mindkét Sylow részcsoport, M és N egyaránt normális részcsoport G-ben.
Lagrange tétele alapján M ∩N ≤ M miatt M ∩N rendje osztója 3-nak és M ∩N ≤ N miatt M ∩N rendje osztója 5-nek,
ebből pedig |M ∩N| = 1, azaz |M ∩N| ={1}. Hasonlóan, MN szintén egy részcsoport G-ben, M ≤ MN miatt 3 osztja MN
rendjét, és N ≤ MN miatt 5 osztja MN rendjét, ebből pedig | MN | = 15, azaz MN = G.
Mivel M és N normálosztók G-ben, | M ∩N | ={1} és MN = G, ebből az következik, hogy G ≅ M × N. Továbbá M és N
ciklikus csoportok (mint minden prímrendű csoport), tehát M = 〈m〉 és N = 〈n〉 alkalmas m és n elemekkel,
amikre |m| = 3 és |n| = 5. Ekkor viszont az (m, n) elem rendje az M × N direkt szorzatban 15, ami megegyezik M × N
rendjével, így M × N = 〈(m, n)〉 egy ciklikus csoport. Tehát a vele izomorf G is ciklikus.

12.6. Testek és Galois-csoportok


Mint már korábban de niáltuk a test fogalmát: testnek nevezünk egy olyan kommutatív egységelemes gyűrűt, ahol a
nullelemet kivéve minden elemnek van multiplikatív inverze. A legismertebb példákat testre a racionális számok, a valós
számok, illetve a komplex számok szolgáltatják a szokásos összeadás és szorzás műveletekkel, de további példákat is
kaphatunk bizonyos konstrukciókkal, amiket az alábbiakban vázolunk.

Egy R kommutatív egységelemes gyűrűben az M ideál pontosan akkor maximális ideál, ha az R/M faktorgyűrű test.

Az M = {0} választással ez a tétel tehát azt mondja ki, hogy egy R kommutatív egységelemes gyűrű pontosan akkor test,
ha nincs valódi ideálja.
Az egész számok gyűrűjében minden maximális ideál (p) = pℤ = {px|x ∈ ℤ} alakban adható meg valamely p prímszám
mellett. Ekkor a ℤ/(p) faktorgyűrű, ami valójában a modulo p kongruenciaosztályok gyűrűje, egy p elemű test jelölése ℤp.
Legyen p(x) egy racionális együtthatós, ℚ[x]-ben irreducibilis polinom! Ekkor az általa generált ideál egy maximális
ideál ℚ[x]-ben, következésképp a ℚ[x]//(p(x)) faktorgyűrű egy test. Ennél általánosabban is igaz a következő:

Ha R egy főideálgyűrű, és p ∈ R, a (p) ideál szerinti R/(p) faktorgyűrű pontosan akkor test, ha p egy irreducibilis elem
R-ben.

Egy másik ismert konstrukció, amivel (bizonyos esetekben) testeket kaphatunk, gyűrűknek „hányadosokkal való
kibővítése”, azt azonban precízen meg kell fogalmaznunk, hogy mit is értünk ezen. Legyen R egy kommutatív (nem
feltétlenül egységelemes) gyűrű, és jelölje S az R gyűrűnek egy olyan nem üres részhalmazát, ami zárt a szorzásra, nem
tartalmazza a nullát, és nem tartalmaz nullosztót sem. Tekintsük azt a relációt az R × S Descartes-féle szorzaton, ahol (a, x)~
(b, y) akkor és csak akkor, ha ay = bx. Könnyen ellenőrizhető, hogy ez egy ekvivalenciareláció (de ahhoz, hogy ez a reláció
tranzitív legyen, valóban fel kell tenni, hogy az S halmaz ne tartalmazzon nullosztót). Jelölje a/x általában egy (a, x) ∈ R × S
elem ekvivalenciaosztályát! Ezen ekvivalenciaosztályok halmaza egy kommutatív egységelemes gyűrűt alkot a következő
műveletekkel:

Ezt a gyűrűt az R gyűrű S szerinti hányadosgyűrűjének nevezzük, jelölése S–1R.

Ha R egy integritási tartomány, és S = R– {0}, akkor az S–1R hányadosgyűrű egy test, amit az R hányadostestének
nevezünk.

Ilyen konstrukcióval kaphatjuk meg a racionális számok testét az egész számok gyűrűjéből (ha S az összes nullától
különböző egész szám halmaza), illetve a valós racionális törtfüggvények testét a valós polinomok gyűrűjéből (ha S az
összes nem zéró valós polinom halmaza).
Egy R integritási tartomány hányadosteste a legkisebb R-et tartalmazó test abban az értelemben, hogy ha T egy
tetszőleges R-et tartalmazó test, akkor T-ben biztosan van olyan E résztest, ami szintén tartalmazza R-et, és izomorf az R
hányadostestével.

Legyen T egy test. Ha létezik olyan pozitív egész m szám, hogy m1 = 0 (azaz az m tagú 1 + 1 + … + 1 összeg nullával
egyenlő), akkor a legkisebb ilyen pozitív egész a T test karakterisztikája. Ha nincs ilyen szám, akkor a T
karakterisztikája nulla.

Egy test karakterisztikája mindig vagy nulla, vagy prímszám. Ha T egy test, x ∈ T és m ∈ ℤ, az mx = 0 egyenlőség akkor
és csak akkor áll fenn, ha m többszöröse a karakterisztikának, vagy x = 0.
Elemszámra nézve vannak véges és végtelen testek. Véges testekre a következő módon kaphatunk példákat: ha g(x) egy
n-edfokú irreducibilis polinom a ℤp prímtest felett, akkor a ℤp[x]/(g(x)) faktorgyűrű egy pn elemszámú és p
karakterisztikájú test, ami tartalmaz a ℤp-vel izomorf résztestet. (A konstans polinomok modulo g(x) kongruenciaosztályai
természetes módon egy ℤp-vel izomorf résztestet alkotnak.) Izomor a erejéig ilyen módon az összes véges test előállítható.

Ha T egy véges test, akkor az elemszáma prímhatvány, pontosabban T karakterisztikájának egy hatványa. Továbbá
ekkor bármely T-vel azonos elemszámú test izomorf T-vel.

Mindig igaz, hogy ha egy T test karakterisztikája a p prímszám, akkor T tartalmaz ℤp-vel izomorf résztestet (ami a 0, 1,
1 + 1, 1 + 1 + 1, … elemekből áll). Ha pedig egy T test karakterisztikája nulla, akkor T tartalmaz ℚ-val izomorf résztestet.

Testbővítések
Algebrai elemek
Egyszerű bővítések
Algebrai bővítések
Galois-elmélet

Testbővítések

A T test egy bővítése F-nek, ha F résztest T-ben.

Mint ahogy általában az algebrai struktúrák elméletében fontos szerepet tölt be a struktúrák és részstruktúráik közötti
kapcsolat vizsgálata, ugyanúgy a testelméletnek is egy igen fontos része a testbővítések tanulmányozása, illetve azok
osztályozása különböző szempontok szerint. Az első fontos észrevétel, hogy egy test mindig vektortérként is tekinthető
bármelyik részteste felett, ugyanis ha T | F egy tetszőleges testbővítés, akkor a T-ben de niált összeadással és T eleméinek
az F elemeivel való szorzásával, mint skalárszorzással teljesülnek a vektortér-axiómák. Például a komplex számok ℂ teste
egy kétdimenziós vektortér a valós ℝ test felett (egy lehetséges bázis az {1, i} rendszer), és a valós test egy végtelen
dimenziós vektortér a racionális számok ℚ teste felett. Egy másik fontos tény, hogy bármely T | F testbővítés esetén a T és
az F testek karakterisztikája megegyezik.
A T | F testbővítés foka – amit [T : F] jelöl – a T-nek mint F feletti vektortérnek a dimenziója. Véges bővítésnek
nevezzük azt a testbővítést, aminek a foka véges.

A T|F testbővítésben E egy közbülső test, ha E egy F-et tartalmazó részteste T-nek, azaz F ≤ E ≤ T. Ilyenkor az egymás
utáni bővítések fokai szorzódnak:

Ha E egy közbülső test a T | F bővítésben, akkor [T : E] · [E : F] = [T : F].

A tételbeli egyenlőség úgy értendő, hogy ha a bal oldali szorzatnak valamelyik tényezője végtelen, akkor T | F is egy
végtelen bővítés.

Algebrai elemek

A T testnek egy t eleme algebrai egy F résztest felett, ha a t hatványai lineárisan összefüggő rendszert alkotnak a T-
ben, mint F feletti vektortérben. Ellenkező esetben t egy transzcendens elem F felett.

Tehát ha a T | F bővítésben t algebrai F felett, akkor alkalmas pozitív egész n szám, és F-beli (nem mind nulla) f0, f1, …,
fn elemek mellett f0 + f1t + … + fntn = 0. Azt is mondhatjuk, hogy t pontosan akkor algebrai elem az F test felett, ha gyöke egy
F[x]-beli nem zéró polinomnak. Egy testnek minden eleme algebrai saját maga felett (hiszen t ∈ T gyöke az x – t ∈ T[x]
polinomnak).

Legyen T | F egy testbővítés és t ∈ T egy algebrai elem F felett! Ekkor pontosan egy olyan normált irreducibilis p(x)
polinom van F[x]-ben, amire p(t) = 0. Továbbá bármely g(x) ∈ F[x] polinomra g(t) = 0 akkor és csak akkor teljesül, ha
p(x) osztója g(x)-nek.

A tételben szereplő p(x) polinomot a t elem minimálpolinomjának hívjuk, p(x) foka pedig a t elem foka.

Példák
1. A ℂ | ℚ bővítésben egy algebrai elem. Egyszerű számolással:

tehát t gyöke a p(x) = x4 + 6x2 + 49 normált, racionális együtthatós polinomnak.


Belátható, hogy p(x) irreducibilis ℚ[x]-ben, így p(x) a t komplex szám ℚ feletti minimálpolinomja, és t foka 4.
2. Ha a ℂ | ℝ bővítésben tekintjük ugyancsak a komplex számot, akkor itt a t foka 2, ugyanis a p(x) =
x4 + 6x2 + 49 polinom ℝ [x]-ben másodfokú polinomok szorzatára bomlik:
, és a két tényező közül az az ℝ [x]-ben
irreducibilis másodfokú polinom, aminek t gyöke.
3. Az e = 2,71828… és π = 3,141 59… számok közismerten transzcendensek ℚ felett.

Egyszerű bővítések

Ha T | F egy testbővítés és u ∈ T, az u által generált F(u) résztest a T test összes, F-et és u-t tartalmazó résztestének a
metszete. Általánosabban, ha S ⊆ T, akkor az ezen részhalmaz által generált F(S) résztest a T összes, az F-et és az S
részhalmazt tartalmazó résztestének a metszete. Ha F(u) = T (valamilyen u ∈ T mellett), akkor T|F egy egyszerű
bővítés.

Amennyiben u algebrai F felett, és a foka n, akkor az 1, u, u2, …, un–1 elemek egy bázist alkotnak F(u)-ban, mint F feletti
vektortérben, tehát az F(u) résztest minden eleme egyértelműen áll elő az u elemnek egy legfeljebb n – 1 fokú
polinomjaként. Ekkor F(u) izomorf az F[x]/(p(x)) faktorgyűrűvel, ahol p(x) az u minimálpolinomja. Ha azonban u
transzcendens F felett, akkor F(u) minden eleme g(u)/h(u) alakban adható meg alkalmas g(x), h(x) ∈ F[x] polinomokkal. (Itt
egyértelműségről nyilván csak akkor beszélhetünk, ha kikötjük, hogy g(x) és h(x) egymáshoz relatív prím polinomok,
továbbá hogy h(x) normált.) Ekkor F(u) izomorf az F feletti racionális törtfüggvények F(x) testével. Egy egyszerű bővítés
tehát attól függően véges vagy végtelen, hogy algebrai vagy transzcendens elem generálja.

Nulla karakterisztika esetén minden véges bővítés egyszerű.


Algebrai bővítések

Algebrai bővítésnek nevezünk egy olyan T | F testbővítést, ahol a T testnek minden eleme algebrai az F felett. Egy
testbővítés transzcendens, ha nem algebrai. Tiszta transzcendens bővítésnek nevezünk egy olyan T | F testbővítést,
ahol T = F(S) alkalmas S ⊆ T részhalmazzal úgy, hogy mindegyik s ∈ S elem transzcendens az F(S – {s}) test felett.
Ilyenkor azt mondjuk, hogy S egy algebrailag független halmaz F felett.

Egyszerű, de fontos észrevétel, hogy minden véges testbővítés algebrai, így például a ℂ | ℝ bővítés is. (Minden komplex
szám gyöke egy irreducibilis valós polinomnak.) Viszont léteznek végtelen algebrai bővítések is: például a racionális test
felett algebrai komplex számok A halmaza egy testet alkot, amivel A | ℚ egy végtelen algebrai bővítés.

Algebrai elemek által generált bővítés algebrai: ha T = F(S), és S minden eleme algebrai F felett, akkor ugyanez T
minden eleméről is elmondható.

Láttuk tehát, hogy ha adott egy T | F testbővítés, akkor a T test elemeit osztályozni lehet aszerint, hogy algebraiak vagy
transzcendensek F felett, továbbá az algebrai elemeket is osztályozhatjuk a fokszámaik, illetve a minimálpolinomjaik
szerint.
Fordított megközelítéssel, kiindulhatunk abból, hogy adott egy F test és egy g(x) ∈ F[x] nem konstans polinom, és
feltehetjük a kérdést, hogy van-e olyan K | F testbővítés, ahol egy alkalmas k ∈ K elemre g(k) = 0. Illetve van-e olyan K | F
testbővítés, ahol a g(x) polinom K felett lineáris tényezők szorzatára bomlik? A válasz igenlő.

Legyen g(x) egy n-edfokú polinom az F test felett, n pozitív egész. Ekkor létezik olyan K|F testbővítés, hogy g(x) = c(x –
k1)(x – k2) … (x – kn) alkalmas K-beli c, k1, …, kn elemekkel és K = F(k1, …, kn).

A tételben szereplő K test izomor a erejéig egyértelmű, és ezt a g(x) polinom F feletti felbontási testének nevezzük.

Egy algebrai K | F testbővítés normális, ha minden olyan F feletti irreducibilis polinom, aminek K-ban gyöke van,
lineáris tényezők szorzatára bomlik fel K felett.

A feltétel, ami ebben a de nícióban szerepel, nem kimondottan praktikus arra, hogy egy adott testbővítést
leteszteljünk a normális tulajdonság szempontjából. Viszont igaz a következő:

Egy véges K | F bővítés akkor és csak akkor normális, ha a K test felbontási teste F felett egy alkalmas g(x) ∈ F[x]
polinomnak.

A g(x) ∈ F[x] polinom szeparábilis, ha az F feletti felbontási testében g(x)-nek nincs többszörös gyöke. Ha K | F egy
testbővítés, a k ∈ K elem szeparábilis F felett, ha egyrészt algebrai, másrészt az F feletti minimálpolinomja
szeparábilis. A K | F testbővítés szeparábilis, ha K minden eleme szeparábilis F felett. Egy véges, normális és
szeparábilis bővítés neve Galois-bővítés.

A de nícióból következően minden szeparábilis bővítés algebrai. A megfordítás nulla karakterisztika esetén igaz:
mivel ekkor minden irreducibilis polinom szeparábilis, így minden algebrai elem automatikusan szeparábilis. Prím
karakterisztika esetén viszont előfordulhat, hogy egy irreducibilis polinom nem szeparábilis (pl. az yp – x polinom a ℤp(x)
test feletti ℤp(x) [y] polinomgyűrűben), így az is előfordulhat, hogy egy algebrai bővítés nem szeparábilis (pl. ℤp(x)[y]/(yp –
x) nem szeparábilis ℤp(x) felett). Véges testek esetén azonban megint csak igaz, hogy minden irreducibilis polinom
szeparábilis, így egy véges test algebrai bővítése is garantáltan szeparábilis bővítés.

Szeparábilis elemek által generált bővítés szeparábilis: ha K = F(S) és S minden eleme szeparábilis F felett, akkor
ugyanez K minden eleméről is elmondható.

A véges normális bővítésekhez hasonlóan a véges szeparábilis bővítések is egyszerűen jellemezhetők.

Egy véges normális K | F bővítés akkor és csak akkor szeparábilis, ha K egy alkalmas F[x]-beli szeparábilis polinomnak
a felbontási teste.
Példák
1. A bővítés véges, normális és szeparábilis, ugyanis a ℚ[x]-ben irreducibilis x2 – 5
polinomnak a felbontási teste.
2. bővítés véges, szeparábilis, de nem normális. Szeparábilis, mert egy szeparábilis elem generálja, de
nem normális, ugyanis a ℚ[x]-ben irreducibilis x3 – 5 polinomnak van gyöke -ben, de nem bomlik fel
lineáris tényezők szorzatára felett. (Hiszen a polinom másik két gyöke nem valós, míg .)
3. Haaz x3 –5 ∈ ℚ[x] polinom nem valós komplex gyökeit v-vel és w-vel jelöljük, akkor a bővítés véges,
normális és szeparábilis: a ℚ[x]-ben irreducibilis x3 – 5 polinomnak a felbontási teste.
Ennek a bővítésnek a foka 6, ugyanis harmadfokú ℚ felett és v másodfokú lett, így

Galois-elmélet
A testek Galois-elméletének alaptémáját a testautomor zmusok szolgáltatják. Egy T test automor zmusai mindig
csoportot alkotnak (a kompozíció műveletével): ez az Aut(T) automor zmuscsoport. Továbbá ha T egy tetszőleges test, és σ
: T → T egy automor zmusa T-nek, tekinthetjük azon T-beli t elemek halmazát, amiket a σ automor zmus helybenhagy,
azaz amikre σ(t) = t. Ez a halmaz mindig egy résztest T-ben. Fordítva, ha T | F egy adott testbővítés, akkor tekinthetjük
azokat a σ : T → T automor zmusokat, amik az F résztest minden elemét helybenhagyják, és ily módon az Aut(T)
automor zmuscsoportnak mindig egy részcsoportját kapjuk.

Legyen K | F egy testbővítés! A σ : K → K automor zmus egy F-automor zmus, ha minden f ∈ F elemre σ(f) = f. A K test
F-automor zmusai csoportot alkotnak (a kompozíció művelettel), amit a K | F bővítés Galois-csoportjának nevezünk.
Jelölése: Gal(K | F).

Az egyik legismertebb példa nem triviális testautomor zmusra a komplex számokon értelmezett konjugálás. Ez az
egyetlen nem triviális automor zmusa a ℂ | ℝ bővítésnek, így Gal(ℂ | ℝ) egy másodrendű ciklikus csoport. Nem véletlen,
hogy a Gal(ℂ | ℝ) csoport rendje megegyezik a (ℂ | ℝ bővítés fokával, ugyanis ez mindig igaz egy Galois-bővítésre.

Ha K | F egy Galois-bővítés, akkor | Gal(K | F) | = [K : F].

Arról, hogy egy K | F bővítés Galois-csoportja miként permutálja a K test elemeit, a következőt érdemes tudni.

Legyen K | F egy véges szeparábilis bővítés! A K-beli u és v elemekhez akkor és csak akkor létezik olyan σ ∈ Gal(K | F),
amivel σ(u) = v, ha u-nak és v-nek ugyanaz a minimálpolinomja.

Legyen K | F egy tetszőleges testbővítés, és G = Gal(K | F) a Galois-csoportja! Ekkor bármely F-et tartalmazó E ≤ K
résztesthez természetes módon hozzárendelhetjük a G csoport egy részcsoportját és viszont, a G csoport bármely H
részcsoportjához természetes módon hozzárendelhetjük a K-nak egy F-et tartalmazó résztestét.
Ha ugyanis E egy közbülső test F és K között, a Gal(K | F) Galois-csoport egy részcsoportja G-nek. Fordítva, ha H egy
részcsoport G-ben (tehát H is a K test bizonyos automor zmusainak egy csoportja), akkor K azon elemei, amiket minden H-
beli automor zmus helybenhagy, egy F-et tartalmazó résztestet alkotnak. Jelöljük ezt a résztestet KH-val! Általában
előfordulhat, hogy két különböző közbülső testhez a G csoportnak ugyanaz a részcsoportja tartozik, és nincs garantálva,
hogy a K testnek minden F-et tartalmazó részteste egy alkalmas G-beli részcsoporthoz tartozó xált test. Viszont Galois-
bővítések esetén a fent de niált hozzárendelések egy kölcsönösen egyértelmű megfeleltetést szolgáltatnak G részcsoportjai
és a K test F-et tartalmazó résztestei között.
A Galois-elmélet főtétele:

Legyen K | F egy Galois-bővítés! Ekkor az E → Gal(K | E) hozzárendelés egy kölcsönösen egyértelmű megfeleltetés a K |
F bővítés közbülső testei és a Gal(K | F) csoport részcsoportjai között. Továbbá minden E közbülső testre
1. A Gal(K | E) csoporthoz tartozó xált test E.
2. [K : E] = | Gal(K | E) | és [E : F] = | Gal(K | F) : Gal(K | E).
3. Az E | F bővítés akkor és csak akkor normális, ha Gal(K | E) egy normális részcsoport a Gal(K | F) csoportban, és
ebben az esetben
Példa. Jelöljük az x3 – 5 ∈ ℚ[x] polinom nem valós komplex gyökeit v-vel és w-vel, továbbá legyen ,
tehát ϵ egy komplex harmadik egységgyök, amivel feltehető, hogy és . Mint már láttuk
korábban, az x3 – 5 polinom felbontási teste és a bővítés egy hatodfokú Galois-
bővítés. Tehát a bővítés G Galois-csoportjának a rendje 6. Másrészt G permutálja a halmazt, mint az x3
– 5 polinom gyökeinek a halmazát. Mivel ennek a halmaznak összesen 6 permutációja van, következik, hogy G
izomorf a halmazon ható S3 szimmetrikus csoporttal. Ebben a csoportban van három 2 rendű
részcsoport, amik az identitáson kívül a , illetve a transzpozíciókat tartalmazzák. Ezen
részcsoportok xált testei rendre a , ℚ(W) és ℚ(v) közbülső testek. Továbbá van G-ben egy 3 rendű
normálosztó: , ez pedig a normális, harmadrendű bővítés Galois-
csoportja. Az olvasóra bízzuk annak az átgondolását, hogy ℚ(ϵ) valóban egy közbülső teste a
bővítésnek, továbbá ℚ(ϵ) az x2 + x + 1 polinom felbontási teste, így ℚ(ϵ) | ℚ egy normális bővítés.

A polinomegyenlőségek gyökjelekkel való megoldhatósága szoros összefüggésben áll a testbővítésekkel, illetve azok
Galois-csoportjaival. Ahhoz, hogy ezt az összefüggést megfogalmazzuk, szükségünk van a következő csoportelméleti
de nícióra:

Egy G csoport feloldható, ha van a részcsoportjainak egy olyan G = G0 ≥ G1 ≥ … ≥ Gn = {1} lánca (valamilyen pozitív egész
n szám mellett), ahol minden 1 ≤ i ≤ n egészre Gi normális részcsoport Gi-1-ben, és a Gi–1/Gi faktorcsoport kommutatív.

Legyen F egy tetszőleges zéró karakterisztikájú test, p (x) ∈ F[x], és legyen K a p(x) polinom F feletti felbontási teste. A
p(x) = 0 egyenlőség K-beli megoldásai akkor és csak akkor fejezhetők ki az F-beli elemek, az alapműveletek és
gyökvonások segítségével, ha a K | F bővítés Galois-csoportja feloldható.

Az a tény, hogy az ötödfokú polinomiális egyenletekre nincs megoldóképlet, olyan racionális együtthatós ötödfokú
polinomok létezésével magyarázható, amiknek a Galois-csoportja (pontosabban a felbontási testüknek a racionális test
feletti Galois-csoportja) izomorf az S5 szimmetrikus csoporttal, és ez a csoport nem feloldható. (Egyetlen nem triviális
valódi normálosztója van, az A5 alternáló csoport, A5 pedig egy nem kommutatív egyszerű csoport.)

12.7. Modulusok
A modulusok a vektorterek általánosításai abban az értelemben, hogy a skalárok nem feltétlenül valós vagy komplex
számok, illetve egy adott test elemei, hanem annál általánosabban, egy tetszőleges rögzített gyűrű elemei lehetnek.
Bármely R gyűrűhöz de niálhatjuk az R feletti modulusokat:

Egy (M, +) additívan írt kommutatív csoport egy bal oldali R-modulus, ha bármely r ∈ R és m ∈ M elemekre
értelmezve van egy rm M-beli „szorzat”, amire az alábbi tulajdonságok teljesülnek:
- Tetszőleges r ∈ R és m1, m2 ∈ M elemekre r(m1 + m2) = rm1 + rm2.
- Tetszőleges r1, r2 ∈ R és m ∈ M elemekre (r1 + r2)m = r1m + r2m.
- Tetszőleges r1, r2 ∈ R és m ∈ M elemekre (r1r2)m = r1(r2m).
- Ha R egységelemes, akkor bármely m ∈ M elemre 1m = m.

A jobb oldali R-modulusok hasonlóan de niálhatók, a különbség mindössze annyi, hogy ott a modulus elemeit jobbról
„szorozhatjuk” a gyűrű elemeivel. Az axiómákból levezethetők a következő alaptulajdonságok:
- Bármely m ∈ M elemre 0m = 0, azaz a gyűrű nullelemével szorozva a modulus nullelemét kapjuk.
- Bármely r ∈ R elemre r0 = 0.
- Bármely r ∈ R és m ∈ M elemekre (–r)m = r(–m) = –(rm), és ezt az elemet így nyugodtan jelölhetjük –rm-mel.
Tetszőleges R gyűrűnek egy I bal oldali ideálja egyben egy bal oldali R-modulus is (a gyűrűbeli szorzással), speciálisan
{0} és R is bal oldali modulusok. Néhány további közismert példa:
- Minden additívan írt Abel-csoport egy (kétoldali) ℤ-modulus, ahol a pozitív számokkal való szorzás az nx = x + x + … + x, a
negatív számokkal való szorzás a (–n)x = (–x) + (–x) + … + (–x), a nullával való szorzás pedig a 0x = 0 képletekkel adott. (A fenti
összegek természetesen n-tényezős összegek.)
- Ha T egy test (például a komplex, a valós vagy a racionális számok teste), akkor a T-modulusok éppen a T feletti vektorterek.
- Tetszőleges n pozitív egész mellett az n hosszúságú valós oszlopvektorok ℝn vektortere egyben egy bal oldali modulus az
Mn(ℝ) mátrixgyűrűre nézve, illetve az n hosszúságú valós sorvektorok tere egyben egy jobb oldali modulus ugyancsak az
Mn(ℝ) mátrixgyűrűre nézve.
- Egy tetszőleges T test feletti V vektortér tekinthető a T[x] polinomgyűrű feletti modulusnak, amennyiben rögzítünk egy A :
V → V lineáris transzformációt, és a gyűrűbeli elemekkel való szorzást az f(x)v = f(A)v képlettel értelmezzük. Azaz egy f
polinom és v vektor „szorzata” a v vektor f(A) lineáris transzformációnál vett képe.
A többi algebrai struktúrához hasonlóan de niálhatjuk a részmodulus, faktormodulus, illetve a homomor zmusok
fogalmát.

Részmodulusok
Homomor zmusok
Modulusok direkt összege

Részmodulusok

Ha az R gyűrű feletti M modulusnak egy N részhalmaza maga is modulust alkot ugyanazon gyűrű felett, akkor N egy
részmodulus M-ben, és ezt a kapcsolatot N ≤ M jelöli.

Minden modulusnak részmodulusa saját maga, illetve a {0} halmaz. Egy modulus egyszerű, ha ezeken kívül más
részmodulusa nincs. Egy N részmodulus M-ben valódi részmodulus, ha N ≠ M (és ez esetben az N < M jelölést is
használhatjuk). Ahhoz, hogy egy N ⊆ M részhalmaz részmodulus legyen, tartalmaznia kell a modulus nullelemét, továbbá
mindegyik elemével együtt annak a negatívját, bármely két elemének az összegét, továbbá bármely elemének az összes
„skalárszorosát” is, azaz ha n ∈ N és r ∈ R, akkor szükségszerűen rn ∈ N. Röviden fogalmazva, részmodulus egy olyan
(additív) részcsoport, ami zárt a gyűrű elemeivel való szorzásra.
Mivel kommutatív csoportban minden részcsoport normális, azaz minden részcsoport szerint lehet faktorizálni, ezért
tetszőleges R gyűrű feletti (bal oldali) M modulus és annak egy N részmodulusa esetén is beszélhetünk az M/N
faktorcsoportról, ami nem más, mint az m + N = {m + n |n ∈ N} mellékosztályok additív csoportja. Ekkor ez a csoport is
tekinthető egyben egy R-modulusnak, ahol a gyűrűelemekkel vett szorzást értelemszerűen az r(m + N) = rm + N képlet adja
meg. (És ez a művelet pontosan azért lesz jól de niált, mert N nem pusztán egy részcsoport, hanem részmodulus is:
amennyiben m1 + N = m2 + N, úgy m1 – m2 ∈ N, és így r(m1 – m2) ∈ N, amiből már következik, hogy rm1 + N = rm2 + N.)
Egy R gyűrű feletti M modulus tetszőleges x elemére az Rx = {rx | r ∈ R} halmaz egy részmodulusa M-nek.
Általánosabban, a modulus tetszőleges x1, x2, …, xk elemei mellett az

halmaz egy részmodulus M-ben, méghozzá a legkisebb olyan részmodulus, ami tartalmazza az xi elemeket. Ezért ezt
nevezzük az x1, x2, …, xk elemek által generált részmodulusnak.

Az R gyűrű feletti M modulus végesen generált, ha alkalmas k pozitív egész és M-beli x1, x2, …, xk elemek mellett M =
Rx1 + Rx2 + … + Rxk. Egy M modulus ciklikus, ha egy elem generálja.

Például ha I egy ideál az R egységelemes gyűrűben, akkor egy részmodulus is R-ben, mint saját maga feletti
modulusban, és R/I egy ciklikus R feletti modulus, amit az 1 + I mellékosztály generál. Ennek az állításnak a megfordítottja
kommutatív gyűrűkre igaz: ha R egy kommutatív gyűrű, és M egy ciklikus R-modulus, akkor akkor alkalmas I ◃ R ideállal
M ≅ R/I.

Homomor zmusok

Ha R egy gyűrű, M és K pedig tetszőleges R-modulusok, akkor egy φ : M → K leképezés R-homomor zmus, ha bármely
r ∈ R, és m, n ∈ M elemekre φ(m + n) = φ(m) + φ(n) és φ(rm) = rφ(m).

Egy φ : M → K R-homomor zmusra mindig igaz, hogy egyben egy csoporthomomor zmus is az M és K, mint additív
csoportok közt, így az M-beli nullelem képe a K-beli nullelem (azaz φ(0) = 0), és bármely M-beli m elemre φ(–m) = –φ(m). A
φ : M → K homomor zmus képe: Im(φ) = {φ(m) |m ∈ M} mindig egy részmodulus K-ban. A φ : M → K homomor zmus
magja: Ker(φ) = {m ∈ M | φ(m) = 0} mindig egy részmodulus M-ben. Megfordítva, minden M-beli N részmodulus magja egy
alkalmas homomor zmusnak: de niáljuk az M modulusnak az M/N faktormodulusra való kanonikus homomor zmusát
úgy, hogy tetszőleges m elem képe legyen az m + N mellékosztály. Ez a leképezés valóban egy homomor zmus, és a magja
pontosan az N részmodulus. (A képe pedig az egész M/N.)
Ahogyan más algebrai struktúráknál, itt is de niálhatjuk az endomor zmus (adott moduluson belüli
homomor zmus), az izomor zmus (bijektív homomor zmus), illetve az automor zmus (adott moduluson belüli
izomor zmus) fogalmát, és két (M és N) modulust izomorfnak nevezünk (jelben M ≅ N), ha létezik köztük egy
izomor zmus. Adott R gyűrű mellett az izomor zmus egy ekvivalenciareláció a bal oldali (illetve a jobb oldali) R-
modulusok osztályán, és modulusokra is kimondhatók a gyűrűkre, illetve csoportokra már megismert
izomor zmustételek megfelelői:

Első izomor zmustétel: tetszőleges φ : M → K modulus-homomor zmusra

Második izomor zmustétel: ha N és K részmodulusok az M modulusban (tetszőleges R gyűrű felett), akkor

Harmadik izomor zmustétel: ha N és K részmodulusok egy R gyűrű feletti M modulusban és K ≤ N, akkor

Modulusok direkt összege

Egy adott R gyűrű feletti két modulus, M és N direkt összegét az M × N Descartes-féle szorzaton úgy de niálhatjuk,
hogy a műveleteket koordinátánként végezzük el. A direkt összeg jelölése: M ⊕ N.

Tehát M ⊕ N = {(m, n) | m ∈ M, n ∈ N}, {m1, n1) + (m2, n2) = (m1 + m2, n1 + n2), és r(m, n) = (rm, rn). A direkt összeget
nemcsak két, hanem több modulus esetében is megkonstruálhatjuk: a modulusok alaphalmazának Descartes-féle
szorzatán a műveleteket koordinátánként végezzük el. Az M ⊕ N direkt összegben az halmaz egy
M-mel izomorf, az halmaz pedig egy N-nel izomorf részmodulust alkot, amikre igaz, hogy
és . Ennek az észrevételnek a megfordítása a következőképp igaz:

Ha a K modulusban M és N olyan részmodulusok, amikre M ∩N= {0} és M+N = K, akkor K izomorf az M ⊕ N direkt
összeggel.

A véges Abel-csoportok alaptételének egyfajta általánosítása a következő, modulusokról szóló tétel (mivelhogy az Abel-
csoportok is modulusok: a (ℤ, +, ·) gyűrű felett):

Egy főideálgyűrű feletti végesen generált modulus mindig izomorf véges sok ciklikus modulus direkt összegével.

12.8. Hálók és Boole-algebrák

Hálónak nevezünk egy H halmazt a rajta értelmezett „metszet” (˄) és „unió” (˅) műveletekkel, ha a következő axiómák
teljesülnek:
1. Tetszőleges x ∈ H elemre x ˄ x = x és x ˅ x = x.
2. Tetszőleges x, y ∈ H elemekre x ˄ y = y ˄ x és x ˅ y = y ˅ x.
3. Tetszőleges x, y, z ∈ H elemekre (x ˄ y) ˄ z = x ˄ (y ˄ z) és (x ˅ y) ˅ z = x ˅ (y ˅ z).
4. Tetszőleges x, y ∈ H elemekre x ˄ (x ˅ y) = x = x ˅ (x ˄ y).

Más megközelítésben egy háló olyan részben rendezett halmaz, ahol bármely két elemnek van legnagyobb alsó korlátja
és legkisebb felső korlátja.
Ha (H, ≤) egy részben rendezett halmaz, ahol bármely x és y elempárnak van legnagyobb alsó korlátja (lak(x, y)) és
legkisebb felső korlátja (lfk(x, y)), akkor az x ˄ y = lak(x, y) és x ˅ y = lfk(x, y) műveletekkel (H, ˄, ˅) egy háló.
Megfordítva, ha (H, ˄, ˅) egy háló, akkor az a ≤ b ↔ a ˄ b = a relációval (H, ≤) egy részben rendezett halmaz, ahol
bármely x és y elemek legnagyobb alsó korlátja x ˄ y és legkisebb felső korlátja x ˅ y.

Az axiómákból látszik, hogy a két művelet szerepe felcserélhető, azaz ha (H, ˄, ˅) egy háló, akkor (H, ˄, ˅) is egy háló: ez
az eredeti háló duálisa. Néhány ismert példa hálókra, illetve hálótípusokra:
- A pozitív egész számok halmaza az oszthatósági részben rendezéssel, ekkor a ˄ b a két szám legnagyobb közös osztója, és a ˅
b pedig a két szám legkisebb közös többszöröse.
- Egy halmaz részhalmazainak a halmaza a tartalmazási részben rendezéssel. Ekkor X ˄ Y a két részhalmaz metszete, és X ˅ Y
a két részhalmaz uniója.
- Egy csoport részcsoportjainak a halmaza a tartalmazási részben rendezéssel. Ekkor H ˄ K a két részcsoport metszete, és H ˄
〈 〉
K = H, K a két részcsoport által generált részcsoport.
- Egy gyűrű ideáljainak a halmaza szintén a tartalmazási részben rendezéssel. Ekkor I ˄ J a két ideál metszete, és I ˄J = I + J a
két ideál összege.
- Egy modulus részmodulusainak a halmaza a tartalmazási részben rendezéssel. Ekkor M ˄ N a két részmodulus metszete, és
M ˄ N = M + N a két részmodulus összege.

Ha a H hálónak egy L részhalmaza maga is hálót alkot a H-beli műveletekkel, akkor L egy részháló H-ban.

Minden hálónak részhálója saját maga, illetve az egyelemű részhalmazai, általában pedig egy L ⊆ H részhalmaz
pontosan akkor alkot részhálót, ha zárt a két műveletre nézve, azaz bármely x, y ∈ L esetén x ˄ y ∈ L és x ˅ y ∈ L. Például
egy csoport részcsoporthálójában részhálót alkot a normálosztók halmaza, hiszen két normálosztónak a metszete és a
generátuma is mindig normálosztó.

Egy H hálónak az I részhalmaza ideál, ha bármely a, b ∈ I és h ∈ H mellett a ˅ b ∈ I, valamint a ˄ h ∈ I.

Ha H és L tetszőleges hálók, a φ : H → L leképezés egy hálóhomomor zmus, ha bármely H-beli x és y elemekre φ(x ˄ y)
= φ(x) ˄ φ(y) és φ(x ˅ y) = φ(x) ˅ φ(y).

Két háló izomorf (jelben H ≅ L), ha létezik közöttük egy izomor zmus (azaz egy bijektív homomor zmus).

A (H, ˄ ˅) háló moduláris, ha tetszőleges x, y és z elemeire, ahol x ≤ z (azaz x ˄ z = x), teljesül az x ˅ (y ˄ z) = (x ˅ y) ˄ z


egyenlőség.
A (H, ˄ ˅) háló disztributív, ha tetszőleges x, y és z elemeire x ˅ (y ˄ z) = (x ˅ y) ˅ (x ˅ z) és x ˄ (y ˅ z) = (x ˄ y) ˅ (x ˅ z).

A disztributív tulajdonságból következik a moduláris tulajdonság, így minden disztributív háló egyben moduláris is.
Modulusok részmodulushálói, illetve csoportok normálosztóhálói mindig modulárisak, halmazok részhalmazhálói
disztributívak, és természetesen egy moduláris háló minden részhálója is moduláris, illetve egy disztributív háló minden
részhálója is disztributív. A disztributív tulajdonsághoz tulajdonképpen elég a két egyenlőség közül csak az egyiket előírni,
ugyanis e két szabály közül bármelyik levezethető a másikból. (Vigyázat: nem a két egyenlőség, hanem a két szabály
vezethető le egymásból, tehát ha minden x, y, z elemhármasra x ˅ (y ˄z) = (x ˅ y) ˄ (x ˅ z), akkor az is kimondható, hogy
minden x, y, z elemhármasra x ⌃ (y ˅ z) = (x ˄ y) ˅ (x ˄ z), és ez fordítva is igaz.) Disztributív hálókból csak a már említett
példák léteznek, ez Stone reprezentációs tétele.

Minden disztributív háló izomorf egy alkalmas halmaz részhalmazhálójának valamely részhálójával.

Egy H háló egységelemes, ha van olyan 1 ∈ H elem, amivel bármely h ∈ H elemre 1 ˄h = h. Illetve a háló zéruselemes,
ha van olyan 0 ∈ H elem, amivel bármely h ∈ H elemre 0 ˅ h = h.

Ha egy hálóban van egységelem, akkor az egyértelmű, továbbá bármely h ∈ H elemre 1 h = 1. És ha egy hálóban van
zéruselem, akkor az is egyértelmű, továbbá bármely h ∈ H elemre 0 ˄ h = 0. A részhalmazhálók, részcsoporthálók és a
részmodulushálók egység- és zéruselemesek, ahol az egységelem maga az egész halmaz, illetve csoport, vagy modulus, a
zéruselem pedig az üres halmaz, illetve csoportoknál az {1} részcsoport és modulusoknál a {0} részmodulus.

Komplementumos hálónak nevezünk egy egységelemes és zéruselemes hálót, ha bármely x eleméhez található olyan y
elem, amivel x ˄ y = 0 és x ˅ y = 1. Ekkor x és y komplementumai egymásnak.

Például egy adott S halmaz részhalmazhálója komplementumos: bármely X ⊆ S részhalmaz komplementuma =S –


X. Viszont a részcsoport- és részmodulushálók általában már nem komplementumosak. Nem mondható ki általánosan,
hogy a komplementumok egyértelműek lennének: vannak olyan hálók (mint pl. a legalább kétdimenziós vektorterek
altérhálói), ahol bizonyos elemeknek több komplementuma is létezik. Disztributív hálókban viszont már igaz, hogy egy
elemnek legfeljebb csak egy komplementuma lehet.

Egy komplementumos disztributív háló neve Boole-algebra.

Az elnevezés George Boole (1815–1864) angol matematikusra utal, aki először használta logikai formalizációkhoz az
ilyen típusú hálókat. A Boole-algebrákat szokás Boole-hálóknak is nevezni. Boole-algebrákban a komplementum fogaimát
egyváltozós műveletként is értelmezhetjük, és ez teljesen jogos, hiszen a de nícióból már következik, hogy egy Boole-
algebrában minden elemnek pontosan egy komplementuma van. Egy x elem komplementumát x′ jelöli.
Boole-algebrákban érvényes a következő egyszerűsítési szabály: ha az x, y, z elemekre x ˄ y = z ˄z és x ˅ y = x ˅ z, akkor y
= z. Továbbá érvényesek a De Morgan-szabályok is: tetszőleges x és y elemekre (x ˄ y)′ = x′ ˅ y′ és (x ˄ y)′ = x′ ˄ y′.

Minden véges Boole-algebra izomorf egy alkalmas véges halmaz részhalmazhálójával. Egy végtelen Boole-algebráról
annyi mondható el, hogy egy alkalmas halmaz részhalmazhálójának valamely komplementumos részhálójával
izomorf.

Boole-gyűrűnek nevezünk egy egységelemes gyűrűt, amelynek minden x elemére xx = x.

Minden Boole-gyűrű kommutatív, továbbá az is igaz, hogy egy Boole-gyűrű bármely x elemére x + x = 0. A Boole-
algebrák és a Boole-gyűrűk kölcsönösen és egyértelműen megfeleltethetők egymásnak.

Legyen (B, ˄ ˅) egy tetszőleges Boole-algebra! Ekkor az a + b = (a ˄ b′) ˅ (a′ ˄ b) és az a · b = a ˄ b műveletekkel (B, +, ·) egy
Boole-gyűrű. Megfordítva, ha (B, +, ·) egy Boole-gyűrű, akkor az a ˄ b = a · b és a ⌄ b = a + b + a · b műveletekkel (B, ˄, ˅)
egy Boole-algebra.
13. Számelmélet
13.1. Bevezetés, oszthatóság
13.2. Számelméleti függvények
13.3. Kongruenciák
13.4. A kongruenciaosztályok algebrája
13.5. Kvadratikus maradékok
13.6. Prímszámok
13.7. Diofantikus egyenletek

13.1. Bevezetés, oszthatóság


A számelmélet a matematika egyik legrégebbi területe. Eredetileg csak a természetes számok elméletét jelentette:
elsősorban egyenletek megoldásairól, illetve oszthatósági kérdésekről szólt, azonban – mint a matematikai tudományágak
legtöbbje – időközben jóval túlnőtt egykori keretein. A modern számelmélet szorosan kapcsolódik a komplex analízishez,
az absztrakt algebrához és az algebrai geometriához is, ezeknek a kapcsolatoknak a felvázolása azonban kicsit túlmegy a
könyvünk keretein. Ebben a fejezetben először röviden áttekintjük az elemi számelmélet legalapvetőbb fogalmait és
tételeit, amelyekkel az első fejezetben már részletesebben megismerkedtünk, majd ezt követően kerülnek tárgyalásra a
kongruenciák, prímszámok, számelméleti függvények és diofantikus egyenletek.
Az egyik legalapvetőbb számelméleti fogalom az oszthatóság. Az egész számok halmaza a négy alapművelet közül
háromra zárt (összeadás, kivonás és szorzás), azonban az osztásra már nem. Oszthatóságról akkor beszélünk, amikor két
egész szám hányadosa is egész.

Az a (nullától különböző) egész szám osztója a b egész számnak, ha alkalmas x egész számmal ax = b. Jelölésben: a | b.

Ilyenkor azt is mondjuk, hogy b többszöröse a-nak, illetve b osztható a-val. Néhány alapvető tény:
- Minden számnak osztója az 1, de az 1 osztói csak az 1 és a –1.
- Ha a | b és b | c, akkor a | c.
- Ha a | b és a | c, akkor tetszőleges m és n egész számok mellett a | mb + nc.
- Ha a | b és b | a, akkor a = b vagy a = –b.

Az a és b egész számok legnagyobb közös osztója az a legnagyobb olyan d pozitív egész, amire d | a és d | b. A legkisebb
közös többszörösük pedig az a legkisebb olyan m pozitív egész, amire a | m és b | m.

Ha az a és b egészek közül legalább az egyik nem nulla, akkor a legnagyobb közös osztójuk létezik és egyenlő a legkisebb
olyan pozitív egész számmal, ami felírható ma + nb alakban (ahol m és n is egészek). Jelölése: lnko(a, b). (Az angol nyelvű
irodalomban gcd (a, b).) Ha az a és b egészek egyike sem nulla, akkor a legkisebb közös többszörösük szintén létezik, jelölése
lkkt(a, b) (az angol nyelvű irodalomban lcm(a, b)), továbbá lnko(a, b) · lkkt(a, b) = |ab|. A legnagyobb közös osztó és a
legkisebb közös többszörös az alábbi tulajdonságokkal is jellemezhető:

A d pozitív egész szám az a és b számok legnagyobb közös osztója, ha d | a, d | b és az a és b számok bármely közös
osztója osztja d-t is. Az m pozitív egész az a és b számok legkisebb közös többszöröse, ha a | m, b | m és az a és b számok
bármely közös többszöröse osztható m-mel.

Bármely a és b egészek, illetve c pozitív egész szám mellett igaz, hogy lnko (ca, cb) = c·lnko(a, b) és lkkt(ca, cb) = c·lkkt(a,
b), feltéve hogy az adott egyenlőségnek legalább az egyik oldala létezik.
Két egész szám relatív prím, ha a legnagyobb közös osztójuk 1. A legnagyobb közös osztó és a legkisebb közös többszörös
fogalma kettőnél több megadott egész szám esetén is értelmezhető. Amennyiben egész számok egy halmazának legalább az
egyik tagja nem nulla, úgy a legnagyobb közös osztó létezik és egyértelmű, amennyiben pedig a halmaz véges és egyik tagja
sem nulla, akkor a legkisebb közös többszörös szintén létezik és egyértelmű.

Maradékos osztás, euklideszi algoritmus


Prímszámok, prímfelbontás

Maradékos osztás, euklideszi algoritmus


Két egész szám legnagyobb közös osztóját megkaphatjuk az euklideszi algoritmus segítségével, aminek az alapja a
maradékos osztás.

Ha a és b egész számok és b ≠ 0, akkor alkalmas q (hányados) és r (maradék) egész számokkal a = qb + r és 0 ≤ r < |b|.

A fenti tételben szereplő hányados és maradék egyértelműen maghatározott. A q hányadost az a/b tört kerekítéséből
kapjuk meg: ha b pozitív, akkor q = ⌊a/b⌋, ha pedig b negatív, akkor q = ⌈a/b⌉. Ezek után a maradék az r = a – qb
összefüggésből adódik.
Az euklideszi algoritmus lényege, hogy ha a és b egész számok, és b ≠ 0, akkor maradékos osztások sorozatát végezzük el
a következőképpen: először | a | -t osztjuk maradékosan | b | -vel, majd minden egyes következő lépésben az előző lépés
osztója és maradéka között végezzük el ismét a maradékos osztást. Ezt folytatjuk mindaddig, amíg egyszer nullát kapunk
maradékul. Tehát

Mivel a maradékok egy szigorúan csökkenő sorozatot alkotnak (nem negatív számokból), előbb-utóbb mindenképp
elérkezünk egy olyan lépéshez, ahol a maradék nulla. Az utolsó nem nulla maradék az a és b számok legnagyobb közös
osztója. (Amennyiben már rögtön az első maradék nulla, úgy b osztja a-t, és akkor természetesen lnko(a, b) = |b|.)

Példa. Keressük meg az 123 321 és 112 233 számok legnagyobb közös osztóját és legkisebb közös többszörösét. Az
euklideszi algoritmus a következőt adja:

Így lnko(123 321, 112 233) = 33 és

Prímszámok, prímfelbontás
Az oszthatóság szempontjából kitüntetett szerepet játszanak a prímszámok.

Egy p pozitív egész prímszám, ha p > 1, és osztói csak a ± 1 és a ± p számok.

A prímszám fogalma de niálható a prímszámok alábbi tulajdonságával is:

Egy egynél nagyobb p egész szám akkor és csak akkor prím, ha bármely a és b egészek mellett p|ab-ből következik,
hogy p|a vagy p|b.

A számelmélet alaptétele a következőt mondja ki:

Minden egynél nagyobb egész szám előáll prímszámok szorzataként. Ez az előállítás a prímtényezők sorrendjétől
eltekintve egyértelmű.
Példa. Adjuk meg a 312 – 1 szám prímtényezős felbontását!
Alkalmazzuk először az x2 –1 = (x – 1)(x + 1) és x3 + 1 = (x + 1)(x2 – x + 1) faktorizációs formulákat: 312 – 1 = (36 – 1)(36 + 1) =
(33 + 1)(33 – 1)(32 + l)(34 – 32 + 1) =28·26·10·73. Itt már mindegyik tényező prímfelbontása kis fejszámolással
megkapható: 28 = 22·7, 26 = 2 · 13, 10 = 2 · 5 és 73 maga egy prímszám, így 312 – 1 prímfelbontása 24 · 5 · 7 · 13 · 73.

A prímtényezős felbontás segítségével könnyen eldönthető, hogy két szám közül osztja-e egyik a másikat, illetve
könnyen megkaphatjuk két adott szám legnagyobb közös osztóját és legkisebb közös többszörösét is. Ha a és b pozitív
egészek, akkor alkalmas p1, p2, …, pr prímszámokkal és α1, α2, …, αr illetve ß1, ß2, …, ßr nem negatív egészekkel

. (Amennyiben egy pi prím az a és b számok közül csak az egyiket osztja,


akkor a másiknál nulla kitevővel szerepel.) Ekkor
-
,
-
,
- az a szám pontosan akkor osztja b-t, ha minden i-re αi ≤ ßi.

13.2. Számelméleti függvények


Számelméleti függvénynek nevezünk minden, a természetes számok halmazán értelmezett (egy vagy több változós,
komplex értékű) függvényt. Tehát egy képlettel de niált függvényt is tekinthetünk számelméleti függvénynek,
amennyiben az értelmezhető az összes természetes számon, viszont a gyakorlatban azok az igazán érdekes számelméleti
függvények, amik valamilyen szempontból a természetes számok számelméleti tulajdonságairól szólnak. A legismertebb
ilyen függvények a következők:
- az Euler-féle φ függvény: φ(n) = az [1, n] intervallumban lévő, n-hez relatív prím egészek száma;
- τ(n) = az n szám pozitív osztóinak a száma;
- σ(n) = az n szám pozitív osztóinak az összege, általánosabban: σk(n) = az n szám pozitív osztóiból képzett k-adik hatványok
összege (ahol k tetszőleges egész);
-

a Möbius-függvény:

Összegzési függvény, inverziós formula


Multiplikatív számelméleti függvények
Konvolúció
Additív számelméleti függvények

Összegzési függvény, inverziós formula


Egy tetszőleges f : ℕ → ℂ számelméleti függvény összegzési függvényét a következő képlettel de niáljuk:

Tehát a konstans f(n) = 1 függvény összegzési függvénye τ(n), az f(n) = n függvény összegzési függvénye σ(n), illetve
általánosabban az f(n) = nk függvény összegzési függvénye σk(n). (A képletben szereplő összegzést természetesen csak a
pozitív osztókra végezzük el!) A Möbius-függvény összegzési függvénye:

Továbbá az is igaz, hogy a φ függvény összegzési függvénye az identitás:

A Möbius-féle inverziós formula segítségével egy összegzési függvényből is megkaphatjuk az eredeti számelméleti
függvényt:
Pontosabban, ha az f és F számelméleti függvényekkel az és azonosságok
valamelyike igaz minden pozitív egészre, akkor a másik azonosság is fennáll.

Multiplikatív számelméleti függvények

Egy f : ℕ → ℂ számelméleti függvény multiplikatív, ha tetszőleges m és n relatív prím pozitív egészekre f(mn) =
f(m)/(n). Az f függvény teljesen multiplikatív, ha tetszőleges m és n pozitív egészekre f(mn) = f(m)f(n).

A φ, τ, σk, μ függvények mind multiplikatív számelméleti függvények. Ezt a következő tétel alkalmazásával
igazolhatjuk:

Egy f számelméleti függvény összegzési függvénye akkor és csak akkor multiplikatív, ha f multiplikatív.

A multiplikatív számelméleti függvények egyik előnyös tulajdonsága, hogy ha a prímhatványokon felvett értékeik
ismertek, akkor azokból már bármely természetes számon felvett értékük kiszámítható. Ugyanis ha f egy multiplikatív

számelméleti függvény, és az n természetes szám prímhatványfelbontása akkor

. Ennek az elvnek az alkalmazásával kaphatunk használható formulákat a φ, τ


és σk függvényekre:

Ha az n természetes szám prímhatványfelbontása , akkor


-

- τ(n) = (a1 + 1)(a2 + l) … (ar + l);


-
illetve általánosabban, ha k egy pozitív egész:
-

Konvolúció
Az f és g számelméleti függvények konvolúciója (Dirichlet-szorzata) f * g, ahol

A konvolúció egy kommutatív és asszociatív művelet a számelméleti függvények halmazán, azaz f * g = g * f és (f * g) *h =


f* (g * h) mindig igaz. Továbbá az

függvény egységelem a konvolúcióra nézve, azaz bármely f számelméleti függvénnyel I * f = f * I = f. Az f és g számelméleti


függvények egymásnak multiplikatív inverzei, ha f * g = g * f = I, és ekkor az f–1 = g, illetve g–1 = f jelöléseket is használjuk.
Például a Möbius-függvény és az azonosan 1 függvény egymásnak inverzei: µ * 1 = 1 * µ = I. Ha egy f függvény összegzési
függvénye F, azt a konvolúciók nyelvén úgy fejezhetjük ki, hogy F = f * 1, és ez ekvivalens az f = F * μ egyenlőséggel.

Az f számelméleti függvénynek akkor és csak akkor van multiplikatív inverze, ha f(1) ≠ 0. Ebben az esetben a
multiplikatív inverz egyértelmű.

Multiplikatív függvények konvolúciója szintén multiplikatív, illetve egy multiplikatív függvény inverze is
multiplikatív. Tehát elmondható a következő:
Azok a számelméleti függvények, amikre f(1) ≠ 0, a konvolúcióra nézve csoportot alkotnak, és ebben a csoportban a
multiplikatív függvények halmaza egy részcsoport.

Additív számelméleti függvények

Egy g : ℕ → ℂ számelméleti függvény additív, ha tetszőleges m és n relatív prím pozitív egészekre g(mn) = g(m) + g(n). A
g függvény teljesen additív, ha tetszőleges m és n pozitív egészekre g(mn) = g(m) + g(n).

Például az ω(n) függvény, ami az n pozitív egész prímosztóinak a számát jelöli, egy additív (de nem teljesen additív)
függvény. Könnyen belátható, hogy – tetszőleges pozitív z mellett – ha g egy additív számelméleti függvény, akkor f(n) =
sg(n) multiplikatív, és megfordítva, ha f egy pozitív valós értékű multiplikatív számelméleti függvény, akkor g(n) = logz(f(n))
additív. Továbbá additív függvények konstansszorosai is additívak, így például tetszőleges c komplex szám mellett g(n) =
cln n egy additív függvény.

13.3. Kongruenciák
A kongruencia mint relációtípus fogalmát Karl Friedrich Gauss vezette be a XIX. században. A lényege, hogy az
oszthatósági tulajdonságokat a kongruencia nyelvezetén megfogalmazva, azokkal viszonylag kényelmesen, az
egyenlőségekhez hasonlóan tudjunk dolgozni. Minden pozitív egész számhoz mint modulushoz de niálható egy
kongruenciareláció az egész számok halmazán, az alábbi módon.

Legyen m egy pozitív egész szám. Az a egész szám kongruens a b egész számmal modulo m, ha m osztója az a – b
különbségnek. Ennek a relációnak a jelölése: a ≡ b (mod m).

Az a ≡ b (mod m) reláció akkor és csak akkor áll fenn, ha a és b ugyanazt a maradékot adják m-mel osztva. Tetszőleges
m modulus mellett a kongruenciareláció egy ekvivalenciareláció, azaz re exív, szimmetrikus és tranzitív az egész számok
halmazán. (Minden a egész számra a ≡ a (mod m), a ≡ b (mod m) esetén b ≡ a (mod m), valamint a ≡ b (mod m) és b ≡ c (mod
m) esetén a ≡ c (mod m).) Így a reláció ekvivalenciaosztályai az egész számok ℤ halmazának egy partícióját alkotják. Egy
tetszőleges a egész szám ekvivalenciaosztálya:

Tehát ā = b̄ pontosan akkor áll fenn, ha a ≡ b (mod m), azaz m | (a– b). Ezeket az ekvivalenciaosztályokat
kongruenciaosztályoknak (vagy maradékosztályoknak) nevezzük. (Ha a modulus feltüntetése is fontos, akkor ā helyett a
kicsit körülményesebb [a]m jelölést is használhatjuk.) A modulo m kongruenciaosztályok: .
Könnyen belátható, hogy ezek mind különbözőek, továbbá bármely a egész számra ā megegyezik ezen
kongruenciaosztályok valamelyikével: ā = r̄, ahol r az a-nak m-mel való osztásából származó maradék. Tehát pontosan m
kongruenciaosztály van modulo m, ezeknek az algebrai tulajdonságait a 13.4. fejezetben részletesebben is fogjuk tárgyalni.
Egy adott m modulus mellett a kongruenciarelációk összeadhatók, kivonhatók és szorozhatók. Ha a ≡ c (mod m) és b ≡
d (mod m), akkor a + b ≡ c + d (mod m), a – b ≡ c – d (mod m) és ab ≡ cd (mod m). Szintúgy elvégezhető egy (pozitív egész
kitevős) hatványozás is egy kongruencia két oldalával: ha a ≡ b (mod m), akkor tetszőleges k pozitív egész számmal ak ≡ bk
(mod m). Az osztás (egyszerűsítés) már nem végezhető el akármikor, azonban mindig lehet egyszerűsíteni egy olyan
számmal, ami relatív prím a modulushoz:
Ha ac ≡ bc (mod m) és lnko (m, c) = 1, akkor a ≡ b (mod m).
Ennél általánosabban az is igaz, hogy ha ac ≡ bc (mod m) és lnko(m, c) = d, akkor a ≡ b (mod m/d). Így például bármikor
nyugodtan egyszerűsíthetünk, ha ezt megtesszük a modulussal is: tetszőleges c pozitív egész mellett az a ≡ b (mod m) és az
ac ≡ bc (mod cm) kongruenciák ekvivalensek.

Elsőfokú kongruenciaegyenletek
Magasabb fokú kongruenciaegyenletek

Elsőfokú kongruenciaegyenletek
Kongruenciaegyenlet alatt egy olyan kongruenciát értünk, ami tartalmaz legalább egy ismeretlent (változót). A
ismeretleneket tartalmazó kifejezések fokától függően beszélhetünk lineáris, másodfokú, harmadfokú stb.
kongruenciákról.
Az ax ≡ b (mod m) lineáris (elsőfokú) kongruencia akkor és csak akkor oldható meg, ha lnko(a, m) osztja b-t az egész
számok körében. Ekkor a megoldások pontosan egy kongruenciaosztályt alkotnak modulo m/lnko(a, m), azaz lnko(a, m)
darab kongruenciaosztályt modulo m.

Példa. Oldjuk mega 6x ≡ 15 (mod 21) kongruenciát!


Először érdemes megjegyezni, hogy mivel lnko(6, 21) = 3 osztója 15-nek, az adott kongruencia megoldható, és
ekvivalens a 2x ≡ 5 (mod 7) kongruenciával. Ha ez utóbbit beszorozzuk 4-gyel (ami relatív prím 7-hez), akkor egy ezzel
szintén ekvivalens kongruenciát kapunk: 8x ≡ 20 (mod 7), egyszerűsítve x ≡ 6 (mod 7). Tehát minden olyan egész szám
megoldás, ami 7-tel osztva 6-ot ad maradékul. Modulo 21 ez három darab kongruenciaosztályt jelent: x ≡ 6 (mod 21), x
≡ 13 (mod 21) vagy x ≡ 20 (mod 21). (A 4-gyel való szorzás azért volt praktikus, mert 2 és 4 egymásnak „modulo 7
inverzei”, azaz 2 · 4 ≡ 1 (mod 7).)

A lineáris kongruencia-rendszereknek két főbb típusa van. Az egyikbe azok a rendszerek tartoznak, ahol csak egy
ismeretlen van, viszont az egyes kongruenciák modulusai nem feltétlenül ugyanazok. A másik fontos típus, ahol a modulus
rögzített, viszont több ismeretlennel állunk szemben. Az előbbi esetben, amennyiben egy adott rendszer megoldható, a
megoldás(ok) a modulusok legkisebb közös többszöröséhez tartozó kongruenciaosztályok formájában adható(k) meg. A
második típusnál természetesen a megoldás(ok) is az adott modulus szerinti kongruenciaosztályokkal fejezhető(k) ki.
A híres kínai maradéktétel szerint:

Ha az m1, m2, …, mk modulusok páronként relatív prímek, akkor az x ≡ a1(mod m1), x ≡ a2(mod m2), …, x ≡ ak(mod mk)
szimultán kongruencia-rendszernek pontosan egy megoldása van modulo M=m1m2 … mk.

A megoldás megtalálására van egy viszonylag egyszerűen követhető módszer. A fenti jelölésekkel legyen M1 = M/m1,
M2 = M/m2, …, Mk = M/mk. Mivel feltettük, hogy a modulusok páronként relatív prímek, ezért az is igaz, hogy mindegyik i-
re Mi relatív prím mi-hez, így létezik inverze modulo mi: egy olyan yi egész, amivel Miyi ≡ 1 (mod mi). Ekkor a = a1M1y1 +
a2M2y2 + … + akMkyk egy megoldása a tételbeli szimultán kongruencia-rendszernek, és az általános megoldás x ≡ a (mod M)
alakban fejezhető ki.

Példa. Oldjuk meg az x ≡ 4(mod 5), x ≡ 3(mod 7), x ≡ 2(mod 9) kongruencia-rendszert! A modulusok páronként relatív
prímek, a szorzatuk M = 5 · 7 · 9 = 315, így pontosan egy megoldás van modulo 315. M1 = 7·9 = 63 ≡ 3(mod 5), M2 = 5·9 =
45 ≡ 3(mod 7), M3 = 5 · 7 = 35 ≡ 8(mod 9), az inverzeik a megfelelő modulusokra nézve rendre y1 = 2, y2 = 5 és y3 = 8, tehát
a = a1M1y1 + a2M2y2 + a3M3y3 = 4·63·2 + 3·45·5 + 2·35·8 = 1739 egy megoldása a szimultán kongruenciának. Végül 1739 ≡
164(mod 315), tehát az általános megoldás: x ≡ 164(mod 315). Ez azokat az egészeket jelenti, amik 315-tel osztva 164-et
adnak maradékul.

A kínai maradéktételnél egy kicsit általánosabban igaz a következő:

Az x ≡ a1(mod m1), x ≡ a2(mod m2), …, x ≡ ak(mod mk) szimultán kongruencia-rendszer akkor és csak akkor oldható
meg, ha lnko(mi, mj) osztja (ai – aj)-t minden i, j egész és 1 ≤ i ≤ j ≤ k esetén. Ebben az esetben egyetlen megoldás van
modulo M = lkkt(m1, m2, …, mk).

Ez a tétel a számtani sorozatok nyelvén is megfogalmazható, ugyanis egy x ≡ a(mod m) típusú kongruencia önmagában
egy (mindkét irányban végtelen) számtani sorozatot ad megoldásként: aminek az a szám tagja, és a di erenciája m. Az
iménti tétel k = 2 esetén azt mondja ki, hogy két számtani sorozatnak akkor és csak akkor van közös eleme, ha a két sorozat
egy-egy tagjából alkotott különbség osztható a di erenciák legnagyobb közös osztójával. Továbbá k > 2 esetén k darab
számtani sorozatnak akkor és csak akkor van közös eleme, ha a sorozatok közül bármely kettőnek van.

Magasabb fokú kongruenciaegyenletek


Magasabb fokú kongruenciák megoldása még egy változó esetén is általában kicsit körülményesebb. Általános formában
egy ilyen kongruencia alakja

ahol f(x) egy egész együtthatós polinom. A megoldások halmaza – amennyiben nem üres – ebben az esetben is bizonyos
modulo m kongruenciaosztályokból áll (mivel x ≡ y (mod m) esetén f(x) ≡ f(y)(mod m) is igaz). Ha az m szám

prímhatványfelbontása , akkor a fenti kongruencia ekvivalens az


szimultán kongruencia-rendszerrel, és ha ezeket a kongruenciákat külön-külön meg tudjuk oldani, akkor a lokális
megoldások segítségével a kínai maradéktétel értelmében az eredeti kongruencia megoldásait is megkaphatjuk. Ha it jelöli

az kongruencia megoldásainak a számát modulo , akkor az eredeti


kongruenciának összesen k1k2 … kr megoldása van modulo m. Speciálisan ha a szimultán kongruencia-rendszer
valamelyik tényezőjének nincs megoldása, akkor az eredeti kongruenciának sincs.

Példa. Oldjuk meg az x2 + 7x – 9 ≡ 0 (mod 315) kongruenciát!


A modulus prímhatványfelbontása 315 = 32 · 5 · 7, tehát az adott kongruencia ekvivalens az x2 + 7x – 9≡ 0(mod 9), x2 +
7x – 9 ≡ 0(mod 5), x2 + 7x – 9 ≡ 0(mod 7) szimultán kongruencia-rendszerrel, ami egyszerűsítés után: x2 + 7x ≡ 0(mod 9),
x2 + 2x + 1 ≡ 0(mod 5) és x2 – 2 ≡ 0(mod 7). Ezeknek a kongruenciáknak a lokális megoldásai rendre x ≡ 0(mod 9) és x ≡
2(mod 9), x ≡ 4(mod 5), illetve x ≡ 3(mod 7) és x ≡ 4(mod 7). A lokális megoldásokból összesen négy lineáris szimultán
kongruencia-rendszer rakható össze a 9, 5 és 7 modulusokkal (mert 2-2 lehetőségünk van modulo 9 és modulo 7),
amiknek a megoldásai x ≡ 74(mod 315), x ≡ 144(mod 315), x ≡ 164(mod 315) és x ≡ 234 (mod 315).

Miután megállapítottuk, hogy egy tetszőleges modulusú magasabb fokú polinomiális kongruencia megoldása
visszavezethető prímhatvány modulusú kongruenciák megoldására, érdemes pár szót ejteni arról, hogy a prímhatvány
modulusú kongruenciák megoldásait milyen módszerekkel lehet megkapni.
Speciális esetként először tekintsük a prím modulusú polinomiális kongruenciákat! Ezeknek a megoldására általános
módszer nincs – eltekintve attól, hogy ha az adott p modulus nem túl nagy, akkor a 0, 1, 2, …, p – 1 számok egyenkénti
vizsgálatával is megkaphatjuk a megoldást szolgáltató kongruenciaosztályokat, és néha valóban ez a legkézenfekvőbb
módszer. Azonban bizonyos trükkökkel a legtöbb prím modulusú polinomiális kongruencia visszavezethető egy
egyszerűbb (alacsonyabb fokú) kongruenciára. Induljunk ki abból, hogy adott egy

kongruencia, ahol p egy prímszám, és f(x) egy egész együtthatós polinom. Figyelembe véve, hogy a kis Fermat-tétel alapján
minden a egész számra aP ≡ a(mod p) (lásd a következő szakaszt), továbbá az f(x) polinom minden együtthatója kongruens a
0, 1, 2, …, p – 1 számok valamelyikével modulo p, az f(x) ≡ 0(mod p) kongruencia visszavezethető egy g(x) ≡ 0(mod p)
kongruenciára, ahol g(x) egy legfeljebb p – 1 fokú polinom, amelynek minden együtthatója egy, a [0, p – 1] intervallumba eső
egész szám. (Sőt, még az is feltehető, hogy a g(x) polinom főegyütthatója 1, ugyanis ellenkező esetben a főegyüttható
inverzével végigszorozva a kongruenciát, egy 1 főegyütthatós polinomot kapunk a bal oldalon.)
A továbbiakban érdemes a g(x) polinomot a ℤp gyűrű felett tekinteni. Legyen h(x) a g(x) és az xp – x polinomok ℤp [x]-
beli legnagyobb közös osztója, ekkor a g(x) ≡ 0(mod p) kongruencia modulo p megoldásainak a száma megegyezik a h(x)
polinom fokával. Sőt, ℤp felett h(x) lineáris tényezők szorzatára bomlik, és ezek a lineáris tényezők szolgáltatják a g(x) ≡
0(mod p) kongruencia összes megoldását. Speciálisan igaz a következő, Lagrange-tól származó észrevétel a megoldások
számára vonatkozóan:

Ha az f(x) n-edfokú polinom főegyütthatója nem osztható a p prímszámmal, akkor az f(x) ≡ 0(mod p) kongruenciának
legfeljebb n megoldása van a modulo p kongruenciaosztályok között.

Példa. Oldjuk meg az x15 – 3x6 – 8 ≡ 0(mod 13) kongruenciát!


Fermat tétele alapján x13 ≡ x(mod 13), és így x15 ≡ x3(mod 13) minden pozitív egész x számra, tehát az adott
kongruencia ekvivalens a –Зx6 + x3 – 8 ≡ 0 (mod 13) hatodfokú kongruenciával. Ez tovább egyszerűsíthető, ha
szorzunk 4-gyel (ami a –3 multiplikatív inverze modulo 13), és gyelembe vesszük, hogy –32 ≡ 7 (mod 13). Ekkor azt
kapjuk, hogy x6 + 4x3 + 7 ≡ 0 (mod 13). Ezek után megkeressük a g(x) = x6 + 4x3 + 7 és az x13 – x polinomok ℤ13 feletti
legnagyobb közös osztóját az euklideszi algoritmus segítségével:

Az utolsó nem nulla maradék tehát 9x3 + 7, ezt 3-mal beszorozva egy normált polinomot kapunk ℤ13 felett: x3 + 8. Ez
az x6 + 4x3 + 7 és x13 – x polinomok legnagyobb közös osztója ℤ13 felett, ahol ez a legnagyobb közös osztó lineáris
tényezők szorzatára bomlik:
Az eredeti x15 – 3x6 – 8 ≡ 0(mod 9) kongruencia megoldásai tehát x ≡ 7(mod 13), x ≡ 8(mod 13) és x ≡ 11(mod 13).

Ki kell hangsúlyoznunk, hogy csak prím modulus esetén garantált, hogy egy polinom lineáris tényezőkre bontásával
az összes zérushelyet megkapjuk az adott modulusra nézve. Egy korábbi példában láttuk, hogy az x2 + 7x – 9 ≡ 0(mod 315)
kongruenciának négy megoldása van, ez abból adódik, hogy az x2 + 7x – 9 polinomot kétféleképp lehet modulo 315 lineáris
tényezőkre bontani:

Ennek a jelenségnek a hátterében az a tény áll, hogy egy ℤm[x] polinomgyűrű akkor és csak akkor egyértelmű
felbontási tartomány, ha m egy prímszám.
A prímhatvány modulusú kongruenciák visszavezethetők prím modulusra. Ez a visszavezetés több lépésben történik,
az egyes lépésekben egy adott f(x) ≡ 0(mod pa–1) kongruencia megoldásaiból megkaphatjuk az f(x) ≡ 0(mod pa) kongruencia
megoldásait. Az alapgondolat az, hogy ha valamely n egész számra f(n) ≡ 0(mod pa), akkor az is igaz, hogy f(n) ≡ 0(mod pa–1),
hiszen evidens, hogy ha pa osztja f(n)-et, akkor pa–1 szintén osztója f(n)-nek. Legyen r az n maradéka pa–1-nel osztva, ekkor r
szintén megoldása az f(x) ≡ 0(mod pa–1) kongruenciának, és n = r+ tpa–1 valamilyen t egész számmal. A vizsgálandó kérdés
ezek után az, hogy ha az f(x) ≡ 0(mod pa–1) kongruenciának adott egy r megoldása a [0, pa–1 – 1] intervallumban, akkor
milyen t egészek mellett lesz az n = r + tpa–1 szám egy megoldás az f(x) ≡ 0(mod pa) kongruenciára. Erről szól a Kurt Hensel
(1861–1941) német matematikusról elnevezett Hensel-lemma:

Legyen f(x) egy egész együtthatós polinom, jelölje f′(x) az f(x) deriváltját, és tegyük fel, hogy az r egész szám egy
megoldása az f(x) ≡ 0(mod pa–1) kongruenciának.
- Ha f′(r) ≠ 0(mod p) és y az f′(r) szám inverze modulo p, akkor legyen t a (–yf(r))/pa–1 szám maradéka p-vel való osztás
után. Ekkor t az egyetlen olyan egész a [0, p – 1] intervallumban, amivel f(r + tpa–1) ≡ 0(mod pa).
- Ha f′(r) ≡ 0(mod p) és f(r) ≡ 0(mod pa), akkor bármely t egész számmal f(r+tpa–1) ≡ 0(mod pa).
- Ha f′(r) ≡ 0(mod p) és f(r) ≠ 0(mod pa), akkor az f(x) ≡ 0 (mod pa) kongruenciának nincs olyan megoldása, amivel x ≡
r(mod pa–1).

13.4. A kongruenciaosztályok algebrája


Egy adott m modulushoz tartozó kongruenciaosztályok halmaza:

Ezen a halmazon értelmezhető az összeadás, a kivonás és a szorzás: .


Bár ezeknek a műveleteknek a létezése teljesen természetesnek tűnik, valójában egy apró tényezővel érdemes tisztában
lennünk, ez pedig a jólde niáltság. Ha ugyanis valamely a, b, c, d egészekre akkor szerencsére az
, egyenlőségek is mind teljesülnek, tehát két kongruenciaosztály összege,
különbsége és szorzata mindig egyértelmű.
Bármely 1-nél nagyobb pozitív egész m-re az m szerinti kongruenciaosztályok ℤm halmaza az összeadással és a
szorzással egy gyűrűt alkot (kommutatív és egységelemes gyűrűt), amiben a nullelem, és az egységelem. A gyűrű
egy ā elemének pontosan akkor van multiplikatív inverze, ha a relatív prím m-hez. A multiplikatív inverzzel rendelkező
kongruenciaosztályok halmaza a szorzásra nézve egy kommutatív csoport, melynek a rendje φ(m).

Az {a1, a2, …, am} halmazt modulo m teljes maradékrendszernek nevezzük, ha mindegyik kongruenciaosztályból
pontosan egy elemet tartalmaz, tehát {ā1, ā2, …, ām} = ℤm. A {b1, b2, …, bφ(m)} halmazt modulo m redukált
maradékrendszernek nevezzük, ha mindegyik m-hez relatív prím kongruenciaosztályból pontosan egy elemet
tartalmaz, tehát {b̄1, b̄2, … b̄φ(m)} = ℤ×m.

Ha a és m relatív prím pozitív egészek, akkor az a rendje modulo m, ordma az a legkisebb olyan pozitív egész k szám,
amivel ak ≡ 1 (mod m).

Ez pontosan az ā elem rendje a csoportban. (Tehát kongruens számok rendje mindig megegyezik.) Mivel egy
véges csoportban az elemek rendje osztja a csoport rendjét, így ordma osztja φ(m)-et, és így minden -beli ā elemre
. Az Euler–Fermat-tétel ugyanezt fogalmazza meg a kongruenciák nyelvén.

Ha a és m relatív prím pozitív egészek, akkor aφ(m) ≡ 1(mod m).


Abban a speciális esetben, amikor a modulus egy p prímszám, φ(p) = p – 1 (hiszen 1-től p – 1-ig minden egész relatív
prím p-hez), tehát ha egy a egész szám nem többszöröse p-nek, akkor ap–1 ≡ 1(mod p) és ebből ap ≡ a(mod p). Ez utóbbi
kongruencia már p többszöröseire is igaz, és ez a közismert „kis” Fermat-tétel.

Ha p egy prímszám, akkor tetszőleges a egész számmal aP ≡ a(mod p).

Primitív gyökök

Primitív gyökök
Visszatérve a kongruenciaosztályokra, már említettük, hogy

egy φ(m) rendű kommutatív csoport. Ha ez a csoport ciklikus, akkor alkalmas g számmal (lásd a generált
részcsoport fogalmát a 12.4. fejezetben), és bármely m-hez relatív prím a számhoz van olyan k kitevő, amivel a ≡ gk(mod
m). Ebben az esetben azt mondjuk, hogy g egy primitív gyök modulo m.

A g egész szám egy primitív gyök modulo m, ha az 1, g, g2, …, gφ(m)–1 számok egy redukált maradékrendszert alkotnak
modulo m. Ez ekvivalens azzal a feltétellel, hogy g relatív prím m-hez, és ordmg = φ(m).

Nincs minden modulushoz primitív gyök. Sőt, az ilyen „szerencsés” modulus viszonylag kevés.

Primitív gyök modulo m akkor és csak akkor létezik, ha m = 2, m = 4, m =pa, vagy m = 2pa valamilyen páratlan p prím és
a pozitív egésszel.

Tehát a csoportokon kívül akkor és csak akkor ciklikus, ha m egy páratlan


prímhatvány vagy egy páratlan prímhatvány kétszerese. Egyébként, mint minden kommutatív csoport, is ciklikus
csoportok direkt szorzata (lásd a véges Abel-csoportok alaptételét a 12.5. fejezetben), és ezt a szorzatfelbontást az m
prímtényezős felbontásának ismeretében konkrétan is meg lehet adni.

Ha az m pozitív egész szám prímhatványfelbontása (ahol a ≥ 0 és minden más ai > 0), akkor
, továbbá a = 0 és a = 1 esetén esetén és tetszőleges
páratlan primp és pozitív egész a kitevő mellett .

Primitív gyököt találni egy adott m modulusra nézve (amennyiben létezik) általában nem könnyű feladat, és
legtöbbször próbálgatást igényel. Például kiindulásnak listázhatjuk a 2-hatványokat modulo m. Ha 2φ(m) az első pozitív
egész kitevős, 1-gyel kongruens 2-hatvány, akkor ordm2 = φ(m), és 2 egy primitív gyök. Ellenkező esetben vegyük a
legkisebb olyan a egészt, ami nem szerepel modulo m a 2-hatványok között, és listázzuk az a hatványait modulo m stb. A
keresést segítheti néhány hasznos észrevétel, illetve tény:
-
Bármely a egészre és n pozitív egész kitevőre .
- Ha ordma és ordmb relatív prímek, akkor ordm(ab) = ordma · ordmb.
- Bármely a egészre és k pozitív egész kitevőre, ha ak ≡ 1(mod m), akkor ordma osztja k-t.
- Egy a egész szám pontosan akkor primitív gyök modulo m, ha lnko(a, m) = 1, és φ(m) bármely q prímosztójára aφ(m)/q ≢
1(mod m).
- Ha p egy páratlan prímszám és r primitív gyök modulo p, akkor r vagy r + p egy primitív gyök modulo p2.
- Ha p egy páratlan prímszám, és r primitív gyök modulo p2, akkor r szintén primitív gyök modulo pk, bármely pozitív egész
k kitevő mellett.
- Ha p egy páratlan prímszám, k pozitív egész, és r primitív gyök modulo pk, akkor amennyiben r páratlan, akkor r szintén
primitív gyök modulo 2pk, amennyiben pedig r páros, akkor r + pk egy primitív gyök modulo 2pk.
Ez utóbbi három megjegyzés alapján a pk, illetve 2pk alakú modulusokhoz tartozó primitív gyökök keresése lényegében
azon múlik, hogy a p prím modulushoz találjunk egy primitív gyököt, a többi viszonylag könnyű számolással adódik. Egy
adott primitív gyökből az összes többit is megkaphatjuk.

Ha g egy primitív gyök modulo m, és a k pozitív egész kitevő relatív prím φ(m)-hez, akkor gk szintén egy primitív gyök
modulo m. Fordítva: bármely r, modulo m primitív gyökhöz található olyan φ(m)-hez relatív prím k kitevő, amivel r ≡
gk (mod m).

Tehát ha léteznek primitív gyökök az m modulushoz, akkor azok pontosan φ(φ(m)) darab kongruenciaosztályt
alkotnak.

Példa. Keressünk primitív gyököt modulo 73!


Mivel 73 egy prímszám, így ezzel a modulussal garantáltan létezik primitív gyök, aminek a rendje φ(73) = 72. Először
a 2-hatványokat vizsgáljuk meg modulo 73: 21 = 2, 22 = 4, 23 = 8, 24 = 16, 25 = 32, 26 = 64, 27 ≡ 55, 28 ≡ 37 és 29 ≡ 1, tehát 2
biztosan nem egy primitív gyök, mert a modulo 73 rendje 9. A 3 hatványai: 31 = 3, 32 = 9, 33 = 27, 34 ≡ 8, 35 ≡ 24, 36 ≡ 72 ≡
–1. Innen már meg tudjuk állapítani a 3 rendjét modulo 73, ugyanis 312 = (36)2 ≡ (–1)2 = 1, tehát ord733 osztja 12-t,
viszont 12 egyik valódi osztójával sem áll fenn 3k ≡ 1(mod 73), így ord733= 12. Következőnek az 5 hatványait vizsgáljuk:
51 = 5, 52 = 25, 53 ≡ 52, 54 ≡ 41, 55 ≡ 59, 56 ≡ 3(mod 73). Mivel 72-nek két prímosztója van: 2 és 3, továbbá az eddigi
számolásaink alapján 572/2 = 536 = (56)6 ≡ 36 ≡ –1 és 572/3 = 524 = (56)4 ≡ 34 ≡ 8(mod 73), ebből már következik, hogy ord735
= 72, azaz 5 egy primitív gyök modulo 73.

A primitív gyökök egy alkalmazási területe az indexaritmetika, ami például prím modulus esetén az axk ≡ b(mod p)
típusú kongruenciák megoldásában nyújthat hasznos segítséget.

Legyen r egy primitív gyök modulo m. Ha az a egész szám relatív prím m-hez, akkor a-nak az r alapú modulo m indexe
(diszkrét logaritmusa) az a legkisebb olyan k nem negatív egész, amivel rk ≡ a(mod m). Jelölése: indra.

Mivel r egy primitív gyök, ez az index minden m-hez relatív prím egész mellett létezik, és legfeljebb φ(m) – 1. Alapvető
tulajdonságai:
- indr 1 = 0,
- indr(ab) ≡ indra + indrb(mod φ(m)),
- indr(ak) ≡ k · indra(mod φ(m)),
- rl ≡ a(mod m) akkor és csak akkor, ha l ≡ indra(mod φ(m)).
Mindez bármely m-hez relatív prím a és b egészek, illetve k és l nem negatív egész számok mellett érvényes.
Ha egy adott axk ≡ b(mod m) kongruencia megoldásait keressük, ahol b és m relatív prímek, akkor a megoldás
létezésének szükséges feltétele, hogy a is relatív prím legyen m-hez, továbbá ennek fenn kell állnia minden x megoldásra is.
Ha most r egy primitív gyök az m modulushoz, akkor vehetjük a kongruencia két oldalának az indexét, és indra + k·indrx ≡
indrb(mod φ(m)), azaz egy lineáris kongruenciát kapunk az x ismeretlen indexére. Mint azt korábban már tárgyaltuk, a
lineáris kongruenciák megoldhatóságának eldöntése, illetve a megoldások megtalálása viszonylag könnyű feladat, és x
indexének az ismeretében már magát x-et is ismerjük, hiszen . A nehézség viszont abban van, hogy
ehhez a lineáris kongruenciához valahogy eljussunk, azaz hogy az a és b egészek r alapú indexét kiszámoljuk.

13.5. Kvadratikus maradékok


A kvadratikus maradékok elmélete a másodfokú kongruenciák vizsgálatából ered.

Egy a egész szám kvadratikus maradék modulo m, ha az x2 ≡ a(mod m) kongruenciának van megoldása. Ellenkező
esetben a egy kvadratikus nem maradék modulo m.

Korábban már láttuk, hogy a polinomiális kongruenciák visszavezethetők prím modulusú polinomiális
kongruenciákra, és hasonló a helyzet annak az eldöntésében is, hogy egy adott a egész kvadratikus maradék-e egy adott m
modulusra nézve.

Egy, az m modulushoz relatív prím a egész szám akkor és csak akkor kvadratikus maradék modulo m, ha kvadratikus
maradék az m minden prímosztójára nézve, továbbá a ≡ 1(mod 4), amennyiben m osztható 4-gyel, illetve a ≡ 1(mod 8),
amennyiben m osztható 8-cal.

Ha az m-hez relatív prím a egész szám kvadratikus maradék modulo m, akkor az x2 ≡ a(mod m) kongruenciának 2r+s
darab megoldása van modulo m, ahol r az m prímosztóinak számát jelöli, és s = 0, 1 vagy 2 annak megfelelően, hogy m/4
nem egész, páratlan egész vagy páros egész.
A továbbiakban többnyire olyan kongruenciákkal foglalkozunk, ahol a modulus egy páratlan (azaz 2-nél nagyobb)
prímszám.
Ha adott egy ax2 + bx+ c ≡ 0(mod p) kongruenciaegyenlet (ahol p egy páratlan prím, és a relatív prím p-hez), az
visszavezethető egy (x + k)2 ≡ l(mod p) alakú kongruenciára. Ha szorzunk 4a-val (ez relatív prím p-hez az előbbi feltevés
szerint), akkor az ezzel ekvivalens, 4a2x2 + 4abx + 4ac ≡ 0(mod p) kongruenciát kapjuk, ami átrendezve (2ax+ b)2 ≡ b2 –
4ac(mod p). A megoldhatóság most már csak attól függ, hogy b2 – 4ac egy kvadratikus maradék vagy nem maradék modulo
p. Azonban két külön feladat eldönteni egy adott a egészről, hogy kvadratikus maradék-e a p modulusra nézve, illetve
találni egy konkrét megoldást az x2 ≡ a(mod p) kongruenciára. Az előbbire létezik egy elemi eljárás, az utóbbi általában
bonyolult. Ha ismert egy r primitív gyök modulo p és az a egész szám r alapú indexe, akkor minden egyszerű.

Ha r primitív gyök a p páratlan prím modulusra nézve, akkor egy a egész szám pontosan akkor kvadratikus maradék
modulo p, ha az r alapú indexe páros.

Ebben az esetben a 2indrx ≡ indra(mod p – 1) lineáris kongruencia megoldásával megkaphatjuk azon x számok indexét,
amikre x2 ≡ a(mod p).

Ha p egy páratlan prímszám, akkor az 1, 2, …, p – 1 számok közül pontosan (p – 1)/2 kvadratikus maradék, és (p – 1)/2
kvadratikus nem maradék. Amennyiben a egy p-vel nem osztható kvadratikus maradék, akkor az x2 ≡ a(mod p)
kongruenciának pontosan két megoldása van modulo p.

Az Euler–Fermat-tétel alapján, ha egy a egész szám nem osztható a p páratlan prímmel, akkor ap–1 ≡ 1(mod p), tehát p
osztja az ap–1 – 1 = (a(p–1)/2 – 1) (a(p–1)/2 + 1) szorzatot, következésképp a szorzat valamelyik tényezőjét is, tehát vagy a(p–1)/2 =
1(mod p), vagy a(p–1)/2 ≡ –1(mod p). Az Euler-feltétel szerint ez pont attól függ, hogy a kvadratikus maradék-e modulo p.

Hap egy páratlan prím, és a(p – 1)/2 ≡ 1(mod p), akkor a egy kvadratikus maradék, ha pedig a(p – 1)/2 ≡ –1(mod p), akkor a
egy kvadratikus nem maradék modulo p.

A Legendre- és Jacobi-szimbólumok

A Legendre- és Jacobi-szimbólumok
Adrien-Marie Legendre (1752–1833) francia matematikus nevét viseli az a szimbólum, ami azt jelzi, hogy egy egész szám
kvadratikus maradék-e egy adott prím modulusra nézve.

Ha p egy páratlan prím, és nem osztója az a egész számnak, akkor az Legendre-szimbólum értéke:

A Legendre-szimbólum alapvető tulajdonságai:


-
Ha a ≡ b(mod p), akkor ,
-

,
-

,
-

,
-
,
bármely páratlan prím p és p-vel nem osztható a és b egész számok mellett.
A kvadratikus reciprocitás törvénye szerint:

tetszőleges p és q páratlan prímekre .

Tehát ha p és q egyaránt kongruens 3-mal modulo 4, akkor (p/q) = –(q/p), minden más esetben (p/q) = (q/p). Ez a tétel
rendkívül praktikus segítséget nyújt ahhoz, hogy eldöntsük, egy adott egész szám kvadratikus maradék-e egy adott
páratlan prímszámra nézve.
Példa. Igazoljuk, hogy 69 egy kvadratikus maradék modulo 83!

Legendre-szimbólum értékét kell kiszámolnunk, ehhez használni fogjuk a már felsorolt tulajdonságokat,
illetve a kvadratikus reciprocitás törvényét. Mivel 69 = 3·23,

és ez pont azt jelenti, hogy 69


egy kvadratikus maradék modulo 83.

A Jacobi-szimbólum – ami Carl Gustav Jacobi (1804–1851) német matematikus nevét viseli – általánosítása a Legendre-
szimbólumnak, és ugyanazt a jelölést is használja. Amennyiben m egy páratlan szám, a prímhatványfelbontása
, és a egy m-hez relatív prím egész, akkor

ahol az egyenlet jobb oldalán a Legendre-szimbólumok szerepelnek. Ebbe beleértendő, hogy m = 1 esetén a Jacobi-
szimbólum értéke 1.
A Jacobi-szimbólum alapvető tulajdonságai:
-
Ha a ≡ b(mod m), akkor .
-
,
-

,
-
,
-
,
bármely páratlan m és n és hozzájuk relatív prím a és b egész számok mellett.
A Jacobi-szimbólumra is igaz a reciprocitási törvény:

Tetszőleges m és n relatív prím páratlan számokra

Ki kell hangsúlyoznunk, hogy az (a/m) Jacobi-szimbólum már nem arról szól, hogy az a szám egy kvadratikus
maradék-e modulo m. Amennyiben (a/m) = –1, akkor garantált, hogy a egy kvadratikus nem maradék, viszont ha (a/m) = 1,
abból még általában nem következik, hogy a kvadratikus maradék lenne modulo m.

Egy pozitív egész a szám akkor és csak akkor kvadratikus maradék minden prím modulusra nézve, ha a egy
négyzetszám.

13.6. Prímszámok
A számelméletben kitüntetett szerepe van a prímszámoknak. Ennek egyik oka, hogy a számelmélet alaptétele szerint
minden 1-nél nagyobb pozitív egész szám prímtényezők szorzatára bomlik, és ennek a ténynek köszönhetően sok
számelméleti kérdés visszavezethető prímszámok vizsgálatára. Másrészt pedig a prímszámok látszólagos rendezetlensége
évezredek óta inspirálta a matematikusokat arra, hogy ebben a rendezetlenségben megpróbáljanak eligazodni, valamilyen
rendet, illetve szabályokat felfedezni.
Eukleidész (Kr. e. 350 körül) óta ismeretes, hogy végtelen sok prímszám van, azóta ennél a tételnél sokkal erősebb
tételek is napvilágot láttak, mint például Dirichlet (1805–1895) tétele:

Ha az a és d számok relatív prímek, akkor az a, a + d, a + 2d, … számtani sorozatban végtelen sok prímszám van.
A kongruenciák nyelvén megfogalmazva, ha a és d relatív prímek, akkor végtelen sok p prímre igaz, hogy p ≡ a(mod d).
Szintén következik végtelen sok prímszámnak a létezése Csebisev (1821–1894) tételéből:

Bármely pozitív egész n számhoz van olyan p prímszám, amivel n < p ≤ 2n.

Az is igaz, hogy a prímszámok reciprokainak az összege végtelen, kicsit konkrétabban

A ~ jelölés arra utal, hogy a két oldal hányadosa x → ∞ mellett l-hez konvergál.
Sokáig megoldatlan kérdés volt, hogy milyen hosszú számtani sorozatot lehet alkotni prímszámokból (például 3, 5, 7
egy háromtagú, 5, 11, 17, 23, 29 egy öttagú számtani sorozat). Végül 2004-ben, kevéssel azután, hogy M. Frind, P. Jobling és
P. Underwood találtak egy prímekből álló 23 tagú számtani sorozatot (az első tagja 56211383760397, a di erenciája pedig
44546738095860), Ben Green és Terence Tao bizonyították, hogy akármilyen hosszú számtani sorozat létezik prím
tagokkal:

Minden pozitív egész k számhoz létezik végtelen sok k tagú, prímszámokból álló számtani sorozat.

Azonban olyan végtelen számtani sorozat nincs, aminek minden tagja prím lenne. Ez például abból a tényből is
következik, hogy míg számtani sorozatokban az egymás utáni tagok különbsége állandó, a szomszédos prímek közti
különbség bármekkora lehet.

Bármely d pozitív egész számhoz végtelen sok olyan szintén pozitív egész n létezik, amire az n + 1, n + 2, …, n + d
számok mindegyike összetett.

Például n = (d + 1)! + 1 teljesíti a fenti feltételt.


Adott x pozitív számhoz π(x) jelöli az x-nél nem nagyobb prímek számát. A prímszámtétel szerint

Ezt a tételt először Jacques Hadamard (1865–1963) és Charles-Jean-Gustave-Nicholas de la Vallée-Poussin (1866–1962)


bizonyították egymástól függetlenül 1896-ban, mindketten komplex analízisre támaszkodva. Csak évtizedekkel
később, 1949-ben született elemi bizonyítás a prímszámtételre, amikor is a norvég Alte Selberg (1917–2007) és Erdős
Pál (1913–1996) szintén egymástól függetlenül találtak egy-egy olyan bizonyítást, ami már nem használt komplex
analízist.

A prímszámtétel egy másik verziója, hogy a függvény is aszimptotikusan közelíti π(x)-et:

Egyik következménye a prímszámtételnek, hogy meg tudjuk becsülni általában az n-edik prím nagyságrendjét:

Ha minden pozitív egész k-ra pk jelöli a k-adik prímszámot, akkor pk ~ k ln k, azaz

Prímtesztek
Fermat-prímek és Mersenne-prímek
Prímszámok a titkosításban
Megoldatlan problémák
Prímtesztek
Egy adott számról általában nehéz eldönteni, hogy prímszám-e. A prímtesztek olyan eljárások, amikkel adott számokról
(esetekben csak bizonyos speciális típusú számokról) meg tudjuk állapítani, hogy prímek-e vagy sem. A legegyszerűbb
ilyen eljárás, ha az adott n számot osztjuk minden, a intervallumban lévő összes prímszámmal, és ha
valamelyik hányados egésznek bizonyul, akkor n összetett, ellenkező esetben n prím. (Azért elég csak a
intervallum egészeivel osztani, mert ha n összetett, akkor biztosan van -nél nem nagyobb prímosztója.)
Az eratoszthenészi szita lényege, hogy alkalmazásával egy adott n egészhez megkaphatjuk az összes n-nél nem nagyobb
prímszám listáját. Az eljárás igen egyszerű. Először felírjuk az egész számokat 2-től n-ig, majd kihúzzuk az összetett
számokat oly módon, hogy sorban -re megnézzük, hogy a k szám ki lett-e már húzva korábban, ha
igen, akkor nem csinálunk semmit, ha nem, akkor pedig kihúzzuk a k többszöröseit 2k-tól kezdve. Végül a ki nem húzott
számok alkotják a prímszámok teljes listáját 2-től n-ig.
A továbbiakban megemlítünk néhány olyan prímtesztet, amik nem támaszkodnak az összes -nél nem nagyobb
prímek listájára. Az egyik ilyen a kis Fermat-tétel Lucas-féle megfordítása:

Ha n egy pozitív egész, és valamely x egész számmal xn–1 ≡ 1(mod n), viszont az n – 1 szám bármely q prímosztójával x(n–
1)/q ≢ 1(mod n), akkor n prímszám.

Ez a tétel akkor praktikus, ha ismerjük az n – 1 prímtényezőit. Például ha n = 2k + 1 valamely k egésszel, akkor n – 1


egyetlen prímtényezője a 2, tehát amennyiben létezik olyan x egész, amivel xn–1 ≡ 1(mod n) és x(n–1)/2 ≢ 1(mod n), akkor n
biztosan prím. Ez a feltétel amúgy ekvivalens azzal, hogy x(n–1)/2 ≡ –1 (mod n). Érdemes megjegyeznünk, hogy ha n = 2k + 1
egy prímszám, akkor k csak egy 2-hatvány lehet. (Ellenkező esetben, ha l egy páratlan osztója k-nak, és k = ml, akkor 2k + 1=
(2m)l + 1 osztható 2m + 1-gyel.) A fenti kritérium ilyenkor már az x = 3 választással is működik (ez a Pepin-teszt): bármely
m
pozitív egész m-re az n = 22 + 1 szám akkor és csak akkor prím, ha 3(n–1)/2 ≡ –1(mod n).

Fermat-prímek és Mersenne-prímek
m
Az Fm = 22 + 1 alakú számokat Fermat-számoknak nevezzük. Fermat azt sejtette, hogy bármely nem negatív m egészre Fm
egy prímszám, és ezt ellenőrizte m = 0, 1, 2, 3, 4-re: F0 = 3, F1 = 5, F2 = 17, F3 = 257 és F4 = 65 537 valóban prímek. Azután Euler
1732-ben észrevette, hogy F5 = 232 + 1 már nem prím: osztható 641-gyel. E könyv írásakor (2009-ben) nem ismeretes, hogy
van-e több prím a Fermat-számok között. Sokan azt sejtik, hogy nincs. F11-ig ismert a Fermat-számok prímfelbontása,
továbbá sok más Fermat-számnak ismert legalább egy prímosztója. További Fermat-számokról tudjuk, hogy nem prímek,
viszont még nem ismert egyetlen prímosztójuk sem (ilyen például F14, F20, F22 és F24). Érdekesség, hogy a Fermat-számok
m
prímosztói csak speciális alakú prímek lehetnek: minden egynél nagyobb egész m-re igaz, hogy az Fm = 22 + 1 Fermat-szám
valamennyi prímosztója k·2m + 2+ 1 alakú (valamilyen k egész mellett). Eddig 242 Fermat-szám igazoltan nem prím, közülük
F2 478 782 a legnagyobb, és jelenleg F33 a legkisebb olyan Fermat-szám, amiről még nem sikerült eldönteni, hogy prímszám-
e.
A Fermat-prímeknek a geometriai vonatkozása az a Gausstól származó tétel, hogy egy szabályos n-szög akkor és csak
akkor szerkeszthető meg körzővel és vonalzóval, ha n egy 2-hatvány, vagy n = 2ap1 … pr, ahol a ≥ 0 egész, r ≥ 1 és p1, …, pr
különböző Fermat-prímek.
A Lucas-teszthez hasonló jellegű E. Proth 1878-ból származó tétele:

Ha n = k · 2m + 1, ahol k és m pozitív egészek és k páratlan, továbbá k < 2m és valamely x egész számmal x(n –1)/2 ≡ –1 (mod
n), akkor n prímszám.

A 2k – 1 alakú prímeket Mersenne-prímeknek nevezzük. Ilyenkor a k kitevő maga is prímszám kell, hogy legyen
(ellenkező esetben, ha k = ml és m > 1, akkor 2m – 1 egy valódi osztó). A megfordítás azonban nem igaz: az Mp = 2p – 1
Mersenne-szám nem minden p prímszám mellett lesz prím. E könyv írásakor összesen 47 Mersenne-prímet ismerünk,
ezeket a következő p kitevőkkel kapjuk: 2, 3, 5, 7, 13, 17, 19, 31, 61, 89, 107, 127, 521, 607, 1279, 2203, 2281, 3217, 4253, 4423, 9689,
9941, 11 213, 19 937, 21 701, 23 209, 44 497, 86 243, 110 503, 132 049, 216 091, 756 839, 859 433, 1 257 787, 1 398 269, 2 976 221, 3 021
377, 6 972 593, 13 466 917, 20 996 011, 24 036 583, 25 964 951, 30 402 457, 32 582 657, 37 156 667, 42 643 801 és 43 112 609. Ez utóbbi
kitevővel kapott Mersenne-prím a jelenleg ismert legnagyobb prímszám, a 10-es számrendszerbeli alakja 12 978 189
számjegyből áll. Azt nem tudjuk, hogy van-e végtelen sok Mersenne-prím, és azt sem tudjuk, hogy van-e végtelen sok olyan
Mersenne-szám, ami nem prím. Az bizonyított, hogy ha q egy prímosztója az Mp = 2p – 1 Mersenne-számnak, akkor q ≡
1(mod p) és q ≡ ± 1(mod 8). A fenti lista 12 millióig teljes: ennél kisebb kitevővel már nincs több Mersenne-prím.
A Lucas–Lehmer-teszt egy rekurzívan de niált sorozat elemeinek a segítségével dönti el a Mersenne-számokról, hogy
melyikük prím.

Legyen , ha k pozitív egész. Ekkor tetszőleges p páratlan prímszám mellett az Mp = 2p – 1


Mersenne-szám akkor és csak akkor prím, ha vp–1 ≡ 0(mod Mp).
A Mersenne-prímek szorosan kapcsolódnak a tökéletes számokhoz. Egy n pozitív egész szám tökéletes, ha a nála kisebb
pozitív osztóinak az összege éppen az n szám maga. (Tehát σ(n) = 2n.) Például 6 = 1 + 2 + 3 és 28 =1 + 2 + 4 + 7+14 tökéletes
számok. Jelenleg is megválaszolatlan kérdés, hogy létezik-e páratlan tökéletes szám. (Ha van, akkor biztosan nagyobb
10300-nál, és legalább nyolc különböző prímosztója van.) A páros tökéletes számokról pedig a következő mondható el:
Egy n páros szám akkor és csak akkor tökéletes, ha n = 2p–1Mp valamely p prímszámmal, amire Mp = 2p – 1 szintén prím.

Prímszámok a titkosításban
A prímszámok egyik legfontosabb alkalmazási területe a titkosítás. Például ha egy számítógépes szolgáltatás beléptetési
rendszere jelszót igényel, nagyon rizikós lenne a felhasználók jelszavait tárolni a rendszerben. Sokkal biztonságosabb
például a következő eljárás: a számítógép kiválaszt egy nagy p prímszámot (lehetőleg több száz számjegyűt) és egy g
primitív gyököt modulo p. Amikor egy felhasználó jelszót választ, abból valamilyen egyszerű eljárással kialakít egy x
pozitív egész számot, és aztán a gx hatvány p-vel vett m maradékát tárolja a rendszerben. Ezek után minden egyes
belépésnél könnyen ellenőrizheti, hogy a megadott x (számosított) jelszóra teljesül-e a gx ≡ m(mod p) kongruencia. Viszont
ha valaki hozzá is jutna a p prímszámhoz, a g primitív gyökhöz és a tárolt m maradékhoz, abból a jelenleg ismert technikák
alapján lehetetlen belátható időn belül megtalálni az x jelszót (azaz az m szám g alapú diszkrét logaritmusát modulo p).
Titkosításon legtöbbször üzenetek titkosítását értjük. Az alapszituáció, hogy A szeretne egy bizalmas üzenetet küldeni
B-nek, és fennáll a veszélye annak, hogy illetéktelen személyek valamilyen módon hozzájutnak ehhez az üzenethez. Tehát
A szeretné az üzenetét kódolni oly módon, hogy azt csak B fejthesse meg. Feltehetjük, hogy az üzenet természetes
számokból áll (ugyanis vannak egyszerű eljárások arra, hogy szavakból számokat készítsünk, aztán alkalomadtán ezekből a
számokból visszakapjuk az eredeti szavakat). Az üzenetküldés úgy zajlik le, hogy A valahogyan kódolja a számokból álló
mondandóját, ezt továbbítja B felé, végül B egy meghatározott eljárással dekódolja a kapott számokból az eredeti üzenetet.
A lényeg, hogy egyedül B ismerje ezt a megfejtési eljárást.
A kódolás, illetve a dekódolás alapulhat egy rögzített kulcson is, például egy nagy (több száz számjegyű) természetes
számon. (Mondjuk úgy, hogy az adott kulcs számjegyeit hozzáadjuk az eredeti számok számjegyeihez, de számtalan más
lehetőség is van.) Ennek a hátránya az, hogy rendszeres kommunikáció esetén gyakran kell cserélni a kulcsot, ugyanis az
illetéktelenek egy idő után fel tudnák törni. (Erre már nagyon ki nomult és hatékony módszerek vannak.) Viszont ahhoz,
hogy A és B kulcsot cseréljen, megint csak kommunikációra van szükség, amit az illetéktelenek szintúgy lehallgatnak.
A Di e–Hellman-eljárás egy biztonságos kulcsválasztási módszer: A és B nyilvános kommunikáció mellett tud
megegyezni egy olyan természetes számban, amit aztán csak ők ketten ismernek. Az eljárás a következő: A és B választanak
egy nagy p prímszámot és egy g primitív gyököt modulo p. Továbbá A választ egy a és B választ egy b egész számot a [2, p – 2]
intervallumból, de nem ezeket küldik el egymásnak, hanem A kiszámolja ga maradékát modulo p, és B kiszámolja gb
maradékát modulo p – legyenek ezek a számok x és y –, és ezt a két számot cserélik ki egymás közt. Ezek után A kiszámolja
ya maradékát, és B kiszámolja xb maradékát p-vel osztva, és ha jól számoltak, akkor ugyanazt a k eredményt kapják: ez lesz
a kulcs. (Ugyanis ya ≡ (gb)a ≡ (ga) ≡ xb(mod p).) Az illetéktelen lehallgatók meg azért lesznek gondban, mert nincs – legalábbis
egyelőre nem ismert – olyan eljárás, amivel diszkrét logaritmust könnyen lehetne számolni. Márpedig hiába nyilvános a p,
a g, az x és az y, a k kulcshoz vagy az a = indgx, vagy a b = indgy számra is szükség van.
Napjaink leghíresebb nyilvános kódú titkosítási eljárása az RSA-séma, amit R. Rivest, A. Shamir és L. Adleman
publikáltak 1978-ban. A rendszer lényege, hogy nyilvánosságra hozhatunk egy olyan kódolási eljárást, amivel bárki küldhet
nekünk üzenetet, de azt csak mi tudjuk megfejteni. Válasszunk két nagy prímszámot, jelöljük őket p-vel és q-val, legyen
továbbá N = pq, F = φ(N) = (p – 1) (q – 1), E egy olyan egész a [3, N – 2] intervallumban, ami relatív prím F-hez, és végül D az E
szám modulo F inverze. (D viszonylag könnyen kiszámolható: az euklideszi algoritmus segítségével 1-et, mint F és E
legnagyobb közös osztóját felírjuk rF + sE alakban, és D ≡ s mod F.) Amit nyilvánosságra hozunk, az az (N, E) számpár,
viszont szigorúan titokban tartjuk a p, q, F és D számokat. Ha ezek után valaki akar nekünk küldeni egy N-nél kisebb
természetes számban kifejezett x bizalmas üzenetet, akkor kiszámolja xE maradékát modulo N, és ezt az y számot küldi el.
Ekkor mi meg kiszámoljuk yD maradékát modulo N, és visszakapjuk x-et, ugyanis yD ≡ xED ≡ x(mod N), mivel az Euler–
Fermat-tétel alapján xF ≡ 1(mod N), és az ED szorzat 1-et ad maradékul F-fel osztva.
Ahhoz, hogy valaki a kódolt üzenetet megfejtse, ismernie kell a D számot, a D-hez pedig ismernie kell F-et, F-hez pedig
a p és q prímeket, tehát a nyilvánosságra hozott N szám prímtényezős felbontását. Éppen ebben rejlik az RSA-séma
biztonsága, ugyanis a jelenleg ismert faktorizációs eljárásokkal és a rendelkezésre álló számítógépes technológiával is
reménytelen feladat egy 3-400 számjegyből álló szám prímtényezőinek a megtalálása. (Sokkal egyszerűbb eldönteni egy
adott számról, hogy prímszám-e, mint megtalálni a prímosztóit: manapság már tetszőleges 15 ezer jegyű számról is
eldönthető, hogy prím vagy összetett. Így a p és q számok kiválasztásával nem lehet gond.)
Az RSA-séma egy kis nomítással arra is használható, hogy az üzeneteket „aláírjuk”. Ha A szeretne egy üzenetet
küldeni B-nek, és B szeretne meggyőződni arról, hogy az üzenetet valóban A-tól kapta, akkor a következőt tehetik.
Mindketten felállítanak egy-egy RSA-sémát a fentiek alapján, A nyilvánosságra hozza az (NA, EA) számpárt, és megőrzi
magának a DA dekódoló kulcsot, ugyanúgy B nyilvánosságra hozza az (NB, EB) számpárt, és megőrzi magának a DB
dekódoló kulcsot. Mivel NA és NB hatalmas számok, feltehetjük, hogy az x bizalmas üzenet egy mindkettőjüknél kisebb
természetes szám. Ekkor A kiszámolja maradékát modulo NA – jelölje ezt a számot s, majd maradékát
modulo NB – ez pedig legyen y, és ezt küldi el B-nek. Miután B megkapta az y számot, veszi maradékát modulo NB,
ami nem más, mint s, aztán kiszámolja maradékát modulo NA, és így visszakapta az eredeti x üzenetet. Ezzel
lényegében garantálva van, hogy az üzenet valóban A-tól érkezett, ugyanis csak ő tudja x alapján s-et kiszámolni. (Bárki
mástól kapott üzenet esetén mod NA minden bizonnyal valami értelmetlen eredményt adna ki.)

Megoldatlan problémák
A prímszámokkal kapcsolatban végül megemlítünk néhány híres problémát, amik viszonylag egyszerűen
megfogalmazhatók, mégis megoldatlanok mind a mai napig. Az egyik ilyen probléma az ikerprímek kérdése: van-e
végtelen sok belőlük? Ikerprímeknek nevezünk két olyan prímszámot, amik különbsége 2. Például 3 és 5, 5 és 7, 11 és 13
ikerprímek. (Ennél „közelebbi” prímek csak a 2 és a 3, mivel két szomszédos szám közül az egyik biztosan páros.) Eddigi
számítások azt a sejtést támasztják alá, hogy az x-nél nem nagyobb ikerprímek száma aszimptotikusan

, ahol C ≈ 0,660 16, pontosabban az 1 – [1/(p – 1)2] alakú racionális számok szorzata, ahol p végigfut a
páratlan prímszámokon. Ha ez a sejtés igaz, akkor természetesen végtelen sok ikerprím létezik, azonban erre semmi
bizonyítás nincs, csak számítási adatok (kb. x = 1016-ig). Annyi biztos, hogy ha van is végtelen sok ikerprím, a reciprokaik
összege konvergens, és a sorösszeg valahol 1,83 és 2,347 között van. Egy pozitív eredmény, ami kapcsolódik a témához: 1966-
ban Chen Jing-run igazolta, hogy végtelen sok olyan p prímszám van, amire p + 2 vagy szintén prím, vagy két prímszám
szorzata.
Az ikerprímek problémájához hasonlóan az is egy nyitott kérdés, hogy van-e végtelen sok olyan szomszédos számpár,
aminek az egyik tagja prím, a másik tagja pedig egy prím kétszerese.
Egy másik megoldatlan probléma a Goldbach-sejtés (1742-ből), miszerint minden 2-nél nagyobb páros szám előáll két
prímszám összegeként (mint például 10 = 3 + 7). Számítógépes ellenőrzések igazolják, hogy 4-től 1017-ig valóban minden
páros szám megkapható két prímszám összegeként. Chen 1966-ban azt is igazolta, hogy minden „elég nagy” páros szám
előáll egy olyan összeg eredményeképp, aminek az egyik tagja prím, a másik tagja pedig vagy prím, vagy két prímszám
szorzata. A „páratlan” Goldbach-sejtés, miszerint minden 5-nél nagyobb páratlan szám megkapható három prímszám
összegeként, szintén egy megoldatlan probléma, viszont egyenesen következne az eredeti sejtésből (mivel akkor az egyik
tényezőnek választhatnánk 3-at). Vinogradov 1937-ben igazolta, hogy minden „elég nagy” páratlan szám három darab
prímszám összege, aztán később, 1989-ben Chen és Wang konkretizálták az „elég nagy” fogalmát: megmutatták, hogy a
páratlan Goldbach-sejtés igaz minden 1043000-nél nagyobb páratlan számra.

13.7. Diofantikus egyenletek


A diofantikus egyenletek olyan többváltozós polinomiális egyenletek, ahol az együtthatók egész számok, és a megoldásokat
is az egész számok körében (vagy esetleg a racionális számok körében) keressük. Tehát egy diofantikus egyenlet általános
alakja f(x1, x2, …, xn) = 0, ahol f egy egész együtthatós n ismeretlenes polinom.
A legegyszerűbb számelméleti egyenletek közé tartoznak a kétismeretlenes lineáris diofantikus egyenletek, ahol adott
a(≠ 0), b(≠ 0) és c egészek mellett keressük az ax+ by = c egyenlet megoldásait. Egy ilyen egyenlet akkor és csak akkor oldható
meg, ha c osztható az a és b számok legnagyobb közös osztójával, azaz lnko(a, b)|c. Ebben az esetben könnyen kaphatunk
egy megoldást az euklideszi algoritmus segítségével, ugyanis abból fel tudjuk írni a és b legnagyobb közös osztóját lnko(a, b)
= ma + nb alakban alkalmas m és n egészekkel, aztán ha c = d · lnko(a, b), akkor az x = dm és y = dn választással ax + by = dma
+ dnb = d · (ma + nb) = d · lnko(a, b) = c.
Egy adott (x0, y0) megoldás ismerete alapján már az összes megoldást fel tudjuk írni, ugyanis ekkor tetszőleges t egész
számra x = x0 + tb/lnko(a, b) és y = y0 – ta/lnko(a, b) szintén megoldása az ax + by = c egyenletnek, továbbá az egyenlet
minden megoldása előáll ily módon.

Példa. Adjuk meg az 52x + 40y = 16 egyenlet általános megoldását!


Az egyenlet megoldható, mivel lnko(52, 40) =4 osztója 16-nak. Az euklideszi algoritmussal: 52 = 1·40 + 12, 40 = 3·12 + 4,
(12 = 3·4) és 4 = 40 – 3·12 = 40 – 3(52 – 40) = –3·52 + 4·40, ebből pedig 16 = –12·52 + 16·40. Tehát x0 = –12, y0 = 16 egy
megoldása az egyenletnek, az általános megoldás pedig az x = x0 + tb/lnko(a, b) és y = y0 – ta/lnko(a, b) formulák
alapján x = –12 + 10t, y = 16 – 13t, ahol t tetszőleges egész szám lehet.

A többváltozós lineáris diofantikus egyenlet általános alakja

ahol az ai egész együtthatók közül egyik sem nulla. Ez az egyenlet is pontosan akkor oldható meg az egész számok körében,
ha lnko(a1, a2, …, an) osztja c-t. A gyakorlatban ez az egyenlet visszavezethető egy eggyel kevesebb ismeretlenes egyenletre:
legyen y = lnko(an – 1, an), és ekkor az a1x1 + … + an–2xn–2 + by = c egyenlet bármely megoldása az an–1xn–1 + anxn = by egyenlet
egy tetszőleges megoldásával az eredeti egyenlet egy megoldását szolgáltatja.
Pitagoraszi számhármasok
A Fermat-egyenlet
A Pell-egyenlet
A Waring-probléma

Pitagoraszi számhármasok
Egy másik közismert diofantikus egyenlet a pitagoraszi számhármasok egyenlete: x2 + y2 = z2, ahol csak pozitív egész
megoldásokat keresünk. Tehát azt is mondhatjuk, hogy olyan derékszögű háromszögeket keresünk, amiknek az
oldalhosszúságai egész számok. Például (3, 4, 5), (4, 6, 10) és (5, 12, 13) a legegyszerűbb pitagoraszi számhármasok. Egyszerű
észrevétel, hogy egy adott (x, y, z) pitagoraszi számhármasból végtelen sokat tudunk készíteni, ugyanis x2 + y2 = z2 esetén
tetszőleges d természetes szám mellett (xd)2 + (yd)2= (zd)2 szintén teljesül. Egy (x, y, z) számhármast primitív pitagoraszi
számhármasnak nevezünk, ha x2 +y2 = z2 mellett még az is teljesül, hogy lnko(x, y, z) = 1. A fenti észrevétel alapján minden
pitagoraszi számhármas megkapható úgy, hogy egy alkalmas primitív pitagoraszi számhármas minden tagját
megszorozzuk egy adott pozitív egésszel. A primitív pitagoraszi számhármasokat pedig az x = m2 – n2, y = 2mn, z = m2 + n2
képlettel kaphatjuk meg, ahol m és n egymáshoz relatív prím, különböző paritású pozitív egészek, továbbá m > n. Az alábbi
táblázatban felsoroljuk az összes olyan primitív pitagoraszi számhármast, aminek az m és n paraméterei 5-nél nem
nagyobbak.

m n x y z

2 1 3 4 5

4 1 15 8 17

3 2 5 12 13

5 2 21 20 29

4 3 7 24 25

5 4 9 40 41

A Fermat-egyenlet
A pitagoraszi számhármasok egyenletének egy lehetséges általánosítása a Fermat-egyenlet: xn + yn = zn, ahol szintén
pozitív egész megoldásokat keresünk mind a négy ismeretlenre az n ≥ 3 feltétel mellett. Fermat híres sejtése 1637-ből –
miszerint n ≥ 3 esetén az egyenletnek nincs pozitív egészekből álló megoldása – évszázadokig foglalkoztatta matematikusok
és matematikakedvelők ezreit, míg végül 1994-ben Andrew Wilesnak sikerült a sejtést igazolnia. (Wiles tulajdonképpen
1993-ban hozta nyilvánosságra a bizonyítását, de néhány hét múlva találtak benne egy hibát, amit aztán Wiles és Richard
Taylor 1994 őszére sikeresen kijavított.) Bizonyos konkrét kitevőkre már régóta bizonyított volt Fermat sejtése, például az n
= 4 esetre Fermat saját maga adott egy elemi bizonyítást. Euler 1770-ben igazolta a sejtést az n = 3 esetre, aztán 1825-ben
Dirichlet és Legendre egymástól függetlenül bizonyították az n = 5, majd Lamé 1839-ben az n = 7 esetet. Komoly áttörést
jelentett az 1840-es években Ernst Kummer munkája, aki a sejtést minden 100-nál kisebb páratlan prím kitevőre igazolta,
37, 59 és 67 kivételével. Wiles történelmi cambridge-i előadásának az idején, 1993-ban már ismert volt, hogy az xn + yn = zn
egyenletnek semmilyen négymilliónál kisebb (és kettőnél nagyobb) kitevővel nincs pozitív egészekből álló megoldása.
A Fermat-sejtést elég volt páratlan prím kitevőkre, illetve n = 4-re igazolni, ha ugyanis létezne egy an + bn = cn, pozitív
egészekből álló megoldás és n osztható egy p páratlan prímszámmal – mondjuk n =pk, ahol k is egész –, akkor az egyenlőség
átírásával (ak)p + (bk)p = (ck)p, tehát az xp + yp = zp egyenletnek is létezne pozitív egészekből álló megoldása. Ha pedig n olyan
2-nél nagyobb egész, ami nem osztható semmilyen páratlan prímszámmal, akkor csak egy 2-hatvány lehet, és így
többszöröse 4-nek: n = Ak, ahol k szintén egész. Ekkor pedig az an + bn = cn egyenlőségből (ak)4 + (bk)4 = (ck)4, tehát az x4 + y4
= z4 egyenletre is kapnánk egy megoldást, amiről pedig már Fermat óta tudjuk, hogy nincs.

A Pell-egyenlet
A Pell-egyenlet általános alakja x2 – dy2 = k, ahol d és k adott egész paraméterek, és d nem négyzetszám. Ha d és k
mindketten negatívak, akkor x2 – dy2 ≥ 0 és k < 0 miatt az egyenletnek nincs megoldása. Ha d negatív és k pozitív, akkor
|d|y2 ≤ k miatt az egyenletnek csak véges sok megoldása lehet, és ezeket megkaphatjuk úgy, hogy végignézzük az összes
olyan y egész számot, ami közé esik, és megvizsgáljuk, hogy mely esetekben lesz k + dy2 egy
négyzetszám. Ha k = 0, akkor az egyenletből x2 = dy2 és d csak úgy lehetne egész, ha maga is négyzetszám. Általában, ha d =
D2, akkor az egyenlet bal oldala szorzatra bomlik: (x + Dy) (x – Dy) = k, és a megoldásokat megkapjuk a k szám szorzatra
bontási lehetőségeiből. Tehát a Pell-egyenlet megoldása csak akkor igényel komolyabb számelméleti megfontolást, ha d egy
pozitív egész, nem négyzetszám és k ≠ 0.
A k = 1 speciális esetben (amikor is az egyenlet alakja x2 – dy2= 1) x = 1, y = 0 egy triviális megoldás, és bármely nem
triviális megoldásból végtelen sok további megoldás konstruálható (ugyanarra a d-re). Ha ugyanis , akkor a

bal oldalt szorzatra bontva azt kapjuk, hogy , és tetszőleges n természetes szám mellett

igaz lesz, hogy . Elvégezve a hatványozásokat és mindkét tényezőben különválasztva az

egész és a tényezőket azt fogjuk kapni, hogy alkalmas a és b egészekkel

. Mivel ekkor

, az x = a, y = b választás szintén egy megoldást


szolgáltat.

Bármely d pozitív egész mellett, ami nem négyzetszám, az x2 – dy2 = 1 egyenletnek végtelen sok megoldása van az egész
számok körében, és ezek között létezik egy alapmegoldás: olyan x0 és y0 pozitív egészek, amikkel az összes megoldást

megkapjuk az , n ∈ ℤ képlettel.

Az absztrakt algebra nyelvezetével úgy fogalmazhatjuk meg ezt a tényt, hogy a


gyűrű azon elemeinek a halmaza, amikre a2 – db2 = 1, egy csoportot alkot a szorzás műveletével, ami egy
végtelen ciklikus csoport direkt szorzata a {–1, 1} kételemű ciklikus csoporttal. Ez amúgy nem feltétlenül egyezik meg a
, gyűrű egységcsoportjával (azaz multiplikatív inverzzel rendelkező elemeinek a csoportjával), ugyanis egy
elem akkor és csak akkor egység -ben, ha a2 – db2 = + 1.
Amennyiben az x2 – dy2 = –1 egyenlet megoldható egész számokkal, akkor szintén igaz, hogy a megoldások száma

végtelen, és ezek mind megkaphatók egy (x0, y0) alapmegoldásból az , n ∈ ℤ képlettel,

ráadásul ekkor egy alapmegoldását szolgáltatja az x2 – dy2 = 1 egyenletnek.


Azonban az x2 – dy2 = –1 egyenlet nem mindig oldható meg az egész számok körében. Például olyankor biztosan nem,
amikor az x2 ≡ –1 (mod d) kongruenciának nincs megoldása.
Az általános x2 – dy2 = k egyenlet megoldásai – amennyiben léteznek – összefüggésben állnak a speciális, x2 – dy2 = 1
egyenlet megoldásaival. Ha ugyanis a2 – db2 = k és e2 – df2 = 1, akkor az
szorzat egy újabb megoldást ad: . Így egy adott megoldásból végtelen
sok megoldást készíthetünk, ha ismerjük az x2 – dy2 = 1 egyenlet megoldásait.
Ha az x2 – dy2 = k egyenlet megoldható az egész számok körében (ahol d pozitív egész, nem négyzetszám, és k pozitív),
akkor végtelen sok megoldás van, és ezek a megoldások véges sok osztályba sorolhatók, azaz léteznek olyan (x1, y1), (x2, y2),

…, (xt, yt) alapmegoldások, amikkel az összes megoldást az , n ∈ ℤ, i = 1, 2, …,


t képlet szolgáltatja, ahol (e, f) az x2 – dy2 = 1 egyenletnek egy alapmegoldása.

A Waring-probléma
Közismert és sokat vizsgált számelméleti kérdés, hogy a pozitív egészek hogyan írhatók fel négyzetszámok összegeként.
Mely számok írhatók fel mint két vagy három négyzetszám összege, illetve van-e olyan n természetes szám, hogy n darab
négyzetszám összegeként már felírható minden pozitív egész szám? Ez a kérdés aztán magasabb kitevőkre is
megfogalmazható: adott k kitevő mellett van-e mindig olyan n természetes szám, hogy n darab k-adik hatvány összegeként
felírható minden pozitív egész szám? Ha a válasz igen, akkor természetesen jó lenne megtalálni a legkisebb ilyen n számot
(ami minden bizonnyal függ majd k-tól). Ez a Waring-problémakör.
Négyzetösszegekről a következő igaz:

Bármely pozitív egész felírható négy négyzetszám összegeként. Három négyzetszám összegeként csak a 4k(8m + 7)
alakú egészek nem állnak elő. Két négyzetszám összegeként pedig pontosan azok a pozitív egészek írhatók fel,
amelyeknek a prímfelbontásában minden 4m + 3 alakú prímszám páros hatványon szerepel.

Általában g(k) jelöli azt legkisebb olyan n pozitív egészt, amire igaz, hogy minden természetes szám előáll n darab k-
adik hatvány összegeként, és G(k) azt a legkisebb olyan m pozitív egészt, amivel maximum véges sok kivételtől eltekintve
minden természetes szám előáll m darab k-adik hatvány összegeként – amennyiben ezek a számok léteznek. A fenti tétel
alapján g(2) = G(2) = 4 (ugyanis végtelen sok természetes szám nem írható fel három négyzetszám összegeként), és már a
XIX. században ismert volt, hogy g(k) létezik k = 3, 4, 5, 6, 7, 8, 10-re. David Hilbert igazolta 1909-ben, hogy g(k) (és így G(k)
is) minden k pozitív egész mellett létezik. Valószínűleg érvényes a g(k) = [(3/2)k] + 2k – 2 képlet (bizonyítottan csak véges sok
k érték lehet ez alól kivétel), így például g(3) = 9, g(4) = 19 és g(5) = 37. Továbbá 4 ≤ G(3) ≤ 7, G(4) = 16, 6 ≤ G(5) ≤ 17, 9 ≤ G(6) ≤ 24,
8 ≤ G(7) ≤ 32 és 32 ≤ G(8) ≤ 42. Egy általános eredmény, hogy minden k pozitív egészre k + 1 ≤ G(k) ≤ 6k ln k.
14. Számsorozatok
14.1. A számsorozat fogalma
14.2. A számtani sorozat és tulajdonságai
14.3. A mértani sorozat és tulajdonságai
14.4. Korlátos, monoton, konvergens sorozatok
14.5. A Fibonacci-sorozat
14.6. Magasabb rendű lineáris rekurzív sorozatok, néhány speciális sor

14.1. A számsorozat fogalma

Számsorozatnak nevezzük az olyan függvényt, melynek értelmezési tartománya a pozitív egész számok halmaza (vagy
annak valamely végtelen részhalmaza), értékkészlete pedig a valós számok egy részhalmaza.

A számsorozatot általában {an}-nel jelöljük. A sorozatban részt vevő valós számokat a sorozat tagjainak mondjuk. A
sorozat 1., 2., …, n. tagját általában a1, a2, …, an-nel jelöljük. Ha tehát a sorozatot leíró függvény f, akkor a számsorozat:

Egy számsorozatot többféle módon is megadhatunk.


a) A sorozat tagjait leggyakrabban képlettel adjuk meg: egy olyan n-től függő képletet adunk meg, melybe rendre
behelyettesítve a pozitív egész számokat, a sorozat egymást követő tagjai adódnak. Például
an = 2n – 1; a sorozat első néhány tagja: 1, 3, 5, 7, 9, …

; a sorozat első néhány tagja: , ...


; a sorozat első néhány tagja:

b) Egy számsorozat tagjait megadhatjuk úgy is, hogy egyértelmű szöveggel körülírjuk a sorozat tagjainak képzési
szabályát. Például
an: a prímszámok növekvő sorozata: 2, 3, 5, 7, 11, …
an: a négyzetszámoknál eggyel kisebb számok nagyság szerint növekvő sorozata:

an : a 3 nevezőjű, pozitív egész számlálójú racionális számok nagyság szerint növekvő sorozata:

c) Gyakran fordul elő, hogy egy számsorozatot rekurzív módon adunk meg: ez azt jelenti, hogy megadjuk a
számsorozat első néhány (k db) tagját, majd megadjuk azt a képzési szabályt, mely megmutatja, hogy a sorozat minden
további tagja hogyan képezhető a kérdéses tagot megelőző k db tag segítségével. Például

E sorozat néhány kezdő tagja: 1, 1, 3, 7, 17, 41, …


Előfordulhat, hogy a sorozat nincs értelmezve minden pozitív egész számra. Például

A jobb oldali tört nevezője n = 2 és n = 3 esetén 0, vagyis e két szám esetén a törtnek nincs értelme; így a számsorozatnak
nincs második és harmadik tagja (például ilyen esetekre utal a de nícióban szereplő „vagy annak valamely végtelen
részhalmaza” kifejezés).
A számsorozat tagjait ábrázolhatjuk számegyenesen vagy derékszögű koordináta-rendszerben. Ez utóbbi esetben az
ábrázolt pontok első koordinátái rendre az értelmezési tartomány növekvő tagjai: 1, 2, 3, 4, …, n, …, a pont második
koordinátái pedig a sorozat egymást követő tagjai: a1, a2, a3, a4, …, an, …
Ábrázoljuk pl. az an = 2n + (–1)n sorozat néhány tagját a koordináta-rendszerben! A sorozatnak megfelelő pontok
koordinátái:
(1; 1), (2; 5), (3; 5), (4; 9), (5; 9), (6; 13), (7; 13), … (14.1. ábra).

14.1. ábra

14.2. A számtani sorozat és tulajdonságai

A számtani sorozat olyan számsorozat, melyben bármely két szomszédos tag különbsége a sorozatra jellemző állandó,
azaz minden n > 1 esetén an+1 – an = állandó.

Ezt az állandót d-vel szokás jelölni, és a sorozat különbségének vagy di erenciájának nevezzük. Ha d = 0, akkor a
sorozat minden tagja a1. Ezek szerint a számtani sorozat tagjait a második tagtól kezdve úgy kaphatjuk meg, hogy a
kérdéses tagot megelőző taghoz hozzáadjuk a sorozat di erenciáját:

Könnyen kifejezhetjük a sorozat n-edik tagját az első tag és a di erencia segítségével. Mivel

Vagyis a sorozat n-edik tagját megkapjuk, ha az első taghoz hozzáadjuk a di erencia (n – 1)-szeresét.
A számtani sorozat bármely három szomszédos tagját tekintve a középső a két szélsőnek mindig számtani közepe. Sőt,
az is igaz, hogy a számtani sorozat bármely három olyan tagja, melyek közül a két szélső a középsőre „szimmetrikusan”
helyezkedik el, e három tag közül a középső a két szélső számtani közepe:

Gyakran van szükség a számtani sorozat első n tagjának összegére. Ezt az összeget Sn-nel szokás jelölni.

A számtani sorozat tagjait ábrázolhatjuk a derékszögű koordináta-rendszerben: a sorozatot szimbolizáló pontok


számtani sorozat esetében egy egyenesre illeszkednek.

Példák
1. Számítsuk ki azoknak a kétjegyű számoknak az összegét, melyek 7-tel osztva 2 maradékot adnak!
A kérdéses számok egy olyan számtani sorozat tagjai, melynek első tagja 16, di erenciája 7. Mivel a legnagyobb
olyan kétjegyű szám, amelyik 7-tel osztva 2 maradékot ad 93, ezért an = 93.
A sorozat első 12 tagjának összege:

2. Egy nem állandó számtani sorozat (d ≠ 0) első tagja 3, di erenciája 2-nél nagyobb prímszám. A sorozat első három
tagja négyzetének összege ugyancsak tagja a sorozatnak. Hányadik tagja?
A feltételek szerint valamely k pozitív egész számra

A bal oldal csak akkor lesz egész szám, ha az első tagja egész, azaz, ha d osztója 24-nek. Mivel d 2-nél nagyobb
prím, ezért csak d = 3 lehetséges, és ekkor

Tehát a kérdéses sorozat első három tagja négyzetének összege a sorozatnak a 42. tagja.
3. Egy derékszögű háromszög oldalai egy számtani sorozat egymást követő tagjai. Mekkora a háromszög területe, ha
a kerülete 24 cm?
Legyen a derékszögű háromszög nagyobbik befogója b, a számtani sorozat di erenciája d (14.2. ábra).

14.2. ábra

Írjuk fel Pitagorasz tételét e derékszögű háromszögre:

Tehát a háromszög oldalai 3d, 4d, 3d. Ezek összege a kerület:

A háromszög oldalai: 6, 8, 10, ezzel a keresett terület: .


Érdemes észrevenni, hogy azok a derékszögű háromszögek, amelyek oldalai egy számtani sorozat egymást követő
tagjai, mind hasonlók egymáshoz, hiszen az ilyen háromszögekben az oldalak aránya: 3 : 4 : 5.

14.3. A mértani sorozat és tulajdonságai

A mértani sorozat olyan számsorozat, melyben bármely két szomszédos tag hányadosa a sorozatra jellemző állandó,

azaz minden n > 1 esetén = állandó.

Ezt az állandót a mértani sorozat hányadosának vagy kvóciensének nevezzük és általában q-val jelöljük. Nyilván q ≠ 0.
Ha q = 1, akkor a sorozat minden tagja az első tag.
Ezek szerint a mértani sorozat tagjait a második tagtól kezdve úgy kaphatjuk meg, hogy a kérdéses tagot megelőző
tagot megszorozzuk a kvócienssel:

Könnyen kifejezhetjük a sorozat n-edik tagját az első elem és a kvóciens segítségével.


Vagyis a sorozat n-edik tagját megkapjuk, ha az első tagot megszorozzuk a hányados (n – 1)-edik hatványával.
Ha a mértani sorozat minden tagja pozitív, akkor bármely három egymást követő tagja közül a középső a két szélsőnek
mértani közepe. Igaz ennek általánosabb alakja is: bármely három olyan tagra, melyek közül a két szélső a középsőre
szimmetrikusan helyezkedik el, a középső tag a két szélsőnek mértani közepe

Gyakran van szükség a mértani sorozat első n tagjának összegére. Ezt az összeget – a számtani sorozathoz hasonlóan –
Sn-nel szokás jelölni. Ha a mértani sorozat hányadosa 1, vagyis a sorozat minden tagja a1, akkor nyilván

Ha q ≠ 1, akkor

Példák
1. Egy derékszögű háromszög oldalai egy mértani sorozat egymást követő tagjai. Mekkorák a háromszög szögei?
Az általánosság megszorítása nélkül feltehetjük, hogy a háromszög egyik befogója egységnyi, továbbá legyen a
mértani sorozat hányadosa q (14.3. ábra)!

14.3. ábra

Pitagorasz tétele alapján:

E q2-ben másodfokú egyenlet pozitív megoldása:

Az ábra alapján pedig

2. Egy pozitív tagú nem állandó számtani sorozat első, második és negyedik tagja egy mértani sorozat egymást
követő tagjai. Igazoljuk, hogy ekkor a számtani sorozat első, harmadik és kilencedik tagja ugyancsak egy mértani
sorozat egymást követő tagjai! A feltételek szerint a1, a1 + d, a1 + 3d egy mértani sorozat egymást követő tagjai. Ez
azt jelenti, hogy

Mivel a sorozat nem állandó, azaz d ≠ 0, így azt kapjuk, hogy d = a1.
A számtani sorozat első, harmadik és kilencedik tagja: a1, a1 + 2d, a1 + 8d. Felhasználva az előbb d-re kapott
értéket, ezek a tagok: a1, 3a1, 9a1. Ezek a tagok egy olyan mértani sorozat egymást követő tagjai, melynek
hányadosa q = 3.
3. Állítsuk elő a mértani sorozat első n tagjának a szorzatát!
Igen jól alkalmazhatók a mértani sorozatok a kamatoskamat-, a törlesztőrészlet-, illetve a járadékszámításoknál.
Ha egy A0 összeget év elején n évre, évenként p% kamatra elhelyezünk, akkor n év elteltével a kamatos kamattal
megnövelt összeg, azaz

összeg áll rendelkezésünkre. Ez tulajdonképpen egy olyan mértani sorozat, melynek első tagja A0, hányadosa pedig:

Ha minden év elején elhelyezünk egy A0 összeget évi p%-os kamatra, akkor kérdezhetjük, hogy mennyi lesz betétünk
értéke n év múlva. A betét értéke n év múlva:

A zárójelben egy olyan mértani sorozat tagjai szerepelnek, melynek első tagja 1, hányadosa q, így azt kapjuk

Ha K0 kölcsönt veszünk fel évi p%-os kamatra, és évenként egyenlő t törlesztést vállalunk, akkor n év múlva még
fennálló Tn tartozásunk:

Ha e K0 kölcsönt n év alatt szeretnénk vissza zetni, akkor az éves egyenlő t törlesztőrészlet kiszámításához vegyük
gyelembe, hogy ez utóbbi kifejezésben Tn = 0. Ekkor

Ha elhelyezünk a bankban egy A0 összeget p%-os kamatra, s minden év végén a kamatos kamattal növelt összegből
ugyanannyi r összeget felveszünk, akkor n év múlva a bankkal szemben fennálló An követelésünk:

Példák
1. Egy bizonyos évtől kezdődően minden év elején elhelyeztünk 150 000 Ft összeget egy bankban, évi 12%-os
kamatra. Mennyi pénzünk lesz 7 év múlva? Hány év alatt duplázódik meg a pénzünk?
Hét év múlva pénzünk

Ha pénzünk n év múlva duplázódik meg, akkor

Vegyük mindkét oldal 10-es alapú logaritmusát, majd alkalmazzuk a logaritmus megfelelő azonosságát!

Tehát pénzünk kb. a hetedik év első hónapjának végére duplázódik meg.


2. Egy bankba elhelyeztünk egy bizonyos összeget évi 16,5%-os kamatra. Hány év múlva duplázódik meg a betett
összeg? Legyen a betett összeg A Ft! Ha e pénzünk n év alatt duplázódik meg, akkor

Vegyük most mindkét oldal 10-es alapú logaritmusát!

Tehát kb. 4,5 év múlva duplázódik meg a betett összeg.


3. Egy banktól 800 000 Ft kölcsönt vettünk fel évi 18%-os kamatra 6 év időtartamra. Ha minden évben ugyanannyi
összeget szeretnénk törleszteni, akkor évente mennyi lesz a törlesztőrészletünk?

ahol t a keresett évi törlesztőrészlet, K0 = 800 000, q = 1,18, n = 6. Az éves törlesztőrészlet:

4. Egy A bankban elhelyeztünk 600 000 Ft-ot évi 14%-os kamatra. Egy másik B bankban 800 000 Ft-ot helyeztünk el
évi 12%-os kamatra. Hány év elteltével ér többet az A bankban elhelyezett betétünk, mint a B bankban elhelyezett
betét?
Ha n év múlva az A bankban elhelyezett betét már legalább akkora, mint a B bankban elhelyezett betét, akkor

Vegyük most mindkét oldal 10-es alapú logaritmusát!

Tehát a 17. évben „éri utol” az A bankban elhelyezett összeg a B bankban elhelyezett összeget. (Az utolsó lépésnél –
ne feledjük el – negatív számmal osztottunk.)

14.4. Korlátos, monoton, konvergens sorozatok


Gyakran szükséges és hasznos számunkra a számsorozatokat abból a szempontból vizsgálni, hogy n növekedtével a sorozat
tagjai növekednek-e vagy csökkennek, illetve hogy a számsorozat mint függvény értékkészlete felülről (vagy alulról)
korlátos halmaz vagy sem.

Az {an} számsorozat monoton növekvő, ha minden n esetén an ≤ an+1.


Az {an} számsorozat monoton csökkenő, ha minden n esetén an ≥ an+1.
Ha minden n-re an < an+1, akkor szigorúan monoton növekvőnek, ha pedig an > an+1, akkor szigorúan monoton
csökkenőnek mondjuk a számsorozatot.

Példaként vizsgáljuk meg az alábbi sorozatokat monotonitás szempontjából!

Példák
1.
. Írjuk ki a sorozat első néhány tagját: , … Az lehet a sejtésünk, hogy ez a sorozat
szigorúan monoton növekvő sorozat. Ennek igazolásához vizsgáljuk meg a következő egyenlőtlenséget: vajon
igaz-e minden n-re, hogy

Mivel mindkét oldal nevezője pozitív, ezért keresztbe szorozhatunk.

Ez utóbbi egyenlőtlenség nyilván minden n-re igaz, tehát a sorozat valóban szigorúan monoton növekedő.
2.
. A sorozat első néhány tagja: , … Most azt sejtjük, hogy a sorozat szigorúan
monoton csökkenő. Hogy ez valóban így van, ahhoz azt kell megmutatnunk, hogy minden n-re an > an+1, vagyis
Ez utóbbi egyenlőtlenség nyilván minden n-re igaz, így a sorozat valóban szigorúan monoton csökkenő.
3.
. A sorozat első néhány tagja: , … Nyilvánvaló, hogy a sorozat tagjai
váltakozó előjelűek, így e sorozat sem nem szigorúan monoton növekvő, sem szigorúan monoton csökkenő.
(Szokás az ilyen számsorozatot oszcilláló sorozatnak nevezni.)

Az {an} sorozatot felülről korlátosnak mondjuk, ha létezik olyan K valós szám, hogy minden n-re an ≤ K. A K számot a
sorozat egy felső korlátjának nevezzük.
Az {an} sorozatot alulról korlátosnak mondjuk, ha létezik olyan k valós szám, hogy minden n-re an ≥ k. A k számot a
sorozat egy alsó korlátjának nevezzük.
Az olyan számsorozatot mely felülről is és alulról is korlátos, korlátos sorozatnak nevezzük.

Nyilvánvaló, hogy ha egy sorozat felülről korlátos, akkor végtelen sok felső korlátja van, hiszen, ha K* > K, akkor K* is
egy felső korlát. Ugyanez természetesen elmondható az alulról korlátos sorozatokra is.
Nézzünk néhány példát korlátos (és nem korlátos) sorozatokra!

Példák
1.
Az előző 1. példában említett sorozatról beláttuk, hogy szigorúan monoton növekvő sorozat. Most
belátjuk, hogy felülről korlátos. Ugyanis minden n-re an < 2.

Ami nyilvánvaló. Mivel e sorozat alulról is korlátos (hiszen minden tagja pozitív, tehát egy alsó korlátja pl. a 0),
így e sorozat korlátos sorozat.
2.
Az előző 2. példában említett sorozat szigorúan monoton csökkenő.
Mivel minden tagja (az első kivételével) negatív, ezért felülről korlátos; egy felső korlátja pl. a 0. Vajon alulról
korlátos-e? Azaz létezik-e olyan k valós szám, hogy minden n-re an ≥ k?

Ez utóbbi egyenlőtlenség nem teljesülhet minden n-re, hiszen ennek az n-ben másodfokú kifejezésnek a gra kus
képe egy felfelé nyíló parabola, így nem lehet minden n-re kisebb-egyenlő 0. Tehát ez a sorozat alulról nem
korlátos, azaz minden határon túl csökken.

Nagy jelentőséggel bírnak azok a sorozatok, melyeknek van határértéke. Az ilyen sorozatokat konvergens
sorozatoknak nevezzük.

Az {an} sorozat konvergens, és határértéke az A szám, ha minden ϵ > 0 valós számhoz létezik olyan n0 pozitív egész
szám, hogy ha n > n0, akkor

Az A számot a sorozat határértékének mondjuk, az n0 pozitív egész számot pedig a kérdéses ϵ-hoz tartozó
küszöbindexnek nevezzük. Mindezt az alábbi módon jelöljük:

Mindez szemléletesen azt jelenti, hogy a sorozat tagjai „egyre közelebb” kerülnek az A számhoz, s az A számnak
bármilyen pici ϵ sugarú környezetét is vesszük, egy bizonyos tagtól kezdve a sorozat összes többi tagja már közelebb van A-
hoz, mint a kérdéses ϵ, azaz e tagtól kezdve a sorozat összes tagja benne van az A ϵ sugarú környezetében. Másképpen ezt
úgy is megfogalmazhatjuk, hogy az A számnak ϵ sugarú környezetében a sorozatnak végtelen sok tagja van, azon kívül
pedig csak véges.
Példák
1.
Első példaként tekintsük az sorozatot! A sorozat néhány kezdő eleme: , … Azt
látjuk, hogy a sorozat szigorúan monoton növekvő, ugyanakkor korlátos, hiszen minden tagja pozitív, s például
minden n-re an < 1. Megmutatjuk, hogy a sorozat konvergens, és a határértéke 1. Ugyanis

Ez utóbbi pedig n növekedtével bármilyen kicsi pozitív szám lehet. Tehát

Adjuk meg pl. az ϵ = 10–4 értéket, s nézzük meg, a sorozat hányadik tagjától kezdve lesznek a sorozat tagjai
közelebb 1-hez, mint a megadott ϵ!

Tehát az 19 999. tagtól kezdve a sorozat minden tagja kevesebbel tér el az 1-től, mint 10–4, mondhatnánk úgy is,
hogy az 1 szám 10–4 sugarú környezetében a sorozatnak végtelen sok tagja van, azonkívül pedig csak véges,
pontosan 19 998.
2.
Legyen ! A sorozat első néhány tagja: , …. Látjuk, hogy a sorozat nem
monoton, de korlátos, hiszen minden tagja –1 és 1 között van. A sorozat tagjait érdemes szemléltetni a
számegyenesen (14.4. ábra).

14.4. ábra

Azt látjuk, hogy a sorozat tagjai a 0 körül „ugrálva” egyre közelebb kerülnek a 0-hoz. Bármilyen pici ϵ sugarú
környezetét vesszük is a 0-nak, a sorozat tagjai előbb-utóbb e környezetbe kerülnek, s így valamely tagtól kezdve a
sorozatnak már minden tagja kevesebbel tér el a 0-tól, mint az adott ϵ. Vagyis e sorozat konvergens és

Természetesen nem minden sorozat rendelkezik a fenti tulajdonsággal, vagyis nem minden sorozat konvergens.

Azt mondjuk, hogy az {an} sorozat tart +∞-hez, ha tetszőleges K valós számhoz létezik olyan n0 pozitív egész szám, hogy
n > n0 esetén an > K.
Azt mondjuk, hogy az {an} sorozat tart –∞-hez, ha tetszőleges k valós számhoz létezik olyan n0 pozitív egész szám, hogy
n > n0 esetén an < k.

Mindezt így jelöljük:

A nem konvergens sorozatokat divergens sorozatnak nevezzük.

Most vizsgáljuk meg a konvergens sorozatok legfontosabb tulajdonságait!

Ha az an sorozat monoton növekedő és felülről korlátos, akkor konvergens.


Ha az an sorozat monoton csökkenő és alulról korlátos, akkor konvergens.

Ha az an sorozat konvergens, akkor csak egy határértéke van.


Bizonyítás. Ez utóbbi állítás igazolásához tegyük fel indirekt, hogy valamely an konvergens sorozatnak két
határértéke van, vagyis

Legyen , és vegyük az A és B számok ϵ sugarú környezetét (14.5. ábra)!

14.5. ábra

A határérték de níciójának következményeként az A szám ϵ sugarú környezetében a sorozatnak végtelen sok tagja
van, azonkívül csak véges. De B is határérték, ezért a B szám ϵ sugarú környezetében a sorozatnak ugyancsak
végtelen sok tagja van, azonkívül csak véges. Mivel az A és B körüli ϵ sugarú környezeteknek nincs közös része, így
ellentmondásra jutottunk, vagyis valóban, ha az an sorozat konvergens, akkor csak egy határértéke van.

Fontos és igen hasznos a konvergens sorozatokra vonatkozó alábbi, ún. „rendőrszabály”.

Ha az an, bn, cn sorozatok esetén minden n-re

Ez tehát azt jelenti, hogy ha az an és bn konvergens sorozatok határértéke megegyezik, és a cn sorozat minden tagja az
an és bn sorozatok megfelelő tagja közé esik, akkor a cn sorozat is konvergens, és határértéke megegyezik az an és bn
sorozatok határértékével.

Bizonyítás. Ennek igazolásához vegyük az A szám egy tetszőleges ϵ > 0 környezetét! A feltételek szerint az an sorozat
esetében van olyan N1 pozitív egész szám, hogy n > N1 esetén a sorozat tagjai az A szám ϵ sugarú környezetébe esnek.
De a bn sorozat esetében is található olyan N2 küszöbindex, hogy n > N2 esetén a sorozat tagjai már az ϵ sugarú
környezetbe esnek. Legyen N2 > N1. Ekkor mindkét sorozat esetében n > N2-re a sorozatok minden tagja az A szám ϵ
sugarú környezetébe esik. De minden n-re an ≤ cn ≤ bn, így a cn sorozatnak ugyancsak minden ilyen indexű tagja az A
szám ϵ sugarú környezetébe esik, és éppen ezt kellett igazolnunk.

Ugyancsak sokszor jól alkalmazható az alábbi tétel:

Érdemes megvizsgálni azt a kérdést, hogy ha konvergens sorozatokkal bizonyos műveleteket végzünk, akkor e
műveletek hogyan vihetők át a kérdéses sorozatok határértékére. Erről szólnak a de níció alapján könnyen igazolható
határértéktételek.

Legyenek az an és bn sorozatok konvergens sorozatok és legyen

Ekkor
1. ,
2. ,
3. ,
4.
, itt természetesen bn ≠ 0 és B ≠ 0.

Mindezek alkalmazására nézzük az alábbi példákat.

Példák
1. Vizsgáljuk meg, konvergens-e az alábbi számsorozat, és ha igen, mi a határértéke:

Osszuk el a számlálót is és a nevezőt is n3-nal. Ekkor


Tehát

A fenti szabályokat tovább alkalmazva, a számláló első tagjának határértéke 3, a többi tag pedig 0-hoz tart, a
nevező esetében az első tag határértéke 6, a többi tag szintén 0-hoz tart. Ezek szerint az an sorozat konvergens és

Megjegyzés. Könnyen kimutatható, hogy általában az

racionális törtfüggvény alakú sorozat hogyan viselkedik a konvergencia szempontjából. Ha r > k (tehát a számláló
magasabb fokú, mint a nevező), akkor a sorozat nem konvergens, határértéke +∞ vagy –∞, aszerint hogy br és ck
(vagyis a legmagasabb fokú tagok együtthatói) előjele megegyezik vagy különböző.
Ha r < k (vagyis a nevező magasabb fokú, mint a számláló), akkor a sorozat konvergens, és határértéke 0 : an → 0.
Végül, ha r = k, akkor a sorozat konvergens, és határértéke a legmagasabb fokú tagok együtthatóinak a
hányadosa.
2. Vizsgáljuk meg az sorozatot. Ezt még így is írhatjuk:

Most a számláló konstans, a nevező pedig nyilván + ∞-hez tart, így

3. Tekintsük az alábbi rekurzív sorozatot: a1 = 2 és n ≥ 2 esetén

Igazoljuk, hogy a sorozat alulról korlátos, szigorúan monoton csökkenő, és határozzuk meg a határértékét!

Mindenekelőtt írjuk ki a sorozat első néhány elemét: , ...


A sorozat korlátosságának igazolásához írjuk fel a számtani és mértani közép közötti egyenlőtlenséget az
általános tagra:

Tehát a sorozat valóban alulról korlátos, és egy alsó korlátja .


A szigorúan monoton csökkenéshez azt kell belátnunk, hogy an > an+1, azaz an – an > an+1 > 0.

hiszen a korlátosság igazolásakor láttuk, hogy minden n-re an > .


Mivel a sorozat szigorúan monoton csökkenő és alulról korlátos, ezért konvergens.

Nyilván , így ezt az értéket A-val jelölve az alábbi egyenlethez jutünk:


Igen fontos számsorozat a következő: . Megmutatjuk, hogy ez a sorozat szigorúan monoton növekvő,
felülről korlátos sorozat. A monoton növekedés igazolásához azt kell belátnunk, hogy

Írjuk fel a bal oldali n tényezős szorzatra a számtani és mértani közép közötti egyenlőtlenséget

Ez utóbbi egyenlőtlenséget az n + 1-edik hatványra emelve azt kapjuk:

A korlátosság igazolásához tekintsük az alábbi n + 2 tényezős szorzatot:

(itt az tényező n-szer szerepel). Írjuk fel erre a szorzatra a számtani és mértani közép közötti egyenlőtlenséget:

Ez utóbbi egyenlőtlenséget n + 2-dik hatványra emelve:

Azt látjuk tehát, hogy e sorozat szigorúan monoton növekvő, felülről korlátos, vagyis konvergens. E sorozat
határértékét e-vel jelöljük.

Az e számról kimutatható, hogy irracionális és transzcendens szám (azaz nem létezik olyan egész együtthatós polinom,
amelynek e gyöke lenne). Az e szám nyolc tizedes pontossággal: e ≈ 2,718 281 82.
Egy másik fontos számsorozat, amelynek n-edik tagja valamely mértani sorozat első n tagjának összege. Legyen an egy
mértani sorozat, melynek első tagja a1, hányadosa q, és legyen Sn az alábbi számsorozat:

A mértani sorozat összegeiből ilyen módon képzett számsorozatot mértani sornak nevezzük.
A mértani sorozat összegképletét felhasználva állapítsuk meg, lesz-e és ha igen, mi lesz a végtelen mértani sor
határértéke.
Ha |q| < 1, akkor qn → 0, ha n tart végtelenhez, így

Példák
1.
Egy a oldalú négyzet mellé írtunk egy oldalú négyzetet, emellé egy újabb négyzetet, melynek oldala az
előbbi négyzet oldalának kétharmada, és így tovább (14.6. ábra). Mekkora lesz az így lerajzolt végtelen sok négyzet
területének összege?
14.6. ábra

Az első négyzet területe a2. A második négyzet területe . Az egymás után lerajzolt négyzetek területei egy
mértani sorozat egymást követő tagjai. E végtelen sok négyzet területének összege egy olyan mértani sor

határértéke, melynek első tagja a2, hányadosa . Tehát a keresett összeg:

2. Tudjuk, hogy a végtelen szakaszos tizedes törtek racionális számok, azaz felírhatók két egész szám
hányadosaként. Melyik két egész szám hányadosa A kérdéses szám az alábbi végtelen mértani sor
határértéke:

A mértani sor első tagja , hányadosa , így e sor konvergens, és határértéke:

14.5. A Fibonacci-sorozat
Leonardo Pisano (Fibonacci) 1202-ben publikált Liber Abaci című munkájában tette fel az alábbi kérdést: „Hány pár nyúl
származik egyetlen pár nyúltól, ha minden pár havonta új párnak ad életet, és az újszülöttek két hónapos koruktól lesznek
ivarérettek?”
Az első hónapban egyetlen pár nyúl van, a másodikban szintén. A harmadik hónapban már két pár nyúl lesz: az eredeti
pár és ennek két hónapos korában született új pár. A negyedik hónapban az eredeti nyúlpár újabb nyúlpárnak ad életet, az
elsőszülött ivadékok még nem szülnek, így három pár nyúl lesz. E gondolatsort folytatva nézzük, hány pár nyúl lesz az n-
edik hónapban. (A 14.7. ábrán üres karika jelzi az újszülött nyúlpárokat, kereszttel ellátott karika az egy hónapos
nyúlpárokat, szürke karika a 2 hónapos vagy annál idősebb nyúlpárokat.)

14.7. ábra

Az n-edik hónapban levő nyúlpárok száma egyrészt az n – 1-edik hónapban meglevő nyúlpárok száma, másrészt az
újszülött párok száma. De az újszülött párok száma megegyezik az n – 2-edik hónapban levő párok számával, hiszen
pontosan azok és csak azok fognak szülni az n-edik hónapban, akik (akár öregek, akár újszülöttek) az n – 2-edik hónapban
megvoltak.

Jelöljük fn-nel az n-edik hónapban meglevő nyúlpárok számát, így kapjuk az alábbi számsorozatot:

Ezt a számsorozatot – felfedezőjéről – Fibonacci-sorozatnak nevezzük. A sorozat első néhány tagja:


A sorozat számtalan érdekes tulajdonsága közül említünk néhányat.
1. A sorozat első n tagjának összegéhez 1-et hozzáadva a sorozat n + 2-dik tagját kapjuk:

2. A sorozat első n tagja négyzetének összege egyenlő az n-edik és n + 1-edik tag szorzatával:

3.
.
4. A sorozat páros, illetve páratlan indexű tagjainak összege:

5. A sorozat bármely tagjának négyzete a szomszédos tagok szorzatától eggyel tér el:

6. A sorozat bármely két tagja relatív prím: (fn; fn + 1) = 1.


7. 4 | fn akkor és csak akkor, ha n = 6k, és 5 | fn akkor és csak akkor, ha n = 5k.
8. Ha n > 2 és n|m, akkor fn|fm.
9. Bármely pozitív egész számnak van többszöröse a sorozatban.

Megjegyzés. A Fibonacci-sorozat fenti tulajdonságainak mindegyikét könnyen igazolhatjuk pl. teljes indukcióval.
Példaként igazoljuk a 2. és a 9. tulajdonságot!

2. Ha n > 2, akkor . Az állítás n = 2, n = 3 értékekre egyszerű számolással ellenőrizhető. Legyen most


k egy olyan pozitív egész, melyre teljesül, hogy

és vizsgáljuk meg, öröklődik-e ez a tulajdonság k + 1-re, vagyis igaz-e, hogy

Ez utóbbi egyenlőség bal oldalának első k db tagjának helyébe beírhatjuk az előbbi egyenlőség jobb oldalát, így
azt kapjuk:

Ez utóbbi egyenlőséget elosztva a sorozat k + 1-edik tagjával:

nyilvánvaló egyenlőséghez jutunk, hiszen ez maga a de níció.


9. Bármely pozitív egész számnak van többszöröse a sorozatban. Legyen m > 1 egy egész szám. Az m-mel való
osztáskor fellépő maradékok: 0, 1, 2, …, m – 1, tehát m-féle maradék lehetséges. Így a sorozat két szomszédos elemét
m-mel osztva a maradékok m2-féleképpen alakulhatnak. Ez azt jelenti, hogy a sorozat fm2 + 1 és fm2 + 2 tagjait m-mel
osztva mindenképpen olyan maradékoknak kell rendre fellépniük, amelyek már korábban ugyanilyen sorrendben
előfordultak. Tehát léteznie kell olyan k és r (k > r) természetes számoknak, amelyekre teljesül, hogy fk+1 és fk m-mel
osztva ugyanazt a maradékot adják, mint fr+1 és fr. Ebből az

(14.1)

egyenlőséget felhasználva azt kapjuk, hogy fk–1 és fr–1 maradéka is megegyezik m-mel osztva. Most ismét alkalmazva
a (14.1) egyenlőséget azt kapjuk, hogy fk–2 és fr–2 osztási maradékai is megegyeznek. Folytatva az eljárást – egymás
után alkalmazva a (14.1) egyenlőséget – arra jutunk, hogy fk– (r_2) és fr– (r_2) = f2 maradékai is, valamint az fk–(r–1) és fr–
(r–1) = f1 maradékai is megegyeznek m-mel osztva. Mivel f2 és f1 m-mel osztva 1 maradékot ad, így a (14.1) egyenlőség
alapján

m-mel osztva 0 maradékot ad, tehát osztható m-mel.

A Fibonacci-sorozat és a Pascal-háromszög között igen szoros kapcsolat van, melyet az alábbi egyenlőséggel
fejezhetünk ki: legyen k < n pozitív egész szám:

Írjuk fel a Fibonacci-sorozat szomszédos tagjainak hányadosából álló számsorozatot:

E számsorozat konvergens. Határértékét az alábbi módon határozhatjuk meg:

Ha a keresett határérték A, akkor azt kaptuk:

Ez utóbbi másodfokú egyenlet pozitív megoldása: , az „aranymetszés” jól ismert arányszáma. Tehát a
Fibonacci-sorozat szomszédos tagjai hányadosának a határértéke:

Könnyen kimutatható, hogy a Fibonacci-sorozat n-edik tagjának explicit alakja:

A Fibonacci-számok gyakran előfordulnak a természetben, kapcsolatban állnak bizonyos áramkörök ellenállásával,


összefüggésben állnak bizonyos zenei kompozíciókkal. Ismert a sorozat tagjainak alsó és felső becslése, kapcsolatban
állnak a Pell-egyenlettel, sőt a Fermat-sejtéssel is. A matematika, a természet, a művészetek számos területén
találkozhatunk a Fibonacci-sorozat elemeivel. Ugyanakkor sok probléma megoldása máig ismeretlen a Fibonacci-
sorozattal kapcsolatban. Például máig sem tudjuk, hogy a sorozatban előforduló prímek száma véges vagy végtelen. Az már
ismert, hogy a sorozat tagjai között nem létezik 4k – 1 alakú prímszám, de a teljes sorozatra a kérdés még eldöntetlen.

14.6. Magasabb rendű lineáris rekurzív sorozatok, néhány speciális sor


Az előző fejezetben ismertetett Fibonacci-sorozatnak többféle általánosítása ismert. Közülük először a legegyszerűbbel, a
k-adrendű Fibonacci-sorozattal foglalkozunk.
k-adrendű Fibonacci-sorozatnak nevezzük az

kezdőelemekkel és az

rekurzióval de niált sorozatot.

Az alábbi táblázat k = 3, 4, 5 esetben mutatja be a megfelelő sorozat néhány kezdő elemét:

n k=3 k=4 k=5

0. 1 1 1

1. 1 1 1

2. 1 1 1

3. 3 1 1

4. 5 4 1

5. 9 7 5

6. 17 13 9

7. 31 25 17

8. 57 49 33

9. 105 94 65

Megjegyzés. A Fibonacci-sorozat tulajdonságai közül sok általánosítható az általánosabb k-adrendű sorozatra is.
Ezek közül említünk néhányat.
1. Ha k = 3, akkor az általános Fibonacci-sorozat n-edik tagja:

2. Az előző fejezetben láttuk, hogy az eredeti Fibonacci-sorozat bármely két szomszédos eleme relatív prím. A fenti
táblázatból könnyen kiolvasható, hogy a magasabb rendű Fibonacci-sorozatokra általában ez már nem igaz. Igaz
azonban, hogy bármely k db egymás után következő tagra

3. Láttuk a Fibonacci-sorozatnál, hogy bármely pozitív egész számnak van többszöröse a sorozatban. Általános
esetben ez sem igaz: Ha Fn a k-adrendű Fibonacci-sorozat, akkor a sorozatnak nincs k – 1-gyel osztható tagja.
4. A k-adrendű Fibonacci-sorozat és a k-adik Pascal-háromszög között hasonló kapcsolat áll fenn, mint az eredeti
Fibonacci-sorozat és a Pascal-háromszög között. Ezt k = 3 esetre ismertetjük.
„Harmadik Pascal-háromszögnek” nevezzük az egész számok alábbi elrendezését:

A 0. sorba egy 1-est, az első sorban szimmetrikusan három 1-est írunk. Minden további elemet úgy kapunk, hogy a
közvetlen fölötte levő, valamint az attól eggyel jobbra, illetve balra levő elemet összeadjuk. Kimutatható, hogy a
harmadik Pascal-háromszög n-edik sorának elemei az

polinom együtthatói, továbbá, hogy a harmadik Pascal-háromszög n-edik sorában levő elemek összege éppen 3n.
A harmadrendű Fibonacci-sorozat elemeire:
ahol cjk a harmadik Pascal-háromszög k-adik sorának j-edik eleme.
Teljes indukcióval igazolhatók az alábbi egyenlőségek:
1. Az első n darab pozitív egész szám összege

2. Az első n darab pozitív egész szám négyzetének összege

3. Az első n darab pozitív egész szám köbének összege


15. Elemi függvények és tulajdonságaik
A függvény fogalma végigkísér bennünket a középiskolában. Mindig más ruhában, de folyton előjön. Néhol csak
ábrázoljuk, máshol pedig valami fontos tulajdonságát vizsgáljuk. Nagy szerepet vállal más fogalmak de niálásában is. A
matematikai analízis a függvények közötti kapcsolatokkal, összefüggésekkel foglalkozik.
Már az ókori görög matematikusok is, mint Arkhimédész, heurisztikusan használták a határérték és a konvergencia
fogalmát. A középkorban Newton és Leibniz értek el nagyobb áttörést a végtelen sorozatok kezelésében. A XIX. században
új alapokra fektették a matematikai analízist, új módszerekkel nagy sikereket értek el. Elég Bolzano, Cantor vagy
Weierstrass nevét említeni.
A középiskolában már találkoztunk a következő három egyváltozós függvénnyel:
- x ↦ x,
- x ↦ ax,
- x ↦ sin x.
Az elemi függvények a fenti három függvényből képezhetők konstansok, függvényműveletek, függvény leszűkítése,
inverzképzés és összetettfüggvény- (kompozíció-) képzés véges sok alkalmazásával. A következőkben szépen sorban
végighaladunk a függvényekkel kapcsolatos fogalmakon, és részletesen elemezzük a legfontosabb elemi függvényeket.
Néhány fontos tulajdonság csak a későbbi fejezetekben kerül tárgyalásra.

15.1. Függvény
15.2. Polinomfüggvények
15.3. Racionális törtfüggvények
15.4. Exponenciális és logaritmusfüggvények
15.5. Trigonometrikus függvények
15.6. Hiperbolikus függvények

15.1. Függvény

Adott A és B valós halmazok. Ha az A halmaz minden eleméhez hozzárendelünk pontosan egy B halmazbeli elemet,
akkor ezt a hozzárendelést függvénynek vagy leképezésnek nevezzük. Jele: f : A → B vagy f ↦ f(a). Az A halmazt a
függvény értelmezési tartományának (Df), a B halmazt a függvény képhalmazának nevezzük (15.1. ábra).

15.1. ábra

Ha f : A → B függvény, akkor bármely A-beli a esetén a B-beli f(d) elemet az f függvény a-beli helyettesítési értékének
vagy függvényértékének nevezzük. Az f függvény helyettesítési értékeinek halmazát a függvény értékkészletének
nevezzük, és Rf-fel jelöljük.

Megjegyzés. Bármely függvény értékkészlete a függvény képhalmazának részhalmaza.

Az f függvény valós, ha az értelmezési tartománya és az értékkészlete is a valós számok egy részhalmaza.

Mivel bármely (x; f(x)) valós számpár meghatároz egy pontot a síkon, ezért az {(x; f(x) : x ∈ A)} halmaz ábrázolható
Descartes-koordináta-rendszerben, és ezt a függvény gra konjának nevezzük (15.2. ábra).
15.2. ábra

Példák
1. Ha minden élő emberhez egy adott pillanatban hozzárendeljük az életkorát, a testsúlyát, a csillagjegyét, akkor
függvényt kapunk. Ha az állampolgárságát, akkor nem kapunk függvényt (a problémát a kettős állampolgárság
okozza).
2. Ha a világ országaihoz (A halmaz) hozzárendeljük a fővárosukat (B halmaz), akkor ez a hozzárendelés nem
függvény, hiszen vannak olyan országok, amelyeknek két fővárosuk van (például Hollandia).
3. Ha minden racionális számhoz hozzárendeljük az abszolút értékét, akkor függvényt kapunk (f : Q → Q, x ↦ |x|).

Ha a reciprokát , akkor nem kapunk függvényt (a 0-nak nincs reciproka).


Megjegyzés. Ha egy függvény megadásakor nem tüntetjük fel az értelmezési tartományt, akkor azt a valós számok

azon legbővebb részhalmazának tekintjük, amelyen a függvény értelmezhető. Ezek szerint az kifejezés
értelmezési tartománya az R\{1} halmaz.

Függvénytranszformációk
Műveletek függvények között
Tulajdonságok

Függvénytranszformációk
Függvénytranszformációkkal egy-egy függvénytípus valamely függvényéből, a hozzárendelési szabály bizonyos
megváltoztatásával ugyanolyan típusú függvényeket állíthatunk elő. A hozzárendelési szabály megváltoztatása kétféle
módon történhet:
- a függvényérték megváltoztatásával (függvényérték-transzformáció)

- a függvényváltozó megváltoztatásával (függvényváltozó-transzformáció)

A függvénytranszformációk egy-egy geometriai transzformációt jelentenek. A geometriai jelentést a típusok


részletezésénél fogjuk feltüntetni.

Átalakítás konstans hozzáadásával


Átalakítás ellentettel
Átalakítás pozitív számmal való szorzással

Átalakítás konstans hozzáadásával


- Konstanssal növelt függvényérték. A függvényértékekhez egy konstanst adunk. Az f függvény x-hez tartozó
f(x)helyettesítési értéke helyett f(x) + c lesz a függvényértékünk. Geometriailag a gra kon minden pontja az y tengellyel
párhuzamosan c egységgel eltolódik (15.3. ábra).
- Konstanssal növelt függvényváltozó. A függvényváltozóhoz egy konstanst adunk. Az f függvény x-hez tartozó f(x)
helyettesítési értéke helyett f(x + c) lesz a függvényértékünk. Geometriailag a gra kon minden pontja az x tengellyel
párhuzamosan c egységgel eltolódik, ha c > 0, akkor negatív irányba (balra), ha c < 0, akkor pedig pozitív irányba (jobbra)
(15.4. ábra).

15.3. ábra

15.4. ábra

Megjegyzés. Vegyük észre, hogy ha c > 0, akkor az f(x + c) függvény c-vel előbb veszi fel azt az értéket, amit f(x) felvesz
x-ben, és ha c < 0, akkor pedig c-vel később.

Átalakítás ellentettel
- A függvényérték ellentettje. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett – f(x) lesz. Geometriailag a gra kon
minden pontját az x tengelyre tükrözzük (15.5. ábra).
- A függvényváltozó ellentettje. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett f(–x) lesz. Geometriailag a
gra kon minden pontját az y tengelyre tükrözzük (15.6. ábra).
15.5. ábra

15.6. ábra

Átalakítás pozitív számmal való szorzással


- Pozitív számmal szorzott függvényérték. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett c · f(x) lesz.
Geometriailag a gra kon minden pontja c-szeresére változik. Ez egy olyan merőleges a nitás, amelynek a tengelye az x
tengely, aránya pedig c. Ha c > 1, akkor az y tengellyel párhuzamos nyújtásról, ha 0 < c < 1, akkor az y tengellyel párhuzamos
összenyomásról beszélünk (15.7. ábra).
- Pozitív számmal szorzott függvényváltozó. Az f függvény x-hez tartozó helyettesítési értéke f(x) helyett f(c · x) lesz.

Geometriailag ez egy olyan merőleges a nitás, amelynek a tengelye az y tengely, aránya pedig . Ha c > 1, akkor az x
tengellyel párhuzamos összenyomásról, ha 0 < c < 1, akkor az x tengellyel párhuzamos nyújtásról beszélünk (15.8. ábra).

15.7. ábra

15.8. ábra

A képhalmaz és az értékkészlet viszonya szerint háromféleképp osztályozhatjuk a függvényeket:

Egy f : A → B függvény szürjektív, ha B halmaz minden elemére képez elemet.

Megjegyzés. Ha f : A → B függvény szürjektív, akkor az értékkészlet megegyezik a képhalmazzal (15.9. ábra).

Egy f : A → B függvény injektív, ha B halmaz egy elemére legfeljebb egy A-beli elemet képez.
Megjegyzés. Ha f : A → B függvény injektív, akkor az értékkészlet részhalmaza a képhalmaznak (15.10. ábra).

15.9. ábra

15.10. ábra

Egy f : A → B függvény bijektív vagy más szóval kölcsönösen egyértelmű, ha szürjektív és injektív.

Megjegyzés. Ha f : A → B függvény bijektív, akkor a B halmaz minden elemére pontosan egy A-beli elemet képez.
Egyszerű következmény, hogy az értelmezési tartomány és a képhalmaz (ami egyben az értékkészlet is) egyenlő
elemszámú halmazok (15.11. ábra).

15.11. ábra

Műveletek függvények között

Két függvény egyenlő, ha értelmezési tartományuk megegyezik, és az értelmezési tartomány ugyanazon eleméhez a
képhalmaz ugyanazon elemét rendelik.

Példa. Vizsgáljuk meg a következő három függvényt! Melyek egyenlők?

Ekkor f ≠ g, mivel nem egyezik meg az értelmezési tartományuk, viszont f = h.


Az f : A → B leképezésnek a C ⊆ A részhalmazra vett leszűkítése az az f | c : A → B függvény, amelyik a C halmazon
megegyezik az f leképezéssel: ∀x ∈ C : f|C(x) = f(x).
Legyen f : A → B, C ⊆ A és g : C → B. Ha az f és g függvények egyenlők a C halmazon, akkor f-et a g függvény (C-ről A-ra
való) kiterjesztésének mondjuk.

Megjegyzés. Ha f a g függvény (C-ről A-ra való) kiterjesztése, akkor a g függvény az f : A → B leképezésnek a C ⊆ A


részhalmazra vett leszűkítése.

Példák
1. Az előző példában az f a g leképezésnek az R \{–1} halmazra vett leszűkítése, és a g pedig a h függvény R halmazra
vonatkozó kiterjesztése.
2. Az általános iskolában a hatványozást csak (pozitív) egész kitevőre szokás tanítani, majd a középiskolában
terjesztik ki a racionális kitevőre. Az x ↦ an, n ∈ Z függvény kiterjesztése a racionális számok halmazára az x ↦ ar,
r ∈ Q függvényt eredményezi.

Ha A, B, C, D nem üres halmaz, és g : A → B, x ↦ g(x), f : C → D, x ↦ f(x), és Rg ⊆ C, akkor g és f egymás utáni


alkalmazását f és g kompozíciójának nevezzük (15.12. ábra). Jele: f ○ g : A → D, x ↦ f(g(x)).

Megjegyzés. f ○ g általában nem egyenlő g ○ f-fel. Az f ○ g függvényt szokás összetett függvénynek is nevezni.

15.12. ábra

H-nak önmagára való olyan leképezését, melynél ∀ elem képe önmaga, H identikus leképezésének nevezzük. Jele: idH
: H → H, x ↦ x.

∀f : H → H leképezés esetén: idH ○ f = f ○ idH = f.

Legyenek f : R → R, g : R → R függvények.
Ekkor (f + g) függvényt f és g összegfüggvényének nevezzük, és (f + g)(x) := f(x) + g(x), ∀ x ∈ D(f + g) esetén, ahol D(f + g)
:= D(f) ∩D(g).
Az (f – g) függvényt f és g különbségfüggvényének nevezzük, és (f – g)(x) := f(x) – g(x), ∀ x ∈ D(f – g) esetén, ahol D(f – g)
:= D(f) ∩D(g).
Az (α · f) függvényt konstansszoros függvényének nevezzük, és (α · f)(x) := α · f(x), ∀ x ∈ D(α · f) esetén, ahol D(α · f) :=
D(f).
Az (f · g) függvényt f és g szorzatfüggvényének nevezzük, és (f · g)(x) := f(x) · g(x), ∀ x ∈ D(f · g) esetén, ahol D(f · g) := D(f)
∩D(g).

Az függvényt f és g hányadosfüggvényének nevezzük, és


Megjegyzés. Érdemes fel gyelni arra, hogy az hányadosfüggvény pontosan azokban a pontokban
értelmezhető, amikben a g függvény nem nulla, és persze f és g is értelmezve van. A többi függvényművelet esetében
csupán arra kell oda gyelnünk, hogy csak azokban a pontokban tudjuk értelmezni az új függvényeket, ahol f is és g is
értelmezve van.

Az f függvényt invertálhatónak nevezzük, ha injektív.

Megjegyzés. Ha valamely f : A → B függvény esetében a hozzárendelés irányát megfordítva B-t A-ba leképező
függvényt kapunk, akkor az f függvényt invertálhatónak, a kapott f–1 : B → A függvényt f inverz függvényének
nevezzük (15.13. ábra).
A függvény értékkészlete megegyezik az inverzének az értelmezési tartományával. Az inverz függvény értékkészlete
megegyezik a függvény értelmezési tartományával.
Ha f függvény invertálható, akkor f–1 ○ f = idA, f ○ f–1 = idB.

15.13. ábra

Ha f függvény invertálható, akkor annak inverze is invertálható, és (f–1)–1 = f.

Példa. Az f(x) = x2 függvény invertálható a értelmezési tartományon. A függvény inverz függvénye

, mert minden x ∈ Df esetén fennáll, hogy . Felhasználtuk,


hogy ha x ∈ R+0, akkor |x| = x.
Megjegyzés. Bármely függvény görbéjét tükrözve az x ↦ x identitásfüggvény egyenesére mint tengelyre az inverz
függvényének képét kapjuk.

Legyen f függvény, az A halmaz pedig f értelmezési tartományának valamely része.


Ekkor f(A) = {y ∈ Rf | ∃x ∈ A : y = f{x)} halmazt A f szerinti képének nevezzük.
Legyen f függvény, a B halmaz pedig f értékkészletének valamely része.
Ekkor az f–1 (B) = {x ∈ Df | f(x) ∈ B} halmazt B f szerinti ősképének nevezzük.

Megjegyzés. Ha h(x) = f(g(x)), akkor Dh = Dg ∩g–1(Df).

Tulajdonságok

Zérushely, y-tengelymetszet
Paritás
Periodicitás
Korlátosság
Monotonitás
Konvexitás
Szélsőértékek
Zérushely, y-tengelymetszet

Az x = u ∈ Df számot az f függvény zérushelyének vagy x-tengelymetszetének nevezzük, ha teljesül f(u) = 0 egyenlőség.


Az y = v ∈ Rf számot az f függvény y-tengelymetszetének nevezzük, ha teljesül f(0) = v egyenlőség.

Ha f függvény invertálható, akkor az x-tengelymetszete megegyezik az inverzének az y-tengelymetszetével, és a


függvény y-tengelymetszete megegyezik az inverzének az x-tengelymetszetével.

Paritás

Az f függvény páros, ha minden x ∈ Df esetén – x ∈ Df, és f(–x) = f(x).


Az f függvény páratlan, ha minden x ∈ Df esetén – x ∈ Df, és f(–x) = –f(x).

Megjegyzés. A függvények paritás szempontjából nem úgy viselkednek, mint a természetes számok. Sok függvény se
nem páros, se nem páratlan (pl. f(x) = x + 1), sőt olyan is van, amely páros és páratlan is egyben (pl. f(x) = 0).

Periodicitás

Az f függvény periodikus, ha van olyan p ≠ 0 valós szám, amire minden valós x-re x ∈ Df pontosan akkor teljesül, ha x +
p ∈ Df, és minden x ∈ D-re f(x) = f(x + p).

Korlátosság

Az f függvényt felülről korlátosnak nevezzük, ha létezik olyan K szám, amire minden x ∈ Df esetén f(x) ≤ K. K-t az f
függvény felső korlátjának nevezzük.

Ha egy függvény felülről korlátos, akkor végtelen sok felső korlátja van.

Az f függvényt alulról korlátosnak nevezzük, ha létezik olyan k szám, amire minden x ∈ Df esetén f(x) ≥ k. k-t az f
függvény alsó korlátjának nevezzük.

Ha egy függvény alulról korlátos, akkor végtelen sok alsó korlátja van.

Az f függvényt korlátosnak nevezzük, ha alulról és felülről is korlátos.

A korlátosság de níciójából következik az alábbi tétel:

Az f függvény pontosan akkor korlátos, ha létezik olyan M szám, amire minden x ∈ Df esetén |f(x) | ≤ M. M a függvény
korlátja.

Ha egy függvény korlátos, akkor végtelen sok korlátja van.

Példák
1. Az x ↦ sin x függvénynek létezik alsó korlátja, a –1, létezik felső korlátja, az 1, tehát a függvény korlátos. | sin x| ≤ 1,
ezért korlátja az 1.
2.
Az függvénynek létezik alsó korlátja, tehát a függvény alulról korlátos, a függvénynek nincs
felső korlátja, tehát felülről nem korlátos. Tehát a függvény nem korlátos.

A példabeli függvény alulról korlátos, tehát végtelen sok alsó korlátja van. Felmerül a kérdés, hogy van-e ezek között
legnagyobb?

Legyen f : A → B egy felülről korlátos függvény. Az f függvény szuprémumának nevezzük a legkisebb felső korlátját.
Legyen f : A → B egy alulról korlátos függvény. Az f függvény in mumának nevezzük a legnagyobb alsó korlátját.

Megjegyzés. Egy korlátos függvénynek mindig van in muma és szuprémuma. Később tárgyaljuk a szuprémum és az
in mum pontosabb de nícióját.

Monotonitás

Az f függvény monoton növő a H ⊂ Df halmazon, ha bármely x, y ∈ H, x < y esetén f(x) ≤ f(y).


Az f függvény szigorúan monoton növő a H ⊂ Df halmazon, ha bármely x, y ∈ H, x < y esetén f(x) < f(y).
Az f függvény monoton csökkenő a H ⊂ Df halmazon, ha bármely x, y ∈ H, x < y esetén f(x) ≥ f(y).
Az f függvény szigorúan monoton csökkenő a H ⊂ Df halmazon, ha bármely x, y ∈ H, x < y esetén f(x) > f(y).
Az f függvény (szigorúan) monoton növő, illetve csökkenő, ha az egész értelmezési tartományon (szigorúan) monoton
növő, illetve csökkenő.

A szigorúan monoton függvénynek mindig van inverz függvénye.

Ha az f függvény szigorúan monoton (növő vagy csökkenő), akkor az értelmezési tartománya és értékkészlete közötti
hozzárendelés bijektív, tehát a függvény invertálható.

Megjegyzés. Az állítás megfordítása nem igaz, hiszen léteznek invertálható, de nem szigorúan monoton függvények.

Ilyen például az függvény.

Konvexitás

Az f függvény konvex az f intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr alatt van [a;
b]-on, azaz

Az f függvény szigorúan konvex az I intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr
alatt van [a; b] -on, azaz

Az f függvény konkáv az f intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr alatt van [a;
b]-on, azaz

Az f függvény szigorúan konkáv az I intervallumon, ha bármely a, b ∈ I, a < b esetén f az a, b pontokhoz tartozó húr
alatt van [a; b]-on, azaz
Az f függvény pontosan akkor konvex az I intervallumon, ha – f konkáv az I intervallumon.

Szélsőértékek

Az f függvénynek lokális maximumhelye van a-ban, ha I értelmezve van a valamely (a – ϵ; a + ϵ) környezetében, és x ∈ (a


– ϵ; a + ϵ) esetén f(x) < f(a).
Az f függvénynek szigorú lokális maximumhelye van a-ban, ha f értelmezve van a valamely (a – ϵ; a + ϵ) környezetében,
és x ∈ (a – ϵ; a + ϵ), x ≠ a esetén f(x) < f(a).
Az f függvénynek lokális minimumhelye van a-ban, ha f értelmezve van a valamely (a – ϵ; a + ϵ) környezetében, és x ∈ (a
– ϵ; a + ϵ) esetén f(x) ≥ f(a).
Az f függvénynek szigorú lokális minimumhelye van a-ban, ha f értelmezve van a valamely (a – ϵ; a + ϵ) környezetében,
és x ∈ (a – e; a+ ϵ), x ≠ a esetén f(x) > f(a).
Az f (a) értéket a függvény minimum-, illetve maximumértékének nevezzük.
Az M érték az f függvény maximuma, ha minden x ∈ Df esetén f(x) ≤ M. Az olyan x-eket, amikre f(x) = M, a függvény
maximumhelyének nevezzük.
Az m érték az f függvény minimuma, ha minden x ∈ Df esetén f(x) ≥ m. Az olyan x-eket, amikre f(x) = m, a függvény
minimumhelyének nevezzük.

15.2. Polinomfüggvények
A függvény tulajdonságainak megismerése után meghatározunk néhány elemi függvényt. Legyen A a valós számok
halmazának egy nem üres részhalmaza.

a) Az x ↦ 1, ∀x ∈ A leképezést azonosan 1, konstans függvénynek nevezzük.


b) Az x ↦ x, ∀x ∈ A leképezést identitásleképezésnek nevezzük.

Vizsgáljuk meg, hogy az előbbi egyszerű függvények segítségével milyen további függvényeket hozhatunk létre!
Használjuk fel ehhez az előző pontban tárgyalt függvényműveleteket!
Az a) függvényből valamely c ∈ R konstanssal való szorzás felhasználásával az x ↦ c, ∀x ∈ A konstansfüggvényt kapjuk.
A függvények közötti szorzást alkalmazhatjuk úgy a b) függvényre, hogy önmagával megszorozzuk. Ekkor megkapjuk
az x ↦ x2, ∀x ∈ A másodfokú függvényt, majd ezt és a b) függvényt összeszorozva az x ↦ x3, ∀x ∈ A harmadfokú függvényt.
Ezt az eljárást folytatva egy tetszőleges n pozitív számra, megkaphatjuk az x ↦ xn, ∀x ∈ A pozitív egész kitevős
hatványfüggvényt.
A hatványfüggvényeket konstanssal szorozva, a kapott kifejezéseket összeadva, majd a konstansfüggvényt mindehhez
hozzáadva megkapjuk a p(x) = anxn + an–1xn–1 + … + a1x + a0 alakú függvényeket, amiket polinomfüggvényeknek szokás
nevezni.

Az n-edfokú valós együtthatós polinomfüggvényen olyan,

alakú függvényt értünk, amelyben az a0, a1, …, an együtthatók adott valós számok, x értéke pedig tetszőleges valós
értéket felvehet. Az n számot p fokszámának nevezzük, és deg p-vel jelöljük. A nem azonosan nulla konstans
függvények fokszáma 0. Az an együtthatót a polinom főegyütthatójának nevezzük.

Megjegyzés. A polinomfüggvényeket felírhatjuk a következő módon is:

Természetesen ez az x0 = 1, ha x ≠ 0 megállapodással teljes.

Ha p n-edfokú polinomfüggvény valós zérushelyei x1, x2, … xk, akkor p felírható


ahol q(x) egy olyan valós együtthatós polinomfüggvény, amelynek nincs valós zérushelye.

Minden valós együtthatós polinomfüggvény felírható elsőfokú és negatív diszkriminánsú másodfokú


polinomfüggvények szorzataként.
Ha p n-edfokú polinomfüggvény, akkor p-nek legfeljebb n különböző gyöke van.
Ha p legfeljebb n-edfokú polinomfüggvény, és n + 1 különböző gyöke van, akkor p ≡ 0.
Ha p és q legfeljebb n-edfokú polinomfüggvények, és p(x) = q(x) legalább n + 1 különböző x-re, akkor p(x) = q(x) minden
x-re. Sőt ekkor p és q formálisan is megegyezik.
Ha p n-edfokú nem konstans polinomfüggvény, akkor minden értéket legfeljebb n-szer vesz fel.
Ha p n-edfokú nem konstans polinomfüggvény, akkor p nem korlátos.
Rolle racionális gyöktesztje. Egész együtthatós polinomfüggvénynek csak olyan racionális zérushelye lehet, amelynek
nem egyszerűsíthető alakjában a számláló a polinom konstans tagjának, a nevező a legmagasabb fokú tag együtthatójának
osztója. Ha egy egész együtthatós polinomfüggvény főegyütthatója 1, akkor annak minden racionális zérushelye egész
szám.
Horner-elrendezés. Egy polinom helyettesítési értéke kiszámítható az alábbi zárójelezést felhasználva is:

A következőkben vizsgáljuk meg a másodfokú és a harmadfokú függvény néhány tulajdonságát.

A másodfokú függvény
A másodfokú függvény tulajdonságai

A másodfokú függvény
A másodfokú függvény általános alakja: f(x) = ax2 + bx + c(x ∈ R, a ≠ 0, a, b, c ∈ R).
Ha ábrázolni szeretnénk, akkor f(x) = a(x – u)2 + v, (x ∈ R, a ≠ 0, a, u, v ∈ R) alakra kell hozni, és ezután a megfelelő
függvénytranszformációkat elvégezni.
Az általános alakból teljes négyzetté alakítás után azt kapjuk, hogy

A függvény képe parabola (15.14. ábra). A parabola csúcspontjának koordinátái: C(u; v).

15.14. ábra

A másodfokú függvény tulajdonságai


Értelmezési tartomány: a valós számok halmaza.
Értékkészlete:
ha a > 0, akkor [v; ∞[,
ha a < 0, akkor ]–∞; v].
Zérushelyek: Az ax2 + bx + c = 0 egyenlet megoldásai:
D = b2 – 4ac → Diszkrimináns,

Y-tengelymetszet: A c konstans tag határozza meg.


Paritás: páros, ha f(x) = x2 + v alakú, vagyis u = 0.
Periodicitás: nem periodikusak.
Korlátosság:
Ha a > 0, akkor alulról korlátos, az alsó korlátja v, felülről nem korlátos.
Ha a < 0, akkor felülről korlátos, a felső korlátja v, alulról nem korlátos.
Tehát a másodfokú függvények nem korlátosak.
Monotonitás:
Ha a > 0, akkor a ]–∞; u] intervallumon a függvény szigorúan monoton csökken, és az [u; ∞[ intervallumon szigorúan
monoton nő.
Ha a < 0, akkor a ]–∞; u] intervallumon a függvény szigorúan monoton nő, és az [u; ∞[ intervallumon szigorúan
monoton csökken.
Konvexitás:
Ha a > 0, akkor a függvény konvex.
Ha a < 0, akkor a függvény konkáv.
Szélsőértékek:
Ha a > 0, akkor a függvénynek minimuma van.
Ha a < 0, akkor a függvénynek maximuma van.
A függvény az x = u szélsőértékhelyen az y = v szélsőértéket veszi fel.

15.3. Racionális törtfüggvények

Legyen az f(x) = anxn + an–1xn–1 + … +a1x+a0 és a g(x) = bmxm + bm–1xm–1 + … + b1x + b0 két polinom. Írjuk fel az
hányadosfüggvényt!

Minden olyan x ∈ R helyen, ahol g(x) ≠ 0, de niálható az hányadosfüggvény,


amit racionális törtüggvénynek szokás nevezni.

Megjegyzés. A racionális törtfüggvény értelmezési tartománya nem tartalmazza a nevezőben lévő polinom gyökeit.

Speciális esetek
Lineáris törtfüggvény
A lineáris törtfüggvény tulajdonságai

Speciális esetek
A negatív egész kitevős hatványfüggvény: f(x) = x–n.

A lineáris törtfüggvény: .

Lineáris törtfüggvény

A lineáris törtfüggvény általános alakja: .

Ha ábrázolni szeretnénk, akkor (ahol x ≠ B) alakra kell hozni, és ezután a megfelelő


függvénytranszformációkat elvégezni.

Az átalakítás után azt kapjuk, hogy .

A függvény képe hiperbola (15.15. ábra). A hiperbola aszimptotái: egyenletű egyenesek.


15.15. ábra

A lineáris törtfüggvény tulajdonságai


Értelmezési tartomány: az x = B kivételével a valós számok halmaza.
Értékkészlete: az y = C kivételével a valós számok halmaza.

Zérushelyek: , ahol x ≠ B egyenlet megoldása: .

Y-tengelymetszet: .

Paritás: páratlan, ha alakú, vagyis a tengelyek az aszimptoták.


Periodicitás: nem periodikusak.
Korlátosság: nem korlátosak.
Monotonitás:
Ha A > 0, akkor a ]–∞; B[ és a ]B; ∞[ intervallumon a függvény szigorúan monoton csökken.
Ha A < 0, akkor a ]–∞; B[ és a ]B; ∞[ intervallumon a függvény szigorúan monoton nő.
Konvexitás:
Ha A > 0, akkor a függvény a ]–∞; B[ intervallumon konkáv és a ]B; ∞[ intervallumon a függvény konvex.
Ha A < 0, akkor a függvény a ]–∞; B[ intervallumon konvex és a ]B; ∞[ intervallumon a függvény konkáv.
Szélsőértékek: Nincs a függvénynek sem minimuma, sem maximuma.

15.4. Exponenciális és logaritmusfüggvények

Tekintsük az an, a ∈ R, n ∈ Z hatványt!

n > 0 esetén
n = 0 esetén a0 = 1, ha a ≠ 0;

n < 0 esetén ,ha a ≠ 0.

Tehát, ha n nem pozitív, akkor ki kell zárnunk azt az esetet, hogy az a szám nulla lehessen.

Azonosságok
Az exponenciális függvény tulajdonságai
A logaritmusfüggvény
A logaritmusfüggvény tulajdonságai

Azonosságok

Ha a > 1, akkor an szigorúan monoton nő, vagyis n > m esetén an > am.
Ha 0 < a < 1, akkor an szigorúan monoton csökken, vagyis n > m esetén an < am.

Most terjesszük ki az n szám számkörét a racionális számok halmazára! Ehhez az szükséges, hogy az a szám ne legyen

negatív, hiszen -et nem értelmezzük. (Nincs olyan valós szám, amelynek a négyzete –1.)
Ha a pozitív valós, n pedig pozitív egész, akkor legyen

Bármely r racionális szám felírható alakban, ahol n egész, m pedig pozitív egész, és n és m relatív prímek.
Ekkor

A hatványozást a permanenciaelv értelmében úgy terjesztettük ki pozitív egész kitevőről racionális kitevőre, hogy az
azonosságok és a szigorú monotonitás érvényben maradtak. Most pedig ugyanezen kívánalmak mellett de niáljuk a
hatványozást bármely valós kitevőre.

Bármely α valós számra aα = sup {ar | r ∈ Q, r ≤ α}.

Megjegyzés. A felső határ egyértelműségéből adódik, hogy az azonosságok és a szigorú monotonitás érvényben
marad.

Ezek után két fontos függvényt de niálhatunk attól függően, hogy az aα valós kitevőjű hatványban az alapot vagy a
kitevőt rögzítjük. Először legyen rögzítve az α kitevő! Ekkor az x pozitív valós alaptól függ az f(x) = xα leképezés.

Legyen α tetszőleges valós szám! Az x ↦ xα leképezést hatványfüggvénynek nevezzük.

Most rögzítsük az a pozitív valós számot! Ekkor az x valós kitevőtől függ az f(x) = ax leképezés.

Legyen a rögzített pozitív valós, x valós szám. Az f(x) = ax függvényt a alapú exponenciális függvénynek nevezzük.

Megjegyzés. Az elnevezést az indokolja, hogy a kitevő latinul exponens, és itt a változó a kitevőben szerepel.

Olykor x ↦ ax-nel vagy egyszerűen csak ax-nel fogjuk jelölni. Az a = 1 alap nagyon egyszerű eredményre vezet. Bármely
α valós szám esetén 1α = 1.
A továbbiakban olyan exponenciális függvényeket jellemzünk, amelyeknek az alapja 1-től különböző.

Az exponenciális függvény tulajdonságai


Értelmezési tartomány: a valós számok halmaza.
Értékkészlete: a pozitív valós számok halmaza.
Zérushelyek: Mivel az exponenciális függvény értékkészlete a pozitív valós számok halmaza, ezért nincs zérushelye.
Y-tengelymetszet: Az exponenciális függvényeknél a0 = 1, amiből következik, hogy az exponenciális függvények y-
tengelymetszete az y = 1.
Paritás: nem páros és nem páratlan. Az ax és a–x függvények egymásnak az y tengelyre vonatkozó tükörképei.
Periodicitás: nem periodikus.
Korlátosság: alsó korlátja a 0, felső korlátja nincs, tehát nem korlátos.
Monotonitás: szigorúan monoton.
Ha a > 1, akkor ax szigorúan monoton nő, vagyis x > y esetén ax > ay.
Ha 0 < a < 1, akkor ax szigorúan monoton csökken, vagyis x > y esetén ax < ay.
Konvexitás: Az exponenciális függvények mindegyike szigorúan konvex.
Szélsőértékek: nincs sem minimuma, sem maximuma.
15.16. ábra

A logaritmusfüggvény
Az a ≠ 1 esetén keressük az y = ax egyenlet megoldásait. Az x-re egyetlen megoldást kapunk, amit loga y-nal jelölünk.
Belátható, hogy az y ↦ loga y éppen az x ↦ ax függvény inverz függvénye lesz.

Legyen az a ≠ 1 rögzített pozitív valós szám. Ekkor az x ↦ ax a alapú bijektív exponenciális függvény inverzét a alapú
exponenciális függvénynek nevezzük, és x ↦ loga x-szel jelöljük.

Megjegyzés. Az a ≠ 1-et azért kell kikötnünk, mert az y = 1x esetén y minden x-re 1-et vesz fel, és a konstans
függvénynek a valós számok halmazán nincs inverze.

Az a alapú exponenciális függvény és a logaritmusfüggvény gra kus képe egymás tükörképei az y = x egyenletű
egyenesre nézve (15.17. ábra). Nagyon fontosak az ex és az ln x úgynevezett természetes alapú függvények. Később pontosan
de niáljuk majd az e számot.

15.17. ábra

A logaritmusfüggvény tulajdonságai
Értelmezési tartomány, értékkészlet: Az inverz függvény de niálásánál megjegyeztük, hogy egy függvény értékkészlete
megegyezik inverz függvényének értelmezési tartományával, és egy függvény értelmezési tartománya megegyezik inverz
függvényének értékkészletével. Mivel az exponenciális függvény értelmezési tartománya a valós számok halmaza,
értékkészlete pedig a pozitív valós számok halmaza (R → R+), ezért a logaritmusfüggvény értelmezési tartománya a pozitív
valós számok halmaza, értékkészlete pedig a valós számok halmaza (R+ → R).
Zérushelye: x = 1, ami az exponenciális függvény y-tengelymetszetével egyenlő.
Y-tengelymetszet: A függvénynek az értelmezési tartományából adódóan nincs y-tengelymetszete.

Paritás: nem páros és nem páratlan. A loga x és a függvények egymásnak az x tengelyre vonatkozó tükörképei.
Periodicitás: nem periodikus.
Korlátosság: Nincs alsó és nincs felső korlátja, hiszen az értékkészlete a valós számok halmaza.
Monotonitás: szigorúan monoton.
Ha a > 1, akkor loga x szigorúan monoton nő, vagyis x > y esetén logax > logay.
Ha 0 < a < 1, akkor logax szigorúan monoton csökken, vagyis x > y esetén logax < logay.
Konvexitás:
Ha a > 1, akkor szigorúan konkáv.
Ha 0 < a < 1, akkor szigorúan konvex.
Szélsőértékek: nincs sem minimuma, sem maximuma.
15.18. ábra

15.5. Trigonometrikus függvények


Amíg eljutunk a trigonometrikus függvények de níciójáig, be kell vezetnünk néhány fogalmat.
A zárt töröttvonallal határolt területet poligonnak nevezzük.
A körív hossza a körívbe írt poligonok hosszának legkisebb felső korlátja.
Az egység sugarú félkörív hosszát π-vel jelöljük. A π irracionális szám, értéke század pontossággal 3,14.

(cos x; sin y) azon pont két koordinátája a Descartes-koordináta-rendszerben, amit úgy kapunk meg, hogy az origó
középpontú egység sugarú körön az (1; 0) pontból indulva |x| hosszú körívet felmérünk x előjelétől függően pozitív (az
óramutató járásával ellentétes), illetve negatív (az óramutató járásával megegyező) irányban.

Ezek után de niálhatjuk a trigonometrikus függvényeket.

Azt a függvényt, amely minden valós számra értelmezve van, és minden valós számhoz a szám szinuszát rendeli hozzá,
szinuszfüggvénynek nevezzük.
Azt a függvényt, amely minden valós számra értelmezve van, és minden valós számhoz a szám koszinuszát rendeli
hozzá, koszinuszfüggvénynek nevezzük.
Trigonometrikus függvényeknek nevezzük azokat a függvényeket, melyek az x ↦ sin x és az x ↦ cos x, valamint a
konstans függvényekből függvényműveletek segítségével jönnek létre.

A sin x és cos x függvények hányadosaiként a következő függvények értelmezhetők.

A sin x és a cos x függvények hányadosát tg x tangensfüggvénynek nevezzük.

A cos x és a sin x függvények hányadosát ctg x kotangensfüggvénynek nevezzük.

Megjegyzés. Vegyük észre, hogy a tangens x és a kotangens x függvények egymás reciprokai, vagyis tg x · ctg x = 1!

A szinuszfüggvény tulajdonságai
A koszinuszfüggvény tulajdonságai
A tangensfüggvény tulajdonságai
A kotangensfüggvény tulajdonságai
Árkuszfüggvények
Az árkusz szinusz függvény és tulajdonságai
Az árkusz koszinusz függvény és tulajdonságai
Az árkusz tangens függvény és tulajdonságai
Az árkusz kotangens függvény és tulajdonságai
A szinuszfüggvény tulajdonságai
Értelmezési tartomány: a valós számok halmaza.
Értékkészlet: A de nícióból következik, hogy a [–1; 1] intervallum, hiszen az egységkörben nincs olyan pont, amelynek
valamelyik koordinátája kívül esik az [–1; 1] intervallumon.
Zérushelyek: x = kπ, ahol k ∈ Z.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és sin(–x) = –sin x.
Periodicitás: Periodikus, egy periódus hossza 2π.
Korlátosság: Korlátos, in muma a – 1, szuprémuma az 1.

Monotonitás: Szigorúan monoton nő a -on, ahol k ∈ Z, és szigorúan monoton csökken a

-on, ahol n e Z.
Konvexitás: Szigorúan konvex a [π + 2kπ; 2π + 2kπ]-on, ahol k ∈ Z, és szigorúan konkáv a [2nπ; π + 2nπ]-on, ahol n ∈ Z.

Szélsőértékek: Minimuma van az , ahol k ∈ Z pontokban y = –1, és maximuma van az ,


ahol n ∈ Z pontokban y = 1.

15.19. ábra

A koszinuszfüggvény tulajdonságai

A koszinuszfüggvény képét megkaphatjuk úgy is, hogy a szinuszfüggvény képét eltoljuk -vel negatív irányba.
Értelmezési tartomány: a valós számok halmaza.
Értékkészlete: A de nícióból következik, hogy a [–1; 1] intervallum.

Zérushelyek: , ahol k ∈ Z.
Y-tengelymetszete: y = 1.
Paritás: Páros, tehát tükrös az y tengelyre, és cos(–x) = cos x.
Periodicitás: periodikus, egy periódus hossza 2π.
Korlátosság: korlátos, in muma a – 1, szuprémuma az 1.
Monotonitás: Szigorúan monoton nő a [–π + 2kπ; 2kπ]-on, ahol k ∈ Z, és szigorúan monoton csökken a [2nπ; π + 2nπ]-on,
ahol n ∈ Z.

Konvexitás: Szigorúan konvex -on, ahol k ∈ Z, és szigorúan konkáv a -


on, ahol n ∈ Z.
Szélsőértékek: Minimuma van az x = π + 2kπ, ahol k ∈ Z pontokban y = –1, és maximuma van az x = 2nπ, ahol n ∈ Z
pontokban y = 1.

15.20. ábra

A tangensfüggvény tulajdonságai

Értelmezési tartomány: Az , ahol k ∈ Z számok kivételével a valós számok halmaza.


Értékkészlet: a valós számok halmaza.
Zérushelyek: A sin x = 0 trigonometrikus egyenlet megoldásai: x = kπ, ahol k ∈ Z.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és tg(–x) = –tg x.
Periodicitás: periodikus, egy periódus hossza π.
Korlátosság: nem korlátos, nincs sem alsó, sem felső korlátja.

Monotonitás: Szigorúan monoton nő a -on, ahol k ∈ Z.

Konvexitás: Szigorúan konkáv a -on, ahol k ∈ Z, és szigorúan konvex a -on, ahol n ∈ Z.


Szélsőértékek: nincs sem maximuma, sem minimuma.

15.21. ábra

A kotangensfüggvény tulajdonságai
Értelmezési tartomány: Az x = kπ, ahol k ∈ Z számok kivételével a valós számok halmaza.
Értékkészlet: a valós számok halmaza.

Zérushelyek: A cos x = 0 trigonometrikus egyenlet megoldásai: , ahol k ∈ Z.


Y-tengelymetszet: nincs.
Paritás: Páratlan, tehát tükrös az origóra, és ctg(–x) = –ctg x.
Periodicitás: periodikus, egy periódus hossza n.
Korlátosság: nem korlátos, nincs sem alsó, sem felső korlátja.
Monotonitás: Szigorúan monoton csökken a ]kπ; π + kπ[-on, ahol k ∈ Z.

Konvexitás: Szigorúan konvex a -on, ahol k ∈ Z, és szigorúan konkáv a -on, ahol n ∈


Z.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.22. ábra

Árkuszfüggvények
A szinusz-, koszinusz-, tangens- és kotangensfüggvények szigorú monotonitásából adódik, hogy bijektívek a megfelelő
intervallumokon. Mivel a bijektív függvények invertálhatók, ezért megvizsgálhatjuk a fenti függvények inverzeit,
amelyeket ciklometrikus vagy árkuszfüggvényeknek szokás nevezni.

Az árkusz szinusz függvény és tulajdonságai


Tekintsük a sin x függvény leszűkítését intervallumra. Ekkor a sin x függvény inverzét árkusz szinusz
függvénynek nevezzük, vagyis arcsin x azt a függvényt jelenti, amelyre sin(arcsin x) = x.

Példa. Mivel , ezért arcsin , vagyis .

Értelmezési tartomány: a [–1; 1] intervallum.

Értékkészlet: a intervallum.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arcsin(–x) = –arcsin x.
Periodicitás: nem periodikus.

Korlátosság: korlátos, in muma a , szuprémuma a .


Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konvex a [0; 1] intervallumon, és szigorúan konkáv a [–1; 0] intervallumon.

Szélsőértékek: Maximuma van az x = 1 pontban , minimuma van az x = –1 pontban .

15.23. ábra

Az árkusz koszinusz függvény és tulajdonságai

Tekintsük a cos x függvény leszűkítését a [0; π] intervallumra. Ekkor a cos x függvény inverzét árkusz koszinusz
függvénynek nevezzük, vagyis arccos x azt a függvényt jelenti, amelyre cos(arccos x) = x.

Példa. Mivel cos 0 = 1, ezért arccos 1 = 0, vagyis cos(arccos 1) = cos 0 = 1.

Értelmezési tartomány: a [–1; 1] intervallum.


Értékkészlet: a [0; π] intervallum.
Zérushelyek: x = 1.

Y-tengelymetszet: .
Paritás: nem páros és nem páratlan.
Periodicitás: nem periodikus.
Korlátosság: korlátos, in muma a 0, szuprémuma a π.
Monotonitás: szigorúan monoton csökken.
Konvexitás: Szigorúan konvex a [–1; 0] intervallumon, és szigorúan konkáv a [0; 1] intervallumon.
Szélsőértékek: Maximuma van az x = –1 pontban y = π, minimuma van az x = 1 pontban y = 0.
15.24. ábra

Az árkusz tangens függvény és tulajdonságai

Tekintsük a tg x függvény leszűkítését a intervallumra! Ekkor a tg x függvény inverzét árkusz tangens


függvénynek nevezzük, vagyis arctg x azt a függvényt jelenti, amelyre tg(arctg x) = x.

Példa. Mivel , ezért arctg , vagyis .

Értelmezési tartomány: a valós számok halmaza.

Értékkészlet: a intervallum.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arctg(–x) = –arctg x.
Periodicitás: nem periodikus.

Korlátosság: korlátos, in muma a , szuprémuma a .


Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konvex a ]–∞; 0] intervallumon, és szigorúan konkáv a [0; ∞[ intervallumon.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.25. ábra

Az árkusz kotangens függvény és tulajdonságai

Tekintsük a ctg x függvény leszűkítését a ]0; π[ intervallumra! Ekkor a ctg x függvény inverzét árkusz kotangens
függvénynek nevezzük, vagyis arcctg x azt a függvényt jelenti, amelyre ctg(arcctg x) = x.

Példa. Mivel , ezért , vagyis .

Értelmezési tartomány: a valós számok halmaza.


Értékkészlet: a ]0; π[ intervallum.
Zérushelyek: nincs zérushelye.
Y-tengelymetszet: .
Paritás: nem páros és nem páratlan.
Periodicitás: nem periodikus.
Korlátosság: korlátos, in muma a 0, szuprémuma a π.
Monotonitás: szigorúan monoton csökken.
Konvexitás: Szigorúan konvex a [0; ∞[ intervallumon, és szigorúan konkáv a ]–∞; 0] intervallumon.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.26. ábra

15.6. Hiperbolikus függvények


A trigonometrikus függvények de niálásánál láthattuk, hogy a (cos x; sin x) koordinátákkal meghatározott pontok
halmaza a síkon az origó középpontú egységkör, vagyis az x2 + y2 = 1 egyenletű kör. A hiperbolikus függvények az x2 – y2 = 1
egyenletű hiperbolával vannak kapcsolatban. Innen származik a nevük.

Az exponenciális függvényt szinusz hiperbolikusz függvénynek nevezzük, és sh x-szel jelöljük.

Az exponenciális függvényt koszinusz hiperbolikusz függvénynek nevezzük, és ch x-szel jelöljük.


Hiperbolikus függvényeknek nevezzük azokat a függvényeket, melyek az x ↦ sh x és az x ↦ ch x, valamint a konstans
függvényekből függvényműveletek segítségével jönnek létre.

A sh x és a ch x függvények hányadosaiként a következő függvényeket de niálhatjuk:

A sh x és a ch x függvények hányadosát th x tangens hiperbolikusz függvénynek nevezzük:

A ch x és a sh x függvények hányadosát cth x kotangens hiperbolikusz függvénynek nevezzük:

Megjegyzés. Vegyük észre, hogy a tangens hiperbolikusz x és a kotangens hiperbolikusz x függvények egymás
reciprokai, vagyis th x · cth x = 1!

A (ch x; sh x) koordinátájú pontok a síkon az x2 – y2 = 1 egyenletű egyenlő szárú hiperbola jobb oldali ágát írják le,
ugyanis
15.27. ábra

Megjegyzés. A 15.27. ábrán a T pont koordinátái (ch x; sh x), T'' pont koordinátái (ch x; –sh x), ahol x a bevonalkázott
területet jelöli.

A szinusz hiperbolikusz függvény tulajdonságai


A koszinusz hiperbolikusz függvény tulajdonságai
A tangens hiperbolikusz függvény tulajdonságai
A kotangens hiperbolikusz függvény tulajdonságai
Áreafüggvények
Az área szinusz hiperbolikusz függvény és tulajdonságai
Az área koszinusz hiperbolikusz függvény és tulajdonságai
Az área tangens hiperbolikusz függvény és tulajdonságai
Az área kotangens hiperbolikusz függvény és tulajdonságai

A szinusz hiperbolikusz függvény tulajdonságai


Értelmezési tartomány: a valós számok halmaza.
Értékkészlet: a valós számok halmaza.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és sh(–x) = –sh x.
Periodicitás: nem periodikus.
Korlátosság: nem korlátos.
Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konkáv a ]–∞; 0]-on, és szigorúan konvex a [0; ∞[-on.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.28. ábra

A koszinusz hiperbolikusz függvény tulajdonságai


A koszinusz hiperbolikusz függvény képét láncgörbének is nevezik, mert egy két végén felfüggesztett fonal (lánc) ilyen
alakot vesz fel.
Értelmezési tartomány: a valós számok halmaza.
Értékkészlete: [1; ∞[ intervallum.
Zérushelyek: nincs zérushelye.
Y-tengelymetszete: y = 1.
Paritás: Páros, tehát tükrös az y tengelyre, és ch(–x) = ch x.
Periodicitás: nem periodikus.
Korlátosság: alulról korlátos, in muma az 1. Felülről nem korlátos. Tehát a koszinusz hiperbolikusz függvény nem korlátos.
Monotonitás: Szigorúan monoton csökken a ]–∞; 0]-on, és szigorúan monoton nő a [0; ∞[-on.
Konvexitás: szigorúan konvex.
Szélsőértékek: minimuma van az x = 0 pontban y = 1.

15.29. ábra

A tangens hiperbolikusz függvény tulajdonságai


Értelmezési tartomány: a valós számok halmaza.
Értékkészlet: a]–1; 1 [ intervallum.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és th(–x) = –th x.
Periodicitás: nem periodikus.
Korlátosság: korlátos, in muma a –1, szuprémuma az 1.
Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konvex a ]–∞; 0]-on, és szigorúan konkáv a [0; ∞[-on.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.30. ábra

A kotangens hiperbolikusz függvény tulajdonságai


Értelmezési tartomány: az x = 0 kivételével a valós számok halmaza.
Értékkészlet: a ]–∞; 1[ ∪ ] 1; ∞[ halmaz.
Zérushelyek: nincs zérushelye.
Y-tengelymetszet: nincs y-tengelymetszete.
Paritás: Páratlan, tehát tükrös az origóra, és cth(–x) = –cth x.
Periodicitás: nem periodikus.
Korlátosság: nem korlátos.
Monotonitás: Szigorúan monoton csökken a ]–∞; 0[ és a ]0; ∞[-on.
Konvexitás: Szigorúan konkáv a ]–∞; 0[-on, és szigorúan konvex a ]0; ∞[-on.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.31. ábra

Áreafüggvények
A szinusz, koszinusz, tangens és kotangens hiperbolikusz függvények szigorú monotonitásából adódik, hogy bijektívek a
megfelelő intervallumokon. Mivel a bijektív függvények invertálhatók, ezért megvizsgálhatjuk a fenti függvények
inverzeit, amelyeket inverz hiperbolikusz vagy áreafüggvényeknek szokás nevezni.

Az área szinusz hiperbolikusz függvény és tulajdonságai

A sh x függvény inverzét área szinusz hiperbolikusz függvénynek nevezzük, vagyis arsh x azt a függvényt jelenti,
amelyre sh(arsh x) = x.

Példa. Mivel sh 0 = 0, ezért arsh 0 = 0.


Megjegyzés. Az arsh x függvény kifejezhető az ln függvény segítségével: arsh .

Értelmezési tartomány: a valós számok halmaza.


Értékkészlet: a valós számok halmaza.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arsh(–x) = –arsh x.
Periodicitás: nem periodikus.
Korlátosság: nem korlátos.
Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konvex a ]–∞; 0] intervallumon, és szigorúan konkáv a [0; ∞[ intervallumon.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.32. ábra
Az área koszinusz hiperbolikusz függvény és tulajdonságai

Tekintsük a ch x függvény leszűkítését a [0; ∞[ intervallumra! Ekkor a ch x függvény inverzét área koszinusz
hiperbolikusz függvénynek nevezzük, vagyis arch x azt a függvényt jelenti, amelyre ch(arch x) = x.

Példa. Mivel ch 0 = 1, ezért arch 1 = 0, vagyis ch(arch 1) = ch 0 = 1.


Megjegyzés. Az arch x függvény kifejezhető az ln függvény segítségével: arch .

Értelmezési tartomány: az [1; ∞[ intervallum.


Értékkészlet: a [0; ∞[ intervallum.
Zérushelyek: x = 1.
Y-tengelymetszet: nincs y-tengelymetszet.
Paritás: nem páros és nem páratlan.
Periodicitás: nem periodikus.
Korlátosság: Alulról korlátos, in muma a 0. Felülről nem korlátos. Tehát nem korlátos az área koszinusz hiperbolikusz
függvény.
Monotonitás: szigorúan monoton nő.
Konvexitás: szigorúan konkáv.
Szélsőértékek: Minimuma van az x = 1 pontban, y = 0.

15.33. ábra

Az área tangens hiperbolikusz függvény és tulajdonságai

Tekintsük a th x függvény leszűkítését a (–1; 1) intervallumra! Ekkor az th x függvény inverzét área tangens
hiperbolikusz függvénynek nevezzük, vagyis arth x azt a függvényt jelenti, amelyre th(arth x) = x.

Példa. Mivel th 0 = 0, ezért arth 0 = 0.

Megjegyzés. Az arth x függvény kifejezhető az ln függvény segítségével, ha n ∈ ]–1; 1[: arth .

Értelmezési tartomány: a ]–1; 1[ intervallum.


Értékkészlet: a valós számok halmaza.
Zérushelyek: x = 0.
Y-tengelymetszet: y = 0.
Paritás: Páratlan, tehát tükrös az origóra, és arth(–x) = –arth x.
Periodicitás: nem periodikus.
Korlátosság: nem korlátos.
Monotonitás: szigorúan monoton nő.
Konvexitás: Szigorúan konkáv a ]–1; 0] intervallumon, és szigorúan konvex a [0; 1 [ intervallumon.
Szélsőértékek: nincs sem maximuma, sem minimuma.
15.34. ábra

Az área kotangens hiperbolikusz függvény és tulajdonságai

A cth x függvény inverzét área kotangens hiperbolikusz függvénynek nevezzük, vagyis arcth x azt a függvényt jelenti,
amelyre cth(arcth x) = x.

Megjegyzés. Az arcth x függvény kifejezhető az ln függvény segítségével, ha

Értelmezési tartomány: a ]–∞; 1[ ∪ ] 1; ∞[ halmaz.


Értékkészlet: az y = 0 kivételével a valós számok halmaza.
Zérushelyek: nincs zérushelye.
Y-tengelymetszet: nincs y-tengelymetszete.
Paritás: Páratlan, tehát tükrös az origóra, és arcth(–x) = –arcth x.
Periodicitás: nem periodikus.
Korlátosság: nem korlátos.
Monotonitás: Szigorúan monoton csökken a ]–∞; –1[ és az ]1; ∞[ intervallumon.
Konvexitás: Szigorúan konkáv a ]–∞; –1[ intervallumon, és szigorúan konvex a ] 1; ∞[ intervallumon.
Szélsőértékek: nincs sem maximuma, sem minimuma.

15.35. ábra
16. A valós analízis elemei
16.1. A valós számok alapfogalmai
16.2. Számsorozatok
16.3. Numerikus sorok
16.4. Egyváltozós függvények folytonossága és határértéke
16.5. Többváltozós analízis elemei

16.1. A valós számok alapfogalmai

Egy In intervallumokból álló sorozatot egymásba skatulyázott intervallumsorozatnak nevezünk, ha bármely n ∈ N


esetén In⊆ In+1.

Arkhimédészi axióma. Bármely valós számhoz található nála nagyobb természetes szám.
Cantor-axióma. Bármely egymásba skatulyázott zárt intervallumsorozatnak létezik közös pontja.

Egy F ⊆ R halmazt felülről korlátosnak nevezünk, ha létezik olyan a valós szám, hogy bármely x ∈ F esetén x ≤ a.
Egy A ⊆ R halmazt alulról korlátosnak nevezünk, ha létezik olyan b valós szám, hogy bármely x ∈ A esetén x ≥ b.
Egy H ⊆ R halmazt korlátosnak nevezünk, ha alulról és felülről is korlátos.

Az iménti de nícióban szereplő a számot az F halmaz egy felső korlátjának, a b számot az A halmaz egy alsó korlátjának
nevezzük.

Megjegyzés. Egy felülről korlátos F halmaznak nyilván végtelen sok felső korlátja van, ugyanis ha az a szám egy felső
korlátja F-nek, akkor minden a-nál nagyobb szám is felső korlátja F-nek.

A következő tétel a felső korlátok halmazának egy nagyon fontos tulajdonságát mondja ki:

Bármely nem üres, felülről korlátos F halmaz felső korlátai között létezik legkisebb. Ezt a számot az F halmaz felső
határának, szuprémumának nevezzük. Jelölés: sup F.

Hasonló állítható az alulról korlátos halmazok esetében:

Bármely nem üres, alulról korlátos A halmaz alsó korlátai között létezik legnagyobb. Ezt a számot az A halmaz alsó
határának, in mumának nevezzük. Jelölés: inf A.

Megállapodunk abban, hogy felülről nem korlátos halmazok legkisebb felső korlátja plusz végtelen (jelölésben: +∞),
alulról nem korlátos halmazok legnagyobb alsó korlátja mínusz végtelen (jelölésben: –∞).

Példa. Tekintsük az halmazt! Ennek legkisebb felső korlátja 1, legnagyobb alsó korlátja 0. Valóban, 1
felső korlátja a halmaznak, hiszen minden eleménél nagyobb vagy egyenlő. Mivel 1 eleme is a halmaznak, nincs nála
kisebb felső korlát, hiszen az nem lenne nagyobb vagy egyenlő a halmaz minden eleménél. A 0 alsó korlát, hiszen a
halmaz elemei mind pozitív számok, így nagyobbak, mint 0. Azt pedig, hogy nincs 0-nál nagyobb alsó korlát, az

arkhimédészi axióma biztosítja. Ha lenne alsó ϵ > 0 korlát, az azt jelentené, hogy minden n ∈ N számra

teljesül. Ezt átrendezve adódik, ez viszont ellentmond az axiómának.

Legyen x ∈ R tetszőleges valós szám, és legyen ϵ > 0! Ekkor az (x – ϵ, x + ϵ) nyílt intervallumot az x pont ϵ sugarú
környezetének nevezzük.

Legyen H ⊆ R tetszőleges halmaz! Egy x ∈ R pont a H halmaz belső pontja,


ha létezik olyan ϵ > 0 szám, hogy (x – ϵ, x + ϵ) ⊆H;
torlódási pontja, ha minden ϵ > 0 számra teljesül, hogy az x ϵ sugarú környezete tartalmaz x-től különböző H-beli
pontot;
jobb oldali torlódási pontja, ha minden ϵ > 0 számra teljesül, hogy (x, x + ϵ) ∩H ≠ Ø;
bal oldali torlódási pontja, ha minden ϵ > 0 számra teljesül, hogy (x – ϵ, x) ∩H ≠ Ø;
izolált pontja, ha létezik olyan ϵ > 0 szám, hogy (x – ϵ, x + ϵ) ∩H = {x}.

A belső pontok halmazára az int H, a torlódási pontok halmazára a H′ jelöléseket alkalmazzuk.


Az iménti de níciókból látható, hogy ha x belső pontja vagy izolált pontja a H halmaznak, akkor x ∈ H. Ha pedig
torlódási pont, akkor előfordulhat, hogy x benne van a halmazban, de az is lehet, hogy nincs. Ezt mutatja a következő
egyszerű példa.

Példa. Tekintsük a (–1, 1) intervallumot! Ennek a halmaznak nyilván torlódási pontja a 0, amely eleme a halmaznak.

Az halmaz torlódási pontja a 0, amely nem eleme a halmaznak. Hogy valóban torlódási pont, az az

arkhimédészi axiómából adódik: legyen ϵ > 0 szám. Ekkor az axióma szerint az számhoz van olyan n természetes

szám, hogy . Ezt átrendezve kapjuk, hogy . Vagyis , ami azt jelenti, hogy 0 torlódási

pontja az halmaznak.

Véges halmazoknak nincs torlódási pontjuk, azonban korlátos, végtelen halmazokra a következőt mondja ki a
Bolzano–Weierstrass-tétel:

Bármely korlátos, végtelen halmaznak létezik torlódási pontja.

16.2. Számsorozatok

Számsorozat határértéke
Nevezetes sorozatok határértéke
Műveletek sorozatokkal
Sorozatok tulajdonságai

Számsorozat határértéke

Egy, a természetes számok halmazán értelmezett, valós számok halmazába képező a : N → R függvényt valós
számsorozatnak, röviden sorozatnak nevezünk.

Az egyszerűbb írásmód kedvéért a(n) helyett egy sorozatra az an indexes jelölést alkalmazzuk. Használatos jelölés még:
(an).

Példák

Azt mondjuk, hogy az an számsorozat határértéke, limesze az a valós szám, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ϵ N, n ≥ n0 esetén |an – a| < ϵ.

Jelölés: .
Megjegyzés. Az n0 ∈ N küszöbindex függ az ϵ > 0 számtól.

Azt mondjuk, hogy az an számsorozat határértéke, limesze +∞, ha bármely K valós számhoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ∈ N, n ≥ n0 esetén an ≥ K.

Jelölés: .

Azt mondjuk, hogy az an számsorozat határértéke, limesze –∞, ha bármely K valós számhoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n ∈ N, n ≥ n0 esetén an ≤ K.

Jelölés:

Azokat a sorozatokat, amelyeknek létezik véges határértéke, konvergensnek nevezzük. Azokat a sorozatokat,
amelyeknek határértéke +∞ vagy –∞, esetleg nincs határértéke, divergensnek nevezzük.

Megjegyzés. Egy valós számsorozatnak legfeljebb egy határértéke lehet.

Azt mondjuk, hogy egy H ⊆ R halmaz torlódási pontja +∞, ha létezik olyan an sorozat, hogy minden n ∈ N esetén an ∈
H, és an → +∞ (n → + ∞).
Azt mondjuk, hogy egy H ⊆ R halmaz torlódási pontja –∞, ha létezik olyan an sorozat, hogy minden n ∈ N esetén an ∈
H, és an → –∞ (n → +∞).

Egy H ⊆ R halmaz torlódási pontjaira továbbra is a H′ jelölést alkalmazzuk.


A következőkben látni fogunk konkrét példákat sorozatokra és azok határértékeire.

Nevezetes sorozatok határértéke


Az arkhimédészi axióma szerint bármely x valós számhoz van olyan n természetes szám, hogy n > x. Vegyünk egy

tetszőleges ϵ > 0 számot! Ekkor az axióma szerint van olyan n0 természetes szám, hogy . Természetesen ekkor

minden n > n0 természetes számra . Átrendezve azt kapjuk tehát, hogy a tetszőleges ϵ > 0-hoz létezik n0

természetes szám, hogy minden n ≥ n0 természetes szám esetén . Ez pedig pontosan azt jelenti, hogy

Tetszőleges α > 0 szám esetén is állítható, hogy

Egy olyan sorozatot, amelynek minden tagja egyenlő, konstans sorozatnak nevezünk. A de nícióból nagyon
egyszerűen adódik, hogy minden konstans sorozat konvergens, és határértéke az a szám, amellyel tagjai megegyeznek.
Legyen most q ∈ R valós szám, és tekintsük a qn sorozatot! Ennek a sorozatnak a határértékei q-tól függően változnak:

q ≤ –1 esetén nincs határértéke.

Tetszőleges a > 0 számra


Fontos megjegyezni bizonyos sorozatok között fennálló „erősorrendet”. Legyenek q > 1 és α > 0 számok. Ekkor n → +∞
esetén
Szokás azt mondani (némileg helytelenül), hogy a qn sorozat „gyorsabban tart végtelenhez”, mint az nα sorozat.

Nagyon fontos sorozat as sorozat. Belátható, hogy ez a sorozat konvergens, azaz létezik véges határértéke.
Ezt a határértékét nevezzük az e számnak, tehát

Megmutatható, hogy tetszőleges a valós szám esetén fennáll

Például, az sorozat határértéke .

Műveletek sorozatokkal
A következőkben értelmezzük a sorozatok közötti műveleteket, melyek természetes módon adódnak. Legyenek an és bn
valós számsorozatok, c tetszőleges valós szám. Ekkor tetszőleges n természetes számra legyen

(a + b) (n) := an + bn, az an és bn sorozatok összege,


c(a) (n) := can, az an sorozat és a c szám szorzata,
(ab) (n) := anbn, az an és bn sorozatok szorzata,
valamint ha tetszőleges n-re bn ≠ 0, akkor legyen

az an és bn sorozatok hányadosa.

Példa. Az an = 3n és a bn = 28n3 sorozatok hányadosa a sorozat.

Konkrét sorozatok határértékének kiszámításánál gyakran lesz szükségünk a valós számok és a „végtelenek” közötti
műveletekre. Ezeket az alábbiakban értelmezzük, a szemléletünkre is hagyatkozva. Legyen a egy tetszőleges valós szám.
Ekkor

(+∞) + (+∞) = +∞, (–∞) + (–∞) = –∞,


(+∞) + a = +∞, (–∞) + a = –∞,
(+∞) (+∞) = +∞, (–∞) (–∞) = +∞, (+∞) (–∞) = –∞,
(+∞)a = +∞, ha a > 0, (+∞)a = –∞, ha a < 0, (–∞)a = –∞, ha a > 0, (–∞)a = +∞, ha a < 0,

Nem értelmezzük ellenkező előjelű végtelenek összegét, végtelenek hányadosát, illetve 0-nak bármelyik végtelennel
való szorzatát.
E műveletek bevezetésének oka a következő tétel, amely a sorozatok közötti műveletek és a határértékek közötti
műveletek összefüggéseit írja le. Az egyszerűbb írásmód kedvéért vezessük be az halmazt, amelyet
kibővített valós számoknak nevezünk.

Legyenek an és bn valós számsorozatok, c tetszőleges szám. Tegyük fel, hogy az an sorozat határértéke a, a bn sorozat
határértéke b, ahol a, b ∈ R̄.
Ekkor n → +∞ esetén
anbn → a + b, ha a + b értelmes,
anbn → ab, ha ab értelmes,
can → ca, ha ca értelmes,
, ha bn ≠ 0 minden n természetes számra, és értelmes.

Ebből következik, hogy konvergens sorozatok összege, szorzata, számmal való szorzata konvergens.

Példa. Számítsuk ki az sorozat határértékét!

A nevezőt kifejtve kapjuk, hogy . A számlálóból és nevezőből is kiemelve n2-et, kapjuk, hogy

. A számlálóban szereplő sorozat az előző tétel összefüggései alapján 2 – 0 – 0-hoz tart, a nevező

pedig 1 + 0 + 0-hoz. Ezért az an sorozat határértéke .

A következő példák mutatják, hogy miért nem célszerű de niálnunk minden lehetséges műveletet:

Példa. Legyen an = n2, bn = n2 – 1! Mindkét sorozat határértéke +∞, így az an – bn sorozat határértéke (+∞) – (+∞) alakú.
Az an–bn = 1 sorozat határértéke 1. Így ha értelmeznünk kellene azonos előjelű végtelenek különbségét, akkor azt 1-
nek lenne célszerű de niálni, hogy összhangban maradjunk a tétellel. Viszont az n2 – n2 = 0 sorozat szerint 0 lenne
megfelelő érték.

Tekintsük az sorozatokat! Az első sorozat határértéke +∞, a második sorozaté 0. Így szorzás esetén (+∞)0
alakú a határérték. A két sorozat szorzata (–1)n, aminek nincs határértéke.

Sorozatok tulajdonságai

Egy an sorozatot felülről korlátosnak (alulról korlátosnak) nevezünk, ha az értékkészlete, {an | n ∈ N} felülről
korlátos (alulról korlátos) halmaz. Egy sorozat korlátos, ha alulról és felülről is korlátos.

Konvergens sorozatok fontos tulajdonsága a következő:

Minden konvergens sorozat korlátos.

A megfordítás nem igaz, azaz léteznek olyan korlátos sorozatok, amelyek nem konvergensek. Ilyen például a (–1)n
sorozat.

Egy an sorozatot monoton növőnek (illetve fogyónak) nevezünk, ha minden n természetes szám esetén an ≤ an+1
(illetve an ≥ an+1). Ha minden n természetes számra szigorú egyenlőtlenség áll fenn, akkor szigorúan monoton
sorozatokról beszélünk.

Minden monoton sorozatnak létezik határértéke. Ha monoton növő, akkor ez a határérték nem más, mint a sorozat
értékkészletének szuprémuma. Ha monoton fogyó, akkor pedig határértéke a sorozat értékkészletének in muma.

De níció szerint egy korlátos halmaz szuprémuma és in muma véges, ezért kimondhatjuk a következő tételt:

Minden korlátos, monoton sorozat konvergens.

Megjegyzés. Az e-t de niáló sorozatról belátható, hogy monoton növő és korlátos, így valóban létezik
véges határértéke.

A következő állítás csendőrelvként vagy közrefogási elvként ismert a szakirodalomban, amely gyakran alkalmazható
sorozatok határértékének meghatározására.

Legyenek an, bn, cn számsorozatok! Tegyük fel, hogy létezik olyan n0 index, hogy minden n ≥ n0 esetén an ≤ bn ≤ cn
teljesül. Ha létezik
akkor a bn sorozatnak is létezik határértéke, és egyenlő a-val.

Példa. Tekintsük az sorozatot! Ekkor bármely n természetes szám esetén fennáll a következő
egyenlőtlenség: . Vagyis a kérdéses sorozatot alulról becsültük a

konstans 7 sorozattal, felülről pedig a 7-hez tartó sorozattal. Így az előzőek szerint

Fontos fogalom a következő.

Legyen an egy valós számsorozat, és legyen φ : N → N egy szigorúan monoton növő sorozat! Ekkor azt a bn sorozatot,
melyre minden n ∈ N esetén bn = aφ(n) teljesül, az an sorozat egy részsorozatának nevezzük.

Példa. Legyen φ(n) = n2. Ekkor a sorozat részsorozata az sorozatnak.

A részsorozatok határértéke „összhangban” van az eredeti sorozat határértékével.

Ha egy an sorozatnak létezik határértéke, akkor minden részsorozatának létezik határértéke, és megegyezik az an
sorozat határértékével.

Nem biztos, hogy egy sorozatnak létezik határértéke, így felvetődik a kérdés, hogy van-e olyan részsorozata, amelynek
létezik limesze. Kiderül, hogy mindig van ilyen részsorozat.

Minden sorozatnak van monoton részsorozata.

Mivel minden monoton sorozatnak létezik határértéke, ezért kimondhatjuk a következő tételt, amely a sorozatokra
vonatkozó:

Bolzano–Weierstrass-tétel: bármely sorozatnak van olyan részsorozata, amelynek létezik határértéke.

Korlátos sorozatokra pedig a következő az állítás:

Minden korlátos sorozatból kiválasztható konvergens részsorozat.

Példa. A (–1)n sorozat részsorozata a (–1)2n = 1 konstans 1 sorozat. Ez monoton növő, határértéke pedig 1. Ugyanennek
a sorozatnak részsorozata a (–1)2n–1 = –1 konstans –1 sorozat, ez is monoton, határértéke pedig –1. Ez mutatja azt is,
hogy a (–1)n sorozatnak nincs határértéke, ugyanis minden részsorozatának ugyanoda kellene tartania.

Legyen an egy tetszőleges sorozat, és jelölje H azt az R̄-beli halmazt, melynek elemei az an valamely részsorozatának
határértékei. Ekkor a H halmaznak létezik legkisebb és legnagyobb eleme -ban.

Az iménti tételben szereplő legkisebb határértéket az an sorozat limesz inferiorjának (jelölésben ), a


legnagyobb határértéket az an sorozat limesz szuperiorjának (jelölésben ) nevezzük.

Megjegyzés. Nyilvánvaló, hogy , és egyenlőség pontosan akkor áll, ha a sorozatnak létezik


határértéke, és ekkor .

Legyenek an és bn számsorozatok! Ekkor azt a cn sorozatot, amelyre minden n ∈ N esetén c2n–1 = an, a2n = bn, az an és bn
sorozatok összefésülésének nevezzük.
Ha létezik , és ezek egyenlők, akkor a két sorozat összefésülésének is létezik limesze, amely egyenlő
az eredeti sorozatok limeszével.

A következő fogalom a numerikus soroknál játszik fontos szerepet.

Legyen p : N → N egy bijekció, azaz olyan függvény, amely kölcsönösen egyértelmű és R(p) = N! Legyen an egy
számsorozat! Ekkor azt a bn sorozatot, amelyre minden n esetén bn = ap(n), az an sorozat egy átrendezésének nevezzük.

Ha egy számsorozatnak létezik határértéke, akkor minden átrendezésének létezik, és egyenlő az eredeti sorozat
határértékével.

Bizonyos számsorozatok nagyon fontos tulajdonsága a következő:

Egy an számsorozatot Cauchy-sorozatnak nevezünk, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N küszöbindex, hogy
tetszőleges n, m ∈ N, n ≥ n0, m ≥ n0 esetén | an – am | < ϵ.

Ez a tulajdonság ad jellemzést a konvergens sorozatokra:

Egy számsorozat pontosan akkor konvergens, ha Cauchy-sorozat.

Az előbbi tulajdonságot a gyakorlatban általában nem könnyű ellenőrizni, a tételnek főleg elméleti jelentősége van,
más állítások és tételek bizonyításaiban játszik fontos szerepet. Léteznek azért konkrét sorozatok, amelyek esetében
alkalmazható a tétel, a következő példában egy ilyen sorozatot vizsgálunk meg.

Példa. Tekintsük az sorozatot! Ez a sorozat szigorúan monoton növő, hiszen .


Következésképpen létezik határértéke. Megmutatjuk, hogy nem lehet véges ez a határérték. Ellenkező esetben

konvergens lenne a sorozat, így az előző tétel szerint Cauchy-sorozat. Ezért az számhoz is létezik olyan no ∈

N küszöbindex, hogy tetszőleges n, m ∈ N, n ≥ n0, m ≥ n0 esetén . Speciálisan ez teljesül n = 2n0, m =

n0 esetén is, azaz . Tekintsük az

számot! Látható, hogy az összegben minden tag nevezője kisebb vagy egyenlő, mint 2n0. Ezért

hiszen n0 darab tag van. Ez viszont ellentmondás, ugyanis lehetetlen.

16.3. Numerikus sorok

Sorok tulajdonságai
Műveletek sorokkal
Pozitív tagú sorok konvergenciájára vonatkozó elégséges kritériumok
Feltételesen konvergens sorok, átrendezések

Sorok tulajdonságai

Legyen an valós számsorozat! Képezzünk ebből egy új számsorozatot a következő módon: minden n ∈ N esetén legyen
.
Ekkor az Sn sorozatot az an sorozathoz tartozó végtelen sornak, az Sn számot a sor n-edik szeletének nevezzük. Jelölés:
Sn = ∑an.

Ha létezik , akkor ezt a határértéket a ∑an sor összegének nevezzük, és a jelölés helyett -t
írunk. Azt mondjuk, hogy a ∑an sor konvergens, ha létezik és véges. Minden más esetben (tehát ha ez a
határérték végtelen vagy nem létezik) azt mondjuk, hogy ∑an divergens.

Megjegyzés. Bizonyos esetekben nem 1-től kezdjük az indexelést.


Példa. Fontos példa végtelen sorra az úgynevezett geometriai sor. Legyen q ∈ R, an := qn, és képezzük ebből a ∑qn sort
(0-val kezdődik az indexelés). A q számot a sor kvóciensének nevezzük. Látható, hogy ha q = 1, akkor a sor divergens,

és összege +∞. Ha q ≠ 1, akkor a geometriai sorozatok összegképlete alapján .


Világos, hogy ez a sorozat pontosan akkor konvergens, ha |q| < 1. Ebben az esetben a sor összege nem más, mint

. Ha q ≥ 1, akkor a sor divergens, és összege +∞, q ≤ – 1 esetén divergens a sor, és összege sem létezik.

Mivel egy sor tulajdonképpen egy sorozat, átfogalmazhatjuk sorokra a Cauchy-kritériumot.

Sorokra vonatkozó Cauchy-kritérium. A ∑an sor pontosan akkor konvergens, ha minden ϵ > 0 számhoz létezik n0 ∈ N

úgy, hogy minden n > m ≥ n0 esetén .

Az iménti kritérium fontos következménye a sorok konvergenciájának szükséges feltétele:

Ha ∑an konvergens sor, akkor .

Egy ∑an sort abszolút konvergensnek nevezünk, ha a ∑|an| sor konvergens.

Az abszolút konvergencia erősebb tulajdonság a konvergenciánál:

Ha a ∑an sor abszolút konvergens, akkor konvergens is.

Később látni fogunk olyan példát konvergens sorra, amely nem abszolút konvergens.

Műveletek sorokkal

Legyenek ∑an és ∑bn tetszőleges sorok! Ekkor a két sor összegén a ∑(an + bn) sort értjük.

Tegyük fel, hogy a két sornak létezik és .

Ekkor a ∑(an + bn) sornak is létezik összege, éspedig , feltéve, hogy a + b értelmes.

Legyen ∑an tetszőleges sor, melynek létezik összege, .


Ekkor bármely c ∈ R valós számra a ∑can sornak is létezik összege, és ez nem más, mint ca, feltéve, hogy a szorzat
értelmes.

A most következő két tétel ∑anbn alakú sorok konvergenciájáról szól. Fontos alkalmazásaik vannak a hatványsorok és
trigonometrikus sorok elméletében.

Abel tétele:
Legyen an monoton, korlátos sorozat, és legyen ∑bn egy konvergens sor.
Ekkor a ∑anbn sor konvergens.

Dirichlet tétele:
Legyen an monoton zérussorozat, és legyen ∑bn olyan sor, amelynek a szeletei korlátosak, azaz van olyan K > 0 szám,

hogy minden n ∈ N-re . Ekkor a ∑anbn sor konvergens.

A hatványsorok elméletében játszik szerepet a következő de níció.

Legyenek ∑an és ∑bn tetszőleges sorok! Készítsük el minden n ∈ N-re a cn = a1bn + a2bn–1 + … + anb1 számot (látható,
hogy minden tag indexösszege n + 1). Ekkor a ∑cn sort a ∑an és ∑bn sorok Cauchy-szorzatának nevezzük.

Fontos tétel Mertens tétele:

Ha ∑an abszolút konvergens, ∑bn konvergens sor, akkor a Cauchy-szorzatuk is konvergens, és összege a két sor
összegének a szorzata.

Pozitív tagú sorok konvergenciájára vonatkozó elégséges kritériumok


Az alábbi szakaszban olyan feltételeket keresünk, amelyek fennállása biztosítja egy sor konvergenciáját. Bevezetünk egy
elnevezést sorok egy osztályára.

A ∑an sort pozitív tagú sornak mondjuk, ha minden n ∈ N esetén an ≥ 0.

Pozitív tagú sornak létezik összege. Ez pontosan akkor véges, vagyis egy pozitív tagú sor pontosan akkor konvergens,
ha a sor részletösszegeinek sorozata felülről korlátos.

Könnyű meggondolni ezt az állítást, ugyanis ha ∑an pozitív tagú sor, akkor a részletösszegeiből álló Sn sorozat
monoton növő, ezért van határértéke. Ez pontosan akkor véges, ha a sorozat felülről korlátos.
A következő tétel mind elméleti, mind gyakorlati alkalmazásokban is előfordul. Abszolútkonvergencia-vizsgálatoknál
is hasznos, hiszen ott pozitív tagú sorokat vizsgálunk.

Weierstrass-kritérium vagy összehasonlító-kritérium:


Legyen ∑an és ∑bn pozitív tagú sor! Tegyük fel, hogy minden n ∈ N esetén an ≤ bn. Ekkor ha ∑bn konvergens, akkor
∑an is konvergens. Ha ∑an divergens, akkor ∑bn is.

Az iménti kritérium segítségével szokás bizonyítani a következő nevezetes állítást.

Cauchy-féle gyökkritérium:

Legyen ∑an pozitív tagú sor! Ha , akkor ∑an konvergens, ha , akkor ∑an
divergens.

Egy másik nevezetes elégséges feltétel következik.

D''Alembert-féle hányadoskritérium:
Legyen ∑an pozitív tagú sor, és tegyük fel, hogy an ≠ 0 minden n ∈ N-re!

Ha , akkor ∑an konvergens, ha , akkor ∑an divergens.

Megjegyzés. Ha a fenti sorozatoknak létezik határértéke, akkor természetesen mindenhol lim írható.

Példa. Legyen x ∈ R tetszőleges valós szám, és tekintsük a sort! Ha x = 0, akkor a sor nyilván konvergens. Ha

x ≠ 0, akkor felírva a hányadossorozatra a határértéket , kapjuk, hogy


, ezért a hányadoskritérium alapján a sor konvergens.

Megmutatható egyébként, hogy minden x ∈ R számra .


Megjegyzés. Az előbbi két tételben lényeges a limeszekre vonatkozó szigorú egyenlőtlenség. Léteznek ugyanis olyan

konvergens és divergens sorok is, amelyekre és teljesül. Láttuk korábban, hogy a

ún. harmonikus sor divergens.

Erre a sorozatra teljesül. Később viszont megmutatjuk, hogy a sor konvergens, és

erre is teljesül, hogy . Tehát, ha egyenlőség szerepel a két limeszben, nem állíthatunk
semmit a konvergenciáról.

Gauss-kritérium vagy kondenzációs kritérium:


Legyen an olyan sorozat, amely monoton fogyólag tart 0-hoz. Ekkor a ∑an sor pontosan akkor konvergens, ha a ∑2na2n
sor konvergens.

Példa. Az előbbi kritérium nagyon szép alkalmazása az ún. hiperharmonikus sor konvergenciájának meghatározása.

Legyen α valós szám! Ekkor a sor pontosan akkor konvergens, ha α > 1. Valóban, felhasználva a Gauss-

kritériumot, kapjuk, hogy pontosan akkor konvergens, amikor konvergens. Ez a sor nem más,

mint amely egy geometriai sor, kvócienssel. Láttuk korábban, hogy egy geometriai
sor pontosan akkor konvergens, ha kvóciensének abszolút értéke kisebb, mint 1. Példánk esetén ez pedig pontosan

akkor teljesül, ha α > 1. Érdemes megjegyezni, hogy a = 2 esetén , amely egyenlőség például Fourier-
sorok segítségével is bizonyítható.

Feltételesen konvergens sorok, átrendezések

A ∑an sort Leibniz-típusú sornak nevezzük, ha an váltakozó előjelű (azaz minden n ∈ N esetén anan+1 < 0), és az |an|
sorozat monoton fogyólag tart 0-hoz.

Nevezetes a következő tétel.

Leibniz-kritérium: minden Leibniz-típusú sor konvergens.

Példa. Tekintsük a sort! Ez Leibniz-típusú, hiszen váltakozó előjelű, és 0-hoz tart monoton

fogyólag. Következésképpen konvergens. (Megmutatható egyébként, hogy .)

A ∑an sort feltételesen konvergens sornak nevezzük, ha ∑an konvergens, de nem abszolút konvergens.

A sor ilyen tulajdonságú, hiszen konvergens, de nem abszolút konvergens, mert divergens.

Ha ∑an abszolút konvergens sor, akkor az an sorozat bármely ap(n) átrendezésére ∑ap(n) konvergens, és összege
megegyezik az eredeti sor összegével.

Látszik tehát, hogy abszolút konvergens sorok esetén a tagok sorrendje az összeg szempontjából nem számít (mint
véges összeg esetén, hiszen az összeadás kommutatív művelet). Feltételesen konvergens sorok esetében ez azonban nincs
így. Ezt mondja ki a nevezetes Riemann-féle átrendezési tétel.
Legyen ∑an egy feltételesen konvergens sor. Ekkor bármely a valós számhoz van an-nek olyan ap(n) átrendezése, hogy a
∑ap(n) sor összege a. Olyan átrendezések is léteznek, hogy ∑ap(n) összege +∞, –∞, vagy nem is létezik.

Megjegyzés. A tétel bizonyításának hátterében egy szemléletes gondolatmenet húzódik, precízen leírva azonban
meglehetősen bonyolult és hosszadalmas.

16.4. Egyváltozós függvények folytonossága és határértéke


A következőkben valós számok részhalmazain értelmezett függvényekről lesz szó. De niálunk két fogalmat, a folytonosság
és a határérték fogalmát, amelyek alapvető fontosságúak az analízisben. E két fogalom lesz segítségünkre a
di erenciálhatóság bevezetésénél, amely egy roppant fontos eszköz függvények alaki tulajdonságainak leírásánál.
Nemegyszer gyakorlati problémák megoldásához nyújt eljárási lehetőséget.

A folytonosság fogalma, függvényműveletek


A határérték fogalma
Nevezetes függvényhatárértékek
Függvényműveletek és határérték
Folytonos függvények tulajdonságai

A folytonosság fogalma, függvényműveletek


A folytonosság, talán a neve is sugallja, egy, a szemléletnek megfelelő tulajdonság lesz. „Folytonos függvény egy olyan
függvény, melynek a gra konját a tollunk felemelése nélkül tudjuk lerajzolni.” Ezt a szemléletes magyarázatot (amely
matematikailag egyáltalán nem korrekt meghatározás) de niáljuk precízen:

Legyen H ⊆ R egy nem üres számhalmaz. Legyen f : H → R egy tetszőleges függvény, xo ∈ H. Azt mondjuk, hogy az f
függvény folytonos az xo ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, akkor |f(x) –
f(x0) | < ϵ. Az f függvény folytonos a H halmazon, ha minden pontjában folytonos.

A szemlélethez visszatérve, a pontbeli folytonosság azt jelenti, hogy ha „közel” vagyunk a ponthoz, akkor a
függvényértékek is „közel” lesznek.

Megjegyzés. Ha egy f : H → R függvény folytonos egy x0 ∈ H pontban, akkor ott |f| is folytonos. Valóban, az ismert
||f(x)| – |f(x0) || ≤ |f(x) – f(x0) | egyenlőtlenség alapján adott ϵ > 0-hoz ugyanaz a δ > 0 jó lesz, ami f-hez jó volt.

Értelmezzük még a jobbról és balról való folytonosságot:

Legyen H ⊆ R egy nem üres számhalmaz! Legyen f : H → R egy tetszőleges függvény, x0 ∈ H. Azt mondjuk, hogy az f
függvény jobbról (illetve balról) folytonos az x0 ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha |x – x0|
< δ, x ∈ H és x ≥ x0 (illetve x ≤ x0), akkor |f(x) – f(x0)| < ϵ.

Nyilvánvaló a következő állítás.

Egy f : H → R függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha ott jobbról és balról is folytonos.

Nagyon fontos a következő állítás, az ún. folytonosságra vonatkozó átviteli elv:

Egy f : H → R függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha bármely olyan xn ∈ H sorozatra,
melyre , fennáll, hogy .

Tehát „elegendő” megmutatnunk, hogy bármely, az értelmezési tartományban haladó x0-hoz tartó sorozat mentén a
függvényértékek tartanak f(x0)-hoz. Ezt a gyakorlatban nem mindig könnyű ellenőrizni, főleg elméleti alkalmazásai
vannak a tételnek. Feladatok esetében főleg úgy fordul elő, hogy a nem folytonosságot kell bizonyítani. Ezt illusztráljuk a
következő példán.

Példa. Tekintsük az függvényt! Megmutatjuk, hogy nem folytonos a 0 pontban.


Az átviteli elv szerint elegendő mutatnunk olyan xn sorozatot, melyre , de .

Legyen ! Ekkor , és ez a sorozat nem tart a 0-beli helyettesítési


értékhez, azaz 0-hoz.
Megjegyzés. Ha az f : H → R függvény értelmezési tartományának x0 izolált pontja, akkor ott szükségszerűen
folytonos a függvény, ugyanis az olyan sorozatok, amelyek H-ban haladnak, és x0-hoz tartanak, azok egy index után
megegyeznek az xn = x0 konstans sorozattal. Egy ilyenre pedig fennáll , hiszen egy n indextől
kezdve már f(xn) = f(x0).

Megvizsgáljuk a folytonosság és a függvényműveletek közötti kapcsolatot, erről szól a következő tétel.

Legyenek f : H → R és g : H → R tetszőleges függvények a közös H értelmezési tartományon, és legyen c ∈ R tetszőleges


valós szám! Tegyük fel, hogy f és g folytonosak az x0 ∈ H pontban. Ekkor az f + g, fg, cf függvények mindegyike

folytonos x0-ban, és ha g(x0) ≠ 0, akkor az függvény is folytonos x0-ban.

Függvények kompozíciójának folytonosságáról megállapíthatjuk:

Legyenek f : H → R és g : f(H) → R tetszőleges függvények! Tegyük fel, hogy f folytonos az x0 ∈ H pontban, g folytonos
az f(x0) ∈ f(H) pontban. Ekkor a (g ○ f) : H → R függvény folytonos x0 ∈ H-ban.

Tehát nem egészen precízen azt mondhatjuk, hogy „folytonos függvények összege, szorzata, számmal való szorzata,
hányadosa és kompozíciója folytonos”.
Folytonos függvényre példának felsorolhatjuk az összes elemi függvényt, illetve ezek és a négy alapművelet, valamint a
kompozíció segítségével gyártott függvények bármelyikét. Megfogalmazzuk ezt külön is:

Az elemi függvények mindegyike folytonos az értelmezési tartományuk minden pontjában. Tehát minden
hatványfüggvény, minden polinomfüggvény, minden exponenciális és logaritmusfüggvény, minden trigonometrikus
függvény folytonos.

Példa. Az f : (0, +∞) → R, f(x) = ln(x + sin2 x)ex függvény folytonos a (0, +∞) intervallum minden pontjában, hiszen x +
sin2 x folytonos függvények összege, így folytonos, ln(x + sin2 x) folytonos, mert folytonos függvények kompozíciója,
végül ln(x + sin2 x)ex folytonos, mert folytonos függvények szorzata.

A határérték fogalma
A most következő fogalom nagyon fontos, ez adja a di erenciálszámítás alapját. A teljesség kedvéért kimondjuk az összes
de níciót. Kezdjük először a véges pontbeli határértékkel!

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik x0-ban véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan δ
> 0, hogy ha |x – x0| < δ, x ∈ H, x ≠ x0, akkor |f(x) – α| < ϵ.
Jelölés: vagy .

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy x0-ban az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈
H, x ≠ x0, akkor f(x) ≥ K.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak! Azt
mondjuk, hogy x0-ban az f függvény határértéke –∞, ha minden K < 0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈
H, x ≠ x0, akkor f(x) ≤ K.
Jelölés: vagy .

Nézzük a +∞-beli határérték de nícióját.

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik +∞-ben véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan L
> 0, hogy ha x > L, x ∈ H, akkor |f(x) – α| < ϵ.

Jelölés: vagy

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy +∞-ben az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan L > 0, hogy ha x > L, x ∈ H,
akkor f(x) > K.

Jelölés: vagy

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen +∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy +∞-ben az f függvény határértéke –∞, ha minden K < 0-hoz létezik olyan L > 0, hogy ha x > L, x ∈ H,
akkor f(x) < K.

Jelölés: vagy

Ugyanez –∞ esetén.

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy létezik –∞-ben véges határértéke az f függvénynek, és ez az α szám, ha minden ϵ > 0-hoz létezik olyan L
< 0, hogy ha x < L, x ∈ H, akkor |f(x) – α| < ϵ.

Jelölés: vagy

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy –∞-ben az f függvény határértéke +∞, ha minden K > 0-hoz létezik olyan L < 0, hogy ha x < L, x ∈ H,
akkor f(x) > K.

Jelölés: vagy

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen –∞ torlódási pontja a H halmaznak! Azt
mondjuk, hogy –∞-ben az f függvény határértéke +∞, ha minden K < 0-hoz létezik olyan L < 0, hogy ha x < L, x ∈ H,
akkor f(x) < K.

Jelölés: vagy

Megjegyzés. Ha visszaemlékezünk a számsorozat de níciójára, teljesen összhangban van a +∞-ben vett


határértékkel, amikor is H = N. Fontosnak tartjuk megjegyezni azt is, hogy a határérték de níciója független a
pontbeli helyettesítési értéktől.
A határérték de níciója nagyban hasonlít a folytonosság de níciójához. A következő tétel mutatja a két fogalom
közötti kapcsolatot. Ez segíteni fog abban is, hogy konkrét függvények határértékét kiszámíthassuk.

Legyen f : H → R tetszőleges függvény, és legyen x0 ∈ H, amely egyúttal torlódási pontja a H halmaznak. Ekkor az f : H
→ R függvény pontosan akkor folytonos az x0 ∈ H pontban, ha létezik x0-ban határértéke, és a limesz egyenlő az f(x0)
helyettesítési értékkel.

Megjegyzés. A pontbeli folytonossághoz még nem elegendő a véges határérték létezése, erre példa az

függvény.

16.1. ábra

A folytonossághoz hasonló átviteli elvet megfogalmazhatunk határértékekre is. Az alábbiakban egy halmaz torlódási
pontja esetén gondolhatunk plusz vagy mínusz végtelenre is.

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 torlódási pontja a H halmaznak, α ∈


!

Pontosan akkor létezik , ha minden xn ∈ H sorozatra, melyre xn → x0, xn ≠ x0, teljesül, hogy f(xn) →
α(n → + ∞).

De niáljuk függvények jobb és bal oldali határértékét, teljesen analóg módon a határértékhez.

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R jobb oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy létezik x0-ban jobb oldali határértéke az f függvénynek, és ez az α szám, ha minden ϵ >
0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, x0 < x, akkor |f(x) – α| < ϵ.
Jelölés: vagy .

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R bal oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy létezik x0-ban bal oldali határértéke az f függvénynek, és ez az α szám, ha minden ϵ >
0-hoz létezik olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, x < x0, akkor |f(x) – α| < ϵ.
Jelölés: vagy .

Végtelen határértékek közül csak a +∞ esetet írjuk le, a –∞ teljesen hasonlóan de niálható.

Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R jobb oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy x0-ban az f függvény jobb oldali határértéke +∞, ha minden K > 0-hoz létezik olyan δ >
0, hogy ha |x – x0| < δ, x ∈ H, x0 < x, akkor f(x) ≥ K.
Jelölés: vagy .
Legyen H ⊆ R tetszőleges halmaz, f : H → R tetszőleges függvény, és legyen x0 ∈ R bal oldali torlódási pontja a H
halmaznak! Azt mondjuk, hogy xo-ban az f függvény bal oldali határértéke +∞, ha minden K > 0-hoz létezik olyan δ > 0,
hogy ha |x – x0| < δ, x ∈ H, x < x0, akkor f(x) ≥ K.
Jelölés: vagy .

Példa:

Egy f : H → R függvénynek pontosan akkor létezik határértéke egy x0 ∈ H′ pontban, amely jobb és bal oldali torlódási
pont egyben, ha ott létezik jobb oldali és bal oldali határértéke, és ezek egyenlőek (ez lesz a határérték).

Monoton függvényekre igaz a következő szemléletes állítás.

Legyen f : I → R egy I intervallumon értelmezett monoton függvény, az intervallum végpontjai legyenek a, b, a < b!
Ekkor az f függvénynek az a pontban létezik jobb oldali, a b pontban létezik bal oldali határértéke, éspedig: ha f

monoton növő, akkor az a pontbeli jobb oldali határérték,

a b pontbeli bal oldali határérték; ha f monoton fogyó, akkor

az a pontbeli jobb oldali határérték, a b pontbeli


bal oldali határérték.

16.2. ábra

Nevezetes függvényhatárértékek
Ebben a részben felsoroljuk az elemi függvények nevezetes határértékeit, továbbá olyan határértékeket, amelyek a
di erenciálás de niálása után lesznek fontosak.

Polinomfüggvények
Racionális törtfüggvények
Exponenciális és logaritmusfüggvények
Trigonometrikus függvények

Polinomfüggvények
Legyen f : R → R, f(x) = anxn + anxn–1 + … + a0 egy n-edfokú polinom (n ∈ N)! Ekkor , ha an pozitív,
, ha an negatív;
, ha an pozitív, és n páratlan;
, ha an pozitív, és n páros;
, ha an negatív, és n páratlan;
Példa: .

Racionális törtfüggvények

Az alakú racionális törtfüggvény (m, n ∈ N, an ≠ 0, bm ≠ 0) határértékei a végtelenekben:


ha m > n,

, ha m = n.
Legyen ezek után m < n!
, ha anbm pozitív;
, ha anbm negatív;
, ha anbm pozitív, és n – m páratlan;
, ha anbm pozitív, és n – m páros;
, ha anbm negatív, és n – m páratlan;
, ha anbm negatív, és n – m páros.

Példa: .

Exponenciális és logaritmusfüggvények
Legyen a > 0 szám, a ≠ 1. Ekkor

Legyen a > 0 szám, a ≠ 1. Ekkor

Megemlítjük a következő fontos határértékeket:

Trigonometrikus függvények
A szinusz- és koszinuszfüggvényeknek nincs határértéke egyik végtelenben sem. A tangensfüggvényre viszont legyen k ∈
Z. Ekkor

Az árkusz tangens függvényre ezért , .

Nagyon fontos a határérték.

Függvényműveletek és határérték
A számsorozatoknál láttuk, hogy a határértékképzés és a műveletek jól illeszkedtek egymáshoz, például két konvergens
sorozat összege konvergens volt, és a határérték nem volt más, mint a határértékek összege. Tetszőleges függvényekre is
hasonló áll fenn, köszönhetően az átviteli elvnek, hiszen a sorozatok „átörökítik” függvényekre.

Legyenek f : H → R és g : H → R tetszőleges függvények a közös H értelmezési tartományon, legyen c ∈ R tetszőleges

valós szám! Legyen x0 ∈ H′, azaz torlódási pontja a H halmaznak! Tegyük fel, hogy létezik és

, ahol . Ekkor feltéve, hogy az kifejezések értelmesek, létezik


és ha is értelmezve van a H halmazon, akkor létezik .

Az állítás hasonló abban az esetben is, ha valamelyik végtelenben vizsgáljuk a határértéket. Kimondjuk mindkét
esetet:

Legyenek f : H → R és g : H → R tetszőleges függvények a közös H értelmezési tartományon, legyen c ∈ R tetszőleges


valós szám! Tegyük fel, hogy van olyan xn sorozat a H halmazban, amely +∞-hez tart. Tegyük fel, hogy létezik

és , ahol a, b ∈ . Ekkor, feltéve, hogy az a + b, ab, ca, kifejezések

értelmesek, létezik , , , és ha is

értelmezve van a H halmazon, akkor létezik .

Legyenek f : H → R és g : H → R tetszőleges függvények a közös H értelmezési tartományon, legyen c ∈ R tetszőleges


valós szám! Tegyük fel, hogy van olyan xn sorozat a H halmazban, amely –∞-hez tart. Tegyük fel, hogy létezik

és , ahol a, b ∈ R̄. Ekkor, feltéve, hogy az a + b, ab, ca, kifejezések értelmesek,

létezik , , és ha is értelmezve van a H

halmazon, akkor létezik .

Kompozíció határértékére pedig kimondhatjuk a következő tételt.

Legyenek f : H → R és g : K → R tetszőleges függvények a H, K számhalmazokon úgy, hogy g(K) H! Legyen x0 ∈ K′, és

tegyük fel, hogy létezik úgy, hogy b ∈ H, és f folytonos a b pontban! Ekkor létezik

Példák
1.
Számítsuk ki a határértéket!
Teljesülnek a kompozíció határértékére vonatkozó állítás feltételei, ugyanis a nevezetes
határérték, és az összegfüggvényre vonatkozó határérték alapján, valamint az ln függvény
folytonos a b = 1 pontban. Így a kérdéses határérték .
2.
Számítsuk ki a határértéket!
2
Mivel x – 1 és x – 1 is folytonos függvény az egész számegyenesen, ezért mindkettő határértéke az 1 pontban a
helyettesítési érték, azaz 0. A kérdéses határérték tehát 0/0 alakú, így további vizsgálat szükséges. Könnyen

észrevehető, hogy minden x ≠ 1 számra . Mivel a helyettesítési érték nem játszik szerepet a

határérték de níciójában, ezért . Ez utóbbi függvény azonban folytonos az x = 1

pontban, ezért a határérték a helyettesítési érték, ami nem más, mint 1 + 1 = 2. Ezért .
3.
Számítsuk ki a határértéket!
Mivel a törtben szereplő függvények mindegyike folytonos függvény, ezért a számláló és a nevező 0-beli

határértéke egyenlő a helyettesítési értékkel. Viszont ebből az látszik, hogy ez alakú határérték, hiszen e0 –

cos 0 = 1 – 1 = 0. Átalakítással: . Ha az összeg tagjainak külön-


külön létezik határértéke a 0 pontban, akkor hivatkozhatunk az összeg határértékére vonatkozó összefüggésre.

Az első határérték létezik, mert egy nevezetes határértékről van szo: . Továbbá

. Ennek a függvénynek létezik határértéke a 0


pontban, éspedig 0, hiszen egy olyan szorzatfüggvény, ahol . Az első
nevezetes határérték, a második pedig két folytonos függvény hányadosa, így folytonos. Ezért a határértéke

-nek a helyettesítési érték, azaz 0. Azt kaptuk tehát, hogy .

Folytonos függvények tulajdonságai


Ebben a szakaszban folytonos függvényekkel kapcsolatos olyan állításokat mutatunk be, amelyek megfelelnek annak a
szemléletnek, hogy „folytonos függvény az, amelynek gra konját úgy tudjuk lerajzolni, hogy közben nem emeljük fel a
tollat”. A tárgyalásra kerülő tételek az analízis alaptételei. Az első ilyen állítás

Bolzano tétele:
Legyen f : [a, b] → R folytonos függvény, f(a) < 0, f(b) > 0. Ekkor van olyan c ∈ (a, b), hogy f(c) = 0.

Az állítás szemléletes, hiszen ha az a pontban az x tengely „alatt”, a b pontban az x tengely „felett” vagyunk, akkor a két
pontot a függvény gra konjával összekötve valahol metszeni kell az x tengelyt, ha a függvény folytonos.

16.3. ábra

Bolzano tételével ekvivalens

Darboux tétele:
Legyen f egy I intervallumon értelmezett folytonos függvény, és legyenek x1, x2 ∈ I, x1 < x2 tetszőleges pontok! Ekkor
bármely f(x1) és f(x2) közé eső c számhoz van olyan x ∈ (x1, x2), hogy f(x) = c.

Szemléletesen annyit mond a tétel, hogy folytonos függvény intervallumot intervallumra képez (esetleg konstans). A
tételben szereplő tulajdonságot Darboux-tulajdonságnak nevezik, felfedezője után.

Példa. Szép alkalmazása Bolzano tételének annak bizonyítása, hogy minden valós együtthatós, páratlan fokú
polinomfüggvénynek létezik valós gyöke. Láttuk korábban, hogy egy páratlan fokú polinomfüggvénynek a +∞-ben
és a –∞-ben ellenkező előjelű végtelenek a határértékei, így szükségszerűen felvesz pozitív és negatív értékeket. Mivel
egy polinomfüggvény folytonos, Bolzano tétele miatt valahol felvesz zérust.

Korlátos és zárt intervallumon értelmezett folytonos függvények nagyon fontos tulajdonsága Weierstrass tétele:

Egy f : [a, b] → R folytonos függvénynek van maximuma és minimuma, azaz létezik olyan x1, x2 ∈ [a, b], hogy minden x
∈ [a, b] esetén f(x1) ≤ f(x) ≤ f(x2).

Összefűzve ezt Darboux tételével:

Korlátos és zárt intervallumon értelmezett folytonos függvény értékkészlete korlátos és zárt intervallum.

Megjegyzés. Az f(x) = x folytonos függvénynek a (0,1) nyílt intervallumon nincs sem maximuma, sem minimuma,
tehát a zártságra vonatkozó feltétel nem hagyható el.

Kölcsönösen egyértelmű folytonos függvények nevezetes tulajdonságát írja le a következő tétel.

Egy I intervallumon értelmezett folytonos és injektív f függvény szigorúan monoton, továbbá az f–1 inverz függvény is
folytonos és szigorúan monoton (ugyanolyan értelemben, mint f) az f(I) intervallumon.

Példa. Tekintsük a tangensfüggvényt! Ez folytonos, szigorúan monoton növő függvény. Az


értékkészlete R, ugyanis a függvény bal oldali határértéke -ben +∞, jobb oldali határértéke -ben –∞, így
Darboux tétele miatt R(tg) = R. Tehát az inverze, az árkusz tangens függvény az egész R-en értelmezett, folytonos,
szigorúan monoton növő függvény.

Egy H ⊆ R halmazon értelmezett függvény folytonossága azt jelenti, hogy minden egyes pontban teljesíti a „minden ϵ-
hoz van olyan δ” de níciót. Adott ϵ-hoz persze különböző pontok esetén más és más δ lesz jó általában. A következő
de níció azt fogalmazza meg, amikor nem ez a helyzet.

Legyen H ⊆ R számhalmaz, f : H → R függvény! Azt mondjuk, hogy f egyenletesen folytonos a H halmazon, ha ∀ ϵ > 0-
hoz ∃δ > 0, hogy ∀ x, y ∈ H esetén, melyekre |x – y| <δ, akkor |f(x) – f(y)| < ϵ teljesül.

Megjegyzés. Az egyenletes folytonosságból automatikusan következik a folytonosság.

Heine tétele:
Egy korlátos és zárt intervallumon folytonos függvény egyenletesen is folytonos.

16.5. Többváltozós analízis elemei

Az Rp tér alapfogalmai
Folytonosság és határérték

Az Rp tér alapfogalmai
Legyen p ≥ 1 természetes szám!
Emlékeztetünk az Rp térben használatos abszolút értékre, avagy vektor hosszára: ha x = (x1, …, xp) ∈ Rp, akkor legyen

Egy H ⊆ Rp halmazt korlátosnak nevezünk, ha létezik olyan r > 0 szám, hogy minden x ∈ H pontra |x| < r teljesül.

Legyen x ∈ Rp tetszőleges pont, és legyen ϵ > 0! Ekkor a B(x, ϵ) = {y ∈ Rp : |x – y| < ϵ} nyílt gömböt az x pont ϵ sugarú
környezetének nevezzük.

Legyen H ⊆ Rp tetszőleges halmaz! Egy x ∈ Rp pont a H halmaz belső pontja, ha létezik olyan ϵ > 0 szám, hogy B(x, ϵ) ⊆
H;
határpontja, ha minden ϵ > 0 esetén a B(x, ϵ) ∩H és B{x, ϵ) ∩Hc halmazok egyike sem üres;
torlódási pontja, ha minden ϵ > 0 számra teljesül, hogy az x ϵ sugarú környezete tartalmaz x-től különböző H-beli
pontot;
izolált pontja, ha létezik olyan ϵ > 0 szám, hogy B(x, ϵ) ∩H = {x}.

A belső pontok halmazára az int H, a torlódási pontok halmazára a H′ jelöléseket alkalmazzuk.

Egy H ⊆ Rp halmaz nyílt, ha minden pontja belső pont.


Egy F ⊆ Rp halmaz zárt, ha minden határpontját tartalmazza.
Az iménti de níciókból látható, hogy ha x belső pontja vagy izolált pontja a H halmaznak, akkor x ∈ H. Ha pedig
torlódási pont, akkor előfordulhat, hogy x benne van a halmazban, de az is lehet, hogy nincs, hasonlóan a p = 1 esethez.
Az Rp térben is érvényes a Bolzano–Weierstrass-tétel:

Bármely korlátos, végtelen halmaznak létezik torlódási pontja.

A valós számokéval analóg módon értelmezhető a sorozat de níciója is:

Egy, a természetes számok halmazán értelmezett, Rp-be képező a : N → Rp függvényt pontsorozatnak vagy
vektorsorozatnak, röviden sorozatnak nevezünk.

Az egyszerűbb írásmód kedvéért a(n) helyett egy sorozatra továbbra is az an indexes jelölést alkalmazzuk.

Megjegyzés. Egy an sorozatot meghatároznak a koordinátasorozatai, ugyanis egy sorozat (a1n, …, apn) alakú, ahol
minden 1 < j < p esetén ajn valós számsorozat.

Azt mondjuk, hogy az an sorozat határértéke, limesze az a ∈ Rp vektor, ha bármely ϵ > 0-hoz létezik olyan n0 ∈ N
küszöbindex, hogy tetszőleges n e N, n ≥ n0 esetén |an – a| < ϵ.

Jelölés: .

Azokat a sorozatokat, amelyeknek létezik határértéke, konvergensnek nevezzük.

Megjegyzés. Egy sorozatnak legfeljebb egy határértéke lehet.

Egy vektorsorozat pontosan akkor konvergens, ha minden koordinátasorozata konvergens, és határértéke azon
számokból álló vektor, melyekhez a koordinátasorozatok tartanak.

Vektorsorozatokra is fennállnak a határértékképzés és a műveletek közötti összefüggések:

Legyenek an és bn vektorsorozatok, c tetszőleges szám! Tegyük fel, hogy az an sorozat határértéke a, a bn sorozat
határértéke b, ahol a, b ∈ Rp. Ekkor n → +∞ esetén an + bn → a + b, és can → ca.

Folytonosság és határérték
A folytonosság és határérték fogalma szinte szó szerint átvihető tetszőleges f : Rp → Rq függvényre. Először a folytonosság
de níciója következik.

Legyen H ⊆ Rp egy nem üres halmaz! Legyen f : H → Rq egy tetszőleges függvény, x0 ∈ H! Azt mondjuk, hogy az f
függvény folytonos az x0 ∈ H pontban, ha bármely ϵ > 0-hoz létezik olyan δ > 0, hogy ha | x – x0| < δ, x ∈ H, akkor |f(x) –
f(x0)| < ϵ. Az f függvény folytonos a H halmazon, ha minden pontjában folytonos.

Igaz az átviteli elv is:

Egy f : H → Rq függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha bármely olyan x ∈ H sorozatra,
melyre fennáll, hogy .

Folytonos függvények jellemzése a következő állítás is.

Egy f : H → Rq függvény pontosan akkor folytonos a H halmaz egy x0 pontjában, ha minden f : H → R


koordinátafüggvénye folytonos x0-ban.

Példa. Legyen f : R2 → R2, f(x, y) = (x + y2, xy)! Ez folytonos függvény, hiszen a koordinátafüggvényei folytonosak.
Legyenek f : H → Rq és g : H → Rq tetszőleges függvények a közös H értelmezési tartományon, és legyen c ∈ R
tetszőleges valós szám! Tegyük fel, hogy f és g folytonosak az x0 ∈ H pontban. Ekkor az f + g, fg, cf függvények
mindegyike folytonos x0-ban.

Függvények kompozíciójának folytonosságáról magasabb dimenzióban is megállapíthatjuk:

Legyenek f : H → Rq és g : f(H) → Rl tetszőleges függvények! Tegyük fel, hogy f folytonos az x0 ∈ H pontban, g folytonos
az f(x0) ∈ f(H) pontban. Ekkor a (g ○ f) : H → Rl függvény folytonos x0 ∈ H-ban.

Egy γ : [a, b] → Rp folytonos függvényt útnak vagy paraméterezett görbének nevezünk. A γ(a) pontot a görbe
kezdőpontjának, a γ(b) pontot a görbe végpontjának nevezzük.

Tartománynak nevezünk minden olyan nyílt halmazt, amelynek bármely x, y pontjához létezik olyan folytonos út,
melynek kezdőpontja x, végpontja y.

Magasabb dimenzióban végtelenben vett határértékről nem beszélünk, végtelenről mint határértékről csak valósba
képező függvények esetén eshet szó.

Legyen H ⊆ Rp tetszőleges halmaz, f : H → Rq tetszőleges függvény, és legyen x0 ∈ R torlódási pontja a H halmaznak!


Azt mondjuk, hogy létezik xo-ban határértéke az f függvénynek, és ez az u ∈ Rq vektor, ha minden ϵ > 0-hoz létezik
olyan δ > 0, hogy ha |x – x0| < δ, x ∈ H, x ≠ x0, akkor |f(x) – u| < ϵ.
Jelölés: vagy .

A műveletek és határérték közötti kapcsolat itt is fennáll:

Legyenek f : H → Rq és g : H → Rq tetszőleges függvények a közös H értelmezési tartományon, legyen c ∈ R tetszőleges

valós szám! Legyen x0 ∈ H′, azaz torlódási pontja a H halmaznak! Tegyük fel, hogy létezik és
, ahol a, b ∈ Rq. Ekkor létezik
17. Di erenciálszámítás és alkalmazásai
17.1. Di erenciálható függvények
17.2. Nevezetes függvények deriváltja
17.3. Függvényműveletek és a deriválás kapcsolata
17.4. Di erenciálható függvények tulajdonságai
17.5. Di erenciálszámítás alkalmazása függvények viselkedésének leírására
17.6. Többváltozós függvények di erenciálása
17.7. Fizikai alkalmazások

17.1. Di erenciálható függvények

Di erenciálható függvény fogalma

Di erenciálható függvény fogalma


Legyen adva a koordináta-rendszerben egy függvény gra konja (görbéje), és vizsgáljuk meg, hogy adott pontjába hogyan
lehetne érintőt húzni! Mivel egy adott (x0, f(x0)) ponton át ismert meredekségű egyenest középiskolás ismereteink alapján
meg tudunk rajzolni, ezért a feladat az érintő meredekségének, azaz iránytangensének meghatározása. A függvény
gra konjának egy másik (x, f(x)) pontján is áthaladó szelő meredeksége

Hiszen ekkor m(x0, x) a szelő iránytangensével egyenlő, azaz (17.1. ábra).

17.1. ábra

Az m(x, x0) függvényt (mint x függvényét) f-nek – az x0 ponthoz tartozó – különbségi hányados vagy
di erenciahányados függvényének nevezzük.

Az érintő meredekségét (amennyiben egyáltalán létezik érintő) úgy kaphatjuk meg, hogy az x pontot közelítjük az x0

ponthoz, azaz (17.2. ábra).


17.2. ábra

Ez az okoskodás ad ötletet a következő de níció bevezetéséhez:

Legyen f : R → R függvény! Legyen x0 ∈ int D(f) az értelmezési tartomány egy belső pontja! Azt mondjuk, hogy f
di erenciálható (deriválható) az x0 pontban, ha létezik

A fenti határértéket az f függvény x0 pontbeli di erenciálhányadosának vagy deriváltjának mondjuk.

További lehetséges jelölések:

Nyilvánvaló módon de niálhatóak a féloldali deriváltak (di erenciálhányadosok). Például a jobb oldali deriválthoz
tegyük fel, hogy található ϵ > 0, hogy [x0, x0 + ϵ) ⊂ D(f), és legyen

A bal oldali di erenciálhányados ugyanilyen módon de niálható, ha található ϵ > 0, hogy(x0 – ϵ, x0] ⊂ D(f):

Ha f az x0 pontban jobbról és balról is di erenciálható, és , akkor f di erenciálható az x0 pontban, és


.

Viszont abból, hogy létezik a jobb oldali és a bal oldali derivált egy x0 pontban, még nem következik, hogy f ott
di erenciálható, ugyanis vegyük például az f(x) = |x| függvényt, aminek létezik a jobb oldali és a bal oldali deriváltja is x0 =
0-ban:

de nem létezik f′(x0), mert ha létezne, akkor egyenlő lenne a jobb és a bal oldali deriválttal is, ami nem lehetséges.

Megjegyzés. Szemléletesen látható, hogy az abszolútérték-függvény x0 = 0 pontban „megtörik” (nem sima), így nem
találhatunk megfelelő érintőt hozzá (17.3. ábra).

17.3. ábra
Az előző de níció segítségével adott f : R → R függvényhez készíthetünk egy új függvényt a következő módon. Ezt f
derivált függvényének nevezzük, és f′ jelöli,

Tehát az f′: R → R függvény minden olyan x0 ponthoz, amihez létezik di erenciálhányados, hozzárendeli az f függvény
x0-beli di erenciálhányadosát (deriváltját). Ha az f függvény egy I nyílt intervallum minden pontjában di erenciálható,
akkor azt mondjuk, hogy f az I intervallumon di erenciálható.

Megjegyzés. Azért tettük fel, hogy az f intervallum nyílt, mert ebben az esetben az intervallum minden pontja belső
pont, ami feltétele a pontbeli deriválhatóságnak. f = [a, b] intervallum esetén (vagyis ha I zárt), akkor ha azt
mondjuk, hogy I az I intervallumon di erenciálható, az azt jelenti, hogy a belső pontokban di erenciálható, és a-
ban és b-ben léteznek a megfelelő féloldali deriváltak.

Már ebben a fejezetben megemlítjük a di erenciálható függvények legfontosabb tulajdonságát:

Ha f di erenciálható x0 ∈ int I-ben, akkor ott folytonos is.

Az előző állítás evidens, hiszen ha f di erenciálható x0-ban, akkor

tehát átrendezve: , ami pontosan azt jelenti, hogy f x0-ban folytonos.

Megjegyzés. Kihasználtuk, hogy a szorzatfüggvény határértéke egy x0 pontban megegyezik a határértékek


szorzatával, és hogy x ≠ x0.

Meg kell említenünk, hogy az előző állítás nem megfordítható, hiszen ha f(x) = |x| és x0 = 0, akkor x0-ban f folytonos
(csakúgy, mint minden x ∈ R pontban), de ott nem di erenciálható, mert nem egyezik meg a jobb oldali és a bal oldali
derivált.

Megjegyzés. Megmutatható, hogy létezik (nagyon sok) mindenhol de niált folytonos függvény, amely értelmezési
tartományának egyetlen pontjában sem di erenciálható.

Még egy fogalommal meg kell ismerkednünk ebben a részben.

Azt mondjuk, hogy az f függvény az I intervallumon folytonosan di erenciálható, ha f az I intervallumon


di erenciálható, és az f′ derivált függvény az I intervallum minden pontjában folytonos.

17.2. Nevezetes függvények deriváltja

Konstans függvény
Lineáris függvény
Hatványfüggvény
Az

függvény deriváltja

Az
négyzetgyökfüggvény deriváltja

Konstans függvény

Emlékeztetünk arra, hogy konstans függvénynek nevezzük azt az f : R → R függvényt, amely minden x pontban
ugyanazt a c ∈ R számot veszi fel, azaz f(x) := c, ∀x ∈ R esetén.

Látható, hogy D(f) = R.


Számoljuk ki a fenti de níció segítségével f derivált függvényét! Vegyünk egy tetszőleges x0 ∈ D(f) pontot, ekkor

Megjegyzés. Kihasználtuk a konstans függvény határértékére vonatkozó tételt.

Tehát tetszőleges x0 ∈ D(f) pontra f′(x0) = 0, azaz f az értelmezési tartomány minden pontjában di erenciálható, így
ezekben a pontokban létezik az f′ derivált függvény:

Megjegyzés. Az előző fejezetben a di erenciálhányados fogalmának bevezetésekor utaltunk a derivált szemléletes


jelentésére is: az f függvény x0 ponthoz tartozó deriváltja a függvény gra konjának az (x0, f(x0)) ponthoz tartozó
érintőnek a meredeksége (iránytangense). (Persze pontosan akkor létezik az x0-beli derivált, amikor az érintő.) A
konstans függvény esetén nyilvánvaló, hogy bármely (x0, c) ponthoz húzott érintő meredeksége 0.

Lineáris függvény

Emlékeztetünk arra, hogy lineáris függvénynek (elsőfokú függvénynek) nevezzük azt az f : R → R függvényt, amelyre

Látható, hogy D(f) = R. Számoljuk ki f derivált függvényét!


Vegyünk egy tetszőleges x0 ∈ D(f) pontot, ekkor

x ≠ x0, így lehet egyszerűsíteni.


Tehát tetszőleges x0 ∈ D(f) pontra f′(x0) = a, azaz f az értelmezési tartomány minden pontjában di erenciálható, így
ezekben a pontokban létezik az f′ derivált függvény:

Megjegyzés. Azért tettük fel, hogy a ≠ 0, mert ha a = 0 lenne, akkor f(x) = b konstans függvény, és ezzel már
foglalkoztunk. Emellett a jelenti a lineáris függvény meredekségét, így látszik, hogy bármely (x0, ax0 + b) pontbeli
érintő meredeksége a lesz, és minden ponthoz húzható érintő.

Hatványfüggvény
Nézzük, mi lesz a f(x) = xn hatványfüggvény deriváltja, ahol n ≥ 1 és egész szám! Tetszőleges D(f) = R esetén
Ismert, hogy . Így

Megjegyzés. Kihasználtuk, hogy x ≠ x0, hogy folytonos függvény határértéke az x0 helyen megegyezik a helyettesítési
értékkel, és hogy a fenti összeg n tagú.

Mivel D(f) = R, így f minden pontban di erenciálható és f′(x) = nxn–1.

Az

függvény deriváltja
Vegyünk tetszőleges x0 ∈ D(f) pontot! (x0 ∈ R tetszőleges, csak 0 nem lehet.)

Tehát minden nem nulla x valós szám esetén létezik f′(x), és esetén.

Az
négyzetgyökfüggvény deriváltja
Tudjuk, hogy D(f) = [0, +∞). Nézzük tetszőleges x0 ∈ (0, +∞) belső pontra a di erenciálhányados de nícióját:

Az előbbi számításban használtuk a összefüggést, és hogy

. Vagyis ha x ∈ (0, +∞), akkor .

Általánosítva az eddigieket belátható, hogy ha n ∈ R és f(x) =xn, akkor az int D(f)-en f deriválható, és f′(x) = nxn–1.

A további nevezetes függvények derivált függvényeinek létezését nem bizonyítjuk, derivált függvényeiket csak
megadjuk. Az összes nevezetes függvény deriváltját táblázatba foglalva közöljük:

D(f) és D(f′) f(x) f′(x)

R c (c ∈ R) 0

x ∈ R, de x ≠ 0 xn(n ∈ Z) nxn–1

(0, +∞) xα(α ∈ R) α · xα–1

R ex ex

(0, +∞) ln x

R ax, a ∈ (0, +∞) ax · ln a


(0, +∞) loga x (a ∈ R+, de a ≠ 1)

R sin x cos x

R cos x –sin x

tg x

x e R, de x ≠ kπ (k ∈ Z) ctg x

D(f) = [–1, 1]
arcsin x
D(f′) = (–1, 1)

D(f) = [–1, 1]
arccos x
D(f′) = (–1, 1)

R arctg x

R arcctg x

R sh x ch x

R ch x sh x

R th x

R, de x ≠ 0 cth x

R arsh x

D(f) = [1,+∞)
arch x
D(f′)= (1, +∞)

(–1, 1) arth x

(–∞, –1) ∪ (1, +∞) arcth x

Megjegyzés. Az xn (n ∈ Z) függvényeknél az értelmezési tartomány ha n pozitív egész, akkor a valós számok halmaza,
ha n negatív egész, akkor kell a x ≠ 0 feltétel. Az értelmezési tartomány megadásánál így a szűkebb értelmezési
tartományú esetet adjuk meg, így nem vétünk hibát. Ugyanígy járunk el az xα (α ∈ R) függvényeknél.

Emlékeztetünk, hogy az arcsin x függvény a sin x inverz függvénye, azaz arcsin(sin x) = x, ugyanígy arccos x a cos x a
inverz függvénye stb., a hiperbolikus függvények de níciója:

az arsh x függvény a sh x inverz függvénye stb.

17.3. Függvényműveletek és a deriválás kapcsolata


A következőkben a műveleti azonosságokat fogjuk vizsgálni.

Tekintsük a következő egyszerű példát!


Legyen f(x) = g(x) = x, ekkor f′(x) = g′(x) = 1, (f · g)(x) = x2, (f · g)′(x) = 2x, azaz 2x = (f · g)′(x) ≠ f′(x) · g′(x) = 1.
Tehát, ebben az esetben, bár a szorzatfüggvény deriválható, kiszámítása nem egyszerűen a deriváltak szorzata.

Nézzük akkor meg, hogy mik a pontos összefüggések a függvényműveletek és a di erenciálhatóság között.

Összegfüggvény, kivonásfüggvény, konstansszoros, szorzat- és hányadosfüggvény


Összetett függvény
Inverz függvény di erenciálhatósága

Összegfüggvény, kivonásfüggvény, konstansszoros, szorzat- és


hányadosfüggvény

Legyenek f : R → R, g : R → R függvények! Legyen I ⊂ D(f), I ⊂ D(g) intervallum, x0 ∈ int I belső pont, melyben legyen f
és g di erenciálható.
Ekkor f +g, f – g, α · f (a ∈ R), f · g, és ha g(x0) ≠ 0, akkor di erenciálható x0-ban és

Tehát az összeg-, a kivonásfüggvény és a konstansszoros függvény deriválására egyszerű szabályok vonatkoznak. Ezek
az összefüggések a di erenciálhányados fogalmának segítségével könnyedén ellenőrizhetők:

A kivonásfüggvényre vonatkozó állítás hasonlóan látható be.


Most nézzük a konstansszoros függvény deriválási szabályát:

Megjegyzés. A di erenciálhatóság de nícióján kívül az összegfüggvény és a konstansszoros függvény határértékére


vonatkozó összefüggést használtuk.
Példák
1. Alkalmazzuk a tanult szabályt az f(x) = x2 + ex függvény deriváltjának kiszámítására! Legyen g(x) := x2 és h(x) := ex!
Ekkor f(x) = g(x) + h(x), így f′(x) = g′(x) + h′(x). Mivel g′(x) = 2x és h′(x) = ex, ezért f′(x) =2x + ex.
2. Adjuk meg általánosan az n-edfokú polinom derivált függvényét, azaz deriváljuk az

Az összegfüggvény deriválási szabályát n-szer használva:

Majd az ai konstansokat kiemelve i = 0-tól (n–1)-ig:

végül alkalmaztuk, hogy a xk hatványfüggvény deriváltja kxk–1, k = 0-tól n-ig.


3. Ha f(x) = 5 sin x cos x, akkor mi lesz f′(x)?
Legyen g(x) := sin x, h(x) := cos x, és tudjuk, hogy g′(x) := cos x, h′(x) := –sin x.
Ekkor
4.
Bizonyítsuk be, hogy f(x) = tg x esetén

Felhasználhatjuk a hányadosfüggvény deriválási szabályát, hiszen .

Így .
5. Deriváljuk le a f(x) = tg2 x függvényt!
f(x) = tg x ·tg x

6.
Deriváljuk az függvényt!

Itt , ahol g(x) = 1, h(x) = és g''(x) = 0 . A hányadosfüggvény deriválási szabálya


alapján

Megjegyzés. Ezt a példát úgy is megoldhatjuk, hogy észrevesszük: . Így .

Összetett függvény
Emlékeztetünk az összetett függvény fogalmára:

Legyenek f : R → R, g : R → R függvények! Ekkor az (f ◦ g) függvényt az f és g függvény által alkotott összetett


függvénynek vagy kompozíciófüggvénynek nevezzük, és

(f ◦ g) esetén az f függvényt külső, míg a g függvényt belső függvénynek hívjuk.

Példa. Legyen f(x) := cos x és g(x) := 2x2 + 1! D(f) = D(g) = R, ekkor D(f ◦ g) = D(g ◦ f) = R, így de niálhatjuk e függvények
kompozícióját. Ekkor (f ◦ g) (x) = f(g(x)) = cos (2x2 + 1), ahol g a belső és f a külső függvény. Másrészt (g ◦ f)(x) = g(f(x)) =
2cos2 x + 1, ahol pedig f a belső és g a külső függvény.

Megjegyzés. Felhívjuk a gyelmet, hogy bizonyos függvények nem komponálhatók egymással. Például vegyük a
és g(x) := –|x|–1 függvényeket! D(f) = [0, +∞) és R(g) = (–∞, –1], így {x ∈ D(g) : g(x) ∈ D(f)} = ø, tehát D(f ○ g) =
ø, vagyis e két függvény nem alkothat összetett függvényt, mert a belőlük alkotott kompozíciófüggvény sehol sem
értelmezhető.

Legyenek f : R → R, g : R → R függvények! Legyen I ⊂ D(f), J ⊂ D(g), ahol I és J intervallumok, g(J) := R(g) ⊂ I, x 0 ∈ J


belső pont, di erenciálható x0-ban, f di erenciálható g(x0) pontban. Ekkor (f ◦ g) di erenciálható x0-ban, és (f ◦ g)′(x0) =
f′(g(x0)) · g′(x0).

Példák
1. Legyen f(x) := sin x és g(x) := x3 + 3, ekkor (f ◦ g)(x) = sin(x3 + 3) és D(f ◦ g) = R. (f ◦ g) ′(x) = f′(g(x)) · g′(x) = cos (x3 + 3) ·
3x2 és D((f ◦ g)′) = R, mert f és g is mindenütt di erenciálható, és persze f és g is egész R-en értelmezve volt, így
beszélhettünk f és g kompozíciójáról.
2. Deriváljuk az függvényt!
Vegyük észre, hogy ez egy összetett függvény: f(x) := (g ◦ h)(x), ahol g(x) := ex és h(x) := x2. Ezek után csak
alkalmaznunk kell az összetett függvény deriválási szabályát: .
3. Deriváljuk az függvényt!
Itt is kompozíciófüggvénnyel állunk szemben: f(x) := (g ◦ h)(x), ahol g(x) := x2 és h(x):= ex. Alkalmazzuk az összetett
függvény deriválási szabályát: .
4. Deriváljuk a f(x) =cos3 (x + 1) függvényt!
Észre kell vennünk, hogy ez egy többszörösen összetett függvény: f(x) := h(g(k(x))), ahol h(x) := x3, g(x) := cos x,
k(x) := x + 1. Ezt a következő módon deriváljuk, többször alkalmazva a kompozíciófüggvényre vonatkozó szabályt:
f(x) = (h ◦ (g ◦ k)) ′(x) = h′((g ◦ k)(x)) · (g ◦ k) ′(x) = h′((g ◦ k)(x)) · (g′(k(x))) · k′(x) = 3cos2 (x + 1) · (–sin(x + 1)) · 1.

Inverz függvény di erenciálhatósága


Emlékezzünk vissza az inverz függvény de níciójára:

Legyen f : R → R bijektív függvény. Ekkor az f–1: R →R függvényt az f inverz függvényének nevezzük, ha (f ◦ f–1)(x) = x és
(f–1 ◦ f)(x) = x.

Legyen f : R → R és legyen I ⊂ D(f) intervallum, f legyen szigorúan monoton I-n. Legyen továbbá x0 ∈ int I, és tegyük
fel, hogy f di erenciálható az x0 pontban, és f′(x0) ≠ 0. Ekkor f–1 di erenciálható az η = f(x0) pontban, és

Megjegyzés. f szigorú monotonitása f–1 létezéséhez elégséges feltétel. Így biztosítjuk, hogy az állításban lévő f–1
létezzen.

Példa. Bizonyítsuk be, hogy f(x) = ln x deriváltja


Vegyük észre, hogy f(x) inverz függvénye g(x) = ex, hiszen (f ◦ g)(x) = ln ex = x és (g ◦ f)(x) = eln x = x, azaz mindkét
kompozíciófüggvény az identitás, azaz f és g egymás inverzei, tehát f(x) =g–1(x).

Így .

17.4. Di erenciálható függvények tulajdonságai

Többszörösen di erenciálható függvények


Középértéktételek, l'Hospital-szabály

Többszörösen di erenciálható függvények

Azt mondjuk, hogy egy f : R → R függvény kétszer di erenciálható egy x0 ∈ int I pontban (I ⊂ D(f)), ha létezik f′ (f
derivált függvénye) az x0 pont egy környezetében, és f′ di erenciálható x0-ban.

Ha f egy nyílt I intervallum minden pontjában di erenciálható, akkor I-n létezik f′, azaz I ⊂ D(f′). Ha f′ az I
intervallumon di erenciálható, azaz (f′)′ létezik I-n, akkor azt mondjuk, hogy f kétszer di erenciálható I-n. Ezt a (f′)′
függvényt f második derivált függvényének nevezzük, és f ˝-vel jelöljük. Azaz f ˝(x) := (f′) ′(x).
Ugyanilyen módon határozhatjuk meg egy I intervallumon háromszor di erenciálható függvény fogalmát: f′˝(x) := ((f′)
′)′(x) (ha a deriválások elvégezhetőek).

Meghatározhatjuk az n-szer di erenciálható függvény fogalmát is, és azt f(n)(x)-szel jelöljük:

Még egy jelölést használunk: f(0)(x) := f(x), azaz f 0-dik derivált függvényének az f függvényt hívjuk.

Azt mondjuk, hogy az f függvény az I intervallumon n-szer folytonosan di erenciálható, ha f az I intervallumon n-


szer di erenciálható, és az f(n) n-edik derivált függvény az I intervallum minden pontjában folytonos. Az I
intervallumon n-szer folytonosan di erenciálható függvények halmazát Cn(I)-vel jelöljük, azaz ha f n-szer
folytonosan di erenciálható I-n, akkor f ∈ Cn (I).

Megjegyzés. Ha f függvény az I intevallumon n-szer folytonosan di erenciálható, akkor k = 0, …, n–1 esetén az f(k)
derivált függvény természetesen folytonos, hiszen deriválható.
Egy f : R → R függvényt egy I ⊂ D(f) intervallumon végtelen sokszor di erenciálhatónak mondunk, ha ∀n ∈ N
esetén f n-szer di erenciálható I-n. Jele: f ∈ C∞(I).
Példa végtelen sokszor di erenciálható függvényre:
1. n-edfokú polinomfüggvény: f(x) = xn + an–1xn–1+ … + a2x2 + a1x + a0
f′(x) = nxn–1 + an–1(n – 1)xn–2 + … + a22x + a1.
Tehát f′ is polinomfüggvény, csak már (n – 1)-edfokú, így ez is deriválható:
f ˝(x) := (f′)′(x) = n(n –1)xn–2 + … + 2a2,
f ˝ is polinomfüggvény, így tovább deriválható, és az eredménye is polinomfüggvény lesz, ami megint deriválható,
így végtelen sokszor deriválható lesz.
f(n)(x) = n(n – 1)(n – 2) ·…· 2 · 1, és mivel ez konstans, ezért
f(n + 1)(x) = 0 és ∀k ≥ n + 1 és egész szám esetén f(k)(x) = 0.
2. Az exponenciális függvény: f(x) = ex,
f′(x) = ex, és látható, hogy f(n)(x) = ex ∀n ∈ N esetén.
3. A trigonometrikus függvények:
például: f(x) = sin x, f′(x) = cos x, f ˝(x) = (f′) ′(x) = – sin x, f(3)(x) = (f ˝) ′(x) = cos x, f(4)(x) = (f3) ′(x) = sin x, f(5)(x) = cos x és
így tovább.
4.
Az racionális törtfüggvények is végtelen sokszor di erenciálhatók.

Középértéktételek, l'Hospital-szabály
Először a középértéktételeket vázoljuk.

Rolle tétele:
Legyen f : R → R és [a, b] ⊂ D(f), f folytonos [a, b]-n, f di erenciálható az (a, b) intervallumban (a ≠ b), és legyen f(a) =
f(b). Ekkor található olyan x0 ∈ (a, b), melyre f′(x0) = 0.

Első hallásra ez az állítás bonyolultan hangzik, de a 17.4. ábra rávilágít a szemléletes jelentésére.

17.4. ábra

Megjegyzés. Tehát az állítás azt mondja ki, hogy ha egy di erenciálható függvény két különböző pontban ugyanazt a
függvényértéket veszi fel, akkor a két pont között található egy olyan harmadik köztük lévő pont, amiben a derivált
0, azaz az érintő vízszintes.

Nézzünk egy, az előbbihez nagyon hasonló állítást:

Lagrange-középértéktétel:
Legyen f: R → R és [a, b] ⊂ D(f), f folytonos [a, b]-n, f di erenciálható az (a, b) intervallumban (a ≠ b). Ekkor található
olyan x0 ∈ (a, b), hogy
Megjegyzés. Tehát a tétel azt mondja ki, hogy bármely, intervallumon di erenciálható függvény esetén található egy
olyan pont az intervallum belsejében, amiben a derivált meredeksége megegyezik a gra kon végpontjait összekötő
szakasz meredekségével (17.5. ábra).

17.5. ábra

Cauchy-féle középértéktétel:
Legyen f: R → R, g: R → R, [a, b] ⊂ D(f) és [a, b] ( D(g), f és g folytonos [a, b]-n, f és g is di erenciálható az (a, b)
intervallumban (a ≠ b), és tegyük fel, hogy g′(x) ≠ 0, ∀x ∈ (a, b) esetén. Ekkor létezik x0 ∈ (a, b), hogy

Darboux-tétel:
Legyen I nyílt intervallum, f : R → R, di erenciálható I-n.
Ekkor ∀[a, b] ⊂I intervallumra és ∀d ∈ R számra, melyre f′(a) < d < f′(b) vagy f′(b) < d < f′(a) teljesül, létezik olyan c ∈ (a,
b), hogy f′(c) = d.

Megjegyezzük, hogy egy g : R → R függvényt, melyre I ⊂ D(g), Darboux-tulajdonságúnak nevezünk, ha ∀[a, b] ⊂I


intervallumra és ∀d ∈ R számra, melyre g(a) < d < g(b) vagy g(b) < d < g(a) teljesül, létezik olyan c ∈ (a, b), hogy g(c) = d.

A Darboux-tétel pontosan azt mondja ki, hogy minden f deriválható függvény f′ derivált függvénye Darboux-
tulajdonságú.

Megjegyzés. Minden intervallumon értelmezett folytonos függvény Darboux-tulajdonságú (ez a Bolzano-tétel), de


létezik olyan Darboux-tulajdonságú függvény, ami nem folytonos. Példával nem szolgálunk, mert az túlságosan
bonyolult lenne.

Nehezebb határérték-számítások is elvégezhetők a deriváltak segítségével, ehhez csak a következő szabályt kell
ismernünk:

l’Hospital-szabály:
Legyen f : R → R, g : R → R, és I ⊂ D⊂f) és I ( D(g) I nyílt intervallum, f és g di erenciálható I-n, x0 vagy eleme, vagy
végpontja az I intervallumnak, akár + ∞ vagy – ∞ is lehet, és g′(x) ≠ 0, ∀x ∈ I, x ≠ x0 esetén. Tegyük fel, hogy

Ha létezik

akkor létezik .
Ugyanez igaz akkor is, ha az x0 pontban f és g a 0 helyett +∞-hez vagy –∞-hez tart (nem szükséges, hogy azonos előjelű
végtelen legyen a két függvény határértéke).
Ennek az állításnak a segítségével például vagy típusú határértékek válnak kiszámíthatóvá, amik
meghatározása eddig lehetetlennek tűnt.

Példa a l’Hospital-szabály alkalmazására:

f(x) = eax és g(x) = x di erenciálható, és (tehát ez egy típusú határérték), és

, tehát -nek van R̄-beli határértéke +∞-ben, így:

.
Példa olyan határérték kiszámítására, mely esetén a l’Hospital-szabály nem alkalmazható: Legyen f(x) = ex + e–x és

g(x) = ex – e–x di erenciálható függvények! Ekkor , de a határérték

kiszámítására a l’Hospital-szabály nem használható, hiszen határértéke típusú (és hasonló lesz a

további deriváltak hányadosa is), viszont egy csellel mégis kiszámolható :

17.5. Di erenciálszámítás alkalmazása függvények viselkedésének leírására

Érintő egyenletének megadása


Monotonitásvizsgálat
Szélsőérték-számítás
Konvexitásvizsgálat
In exiós pont
Függvényvizsgálat

Érintő egyenletének megadása


Már említettük, hogy pontosan akkor van az f : R → R függvény gra konjának a (x0, f(x0)) pontban érintője, ha f az x0
pontban di erenciálható, és ekkor az érintő meredeksége f′(x0).
Vajon az érintő egyenlete hogyan adható meg? Vegyünk egy x0-hoz nagyon közeli x pontot, jelöljük a „nagyon

közelséget” így: x0 ≈ x. Ekkor a derivált de níciója alapján: , vagyis f(x) – f(x0) ≈ f′(x0)(x – x0), azaz
f(x) ≈ f′(x0)(x – x0) + f(x0).
Ez azt jelenti, hogy ha x nagyon közel van x0-hoz, akkor az f(x) közel van a f′(x0) (x – x0) + f(x0) értékhez. Tehát az x0-hoz
közeli pontokban a függvényérték a e(x): = f′(x0)(x – x0) + f(x0) lineáris függvény helyettesítési értékével közelíthető. A
lineáris függvény gra konja pedig pontosan az (x0, f(x0)) pontba húzott érintő egyenlete.

Tehát az érintő egyenlete: y = f′(x0)(x – x0) + f(x0).

Példa. Adjuk meg az f(x) = x2 – 3x függvény gra konjának érintőjét az x0 = 2 helyen! f′(x) = 2x – 3, és x0-t
behelyettesítve f′(x0) = f′(2) = 1 és f(x0) = f(2) = –2. Az érintő egyenlete: y = 1(x – 2) – 2, azazy = x – 4 (17.6. ábra).
17.6. ábra

Monotonitásvizsgálat
Emlékeztetünk a monotonitás de níciójára:

Az f : R → R függvényt egy I intervallumon monoton növőnek nevezünk, ha ∀x1, x2 ∈ I, x1 < x2 esetén f(x1) ≤ f(x2). f
szigorúan monoton növő, ha ilyen x1 és x2 esetén f(x1) < f(x2).
Az f : R → R függvényt egy I intervallumon monoton fogyónak nevezünk, ha ∀x1, x2 ∈ I, x1 < x2 esetén f(x1) ≥ f(x2). f
szigorúan monoton fogyó, ha ilyen x1 és x2 esetén f(x1) > f(x2).

Az f függvény derivált függvényének segítségével következtethetünk f monoton növőségére vagy fogyására egy I
intervallumon.

A monotonitás elégséges feltétele:


Legyen f : R → R, és legyen I ⊂D(f) intervallum, f folytonos és di erenciálható int I-ben. Ha ∀x ∈ int I pontban
f′(x) ≥ 0, akkor f monoton nő az I intervallumon;
f′(x) > 0, akkor f szigorúan monoton nő az I intervallumon;
f′(x) ≤ 0, akkor f monoton csökken az I intervallumon;
f′(x) < 0, akkor f szigorúan monoton csökken az I intervallumon.

Ez az állítás könnyen belátható. Vizsgáljuk például az első esetet, a többi hasonlóan történhet. Tegyük fel, hogy ∀x ∈
int I pontban f′(x) ≥ 0, és legyen tetszőleges x, y ∈ I, olyan, hogy x < y. A Lagrange-középértéktétel szerint található x0 ∈ (x,
y) ⊂ I, hogy f(y) – f(x) = f′(x0)(y – x) ≥ 0, tehát f(y) ≥ f(x).
Tehát ha x < y, akkor f(x) ≤ f(y), azaz monoton növő I-ben.

A monotonitás szükséges feltétele:


Legyen f : R → R, és legyen I ⊂ D(f) intervallum, f folytonos és di erenciálható int I-ben. Ha
f monoton növő az I intervallumon, akkor f′(x) ≥ 0, ∀x ∈ int I pontban,
f monoton csökken az I intervallumon, akkor f′(x) ≤ 0, ∀x ∈ int I pontban.

Gondoljuk meg, hogy miért teljesül ez a feltétel.


Nézzük csupán az első esetet, hiszen a második is ugyanúgy bizonyítható. Tegyük tehát fel, hogy f monoton nő az I
intervallumon. Vegyünk egy tetszőleges x0 ∈ int I pontot és egy x ∈ int I pontot úgy, hogy x0 ≠ x teljesüljön!
Ha x0 ≠ x, akkor x0 > x vagy x0 < x, és f monoton növősége miatt első esetben f(x0) ≥ f(x), második esetben f(x0) ≤ f(x), így
az x0-beli di erenciahányados:

így , mert nem negatív függvény határértéke csak nem negatív lehet.
Mivel x0 ∈ int I tetszőleges volt, így minden x0 ∈ int I pontra f′(x0) ≥ 0.

Megjegyzés. Gondoljunk bele, hogy ha f egy I intervallumon szigorúan monoton nő, akkor abból nem következik,
hogy f′(x) > 0 minden pontjában az intervallumnak. Vegyük ugyanis a f(x) = x3 függvényt, ami szigorúan monoton nő
∀x ∈ R esetén (17.7. ábra), de f′(x) = 3x2 és f′(0) = 0, azaz van olyan x0 ∈ R, hogy f(x0) > 0 nem teljesül. Vagyis a szigorú
monotonitásból nem következtethetünk f′ szigorú pozitivitására, illetve negativitására.

17.7. ábra

Példák
1. Nézzük meg, hogy az f(x) = –x2 – 2x + 3 függvény mely intervallumokon nő, illetve csökken! Erre a kérdésre a
derivált függvény adja meg a választ: f′(x) = –2x – 2.
Vizsgáljuk meg, mely intervallumokon lesz pozitív f′:

Tehát, f′(x) pontosan akkor nem negatív, ha x ≤ –1. Azaz ha x ≤ –1, akkor f monoton növő. Sőt, ha x < –1, akkor f
szigorúan monoton növő. Másrészről f′(x) pontosan akkor nem pozitív, ha x ≥ –1. Azaz ha x ≥ –1, akkor f monoton
csökken, és ha x > –1, akkor f szigorúan monoton csökken (17.8. ábra).

17.8. ábra

2. Vizsgáljuk meg az f(x) = x3 – 4,5x2 + 6x függvényt monotonitás szempontjából! f′(x) = 3x2 – 9x + 6. Nézzük f′(x) mely
x-ekre lesz pozitív, azaz 3x2 – 9x + 6 ≥ 0 mikor teljesül?

Tehát x1 = 2 és x2 = 1, vagyis 3x2 – 9x + 6 = 3(x – 2)(x – 1). Azaz, keressük azon x-eket, melyekre 3(x – 2)(x – 1) ≥ 0!
Az előzőkből következik, hogy f′(x) pontosan akkor lesz nem negatív, ha x ≥ 2 vagy x ≤ 1, és f′(x) pontosan akkor
lesz nem pozitív, ha 1 ≤ x ≤ 2. Tehát ha x ≥ 2 vagy x ≤ 1, akkor f monoton növő (és ha x > 2 vagy x < 1, akkor f
szigorúan monoton növő). Ha 1 ≤ x ≤ 2, akkor f monoton csökken (és ha 1 < x < 2, akkor f szigorúan monoton növő)
(17.9. ábra).
17.9. ábra

3. Adjuk meg, hogy mely intervallumokon szigorúan monoton csökken f(x) = sin2x! Az a kérdés, hogy f′(x) < 0 mikor
teljesül. f′(x) = 2 sin x cos x és 2 sin x cos x < 0 ⇔ sin x cos x < 0.
Ez pontosan akkor teljesül, ha sin x negatív és cos x pozitív (1. eset), vagy ha sin x pozitív és cos x negatív (2. eset).
Tudjuk, hogy

1.
esetben sin x < 0 és .
2.
esetben sin x > 0 és .
Tehát ezeken az intervallumokon lesz f(x) = sin2 x szigorúan monoton fogyó (17.10. ábra).

17.10. ábra

Szélsőérték-számítás

Tekintsük az f : R → R függvényt!
Az x0 ∈ D(f) pont lokális maximumhely, ha található ϵ > 0, hogy (x0 – ϵ, x0 + ϵ) ⊂ D(f), és bármely x ∈ (x0 – ϵ, x0 + ϵ) esetén
f(x) ≤ f(x0).
Az x0 ∈ D(f) pont lokális minimumhely, ha található ϵ > 0, hogy (x0 – ϵ, x0 + ϵ) ⊂ D(f), és bármely x ∈ (x0 – ϵ, x0 + ϵ) esetén
f(x) ≥ f(x0).
Ha az x0 ∈ D(f) pont lokális minimumhely vagy lokális maximumhely, akkor azt mondjuk, hogy x0 lokális
szélsőértékhely.

Ha egy x0 ∈ D(f) pontra f(x) ≤ f(x0) teljesül bármely x ∈ D(f) esetén, akkor x0 abszolút minimumhely, és f(x0) érték az f
függvény minimuma.
Ha egy x0 ∈ D(f) pontra f(x) ≥ f(x0) teljesül bármely x ∈ D(f) esetén, akkor x0 abszolút maximumhely, és f(x0) érték az f
függvény maximuma.
Látható, hogy ha x0 abszolút minimumhely, akkor x0 lokális minimumhely is. De ha x0 lokális minimumhely, akkor
abból nem következik, hogy x0 abszolút minimumhely is. De csak az a pont lehet abszolút minimumhely, ami lokális
minimumhely is. (Ugyanez teljesül a maximumhelyre is.)

Szélsőérték szükséges feltétele:


Legyen f : R → R, I ⊂ D(f) intervallum, x0 ∈ int I belső pont, és legyen f di erenciálható x0-ban.
Ha x0 ∈ int I lokális maximumhely, akkor f′(x0) = 0.
Hasonlóan, ha x0 ∈ int I lokális minimumhely, akkor f′(x0) = 0.

Ez az állítás könnyedén bebizonyítható, például ha x0 ∈ int I lokális maximumhely.


Használjuk, hogy

Ha x > x0, akkor .

Ha x < x0, akkor


Mivel f di erenciálható x0-ban, ezért f′ (x0) = f′+ (x0) = f′− (x0), Így f′+ (x0) = f′− (x0) = 0 lehet csak. Így f′(x0) = 0.

Megjegyzés. Fontos az a feltétel is, hogy x0 ∈ int I ⊂ D(f), hiszen ha f(x) = x2, D(f) = [1, 2], (vagyis f(x) = x2 | [1, 2]), akkor
x0 = 1 minimumhely, x0 = 2 maximumhely (de x0 egyik esetben sem belső pontja az értelmezési tartománynak),
viszont f′(1) = f′+(1) = 2 ≠ 0 és f′(2) = f′−(2) = 4 ≠ 0 (17.11. ábra).

17.11. ábra

Abból hogy egy pontban a derivált 0, még nem következik, hogy a pont lokális szélsőértékhely, például nézzük az f(x) =
x3 függvényt az x0 = 0 pontban! f′(x) = 3x2, f′(0) = 0, viszont x0 = 0 nem lokális szélsőértékhely, hiszen f szigorúan monoton
nő (17.7. ábra). Ezért kell pontosan megvizsgálnunk, hogy milyen feltételek mellett következtethetünk arra, hogy x0 lokális
szélsőértékhely.

Szélsőérték elégséges feltétele:


Legyen f : R → R, I ⊂ D(f) intervallum, x0 ∈ int I belső pont, és legyen f di erenciálható int I-ben, x0 ∈ int I, és legyen f′
(x0) = 0! Az f függvénynek az x0 pont lokális maximumhelye, ha található ϵ > 0, hogy
∀x ∈ (x0 – ϵ, x0) esetén f′(x) ≥ 0 és
∀x ∈ (x0, x0 + ϵ) esetén f′(x) ≤ 0.
Az f függvénynek az x0 pont lokális minimumhelye, ha található ϵ > 0, hogy
∀x ∈ (x0 – ϵ, x0) esetén f′(x) ≤ 0, és
∀x ∈ (x0, x0 + e) esetén f′(x) ≥ 0.

Azaz egy f di erenciálható függvénynek egy x0 ∈ int I ⊂ D(f) pontban lokális szélsőértékhelye van, ha f′(x0) = 0, és f′ az
x0 pontban előjelet vált. (Sőt, az is megmutatható, hogy ha f′ egy x0 pontban nem vált előjelet, akkor ott nincs szélsőérték.)
Ha f′(x0) = 0, és f″(x0) ≠ 0, akkor belátható, hogy f′ az x0 pontban előjelet vált. (Ez visszafelé nem igaz, pl. ha f′(x) = x3,
akkor f a nullában előjelet vált, de f″(0) ≠ 0.)
így az is igaz, hogy

ha f′(x0) = 0, és f″(x0) ≠ 0, akkor x0 lokális szélsőértékhely;


ha f′(x0) = 0, és f″(x0) < 0, akkor x0 lokális maximumhely;
ha f′(x0) = 0, és f″(x0) > 0, akkor x0 lokális minimumhely.

Megjegyezzük, hogy ha f′(x0) = 0, és f″(x0) = 0, abból nem következik feltétlenül, hogy f-nek x0-ban nincs lokális
szélsőértékhelye (pl. , aminek nullában minimuma van, de f′(0) = 0, és f″(0) = 0). Ebben az esetben
folytatnunk kell a vizsgálódást a szélsőérték elégséges feltételét ellenőrizve. Másképp megfogalmazva az elégséges feltétel a
következő.

Ha egy f függvény di erenciálható I intervallumon, és egy x0 ∈ int I ⊂ D(f) pontban f′(x0) = 0, és található ϵ < 0, hogy f
monoton növő az (x0 – ϵ, x0) intervallumon, és f monoton fogyó az (x0, x0 + ϵ) intervallumon, akkor f-nek x0-ban lokális
maximumhelye van.
Ugyanígy, ha egy f függvény di erenciálható I intervallumon, és egy x0 ∈ int I ⊂ D(f) pontban f′(x0) = 0, és található ϵ >
0, hogy f monoton fogyó az (x0– ϵ, x0) intervallumon, és f monoton növő az (x0, x0 + ϵ) intervallumon, akkor f-nek x0-
ban lokális minimumhelye van.

Az előző részben a monotonitásra vonatkozó állítások segítségével könnyedén igazolható, hogy ez az átfogalmazás
valóban ugyanazt mondja ki, mint a fenti állítás. Viszont ez az átfogalmazott állítás láthatóan teljesül: ha egy függvény
monoton nő, „majd” monoton fogy, akkor természetesen maximumhelye lesz a monoton növő és a monoton fogyó „részek
között” (17.12. ábra).

17.12. ábra

Példa. Állapítsuk meg, hogy az függvénynek hol van abszolút minimumhelye és abszolút
maximumhelye!
Ehhez f′-at kell vizsgálnunk: f′(x) = 4x3 + 4x2 – 8x = 4x(x2 + x – 2).
Kérdés, hogy f′ mikor 0? f′(x) = 4x(x2 + x – 2) = 0.
Látható, hogy x0 = 0 esetén f′(x0) = 0.
Még vizsgáljuk meg, hogy mik az x2 + x – 2 = 0 egyenlet gyökei!

így x1 = 1 és x2 = –2.

Tehát f′(x0) = f(x1) = f′(x2) = 0. x0, x1 és x2 lehet, hogy szélsőértékhely, de ehhez még az is kell, hogy például f″(x0) ≠ 0. Ha
ez teljesülne, akkor x0 szélsőértékhely lenne. Nézzük, mi az f második derivált függvénye: f″(x) = 12x2 + 8x – 8.
f″(x0) = f″(0) = –8 < 0, tehát a szélsőértékhelyről szóló állítás szerint x0 = 0 lokális maximumhely, és az x0-hoz tartozó
függvényérték: f(x0) = f(0) = 0.
f″(x1) = f″(1) = 12 · 12 + 8 · 1 – 8 = 12 > 0, tehát x1 = 1 lokális minimumhely, és az x1-hez tartozó függvényérték:

.
f″(x1) = f″(–2) = 12 · (–2)2 + 8 · (–2) – 8 = 24 > 0, tehát x2 = –2 lokális minimumhely, és az x2-höz tartozó függvényérték:

Megmutatható, hogy f′ ≤ 0, ha x ∈ (–∞, –2) vagy ha x ∈ (0, 1), tehát f ezeken az intervallumokon monoton fogyó, és f′ ≥
0, ha x ∈ (–2, 0) vagy ha x ∈ (1, +∞), tehát f ezeken az intervallumokon monoton növő (17.13. ábra). Az ábra alapján
látható, hogy x0 = 0 csak lokális maximumhely, míg x2 = –2 abszolút minimumhely.
17.13. ábra

Konvexitásvizsgálat

Azt mondjuk, hogy az f : R → R függvény konvex az I intervallumban, ha ∀x1, x2 ∈ I esetén és ∀α1, α2 ≥ 0, α1 + a2 = 1


számok mellett f(α1x1 + α2x2) ≤ α1f(x1) + α2f(x2).
Azt mondjuk, hogy az f : R → R függvény konkáv az I intervallumban, ha ∀x1, x2 ∈ I esetén és ∀α1, α2 ≥ 0, α1 + α2 = 1
számok mellett f(α1 + α2x2) ≥ α1f(x1) + α2f(x2).
A függvény szigorúan konvex (konkáv), ha a fenti egyenlőtlenségben < (>) szerepel.

Ez szemléletesen azt jelenti, hogy f pontosan akkor konvex az I intervallumban, ha ∀x1, x2 ∈ I esetén az f függvény

gra konja a P1 : = (x1, f(x1)) és a P2:= (x2, f(x2)) pontokat összekötő húr alatt
(pontosabban nem felette) fekszik az [x1, x2] intervallumon (17.14a ábra).
Ugyanígy f pontosan akkor konkáv az I intervallumban, ha ∀x1, x2 ∈ I esetén az f függvény gra konja a húr
felett fekszik az [x1, x2] intervallumon (17.14b ábra).

17.14. ábra

A konvex függvények egy fontos tulajdonsága a következő:

Egy nyílt intervallumon konvex (konkáv) függvény folytonos az intervallum minden pontjában.

Lássuk, milyen feltételek teljesülése mellett lesz f konvex, illetve konkáv!

Legyen f: R → R és legyen I ⊂ D(f) intervallum, f folytonos I-ben és di erenciálható int I-ben.


Ha f′ monoton nő az I intervallumon, akkor f konvex.
Ha f′ monoton fogy az I intervallumon, akkor f konkáv.

Ebből arra következtethetünk, hogy ha az előbbi feltételek mellett f még kétszer di erenciálható is int I-ben, akkor ha
minden x ∈ int I esetén
f″(x) ≥ 0, akkor f konvex,
f″(x) ≤ 0, akkor f konkáv.

Ennek a meggondolásához a monotonitás témakörénél elhangzott állításokra kell emlékeznünk.

Példa. Vizsgáljuk meg, hogy az f(x) = sin x függvény mely intervallumokon konvex, illetve konkáv! Ehhez tekintsük f″
(x) = (f′)′(x) = ((sin x)′)′ = (cos x)′ = –sin x! Tehát ha – sin x ≥ 0, akkor f konvex, ha – sin x ≤ 0, akkor f konkáv.
Azaz ha – π + 2kπ ≤ x ≤ 0 + 2kπ (k ∈ Z), akkor f konvex, ha 0 + 2kπ ≤ x ≤ π + 2kπ (k ∈ Z), akkor f konkáv (17.15. ábra).
17.15. ábra

In exiós pont

Legyen f: R → R, I ⊂ (f) intervallum, f folytonos és int I-ben kétszer di erenciálható. Az x0 ∈ int I pont in exiós pont (f-
nek x0-ban in exiója van), ha f″ az x0 pontban előjelet vált, azaz f″(x0) = 0, és található ϵ > 0, hogy
∀x ∈ (x0 – ϵ, x0) esetén f″(x) ≥ 0, és ∀x ∈ (x0, x0 + ϵ), esetén f″(x) ≤ 0, vagy
∀x ∈ (x0 – ϵ, x0) esetén f″(x) ≤ 0, és ∀x ∈ (x0, x0 + ϵ), esetén f″(x) ≥ 0.

Ha f″(x0) = 0 és f′″ (x0) ≠ 0, akkor belátható, hogy f″ az x0 pontban előjelet vált. Ezért igaz a következő.

Az in exiós pont elégséges feltétele:


ha f″(x0) = 0 és f′″(x0) ≠ 0, akkor x0 in exiós pont.

Megemlítjük, hogy az x0 ∈ int I in exiós pont az a pont, ahol az f függvény konvexből átmegy konkávba, illetve
konkávból átmegy konvexbe. Ha x0 in exiós pont, akkor az (x0 f(x0)) ponton átmenő érintő (az ún. in exiós érintő)
belemetsz a függvény görbéjébe.

Példa. Bizonyítsuk be, hogy az f(x) = x3 függvénynek a x0 = 0 az in exiós pontja!


Valóban, f″(x) = 3 · 2x = 6x, f″(x0) = f″(0) = 0, és pl. ϵ = 1 választással ∀x ∈ (–1, 0) esetén 6x ≤ 0, és ∀x ∈ (0, 1) esetén 6x ≥ 0.
Tehát teljesülnek a de níció feltételei, így x0 = 0 in exiós pont. Megoldhattuk volna az in exió elégséges feltételének
ellenőrzésével: f″(x0) = f″(0) = 0, és f″(x) = 6, igy f′″(x0) = f′″(0) = 6 ≠ 0, vagyis x0 = 0 in exiós pont. Az ábrán láthatjuk,
hogy az (x0, f(x0)) = (0, 0) ponton átmenő érintő tényleg „kettészeli” a függvény görbéjét: (–∞, 0) intervallumon a (0, 0)
ponton átmenő érintő f gra konja felett halad, míg a (0, +∞) intervallumon az érintő f gra konja alatt halad (17.16.
ábra).

17.16. ábra

Függvényvizsgálat
Az eddigiek alapján már el tudunk végezni egy precíz függvényvizsgálatot.

A függvényvizsgálat szempontjai:
1. Értelmezési tartomány (D(f)).
2. Tengelymetszetek.
3. Folytonosság, (féloldali) határértékek a szakadási helyeken és az értelmezési tartomány határpontjaiban, esetleges
aszimptoták.
4. Monotonitás, lokális szélsőértékek.
5. Konvexitás, in exiós pont.
6. Táblázat, a függvénygra kon vázlatos megrajzolása.
7. Értékkészlet (R(f)).

Már csak egy fogalmat kell tisztáznunk: az f függvény aszimptotája, egy olyan y = mx + b egyenletű egyenes, melyre
(ha a határérték egyáltalán létezik) vagy olyan függőleges x = x0 egyenes, melyre

és .
Az aszimptota létezése szemléletesen azt jelenti, hogy a függvénygra kon hozzásimul az adott egyeneshez (17.17. ábra).

17.17. ábra

Meghatározása: és .

Az függvény vizsgálata:
1. A polinomfüggvény értelmezési tartománya minden esetben: R.
2. Tengelymetszetek:
Az x tengely és a gra kon metszete: f gyökei, azaz ahol f(x) = 0:

Azaz x0 = 0, a gyökök.
Azy tengely és a gra kon metszete a (0, f(0)) pont:

Tehát az x tengelyt a gra kon (0, 0), a pontokban metszi, az y tengelyt a (0, 0)
pontban.
3. A polinomfüggvények egész R-en folytonosak, és , , a határértéknél tanultak alapján.
4. A monotonitás és a szélsőérték-vizsgálathoz deriválni kell: f′(x) = x2 + 2x – 8.
Ha f′(x) ≥ 0, akkor f monoton nő, ha f′(x) ≤ 0, akkor f monoton csökken.

f′(x) ≥ 0 ⇔ x ≤ –4 vagy 2 ≤ x. f′(x) ≤ 0 ⇔ –4 ≤ x ≤ 2.


Tehát ha x ≤ –4 vagy 2 ≤ x, akkor f monoton nő. (Ha x < –4 vagy 2 < x, akkor f szigorúan monoton nő.)
Ha –4 ≤ x ≤ 2, akkor f monoton fogy. (Ha –4 < x < 2, akkor f szigorúan monoton csökken.)
Nézzük a szélsőértékhelyeket!
f′(–4) = 0 és f′(2) = 0, ezeken az x helyeken van esély szélsőértékhelyre.
f″(x) = 2x + 2
f″(–4) = 2 · (–4) + 2 = –6 < 0 ⇒ –4 maximumhely.
A –4-hez tartozó maximumérték

f″(2) = 2 · (2) + 2 = 6 > 0 ⇒ 2 minimumhely.


A 2-höz tartozó minimumérték:

5. Konvexitásvizsgálat következik, ehhez a második derivált szükséges: f″(x) = 2x + 2.


f″(x) ≥ 0, ⇔ x ≥ –1és f″(x) ≤ 0 ⇔ x ≤ –1.
A konvexitásról szóló tétel alapján, ha x ≥ –1 ⇒ f konvex, ha x ≤ –1 ⇒ f konkáv.
Ha f″(x) = 0 ⇔ 0 x = –1, és x = –1-ben a függvény átmegy konkávból konvexbe, így x = –1 in exiós pont.
6. A függvény minden fontos tulajdonságát feltérképeztük, így jöhet a függvény gra konjának vázlatos felrajzolása táblázat
segítségével:

x x < –4 x = –4 –4 < x < 2 x=2 2<x

f′(x) + 0 – 0 +

f(x) monoton nő lokális maximum monoton fogy lokális minimum monoton nő

17.18. ábra

A gra konból látszik, hogy x1 = 2 és x2 = –4 csak lokális szélsőértékhelyek (17.18. ábra).


7. A függvény gra konjának a felvázolása után már könnyedén láthatjuk, hogy a függvény értékkészlete: R.
Az f(x) = sin x + x függvény vizsgálata:
1. D(f) = R, mert x ↦ sin x és x ↦ x egész R-en értelmezett függvények.
2. Az x tengely és a gra kon metszete: sin x + x = 0 ⇔ sin x = –x.
Az x ↦ sin x és x ↦ –x függvények gra konjainak metszete a (0, 0) pont, így a sin x = –x egyenlet megoldása x = 0 (egyetlen
megoldása van). Tehát a tengelymetszet: (0, 0), és ez az ytengellyel vett metszete is a gra konnak (a koordináták alapján
látható).
3. Az f függvény folytonos R-en, mert két folytonos függvény összege és , mert az x ↦ sin
x függvény korlátos, és így az identitásfüggvény határértéke dominál.
4. Monotonitás és szélsőérték: f′ (x) = cos x + 1.
Mely x esetén lesz f′(x) = 0?
cos x + 1 = 0 ⇔ cos x = –1 ⇔ x = π + 2kπ (k ∈ Z).
Tehát ezeken a helyeken lehet szélsőértékhely.
Az is egyértelmű, hogy ∀x ∈ R esetén f′(x) ≥ 0, vagyis f egész R-en monoton növő.
Tehát f′(x) = 0, az x = π + 2kπ (k ∈ Z) pontokban, de látható, hogy nem létezik olyan ϵ > 0, hogy ∀x ∈ (x0 – ϵ, x0) esetén f′(x) ≥ 0,
és ∀x ∈ (x0, x0 + ϵ) esetén f′(x) ≤ 0, vagy ∀x ∈ (x0 – ϵ, x0) esetén f′(x) ≤ 0, és ∀x ∈ (x0, x0 + ϵ) esetén f′(x) ≥ 0. Ugyanis f′(x) > 0, ∀x ∈
R esetén ha x ≠ π + 2kπ (k ∈ Z). Tehát a lokális szélsőérték elégséges feltétele nem teljesül, így az x = π + 2kπ (k ∈ Z) pontok
nem szélsőértékhelyek.
5. Konvexitás, in exiós pontok:
f″(x) = –sin x;
f″(x) = –sin x ≥ 0 ⇔ –π + 2kπ ≤ x ≤ 0 + 2kπ;
f″(x) = –sin x ≤ 0 ⇔ 0 + 2kπ ≤ x ≤ π + 2kπ.
Tehát ha – π + 2kπ ≤ x ≤ 0 + 2kπ (k ∈ Z), akkor f konvex,
ha 0 + 2kπ ≤ x ≤ π + 2kπ (k ∈ Z), akkor f konkáv.
In exió : f″(x) = –sin x = 0 ⇔ x = 0 + kπ, f″′(x) = – cos x és f′″(kπ) = –coskπ ≠ 0, azaz az x = 0 + kπ pontok in exiós pontok (k ∈ Z).
6. Táblázat:

x –2π < x < –π x = –π –π < x > 0 x=0 0<x<π x=π π < x < 2π

f′(x) + 0 + + 0 +

f″(x) – 0 + 0 – 0 +

f(x) monoton nő in exiós pont monoton nő in exiós pont monoton nő in exiós pont monoton nő

Ezek után már könnyedén ábrázolható a függvény (17.19. ábra).

17.19. ábra

7. Az értékkészlete: R(f) = R, ami leolvasható a függvény gra konjából.

Az függvény vizsgálata:
1. Ez egy racionális törtfüggvény, amiről tudjuk, hogy értelmezési tartománya a nevezőben lévő polinom gyökein kívül az
összes valós szám. Az x ↦ x + 3 polinom gyöke az x = –3. Tehát D(f) = R\{–3}.
2. Tengelymetszetek:

Az y tengellyel: .
Tehát a (0, 0) pont az x és az y tengellyel vett metszete a gra konnak.
3. A racionális törtfüggvények az értelmezési tartományuk minden pontjában folytonosak. Nézzük meg a függvény jobb oldali
és bal oldali határértékét az x = –3 pontban:

vagyis az x = –3 egyenes aszimptota.


Számoljunk határértéket (–∞)-ben és (+∞)-ben is:

További aszimptota keresése:


Az aszimptota egy y = mx + b egyenletű egyenes, meghatározása a következő módon történik:

Tehát az aszimptota, melyhez a függvény gra konja a ± ∞-ben hozzásimul: y = x – 3.


4. Monotonitás, szélsőérték:

Ezekben a pontokban lehet szélsőértékhely.


Vizsgáljuk meg, hogy a derivált függvény hol vált előjelet!

vagy x ≤ –6, itt f monoton növő.


f′(x) ≤ 0 ⇔ x(x + 6) ≤ 0 ⇔ –6 ≤ x ≤ 0, itt f mononton fogyó.
Ebből következik, hogy x1 = –6 lokális maximumhely, és x2 = 0 lokális minimumhely.
5. Konvexitás, in exiós pontok:
, itt f konkáv.

, ∀x ∈ R esetén, így nincs in exiós pontja f-nek.


6. Táblázat:

x x<–6 x = –6 –6 < x < –3 –3 < x < 0 x=0 0<x

f′(x) + 0 – – 0 +

f(x) monoton nő lokális maximum monoton fogy monoton fogy lokális minimum monoton nő

f(–6) = –12 f(0) = 0

A függvény gra konja így már felrajzolható (17.20. ábra).

17.20. ábra

7. Látható a gra konból, hogy R(f) = (–∞, –12] ∪ [0, +∞).


Megjegyezzük, hogy a függvényvizsgálatba néhány egyéb, speciális tulajdonság vizsgálata is belevehető.
Egy f: R → R függvényről azt mondjuk, hogy periodikus, ha létezik olyan p ∈ R szám, melyre minden x ∈ R esetén f(x +
p) = f(x). A legkisebb ilyen pozitív p számot f periódusának nevezzük. Periodikus függvény például a sin x, hiszen sin (x + 2π)
= sin x minden x ∈ R esetén.
Egy f: R → R függvényről azt mondjuk, hogy páros, ha minden x ∈ R esetén f(–x) = f(x), és páratlan, ha minden x ∈ R
esetén f(–x) = –f(x). Ezen két tulajdonság vizsgálatát nevezzük paritásvizsgálatnak. A páros függvények gra konja az y
tengelyre szimmetrikus, míg a páratlan függvények gra konja az xy sík origójára szimmetrikus. A fent vizsgált három
függvény egyike sem periodikus, nem páros, illetve páratlan függvény.

17.6. Többváltozós függvények di erenciálása

Parciális derivált
Di erenciálhatóság fogalma többváltozós függvény esetén
Második derivált
Felület érintősíkja
Szélsőérték
Parciális derivált
Legyen f: R2 → R függvény! Legyen a = (x0, y0) ∈ int D(f)! Tekintsük az (x0, y0) ponton áthaladó, az x tengellyel párhuzamos
egyenest az xy síkon. Az egyenes egy pontja: (x0 + t, y0) (t ∈ R). Tekintsük ezen egyenes pontjaihoz tartozó
függvényértékeket: f(x0 + t, y0) (t ∈ R). De niáljuk a ψ:R → R függvényt úgy, hogy minden t ∈ R valós számhoz rendelje
hozzá az f függvénynek az (x0 + t, y0) ponthoz tartozó helyettesítési értékét, azaz ψ(t): = f(x0 + t, y0). Vagyis szemléletesen ψ
egy, a felületen futó görbe (17.21. ábra).

17.21. ábra

Azt mondjuk, hogy az f függvény az (x0, y0) pontban az első változó szerint parciálisan di erenciálható, ha a ψ
függvény di erenciálható a t = 0-ban, és ekkor f(x0, y0) pontbeli első változó szerinti parciális deriváltja legyen ψ′(0) ∈
R.

Mivel ψ valósból valósba képező függvény, így az egyváltozós di erenciálhatóság de níciója alapján:

További jelölések:

Mivel ψ′(0) a ψ görbe 0 ponthoz tartozó érintőjének a meredeksége, így ∂1f(x0, y0) a ψ függvény által megrajzolt felületi
görbe (x0, y0, f(x0, y0)) ponthoz tartozó meredeksége (17.22. ábra).

17.22. ábra

Ugyanígy de niálható f második parciális deriváltja.


Vegyük az (x0, y0) ponton áthaladó, az y tengellyel párhuzamos egyenest az xy síkon. A ψ(t) := f(x0, y0 + t) képlettel
de niált függvény szintén egy felületi görbét ad.

Ha a ψ függvény di erenciálható a t = 0-ban, akkor az f függvény (x0, y0) pontbeli másodikváltozó szerinti parciális
deriváltja legyen ψ′(0) ∈ R. Azaz
A további jelölések értelemszerűen:

Az előzőekhez hasonló a ∂2f(x0, y0) jelentése is, azaz ∂2f(x0, y0) a felületi görbe érintőjének a meredeksége.
Az első változó szerinti parciális derivált de níciójából látszik, hogy a második koordináta, az y nem változik, állandó
marad. Ebből következik, hogy ha egy függvényt az első változója szerint deriválunk, akkor a második változót
konstansnak kell tekintenünk. Ugyanígy, ha a második változó szerint deriválunk, akkor az első változót tekintjük
konstansnak.

Megjegyzés. Az egyváltozós esetben beláttuk, hogy ha egy f: R → R függvény egy pontban di erenciálható, akkor ott
folytonos is. Kétváltozós esetben azonban egy (x0, y0) pontbeli parciális deriváltak létezéséből nem következik f(x0,
y0)-beli folytonossága. Vegyük ugyanis például az

függvényt. Ekkor ∂1f(0, 0) = 0 és ∂2f(0, 0) = 0, de f nem folytonos a (0, 0) pontban.

A parciális derivált fogalma f : Rn → R függvényekre általánosítható.

Legyen f : Rn→R, x = (x1, x2, …, xn) ∈ int D(f). Ha létezik

akkor ez a szám lesz f i-edik változó szerinti parciális deriváltja. (i = 1, …, n).


Ha minden x = (x1, x2, …, xn) ∈ int D(f) pontban létezik ∂if(x), akkor f i-edik változó szerinti parciális derivált
függvényének nevezzük azt a ∂if : Rn→R függvényt, ami minden x ∈ int D(f) ponthoz hozzárendeli az i-edik parciális
deriváltat.

Példa. Számítsuk ki az f(x) = 4x2 – 2xy3 + y függvény első és második parciális derivált függvényét!
Az x szerinti deriváltnál az y számít konstansnak: ∂1f(x, y) = 8x – 2y3.
Az y szerinti deriválásnál pedig x-t tekintjük konstansnak: ∂2f(x, y) = 6xy2 + 1.

Di erenciálhatóság fogalma többváltozós függvény esetén

Azt mondjuk, hogy f: R2 → R kétváltozós függvény di erenciálható az (x0, y0) ∈ int D(f) belső pontban, ha van olyan
A1, A2 ∈ R és olyan α: R2 → R függvény, hogy minden olyan h = (h1, h2) ∈ R2 vektorra, amelyre (x0 + h1, y0 + h2) ∈ D(f),
arra teljesül, hogy

Megjegyzés. Kisrendűnek szoktuk nevezni az olyan tulajdonságú α: R2 → R függvényt, melyre (α: Rn


→ R esetén is így de niáljuk a kisrendűség fogalmát és n-dimenzióban . Az elnevezés arra utal,

hogy az α függvény a 0 közelében nagyon pici. Látható, hogy ha fennáll, akkor , de itt
ennél erősebb tulajdonságról van szó: ha veszünk egy, a 0-hoz nagyon közeli h vektort, és ennek hosszával elosztjuk

α(h)-t, akkor ha |h| < 1, akkor , tehát az osztással α(h) értékét növeljük, de még így is h → 0 esetén

Ez pontosan azt jelenti, hogy – mint az egyváltozós esetben – ha veszünk egy h = (h1, h2) vektort, melyre |h| kicsi, akkor
az (x0, y0) és (x0 + h1, y0 + h2) pontok távolsága |h|, vagyis a távolságuk kicsi, azaz (x0, y0) ≈ (x0 + h1, y0 + h2), és ekkor a
függvényértékek különbsége jól becsülhető a következő módon:

azaz ha (x0, y0) ≈ (x, y), akkor

Hiszen ha |h| kicsi, akkor α(h) nagyon kicsi, így elhanyagolható.


Tegyük fel, hogy f: R2 → R di erenciálható az (x0, y0) pontban! Ekkor minden h ∈ R2 vektorra fennáll a fenti
összefüggés. Nézzük a h = (h1, 0) esetet:

Ha leosztjuk h1-gyel mindkét oldalt és határértéket veszünk, akkor:

Vegyük észre, hogy a bal oldali határérték az első változó szerinti parciális derivált az (x0, y0) pontban (csak azt kell

meggondolnunk, hogy h → 0 pontosan akkor, amikor h1 → 0 és α kisrendűsége miatt . Vagyis A1 = ∂1f(x0,


y0).
Ha az előbbi gondolatmenetet a h = (0, h2) vektorra alkalmazzuk, akkor az jön ki, hogy A2 = ∂2f(x0, y0).

Tehát ha f di erenciálható az (x0, y0) pontban (vagyis létezik jó A1, A2, α), akkor f parciálisán is di erenciálható (x0,
y0)-ban, és A1 = ∂(x0, y0), A2 = ∂2f(x0, y0).

Mátrixok segítségével is felírható a di erenciálhatóság fogalma:

f di erenciálható, ha létezik A1 = ∂1f(x0, y0), A2 = ∂2f(x0, y0) és olyan kisrendű α: R2 → R, hogy

Láthattuk, hogy mikor mondjuk egy f: R2 → R függvényre, hogy di erenciálható egy (x0, y0) pontban, de mit hívunk
f(x0, y0) pontbeli deriváltjának?

Az f:R2 → R függvény (x0, y0) pontbeli deriváltjának nevezzük azt az A ∈ R1 × 2 mátrixot, ún. derivált mátrixot, melyre

Az A mátrixot f′ (x0, y0)-val jelöljük.

Vagyis az eddigiek alapján f′(x0, y0) ∈ R1×2 és

Kétváltozós esetben is de niálható a derivált függvény.

Ha f: R2 → R di erenciálható az értelmezési tartománya belső pontjaiban, akkor ott létezik f derivált függvénye, és

Nagyon fontos állítás a következő:

Ha az f di erenciálható az (x0, y0) pontban, akkor f ott folytonos is.


Mint valósban, itt is könnyű belátni ezt:

Azaz , ami az (x0, y0) pontbeli folytonosság de níciójával ekvivalens.


Ebből az állításból jól látszik, hogy lényeges a különbség aközött, hogy f-nek csak a parciális deriváltjai léteznek, vagy f
di erenciálható, hiszen az első esetben f(x0, y0)-ban nem feltétlenül folytonos.
Előbb láttuk, hogy ha f di erenciálható, akkor a parciális deriváltjai léteznek, de fordítva nem igaz, csak ha még plusz
feltételekkel élünk.

Tegyük fel, hogy f:R2 → R függvénynek léteznek a parciális deriváltjai (x0, y0)-ban, és (x0, y0) egy környezetében is, és a
környezetében a parciális derivált függvények folytonosak, persze így (x0, y0)-ban is. Ekkor f az (x0, y0) pontban
di erenciálható.

Megjegyzés. Ez az állítás f: Rn → R függvényre általánosítható.

Ahogy a parciális derivált fogalmát, úgy a derivált fogalmát is kiterjeszthetjük n-változós függvényekre:

Egy f: Rn → R egy x = (x1, x2, …, xn) ∈ int D(f) belső pontban di erenciálható, ha létezik olyan A = [A1, A2, …, An) ∈ R1 × n
mátrix és olyan α: Rn → R függvény, hogy minden h ∈ Rn vektor esetén

Ebben az általános esetben is belátható, hogy ha f : Rn →R di erenciálható egy x ∈ int D(f) pontban, akkor a parciális
deriváltak léteznek, és minden i = 1, …, n esetén

Megemlítjük, hogy ha f: Rn → Rm függvényeket vizsgálunk, akkor a deriválhatóság fogalma a következőképp módosul:

Egy f: Rn → Rm egy x ∈ int D(f) belső pontban di erenciálható, ha létezik olyan mátrix

és olyan α : Rn → Rm függvény, hogy minden h ∈ Rn vektor esetén f(x + h) – f(x) = Ah + α(h) és .

Ha f: Rn →Rm di erenciálható egy x ∈ int D(f) pontban, akkor a parciális deriváltjai léteznek minden fj (j = 1, …, m)
koordinátafüggvénynek és minden i = 1, …, n esetén

Ezt az f′(x) mátrixot Jacobi-mátrixnak nevezzük.

Példa. Adjuk meg a következő függvények derivált mátrixát!


1. Ha f(x, y, z) = xz + 2y,
akkor f′(x, y, z) = [∂1f(x, y, z), ∂2f(x, y, z), ∂3f(x, y, z)] = [z, 2, x].
2.

Ha , akkor , ahol f1(x) = cos x és f2(x) = 2 · ex.


3.
Ha , akkor

Második derivált

Legyen f: Rn → R. Tegyük fel, hogy a ∂if: Rn → R i-edik változó szerinti parciális derivált függvénynek létezik a j-edik
változó szerinti parciális deriváltja. Ekkor

Megjegyzés. Ugyanilyen módon de niálhatók f további parciális deriváltjai is.

Nézzük meg, hogy mit nevezünk f második deriváltjának!

Legyen f : Rn → R, a ∈ D(f) és K(a) az a egy környezete. Minden i, j = 1, …, n esetén ∂2ij f folytonos K(a)-ban. Ekkor az

mátrixot f második deriváltjának nevezzük az a pontban.


Ezt a mátrixot Hesse-mátrixnak nevezzük, és H(a)-val is jelöljük.

Álljon itt egy nevezetes tétel!

Young-tétel:
Legyen f : Rn → R, a ∈ D(f) és K(a) az a egy környezete. Minden i, j = 1, …, n esetén ∂2ij f folytonos K(a)-ban. Ekkor ∂2ij f =
∂2ij f (i, j = 1, ..., n).

Tehát a parciális deriváltak megfelelő feltételek teljesülése esetén felcserélhetők, vagyis a Young-tétel pont azt mondja
ki, hogy a H(a) = f″(a) mátrix szimmetrikus.

Felület érintősíkja
Emlékezzünk vissza, hogy egy f: R → R függvénynél, ha az di erenciálható volt egy x0 ∈ int D(f) pontban, akkor fel tudtuk
írni a gra kon (x0, f(x0)) pontjához húzott érintő egyenletét. Ugyanígy gondolkodva, szeretnénk megadni egy f: R2 → R
függvény gra konjához, vagyis az általa megrajzolt felülethez tartozó (x0, y0, f(x0, y0)) pontbeli érintősík egyenletét, ha f az
(x0, y0) pontban di erenciálható.
Már említettük, hogy ha f: R2 → R az (x0, y0) ∈ D(f) pontban di erenciálható, akkor ha (x0, y0) ≈ (x, y), akkor

azaz

Ez azt jelenti, hogy ha az (x0, y0) és az (x, y) távolsága kicsi, akkor az (x, y) ponthoz tartozó függvényértékek jól
becsülhetők a A1(x – x0) + A2(y – y0) + f(x0, y0) értékkel.
Vegyük észre koordinátageometriai ismereteinkre visszagondolva, hogy a z = A1(x – x0) + A2(y – y0) + f(x0, y0) egy sík
egyenlete. Erről beláttuk, hogy jól közelíti az f(x, y) értékeket (x0, y0) ≈ (x, y) esetén, emellett áthalad az (x0, y0, f(x0, y0))
ponton.
Így ez a

egyenletű sík az f függvény (x0, y0, f(x0, y0)) ponthoz tartozó érintősíkja (az (x0, y0) ponthoz tartozó érintősíkja), ahol A1
= ∂1f(x0, y0) és A2 = = ∂2f(x0, y0).

Példa. Adjuk meg az f(x, y) = x3y függvény (2, –1) ponthoz tartozó érintősíkját!

így A1 = ∂1f(2, –1) = –12, A2 = ∂2f(2, –1) = 8 és f(2,–1) = 8.


Tehát az érintősík

Szélsőérték
Csak f: Rn → R valós értékű függvény esetén tudunk szélsőértéket de niálni.

Legyen f : Rn → R, a ∈ int D(f). Ha létezik olyan K(a) környezete az a pontnak, hogy minden x ∈ K(a) ⊂ D(f) esetén

akkor azt mondjuk, hogy az f függvénynek lokális minimuma van az a pontban.


Ha létezik olyan K(a) környezete az a pontnak, hogy minden x ∈ K(a) ∩ D(f) esetén

akkor azt mondjuk, hogy az f függvénynek lokális maximuma van az a pontban.


Szigorú lokális minimumról (maximumról) akkor beszélünk, ha az egyenlőtlenségben < (>) szerepel.
Ha f-nek lokális minimuma vagy maximuma van a-ban, akkor azt mondjuk, hogy f-nek lokális szélsőértéke van a-ban.
Az abszolút minimumot (maximumot) ugyanúgy de niálhatjuk, mint az R → R függvényeknél.

A lokális szélsőérték szükséges feltétele:


Legyen f: Rn → R, a ∈ int D(f) és f di erenciálható az a pontban! Ha f-nek a-ban lokális szélsőértéke van, akkor f′(a) = 0.

Megjegyzés. Az f′(a) = 0 jelen esetben azt jelenti, hogy f′(a) = (0, …, 0), vagyis minden parciális deriváltja 0 az a
pontban, az ilyen pontokat stacionárius pontoknak nevezzük. Felhívjuk a gyelmet, hogy az állítás visszafelé nem
igaz, vagyis ha egy pontban a derivált 0, abból még nem következik, hogy ott szélsőértékhely van.

Ennek az állításnak a segítségével megvizsgálhatjuk, hogy hol lehetnek f-nek lehetséges szélsőértékhelyei.

Szigorú lokális minimum elégséges feltétele:


Legyen f: Rn → R, a ∈ int D(f) és K(a) és egy környezete a-nak. Tegyük fel, hogy ∂if és ∂2ijf folytonos K(a)-n, f′(a) = 0 és
bármely h ∈ R, h ≠ 0 esetén 〈f″(a)h, h 〉 > 0.
Ekkor f-nek a-ban szigorú lokális minimuma van.
Szigorú lokális maximum elégséges feltétele:
Legyen f: Rn → R, a ∈ int D(f) és K(a) és egy környezete a-nak. Tegyük fel, hogy ∂if és ∂2ijf folytonos K(a)-n, f′(a) = 0 és
bármely h ∈ R, h ≠ 0 esetén 〈f″(a)h, h〉 < 0.
Ekkor f-nek a-ban szigorú lokális maximuma van.

〈 〉
Megjegyzés. A x, y az x és y vektorok skaláris szorzatát jelöli. A tételben 〈f″(a)h, h〉 kifejezés értelmes, hiszen f″
(a)h egy Rn-beli vektor.
〈 〉 〈
Speciálisan kétváltozós esetben a f″(a)h, h > 0 és a f″(a)h, h 〉 < 0 (bármely h ∈ R, h ≠ 0 esetén) feltételeket a
következő feltételekre cserélhetjük le, mert ekvivalensek egymással:
- ha det H(a) > 0 és ∂211 f(a) > 0, akkor a-ban lokális minimum van,
- ha det H(a) > 0 és ∂211 f(a) < 0, akkor a-ban lokális maximum van, és
- ha det H(a) < 0, akkor a-ban nincs lokális szélsőérték,
- ha det H(a) = 0, akkor az eddigi információkból nem tudjuk még eldönteni, hogy a-ban van-e szélsőérték.
Ez a feltétel könnyebben ellenőrizhető, így segítséget jelent konkrét példák megoldásánál.

2 2
Példa. Határozzuk meg, hogy hol van szélsőértéke az f(x, y) = ex + y függvénynek!

f′ hol 0?

Tehát a (0, 0) pontban van esély szélsőértékhelyre.

.
det H(a) = 4 > 0 és ∂211 f(0, 0) = 2 > 0, vagyis ebből az következik, hogy az f függvénynek a (0, 0) pontban lokális
minimuma van.

17.7. Fizikai alkalmazások

Sebesség
Gyorsulás

Sebesség
Tekintsük a sebességfogalom kérdését a zikában! Először vizsgáljuk az egyenes vonalú mozgást! Egyenes vonalú
egyenletes mozgás esetén a sebesség a megtett út és az eltelt idő hányadosa,

A sebesség – ebben az esetben – a mozgás nagyságát mérő mennyiség, a mozgás iránya pedig az egyenes vonal irányával
egyezik meg.
Hasonlóan értelmezhető időben változó sebességű egyenes vonalú mozgás esetén az átlagsebesség t0 és t időpillanat
között, azaz

ahol s(t) jelöli a t idő alatt megtett utat (s: R → R folytonos függvény). Észszerűnek látszik, hogy a pillanatnyi sebesség
fogalmát a t0 időpillanatban a következőképp értelmezzük. Vegyünk a t0 időponthoz közeli t időpontokat, határozzuk meg
az átlagsebességet a [t0, t] időintervallumon, majd közelítsük t-t t0-hoz. Matematikailag precízen megfogalmazva, legyen

persze amennyiben ez a határérték létezik.


Tehát

Bonyolultabb az eset, ha nem egyenes vonalú mozgást nézünk. Nem egyenes vonalú mozgás esetén (például ha egy
kanyargós úton haladunk autóval):

a sebesség egy olyan mennyiség, amely a mozgás nagyságát és irányát adja meg. Tehát a sebesség egy vektor.

Egy sík felszínen haladó tetszőleges mozgást egy görbe segítségével írhatunk le.

Egy folytonos paraméterezett görbe egy φ: [a, b] → R2 folytonos leképezés az [a, b] intervallumról R2-be.

Az a lesz a kezdő időpillanat, b az utolsó. A kétdimenziós térben a mozgás kiindulópontja: , végpontja:

, és a síkgörbe pontjai, amiken végighaladunk az idő függvényében: , t ∈ [a, b].

A φ függvény deriváltja egy t0 pontban: , ami a mozgás sebességét jelenti a t0 időpontban. Tehát

Ez egy sebességvektor, melynek hossza a mozgás nagyságát, iránya a mozgás irányát adja meg (17.23. ábra).

17.23. ábra

Ugyanígy modellezhető a térben például egy repülőgép mozgása, melyet az idő függvényében egy φ: [a, b] →R3
folytonos paraméterezett görbe ír le. Sebességvektora egy t0 időpillanatban:

melynek hossza a mozgás nagysága, és az iránya a mozgás iránya.

Gyorsulás
A zikában a gyorsulás a sebesség változási gyorsasága, jele: a. Egyenes vonalú mozgás esetén az átlaggyorsulás úgy
értelmezhető a t0 és t időpillanat között, hogy

azaz a t0 és t időpillanatbeli sebességváltozás átlagát veszem.


Ugyanazt a gondolatmenetet használom, mint az előbb. A pillanatnyi gyorsulás fogalmát a t0 időpillanatban a
következőképp értelmezzük. Vegyünk a t0 időponthoz közeli t időpontokat, határozzuk meg az átlaggyorsulást a [t0, t]
időintervallumon, majd közelítsük t-t t0-hoz. Azaz legyen
ha a határérték létezik.

Tehát a gyorsulás a sebességfüggvény deriváltja:

De előbb vettük, hogy v(t0) = s′(t0), így

azaz, ha az időfüggvényben s(t) jelöli az eddig megtett utat, akkor a(t0) = s″(t0).
Nem egyenes vonalú mozgás esetén a mozgást egy φ: [a, b] → Rn folytonos leképezéssel írjuk le az [a, b] intervallumról
Rn-be (n = 2, 3). Ekkor a gyorsulás egy megfelelő dimenziós vektor lesz, melyet úgy kapunk, hogy a sebességvektorból
kapott függvényt deriváljuk. Például n = 3 esetén:

, ∀t ∈ [a, b] és a gyorsulás így , t ∈ [a, b]. (Feltéve, hogy ezek a deriváltak


léteznek.)

Példa. Egy repülőgép a következő görbét írja le az idő függvényében: , t > 0.


Nézzük meg, hogy mennyi a gép sebessége egy t0 időpillanatban, és mi a gyorsulásvektor! Ez egy spirális mozgás, ami
az xyz tér origójából indul (17.24. ábra).

17.24. ábra

A sebességvektor t0-ban: . A sebességvektor hossza megadja a t0 pontban lévő


sebesség „nagyságát”:

Azaz . Tehát ahogy halad a gép (t nő), a sebessége egyre növekszik, a mozgás iránya pedig állandóan
változik, mert a vektor iránya változik. A mozgás gyorsulásvektora pedig:
18. Integrálszámításéés alkalmazásai
18.1. Határozatlan integrál
18.2. Riemann-integrál és tulajdonságai
18.3. Numerikus integrálás
18.4. Integrálszámítás alkalmazásai (terület, térfogat, ívhossz)
18.5. Többváltozós integrál

18.1. Határozatlan integrál

Primitív függvény

Primitív függvény

Legyen f valós-valós függvény, D(f) = I tetszőleges intervallum (korlátos vagy nem korlátos, nyílt, zárt, félig nyílt stb.).
Azt mondjuk, hogy az F: I → R függvény az f függvény primitív függvénye vagy határozatlan integrálja, ha F
di erenciálható, és F′(x) = f(x) minden x ∈ I esetén.

Megjegyzés. Az egész fejezetben, ha az intervallum szót használjuk, mindig nem elfajuló, azaz legalább kétpontú
intervallumra fogunk gondolni.

Megemlítjük, hogy ha kiszámítjuk egy f függvény primitív függvényét, akkor azt is szoktuk mondani, hogy
„integráljuk az f függvényt”.
Az előbbi de níció alapján egyértelmű, hogy

ha F az f egy primitív függvénye, akkor bármely c ∈ R esetén (F + c)′ = f, így f-nek végtelen sok primitív függvénye van.

A Lagrange-középértéktétel egy egyszerű következménye is ide kapcsolódik.

Ha F az f egy primitív függvénye, akkor f-nek minden más G primitív függvénye előáll G = F + c alakban valamely c ∈
R-re.

Ez az állítás könnyen belátható. Az állítás feltételeiből következik, hogy

vagyis (F – G)′ = 0 az egész I intervallumon. Legyenek x1, x2 ∈ [a, b] tetszőleges pontok, [a, b] ⊂ I tetszőleges. A Lagrange-
középértéktétel feltételei nyilván teljesülnek az [x1, x2] intervallumon F – G-re, tehát létezik olyan c ∈ (x1, x2), melyre

Ebből (F – G)(x2) = (F – G)(x1). Mivel x1 és x2 tetszőleges volt, ezért az F és a G különbsége az egész intervallumon állandó,
így az állítást beláttuk.
Tehát a primitív függvény mindig konstans erejéig van megadva, nem egyértelmű.
Bevezetünk egy jelölést a primitív függvények halmazára. Elöljáróban megjegyezzük, hogy a jelölés talán logikai
szempontból nem tökéletes, mégis használjuk, mert elterjedt a hazai és a nemzetközi szakirodalomban, lényegében Leibniz
óta bevett jelölés, és a megfelelő megállapodásokkal precízzé tehető.

Legyen D(f) = I intervallum, és jelölje f primitív függvényeinek halmazát


Szokásos jelölések még:

Tehát az előzőek szerint, ha F az f egy primitív függvénye, ahol D(f) = I intervallum, akkor

A továbbiakban a fenti halmazt nem fogjuk mindig ilyen részletességgel kiírni, hanem egyszerűsítve, F + C alakban,
tehát

Ha ezt az írásmódot használjuk, emlékezzünk mindig arra, hogy itt C nem egy számot jelöl, hanem az összes lehetséges
számot, tehát ez a szimbólum nem egy függvényt jelöl, hanem függvények halmazát. Ha nem okoz félreértést, akkor ∫f(x)
dx = {F + C : C ∈ R} minden elemét is az egyszerűség kedvéért ∫f-fel jelöljük, tehát

Szokásosak még az ∫f(x) és ∫f(x) dx jelölések is a primitív függvény x pontbeli helyettesítési értékére, csakúgy, mint a
halmaz jelölésére. Vegyük észre, hogy a primitívfüggvény-keresés vagy határozatlan integrálás lényegében a di erenciálás
műveletének megfordítása. Így a di erenciálás szabályai megadják nagyon sok függvénynek a határozatlan integrálját. A
fontosabb alapintegrálok a következők:

A lista ízlés szerint a végtelenségig folytatható ismert függvények di erenciálásának megfordításával, például:

Az elemi függvények primitív függvényei után rátérhetünk a határozatlan integrál műveleti azonosságaira. A
di erenciálás azonosságaiból egyből adódnak a következők:

Ha f-nek és g-nek létezik primitív függvénye, akkor f + g-nek is, és

Ha f-nek és g-nek létezik primitív függvénye, akkor f – g-nek is, és

Ha f-nek létezik primitív függvénye, c ∈ R tetszőleges állandó, akkor c · f-nek is, és

Ugyanis például az első esetben, ha f-nek és g-nek létezik primitív függvénye: ∫f, ∫g, azaz (∫f)′ = f és (∫g)′ = g, akkor ebből
következnie kellene, hogy létezik egy olyan H függvény, melyre H′ = f + g. Valóban, H:= ∫f + ∫g választással H′:= (∫f + ∫g)′ = (∫f)′ +
(∫g)′ = f + g, azaz (f + g)-nek létezik primitív függvénye, vagyis létezik ∫(f + g) és ∫(f + g) = H = ∫f + ∫g.
Ugyanígy látható be a másik két állítás is, a di erenciálás tulajdonságait kihasználva. Sajnos az integrálás szorzás és
kompozíció esetén nem viselkedik ilyen szépen, ezért bonyolultabb függvények esetén csak esetleges módszereink vannak.
A szorzással kapcsolatos a parciális integrálás:
A parciális integrálás elve:
Legyenek f és g di erenciálhatóak az I intervallumban, és tegyük fel, f · g′-nek létezik primitív függvénye! Ekkor f′ · g-
nek is létezik primitív függvénye, és az egyik:

Be kell látnunk, hogy (f · g – ∫f · g′) di erenciálható, és (f · g – ∫f · g′)′ = f′ · g, ekkor ugyanis f′ · g-nek létezik primitív
függvénye, és ∫f′ · g = f · g – ∫f · g′.
Nézzük: (f · g – ∫f · g′)′ = (f · g)′ – (∫f · g′)′ = f′ · g + f · g′ – f · g′ = f′ · g, tehát teljesülnek az elvárásaink.

Példa. Számítsuk ki h(x) = ln x primitív függvényét!

A kompozícióval kapcsolatosan szemléletesen nyilvánvaló a következő állítás.

Helyettesítéses integrálás elve I.


Legyenek I és J tetszőleges intervallumok, f és g adott függvények, D(f) = I, D(g) = J, g di erenciálható J-n, D(g) ⊂ I és
tegyük fel, hogy f-nek létezik primitív függvénye I-n. Ekkor az (f ◦ g) · g′ függvénynek is létezik primitív függvénye J-n,
és

vagy másképp kifejezve

Ugyanis, ha F(t) = ∫f(t) dt, akkor

A helyettesítéses integrál másik esetét is nézzük meg.

Helyettesítéses integrálás elve II.


Legyenek I és J tetszőleges intervallumok, f és g adott függvények, D(f) = I, D(g) = J, g di erenciálható J-n, D(g) ⊂ I, g′
(x) ≠ 0, ∀x ∈ J esetén, és tegyük fel, hogy (f ◦ g) · g′-nek létezik primitív függvénye J-n. Ekkor az f függvénynek is létezik
primitív függvénye I-n, és

vagy másképp kifejezve

Hiszen, ha F(t) = ∫f(g(t)) · g′(t) dt, akkor

Megjegyzés. Használtuk az inverz függvény deriválási szabályát és hogy F′(t) = f(g(t))g′(t) (amit feltettünk).

A ∫(f ◦ g) · g′ = F ◦ g képletnek, ahol F = ∫f, fontos speciális esetei a következők:


Az összefüggések értelemszerűen mindig a megfelelő intervallumon vannak értelmezve.
Most nézzük meg, hogy hogyan kell használni ezeket a fontos képleteket!

Példák a képlet alkalmazására:


1. Mi a primitív függvénye az x ↦ e–x + 2 függvénynek?
f(–x + 2) = e–x + 2, vagyis f(x) = ex és F(x) = ∫f(x) = ex.

Így .
Valóban, (−e−x + 2) ′ = −(e−x + 2) ′ = −e−x + 2 · (−1) = e−x + 2.
2.
Mi a primitív függvénye az függvénynek ?

, tehát , és F(x) = ∫f(x) = ln |x|.

Tehát .
3. Ez a példa ötletet ad bizonyos racionális törtfüggvények primitív függvényének kiszámolásához.

Ha alakú racionális törtfüggvény, ahol p(x) egy n-edfokú polinom, akkor ismert, hogy p(x)
előállítható a következő gyöktényezős alakban:
p(x) = a(x – x1)(x – x2) · …· (x · xn). Ennek segítségével f(x) parciális törtekre bontható úgy, hogy

, ahol A1, A2, ..., An ∈ R.

Ekkor és az primitív függvény meghatározását már


tudjuk. Álljon itt egy példa!

Határozzuk meg az függvény primitív függvényét!


Ehhez először a p(x) = 2x2 + x – 1 polinomot írjuk fel gyöktényezős alakban (a gyökképlet segítségével):

.
Keresnünk kell olyan A1, A2 ∈ R számokat, melyekre:

A jobb oldal közös nevezőre hozása után:

Ez pontosan akkor teljesül, ha . A kétismeretlenes egyenletrendszer megoldásai a keresett számok.

Ilyen formában f primitív függvényét már könnyű meghatározni:


Példa az képlet alkalmazására: ∫sin x cos x dx = ? g(x) = sin x és α = 1 választással gα(x) · g′(x) = sin x
cos x, így

Valóban .

Példa az képlet alkalmazására:

Ha g(x) = tg x, akkor
Példa helyettesítéses integrálra:
Számítsuk ki helyettesítéssel a függvényt az I = [–1, 1] intervallumon! Helyettesítsünk t:= sin x-t,

Így

Mi nem az · cos x függvény primitív függvényére vagyunk kíváncsiak (eddig csak ezt számoltuk
ki), hanem a függvénynek a primitív függvényére, így a helyettesítést „visszafelé” is el kell végeznünk,
azaz legyen x = arcsin t:

Megjegyzés. Kihasználtuk, hogy és hogy sin 2x = sin x · cos x.

18.2. Riemann-integrál és tulajdonságai

A Riemann-integrál fogalma
A Riemann-integrál formális tulajdonságai
A Newton–Leibniz-tétel
Integrálfüggvények
Improprius integrál

A Riemann-integrál fogalma

Az [a, b] intervallum (korlátos és zárt) egy felosztása egy olyan {Ii = [xi – 1, xi]: i = 1, …, n} véges intervallumrendszer,
melyre a = x0 < x1 < x2 < … < xn = b valamely n ∈ N esetén. Az [a, b] intervallum felosztásainak halmazát jelölje FO [a, b].

Adott f: [a, b] → R korlátos függvény és Φ = {I1, I2, …, In} ∈ FO[a, b] felosztás esetén de niálja a Φ felosztáshoz tartozó
alsó közelítő összeget

felső közelítő összeget

ahol |Ii| := xi – xi – 1, az Ii intervallum hossza.


Szemléletesen az Sf(Φ) összeg az [Xi–1, xi] alapú, (inf Iif) magasságú téglalapok „előjeles” térfogatának az összege (18.1a
ábra). Azért „előjeles”, mert az (inf Iif) számok nyilván lehetnek negatívak is. Tehát sf(Φ) egy alsó becslése a függvénygörbe
és az x tengely által határolt síkidom „előjeles” területének az [a, b] intervallumon.
Ugyanígy az Sf(Φ) összeg egy felső becslése a függvénygörbe és az x tengely által határolt síkidom „előjeles” területének
(18.1b ábra).

18.1. ábra

Tetszőleges f: [a, b] → R korlátos függvény és Φ ∈ FO[a, b] esetén .

Ez világos, hiszen inf Iif ≤ sup Iif.


Tetszőleges f: [a, b] →R korlátos függvény és Φ ∈ FO[a, b] esetén Sf(Φ) = –s–f(Φ).
Ugyanis tudjuk, hogy sup Iif = − inf Ii(−f).
Megmutatható, hogy

legyen f: [a, b] → R korlátos függvény. Ekkor bármely Φ, Ψ ∈ FO[a, b] felosztások esetén

Ezt felhasználva egyértelmű, hogy

az {Sf(Φ):Φ ∈ FO[a, b]} és {Sf(Φ):Φ ∈ FO[a, b]} halmazok közül a bal oldali halmaz minden eleme kisebb vagy egyenlő a
jobb oldali halmaz minden eleménél. Ebből az is következik, hogy az első halmaz felülről, a második alulról korlátos.

Így értelmes a következő de níció:

De niálja az f: [a, b] → R korlátos függvény Darboux-féle alsó integrálját

és Darboux-féle felső integrálját

Az előbbi állítás alapján

Az integrál Darboux-féle de níciója:


Egy korlátos f: [a, b] → R függvényt Riemann-integrálhatónak mondunk, ha

Ha f Riemann-integrálható, akkor az alsó és felső Darboux-integrálok közös értékét f Riemann-integráljának


nevezzük, és az alábbi módon jelöljük:
Megjegyzés. Később bevezetjük az integrálhatóság Riemann-féle de nícióját is. Mivel a két de níció egymással
ekvivalens lesz – vagyis ugyanazt a fogalmat de niálják –, így az általuk kapott integrált mindkét esetben Riemann-
integrálnak nevezzük.

Megjegyezzük, hogy az integrál szemléletes jelentése a következő. Mivel sf(Φ) egy alsó becslése a függvénygörbe és az x
tengely által határolt síkidom „előjeles” területének az [a, b]-n és Sf(Φ) egy felső becslése. Ezek szuprémuma, illetve
in muma által előállított mennyiség az integrál, és ha ezek megegyeznek, így ebből következik, hogy az integrál az [a, b]
intervallumon pontosan a függvénygörbe és az x tengely által határolt síkidom „előjeles” területe az [a, b] intervallumon
(18.2. ábra).

18.2. ábra

A későbbiekben ennek az észrevételnek az alkalmazásaival is foglalkozni fogunk.

Példa. Bizonyítsuk be, hogy


Rögzített n ∈ N esetén legyen a Φn felosztás az az intervallumrendszer, amit a

osztópontok határoznak meg. Ekkor

tehát , ha n → + ∞. Ebből könnyen látható, hogy f(x) = x2

Riemann-integrálható [0, 1]-en, és Riemann-integrálja .

18.3. ábra

A továbbiakban jelölje
R[a, b] := {f: [a, b] → R: f korlátos és Riemann-integrálható}.
Ha Φ ∈ FO[a, b], akkor az

számot az f függvény Φ felosztáshoz tartozó oszcillációs összegének nevezzük.

Leghasznosabb kritérium Riemann-integrálhatóságra:


Egy korlátos f: [a, b] → R függvény pontosan akkor Riemann-integrálható, vagyis f ∈ R[a, b] pontosan akkor, ha
minden ϵ > 0 számhoz létezik olyan Φ = Φ(ϵ) ∈ FO[a, b] felosztás, melyre Ωf(Φ) < ϵ.

A következő de nícióra szükség lesz az integrálhatóság Riemann-féle kritériumának megfogalmazásához.

Ha Φ = {I1, I2, …, In} ∈ FO [a, b] egy felosztás, akkor de niálja Φ nomságát

Először kimondunk egy, az előző kritériumhoz nagyon hasonló integrálhatósági feltételt, ami azonban „több” annál.

Legyen f: [a, b] → R korlátos. Ekkor az alábbi két állítás egymással egyenértékű:


a) f ∈ R[a, b];
b) minden ϵ > 0 számhoz létezik olyan δ > 0, hogy minden Φ ∈ FO[a, b], |Φ| < δ felosztás esetén

Az integrálhatóság Riemann-féle kritériumának kimondásához szükségünk lesz még az alábbi fogalomra is.

Legyen Φ = {I1, I2, …, In} ∈ FO[a, b] felosztás, és ξ = (ξ1, …, ξn) ∈ Rn tetszőleges, a Φ felosztás egy osztópontvektora,
vagyis

jelölésben: ξ > Φ. Ekkora

számot az f függvény (Φ, ξ) párhoz tartozó Riemann-összegének nevezzük.

Megjegyezzük, hogy tetszőleges Φ és ξ > Φ esetén sf(Φ) ≤ σf(Φ, ξ) ≤ Sf(Φ).

Az integrálhatóság Riemann-féle kritériuma.


Legyen f: [a, b] → R korlátos. Ekkor az alábbi két állítás egymással egyenértékű:
a)
;
b) minden ϵ > 0 számhoz létezik olyan δ > 0, hogy minden Φ ∈ FO[a, b], |Φ| < δ felosztás és minden ξ > Φ esetén

Megjegyezzük, hogy a b) állítás pontosan az integrál Riemann-féle de níciója.

Az integrál Riemann-féle de níciója I.


Legyen f: [a, b] → R függvény! Ha van olyan A ∈ R szám, hogy minden ϵ > 0 számhoz létezik olyan δ > 0, hogy minden Φ
∈ FO[a, b], Φ < δ felosztás és minden ξ Φ osztópontvektor esetén

akkor azt mondjuk, hogy f Riemann-integrálható [a, b]-n és f Riemann-integrálja A, azaz .


Másképp megfogalmazva:

Az integrál Riemann-féle de níciója II.


f Riemann-integrálható, ha a bármely |Φn| → 0 felosztássorozatra és tetszőleges ξ(n)∞ Φn osztópontvektor-sorozatra a
σf(Φn, ξ(n)) Riemann-közelítőösszegek sorozata konvergens.
Könnyű végiggondolni indirekt módon az összefésülés módszerével, hogy ha f Riemann-integrálható, akkor a
Riemann-közelítőösszegeknek csak egyféle határértéke lehet, azaz

tetszőleges |Φn| → 0 és tetszőleges ξ(n) Φn esetén.

Ezt az számot f Riemann-integráljának nevezzük.

Az integrálhatóság Riemann-féle kritériuma pont azt mondja ki, hogy a Riemann-féle de níció és a Darboux-féle
de níció megegyezik, azaz

A Riemann-féle de níciónál nem tettük fel, hogy f korlátos függvény. Ha egy tetszőleges f függvénynek létezik a
Riemann-integrálja, akkor létezik a Darboux-féle integrálja is, hiszen ugyanaz a két érték, viszont a Darboux-féle integrált
csak korlátos függvényekre tudjuk kiszámítani, tehát f biztosan korlátos is. Ebből a gondolatmenetből következik, hogy

ha f Riemann-integrálható [a, b]-n, akkor f ott korlátos.

Felhívjuk a gyelmet, hogy van olyan korlátos függvény, ami nem Riemann-integrálható. Tekintsük a

Dirichlet-függvényt!
Láthatóan f korlátos [0, 1]-en, de nem Riemann-integrálható, mert minden Φ ∈ FO[a, b] esetén sf(Φ) = 0 és Sf(Φ) = 1, így

Most már példát is mutattunk nem Riemann-integrálható függvényre! Feltehetjük a kérdést, hogy vajon melyek azok a
függvények, amelyek biztosan Riemann-integrálhatóak? Erre ad választ az alábbi fontos állítás.

Minden, az [a, b] zárt intervallumon folytonos függvény Riemann-integrálható [a, b]-n.

Tehát ha f folytonos egy [a, b] intervallumon, akkor ott integrálható is, azonban ez az állítás szintén nem igaz
visszafelé. Vegyük például az

[0, 2]-n nem folytonos függvényt, ami integrálható [0, 2]-n (18.4. ábra).

18.4. ábra
A Riemann-integrál formális tulajdonságai
Hasonlóan a határozatlan integrálhoz, a Riemann-integrálra is érvényesek bizonyos műveleti tulajdonságok.

Legyen f, g ∈ R[a, b], akkor f + g ∈ R [a, b] és

Ha f, g ∈ R[a, b], akkor f – g ∈ R[a, b] és

Ha f ∈ R[a, b], és c ∈ R tetszőleges szám, akkor c · f ∈ R[a, b], és

Ha a Riemann-integrál szemléletes jelentésére gondolunk, azaz az integrál a „függvény görbéje, és a vízszintes tengely
által határolt síkidom előjeles területe”, akkor az előbbi állítások láthatóan teljesülnek. Például, ha az f és g függvényeket
összeadjuk, akkor az f + g függvény görbe alatti területe a két függvény görbe alatti területének az összege (18.5. ábra).
Az |f| és a szorzatfüggvény Riemann-integrálhatóságáról szólnak az alábbi állítások.

18.5. ábra

Ha f ∈ R[a, b], akkor |f| ∈ R[a, b].

De sajnos nem igaz, hogy .

Például .

Ha f, g ∈ R [a, b], akkor f · g ∈ R [a, b].

Itt sem teljesül, hogy


Még két tulajdonság könnyedén látható az integrál szemléletes jelentéséből.

Legyen f ∈ R[a, b], a ≤ α < β ≤ b, ekkor f|[α, β] ∈ R[α, β].

Ez azt jelenti, hogy ha f Riemann-integrálható [a, b]-n, akkor [a, b] egy részintervallumán f leszűkítése is nyilván
integrálható.

Legyen f: [a, c] →R függvény, a < b < c. Tegyük fel, hogy f ∈ R[a, b] és f ∈ R[b, c]. Ekkor f ∈ R [a, c] és
A 18.6. ábrából szépen látható, hogy miről szól ez az állítás.

18.6. ábra

Ebben a részben közlünk az integrálról egy jelölésbeli megállapodást is. f ∈ R [a, b] esetén jelölje

Az integrál az integrandus szerint monoton, ezt matematikailag úgy fogalmazzuk meg, hogy

ha f, g ∈ R[a, b] függvények, és minden x ∈ [a, b] esetén f(x) ≤ g(x), akkor

Ehhez csak azt kell meggondolnunk, hogy minden Φ ∈ FO[a, b] esetén sf(Φ) ≤ sg(Φ), amiből

Az integrandus szerinti monotonitás következménye, hogy

bármely f ∈ R [a, b] függvényre fennáll:

Ugyanis, minden x ∈ [a, b] esetén − |f(x) | ≤ f(x) ≤ | f(x) |, így . Az első egyenlőtlenséget (–1)-

gyel beszorozva és a (–1)-es szorzót kiemelve , amiből is használva .


Az integrálra triviális becslést is adhatunk.

Legyen f ∈ R[a, b]. Ekkor

A bizonyítás azonnal adódik abból, hogy az integrál monoton. Ehhez a fenti állítást az inf f konstans függvényre és f-re,
illetve f-re és a sup f konstans függvényre kell alkalmazni. Ennek az állításnak a következménye:

Legyen f ∈ R[a, b]! Ekkor

Ezen becslések segítségével (folytonos függvényekre) bizonyítható a di erenciálszámításban megismert


középértéktétel analógja Riemann-integrálra.
Az integrálszámítás középértéktétele:
Legyen f:R → R folytonos [a, b]-n. Ekkor létezik olyan c ∈ [a, b], melyre

A Newton–Leibniz-tétel
Ebben a fejezetben azt vizsgáljuk, hogy hogyan lehet kiszámolni egy konkrét függvény Riemann-integrálját egy [a, b]
intervallumon. A következő tétel az egész integrálszámítás legjelentősebb eredménye.

Newton–Leibniz-tétel:
Ha f ∈ R [a, b] és f-nek létezik primitív függvénye [a, b]-n, akkor f minden rögzített F primitív függvényére

A Newton–Leibniz-tétel lehetőséget ad bármely Riemann-integrálható és primitív függvénnyel rendelkező függvény


Riemann-integráljának kiszámítására.

Példák
1.

Tudjuk, hogy , így a Newton – Leibniz-tétel alapján

2.

, az integrál műveleti összefüggései alapján és tudjuk, hogy ∫x–2 dx = –x–1 és ∫ex dx


= ex, így

3.

∫sin x dx = –cos x, tehát

18.7. ábra

A 18.7. ábrából jól látható, hogy miért 0 ez az „előjeles terület”: a [–π, π] intervallumon a sin x függvény görbéje
ugyanakkora területet metsz ki a síkból az x tengely felett és alatt.

A Newton–Leibniz-tétel feltételeit teljesítő függvényekre bizonyíthatók a primitív függvényeknél megismert parciális


és helyettesítéses integrálás szabályai.
Parciális integrálás Riemann-integrálra.
Legyen f, g ∈ R[a, b] és legyen f-nek és g-nek (egy-egy) primitív függvénye F, illetve G. Ekkor

Példák
1.

G(x):= x és f(x):= cos x választással F(x) = sin x és g(x) = 1. Ekkor

Vajon rájöhetünk-e máshogy is arra, hogy az integrál 0? A válasz igen. Ez egy speciális típusú függvény volt:
páratlan függvény, azaz f(–x) = –f(x). Valóban cos (–x) · (–x) = – cos x · x, hiszen tudjuk, hogy cos (x) = cos (–x).
Ha páratlan függvényt integrálunk egy, a 0-ra szimmetrikus intervallumon, akkor az integrál értéke 0 lesz. Jól
szemlélteti ezt a 18.7. ábra is, hiszen az integrál egy „előjeles terület”.
2.

Legyen G(x):= x2 és f(x):= e4x! Ekkor , hiszen F′(x) = f(x) = e4x és g(x) = G′(x) = 2x, így

Még a kifejezést is le kell parciálisán integrálnunk:

most .

Tehát

Úgy osztottuk ki a szerepeket a szorzatban, hogy G legyen az a függvény, amit a deriválás egyszerűsít, és valóban: a
G(x) = x2 függvényt a deriválás egyszerűsíti, a második deriváltja pedig konstans, így lényegében „eltüntettük”, hogy
ne zavarjon minket az integrandusban.

Helyettesítéses integrálás Riemann-integrálra:


Legyen I = [a, b] intervallum, f ∈ R[a, b], és f-nek létezzen primitív függvénye! Legyen továbbá J = [α, β] intervallum, g:
J → I di erenciálható bijekció, melyre (f ◦ g) · g′ ∈ R[a, b]!
Ekkor

Megjegyzés. Ha g bijekció, akkor létezik g–1, és nyilvánvaló, hogy g–1(a) = α és g–1(b) = β az állításban.
Példa. Számítsuk ki a értékét!
Szeretnénk a helyettesítéses integrál képletét alkalmazni! Vegyük észre, hogy ha f(x) = akkor

és g ′ (x) = ex, így , vagyis az integrandus, emellett g–1(x) = In x,


így g–1(1) = ln 1 = 0 és g–1(e) = ln e = 1, így

Megjegyezzük, hogy a primitívfüggvény-számításnál ugyanígy levezethetők ezek a példák, mint itt, például az előbbi
példából látszik, hogy

Illetve, azt is megtehetjük, hogy a primitívfüggvény-számításnál elhangzott helyettesítéses képlet segítségével


kiszámítjuk az integrandus primitív függvenyét, és utána alkalmazzuk a Newton–Leibniz-formulát, így elkerülhetjük
ennek a bonyolult képletnek a használatát. Ugyanezek az észrevételek a parciális integrálással kapcsolatban is
elmondhatók.

Integrálfüggvények

Az f ∈ R[a, b] függvény integrálfüggvényei az [a, b] intervallumon értelmezett

függvények, ahol c ∈ R tetszőleges, rögzített szám.

Megjegyzés. Mivel x ∈ [a, b], így [a, x] ⊂ [a, b] és ezért a megfelelő állítást használva f ∈ R[a, x], vagyis az

kifejezés értelmes. Látható, hogy bármely integrálfüggvényhez konstanst hozzáadva


integrálfüggvényt kapunk.
Példa. Számoljuk ki a f(x) = sin x + 1 egy integrálfüggvényét!

Legyen például c = 0, ekkor egy integrálfüggvény: . Mivel f egész R-en értelmezett függvény, így
a de níció szerint tetszőleges a ∈ R számot választhatok. Legyen például a = 0, ekkor f egy integrálfüggvénye:

dt.

Észrevehető, hogy a példában lévő integrálfüggvény megegyezik f egy primitív függvényével. A továbbiakban azzal
foglalkozunk, hogy mikor egyeznek meg egy függvény primitív és integrálfüggvényei.
Meg kell említenünk az integrálfüggvények egy fontos tulajdonságát:

Bármely f ∈ R[a, b] bármely integrálfüggvénye folytonos [a, b]-n.

Felhívjuk a gyelmet, hogy attól, hogy f Riemann-integrálható, még nem biztos, hogy van primitív függvénye, és lehet
olyan, hogy f-nek van primitív függvénye, mégsem Riemann-integrálható. A következő állítás tisztázza az összefüggést a
határozott integrálok és a primitív függvények között.

Ha f ∈ R [a, b] és f-nek létezik primitív függvénye, akkor f primitív függvényeinek ∫f halmaza megegyezik f
integrálfüggvényeinek halmazával. Ez azt is jelenti, hogy ekkor f integrálfüggvényei di erenciálhatók, és deriváltjuk
éppen f, azaz

Megjegyzés. Az állításban x szerint deriváltunk.

Tehát az állítás feltételeinek teljesülése mellett ha f ∈ R[a, b], akkor van integrálfüggvénye, ami primitív függvény is.
Ha f-nek van primitív függvénye, akkor az integrálfüggvény is, és akkor könnyen látható, hogy f Riemann-integrálható.
Nézzük meg, hogy mit lehet tudni egy Riemann-integrálható és folytonos függvény integrálfüggvényeiről!

Ha f ∈ R[a, b] és f folytonos az x ∈ [a, b] helyen, akkor f bármely F integrálfüggvénye di erenciálható x-ben, és


deriváltja F′(x) = f(x).

Ebből következik, hogy

ha f folytonos [a, b]-n, akkor f-nek van primitív függvénye [a, b]-n (éspedig bármely integrálfüggvénye az).

Ugyanis, ha f folytonos [a, b]-n, akkor ott Riemann-integrálható is, és akkor létezik F integrálfüggvénye, ami az előbbi
állítás alapján primitív függvénye is f-nek [a, b]-n.

Improprius integrál
Ki szeretnénk terjeszteni a Riemann-integrál fogalmát nyílt, félig nyílt és nem korlátos intervallumokra.

Legyen I intervallum, f: I → R függvény.


Azt mondjuk, hogy f lokálisan integrálható I-n, ha f ∈ R[a, b] minden [a, b] ∈ I esetén. Jelölés: f ∈ Rloc(I).

Megjegyzés. Könnyen látható, hogy ha I = [a, b], akkor Rloc[a, b] = R[a, b].

Legyen f: I → R függvény! Azt mondjuk, hogy f impropriusan integrálható I-n, ha f ∈ Rloc(I), és f-nek létezik olyan F
integrálfüggvénye I-n, melyre

Ekkor f improprius integrálja I-n:

Megjegyzés. Ha a fenti feltételek mellett a és határértékek léteznek, de egyikük végtelen, a másik


véges; vagy ellenkező előjelű végtelenek, akkor szokás azt mondani, hogy f improprius integrálja (+ vagy –) végtelen,
de mi az improprius integrálhatóságon csak a véges improprius integrálú függvények integrálhatóságát értjük.

Látható, hogy ezzel a de nícióval kiterjesztettük a Newton–Leibniz-tétel öszszefüggését, ugyanis ha f ∈ R[a, b], akkor F
integrálfüggvénye folytonos az a és b végpontokban, ezért határértékei is léteznek, és megegyeznek a helyettesítési
értékkel, vagyis ekkor a Newton–Leibniz-tételt kapjuk vissza.

Példák improprius integrál létezésének vizsgálatára és kiszámítására:


1.
Ennek a függvénynek egy primitív függvénye: .
F(x)-nek 1-ben nyilván létezik határértéke, minden p esetén, de mi a helyzet a +∞-ben vett határértékével:
. Vagyis pontosan akkor improprius integrálható f, ha p > 1.
2.

Az előző példából következik, hogy pontosan akkor improprius integrálható f, ha p < 1.


3. f: [0, +∞) → R, f(x) = e–x és ∫f = –e–x (18.8. ábra).

18.8. ábra

Most nézzük meg, hogy milyen feltételek segítségével látható be, hogy egy függvény improprius integrálható-e.

Cauchy-féle szükséges és elégséges feltétel improprius integrálhatóságra: Legyen f ∈ Rloc(I). Ekkor f pontosan akkor
impropriusan integrálható I-n, ha minden ϵ > 0 esetén léteznek olyan a, b ∈ I, inf I < a ≤ b > sup I számok, hogy

Példa a Cauchy-féle feltétel alkalmazására:

Parciális integrálással kapjuk:

Ebből

Vagyis teljesül f-re a Cauchy-feltétel, így improprius integrálható, bár az integrál értékét nem tudtuk kiszámolni.

Összehasonlító kritérium:
Legyen f ∈ Rloc(I)! Tegyük fel, hogy léteznek α, β ∈ I, inf I < a ≤ β > sup I számok és g1: I ∩ (–∞, α] → [0, +∞), g2: I ∩ [β, + ∞)
→ [0, +∞) függvények, melyek improprius integrálhatók, és majorálják f-et, vagyis
Ekkor f improprius értelemben integrálható I-n.

Ennek triviális következménye a következő állítás:

Ha f ∈ Rloc(I) és |f| improprius értelemben integrálható I-n, akkor f is improprius értelemben integrálható I-n.

Példa az összehasonlító kritérium alkalmazására:


2
f: (−∞, +∞) → R, f(x) = e−x .
2 2
∀ x ∈ (−∞, −1]: e−x ≤ ex és ∀ x ∈ [1, +∞): e−x ≤ e−x. Ezeken az intervallumokon mindkét majoráló függvény improprius
integrálható, így f is az lesz R-en, hiszen a [–1, 1] zárt intervallumon az f folytonos függvény Riemann-integrálható.

18.3. Numerikus integrálás


Az előző részben láthattuk, hogy hogyan kell kiszámítani egy f függvény integrálját egy [a, b] intervallumon a Newton–
Leibniz-szabály segítségével: elég ismerni f primitív függvényét. Mi lehet a megoldás abban az esetben, ha f primitív
függvénye nagyon bonyolult vagy nehezen kiszámítható? Erre a problémára jelenthet megoldást a numerikus integrálás
módszere.
A módszer bemutatása előtt azonban fontos beszélnünk a polinominterpoláció vagy polinomapproximáció
fogalmáról. Egy polinominterpolációs feladatnál adott f: R → R függvényt szeretnénk közelíteni egy p : R → R
polinommal.

Legyenek adva n ∈ N és xk ∈ R (k = 0, …, n) különböző interpolációs alappontok és a pontokhoz tartozó


függvényértékek: f(xk) (k = 0, …, n). Erre az n + 1 darab (xk, f(xk)) pontra szeretnénk egy legfeljebb n-edfokú p
interpolációs polinomot illeszteni. Ez azt jelenti, hogy egy olyan n-edfokú p polinomot keresünk, melyre p(xk) = f(xk),
minden k = 0, …, n esetén.

Belátható, hogy ilyen n-edfokú p polinom létezik és egyértelmű, azaz egyetlen ilyen tulajdonságú polinom van.

Ez ap polinom könnyedén meg is határozható adott alappontok és f függvény esetén. Ehhez tekintsük a következő
de níciót!

Legyenek adva n ∈ N és xk ∈ R(k = 0, …, n) és különböző interpolációs alappontok. Ekkor a

n-edfokú polinomokat Lagrange-féle alappolinomoknak nevezzük k = 0, …, n esetén.

Láthatóan ezekre a polinomokra teljesül, hogy

E polinomok segítségével kaphatjuk meg a p polinomot.

Az interpolációs feladat megoldása:

Ezt az n-edfokú pn polinomot Lagrange-féle interpolációs polinomnak nevezzük.

Ellenőrizzük, hogy pn valóban az interpolációs feladat megoldása-e! Mivel pn n-edfokú, így elegendő megnézni, hogy
pn(xt) = f(xi) (i = 0, …, n) teljesül-e.

Tehát tetszőleges i = 0, …, n esetén pn interpolál, azaz az interpolációs feladat megoldása.

Megjegyzés. Kihasználtuk a Lagrange-féle alappolinomok előbb említett tulajdonságát.


Most térjünk vissza a numerikus integrálás témaköréhez! Ahelyett, hogy a primitív függvény segítségével

kiszámolnánk az pontos értékét, szeretnénk közelíteni azt. A Lagrange-interpoláció segítségével f-et


közelítjük a pn polinommal; ehhez válasszunk xk ∈ [a, b] (k = 0, …, n) alappontrendszert, majd az alappolinomok

segítségével felírjuk a Lagrange-féle interpolációs polinomot. Észszerű lenne

közelíteni:

Tehát .

A formulát kvadratúrának nevezzük, a kvadratúra Ak együtthatói a Lagrange-féle alappolinomok

integráljai, azaz .

Az integrál közelítésére felírt kvadratúrát interpolációs típusúnak nevezzük, ha,

, ahol lk(x) polinomok a Lagrange-féle alappolinomok.

Egy kvadratúra akkor és csak akkor pontos minden legfeljebb n-edfokú polinomra, ha interpolációs

típusú. Azaz minden legfeljebb n-edfokú f polinomra ⇔

Newton–Cotes-kvadratúraformulák
Érintőformula
Trapézformula
Simpson-formula
Összetett formulák

Newton–Cotes-kvadratúraformulák

Legyen xk ∈ [a, b] (k = 0, …, n) olyan alappontsorozat, hogy xk = a + kh (k = 0, …, n), ahol . Az ilyen


alappontokat ekvidisztáns alappontrendszernek nevezzük, mert bármely két egymással szomszédos alappont
távolsága állandó, azaz xk – xk – 1 = h (k = 1, …, n), Az ekvidisztáns alappontrendszerhez tartozó interpolációs
kvadratúraformulát zárt Newton–Cotes-formulának nevezzük.

Az elnevezésben a „zárt” jelző arra utal, hogy az alappontrendszer az a és b végpontokat is tartalmazza (x0 = a és xn = b),
így összesen n + 1 alappontunk van. Ha a végpontokat nem vesszük bele az ekvidisztáns alappontrendszerbe, akkor
nyílt Newton–Cotes-formuláról beszélünk, ebben az esetben csupán n – 1 alappontunk van: x1, x2, …, xn – 1, de itt is
teljesülnie kell annak a feltételnek, hogy a szomszédos alappontok távolsága h, sőt még x1 – a = b – xn–1 = h.

A továbbiakban néhány fontos és egyszerű Newton–Cotes-típusú formulát ismertetünk.


Érintőformula

Ez egy nyílt Newton–Cotes-formula, egy alappontja van: , ami az [a, b] intervallum felezőpontja. Ehhez az
interpolációs alapponthoz tartozó Lagrange-féle alappolinom: l1(x) = 1 (hiszen az 1 darab alapponthoz 0-adfokú

alappolinom tartozik). A kvadratúra együtthatója: . A közelítés:


Így az érintőformula:

A formulát a 18.9. ábra szemlélteti.

18.9. ábra

Trapézformula
Ez egy zárt formula két alapponttal: x0 = a és x1 = b. A két alappontra elsőfokú Lagrange-interpolációt végzünk, az

alappolinomok:
A kvadratúra együtthatói:

Így a trapézformula:

18.10. ábra

A 18.10. ábrából látható, hogy ha az f nem negatív függvény, akkor a trapézformula az (a, 0), (a, f(a)), (b, f(b)), (b, 0)
pontok által meghatározott trapéz területét adja, így már érthető az elnevezés. Nyilván, ez a formula nem pontos
tetszőleges függvényre. A következő állítás a formula hibájáról ad felvilágosítást.

Legyen f ∈ C2 [a, b], és jelölje a trapézformula hibáját!

Ekkor , ahol ξ ∈ (a, b).


Simpson-formula

Ez egy zárt formula három alapponttal: x0 = a, és x2 = b, így az alappontok az [a, b] intervallumot két egyenlő
részre osztják. Ezekre az alappontokra illesztett alappolinomok integráljai, azaz a kvadratúra együtthatói a következők:

Tehát a Simpson-formula

A következő állítás a formula hibájáról szól.

Legyen f ∈ C3[a, b], és jelölje a Simpson-formula hibáját! Ekkor

, ahol ξ ∈ (a, b).

Összetett formulák
Ha az [a, b] intervallumot m egyenlő részre osztjuk, és minden ilyen részintervallumon alkalmazzuk a trapézformulát,
majd a kapott részintervallumokon az f közelített integrálját összegezzük, akkor az összetett trapézszabályt kapjuk meg.

Az összetett trapézszabály az (i= 0, 1, …, m) alappontokkal:

Nyilván ez a formula sokkal pontosabb az egyszerű trapézszabálynál, és m növelésével egyre pontosabbá válik.

Ugyanígy járhatunk el a Simpson-formulánál is. Az [a, b] intervallumot egyenlő részre osztjuk (persze m páros),

az alappontok (i= 0, 1, …, m) lesznek. Minden [x2k, x2k + 2] részintervallumon alkalmazzuk a Simpson-


formulát. Az összetett Simpson-formula így a következő lesz:

Megjegyezzük, hogy rengeteg Newton–Cotes-típusú kvadratúraformula létezik, attól függően, hogy nyílt vagy zárt
formulát használunk, és mennyi alappontot veszünk. Emellett még arra is felhívjuk a gyelmet, hogy nemcsak Newton–
Cotes-típusú kvadratúrák vannak.

A Gauss-típusú kvadratúraformulák esetén az xk, Ak(k = 0, …, n) értékeket úgy választjuk meg, hogy a kvadratúra
minél magasabb fokú polinomokra is pontos legyen. A Csebisev-típusú kvadratúraformulák esetén az xk ∈ [a, b] (k =

0, …, n) alappontokat úgy adjuk meg, hogy a kvadratúraegyütthatói megegyezzenek, azaz legyen Ak = A,


minden k = 0, …, n esetén. Így könnyebb lesz számolni vele.

Példa. Adjuk meg közelítő értékét az egyszerű trapézformula, majd az összetett trapézformula
segítségével! Végül számoljuk ki az integrál pontos értékét a primitív függvény segítségével!

Most számoljuk ki az integrál pontos értékét a Newton–Leibnitz-szabály segítségével:

Látható, hogy a trapézformulánál az összetett trapézszabály sokkal pontosabb eredményt adott.

18.4. Integrálszámítás alkalmazásai (terület, térfogat, ívhossz)

Területszámítás
Ívhosszúság-számítás
Forgástestek térfogata

Területszámítás
Mint már említettük, az integrálszámítás felhasználható síkidomok területének kiszámítására. Emlékezzünk vissza, hogy
ha f:R → R függvény folytonos, és f ≥ 0 [a, b]-n, akkor az [a, b] intervallumon az f függvény görbéje és az x tengely közötti
rész területe pontosan az f függvény [a, b]-n vett integráljával egyezik meg.

Azaz, ha f: R → R függvény integrálható [a, b] intervallumon, és A:= {(x, y) ∈ R2: a ≤ x ≤ b, 0 ≤ y ≤ f(x)}, akkor az A halmaz
területe a következő:

Felhívjuk a gyelmet, hogy ha f ≤ 0 [a, b]-n, akkor –f ≥ 0 [a, b]-n, és a görbe alatti terület,

, tehát Azaz, ha f ≤ 0 [a, b]-n, akkor negatív, vagyis az


integrál egy „előjeles” terület, tehát negatív is lehet.

Példák
1. Számítsuk ki a függvény görbe alatti területét a [0, 2] intervallumon!

Tehát a görbe alatti terület területegység (18.11. ábra).

18.11. ábra
2. Mekkora területet határolnak az y = 1, y = e–x és x = –3 egyenletű görbék?
Nézzük meg, hogy hol metszi egymást az y = 1 és y = e–x görbe, ezt úgy számoljuk ki, mintha az

kétismeretlenes egyenletrendszert oldanánk meg!


Tehát 1 = e–x, amiből x = 0, és természetesen y = 1, így a (0, 1) pontban metszi egymást a két görbe. Ezek után már
látszik, hogy a három görbe által határolt halmaz:
A:= {(x, y) ∈ R2: –3 ≤ x ≤ 0, 1 ≤ y ≤ e–x} (18.12. ábra).

18.12. ábra

Vegyük a B :={(x, y) ∈ R2: –3 ≤ x ≤ 0, 0 ≤ y ≤ e–x–1} halmazt. Láthatóan az A és a B halmaz területe megegyezik. Így ha
az f(x) = e–x – 1 függvényt integráljuk a [–3, 0] intervallumon, akkor a B, azaz az A halmaz területét kapjuk meg.

Vagyis a görbék által határolt terület 15,9 egység. Felhasználtuk, hogy e ≅ 2,71.
3. Számítsuk ki az f(x) = 3x2 + 3x – 1 és a g(x) = 2x2 – 5x – 8 parabolák által határolt területet! Ehhez először meg kell
határoznunk a két gra kon metszéspontjait:

Tehát x1 = –1 és x2 = –7, és így y1 = f(x1) = 3 · (–1)2 + 3 · (–1) – 1 = –1, és y2 = f(x2) = –3 · (–7)2 + 3 · (–7) – 1 = 147 – 21 – 1 = 125,
vagyis a két metszéspont: (–1, –1) és (–7, 125). Ez azt jelenti, hogy a [–7, –1] intervallumon kell integrálnunk a g(x) –
f(x) függvényt (18.13a ábra). Azért ezt a függvényt, mert ezen az intervallumon g(x) ≥ f(x) (18.13b ábra).
(Megjegyzés: a 18.13b ábra nem arányos!)

18.13. ábra

Tehát a keresett terület:

4. Számítsuk ki az r > 0 sugarú kör területét! A sík x2 + y2 = r2 egyenletet kielégítő (x, y) pontjai pontosan az origó
középpontú, r sugarú kör pontjai (18.14. ábra).
18.14. ábra

Először a felső félkör területét fogjuk kiszámolni, ami megegyezik az függvény görbéje és az x
tengely által bezárt területtel. f(x) és az x tengely metszete: (0, –r) és (0, r). Tehát a felső félkör területe:

Az x = r sin u helyettesítéssel élünk, azaz a g(u) = r sin u függvénnyel komponáljuk az f függvényt:

Megjegyzés. Kihasználtuk a cos2 u = 1 – sin2 u és a összefüggéseket, és hogy g(u) bijekció a

intervallumon.

Ívhosszúság-számítás
Emlékeztetünk ennek a résznek a legfontosabb fogalmára:

Egy folytonos, paraméterezett görbe egy φ : [a, b] → Rn folytonos leképezés az [a, b] intervallumról Rn-be.

Legyen φ: [a, b] → Rn folytonos, paraméterezett görbe.


φ egy beírt töröttvonala egy φ (t0) φ (t1) … φ(tn) töröttvonal, ahol a = t0 < t1 < … < tn = b. A görbe rekti kálható, ha a
beírt töröttvonal hosszának van egy véges l határértéke, miközben max {|ti – ti–1|: 1 ≤ i ≤ n} → 0. Ez esetben l a görbe
ívhossza.

Ha a φ: [a, b] → Rn folytonos, paraméterezett görbe folytonosan di erenciálható, akkor φ rekti kálható, és ívhossza:

Ha egy f: [a, b] → R folytonosan di erenciálható függvény gra konjának mint síkbeli görbének az ívhosszát

szeretnénk meghatározni, akkor a függvényt, azaz a folytonos, paraméterezett


görbét kell vizsgálnunk, φ: [a, b] → R2 folytonosan di erenciálható, hiszen a φ1(t) = t és a φ2(t) = f(t)
koordinátafüggvények folytonosan di erenciálhatók. Tehát a φ görbe rekti kálható, és ívhossza:
Példa. Számítsuk ki a φ: [–π, π] → R2 görbe ívhosszát, ha
Vegyük észre, hogy ez az r sugarú, origó középpontú kör paraméterezése. φ folytonosan di erenciálható, így
rekti kálható, és ívhossza

Ezzel beláttuk, hogy az r sugarú, origó középpontú kör ívhossza, azaz kerülete: 2rπ.

Forgástestek térfogata

Legyen f: [a, b] → R függvény folytonos [a, b]-n, és legyen f ≥ 0! Képzeljük el az f függvény gra konját a kétdimenziós
koordináta-rendszerben (x tengely és y tengely), és vegyük hozzá a z tengelyt, hogy térbeli koordináta-rendszerünk
legyen.
Az f függvény által meghatározott forgástesten a tér azon (x, y, z) koordinátájú pontjait értjük, melyekre teljesül, hogy

A forgástestet szemléletesen úgy kapjuk, hogy az f függvény gra konját a térbeli koordináta-rendszerben
megforgatjuk az x tengely körül (18.15. ábra).

18.15. ábra

Ha f: [a, b] → R függvény folytonos [a, b]-n, és f ≥ 0, akkor az f függvény által meghatározott forgástest térfogata a
következő formulával számítható ki:

Megjegyzés. Az állításban a feltételeket úgy határoztuk meg, hogy f2 minden esetben integrálható legyen.
Példák
1. Kúp és csonka kúp térfogata.
Adjuk meg az f(x) = 3x által meghatározott forgástest térfogatát a [0, 5] és a [2, 5] intervallumban (18.16. ábra)!
18.16. ábra

Ha f gra konját megforgatjuk az x tengely körül, akkor ha a [0, 5] intervallumon nézzük a forgástestet, akkor egy
kúpot kapunk, melynek magassága 5, alapkörének sugara pedig 3·5. Ha pedig a [2, 5] intervallumon vizsgáljuk a
forgástestet, akkor csonka kúpot kapunk, melynek magassága 3, és az alapkörének sugara 15, míg a fedőlap
körének sugara 6. Nézzük meg mi lesz a kúp térfogata:

A csonka kúp térfogata:

2. Gömb térfogata.
Adjuk meg az függvény által meghatározott forgástest térfogatát a [–r, r] intervallumban! Ez az f
függvény az origó középpontú, r sugarú kör felső körívét adja meg, mint azt már láthattuk az előbbi részeknél. Ha
tehát megforgatjuk a függvény gra konját az x tengely körül, akkor az r sugarú gömböt kapjuk.
Számítsuk ki ennek a testnek a térfogatát:

18.5. Többváltozós integrál

Téglalapon vett integrál


Integrálás normáltartományon
Integráltranszformáció

Téglalapon vett integrál


Ebben a részben kétváltozós függvényekre általánosítjuk a Riemann-integrál fogalmát.

Legyen f: [a, b] × [c, d] → R kétváltozós függvény! Vegyük az [a, b] intervallum a = x0 < x1 < x2 < … < xn = b felosztását,
jelöljük ezt Φ = {I1, I2, …, In} ∈ FO [a, b]-vel, és a [c, d] intervallum c = y0 < x1 < y2 < … < ym = d felosztását, jelöljükΨ = {J1,
J2, …, Jm} ∈ FO [c, d]-vel. Legyen ξ = (ξ1, …, ξn) ∈ Rn tetszőleges, a Φ felosztás egy osztópontvektora, vagyis ξi ∈ Ii, t = 1,
…, n, és η = (η1 …, ηm) ∈ Rm tetszőleges, a Ψ felosztás egy osztópontvektora, ηj ∈ Jj, j = 1, …, m. (Azaz ξ ∞ Φ és η ∞ Ψ.)
Ekkor a

számot az f függvény (Φ, Ψ, ξ, η) négyeshez tartozó Riemann-közelítőösszegének nevezzük.

Szemléletesen ez az összeg a [xi–1, x] × [yj–1, yj] téglalap alaplapú, f(ξi, ηj) magasságú hasábok „előjeles” térfogatának az
összege. (Hiszen az f(ξi, ηj) számok negatívak is lehetnek.)

Legyen f: [a, b] × [c, d] → R kétváltozós függvény! Ha van olyan A ∈ R szám, hogy minden ϵ > 0 számhoz létezik olyan δ >
0, hogy minden Φ ∈ FO[a, b] és Ψ ∈ FO[c, d], |Φ| < δ, |Ψ| < δ felosztások, és minden ξ ξ Φ, η > Ψ osztópontvektorok
esetén

akkor azt mondjuk, hogy f Riemann-integrálható T: = [a, b] × [c, d] téglalapon, és f Riemann-integrálja A, azaz
.

Szemléletesen a de nícióból következik, hogy az szám az f felület alatti

térrész előjeles térfogata, azaz az xy sík alatti területet negatív előjellel számolja.
Belátható, mint az egyváltozós esetben, hogy

ha f: [a, b] × [c, d] → R folytonos függvény, akkor Riemann-integrálható, azaz a Riemann-közelítőösszegeknek létezik


határértéke.

Látható, hogy kétváltozós esetben ugyanolyan gondolatmenettel de niáltuk az integrált, mint az egyváltozós esetben.
Azonban míg az egyváltozós esetben a primitív függvények segítségével az integrálok egyszerűen kiszámíthatóak, a
kétváltozós esetben nem tudjuk alkalmazni „egy az egyben” ezt a technikát, hiszen nem tudjuk de niálni egy kétváltozós
függvény primitív függvényét.
A következő tétel arra ad választ, hogy hogyan tudjuk ebben az esetben könnyedén kiszámolni egy kétváltozós
függvény integrálját.

Fubini-tétel:
Legyen f: [a, b] × [c, d] → R, f folytonos az [a, b] × [c, d] téglalapon. Ekkor

A tétel kapcsán tisztáznunk kell, hogy mit jelent például az kifejezés.

Az f kétváltozós függvényre úgy nézzünk rá, mint egy egyváltozós függvényre: rögzítrsük le y-t, vagyis tekintsük
konstansnak, és vegyük az x ↦ f(x, y) egyváltozós függvényt!

Az kifejezés jelentse az x ↦ f(x, y) függvény Riemann-integrálját az [a, b] intervallumon. (Látható, hogy a


dx tag jelzi nekünk, hogy y-t kell lerögzítenünk.)

Ezt az eljárást alkalmazzuk, akkor azt mondjuk, hogy x szerint integrálunk, és f x szerinti integrálja .

Ugyanígy de niáljuk f y szerinti integrálját is, azaz .

Megjegyzés. Ez a de níció analóg a parciális deriváltak fogalmával, csak itt integrálni kell. Nézzük meg, hogy mit
jelent ez a gyakorlatban:

Tekintsük a g:x ↦ x2y – ey + 2x egyváltozós függvényt!

Ennek egy primitív függvénye: , hiszen G′(x) = x2y – ey + 2x.

(Gondolhatunk a x szerinti parciális deriváltjára is.) Így alkalmazható a Newton–


Leibniz-tétel:

Látjuk, hogy az y-nak egy függvénye lesz, az x változó eltűnt. Ezt úgy is szoktuk mondani, hogy
kiintegráltuk x-et a kifejezésből. Nézzük, mi lesz, ha y szerint integrálunk!
Vegyük a h : y ↦ x2y–ey + 2x egyváltozós függvényt!

Ennek egy primitív függvénye: , hiszen H′(y) = x2y–ey + 2x. Így

Most y-t integráltuk ki, az eredmény csak x függvénye.

Megemlítjük, hogy ha az integrált szeretnénk kiszámolni, akkor mivel y3 itt konstansnak tekinthető, így

akár az integrálból ki is emelhető, azaz , és így az integrált már


könnyedén ki is számoltuk.
Ezek után álljon itt egy példa a Fubini-tétel alkalmazására!

Integráljuk az f(x) = sin x · sin y függvényt a téglalapon! Ez a függvény folytonos, így alkalmazható
a Fubini-tétel:

Számoljuk ki értékét:

Így

Megjegyezzük, hogy Fubini tétele szerint az integrálást is elvégezhettük volna, és az


eredmény ugyanaz lenne, azaz

Megjegyezzük, hogy egy n-dimenziós téglatesten történő integrálás hasonlóan végezhető el. Háromdimenziós példát a
következő részben láthatunk.

Integrálás normáltartományon
A téglalapon vett integrálás kiterjeszthető kicsit bonyolultabb térrészeken való integrálásra is.

Legyen α: [a, b] → R, β: [a, b] → R olyan folytonos függvények, melyekre α(x) < β(x) minden x ∈ [a, b] esetén. Szeretnénk
az α és β függvények által határolt tartományon integrálni az [a, b] intervallumon, azaz a

tartományon. Ezt a tartományt az x tengely szerinti normáltartománynak nevezzük (18.17. ábra).


18.17. ábra

Az f: Nx → R folytonos függvény integrálját az Nx tartományon a következő képlettel számolhatjuk ki:

Vigyázat, itt már a két integrál nem cserélhető fel egymással!


Megmutatható, hogy ez a képlet valóban az f felület alatti

térrész előjeles térfogatát adja.

Példa. Legyen α(x) ≡ 0 és β(x) = x(x – 2) a [0, 2] intervallumon, az ezen függvények és intervallum által meghatározott
Nx normáltartományon integráljuk az f(x) = xy függvényt (18.18. ábra)!

18.18. ábra

Integráltranszformáció
Emlékezzünk vissza a helyettesítéses integrál témakörére. Ott a helyettesítés segítségével egy bonyolult integrált
egyszerűbb alakra tudtunk hozni, és így már könnyebben ki tudtuk számolni. Több dimenzióban is szeretnénk egy hasonló
fogalmat bevezetni, melynek segítségével egy bonyolultabb halmazon vett integrált téglalapon vett integrállá
transzformálhatunk.

Integráltranszformáció:
legyen H ⊂ Rn halmaz és G: H → Rn olyan injektív függvény, melyre a ∂i;Gk: H → R parciális derivált függvények
léteznek és folytonosak a H halmazon, i = 1, … n, k = 1, …, n.
Ekkor minden a G(H) halmazon integrálható f: G(H) → R függvényre

Megjegyzés. Mivel G: Rn → Rn függvény, így a hozzá tartozó

Jacobi-mátrix n × n-es lesz, vagyis kiszámolható a determinánsa


bármely x ∈ H pontban.

Látható, hogy ez a formula az egydimenziós helyettesítéses integrál általánosítása több dimenzióra.


A legfontosabb példa a polártranszformáció.
Síkbeli polártranszformáció. n = 2 esetén az olyan transzformációkat nevezzük síkbeli polártranszformációknak,
melyeknél

Így ha H = [0, R] × [0, 2π), akkor G(H) az origó középpontú, R sugarú kör, vagyis ebben az esetben egy körön való
integrálást téglalapon vett integrálássá transzformálhatunk.

Példa. Számítsuk ki az R sugarú kör területét a polártranszformáció segítségével! Ehhez az f(x, y) ≡ 1 függvényt kell
integrálnunk az origó középpontú, R sugarú körön. Először kiszámoljuk det G′(r, φ) értékét:

mert cos2φ + sin2φ = 1.


Végezzük el a transzformációt! Legyen H = [0, R] × [0, 2π), ekkor

Megjegyzés. Az alakú integrált a következő módon számoltuk ki:

ugyanis az integrálban lévő „konstanst” kiemeltük.

Térbeli polártranszformáció. Ebben az esetben, azaz ha n = 3, akkor az olyan transzformációkat nevezzük térbeli
polártranszformációknak, melyeknél

Ekkor, ha , akkor G(H) az origó középpontú, R sugarú gömb a háromdimenziós


térben. Tehát a térbeli polártranszformáció azért fontos, mert ennek a segítségével egy gömbön való integrálást téglatesten
vett integrálássá transzformálhatunk.

Példa. A polártranszformáció segítségével is számítsuk ki a gömb térfogatát!

Megint az f(x, y, z) ≡ 1 függvényt kell integrálnunk most a halmazon. Számítsuk ki a


Jacobi-mátrix determinánsát, a harmadik sor szerint kifejtve:

Legyen, ekkor

Nézzük az integrálást!

Megjegyzés. Az integrálási határokat úgy választottuk, hogy det G′(r, φ, υ = r2 cos υ értéke pozitív legyen, így az
abszolút érték jelét elhagyhattuk.

A későbbi fejezetekben még számos példát láthatunk a polártranszformáció alkalmazására.


19. Közönséges di erenciálegyenletek
19.1. Bevezetés
19.2. Elsőrendű egyenletek
19.3. Di erenciálegyenlet-rendszerek
19.4. Magasabb rendű egyenletek
19.5. A Laplace-transzformáció
19.6. Függvénysorok

19.1. Bevezetés
Középiskolában sokat foglalkoztunk különböző egyenletek, egyenletrendszerek megoldásával. Ennél általánosabb, ha egy
egyenletben az ismeretlen nem szám, hanem függvény. Ekkor az egyenletet függvényegyenletnek hívjuk. Ebben a
fejezetben olyan függvényegyenletek megoldásával foglalkozunk, amelyekben egy ismeretlen függvény, az ismeretlen
függvény deriváltja, illetve deriváltjai szerepelnek. Az ilyen egyenleteket di erenciálegyenletnek nevezzük.
A di erenciálegyenletek a természetben, társadalomban zajló folyamatok leírására alkalmasak. Most tekintsünk
néhány zikai, illetve biológiai példát ezekre:
1. Mozgás leírása (kinematika): jelölje x(t), hogy t időpontban hol tartózkodik a test, a pillanatnyi sebességét v(t) = x′(t),
a pillanatnyi gyorsulását a(t) = x″(t). Newton II. törvénye alapján a testre ható erő F = m · a.
Legegyszerűbb eset a szabadesés vizsgálata. Legyen m a test tömege, g a gravitációs állandó. Mivel zikából tudjuk,
hogy F = m · g, ezért a fentiek alapján

A primitív függvény kiszámítására tanult módszerek segítségével

a megoldás, ahol v0 a test kezdősebessége, és x0 jelöli, hogy honnan indult a test.


2. Hőátadás: legyen x(t) t időpillanatban a test hőmérséklete, T a környezet hőmérséklete! Ekkor az erre vonatkozó
di erenciálegyenlet:

ahol K konstans.
3. Populációdinamika: jelölje x(t) t időpontban egy populáció méretét! Ekkor

leosztva h-val és határértéket véve

ahol x0 ∈ R tetszőleges.

A di erenciálegyenlet fogalma
A di erenciálegyenlet megoldásai

A di erenciálegyenlet fogalma
Legyen F : Rn + 2→R folytonos függvény. Ekkor n-edrendű közönséges di erenciálegyenletnek nevezzük a következőt:

Tehát a di erenciálegyenlet rendje a benne szereplő deriváltak maximuma. Megjegyezzük, hogy a


di erenciálegyenletek témakörénél gyakran használják az ẋ(t) jelölést x′(t) helyett. Az n-edrendű közönséges
di erenciálegyenleteknek egy fontos speciális esete a következő:

Legyen f:Rn + 1→R folytonos függvény! Ekkor n-edrendű explicit közönséges di erenciálegyenletnek nevezzük a
következőt:

Bár később még lesz szó ilyen típusú egyenletekről, most is felhívjuk az olvasó gyelmét arra, hogy egy n-edrendű
explicit közönséges di erenciálegyenlet egy elsőrendű rendszerré transzformálható a következő módon.
Legyen x1(t) := x(t), x2(t): = x′(t), …, xn(t): = x(n–1)(t). Ekkor a következők tel jesülnek:

A di erenciálegyenlet megoldásai
Egy di erenciálegyenletet megoldani annyit jelent, hogy meghatározzuk az összes olyan függvényt, amelyek a
deriváltfüggvényeikkel együtt kielégítik a szóban forgó di erenciálegyenletet. Tekintsük a következő példákat!
1. x′(t) = 3t2
Ez egy elsőrendű explicit közönséges di erenciálegyenlet. Ennek általános megoldása az x(t) = t3 + c függvény, ahol c ∈
R tetszőleges szám. Ugyanis, ha

Mivel c tetszőleges, ez végtelen sok megoldáshoz vezet. Ha azonban azt is kikötjük, hogy például x(0) = 5, akkor az x(t) =
t3 + 5 lesz az egyetlen megoldás, mivel x(0) = 3·02 + c = c = 5. Megjegyezzük, hogy lényegében ez egy primitívfüggvény-
keresési feladat volt. Egyszerűbb egyenletek esetében csupán a tanult primitívfüggvény-keresési technikákat kell
alkalmaznunk. A következő példa is ilyen.
2. x″(t) = 6t
Ez már másodrendű explicit közönséges di erenciálegyenlet. Keressük meg a t ↦ 6t függvény primitív függvényét:

ezt tovább „integrálva” a di erenciálegyenlet általános megoldása

ahol c, d ∈ R tetszőleges számok. Tekintsük tehát megint az x(0) = 5 kezdeti feltételt! Ekkor tehát

így az x(t) = t3 + ct + 5 megoldásra jutottunk. Ez még mindig végtelen sok megoldás, tehát még egy feltétel kell. Például
kiköthetjük azt, hogy x′(0) = 3. Ekkor

lesz az egyetlen megoldás.


Látható, hogy az elsőrendű di erenciálegyenlet esetén egy kezdeti feltételre volt szükségünk, hogy egy megoldást
jelöljünk ki a végtelen sok közül, míg a másodrendű di erenciálegyenlet esetén kettő kezdeti feltételre.
Ezek után fogalmazzuk meg a di erenciálegyenlet megoldásának pontos fogalmát!

Legyen D ⊂ R × Rn tartomány, f: D → Rn folytonos függvény, (t0, p0) ∈ D egy pont. Ha az I ⊂ R nyílt intervallumra és az
x: I → Rn di erenciálható függvényre teljesül az, hogy

akkor az x függvényt az I intervallumon az f jobb oldalú explicit közönséges di erenciálegyenlet megoldásának


nevezzük az x(t0) = p0 kezdeti feltétel mellett. Ezt más szóval partikuláris megoldásnak is nevezzük.

Megjegyzés. Partikuláris megoldásnak nevezünk minden olyan megoldást, ami nem tartalmazza a
di erenciálegyenlet összes megoldását.

A di erenciálegyenletek elméletének alapvető kérdése a megoldások egzisztenciájának (létezésének) és unicitásának


(egyértelműségének) vizsgálata. A téma egyszerűbb tárgyalása miatt nem fogunk ezzel a bonyolult kérdéssel most
foglalkozni, csak néhány alapvető di erenciálegyenlet általános megoldásának keresésére adunk módszert. Így feltesszük,
hogy a szóban forgó di erenciálegyenletben az úgynevezett adott függvények folytonosak, és a megoldás során
integrandusként fellépő függvények valamilyen intervallumon mindig integrálhatók.

19.2. Elsőrendű egyenletek


Ebben a részben és általában is az explicit közönséges di erenciálegyenletekkel fogunk foglalkozni. Az elsőrendű explicit
közönséges di erenciálegyenlet általános alakja a következő:

A következőkben néhány egyszerű típusú, valós-valós függvényre vonatkozó di erenciálegyenlet esetében


megmutatjuk, miként lehet a megoldást megkapni.

Szétválasztható változójú egyenletek


Szétválaszthatóra visszavezethető egyenletek
Lineáris di erenciálegyenletek
A Bernoulli-egyenlet
Egzakt közönséges di erenciálegyenlet
Autonóm egyenletek

Szétválasztható változójú egyenletek

Legyenek x, g, h egyváltozós valós függvények, ekkor az

alakra hozható di erenciálegyenleteket szétválasztható változójú di erenciálegyenletnek nevezzük.

Tegyük fel, hogy g folytonos az I intervallumon, és h folytonos a J intervallumon. Továbbá tegyük fel, hogy h(x(t)) ≠ 0
sehol J-n. Ezután az egyenlet mindkét oldalát h(x(t))-vel leosztva a következőre jutunk

Ha most integráljuk mindkét oldalt t szerint, azaz vesszük a primitív függvényüket, akkor
így a helyettesítéses integrálás szabálya alapján:

Legyen

Ekkor H(x(t)) = G(t) + c, ahol c = c1 – c2 az implicit megoldás. Ha H injektív, akkor

az explicit megoldás. Ha H nem injektív, de részintervallumokon az, akkor a részintervallumokon invertáljuk H-t.

Példák
1. x′(t) = ch2(x(t))·t
Mivel ch2 (p) ≠ 0, p ∈ R esetén, ezért leoszthatunk vele. Így

Mivel

a következőt kapjuk:

th (p) injektív R-en, és th–1 (p) = arth(p), így

az explicit megoldás.
2. x′(t) = 1 + x2(t)
Itt h(p) = 1 + p2 és g(t) ≡ 1. Mivel az 1 + p2 függvény sehol sem 0 R-en, ezért leoszthatunk 1 + x2(t)-vel:

lesz az eredmény. Most a primitív függvények a következők lesznek:

Tehát

3. x′(t) = 1 – x2(t)
Ebben a példában g(t) ≡ 1 és h(p) = 1 – p2. Mivel g(p) = 0, ha p = ±1, ezért könnyű végiggondolni, hogy

konstans megoldások. Ezek után tegyük fel, hogy x(t) ≠ ± 1. Ekkor leoszthatunk h(p)-vel:
G(t) ugyanaz lesz, mint az előző példában, H(p) pedig a következő:

Tehát az implicit megoldás

Ebből már könnyen meghatározható az implicit megoldás, ami a következő lesz:

Megjegyezzük, hogy a szétválasztható változójú egyenleteknek létezik két speciális esete, nevezetesen:
1. g ≡ 1, azaz x′(t) = h(x(t)). Ekkor ugyanaz a módszer alkalmazandó, mint az általános esetben.
2. h ≡ 1, azaz x′(t) = g(t). Vagyis itt csak integrálnunk kell, azaz

Szétválaszthatóra visszavezethető egyenletek


Speciális egyenletek visszavezethetők szétválasztható változójúra. Az alábbiakban ezekből mutatunk be két típust.
1. Inhomogén lineáris helyettesítés:
Az egyenlet

alakú, ahol a, b, c ∈ R, b ≠ 0. Ekkor a megoldás módszere a következő. Új ismeretlen függvényt vezetünk be:

Ekkor az egyenlet mindkét oldalát deriválva és rendezve az

összefüggést kapjuk.
Így az egyenletünk a következő lesz:

Az egyenlet mindkét oldalát b-vel szorozva és a-t hozzáadva az alábbi alakhoz jutunk:

Ez már szétválasztható változójú di erenciálegyenlet, ahol h(p) = a + b·f(p), g(t) ≡ 1. Ezt a már ismertetett módon meg
tudjuk oldani z(t)-re, amiből pedig könnyű meghatározni x(t)-t.
2. A homogén egyenlet

alakú. Hogy az ilyen típusú egyenletet meg tudjuk oldani, ismét új ismeretlen függvényt kell bevezetnünk, ami a következő
lesz:

Ezt deriválva a hányadosfüggvény deriválási szabálya alapján


Az egyenlet mindkét oldalát t-vel szorozva:

z(t) de níciója alapján az egyenletet átrendezve

Ezt az eredeti egyenletbe írva:

tehát az egyenletünk a következő lesz

Ez már szétválasztható változójú di erenciálegyenlet.

Példák
1. x′(t) = (3t + x(t) + 2)2
Legyen

Mindkét oldalt deriválva t szerint:

majd x′(t) helyébe z2(t)-t írva, hiszen x′(t) = z2(t):

di erenciálegyenletet kapjuk, amely z-re nézve már szétválasztható változójú di erenciálegyenlet. Itt h(p) = 3 +
p2, ami sehol sem 0 R-en. Így leosztva vele:

Tehát az és az ∫1dt határozatlan integrálokat kell megoldanunk. Az utóbbiról már tudjuk, hogy az t +
c1, így tekintsük az elsőt!

Azaz a primitív függvények a következők:

Ebből x(t)-t a következőféleképpen határozzuk meg.

mindkét oldal tangensét véve pedig azt kapjuk, hogy

Ebből x(t)-t kifejezve


a megoldás.
2.

Tegyük fel, hogy t ≠ 0, és bővítsük a jobb oldalt -vel:

Legyen , amelyből x(t) = t·z(t). Ez utóbbit deriválva:

Ezt a bővített egyenletünkbe helyettesítve:

egyenletet kapjuk, amely már szétválasztható változójú di erenciálegyenlet. Átrendezve:

azaz

Tehát . Mivel h(p) sehol sem vesz fel 0-t, ezért osztva vele:

A határozatlan integrálok a következők:

Ezért

Legyen ln k = c, k > 0, ekkor

írjuk vissza z(t) helyébe , és rendezzük át az egyenletet:

illetve

amelyből ha t-t bevisszük a négyzetgyök alá:

lesz az implicit megoldás.


Lineáris di erenciálegyenletek

Legyenek a, b : R → R folytonos függvények, ekkor az

alakra hozható di erenciálegyenleteket elsőrendű lineáris di erenciálegyenleteknek nevezzük.


A di erenciálegyenlet homogén, ha b(t) ≡ 0, ellenkező esetben inhomogén.

Megjegyzés. Az elsőrendű homogén lineáris di erenciálegyenlet egy speciális alakú szétválasztható változójú
egyenlet, ahol h(p) = p és g(t) = a(t). Azt is megjegyezzük, hogy a homogén lineáris egyenletnek az x(t) ≡ 0 mindig
megoldása, ezért ezek után ezt nem írjuk le külön.

Térjünk rá az általánosabb inhomogén egyenlet megoldására. Legyen

egy primitív függvény. Szorozzuk be az egyenletünk mindkét oldalát e–A(t)-vel, és rendezzük át:

Vegyük észre, hogy

és így a bal oldal a szorzat deriválási szabálya alapján:

Ezt az egyenletbe írva:

Ezek után integráljuk az egyenlet mindkét oldalát:

Az egyenletet x(t)-re rendezve megkapjuk az általános megoldást:

A homogén esetben ez a következő alakra redukálódik: x(t) = c · e–A(t).

Az elsőrendű lineáris di erenciálegyenleteknek egyik speciális esete az

alakú egyenlet, ahol az a valamilyen konstans. Az ilyen típusú egyenleteket elsőrendű állandó együtthatós homogén
di erenciálegyenleteknek nevezzük.

Az ilyen egyenletek általános megoldása a fentiek alapján a következő:

Megjegyzés. Az inhomogén egyenlet megoldásához más úton is el lehet jutni, méghozzá úgy, hogy először előállítjuk
az inhomogén egyenlethez hozzárendelt X′(t) = a(t) · X(t) homogén di erenciálegyenlet X-szel jelölt általános
megoldását, valamint az inhomogén egyenlet egy partikuláris megoldását, amit xp-vel jelölünk. Ekkor az inhomogén
lineáris di erenciálegyenlet általános megoldása az alábbi:

Példák
1.

Ez inhomogén lineáris di erenciálegyenlet, ahol , b(t) = t. Első lépésként rendezzük át az egyenletet:

így

Szorozzuk be az egyenlet mindkét oldalát ezzel:

A bal oldalon x(t) · e–A(t) deriváltja szerepel, így az egyenlet mindkét oldalát integrálva a következőt kapjuk:

x(t)-re rendezve, azaz t-vel beszorozva az egyenletet az általános megoldás a következő:

2. x′(t) + 6t·x(t) = 0
Ez homogén lineáris egyenlet, ahol a(t) = –6t. A fentiek alapján a di erenciálegyenlet általános megoldása:

ahol

Így a megoldás a következő:

Ezek után adjuk meg az x(–2) = 3 kezdeti értékhez tartozó partikuláris megoldást is! Helyettesítsünk be t helyébe –
2-t:

c-re rendezve az utolsó egyenlőséget:

Így ehhez a kezdeti feltételhez tartozó megoldás az alábbi:

A Bernoulli-egyenlet

Legyenek a(t), b(t) intervallumon értelmezett folytonos függvények, α ∈ R. Ekkor az

alakú di erenciálegyenletet Bernoulli-egyenletnek nevezzük.


Az ilyen típusú egyenleteket úgy kell megoldani, hogy új ismeretlen függvény bevezetésével visszavezetjük lineáris
di erenciálegyenletté. Először alakítsuk át az egyenletet! Osszunk le xα(t)-vel:

Szorozzunk be (–α + 1)-gyel:

Vezessük be az új ismeretlen függvényt, y(t)-t:

deriválva

Ezt a di erenciálegyenletbe írva:

Ez már lineáris di erenciálegyenlet, amit a fent ismertetett módon meg tudunk oldani.

Példa: x′(t) + 2x(t) = x2(t) · et.


Vonjunk ki a di erenciálegyenlet mindkét oldalából 2x(t)-t:

Ez Bernoulli-egyenlet, ahol a(t) = –2, bt = et, α = 2. Az új ismeretlen függvény:

A lineárissá átalakított egyenlet:

Ezt a lineáris egyenleteknél ismertetett módon oldjuk meg:

e–A(t)-vel beszorozva az egyenlet mindkét oldalát:

Integrálva az egyenletet:

Ez az eredeti egyenletünk megoldásának reciproka, így

Egzakt közönséges di erenciálegyenlet

Legyenek M, N kétváltozós folytonosan di erenciálható függvények. Az


egyenlet egzakt di erenciálegyenlet, ha ∂2M = ∂1N.

Ismeretes, hogy ilyenkor ∃F: R2 → R folytonosan di erenciálható függvény, melyre ∂tF(t, p) = M(t, p) és ∂pF(t, p) = N(t,
p). Határozzuk meg így F-et, ekkor

Tehát az egzakt di erenciálegyenlet pontosan akkor teljesül, ha

Ez általában implicit megoldás. Ha ebből x(t) kifejezhető, akkor megkapjuk az explicit megoldást.

Példa: t + x(t) · x′(t) = 0.


Ebben az esetben M(t, x(t)) = t és N(t, x(t)) = x(t).
Nézzük meg, hogy ez tényleg egzakt di erenciálegyenlet:

A következő lépés F(t, x(t)) meghatározása:

Integráljuk t szerint:

x(t) szerint deriválva ezt:

Itt a konstansoktól eltekintünk, hiszen csak egy primitív függvényre van szükségünk. Tehát

az implicit megoldás. Ebből x(t)-t kifejezve az explicit megoldás:

Autonóm egyenletek
Az autonóm egyenletekben az f függvény t-től csak x(t)-n keresztül függ. Ezt precízebben megfogalmazva:

Legyen J ⊂ R nyílt intervallum, h : J → R folytonos függvény, Ω := R × J,

Ekkor az f jobb oldalú explicit közönséges elsőrendű di erenciálegyenletet autonóm di erenciálegyenletnek


nevezzük.

Az autonóm egyenletek általános alakja a következő:

Legyen τ ∈ R, ξ ∈ J tetszőleges. Tekintsük a fenti di erenciálegyenletet az


kezdeti feltétel mellett!
Tegyük fel, hogy h(x(t)) sehol sem veszi fel a 0 értéket, és osszunk le vele. Ekkor azt kapjuk, hogy

Ha integráljuk mindkét oldalt, akkor

Helyettesítéses integrálás után

Így az általános megoldás a következő lesz:

19.3. Di erenciálegyenlet-rendszerek
Ebben a fejezetben olyan di erenciálegyenletekről lesz szó, ahol az ismeretlen többváltozós függvény. Ennek elmélete
általában igen összetett, így mi most csak az elsőrendű lineáris esetet fogjuk tárgyalni. Az elsőrendű közönséges lineáris
di erenciálegyenlet-rendszer általános alakja a következő:

ahol x:I → Rn, A(t) ∈ Rn × n és b(t) ∈ Rn ∀t ∈ I, továbbá A és b folytonos függvények. Ha b ≡ 0, akkor az egyenletrendszert
homogén elsőrendű lineáris di erenciálegyenlet-rendszernek nevezzük, ellenkező esetben inhomogénnek.
Az elsőrendű homogén lineáris di erenciálegyenlet-rendszer megoldásai előállnak

alakban, ahol x1(t), x2(t), …, xn(t) lineárisan független megoldások, c1, c2, …, cn ∈ R tetszőleges konstansok.
Ekkor az elsőrendű inhomogén lineáris di erenciálegyenlet-rendszer megoldásai:

ahol xh(t) az inhomogén rendszerhez tartozó homogén rendszer megoldása, amit úgy kapunk, hogy az inhomogén
rendszerben b(t)-t azonosan nullává tesszük, és az így kapott homogén lineáris di erenciálegyenlet-rendszert megoldjuk.
xp(t) az inhomogén rendszer egy partikuláris megoldása.
A megoldásra általában nem lehet képletet adni, ezért mi csak az állandó együtthatós esettel foglalkozunk. Az
elsőrendű állandó együtthatós lineáris di erenciálegyenlet-rendszerek általános alakja a következő:

ahol ∀ ∈ Rn × n, b : I → Rn folytonos függvény.


Először tekintsük az n = 1 esetet, amikor A ∈ R, b: I → R. Ekkor a homogén egyenlet megoldását ismerjük az előző
fejezetben leírtak alapján:

Az inhomogén egyenlet megoldása pedig


Megjegyezzük, hogy ez valóban egy partikuláris megoldás és a homogén megoldás összege.
Ez általánosítható n > 1 esetére is, azaz ∀A ∈ Rn × n mátrixhoz értelmezhető olyan eAt mátrixfüggvény, hogy a fenti
formulák érvényesek maradnak, de c ∈ Rn tetszőleges.
Már csak eAt meghatározása van hátra. eAt-t általában ex hatványsorával tudjuk kiszámolni, melyet a 19.6. fejezetben
ismertetünk, nevezetesen

Ez azonban a gyakorlatban nem túl jól használható, hiszen általában nem könnyű egy végtelen sor összegét
meghatározni, főleg hogy mátrixot kell hatványozni benne.

Ismeretes, hogy minden A ∈ Rn×n mátrixhoz létezik olyan P ∈ Rn × n invertálható mátrix, melyre

ahol a blokkok négy típus valamelyikébe tartoznak: ha λ valós sajátértéke az A mátrixnak, akkor egy blokk az alábbi
két típus valamelyikébe tartozik:

ha pedig a ± bi sajátértéke az A mátrixnak, akkor

alakúak, ahol I2 a 2 × 2-es egységmátrixot jelöli. Valamely sajátértékhez annyi blokk tartozik, amennyi a hozzá tartozó
lineárisan független sajátvektorok száma. A legnagyobb λ blokk mérete egyenlő λ multiplicitásával az A mátrix
minimálpolinomjában. Ez az úgynevezett valós Jordan-féle normálalak.

Az A mátrix Jordan-féle normálalakjából eAt a következő módon írható fel:

A továbbiakban megnézzük, hogy 2 × 2-es A mátrixok esetén milyen alakú J mátrixokat kaphatunk a sajátértékeik (λ, μ)
felhasználásával.
1. Ha λ ≠ μ valósak, vagy λ = μ kétszeres sajátérték esetén

ahol u, v kétdimenziós oszlopvektorok, λ-hoz, illetve μ-höz tartozó sajátvektorok, azaz Au = λμ és Av = μv. Ez esetben

2. Ha λ = μ egyszeres sajátértékről van szó, akkor


ahol Au = λμ és Av = λv + u. Ekkor

3. Ha λ = α + βi, μ = α – βi (β ≠ 0), akkor

ahol Ap = λp (p ∈ C2)p = u + vi. Ilyenkor

Példa: az x′(t) = Ax(t) alakú di erenciálegyenlet-rendszereket oldjuk meg a következő A mátrixok esetén:
1.

Először A sajátértékeit határozzuk meg a karakterisztikus polinom segítségével:

A zárójeleket kibontva és összevonva:

Az egyenletet megoldva a sajátértékek:

Az ezekhez tartozó sajátvektorok:

Ezek szerint

Mivel a di erenciálegyenlet-rendszerünk homogén, ezért a megoldás a következő lesz:

2.

Az előző példához hasonlóan ismét A sajátértékeinek a meghatározása a feladatunk a karakterisztikus polinom


segítségével:

A zárójeleket kibontva és összevonva:

Ami valójában (λ – 1)2 = 0, amelynek a megoldása egyszeres sajátérték: λ = 1. Ehhez két független sajátvektor
tartozik:
Ezek szerint

A di erenciálegyenlet-rendszerünk itt szintén homogén, ezért a megoldás a következő lesz:

3.

Az előző példákhoz hasonlóan ismét A sajátértékeinek a meghatározása a feladatunk a karakterisztikus polinom


segítségével:

A zárójeleket kibontva és összevonva:

Az egyenletet megoldva a sajátértékek:

Ehhez két független sajátvektor tartozik:

Ezek szerint

Természetesen észrevehettük volna, hogy A mátrix eleve Jordan-féle normálformában van felírva. A megoldása a
következő:

Lineáris rendszerek megoldásának ábrázolása a fázissíkon

Lineáris rendszerek megoldásának ábrázolása a fázissíkon

Az megoldásainak ábrázolásával fogunk foglalkozni ebben a részben. Mivel ezek térben


vannak, ezért a időtengelyt nem vesszük gyelembe, azaz a fázissíkon ábrázoljuk a rendszert. Mint azt már láttuk, minden
valós mátrix valós Jordan-alakra hozható. Először az ilyen alakú mátrixokat fogjuk vizsgálni.

1. eset: valós számok. Ebben az esetben a rendszer a következő:

ennek megoldása:

Azaz
a) Tegyük fel, hogy λ, μ > 0, ekkor a fáziskép típusa instabil csomó.

19.1. ábra λ < μ fázisképe

19.2. ábra λ > μ fázisképe

19.3. ábra λ = μ fázisképe

b) Tegyük fel, hogy λ, μ < 0, ekkor a fáziskép típusa stabil csomó.

19.4. ábra λ < μ fázisképe


19.5. ábra λ > μ fázisképe

19.6. ábra λ = μ fázisképe

c) Tegyük fel, hogy λ · μ < 0 különböző előjelűek. Ekkor a fáziskép típusa nyereg.

19.7. ábra λ > 0, μ > 0 fázisképe

19.8. ábra λ < 0, μ > 0 fázisképe

2. eset: valós szám. Ebben az esetben a rendszer a következő:


ennek megoldása

Fejezzük ki x-et y segítségével:

a) Tegyük fel, hogy λ > 0! Ekkor a fáziskép típusa elfajult instabil csomó (19.9. ábra).

19.9. ábra

b) Tegyük fel, hogy λ < 0! Ekkor a fáziskép típusa elfajult stabil csomó (19.10. ábra).

19.10. ábra

3. eset: valós számok. Ebben az esetben a rendszer a következő:

Írjuk át a rendszert polárkoordináták segítségével:

Így r(t), φ(t) új ismeretlen függvények bevezetésével a rendszer a következő:

Az első egyenletet cos φ(t)-vel szorozva, a második egyenlet sin φ(t)-szereséhez adva, illetve az első egyenletet – sin φ(t)-
vel szorozva, a második egyenlet cos φ(t)-szereséhez adva a következő rendszerhez jutunk:

A második egyenletet r(t)-vel osztva:


ennek megoldása:

a) Tegyük fel, hogy a > 0. Ekkor a fáziskép típusa instabil fókusz.

19.11. ábra β > 0 fázisképe

19.12. ábra β > 0 fázisképe

b) Tegyük fel, hogy α < 0. Ekkor a fáziskép típusa stabil fókusz.

19.13. ábra β > 0 fázisképe


19.14. ábra β > 0 fázisképe

c) Tegyük fel, hogy a = 0. Ekkor a fáziskép típusa stabil centrum.

19.15. ábra β > 0 fázisképe

19.16. ábra β < 0 fázisképe

Ezek után tetszőleges A mátrix esetén könnyen meg tudjuk határozni a fázisképet. Legyen A ∈ Rn × n tetszőleges, B = P–
1AP valamely P ∈ Rn × n invertálható mátrixszal. Ekkor az x′(t) = Ax(t) egyenletrendszernek a z(t) = P–1x(t) új ismeretlen
függvény bevezetésével a z′(t) = Bz(t) egyenletrendszer felel meg. Így ha B az A Jordan-féle normálalakja, akkor a z′(t) =
Bz(t)-hez tartozó fázisképet P viszi át az x′(t) = Ax(t) fázisképébe.

Példa: fázisképének meghatározásához először ki kell számolnunk a sajátértékeit. A


karakterisztikus polinom: (–2 – λ)(–3 – λ) = 0 megoldásai λ1 = –2, λ2 = –3.
19.17. ábra

Az ezekhez tartozó sajátvektorok: így

Ennek a fázisképe stabil csomó (lásd a 19.5. ábrán). Erre alkalmazva a P mátrixot a fázisképet a 19.17. ábra mutatja.

19.4. Magasabb rendű egyenletek


Ebben a fejezetben másodrendű di erenciálegyenletekről lesz szó. Már említettük, ha az egyenlet explicit alakra hozható,
akkor az egyenlet egy di erenciálegyenlet-rendszerré alakítható. Az általános másodrendű di erenciálegyenlet
megoldására véges számú integráláson alapuló módszer nem ismeretes. Speciális esetekben léteznek azonban kidolgozott
eljárások. A következőkben ilyen speciális másodrendű di erenciálegyenletek megoldásával foglalkozunk. A másodrendű
di erenciálegyenlet általános képlete:

Az explicit másodrendű di erenciálegyenlet:

Hiányos másodrendű di erenciálegyenletek


Másodrendű lineáris egyenletek

Hiányos másodrendű di erenciálegyenletek


Egy másodrendű di erenciálegyenletet akkor nevezünk hiányosnak, ha a benne szereplő t, x(t), x′(t) közül legalább az
egyik hiányzik. A hiányos másodrendű di erenciálegyenletek közül csak néhány esetet tárgyalunk.
1. x″(t) = f(t).
A megoldás két egymás utáni integrálással meghatározható:

Példa. Ilyen típusú a már megoldott x″(t) = 6t di erenciálegyenlet is.

2. F(t, x′(t), x″(t)) = 0.


A megoldás előállításához alkalmazzuk az x′(t) = p(t) helyettesítést. Ekkor x″(t) = p′(t), így a di erenciálegyenletünk:

Ez már elsőrendű di erenciálegyenlet. Így az eredeti másodrendű egyenlet megoldását visszavezettük két elsőrendű
egyenlet megoldására.
Példa: di erenciálegyenlet általános megoldását keressük.
Alkalmazva az x′(t) = p(t) helyettesítést az alábbi di erenciálegyenlethez jutunk:

Ez inhomogén lineáris di erenciálegyenlet, ahol . Első lépésként rendezzük át az


egyenletet:

így

Szorozzuk be az egyenlet mindkét oldalát ezzel:

A bal oldalon p(t) · e–A(t) deriváltja szerepel, így az egyenlet mindkét oldalát integrálva a következőt kapjuk:

p(t)-re rendezve, azaz t-vel beszorozva az egyenletet az általános megoldás a következő:

Vegyük gyelembe, hogy x′(t) = p(t), így

Mindkét oldalt t szerint integrálva:

A jobb oldal a következő módon számolható ki:

így

A jelölést bevezetve a hiányos másodrendű di erenciálegyenlet általános megoldása:

Másodrendű lineáris egyenletek


Az explicit általános alak a következő:

ahol a, b, f intervallumon értelmezett folytonos függvények. Ha f ≡ 0, akkor homogén, ellenkező esetben inhomogén
egyenlet.
A homogén egyenlet megoldásai előállnak

alakban, ahol c1, c2 ∈ R tetszőleges konstansok, és x1(t), x2(t) lineárisan független alapmegoldások.
Az inhomogén egyenlet megoldása így

lesz, ahol xp(t) az inhomogén egyenlet egy partikuláris megoldása, xh(t) pedig az egyenlethez tartozó homogén egyenlet
megoldása. A megoldást képlettel csak állandó együtthatós esetben tudjuk előállítani. Az állandó együtthatós egyenlet:

Először tekintsük a homogén esetet! Ennek két lineárisan független alapmegoldását szeretnénk előállítani. A módszer
a következő: keressük x-et x(t) = eλt alakban. Ezt a homogén egyenletbe helyettesítve:

Mivel eλt > 0 ∀t, ezért ez az alábbival ekvivalens:

Ez a másodrendű homogén di erenciálegyenlethez tartozó úgynevezett karakterisztikus egyenlet. Ez λ-ra másodfokú


egyenlet, melynek gyökei a következőféleképpen állhatnak elő:
1. λ1 ≠ λ2 valós számok. Ekkor a homogén egyenlet megoldása:

2. Az egyenletnek egyetlen valós gyöke van: λ. Ekkor

3. Az egyenletnek két komplex gyöke van: λ1, 2 = α ± βi(β ≠ 0). Ekkor

Ezek után rátérünk az inhomogén egyenlet megoldására. Első lépésként előállítjuk az egyenlethez tartozó homogén
egyenletet úgy, hogy f(t) ≡ 0. Ennek a fentiek alapján meghatározzuk a megoldását. Így a megoldás előállításához az
inhomogén egyenlet egy partikuláris megoldását kell még meghatároznunk. Ezt általában próbálgatással tudjuk megtenni,
azonban a következő speciális esetben képlet van rá.

Legyen f(t) = eat(P1(t) cos bt + P2(t) sin bt) alakú, ahol a, b ∈ R, és P1, P2 polinomok. Ekkor létezik az alábbi alakú
partikuláris megoldás:

ahol Q1, Q2 polinomok, melyek foka P1 és P2 fokának maximuma, valamint a + bi a karakterisztikus egyenlet k-szoros
gyöke.

Példák
1. x″(t) + 2x′(t) + x(t) = 0 elsőrendű homogén lineáris egyenlet megoldásait keressük. Először a karakterisztikus
egyenletet kell felírnunk:

Ennek gyökei λ1 = λ2 = –1. Így a di erenciálegyenletünk általános megoldása a fentiek alapján az alábbi függvény:

2. x″(t) – 2x′(t) + 2x(t) = 0 elsőrendű homogén lineáris egyenlet megoldásait keressük. Most ismét a karakterisztikus
egyenlet felírásával kezdünk:
Ennek gyökei λ1 = 1 + i, illetve λ2 = 1 – i. Ezek komplex megoldások, így a di erenciálegyenletünk általános
megoldása a fentiek alapján az alábbi függvény:

3. x″(t) – 3x′(t) + 2x(t) = et cos t másodrendű inhomogén lineáris egyenlet megoldásait keressük. Első lépésként írjuk
fel az ehhez tartozó homogén lineáris egyenletet:

Az ehhez tartozó karakterisztikus egyenlet a következő:

Ennek gyökei: λ1 = 1 és λ2 = 2. Így a homogén egyenlet megoldása az alábbi:

Ezek után az inhomogén egyenlet egy partikuláris megoldását kell előállítanunk, amit a fenti tétel alapján fogunk
megtenni.

azaz a = 1, b = 1, P1(t) ≡ 1, P2(t) ≡ 0. Ekkor

ahol Q1, Q2 ∈ R (nulladfokú polinomok). k meghatározásához azt kell megnézni, hogy a + bi = 1 + i a


karakterisztikus egyenletnek hányszoros gyöke. Mivel a karakterisztikus egyenlet gyökei 1 és 2, így k = 0. Ezek
szerint

Ezt deriválva a következőt kapjuk:

Ezt ismét deriválva:

Ha ezt az eredeti di erenciálegyenletünkbe behelyettesítjük:

Ennek a di erenciálegyenletünk alapján meg kell egyeznie et cos t-vel, azaz

Így . Ezek alapján a partikuláris megoldás a következő:

Tehát a másodfokú inhomogén lineáris egyenlet megoldása

19.5. A Laplace-transzformáció
Már a középiskolában is találkoztunk azzal a módszerrel, hogy egy egyenletet úgy oldottunk meg, hogy új változó
bevezetésével egy egyszerűbb egyenletre vezettük vissza az egyenletünket, és annak a megoldásából számoltuk ki az eredeti
ismeretlent. Az előzőkben is többször oldottunk meg úgy di erenciálegyenleteket, hogy először transzformáltuk az
ismeretlen függvényt, és az arra kapott egyenletet oldottuk meg, majd az eredményt visszatranszformáltuk.
Tulajdonképpen ezt csináltuk mindig, amikor új ismeretlen függvényt vezettünk be. A most bevezetésre kerülő
transzformáció az ismeretlen függvényre vonatkozó di erenciálegyenlet helyett annak egy transzformáltjára vonatkozó,
explicite megoldható függvényegyenletet szolgáltat. Ez az eljárás igen sok di erenciálegyenletre használható. A Laplace-
transzformáció csak az adott kezdeti feltételnek megfelelő megoldást adja meg, nem az általános megoldásból származtatja
a partikuláris megoldást. A következőkben bevezetünk néhány alapfogalmat, és leírjuk a Laplace-transzformáció
legfontosabb tulajdonságait.

Legyen f : R → C, ekkor f-et alapfüggvénynek nevezzük, ha igaz rá az alábbi három tulajdonság:


1. f(t) = 0, ha t < 0.
2. f a [0, +∞) intervallum minden véges részintervallumán integrálható, azaz lokálisan integrálható.
3. Léteznek olyan Mf, αf, Tf, nem negatív valós számok, melyekkel:

Az alapfüggvények tehát többek között kisebbek, mint egy nem túlságosan gyorsan +∞-hez tartó függvény.
Megjegyezzük, hogy Mf és αf árnövelésével Tf mindig nullának vehető. A Laplace-transzformáció módszere olyan
egyenletek transzformálására használható, amelynek megoldásairól eleve tudjuk a fenti feltételek teljesülését, vagy az
adott egyenletnek csak ilyen megoldásait keressük. Ezek után bevezetjük a Laplace-transzformáció fogalmát.

Legyen f egy alapfüggvény. Ekkor f Laplace-transzformáltja a következő:

A következőkben a Laplace-transzformáció alapvető tulajdonságairól lesz szó.


Legyenek f, g alapfüggvények, k ∈ C tetszőleges komplex szám! Ekkor az alábbiak teljesülnek:
1. kf is alapfüggvény, Mkf ≤ |k| Mf αkf ≤ af és

2.
f + g is alapfüggvény, , t ∈ R és

3.

Megjegyzés. A Laplace-transzformáció az alapfüggvények halmazán lineáris transzformáció.

Legyen f alapfüggvény, k ∈ C tetszőleges, g(t) := f(t)ekt! Ekkor

Legyen n ∈ N! Ha az f alapfüggvény N-szer folytonosan deriválható, és deriváltjai korlátosak a [0, +∞) intervallumon,
akkor f(N) is alapfüggvény, és

Tegyük fel, hogy f alapfüggvény, akkor az integrálfüggvénye is az, és

A Laplace-transzformáció következő tulajdonságához bevezetjük két függvény konvolúciójának fogalmát.

Legyen f, g: (0, +∞) → C! Tegyük fel, hogy az integrál minden t ∈ (0, +∞) esetén létezik. Ekkor az f és g
konvolúciója a következő:
Az alábbiakban a konvolúció néhány tulajdonságát mondjuk ki.
1. Ha létezik f * g, akkor g * f is létezik, és f * g = g * f. Továbbá tetszőleges k ∈ C mellett f * kg is létezik, és f * kg = k(f * g).
2. Ha létezik f * g és f * h, akkor f * (g + h) is létezik, és f * (g + h) = f * g + f * h.
Két függvény konvolúciójának Laplace-transzformáltját a következő módon adhatjuk meg. Ha f és g alapfüggvény,
akkor konvolúciójuk létezik, Mf * g ≤ max{Mf, Mg}, af * g ≤ max{αf, αg}, és L(f * g) = L(f)L(g).
Az alábbi táblázat néhány függvény Laplace-transzformáltját adja meg.

f(t)(t ∈ R+) Mf αf L(f)(p)(Re(p) > αf)

1 1 0

ϵ ∈ R+ tetszőleges
(n ∈N)

eat (a ∈ R) 1 |a|

cos (bt) (b ∈ R) 1 0

sin (bt) (b ∈ R) 1 0

ch (bt) (b ∈ R) 2 |b|

sh (bt) (b ∈ R) 2 |b|

eat cos (bt) (a, b ∈ R) 1 |a|

eat sin(bt) (a, b ∈ R) 1 |a|

|a| + ϵ
(n ∈ N, a ∈ R) ϵ ∈ R+ tetszőleges

t cos (bt) (b ∈ R) 1 ϵ ∈ R+ tetszőleges

t sin(bt) (b ∈ R) 1 ϵ ∈ R+ tetszőleges

Re (b) + ϵ
t ch (bt) (b ∈ R) 1
ϵ ∈ R+ tetszőleges

Re(b) + ϵ
t sh (bt)(b ∈ R) 1
ϵ ∈ R+ tetszőleges

Most megfogalmazzuk a Laplace-transzformáció inverzének fogalmát:

Legyen α ∈ R valós szám. A

függvény inverz Laplace-transzformáltjának nevezzük, és L–1(F)-fel jelöljük azt az alapfüggvényt, amelynek Laplace-
transzformáltja F.

Az inverz Laplace-transzformált meghatározására egyszerűbb esetekben szintén a fenti táblázat használható. A


továbbiakban példákon keresztül mutatjuk be, hogy hogyan lehet alkalmazni a Laplace-transzformációt magasabb rendű
állandó együtthatós lineáris di erenciálegyenletek és lineáris di erenciálegyenlet-rendszerek esetén.

Példák
1. x′″(t) – 6x″(t) + 12x′(t) – 8x(t) = t3e2t harmadrendű állandó együtthatós inhomogén lineáris di erenciálegyenlet
megoldásait keressük az x(0) = 1, x′(0) = –1, x″(0) = –2 kezdeti feltételek mellett. Legyen
Ekkor mivel

ezért behelyettesítés és rendezés után a következőt kapjuk:

Mivel a táblázat alapján , ezért

2. Oldjuk meg Laplace-transzformációval a következő elsőrendű lineáris di erenciálegyenlet-rendszert az adott


kezdeti feltételek mellett:

Legyen ismét X:= L(x), Y:= L(y). Ekkor az előző példához hasonlóan kapjuk, hogy

Ez X(p)-re és Y(p)-re egy kétismeretlenes egyenletrendszer. Ezt megoldva:

A kifejezéseket szintén az előző példához hasonlóan elemi törtekre bontva:

A táblázat segítségével meghatározhatjuk ezek inverz Laplace-transzformáltjait, ami már a megoldást adja:

19.6. Függvénysorok
Az előző fejezetekben volt már szó végtelen sorokról. Ebben a fejezetben is valami hasonlóról fogunk írni, csak itt az
összegzésen belül nem számok lesznek, hanem függvények. Először is ismerkedjünk meg a függvénysorok pontos
fogalmával!

Legyenek az f1, f2, …, fn, … függvények olyanok, hogy értelmezési tartományaiknak H metszete nem üres halmaz.
Ekkor az

végtelen sok tagú formális összeget függvénysornak nevezzük. Az f1, f2, …, fn, … függvények a függvénysor tagjai. Az

összeg pedig a függvénysor n-edik maradékösszege.


A fent szereplő összeg csak egy formális összeg. A most bevezetésre kerülő fogalmakkal fogunk értelmet adni neki.

A függvénysor első k tagjának összegfüggvényét, az

összeget a függvénysor k-adik részletösszegének nevezzük.

Függvénysorok konvergenciája
Műveletek függvénysorokkal
Hatványsorok
A Taylor-sor
Fourier-sorok

Függvénysorok konvergenciája
A végtelen sorokhoz hasonlóan a függvénysor részletösszegeinek segítségével fogalmazhatjuk meg a függvénysor
konvergenciájának fogalmát.

A H halmazon értelmezett függvénysor az a ∈ H pontban konvergens, ha a részletösszegeinek az a ponthoz


tartozó (Sn(a)) számsorozata konvergens. Egy függvénysor valamely halmazon konvergens, ha ezen halmaz minden
pontján konvergens. Azt a halmazt, amelyen a függvénysor konvergens, a függvénysor konvergenciatartományának
nevezzük. A függvénysor összegfüggvényén (összegén) a H halmazon értelmezett x ∈ H és az

hozzárendelési szabállyal megadott S függvényt értjük. Jelölése:

Ezt másképpen úgy is mondhatjuk, hogy az S függvény a H halmazon sorba fejthető.

Megjegyezzük, hogy az (Sn(a)) számsorozat határértéke a konvergenciatartomány különböző pontjaiban más és más
lehet, így a függvénysor összege a hely függvénye.
A függvénysor konvergenciáját a maradékösszeg segítségével is megfogalmazhatjuk.

A függvénysor az a ∈ H pontban konvergens, ha a maradékösszegeinek az a pontban vett helyettesítési értékei


nullához tartanak, azaz

Már a végtelen soroknál is láttuk, hogy a véges összegekre vonatkozó műveleti szabályok általában nem érvényesek. Ez
a megállapítás a függvénysorokra is fennáll. Többek között ez is indokolja a következő fogalom bevezetését.

A H halmazon értelmezett függvénysor egyenletesen konvergens, ha ∀x ∈ H esetén ∀ϵ > 0-hoz ∃δ


küszöbindex, hogy n > δ esetén

Felhívjuk a gyelmet arra, hogy itt δ csak ϵ-tól függ, x-től nem!

Ha egy függvénysor egyenletesen konvergens valamely halmazon, akkor ezen a halmazon konvergens is.
A következőkben szükséges és elégséges feltételeit fogjuk megadni az egyenletes konvergenciának.

A H halmazon értelmezett függvénysor akkor és csak akkor egyenletesen konvergens, ha ∀x ∈ H esetén ∀ϵ


> 0-hoz ∃δ küszöbindex, hogy n, m > δ esetén

ahol és . Ezt szokás függvénysorokra vonatkozó Cauchy-féle


konvergenciakritériumnak vagy rövidebben függvénysorokra vonatkozó Cauchy-tételnek is nevezni.

A most leírt állításból és a végtelen sorokra vonatkozó Cauchy-tételből következik az alábbi állítás, ami végtelen sorok
konvergenciájára vezeti vissza a függvénysorok konvergenciáját.

Legyen egy H halmazon értelmezett függvénysor és a egy konvergens végtelen sor! Tegyük fel,
hogy ∀x ∈ H esetén

Ekkor a függvénysor a H halmazon egyenletesen konvergens. Ez az úgynevezett Weierstrass-féle


konvergenciakritérium.

A következő fogalom az egyenletesen konvergens függvénysorok egy szűkebb osztályát adja.

A H halmazon értelmezett függvénysort abszolút konvergensnek nevezzük, ha a függvénysor


konvergens ezen a halmazon.

Megjegyezzük, hogy azok a függvénysorok, amelyek teljesítik a Weierstrassféle konvergenciakritérium feltételeit,


nemcsak egyenletesen konvergensek, hanem a H halmaz minden pontjában abszolút konvergensek is.
A következő állítás a függvénysorok összegfüggvényének folytonosságára ad elégséges feltételt.

Legyenek az f1, f2, …, fn, … függvények valamely I intervallumon folytonosak és az függvénysor


egyenletesen konvergens az I intervallumon! Ekkor S is folytonos az I intervallumon.

Műveletek függvénysorokkal
Mint már említettük a véges összegre vonatkozó műveleti szabályok általában nem igazak függvénysorokra. A
következőkben arról lesz szó, hogy milyen feltételek mellett teljesülnek mégis ezek a szabályok.

Legyen a H halmazon értelmezett függvénysor konvergens! Ekkor a következők teljesülnek:


- a függvénysor tagjainak bármely csoportosítása után is konvergens marad;
- a függvénysor véges sok tagjának elhagyása után vagy véges sok függvénynek a sorhoz vétele után is konvergens marad;
-
a függvénysort bármely c számmal tagonként szorozva az így kapott függvénysor is konvergens, és

azaz a konvergens függvénysorok rendelkeznek a homogenitás tulajdonságával;


-
ha a is konvergens függvénysor, akkor a függvénysor is konvergens, és

azaz a konvergens függvénysorok additívak.


A következőkben függvénysorok integrálhatóságának feltételeit fogalmazzuk meg.
Legyenek az f1, f2, …, fn, … függvények valamely [a, b] intervallumon folytonosak és az függvénysor
egyenletesen konvergens az [a, b] intervallumon. Ekkor S integrálható az [a, b] intervallumon, és

A következő állítás a függvénysorok tagonkénti di erenciálhatóságáról szól.

Legyenek az f1, f2, …, fn, … függvények di erenciálhatók és az f′1, f′2, …, f′n, … deriváltak folytonosak az [a, b]

intervallumon. Továbbá tegyük fel, hogy az függvénysor konvergens, és a függvénysor


egyenletesen konvergens az [a, b] intervallumon. Ekkor S di erenciálható az [a, b] intervallumon, és

Hatványsorok
Ebben a részben speciális függvénysorokról lesz szó, pontosabban:

A függvénysort x0 körüli hatványsornak nevezzük, ahol a cn együtthatók és az x0 konstansok.

Legyen t: = x – x0, ekkor a hatványsora origó körüli hatványsorrá transzformálódik.

Ezért a továbbiakban elegendő a hatványsorokkal foglalkoznunk.


Az alábbiakban a hatványsorok konvergenciatartományának meghatározásával fogunk foglalkozni. Emlékeztetünk rá,
hogy a hatványsorok speciális függvénysorok, ezért a függvénysorokra vonatkozó állításaink a hatványsorokra is
érvényesek. Továbbá megjegyezzük azt, hogy minden hatványsor konvergens legalább egy pontban, ugyanis az x = 0
pontban triviálisan konvergens.

Legyen a hatványsor az x ≠ 0 pontban konvergens! Ekkor létezik olyan, az origóra szimmetrikus (nem
elfajuló) intervallum, amelynek belső pontjaiban a hatványsor abszolút konvergens, a külső pontokban pedig
divergens. Ezt az állítást Abel tételének nevezzük.

Tehát az Abel-tétel szerint a hatványsor konvergencia- és divergenciapontjai nem „keverednek”.

Azt az origó körüli szimmetrikus nyílt intervallumot, amelyben az origó körüli hatványsor abszolút konvergens, a
hatványsor konvergenciaintervallumának nevezzük.
Abel tétele szerint a hatványsor konvergenciaintervalluma (–r, r) vagy (–∞, +∞) lehet. Ez az r ∈ R szám, illetve +∞ a
hatványsor konvergenciasugara.

Megjegyezzük, hogy ha a konvergenciasugár r, akkor x = r-ben és x = –r-ben a hatványsor lehet konvergens, de lehet
divergens is. Ha egy hatványsor konvergenciasugara r > 0, akkor ez a hatványsor abszolút és egyenletesen konvergens
minden olyan zárt [a, b] intervallumban, mely teljesen része a konvergenciaintervallumnak.
A következőkben a hatványsor együtthatóinak vizsgálatára vezetjük vissza a konvergenciasugár meghatározását. A
következő állítás a végtelen sorokra vonatkozó gyökkritériumon alapszik.

A hatványsor konvergenciasugara:
A konvergenciasugár meghatározásának másik gyakran használt módszere a végtelen sorokra vonatkozó
gyökkritériumhoz hasonlóan a következő.

Tegyük fel, hogy létezik! Ekkor a hatványsor konvergenciasugara:

Példák
1.
A hatványsor konvergenciasugara a hányadoskritérium szerint

2.
A hatványsor konvergenciasugara szintén a hányadoskritérium szerint

3.
A hatványsor konvergenciasugara a hányadoskritérium szerint

4.
A hatványsor konvergenciasugara a gyökkritérium szerint

Ha egy függvény hatványsorba fejthető, akkor az csak egyféleképpen lehetséges.

A Taylor-sor
Ebben a részben egy speciális hatványsorról lesz szó.

Legyen f az x0 pont egy környezetében akárhányszor di erenciálható. Ekkor a

hatványsort az f függvény x0 pont körüli Taylor-sorának nevezzük. Az f függvény x0 pont körüli Taylor-polinomjának
n-edik részletösszege, az

az f függvény x0 ponthoz tartozó n-edik Taylor-polinomja.

A következő állítás arról szól, hogy lehet közelíteni az f függvényt a Taylor-polinommal.

Legyen f az x0 pont egy környezetében (n + 1)-szer di erenciálható. Ekkor minden ebbe a környezetbe eső x-re érvényes
a következő:
ahol ξ az x és az x0 között van. Az f függvény ilyen előállítását Taylor-formulának, az

kifejezést pedig (n + 1)-edik Lagrange-féle maradéktagnak nevezzük.

Valamely függvény Taylor-sora nem biztos, hogy előállítja magát a függvényt. Ezért foglalkoznunk kell azzal a
kérdéssel, hogy a Taylor-sornak mi a konvergenciatartománya, és összegfüggvénye mely pontokban egyenlő magával a
függvénnyel.

Legyen f az x0 pont egy környezetében akárhányszor di erenciálható! Ekkor az f függvény Taylor-sora akkor és csak
akkor állítja elő az f függvényt, ha az x0 pont ezen környezetének bármely x pontjában az f függvény n-edik Lagrange-
féle maradéktagja n → ∞ esetén nullához tart.

Mivel a Taylor-sor egy hatványsor, és tudjuk, hogy ha egy függvény hatványsorba fejthető, akkor az csak
egyféleképpen lehetséges, ezért kijelenthetjük, hogy ha egy függvény valamely pont körül hatványsorba fejthető, akkor ez
a függvény Taylor-sora.
A következő táblázat néhány függvény 0 körüli Taylor-sorát adja meg és annak konvergenciatartományát.

f(x) Taylor-sor konvergenciatartomány

(–1, 1)

– ln(1 – x) (–1, 1)

ln (1 + x) (–1, 1)

ln (1 – x2) (–1, 1)

arctg (x) (–1, 1)

cos (x) (–∞, ∞)

sin (x) (–∞, ∞)

ex (–∞, ∞)

A táblázat segítségével további függvények Taylor-sorát határozhatjuk meg.

Például az függvény Taylor-sora az ex függvény Taylor-sorának segítségével:

Fourier-sorok
Ebben a részben a függvénysorok egy másik speciális esetét fogjuk tárgyalni.

Legyen az f függvény 2π szerint periodikus és integrálható valamely [a, a + 2π] intervallumon. Ekkor az f függvény
Fourier-során az
trigonometrikus sort értjük, ahol az együtthatók:

Az a0, ak, bk együtthatókat az f függvény Fourier-együtthatóinak nevezzük.

Megjegyezzük, hogy mivel a Fourier-együtthatók integráljaiban az integrandus 2π szerint periodikus, ezért az


integrálás bármely 2π hosszúságú intervallumon elvégezhető. Ha az f függvény páros vagy páratlan, akkor célszerű a [–π, π]
intervallumon integrálni.

Páros függvény Fourier-sora csak koszinuszos tagokat tartalmaz, páratlan függvényé pedig csak szinuszos tagokat
tartalmaz.

Példák
1. Adjuk meg az alábbi 2π szerint periodikus függvény Fourier-sorát:

Mivel f(–x) = –f(x), ezért a függvény páratlan, így a0 = 0, és a Fourier-sorban csak szinuszos tagok szerepelnek.
Számoljuk ki ezeket:

Ezért a fenti f függvény Fourier-sora a következő:

2. Állítsuk elő az f(x) = |sin x| függvény Fourier-sorát!


Mivel

ezért a függvény páros. Így most a szinuszos együtthatók lesznek nullák. Számoljuk ki a többi együtthatót:

Ezért a fenti f függvény Fourier-sora a következő:

Megjegyezzük, hogy az integrálható periodikus függvények akkor is sorba fejthetők, ha a periódus nem 2π.

Legyen az f függvény 2l szerint periodikus és integrálható valamely [a, a + 2l] intervallumon. Ekkor az f függvény
Fourier-során az
trigonometrikus sort értjük, ahol az együtthatók:
20. Parciális di erenciálegyenletek
20.1. Bevezetés
20.2. Elsőrendű egyenletek
20.3. Másodrendű egyenletek
20.4. Vektoranalízis és integrálátalakító tételek
20.5. A hővezetési egyenlet és a hullámegyenlet

20.1. Bevezetés
Az előző fejezetben megismerkedhettünk a di erenciálegyenlet fogalmával. Ez olyan speciális egyenletet jelent, ahol a
megoldás egy x: R → R egyváltozós függvény. Ebben a részben kiterjesztjük ezt a fogalmat, és olyan egyenletekkel fogunk
foglalkozni, ahol a megoldás egy u : Rn → R többváltozós függvény. Az egyenletben – a di erenciálegyenletekhez hasonlóan
– nemcsak az u függvény fog szerepelni, hanem az u parciális deriváltjai és magasabb rendű parciális deriváltjai is
(természetesen fel fogjuk tenni, hogy ezek léteznek). Az ilyen egyenleteket parciális di erenciálegyenleteknek nevezzük. A
továbbiakban az egyszerűség kedvéért a parciális di erenciálegyenlet kifejezést esetenként PDE-vel fogjuk rövidíteni. A
parciális di erenciálegyenleteket gyakran alkalmazzák a zikában, kémiában, biológiában. A legfontosabb ilyen példákról
egy későbbi fejezetben teszünk említést.
A matematikailag is precíz de níció bevezetése előtt tisztázzunk néhány fogalmat. Az u függvény magasabb rendű
parciális deriváltjaival fogunk foglalkozni, de vajon mit is jelent ez pontosan?
Ha u ∈ C∞(Rn), akkor u parciális derivált függvényei parciálisan deriválhatóak lesznek, és a kapott függvények megint
parciálisan deriválhatóak lesznek. Például egy u ∈ C∞(R3) függvény esetén létezni fog a ∂2∂3∂1∂2∂3u függvény is, amit
magasabb rendű parciális deriváltnak nevezünk. A Young-tétel segítségével belátható, hogy ∂2∂3∂1∂2∂3u = ∂1∂2∂2∂3∂3u, és ha

bevezetjük a (i, k ∈ N) jelölést, akkor A magasabb rendű parciális


derivált rendjének a parciális deriváltak számát nevezzük, azaz a példában 1 + 2 + 2 = 5, azaz a egy ötödrendű
parciális derivált.

Általános esetben, ha u ∈ C∞(Rn), akkor a egy (α1α2, …, αn)-ed-rendű parciális derivált függvény, ahol
α1α2, …, αn ∈ N.
Az egyszerűség kedvéért bevezetjük a következő jelöléseket: , ahol α := (α1, α2, …, αn) multiindex,
és |α|:= α1 + α2 + …+ αn jelölje a parciális derivált függvény rendjét.

Ezek után rátérhetünk a parciális di erenciálegyenlet pontos fogalmának ismertetésére.

Legyen Ω ⊂ Rn nyílt, összefüggő halmaz, azaz egy Rn-beli tartomány, m ≥ 1 egész szám! Jelölje N a legfeljebb m-edrendű
parciális deriváltak számát (azaz az 1 ≤ |α| ≤ m feltételeknek eleget tevő multiindexek számát)! Legyen G ⊂ RN egy
tartomány és F: Ω × G → R tetszőleges függvény!
Olyan u : Ω → R függvényt keresünk, melyre u ∈ Cm(Ω), és kielégíti az

egyenletet minden x ∈ Ω esetén, ahol |α| ≤ m.


Ha ez teljesül, akkor az u függvény klasszikus megoldása az parciális
di erenciálegyenletnek Ω-n, és a parciális di erenciálegyenlet rendje m.

Megjegyzés. Azt mondjuk, hogy egy u tetszőleges függvény megoldása a PDE-nek, ha kielégíti a fenti egyenletet.
Elemi úton megoldható példák
1. Keresendő olyan u : R2 → R függvény, melyre ∂1u = 0!
Könnyű végiggondolni, hogy ∂1u(x, y) = 0 ⇔ u(x, y) = c(y), ahol c: R → R tetszőleges függvény. (Ez megoldás, bár
nem feltétlenül a klasszikus értelemben.)
2. Keresendő olyan u : R2 → R függvény, melyre ∂1∂2u = 0!
Az előző feladat alapján ∂1∂2u(x, y) = 0 ⇔ ∂2u(x, y) = c(y) ⇔ u(x, y) = C(y) + D(x), ahol C, D ∈ C2(R) tetszőleges
függvények, és C(y) primitív függvénye c(y)-nak.

A továbbiakban egyszerűbb parciális di erenciálegyenletek megoldási módszereivel foglalkozunk. A megoldási


módszereket példákon keresztül fogjuk illusztrálni, általánosan csak a különböző típusú PDE-ket de niáljuk.

20.2. Elsőrendű egyenletek

Homogén lineáris parciális di erenciálegyenletek


Inhomogén, illetve kvázilineáris parciális di erenciálegyenletek
Cauchy-feladatok

Homogén lineáris parciális di erenciálegyenletek

A egyenletet homogén lineáris parciális di erenciálegyenletnek nevezzük, ahol Ω ⊂ Rn


tartomány, x ∈ Ω a változó, fi: Ω → R folytonos függvények, i = 1, …, n.

Keresendő olyan u : Ω → R, u ∈ C1(Ω) függvény, ami megoldása a fenti PDE-nek.

Tömören kifejezve, legyen , azaz f: Rn → Rn, és keresünk egy olyan u ∈ C1(Ω) függvényt, melyre
〈 〉
f(x), u′(x) = 0, ∀x ∈ Ω esetén.
Most nézzük, hogyan kell megoldani ezt a típusú feladatot. Az eljárást csak a háromdimenziós esetre részletezzük, a
két-, illetve többdimenziós eset lényegében ugyanaz, a példákban ezekre is ki fogunk térni.
Tehát n = 3 esetén olyan u : R3 → R folytonosan deriválható függvényt keresünk, amely megoldása az

elsőrendű homogén lineáris PDE-nek.


Megoldási módszer:
1. A fenti elsőrendű homogén lineáris PDE-hez tartozó karakterisztikus rendszernek nevezünk egy

függvényre (ami egy görbe) vonatkozó

közönséges di erenciálegyenlet-rendszert. Ennek a megoldásai a karakterisztikus görbék. Felírjuk a PDE-hez tartozó


karakterisztikus rendszert.
2. Ezek után olyan g : R3 → R folytonosan di erenciálható függvényeket keresünk, amelyek az előbbi karakterisztikus
rendszer megoldásai mentén állandók, azaz a t ↦ g(x(t), y(t), z(t)) függvény konstans, tehát ennek deriváltja nulla. Az ilyen
függvényeket a karakterisztikus rendszer első integráljának nevezzük.
3. Ekkor tetszőleges folytonosan deriválható h : R → R függvényre az (x, y, z) ↦ h(g(x, y, z)) hozzárendeléssel értelmezett
függvény megoldása lesz a fenti elsőrendű homogén lineáris PDE-nek.
4. Látható, hogy rengeteg megoldása van ennek a típusú PDE-nek. Belátható, hogy ha φ1:R3 → R, φ2 : R3 → R
folytonosan di erenciálható megoldások, akkor tetszőleges ø : R2 → R, ø ∈ C1(R2) esetén ø(φ1, φ2): R3 → R is megoldása a
homogén lineáris PDE-nek.
Ha φ1: R3 → R, φ2: R3 → R olyan megoldásai a PDE-nek, hogy a jelöléssel a

Jacobi-mátrix rangja 2, akkor a φ1, φ2 neve alaprendszer.


Az alaprendszert jellemző rang tulajdonságot függetlenségnek hívjuk, azaz ekkor azt mondjuk, hogy a φ1, φ2 megoldások
függetlenek. Ez pontosan azt jelenti, hogy ezen φ1, φ2 megoldások esetén nem létezik olyan h ∈ C1(R), melyre h ⊂ φ1 ◦ φ2,
vagyis a megoldások „egymásba nem vihetők” kompozíció segítségével.
Igazolható, hogy bármely u megoldás előáll u = ø(φ1, φ2) alakban alkalmas ø:R2 → R, ø ∈ C1(R2) mellett. Tehát az
általános megoldás u = ø(φ1, φ2), ahol φ1, φ2 alaprendszer, és ø ∈ C1(R2) tetszőleges függvény.

Megjegyzés. 1. Általánosan n dimenzióban φ1, …, φn–1: Rn → R folytonosan di erenciálható megoldások esetén, ha a

Jacobi-mátrix rangja n – 1 (amit úgy ellenőrizhetünk, hogy létezik (n – 1) × (n –


1)-es nem nulla részdetermináns), akkor a φ1, …, φn–1 rendszert alaprendszernek nevezzük, és az általános megoldás
u = ø(φ1, …, φn – 1), ahol φ1, …, φn – 1 alaprendszer, és ø ∈ C1(Rn) tetszőleges függvény. 2. Két dimenzióban a 3. lépés
után már a (x, y, z) ↦ h(g(x, y, z)) függvény megadja az általános megoldást, hiszen az alaprendszer 1 elemű lesz, így a
4. lépéssel már nem kell foglalkoznunk.
Példák két dimenzióban
1. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását!

Átrendezve kapjuk, hogy

azaz, f1(x, y) = x, f2(x, y) = –y. A karakterisztikus rendszer tehát:

Innen azt nyerjük, hogy x(t) = c1et, y(t) = c2e–t, c1, c2 ∈ R, vagyis a g (x, y) = xy függvény állandó a megoldások
mentén, hiszen g(x(t), y(t)) = c1c2ete–t = c1c2et–t = c1c2, tehát a feladat általános megoldása egy (x, y) ↦ h(xy) alakú
függvény (ahol h : R → R tetszőleges C1(R)-beli függvény).
Valóban: u(x, y) = h(xy) választással ∂1u(x, y) = h′(xy)y és ∂2u(xy) = h′(xy)x, így

Például konkrét megoldások az (x, y) ↦ xy vagy az (x, y) ↦ exy függvények, hiszen h:x ⊂ ex C1(R)-beli függvény. Itt
az alaprendszer 1 elemű: (x, y) ↦ xy, mert kétdimenziós volt a feladat.
2. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását:

Átrendezve kapjuk, hogy

azaz f1(x, y) = y, f2(x, y) = –x. A karakterisztikus rendszer tehát:

Most következik az a lépés, mikor olyan g: R2 → R függvényeket keresünk, amelyek a karakterisztikus rendszer
megoldásai mentén állandók. Ennek a függvénynek a megtalálásához n = 2 esetén több módszer is
rendelkezésünkre állhat. Az egyik az előbb bemutatott, kezdjük megint ezzel!
Első módszer. A karakterisztikus rendszert megoldva azt nyerjük, hogy x(t) = c · sin t, y(t) = c · cos t. Vagyis a
karakterisztikus görbék c sugarú körök, tehát ezek mentén az origótól mért távolság lesz állandó, azaz

azaz g(x, y) = x2 + y2, tehát a feladat általános megoldása egy h (x2 + y2) alakú függvény (ahol h : R → R tetszőleges
C1(R)-beli függvény).
Második módszer. Első integrál keresése a „teljes derivált” módszerével. Ez az eljárás csak speciális esetekben
alkalmazható. Vegyük észre, hogy ha a karakterisztikus egyenletrendszer első egyenletét beszorozzuk 2x(t)-vel, a
másodikat pedig 2y(t)-vel, akkor a bal oldalon éppen a két ismeretlen függvény négyzetének deriváltjai
szerepelnek. Az egyenleteket összeadva tehát az

egyenlőséget nyerjük, vagyis ismét azt kaptuk, hogy a megoldások mentén az (x, y) ↦ x2 + y2 függvény állandó,
vagyis g(x, y) = x2 + y2, tehát a feladat általános megoldása egy h(x2 + y2) alakú függvény.
Harmadik módszer. Egy

kétdimenziós közönséges di erenciálegyenlet-rendszert Hamilton-rendszernek nevezünk, ha található olyan H :


R2 → R, H ∈ C1(R2) függvény, melyre f1 = ∂2H és f2 = –∂1H.
Azaz a di erenciálegyenlet

alakú. Egy

egyenletrendszer pontosan akkor Hamilton-rendszer, ha f ∈ C1(R) és ∂1f1(x, y) + ∂2f2(x, y) = 0. Így bármely


közönséges di erenciálegyenlet-rendszer esetén ellenőrizhető, hogy Hamilton-rendszerrel állunk-e szemben. Ha
a karakterisztikus rendszer

alakú, akkor a rendszer Hamilton-rendszer is, és H(x, y) = G1(y) + G2(x), ahol (g1 és g2 folytonos
függvények).
Azért érdemes megnézni, hogy a rendszerünk Hamilton-rendszer-e, mert ha az, akkor a H függvény a
karakterisztikus rendszer első integrálja, vagyis a karakterisztikus görbék mentén H állandó, és pont egy ilyen
tulajdonságú függvényt keresünk.
Nézzük, mit jelent ez a mostani feladatban! A karakterisztikus egyenlet:

Emlékszünk, hogy f1(x, y) = y(= g1(y)), f2(x, y) =–x(= –g2(x)), és ∂1f1(x, y) + ∂2f2(x, y) = 0 + 0 = 0, vagyis Hamilton-

rendszerről van szó, így az első integrál, és ha az függvény a


karakterisztikus görbék mentén állandó, akkor az (x, y) ↦ x2 + y2 függvény is. Tehát a feladat általános megoldása
egy h(x2 + y2) alakú függvény.
Az utolsó két módszer előnye, hogy nem kell konkrétan ismerni a karakterisztikus rendszer megoldását ahhoz,
hogy a kívánt tulajdonságú g függvényt előállítsuk. Megjegyezzük, hogy az első feladat is megoldható lenne
ezekkel a módszerekkel. Nézzük meg, hogy hogyan!
3. Az első feladatot oldjuk meg a most tanult új módszerekkel is! Az alábbi elsőrendű homogén lineáris PDE
általános megoldását keressük:

A karakterisztikus rendszer:

Megoldás a „teljes derivált” módszerével a következő. Szorozzuk be a karakterisztikus egyenlet első


egyenletéty(t)-vel, a másodikat x(t)-vel, és adjuk össze őket:
Vegyük észre, hogy a bal oldalon a szorzatfüggvény deriváltja áll:

azaz a g: (x, y) ↦ xy függvény a karakterisztikus görbék mentén állandó, így a feladat általános megoldása egy (x,
y) ↦ h(xy) alakú függvény, ahol h: R → R tetszőleges C1(R)-beli függvény. Tehát kijött ugyanaz az eredmény.
Hamilton-módszer. Vizsgáljuk meg a karakterisztikus rendszert, emlékszünk, hogy f1(x, y) = x, f2(x, y) = –y.

tehát ez egy Hamilton-rendszer, és az első integrál a H függvény lesz.


H(x, y) = xy jó lesz, mert ekkor f1 = ∂2H és f2 = –∂1H. Vagyis az általános megoldás így is egy (x, y) ↦ h(xy) alakú
függvény.
Fontos megjegyeznünk, hogy ezek az új módszerek csak speciális típusú karakterisztikus rendszerek első
integráljának megkeresésére alkalmazhatók!

Háromdimenziós példa
1. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását!

Ekkor f1(x, y, z) = yz, f2(x, y, z) = xz, f3(x, y, z) = x2 + y2. A karakterisztikus rendszer tehát:

Az előző megoldás gondolatmenete alapján szorozzuk be az első egyenletet 2x(t)-vel, a másodikat pedig 2y(t)-vel,
majd vonjuk ki ezeket egymásból. Ekkor az alábbi egyenlőséget kapjuk:

Tehát a φ1: (x, y, z) ↦ x2 – y2 megoldás, hiszen a karakterisztikus görbék mentén ez a függvény állandó. Az
alaprendszer meghatározásához két független megoldásra van szükségünk, úgyhogy még egy megoldást kell
találnunk. A harmadik egyenletet 2z(t)-vel szorozva, majd az első két egyenletet felhasználva nyerjük, hogy

tehát

vagyis összefoglalva:

két megoldása a lineáris PDE-nek, hiszen φ2 is állandó a karakterisztikus görbék mentén. Nézzük meg, hogy
függetlenek-e! A deriváltakból álló mátrix

Ennek rangja az origó kivételével mindenhol 2, azaz az origó kivételével az általános megoldás az

alakban adható meg, ahol φ ∈ C1(R2) tetszőleges függvény.


2. Határozzuk meg az alábbi elsőrendű homogén lineáris PDE általános megoldását!

Ekkor f1(x, y, z) = x, f2(x, y, z) = y, f3(x, y, z) = z. A karakterisztikus rendszer pedig:


Ennek az egyenletrendszernek a megoldásai ismertek:

Ekkor a megoldása a PDE-nek, hiszen a karakterisztikus görbék mentén állandó. Ugyanígy

is megoldás. (Feltesszük, hogy x, y ≠ 0.)


A Jacobi-mátrix

Ennek a rangja 2, ha x, y ≠ 0. Így ha x, y ≠ 0, akkor az általános megoldás

ø ∈ C1(R2) tetszőleges függvény.

Inhomogén, illetve kvázilineáris parciális di erenciálegyenletek

A , ∀x ∈ Ω típusú egyenletet inhomogén, illetve kvázilineáris parciális


di erenciálegyenletnek nevezzük, ahol Ω ⊂ Rn egy tartomány, x ∈ Ω a változó, fi: Ω × R → R folytonos függvények, i =
0, 1, …, n.

Egy u: Ω → R megoldás, ha u ∈ C1(Ω), és teljesül rá a fenti egyenlet.

Tömören kifejezve, legyen azaz f : Rn → Rn, és keresünk egy olyan u ∈ C1(Ω) függvényt,
melyre 〈f(x, u(x)), u′(x)〉 = f (x, u(x)), ∀x ∈ Ω esetén.
0

Megjegyzés. A kvázilineáris PDE-nek speciális esete a homogén lineáris PDE f0(x, u(x)) = 0 és fi (x, u(x)) = fi(x)
választással.

A megoldási eljárást két dimenzióban (n = 2 esetén) mutatjuk be. Ekkor az ilyen típusú egyenlet általános alakja:

A megoldási módszer ebben az esetben a következő:


1. A feladatot visszavezetjük egy háromdimenziós homogén lineáris PDE megoldására. A transzformált egyenlet
bevezetve a v : R3 → R függvényt:

2. Ekkor a v függvényre vonatkozóan egy háromdimenziós homogén lineáris PDE-t kapunk (x, y, u) ∈ R3 változóval,
melynek megoldását az előző módszerrel határozhatjuk meg.
3. Ha az általános megoldást nullává téve a kapott formulából ki tudjuk fejezni az u változót, akkor az így kapott
kifejezés megoldása lesz az eredeti feladatnak.

Példák
1. Adjuk meg az alábbi egyenlet általános megoldását:
A transzformált egyenlet a következő lesz:

ahol már (x, y, u) ∈ R3 a változó.


Igazoltuk, hogy ennek általános megoldása a

függvény, ahol ø ∈ C1(R)2) tetszőleges függvény.


A fentiek alapján az eredeti egyenlet u(x, y) megoldására teljesül a

összefüggés. Ezt u implicit alakjának nevezzük.


Az u(x, y) megoldást úgy kaphatjuk meg, ha a ø(x2 – y2, u2 – 2xy) = 0 egyenletből az u függvényt mint változót
kifejezzük.
Belátható, hogy ha ∂2ø ≠ 0, akkor ø második változója kifejezhető az első segítségével:

ahol ψ ∈ C1(R) alkalmas függvény.


Vagyis a PDE általános megoldása:
, amennyiben ez értelmes, ψ ∈ C1(R) tetszőleges.
Ezt u explicit alakjának nevezzük.
2. Adjuk meg az alábbi egyenlet általános megoldását:

A transzformált egyenlet a következő lesz:

Az ehhez tartozó karakterisztikus egyenlet:

Láttuk, hogy a karakterisztikus görbék mentén állandó a

függvény. Emellett a karakterisztikus egyenlet első egyenletét a harmadikba helyettesítve, majd u-val osztva
kapjuk, hogy

azaz

ami azt jelenti, hogy a

lesz a másik keresett függvény. A Jacobi-mátrix, ha u ≠ 0:

melynek rangja 2, vagyis φ1, φ2 függetlenek, így a transzformált egyenlet általános megoldása
A fentiek alapján az eredeti egyenlet u(x, y) megoldását úgy kaphatjuk meg, ha a

egyenletből az u függvényt mint változót kifejezzük.


Ha ∂2ø ≠ 0, akkor ψ második változója kifejezhető az első segítségével:

ahol ψ ∈ C1(R) tetszőleges függvény.


Vagyis a PDE általános megoldása:

Cauchy-feladatok
Itt olyan feladatokról lesz szó, ahol a kvázilineáris PDE-t egy mellékfeltétellel látjuk el: a PDE megoldását előírjuk egy görbe
mentén. Az ilyen feladatokat Cauchy-feladatoknak nevezzük. Megjegyezzük, hogy a homogén lineáris PDE speciális esete a
kvázilineáris PDE-nek, így a Cauchy-feladatban homogén lineáris PDE is szerepelhet.
Szemléletesen az u megoldások felületek, a mellékfeltétel pedig egy görbe. A Cauchy-feladat megoldása azt jelenti, hogy
a felületseregből megkeressük a görbére illeszkedőt. A megoldási módszert példákon illusztráljuk.

Példák
1.

Oldjuk meg a Cauchy-feladatot!


Keressük meg a kvázilineáris PDE megoldását! A hozzátartozó homogén lineáris PDE:

Ennek a megoldását már ismerjük:

Azaz az eredeti megoldás implicit alakja:

u explicit alakja, ha ∂2ø ≠ 0, akkor

Most kell megnézni, hogy az u(x, x2) = x3 feltétel mely megoldásokra teljesül, ezért behelyettesítünk:

azaz

Tehát a ψ(x) = x választással teljesül a mellékfeltétel. Nézzük meg, hogy mi adódik így u-ra:

A Cauchy-feladat megoldása ez az u függvény. Ennek a Cauchy-feladatnak ez az egy megoldása van.


2.

Oldjuk meg a Cauchy-feladatot!


Keressük meg a homogén lineáris PDE megoldásait! Ennek a megoldását már kiszámoltuk:

Most megnézzük, hogy az feltétel mely megoldásokra teljesül, behelyettesítünk:

Ezt a feltételt végtelen sok ø ∈ C1(R) függvény kielégíti, így végtelen sok megoldása lesz a Cauchy-feladatnak is. A
megoldások:

3.

Oldjuk meg a Cauchy-feladatot!


A PDE általános megoldása:

Most megnézzük, hogy az feltétel mely megoldásokra teljesül, behelyettesítünk:

Ezt a feltételt egyetlen ø ∈ C1(R) függvény sem teljesíti, hiszen ez nem is függvény, így nincs megoldása a Cauchy-
feladatnak.

Meg gyelhető, hogy a mellékfeltételtől függően előfordulhat, hogy egy Cauchy-feladatnak nincs megoldása, 1
megoldása van vagy végtelen sok. Belátható, hogy ha a mellékfeltételben lévő görbe minden karakterisztikus görbét
pontosan egyszer metsz, akkor van egyértelmű megoldás.

20.3. Másodrendű egyenletek

Másodrendű lineáris parciális di erenciálegyenletek


Cauchy-feladat parabolikus egyenletekre
Hiperbolikus egyenletekre vonatkozó Cauchy-feladat
Elliptikus peremérték feladatok

Másodrendű lineáris parciális di erenciálegyenletek

A másodrendű lineáris parciális di erenciálegyenlet általános alakja:

ahol ai, j, bi, c, f ∈ C(Ω) és Ω ⊂ Rn tartomány.

Egy u : Ω → R megoldás, ha u ∈ C2(Ω), és teljesül rá a fenti egyenlet.

A részt az egyenlet főrészének hívjuk. Ez a rész dönti el a lineáris egyenlet típusát.


Tekintsük a együtthatómátrixot!
Mivel u ∈ C2(Ω), így a Young-tétel szerint ∂i∂ju = ∂j∂iμ (i, j = 1, …, n), vagyis feltehető, hogy A(x) szimmetrikus mátrix.
Ismert, hogy valós szimmetrikus mátrix sajátértékei valósak.
Ezek után osztályozhatjuk a másodrendű lineáris PDE-ket a sajátértékeik alapján.

Jelölje n+ az A(x) pozitív sajátértékeinek számát multiplicitással, n– az A(x) negatív, míg n0 az A(x) 0 sajátértékeinek
számát multiplicitással. Nyilván n+ + n– + n0 = n.
Azt mondjuk, hogy másodrendű lineáris PDE x-ben elliptikus, ha n+ = n vagy n_ = n.
Hiperbolikus, ha n+ = 1 és n–= n – 1 vagy n+ = n – 1 és n– = 1.
Parabolikus, ha n0 = 1 és n+ = n – 1 vagy n– = n – 1.

Alappéldák

1. , bi(x) ≡ 0, ∀i, c(x) ≡ c ∈ R:

elliptikus egyenlet.

2. , bi(x) ≡ 0, ∀i, c(x) ≡ c ∈ R:

hiperbolikus egyenlet.
Ha új változót vezetünk be: x = (t, x1, x2, …, xn–1) esetén az egyenlet

alakúra módosul.

3. , bi(x) ≡ 1, bi(x) ≡ 0, ∀i ≥ 2, c(x) ≡ 0:

parabolikus egyenlet, vagy az előbbi új változóval:

Megjegyzés. Az alappéldákban szereplő mátrixok főátlóiban természetesen a sajátértékek találhatók, ezért könnyen
meghatározhatók az egyenletek típusai.

Állandó együtthatósnak hívjuk az olyan egyenleteket, ahol ai, bi, c ∈ R, azaz konstans függvények.
Belátható, hogy egy állandó együtthatós elliptikus, hiperbolikus, illetve parabolikus egyenlet a változók és az u
függvény transzformációjával a fenti 1., 2., 3. alakra hozható. Ezeket az alakokat kanonikus alaknak nevezzük.

Példa másodrendű lineáris egyenlet típusának meghatározására: Mu:= –6 · ∂1∂2u milyen típusú?

Mivel ∂1∂2u = ∂2∂1u, így Mu:= –6 · ∂1∂2u = –3 · ∂1∂2u – 3 · ∂2∂1u és


A(x) sajátértékei az x2 – 9 = 0 egyenlet megoldásai: x1 = 3 és x2 = – 3. Tehát n+ = 1 és n– = 1, vagyis Mu hiperbolikus típusú
PDE.

A következő szakaszban megemlítjük, hogy a legegyszerűbb egyenletek esetén mi a megoldó képlet, illetve milyen
technikával kaphatunk megoldást.

Cauchy-feladat parabolikus egyenletekre


Az alábbiakban vizsgált feladat a közönséges di erenciálegyenletek elméletében megismert kezdetiérték-feladattal rokon.
Tekintsük az alábbi problémát, amely egy Cauchy-feladat parabolikus egyenletekre:

míg n = 1, azaz egydimenziós feladat esetén az

problémát.

Megjegyzés. A jelölések kicsit megváltoztak: t > 0 a „0. változó”, és ∂i jelöli a xi szerinti parciális deriváltat. Gyakran
használják ezt a fajta jelölést is. Vigyázat, az u egy n + 1 változós függvény!

A megoldás kiszámítását csak a homogén esetre mutatjuk be, azaz amikor f(t, x) = 0. Ekkor a

homogén, parabolikus egyenletre vonatkozó Cauchy-feladatnak, amelynek megfelelője több dimenzióban a

probléma, megoldását az

egyenlőséggel de niált függvény adja meg. Ez n = 1, azaz egydimenziós feladat esetén az

alakot ölti.

Példa

Oldjuk meg a parabolikus egyenletre vonatkozó Cauchy-feladatot!


A megoldási formula alapján azt írhatjuk, hogy

amiből az s = x – ξ helyettesítéssel és az integrálási határok felcserélésével azt kapjuk, hogy


Közben használtuk, hogy , valamint azt, hogy az egyik integrál, ami
egy páratlan függvényre vonatkozott (itt sin x-re), az nulla.

Hiperbolikus egyenletekre vonatkozó Cauchy-feladat


Tekintsük az alábbi problémát, amely egy másodrendű hiperbolikus PDE-re vonatkozó Cauchy-feladat:

A fenti probléma megoldását csak n = 2 esetén és homogén esetben vizsgáljuk, azaz ha f ≡ g ≡ 0. Vagyis

Ennek a feladatnak a megoldását az

képlet adja meg. Az első integrált a másodikkal egy polártranszformáció köti össze, és Br(x) jelöli az x középpontú, r sugarú
körlapot a síkon.

Elliptikus peremérték feladatok


Ezekben a típusú feladatokban más stratégiát kell választanunk a megoldás megkereséséhez. Az előzőekben olyan
problémákat vizsgáltunk, ahol a tartomány, amelyen az egyenletet tekintettük, nem volt korlátos. Ekkor is adtunk
peremfeltételt, a perem azonban csak a {0} × Rn halmaz volt. Amennyiben korlátos halmazon vizsgáljuk az egyenleteket
(amely a valóságban sokkal gyakrabban fordul elő különböző modellekben), akkor annak határán kell valamilyen
peremfeltételt megadni. Ez ad ötletet, hogy hogyan adjuk meg egy megoldását az elliptikus PDE-nek.

Példa
1. Legyen K:= B1(0, 0) ⊂ R2 az egységkörlap, és ∂K:= {(x, y): x2 + y2 = 1} jelölje a peremét! Adjuk meg az alábbi
peremérték-feladat egy megoldását:

Mivel a keresett u függvény a határon nulla, azért keressük olyan alakban, hogy ezt a peremfeltételt azonnal
biztosítsuk: olyan lehető legegyszerűbb szorzótényezővel látjuk el, ami a peremen nulla, vagyis a (x2 + y2 – 1)-gyel.
Legyen tehát

ahol az a, b, c számokat nekünk kell megfelelően megválasztanunk. A második tényezőt azért választottuk
elsőfokú polinomnak, mert így reméljük, hogy a második deriváltak ismét elsőfokúak lesznek, mint ahogy x + y is
az. Ekkor

és ezt a függvényt az elliptikus PDE-be beírva:

Ez a két kétismeretlenes polinom megegyezik az egységkörön, ha a megfelelő együtthatók megegyeznek, azaz


tehát

Ezt visszahelyettesítve azt kapjuk, hogy

Ez a függvény a peremen valóban 0, és teljesíti a PDE-t is, tehát megoldása a feladatnak.

20.4. Vektoranalízis és integrálátalakító tételek

A vektoranalízis elemei: gradiens, divergencia, rotáció és a nabla operátor


A vonalintegrál fogalma és tulajdonságai
A felület fogalma és a felületi integrál
Integrálátalakító tételek

A vektoranalízis elemei: gradiens, divergencia, rotáció és a nabla operátor


Ebben a fejezetben főleg f: Rn → Rn függvényekről lesz szó, ezek az n-dimenziós tér minden pontjához egy n-dimenziós
vektort rendelnek hozzá, azaz vektor-vektor függvények. Az ilyen függvényeket vektormezőnek szoktuk hívni.
A teljesség kedvéért megemlítjük, hogy az f: Rn → R függvényeket skalármezőnek szoktuk nevezni (mert itt f vektor-
skalár függvény). Ehhez kapcsolódik a következő fogalom.

Legyen f : R3 → R di erenciálható függvény R3-on. Az f skalármező gradiensének nevezzük azt a grad f: R3 → R3


függvényt, amely minden (x, y, z) ∈ R3 ponthoz hozzárendeli az (x, y, z)-beli parciális deriváltakat, vagyis

Térjünk vissza a vektormezők témaköréhez, speciálisan az f : R3 → R3 függvényekhez!

Legyen f: R3 → R3 di erenciálható függvény R3-on. Az f vektormező divergenciájának nevezzük azt a div f: R3 → R


függvényt, amely minden (x, y, z) ∈ R3 ponthoz hozzárendeli a következő számot:

ahol fi az i-edik koordinátafüggvény (i = 1, 2, 3).


Változók nélkül felírva:

A vektormező rotációja pedig egy f: R3 → R3 di erenciálható függvény esetén legyen az a rot f: R3 → R3 függvény, mely
tetszőleges (x, y, z) ∈ R3 ponthoz a következő vektort rendeli hozzá:

Mindkét de níciónál feltettük, hogy az f: R3 → R3 vektormező di erenciálható, azaz – a 17.6. fejezet alapján – létezik az
derivált mátrix.
Meg gyelhető, hogy a divergencia a derivált mátrix nyoma, míg a rotációt a főátlón kívüli megfelelő elemeknek a
különbségeit vektorba rendezve kaphatjuk meg.

Vezessük be a következő szimbolikus vektort, melyet nablának hívunk:

Például egy f: R3 → R di erenciálható függvényre „alkalmazva” a ∇ vektort:

Megjegyzés. Itt f-et skalárnak tekintettük, és a skalár vektor szorzás alapján szoroztuk f-et és a ∇ vektort össze.

Egy f: R3 → R3 di erenciálható függvény esetén

Megjegyzés. Emlékeztetünk, hogy a fenti 〈x, y〉 skaláris szorzás de níciója tetszőleges x, y ∈ Rn, n ∈ N esetén:
〈 〉
n x, y := x1, y1 + x2, y2 + … + xn, yn.

Ugyanígy

Megjegyzés. Az előbb a vektoriális szorzat fogalmát használtuk: ha x, y ∈ R3, akkor

Fontos megemlíteni, hogy a ∇ vektornak önmagában nincs értelme, csak egy jelképes jelölés, melynek segítségével
könnyebben megjegyezhetjük az eddigi fogalmakat.

Az utolsó szemléletes összefüggést úgy kapjuk, ha nabla vektort önmagával skalárisan összeszorozzuk:

azaz f: R3 → R függvényre
Ezt az operátort (vagy hozzárendelést), mely az f : R3 → R függvényhez hozzárendeli az Lf : R3 → R függvényt, Laplace-
operátornak nevezzük.
A vonalintegrál fogalma és tulajdonságai
Legyen φ: [a, b] → R3 egy olyan folytonos paraméterezett görbe, ami folytonosan di erenciálható. Emellett minden t ∈ [a,
b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ1(t1) ≠ φ(t2). A továbbiakban mindig feltesszük, hogy a φ görbe ilyen
tulajdonságú, ugyanis ilyen görbe és folytonos f:R3 → R3 esetén belátható, hogy az f függvény – alább de niált –
vonalintegrálja a φ görbén létezik.
Vezessük be a vonalintegrál fogalmát tetszőleges f: R3 → R3 függvényre!

Vegyük az [a, b] intervallum egy felosztását: a = t0 < t1 < … < tn = b, jelöljük ezt Φ = {I1, I2, …, In} ∈ FO[a, b]-vel. Legyen ξ =
(ξλ, …, ξn) ∈ Rn a felosztáshoz tartozó osztópontvektor (azaz ξ ∞Φ). Ekkor a

összeg egy közelítő összege lesz f vonalintegráljának a φ görbén.

Megjegyzés. A skaláris szorzat a de nícióban értelmes, hiszen f(φ(t1)), φ(ti) – φ(ti–1) ∈ R3.

Ha van olyan A ∈ R szám, hogy minden ϵ > 0 számhoz létezik olyan δ > 0, hogy minden Φ ∈ FO[a, b], |Φ| < δ felosztás és
minden ξ ∝ Φ osztópontvektor esetén

akkor azt mondjuk, hogy f integrálható a φ görbe mentén, és f vonalintegrálja a φ görbe mentén A, azaz .

Vajon hogyan számolható ki a vonalintegrál? Ha a φ görbe folytonosan di erenciálható, akkor

a Lagrange-tétel és φ′ folytonossága miatt. Látható, hogy ahogy a Φ felosztás nomodik, úgy a φ(ti) – φ(ti – 1) ≈ φ′(ξi)(ti – ti–1)
becslés egyre pontosabbá válik. Ez alapján:

Belátható, hogy a két integrál egymással pontosan megegyezik, vagyis igaz a következő tétel:

Legyen φ: [a, b] → R3 egy olyan folytonos paraméterezett görbe, ami folytonosan di erenciálható! Emellett minden t ∈
[a, b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Emellett legyen f: R3 → R3 folytonos függvény! Ekkor

létezik, és

Vagyis megfelelő feltételek esetén f vonalintegrálja átírható egy Riemann-integrállá.


Ennek a tételnek a segítségével a vonalintegrál könnyen kiszámolható, hiszen Riemann-integrált számolni már
tudunk.

Példa. Legyen Számoljuk ki a vonalintegrált!


A tétel alapján

A felület fogalma és a felületi integrál

Egy ø: T ∈ R2 → R3 folytonos függvény képhalmazát paraméterezett felületnek nevezzük.

A továbbiakban olyan ø: T ⊂ R2 → R3 függvényekkel foglalkozunk, melyek folytonosan di erenciálhatók, emellett


minden (u, v) ∈ T-re ø ∂1(u, v) × ∂2φ(u, v) ≠ 0, és ha (u1, v1) ≠ (u2, v2) belső pontok, akkor ø(u1 v1) ≠ ø(u2, v2). Megjegyezzük,
hogy a ∂1ø(u, v) × ∂2ø(u, v) vektor az (u, v) ponthoz tartozó felületre merőleges kifelé mutató normálvektor.

Például az egységgömbfelület a, , (u, v) ∈ [0, π] × [0, 2π] függvény képhalmaza.


Szeretnénk de niálni a felületi integrálját egy f: R3 → R3 vektormezőnek. Vegyünk egy felületet a háromdimenziós
térben, azaz legyen ø: T → R3 folytonos függvény és F:= ø(T)! Képzeljük el, hogy a felületen átáramlik valamilyen folyadék.
Legyen f: R3 → R3 az a függvény, ami egy x ∈ F ⊂ R3 ponthoz hozzárendeli a folyadék x-beli sebességvektorát. Ekkor az f
vektormező integrálja az F felületen jelentse azt a mennyiséget, hogy egységnyi idő alatt mennyi folyadék áramlik át a
felületen. A felületi integrált a következő formulával számíthatjuk ki.

Legyen ø: T ⊂ R2 → R3 folytonosan di erenciálható paraméterezett felület, minden (u, v) ∈ T-re ∂1ø(u, v) × ∂2ø(u, v) ≠ 0,
és ha (u1, v1) ≠ (u2, v2) belső pontok, akkor ø(uv v1) ≠ ø(u2, v2). Legyen f: R3 → R3 folytonos függvény!

Ekkor létezik, és .

Példa. Számítsuk ki az r sugarú, origó középpontú gömb felszínét!

Az r sugarú, origó középpontú gömbfelület paraméterezése: ,

A felszín kiszámításához az függvényt kell integrálnunk a gömb felszínén (mert így az f(ø(u, v))
vektorok hossza 1 lesz, és így valóban a felszínt fogjuk megkapni). A képlet használatához ki kell számolni a ∂1ø(u, v) ×
∂2ø(u, v) vektort:
Többször is kihasználtuk, hogy cos2 u + sin2 u = 1.

A most következő szakaszban újabb példákat láthatunk felületi integrál kiszámítására.

Integrálátalakító tételek
Az itt szereplő tételek lényegében a Newton–Leibniz-szabály általánosításai. Egy térbeli halmazon (testen) vett integrálást
köti össze a halmaz határán mint felszínen vett integrálással a következő tétel.

Gauss–Osztrogradszkij-tétel:
Legyen ø: T ⊂ R2 → R3 folytonosan di erenciálható paraméterezett zárt felület, minden (u, v) ∈ T-re ∂1ø(u, v) × ∂2ø(u,
v) ≠ 0, és ha (u1, v1) ≠ (u2, v2) belső pontok, akkor ø(uv v) ≠ ø(u2, v2). F := ø(T) és V ⊂ R3 az F felület által határolt korlátos
test. Legyen f: R3 →R3 folytonosan di erenciálható függvény! Ekkor

Azaz az f függvény F felületen vett integrálja megegyezik a div f: R3 → R háromváltozós függvény V testen vett
Riemann-integráljával.

Megjegyzés. A zárt felület azt jelenti, hogy a felület egy V korlátos testet határol.

Példa. Legyen ø az egységgömbfelület: ,

és Ḡ jelölje a gömböt!

Legyen Bizonyítsuk be, hogy ezen ø-re és f-re teljesül a Gauss–Osztrogradszkij-tétel!


Be kellene látni, hogy

Tekintsük az összefüggés bal oldalát, ami egy felszíni integrál. A ∂1ø(u, v) × ∂2ø(u, v) vektort már kiszámoltuk, így

Ugyanis , mert v ↦ cos v sin3 v páratlan függvény, ami egy origóra szimmetrikus
intervallumon van integrálva.
Számoljuk ki a másik két integrált is, hogy valóban nullák-e.

Kihasználtuk, hogy ∫(f ◦ g) · g′ = (∫f) ◦ g, f(t) = 1 – t2 és g(t) = sin t függvényekkel, és hogy sin u 2π-nként periodikus.
Ugyanilyen logikával
Ezek mellett nagyon fontos, hogy a ∫ ∫a(x)b(y)dxdy alakú integrálokat a következő módon számoltuk ki:

ugyanis az integrálban lévő „konstansokat” mindig kiemeltük.


Most tekintsük a Gauss–Osztrogradszkij-összefüggés jobb oldalát, ami egy Riemann-integrál:

vezessük be a következő polárkoordinátákat:

Ekkor

Az első két integrál természetesen 0 a periodikusság miatt, a harmadik integrál pedig a következők miatt:

Tehát beláttuk, hogy a Gauss–Osztrogradszkij-összefüggés jobb és bal oldala is 0 ezekre a függvényekre.

A következő tétel a háromdimenziós vonalintegrál és a felszíni integrál között teremt kapcsolatot.

Stokes-tétel:
Legyen φ: [a, b] → R3 folytonosan di erenciálható, paraméterezett zárt görbe, azaz φ(a) = φ(b)! Emellett minden t ∈ [a,
b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Legyen F egy, a φ görbe által határolt felület és f: R3 → R3
folytonosan di erenciálható függvény. Ekkor

Azaz az f függvény φ görbén vett integrálja megegyezik a rot f: R3→R3 függvény F felületen vett integráljával.

Példa. Legyen ! Számoljuk ki mindkét módszerrel az függvény


vonalintegrálját!
Először a szokásos módszerrel:

Kihasználtuk, hogy cos2t – sin2t = cos 2t, hogy cos 2t sin 2t = sin 4t és a periodikusságot. A Stokes-tétel segítségével
még könnyebben kiszámolhatjuk a vonalintegrált:
Most nézzük, hogy milyen kapcsolat van a kétdimenziós vonalintegrál és a síkbeli Riemann-integrál között!

Green-formula:
Legyen φ : [a, b] → R2 folytonosan di erenciálható, paraméterezett zárt görbe, azaz φ(α) = φ(b)! Emellett minden t ∈
[a, b]-re φ′(t) ≠ 0, és ha t1 ≠ t2 belső pontok, akkor φ(t1) ≠ φ(t2). Legyen T ⊂ R2 a φ görbe által határolt öszszefüggő
síkdarab és f: R2 → R2 folytonosan di erenciálható függvény! Ekkor

Azaz az f függvény φ görbén vett integrálja megegyezik a (∂1f2(x, y) – –∂2f1(x, y)) :R2 → R függvény T halmazon vett
kétdimenziós Riemann-integráljával.

Példa. Legyen adott szám, , (x, y) ∈ R! Számoljuk ki az f


függvény φ görbén vett vonalintegrálját mindkét módszerrel! Vegyük észre, hogy a φ görbe az r sugarú, origó
középpontú körvonal egy paraméterezése. A vonalintegrál kiszámítása a vonalintegrálra vonatkozó tétel
segítségével:

Kihasználtuk a összefüggést.
A vonalintegrál kiszámítása a Green-formulát használva a következő. Jelöljük a φ görbe által határolt összefüggő
síkdarabot, azaz az r sugarú, origó középpontú kört K-val. Ekkor

Vezessünk be polárkoordinátákat:

Így

20.5. A hővezetési egyenlet és a hullámegyenlet


Ebben a fejezetben a két legismertebb zikai példával foglalkozunk.

Hővezetési egyenlet három dimenzióban


Hővezetés egy dimenzióban
Hullámegyenlet
Hővezetési egyenlet három dimenzióban
A háromdimenziós hővezetés egyenletét szeretnénk felírni egy Ω ⊂ R3 tartományon. Tegyük fel, hogy Ω-ban jelen van egy
homogén anyag, ebben megy végbe a hőterjedés. Jelölje u(t, x) az anyag hőmérsékletét a t ≥ 0 időpontban az x ∈ Ω ⊂ R3
helyen! Ekkor x0:= t > 0, x = (x1, x2, x3) ∈ Ω jelölések mellett a hővezetési egyenlet a következő:

ahol f ∈ C(R+ × R3) adott függvény.


Az egyenletben a egy pozitív konstans (mivel az anyag homogén, így a x-től független).
A hőegyenletet kezdeti feltétellel vagy peremfeltétellel szoktuk ellátni.
1. Ha Ω → R3, akkor kezdeti feltétel: u(0, x) = μ(x), ∀x ∈ R3 és μ : R3 → R C(R3)-beli függvény. Azaz a 0 időpontban előírjuk a
kezdeti hőmérsékletet a háromdimenziós tér összes pontjában. Tehát a hőegyenlet a következő Cauchy-feladattá vagy
kezdetiérték-feladattá módosul:

2. Stacionárius hővezetésről beszélünk, ha a hőmérséklet időben állandó. Ekkor a hővezetési egyenlet a

alakot ölti, ahol Ω ⊂ R3 korlátos tartomány. Ekkor a következő peremfeltételt használjuk: u|∂Ω(x) = v(x), valamely v: R3 → R
folytonos függvényre, és ∂Ω jelöli a Ω tartomány határpontjainak halmazát, azaz a tartomány „peremén” a hőmérséklet
előre meghatározott. Vagyis a peremérték-feladat a következő:

3. Vegyes feladat. Most tekintsük az időtől függő hővezetést Ω ⊂ R3 korlátos tartományban:

Azért nevezzük vegyes feladatnak, mert kezdeti és peremfeltétellel is ellátjuk az egyenletet, azaz:

Megjegyzés. Belátható, hogy a fenti mellékfeltételekkel ellátott feladatnak létezik megoldása és az egyértelmű.

Hővezetés egy dimenzióban


Ezt úgy képzeljük el, mintha egy vékony, homogén rúdban vizsgálnánk a hővezetést. Jelölje u(t, x) az anyag hőmérsékletét
a t ≥ 0 időpontban az x ∈ I ⊂ R pontban, ahol I egy intervallum! Legyen x0:= t > 0 és x1:= x ∈ I, ekkor a hővezetés egyenlete:

1. Ha I = R, akkor kezdetiérték-feladatról beszélünk:

2. Ha stacionárius hővezetési feladatunk van, és I = (c, d), c, d ∈ R, azaz


akkor az alábbi peremfeltételeket szokás alkalmazni:

vagy

vagy ezek valamilyen kombinációját, ahol α, β ∈ R.


3. Időtől függő hővezetés véges rúdban:

Ellátva a kezdeti és a peremfeltétellel is:

vagy a többi már említett peremfeltétellel is ellátható az u(c) = α és u(d) = β feltétel helyett.

Hullámegyenlet
Ezt az egyenletet csak egy dimenzióban vizsgáljuk. Szemléletesen, úgy képzeljük el a folyamatot, mint egy hullámmozgást
egy megpendített húrban. Jelölje u(t, x) a nyugalmi állapothoz viszonyított kitérést a t időpillanatban az x helyen (20.1.
ábra). Legyen I ⊂ R intervallum!

20.1. ábra

Ekkor a hullámegyenlet:

ahol f :R+ × R → R adott függvény.


Ezt a feladatot is ellátjuk kezdeti, illetve peremfeltételekkel.
1. Végtelen húr esetén, azaz ha I = R, kezdeti feltételekkel látjuk el a feladatot.
A következő Cauchy-feladatot kapjuk:

azaz előírjuk az u és a ∂0u függvények minden értékét a kezdő időpillanatban, és μi: R → R folytonos függvények (i = 1, 2).
2. Véges húr esetén, azaz ha I = (c, d), akkor vegyes feladatunk lesz: kezdeti és peremfeltételt is adunk. Rögzítsük a μ1(x), µ2(x),
α(t), β(t) függvényeket!
Kezdeti feltétel: μ(0, x) = μ1(x), x ∈ (c, d) és ∂0u(0, x) = μ2(x), x ∈ (c, d).
Peremfeltétel: u (t, c) = α(t), t > 0 és u(t, d) = β(t), t > 0,
vagy ∂1u(t, c) = α(t), t > 0 és ∂1u(t, d) = β(t), t > 0.
Tehát a vegyes feladat valamelyik peremfeltételt választva, sőt kombinálva:

Megjegyzés. Belátható, hogy a fenti mellékfeltételekkel ellátott feladatnak létezik megoldása és az egyértelmű.
21. Komplex függvénytan
21.1. Bevezető
21.2. Reguláris függvények
21.3. Integráltételek
21.4. Hatványsorba és Laurent-sorba fejtés
21.5. A reziduumtétel és alkalmazásai
21.6. Konform leképezések
21.7. Harmonikus függvények

21.1. Bevezető
Ebben a fejezetben a D ⊂ C, f : D → C ún. komplex függvények néhány fontos tulajdonságát mutatjuk be. Látni fogjuk, hogy
egy egészen egyszerűnek tűnő tulajdonságból, a pontonkénti di erenciálhatóságból mennyire messzemenő, globális
következtetéseket lehet levonni.
A komplex értelemben di erenciálható függvényeket több híres matematikus, így például Gauss, Euler, Riemann és
Weierstrass is vizsgálta. Ebben a fejezetben leggyakrabban Augustin Louis Cauchy (1789–1857) nevével találkozhatunk,
Cauchy volt ugyanis az, aki a komplex vonalintegrálok alkalmazásával bebizonyította, hogy a (komplex értelmen)
di erenciálható, más néven reguláris vagy holomorf és a hatványsorba fejthető, analitikus függvények fogalma egybeesik.
A komplex függvények viselkedése valóban különleges, és a matematika és a zika számos területén, az
összenyomhatatlan folyadékok áramlásától a Fourier-analízisen keresztül a prímszámok eloszlásának vizsgálatáig és még
nagyon sok más területen használjuk ezeket. De az alkalmazásoktól függetlenül, a matematika iránt érdeklődő diák
számára a komplex függvénytan az egyetemi matematika egyik, ha nem a legszebb fejezete.
Komplex számok. Feltételezzük, hogy az olvasó birtokában van a komplex számokra vonatkozó alapismereteknek, és
nem ismeretlenek számára a komplex számokkal való alapműveletek. Ezért ezek közül csak a legfontosabb elnevezéseket és
jelöléseket soroljuk fel.
– Az x és y betűket általában inkább csak valós számok jelölésére fogjuk használni, a komplex számokat z, w stb.
betűkkel fogjuk jelölni.
– A komplex számokat írhatjuk x + yi algebrai alakban, ahol az x és y valós számok a szám valós, illetve képzetes része. A
z komplex szám valós és képzetes részét Re z-vel, illetve Im z-vel jelöljük. Megjegyezzük, hogy az i nem része a képzetes
résznek, Im z maga valós szám.
– A komplex számokat írhatjuk z = r(cos φ + i sin φ) trigonometrikus alakban, ahol az r = |z| nem negatív valós szám a z
szám abszolút értéke, a φ szög pedig a szám argumentuma. Az argumentum csak modulo 2π értelemben egyértelmű,
összhangban azzal, hogy a szinusz- és a koszinuszfüggvény 2π szerint periodikus.
A z szám argumentumát arg z-vel jelöljük.
– A z = x + yi szám konjugáltja a z̄ = x + yi szám.
A komplex sík. A valós számokat az euklideszi egyenes pontjainak feleltettük meg. Többnyire célszerű volt az egyenes
két „végét” a ∞ és –∞ „végtelen távoli” pontokkal lezárnunk.
A komplex számokat a sík pontjainak feleltetjük meg: az x + yi komplex szám képe az (x, y) pont. Ami lényeges
különbség a számegyeneshez képest, hogy a különböző irányokhoz nem de niálunk különböző végtelen távoli pontokat,
hanem csak egyet. Ugyanaz a végtelen távoli pont lesz minden irányban.
A Riemann-gömb. Az egyetlen végtelen távoli pont de niálása egyáltalán nem természetellenes. A komplex számok és
a ∞ jól ábrázolhatok például a gömbön. Helyezzük el a komplex számsíkot a térben, és vegyünk egy egységgömböt, aminek
középpontja a 0! Válasszuk ki a gömb egyik olyan pontját, ahol a gömb érintője párhuzamos a síkkal. Ez a pont lesz a ∞ (21.1.
ábra).
21.1. ábra

Kössük össze a ∞ pontot a sík z pontjával. Az így kapott egyenes még egyszer metszi a gömböt: ezt a második
metszéspontot, z′-t feleltetjük meg z-nek. Az egyetlen pont, aminek nem feleltetünk meg egy komplex számot sem, a ∞. Ha
viszont a z pontot a síkon egyre távolabbra mozgatjuk, vagyis |z|-vel tartunk ∞-hez, akkor a gömbön a z′ pont a ∞ ponthoz
fog tartani.
Az alkalmazott feleltetés neve sztereogra kus projekció.
Mivel csak egy ∞ van, nincs értelme a z → –∞ és hasonló végtelen határértékeket megkülönböztetni, z → ∞, |z| → ∞ stb.
mind ugyanazt jelentik.

21.2. Reguláris függvények


A továbbiakban tartománynak fogjuk nevezni a komplex sík összefüggő, nyílt részhalmazait. Bizonyítás nélkül
megjegyezzük, hogy nyílt halmazok esetén a leggyakrabban használt összefüggőség-fogalmak egybeesnek.

A komplex sík bármely D nyílt halmazára a következő tulajdonságok ekvivalensek:


D topológiailag összefüggő, azaz D nem bontható fel két diszjunkt, nem üres, nyílt halmaz uniójára;
D bármely két pontja összeköthető D-ben haladó görbével;
D bármely két pontja összeköthető D-ben haladó töröttvonallal.

A komplex sík valamely részhalmazán értelmezett, komplex értékű függvényeket egyszerűen komplex függvényeknek
fogjuk hívni. Az éles szemű olvasó és a vájt fülű hallgató (de nem ám fordítva!) nyilván észrevette, hogy itt nem a
„tartomány”, hanem a „halmaz” szót használtuk. Többször előfordul ugyanis, hogy egy komplex függvény értelmezési
„tartománya” nem a fenti értelemben vett tartomány.
Határérték és folytonosság tekintetében nincs különbség a komplex függvények és az R2 valamely részhalmazán
értelmezett, R2-be képező függvények között. Merőben más lesz azonban a helyzet a komplex értelemben vett
di erenciálhatósággal.

Komplex di erenciálhatóság
A Cauchy–Riemann-féle parciális egyenletek
Reguláris és egészfüggvények
Hatványsorok
A hatványsor konvergenciahalmaza
Műveletek hatványsorokkal
Az összegfüggvény regularitása
Taylor-sor
Elemi függvények

Komplex di erenciálhatóság
Az egyváltozós valós analízisből ismert di erenciálhatóság komplex függvényekre is pontosan ugyanúgy de niálható.

Az f (z) komplex függvény di erenciálható az a ∈ C pontban, ha értelmezett az a pont egy környezetében, és a

határérték létezik és véges. A számot a függvény a-beli di erenciálhányadosának


nevezzük, és f′(a)-val jelöljük.

Az egyváltozós valós függvényekre vonatkozó di erenciálási szabályok – a bizonyításukkal együtt – egy az egyben
átírhatók komplex függvényekre. Érvényben maradnak az alapműveletekre (összeg, különbség, szorzat, hányados)
vonatkozó szabályok, a láncszabály és az inverz függvény di erenciálási szabálya is.
A di erenciálhatóság de nícióját az

alakban is írhatjuk, ahol


Ha a b komplex szám nem 0, akkor a z ↦ bz transzformáció egy |b|-szeres, arg b szögű forgatva nyújtás. Ha tehát a z
szám „közel” van az α ponthoz, akkor az f(z) – f(a) különbség is „közel” van a z – a szám forgatva nyújtott képéhez.

Ha az f(z) függvény di erenciálható az a pontban, és f′(a) ≠ 0, akkor a függvény


– „kicsiben körtartó”, azaz az a középpontú, kicsi sugarú körök képei közelítőleg f(a) középpontú körök;
– irányítástartó és szögtartó, azaz ha (zn) és (wn) két, a-hoz tartó sorozat és a zn – a és wn – a vektorok előjeles szöge tart
a φ értékhez, akkor az f(zn) – f(a) és f(wn) – f(a) vektorok előjeles szöge is φ-hez tart.

A Cauchy–Riemann-féle parciális egyenletek


Az f(x) = f(x + yi) komplex függvény valós és képzetes részét kétváltozós függvényeknek is tekinthetjük:

u(x, y) és v(x, y) valós értékű függvények. Legyen a = (a1, a2) az értelmezési tartomány egy belső pontja!

Az f(x + yi) = u(x, y) + iv(x, y) függvény komplex értelemben akkor di erenciálható az a1 + a2i pontban, ha
– az u(x, y) és v(x, y) függvények valós értelemben di erenciálhatóak az (a1, a2) pontban, és
– az (a1, a2) pontban teljesülnek az úgynevezett Cauchy–Riemann-egyenletek:

A Cauchy–Riemann-egyenletek alapján a f(z) deriváltját többféleképpen is felírhatjuk az u és a v függvények parciális


deriváltjaival:

A két Cauchy–Riemann-egyenletet együtt úgy is átfogalmazhatjuk, hogy az f függvény mint R2 → R2 leképezés Jacobi-

mátrixa alakú.

Példák
1. Az f(z) = z2 függvény di erenciálható, mert a di erenciálási szabályokból következik, hogy minden polinom
di erenciálható. Most ellenőrizzük a függvényre a Cauchy–Riemann-egyenleteket is:

2. A z ↦ z̄ függvény nem di erenciálható. Ez a de nícióból is jól látható:

A különbségi hányados egységnyi abszolút értékű, de nincs határértéke, mert iránya tetszőleges lehet z0
bármilyen kis környezetében.

Azt is láthatjuk, hogy az z̄ = x – yi mint R2 → R2 függvény Jacobi-mátrixa , és az első Cauchy–Riemann-


egyenlet nem teljesül.

Reguláris és egészfüggvények
Legyen D ⊂ C tartomány! Ha az f(z) függvény D minden pontjában di erenciálható, akkor azt mondjuk, hogy f(z) reguláris
vagy holomorf D-n. Később látni fogjuk, hogy a regularitás nagyon erős tulajdonság; a reguláris függvények akárhányszor
di erenciálhatók, és az értelmezési tartományuk minden belső pontja körül hatványsorba fejthetők. Ha az f(z) függvény a
teljes komplex síkon reguláris, akkor egészfüggvénynek is nevezzük.

Hatványsorok
A komplex hatványsorokat a valós hatványsorokhoz hasonlóan de niáljuk.

Legyenek a és b0, b1, … komplex számok! A végtelen sort a körüli hatványsornak nevezzük. A b0, b1, …
számokat a hatványsor együtthatóinak nevezzük.

A hatványsor speciális esete a polinom, amikor az együtthatók néhány kivétellel mind nullák.

A hatványsor konvergenciahalmaza
Azoknak a pontoknak a halmaza, ahol a hatványsor konvergens, többféle lehet. Van olyan hatványsor, ami csak a
középpontban konvergens, de az is előfordul, hogy a konvergenciahalmaz a teljes sík. Hogy a lehetséges eseteket leírjuk,
először a következő tényt bizonyítjuk be.

Lemma. Tegyük fel, hogy a hatványsor konvergens a z0 ≠ a pontban, és r0 = |z0 – a|. Ekkor
– a hatványsor abszolút konvergens a B(a, r0) nyílt körlapon;
– a hatványsor tetszőleges r < r0 esetén egyenletesen és abszolút konvergens a B(a, r) körlapon.

Bizonyítás. Először a második állítást bizonyítjuk; a bizonyításhoz a Weierstrass-kritériumot fogjuk használni.


Ha a sor konvergens z0-ban, akkor ott a tagjai korlátosak: létezik egy olyan K pozitív szám, amire |bn(z0 – a)n| ≤ K
minden n indexre. Jelöljük Mn-nel az n-edik tag szuprémumát a B(a, r) körlapon:

Ekkor

és

A sor tehát, ami egyenletes majoránsa a hatványsornak a B(a, r) halmazon, konvergens. Ezért itt a
hatványsor egyenletesen és abszolút konvergens.
Az első állítás következik a másodikból. Ha z ∈ B (a, r0), akkor választhatunk egy olyan r > 0 valós számot, amikre |z–a|
< r < z0. Mivel a sor egyenletes és abszolút konvergens a B(a, r) halmazon, a z ∈ B(a, r) pontban is abszolút konvergens.

Legyen ezek után R a |z – a| szuprémuma azokra az értékekre, amikre a sor konvergens. A fenti lemma egyszerű
következménye, hogy
– a |z – a| < R kör belsejében a sor abszolút konvergens;
– tetszőleges 0 < r < R esetén a hatványsor egyenletesen és abszolút konvergens a |z – a| < r körlemezen;
– a körön kívül a hatványsor divergens. Sőt, a körön kívül a tagok sorozata nem is korlátos.
Az R számot a hatványsor konvergenciasugarának nevezzük. Az R = 0 és az R = ∞ értékek azt jelentik, hogy a sor csak a
középpontban, illetve a teljes síkon konvergens.

A fenti tétel nem mond semmit a hatványsor viselkedéséről magán a körvonalon. A konvergenciahalmaznak a
körvonalra eső része nagyon sokféle lehet az üres halmaztól a teljes körvonalig. Ennek a – nem is teljesen megválaszolt –
kérdésnek a részleteibe most nem megyünk bele; a továbbiakban amúgy is csak a konvergenciakör belső pontjait fogjuk
használni.
Példák
1.
Csak a hatványsor középpontjában, a 0-ban konvergens a sor.
2. A teljes síkon konvergensek a már említett polinomok (beleértve természetesen a konstans nulla sort is), vagy

például a 2 körüli sor.


3.
A B(–1, 1) körben konvergens a sor.
4.
A B̄(i, 1) zárt körlemezen konvergens a sor.

A hatványsor konvergenciasugarát határozza meg a

Cauchy-Hadamard-tétel: a hatványsor konvergenciasugara

Műveletek hatványsorokkal
Az abszolút konvergencia miatt kényelmes szabadságunk nyílik arra, hogy hatványsorokkal különféle műveleteket
végezzünk.
– A hatványsort tagonként megszorozhatjuk egy számmal:

– Két sort tagonként összeadhatunk a konvergenciahalmazaik közös részében:

– Két sor szorzatát felírhatjuk a két sor Cauchy-szorzataként a konvergenciatartományaik közös részében:

, ahol

Példa. A sor egy z hányadosú mértani sor, ami a B(0, 1) körben konvergens, az összege . A sort
négyzetre emelhetjük úgy, hogy megszorozzuk önmagával:

Az összegfüggvény regularitása
A komplex függvénytan szempontjából a hatványsor legfontosabb tulajdonsága, hogy az összegfüggvény a
konvergenciakör belsejében akárhányszor di erenciálható, és a sort szabad tagonként di erenciálni.

Tegyük fel, hogy a hatványsor konvergenciasugara R, az összege pedig f(z). Ekkor

– a tagonkénti deriváltakból álló sor konvergenciasugara is R;


– az f(z) függvény a konvergenciahalmaz minden belső pontjában di erenciálható, és

Bizonyítás. Ha egy hatványsor minden tagját megszorozzuk (z – a)-val, az nem változtat azon, hogy a sor konvergens-e.

Ezért a sor ugyanazokban a pontokban konvergens, mint a sor, a két

sor konvergenciasugara ugyanaz. A Cauchy–Hadamard-tétel szerint a sor konvergenciasugara


pedig
A di erenciálhatóság igazolásához legyen z0∈ B(a, R) a konvergenciahalmaz egy rögzített belső pontja. Azt kell
megmutatnunk, hogy minden ϵ > 0-hoz létezik olyan δ > 0, hogy z ∈ B(z0, δ) esetén

Legyen tehát r0 = |z0 – a| és ϵ > 0. A bal oldalt a tagok abszolút értékeinek összegével becsüljük (b0 kiesik):

A további becslések során külön fogjuk kezelni a sor elejét (az első néhány tagot), és a többi tagot (a sor farkát), ahol az
összeg már kicsi.

a) Legyen . Mivel a derivált sor egyenletesen és abszolút konvergens a B(z0, r1 – r0) ⊂ B(a, r1) körlapon,

létezik egy olyan N pozitív egész, amire . Ezért

b) Tetszőleges 1≤ n ≤ N-re a zn függvény di erenciálható, ezért létezik egy olyan, δn > 0, amire tetszőleges z ∈ B(z0, δn)
esetén

Ha δ = min (δ1, …, δN, r1 – r0), akkor a fenti egyenlőtlenségeket egyszerre alkalmazhatjuk bármely z ∈ B(z0, δ) esetén:

A tételt k-szor alkalmazva láthatjuk, hogy a konvergenciakör belsejében a hatványsor összegfüggvénye akárhányszor
di erenciálható, és

Példa. AB(0, 1) körlapon . A sort tagonként di erenciálva

A tagonkénti di erenciálási szabályt visszafelé is alkalmazhatjuk. A hatványsor összegfüggvényének létezik primitív

függvénye a konvergenciakör belsejében. A primitív függvényeket alakban írhatjuk fel.

Taylor-sor

A valós hatványsorokhoz hasonlóan, ha a k-adik deriváltba behelyettesítjük az a pontot, az együtthatókra a


képletet kapjuk. Ez az összefüggés azt is mutatja, hogy a hatványsor egyértelmű; az összegfüggvény meghatározza az
együtthatókat.
A képlet fordított esetben is hasznos lehet, amikor egy ismert függvény hatványsorát keressük egy olyan pont körül,
ahol a függvény komplex értelemben akárhányszor di erenciálható.

A deriváltnak a középpontban felvett értékeiből képezett

sort az f(z) függvény a körüli Taylor-sorának nevezzük. A 0 körüli Taylor-sort MacLaurin-sornak is szokás nevezni.

Később látni fogjuk, hogy a Taylor-sor mindig konvergens az a pont egy környezetében, és előállítja az f(z) függvényt.
(Ez a tény azért is meglepő, mert egy valós értelemben akárhányszor di erenciálható függvényt nem feltétlenül állít elő a
valós Taylor-sora.)

Elemi függvények
Most a valós analízisben megszokott elemi függvényeknek a komplex számokra való kiterjesztésének kérdéseit vizsgáljuk
meg. Az egész kitevős hatványozást, a polinomokat és a racionális törtfüggvényeket bármilyen algebrai testben ugyanúgy
de niáljuk, nincs különbség a valós és a komplex eset között.

Az exponenciális és a trigonometrikus függvények


Komplex logaritmus
Néhány konkrét függvény hatványsora

Az exponenciális és a trigonometrikus függvények


A komplex exponenciális függvényt, a szinusz- és a koszinuszfüggvényt legegyszerűbben a valós analízisből jól ismert
hatványsorával de niálhatjuk:

Ezek a hatványsorok a teljes síkon konvergensek, mert , és valós z értékekre az összegfüggvényeik


megegyeznek a valós analízisből ismert ex, sin x, illetve cos x függvényekkel. E három függvény közötti szoros kapcsolatot
fejezi ki a következő azonosság. Tetszőleges z komplex számra

– A komplex exponenciális függvényre is érvényesek a valósból ismert, ez1 + z2 = ez1 · ez2, (ez)′ = ez azonosságok.
Ha z = x + yi, ahol x és y valós számok, akkor

ami a komplex számok ún. exponenciális alakja.


– Teljesülnek az alábbi azonosságok is:

Bizonyítás. Itt csak az utolsó azonosságot bizonyítjuk:

Az exponenciális függvény 2πi szerint periodikus: ez + k·2πi = ez.

Bizonyítás.
(21.2)

A komplex szinusz- és koszinuszfüggvényre is érvényesek a jól ismert trigonometrikus összefüggések, melyek könnyen
beláthatóak (21.1) segítségével:

A pozitív valós alapú exponenciális függvényeket az az = e(log a) z képlettel értelmezzük, ahol log a a valós logaritmus. Ez
a függvény is a valósból ismert ax kiterjesztése, és teljesülnek rá az összefüggések.

Komplex logaritmus
Az exponenciális függvény 2πi szerint periodikus, és minden, a nullától különböző komplex számot végtelen sokszor vesz
fel. Ezért minden 0-tól különböző számnak végtelen sokféle logaritmusa van, a logaritmust csak „modulo 2πi” ismerjük:

Általában, a logaritmust nem tudjuk az összes nullától különböző pontban egyszerre de niálni úgy, hogy a függvény
folytonos legyen; már a komplex számok argumentumát sem lehet folytonosan megválasztani.

Ha azonban a komplex síkból elhagyjuk a negatív számokat, megtehetjük, hogy arg z-t mindig a (–π, π) intervallumból
választjuk. Az így de niált számot hívjuk a logaritmus főértékének.

De bármilyen más, 0 csúcsú félegyenest is elhagyhatunk, és arg z-t egy alkalmas nyílt intervallumból választhatjuk.

Néhány konkrét függvény hatványsora


Bizonyítás nélkül megadjuk néhány konkrét függvény 0 körüli hatványsorát: |z| < 1 esetén

21.3. Integráltételek

A komplex vonalintegrál
A primitív függvény létezésének feltételei
A Cauchy-tétel
A logaritmus létezése
Az integrációs út módosítása
A Cauchy-formulák
A deriváltakra vonatkozó Cauchy-integrálformula

A komplex vonalintegrál
A komplex vonalintegrál a valós analízisből és a zikából ismert vonalintegrál komplex változata, amelyben a vektorok
skaláris szorzata helyett a komplex szorzás szerepel. Az esetek nagy részében a megfelelő, Riemann- és Riemann–Stieltjes-
integrálokra, görbékre, illetve valós vonalintegrálokra vonatkozó tételek bizonyítása szó szerint átvihető. Itt most nem
bizonyítunk több olyan síktopológiai állítást, ami szemléletesen nyilvánvaló. Emiatt a bizonyítások egy része valójában
csak szemléltetés. Ugyanakkor megjegyezzük, hogy a síktopológiai kérdések vizsgálatához maga a komplex függvénytan is
jól használható eszközöket biztosít.

Síkgörbék
A vonalintegrál de níciója
A vonalintegrál létezése és kiszámítása
Műveletek vonalintegrálokkal
A Newton–Leibniz-formula

Síkgörbék
A síkgörbéket, a valós görbékhez hasonlóan valós intervallumok képeként állítjuk elő.

Legyen γ: [a, b] → C folytonos függvény. A γ függvényt (paraméteres) síkgörbének nevezzük. A γ függvény értékei a
görbe pontjai, az [a, b] intervallumban levő számok pedig a paraméterértékek. A γ(a) és a γ(b) pontokat a görbe
kezdő-, illetve végpontjának nevezzük. Ha γ(a) = γ(b), azaz a kezdő- és végpont megegyezik, akkor a görbe zárt.

A görbék hosszát a beírt töröttvonalak hosszainak szuprémumaként de niáljuk.

A γ: [a, b] → C görbe hossza .

Ha γ folytonosan di erenciálható, akkor a hosszát az Riemann-integrállal is kiszámíthatjuk.

A γ görbét rekti kálhatónak nevezzük, ha a hossza véges.

A vonalintegrál de níciója
A Riemann-integrálhoz hasonlóan, ha a = t0< t1 < … < tn = b az [a, b] intervallum egy felosztása, akkor a felosztás
nomságának a max 1 ≤ k ≤ n|tk – tk – 1| számot nevezzük.
Legyen f(z) olyan komplex értékű függvény, ami értelmes a γ görbe pontjaiban.

Az f(z) függvény γ menti komplex vonalintegrálja az I komplex szám, ha minden ϵ >0-hoz létezik olyan δ > 0, hogy
valahányszor a = t0 < t1 < … < tn = b az [a, b] intervallum egy δ-nál nomabb felbontása, valamint u1 ∈ [t0, t1], u2 ∈ [t1,
t2], …, un ∈ [tn–1, tn], akkor

A vonalintegrál jele: .

Az f(z) függvény γ menti ívhossz szerinti integrálja az I komplex szám, ha minden ϵ > 0-hoz létezik olyan δ > 0, hogy
valahányszor a = t0 < t1 < … < tn = b az [a, b] intervallum egy δ-nál nomabb felbontása, valamint u1∈ [t0, t1], u2 ∈ [t1, t2],
…, un ∈ [tn–1, tn], akkor

Az ívhossz szerinti integrál jele: .


Abban az esetben, ha az integrációs út a valós tengely egy (pozitív irányú) szakasza, a vonalintegrál és az ívhossz
szerinti integrál is azonos az f(z) (komplex értékű) Riemann-integráljával.
A fenti de níciók nem függnek a görbe paraméterezésétől, ezt mondja a következő tétel.

Ha φ:[c, d] → [a, b] monoton növekvő, folytonos függvény, amire φ(c) = a és φ(d) = b, akkor az γ ◦ φ a γ görbe
átparaméterezése, és

, valamint , ahol az egyenlőségekbe azt is beleértjük, hogy ha


az egyik oldalon álló integrál létezik, akkor a másik is.
Ha φ : [c, d] → [a, b] monoton csökkenő folytonos függvény, amire φ(c) = b és φ(d) = a, akkor a γ ◦ φ görbe a γ görbe

„megfordítása”, ennek megfelelően és .

Előfordul, hogy egy olyan görbe mentén akarunk vonalintegrált számítani, ami nem korlátos, például egy teljes
egyenesen. Ilyenkor a paramétertartomány nyílt vagy félig nyílt intervallum, és a vonalintegrált a valós improprius
integrálókhoz hasonlóan, a kompakt részgörbéken vett vonal-, illetve ívhossz szerinti integrálok határértékeként
értelmezzük.
Mivel az integrálok létezése és értéke nem függ a konkrét paraméterezéstől, legtöbbször csak a görbe képét adjuk meg
vagy rajzoljuk fel, és az ábrákon is csak az irányát tüntetjük fel. Képletekben gyakori, hogy az integrálási utat csak az
egyenletével írjuk le; ilyenkor megállapodás szerint a körvonalakat pozitív (az óramutatóval ellentétes), a vízszintes és
függőleges egyeneseket pozitív irányban irányítjuk. Ha ez nem okoz félreértést, az egyenesek végtelen távoli „végeinek”
megadásakor használhatjuk a ∞ szimbólumot. Például

A vonalintegrál létezése és kiszámítása


A vonalintegrál és az ívhossz szerinti integrál is létezik minden olyan esetben, amikor γ rekti kálható, és f(z) folytonos γ
pontjaiban. Ha azt is tudjuk, hogy γ (mint [a, b] → C függvény) folytonosan di erenciálható, akkor a vonalintegrált és az
ívhossz szerinti integrált is átírhatjuk Riemann-integrállá:
Ha a γ görbe folytonosan di erenciálható, és f(z) folytonos a görbe pontjaiban, akkor

A gyakorlatban szinte kivétel nélkül olyan görbék fordulnak elő, amik folytonosan di erenciálható darabokból állnak.

Példák
1. Számítsuk ki a z2 függvény vonalintegrálját azon a 0 középpontú, 1 sugarú negyedköríven, ami az 1 és az i
pontokat köti össze.
Megoldás. A görbe egy lehetséges paraméterezése γ: [0, π/2] → C, γ(t) = eit, és

2. Számítsuk ki a z2 függvény ívhossz szerinti integrálját is ugyanezen a köríven! Megoldás. Ugyanazzal a


paraméterezéssel

Műveletek vonalintegrálokkal
A komplex vonalintegrálokra is érvényesek a valós Stieltjes- és vonalintegrálokra vonatkozó, jól ismert szabályok. Ha c
komplex szám, és az f(z) és g(z) függvények integrálhatók a γ görbén, akkor
Tegyük fel, hogy a < b < c valós számok, γ1: [a, b] → C és γ2: [b, c] → C olyan síkgörbék, amikre γ1(b) = γ2(b), vagyis γ1
végpontja megegyezik γ2 kezdőpontjával. Ekkor a két görbe összefűzésével kapható görbét γ1 + γ2-vel jelölve,

Ha γ egy rekti kálható görbe a D tartományban, g : D → E reguláris, és f : E → C folytonos, akkor

A Newton–Leibniz-formula
Legyen D ⊂ C nyílt tartomány és f : D → C folytonos függvény. Azt mondjuk, hogy F : D → C az f-nek primitív függvénye, ha
f = F′.

Newton–Leibniz-formula. Ha D ⊂ C nyílt tartomány, f: D → C folytonos és F:D → C az f-nek primitív függvénye, akkor

bármely, γ: [a, b] → D rekti kálható görbe mentén

Példa. Számítsuk ki a z2 függvény vonalintegrálját a 0 középpontú, 1 sugarú negyedköríven, ami az 1 és az i pontokat


köti össze, a Newton–Leibniz-formulával is.
Megoldás: a z2 függvénynek primitív függvénye a z3/3 függvény, ezért

A Newton–Leibniz-formula egyszerű következménye, hogy ha az f(z) függvény folytonos, és létezik primitív függvénye
a D tartományon, akkor
– f(z)-nek bármely, D-ben fekvő rekti kálható görbe mentén vett vonalintegrálja csak a görbe két végpontjától függ;
– f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt görbe mentén.
Ha létezik a primitív függvény, akkor tehát nincs szükség a pontos integrációs út megadására, elég a görbe kezdő- és

végpontja. Ilyenkor használhatjuk az jelölést is.

A primitív függvény létezésének feltételei

Ha az f(z) függvény folytonos, és létezik primitív függvénye a D tartományon, akkor a következő állítások
ekvivalensek:
a) az f(z) függvénynek létezik primitív függvénye a D tartományon;
b) f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt görbe mentén;
c) f(z) vonalintegrálja 0 bármely, D-ben fekvő rekti kálható zárt töröttvonal mentén.

Bizonyítás. Mint láttuk, a Newton–Leibniz-formula miatt az a) tulajdonságból következik a b). A b)-ből triviálisan
következik a c), mert minden töröttvonal egyben rekti kálható görbe is. Elegendő tehát azt igazolni, hogy c)-ből
következik a).
Az a) feltételt úgy is mondhatjuk, hogy ha a γ1 és γ2 töröttvonalaknak ugyanaz a kezdőpontja és ugyanaz a végpontja,
akkor az f(z) vonalintegrálja ugyanaz a két töröttvonalon. Ha tehát a és b két tetszőleges pont S-ben, akkor bármely, a
kezdőpontú és b végpontú töröttvonalon f(z) vonalintegrálja ugyanaz. Ezt a közös értéket jelöljük g(a, b)-vel. Mivel D
tartomány, bármelyik két pontja összeköthető töröttvonallal, tehát g(a, b) mindig létezik.
Válasszunk ki egy tetszőleges z0 ∈ D kezdőpontot, és legyen F(z) = g(z0, z). Megmutatjuk, hogy F(z) di erenciálható, és
F′(z) = f(z).
Rögzítsük most z-t, és legyen ϵ > 0! Mivel D nyílt és f(z) folytonos, ezekhez létezik olyan δ > 0, amire B(z, δ) ⊂ D, és
bármely w ∈ B(z, δ) esetén |f(w) – f(z)| < ϵ. Legyen [z, w] a z-t w-vel összekötő szakasz. Ekkor

így w ∈ Ḃ(z, δ) esetén

A Cauchy-tétel

Nullhomotóp görbék és egyszeresen összefüggő tartományok


A Cauchy-tétel

Nullhomotóp görbék és egyszeresen összefüggő tartományok


A továbblépéshez szükségünk lesz néhány topológiai fogalomra. Legyen D ⊂ C tartomány és γ: [0, 1] → D zárt görbe D-ben.
Azt mondjuk, hogy γ nullhomotóp D-ben, vagy másképpen egy pontra húzható össze D-ben, ha létezik egy olyan folytonos
φ: [0, 1] × [0, 1] →D függvény, amire
– minden 0 ≤ t ≤ 1-re φ(t, 0) = γ(t);
– minden 0 ≤ u ≤ 1-re φ(0, u) = φ(1, u);
– φ(t, 1) minden 0 ≤ t ≤ 1-re ugyanaz a pont.
A φ(t, u) függvényt úgy is tekinthetjük, mint egy paraméteres görbesereget. Az u paraméter bármelyik rögzített
értékére t → φ(t, u) egy zárt görbe D-ben, az u = 0 értékre ez a görbe maga γ, u = 1-re a görbe egyetlen pont, a közbülső
értékekhez tartozó görbék átmenetet képeznek a γ görbe és az egy pont között (21.2. ábra).
Ha a γ zárt görbe egyszerű, akkor a pontra húzhatóság szemléletesen azt jelenti, hogy a görbe belseje is D-ben van. A D
⊂ C tartományt egyszeresen összefüggőnek mondjuk, ha minden D-ben fekvő zárt görbe nullhomotóp. Ez a tulajdonság
szemléletesen azt jelenti, hogy D nem „lyukas”. Egyszeresen összefüggő például minden konvex, sőt minden csillagszerű
tartomány.

21.2. ábra

A Cauchy-tétel
Most vázoljuk a következő, a komplex függvénytanban alapvető fontosságú tétel bizonyítását.

Cauchy-tétel. Ha f(z) reguláris az egyszeresen összefüggő D tartományon, akkor bármely D-ben fekvő rekti kálható,

zárt γ görbén .
A tételt először abban az esetben bizonyítjuk, ha γ egy háromszögvonal, aminek a belseje is D-be esik.

Goursat-lemma. Tegyük fel, hogy T (irányított) háromszögvonal, és az f(z) függvény reguláris a teljes

háromszöglemezen. Ekkor .

Bizonyítás. Legyen a T háromszög kerülete.


De niáljuk az T0, T1, … háromszöglemezeket a következőképpen. Legyen T0 = T! Ha már de niáltuk Tn-t, akkor
osszuk fel Tn-t a középvonalaival négy, feleakkora háromszögre a 21.3. ábra szerint, legyenek ezek Tn,1, Tn,2, Tn,3 és Tn,4.
Ha összeadjuk f(z) vonalintegráljait a négy kis háromszögön, a középvonalakon vett integrálok kiesnek, és

21.3. ábra

Válasszuk ki a négy háromszög közül azt, amelyen f(z) vonalintegrálja a legnagyobb abszolút értékű; ez lesz Tn + 1. Mivel

azt kapjuk, hogy

Mivel a háromszögek mérete minden lépésben feleződik, . A háromszöglemezek egyetlen a pontra


húzódnak össze, ahol a feltétel szerint f di erenciálható. Legyen b = f(a) és c = f′(a).
Válasszunk most egy tetszőlegesen kicsi pozitív ϵ > 0 számot! Ehhez létezik olyan δ > 0, hogy bármely z ∈ B(a, δ) esetén
|f(z) – b – c(z – a)| < ϵ|z – α|. Válasszunk egy olyan n pozitív egészt, amire Tn ⊂ B(a, δ)! A b + c(z–a) függvénynek – mint
minden polinomnak – létezik primitív függvénye, ezért

Tehát

Mivel ez tetszőleges ϵ > 0-ra igaz, |I| = 0.


A Cauchy-tétel bizonyítása (vázlat). A tételt először töröttvonalakra bizonyítjuk.
Ha γ egy egyszerű, zárt töröttvonal, akkor bontsuk fel γ belsejét háromszögekre. A Goursat-lemma szerint a
vonalintegrál 0 mindegyik háromszögön. A háromszögeken vett integrálok összege kiadja a töröttvonalon vett integrált.
Ha a töröttvonal nem egyszerű, azaz metszi önmagát, akkor a metszéspontoknál szétvághatjuk kisebb, kevesebb
szakaszból álló zárt töröttvonalakra, és a bizonyítást az önmetszések száma szerinti indukcióval végezhetjük.
Most már tudjuk, hogy f(z) vonalintegrálja 0 minden D-beli zárt töröttvonalon. Mint láttuk, ezzel ekvivalens, hogy f(z)-
nek létezik primitív függvénye, illetve f(z) vonalintegrálja 0 minden D-beli rekti kálható zárt görbén.
A Cauchy-tétel állítása nem marad igaz akkor, ha D nem egyszeresen összefüggő. Például, ha a komplex síkból
elhagyjuk a 0 pontot, akkor a megmaradó halmazon az 1/z függvény reguláris, és az egységkörvonalon vett vonalintegrálja
mégsem 0:
A Cauchy-tétel egyszerű következménye, hogy

ha a D tartomány egyszeresen összefüggő, akkor minden D-n reguláris függvénynek létezik primitív függvénye.

A Cauchy-tételnek többféle általánosítását is felírhatjuk.

Ha f(z) reguláris a D tartományon, és γ nullhomotóp, rekti kálható zárt görbe D-ben, akkor
Tegyük fel, hogy a D tartományt a γ1 …, γn, rekti kálható zárt görbék határolják úgy, hogy a külső határgörbét pozitív,
a belső határgörbéket pedig negatív irányban irányítjuk. Ha f(z) reguláris D-n és folytonos a D határgörbéin, akkor

21.4. ábra

A logaritmus létezése
A Cauchy-tétel ismeretében előállíthatjuk a logaritmus függvény(eke)t mint az 1/z függvény primitív függvénye(i)t.

Ha a D tartomány egyszeresen összefüggő és nem tartalmazza a 0-t, akkor a logaritmusfüggvény értelmezhető D-n.

Bizonyítás. Jelöljünk ki D-ben egy tetszőleges z0 pontot, és válasszunk ki egy olyan c0 komplex számot, amire
. Mivel az 1/z függvény reguláris, a Cauchy-tétel következménye szerint létezik D-n primitív függvénye; ezek
közül válasszuk azt az l(z) függvényt, amire l(z0) = c0. Más szóval, legyen

Tekintsük most a ze–l(z) függvényt!

Mivel a ze–l(z) függvény konstans. A z0-beli érték


. Tehát a teljes tartományon ze–l(z) = 1, vagyis e–l(z) = z.

Ha a D tartomány egyszeresen összefüggő, f(z) reguláris D-n, és nem veszi fel a nullát, akkor a log f(z) függvény
értelmezhető D-n: létezik olyan reguláris g(z) függvény D-n, amire f(z) = eg(z).

Bizonyítás. Legyen most is z0 ∈ D és c0 olyan komplex szám, amire . Mivel reguláris D-n, létezik
primitív függvénye D-n. Legyen g(z) az a primitív függvény, amire g(z0) = c0, azaz legyen

Vizsgáljuk az f(z)e–g(z) függvényt. Mivel


f(z)e–g(z) konstans. Mivel pedig , az is igaz, hogy f(z)e–g(z) = 1, vagyis f(z) = e–g(z) a teljes
tartományon.

Az integrációs út módosítása
A Cauchy-tétel lehetőséget ad arra, hogy az integrációs utat más görbékre cseréljük ki, amiken az integrál könnyebben
kiszámítható. Sőt, a gyakorlatban a vonalintegrálokat nagyon sokszor nem is számítjuk ki. Ehelyett az integrációs utat úgy
változtatjuk, hogy az integrandus kicsi legyen, és a teljes integrál nullához tartson.
A vonalintegrál becsléséhez legtöbbször a triviális

becslést használjuk.

Példák
1.
Számítsuk ki az integrált!
Megoldás: az integrandus mindenhol reguláris a és –i pontok kivételével. A Cauchy-tétel alapján az
integrációs utat bármilyen sugarú körre kicserélhetjük:

21.5. ábra

Mi történik, ha az integrációs kört végtelen nagyra felfújjuk, azaz R-rel tartunk végtelenhez? Mivel

az integrál egyrészt 0-hoz tart, másrészt a Cauchy-tétel szerint konstans. Tehát

2.
Felhasználva, hogy , számítsuk ki az integrált, ahol a tetszőleges valós szám.
Megoldás. Tetszőleges K > 0 valós számra

Alkalmazzuk a Cauchy-tételt arra a téglalapra, amelynek csúcsai a –K, K, K + ai és –K + ai számok. Az oldalakat


betűzzük a 21.6. ábrának megfelelően. A tétel szerint
21.6. ábra

A két függőleges oldalon a vonalintegrál „kicsi”:

ha K → ∞, akkor mindkettő 0-hoz tart. Tehát

és igy

A Cauchy-formulák

Lemma.

Bizonyítás. Legyen γ(f) = a + reit ahol t ∈ [0, 2π]. Ekkor

Cauchy-formula Jordan-tartományon. Tegyük fel, hogy γ egyszerű, zárt, rekti kálható, pozitív irányítású görbe, és
f(z) reguláris γ belsejében és a görbe pontjaiban. Ekkor bármely, γ belsejében fekvő z pontban

Bizonyítás. Rögzítsük z-t, és legyen ϵ > 0 tetszőlegesen kicsi.


Válasszunk egy olyan r > 0 számot, amire B(z, r) a tartomány belsejében fekszik, és w ∈ B(z, r) esetén |f(w) – f(z)| < ϵ.
A Cauchy-tétel miatt a γ görbét kicserélhetjük a |w – z| = r körre:
Azt kaptuk, hogy

tetszőlegesen kicsi ϵ > 0 esetén.


Ha a Cauchy-formulát egy körre alkalmazzuk, és vonalintegrál helyett Riemann-integrálként írjuk fel, a következő
fontos tételt kapjuk.

Középérték-tulajdonság. Ha f(z) reguláris a B(a, r) körlapon és folytonos a határán, akkor

Más szóval, a függvény átlaga a körlapon megegyezik a középpontban felvett értékkel.


Bizonyítás. A Cauchy-formula alapján

A Cauchy-tételhez hasonlóan a Cauchy-formulát is általánosíthatjuk több görbe által határolt tartományokra. Az


állítás akkor is igaz marad, ha a határon az f(z) függvénynek csak a folytonosságát kötjük ki.

Cauchy-formula több határú tartományon. Legyen D olyan tartomány, amit a γ1, …, γn rekti kálható görbék
határolnak. A görbéket a szokásos módon irányítjuk: a külső görbét pozitív, a belső határgörbéket pedig negatív
irányban. Ha f(z) reguláris D-n és folytonos D lezárásán, akkor D bármely z belső pontjára

A deriváltakra vonatkozó Cauchy-integrálformula


A Cauchy-integrálformulában szereplő paraméteres integrál akárhányszor di erenciálható z szerint. A paraméteres
integrál di erenciálási szabálya szerint (ami most is alkalmazható),

Ebben a tényben az a meglepő, hogy az f(z) függvényről nem kötöttük ki a többszörös di erenciálhatóságot. Mégis, a
Cauchy-integrálformula egy olyan képlettel írja fel a függvényt, ami akárhányszor di erenciálható.
A Cauchy-integrálformula következménye tehát, hogy ha egy komplex értékű függvény egyszer di erenciálható egy
tartományon, akkor a függvény akárhányszor di erenciálható.

A deriváltakra vonatkozó Cauchy-formula. Legyen D olyan tartomány, amit a γ1, …, γn rekti kálható görbék
határolnak. A görbéket a szokásos módon irányítjuk. Ha f(z) reguláris D-n és folytonos D lezárásán, akkor D bármely z
belső pontjára és tetszőleges k pozitív egészre

21.4. Hatványsorba és Laurent-sorba fejtés


Hatványsorba fejtés
Laurent-sorba fejtés
A hatványsorba fejthetőség következményei
A Liouville-tétel
Az izolált szingularitások tulajdonságai

Hatványsorba fejtés
A Cauchy-formula egyik fontos következménye a reguláris függvények hatványsorba fejthetősége.

Hatványsorba fejtés. Tegyük fel, hogy f(z) reguláris a B(a, r) körben és folytonos a határán. Ekkor
–f(z) hatványsorba fejthető az a pont körül;
–f(z) hatványsora a teljes B(a, r) körlapon konvergens, és előállítja a függvényt;
– a hatványsorban a (z – a)n együtthatója

Az utolsó képlet neve a hatványsorokra vonatkozó együtthatóformula.

Bizonyítás. A |w – a| = r körvonalon a mértani sor egyenletesen konvergens, és az összege

. Ezért

Az egyenletes konvergencia miatt tagonként integrálhatunk:

Az utolsó zárójelben álló kifejezés nem függ w-től. Az f(z) függvényt ezzel a teljes B(a, r) körlapon előállítottuk

alakban, ahol .
A tétel következménye, hogy

– minden reguláris függvény analitikus, azaz ha az f(z) függvény reguláris a D tartományon, akkor az f(z) függvény a D
bármely a pontja körül sorba fejthető;
– az a körüli hatványsor konvergenciasugara legalább akkora, mint a legnagyobb, D-ben fekvő, a középpontú kör
sugara.

A hatványsor együtthatóira most már kétféle képletet is ismerünk: , illetve

. A deriváltakra vonatkozó Cauchy-formulákból tudjuk, hogy ez a kettő pontosan ugyanaz.

Laurent-sorba fejtés

A mindkét irányban végtelen,


alakú sorokat a körüli Laurent-sornak nevezzük. Az improprius integrálokhoz hasonlóan, a sort akkor tekintjük
konvergensnek, ha mindkét fele konvergens.

A hatványsorokról tanultakból tudjuk, hogy a sor jobb fele, egy a középpontú, kör alakú halmazon

konvergens. A sor bal fele, pedig akkor konvergens, ha 1/(z – a) esik egy bizonyos körbe.

A Laurent-sor egy körgyűrű alakú halmazon konvergens. Legyen .


– Ha |z – a| < R1, vagy |z – a| > R2, akkor a Laurent-sor divergens, mert a megfelelő irányban a tagok nem tartanak 0-
hoz.
– Ha R1 < |z – a| < R2, akkor a Laurent-sor abszolút konvergens.
– Tetszőleges R1 < r1 < r2 < R2 számok esetén a Laurent-sor abszolút és egyenletesen konvergens az r1 < |z – a| < r2
gyűrűn.

Lehetséges, hogy R1 = 0; ilyenkor a gyűrű belső határa az a pontból áll. Ha a sor nem tartalmaz negatív kitevőjű tagot,
vagyis a sor egy hatványsor, akkor természetesen a középpontban is konvergens. Ha R1 = ∞, akkor a tartománynak nincs
külső határa.

Példák
1. Az 1 körüli

Laurent-sor az 1 < |z –1| < 2 gyűrűn konvergens.


2.
A 0 körüli Laurent-sor sehol sem konvergens,
mert R1 = 1 és R2 = 1/2.
3.
A –i körüli Laurent-sor a –1 ponton kívül mindenhol konvergens.
4.
A 2 körüli halmazon konvergens.
5.
A halmazon konvergens.

Laurent-sorba fejtés. Ha az f(z) függvény reguláris az R1< |z – a| < R2 körgyűrűn, akkor f(z) ezen a tartományon
Laurent-sorba fejthető: léteznek olyan bn komplex számok, amelyekre
-
a Laurent-sor konvergens az R1<|z–a| < R2 tartományon;
-
;
-

a bn együtthatók egyértelműek, és tetszőleges R1 < r < R2 esetén teljesül rájuk a


együtthatóformula.

Bizonyítás. Válasszuk ki az r1, r2 sugarakat úgy, hogy R1 < r1<|z – a| < r2 < R2 teljesüljön. A Cauchy-formula alapján

Az első integrált pontosan ugyanúgy alakítjuk át, mint a hatványsorba fejtés bizonyításában:
A második integrál átalakításában a sort integráljuk tagonként.

A két integrálra kapott összegeket behelyettesítve

Mivel az függvény a teljes R1< |w – a| < R2 körgyűrűn reguláris, a két szummában szereplő integrálokban
a r1, illetve r2 sugarú köröket bármilyen R1 < r < R2 sugarú körre kicserélhetjük. Ezzel azt kapjuk, hogy

és ez a Laurent-sor a teljes gyűrűn előállítja a függvényt.


Már csak a Laurent-sor egyértelműségét kell igazolnunk a bizonyítás befejezéséhez.

Tegyük fel, hogy a Laurent-sor konvergens az R1 <|z–a| < R2 gyűrűn, az összege f(z), és legyen

. Azt akarjuk megmutatni, hogy teljesül az együtthatóformula.

Vegyünk tehát egy n egész számot, és vizsgáljuk az integrált! Mivel a Laurent-sor


egyenletesen és abszolút konvergens a |z – a| = r körvonalon, tagonként integrálhatunk:

Ha m – n – 1 ≠ –1, azaz m ≠ n, akkor a (z – a)m – n – 1 függvénynek létezik primitív függvénye, ezért az integrál 0. Az m = n
esetben viszont, mint korábban már láttuk,

ezért

az összegfüggvény egyértelműen meghatározza az bn együtthatót.

A hatványsorba fejthetőség következményei

Az unicitástétel
A gyöktényezők kiemelhetősége; lokális aszimptotikus viselkedés
A maximumelv

Az unicitástétel
A reguláris függvényeket egyértelműen meghatározzák az értelmezési tartomány egy pontjának környezetében felvett
értékei.

Unicitástétel. Ha z1, z2, …, z, egy olyan, D-beli komplex számokból álló végtelen sorozat, aminek van torlódási pontja D
belsejében, akkor minden D-ben reguláris függvényt egyértelműen meghatároznak az f(z1), f(z2), … értékek. Más
szóval, ha f(z) és g(z) reguláris függvények D-n és f(zz) = g(zn) minden n-re, akkor f(z) = g(z) a teljes D tartományon.

Bizonyítás. Legyen h(z) = f(z) – g(z); a tételt úgy is megfogalmazhatjuk, hogy ha h(zn) = 0 minden n-re, akkor h(z) ≡ 0.
Legyen Z azon D-beli pontok halmaza, ahol h = 0, és legyen Z′ a Z halmaz torlódási pontjainak halmaza. Mint tudjuk,
tetszőleges halmaz torlódási pontjainak halmaza zárt, tehát Z′ egy zárt halmaz.
Most megmutatjuk, hogy a Z′ ⋂ D halmaz nyílt. Tegyük fel, hogy a ∈ D torlódási pontja Z-nek, azaz léteznek olyan w1,

w2, … ∈ D pontok, amikre wn ∈ Z, wn → a és h(wn) = 0. Legyen h(z) hatványsora a körül


Ha az együtthatók között van 0-tól különböző, akkor legyen bm az első ilyen. Ekkor azonban

ami ellentmondás. Tehát mindegyik együttható 0, és h(z) ≡ 0 az a pont egy környezetében. A Z′ ⋂ D halmaz tehát
tartalmazza a egy környezetét bármely a ∈ Z′ ⋂ D esetén.
Tekintsük most a Z′ ⋂ D és D\Z′ halmazokat! Ez két diszjunkt nyílt halmaz, amelyek uniója D. Mivel D összefüggő, ez
csak úgy lehetséges, ha az egyikük üres, a másik a teljes D. Azt azonban a feltételből tudjuk, hogy a z1, z2, … sorozatnak van
torlódási pontja D-ben, vagyis Z′ ⋂ D nem lehet üres. Tehát D ⊂ Z′, amiből következik, hogy h(z) = 0 a teljes D-n.
Az unicitástétel állítása nem marad igaz, ha a z1, z2, … sorozat csak a határhoz torlódik. Legyen például D az egységkör,

és . Ezekben a pontokban f(zn) = sin (nπ) = 0, holott f(z) nem a konstans 0.

A gyöktényezők kiemelhetősége; lokális aszimptotikus viselkedés


A reguláris függvények nullhelyei nagyon hasonlóan viselkednek a polinomok gyökeihez.

Ha f(z) reguláris az a pont egy környezetében, és f(a) = 0, akkor f(z)-ből kiemelhető a z – a gyöktényező, azaz létezik
olyan, g(z) reguláris függvény, amire f(z) = g(z)(z – a).
Általánosabban, f(z)-ből akkor és csak akkor emelhető ki (z – a)k, ha f(a) = f′(a) =…= f(k – 1)(a) = 0.

Bizonyítás. Legyen az f(z) függvény a körüli hatványsora , ahol . A (z – a)k


tényező akkor és csak akkor emelhető ki, ha b0 = b1 = b2 = … = bk–1 azaz f(a) = f′(a) = … = f(k –1)(a) = 0.
Ha f(z) nem a konstans 0 függvény, akkor a hatványsor együtthatói között szerepel 0-tól különböző is, ezért mindig van
egy maximális k kitevő, amire (z – a)k kiemelhető a függvényből.

Ha f(z) regularis az a pont egy környezetében, f(a) = 0, és k a legnagyobb olyan pozitív egész, amire (z – a)k kiemelhető a
függvényből, akkor azt mondjuk, hogy f-nek az a pont k-szoros gyöke.

Tegyük most fel, hogy f(z) reguláris az a pont egy környezetében, és az f(z) – f(a) függvénynek az a szám m-szeres gyöke,
azaz f(z) – f(a) = g(z)(z – a)m, ahol g(a) ≠ 0. Vizsgáljuk meg, hogy mi egy a körüli kis r sugarú körvonal képe.

Ha r → 0, akkor a folytonosság miatt g(a + reit) → g(a) egyenletesen. Tehát

ha z körbefut |z – a| = r körvonalon, akkor f(z) közelítőleg az f(a) középpontú, rm|g(a + reit)| sugarú körön fut körbe m-
szer. Az a szögsebesség, amivel f(z) – f(a) körbefordul, közelítőleg m-szerese z – a szögsebességének.

Ha m > 1, azaz f′(a) = 0, akkor ez azt is jelenti, hogy a reguláris függvények nem szögtartók azokban a pontokban, ahol a
derivált eltűnik.

A maximumelv
Ha f(z) reguláris és nem konstans az a pont egy környezetében, akkor a lokális aszimptotikus viselkedésből szemléletesen
látható, hogy a környezet „körülveszi” az f(a) pontot, vagyis f(a) belső pontja a képhalmaznak.
A nyílt leképezés tétele. Ha f(z) reguláris és nem konstans a D tartományon, akkor bármely, D-ben fekvő nyílt halmaz
képe is nyílt.

A tételt a következő fejezetben bizonyítjuk be.


A nyílt leképezés tételéből azonnal következik, hogy sem a függvény valós, sem képzetes részének nem lehet sehol
lokális szélsőértéke, továbbá a függvény abszolút értékének sem lehet sehol lokális maximuma. Erre a tényre közvetlen
bizonyítást adhatunk a lokális aszimptotikus viselkedésből.

Maximumelv
a) Nem konstans reguláris függvény abszolút értékének nincs lokális maximumhelye.
b) Ha K kompakt részhalmaza a h(z) nem konstans reguláris függvény értelmezési tartományának, akkor |h(z)| a
legnagyobb értékét K határán veszi fel.
c)
Ha z1, z2, … olyan pontsorozat a D tartományban, amire , akkor a sorozat minden torlódási
pontja (konvergens sorozat esetén a limesze) D-nek határpontja.

Bizonyítás. Az a) állításból azonnal következik b) és c), ezért csak a)-t bizonyítjuk. Legyen a tetszőleges pont, amelynek
egy B (a, δ) környezetében f(z) reguláris. Azt akarjuk megmutatni, hogy |f(z)| felvesz |f(a)|-nál nagyobb értéket.
Tegyük fel, hogy f(z) – f(a) = g(z) (z – a)m, ahol g(z) reguláris és g(a) ≠ 0. Válasszunk egy olyan t számot, amelyre g(a)emit

és f(a) iránya megegyezik, azaz nem negatív valós szám. (Ha f(a) = 0, akkor bármelyik irány megfelel.) Ekkor

Ebből következik, hogy elég kis r esetén

A maximumelv egyik fontos alkalmazása a

Schwarz-lemma
a) Ha f(z) reguláris a B(0, 1) egységkör belsejében, |f(z)| ≤ 1 és f(0) = 0, akkor |f(z)| ≤ |z|, és |f′(0)| ≤ 1.
b) b) Ha |f′(0)| = 1, vagy |f(z)| = |z| teljesül akár csak egyetlen z ≠ 0 pontban, akkor f(z) = cz, ahol c egy egységi hosszú
komplex szám.

Bizonyítás. Mivel 0 gyöke f(z)-nek, f(z) = g(z) ·z és f′(0) = g(0) egy alkalmas g(z) reguláris függvénnyel, amire a feltétel

szerint .
A maximumelvet alkalmazva a g(z) függvényre, tetszőleges 0 < r < R < 1 esetén

A R → 1 – 0 határátmenetből

vagyis |g(z)| ≤ 1 a teljes körlapon. Visszaírva g(z) de nícióját, ez azt jelenti, hogy [f(z)| = |g(z)| · |z| ≤ |z| és |f′(0)| = |g(0)| ≤ 1.
Ha |g(z)| = 1 csak egyetlen pontban is teljesül, akkor a maximumelv szerint g(z) konstans, és f(z) valóban cz alakú.

A Liouville-tétel
Az együttható-formula ismeretében a függvényértékek nagyságából könnyen kaphatunk jól használható becsléseket a
hatványsor együtthatóinak nagyságára.

Együtthatóbecslés. Ha a B(a, r) körben


Bizonyítás. Legyen .

Ha r1-gyel tartunk r-hez, a bizonyítandó állítást kapjuk.


Az együtthatóbecslés egyszerű következménye a

Liouville-tétel. Ha egy egészfüggvény korlátos, akkor konstans.

Bizonyítás. Tegyük fel, hogy f(z) egészfüggvény, és |f(z)| ≤ M a teljes síkon. Legyen a függvény 0 körüli hatványsora

. Az együtthatóbecslés szerint tetszőleges pozitív egészre n és pozitív valós r-re

Rögzített pozitív egész n mellett ez csak úgy teljesülhet minden r-re, ha bn = 0.

A polinomok jellemzése. Ha f(z) egészfüggvény, és , akkor f(z) legfeljebb k-adfokú polinom.

Bizonyítás. Legyen . Az együtthatóbecslés alapján n ≥ k + 1 esetén

.
Tehát valójában f(z) = b0 + b1z + … + bkzk egy polinom, ami nem tartalmaz k-nál magasabb fokú tagot.

Az izolált szingularitások tulajdonságai

Az a pontot az f(z) függvény izolált szingularitásának nevezzük, ha a függvény reguláris az a egy pontozott
környezetében. Az izolált szingularitásokat három csoportba soroljuk:
- Az a pont megszüntethető szingularitás, ha a függvény az a pontra is kiterjeszthető regulárisan.
-
Az a pont k-adrendű pólus, ha egy alkalmas g(z) függvényre, amely reguláris a-ban, és amelyre g(a)
≠ 0.
- Az a pont lényeges szingularitás, ha nem tartozik az előző két csoportba.

A megszüntethető szingularitások jellemzése. Tegyük fel, hogy f(z)-nek izolált szingularitása van a-ban. A következő
állítások ekvivalensek:
a) az a-beli szingularitás megszüntethető;
b) a függvény folytonosan kiterjeszthető az a pontban, azaz létezik véges határértéke;
c) a függvény korlátos a egy pontozott környezetében;
d) .

A pólusok jellemzése. Tegyük fel, hogy f(z)-nek izolált szingularitása van a-ban. A következő állítások ekvivalensek:
a) a függvénynek a-ban legfeljebb k-adrendű pólusa (vagy megszüntethető szingularitása) van;
b) az f(z) (z – a)k függvénynek létezik véges határértéke a-ban;
c) az f(z) (z – a)k függvény korlátos a egy pontozott környezetében;
d) .

Bizonyítás. Mivel triviálisan (a) ⇒ (b) ⇒ (c) ⇒ (d), elég azt igazolni, hogy (d) ⇒ (a).
Válasszunk egy olyan kicsi r0 > 0 számot, amire f(z) reguláris a Ḃ(a, r0) pontozott környezetben, és legyen f(z) Laurent-
sora a 0 < |z – a| < r0 tartományon A célunk annak megmutatása, hogy a Laurent-sorban nincsenek
(– k)-nál kisebb fokú tagok. Legyen tehát n ≤ – (k + 1), és vizsgáljuk a bn együtthatót! Az együttható-formula szerint bármely
0 < r < r0 esetén

, amiből

Ha a d) állítás teljesül, akkor .

Casorati–Weierstrass-tétel. Ha a lényeges szingularitása az f(z) függvénynek, akkor a bármely pontozott


környezetének f szerinti képe sűrű a teljes síkon.

Bizonyítás nélkül megemlítjük, hogy a Casorati–Weierstrass-tételnél sokkal több is igaz.

Picard-tétel. Ha a lényeges szingularitása az f(z) függvénynek, akkor a bármely pontozott környezetében legfeljebb egy
kivétellel minden komplex számot felvesz.

A Casorati–Weierstrass-tétel bizonyítása. Tegyük fel, hogy az állítás hamis, valamilyen δ > 0-ra a Ḃ(a, δ) halmaz képe

mégsem sűrű, vagyis nem vesz fel egy értéket sem egy tetszőleges B(b, r) körlapon. Nézzük a függvényt!

A fenti indirekt feltevés szerint halmazon. A g(z) függvény tehát korlátos az a egy pontozott
környezetében, és g(z)-nek megszüntethető szingularitása van a-ban.

Ha g(z)-nek k-szoros gyöke van a-ban, akkor az függvénynek ugyanitt k-adrendű pólusa (k = 0
esetén megszüntethető szingularitása) van.

21.5. A reziduumtétel és alkalmazásai

A reziduumtétel
A reziduum kiszámítása
Az argumentumelv
A nyílt leképezés tételének bizonyítása
A reziduumtétel alkalmazásai

A reziduumtétel
Tegyük fel, hogy az f(z) reguláris a D egyszeresen összefüggő tartományon néhány izolált szingularitás kivételével, és γ
olyan zárt, rekti kálható görbe D-ben, ami elkerüli ezeket a szingularitásokat.
A Cauchy-tétel lehetőséget ad arra, hogy az integrációs utat megváltoztassuk, ha eközben nem „ugorjuk át” a
szingularitásokat. Húzzuk össze a görbét olyan kis körökre, amik egy-egy szingularitást kerülnek meg. A kis köröket olyan
görbedarabokkal kössük össze, amelyeken az új görbe mindkét irányban végighalad (21.7. ábra).

21.7. ábra

Az összekötő görbéken vett vonalintegrálok kiejtik egymást, a teljes görbén vett integrál ezért megegyezik a kis
körökön vett integrálok összegével. Ez a tény mutatja, hogy az integrál értéke csak attól függ, hogy a függvény hogy
viselkedik szingularitások körül, valamint attól, hogy az integrációs út hányszor kerüli meg az egyes szingularitásokat.
Tegyük fel, hogy f(z) reguláris a 0 < |z – a| ≤ r pontozott környezeten. Az számot az f(z) függvény a-beli
reziduumának nevezzük, és vagy, a változó feltüntetése nélkül, -fel jelöljük.

Ha f(z) Laurent-sora a 0 < |z – a| < r körben

Reziduumtétel. Legyen D egyszeresen összefüggő tartomány, és f(z) reguláris D-n az a1, …, ak szinguláris pontok
kivételével. Legyen továbbá γ olyan zárt, rekti kálható görbe D-ben, ami nem megy át a szinguláris pontokon, és
jelöljük mj-vel azt, hogy a görbe (előjelesen) hányszor kerüli meg az aj pontot, vagyis a γ(t) – aj vektor hányszor fordul
körbe, amíg végigmegyünk a görbén. Ekkor

(Például a 21.7. ábrán m1 = – 1, a2 = 2 és an = 1.)

A reziduum kiszámítása
Sok esetben a Laurent-sor felírása nélkül is kiszámíthatjuk a reziduumot. Két ilyen fontos esetet mutatunk.
1.
Ha , ahol g(z) reguláris az a pont egy környezetében, akkor az a-beli reziduumot a Cauchy-formulák adják

meg: , , általában .
2.
Ha , ahol g(z) és h(z) reguláris az a pont egy környezetében, és h(z)-nek egyszeres gyöke van a-ban, akkor

Példák
1.
Számítsuk ki az függvény reziduumát a 0-ban!

Megoldás: az függvény reguláris a 0-ban, tehát .


2.
Számítsuk ki a függvény reziduumát az i-ben!

Megoldás: .
3. Számítsuk ki a ctg z függvény reziduumát a 0-ban!

Megoldás:

4.
Számítsuk ki az függvény reziduumát a –i-ben!
Megoldás: a deriváltra vonatkozó Cauchy-formula szerint

5.
Számítsuk ki az függvény reziduumát a –π-ben!

Megoldás: az függvénynek másodrendű pólusa van a –π-ben, ezért a Laurent-sora ...


alakú. A számláló és a nevező –π körüli hatványsora
tehát

amiből

Az argumentumelv
A reziduumtétel arra is használható, hogy egy függvény gyökeit és pólusait megszámoljuk egy adott görbe belsejében.

Ha az f(z) függvény izolált szingularitásoktól eltekintve reguláris, és a szingularitások mind pólusok, akkor
meromorfnak nevezzük.

Könnyen ellenőrizhető, hogy

-
ha f(z)-nek m-szeres gyöke van az a pontban, akkor ,
-
ha f(z)-nek m-edrendű pólusa az a pontban, akkor .

Ha a reziduumtételt az f′/f függvényre alkalmazzuk, a következő összefüggést kapjuk.

Argumentumelv. Tegyük fel, hogy f(z) meromorf a D tartományon, és legyen γ olyan, D-ben fekvő egyszerű, zárt,
rekti kálható görbe, ami nem megy át f semelyik gyökén és pólusán sem. Ha γ belsejében f-nek (multiplicitással

számolva) N gyöke és P pólusa van, akkor .

A tételben szereplő integrálnak egy fontos geometriai jelentése van: a γ görbén körbehaladva, az f(z) iránya (azaz az

argumentuma) pontosan szer fordul körbe.

Ha f(z) reguláris a γ görbén és annak belsejében, továbbá f(z) ≠ a a görbén, akkor a görbén körbehaladva f(z) pontosan
annyiszor kerüli meg az a számot, mint ahányszor f(z) felveszi az a értéket.

A nyílt leképezés tételének bizonyítása


Tegyük most fel, hogy f(z) reguláris az a pont egy környezetében, és az f(z) –f(a) függvénynek az a szám m-szeres gyöke!
Mint láttuk, egy a középpontú kis kör képe m-szer körbefut f(a) és f(a) egy kis környezete körül is. Az argumentumelv
szerint tehát ezeket az értékeket mind felveszi a függvény, az f(a) pont pedig a képhalmaznak belső pontja.
Ha a γ görbe pontjaiban |f(z)| > |g(z)|, akkor szemléletesen f(z) és f(z) + g(z) ugyanannyiszor fordul körbe. Ez az alapja a
következő tételnek.

Rouché tétele. Legyen f(z) és g(z) meromorf a D tartományon, és legyen γ olyan zárt, rekti kálható görbe, ami a
belsejével együtt a tartományban fekszik úgy, hogy γ nem megy át f(z) és g(z) pólusain.
Ha a γ görbe pontjaiban |f(z)| > |g(z)|, akkor γ belsejében az f és f + g függvény gyökei és pólusai (multiplicitással vett)
számának különbsége ugyanaz.

A reziduumtétel alkalmazásai
Most a reziduumtétel néhány olyan alkalmazására mutatunk példákat, amikor nehezen kezelhető összegeket és
integrálokat számítunk ki a segítségével.

Valós improprius integrálok kiszámítása


Az

integrál kiszámítása
Az

integrál kiszámítása
Végtelen sorok összegének kiszámítása

Valós improprius integrálok kiszámítása


A valós tengelyen vett integrálokat kicseréljük egy másik görbén vett integrálra. Az új integrációs utat úgy választjuk meg,
hogy az integrál 0-hoz tartson. A régi és az új integrál közötti különbséget a reziduumtételből számítjuk ki.
Az új integrációs út alakja többféle lehet. A leggyakoribbak a félkör, a téglalap és a bevágott kör alakú görbék. Az is
gyakori, hogy az integrálandó függvényt módosítjuk, például megszorozzuk log z-vel.

Az

integrál kiszámítása
Ez az integrál a valós eszközökkel kiszámítható, de jól példázza a bemutatott technikát.

21.8. ábra

Legyen K > 1 esetén γK a K és –K pontokat összekötő félkör (21.8. ábra). A reziduumtétel szerint

Az

integrál kiszámítása

A függvénynek megszüntethető szingularitása van a 0-ban.


A számlálóban álló tagok közül az eiz akkor kicsi, ha Im z nagy, ezzel szemben e–iz akkor kicsi, ha Im z nagy abszolút értékű,
de negatív szám. Ezért a két tagot különböző görbéken fogjuk integrálni.
Legyen K > 0, és tekintsük a 21.9. ábrán látható γ1, γ2 és γ3 görbéket! A Cauchy-tételt alkalmazva
21.9. ábra

A középső integrált a reziduumtételből számítjuk ki:

Az γ1 görbén |eIimz| = eIm z < 1, ezért

Ugyanezt kaphatjuk a harmadik integrálra. Ha tehát K→ ∞, akkor a két szélső integrál 0-hoz tart. Összességében azt
kaptuk, hogy

Végtelen sorok összegének kiszámítása


A π ctg(πz) függvénynek elsőrendű pólusa van a (valós) egész helyeken, és itt a reziduuma 1. Ha elhagyjuk a síkból az
egészek egy-egy kicsi környezetét, például a B(k, 1/3) körlapok unióját, a megmaradó halmazon a függvény korlátos. Erre
alapul a következő módszer, amellyel például racionális függvények értékeit összegezhetjük az egész helyeken.

Legyen racionális függvény, amelyben a nevező foka legalább 2-vel nagyobb, mint a számláló foka. A
függvénynek az egészektől különböző pólusai legyenek a1, …, ak. A reziduumtételt az f(z) · π ctg (πz) függvényre alkalmazva

Ha az N pozitív egésszel tartunk ∞-hez, akkor a jobb oldal 0-hoz tart, mert az integrációs út hossza N, az integrandus
pedig legfeljebb 1/N2 nagyságrendű. Ezért

Azokon az egész j helyeken, ahol f(z)-nek nincs pólusa, Resj g = f(j). A képlet tehát lehetőséget ad az f(j) értékek
összegzésére.

Példák
1.
Számítsuk ki a összeget!

Megoldás. Az függvénynek elsőrendű pólusa van az egész helyeken és a ± i pontokban. Ezeken a


helyeken a reziduumok:

hasonlóan kapjuk, hogy

A reziduumok összege 0, tehát


2.
Számítsuk ki a összeget!

Megoldás. Az függvénynek elsőrendű pólusa van a 0-tól különböző egészekben, és

A kotangensfüggvény 0 körüli Laurent-sorának első tagjai

Mivel a reziduumok összege 0,

21.6. Konform leképezések


Az úgynevezett konform leképezések két R2-beli tartományt feleltetnek meg egymásnak úgy, hogy lokálisan, „kicsiben”
megtartanak több geometriai tulajdonságot, mint például a szögek, az arányok és az irányítás. Egy konform leképezés
minden pont körül egy irányítástartó hasonlósággal approximálható.
A konform leképezéseket gyakran használjuk zikai és mérnöki alkalmazásokban is, például forrásmentes erőterek
modellezésében. A konform leképezések segítségével a feladatokat más, könnyebben kezelhető esetekre vezethetjük vissza,
amelyekben a számítások egyszerűbbek.

Legyen D1 és D2 két tartomány. Ha f : D1 → D2 kölcsönösen egyértelmű megfeleltetés úgy, hogy f és f–1 reguláris, akkor
az f függvényt konform leképezésnek nevezzük.

(Megjegyezzük, hogy f regularitásából következik, hogy f–1 is reguláris.)


Ha az D1 és D2 tartományok között létezik konform megfeleltetés, akkor azt mondjuk, hogy a két tartomány konform
ekvivalens. A D tartományt önmagának megfeleltető konform leképezéseket D konform automor zmusainak is nevezzük.

Egyszeresen összefüggő tartományok konform ekvivalenciája


Körök és félsíkok konform leképezései
Az egységkör konform automor zmusai
A tükrözési elv
Sokszög leképezése

Egyszeresen összefüggő tartományok konform ekvivalenciája


A konform ekvivalencia erősebb reláció, mint a topológiából ismert homeomor a. Minden konform megfeleltetés egyúttal
homeomor a is, de nem igaz, hogy bármely két homeomorf tartomány egyúttal konform ekvivalens is lenne. Például a
teljes sík homeomorf az egységkörrel, ez a két tartomány mégsem konform ekvivalens. Sőt

a teljes sík nem konform ekvivalens semmilyen valódi részével.

Bizonyítás. Azt kell bizonyítanunk, hogy ha egy f(z) egész függvény injektív, akkor minden komplex számot felvesz.
Tegyük fel indirekten, hogy f(z) nem vesz egy értéket; mivel f(z)-t egy konstanssal megváltoztathatjuk, feltehetjük, hogy
f(z) ≠ 0. Ekkor létezik log f-nek reguláris ága, legyen tehát g(z) az egyik ilyen ág; f(z) = eg(z) a teljes síkon.
Válasszuk ki g(z) egyik értékét, legyen ez a! A nyílt leképezések tételéből következik, hogy g(z) minden értéket felvesz a
egy kis B(a, r) környezetében. Az exponenciális függvény 2πi szerint periodikus, tetszőleges w ∈ B(a, r) esetén ew = e2πiw.
Mivel az f(z) = eg(z) függvény injektív, g értékei között nem szerepelhet egyszerre a w és a w + 2πi szám is. A g(z) függvény
tehát nem vesz fel egy értéket sem a B(a + 2πi, r) körben.

Tekintsük most a függvényt! h(z) egy olyan egész függvény, ami korlátos is: .A
Liouville-tétel alapján h(z) konstans, ez viszont ellentmond annak, hogy f, és vele együtt g és h is, injektív.

A konform leképezések alaptétele, Riemann-alaptétel. A teljes sík kivételével minden nem üres, egyszeresen
összefüggő tartomány konform ekvivalens az U = {z: |z| < 1} egységkörlemezzel.

A tételből természetesen azonnal következik, hogy bármely két olyan egyszeresen összefüggő tartomány, ami nem a
teljes sík, konform ekvivalens egymással.

Körök és félsíkok konform leképezései


A körök és egyenesek jellemzésében alapvető a következő, a projektív geometriából ismert fogalom.

Legyen a, b, c, d négy különböző komplex szám. Az

számot az a, b, c, d számnégyes kettősviszonyának nevezzük és (a, b, c, d)-vel jelöljük.

Az (a, b, c, d) kettősviszony akkor és csak akkor valós, ha az (a, b, c, d) pontok egy körre vagy egy egyenesre esnek.

Bizonyítás. Az (a, b, c, d) kettősviszony akkor tisztán valós, ha (arg(a – c) – arg(b – c)) – (arg(a – d) – arg(b – d))
többszöröse π-nek. A két zárójelben az acbd négyszög c-nél és d-nél levő előjeles szögei állnak; a feltétel azzal ekvivalens,
hogy a két szemközti előjeles szög összege osztható π-vel.
Az az + b alakú lineáris függvények irányítástartó hasonlóságok, amik egyenest egyenesbe és kört körbe visznek. Egy
további fontos függvény az 1/z függvény, geometriailag egy tükrözött inverzió. (Az A/z̄ függvény írja le az egységkörre való
inverziót, de ez nem reguláris a konjugálás miatt.) A síkot kiegészítjük a ∞ ponttal, akkor az 1/z függvény a 0-t és a ∞ pontot
egymásnak felelteti meg. Nem nehéz ellenőrizni, hogy az 1/z függvény tengelyesen tükrözi a 21.1. fejezetben látott gömböt a
– 1, 1 átmérőre.
A ∞-nel kiegészített gömbön az egyeneseket is köröknek tekinthetjük. A félsíkok azok a körlemezek, amiknek határa
átmegy a ∞ ponton; egy kör külseje pedig az a kör, ami a belsejében tartalmazza a ∞-t (21.10. ábra).

21.10. ábra

Ha lineáris függvényeket és az 1/z függvényt egymás után alkalmazzuk, további függvényeket kaphatunk: ezek az
úgynevezett lineáris törtfüggvények.

Legyenek a, b, c, d olyan komplex számok, amikre ad – bc ≠ 0. A

alakú függvényeket lineáris törtfüggvényeknek nevezzük.

A lineáris törtfüggvények kettősviszonytartóak, és minden kört és egyenest körbe vagy egyenesbe visznek. A lineáris
törtfüggvényeknek 3 „szabadsági foka” van. Általában is igaz, hogy

a lineáris törtfüggvények három tetszőleges pont képével egyértelműen meghatározhatók, azaz ha z1, z2, z3, illetve w1,
w2, w3 három különböző pont (szerepelhet közöttük a ∞ is), akkor pontosan egy olyan f(z) lineáris törtfüggvény
létezik, amire f(z1) = w1, f(z2) = w2, és f(z3) = w3.
Az egységkör konform automor zmusai

Az U = {z: |z| < 1} konform automor zmusai a alakú lineáris törtfüggvények, ahol a és ϵ komplex
számok, |a| < 1 és |ϵ|.

Bizonyítás. Tetszőleges |a| < 1 esetén legyen . Könnyű ellenőrizni, hogy φa(z) és φ–a(z) egymás
inverzei.
Először vizsgáljuk meg azokat a konform automor zmusokat, amik xen hagyják a 0-t. A 0 körüli forgatások, azaz az ϵz
alakú függvények nyilván ilyenek; megmutatjuk, hogy más nincs.
Tegyük fel tehát, hogy f(z) olyan konform automor zmusa az egységkörnek, amire f(0) = 0. A Schwarz-lemmát
alkalmazva az f és f–1 függvényekre, |f(z) | ≤ |z| és |z| = |f–1 (f(z))| ≤ |f(z)| bármely |z| < 1 esetén, ami csak úgy lehet, ha |f(z) | =
|z| a teljes körlemezen. Ez esetben viszont a Schwarz-lemma azt is kimondja, hogy f(z) = ϵz alkalmas, egységnyi hosszúságú
ϵ komplex számmal.
Tekintsük most a φa(z) függvényt, ahol |a| < 1! A függvény reguláris az A/z̄ pont kivételével, és körvonalon

A függvény tehát az egységkörvonalat önmagára képezi. Mivel a 0 képe a φa(0) = a belső pont, a függvény az
egységkörlemezt a kör belsejének felelteti meg, vagyis φa(z) egy konform automor zmusa U-nak.
Az eddigiekből láthatjuk, hogy minden ϵφα(z) alakú függvény konform automor zmusa az egységkörnek. Legyen most
f(z) egy tetszőleges konform automor zmusa U-nak; olyan a és ϵ számokat akarunk találni, amikre f(z) = ϵφα(z). Legyen a = –
f–1(0), és tekintsük a h(z) =f(φ–α(z)) függvényt! Ez a függvény konform automor zmusok összetétele, maga is
automor zmus, továbbá h(0) = f(φ_a(0))= f(– a) = 0. Mint láttuk, ebből következik, hogy h(z) = ϵz egy egységnyi hosszúságú
komplex számmal. Ezek után pedig, z helyére φα(z)-t helyettesítve,

A tükrözési elv
Egy tartomány határa nem mindig „szép”. A határnak lehetnek többszörös, sőt végtelenszeres pontjai. A határ maga lehet
egy egészen bonyolult fraktál is. Ezért nem mindig lehet egy konform megfeleltetést bővebb halmazra folytatni. Ha viszont
a határ „szép”, akkor többet lehet mondani.

Caratheodory tétele. Ha D1 és D2 két Jordan-tartomány és f: D1 → D2 konform leképezés, akkor f és f–1 kiterjeszthető


folytonosan a két tartomány határára.
Tükrözési elv. Legyen D1 és D2 két Jordan-tartomány a felső félsíkban úgy, hogy mindkettőnek legyen egy-egy
határszakasza, I1 és I2, a valós tengelyen. Legyen f olyan konform megfeleltetés D1 és D2 között, ami I1-et I2-nek felelteti
meg. Ekkor az f(z) konform megfeleltetés kiterjeszthető a D1 ∪ I1 ∪ D̄1 és D2 ∪ I2 ∪ D̄2 tartományok közötti konform
megfeleltetéssé.

21.11. ábra

Sokszög leképezése
A fejezetet egy olyan képlettel zárjuk, ami megadja egy félsík és egy sokszög között az összes lehetséges konform
megfeleltetést.

Schwarz–Christo el-formula. Tegyük fel, hogy f(z) konform megfeleltetés a felső félsík és az A1… An sokszög között
úgy, hogy a sokszög Ak csúcsának a valós tengely ak pontja felel meg. Ha a sokszög szögei a1…an, akkor
ahol B ≠ 0 és C alkalmas komplex számok.

21.12. ábra

Ha az ak számok valamelyike a ∞, akkor a megfelelő tényezőt elhagyjuk. A formula akkor is érvényes, ha a csúcsok
közül egy – vagy akár több – a ∞; így például szögtartományok esetén is használható.
Teljes általánosságban ez a képlet nem használható könnyen, ugyanis nem ad eljárást az a1, …, an számok
meghatározására. Az viszont igaz, hogy közülük bármelyik hármat tetszés szerint megadhatjuk, ha sorrendjük megfelel a
sokszög – mindig pozitív – körüljárásának.

21.7. Harmonikus függvények


Az úgynevezett harmonikus függvények fontos szerepet játszanak több zikai témában, így a folyadékok és gázok
áramlásának és a hővezetés modellezésében is. Most a kétváltozós harmonikus függvények és a reguláris komplex
függvények szoros kapcsolatát mutatjuk be. A kétváltozós esetben az értelmezési tartományt a komplex sík
részhalmazának tekintjük, a harmonikus függvényeket pedig komplex változós, de valós értékű függvényekként kezeljük.

Legyen D ⊂ Rn összefüggő, nyílt halmaz, és legyen h: D → R kétszer di erenciálható függvény! Azt mondjuk, hogy h(x1,
…, xn) harmonikus, ha teljesül rá az úgynevezett Laplace-egyenlet:

A operátort Laplace-operátornak is nevezik; ezzel a jelöléssel a Laplace-egyenletet a Δh = 0


alakban is írhatjuk.

A harmonikus függvény mint a reguláris függvény valós része


A harmonikus függvények néhány fontos tulajdonsága

A harmonikus függvény mint a reguláris függvény valós része


A kétváltozós esetben a harmonikus függvényeket, legalábbis lokálisan, illetve egyszeresen összefüggő tartományokon,
megkaphatjuk alkalmas reguláris komplex függvények valós részeként.

Ha az f: D → C függvény reguláris a D ⊂ C tartományon, akkor Re f és Im f harmonikus. Továbbá, ha f(z) ≠ 0, akkor log


|f(z)| is harmonikus.

Bizonyítás. Legyen f(x + yi) = u(x, y) + v(x, y)i. A Cauchy–Riemann-egyenletek és a Young-tétel alapján

Tehát u = Re f és v = Im f valóban harmonikus.


Ha f(z0) ≠ 0, akkor z0 egy környezetében értelmezhető regulárisan a log f függvény; ekkor log|f(z)| = Re log f(z) egy
reguláris függvény valós része, tehát szintén harmonikus.
Ha az u : D → R függvény harmonikus az egyszeresen összefüggő D tartományon, akkor létezik olyan f(z) függvény, ami
reguláris D-n, és u(x, y) = Re f(x + yi).

Bizonyítás. Először f(z) deriváltját írjuk fel, ezt ugyanis a Cauchy–Riemann-egyenletek miatt megtehetjük a képzetes
rész nélkül is.
Legyen

Könnyen ellenőrizhető, hogy a g(z) függvényre teljesülnek a Cauchy–Riemann-egyenletek. Így g(z) reguláris a D
tartományon, és létezik primitív függvénye. A g alkalmas primitív függvényét választva f-nek, teljesülni fog az u = Re f
azonosság.
A két fenti tételt összevetve, azt igazoltuk, hogy

egyszeresen összefüggő tartományon egy kétszer di erenciálható függvény akkor és csak akkor harmonikus, ha egy
reguláris komplex függvény valós része.

Megjegyezzük, hogy ez az eredmény nem marad igaz, ha D nem egyszeresen összefüggő. Például az
függvény a C\{0} tartományon harmonikus – ez a függvény a csak lokálisan létező
logaritmusfüggvény valós része –, de nincs olyan, a teljes C\{0} tartományon reguláris függvény, aminek ez lenne a valós
része.

A harmonikus függvények néhány fontos tulajdonsága


A reguláris függvények számos, korábban már látott lokális tulajdonsága fogalmazható át harmonikus függvényekre.

Középérték-tulajdonság. Ha h(z) harmonikus a zárt körlapon, akkor

Más szóval, a függvény átlaga a körlapon megegyezik a középpontban felvett értékkel. Megfordítva, ha h(z) folytonos a
D tartományon, és minden a ∈ D ponthoz létezik olyan δ(a) > 0, hogy bármely 0 < r < (a) esetén

akkor a h(z) függvény harmonikus.


A tétel első fele azonnal következik a reguláris komplex függvények középérték-tulajdonságából, egyben speciális esete
az alábbi tételnek. A tétel második felét most nem bizonyítjuk.

Poisson-formula. Ha h(z) harmonikus a B(0, 1 + e) körlapon, akkor tetszőleges z = ρeiϑ, |ρ| < 1 esetén

Bizonyítás. A szimmetria miatt elég az állítást a ϑ = 0 esetben igazolni. Legyen f(z) olyan reguláris függvény, amelynek
valós része h(z). A Cauchy-formula alapján
Az utolsó integrál 0, mert az függvény reguláris, ezért

Nyílt leképezés tétele. Ha h(z) harmonikus és nem konstans a D tartományon, akkor bármely, D-ben fekvő nyílt
halmaz képe is nyílt.

Maximum- és minimumelv
a) Nem konstans harmonikus függvénynek nincs lokális szélsőértékhelye.
b) Ha K kompakt részhalmaza a h (nem konstans) harmonikus függvény értelmezési tartományának, akkor h a
legkisebb és a legnagyobb értékét K határán feszi fel.
c) Ha z1, z2, … olyan pontsorozat a D tartományban, amire h(zn) → supD h vagy h(zn) → infD h, akkor a sorozat minden
torlódási pontja (konvergens sorozat esetén a limesze) D-nek határpontja.
22. Fraktálgeometria
A fraktálgeometria a XX. század matematikájának a terméke. A század első évtizedeiben Sierpinski lengyel, Koch és Cantor
német matematikusok a halmazelmélet furcsaságainak bemutatására és vizsgálatára szerkesztettek „megmérhetetlen”
halmazokat, amelyek távolinak tűnnek a minket körülvevő világ geometriájától. A fraktálgeometria a XX. század utolsó
évtizedeiben alakult ki, miután Mandelbrot, a hazájából menekülni kényszerült, az IBM-nél dolgozó lengyel matematikus
1982-ben megjelent könyvében megmutatta, hogy ezek a patologikusnak tűnő halmazok alkalmasak lehetnek a
körülöttünk levő világ matematikai leírására is. A fraktál elnevezés is tőle származik.

22.1. Bevezető példák


22.2. Mátrixok és geometriai transzformációk
22.3. Hasonlósági és kontraktív leképezések, halmazfüggvények
22.4. Az IFS-modell
22.5. Olvasmány a halmazok távolságáról
22.6. Az IFS-modell tulajdonságai
22.7. IFS-modell és önhasonlóság
22.8. Önhasonló halmazok szerkezete és a „valóság”
22.9. A fraktáldimenziók
22.10. A hatványszabály (power law)
22.11. A boxdimenzió
22.12. Mit mér a boxdimenzió?
22.13. Tetszőleges halmaz boxdimenziója
22.14. Fraktáldimenzió a geodéziában

22.1. Bevezető példák


A fraktálgeometria egyik eszköze és alapkoncepciója az iteráció. Iterációnak nevezzük azt, amikor egy szabályt újra meg
újra ismétlünk. Ismerkedésünket a fraktálgeometriával azzal kezdjük, hogy iterációval állítunk elő nevezetesebb
fraktálokat.
1. A Sierpinski-háromszög. Induljunk ki egy zárt háromszöglapból! Az oldalfelező pontok összekötésével osszuk négy
egybevágó részre, és a középső negyedét távolítsuk el. Ezt az eljárást folytassuk a megmaradó háromszögekkel „a
végtelenségig”. Ekkor az ismétlődő szabály: „minden háromszöget osszunk négy egybevágó részre, és a középső (nyílt)
háromszöget töröljük.”
Újra meg újra alkalmazva a szabályt, a kapott halmazoknak {Sn; n = 1, 2, …} sorozatára

(22.1)

hiszen a szabály minden alkalmazásával elveszünk a halmazból.


Ha (22.1) érvényes, akkor azt mondjuk, hogy {Sn; n = 1, 2, …} egymásba skatulyázott halmazok sorozata.
Az {Sn; n = 1, 2, ...} halmazok

közös részét nevezzük Sierpinski-háromszögnek.


Az eljárást a 22.1. és 22.2. ábrán mutatjuk be. Az első ábrán derékszögű, a második ábrán pedig egyenlő oldalú
háromszöget választottunk kezdő halmazként.
22.1. ábra

22.2. ábra

Az S Sierpinski-háromszögnek a következő tulajdonságai vannak.


I. Az S területe nulla. Ugyanis az {Sn; n = 1, 2, …} sorozatban mindegyik halmaz területe az előző területének a
háromnegyed része. Így, ha gyelembe vesszük a területnek (mértéknek) azt a tulajdonságát, hogy egy halmaz részének a
területe nem lehet nagyobb, mint a halmazé, akkor S területe csak 0 lehet. A továbbiakban röviden a halmaz mértékének
fogjuk olykor nevezni a halmaz területét, hosszát vagy térfogatát.
II. Ha T az egyike azon háromszögeknek, amelyeket nem töröltünk az első iteráció során, akkor az S ∩ T halmazt
lineárisan kétszeresére növelve megkapjuk az egész S Sierpinski-háromszöget. Három, az S ∩ T halmazzal egybevágó
halmaz egyesítésével is megkapjuk a Sierpinski-háromszöget. Ezt a tulajdonságot önhasonlóságnak nevezzük.
Minden Sierpinski-háromszög egy szerfelett lyukacsos halmaz, amelyből nagyításkor egyre több és több részlet válik
láthatóvá. Ez a tulajdonság az önhasonlósággal kapcsolatos, hiszen minden, a Sierpinski-háromszögben fellelhető lyuk,
feleakkora lineáris méretben a három, az S ∩ T halmazzal egybevágó részben is megjelenik. Sőt, az egyre kisebb átmérőjű,
a Sierpinski-háromszöggel hasonló részeken, egyre kisebb méretekben, újra és újra felbukkannak.
Gondolkodjunk el a következő furcsaságon. Ha egy kétdimenziós halmaz (például háromszög) lineárisan r-szeresre
változik, akkor a halmaz mértéke (területe) r2-szeres lesz; az egydimenziós halmaz mértéke (a hossza) pedig r-szeres.
A Sierpinski-háromszög, amint az ábrákból is leolvasható, három feleakkora átmérőjű Sierpinski-háromszög uniója.
Ezért azt mondjuk, hogy felére változtatva a Sierpinski-háromszög lineáris méretét, a Sierpinski-háromszög mérete
harmadára változik. Ugyanígy láthatjuk, hogy a Sierpinski-háromszög kilenc negyedakkora átmérőjű Sierpinski-
háromszög uniója.
Azt tapasztaljuk, hogy a Sierpinski-háromszög nem úgy viselkedik, mint egy kétdimenziós halmaz, hiszen ekkor nem
három, hanem négy feleakkora átmérőjű Sierpinski-háromszög uniója lenne. De úgy sem, mint egy egydimenziós halmaz.
Ennek alapján intuitíve azt mondjuk, hogy a Sierpinski-háromszög nem kétdimenziós, mint például egy tömör
háromszöglap, hanem egy és kettő közötti s törtdimenziós.
Mi a törtdimenzió? Milyen információt ad egy halmaz méretére a törtdimenzió? Hol találkozhatunk a „természetben”
törtdimenziósnak tekinthető halmazokkal? Ezekre a kérdésekre fogunk válaszokat kapni a boxdimenzióról szóló
fejezetekben.
2. A Koch-görbe. Induljunk ki a [0, 1] intervallumból! A 22.3a ábrán látható sorozat első eleme („1. iteráció”) egy
törtvonal, amelyet a sorozat generátorának is nevezünk. Itt azt a szabályt ismételjük, hogy az aktuális ábrán

„minden egyenesszakaszt cseréljünk le a megfelelően kicsinyített generátorra”. (22.2)


22.3. ábra

Az egymás után kapott Kn(n = 1, 2, …) törtvonalak hossza ekkor határtalanul növekszik. Valóban, ha az indító

egyenesszakasz hossza egységnyi, akkor a generátor hossza , az F(generátor) hossza , hiszen a „2.
iteráció” úgy jön létre, hogy az „1. iteráció” ábráján minden egyenesszakaszt lecserélünk a generátor egyharmadára.
Ugyanígy belátható, hogy minden egyes lépésnél a kapott törtvonal hossza az előző 4/3-a lesz.
Ezért elég hosszú ideig folytatva az iterációt, vagyis elég sokszor ismételve a (22.2) szabályt, a kapott törtvonal hossza
tetszőlegesen nagy lesz.
Vegyük közelebbről szemügyre azt, hogy mi a végeredménye ennek a szerkesztésnek. A válasz céljából tekintsük a
(zárt) háromszögekből álló { ; n = 1, 2, …} sorozatot a 22.3b ábrán. Ezek egymásba skatulyázott halmazok

és éppúgy, mint a Sierpinski-háromszög esetén, a sorozat

közös részét tekintjük az iteráció végeredményének. Ezt Koch-görbének nevezzük. Abból, hogy és
a háromszögek halmaza „rázsugorodik” a Kn törtvonalakra (*)
arra következtetünk, hogy a Kn; n = 1, 2, ...} és a { ; n = 1, 2,...} ugyanazt a halmazt állítja elő.

Megjegyzés. A (*) állítás a következőket jelenti. minden P* pontjához van a K1 halmaznak olyan P pontja,
amelyek távolsága

amely leolvasható a 22.3b ábrából. Ezután a szerkesztésből következik, hogy minden iterációval ez a távolság a
harmadára változik. Így a minden P* pontjához van a Kn halmaznak olyan P pontja, amelyek távolsága

Amint láttuk, a Koch-görbe egydimenziós mértéke (hossza) tetszőlegesen nagy lehet („végtelen”) és – a { ; n = 1,
2,...} háromszögeiből becsülve – kétdimenziós mértéke (területe) csak nulla lehet, mivel

és ha területe ( ), akkor
vagyis a { ; n = 1, 2,...} sorozatban mindegyik halmaz területe az előző területének kétharmada.
Gondolkodjunk el a következő furcsaságon. Ha egy sima görbét arányosan a harmadára kicsinyítünk, akkor a mérete
(hossza) is a harmadára változik. A Koch-görbénél azt tapasztaljuk, amint a 22.3a ábrából leolvasható, hogy a harmadára
kicsinyített Koch-görbéből (a szürkével fedett részből) négynek az uniója adja ki az eredeti Koch-görbét. Így a Koch-görbe
arányos méretváltozásra (röviden: skálaváltozásra) nem úgy viselkedik, mint egy sima görbe. Ezt a viselkedést is, mint a
Sierpinski-háromszög hasonló viselkedését, tört értékű dimenzióval fogjuk jellemezni.
A 22.3c ábrán a Koch-görbére vezető sorozatot kissé módosítottuk. Az egyenesszakaszokat olykor a 22.3a ábra
generátorának tükörképével helyettesítettük. Ez első ízben a 2. iteráció szürkével fedett részében látható. Ilyen
módosításokkal különböző zegzugos görbék, például tengerpartvonalak modellezhetők, és ez adja az alapot a geodéziában
a fraktálgeometria alkalmazásának.
3. Határtalanul nagyítható faág. A természeti környezetünk is rendelkezhet olyan tulajdonságokkal, mint a
Sierpinski-háromszög vagy a Koch-görbe. Ilyen a már említett zegzugos tengerpart és ilyen lehet egy faág. A 22.4a–b ábrák
azt mutatják, hogyan állítható elő egy faág képe iterációval. Kiindulhatunk egy egyenesszakaszból, és az iterációs szabály,
vagyis az a szabály, amelynek ismétlésével a faág szerkesztése történik, ekkor a következő négy (F1, F2, F3 és F4) szabály
uniója (egyesítése).
F1, F2, F3, F4 négy olyan transzformáció, amelyek az eredeti ábra lineáris méretét a 0,4-szeresére változtatják, majd a
22.4a–b ábrán látható módon, különböző mértékben eltolják, illetve elforgatják. Az F1, F2, F3, F4 transzformációk
uniójának (egyesítésének) ismétlésével alakul ki a faág. A 22.4a ábra részletesen mutatja az első két iterációt abban az
esetben, amikor egy egyenesszakaszból indulunk ki. A 22.4b ábra mutatja a szabály további ismétlésével kapott ábrákat. A
kialakult faágon az egymással hasonló részek árnyékolásával próbáljuk megmutatni az önhasonló jelleget (22.4c ábra).
Dacára annak, hogy a szerkesztés végeredménye alig különböztethető meg egy valódi faágtól, a végeredmény hossza
végtelen. Ugyanis, minden iteráció az előző halmaz 0,4-szeresének négyszeresét egyesíti. Így az egyre reálisabbnak tűnő
faágak hossza egy 1,6 hányadosú geometriai sorozatot alkot, és így tetszőlegesen naggyá válik, ha elég messze megyünk a
sorozatban.

22.4. ábra

A matematika, a mátrixok nyelvén az iterációs szabály megfogalmazása a következő. Legyen

Ekkor az iterációs szabály az, hogy a fenti négy leképezést egymás után alkalmazzuk az aktuális halmazra, majd az így
kapott halmazokat egyesítjük.

22.2. Mátrixok és geometriai transzformációk


Minden 2 × 2 mátrixhoz hozzárendelhetjük a következő geometriai transzformációt (leképezést)
(22.3)

Ha

(22.4)

akkor a (22.3) leképezés az egységnégyzetet egy paralelogrammába viszi, amelynek nem párhuzamos oldalai az

vektorok. Ez pontosan akkor érvényes, ha ezek a vektorok nem párhuzamosak, vagyis lineárisan függetlenek (22.5a ábra).

22.5. ábra

Ezt a következő számolással láthatjuk be

amiből következik, hogy az

bázisvektorokat a mátrix oszlopvektoraiba képezi a (22.3) transzformáció, és az

egyenlőségekből pedig az következik, hogy a (zárt) egységnégyzetet a (zárt) paralelogrammára képezi le a (22.3)
transzformáció. A (22.3) leképezés „hatását” a 22.6. ábrával érzékeltetjük.

22.6. ábra
Példák
1. Az a11 = a, a22 = b diagonális mátrix az egységnégyzetet egy a, b oldalú téglalapba viszi, és az alakzatokon az x
tengely irányában a-szoros, az y tengely irányában b-szeres skálaváltoztatást hajt végre (22.5b ábra).
2.
A mátrix az alakzatokat ø szöggel elforgatja az óramutató járásával megegyező irányban (22.5c
ábra).

A mátrixszorzás asszociatív tulajdonságából következik, hogy mátrixok szorzatához a megfelelő leképezések


kompozíciója tartozik. Például, a

mátrix ø szöggel elforgat az óramutató járásával megegyező irányban, majd ezután r-szeres skálaváltoztatást
(léptékváltoztatást) végez mindkét koordinátatengely irányában.
Legyen

(22.5)

ahol

Ekkor az F : R2 → R2 leképezést a n leképezésnek nevezzük.

22.3. Hasonlósági és kontraktív leképezések, halmazfüggvények


A továbbiakban D az R2 euklideszi tér vagy annak egy részhalmaza, és a függvényeket sokszor leképezésnek vagy
transzformációnak nevezzük. Függvényeink általában a n leképezések lesznek.
Legyen F: D → D, vagyis F egy D halmaz minden pontjához rendelje hozzá ugyanannak a D halmaznak egy (az F
szabállyal) meghatározott pontját. Ekkor F a D halmazon értelmezett függvény. Jelentse d[x, y] az x és y pont távolságát.
Ekkor minden a n leképezéshez van olyan r, hogy

(22.6)

(Mekkora ez az r?)
Számunkra az az eset fontos, amikor r < 1. Ekkor F kontraktív leképezés. Ekkor az F leképezés összehúz, abban az
értelemben, hogy az F(x), F(y) képpontok távolsága mindig kisebb, mint az x, y pontoké (22.7. ábra). Ha a (22.6) formulában
egyenlőség áll, akkor az F függvény neve hasonlósági leképezés.

22.7. ábra

A hasonlósági leképezés fogalmával a geometriai hasonlóság de nícióját a következőképpen adhatjuk meg: két
korlátos halmaz, D és D*, hasonló, ha van olyan F hasonlósági leképezés, hogy a D-beli pontok képeinek a halmaza D*. Ezt
tömören, a matematika nyelvén így fejezzük ki

(22.7)
Példák
1. Egy diagonális mátrixhoz hozzárendelt transzformáció pontosan akkor kontraktív, ha a mátrix elemeinek
abszolút értéke egynél kisebb.
2. Ha egy F a n leképezésben

akkor F hasonlósági leképezés, és pontosan akkor kontraktív, ha r < 1.

Az F(H) a H halmaz képét jelenti az F leképezésben. Pontosabban

(22.8)

Az F függvénnyel adott

leképezést ekkor halmazfüggvénynek is nevezzük.

Példák
1. Legyen F(x) = log x. Ekkor F-et a (22.8) módon halmazfüggvénynek tekintve

és ha D = {1, 2, …, 10}, vagyis D a [0, 10] intervallumban levő egész számok sorozata, akkor

vagyis a logaritmusskála [0, 1]-ben (22.8. ábra).

22.8. ábra

2. Legyen

Ekkor F a (0, 0), (a, 0), (a, a), (0, a) négyzetet a (0, 0,5a), (0,5a, 0,5a), (0,5a, a), (0, a) négyzetbe és az origó középpontú
R sugarú kört a (0, 0,5a) középpontú 0,5R sugarú körbe képezi le (22.9. ábra szürke). Köznapi nyelven szólva, az F
függvény a fenti halmazokat a felére „zsugorítja”, majd a

vektorral eltolja.
22.9. ábra

A fenti példákból is már láthatjuk, hogy a (22.8) halmazfüggvény bevezetésével jobban tudjuk szemléltetni egy-egy
függvény jellegzetességeit, mint az F függvény szokásos alakjával. Az R2 részhalmazai, amelyekre a (22.8) formulával adott
halmazfüggvényeket értelmezzük, korlátos és zárt halmazok. Az R2 korlátos és zárt részhalmazait kompakt halmazoknak
nevezzük.

22.4. Az IFS-modell
IFS, az iterált függvényrendszer angol kifejezésének (iterated function system) a rövidítése. Az IFS-modell egy olyan
eljárás, amellyel egyszerűen állíthatunk elő olyan halmazokat, amelyeket a bevezető három példában bemutattunk. Ez az
eljárás a következő lépésekből áll:
I. Megadunk véges sok kontraktív függvényt, legyenek ezek {Fi; i = 1, 2, …, N}.
II.
Képezzük a függvények unióját. Ezen a következő halmazfüggvényt értjük

III.Végül képezzük a

(22.9)

sorozatot, vagyis egy B halmazra újra meg újra alkalmaztuk a W szabályt. Ellenőrizzük, hogy a bevezető példák ezzel az
eljárással is előállíthatók.
A bevezető példáknál összetettebb, nem hasonlósági, hanem általános a n leképezésekből álló függvényrendszerre a
következő példát adjuk.

A függvényrendszerből képezett (22.9) sorozat látható a 22.10. ábrán, amikor B egy olyan nagy négyzetlap, amelyre
W(B) ⊂ B.
Az IFS invariáns halmaza egy fa képét mutatja. A fát szegélyező paralelogrammák a négyzet képei a beírt Fi
leképezésben. Vegyük észre, hogy a fát szegélyező paralelogrammák uniója a B négyzetlap részhalmaza.
Az IFS-modell eddigi alkalmazásaiban W (B) ⊂ B, és így
(22.10)

22.10. ábra

Ugyanezt a gondolatmenetet ismételve újra meg újra (teljes indukcióval)

(22.11)

Az IFS-modell „végterméke” ekkor

a {W[n] (B); n = 1, 2, …} halmazsorozat közös része.


Minden esetben érvényes (22.11)? Vagyis, az IFS-modellben megszerkesztett

minden esetben egymásba skatulyázott halmazok?


A válasz: igen, ha B elég nagy. A 22.11. ábrából leolvasható, hogy ha

(22.12)

ahol r az F kontraktivitási tényezője, akkor a K körlap elég nagy, amiből

(22.13)

22.11. ábra

A (22.13) összefüggés alapján, ha egy K kör R sugara olyan nagy, hogy az iterált függvényrendszert (IFS) meghatározó
minden Fi függvényre (22.13) fennáll, akkor W(K) ⊂ K. Ebből már következik (22.11) minden olyan B halmazra, amely
tartalmazza a K körlapot.
Nyitva maradt az a probléma, hogy vajon különböző B halmazból indítva, az IFS-modellnek nevezett eljárás ugyanazt
az invariáns halmazt eredményezi-e? Erre a következő olvasmány keretében válaszolunk.
22.5. Olvasmány a halmazok távolságáról
Két ábra távolságát különböző elvek alapján mérhetjük meg. A számítógépes gra kában is alkalmazott és legcélszerűbb
távolságfogalom arra a formulára épül, amely megadja egy x pont és egy B (nem üres kompakt) halmaz távolságát. Ez a
formula

vagyis d[x, B] annak a b pontnak az x-től mért távolsága, ami a B pontjai közül a legközelebb van x-hez (22.12a ábra).
Példa erre az az eljárás, amikor egy pontnak egyenesszakasztól vagy egy körlaptól mért távolságát megállapítjuk. Ha
megadjuk egy x pontnak és egy B egyenesnek a távolságát, akkor azt a b pontot határozzuk meg az egyenesen, amely a
legközelebb van az x-hez (22.12c ábra). Ha az ismert módon egy x pontnak és egy B zárt körlapnak a távolságát határozzuk
meg, akkor is ezt a b pontot határozzuk meg (22.12b ábra).

22.12. ábra

A pont–halmaz távolságra épülő új fogalom a t-vel növelt B

vagyis B + t azoknak a pontoknak a halmaza, amelyek legfeljebb t távolságra vannak B-től (22.13. ábra).

22.13. ábra

Figyeljük meg, hogy ha K egy r sugarú körlap, akkor a K + t′ halmaz egy r + t′ sugarú körlap, viszont ha N egy négyzet,
akkor a tőle legfeljebb t távolságban levő pontok hamaza nem négyzet.
A B és C nem üres kompakt halmazok (ábrák) h[B, C] (Hausdor ) távolsága az a legkisebb t (22.14. ábra), amelyre

(22.14)
22.14. ábra

A (22.14) formula informális jelentése, amit a 22.14. ábráról is leolvashatunk, hogy a B halmazt addig növeljük, amíg B +
t „éppen elnyeli” a C halmazt, majd ugyanezt tegyük a C halmazzal. A kapott t értékek közül a nagyobbik lesz a B és C
halmazok távolsága.
A Hausdor -távolságnak egy másik, ismertebb, de kevésbé szemléletes meghatározása is van, és ez a következő.
Legyen d[B, C] = max {d[x, C]; x ∈ B}. Vagyis, legyen x a B halmaznak az a pontja, amely a legtávolabb van C-től, és d[B, C]
ennek az x pontnak a C-től mért távolsága. Ekkor a d[B, C] és a d[C, B] értékek közül a nagyobbik lesz a h[B, C].
Ellenőrizzük ezt! Melyik egyszerűbb a két de níció közül?

Példák
1. A Sierpinski-háromszögre vezető sorozat elemei közötti távolság (22.15. ábra). A B négyzet és a W(B) közötti
távolság 0,5a, és ezután a sorozat két egymás után következő eleme közötti távolság egyre csökken, mégpedig
mindig az előzőnek a fele lesz. Így h[W[n] (B), W[n + 1](B)] ≤ 0,5n + 1 a.
Ebből az is következik, hogy bármilyen kis ϵ > 0-t is veszünk, A + ϵ, az ϵ-nal növelt A, tartalmazni fogja a W[n] (B)
halmazokat valamely n-től kezdve. (Miért?)

22.15. ábra

Most legyen ϵ az a méret, amelynél kisebb átmérőjű halmazt nem tudunk észrevenni. (Ennek oka lehet az, hogy a
szemünk felbontóképességének ez a határa, vagy a számítógép képernyőjén, ahol a halmazokat megjelenítjük,
nem lehet ennél közelebbi pontokat megkülönböztetni stb.) Ekkor, ha n olyan nagy, hogy 0,5na < ϵ, akkor az n + 1-
edik elemtől kezdve a

sorozat elemei nem különböztethetők meg egymástól, és így a Sierpinski-háromszögtől sem, amit ez az IFS
előállít.
Megjegyzés. A

(22.15)

halmazok az IFS A „végtermékének” egyre pontosabb közelítései. Az IFS-ábrákon a (22.15) mint egymást követő
pillanatfelvételek sorozata jelenik meg.
2. A Koch-görbére vezető sorozat elemei közötti távolság (22.3b ábra). Ekkor a B háromszög és a W(B) közötti

távolság (az ábrán közötti távolság) a sorozat két egymás után következő eleme közötti távolság
egyre csökken, mégpedig mindig az előzőnek a harmada lesz. Így

(22.16)
Ebből az is következik, hogy bármilyen kis ϵ > 0-t is veszünk, A + ϵ, az ϵ-nal növelt A, tartalmazni fogja a W[n](B)
halmazokat valamely n-től kezdve. (Miért?) Hasonlóan, mint a Sierpinski-háromszögnél, a (22.16)
egyenlőtlenségből megállapíthatjuk, hogy hányadik iteráció után lesz W[n](B) gyakorlatilag azonos a Koch-
görbével.

A h[B, C] értéket két okból tekinthetjük a B és C távolságának. Az egyik az, hogy megegyezik a vizuális tapasztalattal.
Ha a halmazok (ábrák) h távolsága kicsi, akkor alig tudjuk a halmazokat megkülönböztetni egymástól. A másik ok az, hogy
h kielégíti az ún. metrikus axiómákat, vagyis a következő alaptulajdonságokat:
I. h[B, C] ≥ 0 és h[B, C] = 0 pontosan akkor, ha B = C (vagyis B és C ugyanaz a halmaz);
II. h[B, C] = h[C, B];
III.bármely A, B, C mellett h[A, B] + h[B, C] ≥ h[A, C].
Ezek közül csupán a III., az ún. háromszög-egyenlőtlenség nem teljesen nyilvánvaló. Ennek bizonyítása a következő.
Legyen h[A, B] = tAB és h[B, C] = tBC. Ez azt jelenti, hogy tAB és tBC az a legkisebb érték, amelyre

Az a) és c) alapján A ⊆ C + tBC + tAB; a b) és d) alapján C ⊆ A + tAB + tBC, ami éppen azt jelenti, hogy h[A, C] ≤ tBC + tAB.
A halmazok távolságára vonatkozó legfontosabb tételek.
1. tétel. Ha {Cn; n = 1, 2,…} nem üres kompakt halmazok sorozata,

akkor

Megjegyzések
1. A nem üres. Ez következik a Cantor-axiómából: egymásba skatulyázott kompakt halmazok közös része nem üres
kompakt halmaz.
2. A h[A, Cn] → 0 állítás, köznapi szóhasználattal, azt jelenti, hogy CN tetszőlegesen közel kerül A-hoz, ha elég
messze megyünk a {Cn; n = 1, 2, …} sorozatban. (Ez nem ugyanaz, mint ha azt mondjuk: „egyre közelebb kerül az
A-hoz.”) Így a tétel állítása megegyezik („harmóniában van”) a vizuális tapasztalattal.

Ebből a tételből következik, hogy az IFS-modell „végterméke” a

sorozat határértéke a Hausdor -távolságban mérve.


2. tétel. Ha F kontraktív függvény r kontraktivitási tényezővel, akkor

(22.17)

Ebből a tételből következik, hogy ha F kontraktív, akkor a (22.8) szerint hozzárendelt halmazfüggvény a Hausdor -
távolságban mérve is kontraktív.
A halmazfüggvényekkel történő számolásokkal kapcsolatban fontos a következő
3. tétel.

(22.18)

vagyis a Bi, illetve Ci halmazok uniója közötti távolság legfeljebb akkora, mint a h(Bi, Ci) távolságok közül a legnagyobb.
Az 1–3. tételek bizonyítása túlnő ennek a fraktálokról szóló fejezetnek a keretein.

22.6. Az IFS-modell tulajdonságai


A halmazok távolságával már pontosan leírhatók a fraktálokat előállító IFS-modell tulajdonságai.
1. tétel. Ha {Fi;, i = 1, 2, …, N} kontraktív függvények, akkor a

(22.19)

sorozat konvergens (a Hausdor -metrikában), és a határértéke, A, független B-től. Ekkor is

Bizonyítás. Azt kell csak belátni, hogy bármilyen kompakt B esetén, az elég nagy K körlap választása mellett kapott A a
(22.19) határértéke.
Legyen B ≠ K. A (22.17) és (22.18) alapján

(22.20)

ahol r = max{ri; i = 1, 2,…, N}. A (22.20)-ból teljes indukcióval

Ezért, r < 1 esetén, W[n] (B) és W[n] (K) tetszőlegesen közel kerül egymáshoz, ha n elég nagy, és így a {W[n] (B); n = 1, 2,…}
és a {W[n] (K); n = 1, 2, …} sorozatoknak ugyanaz a határértéke.
2. tétel. Ha A az {Fi; i = 1, 2, …, N} leképezésekkel (függvényekkel) meghatározott IFS invariáns halmaza, vagyis W[n] (B)
→ A, akkor

(22.21)

Bizonyítás. Ekkor

(22.22)

hiszen a részsorozat ugyanoda tart. Másrészt

(22.23)

mivel W[n + 1] (B) = W ○ W[n] (B), és W folytonos (mivel kontraktív). A (22.22) és a (22.23) összehasonlításából következik
(22.21).
3. tétel. Minden IFS-hez pontosan egy invariáns halmaz tartozik.
Bizonyítás. Legyen a W kontraktív,

(22.24)

(22.25)

A (22.24) és (22.25) összefüggés összehasonlításából h[A, B] ≤ rh [A, B], ami csak h[A, B] = 0 esetben állhat fenn, és így A =
B.
A (22.19) összefüggés a háttere annak, hogy ha a

sorozat konvergens, és az A határérték független a B megválasztásától, akkor az A kompakt halmazt az IFS attraktorának
vagy invariáns halmazának nevezzük.

22.7. IFS-modell és önhasonlóság


Azokat a halmazokat, amelyeket az IFS-modellel előállítottunk, általában az jellemzi, hogy bonyolult szerkezetűek
(complex structure), viszont nagyon kevés, N × 6 adattal meghatározhatók, és igen egyszerű szabály ismétlésével gyorsan
előállíthatók.
Bonyolult szerkezeten itt azt értjük, hogy nagyításkor egyre több részlet válik láthatóvá. Ezt a jelenséget úgy is
megfogalmazhatjuk, hogy ezek a halmazok határtalanul nagyíthatók. A legegyszerűbb határtalanul nagyítható halmazok
az önhasonló halmazok.
A (22.21) részletesen kiírva

(22.26)

ami azt jelenti, hogy ha {Fi; i = 1, 2,…, N} hasonlósági leképezések, akkor az A halmaz az A arányosan kicsinyített
másolataiból van összerakva. Pontosabban,
az A halmaz az A-val hasonló halmazok uniója.
A (22.26) egyenlőséget kielégítő A halmazt önhasonlónak (self-similar) nevezzük.

Példák
1. A Sierpinski-háromszög három, a Sierpinski-háromszöggel hasonló halmaz uniója, amelyeknek a lineáris mérete
feleakkora, mint a Sierpinski-háromszög.
2. A 22.16. ábra önhasonló halmaza, amit csillárnak nevezünk, öt vele hasonló halmaz uniója, különböző
hasonlósági tényezőkkel: r1 = 0,6, ri = 0,2 (i = 2, 3, 4, 5).

22.16. ábra

22.8. Önhasonló halmazok szerkezete és a „valóság”


Ha tüzetesebben megvizsgáljuk az önhasonló halmazokat, akkor nagyon kis átmérőjű, az A-val hasonló halmazok légióját
fedezhetjük fel bennük.
Tekintsük például a Sierpinski-háromszöget! A bevezető példákban már megállapítottuk, hogy az három, fele
átmérőjű Sierpinski-háromszög uniója. Ám a fele átmérőjű Sierpinski-háromszögek mindegyikére is fennáll ez. Így az
eredeti Sierpinski-háromszög előáll kilenc negyedakkora átmérőjű Sierpinski-háromszög uniójaként.
Tovább folytatva ezt a gondolatmenetet, (teljes indukcióval) belátható, hogy minden pozitív egész n-re, a Sierpinski-
háromszög 3n olyan Sierpinski-háromszög uniója, amelyek mindegyikének az átmérője az eredeti Sierpinski-háromszög

része.
A vázolt gondolatmenetből több is következik, mint amit szemléletből megállapíthatunk. A Sierpinski-háromszögben
tetszőlegesen kis átmérőjű Sierpinski-háromszögek vannak, és ezek uniójaként is előáll a Sierpinski-háromszög. Ugyanez
mondható minden önhasonló halmazról, csupán az arányossági tényezők lesznek mások. Például, a Koch-görbénél az
átmérők a felezések helyett harmadakkorák lesznek, és mindig négy kisebb Koch-görbe adja a nagyobbikat. A csillárnál
felváltva 0,25 és 0,5 arányossági tényezőket alkalmazunk.
A Sierpinski-háromszög, a Koch-görbe és a csillár fent vázolt tulajdonságát határtalanul nagyíthatónak nevezzük.
Bebizonyítható, hogy minden önhasonló halmaz határtalanul nagyítható.
A 22.7. fejezetben megmutattuk, hogy ha {Fi; i = 1, 2, …, N} hasonlósági leképezések, akkor az IFS-modellel előállott
halmazok önhasonlók. Ennek a megfordítása is igaz: minden önhasonló halmazt IFS-modellel állíthatunk elő. (Ennek
bizonyítása: mivel {Fi; i = 1, 2, …, N} kontraktív leképezések, ezért van olyan kompakt halmaz, legyen ez C, amelyre W[n] (B)
→ C, és a C független B-től. Ám a 22.6. fejezetben mondottak alapján ekkor C a W invariáns halmaza, és minden W-nek
pontosan egy invariáns halmaza van. Ezért C = A.)
Vegyük észre, hogy a 22.7. és a 22.8. fejezetben mondottak minden IFS-modellre érvényesek, nemcsak azokra, ahol {Fi;
i = 1, 2, …, N} hasonlósági leképezések. Ha {Fi; i = 1, 2, …, N} (nem önhasonló) a n leképezések, akkor az A halmazt
öna nnak nevezzük.
Például a fa (22.17. ábra) és a páfrány (22.18. ábra) szemmel láthatóan is nem önhasonló. Ugyanis a 22.17. ábrán az F1 az
egységnégyzetet a (0,195, 0,344), –0,488, 0,443) vektorokkal adott paralelogrammába képezi le, és az Fi (i = 2, 3, 4, 5)
leképezések is nem négyzetbe, hanem egy általános paralelogrammába képezik le a négyzeteket.
Az öna n halmazok is határtalanul nagyíthatók, hiszen nagyításkor egyre több részlet bukkan fel a halmazban. Ezek a
részletek azonban nem hasonlók A-val, hanem olyan torzulásokon mennek át, mint amikor a négyzetből valamilyen
paralelogramma lesz. Ezért egy öna n halmaz sokkal változatosabb lehet, mint egy önhasonló halmaz.

22.17. ábra

22.18. ábra

Megjegyzések
1. Vannak források, amelyek minden IFS invariáns halmazát önhasonlónak nevezik, függetlenül attól, hogy {Fi; i =
1, 2, …, N} hasonlósági leképezések vagy sem, hiszen bármely kontraktív {Fi; i = 1, 2, …, N} mellett is többé-
kevésbé érvényesek a 22.6–22.8. fejezetben leírt tulajdonságok. Szokásosabb terminológia az A invariáns halmazt
önhasonló jellegűnek (quasi self-similar) nevezni, ha {Fi; i = 1, 2, …, N} nem hasonlósági leképezések.
2. Vannak önhasonló halmazok, amelyeknél nem látjuk a határtalan nagyíthatóság jelenségét. Ilyen például egy
négyzet vagy háromszöglap.

Önhasonló (öna n) halmazokkal a megtévesztésig közelíthetők körülöttünk látható halmazok, amint azt a faág, fa
vagy a csillár példája mutatja. Önhasonló (öna n) halmazok még sincsenek a valóságban, mivel tetszőlegesen kicsi
átmérőjű halmaz sem állítható elő. Ennek határt szab a képernyő vagy más megjelenítő eszköz felbontóképessége. Így
önhasonló halmazok csak tetszőleges pontossággal hozhatók létre (állíthatók elő). Viszont az IFS attraktorai (invariáns
halmazai) önhasonlónak látszanak. Mit jelent ez?
A Sierpinski-háromszög szürkével fedett része a 22.1. ábrán (lineárisan) felére kicsinyített mása a Sierpinski-
háromszögnek. A 22.3a ábrán, a Koch-görbék szürkével fedett részei a Koch-görbével hasonló halmazok. Ugyanez áll az
22.4c ábrán a faág szürkével fedett részeire is.
Alaposabban meg gyelve ezeket az ábrákat azonban észrevehetjük, hogy ez nem egészen így van. A Sierpinski-
háromszög szürke részében kevesebb háromszöget számolhatunk össze, mint magában a Sierpinski-háromszögben, és a
Koch-görbe meg a csillár bekeretezett részei sem az egész A halmaz pontos kicsinyített másai. A felbonthatóság korlátai
miatt a kicsinyített részen bizonyos részletek eltűntek.
Az elmondottak alapján önhasonló halmazok nem léteznek a valóságban, hanem az önhasonló halmaz csupán egy
matematikai modell, amely tetszőleges pontossággal megközelíthető. Mégis szemléltethetjük ezt a következő számítógépes
kísérlettel.
Menjünk el az önhasonló (vagy öna n) A-t előállító {W[n] (B); n = 1, 2, …} sorozatban éppen addig, hogy az egymás után
következő ábrák már ne legyenek megkülönböztethetők egymástól. Ezután nagyítsuk az ábrát úgy, hogy közben az
iterációt is folytatjuk. Ha e két művelet szinkronban van, akkor a felnagyított ábrákat egyformán részletdúsnak látjuk,
ellentétben egy papírfénykép nagyításával, ahol a nagyítás során a részletek elveszni látszanak. A kísérlet során azt fogjuk
látni, hogy a nagyításkor az ábra újabb és újabb részletei bukkannak fel. Vagyis mégis látni fogjuk a 22.6–8. fejezetben leírt
tulajdonságokat.

22.9. A fraktáldimenziók
A különböző fraktáldimenziók közül elsősorban a boxdimenziót tárgyaljuk. Ez elemi eszközökkel számítható és a
leggyakrabban alkalmazott fraktáldimenzió. Olyan halmazokon fogjuk bemutatni a boxdimenzió tulajdonságait és
kiszámítását, amelyek szerkezetét tetszőleges nomságú négyzethálók határozzák meg úgy, hogy belőlük, különböző
rekurzív szabállyal, négyzetek sorozatát töröljük. Amint látni fogjuk, ezek a halmazok eléggé változatosak ahhoz, hogy a
boxdimenzió minden problémája bemutatható rajtuk, viszont eléggé szabályosak, hogy bemutatásukhoz a matematikai
analízis és mértékelmélet elkerülhető.
A négyzethálók szerkesztését a 22.19. ábra mutatja be. Az egységnégyzetet a 0, 1, 2, 3 jelekkel látjuk el úgy, ahogy azt a
22.19a ábrán látjuk, majd a következő rekurzív szabállyal folytatjuk. Ha En a sorozat n-edik eleme, akkor az En minden
négyzetét lineárisan felezzük, majd az így kapott négy négyzethez jelsorozatot rendelünk úgy, hogy a felosztás előtti
négyzet C jeléhez, a 22.19c ábra szerint, hozzáfűzzük a 0, 1, 2, 3 jel egyikét. A négyzetekhez rendelt jelsorozatokat kódoknak
fogjuk nevezni.

22.19. ábra

Az eljárás heurisztikus, vizuális háttere. Az eljárással a 0, 1, 2, 3 jelekből alkotott szavak (véges jelsorozatok)
mindegyikét el tudjuk helyezni az egységnégyzeten. A szavak egyre hosszabbak lesznek, a négyzetháló egyre sűrűbb lesz az
eljárás folyamán, és gyorsan eljutunk a megjelenítő eszköz (papír, képernyő stb.) felbonthatóságának a határáig. A
négyzetrács azonban határtalanul nagyítható. Nagyításkor egyre több részlet bukkan fel, és megjelennek az egyre hosszabb
szavakkal kódolható négyzetek. Például a 00122311 kód egy

oldalú négyzet kódja. Egy normál rajzlap méretű négyzeten, sőt az 1280 × 1024 pixelméretű képernyőn csupán néhány
milliméter ennek a négyzetnek az átmérője. A négyzethálót nagyítva nemcsak elhelyezhető a 00122311 kódhoz tartozó
négyzet, hanem újabb, az ennél hosszabb kódokhoz tartozó négyzetek is felbukkannak.
Miután a 0, 1, 2, 3 jelekkel felírható szavakat a leírt módon elhelyeztük az egységnégyzeten, hozzáfoghatunk
törtdimenziós halmazok előállításához. Megadunk egy szót (véges jelsorozatot), amelyet tiltott szónak fogunk nevezni,
majd törlünk minden olyan négyzetet, amelynek kódja tartalmazza a tiltott szót.
1. Első példaként töröljük mindazokat a négyzeteket, amelyek kódjában a 3 szerepel. Ez például a 22.20. ábrán
szemléltetett rekurzív eljárással végezhető el. A rekurzív szabály ekkor az lesz, hogy minden lépés után, a lineáris felezéssel
kapott négy négyzet közül pontosan egyet (a lineáris felezés után kapott jobb felső négyzetet) töröljük. Ugyanis, a rekurzív
lépéssel kapott négy négyzet közül pontosan ennek a kódja tartalmaz 3 jelet.
22.20. ábra

A 3 jelet tartalmazó összes négyzet törlésével kapott részhalmaz, a Sierpinski-háromszög területe csak 0 lehet. Ugyanis
a rekurzív szabállyal kapott négy új négyzet közül pontosan egy olyan van, amelynek kódja tartalmazza a 3 jelet. Ezért
minden lépésben, a 3 jelet tartalmazó négyzetek törlése után megmaradó halmaz területe az előző háromnegyede lesz.
A szerkesztés során kapott sokszögek kerülete egyre növekszik, mindegyik közelítés kerülete az előzőnek legalább
másfélszerese (22.20. ábra). Ezért minden M pozitív számhoz van n, hogy az n-edik rekurzív lépés után kapott sokszögek
összkerülete nagyobb, mint M. A Sierpinski-háromszög méretére vonatkozó megállapításainkat röviden így fejezzük ki

(22.27)

2. Most töröljük az összes olyan négyzetet, amelyek kódjában egy megadott kétjegyű szám szerepel. Legyen ez például
20. A 22.21. ábrán láthatjuk ezt a rekurzív folyamatot. A szürke halmazok azoknak a négyzeteknek az uniója, amelyek kódja
tartalmazza a 20 jelet. Ellentétben a Sierpinski-háromszög esetével, itt már nem annyira nyilvánvaló, hogy a négyzetek
törlése után mennyi lesz a megmaradó halmaz területe.

22.21. ábra

Hogyan oldottunk meg hasonló problémát az előző példa, a Sierpinski-háromszög esetében? Az előző példában az
egyre hosszabb szavak törlése után megmaradó halmazok területei geometriai sorozatot alkotnak, ahogyan azt a 22.2. ábra
is mutatja, a megfelelő halmazok kerületei viszont nem. Ezt a problémát úgy oldottuk meg, hogy kerületek helyett a
kerületek olyan részeit emeltük ki, amelyek mérőszámai geometriai sorozatot alkotnak (22.20b ábra). Ezek voltak a
vastagított részek.
Próbáljunk itt is hasonló utat követni. Nem az összes olyan négyzetet töröljük, amelynek a kódja tartalmazza a 20 szót,
hanem azoknak csupán egy olyan részhalmazát, amelyek törlése után megmaradó halmazok területei geometriai sorozatot
alkotnak.
A rekurzív szabály páros számú alkalmazásával minden előző négyzet helyére 16 új négyzet kerül, amelyek közül
pontosan egy olyan van, amelynek kódja 20-ra végződik. Így a 20-ra végződő kódokhoz tartozó négyzetek törlésével,
minden páros számú lépés után, a megmaradó halmaz területe az előző halmaz területének tizenöt tizenhatod része lesz

(22.22. ábra). Így a megmaradó halmazok területei egy hányadosú geometriai sorozatot alkotnak. Ebből következik,
pontosan úgy, ahogy a Sierpinski-háromszögnél, hogy az eljárás végén megmaradó halmaz területe, azaz annak a
halmaznak a területe, ami azután marad az egységnégyzetből, miután mindazokat a négyzeteket töröltük, amelyeknek a
kódja páros hosszúságú és 20-ra végződik, csak 0 lehet.

22.22. ábra

A kerület hosszának vizsgálatánál is ugyanígy járhatunk el. A szerkesztés során kapott sokszögek kerületének
vastagított részei tizenöt negyedszeresen növekednek (22.22. ábra). Így akármilyen nagy pozitív számot mondunk, elég sok
rekurzív lépés után, a kapott sokszögek összkerülete ennél is nagyobbá válik. Ezért a „a terület 0, a kerület ∞” tulajdonság
itt is érvényes. Ez a tulajdonság akkor is érvényes, amikor azt a halmazt tekintjük, amely akkor marad meg az
egységnégyzetből, ha az összes 20 jelet tartalmazó négyzetet töröljük. Hiszen több négyzet törlésével a kapott halmaz
területe csökken, és kerülete pedig növekszik.
A (22.27) heurisztikus, vizuális háttere. A 20 kód (szó) törlésével kapott halmaz is határtalanul nagyítható. Ha a
halmazból kezdetben csupán a legfeljebb hat hosszú szóval kódolt négyzetek láthatók, akkor nagyításkor előbukkannak az
egyre hosszabb kódokhoz tartozó négyzetek is, mellettük a törölt négyzetek helyén támadt lyukakkal. Egyre több ilyen lyuk
bukkan elő, rohamosan csökkenő átmérőkkel. Ebből a képből alakulhat ki az a sejtés, amit a fentiekkel igazoltunk, hogy a
terület csakis nulla lehet, dacára a halmaz látszólag nagy kiterjedésének.
3. A 22.23. ábrán az egységnégyzet különböző részhalmazait látjuk, amelyek úgy keletkeztek, hogy töröltük
mindazokat a négyzeteket, amelyek kódja azokat az egy vagy több kétjegyű számokat tartalmazza, amelyek a halmaz képe
alatt láthatók.
(A link honlapomon található „Fractalshift” szoftverrel tömegesen gyárthatók ilyen mintázatok.)

Megjegyzés. A „Fractalshift” kódolása különbözik a 22.19. ábra kódolásától. A 22.20a ábrán 0123 helyett 2031 áll.
Ezután a rekurzív szabály ezekkel a jelekkel folytatódik.

22.23. ábra

Feladatok
1. Igaz-e, hogy a 22.23. ábra (világos) halmazainak a területe is csak nulla lehet?
2. Töröljük mindazokat a négyzeteket a négyzethálókból, amelyek kódjában 33 áll. Mennyi lehet ekkor a kódolt
négyzethálók közös részének a területe?
3. Töröljük mindazokat a négyzeteket a négyzethálókból, amelyek kódjában 3333333 áll (hét darab 3 jel követi
egymást). Mennyi lehet ekkor a kódolt négyzethálók közös részének a területe?
4. Van-e olyan szó, amelynek az a tulajdonsága, hogy törölve minden olyan négyzetet, amelynek kódja ezt a szót
tartalmazza, pozitív területű halmaz marad az egységnégyzetből? Ha igen, akkor adjunk meg ilyen szavakat.

Megmutattuk, hogy a tiltott kódokhoz tartozó négyzetek törlésével nulla területű halmazokat kapunk, pedig ezek a
halmazok nagyon különböző kiterjedésűek, különböző méretűnek látszanak (22.23. ábra). Hogyan lehet méret szerint
megkülönböztetni az ilyen halmazokat?

22.10. A hatványszabály (power law)


Legyen r = 2–n (n = 1, 2, …) és Nr azoknak az r élű négyzeteknek a száma, amelyek a megadott jelet (vagy jeleket) tartalmazó,
r élű négyzetek törlése után maradnak az egységnégyzetben. Az (Nr, r) értékpárok határozzák meg a szóban forgó
halmazok területét. Ugyanis

a szóban forgó halmazok területének a közelítő értéke. Ez az érték annál pontosabb, minél kisebb az r. Esetünkben ez a
képlet csődöt mondott, hiszen a legváltozatosabb kiterjedésű halmazokra ugyanazt az értéket, a nullát adja. Mégis, az
intuíciónk azt sugallhatja, hogy további meggondolásainkat erre az értékpárra építsük, hiszen az r élű négyzeteknek az Nr
száma, különböző r értékek mellett szoros kapcsolatban van a szóban forgó halmazok kiterjedésével. Néhány tipikus esetre
megvizsgáljuk az r és az Nr kapcsolatát (22.24. ábra).
Az egyenesszakasz esetén (az egyenesszakasz úgy is szerkeszthető, hogy a 3,0 jelek valamelyikét tartalmazó
négyzeteket töröljük a négyzethálók sorozatában)
ha ,
amely a következő rekurzív formula megoldása

22.24. ábra

Így, a felezésekkel kapott egyre sűrűbb négyzethálóból megmaradó négyzetlapok száma 2, 4, 8, 16, …
A Sierpinski-háromszögnél, amikor a 3 jelet tartalmazó összes négyzetet töröltük, a rekurzív szerkesztésből
következik:

ha

ahol
Ekkor az Nr-hez tartozó rekurzív formula

Így a felezésekkel kapott egyre sűrűbb négyzethálóból megmaradó négyzetlapok száma 3, 9, 27, 81, …
A 20 kódot tartalmazó összes r élű négyzet törlése után megmaradó r élű négyzetek számának a meghatározása az
előzőknél kicsit több megfontolást igényel. Legyen

vagyis legyen az egységnégyzetből az n-edik lépésben törölt négyzetek száma. Ekkor

Ugyanis feleakkora élű négyzetekben mérve, az eddig törölt négyzetek száma négyszeres lesz, amihez hozzájönnek
azok a négyzetek, amelyek éle r = 2–n, kódja 20-ra végződik, és egyetlen 20 jelet tartalmaznak. Ez utóbbiak száma pontosan
. Könnyen ellenőrizhető, hogy az eddig törölt négyzetek és azok a négyzetek, amelyek éle r = 2–n, kódja 20-ra
végződik, és egyetlen 20 jelet tartalmaznak, diszjunkt halmazok, és uniójuk minden olyan négyzetet tartalmaz, amelyek
kódjában a 20 jel szerepel.
A mondottak alapján a 20 jelet tartalmazó összes r élű négyzet törlése után megmaradó r élű négyzetek számára a
következő rekurzív formulát kapjuk

(22.28)

ahol a megmaradó négyzetek száma, amikor r = 2–n.


Így a felezésekkel kapott egyre sűrűbb négyzethálóból megmaradó négyzetlapok száma 4, 15, 56, 208, …

Megjegyzés. A (22.28) formulában azért indulunk az kezdő feltételből (az helyett), mert a 20 n = 2-nél
bukkan fel először.

Érdemes még az egész négyzetlapra is megvizsgálni az r és az Nr kapcsolatot. Valószínűleg nem igényelnek


magyarázatot a következők:

Így ekkor az Nr-hez tartozó rekurzív formula

Az Nr értékek sorozata azt mutatja, hogy dacára annak, hogy minden bemutatott halmaz területe csak nulla lehet, az r
élű négyzetek száma különbözik egymástól a bemutatott halmazoknál. Az Nr értékek sorozata gyorsabban növekszik
akkor, amikor nagyobbnak látjuk az egyformán nulla területű halmazt. Pontosabban, a halmaz területét egyre jobban
közelítő Nrr2 értékek a nullához közelednek mindhárom halmazban, ezért mindhárom halmaz területe csak nulla lehet.
Adott r értékre viszont a területük közelítő értéke egymástól különböző, nagyobb akkor, ha a halmaz nagyobbnak látszik.

Feladatok
1. Adjunk meg rekurzív formulát a 33 tiltott szóhoz tartozó {Nr; r = 2–n, n = 1, 2, …} sorozatra!
2. Adjuk meg azokat a σ tiltott szavakat, amelyekhez tartozó halmazok {Nr; r = 2–n, n = 1, 2, …} sorozata megegyezik a
20 tiltott szóhoz tartozó sorozattal, vagyis (22.28)-cal!
3. Töröljünk a négyzethálókból minden olyan négyzetet, amelynek kódja tartalmazza a 3333333 szót (ahol hét darab
3 jel követi egymást)! Adjunk meg rekurzív formulát az {Nr; r = 2–n, n = 1, 2, …} sorozatra!

22.11. A boxdimenzió
A tárgyalt halmazok méretét jellemző {Nr; r = 2–n, n = 1, 2, …} sorozat elemei, az egyenesszakasz, a Sierpinski-háromszög és
a négyzetlap esetén, a rekurzív formula mellett, egyetlen hatványfüggvénnyel is jellemezhetők. Azt kaptuk, hogy

ahol s = 1 az egyenesszakasz, s = 1,5849… a Sierpinski-háromszög, s = 2 a négyzetlap esetén.


Vizsgáljuk meg, hogy a 20 tiltott szóhoz tartozó halmaz méretét jellemző {Nr; r = 2–n, n = 1, 2, …} is jellemezhető-e egy
hatványfüggvénnyel?
Behelyettesítve az r–s (r = 2–n) formulát (22.28)-ba, a megfelelő egyszerűsítések után kapjuk

aminek két megoldása van

Sajnos, ezek egyike sem jó megoldás, hiszen ezekkel felírva a rekurzív sorozat első két elemét, azok

lesznek.
Észrevétel. Bármely α, β számpárra

is megoldása (22.28)-nak.
Ezt az észrevételt alkalmazva, keressük azt az α, β számpárt, amelyre

(22.29)

és a (22.29) egyenletrendszernek pontosan egy α, β megoldása van. Továbbá, nagy n-re a 0,268n tag elenyészik. Például n ≥ 16
esetén 0,268n < 10–9.
Arra az eredményre jutottunk, hogy az {Nr; r = 2–n, n = 1, 2, …} sorozat, a 20 tiltott szóhoz tartozó halmaz esetén, nagy n
értékekre (vagyis elég sűrű négyzetrács esetére) egyetlen hatványfüggvénnyel jellemezhető:

jó közelítéssel. (32 × 32 hálózat esetén az eltérés kisebb, mint egy ezred, 128 × 128 hálózat esetén az eltérés kisebb, mint
tízezred, egységnek véve a négyzet oldalát.)
Mindhárom példánkban az {Nr; r = 2–n,, n = 1, 2, …} növekedése egyetlen nem negatív számmal, az s boxdimenzióval
jellemezhető.
Azt a tulajdonságot, hogy
ha r elég kicsi, hatványszabálynak és az s értéket a halmaz boxdimenziójának nevezzük.

Feladat. Adjuk meg az egységnégyzetnek a 33 tiltott szóhoz és adjuk meg a 3333333 tiltott szóhoz tartozó
részhalmazainak a boxdimemzióját!

22.12. Mit mér a boxdimenzió?


Az elmondottakból következik, hogy az s boxdimenzió az Nr → ∞ sebességét méri. Pontosabban, egy eléggé sűrű
négyzetrácsból, nagyobb s boxdimenzió mellett, több négyzet szükséges a halmaz lefedéséhez, mint kisebb s mellett.
Nagyobb s esetén Nr rohamosabban növekszik, ha r közeledik a nullához, mint kisebb s esetén. Ez akkor is érvényes, ha a
halmazok területe nulla.
Egy kevésbé matematikus válasz arra, hogy mit mér a boxdimenzió. Egy halmazt adott felbontás mellett tudunk csak
meg gyelni. A számítógép képernyőjén megjelenő kép meg gyelésének a képernyő pixelmérete, egy „valóságos” tárgy
meg gyelésének pedig a szemünk felbontóképessége szab határt. Legyen h átmérőjű az a legkisebb objektum, amelyet
meg gyelni tudunk. Ez a nullához nagyon közeli érték. Így az elmondottak alapján nagyobb s mellett több lesz a halmazt
lefedő h élű négyzetek Nh száma, és így több ilyen négyzetet tudunk meg gyelni, mint kisebb s boxdimenzió esetén. Így
valóban nagyobbnak látjuk a halmazt. Ez akkor is érvényes, amikor s < 2, vagyis a halmaz területe nulla. Ezzel méret szerint
is különbséget tudunk tenni olyan halmazok között is, amelyek mindegyikének területe nulla.
Figyeljük meg, hogy az Nr → ∞ sebességének mérésére a következő, egyre nomodó eljárások vannak.
Az első lépés: az leszámolása. (Ehhez még rekurzív összefüggés sem kell.)
A második lépés: a rekurzív formula. Ezzel olyan nagy k értékekre is számítható amelyek már nem is láthatók
(például 2–10 = 0,00097… élű négyzethálóra).
A harmadik lépés: a rekurzív formula „megoldása”. Ez a hatványszabály, amikor egyetlen számmal, az s kitevővel
adjuk meg az

sebességet, amely jellemzi a nulla területű halmaz méretet.

22.13. Tetszőleges halmaz boxdimenziója


A természetben előforduló objektumok hossza, területe vagy térfogata helyett boxdimenziót számolunk, ha azok értéke a
szokásos mértékegységben mérve gyakorlatilag nulla. Ilyen a nagyon barázdált szikla, az elektrolízis folyamán a rézszulfát-
oldatból a katódra rakódott réz, ínséges időket átvészelő baktériumtelep, a tüdőt behálózó érrendszer vagy egy perkolációs
folyamat végeredménye, amilyenné egy porózus anyag válhat, víz behatolása esetén.
Csupán síkbeli alakzatok mérését mutatjuk be. Térbeli alakzatok mérése ugyanígy történik térbeli négyzetrácsot
használva. Egy r élű négyzetrácsot fektetünk a halmazra, és töröljük a négyzetrács azon elemeit, amelyeknek a halmazzal
való közös része (metszete) üres. Az így kapott (pl. r = 2–n, n = 1, 2, …) négyzetháló-sorozatból határozzuk meg az s
boxdimenziót, ekkor is az

(22.30)

feltevésre építve.
Éppúgy, mint a négyzethálós halmazoknál, amelyeket a 22.9–12. fejezetekben tárgyaltunk, a halmaz méretét az s kitevő
jellemzi. Ezt kétféle módon határozhatjuk meg.
1. gra kus eljárás. Egy törtkitevőjű hatványfüggvény gra konja és vizsgálata és így az s meghatározása bonyolultnak
látszik. A probléma megoldása arra az ötletre épül, hogy ha Nr ≈ αrs, akkor

(22.31)

Vagyis a
(22.32)

pontok egy s iránytangensű egyenesen vannak (22.25. ábra).

22.25. ábra

Az elmondottak alapján az s boxdimenzió a (22.32) pontok által adott egyenes iránytangense (meredeksége).

Megjegyzés. Amint azt a 22.10–11. fejezetben láttuk, a (22.32) pontok sokszor csak közelítőleg és kis r értékekre
illeszkednek az s meredekségű egyenesre. Ezért kell több pont az egyenes meghatározásához és a (22.32) pontokhoz
tartozó regressziós egyenest vesszük, vagyis azt az egyenest, amelytől a (22.32) pontok négyzetes eltérése minimális
(22.25. ábra).

2. s számítása határértékkel. A (22.31) alapján

amiből

(22.33)

A boxdimenzió de níciója. Fedjük le a B halmazt legfeljebb r átmérőjű halmazokkal. Ez azt jelenti, hogy vegyünk
olyan Hk (k = 1, 2, …, N) halmazokat, amelyek átmérője legfeljebb r, és

Minden r-hez nyilván van olyan lefedése B-nek, amely a legkevesebb halmazból áll. Ezt minimális r-lefedésnek
nevezzük.
Legyen halmaz minimális r-lefedése. Ekkor a B halmaz boxdimenziója (capacity dimension, box-counting
dimension)

(22.34)

amennyiben ez a határérték létezik. A boxdimenziót Minkovski-dimenziónak is nevezik.


A négyzethálós lefedésekből kapott (22.33) formula megadja az s boxdimenziót. Ez abból következik, hogy ha egy M
elemű négyzetháló lefedi az r átmérőjű H halmazt, akkor a négyzethálóból legfeljebb M-szer annyi kell a B halmaz
lefedéséhez, mint a H halmazokból. A 22.26. ábra alapján, az r élű négyzethálóhoz M = 9 már elegendő. Ezt a következő
egyenlőtlenségek fejezik ki

(22.35)

22.26. ábra

Annak bizonyítása, hogy (22.33) és (22.34) eredménye ugyanaz. A (22.35) alapján

és a két szélső határérték megegyezik („rendőrelv”)

Egy tetszőleges halmaz boxdimenziójának meghatározásánál vegyük észre a következőket.


I. A valóságban minden objektum háromdimenziós. Például, ceruzával akármilyen kis pontot vagy akármilyen vékony
vonalat rajzolva, gra tcsomót kapunk. Olyan négyzetháló, ahol r értéke túlságosan nagy, nem érzékeli a lyukacsosságot.
Ezért egy „valóságos” halmaz csupán bizonyos skálákon mérve törtdimenziós. Ez azt jelenti, hogy a (–log ri, log Nr); i = 1, 2,
…, n pontok csak egy bizonyos szakaszon vannak az s iránytangensű egyenesen. Akkor mondjuk a halmazt
törtdimenziósnak, ha ez a szakasz a szokásos mérési határokat kitölti.
II. A gra kus eljárásnál ugyanazt az eredményt kapjuk, ha (r, Nr) pontokat tekintjük egy log log koordináta-
rendszerben.

22.14. Fraktáldimenzió a geodéziában


A geodéziában szokásos eljárás egy partvonal (vagy egy folyó hosszának) mérésére, hogy egymástól ugyanakkora d
távolságban pontokat (ún. mérési sarokpontokat) jelölnek ki a partvonal mentén (22.27. ábra). Legyen az így kijelölt pontok
száma M(d) + 1. Ekkor a partvonal közelítő hosszának az

(22.36)

értéket tekinthetjük. Ezt a mérési sokszög hosszának nevezik. Nagyon zegzugos partvonalak esetén, mint amilyen például
Norvégia vagy Izland partvonala, vagy egy zegzugos folyó, a mérési sokszög hosszával nem kapható meg a partvonal hossza
megfelelő pontossággal. Ennek oka egyrészt az, hogy a méréseknél felvehető ugyanazon d távolságban, de különböző
helyeken kijelölve ezeket a mérési pontokat az (1) értékek lényegesen eltérnek egymástól, ha a partvonal nagyon zegzugos,
másrészt, ekkor a d csökkentésével a mérési sokszög hossza lényegesen
22.27. ábra

megváltozik. Így a mérési sokszög hossza nem ad kellő tájékoztatást a partvonal hosszáról (22.27. ábra). Ebben az esetben,
ha a mérési sokszög hossza mellett a görbe egy fraktáldimenzióját is feltüntetjük, akkor felvilágosítást adunk a mérés
pontosságáról is.
A görbének ez a fraktáldimenziója, amit kompasz- (tájoló) dimenziónak nevezünk, hasonlóan épül fel az L(d), d párra,
mint ahogyan a boxdimenzió az Nr, r párra. Itt az az észrevétel, hogy a (log M(d), log d) pontok (közelítőleg) egy egyenesen
vannak. Az egyenes meredeksége a görbe dimenziója.
A dimenzió megállapításának a legegyszerűbb módja, hogy különböző d1 és d2 mellett meghatározzuk a hozzájuk
tartozó mérési sokszögek L(d1) és L(d2) hosszát. Összevetjük a sokszögek éleinek a csökkenését a hozzájuk tartozó ívhossz
növekedésével. Pontosabban a

(22.37)

számítjuk a mért d1, d2 párra.


A (22.37) a következővel egyenlő

ami a (–log d, log M(d)) pontokkal meghatározott egyenes h iránytangense, vagyis a görbe dimenziója.

Megjegyzés. A (23.37) a mérési sokszögek hosszának a relatív növekedését adja, ami gazdagabb információ, mintha
csupán az L(d1) és L(d2) hányadosát adjuk meg, hiszen tekintetbe veszi azt is, hogy a d milyen változásához tartozik a
növekedés. A logaritmus bevetését a hatványszabály indokolja.

Térképek készítésénél a következő szerepe lehet a kompaszdimenziónak. Ha egy kisebb léptékű térkép alapján egy
nagyobb léptékűt készítünk, akkor a térkép vonalai „megrövidülnek”. Rövid, éles kanyarok a folyókon vagy egy partvonal
kisméretű öblei eltűnhetnek a nagyobb léptékű térképen. A vonalhossz megváltozásának a mértékét ekkor a
kompaszdimenzió adja, és a térképszerkesztés jóságának egyik paramétere, hogy a szerkesztés során mennyire változik
meg a görbék dimenziója.
23. Kombinatorika
A kombinatorika a matematika viszonylag atal és gyorsan fejlődő területeihez tartozik, akárcsak a gráfelmélet, illetve a
kódelmélet, valamint a valószínűség-számítás és a statisztika is. Gyökerei azért régre nyúlnak vissza, csak szisztematikus
tárgyalása és felhasználása legújabb kori. Szokás az úgynevezett véges matematikához sorolni, mivel nem végtelen
halmazokkal foglalkozik, mint az analízis, a geometria és legtöbbször az algebra. Azonban szinte minden matematikai
területen felbukkan, mint például a kombinatorikus geometria, számelmélet, topológia vagy például a kombinatorikus
halmazelmélet. Általánosan megfogalmazva: a kombinatorika véges halmazok bizonyos tulajdonságú elrendezései
számosságának a meghatározásával foglalkozik. A következő alfejezetben a legegyszerűbb, középiskolában megismert
esetekkel foglalkozunk, s később fogunk egyes összetettebb eseteket tárgyalni, természetesen csak a legalapvetőbbeket,
illetve néhány más területen történő alkalmazást.

23.1. Egyszerű sorba rendezési és kiválasztási problémák


23.2. Egyszerű sorba rendezési és leszámolási feladatok ismétlődő elemekkel
23.3. A kombinatorika alkalmazásai, összetettebb leszámlálásos problémák
23.4. A kombinatorikus geometria elemei

23.1. Egyszerű sorba rendezési és kiválasztási problémák


Az egyik egyszerű kombinatorikai alapfeladat egy halmaz elemei különböző sorba rendezéseinek számát meghatározni.
Nézzünk egy könnyű feladatot!

Példa. Az angol betűkészlet első három betűjéből (a, b, c) hány hárombetűs különböző betűsorozat képezhető. Ilyen
kis elemszámú esetben a megoldást a lehetőségek szisztematikus felsorolásával is elvégezhetjük. Az első helyen lehet
az a, a b, illetve a c betű bármelyike. Rögzítsük le az a-t. Ekkor a második helyre kerülhet a b vagy a c. Azaz két
lehetőségünk van a-val kezdeni: abc, illetve acb. Mivel ez hasonló a b-vel, illetve a c-vel kezdés esetén, ezért összesen
3 · 2 = 6 lehetőségünk van. Felsorolva: abc, acb, bac, bca, cab, cba. Látható, hogy ezek mindegyike más sorozat, és
sehogy másképpen nem lehet a három betűt egymás után felsorolni. Így tehát az esetek száma: 6.

Válasszunk nagyobb elemszámú példát, ahol az összes eset felsorolása már igen sok időt igényelne. Az egyjegyű pozitív
egész számokat hányféleképpen lehet felsorolni? Kilenc elemünk van, az 1, 2, 3,…, 9 számok. Ezeket kellene sorba rendezni.
Az előző példa ad egy rekurzív gondolatot. Az első helyre 9-féleképpen lehet elhelyezni számot. Ha ebből egyet
kiválasztunk, akkor a maradék 8 helyre 8 elemet kell sorba rakni, azaz a kilenc elem sorba rendezéseinek számát
megkaphatjuk, ha 9-cel szorozzuk 8 elem sorba rendezéseinek a számát. Ez azonban tovább vihető lefelé, a nyolc elemből 8-
féleképpen lehet az elsőt kiválasztani, s a maradék hét elem sorba rendezéseinek száma marad hátra. Ezt a gondolatot
folytatva végül: 9 · 8 · 7 · … · 2 · 1 lehetőség adódik. Mivel az ilyen számok gyakran előfordulnak a kombinatorikában, egy
szimbólumot vezettek be rá.

Az első n szám szorzatát n!-lel jelöljük, olvasva n faktoriális. Felsoroljuk az első néhány faktoriális értéket: 1 ! = 1, 2 ! = 2,
3 ! = 6, 4 ! = 24, 5 ! = 120, …, 9 ! = 362 880, …

Láthatóan nagyon gyorsan növekszik, majd a későbbiekben látunk egy csak n-től függő becslést n ! konkrét numerikus
értékére. A valószínűség-számításban is fontos szerepet kap majd ez a formula. Az eddigieket összefoglalva bevezetünk egy
új fogalmat.

Egy n elemű halmaz elemeinek egy lehetséges sorrendben való felsorolását permutációnak nevezzük.

Az ilyen permutációk számát jelöli Pn (ahol n az elemszámra utal), és a következő tételt mondhatjuk ki:

Egy n elemű halmaz elemeinek összes lehetséges sorrendjére igaz, hogy Pn = n !

A bizonyítást teljes indukcióval végezzük, n = 1-re nyilván igaz a felírt formula. Tegyük fel, hogy n = k esetén igaz,
akkor belátjuk, hogy n = k + 1 esetén is igaz. Ez utóbbi azonban könnyen adódik, hiszen egy k + 1 elemű halmaz esetén az első
helyre k + 1-féleképpen választhatunk ki egy elemet, s a maradék k helyre a maradék k elemet a feltétel szerint k !-
féleképpen rakhatjuk le. Mivel minden kezdőelemhez k !-féle folytatás van, ezért összesen (k + 1) · k ! = (k + 1) !-féle sorba
rendezés lehetséges. Éppen ezt akartuk belátni. Lehet a tétel konkrét esetben történő illusztrációjára egy fát (lásd a 24.2.
fejezetben) is rajzolni, amelynek a „tetejétől az utolsó soráig” minden egyes útnak egy permutáció felel meg, s láthatóan az
utak száma 4 ! = 24 (23.1. ábra). A végén levő „leveleket” kell leszámolni. Látszik, hogy minden szinten eggyel kevesebb
elágazás van, így adódik a faktoriális.

23.1. ábra

A másik alapfeladat a kiválasztás. Adott elemszámú halmazból hányféleképpen lehet egy másik adott elemszámú
részhalmazt kiválasztani? Nézzünk erre is először egy egyszerű példát!

Példa. Négy különböző betűből hányféleképpen lehet két betűt kiválasztani? Mint a permutációk esetén, itt is
először készítsünk egy minden esetet éppen egyszer tartalmazó felsorolást. Legyen a négy betű most is az angol
betűkészlet első négy betűje: a, b, c, d! Ebből kettőt kell kiválasztani. Nézzük aszerint, hogy az a betű szerepel-e. Ha
igen, akkor a másik háromból kell egyet kiválasztani, amit nyilván háromféleképpen lehet: b, c vagy d. Ha nem
szerepel a, akkor a maradék háromból kettőt kell kiválasztani, de az ugyanaz, mintha egyet kihagyunk, tehát
háromféleképpen, azaz ez ismét három eset, tehát összesen hatféleképpen. A teljes felsorolás a fenti logikával: {a, b};
{a, c}; {a, d}; {b, c}; {b, d}; {c, d}.

Bevezethetünk egy új fogalmat, amely erre a kiválasztásra vonatkozik.

Kombinációnak nevezzük, amikor egy adott elemszámú halmazból adott elemszámú részhalmazokat kell az összes
lehetséges módon kiválasztani. A két paraméter a halmaz elemszáma, illetve a részhalmaz elemszáma. Jelölése:

elem k-ad osztályú kombinációinak száma. Ezt szokás az – kiolvasva n alatt a k – is jelölni.

Mivel éppen ezek a számok alkotják a binomiális tétel megfelelő együtthatóit, szokásos a binomiális együttható
elnevezés is. Mielőtt elkezdenénk a binomiális együtthatók kiszámításával foglalkozni, néhány elemi és fontos
összefüggést írunk fel velük kapcsolatban. A bizonyítások teljesen egyszerűek, egy-két esetben megemlítjük legalább az
alapgondolatot, a többiben az olvasóra bízzuk.

(23.1)

hiszen egy halmazból 0 elemű részhalmazt csak egyféleképpen lehet kiválasztani, s ez az üres halmaz, míg n elemű
részhalmaz is egy van, maga a halmaz. Hasonló okból még egy, értelmesen csak egyféleképpen de niálható eset, az üres
halmazból egyetlen 0 elemű részhalmazt, az üres halmazt lehet kiválasztani. Formálisan

(23.2)

Ez az első összefüggés és a következő rekurzív formula lehetőséget ad bármelyik együttható kiszámítására:

(23.3)

Könnyen látható, hogy ha egy (n + 1) elemű halmazból (k + 1) elemű részhalmazokat kell kiválasztani, akkor ezek
számát egy ügyes ötlettel úgy is leszámolhatjuk, hogy kijelölünk egy elemet az (n + 1)-ből, s azt nézzük, hogy a (k + 1) elemű
részhalmaz tartalmazza-e ezt az elemet. Két lehetőség van. Ha tartalmazza, ebből annyi eset van, ahányféleképpen a
maradék n elemű halmazból k elemű részhalmazokat lehet kiválasztani, hiszen az (n + 1)-edik elem lesz a (k + 1)-edik eleme
a részhalmaznak. Ha nem tartalmazza, akkor a maradék n elemből kell mind a (k + 1) elemet kiválasztani. Ezzel be is láttuk
a rekurzív összefüggést. A gondolat elég általános, és sokszor előfordul a matematikában, különösen a kombinatorikában,
ezért a következőkben megfogalmazzuk. Ha ugyanazt a leszámolást két különböző módon végezzük el, akkor az eredmény
ugyanaz kell hogy legyen. Így mindig azonosságokat kapunk, amiknek a fenti egy egyszerű példája.

(23.4)

Belátása evidens a kiválasztás és a bennmaradás szimmetriája miatt. Ahányféleképpen kiválasztok egy k elemű
részhalmazt, éppen annyiféleképpen hagyok meg egy (n – k) elemű részhalmazt. További összefüggések:

(23.5)

Bizonyítása a fent emlegetett kétféle leszámolási elvvel egyszerűen végiggondolható. A bal oldalon egy (n + k) elemű
halmazból kiválasztható összes l elemű részhalmazok száma áll. Ugyanez van másképp leszámolva a bal oldalon, azzal a
gondolattal, hogy képzeletben szétválasztjuk egy n és egy k elemű részre az eredeti halmazt. Az eredetileg l elemű
részhalmazokat aszerint számoljuk le, hogy hány elemet tartalmaz az n, és hányat a k elemű részből. Ez a gondolat csak
akkor használható, ha teljesül az l ≤ min {n, k} feltétel. Ebből adódik két további összefüggés még, ami jól használható: az
első, ha k = l < n

(23.6a)

egy kicsit ravaszabb átalakítással egy második is, ha k = l = n, akkor

(23.6b)

Ez már nem egy egyszerű kezdő feladat. Az első egyenlőség (23.5) miatt, a második egyenlőség (23.4) miatt érvényes.

Példák. Egy 8 elemű halmaznak hány 3 elemű részhalmaza van? A fentiek szerint 56. Két egyaránt 20 fős
osztályból kell egyetlen 20 fős csoportot kialakítani. Hányféleképpen lehet ezt megtenni? A (23.4) összefüggés adja

meg a kérdésre a választ, azaz .

A binomiális együtthatókat elrendezhetjük egy háromszög alakzatba, az ún. Pascal-háromszögbe, melyet


megalkotójáról, Blaise Pascal francia tudósról neveztek el.
Ezeket a számokat éppen a rekurzióval a következőképpen adhatjuk meg, azt is felhasználva, hogy :

Newtontól származik az ún. binomiális tétel, amely két tag magasabb hatványainak kifejtését adja meg:

Binomiális tétel: (23.7)

A bizonyítást lehet teljes indukcióval végezni, használva a binomiális együtthatókra vonatkozó rekurziót. Nyilván n = 1

esetén igaz. Tegyük fel, hogy n = m-re is igaz, azaz . Ekkor igazolnunk kell, hogy öröklődik
(m + 1)-re is.
Szorozzuk be a jobb oldalt (x + y)-nal. Ekkor egy xkym + 1–k tag együtthatója (mivel vagy xkym–k-t szoroztuk y-nal, vagy

xk–1ym + 1–k-t x-szel, ezért a két tag együtthatóját össze kell adni), lesz az együttható, ez azonban (23.3)

miatt éppen . Ezt kellett bizonyítani (m + 1) esetén. Tehát a formula igaz.


Ennek a tételnek ismert, középiskolában tanult két esete a két tag négyzete és köbe kifejezése.

Példa. (x + y)2 = x2 + 2xy + y2, illetve (x + y)3 = x3 + 3x2y + 3xy2 +y3. Ezekre szemléletes bizonyítás is van
téglalapterületek, illetve téglatest-térfogatok felhasználásával.

A binomiális tételből adódnak további nevezetes összefüggések is:

(23.8)

Ez közvetlenül adódik (23.7)-ből, ha az x = y = 1 helyettesítést alkalmazzuk. Egy másik kombinatorikus okoskodás a


következő.
A jobb oldal egy n elemű halmaz összes részhalmazainak (beleértve az üres és a teljes halmazt is) számossága. A jobb
oldal ugyanennek a számnak egy másik meghatározása. A halmaz egy részhalmazát meghatározhatjuk egy, a 0 vagy 1
számokból álló szám n-essel, aszerint, hogy a sorba rakott elemei a halmaznak benne vannak a részhalmazba (1-es) vagy
nincsenek (0-s). Mivel minden helyen 2 lehetőség van, így az n független esetben 2n lehetőség. Lásd még a variációk
alpontot is!

(23.9)

Az összefüggés (23.7)-ből az x = 1; y = –1 helyettesítéssel adódik. További összefüggéseket, amelyeket sokszor


használunk, később adunk meg, mert bizonyításukhoz hasznos tudni a binomiális együtthatók csak n-től és k-tól függő
explicit alakját, amelyet a következő bekezdés után ismertetünk. Mielőtt ezt a formulát megadnánk a kombináció
kiszámítására, nézzük a harmadik típusú feladatot!
Az eddigi két alapfeladatot lehet variálni, azaz olyan kiválasztásokat nézni, ahol a sorrend is lényeges. Azaz a
kiválasztás után még a sorba rendezések száma is gyelembe veendő.

Az eddigi példánkat vegyük újra, az angol ábécé első négy betűjéből kétbetűs „szavakat” készítsünk. Ekkor nyilván a
sorrend is számít, tehát {a, b} esetéből kettő is lesz: ab, illetve ba. Így 12 lesz az összes eset: ab, ba, ac, ca, ad, da, bc, cb,
bd, db, cd, dc.

Hogyan lehet ezt kiszámolni? Az első helyre 4 betű kerülhet, a másodikra viszont 3. Bármelyikhez a négyből három,
azaz 4 · 3=12 eset lesz.

Variációról beszélünk, ha egy n elemű halmazból k elemet úgy választunk ki, hogy a kiválasztott elemek sorrendje is
lényeges. Ezután n elem k-ad osztályú variációja ezeknek a lehetőségeknek a számát jelenti, amit szokás
jelölni.

vagy másképpen a permutációknál bevezetett jelöléssel:

(23.10)

Fontos észrevétel az n elem k-ad osztályú variációi és kombinációi közötti kapcsolat:

(23.11)

hiszen a kiválasztott k elem sorrendjeinek száma k!, ennyiszer számolunk egy esetet a variáció esetén. Ebből adódik a
binomiális együtthatók kiszámítására egy csak n-et és k-t tartalmazó formula:

(23.12)

Binomiális együtthatók további összefüggései


Binomiális együtthatók további összefüggései

(23.13)

igazolása azonnal adódik a fenti formulából. Indukcióval könnyen belátható az is, hogy

(23.14)

természetesen i ≤ k ≤ n mellett.
Ezek alkalmazása vezet a 26. fejezetben a binomiális eloszlás várható értéke és szórása kiszámításánál is hasznos
következő összefüggésekhez.

(23.15)

(23.16)

Igazolásuk a következőképpen történhet, most nézzük csak az elsőt, a másikat az olvasó elvégezheti hasonlóképpen
maga is.

(23.8)-at használva n = n – 1 helyettesítéssel. Ugyanígy megy


két lépésben a második összefüggés igazolása is.

(23.17)

(23.18)

Ez az összefüggés kétféle leszámlálással adódik. Ha (n + 1) elemből (k + 1)-et kell kiválasztani (ez áll a jobb oldalon),
akkor ezt a kiválasztott maximális elem szerint rendszerezhetjük. A maximum lehetséges értéke k + 1 (ennél kevesebb nem
lehet), ez csak 1-féleképpen lehet, mert a többi k elemet k-ból kell választani, azaz mindet ki kell venni. Ha a maximum k +

2, akkor a maradék k elemet k + 1-ből kell választani, azaz -féleképpen lehet, s így tovább, ha a maximum n + 1

(ennél nagyobb nem lehet), akkor a többi k elemet -féleképpen lehet kiválasztani. S éppen ez az összeg a bal oldal.
(23.19)

Igazolása tagokra bontással:

utolsó lépésnél (23.9)-et


használtuk.

(23.20)

igazolása:

Polinomiális-tétel:

Igazolása a tagok száma szerinti teljes indukcióval megy, két tagra igaz. Ha s tagra igaz, akkor s + 1-re kell belátni az
indukciós szabály szerint. Ez viszont viszszavezethető két tagra:

S itt írhatunk n – l = ks + 1-et. Feltételeztük, hogy s tagra, minden n vagy annál kisebb hatványra fennáll a polinomiális-
tétel. Azaz tulajdonképpen kettős indukció s-re és n-re.

(23.22)

és ebből

(23.23)

(23.24)
Ez utóbbi összefüggés a közvélemény-kutatás során merül fel. Tudjuk, hogy egy n elemű mintában k valamire igent
mondó személy van. Tegyük fel, hogy a teljes populációban (sokaságban, lásd 27.1 fejezetet) az N személy közül J igent
mondó van. Az összeg a Bayes-tételhez kell (26.3. fejezet), hogy milyen súllyal szerepelnek az egyes J értékek az összes
lehetséges esetből, amelyek számát a fenti összeg adja meg. Bizonyítása több úton is elképzelhető. Lásd a 27.9. fejezetet is.
Egy külön esete ennek a három eddig tárgyalt feladatnak, amikor ismétlődés is fellép. Ilyenkor ismétléses
permutációról, ismétléses variációról és ismétléses kombinációról beszélünk. A következőkben ezeket tárgyaljuk.

23.2. Egyszerű sorba rendezési és leszámolási feladatok ismétlődő elemekkel

Ismétléses permutációról beszélünk, ha van n elemünk, de csak r különböző fajta, s az egyes fajtákból rendre k1, k2, …,
kr darab. Ezek lehetséges sorrendjeinek száma a kérdés.

Azaz például van három a, két b és két c betűnk, tehát összesen 7 betű. Hány különböző sorrendben lehet ezeket
felsorolni? Erre a kérdésre válaszol az ismétléses permutációk száma:

(23.25)

Példa. Az említett esetben, ahol három a, két b és két c betűnk van, ott a lehetséges hétbetűs szavak száma a fenti

összefüggést használva: .

Ismétléses kombinációról beszélünk, ha n különböző elemből kell k darabot kiválasztani úgy, hogy ismétlődés is
megengedett, feltéve még, hogy mindegyik fajta elemből van legalább k darab. Azaz akár egy fajtából is vehetünk k
darabot. Az ismétléses kombinációk számát jelöljük: -val.

Korábbi példánkat tekintve (a négy betűből kettőt választani), de most ismétlődéssel, akkor a hat ismétlés nélkülihez
hozzájön még az alábbi négy pár: {a, a}; {b, b}; {c, c} és {d, d}. Tehát 10 eset van.

Általában több elem esetén ez a módszer elég nehézkes, azaz külön leszámolni a mind különböző, egyből kettőt, a
többiből egyet, s így tovább. Egy másik gondolattal viszont megmutatható, hogy

(23.26)

A bizonyítás gondolatmenete a következő. Ha a k kiválasztott elemet úgy kódoljuk, hogy ennyi darab 1-est írunk, n – 1
függőleges vonal közé, amivel n részre osztunk egy szakaszt. Az első vonal elé annyi 1-et teszünk, ahányszor az első elemét a
halmaznak kiválasztottuk, ha ez egyszer sem történt meg, akkor nincs egyetlen 1 sem az első függőleges vonal előtt.
Hasonlóan az első és a második közötti 1-ek száma mutatja, hogy hányszor választottuk a második elemet. Hasonlóan a
többit is. Ekkor k darab 1-est és n – 1 darab függőleges vonalat kell elhelyezni az összes lehetséges módon. Ezek száma éppen
az állításban felírt binomiális együttható.
Végezetül a sorrendet is gyelembe vevő kiválasztást, a variációt vegyük.

Ismétléses variációról beszélünk, ha n különböző elemből k-t választunk ki úgy, hogy minden elem akárhányszor
ismétlődhet, és a kiválasztás sorrendje is számít. Ezeknek a számát szokás -vel jelölni.

Ekkor a következő igaz:


(23.27)

Mivel az első elem n-féle lehet, a második, a lehetséges ismétlődés miatt ismét, hasonlóan tovább, egészen a k-adik
elemig, így kapjuk a fenti formulát az ismétléses variációra. A téma középiskolai lezárásához vegyünk egy olyan példát,
amin az összes lehetséges esetet szemléltethetjük, különböző kérdésfeltevésekkel.

Példa. Egy fagylaltárusnál ötféle fagyi van. Lehet tölcsérbe kérni akárhány gombócot (már amennyi egyáltalán a
legnagyobb tölcsérbe belefér), illetve kehelybe. Az első esetben számít a gombócok sorrendje, hiszen nem mindegy,
hogy melyik van a tetején. A kehelyben ez nem lényeges. Nézzük a kérdéseket!
a) Egy vevő kér ötgombócos tölcséres fagyit úgy, hogy minden gombóc különböző fajta legyen. Hányféleképpen
szolgálhatják ki?
b) Egy vevő kér ötgombócos tölcséres fagyit úgy, hogy kedvencéből, a csokiból hármat szeretne. Hányféleképpen
szolgálhatják ki?
c) Egy vevő három különböző gombócos fagyit szeretne tölcsérbe. Hányféleképpen szolgálhatják ki?
d) Egy vevő háromgombócos tölcséres fagyit kér. Hányféleképpen szolgálhatják ki?
e) Egy vevő három különböző gombócos kelyhes fagyit kér. Hányféleképpen szolgálhatják ki?
f) Egy vevő háromgombócos kelyhes fagyit kér. Hányféleképpen szolgálhatják ki?
A válaszok:
a) Mivel a sorrend lényeges, és nincs ismétlődés, a válasz 5 ! = 120.
b)
Itt is lényeges a sorrend, de van egy elem (a csoki), amelyik 3-szor ismétlődik, tehát .
c) Hármat kell kiválasztani, és a sorrend is lényeges, tehát variáció: 5 · 4 · 3 = 60 lehetőség van.
d) Ekkor lehet akár három egyforma is, és mindenféle egyéb, tehát ismétléses variáció, mind a három gombóc ötféle
lehet: azaz 53 = 125 eset van.
e) Mivel kelyhes a fagyi, ezért nem számít a sorrend, ismétlődés nincs, tehát 5 elem harmadosztályú

kombinációjáról van szó: -féleképpen szolgálható ki a vendég.


f)
Ha ismétlődhetnek a gombócok, akkor ismétléses kombináció, 5-ből 3 elem, azaz: -féleképpen
lehet felszolgálni a fagyit.

23.3. A kombinatorika alkalmazásai, összetettebb leszámlálásos problémák

Fibonacci-sorozat
Skatulyaelv (Dirichlet)
Logikai szitaformula
Általános elhelyezési probléma
Számpartíciók
A Pólya-féle leszámolási módszer

Fibonacci-sorozat
További problémák, amelyek kicsit tovább vezetnek már.

1. Egy 20 emeletes házat kell kifesteni két színnel úgy, hogy az egyik szín nem ismétlődhet két egymás utáni szinten.
Hányféleképpen festhető ki az épület?
2. Egy 2 × n-es táblát kell 2 × n-es dominókkal kirakni. Hányféleképpen lehet?
3. Egy n hosszú lépcsőn szeretnénk felmenni úgy, hogy egyszerre vagy egy lépcsőfokot haladunk, vagy kettőt.
Hányféleképpen juthatunk a lépcső tetejére?

A válasz mindhárom feladatban a következő rekurzió: f(n) = f(n – 1) + f(n – 2). Nézzük például a másodikat, ha az utolsó
dominó állított helyzetben van, akkor ebből annyi eset van, ahányféleképpen a 2 × (n – 1)-es dominót ki lehet rakni. Ha a
végén két egymáson levő fekvő dominó van, akkor meg éppen az előtte levő 2 × (n – 2)-es tábla kirakásainak a száma adja
meg ezen lehetőségek számát. Nyilván a kettő összege adja meg az összes lehetőséget. Ez egy igen nevezetes rekurzió, amely
a Fibonacci-sorozathoz vezet, ha az első két eleme 1, 1 (az első elemet 0 indexszel véve). Esetünkben ez eggyel el van tolva,
mert az 1 és 2 a kezdő elemek. A folytatás ismert: 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987…

Rekurzívan megadott egy sorozat, ha a sorozat n-edik tagját a megelőző elemekből egy meghatározott szabály szerint
számíthatjuk ki.

Példa. A fenti sorozat mellett nagyon sokféle ilyen megadás lehet. Például az ismert mértani sorozatokat
megadhatjuk úgy, hogy adott a1 a sorozat első eleme, valamint a következő szabály: a = an–1q, ahol a q egy tetszőleges
nem zérus valós szám.
Megjegyzés: A Fibonacci-sorozat elnevezése a középkorból való. A sorozatnak nagyon sok nevezetes tulajdonsága
van, szoros a kapcsolata a Pascal-háromszöggel is.

Kezdjük az összefüggések felsorolását talán a legnevezetesebbel, az explicit formulával, amellyel bármely n-re meg
tudjuk adni fn értékét.

A Fibonacci-sorozat n-edik tagjára igaz a következő összefüggés:

(23.28)

Bizonyítás: A fontossága miatt mutatjuk meg az ötletet. Keressük először azokat a mértani sorozatokat, amelyek eleget
tesznek a Fibonacci-sorozat rekurziós összefüggésének.
Ekkor teljesül: a1qn = a1qn–1 + a1qn–2, ahonnan – mivel az első tag nem lehet 0, hasonlóan q sem, ezt gyelembe véve –
osztásokkal adódik: q2 = q + 1. Tehát azok a mértani sorozatok jönnek szóba, melyek hányadosa a másodfokú egyenlet

gyöke, azaz , illetve . Látszik, hogy az első tag tetszőleges. Nyilván, ha két sorozat teljesíti a
Fibonacci-féle rekurziót, akkor a lineáris kombinációjuk is, azaz a Fibonacci-sorozatok egy vektorteret alkotnak. Ebben a
fenti két hányadosú mértani sorozat lesz egy bázis, azaz kétdimenziós vektorteret kapunk (lásd a 11.3. fejezetet).
Van még egy összefüggésünk, az első két tagra. Kihasználva azt a szabadsági fokot, hogy mindkét mértani sorozat első

tagja szabadon választható, így legyen az egyik , míg a másik a . Ezek összege legyen a
keresett Fibonacci-sorozat, akkor a következő két egyenletet kapjuk az első két tagra:

A másodikat rendezve: . Figyelembe véve az első egyenletet: . Ebből adódik:

és . Ez pedig éppen az állítást jelenti.


Következmények. A Fibonacci-sorozat exponenciálisan nő, mégpedig lényegében a fontos tag az első sorozat, mert a

második 0-hoz tart, ha n tart végtelenbe. Formálisan igaz: , ami egyben az aranymetszés
arányszáma (lásd az 5.6. fejezetet).
Néhány további érdekesség a Fibonacci-sorozat elemeivel kapcsolatban. A már példaként említett 2., dominóval
kapcsolatos feladatot meg lehet oldani egy másik gondolattal is, amely a binomiális együtthatókkal hozza kapcsolatba a
sorozat elemeit. Érvényes a következő:

(23.29)
Ez azt jelenti, hogy ha a Pascal-háromszögben a háromszög bal széléről bármelyik sorból elindulunk „lóugrásban”
jobbra felfelé, amíg a másik szélére nem érünk, akkor az összeg éppen egy Fibonacci-szám lesz.
A bizonyítás gondolata a következő: aszerint számoljuk le az eseteket, hogy hány fekvő dominó van. Ha nincs fekvő

dominó, akkor mind az n dominó áll, ami egy eset, felírható formában. Ha egy fekvő dominó van, akkor annyi eset
van, ahányféleképpen ez elhelyezhető, ami, lévén, hogy most összesen csak n – 1 egységünk lesz, n – 2 álló és egy fekvő

dominópár, ezért -féleképpen rakható le, hiszen azt az egy helyet kell kiválasztani, ahová a fekvő pár kerülhet.

Hasonlóan két fekvő pár esetén lehetőség lesz. Ezt vihetjük tovább, legfeljebb darab fekvő dominópárig,

amely -féleképpen rakható le. Ezzel igazoltuk is az állítást.


Néhány érdekes elemi számelméleti tulajdonsága a sorozatnak a következő. Ha eltoljuk eggyel az indexelést, tehát f1 =
1, f2 = 1, f3 = 2, f4 = 3, f5 = 5, f6 = 8, f7 = 13, f8 = 21, f9 = 34, f10 = 55, … akkor a következő észrevételt tehetjük:

(fn, fm) = 1 akkor és csak akkor, ha (n, m) = 1, ahol (n, m) szokásosan a két szám legnagyobb közös osztóját jelenti. (23.30)

Azaz két Fibonacci-szám akkor és csak akkor relatív prím, ha indexeik azok. Tehát például a hetedik (13) és a
tizenkettedik (144) relatív prím, hiszen a 13 prím és 144 nem osztható 13-mal, míg az ötödik (5) és a tizedik (55) nem relatív
prím, hiszen közös osztójuk 5.

Ha n | m, akkor fn |fm. (23.31)

Lásd például: 5 | 10és f5 | f10. Vagy 4 | 8 és f4 | f8 is fennáll. Ezek nem véletlenek, hanem a bizonyítható (23.31)
összefüggés következményei. Az okoskodáshoz azt kell használni, hogy milyen rekurzió adja a sorozat elemeit, s akkor
látszik, hogy ha például a legegyszerűbb oszthatóságot, a 2n-edik és az n-edik tagot nézzük:

és a vége nyilván osztható fn-nel. Ezzel egy konkrét esetben beláttuk az állítást. Általában hasonló módon mutatható ki, ha
m = kn, akkor fkn akár fm-nek, akár fn-nek többszöröse, ami éppen a bizonyítandó állítás.
Több is igaz, ennek az állításnak a megfordítása is áll, tehát

(23.32)

Ennek igazolását az olvasóra bízzuk. További nevezetes összefüggések:

(23.33)

(23.34)
(23.35)

ebből is könnyen megmutatható, hogy miért igaz (23.30).

(23.36)

(23.37)

(23.38)

Bizonyítása a (23.36) és (23.37) összefüggések, valamint a pitagoraszi számhármasok explicit formulája segítségével
történhet.
Sok helyen lehet ennek a sorozatnak az alkalmazásairól beszélni, kezdve a biológiát, informatikát egészen a zenéig
bezárólag, ahol zeneművek felépítésében (pl. ütemek száma) bukkannak fel ezek a számok. (Lásd még erről Rényi A.:
Variációk egy Fibonacci-témára. Természet Világa, 1967.)

Példák. A virágszirmok száma gyakran Fibonacci-szám. Például a liliom, nőszirom 3 szirmú, a harangláb vagy a
vadrózsa 5, a szarkaláb és a vérpipacs 8, a körömvirág 13, az őszirózsa és a cikória 21, útilapu és egyes százszorszépek
34, míg más százszorszépeknek 55 vagy 89 szirma van. Fontos tudni, hogy ritka az a virágfajta, amelyiknek nem
Fibonacci-szám a szirmainak száma. Ha ez nem így lenne, akkor a fenti tények egyszerűen abból adódhatnának,
hogy a Fibonacci-számok is természetes számok. Egy másik terület a Fibonacci-spirális, ahol a csavarodások szöge
alkot aranymetszést. Ez azt jelenti, hogy fölülről nézve két ág úgy osztja az egész kört, hogy a kisebbik ív úgy aránylik
a nagyobbhoz, mint az egész körhöz. A növények szárán az egymást követő levelek elfordulása (phyllotaxis)
többnyire (egyes becslések szerint 90%-ban) Fn/Fn + 2 alakúak (pl. szilfa és hárs esetén 1/2, bükknél, mogyorónál és
szedernél 1/3, tölgynél, almánál, cseresznyénél és meggynél 2/5, nyárnál, rózsánál és baracknál 3/8, fűznél és
mandulánál 5/13). Ezek az arányok éppen a Φ–2 lánctörtbe fejtésekor kapott közelítő törtek (ahol Φ az aranymetszés
aránya).
A fenyőtobozokban a pikkelyek száma, vagy az ananász pikkelyeinek száma is általában Fibonacci-számok. A
zenéből két Bartók művet említsünk, egy korait, az Allegro barbarót, ahol hol 3, hol 5, hol 8, hol 13 ütemes
csoportokba rendeződik a mű, illetve a Zene húros-, ütőhangszerekre és cselesztára című művét, amelyben az I.
tételben összesen 144 ütem van, ami éppen Fibonacci-szám, míg a mű csúcspontja az 89. ütemben található, ami az
előző Fibonacci-szám. Így még az is igaz, hogy a mű csúcspontja kb. a mű „aranymetszeténél” van. Ez más Bartók-
művekre is jellemző (lásd Lendvai E.: Bartók költői világa. Szépirodalmi Kiadó, Budapest, 1971). Az érdeklődők a
keresőbe az aranymetszést vagy a Fibonacci-sorozatot beírva több tízezer alkalmazást találhatnak az interneten is.

Skatulyaelv (Dirichlet)
Nézzük a következő kérdést! Hány ember van a teremben, ha tudjuk, hogy legalább három ugyanazon a napon született?
Mivel a szökőévet is gyelembe véve 366 napon lehet születni, ha 733 ember van, akkor biztos lesz olyan nap, amelyen
hárman születtek, hiszen ha minden napra legfeljebb kettő esne, akkor legfeljebb 732 személy lehetne. Ez az egyszerű
gondolat a következő formában fogalmazható meg általában:

Ha van n skatulyánk (osztályunk) és nk + 1 tárgyunk (elemünk), akkor létezik olyan skatulya, amelybe legalább k + 1
tárgy esik. Ezt szokás skatulyaelvnek is mondani.

Példák
1. Egy tudományos tény, hogy senkinek sincs 500 000 szálnál több haja a fejbőrén. Igaz-e, hogy van két budapesti,
akinek azonos számú hajszála van? Ez a skatulyaelvből adódik, hiszen ma kb. 1 700 000 budapesti lakos van. Mivel
legfeljebb 500 000 skatulyánk van, valamelyikben több mint 1 elem van. Sőt mivel több mint háromszor annyi a
budapestiek száma, mint a maximális hajszálak száma, még az is igaz, hogy lesz legalább négy olyan ember,
akinek ugyanannyi szál haja van (esetleg 0, azaz tökéletesen kopasz).
2. Biztos, hogy minden racionális szám vagy véges tizedes tört alakban, vagy egy valahonnantól periodikus végtelen
tizedes tört alakban felírható. Mivel a maradékos osztásnál legfeljebb q – 1 különböző maradék lép fel, ezért
legkésőbb a q-adik lépésben ismétlődés lép fel. Azaz periodikus lesz. Ha valamikor fellép a 0 maradék, akkor pedig
véges. Előbbire példa az 1/7, utóbbira a 3/25.

Logikai szitaformula
Ez a formula igen sokszor használatos mind metrikus feladatoknál, mind számossággal vagy valószínűségekkel
kapcsolatban (lásd pl. 26.2. fejezet). Általában n halmazra vonatkozik, és most véges számosságokkal fogalmazzuk meg.
Jelöljön A1, A2, …, An véges számosságú halmazokat, az uniót most + jellel, míg a metszetet a halmazok közvetlen egymás
mellé írásával jelöljük:

(23.39)

Példák
1. Legyen egy osztályban 3-féle nyelvcsoport, angol, német és francia. Minden tanuló legalább egy nyelvet tanul.
Tudjuk, hogy angolul 18-an, németül 13-an, franciául 12-en tanulnak. Angolul és németül 6, angolul és franciául 2,
és németül és franciául mindössze 1 tanuló tanul. Mindhárom nyelvet senki sem tanulja. Hány fős az osztály? A
formulánk szerint az osztálylétszámot úgy kapjuk meg, hogy összeadjuk az egyes csoportok létszámát, ami
esetünkben 43, majd ebből levonjuk a két nyelvet tanulók számát, akik ezúttal 9-en vannak, azaz marad 34. Ehhez
kellene hozzáadni a mindhárom nyelvet tanulók számát, akiknek a száma most 0, tehát 34 fős osztályról van szó.
2. Hány 5-tel vagy 3-mal osztható pozitív szám van 1000-ig?
Nyilván ami 5-tel osztható, a számok ötöde 200. Ami 3-mal az 333, hiszen 3-tól 999-ig ennyi pozitív egész szám
van. Ebből 200 + 333 = 533 szám adódna, de a 15-tel oszthatókat kétszer számoltuk, egyszer az 5-tel, egyszer a 3-mal
oszthatók között, tehát ezek számát le kell vonni a szitaformula szerint az 533-ból. Ilyen szám éppen 66 van 15-től
990-ig. Tehát a keresett szám 533 – 66 = 467.
3. A relatív prímek száma (Euler-féle φ függvény), lásd a 13.2. fejezetben.
Legyen az n szám kanonikus alakja: . A nem relatív prímeket fogjuk megszámolni, s majd az n
számból ezek számát levonva kapjuk a φ(n) értékét. Először leszámoljuk 1-től n-ig a p1-gyel, a p2-vel és így tovább,
a pk-val osztható számok számát. Ekkor a két prímmel oszthatókat többször számoltuk, azokat le kell vonni, a
három különböző prímmel oszthatókat újra hozzáadni, tehát a szitaformulát használjuk.

Ezzel .

Ebből megfelelő átalakítással adódik, hogy .

A következőkben megfogalmazunk egy igen általános feladatot, amelynek nagyon sok alkalmazása van a
legkülönbözőbb területeken, például a statisztikus zikában vagy a részecske zikában, de más hétköznapi helyzetekben is.

Általános elhelyezési probléma


Hányféleképpen lehet n darab golyót k darab dobozba elhelyezni a következő különböző szempontokat tekintetbe véve:
a) a golyók mind egyformák vagy mind különbözőek (számozottak),
b) a dobozok is lehetnek egyformák vagy megkülönböztetettek (számozottak),
c) az egy dobozba kerülő golyók száma lehet legfeljebb 1, legalább 1, illetve tetszőleges?
A választ össze lehet foglalni a következő két táblázatban, amely megtalálható egyetemi jegyzetben is (Elekes Gy.: Véges
matematika. ELTE, Budapest, 2002).
Számozott golyók
Minden dobozba
számozott dobozok egyforma dobozok

Maximum 1 k(k – 1) … (k – n + 1) 1

Minimum 1
(1) (2)

Tetszőleges kn
(3)

Egyforma golyók
Minden dobozba
számozott dobozok egyforma dobozok

Maximum 1 1

Minimum 1 (5) lásd számpartíciók

Tetszőleges
(4)

A megjelölt mezőkhöz tartozó magyarázatokkal foglalkozunk az alábbiakban, amelyek nem egyszerűen adódnak már
eddig tárgyalt esetekből, mint a többi jelöletlen mező értékei.
Az (1)-ben szereplő számokat elsőfajú Stirling-számoknak mondjuk, és általában s(n, k)-val jelöljük. Szokásos
de níciójuk a következő.

Rendezzük r növekvő hatványai szerint a szorzatot (nyilván r n-edfokú polinomja lesz).


Jelöljük s(n, k)-val az rk tag együtthatóját.
Azaz [r]n = s(n, 0) + s(n, 1)r + s(n, 2)r2 + … + s(n, n)rn.
Az s(n, k) számokat elsőfajú Stirling-féle számoknak mondjuk.

Ezek a számok rekurzívan is kiszámolhatók a következő összefüggések alapján:

(23.40)

Az első kettő nyilvánvaló a de nícióból, a harmadik az [r]n+1 = (r – n) [r]n egyenlőség mindkét oldalán fellépő rk tag
együtthatójának összehasonlításából adódik. Még megállapodunk abban, hogy s(n, k) = 0, ha n < k. Néhány elsőfajú
Stirling-féle szám látható a következő táblázatban:

s(n, k) K=0 1 2 3 4 5 6 7

N=1 0 1 0 0 0 0 0 0

2 0 –1 1 0 0 0 0 0

3 0 2 –3 1 0 0 0 0

4 0 –6 11 –6 1 0 0 0

5 0 24 –50 35 –10 1 0 0

6 0 –120 200 …

7 0 …

A fenti számokra igaz az (1)-beli kifejezés, azaz

az elsőfajú Stirling-féle számok explicit, csak n és k segítségével kifejezett alakja:


(23.41)

Egy n elemű halmaz k számú osztályt tartalmazó osztályozásainak számát jelöljük S(n, k), amit szokás másodfajú
Stirling-féle számnak is mondani.

Mivel az osztályok között nem teszünk különbséget, ez éppen (2)-nek felel meg, azaz (2) elemeit nevezzük másodfajú
Stirling-számoknak, s így érvényes:

(23.42)

Egy másik észrevétel, ami hasonló az elsőfajú Stirling-számokra észrevett összefüggéshez:

Az egytagú xn polinom előállítható az [x]k polinomok következő lineáris kombinációjaként:

A bizonyítást illetően lásd Vilenkin, N. J.: Kombinatorika. Műszaki, Budapest, 1987, 48.
További fontos összefüggés az elsőfajú Stirling-féle számok analógiájára:

A másodfajú Stirling-féle számok a következő rekurziónak tesznek eleget:

(23.43)

Érdekes tény, melyet most csak közlünk, a következő.

Az S(n, k) számok előbb növekednek, majd csökkennek, s a maximumuk, amelytől kezdve csökkennek, legfeljebb

, és ha n tart a végtelenhez, akkor aszimptotikusan tart -hez, ahol a nevezőben a természetes (e-
alapú) logaritmus szerepel.

Vezessünk be egy új fogalmat!

Egy n elemű X halmaz valamely osztályozását 1λ12λ23λ3 … kλk-típusúnak nevezzük, ha λ1 számú osztály egy elemet, λ2
számú osztály két elemet, …λk számú osztály pedig k darab elemet tartalmaz. Mivel az osztályok páronként
diszjunktak, így az elemek összegére igaz lesz, hogy λ1 + 2λ2 + … + kλk = n.

Az ilyen osztályba sorolások számára igaz a következő összefüggés.

Egy n elemű X halmaz -típusú osztályozásainak számára (ahol λ1 + 2λ2 + … + kλk = n) igaz, hogy

(23.44)
A következő kérdés egy n elemű X halmaz összes lehetséges osztályozásáról szól. Ez szerepel a korábbi táblázatban (3)
alatt.

Egy n elemű halmaz összes lehetséges osztályozásainak számát szokás Bn-nel jelölni és Bell-féle számnak mondani.

Mivel az n elemű X halmaz bármely osztályozása egy vagy két, …, vagy n számú osztályt tartalmaz, azért Bn = S(n, 1) +
S(n, 2) + … + S(n, n), ahol az S(n, k) számok a fent tárgyalt másodfajú Stirling-féle számok.

A Bell-féle számok kielégítik a

(23.45)

rekurzív összefüggést, ahol értelmezés szerint B0 = 1.

A tétel igazolásához gyeljük meg, hogy Bn + 1 = S(n + 1, 1) + S(n + 1, 2) + … + S(n + 1, n + 1) és használjuk fel a (23.43)
összefüggést, azaz

De mivel a belső második összegzés éppen Bi'' továbbá megállapodás szerint B0 = 1, ezzel készen is vagyunk.

Megjegyzés. A Bell-féle Bn számok éppen egy n elemű halmazon értelmezhető összes ekvivalenciarelációk számát is
megadják. Ez egy másik fontos tulajdonságuk.

A Bn-nel jelölt számok egy E. T. Bell által észrevett érdekes tulajdonsága az, hogy ezek a számok az függvény
Taylor-féle sorfejtésének együtthatói. Ezen észrevétel miatt tiszteletből nevezik a fenti számokat Bell-féle számoknak. Így
ezt a függvényt a Bn számok generátorfüggvényének nevezzük.

Azaz igaz a következő összefüggés:

(23.46)

Igazolását lásd Vilenkin, N. J.: Kombinatorika. Műszaki, Budapest, 1987, 53–54.


Catalan-számok:

Legyen n ∈ N és a ∈ R ! Ekkor legyen a következő de nícióval az eddig használt binomiális együttható fogalma
kibővítve:

Ismert, hogy az (1 + x)α függvény (a ∈ R, |x| < 1) a következőképpen fejthető sorba (általános binomiálistétel):

. A későbbiekben még szükség lesz rá, ezért írjuk fel konkrétan az esetet.

Feladat. Hány olyan 2n hosszú, 1 és –1 számokból álló sorozat van, melynek az összege 0, és minden részletösszege
nem negatív?
Megoldás. Jelöljük az ilyen sorozatok számát cn-nel. Nyilván c0 = 1 és c1 = 1. A 2n hosszúságú sorozatokat osztályozzuk
aszerint, hogy melyik az utolsó 0 részletösszegük a teljes összeg előtt (természetesen csak páros sok tag esetén lehet a
részletösszeg 0).

, ha n ≥ 1. Jelölje c(x) a sorozat generátorfüggvényét: . Ekkor a rekurzív


összefüggést felhasználva:

, amiből

A másodfokú egyenlet másik megoldása nem jöhet szóba, mert annak abszolút értéke 0-ban végtelenhez tart. A
függvény a következőképpen fejthető sorba:

így

Ezeket a számokat Catalan-féle számoknak nevezzük, azaz az n-edik Catalan-féle szám:

Számpartíciók
Gyakori kérdés, hogy egy n természetes számot hányféleképpen lehet felbontani pozitív egészek összegére. Ha még egy
korlátozásunk is van a legnagyobb összeadandóra, amit k-val jelölünk, akkor a lehetséges felbontások számát Pk(n)-nel
jelölve a következő állítás igaz:

(23.47)

Megjegyzés: tehát a felbontások számának ismerjük a generátorfüggvényét (ez a jobb oldal), s ebből számíthatunk
konkrét eseteket (lásd a bizonyítás utáni példát).

A bizonyításhoz tekintsük a

függvényt. Egyfelől ez a függvény megegyezik állításunk jobb oldalával, másrészt xn együtthatója a szorzás elvégzésekor
éppen annyi, ahányféleképpen az n számot elő lehet állítani nem negatív egészek összegeként és legfeljebb k nagyságú
összeadandókból.

Példa. Bontsuk fel a 7-et úgy pozitív egészek összegére, hogy a legnagyobb összeadandó a 3 legyen, azaz n = 7, k = 3.
Ekkor a nevező mindössze háromtényezős szorzatból áll, s keressük a kifejtés 7-edfokú tagjának az együtthatóját. A
nevező polinomja: 1 – x – x2 + x4 + x5 – x6. Ezt kell egy végtelen polinommal szorozni, hogy az eredmény 1 legyen.
Ennek a végtelen polinomnak az eleje (ameddig nekünk kell a 7. tagig): 1 + x + 2x2 + 3x3 + 4x4 + 5x5 7x6 + 8x7 + …. Tehát
a számolás eredménye 8, ami közvetlenül is adódik, hiszen ilyenkor még nem nehéz a teljes felsorolás sem. (Az egyes
esetek rendre: 3 + 3 + 1, 3 + 2 + 2, 3 + 2 + 1 + 1, 3 + 1 + 1 + 1 + 1, 2 + 2 + 2 + 1, 2 + 2 + 1 + 1 + 1, 2 + 1 + 1 + 1 + 1 + 1 és végül 1 + 1 + 1 +
1 + 1 + 1 + 1.) Egyébként a következő együttható 10, ami azt jelenti, hogy a 8-at már 10-féleképpen lehet pozitív egészek
összegére bontani úgy, hogy a legnagyobb összeadandó a 3.
Egy másik ellenőrzése a formulának az a speciális eset, ha a megengedett maximális tag 1. Ekkor bármilyen számot
egyféleképpen lehet felbontani, csupa egyesre. Ekkor a végtelen polinom minden együtthatója 1, ami meg is felel
válasznak, hiszen:

A Pólya-féle leszámolási módszer


A következő problémából indulunk ki. Legyen különböző objektumoknak egy n elemű halmaza. Ezeket szeretnénk m
különböző színnel kiszínezni. Ezúttal azonban két színezést azonosnak mondunk, ha az objektumoknak létezik olyan
permutációja, hogy az egyik színezés a másikba megy át. Ezen feltétel nélkül nyilván, mivel minden elemet m különböző
színre lehet festeni, az mn szám fejezi ki a lehetséges színezések számát. Most azonban az elemek permutálásával kapott
színezéseket azonosnak tekintjük. Két színezés tehát akkor ekvivalens (G szerint, ahol G az n objektum egy
permutációcsoportja), ha van olyan (G-beli) permutálás, amely az egyik színezést a másikba transzformálja. Ez az
ekvivalenciareláció a színezések halmazát ekvivalenciaosztályokra bontja. Ezek számát a G szerinti ciklusmutató polinom
segítségével határozzuk meg.

Ha g ∈ G, és λ1(g) jelöli a g permutálás i hosszúságú ciklusainak számát, akkor a G csoport ciklusmutató polinomján a

Ezzel már megfogalmazható a következő Pólya Györgytől származó tétel.

Legyen n tárgy és m szín, valamint G az n tárgy egy permutációcsoportja. Ekkor a G szerinti színezési sémák száma a
ciklusmutató polinom P(G; m, m, … m) számértékével egyenlő.

Példa. Vegyünk egy kockát, amelynek lapjait például két különböző színnel akarjuk kiszínezni. Hányféleképpen
tehető ez meg, ha a kocka azon színezéseit, amelyeket egy mozgással egymásba vihetünk, nem tekintjük
különbözőeknek?
Megoldás. Pólya módszerének alkalmazásához először a kocka forgáscsoportját kell meghatározni. Legyenek a kocka
csúcsai szokásosan: A, B, C, D, E, F, G, H! A forgáscsoport elemeinek száma 24. A ciklusmutató polinom alakja:

Ezért a Pólya-tétel alapján a két színt használó színezések száma:

Könnyen ellenőrizhetjük, hogy ez helyes szám, mert két szín esetén tényleg fel is lehet sorolni az összes lehetséges
színezéseket. Ezt az olvasóra hagyjuk.
A Pólya-módszer egyébként lehetővé teszi vegyületek izomerjeinek a megszámolását is.

További érdekes problémákat találunk Vilenkin, N. J.: Kombinatorika (Műszaki, Budapest, 1987), illetve Elekes Gy.:
Véges matematika (ELTE, Budapest, 2002) és Lovász–Pelikán–Vesztergombi: Diszkrét matematika (Typotex, 2006) című
munkákban.

23.4. A kombinatorikus geometria elemei


Ebben a fejezetben megismerkedünk a kombinatorika néhány geometriai alkalmazásával.

Véges geometriák
A sík és a tér felbontásai
A konvex kombinatorikus geometria alaptétele
Euler-féle poliédertétel
Véges geometriák

A H véges alaphalmaz E1, E2, …, Em részhalmazainak a rendszerét véges geometriának nevezzük, ha fennáll
1. i ≠ j esetén | Ei ∩ Ej| = 1, és
2. x∈H y ∈ H esetén Ǝi úgy, hogy {x, y} ⊆ Ei.

A de níció a projektív geometriák illeszkedési axiómáiból adódik, azaz, hogy bármely két egyenesnek van pontosan
egy közös pontja, és bármely két ponton át fektethető egy egyenes. Nyilván az E-vel jelölt halmazok az egyenesek, és H
elemei a pontok.

Triviális vagy elfajuló véges geometriáról beszélünk, ha vagy m = 1 és E1 = H, vagy Ei = {x, y) (i = 1, 2, …, m – 1}, Em = {y1,
y0, …, ym–1} (lásd a 23.2. ábrát).

23.2. ábra

Egy érdekes kérdés, hogy hány pont esetén létezik véges nem triviális geometria. Mielőtt erre a kérdésre válaszolnánk,
még néhány fogalmat vezessünk be.

Egy véges geometria valahány eleme általános helyzetű, ha közülük semelyik három nem esik ugyanabba az Ei
halmazba.

Ezzel megfogalmazható a nem elfajuló véges geometria is:

Egy véges geometria nem elfajuló, ha létezik négy általános helyzetű eleme.

A továbbiakban egy elem fokát vezetjük be.

Egy elem fokának nevezzük az őt tartalmazó Ei halmazok számát.

Ezzel megfogalmazható egy fontos lemma.

1. Ha x ∉ Ei, akkor x foka |Ei|,


2. ha az x1, x2, x3, x4 általános helyzetű elemek, akkor van olyan q természetes szám, hogy a négy pont mindegyikének
a foka q + 1, és minden általuk meghatározott egyenesre pontosan q + 1 pont illeszkedik.

Ebből a következő alaptétel adódik. Minden nem elfajuló véges geometriához van olyan q természetes szám, hogy

1. minden elem q + 1 fokú,


2. minden i-re | Ei | = q + 1,
3. |H| = q2 + q + 1,
4. m = q2 + q + 1.

További fontos tétel:

Minden p prímszámhoz létezik p-edrendű véges geometria.

Egy példa 3-adrendű geometriára a Fano-sík (lásd a 23.3. ábrát).


Itt hét pontunk van és hét egyenesünk, az utóbbiból 6 látható az ábrán, a hetedik az E7 = {h4, h5, h6} „egyenes”. A véges
geometriák iránt érdeklődőknek ajánlhatjuk Kárteszi F.: Bevezetés a véges geometriákba című könyvét, amely az
Akadémiai Kiadónál jelent meg először 1972-ben.
23.3. ábra

A sík és a tér felbontásai


Érdekes kombinatorikus geometriai problémák kaphatók, ha különböző síkbeli és térbeli alakzatokkal akarjuk felbontani a
síkot, illetve a teret. A legegyszerűbbeket tárgyaljuk csak, és csupán az euklideszi sík, illetve tér esetében.
Hány részre bontja a síkot n általános helyzetű egyenes? A megoldáshoz azt kell észrevenni, hogy egy rekurzió építhető
fel. Ha f(n) jelöli a különböző diszjunkt síktartományok számát, amely n egyenes esetén lép fel, akkor ha behúzunk egy n +
1-edik egyenest, azon a már meglévő n egyenes különböző metszéspontjai n + 1 intervallumot (köztük két végtelent) hoznak
létre. Ezek mindegyike egy kettévágott tartomány két új darabját választja szét, tehát a tartományok száma éppen n + 1-gyel
nő. Ezzel beláttuk, hogy f(n + 1) = f(n) + n + 1.
Nyilván f(1) = 2, és így lépésről lépésre adódik, hogy

Általában az n-edik tagot szokás megadni, tehát

Megjegyzés. Érdekes, hogy a sorozat első két tagja: 2, 4, éppen kettő hatványok, hajlamosak lennénk ezt folytatni és
8-cal, 16-tal folytatni a valóságos 7, 11 helyett. Nem exponenciálisan nő a tartományok száma, csupán polinomiálisan
egy másodfokú polinom szerint.

Hány részre osztja a teret n általános helyzetű sík? Ennek megoldásakor az előző síkbeli eredményt fogjuk erősen
használni. Ezúttal a keresett választ g(n)-nel jelöljük. Ismét rekurziót építünk, amelyben az (n + 1)-edik síkon lévő n
metszésvonalat tekintve annyi új tartomány lesz, ahány részre ezt a síkot ez az n egyenes bontja, azaz:

. Ebben az esetben is igaz, hogy egy sík két részre bont, azaz g(1) = 2. Ismét
a rekurzió feloldása lépésről lépésre következik, most csak az eredményt közöljük:

ahonnan

Megjegyzés. Még érdekesebb, mint az előbb, hogy most az első három kettő hatvány adódik, ha az n = 1, 2, 3 esetet
nézzük: 2, 4, 8, de 4-re már csak 15. Ezúttal sem exponenciális, de most harmadrendű polinomiális a növekedés
mértéke.

Hasonló kérdéseket lehet feltenni, például körök esetén vagy térben gömbökkel. Ezek azonban már túlnyúlnak jelen
könyvünk keretein.

A konvex kombinatorikus geometria alaptétele


Helly tétele egy, két és három dimenzióban:

Legyen adott n intervallum egy egyenesen. Ha bármely kettőnek van közös pontja, akkor mindnek is van közös pontja.
Legyen n konvex ponthalmaz a síkon. Ha bármely háromnak van közös pontja, akkor az összesnek van.
Legyen n konvex ponthalmaz a térben. Ha bármely négynek van közös pontja, akkor az összesnek van.

Megmutatható, hogy általánosan is igaz:

Legyen n konvex ponthalmaz a k dimenziós euklideszi térben. Ha bármely (k + 1)-nek van közös pontja, akkor mind az
n ponthalmaznak van közös pontja.

Példa. Ha van 10 körlemez a síkon úgy, hogy bármely 3-nak van közös pontja, akkor mind a 10-nek van közös pontja.
Ezt például a következő problémában használhatjuk. Egy adott területen 10 rádióadó sugároz. Ha tudjuk, hogy egy
adott körben foghatók az adók, és azt is, hogy bármely három adó mindegyike fogható valahol, akkor van olyan hely,
ahol mind a tíz adó is fogható.

A bizonyítás magasabb dimenzióban indukciós, egy dimenzióban igen egyszerű, így a kétdimenzióst vázoljuk. Az
egydimenzióst úgy is fogalmazhatjuk, hogy ha egy könyvtárba érkeznek látogatók, s tudjuk, hogy bármely kettő
találkozott, akkor volt időpillanat, amikor mindnyájan a könyvtárban voltak. Vegyük a legelső érkezőt, mivel neki a
legutolsóval is kellett találkoznia, ezért csak később mehetett el, mint ahogy az utolsó érkezett. Akkor az utolsó
érkezésekor mindnyájan a könyvtárban kell hogy legyenek, különben aki nincs ott, az nem találkozott az utolsóval. Ami
ellentmond a feltételnek.
Két dimenzióban az indukcióhoz belátjuk, hogy ha négy síkbeli konvex halmaz közül bármelyik háromnak van közös
pontja, akkor mind a négynek is van. Jelöljön Pi egy olyan pontot, ami az i-edik halmazt kivéve a másik háromnak közös
pontja. Ez a négy pont vagy egy konvex négyszöget alkot, vagy három pont alkotta háromszög tartalmazza a negyedik
pontot (23.4. ábra).

23.4. ábra

Mindkét esetben találunk közös pontot, hiszen ha négyszög, akkor a P2P4 átló minden pontja benne kell legyen a
konvexitás miatt az első és a harmadik halmazban, míg a P1P3 átló minden pontja a második és a negyedik halmazban.
Ekkor az átlók P metszéspontja mind a négy halmaznak közös pontja. Ha mondjuk a P1P2P3 háromszög tartalmazza a P4
pontot, akkor pl. a P1P4 egyenes P2P3-mal alkotott P metszéspontja lesz egy olyan pont, amely mind a négy halmazba benne
kell legyen.
Ezután jön az indukció. Tegyük fel, hogy n konvex alakzat közül bármelyik háromnak van közös pontja, akkor a
„mindnek van teljesül”, s bizonyítani szeretnénk n + 1 halmazra, melyekről tudjuk, hogy köztük is bármely háromnak van
közös pontja. Jelöljük Ki-vel az alakzatokat! Legyen K = Kn ∩ Kn+1, amely szintén egy konvex halmaz, és nyilván nem üres,
hiszen bármely háromnak van közös pontja, akkor kettőnek még inkább. Vegyük most a K1, K2, …, Kn–1, K halmazokat!
Ezek közül bármely háromnak van közös pontja, mivel ha nincs köztük K, akkor nyilván a feltétel miatt, ha viszont benne
van K, akkor meg amiatt, hogy 4 halmazra már beláttuk, tehát pl. K1, K2, Kn, Kn+1 négyesnek is van közös pontja, ha
bármelyik háromnak, s így, ha K-t vesszük két másik halmazzal, akkor lesz közös pont. Ezzel véges sok halmazra
bizonyítottuk Helly tételét két dimenzióban. Hasonló a bizonyítás tér esetében is.
Ennek a Helly-tételnek az alkalmazásával érdekes további tételek bizonyíthatók konvex alakzatokra, amelyek már
inkább geometriai, mint kombinatorikai eredmények, mégis közöljük őket, a bizonyításukban szerepel a Helly-tétel.

Blaschke-tétel. Ha egy konvex tartomány szélessége d, akkor a tartományban elhelyezhető egy d/3 sugarú kör.

Egy t területű korlátos S alakzathoz mindig található a síkjában egy olyan O pont, hogy az O-n átmenő valamennyi
egyenes úgy vágja szét S-et, hogy az egyenes mindkét oldalán S-nek legalább t/3 területű része lesz.

Megjegyzés. Utóbbi tételhez sem a konvexitás, sem az alakzat összefüggősége nem kell. Azt mutathatjuk meg, hogy a
sík összes olyan félsíkja, amelyik S-nek legalább a 2/3 területű részét tartalmazza, olyan tulajdonságú, hogy bármely
három metszete nem üres. Ebből már adódik az állítás.

Megemlítünk még magyar vonatkozásai miatt két másik, konvexitással kapcsolatos problémát.
Nevezzük általános helyzetűnek a sík azon ponthalmazát, ahol semelyik három pont nem illeszkedik egy egyenesre.

Egy másik fogalom:

Konvex helyzetűnek mondunk a síkban egy olyan ponthalmazt, amelyek egy konvex sokszög csúcsai.

A kérdés az, hogy vajon hány darab általános helyzetű pontot kell felvennünk, ha azt akarjuk, hogy köztük legyen
legalább egy konvex sokszög. Pontosan megfogalmazva, ha egy konvex n-szöget szeretnénk garantálni, akkor létezik-e
olyan K(n) szám, melyre igaz, hogy bárhogyan veszünk fel egy K(n) elemű általános helyzetű ponthalmazt, közülük mindig
kiválasztható egy konvex n-szög.
Ez kis n-ekre még egyszerű, n = 2-re nyilván K(n) = 2 és n = 3-ra K(n) = 3. Már nem teljesen triviális az n = 4 eset sem, erre
Klein Eszter adott választ bebizonyítva, hogy K(4) = 5. Ennek bizonyítása a következő gondolaton alapul. Ha az öt pont
konvex burka négy- vagy ötszög, akkor készen vagyunk, hiszen akkor ki lehet választani konvex négyszöget. Egy eset
marad, ha a konvex burok egy háromszög (23.5. ábra).

23.5. ábra

Ekkor a háromszög belsejében lévő két pontot összekötő egyenes kettévágja a konvex burok háromszöget, s az a két
háromszögcsúcs, amelyik az egyik oldalára esik, plusz a belső két pont alkot ekkor konvex négyszöget.
Általánosan igaz az Erdős–Szekeres-tétel, mely szerint

minden n ≥ 3 esetén létezik olyan K(n) szám, hogy minden K(n) elemű általános helyzetű ponthalmaz tartalmaz n
konvex helyzetű pontot.

Bizonyításához fel kell használni a Ramsey-tételt, lásd a 24.4. fejezetet.


Egy további megállapodás. Jelöljük K*(n)-nel azt a legkisebb természetes számot, amelyre igaz, hogy bármely ilyen
pontszámú általános helyzetű ponthalmaz tartalmaz konvex n-szöget, de az eggyel kisebb természetes számra ez már nem
igaz. Meg lehet mutatni, hogy K*(n) ≥ 2n–2 + 1, azaz hogy megadható általános helyzetű 2n–2 darab pont úgy, hogy ezek közül
sehogyan sem lehet egy konvex n-szöget kiválasztani. Ennek egy általánosítása a következő Erdős–Szekeres-sejtés: K*(n) =
2n–2 + 1.
Máig nincs bizonyítása.
A permutációknak egy érdekes alkalmazása a Scott-probléma.
Feladat. Adott a síkon n különböző pont, melyek nem mind kollineárisak (azaz nem esnek egyetlen egyenesre).
Legalább hány különböző irányú egyenest határoznak meg ezek a pontok?
Megoldás. Ha az n pontból n – 1 kollineáris, akkor éppen n különböző irányt határoznak meg, lásd az n = 6 esetet a 23.6.
ábrán, ahol 5 irány a 6. pont összekötései a többi öttel, míg az öt egy egyenesre eső egyenes iránya a hatodik.

23.6. ábra

Ha n páratlan, akkor a pontok elhelyezhetők úgy, hogy csak n – 1 különböző irány keletkezik (23.7. és 23.8. ábra).

23.7. ábra

A 23.7. ábrán az egyenesen egyenlő közönként helyezkednek el a csillaggal jelölt pontok, és az egyenesen kívül, a
középső pont által meghatározott merőleges tengelyen van a maradék két pont. Ekkor éppen n – 1 irány lesz, mert az alsó és
felső pont egyenesbeli pontokkal való összekötése esetén lesznek egyirányú párok.
Egy másik konstrukció a következő.

23.8. ábra

A 23.8. ábrán az összes többi pontpár összekötésével keletkező irány megegyezik valamelyik, az ábrában berajzolt
iránnyal. Az olvasó ellenőrizheti az állítás igazságát. Scott sejtését Ungár bizonyította a permutációk segítségével. Csak a
konstrukciót mutatjuk meg.

Legyen adott a síkon n darab nem kollineáris pont. Ha n = 2k vagy n = 2k + 1, akkor az n pont legalább 2k különböző
irányt határoz meg (Ungár tétele).

Elegendő az n = 2k esetben bizonyítani. Vetítsük a pontokat minden lehetséges irányban egy egyenesre! A pontok
vetületeinek a sorrendje az egyenesen (feltéve, hogy minden pont képe különböző) a pontok egy permutációját határozza
meg. Az egyenest forgatva e permutáció változásaihoz pontosan azok a vetítési irányok tartoznak, amelyeket az n pont
határoz meg. A permutáció egy ilyen változását lépésnek nevezzük. Egy 180 fokos fordulathoz tartozó lépések száma tehát
megegyezik a pontok által meghatározott különböző irányok számával. A 180 fokos fordulat de niálja a pontok
permutációinak egy sorozatát, amely a következő tulajdonságokkal rendelkezik:
1. Az utolsó permutáció az elsőnek a megfordítottja.
2. Egy lépésben szomszédos pontokból álló diszjunkt blokkok sorrendje fordul meg. (Egy ilyen blokkban kollineáris pontok
találhatók. Két vagy több blokk ugyanabban a lépésben fordul meg, ha a hozzájuk tartozó egyenesek párhuzamosak.)
3. Nem fordíthatjuk meg egyszerre az összes elemet, hiszen nem minden pont esik egy egyenesre.
4. Bármely két pont egymáshoz viszonyított helyzete a permutációban pontosan egyszer változik.
Nevezzük középpontnak az egyenesnek egy olyan pontját, amelynek mindkét oldalán k darab pont fekszik.
Átmenetnek meg nevezzük azt, hogy ha egy pont egy lépés által átkerül a permutáció első feléből a második felébe, azaz
balról jobbra átugorja a középpontot.
Egy fontos segédtétel, amelyből lényegében már könnyen adódik az állításunk, a következő. Ha bármely lépés által s
darab, majd egy későbbi lépés által t darab átmenet történik, akkor a két lépés között van legalább további s + t – 1 lépés, ami
egyetlen átmenetet sem tartalmaz. Bizonyítását lásd Elekes Gy.: Véges matematika. ELTE, Budapest, 111–112.
Ugyanez a tétel tisztán kombinatorikai megfogalmazásban zárja ezt a paragrafust.

Ha 2k elem permutációinak sorozata rendelkezik az előző tételben szereplő 1 – 4. tulajdonságok mindegyikével, akkor
ez a sorozat legalább 2k permutációból áll (Ungár-tétel).

Euler-féle poliédertétel
Végül egy poliéderekkel kapcsolatos kérdéskör (igazából az algebrai topológia területe), ami poliéderek határoló
alakzatainak számai közötti összefüggést ad meg. A kérdéskört sokan vizsgálták, de első explicit megfogalmazójáról Euler-
féle poliédertételnek nevezik. Ez a következőt mondja ki:

Egy közönséges, egyszerű poliéder csúcsai, élei és lapjainak száma (jelölje ezeket a számokat rendre: c, e és l) között a
(23.48)
következő összefüggés érvényes: c + l – e = 2.

Bizonyítása gráfokkal történik (lásd a 24.8. fejezetben).


Ennek alapján lehet például megmutatni, hogy mindösszesen öt szabályos (platóni) test létezik, a tetraéder, a kocka, az
oktaéder, a dodekaéder és az ikozaéder. A gondolat lényege, hogy a szabályos testek minden lapja azonos oldalszámú
szabályos sokszög, és e szögletei is egybevágóak, így minden csúcsban ugyannyi él kell hogy befusson. Ezeket felhasználva
adódik, hogy a lapok csak szabályos három-, négy- vagy hatszögek lehetnek. Ezeket az eseteket végignézve öt esetet
kapunk. Ezek ábráival (23.9. ábra) fejezzük be a kombinatorikus geometria területén való rövid kalandozásunkat.

23.9. ábra
24. Gráfok
24.1. Alapfogalmak
24.2. Gráfok összefüggősége, fák, erdők
24.3. A gráfok bejárásai
24.4. Speciális gráfok és tulajdonságaik
24.5. Irányított gráfok
24.6. Szállítási problémák modellezése gráfokkal
24.7. Véletlen gráfok
24.8. Gráfok alkalmazásai
24.9. Gráfok és mátrixok

24.1. Alapfogalmak
Ez a téma egy újabb fejezete a matematikának, ahol a mindössze 250 évet mondjuk újnak. Az első kérdés, amelynek
megválaszolásához gráfokat használt Leonhard Euler, az ún. königsbergi hidak problémája (1736-ban jelent meg). Ebben
fordul elő olyan helyzet, ahol pontokkal és az azokkal jelölt dolgok között levő kapcsolatokat szimbolizáló élekkel lehet
modellezni a valóságot, s aztán ezen a modellen sikerül egy egyszerű okoskodással egy lehetetlenséget igazolni. Lássuk a
problémát!

24.1. ábra

A poroszországi Königsberg városában (ma Kalinyingrád, Oroszország) folyik a Pregel folyó, amelyet – a 24.1. ábrán
látható módon – hét híd ível át. A város polgárai azt kérdezték, lehet-e olyan sétát tervezni, amelyik minden hídon éppen
egyszer halad át. A kérdés a szentpétervári akadémia tanárához, Eulerhez került.
Ennek a problémának a modellezéséből adódott a következő fogalom. Ha adva van egy halmaz, valamint e halmaz
elempárjainak egy sorozata (ahol az „elempáron” ugyanazon elem kétszeri megismétlését is értjük), akkor gráfról
beszélünk. Ezt pontosan a következőképpen fogalmazhatjuk meg:

Legyen adva egy diszjunkt P és E halmaz, valamint egy leképezés, amely E minden eleméhez egy P-beli – nem
szükségképpen különböző elemekből álló – elempárt rendel hozzá. A G = (P, E, ) rendezett hármast gráfnak
nevezzük, ahol a P halmaz elemeit a gráf csúcspontjainak vagy röviden pontjainak vagy csúcsainak, míg az E halmaz
elemeit a gráf éleinek nevezzük. A leképezés éppen azt jelenti, hogy az éleknek pontosan két ún. végpontja van,
azaz pontpárok (nem feltétlenül különbözőek) jelentik az éleket.

A königsbergi hidak esetében P a szigetek, E a hidak halmaza, és minden hídhoz azt a 2 szigetet rendeli, amiket az
összeköt. Ez a de níció megenged ún. hurokéleket, amikor a pontpár két eleme azonos, illetve többszörös éleket, amikor
különböző élekhez is ugyanazt a pontpárt rendeljük. Amennyiben a leképezés egy-egyértelmű, akkor nincs többszörös
él, s ha nem fordul elő a pontpárok között azonos elem, akkor hurokmentes gráfról beszélünk.
A fentivel azonos, de más megközelítésű de níció a következő.

Legyen adva egy P halmaz, valamint egy sorozat, amelynek elemei a P kételemű részhalmazai közül valók. A

párt gráfnak nevezzük.

A P halmaz elemeit mondjuk a gráf csúcspontjainak és az sorozat elemeit a gráf éleinek. Azért beszélünk
sorozatról, hogy többszörös élek is megengedhetők legyenek.
Az ej = (X, X) élt hurokélnek nevezzük, míg a sorozat azonos elemeit mondjuk többszörös éleknek.

Gráfok megadási módjai vagy reprezentációi a következők lehetnek.


I. Ha megadjuk a P, E halmazokat és a leképezést. Példa: P = {A, B, C, D}, E = {e, f, g, h} és a :E ( P × P leképezés pedig e ↦
(A, B); f ↦ (B, C); g ↦ ↦ (A, D); h ↦ (B, B).
II. Lehet ábrával is megadni a síkon, ahol a csúcsokat a sík jelölt pontjai, az éleket pedig a pontok között vezető folytonos és
önmagukat nem metsző (ún. egyszerű) görbék reprezentálják.
Az előbbi gráf ezen a módon a következőképpen néz ki (24.2. ábra).

24.2. ábra

III.Számítástechnikában egy szimmetrikus négyzetes mátrixszal lehet megadni egy gráfot. A sorai és az oszlopai egyaránt a P
halmaz elemeivel indexelendők, míg az aij mátrixelem értéke k ∈ N, mely 0, ha nincs él a Pi és a Pj csúcspontok között, 1 ha
van egy él, és ha többszörös él van, akkor k ≥ 2. Ezt a gráf szomszédsági (adjacencia) mátrixának nevezzük.

Ismét az I. szerinti gráfot adjuk meg ezen a módon: . Számítógépben általában így reprezentálódik
egy gráf. (Természetesen sok más mód is lehetséges, lásd például a Prüfer-kódokat a 24.8. fejezetben.)

Egyszerű gráf, amely nem tartalmaz hurok- és többszörös élt.

Az ilyen egyszerű gráfok alkalmasak lehetnek például egy alaphalmaz elemei közötti kapcsolatok modellezésére, így
ismeretségek, sportversenyeknél lejátszott mérkőzések vagy települések közötti kapcsolatok, pl. vasútvonalak, utak, víz-,
gázvezetékek stb.

Teljes gráf az olyan egyszerű gráf, amelyben minden csúcs minden másik csúccsal össze van kötve éllel. Mátrixa a

főátlón kívül csupa 1-es. Éleinek száma , amennyiben n csúcsa van.

Megadható egy elemi összefüggés a gráfok éleinek a számára, amelyhez azonban még egy új fogalom szükséges.

Egy gráf egy P pontjának fokszáma a belőle induló élek számát jelenti. Jelölése többnyire gr (P) vagy d(P).

Minden gráfban érvényes a következő összefüggés, feltéve, hogy n csúcsa van:

(24.1)

ahol az élek számát jelöli e. Másként |E| = e.


Ennek igazolása nyilvánvaló, hiszen minden élnek pontosan két vége van (csak megjegyezzük, hogy a hurokél a
fokszámban kettőt „ér”, hiszen „mindkét vége” ugyanabban a csúcsban van).

Példa. A gráfok megadásánál használt minta gráf esetén (lásd a 24.2. ábrán) a fokszámok rendre gr(A) = 2, gr(B) = 4,
gr(C) = gr(D) = 1. Nyilván ekkor a fokszámok összege 8, s így az élek száma ennek a fele, azaz 4. Az ábra mutatja, hogy
valóban ennyi él van, egy hurokél és három további él.

Két hasonló, egy egyszerűbb és egy mélyebb állítás, az utóbbi igazolás nélkül.
Nem létezik olyan egyszerű gráf, melyben minden pont foka különböző.

Hiszen ennek (n pontszámú gráf esetén) lenne 0 és n – 1 fokszámú pontja is, s így az előbbi semelyik, az utóbbi
mindegyik másik ponttal szomszédos lenne, ami egyszerre lehetetlen.

Nem létezik olyan n csúcsú e élű egyszerű gráf sem, mely csúcsai kettő olyan k és n – k számú csúcsból álló részekre

oszthatók, ahol a k csúcsú rész fokszámainak az összegét m-mel jelölve


Bármely fokszámsorozat, mely nem ilyen, az realizálható, tehát ez szükséges és elégséges feltétel.

Egy egyszerű gráf komplementere az a gráf, melynek csúcsai ugyanazok, mint a megadott egyszerű gráfé, élei viszont
pontosan azok, amelyek a másik gráfból hiányoznak. Azaz egy egyszerű gráfot és a komplementerét egyesítve éppen a
teljes gráfot kapjuk.

Példák. Két ötpontú gráf látható a 24.3. ábrán, melyek egymás komplementerei. A szaggatott élek csak a
komplementerképzés világosabbá tételét szolgálják. A bal oldali gráf a vastag élű, s ennek komplementere a jobb oldali
vastag élű.

24.3. ábra

Egy, a fogalom alapján nyilvánvalóan fennálló összefüggés:

Ha egy n pontú egyszerű gráf éleinek száma e, akkor a komplementer éleinek száma:

Reguláris egy gráf, ha minden csúcsának azonos a fokszáma. Ha jelölni akarjuk azt is, hogy mennyi ez a közös
fokszám, akkor k-reguláris gráfról beszélünk. Ilyenkor minden csúcsból k él indul ki.

Minden teljes gráf reguláris, hiszen minden pontjából ugyanannyi él indul, szám szerint n – 1, feltéve, hogy a csúcsok
száma n.

Megjegyzés. (2k + 1)-reguláris gráf csúcsainak száma csak páros lehet, hiszen különben a fokszámok összege nem
lenne páros. Így például 7 pontú 3-reguláris gráf nem létezik. Példa nem teljes 3-reguláris gráfra a 24.4. ábrán látható
8 pontú 3-reguláris gráf.

24.4. ábra

Egy további fontos fogalom egy gráf részeire vonatkozik.

Egy gráf részgráfja az a gráf, amelynek csúcsai az eredeti gráf csúcsainak egy részhalmazát alkotják, míg élei az eredeti
gráf azon élei közül kerülnek ki, melyeknek mindkét végpontja az eredeti gráf kiválasztott csúcsa.

A 24.5. ábrán példák láthatók különböző részgráfokra. A bal oldali gráfnak részgráfjai a jobb oldali gráfok, az elsőnek
ugyanannyi csúcsa is van, a másodiknak kevesebb csúcsa, de azok között minden eredeti él megmaradt.
24.5. ábra

Végezetül egy fontos fogalom a gráfok azonossága, ha a csúcsait nem különböztetjük meg (pl. két szénatom vagy két
hidrogénatom egymástól nem különböztethető meg, lásd később a kémiai molekulák példáit).

Legyen G1 és G2 két gráf. Ha létezik G1 és G2 csúcsai között egy olyan egy-egyértelmű leképezés (bijekció), amely
„éltartó”, azaz pontosan akkor köt össze él két (nem feltétlen különböző) pontot G1-ben, ha a leképezés szerint nekik
megfelelő pontokat is él köti össze G2-ben, akkor a két gráfot izomorfnak mondjuk.

Példa. A 24.6. ábrán két izomorf, a 24.7. ábrán két nem izomorf gráfot látunk. Az elsőnél a leképezést a
következőképpen adhatjuk meg: A → C, B → D, C → B, D → E, E → A. Ekkor a 7 él is megfelelő élbe megy: AB, AC, AD
átmegy rendre: CD-be, BC-be, CE-be; BC és BD BD-be és DE-be; míg CE és DE pedig AB-be és AE-be. A másik ábrán
nem izomorfak a gráfok, mert az első fokszámai rendre: 4, 2, 2, 4, 2, míg a másodiké 3, 2, 3, 3, 3. Triviális, hogy nem
lehetnek izomorfak, hiszen annak minimális feltétele a fokszámsorozatok elemeinek azonossága.

24.6. ábra

24.7. ábra

Megjegyzés. Két gráf izomor ájának a kérdése általában igen nehéz, nem ismerünk szükséges és elégséges feltételt
rá. (Természetesen ekvivalens de níciók vannak, például 2 gráfot izomorfnak mondunk, ha létezik csúcsaik és éleik
halmazainak uniói közötti olyan bijekció, amely csúcshoz csúcsot, élhez élt rendel, és megtartja a csúcs-él
illeszkedéseket. Ez bizonyos értelemben szükséges és elégséges feltétel.) Ezzel szemben sok szükséges feltétel van,
ezek közül néhány egyszerűbbet felsorolunk: nyilván azonos csúcsszám, azonos élszám, ha a pontok fokszámait
felsoroljuk, akkor mindkét gráfra ugyanazon elemekből álló sorozatot kell kapnunk. Ezek az izomor ánál
„megmaradó” (invariáns) mennyiségek. A felsoroltak elég triviális szükséges feltételek, vannak jóval ravaszabbak is,
de azokhoz már mélyebb ismeretek kellenek a gráfokról. Tény viszont, hogy még számítógéppel sincs polinomiális
idejű program a kérdés eldöntésére, így nagy gráfok esetén nagyon sok idő kell a kérdés eldöntésére, ha az egyáltalán
lehetséges.

24.2. Gráfok összefüggősége, fák, erdők


Ahhoz, hogy a gráfok körében tovább vizsgálódjunk, az eredeti első gráfos feladat, a városi séta mintájára a következő
fogalmakat vezetjük be.
Séta a gráf éleinek egy tetszőleges olyan sorozata, ahol az egymást követő éleknek van közös végpontja. Az olyan séta,
ahol minden élt csupán egyszer érintünk, a vonal (ebben az esetben egyes csúcsokon akár többször is
keresztülmehetünk). Az olyan séta, amelyben minden csúcsot csak egyszer érintünk, az út.

Megjegyzés. A séta helyett használatos az élsorozat megnevezés is.

Könnyen látható, hogy az út egyben vonal is, hiszen ha minden csúcson csak egyszer mehetünk át, akkor élt sem
érinthetünk kétszer.

Példa. A 24.8. ábrán a vastag vonallal jelölt élek a bal oldali ábrán egy olyan vonalat, amely nem út (amelynek
sorrendje 1-2-3-4-5 élek), illetve a jobb oldalin egy utat példáznak (itt is a sorrendet jelöli az 1-2-3-4-5).

24.8. ábra

A fenti fogalmakat használva, az Eulernek feltett kérdés így hangzik: A königsbergi hidak és szigetek alkotta gráfban
van-e olyan vonal, amely minden élt tartalmaz?
Fontos fogalom egy gráf összefüggősége is. Erről szemléletesen is meg lehet győződni úgy, hogy akárhogyan is rajzolom
le egy síklapra a gráfot, annak nincsenek különböző, egymástól elszigetelt darabjai (az ábrán). Ezt matematikailag a
következőképpen fogalmazhatjuk meg.

Egy gráfot összefüggőnek mondunk, ha bármely két csúcsa között létezik séta, azaz egymáshoz kapcsolódó élek
sorozatán egyikből a másikba juthatunk.

Példa összefüggő és nem összefüggő gráfra. A 24.9. ábrán két különböző összefüggő gráfot, míg a 24.10. ábrán egy
nem összefüggő gráfot látunk, aminek három komponense van (lásd a következő bekezdést és de níciót). Mindkét
ábrán van többszörös és hurokél is, jelezve, hogy tetszőleges gráfokra de niálható az összefüggőség és a komponens
fogalma, nemcsak egyszerű gráfok esetén.

24.9. ábra

Nem összefüggő gráfokat is lehet az összefüggőség szempontjából osztályozni úgy, hogy megnézzük, hány „darabból”
állnak.

24.10. ábra

Egy gráf egy maximális összefüggő részgráfját komponensnek mondjuk. Maximálisan összefüggő részen azt értjük,
hogy összefüggő, de a gráf bármelyik további csúcsát hozzá véve, már nem összefüggő, azaz nem bővíthető úgy, hogy
összefüggő marad. Más szóval a komponensből nem vezet él a gráf további, rajta kívül eső csúcsaihoz.
Szélsőséges esetben egy komponens állhat egyetlen hurokél nélküli pontból; ezt izolált pontnak nevezzük.
A gráf egy élét hídélnek (vagy elvágó élnek) mondjuk, ha törlésével az őt tartalmazó komponens összefüggősége
megszűnik, és így a gráf komponenseinek a száma eggyel nő. Egy pontot elvágó pontnak mondunk a gráfban, ha azt és
a belőle kiinduló éleket törölve nő a gráf komponenseinek a száma.

Nem nehéz belátni a következő tételt.

Minden gráf egyértelműen felbontható komponensekre. Így egy gráfot az is jellemez, hogy hány komponense van.
Véges gráfnak (csúcsainak és éleinek a száma is véges) magától értetődően csak véges sok komponense lehet.

Példa kettő, illetve négy komponenst tartalmazó gráfra (24.11a és 24.11b ábra).

24.11. ábra

Megjegyzés. Az előző fejezet végén emlegetett izomor a esetén az itt de niált fogalmak is megmaradó mennyiségek.
Tehát az összefüggőség vagy a komponensek száma invariáns az izomor ára nézve, illetve ha egy gráfban három
hídél van, akkor a vele izomorfban is annyi. Egyébként úgy is fogalmazhatunk, hogy a gráfelmélet olyan fogalmakat
alkot, s azokkal foglalkozik, amelyek az izomor ára nézve invariánsak.

Egy nevezetes, sokszor használható, egyszerű összefüggés egy gráf és a komplementere között a következő.

Bármely egyszerű gráf vagy a komplementere összefüggő.

Igazolása egyszerű. Ha a gráf nem összefüggő, akkor k ≥ 2 komponense van (amelyek között nincsen él). Ekkor a
komplementer biztosan összefüggő, hiszen két különböző komponensbe eső pont között a komplementerben közvetlen él
fut, az egy komponensbe eső két pont pedig egy tetszőleges másik komponens bármelyik pontján keresztül 2-hosszú úton
elérhető. Azaz ekkor a komplementer lesz összefüggő.

24.12. ábra

A 24.12. ábrán a gráf élei a folytonos vonalak, a komplementernek csak néhány élét rajzoltuk be, amelyek már
összefüggővé teszik azt. Ezek a vékony pontozott élek. Láthatóan az eredeti gráf két komponensből áll, s a szövegnek
megfelelően látszik, hogy ekkor a komplementere viszont valóban összefüggő.
Egy érdekes és fontos kérdés, hogy ha n pontunk van, akkor minimum hány él kell ahhoz, hogy összefüggő gráf
szülessen. A válasz a következő tétel.

Összefüggő n pontú gráfnak legalább n – 1 éle van. Azaz ha egy gráfban túl kevés az él, akkor nem lehet összefüggő. Ez
nem fordítható meg, egy gráf lehet nem összefüggő még akkor is, ha éleinek száma jóval több, mint n – 1.

Igazolása (a pontok száma szerinti) teljes indukcióval lehetséges: 1 pontra triviális, 2 pont esetén legalább 1 él kell, hogy
összefüggő legyen. Ha igaz n pontra, akkor vegyünk egy tetszőleges (n + 1) pontú összefüggő gráfot. Belátható, hogy ennek
minden esetben létezik olyan pontja, melyet a hozzá kapcsolódó élekkel együtt elhagyva a keletkező n pontú gráf is
összefüggő. Ez a pont legalább 1 éllel kapcsolódik a többihez. Az így keletkezett n pontú gráfnak feltételünk szerint legalább
(n – 1) éle van, így hozzávéve az elhagyott pontot és éleket legalább n élünk lesz.
Példa minimális összefüggő gráfra minden egyszeres kötést tartalmazó kémiai molekula, vagy megfelelő úthálózat,
vagy egy családfa stb. Sok élű, nem összefüggő gráfra példa a 24.13. ábra, ahol 7 pontunk van, s az élek száma 9. Azaz
3-mal is több a minimálisan szükséges 6-nál, mégsem összefüggő. Egy szélsőséges helyzet egyszerű gráfok esetén, ha
van egy (n – 1) pontú teljes gráfunk és egy izolált pont. Ekkor az összes pontok száma n, míg az éleké jóval több mint
(n – 1), hiszen (n – 1)(n – 2)/2.

24.13. ábra

A következő feladat megoldásában a minimális összefüggő gráfra vonatkozó állítást használjuk.

Példa. Az ország 11 nagyobb városát távközlési kábelekkel akarják összekötni. Bármely két város között maximum
egy kábel épülhet. 46 kábelt már kiépítettek. Biztos, hogy már használható a kábelrendszer bármely két város között
(akár egy harmadik városon keresztül)?
Igen, hiszen a 11 pontú teljes gráf éleinek száma 55. Ha 46 kábel-összeköttetés már elkészült, akkor csak 9 van hátra.
Ez a komplementer gráf (tehát a még meg nem építettek gráfja) nem lehet összefüggő az előző tétel miatt, hiszen
akkor legalább 10 éle lenne, és csak 9 van. Ekkor viszont a komplementere, azaz a megépítettek (gráfja) összefüggő
hálózatot alkot.

Egy másik irányból is közelíthetünk a minimális élszámú összefüggő gráfokhoz. Nem minimális élszámú az olyan
összefüggő gráf, amiben van „körút”, azaz két pont között többféle úton is eljuthatunk.

Körnek mondjuk a gráf olyan útját, amelynek kezdő- és végpontja azonos. Hasonló módon beszélünk körvonalról és
körsétáról. Az előbbi olyan vonal, az utóbbi pedig olyan séta, melynek kezdő- és végpontja azonos.

Indirekt úton könnyen igazolható, hogy ha egy gráfban nincs kör, akkor van olyan csúcsa, melynek fokszáma
legfeljebb 1. Ennek felhasználásával és indukcióval igazolható a következő.

Az olyan n pontú gráfnak, melyben nincs kör, legfeljebb n – 1 éle van. Azaz ha túl sok az él egy gráfban, akkor nem lehet
körmentes. Ugyanakkor egy gráf tartalmazhat kört még akkor is, ha jóval kevesebb éle van, mint n – 1. (Vegyünk hozzá
egy körhöz izolált pontokat.)

A legutóbbi 2 tételben szereplő eredményeket összevetve adódnak az alábbiak, melyek segítségével egy újabb nagyon
fontos gráfosztályt nevezünk meg.

Ha egy n pontú összefüggő gráfnak éppen maximális számú, azaz n – 1 éle van, akkor nincs benne kör (azaz a gráf fa).
Hasonlóan, ha egy n pontú, kört nem tartalmazó gráfnak éppen minimális számú, azaz n – 1 éle van, akkor összefüggő.

Könnyen igazolható ezeknek a megfordítása a Frobenius-tétel és azon állítás felhasználásával, mely szerint ha a G
gráfban van független teljes élhalmaz, akkor G csúcsainak száma páros:

Ha egy n pontú gráf összefüggő és nincs benne kör, akkor n – 1 éle van.

Az ilyen gráfokat fáknak nevezzük.

A fa olyan gráf, amely összefüggő és nincs benne kör. A fentiek értelmében ezzel egyenértékű de níció a fára, hogy az
egy olyan gráf, amely minimális számú éllel összefüggő, illetve az is, hogy olyan gráf, amely maximális számú éllel
körmentes.

Megjegyzés. Könnyen meggondolható, hogy szintén a fentiekkel ekvivalens de níció a következő: olyan gráf,
melynek bármely 2 pontja között pontosan 1 út vezet. A fentiek alapján nyilvánvaló, hogy bármely n csúcsú fának n –
1 éle van.

Ha a körmentességet nem kapcsoljuk az összefüggőséggel, akkor egy új fogalmat kapunk. Mivel ha nem összefüggő a
gráf, akkor komponensekre bomlik, amelyek már összefüggők, és mivel a körmentesség nyilván minden egyes
komponensre is igaz, ezért mondhatjuk, hogy a körmentes gráfok komponensei fák. Mivel az erdő éppen fákból áll, ez
indokolja a következő fogalom nevét.

A körmentes gráfokat erdőnek mondjuk. Speciálisan az egykomponensű erdő a fa. Tehát a gráfelméletben a fa is
erdő, nemcsak bizonyos számú fa esetén használjuk az erdő fogalmát.

Megjegyzés. Az erdő szó helyett használatos a liget is.

Sokszor fontos lesz egy gráf minimális összefüggő részgráfjait vizsgálni. Erre is bevezetünk egy fogalmat.

Egy összefüggő gráf favázán egy olyan részgráfját értjük, amely körmentes, összefüggő, és a gráf minden csúcsát
tartalmazza. Belátható, hogy minden összefüggő gráfnak van faváza, és ha nem összefüggő a gráf, akkor az egyes
komponenseinek lesz faváza. Szokás ezt a favázat feszítőfának is, tetszőleges gráf esetén a komponensek egy-egy
feszítőfáiból álló gráfot pedig feszítőerdőnek mondani.

A fának egy másik egyszerű karakterizációja, hogy összefüggő és minden éle hídél. Hiszen, mivel minimális
összefüggő gráf, ha bármelyik élét töröljük, akkor szétesik komponensekre. Továbbá megfordítva is igaz, hiszen ha egy
összefüggő gráfban van kör, akkor a kör egyik éle sem lehet hídél, mivel azt törölve az összefüggőség megmaradna. Így
adódik a következő tétel.

Egy gráf akkor és csak akkor fa, ha összefüggő és minden éle hídél.

Nevezetes példák fákra a nyílt láncú szénhidrogének szerkezete (24.14a–c ábra), minimális összefüggő hálózatok
(telefon-, elektromos- és gázvezeték-hálózatok). Itt említhető meg az előző fejezetben bemutatott gráfos modellje a
permutációknak (23.1. fejezet).

Érdekes kérdés, hogy hány különböző (egymással nem izomorf) n pontú fa létezik. Speciális esetben, ha ismerjük az
egyes csúcsok fokszámait, akkor mit mondhatunk? Ezekre a kérdésekre általános válasz a mai napig nincs. Egy példa a
telített szénhidrogének, ahol ismerjük az egyes csúcsok fokszámait (vegyérték). A 24.14a–c ábra mutatja a sorozat első hat
elemét.
Az ábrákon a CH4, C2H6, C3H8, C4H10, C5H12, C6H14 molekulák lehetséges izomerjeit látjuk, ahol a szénhez négy, a
hidrogénhez mindig egy kapcsolódás van (ezt mondják vegyértéknek). Tehát ez esetben olyan speciális fák számát
keressük, amik meghatározott számú első- és szintén meghatározott számú negyedfokú pontokból állnak, és az azonos
fokú pontok között nem teszünk különbséget. Az egyszerűség kedvéért csak a szénatomokat jelöljük, az élek másik vége,
ahol nincs betű, a hidrogént jelöli. Az első három molekula esetén csak egy-egy lehetőség van. A negyedikből két darab van,
egy lineáris és egy elágazó. A következőből már három. Végül az utolsó, hatodik molekula már ötféle lehet. Látszik, hogyan
bonyolódik a helyzet. A felsorolást a szénlánc maximális hossza szerint végeztük. A 24.14a ábrán CH4, C2H6, C3H8, C4H10
lehetséges változatait láthatjuk, a 24.14b ábrán a három lehetséges C5H12 molekulát, míg a 24.14c ábrán az öt lehetséges
C6H14 molekulát.
24.14. ábra

A folytatás elemszámai még egy ideig meghatározhatók, de általános képlet nem ismert. Válasz arra a némileg
módosított kérdésre van, amikor számozott pontú különböző fák számát szeretnénk megtudni, ahol a pontok száma adott,
de az egyes pontok fokszámai nem. (Itt akkor tekintünk „azonosnak” 2 számozott fát, ha az azonos sorszámú pontok azonos
sorszámúakkal vannak éllel összekötve.) Ez nem modellezi a fentihez hasonló kémiai szituációkat, de konkrét személyek
vagy objektumok esetén lényeges lehet. Például nem mindegy, hogy hat különböző település között hogyan épül ki egy
minimális összefüggő hálózat, azaz milyen lehetséges fák vannak, ha nemcsak izomor a erejéig számolunk, mint a fenti
kémiai molekulák esetén, hanem a csúcsok számozottak, azaz megkülönböztettek. Erre vonatkozik egy nevezetes tétel.

Cayley tétele. A számozott (azaz megjelölt) n csúcsú különböző fák száma pontosan nn–2.

A bizonyítás többféle gondolatmenettel is elvégezhető, de mindegyik nagyon bonyolult. Egyik talán legszemléletesebb
módja a Prüfer-kódokkal történik (lásd a 24.8. fejezetben), ami egyben fák számítógépes tárolását is lehetővé teszi.
A számozatlan csúcsú fák esete, mint már említettük, megoldatlan, de azért legalább némi eredmény van azt illetően,
hogy milyen intervallumban lehet a megoldás. Jelöljük Fn-nel az n számozatlan csúcsú egymással nem izomorf fák számát
(most a fokszámok nem adottak). Ekkor igaz a következő:

(24.2)

illetve egyszerűbb megjegyezni az n > 30 esetén érvényes egyszerűbb egyenlőtlenséget: 2n ≤ Fn ≤ 4n–1.


Az alsó korlát nyilván abból származik, hogy n csúcsot n!-féleképpen lehet megszámozni, ugyanakkor a csúcsokat
permutálva kaphatunk az eredetivel „azonos” fát, és így a számozott csúcsú fák számát ezzel osztva alsó becslést kapunk. A
második, egyszerűbb egyenlőtlenség alsó határa ebből a Stirling-formula alkalmazásával és egy egyszerű becsléssel adódik.
A felső korlát egy szép gondolatból határozható meg, amellyel fákat tárolhatunk. Vegyünk egy n pontú G fát, és nevezzük ki
G egyik pontját gyökérpontnak. Rajzoljuk le G-t élmetszés nélkül, ez egy fával mindig megtehető (mivel egy fában nem
lehet sem teljes ötszög, sem három ház és három kút típusú részgráf, lásd 24.4. fejezetben), és így is szoktuk ábrázolni.
Képzeljük most el a gráf éleit (a papírra merőleges) falaknak.

A gyökértől indulva „járjuk körbe” a gráfot úgy, hogy a „fal” mindvégig jobb kéz felől legyen; ekkor minden élen
pontosan kétszer megyünk át. Nevezzük lépésnek a körút egy élre eső szakaszát. Mivel a fának n – 1 éle van, ezért 2(n –
1) lépés után érünk vissza a gyökérponthoz. Minden olyan lépés esetén, amikor a gyökértől távolodunk, akkor írjunk le
egy 1-est, és amikor közeledünk, egy 0-t. Így egy 2(n–1) hosszúságú „01” sorozatot kapunk, amit szokás a fa planáris
kódjának nevezni. (Egy gráfban 2 pont távolságának a köztük lévő legkevesebb élből álló út éleinek a számát nevezzük.)
Egy ilyen bejárást mutatunk be a 24.15. ábrán, ahol egy csillag jelöli a gyökérpontot, és egy bejárást mutatnak a
nyilazott szaggatott szakaszok. Az ábra planáris kódja eszerint a következő: 1111100100011011010000.

24.15. ábra

A legfontosabb állítás, melynek egy lehetséges bizonyítása Lovász L.–Pelikán J.–Vesztergombi K.: Diszkrét matematika
című könyvében olvasható (Typotex, Budapest, 2006, 162.), a következő:

Bármely számozatlan fát egyértelműen meghatározza a planáris kódja.

Példa. Legyen a planáris kód a következő: 1101101001100100. Mivel 16 hosszú, ezért ez egy 9 pontú fa lesz, 8 éllel (mert
ezek számának kétszerese a kód hossza). A megoldás a 24.16. ábrán látható.

24.16. ábra

Mivel a planáris kódok száma 22(n+1) = 4n–1, ezért ennél több fa biztos nem lehet. Sajnos ezek között lehetnek bőven
izomorfak, mert egy fának több különböző planáris kódja is lehet attól függően, hogy melyik csúcsát választjuk gyökérnek,
illetve hogy merre megyünk. Így a pontos számot ebből nem lehet megmondani, de ez egy felső korlát. Ezzel beláttuk a
(24.2) összefüggést.
Megjegyzésként elmondható, hogy a felső korlát még javítható, hiszen csak azok a planáris kódok jöhetnek szóba, ahol

a 0-k és 1-esek száma azonos (igaz ebből van a legtöbb), azaz a felső korlát javítható: -re. Ami nagyobb n-ekre
ismét a Stirling-formulát használva:

Ezen túl még a magyar származású Pólya György Fn aszimptotikus viselkedését is meghatározta, anélkül hogy
bármilyen képletet ismernénk a számozatlan csúcsú fák számára:

(24.3)

ahol a és b két valós, bonyolult módon de niált konstans, értékük néhány tizedesjegyre: a = 0,5349…; míg b = 2,9557…

Minimális összköltségű feszítőfák keresése

Minimális összköltségű feszítőfák keresése


Legyen adott egy összefüggő gráf, s minden éléhez rendeljünk egy valós számértéket. Például, ha egy elektromos hálózatot
vagy más hálózatot akarunk települések között létrehozni, akkor célszerű az élekre azt a költséget írni, amibe a kapcsolat
létrehozása kerül. Ha most egy minimális összefüggő hálózatot akarunk létrehozni, akkor nyilván egy feszítőfát kell
választanunk. Fontos kérdés, hogy a költséget hogyan lehet minimalizálni. Erre vonatkozik a Kruskaltól származó, ún.
mohó algoritmus vagy Kruskal-algoritmus. Ennek leírása a következő:

„Mohó algoritmus”
1. Válasszuk ki a legolcsóbb élt. (Ezt megépítjük.)
2. Folytassuk tovább ismét a legolcsóbbal, ha ez a már kiválasztott élekkel nem alkot kört.
3. Ha kört alkot, akkor hagyjuk ki, s vegyük azt a következő legolcsóbbat, amellyel még körmentes marad a hálózat.
4. Ezt addig folytassuk, amíg elérünk a feszítőfa utolsó éléig. (Ha a gráf n pontú volt, akkor az n – 1-edik élig.

Belátható a következő tétel:

A Kruskal-féle mohó algoritmus a gráf egy minimális értékű feszítőfáját szolgáltatja.

Megjegyzések
1. A bizonyítás nem túl bonyolult, még középiskolai jegyzetben is megtalálható „optimista eljárás” megnevezéssel.
(Lovász L.–Pelikán J.–Vesztergombi K.: Kombinatorika az általános és középiskolai matematikai szakkörök
számára. Typotex, 2003, 89.)
2. Egy másik algoritmus is célra vezet. Ebben sorban töröljük a legdrágább éleket, amíg csak összefüggő marad a
hálózat. Ha egy él törlésével szétesne, akkor azt meghagyjuk, és a következő legdrágábbat töröljük és így tovább,
amíg egy fa nem marad a végén. Belátható, hogy ez éppúgy egy minimális költségű feszítőfához vezet (,,
pesszimista eljárás”).
Példa a Kruskal-algoritmusra. Legyen egy 7 pontú teljes gráfunk s hozzá az élköltségeket tartalmazó mátrix.
Kövessük végig az algoritmust, amíg meg nem találjuk a minimális értékű feszítőfát. A sorban megépítendő éleket
jelöljük a mellékelt gráfon az építés menetét jelző sorszámmal (24.17. ábra).
Megjegyzés. Ha nem teljes a gráf, akkor a nem létező élekhez a legdrágább él költségénél eggyel nagyobb számot írva
és ezeket az éleket hozzávéve kapunk egy teljes gráfot, ami az alábbi mátrixhoz hasonlóan csak a főátlóban tartalmaz
0-kat, és persze szimmetrikus erre, hiszen két település között „mindkét irányban” ugyannyiba kerül az él
megvalósítása. E gráf minimális költségű feszítőfája nyilván megegyezik az eredetiével.

24.17. ábra

Megjegyezzük, hogy szaggatott élekkel olcsóbb vagy ugyanilyen árú lett volna a hálózat. Viszont tovább kellett volna
építeni, mert nem feszítőfa (hiszen kört tartalmazott volna, és így vagy nem lett volna összefüggő, vagy több élt
kellett volna „megépíteni”). A CG él ára 6 egység, és mégis kimaradt, helyette a 7 egységárú BD él került, mert CG a
már kiválasztott olcsóbb BC és BG élekkel kört alkotott volna, ezért átugrottuk. Hasonló igaz CF élre is (CBGFC kör
lett volna), helyette választottuk EG élt, ami ugyan drágább, de nem jön létre kör. Végül EG egy árban van AB és AC
élekkel, így azokat is választhattuk volna, csakhogy AB esetén ABDA kör lenne, míg AC esetén ACBDA kör lenne. Így
csak EG választható, és ezzel kész is vagyunk. A teljes költség: 3 + 4 + 4 + 5 + 7 + 8 = 31 egység. Ennél olcsóbb a tétel
szerint nem lehet.
Természetesen biztonsági okokból sokszor többet építenek meg, hiszen ha a feszítőfában egy él kiesik, sérülés vagy
utak esetén pl. baleset miatt, akkor a hálózat már nem bejárható, így sokszor néhány nem túl drága élt mint
biztonsági tényezőt még megépítenek, megszüntetve ezzel a körmentességet. Általában az úthálózatoknak legfeljebb
a legalsóbb rendű részei fák (lásd „zsákfaluk” esete, ami a világvégét jelenti), általában sok lehetőség van valahonnan
valahová eljutni.
Ha a minimális költségű feszítőfa egyértelmű, azaz minden lépésben csak azt lehet tenni, amit az algoritmus szerint
elvégzünk, akkor az említett második algoritmus, amelyikkel a legdrágább éleket törölve, de mindig összefüggőnek
hagyva a maradék gráfot dolgozunk, ugyanehhez vezet. Ha nem egyértelmű a szituáció, azaz több egyenlő minimális
költségű feszítőfa van, akkor a két algoritmus különböző feszítőfákhoz vezethet. Például az előbb vizsgált 7 pontú
gráfban ez az algoritmus (hosszabb, mint a másik, hiszen ott 6 élt kellett megépíteni, itt viszont törölni kell 21 – 6 = 15
élt, ami több munka) ugyanarra a gráfra vezet. Felsoroljuk a törölt éleket: BF, DG, CD, DE, BE, AE, AF, AG, CE, DF, EF,
AB, AC, CF (EG helyett, mert akkor szétesne, ha azt törölnénk, ugyanígy BD-vel is), CG. A maradék gráf: AD, BC, BD,
BG, EG, FG. Ez a fa éppen a Kruskal-algoritmussal kapott feszítőfa.
24.3. A gráfok bejárásai
Az eredeti königsbergi probléma megoldása egy általános tétel következménye, amit előzzön meg a rövidebb leírhatóság
miatt két de níció.

Egy gráf Euler-vonala egy olyan vonal, amely minden élét érinti (pontosan egyszer).
Amennyiben a vonal kezdő- és végpontja megegyezik, akkor Euler-körvonalról beszélünk.

Megjegyzés. Természetesen csúcsokon akárhányszor keresztülmehetünk, az egyszeri megkötés csak az élekre


vonatkozik. Euler-vonal tehát nem szükségképpen, sőt általában nem út, illetve az Euler-körvonal általában nem
kör. Ennek ellenére a szakirodalomban használatos az Euler-út, illetve az Euler-kör megnevezés is, némileg
pontatlanul, illetve félrevezetően.

Azt a gráfot, amelyet végig lehet járni egy Euler-vonal mentén, Euler-féle gráfnak vagy röviden Euler-gráfnak
mondjuk.

Euler-tétel. Ha egy összefüggő gráfban kettő kivételével minden pont foka páros, akkor létezik Euler-vonal a gráfban,
de Euler-körvonal nem létezik. A két páratlan fokú csúcs lesz a kezdő- és a végpont. Amennyiben minden pont foka
páros, akkor Euler-körvonal is létezik, azaz a vonal kezdő- és végpontja azonos lesz.
Fordítva is igaz, ha egy gráfban van Euler-vonal, de nincs Euler-körvonal, akkor a gráf összefüggő, és kettő kivételével
minden csúcs foka páros, míg ha a kezdő- és a végpont megegyezik, azaz Euler-körvonal van a gráfban, akkor minden
pont foka szükségképpen páros, és nyilván ekkor is összefüggő a gráf.

Ez a tétel választ ad arra a problémára is, hogy az íróeszköz felemelése nélkül mikor rajzolható le úgy egy gráf a síkba,
hogy minden élét csak egyszer rajzoljuk meg, és a teljes gráf ábrája elkészül. Lásd például a boríték esetét (bal oldali kép,
nem rajzolható le) vagy Mohamed kézjegyét (jobb oldali kép, lerajzolható) a 24.18. ábrán.

24.18. ábra

A tétel igazolásának egyik iránya egyszerű. Ha több mint két páratlan fokú pont van, akkor nem lehet bejárni, hiszen
minden bejárás esetleg a kezdő- és a végpont kivételével minden pontba „bemegy” és „kijön”, azaz páros sokszor érinti. 1
páratlan fokú csúcs nem lehet, 0 páratlan fokú csúcs esetén visszaérünk a kiindulópontba, 2 esetén nem. Ha a gráf nem
összefüggő, nyilván szintén nem tartalmazhat Euler-vonalat. Az elégségesség egy kicsit nehezebb, de bízunk az olvasóban.
E kérdéskör általánosítása a kínai postás problémája, mely tetszőleges összefüggő gráfban keres a gráf minden élét
tartalmazó vonalat a lehető legkevesebb élismétléssel.
Ha egy gráf bejárásánál minden él helyett minden ponton szeretnénk pontosan egyszer végigmenni, szintén élek
mentén haladva, Hamilton-út vagy Hamilton-körút létezésének és keresésének, illetve a Hamilton-féle gráfok
karakterizálásának a problémájával foglalkozunk, ahol tehát olyan sétát keresünk, mely minden csúcsot pontosan egyszer
tartalmaz. Az „utazó ügynök problémáját” még W. R. Hamilton, a neves ír matematikus és zikus vetette fel, s néhány
konkrét esetben meg is oldotta, de általános szükséges és elégséges feltételt, mint az előbbi Euler-féle probléma esetén, a
mai napig nem sikerült adni.
A probléma a következő. Egy ügynök végig akar járni néhány nagyvárost, hogy bemutasson egy mintadarabot, és
vevőket toborozzon. Adott, hogy mely városok között van közvetlen légi kapcsolat, amit használhat, hogy lehetőleg
gyorsan végezhessen. Megtervezhető-e úgy az útja, hogy minden várost pontosan egyszer látogat meg (és a végén ugyanoda
ér vissza)?
A gráfok nyelvére lefordítva, adva van egy n pontú gráf, ahol két pont akkor van éllel összekötve, ha van köztük
közvetlen légi összeköttetés. A kérdés, hogy bejárhatók-e a gráf csúcsai úgy, hogy mindenhol pontosan egyszer járunk (és a
végén ugyanoda érkezünk, ahonnan indultunk). Azaz egy olyan utat (kört) keresünk, amelyre az összes csúcs felfűzhető.
Az utazó ügynök problémáján szokták érteni azt az általánosabb szituációt is, amikor a városok közötti távolság vagy az
egyikből a másikba jutás költsége is számít, és a legrövidebb vagy legkisebb összköltségű olyan utat (körutat) keressük, ami
minden várost pontosan egyszer érint.
A gráfok nyelvén ez azt jelenti, hogy a gráfon kívül adott egy, az élek halmazán értelmezett úgynevezett
költségfüggvény is, és keressük a legkisebb összköltségű és minden csúcsot pontosan egyszer tartalmazó utat (kört).

Egy gráf Hamilton-féle, ha van benne az összes csúcsot tartalmazó út. Ezt Hamilton-útnak nevezzük. Ha az út még
záródik is, azaz a kezdő- és a végpont megegyezik, akkor Hamilton-körről beszélünk.

Néhány tételt ismerünk meg a továbbiakban, amelyek garantálják, hogy egy gráfban van Hamilton-kör. Ezek mind
csak elégséges feltételek. Erre mutatunk példákat is.

G. A. Dirac tétele. Ha egy n ≥ 3 pontú egyszerű gráf minden pontjának foka legalább , akkor van benne Hamilton-
kör.

Példa arra, hogy a feltétel nem szükséges. Vegyünk egy szabályos n-szöget, amelynek a csúcsai a gráf csúcsai és az
oldalai legyenek a gráf élei. Itt a feltétel nyilván nem teljesül, ha legalább ötszöget választunk (hiszen ekkor minden
pont foka csak 2), és mégis triviális Hamilton-út, sőt körút is van benne.

A bizonyítás a leghosszabb út elvére épül; megmutatható, hogy ha a leghosszabb út nem tartalmazná az összes csúcsot,
akkor a fokszámokra tett feltevés alapján lehetne bővíteni egy csúccsal az utat, ami ellentmond a maximalitásnak.
További elégséges feltételeket adó tételek, amelyek az előző tétel valamilyen élesítéséből adódnak:

Pósa L. tétele. Legyen n > 2 egész szám. Ha egy n pontú egyszerű gráfban bármely -nél kisebb pozitív k esetén a k-
nál nem nagyobb fokú pontok száma kisebb, mint k, akkor a gráfnak van Hamilton-köre.

Ez azt jelenti, hogy a Hamilton-kör létezésének elégséges feltétele, hogy a gráfban 0 darab 0 vagy 1 fokszámú, legfeljebb
1 darab 2 fokszámú, legfeljebb 2 darab 3 vagy annál kisebb fokszámú, legfeljebb 3 darab 4 vagy annál kisebb fokszámú stb.,

legfeljebb darab vagy annál kisebb fokszámú csúcs van, a többi csúcs fokszáma pedig legalább

.
Egy másik hasonló tétel

Erdős P. tétele. Legyen n > 2. Ha egy n pontú egyszerű gráfban bármely -nél kisebb pozitív egész k esetén a k-
nál nem nagyobb fokú pontok száma legfeljebb k, akkor a gráfnak van Hamilton-útja.

Megjegyzés. Erdős eredeti cikkét lásd link

És végül

O. Ore tétele. Ha egy n ≥ 3 pontú egyszerű gráfra teljesül, hogy bármely kettő olyan pontot véve, amelyek nincsenek
éllel összekötve, azok fokszámainak az összege legalább n, akkor van a gráfban Hamilton-kör.

Megjegyezzük, hogy a fenti tételek között az alábbi logikai kapcsolat áll fenn: (Pósa tétele) ⇒ (Ore tétele) ⇒ (Dirac
tétele).
A fordított irányú összefüggések (szükséges feltételek) közül néhány könnyen adódik, mind általános esetben, mind
speciális típusú gráfok esetén. Például nem összefüggő gráfnak biztosan nincs Hamilton-útja, illetve páros gráfok közül a
páratlan csúcsszámúakban nincs Hamilton-kör (de Hamilton-út lehet). Hasonlóan könnyű belátni, hogy egy fában nincs
Hamilton-kör, illetve hogy pontosan mikor tartalmazhat egy fa Hamilton-utat. Ezek belátását az olvasóra bízzuk. Külön
kiemeljük a következőt:

Ha egy G gráfban létezik Hamilton-kör, akkor minden S ⊂ V (a csúcsok halmaza) esetén a G-ből S (és az S-beli végpontú
élek) törlésével keletkező gráf komponenseinek száma legfeljebb |S|.

Bizonyításának alapgondolata, hogy egy út egy pontját törölve az 1 vagy 2 útra esik szét.

Megjegyzés. A tétel segítségével lehet bizonyítani elegánsan, hogy egy 4 x 4-es tábla egy lóval (huszár) nem járható
be. A tábla gráfja az, amelyikben azokat a mezőket reprezentáló csúcsokat kötjük össze, melyek lóugrással elérhetők
egymásból. Így a gráfnak 16 csúcsa lesz, az éleket a 24.19. ábrán látjuk. Ha a belső 4 „b” jelű pontot elhagyjuk, akkor a
maradék gráf komponenseinek száma 6, így még Hamilton-út sem lesz, nemhogy kör.
24.19. ábra

Végül néhány irányított gráfokra vonatkozó tétel (a de níciókat lásd a 24.5. fejezetben, ahol az irányított gráf
de nícióját és fontosabb tulajdonságait adtuk meg).

Kőnig D. tétele. Egy legalább 2 pontú teljes gráf bármilyen irányítása révén nyert irányított gráfnak van irányított
Hamilton-útja.

Megjegyzés. Ez utóbbi tétel azt jelenti, hogy ha van egy körmérkőzéses bajnokság, azaz mindenki mindenkivel
játszik, akkor biztosan felsorolhatók úgy a csapatok egyetlen láncban, hogy mindenki legyőzte a közvetlenül
mögötte állót. Ennél majd élesebbet is állítunk a 24.5. fejezetben, Az újságíró paradoxona cím alatt.

Ha egy n pontú egyszerű irányított gráf minden pontjának be-foka is és ki-foka is legalább , akkor van a gráfnak
irányított Hamilton-köre.

Ennek általánosítása a következő:

Ha egy n pontú egyszerű, irányított, erősen összefüggő gráf minden pontja ki-fokának és be-fokának összege legalább
n, akkor van a gráfnak irányított Hamilton-köre.

Az erősen összefüggő gráf fogalmát lásd a 24.5. fejezetben, az irányított gráfok tulajdonságainál. Az előző tétel
módosításával létrejövő Hamilton-út létezésére vonatkozó tétel a következő:

Ha egy n ≥ 2 pontú egyszerű, irányított gráf minden pontja ki-fokának és be-fokának összege legalább n – 1, akkor van a
gráfnak irányított Hamilton-útja.

Megjegyzés. Ebben a tételben nem kell az erősen összefüggő feltétel, mint az előző Hamilton-körös tételben.

Véletlen gráfok Hamilton-köreire vonatkozóan lásd a 24.7. fejezetet.

24.4. Speciális gráfok és tulajdonságaik

Páros gráfok
Síkba rajzolható gráfok
Extremális gráfok

Páros gráfok
Egy, a mindennapokban gyakran előforduló gráftípust de niálunk a következőkben.

Egy gráfot párosnak mondunk, ha csúcsainak halmazát két diszjunkt részhalmazra bonthatjuk úgy, hogy élek
legfeljebb a két különböző részhalmazba tartozó csúcsok között futnak, míg az egy részhalmazba esők között nincsen
él.

Megjegyzés. Ha az említett két különböző részhalmaz között sem fut él, tehát egyetlen éle sincs a gráfnak, akkor az
üres gráfot kapjuk, amely szintén páros.
A 24.20. ábrán látunk egy páros gráfot; a két csúcshalmazt, melyeken belül nem fut él, az ábrázolás struktúrája miatt
szokás alsó és felső csúcshalmaznak mondani.

24.20. ábra

Ha a G páros gráf, akkor bármely K köre éleinek a száma páros.

Járjuk végig egy K kör éleit. Ekkor felváltva leszünk a páros gráf alsó vagy felső csúcsaiban, tehát mindig páros sok él
után érünk ugyanarra a „szintre”. Mivel a kör kezdő- és végpontja azonos, ezért ha pl. a felsőből rajtoltunk, akkor oda is
kell visszafutnunk, s ezért az élek száma valóban páros.

Példák
1. Legyenek a gráf csúcsai egy adott cég álláshirdetéseire jelentkezett személyek és a meghirdetett munkahelyek!
Éllel kössük össze a jelentkezett személyeket azokkal a munkahelyekkel, amit képesítésük és jelentkezésük
alapján betölthetnek. Ez páros gráf lesz, hiszen személyeket egymással nem köt össze él, sem munkahelyeket
egymással. Él csupán személyek és munkahelyek között megy.
2. Hasonló a helyzet egy házasságközvetítő irodában, ahová fér ak és nők jelentkeznek. Mindenki felírja az adatait
és elképzeléseit. Azokat kötjük össze éllel, akik elvileg a kívánságaik alapján összeismertethetők. Mivel egyelőre
Magyarországon még egynemű házasság nem köthető, ezért fér t fér val, illetve nőt nővel biztosan nem kötünk
össze. Így a jelentkezők fenti módon elkészített gráfja biztosan páros lesz.
További példákat találhatunk a következő művekben: Ore, O.: Gráfok és alkalmazásaik. Gondolat, Budapest, 1972
vagy Andrásfai B.: Ismerkedés a gráfelmélettel. Tankönyvkiadó, Budapest, 1985. Lásd még a 24.20. ábrát, ahol a
két diszjunkt csúcshalmazt egy-egy ellipszissel jelöltük.

Páros gráfok esetében az egyik legfontosabb kérdés, hogy létrehozható-e a gráfban olyan párosítás, hogy a fenti első
példában vagy mindenki kap munkát (ez a munkavállalók szemszöge), vagy minden munkahelyet sikerül a jelentkezőkkel
betölteni (ez a munkaadó szempontja). Akármelyikre, de egyszerre csak az egyikre ad szükséges és elégséges feltételt a
következő tétel.

Kőnig–Hall-tétel. Ha egy páros gráfban teljesül az a feltétel, hogy bármiképpen választunk ki néhány, akár az összes
csúcsot az egyik részhalmazból (C1-ből), s vesszük az összes belőlük induló élek végpontjait a másik részhalmazban (C2-
ben), ennek számossága legalább akkora, mint ahány pontot C1-ből választottunk, akkor létezik C1-et fedő párosítás a
páros gráfban. Azaz egy kételemű komponensekből álló egyszerű részgráfot tudunk megadni úgy, hogy C1 minden
csúcsa szerepel benne. Igaz ennek a megfordítása is.

Megjegyzés. Szokás ezt a feltételt házasodási feltételnek vagy Hall-feltételnek is mondani.

Ha azonos a jelentkezettek száma a munkahelyek számával, akkor esetleg mindkét szempont is teljesíthető. Kérdés,
hogy ez mikor áll fenn. Erre van egy nevezetes tétel, amely szükséges és elégséges feltételt biztosít a kívánt párosítás
létezésére.

Frobenius tétele. Ha egy páros gráfban teljesül a Hall-feltétel valamelyik részhalmazra (C1-re vagy C2-re a fenti
jelölésekkel), és a 2 részhalmaz számossága egyenlő, akkor létezik teljes párosítás a páros gráfban. Azaz egy olyan
kételemű komponensekből álló egyszerű részgráfot tudunk megadni, mely a gráf összes csúcsát tartalmazza. Itt is igaz
ennek a megfordítása is.

Példa. Legyen a gráfunk a 24.21. ábrán látható páros gráf. Itt van teljes párosítás, mert teljesülnek a feltételek (egy
lehetségest vastag vonallal be is rajzoltunk). Ezzel szemben a 24.22. ábra gráfján nem teljesül a házasodási feltétel, így
nem is érdemes keresni párosítást (az A, B, C jelű „alsó” csúcsokhoz, bár három van, mégis csak két csúcs tartozik,
ami azt jelenti, hogy nem teljesül a tétel feltétele, így biztosan nem lehet párokra bontani a páros gráfot).
24.21. ábra

24.22. ábra

A Frobenius-tétel bizonyítása a König–Hall-tétel felhasználásával egyszerű. Az utóbbi bizonyításhoz érdemes bevezetni


további, más területen is használatos fogalmakat.

A G páros gráf éleinek M részhalmazát párosításnak mondjuk, ha M semelyik két élének nincs közös végpontja.
Tetszőleges gráfban a párosításnak ugyanez a meghatározása, azzal a kiegészítéssel, hogy annak egyik eleme sem lehet
hurokél.

Más szóval, M elemei párosítják (egymáshoz rendelik) a G páros gráf bizonyos csúcspontjait. M-et teljesnek mondjuk,
ha G összes csúcsát párosítja, más szóval, ha M lefedi G csúcsait, s maximálisnak, ha nem létezik M-nél nagyobb elemszámú
M′ párosítása G-nek. Triviális, hogy a teljes párosítás maximális. Valójában a Frobenius-tétel azt mondja ki, hogy ha
teljesül a Hall-feltétel, akkor a maximális párosításban a gráf minden csúcsa szerepel, azaz teljes.

A G gráf éleinek M halmazát függetlennek is nevezzük, ha M semelyik két élének nincs közös végpontja, és nem
tartalmaz hurokélt. Az M független élhalmazt (párosítást) teljesnek mondjuk, ha M végpontjai között G minden pontja
szerepel.

Az M elemei két azonos számosságú részhalmazra bontják G pontjait, ezért nyilván igaz a következő állítás.

Ha a G gráfban van független teljes élhalmaz (teljes párosítás), akkor G csúcsainak száma páros.

Az M független élhalmazt (párosítást) maximálisnak mondjuk, ha G éleinek nincs olyan M′ részhalmaza, mely
független, és több eleme van, mint M-nek. Az M élhalmaz számosságát általában v(G)-vel vagy fémax(G)-vel jelöljük. A
G gráf csúcspontjainak valamely S részhalmazát lefogó ponthalmaznak nevezzük, ha G bármely élének legalább az
egyik végpontja S-ben van. S számosságát szokás τ(G)-vel vagy lpmin(G)-vel jelölni.

Kőnig D. tétele. Bármely páros gráf független éleinek maximális száma egyenlő az éleket lefogó pontok minimális
számával.
Azaz a jelöléseinkkel: v(G) = τ(G) (fémax(G) = lpmin(G)).

Az, hogy v(G) ≤ τ(G) (fémax(G) ≤ lpmin(G)), a de nícióból közvetlenül adódik (tetszőleges gráf esetén is). Kőnig Dénes és
Egerváry Jenő az 1930-as években kifejlesztettek egy módszert a maximális független élek meghatározására, melyet magyar
módszernek is szoktak nevezni. E módszerrel lehet a fordított irányú τ(G) ≤ v(G) egyenlőtlenséget bizonyítani.

24.23. ábra

Maximális számú élt tartalmazó párosítás keresése a magyar módszerrel. Tegyük fel, hogy a páros gráfunk csúcsai A,
illetve B nem üres diszjunkt halmazoknak az elemei, és A-ból A-ba, illetve B-ből B-be nem fut él. Az A és B halmazok
pontjait két egymással párhuzamos egyenesen vettük fel az ábrán, a szemléletesség kedvéért. Legyen adott G-nek egy M
párosítása (M lehet üres is). G-nek valamely e1 e2, e3, e4, …, ek élekből álló útját alternáló útnak fogjuk nevezni, ha az élek
felváltva elemei E(G)/M-nek, illetve M-nek, például e1 ∉ M, e2 ∈ M, e3 ∉ M, e4 ∈ M. A 24.23. ábrán vastag vonallal jelöltük
M éleit, valamint A1-gyel és B1-gyel az A, illetve a B csúcshalmazok M által le nem fedett pontjaiból álló halmazokat. Ha
találunk olyan e1 e2, e3, e4, …, ek alternáló utat, amely B1-ből indul és A1-ben végződik (ezt javító útnak is szokták nevezni),
akkor az e1 e2, e3, e4, …, ek út M-ben lévő, azaz páros indexű éleit cseréljük ki a nem M-ben lévő, azaz páratlan indexűekre.
Az így nyert új M′ párosítása G-nek, és M′-nek eggyel több eleme van, mint M-nek. A következő lépésben meghatározzuk az
M′-höz tartozó A1′, B1′ halmazokat, és keresünk olyan alternáló utat, mely B1′-ből indul és A1′-ben végződik. Az alternáló út
páros indexű éleit M′-ből törölve és M′-höz csatolva az út páratlan indexű éleit, a G-nek egy M ˝ párosítását kapjuk, melynek
eggyel több eleme van, mint M′-nek.
Az algoritmust nyilván addig lehet folytatni, amíg találunk a fent említett típusú alternáló utakat. Megjegyezzük, hogy
természetesen egyetlen B1 és A1 között futó él is megfelelő alternáló út, az algoritmust ezen éleknek a párosításhoz való
hozzávételével szokták kezdeni. Meg lehet mutatni, hogy amikor már nem lelünk alkalmas alternáló utat, akkor az utolsó
lépésben kapott M(n) párosítás maximális párosítás. Ezt az algoritmust könnyű programozni, s ezzel lehet maximális
párosításokat keresni számítógéppel. Ezzel a módszerrel lehet igazolni Kőnig Dénes tételét, másrészt ezzel a módszerrel
lehet bizonyítani a Kőnig–Hall-tételt is, megmutatva, hogy ha alternáló úttal nem növelhetjük tovább az M(n) párosítást
M(n+1)-re, akkor nem lehet, hogy M(n) ne fedje le B-t. A téma egy felbukkanását lásd még a 24.6. fejezetben.

Síkba rajzolható gráfok


A „három ház és három kút” gráf, a teljes ötszög. Egy vékony lapon megvalósítandó elektromos hálózatok (ilyenek a
vékony lapra felvitt integrált áramkörök a számítógépekben vagy egyéb mai modern elektronikai eszközben, pl.
mobiltelefon, tv, CD-lejátszó stb.) esetén fontos kérdés, hogy meg lehet-e rajzolni úgy a hálózatot, hogy két „él”, azaz
összeköttetés ne metssze egymást, mert akkor ott zárlat keletkezne. Autóutaknál ez nem olyan fontos, mert ott alul- és
felüljárókkal megoldhatók a kereszteződések.

Egy gráfot síkba rajzolhatónak mondunk, ha létezik olyan síkbeli reprezentációja, ahol a csúcsoknak a sík
meghatározott pontjai, míg éleinek a megfelelő csúcsokat összekötő folytonos, önmagukat nem metsző síkgörbék
(nem szükségképpen egyenes szakaszok!) felelnek meg, és két síkgörbének csak a csúcsokban van közös pontja, azaz
másutt nem metszik egymást.
A síkba rajzolható gráfok megfelelő reprezentációi a síkot tartományokra osztják, melyeket a csúcsoknak megfelelő
síkbeli pontok és az éleknek megfelelő síkgörbék határolják, keletkezik egy végtelen tartomány is.

Ezek a tartományok fontos szerepet kapnak később a 24.8. fejezetben, az Euler-féle poliéderformula cím alatt.
Két nevezetes, síkba nem rajzolható viszonylag egyszerű gráf a teljes ötszög, azaz az ötpontú teljes gráf (24.24. ábra) és
az ún. „három ház és három kút” gráf (24.25. ábra). Utóbbi gráfban három pont mindegyike másik három pont
mindegyikével össze van kötve. Állítás, hogy ezek nem síkba rajzolható gráfok.

24.24. ábra

24.25. ábra

A 24.24. ábrán azt látjuk, hogy az A és a D jelű csúcsokat bárhogyan is akarjuk összekötni, mivel a már behúzott élek
által elszeparált részekben vannak, így mindenképpen metszeni fogjuk a tizedik éllel valamelyik már behúzott élt. A 24.25.
ábrán ugyanez a probléma a III és az 1 jelű ház, illetve kút között lép fel. A szaggatott éleket bárhogy húzzuk is be,
mindenképpen létrejön egy metszéspont, azaz nem lehet lerajzolni. Ez illusztráció csupán, hiszen az elején önkényesen
kezdtük el rajzolni az éleket; a teljes bizonyítást, felhasználva, hogy egy gráf pontosan akkor síkba rajzolható, ha gömbre
rajzolható, később az Euler-féle poliédertételből vezethetjük le. (Lásd a 24.8. fejezetben, az Euler-féle poliéderformula című
rész végén szereplő alkalmazást.)
Ha egy gráf élét egy legalább 2 hosszú úttal helyettesítjük, vagy fordítva, egy, a végpontjai kivételével csupa 2 fokszámú
csúcsból álló útját egy éllel helyettesítjük, az így kapott gráf nyilván pontosan akkor síkba rajzolható, ha az eredeti gráf is.
Sőt, ha G′ úgy keletkezik G-ből, hogy csak e fenti két transzformációt alkalmazom egymás után valahányszor, abban az
esetben is G pontosan akkor rajzolható síkba, ha G′ is. Ekkor a G és G′ gráfokat egymással topologikusan izomorfaknak
mondjuk. (Minden gráf önmagával is topologikusan izomorf.) A síkba rajzolhatóság tehát egy, a topologikus izomor ára
nézve megmaradó (invariáns) tulajdonság. Nem síkba rajzolhatók tehát a teljes ötszöggel vagy a „három ház és három kút”
típusú grá al topologikusan izomorf részgráfok sem. Meglepő, hogy minden más gráf viszont igen.
Ezt foglalja össze egy nevezetes, Kuratowskitól származó tétel:

Egy gráf akkor és csak akkor síkba rajzolható, ha sem a teljes ötszöggel, sem a „három ház és három kút” grá al
topologikusan izomorf részgráfot nem tartalmaz.

A tétel egyik iránya nyilvánvaló, hiszen mivel ezzel a két grá al topologikusan izomorf gráfok nem síkba rajzolhatók,
ezért ha a gráf ilyet tartalmaz részgráfként, akkor már az a része sem „rajzolható le a síkba”, tehát nyilván maga a gráf sem
síkba rajzolható. A nehezebb felét most sem bizonyítjuk, a sík bizonyos topológiai tulajdonságait kell kihasználni.
Ez egy viszonylag könnyen ellenőrizhető feltétel, így viszonylag nagy gráfokról is el lehet dönteni, hogy síkba
rajzolhatók-e. Még egy érdekes tétel a következő, amely a folytonos vonalat szakaszra redukálja.

Fáry–Wagner tétele. Ha egy G egyszerű gráf síkba rajzolható, akkor van olyan síkba rajzolása is, melynél minden él
egyenes szakasz.

Ez azt jelenti, hogy ha valahogyan síkba rajzolható, akkor ez „sokszögszerűen” is megtehető. Azaz olyan szakaszokkal,
melyek egymást sehol sem metszik. Ezt a tényt felhasználjuk a fák planáris kódjánál a 24.8. fejezetben, A Prüfer-kód és a
számozott pontú fák cím alatt.

Extremális gráfok
A gráfelméletben gyakran előfordulnak olyan kérdések, amikor azt vizsgáljuk valamilyen típusú gráfok körében, hogy
rendelkezik-e a gráf valamely tulajdonsággal, például hogy tartalmaz-e valamilyen speciális típusú részgráfot. Egy ilyen
eset a következő: rögzített csúcsszámú gráfok körében hogyan függ az élek számától az, hogy biztosan tartalmaz-e a gráf
kört. Láttuk, hogy ha valamely élszámra biztosan van a gráfban kör, akkor nagyobb élszámra is, és így ha valamely élszám
esetén lehetséges a körmentesség, akkor kisebb élszám esetén is. Ebből kifolyólag a fő kérdésünk az volt, melyik az a
legnagyobb élszám, amire még lehet körmentes a gráf. Így jutunk el a fákhoz. Azt is mondhatjuk, hogy a fa-gráf a probléma
szempontjából a „szélsőséges”, extrém eset, a „fordulópont”. Az ilyen típusú problémákat ezért extremálisnak vagy
szélsőérték-problémáknak nevezzük, és a „szélsőséges” számértékkel rendelkező gráfot pedig extrém gráfnak. A
továbbiakban két újabb ilyen problémakörbe pillantunk be.

Ramsey-típusú problémák
Háromszögek gráfokban – egy Turán-típusú probléma

Ramsey-típusú problémák

Feladat. Egy legalább hattagú társaságban mindig igaz, hogy vagy van három ember, akik kölcsönösen ismerik
egymást, vagy van három, akik közül egyik sem ismeri a másikat (24.26. ábra) (mindkettő egyszerre is előfordulhat).
Az ismeretségről feltesszük, hogy kölcsönös. Ezt a gráfok nyelvére a következőképpen fordíthatjuk le. Ha egy
legalább hatpontú gráfot veszünk, akkor vagy a gráfban, vagy a komplementerében van háromszög (háromcsúcsú
teljes gráf).
A megoldás egyszerű, ha észrevesszük, hogy bármely pontját kiválasztva az ismeretségeket ábrázoló gráfnak, abból
vagy legalább 3 él indul, vagy legfeljebb két él indul (ebben az esetben a komplementerben lesz három kiinduló él).
Válasszunk ki egy tetszőleges pontot! Első esetben, ha az ebből kiinduló legalább 3 él végpontjai között van egy él,
akkor megvan a háromszög, ha nincs, akkor viszont megvan az üres háromszög, akik nem ismerik egymást, ami a
komplementerben alkot háromszöget. Második esetben, ha a komplementer gráfban indul három él a kiválasztott
pontból, akkor ezek másik három végpontjára lehet az előbbi gondolatmenetet elvégezni. Ha közöttük a
komplementerben egyetlen él is fut, akkor megvan a komplementerben a háromszög, s így találtunk az eredetiben
üres háromszöget, vagy ha a három pont között a komplementerben nincs egyetlen él sem, akkor viszont az
eredetiben találtunk háromszöget (lásd a vastag vonallal jelölt háromszögeket a jobb oldali komplementer gráfban).

24.26. ábra

Az előbbi feladat elmondható úgy is, hogy ha egy legalább hatpontú teljes gráf éleit két különböző színnel színezzük,
azaz minden gráfél valamelyik színű, akkor bárhogyan is színeztük ki, van egyszínű háromszög. Ötpontú teljes gráfra nem
igaz ugyanez, például ha a teljes ötszög „oldalait” az egyik, „átlóit” a másik színnel színezzük, akkor nem lesz benne
egyszínű háromszög. Így nyilván ötnél kevesebb pontú teljes gráfra sem igaz, mert ha igaz lenne, akkor ötpontúra is igaz
lenne, az ugyanis tartalmaz részgráfként minden nála kevesebb pontú teljes gráfot.
Ez azt jelenti, hogy ha két színnel színezzük a teljes gráfok éleit, akkor van egy olyan pozitív egész szám, hogy annál
nagyobb vagy egyenlő csúcsszámúakban bármilyen színezés esetén van vagy ilyen, vagy olyan színű háromszög, esetleg
mindkettő, de az annál kisebb teljes gráfokat lehet úgy színezni, hogy ne legyen. Általánosítva a problémát, kérdés, hogy
tetszőleges m ≥ 2 és k ≥ 2 egész számok esetén létezik-e olyan n egész szám, melyre teljesül a következő. Egyrészt bármely
legalább n csúcsú teljes gráf éleit két színnel színezve, biztosan keletkezik bennük vagy teljes m csúcsú gráf (röviden m-
gráf) csupa azonos színű éllel, vagy teljes k-gráf, melynek minden éle a másik színnel lett színezve, másrészt az n-nél
kevesebb csúcsú teljes gráfoknak van olyan színezése, melyre ez nem igaz (tehát n a legkisebb szám, amelyre igaz). Erre a
kérdésre F. P. Ramsey közgazdász, matematikus adta meg az igenlő választ az 1920-as években. Ezt, illetve ennek
általánosításait nevezzük Ramsey-tételnek.
A továbbiakban elnevezéseket vezetünk be, megemlítünk néhány fontos állítást, köztük e tétel igazolásának főbb
gondolatait, majd becsléseket keresünk ezekre a számokra, melyek létezését állítja tételünk.

Legyen n(m, k) az a legkisebb egész szám, amely azzal a tulajdonsággal bír, hogy ha bármely legalább n(m, k)-pontú
teljes gráf éleit két színnel színezzük, akkor létrejön részgráfként vagy piros teljes m-gráf, vagy kék teljes k-gráf,
amennyiben létezik ilyen szám. Extrém gráfok azok a kétszínű (piros-kék) teljes n(m, k) – 1-gráfok, amelyek nem
tartalmaznak sem piros teljes m-gráfot, sem kék teljes k-gráfot. (Pontosabban azok az n(m, k) – 1-gráfok, melyeknek
nincs teljes m-gráf részgráfjuk és a komplementerüknek nincs teljes k-gráf részgráfjuk.) Az n(m, k) számokat nevezzük
Ramsey-számoknak.

Ezt úgy is lehet fogalmazni, hogy n(m, k) az a legkisebb pozitív egész szám, amelyre igaz, hogy minden legalább n(m,
k)-pontú gráf tartalmaz teljes m-gráfot, vagy k páronként független pontot (azaz komplementere tartalmaz teljes k-gráfot),
lásd a bevezető feladatot. A bevezető feladat megoldása szerint tehát n(3, 3) = 6. A két szín felcserélésével kapjuk a következő
összefüggést.

Minden m ∈ N és k ∈ N esetén, ha n(m, k) létezik, akkor n(k, m) is, és n(m, k) = n(k, m).

Mondhatjuk, hogy a teljes 1-gráf, ami mindössze 1 pont, minden éle piros vagy éppen kék, hiszen nincsen éle. Ezért n(1,
k) = 1. Ha egy teljes gráf nem tartalmaz piros teljes 2-gráfot, az azt jelenti, hogy nincs piros éle.

Tehát n(2, k) minden k természetes számra létezik és n(2, k) = k.

Érdekes, hogy mindössze néhány esetben ismerjük a Ramsey-számok pontos értékét. (Ezért fogunk a továbbiakban
csak becsléseket keresni.) Néhány ilyen eset:

Fontosak még a következő észrevételek.

Minden k természetes számra igaz, hogy n(3, k) ≥ 3 (k-1).

Ha n(m – 1, k) és n(m, k – 1) létezik, akkor n(m, k) is létezik, és fennáll, hogy n(m, k) ≤ n(m – 1, k) + n(m, k – 1). Továbbá,
ha mind n(m – 1, k), mind n(m, k – 1) páros, akkor n(m, k) < n(m – 1, k) + n(m, k – 1) (szigorúan kisebb).
A fentiek segítségével igazolható a téma következő két alapvető tétele.

Ramsey tétele. Minden m ∈ N és k ∈ N esetén n(m, k) létezik.

Igazolása egy érdekes indukciós okoskodás következménye, melynek alapgondolata a bevezetőben leírt
gondolatmenethez hasonló.

Erdős–Szekeres-tétel: Minden m ∈ N és k ∈ N esetén .

Ez a tétel ugyanúgy indukcióval igazolható, mint a létezést kimondó Ramsey-tétel, felhasználva, hogy

Ebből adódik m = k esetén: .


További nevezetes egyenlőtlenségek a következők:

Erdős P. tétele. Minden m ≥ 3 esetén . Ez tehát egy alsó becslés.

Az előzőek alapján:

(24.4)

A következő sejtés azonban eddig megoldatlan:

létezik határérték.
További általánosítása a problémakörnek, hogy ha egy teljes gráfot k színnel színezünk, akkor legkevesebb hány pontú
teljes gráf esetén van biztosan egyszínű teljes k + 1 részgráf (két szín esetén a teljes 3-gráf a háromszög). Még tovább
általánosítva, ha k színnel színezünk, legkevesebb hány pontú G teljes gráf esetén van biztosan első színű teljes m1-gráf,
második színű teljes m2-gráf, …, k-adik színű teljes mk-gráf közül legalább egy részgráfként G-ben.

Háromszögek gráfokban – egy Turán-típusú probléma


A következőkben pusztán háromszög létezésére vonatkozó összefüggéseket adunk meg, rögzített csúcsszámú gráfok esetén
(egy-két konkrét extrém grá al). Végső célunk olyan adott csúcsszámú gráfot keresni, amely a lehető legtöbb éllel még nem
tartalmaz háromszöget (az extrém gráf megtalálása, mint extremális problémáknál általában, ha van ilyen).

Ha egy G egyszerű gráf pontjainak száma 2k (k ≥ 2), és minden P pontjára igaz, hogy gr(P) > k, akkor a gráf tartalmaz
háromszöget.

Eszerint, páros csúcsszám esetén, ha létezik extrém gráf, akkor annak kell hogy legyen olyan csúcsa, melynek a
fokszáma legfeljebb a csúcsok számának a fele. A többi csúcs fokszámáról semmit nem állít, így az élek számáról sem;
páratlan csúcsszám esetére pedig nem mond semmit a tétel.

Háromszöget nem tartalmazó n pontú és e élű G egyszerű gráfra , ahol α(G) jelöli a gráf független
pontjainak maximális számát.

Itt már nyertünk egy felső becslést extrém gráfunk éleinek a számára (ha létezik). Egy további tétel, amely már éles
felső becslést ad az élek számára, és ismertet is ennek megfelelő extrém gráfot, a következő, amelyik a Turán-tétel egy
speciális esete.

Háromszöget nem tartalmazó n pontú és e élű G egyszerű gráfra , ha n páros szám, illetve

, ha n páratlan. Egyenlőség csak az páros gráf esetén áll fenn, ha az n páros


szám és az páros gráf esetén, ha az n páratlan. (Lásd 24.27. ábrát n = 9 esetén.)

Ebben a gráfban nincs háromszög, páros gráf, és éleinek száma 20, ami éppen a formula felső korlátja. Annak
igazolása, hogy más (ezzel nem izomorf) extrém gráf nincs, nehezebb.

24.27. ábra

Végül vizsgáljuk az „elég sok” élű gráfokat aszerint, hogy legalább milyen hosszú utakat (köröket) tartalmaznak.

Ha egy legalább 2k + 1 (k pozitív egész szám) pontú összefüggő egyszerű gráf minden pontjának foka legalább k, akkor
van a gráfban 2k hosszúságú út.

Ha egy n-pontú egyszerű gráf nem tartalmaz k-nál hosszabb utat (k ≥ 1), akkor éleinek számára fennáll, hogy
. Extrém gráfok (amelyekre egyenlőség áll) rögzített k mellett azok, amelyeknek minden komponense teljes (k + 1)-
gráf; más extrém gráf nincs.

Ugyanúgy, ha egy gráfban elég sok él van, akkor lesz benne elég hosszú kör is. Erről szól fejezetünk utolsó tétele.

Ha egy n-pontú egyszerű gráf nem tartalmaz k-nál hosszabb kört (k ≥ 2), akkor éleinek számára fennáll, hogy

. Extrém gráfok (amelyekre egyenlőség áll) azok az összefüggő gráfok, amelyeknek minden tagja teljes
k-gráf; más extrém gráf nincs (lásd a 9-pontú 3-nál hosszabb kört nem tartalmazó extrém gráfot a 24.28. ábrán).

24.28. ábra

24.5. Irányított gráfok


Gyakran előfordul, hogy nem kölcsönös, hanem egyirányú kapcsolatokat szeretnénk modellezni, melyek egy halmaz
elempárjai között fennállnak. Ha egyirányú utcáink vannak, vagy egy mérkőzésen a győzelmet is reprezentálni akarjuk,
olyan modellt érdemes használni, ahol – a korábbi fejezetekben tárgyalt gráfmodellünket kiegészítve – az éleknek iránya is
van; az utóbbi feladatban például a legyőzött felé mutat az irány. Nem mindegy tehát, hogy melyik pont van elöl az élt
reprezentáló pontpár tagjai közül, vagyis nem rendezetlen, hanem rendezett párok felelnek meg az éleknek.

Legyen adva egy diszjunkt P és E halmaz, valamint egy leképezés, amely E minden eleméhez egy P-beli – nem
szükségképpen különböző elemekből álló – rendezett párt rendel hozzá. A G = (P, E, ) rendezett hármast irányított
gráfnak nevezzük, ahol a P halmaz elemeit a gráf csúcspontjainak vagy röviden pontjainak, míg az E halmaz elemeit a
gráf irányított éleinek nevezzük, melyeknek – nem szükségképpen különböző – kezdő- és végpontjaik vannak.

Ismét megadjuk az irányított gráfok lehetséges ábrázolásait a már tárgyalt gráfok mintájára. Irányított gráfot
megadhatunk:
I. Ha megadjuk a P, E halmazt és a leképezést.
Példa: P = {A, B, C, D}, E = {e, f, g, h} és a : E ↦ P × P leképezés pedig:
, ahol a rendezett párokat 〈X, Y〉 jelöli.
II. Lehet rajzzal is megadni a síkon, ahol a csúcsokat a sík jelölt pontjai, az éleket pedig a pontok között vezető irányított
folytonos, és önmagukat nem metsző görbék reprezentálják. Az előbbi gráf ezen a módon a következőképpen néz ki (24.29.
ábra); a hurokél irányítását nem jelöltük, mert ott érdektelen (akár azt is mondhatjuk, hogy a hurokélt nem irányítjuk).

24.29. ábra

III.Számítástechnikában egy négyzetes mátrixszal lehet megadni egy irányított gráfot. A sorai és az oszlopai egyaránt a P
halmaz elemeivel indexelendők, míg az aij mátrixelem értéke k ∈ N, amely 0, ha nincs irányított él a Pi pontból a Pj
csúcspontba, 1, ha van egy irányított él, és ha többszörös irányított él van, akkor k ≥ 2.

Ismét az I.-beli gráfot adjuk meg ezen a módon: . Számítógépben általában így reprezentálódik egy
irányított gráf. Jegyezzük meg, hogy ez a mátrix már nem feltétlen lesz szimmetrikus, hiszen „iránya” van az éleinek.
Ha szimmetrikus a irányított gráf mátrixa, az azt jelenti, hogy tetszőleges A és B gráfbeli pontok esetén, pontosan
akkor megy él A-ból B-be, ha B-ből is megy él A-ba (az ábráján minden vonal kétfelé irányított). Ekkor (és csak ekkor) -
nek kölcsönösen egyértelműen megfeleltethető egy azonos csúcsszámú G (irányítatlan) gráf, melyben azok a pontok
vannak éllel összekötve, melyeknek megfelelők között megy (mindkét irányba) él -ben. Az (irányítatlan) gráfokat így
„tekinthetjük” szimmetrikus mátrixú irányított gráfoknak, s ekkor azokra mint speciális irányított gráfokra gondolhatunk
(például egy csupa kétirányú utcából álló úthálózat).

Az irányított gráfok tulajdonságai


Gráfok irányításai
Az újságíró paradoxona
Hogyan szervezzünk körmérkőzéses bajnokságot?

Az irányított gráfok tulajdonságai

Egy irányított gráf egy pontjának ki-foka az a száma, ahány irányított él abból a pontból indul. Hasonlóan a pont be-
foka az a szám, ahány élnek ez a pont a végpontja.

Minden irányított gráfban a ki-fokok összege is és a be-fokok összege is az élek számát adja.

Példa. Az alábbi gráfban hat csúcs van, s a ki-fokok sorozata: 2, 1, 3, 1, 3, 2; hasonlóan a be-fokok sorozata 1, 2, 2, 2, 2, 3.
Látható, hogy mindkettő összege 12, s ez éppen az élek száma. Egyébként egy kettős él van a 24.30. ábrán, ellentétesen
irányítva a P3-mal és a P6-tal jelölt pontok között.
24.30. ábra

Egy irányított gráfot egyszerűnek nevezünk, ha nem tartalmaz sem hurokélt, sem két olyan irányított élt, melyeknek
ugyanaz a kezdő- és a végpontjuk. Kétszeres éleket tehát tartalmazhat, de csak ellentétes irányítással.

Egy irányított gráf éleinél eltekinthetünk a kezdő- és végpont megkülönböztetésétől, azaz eltávolíthatjuk az
irányítását, s ekkor egy egyértelműen meghatározott G (irányítatlan) gráfot kapunk. Fordítva, egy (irányítatlan) gráf éleit
is irányíthatjuk, ekkor azonban általában sokféle irányított gráfot kaphatunk, pontosan 2e–h-félét, (e az élek, h a hurokélek
száma) attól függően, hogy hogyan irányítottuk az éleket.
Egy irányított gráfban (irányítatlan) élsorozatnak nevezzük az irányított élek egy olyan részhalmazát, amely a
megfelelő G irányítatlan gráfban egy sétát alkot.

Ha egy élsorozat irányítása olyan, hogy az irányított élek egymáshoz irányítottan csatlakoznak, akkor irányított
sétáról vagy irányított élsorozatról beszélünk, illetve ha ennek kezdő- és végpontja azonos, akkor irányított
körsétáról. Ha semelyik él nem ismétlődik, akkor irányított vonalról, illetve ha a kezdő- és a végpont megegyezik,
akkor irányított körvonalról van szó. Hasonlóan, a pontismétlés nélküli irányított sétát irányított útnak, illetve
kezdő- és végpontegyezés esetén irányított körnek mondjuk.

Gráfok irányításai
Ha egy teljes gráf éleit valahogyan irányítással látjuk el, akkor bárhogyan is tesszük, mindenképpen lesz benne egy
irányított Hamilton-út, tehát a gráf összes csúcsát tartalmazó irányított út. Ez volt Kőnig Dénes irányított gráfokra
vonatkozó tétele.
Ez azt jelenti, hogy ha egy egyfordulós bajnokság résztvevőit vesszük, akkor mindig fel lehet őket sorolni úgy, hogy a
sorban egymás után következők legyőzték az utánuk állókat. Itt most feltételezzük, hogy döntetlen nem lehet, tehát
például kosárlabda- vagy teniszbajnokság esetén lehet használni ezt az eredményt.
A 24.3. fejezetben további három tételt fogalmaztunk meg irányított Hamilton-utak és Hamilton-körök létezésére
vonatkozóan.
Egy fontos kérdés például egy városi közlekedés egyirányúsításánál, hogy lehet-e az éleket (utcák, hidak) úgy
irányítani, hogy bármely pontból bármely pontba el lehessen jutni irányított éleken (úton) keresztül.

Egy irányított gráfot erősen összefüggőnek nevezünk, ha bármely pontjából bármely másik pontjába el lehet jutni
irányított úton.

Nyilvánvaló, hogy egy erősen összefüggő irányított gráf esetén a megfelelő G irányítatlan gráf összefüggő, tehát
nem összefüggő gráfnak nem létezik olyan irányítása, hogy az így kapott gráf erősen összefüggő legyen, hiszen egy -
beli irányított út irányítás nélküli megfelelője egy út G-ben. Ugyanakkor a G gráf összefüggősége nem elegendő feltétele
annak, hogy erősen összefüggő legyen, és hasonlóan, egy összefüggő gráfnak nem feltétlenül létezik erősen
összefüggő irányítása, hiszen ha egy él hídél az irányítatlan gráfban, akkor azt csak valamerre lehet irányítani, s akkor a
másik irányban nem lehet e két rész között közlekedni.
Összevetve egyrészt azt kaptuk tehát, hogy egy irányított gráf erősen összefüggőségének szükséges feltétele, hogy
G összefüggő legyen, és ne tartalmazzon hidat; másrészt annak, hogy egy gráfnak létezzen erősen összefüggő irányítása,
szükséges feltétele, hogy a gráf összefüggő legyen, és egyik éle se legyen hídél. Igaz az utóbbinak (de csak annak) a
megfordítása is; így kapjuk az alábbi tételeket.

Egy gráf pontosan akkor irányítható úgy, hogy az így kapott irányított gráf erősen összefüggő legyen, ha összefüggő, és
nem tartalmaz hidat.

Ha egy irányított gráf erősen összefüggő, akkor a neki megfelelő G irányítatlan gráf összefüggő, és egyetlen éle
sem hídél.

Megjegyzés. Itt nem teljesül a megfordítás. Ellenpélda egy olyan irányított háromszög, ahol az egyik csúcs felé mutat
mindkét arra illeszkedő él, mert ekkor ebből a csúcsból nem vezet sehova irányított él (út).
A 24.31. ábrán a bal oldali gráf egy irányítása a jobb oldali. Mivel itt mindenhonnan mindenhová eljutunk irányított
út mentén, ezért erősen összefüggő. Látható ez abból, hogy a bal oldali összefüggő, és nincsen hídéle.
24.31. ábra

Az újságíró paradoxona
Egyszer egy sportújságíró észrevette, hogy egy körmérkőzéses bajnokság résztvevőit a következő paradox módon lehet
felsorolni. Legelöl áll az utolsó helyezett, utána következik egy csapat, akit legyőzött, azután egy, a második helyen álló
által legyőzött és így tovább, s végül utoljára a bajnok, akit a sorrendben őt közvetlenül megelőző győzött le. Az ilyen
paradox felsorolás létezésének a szükséges és elégséges feltétele előtt de niáljunk két fogalmat.

Nevezzük alsóháznak a bajnokság végén álló csapatok halmazát, ha ők együttesen sem győztek le egyetlen csapatot
sem az őket a bajnokságban megelőzők közül, és azok halmaza nem üres. Hasonlóan nevezzük felsőháznak a tabella
elején álló csapatok társaságát, ha senki sem győzte le őket az alattuk levők közül (amely halmaz szintén nem üres).

A továbbiakban tegyük fel, hogy a vizsgált bajnokságban nincs döntetlen.

Megjegyzés. E feltétel mellett, ha van alsóház egy bajnokságban, akkor az ezen kívül eső csapatok természetesen
felsőházat alkotnak, tehát ez a két fogalom egymás létezését kölcsönösen tételezi. Ha van az egyik, akkor van a
másik. Vagy egyik sincs.
Példa. Kis módosítással (a döntetlenek miatt szükséges) a futballal is lehet dolgozni. Vegyük egy bajnokság őszi
végeredményét, s ahol döntetlen volt, ott a tavaszi eredmény alapján jelöljük ki a győztest. A táblázatban a csapatok a
bajnokság végeredménye szerint vannak felsorolva, tehát az MTK az első és a DVFC az utolsó helyen áll. Látható,
hogy fel lehet sorolni a csapatokat a paradoxonnak megfelelő módon.

A keresett lánc a következő: DVFC – BHFC – TFC – KRFC – FCF – VSC – ETO – PMFC – DVTK – UTE – DVSC – FCS – REAC
– PSE – ZTE – MTK. Az eredmények rendre: 3 : 1; 2 : 1; 4 : 2; 1 : 0; 2 : 0; 3 : 2; 0 : 0*; 3 : 1; 1 : 0; 2 : 0; 6 : 1; 3 : 1; 4 : 3; 2 : 0; 1 : 0. A *-
gal jelölt eredmény mindkét mérkőzésen döntetlen, de az ETO előrébb végzett, így jobbnak vettük. Az olvasóra hagyjuk
további hasonló lista elkészítését.
E példa után álljon itt a főállítás, amit a sportújságíró paradoxonának mondanak, hiszen elég meglepőt állít, ami csak
„a jobbnak lenni valakinél” reláció tranzitivitásának feltételezése miatt tűnik ellentmondásnak, ez azonban a sportban
nem tranzitív.

Ha egy körmérkőzéses, döntetlent nem tartalmazó bajnokság végeredményét tekintve nem létezik alsó-, illetve
felsőház, akkor mindig fel lehet a csapatokat sorolni a következő módon. Minden csapat legyőzte a felsorolásban
közvetlenül utána következőt, s a sorban első a bajnokság utolsó helyezettje, míg az utolsó a bajnok. Nyilván egyszerre
létezik alsó-, illetve felsőház egy döntetlent nem tartalmazó bajnokságban.

Az világos, hogy miért szükséges feltétele a paradox felsorolásnak az, hogy ne létezzen alsó-, illetve felsőház. Hiszen ha
léteznek, akkor biztosan nem lehet kívánt felsorolás, mivel az utolsóval kezdve egyszer csak elakadunk, legkésőbb, amikor
felsoroltuk az egész alsóházat, mert azok már senkit sem győztek le a bajnokságban előttük levők közül. Az érdekes, hogy
ez elégséges feltétel, s ennek belátását az olvasóra bízzuk, vagy ajánljuk Ore, O.: Gráfok és alkalmazásaik című könyvét
(Gondolat, Budapest, 1972), amelyben elolvasható a tétel bizonyítása.
Hogyan szervezzünk körmérkőzéses bajnokságot?
Egy alapvető kérdés a fentihez hasonló körmérkőzéses bajnokságok esetén, hogy hogyan szervezzük meg a fordulókat. Ha a
csapatok száma páros (és ez az általános), akkor egy fordulón azt értjük, hogy minden csapat játszik valakivel egy
mérkőzést. Nyilván ha a csapatok száma 2n, akkor fordulónként n mérkőzés van. Öszszesen 2n – 1 mérkőzést kell játszania
minden csapatnak, tehát ennyi fordulóban lehet lebonyolítani a bajnokságot. A kérdés, hogy ez megoldható-e mindig. Azaz
nem lesz-e olyan eset, hogy egy fordulót a vége felé nem tudunk megszervezni, mert olyan párosítások lennének, amelyek
már voltak. Be fogunk mutatni egy módszert, amivel megvalósítható, hogy ez ne forduljon elő.
Ha páratlan sok csapat lenne, akkor egy ktív csapatot vegyünk hozzájuk, neve legyen „Pihenőnap”, így már páros
sokan vannak, s aki a pihenővel kerül össze, az abban a fordulóban nem játszik. Egy konkrét párosítás a következő
példában egy 8 csapatos 7 fordulós bajnokság esetén:
1. forduló: 1 : 8; 2 : 7, 3 : 6, 4 : 5
2. forduló: 1 : 7, 2 : 8, 3 : 5, 4 : 6
3. forduló: 1 : 6, 2 : 5, 3 : 7, 4 : 8
4. forduló: 1 : 5, 2 : 6, 3 : 8, 4 : 7
5. forduló: 1 : 4, 2 : 3, 5 : 6, 7 : 8
6. forduló: 1 : 3, 2 : 4, 5 : 7, 6 : 8
7. forduló: 1 : 2, 3 : 4, 5 : 8, 6 : 7
Megfeleztük a 8 csapatot, és először az első 4-hez sorsoljuk a második négyet a párosításban látható szisztéma szerint,
így jött létre az első 4 forduló. Ezután már csak az első négyet egymással és a második négyet egymással kell párosítani, így
kapjuk az utolsó három fordulót, hármat, mert ekkor önmagával senki sem játszhat. Ez könnyen általánosítható, amit itt
most nem adunk meg, de a módszer teljesen hasonló. Lásd még Ore, O.: Gráfok és alkalmazásaik. Gondolat, Budapest, 1972.

24.6. Szállítási problémák modellezése gráfokkal

Hálózati folyamok
A maximális folyam problémája
A maximális folyam problémájának néhány következménye: Menger tételei
A maximális folyam problémájának néhány általánosítása
Minimális költségű folyam – a híres szállítási probléma

Hálózati folyamok
A gráfelmélet II. világháború során történt nagy előrelépése a következő problémák megoldását hozta magával.
Az eredményes hadviselés megkívánja, hogy a hadsereg egységeit szükség esetén gyorsan át tudjuk csoportosítani.
Hasonlóan, logisztikai és áruszállító cégek hatékony működésének feltétele, hogy gyorsan, nagy mennyiségű árut
juttassanak el a gyártóktól a fogyasztókhoz. Ez általában közúton, vasúton, vízi úton és légi úton történhet, kiindulási
helyek és célállomások közötti előre adott, egymással esetleg máshol is találkozó útvonalak mentén. A gyorsaság több
tényező függvénye. Függ az adott útvonalszakaszokon rendelkezésre álló szállítóeszközök számától és azok
befogadóképességétől, melyek együttesen tekinthetők az egyes útvonalszakaszt jellemző mennyiségnek, az útvonalszakasz
kapacitásának. Függ továbbá több útszakasz találkozási helyeinek, azaz a csomópontoknak a kapacitásától, amely a
csomópontot jellemző mennyiség. Ezek a csomópontok városokat, repülőtereket, vasút- és hajóállomásokat jelentenek, de
lehetnek akár egy városon belüli helyszínek vagy az útvonalak egyéb elágazásai is. Fontos probléma az optimális szállítás
meghatározása, vagyis hogy egy folyamatos szállítást feltételezve (mely persze a valóságban mindig csak adott ideig tart,
vagy időközönként ismétlődik) mely útszakaszokon mennyi katonát, árut stb. szállíthatunk egyszerre úgy, hogy adott
időegység alatt a lehető legtöbb érjen célba.
A fenti problémákhoz hasonlóak (főleg azok általánosításai) felmerülnek például vízvezeték-, elektromos, illetve
telekommunikációs vagy egyéb információs hálózatok tervezésekor is. Mindegyik alkalmazásban felmerülnek olyan
problémák, ahol a kiindulási és célállomásokat, illetve a csomópontokat egy gráf csúcsainak, a közöttük futó
útvonalszakaszokat (vagy vezetékrészeket, információs csatornákat stb.) pedig a gráf éleinek tekintve modellezhetjük egy
irányított grá al a feladatot. Ennek a gráfnak az éleihez, illetve a csomópontokat reprezentáló csúcsaihoz pozitív valós
számokat rendelünk, melyek a megfelelő útvonalszakaszon (vezetékrészen) szállítható, illetve a megfelelő csomóponton
átküldhető mennyiségek mérőszámainak felső határai. (A további általánosításokat lásd később.)
Az optimális szállításra vonatkozó tételek, illetve az azt eredményező algoritmus L. R. Ford, Jr. és D. R. Fulkerson
amerikai matematikusokhoz fűződnek, de meg kell jegyezni, hogy már a század elején, ha nem is ebben a formában, de
logikailag ekvivalens módon K. Menger osztrák matematikus is felfedezte eredményeik lényegét. Az ő munkájában Kőnig
Dénes fedezett fel egy hiányosságot, melyet könyvében pótolt, s azóta bizonyítását, illetve a bizonyítás során vázolt
algoritmikus eljárást magyar módszernek nevezik. Ez sok más területen is felhasználható, lásd a 24.4. fejezetben, a Páros
gráfok cím alatt. (Ehhez az ott bevezetett fogalmakon túl még kettőre van szükség.)

A maximális folyam problémája


Induljunk ki eleinte abból a speciális szituációból, amikor egyrészt csak egy kiindulási és egy célállomásunk van, másrészt
a csomópontok kapacitásától is eltekintünk, feltételezve, hogy azok bármilyen nagyok lehetnek. Látni fogjuk, hogy az
általánosabb esetek erre visszavezethetők. A probléma megoldásának vázlatos ismertetéséhez ismerjük meg először a
használatos elnevezéseket.

Ha adott egy irányított gráf, s és t két egymástól különböző kijelölt pontjával (s a kiindulási, t a célállomásnak felel
meg) és egy éleinek halmazán értelmezett pozitív valós értékű c függvény (az útvonalszakaszok kapacitásai az
egyes élekhez rendelt értékek), akkor a rendezett négyest hálózatnak nevezzük.
s-et forrásnak, t-t nyelőnek mondjuk, de szokásos még s-re a termelő és t-re a fogyasztó elnevezések használata is. A c
függvényt kapacitásfüggvénynek, egy élhez rendelt értékét az él kapacitásának nevezzük.
Megjegyezzük, hogy szokás hálózatként ennél általánosabb struktúrákat is de niálni, melyek közül néhányról a
maximális folyam problémájának általánosítása kapcsán később említést teszünk.

Példa. Ez egy lehetséges modellje például egy vízvezeték-rendszernek, ahol az élek kapacitásai mutatják, hogy az
élekkel reprezentált csővezetékrészeken időegység alatt legfeljebb mennyi víz folyhat át. Annak leírására, hogy
ténylegesen mennyi víz folyik át a rendszer működésének különböző állapotaiban, bevezetünk újabb fogalmakat.
Nyilvánvaló, hogy amennyiben nem számolunk például csőrepedéssel, feltehetjük, hogy a vezetékek valamely
találkozási pontjánál (a forrást és a nyelőt leszámítva) amennyi víz befolyik a különböző csöveken, pontosan
ugyanannyi folyik tovább.

Folyamnak nevezünk egy hálózat éleinek halmazán értelmezett pozitív valós értékű f függvényt, ha esetleg a forrás és
a nyelő kivételével bármely v pontjára teljesül, hogy (megmaradási feltételek) és 0 ≤ f(e) ≤
c(e) a hálózat minden élére, ahol c a kapacitásfüggvény.
Szokásos a megengedett folyam elnevezés is, és ekkor a folyamra az utóbbi feltételt nem követelik meg. Ez értelmet
nyerhet például akkor, ha lehetőség van az élkapacitások növelésére, például egy esetleges felújítás folyamán.

Célunk olyan folyam keresése, amelynél a nyelőbe beáramló víz mennyiségéből levonva az onnan visszaáramló víz
mennyiségét, az így kapott érték a lehető legnagyobb. Ha a csővezetékek találkozási helyeinek halmazát két részre osztjuk
úgy, hogy az egyikben a forrás, a másikban a nyelő van, és megnézzük, hogy a két rész közötti vezetékekben összesen
mennyi víz áramlik a nyelőt tartalmazó rész felé, levonva a forrást tartalmazó felé áramló mennyiséget, akkor nyilván
ennél nem lehet nagyobb a keresett érték.

Osszuk a hálózat csúcsainak halmazát két diszjunkt részre, S-re és T-re úgy, hogy S az s forrást, T a t nyelőt
tartalmazza. Ekkor az összes S és T között futó hálózatbeli élek alkotta V halmazt s – t vágásnak nevezzük.
értéket a V s – t vágás kapacitásának nevezzük, és c(V)-vel jelöljük. Egy V s – t vágás kapacitása tehát a
V-beli, azaz az S-beli pontból T-beli pontba mutató élek kapacitásainak összege.
Egy adott f folyam és V s – t vágás esetén a értéket nevezzük az f folyam V vágáson felvett
értékének.

Nyilvánvaló a következő megállapítás.

Adott hálózatban, bármely folyam és bármely V s – t vágás esetén a folyam V vágáson felvett értéke
legfeljebb annyi, mint a vágás kapacitása.

Ha egy tetszőleges V s – t vágás és egy szintén tetszőleges f folyam esetén a T\{t} halmaz v csúcsaira felírt

megmaradási feltételeket mint egyenleteket összeadjuk, és az így kapott új egyenlet mindkét


oldalához hozzáadjuk az f folyam azon s – t vágáson felvett értékét, mely vágásnál T = {t}, tehát a

értéket, akkor a következőt kapjuk. Egyrészt az f folyamnak minden, a T\{t} halmaz két pontja
között futó élén felvett értéke pontosan egyszer szerepel pozitív és pontosan egyszer negatív előjellel az így kapott egyenlet
bal oldalán, másrészt a T\{t} és t közötti éleken vett folyamértékeket, szintén a bal oldalon, pontosan egyszer vettük pozitív

és pontosan egyszer negatív előjellel. Így ezekkel egyszerűsítve a bal oldalon a különbség,
tehát az f folyam V vágáson felvett étéke marad, a jobb oldalon pedig a érték. Ebből következik
az alábbi állítás.

Egy hálózat bármely folyamára igaz, hogy annak bármely vágáson felvett értéke ugyanannyi. Ez az érték tehát csak a
folyamtól függ, a vágástól nem.

Ezt a közös, értéket nevezzük a folyam értékének, és v(f)-fel jelöljük.

Mint korábban említettük, adott hálózat (és így adott vágások és adott vágáskapacitások) esetén olyan folyam
megtalálása a célunk, amelynél ez az érték a legnagyobb, tehát maximális értékű folyamot keresünk. Az eddigiek
értelmében igaz a következő fontos tétel:

Bármely hálózat esetén max{v(f) : f folyam} ≤ min{c(V) : V s – t vágás}.

Kérdés, hogy a határ minden hálózat esetén elérhető-e, és létezik-e algoritmikus módszer a maximális értékű folyam
megtalálására. A válasz mindkettőre igen, és Ford–Fulkerson-tétel és algoritmus néven váltak ismertté. Ezek precíz
belátását az olvasóra bízzuk, csupán az ezekhez szükséges további fogalmakat vezetjük be, kimondjuk az ide kapcsolódó
főbb tételeket, és vázlatosan ismertetjük a bizonyítási gondolatmenetek fő pontjait, illetve az említett algoritmust,
melynek első lépéseként egy tetszőleges f1 folyamot veszünk. (A minden élen 0 értéket felvevő folyam például tökéletesen
megfelel.)

Legyen adott egy hálózat és ezen egy f folyam. Ha létezik a -nek megfelelő G irányítatlan gráfban egy
olyan s – t út, melynek minden e élére teljesül, hogy amennyiben annak -beli irányítása az út mentén t felé mutat,
akkor f(e) < c(e), ha pedig s felé, akkor f(e) > 0, akkor ezen út -beli megfelelőjét javító útnak nevezzük a
hálózatban, az f folyamra nézve.
A javító út mentén tehát, ismét vízvezeték-hálózatos példánkkal szemléltetve, minden élen vagy kevesebb víz folyik t
felé, mint amennyi legfeljebb folyhat, vagy folyik visszafelé víz (esetleg mindkettő).

Ha találunk egy ilyen utat valamely fk folyam esetén, akkor keressük meg a „t felé mutató” e élekre a c(e) – fk(e), az „s
felé mutató” e élekre pedig az fk(e) számok legkisebbikét, és vegyük e kettő közül is a nem nagyobbat (mk). Ezután az előbbi
éleken ennyivel növeljük, az utóbbiakon pedig ennyivel csökkentsük a folyam szerinti értéket (míg a többi élen hagyjuk
változatlanul azt). Így kapunk egy új fk+1 folyamot – hiszen minden élhez rendelt érték 0 és c(e) között marad, és a
megmaradási feltételek is ismét teljesülnek –, és fk+1 értéke nagyobb (mk-val), mint fk értéke.
Az algoritmus során ilyen javító utaknak legalább a kezdeményeit igyekszünk felépíteni s-ből indulva, melyek esetleg
nem t-ben végződnek (ezért kezdemények), de a javító út minden más feltételének eleget tesznek. Ha találunk olyat, amely
eljut t-ig, akkor a fentiek értelmében „javítunk” a folyamon, nagyobb értékűt veszünk helyette.
Megmutatható (ezt bízzuk az olvasóra), hogy ha nem létezik s – t javító út a kezdemények között, akkor a javítóút-
kezdemények végpontjai (s-et is idevéve) által alkotta csúcsok halmaza és a hálózat maradék csúcsainak halmaza között
futó élek alkotta vágás kapacitása egyrészt minimális a hálózat összes vágáskapacitása között, másrészt egyenlő a folyam
értékével, amely így a maximális folyamérték, tehát megtaláltuk, amit kerestünk, véget ért az algoritmus.
Ennek megfelelően igaz a következő tétel.

Egy hálózatban egy f folyam értéke akkor és csak akkor maximális, ha nincs s – t javító út, ami akkor és
csak akkor teljesül, ha létezik olyan vágás, melynek kapacitása egyenlő az f folyam értékével.

Ennek következménye a Ford–Fulkerson-tétel:

Bármely hálózat esetén max {v(f) : f folyam} = min{c(V): V s – t vágás}.

A maximális folyam problémájának néhány következménye: Menger tételei


A továbbiakban olyan irányított, illetve irányítatlan, kapacitásfüggvény nélkül megadott gráfokra vonatkozó tételeket
mondunk ki, melyek a Ford–Fulkerson-tétel segítségével bizonyíthatóak. Ehhez előbb bevezetünk néhány újabb fogalmat.

Legyenek s és t egy irányított gráf két különböző pontja. Az s – t irányított utakat lefogó élhalmaz éleinek
olyan halmaza, amely tartalmazza minden s – t irányított útnak legalább egy élét. Jelöljük ezt LÉ(s – t)-vel.
Egy G irányítatlan gráfban hasonlóan de niáljuk az s – t utakat lefogó élhalmazt (az irányított jelzők elhagyásával), és
szintén LÉ(s – t)-vel jelöljük. Ez utóbbi esetben s és t sorrendje nem számít, de irányított gráfnál természetesen igen.
Feltehetjük, hogy az mindig adott és egyértelmű, hogy mely, tehát az is, hogy irányított vagy irányítatlan gráfról van
szó.

Irányított gráfban élfüggetlen s – t irányított utak halmazán olyan s – t irányított utak halmazát értjük, amelyek közül
semelyik kettőnek nincs közös éle. Jelölése: ÉFU(s – t). Hasonlóan de niáljuk és jelöljük irányítatlan gráf élfüggetlen s
– t útjainak halmazát.

Egy irányított gráfban az s – t irányított utakat lefogó ponthalmaz olyan pontjainak halmaza, amely nem
tartalmazza s-et és t-t, de tartalmazza minden s-t irányított útnak legalább egy pontját. Jelöljük ezt LP(s – t)-vel.
Egy G irányítatlan gráfban hasonlóan de niáljuk az s – t utakat lefogó ponthalmazt, és szintén LP(s – t)-vel jelöljük.

Irányított, illetve irányítatlan gráfban pontfüggetlen s – t irányított, illetve irányítatlan utak halmazán olyan s – t
irányított, illetve irányítatlan utak halmazát értjük, amelyek közül semelyik kettőnek nincs közös belső pontja (persze
közös s és t), jelben PFU(s – t).

Ha adott egy irányított gráf és két kijelölt pontja, akkor az éleinek halmazán értelmezett azonosan 1 értékű
függvénnyel együtt ez egy hálózatot alkot, melyre alkalmazhatjuk a Ford–Fulkerson-tételt. Irányítatlan gráf esetén,
minden élét ellentétesen irányított kettős élekkel helyettesítve egy irányított gráfot kapunk. Ezek segítségével igazolható a
következő tételpár.

Ha s és t egy irányított gráf 2 tetszőleges pontja, akkor max | ÉFU(s – t) = min | LÉ(s – t)|. Ugyanez teljesül tetszőleges
irányítatlan gráf esetén.

Ha egy irányított gráf minden v pontját „széthúzzuk” egy v1 és v2 pontokból és egy v1-ből v2-be mutató irányított élből
álló részgrá á úgy, hogy az eredetileg v-be menő élek v1-be menjenek, és az eredetileg v-ből kiinduló pontok v2-ből
induljanak ki az új gráfban, akkor az előző tételpár segítségével igazolható a következő. Irányítatlan esetben a
„pontszéthúzás” és a „duplázó élirányítás” technikákat együttesen kell alkalmazni, mely alapján:

Ha egy irányított gráfban s és t nem szomszédosak (azaz nincs közöttük él), akkor max | PFU(s – t) | = min | LP(s – t)|.
Ugyanez teljesül irányítatlan gráfok esetén.

Részletes bizonyítások olvashatók Katona Gy.–Recski A.–Szabó Cs.: A számítástudomány alapjai című könyvében
(Typotex, 2006, 69–70.). Megjegyezzük, hogy ez utóbbi tételpárban max | PFU(s – t) | ≤ min | LP(s – t)| közvetlenül is
könnyen belátható.

A maximális folyam problémájának néhány általánosítása


E fejezetben, A maximális folyam problémája cím alatt már említettük, hogy a több forrás, s1, s2, …, sm és több nyelő, t1, t2,
…, tn esetét visszavezethetjük az ott már tárgyalt egy forrás és egy nyelő esetre. Ezúttal a feladatunk az összes forrástól az
összes nyelőig eljutó mennyiség maximalizálása. Vegyünk hozzá ehhez az általánosított hálózathoz egy s′ pontot a belőle s1,
s2, …, sm-be menő élekkel, és egy t′ pontot a t1, t2, …, tn-ből t′-be menő élekkel, és az új élek kapacitásai egyenként is
legyenek nagyságrendekkel nagyobbak, mint az összes többi él kapacitásainak összege. Belátható, hogy az így kapott új
„hagyományos” hálózatnak, melynek forrása legyen s′ és nyelője t′, a maximális folyamértéke éppen a keresett érték.
A nem forrás és nem nyelő típusú csúcsok halmazán értelmezett pozitív valós értékű kapacitásfüggvénnyel bővített
általános hálózat esetén a csúcsokon adott idő alatt áthaladó mennyiség felső határai a csúcsok kapacitásai. E problémát az
előzőekben leírt „pontszéthúzás” technikával lehet visszavezetni az alapesetre úgy, hogy a pontok kapacitásai lesznek az új
hálózatban az új élek kapacitásai.

Minimális költségű folyam – a híres szállítási probléma


Az eddig tárgyalt esetekben a rendszeren átáramló összmennyiségnek (a hálózati folyamértéknek) csupán maga a rendszer
szabott határokat, az adott időegység alatt szállítható mennyiség volt korlátok közé szorítva élekhez és nem forrás és nem
nyelő típusú csúcsokhoz rendelt értékek által. Feltételeztük (kimondatlanul is), hogy a források kibocsátó- és a nyelők
befogadóképessége határtalan. (A forrásokból a többi csúcsba áramló összmennyiség értelmezhető a „külvilágból” a
hálózattal modellezett rendszerbe beáramló, míg a nyelőkbe a többi csúcsból beáramló összmennyiség a rendszerből a
„külvilágba” kiáramló mennyiségként.) Gyakori az egyes alkalmazásokban, hogy a forrásokból és a nyelőkbe
áramoltatható mennyiségek is határok közé vannak szorítva, tehát ezek (is) kapnak kapacitásokat, sőt ezek a mennyiségek
esetleg rögzítettek (készletek és igények, lásd később).
A hálózatban továbbá megadhatunk további, az élek halmazán értelmezett valós értékű függvényeket is, például az
élek kapacitásai mint felső korlátok mellett alsó korlát is szabható az azon szállítandó mennyiségre; illetve az élekhez
úgynevezett költségek is rendelhetők. Ez esetben az optimalizálási feladat lényege adott folyamérték mellett a legkisebb
összköltségű folyam (a legkisebb költségű szállítás) vagy adott költség mellett a maximális folyamérték, esetleg mindkettő
változása esetén valamely képlettel kifejezett optimum megtalálása. Szállítási feladatként vált ismertté ennek speciális
esete, ahol a csúcsok között csak források (avagy termelők) és nyelők (avagy fogyasztók) vannak, rögzített termelési és
fogyasztási értékekkel (készletek és igények), illetve a költségekkel terhelt éleknek nincsenek (tetszőlegesen nagyok a)
kapacitásaik.
Az ilyen rendszerek vizsgálatához szükségünk van az alábbi de nícióra.

A G = G(A, B) teljes páros gráf, ha csúcsai A = {A1, A2, …, Am}, valamint B = {B1, B2, …, Bn} és élei (Ai, Bj) minden
lehetséges i ∈ {1, 2, …, m} és j ∈ {1, 2, …, n} párra.

Ennek az irányítása révén nyert azon irányított grá al, amelyben minden él A-ból B-felé, tehát a termelőtől a
fogyasztó felé van irányítva, megfogalmazhatjuk a szállítási feladatot.

Az Ai termelőkhöz rendelt egész értékű α(Ai) > 0 készletekből kell a Bj fogyasztókhoz rendelt egész értékű β(Bj) > 0
igényeket ellátni az 〈Ai, Bj〉 éleken történő szállítással, tehát egy folyam megadásával, mely az élek halmazán
értelmezett pozitív egész értékű függvény, aminek korlátait most a készletek és az igények adják. Ha az 〈Ai, Bj〉 élen
szállítunk, akkor azt egységenként az él ρij költségével terheljük, így ha f(〈Ai, Bj〉) = fij mennyiséget szállítunk ezen az

élen, azaz az f folyam szerint az 〈Ai, B 〉 élhez rendelt érték fij, akkor annak költsége
j
mátrixot költségmátrixnak nevezzük.

A folyam költségén a értéket értjük. A folyam értéke így a folyam költsége egy
élköltségekkel súlyozott folyamértéknek is tekinthető; ez a szállítás összköltsége.

Mint említettük, az a célunk, hogy optimális módon, tehát ez esetben a lehető legkisebb költséggel szállítsunk.

Minimális költségű az az f folyam, amelyre ρ(f) minimális, feltételezve, hogy a készletek, az igények és a költségmátrix
adottak.

Célunk ennek a meghatározása.


Megjegyezzük, hogy ha valahonnan valahová nem lehet szállítani, akkor arra az élre végtelen nagy (pontosabban
például az összes nem ilyen élköltség összegénél nagyságrendekkel nagyobb) költséget téve az úgysem fog a minimális
költségű megoldásba kerülni, ez esetben is feltételezhetjük tehát, hogy a páros gráfunk teljes, ahogy azt már meg is tettük.

Feltehetjük, hogy azaz a készletek és az igények egyenlők. Ha a készletek


nagyobbak lennének, akkor egy virtuális B-beli pontot felvéve, ahová igényként éppen a különbséget írnánk, és ezt minden
A-beli ponttal 0 költségű éllel összekötve egy olyan helyzetet kapnánk, ahol már egyenlők az igények és a készletek. Ennek a
megoldása egyben az eredeti feladaté is. Fordított esetben természetesen nem lehetséges az igények maximális kielégítése,
ezzel az esettel most nem foglalkozunk.

Élünk végül azzal a feltételezéssel, hogy ami az előző feltétellel együtt azt jelenti,
hogy összesen a lehető legnagyobb mennyiséget szállítjuk, tehát csak olyan folyamokat vizsgálunk, amelyek súlyozatlan
értéke α(A). Így egy minimális költségű folyam kiválasztása azt jelenti, hogy az élek halmazának egy olyan részhalmazát
választjuk ki, melyen a rögzített összsúlyú súlyozott összköltség minimális.
Olyan általánosított hálózatunk van tehát, melynek gráfja egy „egyirányúsított” páros gráf ( ), az egyik rész
minden csúcsa forrás, a másiké nyelő, nincs kapacitásfüggvény, van viszont készlet-igény függvény a csúcsok és
költségfüggvény az élek halmazán. A teljes készlettel kielégítünk minden igényt, és ezek közül keressük a legkevesebb
ráfordítással létrejövőt. A következő algoritmus adja a megoldást.

Vonjunk ki az M költségmátrix i-edik sorának minden eleméből 1-et, ekkor kapjuk az M1 mátrixot. Vegyük észre, hogy
az így kapott ρ1(f) = ρ(f) – α(Ai) megváltozott költség nem függ f-től, ezért p(f) akkor és csak akkor minimális, ha ρ1(f)
minimális, mindegy tehát, hogy a kettő közül melyik költségmátrix esetén határozzuk meg a minimális költségű
folyamot. Sor helyett oszlopra is hasonló gyelhető meg. Így kivonásokkal elérhető, hogy minden sorban és minden
oszlopban legyen 0. Így kapjuk a k-adik lépésben Mk-t és ρk-t. Ezután a 0 költségű éleken szállítunk úgy, hogy a
szállított mennyiség pont α(A) legyen. Ezt úgy érjük el, hogy ebből a módosított általánosított hálózatból elkészítünk
egy még újabb, költség-függvénnyel kiegészített „hagyományosat”. Vegyük G-nek azt a részgráfját, amelyik csak a 0
költségű éleket tartalmazza. Felveszünk két új pontot: az új forrást, jelölje X, és az új nyelőt, amit Y jelöl, valamint az
〈 〉 〈 〉
X, Ai és Y, Bj éleket, minden i ∈ {1, 2, …, m} és j ∈ {1, 2, …, n} párra. Ez lesz az új, G0 gráfunk, új hálózatunk
gráfja. De niálunk egy kapacitásfüggvényt ennek élei halmazán. A régi éleken „elég nagy” kapacitást írunk elő, az
〈 〉 〈 〉
újakon pedig: c( X, Ai ) = α(Ai) i = 1, 2, …, m és c( Y, Bj ) = β(Bj) j = 1, 2, …, n. Ez lesz az új 〈G , X, Y, c〉 hálózat.
0
Ebben keresünk maximális értékű f0 folyamot, melynek értéke a Ford–Fulkerson-tétel szerint egyenlő a minimális
vágáskapacitással, ami nyilván α(A), ha a régi élekre tényleg elég nagy kapacitásokat írtunk. Ezt az említett tétel előtt
vázlatosan ismertetett algoritmussal megtehetjük.
f0 A és B közötti -beli éleken vett értékét rendelve ezekhez az élekhez, a többi -beli élhez pedig 0-t rendelve
kapjuk a -ben minimális költségű folyamot.

24.7. Véletlen gráfok


Ebben a fejezetben olyan egyszerű, módosított értelemben vett gráfokkal foglalkozunk, ahol minden egyes él behúzását
egy véletlen kísérlet eredménye alapján döntjük el. Ilyen struktúrákkal modellezhető különböző társadalmi és
kommunikációs hálózatok létrejötte, például az interneté, illetve számos zikai és kémiai jelenség, például folyadékok
halmazállapot-változásai során a molekulák között véletlenszerűen kialakuló kötések, hogy csak néhány alkalmazást
említsünk. Az első ilyen gráfmodelleket de niáló cikkek a XX. század ötvenes évei végén, hatvanas évei elején jelentek meg.
E modellek közös jellemzői, hogy adottak a gráf rögzített számú számozott csúcsai, és az ezek között menő élek
valószínűségei egymástól függetlenek.
Két, bizonyos szempontok alapján azonosnak tekinthető modell az Erdős–Rényi-féle véletlen gráf néven vált ismertté.
Az első megfogalmazása a következő.

Adott n és N pozitív egész számok esetén egymással számozott értelemben nem izomorf N élű (hagyományos
értelemben vett) egyszerű gráf létezik n számozott ponttal. Legyen G(n, N) az a „módosított gráf”, amely ezek közül
véletlenszerű kiválasztás révén keletkezik, feltételezve, hogy mindegyik kiválasztásának a valószínűsége azonos.

Ekkor G(n, N) valószínűségének nevezzük reciprokát.

Ugyanez de niálható az alábbi módon is.

Legyen adott n számozott pont és egy (hagyományos értelemben vett) teljes gráf. Ennek éle közül válasszunk
egyet véletlenszerűen úgy, hogy bármelyik él kiválasztásának a valószínűsége azonos legyen. Válasszunk lépésenként
további éleket úgy, hogy minden egyes lépésben az addig ki nem választott élek közül azonos valószínűséggel
választunk egyet. Folytassuk ezt addig, hogy végül összesen N élt választunk ki. Így is G(n, N)-et kapjuk.

A másik modellt Edgar Gilbert vezette be (1959).

Ez a struktúra egy olyan „módosított gráf”, mely úgy jön létre, hogy veszünk egy teljes (hagyományos értelemben vett)
számozott csúcsú gráfot, majd sorba megyünk az élein, és p(0 < p < 1) valószínűséggel meghagyjuk, és 1 – p
valószínűséggel töröljük őket egymástól függetlenül.
Ugyanezt kapjuk, ha egy üres gráf éleit húzzuk be egymástól függetlenül p valószínűséggel. (Mint fentebb említettük,
fontos, hogy itt is a csúcsok száma rögzített, az nem véletlen kísérlet eredménye.)
Véletlen gráfunkra úgy is gondolhatunk, mint egy adott valószínűséggel létező „hagyományos értelemben vett”
egyszerű n pontú gráfra. Ez a valószínűség a véletlen gráf valószínűsége. E modell szokásos jelölése G(n, p).

Ennek legegyszerűbb esete, amikor p = ½. Foglalkozzunk a következőkben csak ezzel az esettel, tehát továbbiakban n

pontú véletlen gráfon G(n, ½)-et értünk. A számozott n csúcsú egyszerű gráfok száma (egymástól függetlenül két
lehetőség van minden pontpárra, vagy összekötjük őket éllel, vagy nem), és mint véletlen gráf nyilván mindegyik

egyformán valószínű (p = ½ miatt), tehát egy konkrét véletlen gráf valószínűsége: . Véletlen gráfok esetén
vizsgálhatunk bizonyos tulajdonságokat, például a csúcsok fokszámai, összefüggő-e a gráf stb., s megnézhetjük, hogy azok
milyen valószínűségűek.
Tipikusnak mondjuk azokat a T tulajdonságokat, amelyek „nagyon nagy” véletlen gráfok esetén „majdnem biztosak”.
Ennek értelmezése a következő (továbbra is csak a p = ½ esetben).
Jelöljük k(GnT)-vel a T tulajdonságú egyszerű n számozott pontú gráfok számát. Vezessük be a következő
valószínűséget:

. Amennyiben , akkor tipikusnak mondunk egy tulajdonságot. Másképp


megfogalmazva, T majdnem minden egyszerű gráfra teljesül.

Egy másik fontos vizsgálódás, hogy ha bizonyos T tulajdonságú („hagyományos értelemben vett”) gráfok létezését
akarjuk bizonyítani, akkor elég belátni, hogy Pn (T) > 0. Ezt a módszert először Erdős Pál alkalmazta, konstruktív úton
nehezen vagy egyáltalán nem megadható gráfok létezését illetően.

Megjegyzés. A téma egyik első és legnevesebb eredménye az Erdős–Rényi-tétel, amely szerint ha egy véletlen gráfot
veszünk n ponttal és p = c/n élvalószínűségekkel, akkor „madártávlatból”, nagyon durván, az így megkonstruált
véletlen gráf c-től függően kétféleképpen nézhet ki, ha feltesszük, hogy c ≠ 1. (Természetesen még az sem magától
értetődő, hogy van tipikus gráf ebben az esetben.) Ha c egy 1-nél kisebb konstans, mondjuk 0,999, akkor nagy
valószínűséggel csak nagyon pici, log n nagyságú komponensek (összefüggő részgráfok) vannak. De ha c akár egy
kicsit is nagyobb, mint 1, mondjuk 1,001, akkor van egy óriási, konstansszor n nagyságú komponens, és az összes
többi megint pici, legfeljebb log n nagyságú.

Nézzünk most néhány tipikus tulajdonságot!

Ha az α és a β valós számokra teljesül a egyenlőtlenség, akkor majdnem minden egyszerű n pontú G


gráfra teljesül, hogy minden pontjának a foka az (αn, βn) intervallumba esik (nyílt intervallum).

A bizonyításhoz az kell, hogy egy egyszerű véletlen gráf adott pontjának fokszáma egy (n – 1)-edrendű ½-paraméterű
binomiális eloszlást követ (lásd 26.5. fejezet), és a fenti állítás lényegében arról szól, hogy teljesül a nagy számok (gyenge)
törvénye.

Ha az α és a β valós számokra teljesül a egyenlőtlenség, akkor majdnem minden egyszerű n pontú G


gráfra teljesül, hogy bármely két pont közös szomszédjainak száma az (αn, βn) intervallumba esik.

Itt is hasonló módon járhatunk el, mint az előző tételnél. Annak a valószínűsége, hogy két különböző pontnak Q egy
közös szomszédja ¼. Így a szomszédos pontok száma egy (n – 2)-edrendű ¼-paraméterű binomiális eloszlást alkot, innen
ismét a nagy számok törvénye biztosítja az állítást, csak most az ¼ körül, ezért szerepel a feltételként megadott
egyenlőtlenségben ezúttal ¼.

Egy tetszőleges gráfban két pont távolságán az őket összekötő utak hosszának minimumát értjük. Ha nincs közöttük
út, akkor végtelennek mondjuk a távolságot, illetve egy pont önmagától vett távolsága 0. A pontpárok távolságának
maximumát a gráf átmérőjének nevezzük.

Nyilván nem összefüggő gráf átmérője is végtelen.

Példa. Az alábbi véges és összefüggő gráf (24.32. ábra) pontpárjai távolságát mutatja a mellékelt mátrix, és ebből
adódik, hogy az átmérő 3, mivel ennél nagyobb távolság nem lép fel a pontok között.

24.32. ábra

Majdnem minden egyszerű gráfra teljesül, hogy összefüggő, sőt 2 átmérőjű.

Nyilván elég az átmérőre vonatkozó állítást igazolni, hiszen ha nem összefüggő, akkor az átmérő végtelen. Azt
igazoljuk először, hogy nem nagyobb 2-nél, majd azt, hogy nem lehet 1. Így adódik az állítás. Ha a P1 P2 pontok távolsága
nagyobb, mint 2, akkor bármely Q pontot is választva, vagy a P1Q, vagy a P2Q él nem tartozik a G gráfhoz, hiszen ha
mindkettő él lenne, akkor a távolságuk 2 volna. Mivel ez n – 2 különböző pont esetén így van, ezért ennek az esélye

Annak az esélye pedig, hogy létezik két ilyen távoli pont, azaz az átmérő nagyobb, mint 2, (az
esélyű), mivel ennyi pontpár van. Ez pedig tart a 0-hoz, ha n tart a végtelenbe, azaz ekkor annak a valószínűsége, hogy
nagyobb, mint 2, az átmérő 0-hoz tart. Vagyis kisebb vagy egyenlő, mint 2. Mivel az átmérő csak akkor lehet 1, ha teljes a
gráf, ennek pedig szintén 0-hoz tart az esélye (hogy minden élt behúzunk), tehát a „jellemző” átmérő a 2.
Meglepő, hogy míg az a kérdés, hogy egy gráf tartalmaz-e Hamilton-utat vagy kört, általában nem megoldott, addig a
következő állítás viszont bizonyítható.

Majdnem minden egyszerű gráfra teljesül, hogy tartalmaz Hamilton-kört.

Egy további Erdős–Rényi-sejtést Hamilton-körökre Pósa Lajos bizonyított.

N = c · n · log n esetén G(n, N) majdnem biztosan tartalmaz Hamilton-kört, ha c elég nagy.

A G(n, p) modellre átfogalmazva a problémát, az élek behúzásának p valószínűségét pedig úgy kell megadni, hogy
várhatóan éppen c · n · log n élünk legyen. Az olvasóra bízzuk ennek meghatározását. Másrészt, a majdnem biztosan azt
jelenti, hogy bármilyen ϵ > 0 esetén a Hamilton-kör létezésének valószínűsége nagyobb, mint 1 – ϵ, feltéve, hogy n „elég
nagy”.

24.8. Gráfok alkalmazásai

A Prüfer-kód és a számozott pontú fák


Kiút a labirintusból, avagy egy újabb gráfbejárás
Euler-féle poliéderformula
Térképek színezése

A Prüfer-kód és a számozott pontú fák

Számozzuk meg az n pontú F fa pontjait 1-től n-ig, és az n-edik pontot nevezzük el gyökérnek. Az így kapott fa-gráfot a
pontjaihoz rendelt számokkal együtt számozott fának nevezzük. A pontokhoz rendelt a számok a pontok indexei.

Két számozott fát egymással (számozott értelemben) izomorfnak mondunk, ha létezik csúcshalmazaik között olyan
egy-egyértelmű leképezés, amely „éltartó” és az egymásnak megfeleltetett csúcsok számozása azonos. (Lásd a 24.1.
fejezet végén található de níciót.)

Ha két számozott fa izomorf, akkor tehát biztos, hogy a nekik megfelelő számozatlan fák is izomorfak (utóbbi a 24.1.
fejezetben levő de níció szerinti értelemben). Egymással izomorf fáknak viszont létezhetnek olyan számozásaik, melyek
révén nyert számozott fák nem lesznek egymással izomorfak. Az egymással nem izomorf fákat, mindkét értelmezés esetén,
különbözőknek is szoktuk mondani. A fentiek értelmében rögzített n csúcsszám esetén legalább annyi különböző
számozott n csúcsú fa van, ahány számozatlan.
A továbbiakban hozzárendelünk egy véges számsorozatot a számozott pontú fához, ami az azt reprezentáló kód lesz. Ez
felhasználható egyrészt a 24.2. fejezetben levő Cayley-tétel bizonyítására, másrészt fák számítógépes tárolására.

Az n számozott pontú F fa esetén hagyjuk el a legkisebb indexű elsőfokú pontot, és írjuk fel a szomszédjának a számát,
legyen az v1. Ismételjük ezt a maradék fával, míg csak egy pont marad. Ennek indexe biztosan n, hiszen mindig van
legalább két elsőfokú pont, és az n-nel indexelt soha nem lehetett a kisebb indexű, tehát nem hagyhattuk el. Ezt már
nem is írjuk le (többnyire). Az így kapott n – 2 hosszúságú 〈v , v , v , …, vn– 〉 számsorozatot az F fa Prüfer-kódjának
1 2 3 2
nevezzük.

Példa. A 24.33. ábrán látható fa Prüfer-kódja: 〈3, 3, 3, 3, 6, 6〉, ha leírnánk a végét is: 〈3, 3, 3, 3, 6, 6, 8〉.
24.33. ábra

Könnyen látható a most vázolt eljárásból, hogy minden számozott csúcsú fának létezik Prüfer-kódja, és adott
számozott csúcsú fa esetén az eljárás a kódot egyértelműen meghatározza. A témakör legfontosabb tétele ennek
„megfordítása”:

Bármely, az 1 és n közötti egész számokból álló, n – 2 tagú sorozat egy n pontú számozott fa Prüfer-kódja, és ez a kód a
számozott fát egyértelműen meghatározza.

Megjegyzés. A sorozat természetesen nem kell hogy minden 1 és n közötti számot tartalmazzon, és a számok többször
is szerepelhetnek. Továbbá, az egyértelműség itt számozott értelemben vett izomor a erejéig érvényes.

Bizonyítás. Ha megmutatjuk, hogy egy tetszőleges megfelelő sorozatból (a Prüfer-kódból) a fa egyértelmű visszaállítása
miként történik, akkor beláttuk, hogy ez egy egyértelműen meghatározott számozott fa Prüfer-kódja, tehát készen van a
bizonyítás. Ehhez a következő algoritmust lehet megadni:
1. Legyen (v a Prüfer-kód) adott egy megfelelő, n – 2 tagú sorozat. Legyen továbbá C = {v1, v2,…, vn} a csúcsok halmaza.
Induljunk ki egy n csúcsú, 0 élű gráfból.
2. Vegyük a sorozat első elemét. Kössük össze az ezzel a sorszámmal indexelt pontot (ezt a sorszámot) a C halmaznak azzal a
legkisebb x sorszámú pontjával, amely sorszám nem szerepel a sorozatban.
3. Hagyjuk el a sorozat első elemét, és töröljük az x sorszámú pontot a C halmazból. Az így kapott új sorozattal és a C-ből kapott
új ponthalmazzal ismételjük a 2. és 3. lépést addig, amíg a sorozat elemei el nem fogynak.
4. A legutoljára elhagyott sorszámú pontot kössük össze vn-nel.
Gondoljuk végig, hogy minden lépésnél egyértelmű, hogy mely sorszámú csúcsokat kötjük össze, és a végén egy
összefüggő és körmentes gráfot kapunk!
Az utóbbi igazolása: A Prüfer-kód mindig n csúcsú, n – 1 élű gráfot ad, ha belátjuk, hogy nincs benne kör, akkor biztos,
hogy fa az eredmény. Indirekt tegyük fel, hogy van kör az eredményben: x, y, z. Ilyenkor a kódban x, y, z sorrendben kell
szerepelniük. y-hoz x-et kötjük, z-hez y-t, viszont x-hez z-t kellene kötni, ami tőle jobbra szerepel.

Példa. Határozzuk meg a következő Prüfer-kóddal rendelkező fát: {4, 2, 4, 6, 3, 4}. Nyilván 8 csúcsa lesz a fának,
hiszen a csúcsszám a Prüfer-kód hossza plusz kettő. Lerajzoljuk a 4-es csúcsot, és hozzákötjük az 1-et, mivel az nem
szerepel tőle jobbra a sorszámok adott sorozatában. Ezután jön a 2, és azt az 5-tel kötjük össze, mivel az a legkisebb
sorszám, ami nem szerepel utána (az 1-en kívül, de az 1-es sorszámú csúcsot már töröltük). Majd ismét a 4-est kötjük
össze a 2-essel, majd a 6-ost a 7-essel, utána a 3-ast a 6-ossal, végül 4-est a 8-assal. Azaz a 24.34. ábra gráfját kapjuk.

24.34. ábra

Ellenőrzésként, a legkisebb elsőfokú pont az 1-es, tehát a kód a szomszédjának sorszámával, 4-gyel kezdődik. A
maradék fa legkisebb sorszámú elsőfokú csúcsa az 5-ös, ennek szomszédja a 2-es, tehát a kód kezdete: {4, 2, …. Ezután
a maradék fa legkisebb sorszámú elsőfokú csúcsa a 2-es, tehát a szomszédjának sorszáma, a 4 következik, {4, 2, 4, … a
kód következő lépése. Ezután már csak egy utunk van: 8-4-3-6-7, ahol a kisebbik vége a 7, ennek szomszédja a
maradék út kisebbik vége, a 6, majd annak szomszédja a (kisebb) 3, s végül annak a 4, tehát a teljes kód: {4, 2, 4, 6, 3,
4}, ebből indultunk.

A korábban leírt tételből és az előtte említett, könnyebben igazolható állításból következik, hogy egy-egyértelmű
megfeleltetés létezik természetes számokból álló (véges) sorozatok (Prüfer-kódok) és a számozott csúcsú fák között. Innen
már csak egyetlen lépés a Cayley-tétel. Mivel minden helyen szerepelhet 1-től n-ig bármelyik szám, ezért nn–2 különböző
Prüfer-kód van rögzített n esetén. Mivel mindegyikhez tartozik pontosan egy számozott csúcsú fa, ezzel beláttuk a Cayley-
tételt, amely ilyen fák számát határozta meg.

Megjegyzések
1. A Prüfer-kódot először Heinz Prüfer német matematikus alkalmazta 1918-ban, melynek segítségével éppen a
Cayley-formulát bizonyította.
2. Ez a kód a fák számítógépes tárolásának is a legkisebb tárigényű módja, hiszen ha például szomszédsági

mátrixszal adjuk meg, akkor, mivel szimmetrikus a mátrix, és az átlójában is 0-k vannak, összesen
bitet kell tárolni, ennyi a 0-k és az egyesek száma összesen. A Prüfer-kód esetén egy n– 2 hosszú sorozatot kell
vennünk, de ennek tagjai 1-től n-ig terjedő számok, amik kettes számrendszerben [log 2n] hosszú sorozatok, azaz

a teljes tárolás mérete: , ami nagy n-ekre kb. n log2 n, ami jóval kevesebb, mint a kb.
tárigény.

Kiút a labirintusból, avagy egy újabb gráfbejárás


Egy kiállítás képeit szeretnénk pontosan egyszer végignézni. Ám a folyosók mindkét oldalán vannak képek, tehát kétszer
kell minden folyosón végigmenni. Ekvivalens probléma egy városrész utcáinak végigtisztítása, feltéve hogy mindegyik
utcán kétféle irány van, tehát egyszer az egyik oldalt, egyszer a másikat tisztítjuk.
Azt állítjuk, hogy bármilyen összefüggő gráf élein végig lehet haladni pontosan kétszer, tehát úgy, hogy semelyik sem
marad ki, és mindegyiken csak kétszer haladtunk végig. A kétféle irányt úgy is elképzelhetjük, hogy mindegyik élt
megduplázzuk, tehát a gráfból egy csak kétszeres vagy négyszeres, vagy hatszoros, … éleket tartalmazó gráf lesz, és ebben
az új gráfban keresünk minden élen végighaladó körvonalat, tehát Euler-körvonalat. Így azonban minden csúcsban páros
számú él találkozik, tehát az Euler-tétel feltételei teljesülnek; bárhonnan is indulnánk, ugyanott fog a megfelelő utunk
véget érni, mivel minden pont foka páros. Most röviden leírjuk az eljárást (és az indoklást), mivel az Euler-tételnek (lásd
24.3. fejezet) ezt az irányát nem bizonyítottuk. Kezdjük el az utunkat egy tetszőleges A1 pontban. Válasszuk ki az egyik
innen induló élt, s azon végigmenve elérünk (a nem feltétlen különböző) A2 pontba. Ezen az élen A1-nél egy kis nyíllal
jelöljük meg az útirányt. A2 pontból továbbhaladva elérjük a (nem feltétlen különböző) A3 pontot. Ismét nyíllal jelöljük az
irányt. Ezt folytatjuk, amíg van még be nem járt élünk. Minden csúcsból olyan élen megyünk tovább, amelyen még nem
jártunk. Így lassan megjelölődnek az élek. Ha elfogytak, akkor biztos újra A1 pontba kerültünk, mert különben a foka
páratlan lenne, hiszen onnan indultunk és utána valahányszor be- és kimentünk. Azt állítjuk, hogy ha a gráf összefüggő
volt, akkor így minden élen jártunk. Ha ez nem így lenne, azaz lenne olyan él, amelyet nem jártunk be, jelöljük ennek két
végpontját Ai-vel és Aj-vel. Ha több ilyen él is van, vegyük azt, amelyiknek van közös csúcsa eddig bejárt éllel. Ilyen
biztosan van, mert különben egyetlen élen se jártunk volna, pedig elindulni egy élen biztosan sikerült. Ekkor mind a két
csúcsban van még egy-egy él, amit szintén nem jártunk be, hiszen minden csúcs foka páros, és az egy csúcshoz tartozó
éleket párosával „fogyasztottuk”. Ha az ugyancsak közöttük vezet, akkor egyszerűen a bejárásunkat bővítsük úgy, hogy
egyszer, amikor Ai-ben jártunk, nem úgy megyünk tovább, ahogy mentünk, hanem beiktatunk egy kitérőt Aj-be és vissza.
Illetve ha további, de ugyanabba a csúcsba mutatnak, akkor egy három hosszú körrel bővíthetjük eddigi sétánkat. Ezzel
készen is lennénk. Ha máshová mutatnak ezek a további élek, akkor azokból is lesznek további be nem jártak, hiszen azok is
páros fokúak, amik vagy bezárnak az eddigiekkel egy még bejáratlan élekből álló kört, amivel bővíthetjük vonalunkat,
vagy további bejáratlan éleket találunk, és így tovább. Véges gráfról lévén szó, előbb-utóbb elfogynak a bejáratlan élek, és
ekkor vagy bejáratlan körrel bővíthetünk, vagy minden él annak bizonyul, ami lehetetlen, mert páros sok bejárt éleket
összefogó pontokba nem érkezhetünk a fokszámok paritása miatt. Egy példa látható a 24.35. ábrán.

24.35. ábra

Ezzel a módszerrel zegzugos barlangokból, labirintusokból is garantáltan ki lehet jutni. Az angol Longleat House-ban
található a világ egyik leghosszabb labirintusa, amit sövényből alakítottak ki. Egy másik híres labirintus az ókori görög
mitológiából ismert krétai labirintus, ahonnan Ariadné egy gombolyag fonal segítségével szabadította ki Thészeuszt. Egy
ilyenféle labirintust láthatunk a 24.36. ábrán.
24.36. ábra

Euler-féle poliéderformula
Egy fontos, matematikán belüli alkalmazása a gráfelméletnek a nevezetes Euler-féle poliédertétel bizonyítása (lásd még a
23.4. fejezet végén leírtakat is). E tétel egyik fontos következménye a szabályos testek karakterizációja. A bizonyítás
lényege, hogy miként a következő pontban a térképek színezésénél, egy síkba rajzolható gráfot tudunk a poliéderhez
rendelni. Ebben a gráfban a minimális (további köröket nem tartalmazó) köröket és az egyetlen maximális (minden más
kört tartalmazó) kört, más megfogalmazásban a tartományokat feleltetjük meg a lapoknak, míg a csúcsoknak és az éleknek
rendre a gráf csúcsait és éleit az alábbi módon. A fő lépés a poliéder levetítése egy síkra, amely minden közönséges poliéder
esetén megtehető, amely topologikusan izomorf egy gömbbel, szemléletesen, felfújható egy gömbbé. Ez két lépésben
történik. Először a poliédert egy gömb belsejébe helyezzük, majd „felfújjuk”, hogy hálója a gömb felszínére „simuljon”.
Ekkor egy gömbre rajzolását kapjuk testháló meghatározta gráfnak. Ezután egyik gömbfelszíni tartományának egy belső
pontjából (É-i sark) sztereogra kus projekcióval levetítjük az említett ponton és a gömb középpontján átmenő egyenesre
merőleges és a gömböt (a D-i sarkban) érintő síkra. Belátható, hogy a kapott kép egy síkba rajzolása a gráfnak. A lényeg,
hogy e hozzárendelések kompozíciója olyan bijekció, amely a csúcs-él, az él-tartomány (és a tartomány-csúcs)
illeszkedéseket megtartja. Emiatt a gráfokra vonatkozó tételből következik annak a poliéderre vonatkozó megfelelője. A
gráfokra vonatkozó tétel ezután így hangzik:

Gráfokra vonatkozó Euler-formula. Egy összefüggő síkba rajzolható gráf, amelynek n csúcsa, e éle és t tartománya van
(beleértve a külső végtelen tartományt is), eleget tesz a következő formulának: n – e + 1 = 2.

Bizonyítás. Ha van benne kör, akkor az a síkot két tartományra osztja, mivel síkba rajzolható. Hagyjunk el a körből egy
tetszőleges élt, ekkor a gráf összefüggő marad, és az élek és a tartományok száma is eggyel csökken, tehát n + t – e értéke
nem változik. Ilyen lépésekkel az összes kört megszüntetve egy körmentes összefüggő gráfot, azaz fát kapunk (a gráf
feszítőfáját). Erre igaz a formula, ugyanis t = 1 és e = n – 1. Ennek általánosításaként könnyen adható hasonló formula: k
komponensből álló, n csúcsú, e élű és t tartományú síkbeli gráfokra: n – e + t = k + 1.
A fenti gondolatmenet annyiban módosul, hogy az utolsó kör megszüntetése után egy k darab fából álló erdő marad,
ahol t = 1 és e = n – k.
A gráfokra vonatkozó Euler-formulából levezethető, hogy

egy n pontú, e ≥ 2 élű, síkbeli, egyszerű gráfra: e ≤ 3n – 6.

Legyen a gráf tartományainak a száma l. Ha e ≥ 3, akkor minden tartományt legalább 3 él határol (hurokél egyedül,
kétszeres él ketten határolnának egy tartományt, de ezeket kizártuk, a végtelen tartományra pedig a feltétel miatt), ezért ez
összesen legalább 3l élt jelentene. Mivel minden él 1 vagy 2 tartományt határol (azok az élek, melyek nem részei körnek, 1-
et, a „külső” végtelen tartományt, amelyek valamely kör élei, pontosan 2-t), tehát legfeljebb 2-t, így az élek számának

legfeljebb kétszerese, az legalább 3l, amiből . Ha e = 2, akkor, mivel egyszerű gráf, csak egy 2 hosszú út lehet, tehát l

= 1, és ugyanezt az egy tartományt csak 2 él határolja, de behelyettesítve ekkor is igaz, hogy . Másrészt az Euler-

tételből n + l = e + 2, és ezt beírva az előbbi egyenlőtlenségbe , ahonnan 3(n – 2) ≤ e.


Ha a gráf nem összefüggő, éleknek a komponensek közötti behúzásával egy olyan összefüggő gráfot állíthatunk elő,
mely egyrészt síkbeli marad, másrészt nem keletkezik új tartomány, így erre teljesül a poliédertétel, tehát e tétel is az
eddigiek értelmében, de eredeti gráfunknak ennél még kevesebb éle van.

Egy n pontú, e ≥ 2 élű, síkba rajzolható, egyszerű páros gráfra e ≤ 2n – 4.

Ez az összefüggés hasonlóan látható be, felhasználva, hogy páros egyszerű gráfban a legrövidebb kör négy élből állhat.
Alkalmazásként megmutatjuk, hogy a 24.4. fejezetben a Síkba rajzolható gráfok cím alatt szereplő teljes ötszög és a
„három ház és három kút” gráfok nem síkba rajzolhatóak. Ennek most egyszerű bizonyítása adódik az utóbbi két (keretben
kiemelt) összefüggés alapján. Az elsőnél 5 pont van és 10 él. A vonatkozó tétel szerint legfeljebb 3 · 5 – 6 = 9 éle lehet egy 5
pontú síkba rajzolható gráfnak, tehát 10 nem; míg a másik gráf páros (házakat házakkal és kutakat kutakkal nem kötünk
össze), tehát itt pedig a síkba rajzolhatóság esetén maximum 2 · 6 – 4 = 8 éle lehet a páros gráfnak. Nekünk viszont 3 · 3 = 9
élünk van, nem lehet tehát síkbeli.

Térképek színezése
A kérdés még 1850 körül az angol királyi földrajzi társaság egy ülésén vetődött fel, hogy vajon minimálisan hány színnel
lehet egy térképet kiszínezni. Természetesen szomszédos országoknak különböző színt kell adni, különben
összemosódnának. Itt szomszédoson azt értjük, hogy van közös határszakaszuk. Ha két ország határvonala csak egy
pontban közös, akkor lehetnek egyszínűek.
Könnyű felrajzolni négy országot úgy, hogy bármely kettőnek van közös határszakasza, valós európai példa is könnyen
adódik: Luxemburg és közvetlen szomszédjai. Tehát van olyan térkép, amihez legalább négy szín kell. A kérdés, hogy van-e
olyan térkép, amihez legalább öt szín kell, vagy néggyel már minden térkép kiszínezhető a megfelelő módon.
Arthur Cayley angol matematikus, a gráfelmélet egyik úttörője írt erről a négyszín-problémáról egy cikket 1879-ben.
Ekkor már a sejtés megvolt, nevezetesen, hogy négy szín mindig elegendő.
Azt könnyebb belátni, hogy öt biztosan elegendő, ennek a gondolatmenetét meg is mutatjuk majd. Azt, hogy négy is
elég, csak 1979-ben sikerült Appel és Haken holland matematikusoknak egy számítógép segítségével igazolniuk. A mai
napig nincs rá „gépmentes” bizonyítás. Ezért sokan kételkednek is a probléma elintézettségében. A programot sokan
nézték már át, s egy kisebb hiányosság javításától eltekintve hibátlannak találták. A gép pedig 24 óra munkával ellenőrizte
mindazt, amire ember a mai napig nem képes. Fogalmazzuk ezt meg egy tétel formájában.

Minden gömbre rajzolható térkép, melyen szomszédos két ország akkor, ha van közös határoló görbeszakaszuk,
kiszínezhető négy színnel úgy, hogy minden ország ezek valamelyikét kapja, és két szomszédos ország különböző
színű.

Ennél egyszerűbb a következő, gyengébb állítás, ahol a bizonyítás gondolatmenetét röviden be is mutatjuk.

Minden gömbre rajzolható térkép, melyen szomszédos két ország akkor, ha van közös határoló görbeszakaszuk,
kiszínezhető öt színnel úgy, hogy minden ország ezek valamelyikét kapja, és két szomszédos ország különböző színű.

A térképet modellezhetjük egy olyan síkba rajzolható grá al, melynek tartományai felelnek meg az országoknak, két
tartományt elválasztó él felel meg a megfelelő országok közös határszakaszának, és csúcs felel meg legalább három ország
közös találkozási pontjának. Így valóban egy síkba rajzolható gráfot kapunk. Nevezzük ezt a térkép gráfjának. Ennek
segítségével az utóbbi két tétel tisztán matematikai fogalmak használatával is kimondható (például tartományokhoz egy
négy, illetve egy öt elemszámú halmaz elemeit rendelve), ezt az olvasóra bízzuk.
Készíthetünk a térkép gráfjához (és a térképhez) tartozó újabb gráfot a következőképpen.

Adott tehát egy síkba rajzolható G gráf. G′ legyen az a gráf, melynek pontjai G tartományai, és 2 pontja pontosan akkor
van éllel összekötve, ha a megfelelő G-beli tartományok szomszédosak, azaz van közös határoló élük. G′ élei
kölcsönösen egyértelműen megfelelnek G éleinek, és szintén nem metszik egymást a csúcsokon kívül, tehát G′ is síkba
rajzolható, tartományai G csúcsainak felelnek meg. G′-t nevezzük a G síkba rajzolható gráf duálisának.
Nyilvánvaló, hogy egy gráf duálisának a duálisa az eredeti gráf, G és G′ tehát egymás duálisai.

A térképen úgy tudjuk ezt elképzelni, hogy minden országnak megfeleltetjük pl. a fővárosát, és a szomszédos országok
fővárosai között vasútvonalakat építünk. Lásd a 24.37. ábrán Közép-Európát és a megfelelő duális gráfot.
Így a színezési probléma a duális gráf színezésére redukálódik. Az alábbi tétel ekvivalens a gömbre rajzolható térképre
vonatkozó első összefüggéssel. Ezeket négyszín-tételnek szoktuk nevezni.

Minden síkba rajzolható gráf csúcsai színezhetők négy színnel úgy, hogy bármely két szomszédos csúcs különböző
színű lesz.

24.37. ábra
Megjegyzés. Ennek egy következménye, hogy ha egy gráf síkba rajzolható, akkor nem tartalmazhat részgráfként
teljes ötszöget, s így nem lehet öt páronként szomszédos ország a földgömbön, hiszen ha ez lehetne, akkor már a gráf
eme részének pontjait sem tudnánk négy színnel úgy kiszínezni, hogy azonos színűek ne legyenek összekötve éllel.
Ezt a következményt az Euler-formula segítségével már igazoltuk, amit beláttunk, ellentétben a négyszín-tétellel.

A gyengébb, általunk is bizonyítandó állítással az alábbi tétel ekvivalens. Közös nevük ötszín-tétel.

Minden síkba rajzolható gráf csúcsai színezhetők öt színnel úgy, hogy bármely két szomszédos csúcs különböző színű
lesz.

Ennek bizonyításához a következő állításból indulunk ki.

Egy síkba rajzolható gráfnak mindig van legalább egy olyan pontja, amely legfeljebb ötödfokú.

Indirekt tegyük fel, hogy minden pont legalább hatodfokú. Ekkor a gráf éleinek száma legalább 3 n, ha n csúcsa van. Ez
azonban ellentmond annak, hogy egy n pontú síkbeli gráfnak legfeljebb 3n – 6 éle van (lásd a tételt az Euler-féle
poliéderformula cím alatt).

Megjegyzés. Ez egyszerű közönséges poliéderekre azt jelenti, hogy mindig van olyan csúcsuk, amelybe legfeljebb 5 él
fut be, vagy a dualitás miatt azt is, hogy van olyan lapjuk, amelyik legfeljebb ötszög. Azaz nincs olyan poliéder,
amelynek minden lapja hatszög (vagy még nagyobb oldalszámú sokszög). (Ez utóbbinál Euler poliédertételének
segítségével erősebb állítás is igazolható, nevezetesen, hogy 3l3 + 2l4 + l5 ≥ 12, ahol lk jelenti a k oldalú sokszöglapok
számát.)

Tehát a gráfban mindig van legfeljebb ötödfokú pont. Ezután indukcióval bizonyítunk. 5 vagy annál kevesebb pontú
gráf kiszínezhető öt színnel. Tegyük fel, hogy minden n-nél kevesebb pontú gráf kiszínezhető öt színnel. Ha most veszünk
egy (n + 1) pontú gráfot, akkor ennek van olyan pontja, amely legfeljebb ötödfokú. Ha van alacsonyabb fokú, akkor készen
vagyunk, mert azt éleivel együtt elhagyva, az így kapott gráf az indukciós feltétel szerint öt színnel színezhető, s akkor az
eredetiben a többi pontot ugyanígy színezve, ennek a plusz egy pontnak a színe olyan lehet, amelyikkel egy olyan csúcsot
színeztünk, amely nem szomszédja. Ha öt szomszédja van, akkor ravaszabbul járunk el. Biztosan van két nem szomszédos
szomszédja, hiszen a teljes ötszöggráf nem síkba rajzolható. Hagyjuk el magát a pontot a belőle induló élekkel, és ezt a két
szomszédját „húzzuk össze” egy ponttá úgy, hogy minden ezekből induló él ebbe az összevont pontba fusson. Ez újra síkba
rajzolható gráf lesz, n-nél kisebb pontszámmal, ami a feltételünk szerint kiszínezhető öt színnel; színezzük ki tehát. Utána
újra húzzuk szét a két szomszédot, melyek most egyszínűek (közös pont voltak), így amikor a kihagyott pontot és éleit
visszatesszük, az öt szomszédjából kettő azonos színű, tehát marad egy ötödik szín erre a pontra. Ezzel beláttuk az ötszín-
tétel állításait.
Még néhány, színezésekkel kapcsolatos tétel, összefüggés, bizonyítás nélkül.

Ha egy gráf összefüggő, minden pontjának fokszáma legfeljebb d, és van legalább egy pontja, melynek fokszáma
határozottan kisebb, mint d, akkor a gráf csúcsai kiszínezhetők d színnel úgy, hogy bármely két szomszédos csúcs
különböző színű lesz (kiszínezhető d színnel).

Útmutatás: használjuk az ötszín-tétel leírt bizonyításvázlatát.


Megjegyzés. A tételben fontos, hogy van legalább egy pont, amelynek fokszáma kisebb, mint d. A 24.38. ábra bal
oldali gráfja mutatja, hogy enélkül nem igaz az állítás, hiszen itt minden pont fokszáma 3, de nem lehet 3 színnel
kiszínezni (ennek belátását az olvasóra bízzuk). Megjegyezzük, hogy ez a gráf a teljes négyszöggráf. Azt gondolnánk,
hogy a 3 színnel kiszínezhetőség egyetlen akadálya, ha tartalmaz a síkbeli gráf részgráfként teljes négyszöget. Ez
nem igaz. A 24.38. ábra jobb oldali gráfjának nincs teljes négyszöggráf részgráfja, mégsem színezhető három színnel.

24.38. ábra

Két színnel színezésre is megadunk egy tételt.

Egy gráf pontosan akkor színezhető ki két színnel, ha nem tartalmaz páratlan hosszúságú (élszámú) kört.
Az egyik irány bizonyítása könnyű. Két színnel való színezés esetén egy kör mentén haladva felváltva kell a két színnel
színezni a csúcsokat, de páratlan hosszú körben ez lehetetlen.

Megjegyzések. A két színnel való kiszínezhetőség azt jelenti, hogy a gráf csúcshalmaza két diszjunkt részhalmazra
osztható úgy, hogy az azonos részhalmazba eső csúcsok között nem megy él, vagyis hogy a gráf páros. Így e tétel
annak az állításnak, mely szerint ha a G páros gráf, akkor bármely K körének az éleinek száma páros, egy más
megfogalmazását és egyben kibővítését jelenti, mert tartalmazza annak megfordítását is. Továbbá, itt nem
szükséges síkbeli gráfokra szorítkoznunk, mert nem síkbeli gráfban biztosan van páratlan hosszú kör, és ez biztos,
hogy nem színezhető ki két színnel a megfelelő módon.

Végezetül megemlítjük, hogy ha olyan gráfokat, illetve ezeknek megfelelő térképeket vizsgálunk, melyek síkba vagy
ami ezzel ekvivalens, gömbre ugyan nem rajzolhatóak, de tóruszra igen, akkor öt szín nem feltétlen elegendő, sőt hat sem,
tehát van olyan eset, amikor legalább hét szín kell. P. J. Heawood brit matematikus megmutatta, hogy ennyi elegendő is
minden esetben.

24.9. Gráfok és mátrixok

Gráfok spektruma, a sajátérték-probléma, alkalmazás reguláris gráfokra

Gráfok spektruma, a sajátérték-probléma, alkalmazás reguláris gráfokra

Az n csúcsú G (irányítatlan) gráf csúcsmátrixán vagy adjacenciamátrixán, vagy még másként szomszédsági mátrixán

értjük azt az négyzetes mátrixot, amellyel a gráf reprezentálható, lásd 24.1. fejezet III. pont. Irányított
gráfok esetén aij jelentse a Pi-ből a Pj-be vezető irányított élek számát.

E de níció alapján egy (számozatlan csúcsú) gráf csúcsmátrixa nem egyértelműen meghatározott; függ attól, hogy a
csúcsoknak milyen sorrendben „feleltetjük meg” a mátrix sorait (az oszlopokat ekkor már mindenképpen ugyanebben a
sorrendben). Ez azonban nem okoz bonyodalmakat, mert, bár nem bizonyítjuk, a továbbiakban tárgyalt összefüggések
függetlenek attól, hogy egy gráf melyik csúcsmátrixával dolgozunk, feltéve persze, hogy egy gondolatmenet során végig
csak eggyel.
Irányítatlan gráf szomszédsági mátrixa mindig szimmetrikus, azaz aij = aji i, j ∈ {1, …, n}.
Nyilván egyszerű gráf mátrixában a főátlóban végig 0 van, hiszen nincsenek hurokélek, míg a többi elem is csak 0 vagy
1, hiszen nincsenek többszörös élek sem. Meggondolható, hogy az A2 : = [aij(2)] mátrix aij(2) eleme éppen a Pi-ből Pj-be vezető
2-hosszúságú, azaz 2 élből álló séták számát jelöli, hiszen a mátrixszorzás de níciója szerint aij(2) = ai1a1j + ai2a2j+ … + ainanj,
amelyben a k-adik tag éppen a Pk csúcson keresztül vezető 2-hosszú Pi–Pk séták számát jelenti. Hiszen ha a k-adik csúcsba az
i-edikből aik darab él vezet, valamint a k-adikból a j-edikbe akj darab él, akkor a szorzási szabály alapján e számok szorzata
adja a Pk-n keresztüli összes 2 élből álló séták számát Pi-ből Pk-ba. Az összeg pedig akkor éppen a fenti állítást igazolja. Ez a
gondolatmenet irányított és irányítatlan gráfokra egyaránt érvényes a benne szereplő fogalmaknak rendre irányított,
illetve irányítatlan értelemben való használatával. Ebből adódik indukcióval, és a k = 1 triviális eset meggondolásával a
következő egyszerű tétel:

Legyen egy irányítatlan gráf csúcsmátrixa A, és minden pozitív egész k-ra mátrix. Ekkor a(k)ij
éppen a Pi-ből a Pj-be vezető k hosszúságú séták számát jelöli. Irányított gráf esetén a megfelelő irányított séták számát
kapjuk.

Három következményét említjük meg ennek a tételnek. Az első egyszerű, a második összefüggő, a harmadik irányított
gráfokra vonatkozik.

Ha az egyszerű irányítatlan gráf csúcsmátrixa , akkor gr(Pi = a(2)ii). Azaz a csúcsok fokszámát a
csúcsmátrix négyzetének főátlójából olvashatjuk ki.

Példa. A 24.39. ábrán egy 7 pontú gráfot látunk.


24.39. ábra

Ennek a 7 pontú gráfnak a csúcsmátrixa:

leolvashatók a főátlóból a fokszámok: 2, 3, 3, 2, 3, 1, 2. Nem triviális, de könnyen meggondolható az alábbi,


felhasználva az utak és séták de níciói (24.2. fejezet) közötti kapcsolatot.

Ha egy összefüggő gráf csúcsai: P1, P2, …, Pn, akkor Pi és Pj távolsága i ≠ j esetén (a legrövidebb út hossza) az a legkisebb
egész m szám, amelyre Am-ben a(m)ij ≠ 0.

A irányított gráfban akkor és csak akkor nincs irányított kör, ha van olyan k0 pozitív egész, hogy minden k ≥ k0
esetén a csúcsmátrixa k-adik hatványa zérusmátrix.

Ez a tétel ekvivalens azzal, hogy pontosan akkor létezik irányított kör a gráfban, ha létezik bármilyen hosszú
irányított séta -ben. Ennek igazolását az olvasóra bízzuk. (Megjegyezzük, hogy végtelen csúcsú gráfokra nem igaz a
tétel.)
Legyen adott az R (valós számok halmaza) feletti Rn vektortér a szokásos műveletekkel (a vektorösszeadás
koordinátánként R-beli összeadást, Rn-beli vektor R-beli skalárral való szorzása pedig szintén koordinátánként R-beli
szorzást jelent). Ekkor Rn lineáris transzformációinak egy-egyértelműen és művelettartóan megfeleltethetőek az R feletti n
× n-es mátrixok. Mint minden ilyen négyzetes mátrixnak, így az n csúcsú G gráf A csúcsmátrixának is de niálni lehet a
szokásos módon a sajátértékeit, illetve sajátvektorait, azokat a λ valós számokat és Rn-beli v ≠ 0 vektorokat, melyekre Av =
λv. Megjegyezzük, hogy R helyett C-t (komplex számok) is vehetjük, a lényeg, hogy egy N-et (természetes számok halmaza)
tartalmazó kommutatív test felett vizsgálódjunk.

A G gráf szomszédsági mátrixának sajátértékeit a gráf sajátértékeinek, a mátrix sajátvektorait a gráf sajátvektorainak
nevezzük.
A gráf sajátértékeinek halmaza a gráf spektruma.
Lehet a gráf spektrumán olyan matematikai objektumot is érteni, mely a sajátértékek mellett azok multiplicitásait is
tartalmazza, így például egy olyan halmazt, melynek elemei olyan rendezett párok, melyek első tagjai a sajátértékek,
második tagjai pedig a hozzájuk tartozó multiplicitások;
vagy azt a kétsoros mátrixot, melynek első sorában a sajátértékek, míg a második sorban a multiplicitásaik
szerepelnek.
Szokás nem gráfok által meghatározott mátrixok esetében is a sajátértékek halmazát a mátrix spektrumának nevezni,
így beszélhetünk a csúcsmátrix spektrumáról is.

Az n pontú G gráf karakterisztikus polinomjának a gráf A szomszédsági mátrixának karakterisztikus polinomját


nevezzük, tehát

ahol E jelöli az ún. egységmátrixot, melynek a főátlójában 1-esek állnak, és a többi eleme 0. Ez λ n-edfokú polinomja,
melynek főegyütthatója (–1)n, és konstans tagja det(A), az A mátrix determinánsa.

A karakterisztikus polinom valós gyökeinek halmaza éppen a gráf spektruma.

Példák
1. Legyen a gráfunk egy kétpontú gráf, ahol a két pont között fut egy él, és az egyik csúcsban van egy hurokél. Ekkor

a gráf csúcsmátrixa (például): . Ennek karakterisztikus polinomja: p(λ) = (1 – λ)(–λ) – 1 = λ2 – λ – 1, azaz

sajátértékei, a spektrum elemei, a másodfokú egyenlet gyökei lesznek: .


Megjegyezzük, hogy ennek az egyenletnek a felhasználásával levezethető a Fibonacci-sorozat nevezetes explicit
formulája is, de ezt az olvasóra bízzuk.
A továbbiakban az egyszerűség kedvéért szorítkozzunk csak egyszerű gráfokra, azaz minden 1 ≤ i ≤ n esetén aii = 0,
és minden aij mátrixelem vagy 1, vagy 0.
2. Legyen gráfunk az alábbi négypontú egyszerű gráf (24.40. ábra).

24.40. ábra

Ennek csúcsmátrixa: , így karakterisztikus polinomja a következő lesz:


P(λ) = λ4 – 4λ2 – 2λ + 1. Látható, hogy nincs harmadfokú tagja, ez a következő tételből adódóan minden egyszerű
gráfra igaz lesz, hogy az (n – 1)-edfokú tag együtthatója 0. A négyzetes tag együtthatója a gráf élei számának –1-
szerese, míg az elsőfokú tag együtthatója jelen esetben a gráf háromszögei számának –2-szerese.

Ezek a meg gyelések alátámasztják a következő tételt.

Egy egyszerű n-pontú gráf karakterisztikus polinomjában az (n – 1)-edfokú tag együtthatója 0, az (n – 2)-edfokú tag
együtthatója a gráf élei számának a (–1)-szerese, míg az (n – 3)-adfokú tag együtthatója a gráf háromszögei számának a
(–2)-szerese.

A bizonyításhoz egyrészt azt kell felhasználni, hogy az A – λE mátrixban a főátlón kívül nem szerepel λ. Így
determinánsának de níció szerinti felírásában (n – 1) db λ szorzótényezőt tartalmazó tag csak a főátlókból vett λ-kal jöhet
létre. Ott egyszerű gráf esetén végig csupa –λ áll, ebből vehetünk tehát (n – 1)-et, de akkor az utolsót is onnan kell venni,
mivel minden sorból és oszlopból pontosan egy elem szerepel egy tagban, mint szorzótényező, s így csak (–1)n λn jöhet létre,
λn–1-es tag nem, tehát a karakterisztikus polinomnak sem lehet (n – 1)-edfokú tagja. Másrészt, λn–2-os tag a
determinánsban, mint szorzat úgy jöhet létre, hogy a főátlóból (n – 2) elemet veszünk s hozzá két nem főátlóbelit. Ha az aii

és az ajj elemeket hagyjuk ki a főátlóból, akkor a szorzat , ha van él Pi és Pj között, illetve

, ha nincs. Ezeket összeadva kapjuk, hogy az (n – 2)-edfokú tag együtthatója olyan 2 × 2-es

deteminánsok összege, melyek értéke , ha van él Pi és Pj él között, különben , tehát


az együttható annyiszor (–1), ahány él van a gráfban. Végül, a karakterisztikus polinom (n – 3)-adfokú tagja úgy keletkezik,
hogy a determináns λn–3-os tagjait adjuk össze. Tehát 3 kivételével vesszük a főátló elemeit. Ilyenkor 3 × 3-as

determinánsokat kell néznünk (n alatt a 3 darabot), ahol az átlóban végig 0 van, és ezek közül a -ek lesznek
csak nem 0-k, hiszen mind szimmetrikus, és ha bármelyik szimmetrikus egyes párt 0-ra változtatjuk, akkor már 0 a
determináns értéke. Ezeknek értéke azonban 2, viszont páratlan sok – λ szorzata negatív előjelű, és annyi van belőlük,
ahány három olyan pont van, melyek közül bármely kettő között megy él (a fenti mátrixhoz pontosan egy háromszög
tartozik, hiszen mindhárom él be van húzva), ezért a karakterisztikus polinomban az együttható –2-szerese lesz a
háromszögek számának. Ezzel be is fejeztük a bizonyítást.
Reguláris gráfok esetén további nevezetes tételek mondhatók még ki, és igen érdekes problémák vetődnek fel.

Ha egy egyszerű gráf k-reguláris (azaz minden pont foka k), akkor
1. k sajátértéke G-nek;
2. ha G összefüggő is, akkor a k sajátérték multiplicitása 1;
3. G bármely λ sajátértékére | λ | ≤ k.

Nem bizonyítjuk, de mutatunk egy példát. Legyen G egy szabályos négyszöggráf (egy négy hosszú kör), aminek minden
pontja másodfokú, azaz 2-reguláris.

Ennek mátrixa a következő , és így a karakterisztikus polinomja: λ4 – 4λ2, amit ki lehetett volna abból
is találni, hogy 4 éle van, ezért a másodfokú tag együtthatója –4, mivel egyszerű, ezért harmadfokú tag nincs, és nincs
háromszöge sem, ezért lineáris tag sincs. A konstans pedig 0, hiszen a csúcsmátrix determinánsa 0. Sajátértékei a
karakterisztikus polinom gyökei: 2; 0; 0; –2. Teljesül, hogy a k = 2 sajátérték, egyszeres multiplicitású (G összefüggő), és a
többi sajátértékre teljesül, hogy abszolút értékben kisebbek, mint 2.
További összefüggés a következő:

Ha az n-pontú k-reguláris egyszerű gráf sajátértékei λ1 ≥ λ2 ≥ … ≥ λn, akkor komplementerének sajátértékei: n – 1 – λ1 és


– λ1 – 1 (2 ≤ i ≤ n).

A bizonyítások elolvashatók például Andrásfai B.: Gráfelmélet – folyamok, mátrixok című könyvében (Akadémiai
Kiadó, Budapest, 1983).
Az előző példánkban a komplementer 1-reguláris nem összefüggő gráf lesz. Sajátértékei a tétel szerint 1; 1; –1; –1. Nem
összefüggő, így nem egyszeres az 1, mint sajátérték. De a maximális az 1, és mindegyik abszolút értéke legfeljebb 1.
Zárjuk a szomszédsági mátrixszal kapcsolatos részt egy nevezetes reguláris gráfokra vonatkozó tétellel és egy máig
nyitott kérdéssel. Továbbiak olvashatók Hraskó András a budapesti Fazekas Mihály Fővárosi Gyakorló Gimnázium és
Általános Iskola honlapján található előadásában is.

Ho mann–Singleton-tétel. Ha egy k-reguláris 2 átmérőjű (bármely két csúcs között van legfeljebb 2-hosszú út) gráfnak
k2 + 1 csúcsa van, akkor k = 1, 2, 3, 7 vagy 57. Az első négy esetre létezik ilyen gráf, 7-re maguk a szerzők konstruáltak
egyet. A k = 57 máig eldöntetlen, hogy van-e ilyen 57-reguláris gráf 3250 csúccsal.

Végezetül megadunk egy újabb mátrixreprezentációt, és egy ezzel kapcsolatos tételt, bizonyítás és a fontos
alkalmazások ismertetése nélkül.

Az n csúcsú és e élű irányított gráf illeszkedési mátrixán értjük azt az n × e-es mátrixot, ahol
aij = 0, ha az i-edik csúcsra nem illeszkedik a j-edik él,
aij = 1, ha az i-edik csúcs kezdőpontja a j-edik élnek, és
aij = – 1, ha az i-edik csúcs végpontja a j-edik élnek.
Hasonlóan értelmezzük egy G irányítatlan gráf illeszkedési mátrixát, azzal a különbséggel, hogy aij = 1 abban az esetben
is, ha az i-edik csúcs végpontja a j-edik élnek.

Ha egy n pontú irányított gráf nem tartalmaz hurokélt, és komponenseinek a száma k, akkor illeszkedési
mátrixának a rangja n – k.

További mátrixreprezentációk ismertetése megtalálható például a Katona Gy.–Recski A.–Szabó Cs.: A


számítástudomány alapjai (Typotex, Budapest, 2006) vagy Busacker, R. G.–Saaty, T. L.: Véges gráfok és hálózatok (Műszaki
Könyvkiadó, Budapest, 1969) című könyvekben.
25. Kódelmélet
25.1. Bevezetés
25.2. Hibajavító kódok
25.3. Lineáris kódok
25.4. Ciklikus kódok

25.1. Bevezetés
A kódolás önmagában nem annyira matematikai, mint inkább gyakorlati fogalom. Egy adott információt szeretnénk egy
adott helyről máshová eljuttatni, miközben a rendelkezésre álló információs csatorna csak meghatározott jelek
(karakterek) továbbítására képes. Így a továbbítandó információt olyan formába kell átalakítani, hogy az az információs
csatornán átjusson, majd utána értelmezhető legyen. Tipikus példája ennek a morzeábécé: egy börtön szomszédos
celláiban elzárt rabok beszéd formájában nem tudnak egymással kommunikálni, de a falon való kopogással már (jobb
esetben) igen. Ekkor az üzenet küldője a mondanivalóját átalakítja morzejelekké, amit a falon, mint az adott információs
csatornán keresztül átküld a társának, ő pedig a kapott jelsorozatból vissza tud következtetni az eredeti üzenetre.
Ugyanezen az elven működnek a digitális adatrögzítők is, például egy koncertfelvétel hosszú 0–1 sorozat formájában kerül
archiválásra, amit egy megfelelő apparátus (mondjuk egy CD-lejátszó) ismét zenei hanganyaggá változtat vissza. Az
alapszituációt a következő diagrammal szokás ábrázolni:

A kódolás matematikai oldala ott kezdődik, amikor ezt az információtovábbítást megpróbáljuk gazdaságossá, illetve
biztonságossá tenni. Gazdaságossá abból a szempontból, hogy az üzenet kódolt formája lehetőleg ne legyen túl hosszú, így
gyorsan és olcsón eljusson a címzetthez. Biztonságossá pedig abból a szempontból, hogy ha az információs csatornán
valami külső hatásra torzul az üzenet, és nem pont ugyanaz a jelsorozat érkezik meg, mint ami elindult a kódolóból, akkor
ezt a hibát (amennyiben csak kis hibáról van szó) az üzenetmegfejtő berendezés észrevegye, és esetleg még korrigálni is
tudja. Ez a két elv viszont a gyakorlatban egymás ellen dolgozik: a gyorsan továbbítható üzenetkódolási módszerek nem túl
biztonságosak, illetve a biztonságos üzenetkódolás többnyire idő- és helyigényes. Így mindig egy adott szituációtól függ,
hogy a gyorsaság és a biztonságosság közötti középutat hogyan választjuk meg, részben ezért is van az, hogy sokféle
kódolási eljárás létezik.
Egy kód tulajdonképpen nem más, mint egy rögzített karakterkészletből alkotott szóhalmaz. Az adott karakterkészlet
a kódolási ábécé, ez lehet például a magyar vagy az angol ábécé is (beleértve a „szóköz” karaktert), vagy lehet egy
számhalmaz (mondjuk 0-tól 9-ig az egész számok). A leggyakoribb kódolási helyzetekben az információs csatorna
mindössze kétféle jel továbbítására képes, és ebből a két jelből (karakterből) kell a kódszavakat összeállítani. Matematikai
szempontból mindegy, hogy mivel jelöljük ezt a két karaktert, de megszokás, hogy a 0-t és az 1-et használjuk. A 0–1
karakterkészletre épülő kódokat bináris kódoknak nevezzük.
Egy kódban elvileg lehetnek különböző hosszúságú kódszavak. Ami a gyakorlatban fontos, az a következő három
tulajdonság:
- A beérkező jelsorozatból egyértelműen meg lehessen állapítani az egyes kódszavak elejét és végét, azaz a beérkező
jelsorozatot fel lehessen bontani kódszavakra.
- Amenyiben az információs csatorna nem teljesen megbízható, akkor lehetőleg ne legyenek egymáshoz nagyon hasonló
kódszavak, hogy az üzenettovábbítás során esetlegesen bekövetkezett torzulások hatására ne kapjon más értelmet az
üzenet.
- A kódszavak ne legyenek indokolatlanul hosszúak, mert ezzel az üzenettovábbítás időbeli és/vagy anyagi költségei
növekednek.
Felbontható kódnak nevezünk egy olyan kódot, ahol bármilyen jelsorozatot legfeljebb egyféleképpen lehet
kódszavakra bontani. Amennyiben minden kódszó hosszúsága ugyanaz (ezek az állandó hosszúságú kódok), akkor a
felbonthatósággal nincs gond, hiszen tudjuk, hogy a beérkezett jelsorozatban hány karakter után ér véget az első kódszó,
aztán a következő ugyanannyi karakter után ér véget a második kódszó, és így tovább, egyszerűen csak feldaraboljuk a
jelsorozatot az adott hosszúságú szakaszokra.

Példa. A {01, 001, 010} kód nem felbontható, mert például a 01001 jelsorozat kétféleképpen is értelmezhető: lehet 010 –
01 vagy 01 –001. Az {1, 01, 001} kód viszont felbontható, hiszen ebben a kódban az 1 karakter mindig a szó végét jelzi.
Az {100, 010, 001} kód pedig azért felbontható, mert állandó hosszúságú: minden beérkező jelsorozatot
automatikusan három hosszúságú szakaszokra kell bontanunk.

Az állandó hosszúságú kódoknak egy általánosítását jelentik a pre x kódok, ahol csak annyit kötünk ki a
kódszavakról, hogy egyik kódszó se kezdődjön egy másik kódszóval. Tehát ne lehessen egy kódszó végére újabb
karaktereket írni úgy, hogy a végén egy másik kódszót kapjunk eredményül. Egy kódnál szinte alapvető elvárás, hogy
egyértelműen felbontható legyen. A pre x kódok praktikus előnye pedig, hogy nemcsak egyértelműen felbonthatóak, de
ez a felbontás mindig egyszerűen megtehető: egy beérkező kódolt üzenet elejéről egyértelműen leválasztható az első
kódszó anélkül, hogy az üzenet folytatását megtekintenénk. Ezt követően a maradék jelsorozat elejéről ugyanígy
választható le a második kódszó stb.
A kódolás – mint eljárás – matematikai megközelítésben egy olyan függvény, ami üzenetekhez rendel hozzá – adott
kódábécé karaktereiből összeállított – kódszavakat. Ennek a megközelítésnek a leírásához érdemes az alábbi jelöléseket
bevezetni:
- W = {w1, w2, …, wM} az elemi üzenetek halmaza, a forrás. Az elemi üzenetek lehetnek betűk, számok vagy éppen egy adott
nyelv szavai is. A lényeg az, hogy a segítségükkel minden lehetséges üzenetet fel lehessen írni.
- F = {α1, α2, …, αn} a kódábécé, ezek az információs csatornán továbbítható karakterek, és belőlük épülnek fel a kódszavak.
- F* a kódábécé karaktereiből összeállítható szavak halmaza.
A fenti jelölések mellett kódolásnak nevezünk egy f:W → F* függvényt. A kódok vizsgálatánál sokszor nincs
matematikai jelentősége az elemi üzeneteknek, ilyenkor általában csak a kódot, azaz a kódszavak {f(w1), f(w2), …, f(wM)}
halmazát vizsgáljuk, magát az f: W → F* kódolási eljárást nem. Azonban olyan helyzetekben, amikor az elemi üzenetek
különböző gyakorisággal fordulnak elő, és a kódszavak nem feltétlenül egyenlő hosszúak, akkor fontos szerepe lehet a
kódolási eljárásnak, hiszen ha például a gyakoribb forrásüzenetekhez rövidebb kódszavakat rendelünk, akkor ezzel hosszú
távon jelentősen csökkenthetjük az információs csatornán átküldött adatmennyiséget, tehát költséget takaríthatunk meg.
További jelölések és alapfogalmak:
Jelölje Pj a wj elemi üzenet előfordulási valószínűségét (minden 1 és M közötti j egész számhoz), valamint |f(wj| az f(wj)
kódszó hosszát. A W forrás entrópiája

Az átlagos kódszóhossz pedig


Üzenetnek nevezünk egy elemi üzenetekből álló m = v1v2…vr véges sorozatot, a hozzá tartozó kódolt üzenet f(m) = f(v1)
f(v2)…f(vr). Az üzenetek halmazát jelölje W*. Az f: W → F* kódolás egyértelműen felbontható (vagy egyszerűen csak
felbontható), ha a hozzá tartozó kód felbontható, azaz bármilyen F*-beli karaktersorozat legfeljebb egyféleképpen állhat
elő kódolt üzenetként. (Másképp fogalmazva: a kiterjesztett f: W* → F* függvény injektív.) Az f: W → F* kódolás egy pre x
kódolás, ha a hozzá tartozó kód pre x, azaz ha egyik f(wi) kódszó sem kezdő szelete egy másik f(wj) kódszónak.
A következő három tétel arról szól, hogy felbontható, illetve pre x kódokat nem lehet akármilyen rövid kódszavakkal
készíteni.
MacMillan-egyenlőtlenség:

Ha adott l1, l2, …, lM pozitív egész számok mellett létezik olyan f:W → F* egyértelműen felbontható kód, amivel f(wi) =

li (i = 1, 2, …, M), akkor , ahol n az F kódábécé méretét jelöli.

Kraft-egyenlőtlenség:

Adott l1, l2, …, lM pozitív egész számok mellett akkor és csak akkor létezik olyan f:W → F* pre x kód, amivel

, ahol n az F kódábécé mérete.

Shannon tétele:

Egy egyértelműen felbontható kód átlagos szóhosszúsága legalább H/log2 n, ahol H az elemi üzenetek halmazának
entrópiáját és n a kódábécé méretét jelöli. Továbbá az elemi üzenetek adott W halmazához mindig létezik olyan kód,
amivel az átlagos szóhosszúság kisebb, mint 1 + H/log2 n.

Hu man-kódok
Hu man-kódok
A Hu man-algoritmus egy olyan eljárás, amivel az elemi üzenetek adott W = {w1 w2, …, wM} halmazához, a pi előfordulási
valószínűségek ismeretében elkészíthetünk egy, a lehető legkisebb átlagos szóhosszúságú pre x kódot. Az algoritmus
lényege, hogy egy gráfot építünk fel, pontosabban egy irányított fát, aminek a levelei az adott elemi üzenetek. Kiinduláskor
legyen Γ0 az a gráf, aminek a csúcsai ezek az elemi üzenetek, és amiben nincs egyetlen él sem. Minden wi csúcsot súlyozzuk
meg a hozzá tartozó pi előfordulási valószínűséggel. Ezt a Γ0 gráfot fogjuk több lépésben átalakítani.
Az első lépésben legyen t az M – 2 szám n – 1-gyel vett osztási maradéka plusz 2 (ahol M az elemi üzenetek számát, n
pedig a kódábécé méretét jelöli). Az összes többi lépésben legyen t = n. Általában, a k-adik lépésben kiválasztjuk a Γk–1 gráf t
legkisebb súlyú összefüggő komponensét, és egy újabb csúcs hozzáadásával egy irányított fát készítünk belőlük, melyben az
újonnan hozzáadott csúcs a gyökér, és ebből minden érintett összefüggő komponens gyökeréhez húzunk egy élt. Ennek az
új irányított fának a súlya a felhasznált összefüggő komponensek súlyösszege.
Könnyen átgondolható, hogy minden egyes lépéssel csökken az összefüggő komponensek száma, amely szám minden
egyes lépés után egy olyan pozitív egész, ami n – 1-gyel osztva 1-et ad maradékul. Továbbá minden lépés eredménye egy
olyan gráf, amiben az összes összefüggő komponens egy irányított fa, melyben a levelektől eltekintve minden csúcs ki-foka
legfeljebb n. Végül pontosan egy összefüggő komponens marad, melynek a súlya pontosan 1.
Ezután címkézzük az irányított éleket az F kódábécé karaktereivel úgy, hogy az azonos csúcsból kiinduló élekhez
mindig különböző karaktereket rendelünk. (Ezt megtehetjük, hiszen a kapott irányított gráfban minden csúcs ki-foka
legfeljebb n.) Majd minden egyes elemi üzenethez, mint a kapott irányított fa egy leveléhez azt a szót rendeljük kódszóként,
amit a gyökértől az adott levélig megtett út során, az érintett élekhez írt karakterekből összeolvasunk. Az így készített
kódokat nevezzük Hu man-kódoknak, az eljárás során elkészített irányított fát pedig Hu man-fának.

Példa. Legyen az elemi üzenetek halmaza W = {a, b, c, d, e, f}, és tegyük fel, hogy a hozzájuk tartozó előfordulási
valószínűségek pedig p(a) = 0,23, p(b) = 0,19, p(c) = 0,14, p(d) = 0,17, p(e) = 0,21 és p(f) = 0,06. A bináris Hu man-kód
elkészítése a következő lépésekből áll:

A kódszavak a kapott Hu man-gráfból olvashatók ki: a → 00, b → 011, c → 110, d → 010, e → 10 és f → 111. Az átlagos
kódhosszúság:

Összehasonlításképp, az entrópia
25.2. Hibajavító kódok
A továbbiakban csak állandó hosszúságú kódokkal foglalkozunk. Ilyenkor egy n hosszúságú kódon egy olyan halmazt
értünk, amiben minden kódszó egy n hosszúságú karaktersorozat. Az üzenet küldője és fogadója közt van egy előzetes
megegyezés a kódszavak listájáról (és azok jelentéséről), azonban az információs csatornán az átküldött kódszavak
torzulhatnak, amin azt értjük, hogy egyes karaktereik esetleg megváltoznak. Így a fogadó fél nem feltétlenül egy olyan szót
kap kézhez, ami szerepel a kódszavak listáján, és ebben az esetben utánanéz, hogy melyik kódszó „hasonlít” a leginkább a
kapott karaktersorozathoz. Ez a művelet a hibajavítás, ami természetesen nem nyújt százszázalékos biztonságot, inkább
csak arra mutat rá, hogy „jó eséllyel” mi lehetett az eredeti üzenet. Ennek a hibajavításnak a matematikai leírásához
néhány alapvető fogalomra van szükségünk.

Két kódszó, x és y távolsága (Hamming-távolsága) azon pozícióknak a száma, ahol a két kódszó eltér egymástól. Ezt a
távolságot d(x, y) jelöli.

A Hamming-távolság tehát azt jelzi, hogy hány karaktert kell megváltoztatni az egyik kódszóban ahhoz, hogy a másik
kódszót kapjuk eredményül. Ha x = x1x2…xn, és y = y1y2…yn, akkor

Egy C kód minimális távolsága pedig a különböző kódszavak közt fellépő legkisebb távolság:

A Hamming-távolság egy metrika egy adott hosszúságú szavak halmazán, azaz rendelkezik az alábbi tulajdonságokkal:
- d(x, y) ≥ 0 bármely x és y szavakra.
- d(x, y) = 0 akkor és csak akkor, ha x = y.
- d(x, y) = d(y, x) bármely x és y szavakra.
- d(x, y) + d(y, z) ≥ d(x, z) bármely x, y és z szavakra.
Egy C kódról azt mondjuk, hogy t hiba-jelző (felismer t hibát), ha t < d(C). Ezen azt értjük, hogy ha egy küldött szóban t
karakter megváltozik, és ez a t szám kisebb a kód minimális távolságánál, akkor a fogadó fél által kapott szó nem lehet még
véletlenül sem egy másik kódszó, így a fogadó fél tisztában van azzal, hogy az üzenet hibásan érkezett, és jobb esetben
ilyenkor az üzenet újbóli elküldését kérheti.
Egy C kód t hiba-javító(korrigál t hibát), ha bármelyik, a kódnak megfelelő hosszúságú w szóhoz legfeljebb egy olyan x
kódszó létezik, amivel d(w, x) ≤ t. Ekkor ha egy elküldött kódszóban t karakter megváltozik, a fogadó fél nemcsak azt ismeri
fel, hogy a kódszó hibásan érkezett, hanem vissza is tud következtetni az eredetileg küldött szóra. Egy C kód pontosan
akkor t hiba-javító, ha 2t < d(C).
A legegyszerűbb példái a hibafelismerő, illetve hibajavító kódoknak az ismétlő kódok. Például ha minden kódszó
ugyanannak a betűnek az n-szeri elismétlése, azaz C = {aa…a | a ∈ F}, ahol F a kódábécét jelöli, akkor bármely két
különböző kódszó távolsága pontosan n, így d(C) = n. Ekkor a C kód t hiba-felismerő, amennyiben t < n, illetve t hiba-javító,
amennyiben 2t < n. Ezeknek az ismétlő kódoknak az előnye, hogy kis számú hibát egyszerűen fel lehet ismerni, illetve ki
lehet javítani velük: ha a beérkező szóban a karaktereknek több mint a fele ugyanaz, akkor valószínűleg annak a
karakternek az ismétléséből állt az eredeti üzenet. Azonban az ismétlő kódoknak van egy nagy hátránya is: helyigényesek.
Kicsit másképp fogalmazva, a használt kódhosszúsághoz képest csak kevés kódszó áll rendelkezésünkre.

Példa. A C = {000000, 010101, 101010, 111111} kód szigorú értelemben nem ismétlő kód, de ismétlésen alapszik: minden
kódszóban az első két karakter ismétlődik meg háromszor. Itt a kódtávolság három, tehát C egy 1 hiba-javító kód. Ez
a kód azért nem gazdaságos, mert egy négy kódszóból álló, 1 hiba-javító kódot rövidebb kódhosszúsággal is
készíthetünk, például {00000, 11100, 00111, 11011}. Itt a minimális távolság szintén három, a kódhossz viszont csak öt.

Egy (n, M, d) kódon egy M darab n hosszúságú kódszóból álló és d minimális távolságú kódot értünk. Jó esetben az n
szám viszonylag kicsi (rövidebb kódszavakkal időt és anyagi költségeket takaríthatunk meg), az M szám viszonylag nagy
(minél több kódszó áll rendelkezésünkre, annál többféle üzenetet tudunk megfogalmazni), és végül a d számról szintén azt
szeretnénk, hogy lehetőleg minél nagyobb legyen, hiszen így válik a kód biztonságossá a hibafelismerés, illetve a
hibajavítás szempontjából. A gyakorlati probléma abból adódik, hogy ezt a három törekvést nehéz egyszerre szem előtt
tartani: bármely két paraméter megadása esetén a harmadik paraméternek már megvannak a korlátai. A hibajavító kódok
elméletének az egyik fő célja lényegében az, hogy ezeket a korlátokat megtaláljuk. Tehát például arról van szó, hogy adott n
kódhossz és előírt M kódszómennyiség mellett maximálisan mekkora lehet a d kódtávolság, vagy ha a d kódtávolságot és az
M kódszómennyiséget írjuk elő, akkor minimálisan mekkora hosszúságú kódszavakat kell használnunk. A leginkább
vizsgált kérdéskör viszont a harmadik felállás, amikor is adott n kódhossz és előírt d kódtávolság mellett szeretnénk
megállapítani, hogy maximálisan hány szóból állhat a kód.

Aq (n, d) jelöli a legnagyobb olyan M számot, amivel létezik egy q karakterre épülő (n, M, d) kód. Amennyiben ilyen kód
nincs, akkor Aq (n, d) sincs értelmezve.
Abban a két szélsőséges esetben, amikor d = 1 vagy d = n, ez az Aq(n, d) érték egyszerűen átgondolható: Aq(n, 1) = qn és
Aq(n, n) = q. (Az összes n hosszúságú szó halmaza qn elemű és 1 minimális távolságú, illetve az azonos karakterekből álló
szavak halmaza q elemű és n minimális távolságú.) Továbbá az is igaz, hogy Aq(n, 2) = qn–1, azonban általános képlet nincs
Aq(n, d)-re. Sőt, nagyobb kódhosszúságok mellett ez az érték már csak bizonyos speciális esetekben ismert, általában már
azzal is be kell érnünk, hogy ha az Aq(n, d) értékekre bizonyos alsó, illetve felső korlátokat tudunk megadni.

Példa. A2(5, 3) = 4. Négy kódszóból álló, 5 hosszúságú és 3 távolságú kódot egy korábbi példában már láttunk: {00000,
11100, 00111, 11011}. És viszonylag könnyen átgondolható, hogy négy kódszó a maximum: öt szóból álló, 5 hosszúságú
és 3 távolságú bináris kód már nem létezik.

Az alábbi táblázat összefoglalja a jelenleg ismert A2(n, d) értékeket n ≤ 20 és d = 3, 5, 7, 9, 11, 13 és 15 mellett. (Ahol két
szám van megadva, ott a pontos érték egyelőre nem ismert, a két szám közül értelemszerűen az egyik alsó, a másik felső
korlát.) A páros d számokhoz tartozó A2(n, d) értékek szintén kiolvashatók ebből a táblázatból: amennyiben d páros, akkor
A2(n, d) = A2(n – 1, d – 1).

n d=3 d=5 d=7 d=9 d = 11 d = 13 d = 15

3 2 – – – – – –

4 2 – – – – – –

5 4 2 – – – – –

6 8 2 – – – – –

7 16 2 2 – – – –

8 20 4 2 – – – –

9 40 6 2 2 – – –

10 72 12 2 2 – – –

11 144 24 4 2 2 – –

12 256 32 4 2 2 – –

13 512 64 8 2 2 2 –

14 1024 128 16 4 2 2 –

15 2048 256 32 4 2 2 2

16 2720–3246 256–340 36–37 6 2 2 2

17 5312–6552 512–680 64–72 10 4 2 2

18 10496–13104 1024–1280 128–142 20 4 2 2

19 20480–26208 2048–2372 256–274 40 6 2 2

20 36864–43688 2560–4096 512 42–48 8 4 2

Egyszerű átalakítások
Korlátok Aq (n, d)-re

Egyszerű átalakítások
Adott kódokból az alábbi egyszerű átalakításokkal újabb kódokat kaphatunk.
1. Egy rögzített permutációt végrehajtunk az összes kódszón belül az egyes pozíciókra. Ha σ az {1, 2, …, n} számoknak egy
permutációja és x = x1x2…xn egy n hosszú szó, legyen xσ=xσ(1)xσ(2)…xσ(n). Ekkor tetszőleges n hosszúságú C kód esetén Cσ=
{xσ | x ∈ C} egy szintén n hosszúságú kód, aminek a további paraméterei (kódszavak mennyisége, minimális távolság) is
megegyeznek az eredeti kód paramétereivel.
2. Az ábécé elemeit permutáljuk meg egy rögzített pozícióban. Ha τ az F ábécé elemeinek egy permutációja, 1 ≤ i ≤ n és x = x1x2…
xn egy n hosszú szó, legyen xτ,i = x1 … xi–1 τ(xi)xi+1… xn. Ekkor tetszőleges n hosszúságú C kód esetén Cτ,i = {xτ,i | x ∈ C}
szintén egy olyan kód, aminek a paraméterei megegyeznek az eredeti kód paramétereivel.
3. Egy pozíciót törlünk. Rögzített 1 ≤ i ≤ n mellett az n hosszúságú C kód összes szavából töröljük az i-edik pozíciót, az
eredményül kapott kód n – 1 hosszúságú, és a minimális távolsága vagy változatlan, vagy 1-gyel kisebb, mint az eredeti kód
minimális távolsága. A kódszavak mennyisége általában nem változik, kivéve azt az egy esetet, amikor az eredeti minimális
távolság 1 volt, és létezett két olyan kódszó, amik csak az i-edik koordinátában tértek el egymástól. Ekkor ugyanis ebből a két
szóból a törlés után ugyanaz marad meg.
4. Ha kiválasztunk olyan kódszavakat, amik egy rögzített i-edik pozícióban ugyanazt a karaktert tartalmazzák, majd ezekből
állítjuk össze az új kódot az i-edik pozíció törlésével, akkor a kódhosszúság 1-gyel rövidül, és a kódszavak száma jelentősen
csökkenhet, viszont a kapott kód minimális távolsága egész biztosan nem csökken. Így például egy bináris (n, M, d) kódból
kaphatunk egy bináris kódot, hiszen ha nincs kódszó, ami 0-t tartalmaz az i-edik pozícióban,
akkor biztosan van kódszó, ami 1-et tartalmaz az i-edik pozícióban.
5. Paritás-ellenőrző bit hozzáadása. Ezt a műveletet bináris kódokra alkalmazhatjuk: minden kódszó végéhez hozzáírunk még
egy 0-t vagy 1-et aszerint, hogy a kódszó páros vagy páratlan 1-est tartalmazott. Az eredményül kapott kódban minden szó
páros sok 1-est fog tartalmazni, így annak a minimális távolsága biztosan egy páros szám lesz (ami nem lehet kisebb, mint az
eredeti kód minimális távolsága). Ezt a műveletet tehát páratlan minimális távolságú kódokon érdemes végrehajtani: ha C
egy bináris (n, M, d) kód, és d egy páratlan szám, akkor a paritás-ellenőrző bit hozzáadása egy (n + 1, M, d + 1) kódot ad
eredményül.
Két kódot ekvivalensnek nevezünk, ha egymásból megkaphatók a fenti lista első és második műveleteinek (esetleg
többszöri) alkalmazásával. Ezekre a műveletekre azért lehet szükség, mert így egy tetszőlegesen rögzített szót bevihetünk
egy kódba. Ha C egy n hosszú kód, és x = x1x2…xn egy ugyanarra az ábécére épülő szó, akkor van olyan C-vel ekvivalens kód,
ami tartalmazza az x szót. Speciálisan minden bináris kód ekvivalens egy olyan kóddal, ami tartalmazza a csupa nulla szót.
A harmadik, negyedik és ötödik műveletekből az alábbi egyenlőtlenségek, illetve egyenlőségek vezethetők le:
- Aq(n – 1, d – 1) ≥ Aq(n, d);
- q · Aq(n – 1, d) ≥ Aq(n, d);
- ha d egy pozitív páros szám, akkor A2(n – 1, d – 1) = A2(n, d).
Az utolsó átalakítási módszert, az ellenőrző bit hozzáadását akkor is meg tudjuk tenni, ha az F ábécé egy tetszőleges
test (például F = {0, 1, …, q – 1} valamilyen q prímszám mellett, és mint látni fogjuk, az algebrai kódelmélet nagyrészt ilyen
kódokkal foglalkozik), ilyenkor a kódszavak végére azt a karaktert írjuk, amivel a karakterek összege 0-t eredményez. Egy n
hosszúságú C kód ellenőrző bittel kiterjesztett kódja:

Ha C egy (n, M, d) kód, akkor C̄ egy (n + 1, M, d̄) kód, ahol d értéke vagy d, vagy d + 1, viszont nincs általános módszer
annak a megállapítására, hogy a kettő közül melyik.

Korlátok Aq (n, d)-re


Már említettük, hogy nagyobb q, n és d értékek mellett általában nehéz meghatározni Aq(n, d) pontos értékét, de sokszor az
is hasznos, ha ezt sikerül bizonyos korlátok közé szorítani. A Hamming- és Singleton-korlátok ilyen általános felső korlátok
az Aq(n, d) értékekre. A Hamming-korlát speciális esetei 3 távolságú kódokra, illetve 5 távolságú kódokra:

Általánosabban, ha e tetszőleges pozitív egész, akkor

Ennek a korlátnak a hátterében az az észrevétel áll, hogy egy q elemű ábécét használó n hosszúságú kód minden
tagjának az e sugarú hibakörnyezete (azon szavak halmaza, amik az adott kódszótól legfeljebb e távolságra állnak)

pontosan szót tartalmaz. És amennyiben a kódszavak egymástól mért távolsága mindig legalább 2e + 1,
akkor ezek az e sugarú hibakörnyezetek diszjunktak, így az együttes méretük nem lehet több, mint amennyi n hosszú szó
van összesen, azaz qn. Azokat a kódokat, amiknek a mérete pontosan a Hamming-korlát által megadott felső határ, perfekt
kódoknak nevezzük.
A Singleton-korlát pedig azon a tényen alapszik, hogy egy n hosszúságú és d távolságú kód bármely két tagja az első n –
d + 1 pozíció valamelyikében eltér egymástól (a maradék d – 1 pozícióból már nem jöhet össze a szükséges d távolság). Az
első n – d + 1 pozícióra pedig qn–d+1 lehetőség van, így:

Azokat a kódokat, amiknek a mérete pontosan a Singleton-korlát által megadott felső határ, MDS kódoknak nevezzük.
(Ez az angol „maximum-distance separable” kifejezés kezdőbetűiből adódik.)
A Plotkin-korlátok nagyjából csak azokra az esetekre vonatkoznak, amikor a minimális távolság legalább a kódhossz
fele:
-
Ha d páros és n < 2d, akkor
- Ha d páros, akkor A2(2d, d) ≤ 4d.
-
Ha d páratlan és n < 2d + 1, akkor
- Ha d páratlan, akkor A2(2d + 1, d) ≤ 4d + 4.
A Gilbert–Varshamov-korlát alsó korlátot szolgáltat az Aq(n, d) értékekre. Két változata van, az egyik erősebb korlát,
de azzal a feltevéssel, hogy q prímhatvány, míg a másik kicsit gyengébb, de általános korlát.
- Ha q egy prímhatvány, és

akkor Aq(n, d) ≥ qk.


- Ha q tetszőleges 1-nél nagyobb egész, akkor

25.3. Lineáris kódok


Ebben a részben csak olyan kódokkal foglalkozunk, ahol a kódolási ábécé egy test, azaz egy olyan F halmaz, amin
értelmezve van egy összeadás és egy szorzás, továbbá erre a két műveletre érvényesek a (12. fejezetben részletezett)
testaxiómák. Általában érdemes feltenni, hogy az F halmaz véges, és a mérete ekkor szükségszerűen egy prímhatvány,
amit a továbbiakban q jelöl. Amennyiben az olvasó nem jártas a véges testek elméletében, a továbbiak megértése
szempontjából nyugodtan feltételezheti, hogy F = {0, 1, …, q – 1} valamilyen rögzített q prímszám mellett, a műveleteket
pedig modulo q végezzük el, azaz a szokásos összeadás, illetve szorzás után az eredménynek mindig a q-val vett osztási
maradékát vesszük.
Rögzített n pozitív egész mellett az F ábécéből alkotott n hosszú szavak halmazát Fn jelöli, ezen is értelmezhetünk
kétfajta műveletet: egy összeadást és egy skalárral való szorzást, amiket koordinátánként végzünk el. Ha x = x1x2…xn és y =
y1y2…yn két Fn-beli szó, továbbá a ∈ F egy skalár, akkor

Ezekkel a műveletekkel Fn egy n dimenziós vektortér F felett. (Vektorterekről bővebben a 11. fejezetben olvashatunk.)

Egy n hosszúságú és F karakterkészletű C kód lineáris, ha altere az Fn vektortérnek, azaz nem üres, zárt az összeadásra
és zárt a skalárokkal való szorzásra is.

Egy lineáris kód tehát saját maga is vektortér F felett, és ha a dimenziója k, akkor az elemszáma qk. A szokásos jelöléssel
C ekkor egy lineáris [n, k]-kód, illetve ha a d kódtávolságra is szeretnénk hivatkozni, akkor C egy lineáris [n, k, d]-kód.

Példa. A C = {00000, 11100, 00111, 11011} kód egy lineáris [5, 2, 3]-kód az F = {0, 1} kételemű test felett. Bináris kódról
lévén szó, itt a skalárszorosokról igazából nincs értelme beszélni, hiszen minden szónak csak két skalárszorosa van:
az 1-szerese, ami önmaga és a 0-szorosa, ami a csupa nulla szó, és ez valóban eleme C-nek. Továbbá az is könynyen
ellenőrizhető, hogy bármely két C-beli szó összege is valamelyik C-beli szót eredményezi.

Egy lineáris kód mindig tartalmazza a csupa nulla szót (amit 0-val jelölünk, és ez az Fn vektortér nullvektora), hiszen
bármelyik kódszóval együtt annak minden skalárszorosát, speciálisan a 0-szorosát is tartalmaznia kell. Ezért aztán ha a
minimális kódtávolság d, akkor minden más kódszóban szükségszerűen lennie kell legalább d nem nulla karakternek.

Egy x ∈ Fn szó súlya a benne szereplő nem nulla karakterek száma. Ezt a számot w(x) jelöli. Egy C lineáris kód
minimális súlya, w(C) a benne szereplő 0-tól különböző kódszavak súlyainak a minimuma.

Tehát w(x) nem más, mint az x szó távolsága a 0 szótól: w(x) = d(x, 0). Megfordítva, két szó távolságát is ki lehet fejezni a
súly fogalmával: d(x, y) = w(x – y). Továbbá az is igaz, hogy egy lineáris kód minimális távolsága és minimális súlya
megegyezik: d(C) = w(C).
Ez utóbbi észrevételben jelentkezik a lineáris kódok egyik nagy előnye: ahhoz, hogy a kódtávolságot megállapítsuk,
elég a kódszavak súlyait megvizsgálni. Általában, egy M szóból álló kód minimális távolságának a meghatározásához az
összes lehetséges szópár távolságát meg kell nézni, ez pedig M(M – 1)/2 vizsgálat. Egy M szóból álló lineáris kód esetén
azonban ennél lényegesen kevesebb munkát, pontosabban M – 1 vizsgálatot jelent a minimális távolság meghatározása,
hiszen ehhez csak a nem nulla kódszavak súlyaira van szükségünk.
Egy másik előnye a lineáris kódoknak, hogy a precíz meghatározásukhoz nem kell az összes általuk tartalmazott
kódszót felsorolni. Mivel egy lineáris kód egyben egy vektortér is, ezért tartalmaz bázist: egy olyan vektorhalmazt, aminek
az elemeiből minden kódszó pontosan egyféleképpen állítható elő lineáris kombinációval. Egy lineáris [n, k]-kód tehát
meghatározható k darab n hosszú vektor segítségével, amikből már az összes kódszót elő tudjuk állítani.

Egy lineáris [n, k]-kód generátormátrixa egy olyan k×n méretű mátrix, aminek a sorai az adott lineáris kódnak egy
bázisát alkotják.

Példák
1. Az n hosszú ismétlő kód egy lineáris [n, 1]-kód, a generátormátrixa (1 1 … 1).
2.

A C = {00000, 11100, 00111, 11011} lineáris [5, 3, 2]-kódnak egy lehetséges generátormátrixa .
3.

mátrix által generált bináris lineáris kód egy [7, 4]-kód, összesen 24 = 16 kódszóból
áll.

A generátormátrixon elemi sorátalakításokat hajthatunk végre anélkül, hogy a generált kód megváltozna, és mivel
minden (test feletti) mátrix elemi sorátalakításokkal redukált lépcsős alakra hozható, így ebből következik, hogy minden
lineáris kódnak van redukált lépcsős alakú generátormátrixa. Amennyiben a generátormátrixban oszlopcseréket hajtunk
végre, akkor általában megváltozik a generált kód is, viszont a fontosabb tulajdonságai (hossz, kódszavak száma,
minimális távolság) változatlanok maradnak. Egy, az eredetivel ekvivalens kódot kapunk. Az oszlopcserék alkalmazása
pedig azért lehet praktikus, mert így a redukált lépcsős alakra hozott generátormátrixból egy olyan mátrixot készíthetünk,
aminek a bal oldalán egy egységmátrix szerepel.
Minden lineáris [n, k, d]-kód ekvivalens egy olyan lineáris [n, k, d]-kóddal, aminek létezik (Ek | A) alakú
generátormátrixa, ahol A egy k × (n – k) méretű mátrix, Ek pedig a k × k méretű egységmátrix. Az ilyen generátormátrixra
azt mondjuk, hogy standard alakú.

Példa. Az előző példában már láttuk, hogy a C = {00000, 11100, 00111, 11011} lineáris [5, 3, 2] = kódnak egy lehetséges

generátormátrixa . Ez ugyan nem redukált lépcsős alak, de a második és a negyedik oszlopok

cseréjével egy standard alakú generátormátrixot kapunk:


Az ehhez tartozó kód az eredeti kódból úgy adódik, hogy minden kódszóban felcseréljük a második és a negyedik
pozíciót. A kódszavak: 00000, 10110, 01101 és 11011.

Duális kód
Hamming-kódok
Golay-kódok
Perfekt kódok
BCH-kódok

Duális kód
Az Fn vektortérben természetes módon értelmezhetünk egy skalárszorzást: ha x = x1x2…xn és y = y1y2…yn, akkor x · y = x1y1
+ x2y2+ … + xnyn. Két vektor merőleges egymásra, ha skalárszorzatuk nulla.

Azok a vektorok, amik egy adott C ⊂ Fn kód összes elemére merőlegesek, szintén egy alteret alkotnak Fn-ben, ez a C
merőleges altere, kódelméleti nyelven duális kódja, jelölése C┴.
Ahhoz, hogy egy v ∈ Fn vektor benne legyen a duális kódban, elég, ha az eredeti kód egy generátormátrixának minden
sorára merőleges, ebből ugyanis már következik, hogy merőleges az összes kódszóra is. Ha C egy [n, k]-kód, akkor C┴ egy
[n, n – k]-kód, továbbá C┴ duális kódja maga az eredeti C kód. A C┴ duális kód egy generátormátrixát C ellenőrző
mátrixának nevezzük:

Egy lineáris [n, k]-kód ellenőrző mátrixa egy olyan (n – k) × n méretű H mátrix, amivel tetszőleges x vektor esetén xHT =
0 pontosan akkor teljesül, ha x egy kódszó.

Egy lineáris [n, k]-kód H ellenőrző mátrixa standard alakú, ha H = (B | En–k) valamilyen alkalmas (n – k) × k méretű B
mátrixszal.

Ha G = (Ek | A) egy generátormátrixa a C lineáris [n, k]-kódnak, akkor H = (– AT | En–k) egy generátormátrixa a C┴ duális
kódnak.

Egy lineáris kód minimális távolsága kiolvasható az ellenőrző mátrixból.

Ha egy lineáris kód ellenőrző mátrixában van d lineárisan összefüggő oszlop, de bármely d – 1 oszlop lineárisan
független, akkor a kód minimális távolsága pontosan d.

Ennek a tételnek az egyik egyenes következménye a lineáris kódokra vonatkozó Singleton-korlát:

Egy lineáris [n, k]-kód minimális távolsága legfeljebb n – k + 1.

Egy fontos gyakorlati alkalmazás pedig, hogy meghatározott minimális távolságú kódokat tudunk készíteni alkalmas
ellenőrző mátrixokból kiindulva.

Példa. Az F = {0, 1} kételemű test feletti mátrix egy standard alakú ellenőrző mátrix, és
bármely két oszlopa lineárisan független. Lineárisan öszszefüggő oszlophármast viszont már tartalmaz, pl. a
második, harmadik és negyedik oszlop összege a nullvektort eredményezi. A H-hoz mint standard ellenőrző

mátrixhoz tartozó standard generátormátrix , tehát egy lineáris [7, 4, 3]-kód


generátormátrixa. A kódszavak a G mátrix soraiból lineáris kombinációval előállítható 7 hosszúságú 0-1 vektorok
(összesen 24 = 16 kódszó), a minimális távolság pedig 3. Ez a kód a bináris 7 hosszúságú Hamming-kód.

Legyen C egy lineáris [n, k]-kód, és H egy ellenőrző mátrixa. Egy tetszőleges Fn-beli y vektor C-hez tartozó
szindrómavektora az S(y) = y · HT sorvektor.

Ez a szindrómavektor általában függ H megválasztásától, viszont pontosan akkor a nullvektor, ha y egy C-beli kódszó.
Illetve két vektor, x és y szindrómája pontosan akkor egyezik meg, ha az x – y különbségvektor egy C-beli kódszó. Ez a tény
megkönnyíti a dekódolás folyamatát, ugyanis ha ismerjük a lehetséges hibavektorok szindrómáit, akkor egy beérkezett
üzenetszó szindrómáját kiszámítva nemcsak az derül ki, hogy történt-e torzulás az átviteli csatornán, hanem vissza is
tudunk következtetni az esetleges hibára. Ha az elküldött üzenet az x kódszó, ami menet közben egy e hibavektorral
változott, így az y = x + e szó érkezett meg, akkor ennek a szindrómája S(y) = S(x)+ S(e) = S(e). Amennyiben
rendelkezésünkre áll a lehetséges hibavektorok szindrómáinak a listája, akkor e lista alapján az S(e) szindrómából kiderül,
hogy mi lehetett az e hibavektor, amit aztán a beérkezett y vektorból levonva megkapjuk az eredetileg küldött üzenetet: x =
y – e.

Hamming-kódok
A Hamming-kódok lineáris egy hiba-javító kódok, amiket bármilyen F véges test felett de niálhatunk. Elméleti
jelentőségük, hogy perfekt kódok (azaz a Hamming-korlát által megengedett lehető legtöbb kódszót tartalmazzák),
praktikus szempontból pedig azért fontosak, mert igen egyszerű eljárással elvégezhető a hozzájuk tartozó kódolási,
hibajavítási és dekódolási folyamat.
Legyen F egy q elemű véges test, r egy pozitív egész és H egy olyan mátrix, aminek r sora és oszlopa van:
valamilyen sorrendben azok az F feletti r hosszú nem nulla oszlopvektorok, amelyeknek az első 0-tól különböző eleme
1. Ekkor a H-hoz mint ellenőrző mátrixhoz tartozó lineáris kód egy Hamming-kód, jelölése Ham (r, q).

Ez a kód tehát nem egyértelmű (csak ekvivalencia erejéig az), hiszen a H mátrix oszlopainak a sorrendje szabadon
megválasztható, így precízen fogalmazva Ham (r, q) valójában kódoknak egy osztályát jelöli. A lényeg, hogy a de nícióban
szereplő H mátrixhoz tartozó Hamming-kód azokból a kódszavakból áll, amik minden H-beli sorra merőlegesek. Ez a kód

egy lineáris [n, n – r, 3]-kód, ahol .

A Hamming-korlát szerint egy n hosszúságú, 3 távolságú kód legfeljebb kódszót tartalmazhat. Mivel itt
n = (qr – 1)/(q – 1), ebből a felső korlátból egyszerűsítés után qn – r adódik, ami pontosan a Ham (r, q) kód szavainak a száma.
A Hamming-kódok tehát perfekt kódok: az adott kódhosszúság mellett a lehető legtöbb kódszót tartalmazzák.

Példa. Ha q = 3 és r = 2, akkor a standard alakú ellenőrző mátrix megfelel a Hamming-kódok


de níciójában előírt követelménynek. A hozzá tartozó Ham (2, 3) kód egy lineáris [4, 2, 3]-kód a 3 elemű test felett, a

generátormátrixa

A Hamming-kódok egy hiba-javító kódok, így a dekódolásukhoz abból a feltevésből kell kiindulnunk, hogy az
információs csatornán átküldött kódszavakon legfeljebb egy hiba történik, azaz legfeljebb egy karakter változik meg. És
perfekt kódokról lévén szó, minden (a kódnak megfelelő hosszúságú) szó benne van valamelyik kódszó egy sugarú
hibakörnyezetében: vagy maga egy kódszó, vagy pontosan egy pozícióban tér el egy kódszótól. Tehát a lehetséges
hibavektorok azok a vektorok, amiknek pontosan egy nullától különböző koordinátájuk van. Ezeknek a
szindrómavektorait könnyen le tudjuk írni: ha ei jelöli azt a vektort, aminek az i-edik koordinátája 1, és a többi koordinátája
mind nulla, továbbá b ∈ F, akkor S(bei) az ellenőrző mátrix i-edik oszlopának a b-szerese, sorvektorként felírva.
(Precízebben: az ellenőrző mátrix transzponáltjában az i-edik sor b-szerese.) A dekódolás folyamata ezek után a következő:
a kapott y vektornak kiszámítjuk az S(y) = y · HT szindrómavektorát, ahol H az ellenőrző mátrix. Ha ez a nullvektor, akkor
y egy kódszó, és feltételezhetjük, hogy nem történt hiba az adatátvitelben. Ha S(y) ≠ 0, akkor jelölje b az első nullától
különböző koordinátáját, és jelölje i azt a számot, amire b–1 S(y) megegyezik a HT mátrix i-edik sorával. (Ilyen i létezik, mert
b–1 S(y) első nullától különböző koordinátája 1.) Ebből már következik, hogy a hiba az i-edik pozícióban történt, a mértéke
pedig b, azaz a küldött kódszó x = y – bei.

Golay-kódok
A kibővített bináris Golay-kód, G24 egy 24 hosszúságú lineáris kód, aminek a generátormátrixa G = (E12 |A), ahol E12 a 12 × 12
méretű egységmátrix és

A kódszavak száma 212 = 4096, és annyit érdemes még tudni erről a kódról, hogy duálisa saját magának (G⊥24 = G24),
minden benne szereplő kódszó súlya osztható 4-gyel, továbbá a minimális távolsága 8, azaz G24 egy [24, 12, 8]-kód. Ebből
egyszerűen úgy kapjuk meg a G23 bináris Golay-kódot, hogy a kódszavak utolsó koordinátáit elhagyjuk, tehát G23 egy
lineáris [23, 12, 7]-kód.
A Hamming-korlát alapján egy 23 hosszúságú és 7 minimális távolságú kód mérete legfeljebb

A G23 kódban pedig pontosan ennyi kódszó van, így G23 egy perfekt kód.
A kibővített ternér (ternáris) Golay-kód, G12 egy 12 hosszúságú lineáris kód a háromelemű F = {0, 1, 2} test felett, aminek
a generátormátrixa G = (E6 | B), ahol E6 a 6 × 6 méretű egységmátrix és

A kódszavak száma 36 = 729, ez a kód is duálisa saját magának (G⊥12 = G12), és a minimális távolsága 6, azaz G12 egy [12, 6,
6]-kód. Ebből egyszerűen úgy kapjuk meg a G11 ternér Golay-kódot, hogy a kódszavak utolsó koordinátáit elhagyjuk, tehát
G11 egy lineáris [11, 6, 5]-kód.
A Hamming-korlát alapján egy 11 hosszúságú és 5 minimális távolságú ternér kód mérete legfeljebb

A G11 kódban pedig pontosan ennyi kódszó van, így G11 szintén egy perfekt kód.

Perfekt kódok
Mint már említettük korábban, egy q elemű ábécére épülő, n hosszú és e hiba-javító kód mérete a Hamming-korlát alapján

legfeljebb , és amenynyiben pontosan ennyi, akkor a kódot perfekt kódnak nevezzük. A perfekt
kódoknak egy másik lehetséges de níciója:

Egy n hosszúságú és e hiba-javító C kód perfekt, ha bármely n hosszú x szóhoz pontosan egy olyan C-beli c kódszó
létezik, amivel d(x, c) ≤ e.

Vannak bizonyos triviális (és nem éppen praktikus) perfekt kódok, ezek három típusba sorolhatók:
- Ha e = 0: Az összes n hosszú szót tartalmazó C = Fn kód egy 0 hiba-javító perfekt kód.
- Ha egy kód csak egy darab n hosszú kódszót tartalmaz, akkor az egy perfekt n hiba-javító kód.
- Ha n = 2e + 1, akkor az n hosszú bináris ismétlő kód, C = {00 … 0, 11 … 1} (illetve bármely ezzel ekvivalens kód) egy perfekt e
hiba-javító kód.
A már tárgyalt Hamming- és Golay-kódokon kívül léteznek még nem triviális perfekt kódok, viszont érdekes módon az
ismert nem triviális perfekt kódok paraméterei mind megegyeznek valamelyik Hamming-kód vagy Golay-kód
paramétereivel. Azt nem tudjuk, hogy van-e olyan, aminek az ábécéje nem prímhatvány elemszámú. A prímhatvány
elemszámú ábécére épülő perfekt kódokról pedig a következő igaz:

Ha C egy q elemű ábécé feletti nem triviális perfekt kód, ahol q egy prímhatvány, akkor C paraméterei (hosszúsága,
mérete és minimális távolsága) megegyezik valamelyik Hamming-kód vagy Golay-kód paramétereivel.

Ezt a tételt 1973-ban van Lint és Tietäväinen bizonyították először, illetve tőlük függetlenül Zinovjev és Leontyev.
Ennél kicsit több is igaz, a két Golay-kód ugyanis bizonyos értelemben egyértelmű, ezt Sover, Delsarte és Goethals
bizonyították 1973-ban, illetve 1975-ben.

Minden perfekt (23, 4096, 7)-kód ekvivalens a G23 bináris Golay-kóddal, és minden perfekt (11, 729, 5)-kód ekvivalens a
G11 ternér Golay-kóddal.

BCH-kódok
A BCH-kódokat először Hocquenghem fedezte fel 1959-ben, majd tőle függetlenül Bose és Ray-Chaudhuri 1960-ban. (A BCH
elnevezés a neveik kezdőbetűiből tevődik össze.)
Legyen q egy tetszőleges prímhatvány, d egy 1-nél nagyobb pozitív egész, n egy d-nél nem kisebb és q-hoz relatív prím
pozitív egész, és jelölje e a q szám rendjét modulo n (azaze a legkisebb olyan pozitív egész, amivel qe – 1 osztható n-nel).
Továbbá legyen α egy generátoreleme a qe elemű test multiplikatív csoportjának (azaz egy olyan elem, aminek a
hatványaiként a test összes nullától különböző eleme előáll) és β egy olyan elem, amivel Fq[β] = . (Ez azt jelenti, hogy
az test minden eleme előáll c0 + c1 β + … + ce–1βe–1 alakban valamilyen ci ∈ Fq együtthatókkal.) Ezek után legyen H a
következő e(d – 1) × n méretű, Fq feletti mátrix:

Ez a mátrix úgy értendő, hogy az összes αk hatvány helyébe azt az oszlopvektort írjuk, aminek a c0, c1, …, ce–1
koordinátáival c0 + c1β + … + ce–1βe–1 = αk. A H ellenőrző mátrix által meghatározott lineáris kód egy n hosszúságú és d
távolságú kód, aminek a dimenziója legalább n – e(d – 1). Ez az n hosszúságú és előírt d távolságú BCH-kód.
A Reed–Solomon-kódok a BCH-kódoknak azt a speciális esetét képezik, amikor n = q – 1. Ekkor q rendje 1 modulo n, így
az ellenőrző mátrix mérete (d – 1) × n, és a kapott kód egy lineáris [n, n – d + 1, d]-kód. A Reed–Solomon-kódok tehát MDS-
kódok: a Singleton-korlát által megengedett lehető legtöbb kódszót tartalmazzák.
Abban az esetben, amikor q egy prímszám, és Fq = {0, 1,…, q – 1}, a H ellenőrző mátrix oszlopcserék után a következő
alakban írható fel:

Az ehhez tartozó C kód az alábbi feltételes halmaz-leírással is de niálható:

25.4. Ciklikus kódok


A ciklikus kódok a lineáris kódoknak egy speciális osztályát alkotják. Mint az előzőkben láttuk, a lineáris kódok absztrakt
algebrai struktúrával rendelkeznek: valamely test feletti adott hosszúságú sorvektorok vektorterében alkotnak alteret. A
ciklikus kódok algebrai struktúrája ennél valamivel gazdagabb, a megértéséhez viszont bizonyos gyűrűelméleti fogalmakra
szükségünk lesz, amikről az olvasó a 12. fejezetben tájékozódhat.
A kulcsfogalom a sorvektorok ciklikus eltoltja: ha z = z1 z2 … zn egy F test feletti n hosszú sorvektor, akkor a ciklikus
eltoltjait úgy kapjuk meg, hogy z-nek egy kezdő szeletét áthelyezzük a vektor végére. Egy ciklikus eltolt általános alakja
zi+1zi+2 … znz1z2 … zi.

Egy lineáris kód ciklikus, ha bármely kódszónak tetszőleges ciklikus eltoltja is egy kódszó.

A ciklikus tulajdonsághoz természetesen elég, ha a0a1… an–1 ∈ C-ből következik an–1a0 a1 … an–2 ∈ C. A továbbiakban az
n hosszú sorvektorok koordinátáit 0-tól n – 1-ig fogjuk indexelni, ciklikus kódoknál ezt az indokolja, hogy a
sorvektoroknak polinomokat feleltetünk meg: az a0a1 … an–1 sorvektornak megfelelő polinom a0 + a1x + … + an–1xn–1.
Ezt a megfeleltetést átvihetjük egy, az Fn vektortér és az F[x]/(xn – 1) faktorgyűrű közötti megfeleltetésbe, ami már
kölcsönösen egyértelmű: az a0a1… an–1 sorvektornak az a0 + a1x + … + an–1xn–1 polinom mellékosztálya felel meg. (Mivel egy
n-edfokú polinom által generált ideállal faktorizáltunk, így minden mellékosztály egyértelműen reprezentálható egy
legfeljebb n – 1-edfokú polinommal.) A továbbiakban jelölje Rn az F[x]/(xn – 1) faktorgyűrűt, amit tulajdonképpen
azonosíthatunk a legfeljebb n – 1-edfokú, F feletti polinomok halmazával, amiben a szorzás művelet elvégzésekor xn
helyébe 1, xn+1 helyébe x, és általában xn+i helyébe xi írandó.

Egy Rn-beli C kód pontosan akkor ciklikus, ha gyűrűelméleti értelemben egy ideál.

Mint minden kommutatív gyűrűben, Rn-ben is bármelyik elem generál egy főideált, így azt is mondhatjuk, hogy
minden legfeljebb n – 1-edfokú polinom generál egy n hosszú ciklikus kódot. Sőt, mivel n-től és q-tól függetlenül Rn minden
ideálja főideál, így minden ciklikus kód generálható egy polinommal. (Viszont nem minden polinom elég szerencsés
ahhoz, hogy egy használható ciklikus kódot generáljon.)

Legyen C egy legalább kételemű Rn-beli ciklikus kód és g(x) a C-beli legkisebb fokú normált polinom. Ez a g(x) polinom
egyértelmű, generálja C-t, és F[x]-ben osztója az xn – 1 polinomnak.
Egy azonnali következmény, hogy az n hosszúságú ciklikus kódok kölcsönösen és egyértelműen megfeleltethetők az xn
– 1 polinom F[x]-beli normált osztóinak. Ebben a megfeleltetésben a konstans 1 polinomhoz az összes n hosszú szót
tartalmazó triviális kód tartozik, míg az (xn – 1)/(x – 1) = 1 + x + x2 + … +xn–1 polinomhoz az azonos karakterekből álló szavak
kódja, az ismétlő kód.

Példa. Legyen F a kételemű {0, 1} test és n = 4! Ekkor x4 – 1 felbontása F felett (x + 1)4, tehát azok a 4-nél kisebb fokú
normált polinomok, amik osztói x4 – 1-nek: 1, x + 1, (x + 1)2 = x2 + 1 és (x + 1)3 = x3 + x2 + x + 1. Így a triviális {0000} kódon
kívül három 4 hosszúságú bináris ciklikus kód létezik. A konstans polinom a teljes R4-et generálja, az x + 1 polinom a
páros súlyú szavak nyolcelemű halmazát, az x2 + 1 polinom a négyelemű {0000, 0101, 1010, 1111} kódot, míg x3 + x2 + x +
1 a kételemű {0000, 1111} ismétlő kódot.

Egy Rn-beli C ciklikus kód ellenőrző polinomja az az F[x]-beli h(x) polinom, amivel g(x) · h(x) = xn – 1.

Az ellenőrző polinom egyértelműen meghatározza magát a kódot, amennyiben a kódhosszúság is adott. Ha C egy n
hosszúságú ciklikus kód, és h(x) az ellenőrző polinomja, akkor egy Rn-beli f(x) polinom pontosan akkor tagja C-nek, ha Rn-
ben f(x) · h(x) = 0. (Ez azt jelenti, hogy F[x]-ben az f(x) · h(x) szorzatnak osztója xn – 1.)
A generátor-, illetve ellenőrző polinomok ismeretében könnyen megadhatjuk a ciklikus kódok egy-egy generátor-,
illetve ellenőrző mátrixát. Amennyiben

az n hosszú ciklikus C kód generátor- és ellenőrző polinomjai, akkor az alábbi (n – k) × n méretű G mátrix, illetve k × n
méretű H mátrix egy-egy generátormátrixa, illetve ellenőrző mátrixa C-nek.

Ebből látszik, hogy a C┴ duális kódnak a generátorpolinomja a h(x) polinom reciprok polinomjának a normáltja:
. (Az a tény, hogy h(x) osztja az xn – 1 polinomot, garantálja
hogy h0 ≠ 0.) Tehát a h(x) polinom által generált ciklikus kód általában nem azonos a C┴ duális kóddal, viszont ekvivalens
vele.
A BCH-kódokat ciklikus kódként is de niálhatjuk. A korábbi jelöléseket használva, legyen γ egy n rendű elem az
test multiplikatív csoportjában és a tetszőleges pozitív egész! Továbbá legyen g(x) a γa, γa+1, …, γa + d – 2 elemek Fq feletti
minimálpolinomjainak a legkisebb közös többszöröse! Ekkor a g(x) által generált n hosszúságú ciklikus kód nem más, mint
az előírt d távolságú BCH-kód.
A Golay-kódok szintén ciklikusak, és a Hamming-kódok közül azok a Ham (r, q) kódok, ahol r és q – 1 relatív prímek.
26. Valószínűség-számítás
26.1. Alapfogalmak, bevezetés
26.2. Valószínűségi mező, események, eseményalgebra
26.3. Feltételes valószínűség, függetlenség
26.4. Valószínűségi változók
26.5. Nevezetes diszkrét eloszlások
26.6. Nevezetes folytonos eloszlások
26.7. Az eloszlások legfontosabb jellemzői: a várható érték és a szórás
26.8. A nagy számok törvényei
26.9. Nevezetes határeloszlás-tételek
26.10. Korreláció, regresszió
26.11. Egyszerű véletlen folyamatok matematikai leírása

26.1. Alapfogalmak, bevezetés


A valószínűség-számítás tárgya a véletlen jelenségek matematikai kezelése. Természetesen annak meghatározása is
izgalmas lenne, hogy mi a véletlen. Ez túlmegy ennek a könyvnek a határain, mind matematikai, mind lozó ai
szempontból. Csak megemlítjük, hogy a téma maga nagyon izgalmas, és sok egészen friss eredmény is született ezen a
területen az elmúlt évtizedekben. Mi azonban régebbre nyúlunk vissza. Történetileg a szerencsejátékok körében kapott
először a véletlen szerepet. Már az ókorban, Augusztus császár idejében is játszottak csontocskákkal (leggyakrabban birka
könyökcsonttal, az asztragalosszal) a Római Birodalomban (26.1. ábra). A csontoknak leeséskor négyféle helyzete lehetett, a
nyerő az volt, ha a négy csontot feldobva, mindegyik ugyanabban a helyzetben esett le. Kísérletezve a csontokkal az ábrán a
jobb felső sarokban látható helyzet a legritkább, ezért ez az abszolút nyerés.

26.1. ábra

Az ókorban azonban mégis mindössze Platónnál jelenik meg egy olyan szövegrészlet, amit a véletlennel, illetve a
valószínűség-számítással kapcsolatba lehet hozni, bár nem teljesen egyértelműen. A Timaioszban (Platón összes művei. 3.
kötet. Európa, Budapest, 1984, 356–362., lásd még Rényi A.: Levelek a valószínűségről. Typotex, Budapest, 1994)
olvashatjuk: „ahogyan aránylik a keletkezéshez a lét, úgy viszonylik a hiedelemhez az igazság”.
Azután a XVII. század közepe felé kezdődött egy nagy fejlődés, melynek a francia Blaise Pascal az egyik fő alakja, aki
először fogalmazta meg a valószínűség-számítás alapfogalmait és összefüggéseit. Később az a Jacob Bernoulli emelhető ki,
akitől a téma első könyve származik „Ars conjectandi”, azaz a sejtés művészete címmel. Ebben olyan alapvető, ma már a
középiskolában is tanult témák vannak, mint a binomiális eloszlás, illetve a nagy számok éppen róla elnevezett „Bernoulli-
féle” törvénye. Ezután sok minden történt ezen a területen még a XVIII. században, pl. Thomas Bayes, de főleg a XIX.
században, Laplace, vagy később az orosz iskola (Markov, Csebisev, Bernstein és társaik) emelhetők ki a teljesség igénye
nélkül. Az alapkérdések azonban, mint a véletlen fogalma és a valószínűség de níciója, hosszan foglalkoztatták
matematikusok egész sorát a XX. század elején, köztük R. von Misest, aki közel is jutott egyfajta megoldáshoz, végül mégis
A. N. Kolmogorov volt, aki az axiomatikus valószínűség-számítást megalkotta 1933-ban, amivel végleges polgárjogot nyert
a téma a matematikában. Azóta egy hatalmas fejlődésen ment keresztül, s mára a matematika egyik hatalmas, virágzó
ágává vált, hihetetlenül széles körű matematikai és matematikán kívüli alkalmazásokkal, például a számelméletben, a
geometriában vagy a bizonyításelméletben, illetve a genetikában, a részecske zikában vagy a közgazdaságtanban. A
továbbiakban térjünk vissza a XVII–XVIII. századi kezdetekhez.
Alapvetően olyan eseményekről fogunk beszélni, amelyek bekövetkezéséről nem tudunk biztosan nyilatkozni, de
mégis szeretnénk valahogyan mérni a bekövetkezésük lehetőségét, más szóval „esélyét”. Ezen egy 0 és 1 közötti számot
értünk, ahol a lehetetlennek a 0 esélyt szánjuk, míg a biztosnak az 1-et. A többi esemény esélye a kettő között van. Az első
modellje valamiféle valószínűség-számításnak, amely az esélyekkel foglalkozik, a következőképpen adható meg:

Egy véletlen esemény valószínűsége (esélye) nem más, mint az esemény szempontjából kedvező kimenetelek száma
osztva az összes kimenetelek számával.

Ez a Laplace-féle modell egy kombinatorikus elképzelés, lényegében Pascalra megy vissza. Gyengéje, hogy egy szűk
fogalom, hiszen csak akkor tudunk valószínűségről beszélni eszerint, ha véges sok kimenetelünk van, s valamiféle okból
ezek egyenértékűeknek tekinthetők, más szóval egyenlő esélyűek.

Megjegyzés. Például már a következő két egyszerű esetben sem tudjuk használni a fenti fogalmat. Valaki arra
kíváncsi, vajon mekkora az esélye, hogy a következő pillanatban rászakad a mennyezet, mondjuk egy földrengés
következtében. Két eset lehetséges, vagy rám szakad, vagy nem. Természetesen józanul nem gondoljuk, hogy ennek
tényleg ½ az esélye, mint mondjuk egy fej dobásának egy pénzérmével. Hiszen a valószínűségnek van egy
interpretációja, miszerint ha egy szituáció sokszor ismétlődik, akkor a bekövetkezés relatív gyakorisága a
valószínűség közelében ingadozik. Ha sok-sok napot gyelembe véve eddig még sosem következett be a földrengés,
akkor jóval kisebb esélyűnek gondoljuk.
Hasonló példa lehet egy másik helyzet, ahol arra vagyunk kíváncsiak, hogy másnap milyen eséllyel lesz viharos szél.
A lehetőségek száma itt is kettő (lesz vagy nem), de akár több is lehet, hiszen mondhatjuk, hogy szélcsendes idő,
enyhe szél, élénk szél, illetve viharos szél lesz a meteorológusok szerinti kategorizálással. Ekkor a 4 lehetőség közül a
klasszikus modell szerint ¼ lenne a viharos szél esélye. Ha megnézzük az előrejelzéseket, nagyon ritkán olvasunk
erre 25% esélyt, azaz a modell itt sem alkalmazható.
Vannak azonban esetek, ahol azért némi ügyességgel használható ez a modell. Vegyük a következő eseményt: négy
szabályos pénzérmét feldobva 2 fej és 2 írás lesz. Mekkora ennek az esélye? A fejek száma szerint például 5 eset
lehetséges: 0, 1, 2, 3, 4. Ekkor a modellünk szerint 1/5 lenne a kérdezett esély. Ezt könnyen ellenőrizhetjük
kísérletekkel, hogy nem reális elképzelés. Van azonban egy másik modell, nem ezt az öt esetet tekintjük
kimenetelnek, hanem a következő 16-ot: FFFF, FFFI, FFIF, FIFF, IFFF, FFII, FIFI, FIIF, IFFI, IFIF, IIFF, FIII, IFII, IIFI,
IIIF, IIII. Azaz minden pénzérme megkülönböztethető a másiktól, és egyformán lehet fej vagy írás. Ekkor a kérdezett
esély 6/16 = 3/8 = 0,375. A kísérletek azt mutatják, hogy ez már jó modell. Az előző két példát azonban nehéz lenne
ilyen elemibb és teljesen egyenértékű esetekre bontani.

Ez sok szerencsejáték esetén egy plauzibilis feltételezés, innen eredhetett a fogalom. Később azonban általánosabb
modellre volt szükség.

Nézzünk most erre néhány egyszerű és egyébként közismert példát!


1. Ha egy lottószelvényünk van, akkor mekkora a valószínűsége, hogy legalább 4 találatunk lesz. Az összes
kimenetel a lehetséges számötösök, amiket kihúzhatnak, azaz ha az ötös lottóról van szó, akkor 90 szám közül

húzzák ki az öt nyerő számot. Tehát a nevező, feltéve, hogy bármely számötös húzása egyenlő esélyű: ,
míg a számláló a kedvező esetek, ez lehet mind az öt szám, ez 1 eset, illetve lehet négy találatunk, ami 5 · 85 = 425
eset, hiszen 5-féleképpen választható ki a nem eltalált szám, s azt 85-féleképpen „téveszthettük el”. Tehát 426 eset

a kedvező, hogy legalább négy találatunk van, aminek tehát az esélye eszerint: , némileg
felkerekítve egy százezred. Hasonló számolással a legalább kéttalálatos, tehát „nyerő” szelvény esélye: 0,022, azaz
kb. egy ötvened. Azt mondhatjuk, hogy évente egy kettes találat nem meglepő, ha minden héten egy szelvénnyel
játszunk, lévén 52 hét egy évben.
2. Egy társaság 32 lapos magyar kártyával játszik. Ebből osztanak a három játékosnak 10–10 lapot, 2 pedig az ún.
talon. Mi az esélye, hogy az egyik játékos a négy szín egyikéből mind a 8 lehetséges lapot megkapja (7, 8, 9, 10, alsó,
felső, király, ász)? Ismét kezdjük a modellel. Ahányféleképpen a 32 lapból 10-et kiválasztunk, annyi az összes
leosztási lehetőség az első játékos számára. Kedvező, ha a négy szín valamelyikéből (négy lehetőség a szín
választása) 8 lapot kap, s a maradék kettőt a maradék 24 lapból.
Azaz , azaz a gyakoriságok nyelvén minden millió partiból 17-szer fordul elő. Elég ritkának

mondható. De például 6 egyszínű a 10-ből már nem anynyira ritka, hiszen azaz már száz
partiból is akár kétszer előfordulhat.
3. Egy ötfős baráti társaság a kölcsönös karácsonyi ajándékozást úgy tervezi, hogy mind az ötük nevét beteszik egy
kalapba, és sorban egyet húznak, s annak a személynek veszik ők az ajándékot. Mi az esélye, hogy ebből egy
tényleges ajándékozás adódik, azaz senki sem húzza saját magát?
A modell a következő. Számozzuk meg az öt személyt az 1, 2, 3, 4, 5 számjegyekkel. Ekkor az öt egymás utáni húzás
megfelel egy rendezett számötösnek, az öt szám egy permutációjának, amiből 5 ! = 120 van összesen. Ebből
nekünk kedvező az ún. xpontmentes permutációk száma, tehát ahol az i-edik helyen nem az i számjegy van (i = 1,
2, 3, 4, 5). Ezeket kicsit nehezebb összeszámolni. Két módszert is veszünk, az egyik könnyen általánosítható n
személyre, a másik nagyon komplikált, ha sokan vannak. Kezdjük ez utóbbival. Esetszétválasztással fogunk
dolgozni. Tegyük fel, hogy az első nem önmagát húzta, hanem például a másodikat. Ekkor két eset lehet, vagy a
második kihúzta az elsőt, ez egy ún. kételemű ciklus, és akkor marad három elem, amelyeknek a xpontmentes
permutációit kell leszámolni, ez azonban egyszerű, a 6-ból mindöszsze a 2, 3, 1 és a 3, 1, 2 felel meg. Tehát ilyen 2
eset van, de kettő hosszú ciklus 4-féle lehet, hiszen az első nemcsak a 2, hanem a 3, 4, 5 jelű társát is húzhatta, s ha
az éppen őt húzta ez a kettő hosszú ciklus. Ebből tehát 4 · 2 = 8 eset van. Ha három hosszú ciklust veszünk, például
1 húzza a 2-t, 2 a 3-at és 3 az 1-et, akkor a maradék két elemnek csak 1 xpontmentes permutációja van, ha
felcseréljük őket. 3 hosszú ciklus 4·3 = 12 van, tehát eddig 8 + 12 = 20 esetnél tartunk. Négy hosszú ciklus nem
lehet, mert akkor az ötödik elem xpont lesz, tehát csak az öt hosszú ciklus maradt, ami 4! = 24 eset, hiszen az első
helyen 4-féle lehet, a második helyen sem az első, sem a második, tehát csak 3-féle s így tovább adódik a 24 eset.
Azaz a kedvező esetek száma 20 + 24 = 44. Így a keresett esély 44/120 = 11/30 ≈ 0,367.
Ez általánosítható, bár rekurzívan elég nehéz kiszámolni gép nélkül. Ha f(n) jelöli n elem xpontmentes
permutációinak számát, akkor érvényes a következő rekurzív formula:

Az f(1)-es tagot ki sem írtuk, mivel f(1) = 0. Ezt lehet csupán faktoriálisok használatával is felírni:

A másik megoldás a következő, logikai szitaformulán alapuló gondolatmenet. Ezt mindjárt általánosan adjuk
meg. A xpontmentes permutációk száma nem más, mint az összes permutációk száma mínusz a xpontos
permutációk száma. Fixpont lehet általában az első, a második stb. az n. elem. Jelölje Ai azt az eseményt, hogy az

i-edik elem a helyén maradt a permutáció során. Ekkor a xpontot tartalmazó permutációk száma az
halmaz számossága, ami a logikai szitaformula szerint (lásd 23.3. fejezet):

Innen mivel bármelyik Ai azonos számosságú, hasonlóan a metszetekkel, ezért a következőket kapjuk:

, ésígy tovább adódik,


hogy a kérdezett kedvező esetek száma:

Ha ezt osztjuk az összes esetek számával, azaz n !-sal, akkor adódik egy szép formula:

Ha n = 5, akkor ebből is 44/120 = 11/30 adódik, mint a korábbi módszerrel. Ebből az alakból azonban látszik egy
másik érdekesség, hogy ha a résztvevők száma minden határon túl nő, akkor ez a valószínűség konvergál az l/e
számhoz, ahol e az Euler-szám (a természetes logaritmus alapszáma). Tehát nagyszámú résztvevő esetén már alig
változik a valószínűség, ami egyáltalán nem magától értetődő. Az ember elsőre azt gondolná, hogy minél többen
vannak, annál kevésbé húzza ki valaki a saját nevét. Ez így is van egy kiválasztott személy esetén, de itt egyszerre
kell mindenkinek mást húznia.
4. Mit gondol hány ember esetén igaz a következő állítás? Egy teremben n ember van, és annak az esélye, hogy
kettőnek ugyanaz a születésnapja (megegyezik a hónap és a nap) éppen több legyen, mint 0,5.
Ismét először modellezzük a helyzetet. Az egyszerűség kedvéért tegyük fel, hogy bárki ugyanolyan eséllyel
születhet az év bármelyik napján. A szökőévektől eltekintve a 365 nap bármelyikén születhet az ember. Feltéve,
hogy nincsenek ikrek a teremben, és mindenki mindennap ugyanolyan eséllyel születhet. Ekkor az n ember
összes lehetőségeinek száma 365n. Annak az esélyét kiszámolni, hogy van legalább két ember azonos
születésnappal, jóval nehezebb közvetlenül, mint azt, hogy mindenki más napon született. Hiszen akkor a
kedvező esetek száma: 365 · 364 · … (365 – n + 2) · (365 – n + 1). Ha annak az esélye, hogy van két egy napon született,
kicsivel több, mint 0,5, akkor annak az esélye, hogy nincs, egy kicsit kevesebb, mint 0,5. Ez utóbbi esély a

klaszszikus Laplace-formula szerint:


Ennek értékeit különböző n-ekre megadva például Excel segítségével adódik, hogy n = 23 esetén már kisebb, mint
0,5 ez az esély. Tehát a válasz: ha 23 ember van legalább a teremben, akkor már nagyobb az esélye, hogy van két
egy napon született, mint annak, hogy nincs ilyen páros.
Megjegyzendő, hogy egész más a válasz, ha azt kérdezzük, hogy hány ember kell egy terembe ahhoz, hogy
legalább még egy ember szülessen velünk egy napon. Ekkor is a komplementert könnyebb számolni, nem egy
napon születik valaki 364/365 eséllyel, s ha n személy van, akkor annak a valószínűsége, hogy egyik sem velünk

egy napon született . Ez először akkor lesz ½-nél kisebb, ha n = 253 vagy annál több, tehát egy
nagyságrenddel nagyobb szám jön ki, mint a 23 volt. Egy pár tehát 364/365 eséllyel nem egy napon születik, és n

személyből párt lehet kiválasztani. Tehát egy lehetséges számolás, hogy ha ez az

kifejezés nagyobb, mint 253, akkor már az n ember között lesz két egy napon született. Ennek

megoldása: n(n – 1) ≥ 506, ahonnan – mivel n pozitív szám – adódik, hogy . Tehát ebből is a 23
adódik, amit már számoltunk. A paradoxon abból adódik, hogy a két kérdést, „velünk egy napon” vagy „csak
bármely két személy egy napon” születik, ezt keverjük.

Lényegében a Laplace-modellnek van egy folytonos változata is, az ún. geometriai valószínűség. Itt a következőről van
szó. Véletlenül választunk egy pontot egy adott síkbeli vagy térbeli (általában akár n-dimenziós euklideszi térbeli)
alakzatból. Ebben ki van jelölve egy részalakzat, s az adott esemény bekövetkezése azt jelenti, hogy ebbe a részhalmazba
esik a véletlen pont. Az esemény valószínűségéhez a következő konstrukcióval juthatunk.

Geometriai valószínűségről beszélünk, ha adott egy korlátos, mérhető (Jordan- vagy akár Lebesgue-mérték szerint) n-
dimenziós térbeli alakzat mint eseménytér, amit A-val jelölünk. Ennek mérhető részhalmazai az események, nyilván
értelmesek a szokásos halmazműveletek. Ekkor az E esemény valószínűségén a következő hányadost értjük:

, ahol μ jelöli az adott mértéket.

Példák
1. Két jó barát megbeszéli, hogy 4 és 5 között fog találkozni a városban. Tegyük fel, hogy egymástól függetlenül
tömegközlekedéssel érkeznek, és a megbeszélt helyen egy negyedórát várnak, azután elmennek, ha a másik nincs
ott.
A geometriai modell szerint egy egységnégyzet pontja reprezentálja érkezésüket, az első koordináta az első, a
második a másik érkezését. A 26.2. ábrán szaggatott vonallal határolt tartományba esik a találkozás, hiszen, ha a
két koordináta különbsége kisebb vagy egyenlő, mint 0,25 (negyedóra), akkor találkoznak, különben nem. Ennek

esélye, mivel a négyzet területe 1, ezért közvetlenül a tartomány területe, azaz , kicsivel
kevesebb, mint 44%.

26.2. ábra

2. Tegyük fel, hogy egy gépi programmal választunk véletlenül két számot a [0; 1] intervallumból. Ezek három
szakaszt határoznak meg. Mi az esélye, hogy ebből a három darabból egy háromszög szerkeszthető?
A geometriai modell itt azt jelenti, hogy egy (x, y) párost választunk az egységnégyzetből, hiszen mindkét
„koordináta” 0 és 1 közé esik. Háromszög akkor szerkeszthető, ha mindhárom háromszög-egyenlőtlenség
teljesül.
a) Ha x < y, akkor a következők:

1. x + (y – x) > 1 – y
2. x + (1 – y) > y – x
3. (y – x) + (1 – y) > x,

rendezve a következőket kapjuk:

b) Ha x ≥ y, akkor pedig:
1. y + {x – y) > 1 – x
2. y + (1 – x) > x – y
3. {x – y) + (1 – x) > y,

rendezve
Mindkét szituáció egy ábrán (26.3. ábra) szemléltethető, ahol a satírozott tartomány adódik „kedvező” esetre,
melynek területe ¼, az egész négyzet 1, tehát a keresett esély ¼.

26.3. ábra

3. Egy körvonalon véletlenül válasszunk három pontot. Mi az esélye, hogy a háromszög hegyesszögű, azaz a kör
középpontját tartalmazza?
Modellünk most már, mivel három pont van, háromdimenziós lesz, (α, β, γ) jelölje a háromszög szögeit. Ekkor
már csak azt kell megfogalmazni, hogy mikor esik a kör középpontja a háromszög belsejébe. Ez a 2π élhosszúságú
kocka egy részhalmaza lesz. Van azonban egyszerűbb megoldás is. A körszimmetria miatt az első pontot vehetjük
rögzítettnek, s csak a másik két ponttal foglalkozunk. Ekkor kétdimenziós ismét a probléma, s a megoldás is
egyszerűbb. Ráadásul a két eset, hogy hegyes- vagy tompaszögű a háromszög, egyenlően valószínű, míg a
derékszögű eset 0 valószínűséget képvisel. Ami egy példája annak, hogy a 0 valószínűségű esemény nem
lehetetlen.

26.2. Valószínűségi mező, események, eseményalgebra


A következőkben a 26.1. fejezetben említett hétköznapi fogalmak egy általánosabb matematikai modelljét és annak
értelmezését tárgyaljuk.

A véletlen kísérlet kapcsán egy lehetséges kimenetelt elemi eseménynek fogunk nevezni, s ebben a kontextusban egy
tetszőleges eseményt bizonyos kimenetelek együttese, azaz elemi események egy összessége jelent majd. Az összes
lehetséges kimenetelek halmaza alkotja a valószínűségi alaphalmazt vagy eseményteret, amit általában Ω-val
jelölünk.

Tehát az elemi események halmazát jelöltük Ω-val.


Az Ω bizonyos részhalmazait (olykor az összes részhalmazát) nevezzük eseményeknek, amelyekre bizonyos műveleti
zártság és azokra vonatkozó azonosságok kell hogy fennálljanak. Ez az eseményhalmaz zárt kell hogy legyen a véges
metszetre, az unióra és a komplementer képzésére. Emellett a szokásos tulajdonságok, mint asszociativitás,
kommutativitás és a megfelelő halmazelméleti disztributivitás is teljesül. Ezt nevezzük algebrának. Amennyiben
nemcsak a véges unió képzésére zárt a halmazalgebra, hanem megszámlálható sok halmaz unióját is tartalmazza,
akkor mondjuk σ-algebrának (lásd később).

Ennek az algebrának a szokásos jele az algebra szó kezdőbetűjéből: .Így tehát eddig van egy (Ω, A) algebránk.

Ha az (Ω, ) algebrán létezik egy P leképezés a [0; 1] intervallumra úgy, hogy minden A és B eleme esetén, ha
A ∩ B = Ø, akkor P(A ∪ B)= P(A) + P(B), valamint P(Ø) = 0 és P(Ω) = 1, úgy az (Ω, , P) hármast valószínűség-
algebrának nevezzük.

Ez tehát a valószínűség-számítás halmazelméleti „fordítása”, és a következőkben evvel fogunk foglalkozni. Szokásos


még a következő rövidebb jelölés, két esemény unióját éppen a valószínűségek összegzési szabályának mintájára az összeg
jelével, míg a metszetet a szorzat jelével, pontosabban betűk esetén egyszerűen az egymás mellé írással helyettesítjük.

Tehát A ∪ B = A + B, illetve A ∩ B = AB.

Megjegyzés. Fontos hangsúlyoznunk, hogy a lehetetlen esemény esélye ugyan 0, de a 0 valószínűség nem jelent
lehetetlent (lásd a 26.1. fejezet utolsó példáját, ahol a három pont 0 valószínűséggel alkot derékszögű háromszöget, de
az mégis előfordulhat). Hasonlóan abból, hogy valaminek 1 az esélye, nem következik, hogy biztos esemény volna.
Lásd az előző példa komplementerét, azaz a háromszög hegyes- vagy tompaszögű 1 valószínűséggel, mégis lehet
derékszögű is.
Lássunk néhány példát a fent de niált valószínűségi mezőre.
1. Egy szabályosnak mondott pénzérme feldobását az alábbi valószínűségi mező reprezentálja: Ω = {F, I}, = {Ø;
{F}; {I}; {F, I}} (azaz az összes részhalmazok halmaza), míg végül a P leképezést a következőképpen adjuk meg: P(Ø)
= 0, P(F) = 1/2, P(I) = 1/2, és P(Ω) = 1.
2. Egy lap húzása egy 32 lapos magyar kártyából. Ennek modellje is egyszerű: az eseménytér 32 elemű halmazból áll,
ennek összes részhalmaza alkotja az algebrát, és a valószínűség a részhalmazok elemszáma osztva az összes
elemek számával, 32-vel. Itt nem írjuk le a hihetetlenül nagy elemszámú algebra elemeit, hiszen 232 ≈ 4 · 230 ≈ 4 ·
109, tehát milliárdos nagyságrendű.
3. Legyen az eseménytér egy dobókocka feldobása addig, amíg az első hatos nem jön ki. Ekkor az alaphalmaz
végtelen lesz, mivel nem tudjuk biztosan garantálni, hogy például 136 dobáson belül kijöjjön az első hatos. Itt az
elemi események a következőképpen néznek ki: {6}, {1, 6}, {2, 6}, {3, 6}, …, {1, 1, 6}, {1, 2, 6}, …, {1, 1, 1, 6}… és így
tovább. Egyelemű 1 van, kételemű 5, háromelemű 25 és így tovább. Az események ezen elemi események

egyesítésével jönnek létre. A valószínűségek pedig az elemi eseményeken a következők: az egyelemű {6} esélye

. A kételemű kimenetelek esélyei , és van belőlük 5. A háromeleműeké , és van belőlük 25, általában

egy n eleműé , és van belőlük 5n darab. Láthatóan rendben leszünk, hiszen a megszámlálható elemi

események halmazán igaz lesz, hogy . Folytonos eseménytérre példa lehet a 26.1.
fejezet három geometriai szituációja, az utolsó három probléma, nézzünk egy még egyszerűbbet.
4. Egy véletlenül választott valós szám a [0; 1] intervallumból. Ez már önmagában elég absztrakt, hiszen nem tudunk
olyan tényleges eljárást, amivel ez végrehajtható lenne. Egy számítógép legfeljebb véges sok tizedesjegyét tudja
produkálni, bármilyen hosszú ideig fut is a kiválasztási program. Mégis bizonyos feladatokban használunk ilyen
modelleket, ezért most a „ zikai” megvalósítás lehetetlenségétől tekintsünk el.
Ebben az esetben Ω = [0; 1]. A lehetséges algebrával baj lesz, mivel a [0; 1] intervallum összes részhalmazaiból álló
halmaz minden eleme nem mérhető (bármilyen mértéket is vennénk alapul), ezért csak például a Lebesgue-
mérhető részhalmazok halmazát vegyük, az lehet a megadott σ-algebra Végül a Lebesgue-mérték lesz a P.

Így annak az esélye, hogy mondjuk az intervallumba esik a kiválasztott szám, annak a
valószínűsége, annak viszont, hogy a ra náltan konstruált Cantor-halmazba esik, 0. Hiszen mint tudjuk, a
Cantor-halmaz mérhető, s mivel komplementere, amit kiveszünk a [0; 1] intervallumból, az 1 mértékű, ezért a
maradék a Cantor-halmaz 0 mértékű.

Néhány fontos, elemi tétel a valószínűség-algebrában, és ezek közvetlen következményei.


Ha B ⊆ A, akkor P(B) ≤ P(A).

Minden A eseményre igaz, hogy P(A) + P(Ā) = 1, vagy szokásosabb módján a komplementer valószínusége P(Ā) = 1 – P(A).

Ha Ai események páronként egymást kizárják, teljesül.


Ha A és B tetszőleges események, akkor P(A + B) = P(A) + P(B) – P(AB).

Példák
1. Mekkora eséllyel fordul elő, hogy királyt vagy pirosat húzunk egy 32 lapos magyar kártyapakliból?
Mivel 8 piros van és 4 király a 32 lapból, ezért P(P + K) = P(P) + P(K) – P(PK) =

, mivel éppen egy piros király van.


2. Mekkora az esélye, hogy 4 pénzérmét feldobva legalább egy fej lesz? Mivel a legalább egy fej (F) komplementere az
egy sem (F̄), ennek az esélyét könnyebb számolni, és a formula szerint az esélyt 1-ből levonva megkapjuk a
kérdéses esemény esélyét:

Két mélyebb tétel a valószínűség-algebra köréből, az első az előző tétel általánosításaként született Poincaré-formula.

Legyenek A1, A2, …, An egy valószínűség-algebra tetszőleges eseményei.

Ekkor ahol

és az összegzés úgy értendő, hogy az (i1, i2, …, ik) az 1, 2,…, n számok öszszes k-adrendű ismétlés nélküli kombinációján
fut végig. Szokás ezt valószínűség-számítási szitaformulának is mondani.

Egy további általánosítás Jordán Károly formulája.

Jelölje annak a valószínűségét, hogy az A1, A2, …, An események közül pontosan r következik be. Ekkor

(r = 0, 1, ..., n), ahol S0(n) = 1 és (l = 0, 1, …) (az


összegzés az 1, 2, …, n számok összes l-edrendű ismétlés nélküli kombinációira terjesztendő ki).

Példák
1. A fejezet elején levő, a xpontmentes permutációk számára vonatkozó 3. feladat megoldása a Poincaré-formula
segítségével is megadható.
2. Legyen a kísérlet egy dobókocka 6-szori feldobása, míg az események Ai = {dobtunk i-t}. Kérdés, hogy mi annak a
valószínűsége, hogy mind a hat szám előfordul? Mi annak az esélye, hogy pontosan 3 szám fordul elő a hatból?
Az elsőre a válasz formula nélkül is megadható, az összes eset nyilván 66, a kedvező, hogy mind a hat szám éppen

egyszer, tehát ahányféleképpen sorba rakhatjuk a 6 számot, ami 6 !, vagyis az esély: . A formulával
számolva:

ahol r = 6 és n = 6.

Tehát , mint azt enélkül is megkaptuk.


A második esetben r = 3, és ekkor szükségünk van értékekre.
Azaz a formula szerint:

Tehát annak a valószínűsége, hogy pontosan három szám fordul elő a 6-ból, kb. 0,23. Ugyanezzel a technikával
számolható a többi eset is, a mind a hatot már számoltuk az első részben, hátra lenne a pontosan 5, a 4, a 2 és az 1.
Nyilván 0 szám nem lehet, hiszen 6 dobásnál valaminek ki kell jönnie. Az 1 esélye is könnyű, mert mindössze 6
kedvező eset van: 111111, 222222, 333333, 444444, 555555, 666666, azaz 0,00013 az esélye. Érdekes kérdés, hogy hány
szám előfordulása a legvalószínűbb. Annak igazolását, hogy a válasz 4, az olvasóra bízzuk.
Az esélyek a formula segítségével (vagy más, néhány esetben egyszerűbb módon):

Előforduló számok száma hat dobásnál Esélyek

Mind a 6 0,0154

5 0,2315

4 0,5015

3 0,2315

2 0,03

1 0,00013

0 0

3. Egy korábbi, már említett példában (ahol egy ötfős csoport kölcsönös ajándékozást tervez, és sorshúzással
döntenek, ki kinek vesz ajándékot) mi az esélye, hogy pontosan két tag húzza saját magát. Az eseményeket jelölje
A1, A2, A3, A4, A5, ha 1, 2, 3, 4 és 5 jelöli az öt csoporttagot, és Ai pedig azt, hogy az i-edik személy saját magát húzza.
Jordán Károly formulája esetünkben a következőképpen néz ki:

Ezzel a következő eredmény adódik:

Tehát annak, hogy pontosan 2 ember húzza saját magát, 1/6 a valószínűsége. Annak, hogy senki, azt már
kiszámoltuk: 11/30. A többit (1 fő húzza magát, 3 fő vagy 5 fő; 4 fő nem lehet, mert akkor az ötödiknek sem marad
más) a következőképpen számolhatjuk:

Az utolsó eset, hogy mind az öt magát húzza, szintén egyszerű: . A három húzza saját magát,
rövidebben adódik a fenti módszerrel, csak három tag lesz, az eredmény: 1/12. Így mivel az összeg 1 kell legyen,
ezért annak az esélye, hogy pontosan egyvalaki húzza saját magát: 3/8. Ez a legvalószínűbb is egyben, hiszen
0,375, míg a „senki sem húzza magát” eset egy leheletnyivel kevesebb csak: 0,367. A két fő, mint láttuk, 0,167.
Azonban általában nem elegendő csak véges sok esemény metszetének és uniójának a valószínűségét meghatározni.
Ezért szükség volt egy általánosabb valószínűségimező-fogalomra, amelyben a már említett σ-algebrának fontos szerep jut.
Ismételjük meg:

Egy algebrát σ-algebrának mondunk, ha nemcsak véges sok, hanem megszámlálhatóan sok halmaz unióját is
tartalmazza, azaz formálisan, ha Ai ϵ , i ϵ N, akkor .

Ehhez kapcsolódik a következő, hogy a valószínűség is σ-additiv halmazfüggvény legyen, tehát a Kolmogorov-féle
valószínűségi mezőben a következőknek kell teljesülnie mint axiómáknak:

Kolmogorov-féle valószínűségi mező az (Ω, , P) hármas, ahol Ω egy tetszőleges halmaz, egy σ-algebra, és
természetesen (utóbbi az összes részhalmazok halmazát jelöli), valamint P teljesíti a következő
feltételeket:
1. P(Ø) = 0 és P(Ω) = 1. (Tehát P 1-re normált mérték.)
2. Ha A ∈ ,B∈ és A ⊂ B, akkor P(A) ≤ P(B) (monotonitás).
3.
Ha Ai megszámlálható sok diszjunkt halmazt jelöl, akkor (σ-additivitás).

26.3. Feltételes valószínűség, függetlenség


Ebben a fejezetben azt vizsgáljuk, hogyan változik egy esemény valószínűsége, ha valamilyen információhoz jutunk, ami
leszűkíti a lehetséges kimenetelek körét. Vegyük a következő példát. Statisztikák alapján úgy tudjuk, annak az esélye, hogy
egy véletlenül kiválasztott magyar felnőtt tüdőrákos kb. 0,0012. (Ez igazából azt jelenti, hogy a teljes lakosságból ekkora
arányt képviselnek a tüdőrákosok, kerekítve kb. 10 000 000 lakossal számolva, tehát kb. 12 000 tüdőrákos van.) Ha azonban
a kiválasztott személy elárulja, hogy dohányos, akkor ez az esély jelentősen megnő. Ennek az oka az, hogy a tüdőrákosok
nem egyenletesen oszlanak el a dohányos és a nem dohányos emberek között. Meg kell néznünk, hogy az összes
tüdőrákosból hány esik a dohányosok közé, s akkor ennek a számnak az aránya a dohányosok számához adja a kérdezett
esélyt. Formalizáljuk ezt a gondolatot! A tüdőrákos dohányosok számát kell a dohányosokéhoz viszonyítani, azaz ha T jelöli

a tüdőrák fennállását, D azt, hogy valaki dohányzik, akkor a keresett esélyt a következő hányados adja: .
Általában is így de niáljuk a feltételes valószínűséget.

A T esemény D pozitív valószínűségű esemény mint feltétel melletti valószínűségét P (T|D)-vel jelöljük, és

kiszámításának módja: .

Megjegyezzük, hogy ha T 0 valószínűségű eseményt jelöl, akkor nyilván a P(T | D) feltételes valószínűség is 0 lehet
csak. Létezik a valószínűség-számításnak egy olyan felépítése is, ahol nem a valószínűség, hanem a feltételes valószínűség
az alapfogalom, ezt például Rényi Alfréd vagy Dennis Lindley könyveiben olvashatjuk. A 26.4. ábra mutatja, hogy ha az
eseményteret leszűkítjük, akkor az új esély a metszet viszonyát fejezi ki a feltételhez. Nézzünk két egyszerű példát!

26.4. ábra

1. Valaki megtudja, hogy a héten mind az öt kihúzott lottószám páros lett. Mi ekkor az esélye, hogy barátjának ötöse
lett, ha tudjuk, csak páros számokat szokott jelölni, valamilyen egyéni megfontolásból? Ez esetben a kihúzható öt

páros szám és a tipp közös része egyelemű, hiszen csak egy számötöst jelölt az illető. Azaz ,
, ebből a formulánk szerint adódik, hogy az esély az információnk birtokában -re nőtt,
ami az eredeti esélynek körülbelül 32-szerese.
2. Legyen egy dobókocka feldobása a véletlen kísérlet. Legyen az A esemény, hogy párosat dobunk, a B esemény,

hogy nem 1-et és 6-ot. Ekkor . Másrészt . Mivel

, ezért az információ, hogy a másik bekövetkezett az események valószínűségét nem


„befolyásolja”.

Erre kézenfekvő egy fogalmat bevezetni.

Ha egy A esemény valószínűsége ugyanannyi, mint a B esemény melletti feltételes valószínűsége, formálisan, ha P(A|B)
= P(A), akkor azt mondjuk, hogy az A esemény független B-től.

Könnyen látható, hogy eseményeknek ez a függetlensége szimmetrikus reláció a pozitív valószínűségű eseményeken,
tehát ha A független B-től, akkor B is független A-tól. Hiszen, ha P(A|B) =P(A), akkor P(AB) = P(A)P(B), de ebből

adódik, hiszen AB = BA, mivel a metszet kommutatív. Viszont a bal oldal éppen P(B|A), s így levezettük,
hogy P(B|A) = P(B), azaz a B is független A-tól. Egyébként de nícióként a közbülső P(AB) = P(A)P(B) egyenlőséget is szokták
venni, azaz

az A és a B események egymástól függetlenek, ha P(AB) = P(A)P(B).

Ennek előnye, és ezért általánosan elterjedt, hogy itt nem kell kikötni a valószínűségek pozitivitását. Nézzünk egy
példát konkrét eseményekkel!

Legyen az eseménytér Ω = {1, 2, 3, 4, 5, 6} egy szabályos dobókocka feldobása. Legyen A esemény: a dobott szám prím,
és a B esemény: a dobott szám 3-mal osztható. Ezek függetlenek, mivel A = {2, 3, 5}, B = {3, 6}, míg AB = {3}, azaz
szabályos kockát feltételezve:

azaz teljesül a feltétel a függetlenségre, hiszen

Fontos tény, hogy a függetlenség nem tranzitív, azaz ha A független B-től, B független C-től, akkor A nem feltétlen
független C-től.

Ellenpélda. Legyen az eseménytér egy egység sugarú kör egy pontjának a véletlen kiválasztása. Három eseményt
adunk meg. Legyen az A esemény, hogy a felső félkörből választjuk a pontot, B az az esemény, hogy a jobb oldali

félkörből, míg C az az esemény, hogy az alsó félkörből (26.5. ábra). Ekkor . Hasonló

igaz B és C-re is, de

26.5. ábra

Ez a fogalom igen fontos a mindennapokban, sokszor éppen azt kutatjuk, hogy vajon két tényező között van-e a
kapcsolat vagy sem. Ez a statisztika egyik fontos feladata is, lásd a 27.5. fejezetet.
A függetlenség fogalma több eseményre is kiterjeszthető egy gyengébb és egy erősebb feltétel teljesülése esetén. Előbb
nézzük a gyengébbet!

Legyenek az A1, A2, …, An események egy valószínűségi mező σ-algebrájának elemei.


Páronként függetlennek mondjuk ezeket az eseményeket értelemszerűen, ha minden i ≠ j esetén Ai és Aj függetlenek.
Teljesen (totálisan) függetlennek mondjuk az A1, A2, …, Aa eseményeket, ha bármilyen i1, i2, …, ij esetén
.

Példa páronként független, de nem totálisan független eseményekre, illetve totálisan független eseményekre
1. Páronként független, de nem totálisan független események. Legyen az eseménytér egy négyzet pontjai közül
egynek a véletlen választása. Az A esemény jelölje a „bal alsó sarok felét” a négyzetnek, a B esemény a „jobb alsó
sarok felét” és a C pedig egy „homokóraszerű” részt (26.6. ábra). Ekkor bármely kettő független, mert
mindegyiknek ½ az esélye, és a páronként vett metszetek mindhárom esetben ¼ esélyűek. Ám a hármas metszet
is ¼, hiszen mindhárom halmazpár metszete azonos(!), míg a szorzat 1/8, azaz nem totálisan függetlenek.

26.6. ábra

2. Totálisan független események. Legyen az eseménytér ezúttal is egy egységnégyzet pontjaiból való véletlen
választás. Az A, B, C események rendre a négyzet alsó fele, a jobb oldali fele, illetve a felezőpontok által
meghatározott középvonal négyzet (26.7. ábra). Ez a három esemény totálisan független lesz, mivel mindegyik
valószínűsége ½, a páronként vett metszeteik ¼ valószínűsége ¼, tehát páronként függetlenek. A hármas
metszet valószínűsége viszont 1/8, ami éppen a három valószínűség szorzata.

26.7. ábra

A következőkben mutatunk egy érdekes jelenséget a függetlenség fogalmára. Tekintsük a háromgyerekes családokat,
és tegyük fel, hogy a nemek valószínűsége egymástól függetlenül minden gyermekre ½ (lehet három pénzérme feldobását
is tekinteni, akkor ez inkább teljesül). Legyen H az az esemény, hogy mindkét nemű gyermek van a családban (mind fej,
mind írás előfordul a dobásnál), míg az A esemény, hogy legfeljebb egy lány van (legfeljebb egy fejet dobunk). Ekkor a két
esemény független, mivel egyrészt:

, hiszen két esetet zárunk ki a nyolcból, a három ú és a három lányt; és , hiszen a legfeljebb

egy ú komplementere, és a szimmetria mindkettő esélye egyenlő. Másrészt , hiszen ez a pontosan egy lány
esete, ami éppen háromféleképpen képzelhető el, vagy az első, vagy a második, vagy a harmadik gyerek lehet lány. Tehát
teljesül a függetlenség feltétele.
A meglepő, hogy ez csak háromgyerekes családokra (három pénzérme egyszerre történő feldobására) igaz. Erre nehéz
magyarázatot adni, hogy miért független ilyenkor, a többi esetben viszont nem. Általában n gyerek (érme) esetén,
ugyanúgy H legyen az az esemény, hogy mindkét nemű gyermek van a családban (mind fej, mind írás előfordul a dobásnál),

míg az A esemény, hogy legfeljebb egy lány van (legfeljebb egy fejet dobunk). Ekkor

végül A függetlenség azt jelenti, hogy ahonnan azt kapjuk,


hogy (2n–1–1)(n + 1) = n · 2n–1, azaz 2n–1 = n + 1, ami csak n = 3 esetén igaz. Tehát sosem független a két esemény csak
háromgyerekes családokra. Ez numerikusan kijött, de semmilyen intuitív magyarázat nincs, hogy miért éppen három
gyerek esetén függetlenek. W. Feller konstruálta ezt az érdekes példát.
A következőkben két tételt mutatunk be, amelyekkel feltételes valószínűségek esetében gyakran dolgozunk. Ehhez
először egy fogalmat vezetünk be.
Teljes eseményrendszernek nevezzük a B1, B2, …, Bn eseményeket, ha a következő két feltétel teljesül:
1. Bi ∩ Bj = Ø minden i ≠ j esetén, ahol 1 ≤ i ≤ n, 1 ≤ j ≤ n;
2.

Megjegyzés. A teljes eseményrendszer fogalma kiterjeszthető nem véges eseményrendszerre is. A feltétel csak a
páronkénti diszjunktság, és hogy az összes uniója kiadja a teljes eseményteret (az Ω-t).

Halmazelméleti nyelven azt is mondhatjuk, hogy a teljes eseményrendszer egy diszjunkt partíciója az Ω halmaznak.
Ezzel már megfogalmazhatjuk és bebizonyítjuk az első tételt.

A teljes valószínűség tétele:


Legyen A egy tetszőleges esemény, azaz A ∈ , és {Bi|1 ≤ i ≤ n, i ∈ N} egy teljes eseményrendszer, amelyre még az is
teljesül, hogy P(Bi) > 0 minden i-re.

Ekkor .

Bizonyítás. Mivel , ezért a jobb oldali összeg átalakítható:

. Viszont mivel Bi események diszjunktak, ezért az A ∩ Bi események is azok, s így az

összegük valószínűsége megegyezik az uniójuk valószínűségével, tehát , mivel


Bi események uniója maga az Ω, és így az unió maga az A esemény lesz. Ezzel a tételt beláttuk. Szemléletesen is könnyen
látszik az összefüggés a 26.8. ábráról.

26.8. ábra

Megjegyzés. A tétel kimondható megszámlálhatóan végtelen sok esemény esetén is, ha azok teljes eseményrendszert

alkotnak, ekkor .
Példa. Legyen a következő kísérlet az, hogy húzunk egy kártyát a 32 lapos pakliból, az egyik esemény, hogy pirosat
húzunk, a másik, hogy ászt. Ezek függetlenek, mert pontosan egy piros ász van, ennek az esélye 1/32, míg a pirosé 1/4,
az ászé 1/8, s a szorzat 1/32. Azaz a szín független a gurától. Ha most két lapot húzunk visszatevés nélkül, akkor az
eseménytér az összes lehetséges kártyapáros. Legyen az egyik eseményünk az, hogy az első lap piros (A), míg a másik
eseményünk, hogy a második lap ász (B). Állításunk igazolására használjuk majd a fenti tételt. Ehhez szükségünk
van három valószínűségre:
1. P(A) = l/4
2.
, ahol C1 jelöli, hogy az első húzás ász, míg a
komplementere a szokásos felülvonás, tehát hogy nem ász. Itt használtuk a teljes valószínűség tételét először.
Azaz másodikra ászt húzni ugyanolyan valószínű, mint elsőre!
3.
, ahol D jelöli azt az esemény, hogy az első
húzás a piros ász, és ismét a teljes valószínűség tételét használtuk.
Azaz a két esemény független egymástól, hiszen P(AB) = P(A)P(B).
Egy másik példa a következő. Van három ók, az elsőben két arany- és egy ezüstérme, a másodikban egy-egy arany és
ezüst, míg a harmadikban egy arany és három ezüst, amelyek tapintásra egyformák. Ha véletlenszerűen választunk
egy ókot s abból egy érmét, akkor mekkora eséllyel lesz ez aranyérme?
A teljes valószínűség tételét alkalmazzuk az A1, A2, A3 eseményekre, amelyek rendre az első, a második, illetve a

harmadik ók választását jelentik: .


Természetesen, ha a ókok választása nem egyenlően valószínű, akkor is tudunk számolni, csak ismerni kell a
választások esélyeit.

A másik tételt is előzze meg egy észrevétel. Ez abból adódik, hogy észrevesszük a közös tényezőt a következő két
feltételes valószínűségben. Mivel és , ezért a közös rész valószínűsége, amely
a metszet kommutativitása miatt triviálisan egyenlő, azt kapjuk, hogy P(A|B)P(A) = P(B|A)P(B). Ez lehetőséget ad például a

B feltéve A esemény valószínűségének kifejezésére: .


Ezzel a formulával lehet dolgozni, ha a feltételt fel akarjuk cserélni az eseménnyel. Ebből két dolog is következik.
Először is, ha A-t és B-t felcseréljük, általában mást kapunk, tehát általában P(B|A) ≠ P(A|B), csak akkor, ha P(A) = P(B). Azaz
a feltételes valószínűség egy nem kommutatív reláció az eseménytér eseménypárjainak halmazán.
Ezek után nézzük a másik tételt, a Bayes-tételt, amely igen jelentős szerepet kapott a valószínűség-számításban, főleg
vitás értelmezései miatt. Ezen az összefüggésen alapul a Bayes-statisztika is, amelyről a 27.8. fejezetben olvashatunk.
A formula a következőképpen írható fel:

Bayes-tétel

, ahol az A esemény és hasonlóan minden Bi esemény pozitív


valószínűségű, {Bi|1 ≤ i ≤ n, i ϵ N} teljes eseményrendszer.

Bizonyítás. Az észrevételünk szerint az első egyenlőség nyilvánvaló, míg a második egyenlőség a teljes valószínűség
tételének alkalmazása.

Megjegyzés. 1. Az összefüggést szokás az inverz valószínűségek, avagy olykor az ok és az okozat valószínűségeinek


felcserélésére használható tételként is emlegetni. Éppen ezért sok lozó ai vitát is kiváltott az értelmezése, maga a
szerző nem is publikálta azt, csak később egy tanítványa. 2. Ez a tétel is kiterjeszthető megszámlálható sok
eseményből álló teljes eseményrendszerre, ezt az olvasóra bízzuk, lásd a teljes valószínűség tétele utáni megjegyzést
is.
Példa. Legyen egy kísérlet egy pénzérme feldobása, amelyet két, ránézésre egyformának tűnő érme egyikével
végzünk. Az egyik szabályos, tehát a fej és az írás valószínűsége egyaránt ½. A másik „cinkelt”, mondjuk úgy, hogy a
fej gyakoribb, meg gyeléseink szerint nagyjából teljesül, hogy a fej esélye ¾. Ezek után a véletlenül választott
érmével dobunk 10-szer, s az eredmény 8 fej. Mit gondolunk valószínűbbnek, s mennyivel, hogy a „cinkelt” vagy a
szabályos pénzt választottuk a dobáshoz?
Formalizáljunk! Jelölje azt az eseményt, hogy a szabályos pénzt választottuk, ekkor nyilván Ā jelöli a „cinkelt”

választását. Előzetesen , és jelölje Bi azt az eseményt, hogy a 10 dobás során éppen i fej született.
Ekkor tudjuk, hogy

Ezek után a kérdésünk a következő: P(A | B8) = ?, illetve P(Ā | B8) = ?


Felhasználva a Bayes-tételt a következőt kapjuk:

ami 1024/7585-tel egyenlő, megközelítőleg 0,13. Ekkor a „cinkelt” választására (ami az előbbi komplementere) 0,87
adódik. Azaz közel 1:7 lett az eredetileg 1:1 viszony. Az eredmény alapján jóval inkább a „cinkelt” pénz választására
gondolunk. Még élesebb eredmény adódna, ha pl. 100 dobásból 80 fejet dobnánk. Ekkor már közel 95% az esélye,
hogy a „cinkelt”-tel dobtunk.

Látható, hogy a bayesi gondolat olyankor használható, ha van egy véletlen alaphelyzet, s a következmények attól
függnek, hogy melyik alapesemény következett be. Ebben az esetben, ha az alaphelyzet eseményeinek ismerjük a
valószínűségét, valamint azt is, hogy azokból milyen eséllyel adódik valamelyik következmény, akkor a következmény
ismeretében megváltozik az alaphelyzet eseményeinek a bekövetkezési valószínűsége. Bővebben a 27. fejezetben
olvashatunk majd erről.

Egy másik fontos alkalmazási példa a mindennapi életből. Vizsgáljunk meg egy gyakori szituációt, egy orvosi
tesztvizsgálatot, például egy vérvizsgálatos AIDS-tesztet. Arra leszünk kíváncsiak, hogy ha valakinek pozitív az
AIDS-tesztje, akkor ennek a közhiedelem (beleértve sok orvost is!) szerint nagy esélyű következménye, hogy HIV-
fertőzött, hiszen a teszt két hibája egyaránt kicsi, mind az, hogy ne jelezzen pozitívot a fertőzés fennállása esetén,
mind az, hogy a nem fertőzöttre is riasszon. Természetesen a nagyon speci kus, érzékeny és csak HIV-re érzékeny
teszt igen drága, ezért általában elsőre olcsóbbként egy olyat választanak, ahol a fertőzés jelzése általában 99% körüli
a bemérések szerint, viszont más is kiválthatja a pozitív reakciót, így 5% körüli hamis riasztás is előfordul. Ezeket az
adatokat formálisan a következőképpen modellezzük: P(T+ | F) = 0,99 és P(T+ | F) ≈ 0,05, ahol T+ jelenti a pozitív
teszteredményt, F azt, hogy az illető fertőzött, és non F azt, hogy nem fertőzött. A kérdés ezek után az, hogy P(F | T+)
≈?
A válasz meglepő, mivel „intuíciónk szerint” kicsi hibák kicsi hibát okoznak, tehát az lenne esetünkben a hiba, hogy
valaki pozitív, mégsem fertőzött, akkor ez kicsi esélyű, tehát a kérdezett esély elég nagy, pl. 90% körüli. Meglepő
elsőre, hogy ez nem igaz. Elég kicsi a kérdezett esély. Írjuk fel a Bayes-tételt!

ahol p-vel jelöltük a fertőzöttség esélyét. Erre a


jelenlegi magyar HIV-statisztikai adatok szerint körülbelül p = 0,0005-et vehetünk. Ekkor a keresett érték:

kicsit kevesebb, mint 1%, szemben a várt magas értékkel. Azaz egy pozitív
teszteredmény még nem jelent nagy eséllyel fertőzöttséget.
Egy másik példa egy bírósági ügyben került elő. Egy fér t egy asszony meggyilkolásával vádolnak. A nő körme alatt
pontosan olyan vércsoportú vért találnak, mint a fér é, a fér ruháján pedig a nő vércsoportjához tartozó
vérnyomokat. A fér vércsoportjának előfordulása 0,173, a nő vércsoportja 0,157, nagyobb statisztikát alapul véve. A
helytelen következtetés a bíróságon az volt, hogy ekkor ez a független egybeesés a kettő szorzata, azaz 0,027. Vagyis
véletlenül csak ennyi volna az esélye ennek, tehát valószínűleg a fér a gyilkos. (El is ítélték 1973-ban, s aztán néhány
év múlva előkerült az igazi gyilkos, s akkor elengedték.) A tényleges esély, hogy a fér pusztán ezek alapján gyilkos
lenne, mindössze 0,1% és 3,5% között van, néhány becslés bizonytalanságát gyelembe véve. Formalizálva, legyen θ1
az a feltételezés, hogy a gyanúsított a gyilkos, míg θ2, hogy nem ő. Jelöljük X-szel a vércsoport megegyezését. Ekkor a
kérdésünk P(θ1 | X) értéke. A Bayes-tétel szerint ez a következőképpen írható fel:

A kérdés a jobb oldali valószínűségek értéke. A P(θ1) értéke attól függ, hogy
a tetthely elérhető környezetében hány szóba jöhető fér lakik. A feladathoz illeszkedő szám 10–7, mivel kb. 107 fér
egyformán szóba jöhetett. Ekkor nyilván P(θ2) = 1 – 10–7. Az első feltételes valószínűség értéke maximum 1, ha tényleg
ő a tettes, és létrejött a karmolás, és vér került a ruhájára, akkor az biztos ilyen vércsoportú. De ez nem biztos,
hasonló bűncselekmények vizsgálatával az mondható, hogy az esetek 50%-ában létrejön hasonló helyzet, vér a
köröm alatt (védekezés), és gyilkosságnál kifröccsenő vér a ruhán. Így ez a szám 0,5 és 1 között lehet. Ha nem ő a
gyilkos, akkor szintén két szélső helyzetet tekintve 2,72 · 10–5 és 2,72 · 10–6 között lesz a második feltételes
valószínűség értéke. Ebben arra való statisztikát is használtunk, hogy általában egy embernek milyen eséllyel van
vér a kabátján. Kihasználtuk a vércsoportok gyakoriságát is. Ezzel a képlet szerint 0,0018 és 0,035 adódik.

Gyakran hasznos az indukcióval bizonyítható alábbi „szorzási szabály” a feltételes valószínűségek felhasználásával:

Példa. Keressük annak a valószínűségét, hogy egy pakli magyar kártyából háromszor egymás után húzva rendre egy

pirosat (A1), egy ászt (A2) és egy hetest (A3) húzunk. Használva a formulát és azt, hogy ,

, , s ezzel a formula szerint a keresett esély:

, tehát mindössze 1000-ből 4-szer következik be, azaz minden kb. 250.
esetben.

26.4. Valószínűségi változók


Ennek a fogalomnak a gyökere a véletlen szám. Ha feldobunk n-szer egy pénzérmét, s azt kérdezzük meg, hány fej lett,
akkor ez egy véletlen szám, hiszen a dobásoktól, azaz a véletlentől függ a fejek száma. Itt a kísérlethez tartozó kimenetelek
halmaza olyan rendezett n-ekből áll, és a „koordináták” vagy F, vagy I:Ω = {(x1, x2, …, xn) |xi ϵ {F, I}, i = 1, 2, …, n}. A fejek
száma változó, minden egyes kimenetelhez egy számot rendel, nevezetesen a sorozatban szereplő F jelek számát.

Az ilyen függvényt, amely az eseménytéren értelmezett és értékei számok, általánosságban valós számok,
valószínűségi változónak mondjuk, ha teljesít egy feltételt, nevezetesen minden valós c-re az {ω | ξ(ω) < c} halmaz
hozzátartozik az Ω-beli σ-algebrához, azaz -mérhető.

Megjegyzés. Olyan véges eseménytéren, ahol minden részhalmaz hozzátartozik a valószínűségi algebrához, minden
valós függvény valószínűségi változó, mivel a mérhetőségi feltétel biztosan teljesül. Végtelen eseménytér esetén már
nem feltétlenül lesz minden azon értelmezett függvény valószínűségi változó, hiszen ha veszünk egy nem mérhető
halmazt, akkor az a függvény, amely akkor 1, ha az elemi esemény ehhez a nem mérhető halmazhoz tartozik,
különben pedig 0, az nem valószínűségi változó.
Példák
1. Dobjunk fel egy dobókockát addig, amíg az első hatost nem kapjuk meg. Az eseménytér nem lesz véges, hiszen
elvileg akármeddig dobálhatunk. Elemi események az n – 1 hosszúságú {1, 2, 3, 4, 5} halmaz elemeiből álló
rendezett sorozatok, melyek végén az n-edik helyen 6 áll. Minden sorozathoz rendeljük hozzá a hosszát! Ez egy
valószínűségi változó lesz, hiszen minden véges c valós számra a legfeljebb ilyen hosszú sorozatok száma véges és
mérhető is. Pontosan meg is mondható, hogy milyen értékeket milyen valószínűséggel vesz fel, hogy ha X-szel

jelöljük a sorozat hosszát, akkor . A későbbiekben arról is lesz szó, hogy az ilyen típusú
változót szokás geometriai eloszlásnak is mondani.
2. Vegyünk véletlenszerűen egy pontot a [0; 1]-ből. Ekkor az eseménytér a [0; l], a σ-algebrát a Lebesgue-mérhető
halmazok alkotják. A valószínűségi változónk a pont az intervallum két végpontjától vett távolságának
négyzetösszege. Ez tényleg valószínűségi változó lesz, hiszen minden {ω | ξ(ω) < c} halmaz mérhető.

Egy speciális valószínűségi változó, amelyet egy E esemény generál aszerint, hogy ha E bekövetkezik, akkor a változó 1
értéket vesz fel, ha nem, akkor 0 értéket.

Egy E esemény karakterisztikus valószínűségi változójának mondjuk a ζE(ω) változót, ha a következőképpen

de niáljuk:

Az eseménypárokon értelmezett függetlenség fogalmát átvihetjük a valószínűségi változókra is.

Az azonos valószínűségi mezőn értelmezett X, Y valószínűségi változókat akkor nevezzük függetlennek, ha minden
valós x és y esetén {ω | X(ω) < x} és {ω | Y(ω) < y} események egymástól függetlenek. Azaz minden x és y esetén a
következő egyenlőség teljesül: P({ω|x(ω) < x} és {ω | Y(ω) < y}) = P({ω|X(ω) < x}) P({ω|Y(ω) < y}).

Megjegyzés. Két esemény függetlenségének szükséges és elégséges feltétele a hozzájuk tartozó két karakterisztikus
valószínűségi változó függetlensége. A következőkben egy-egy példát látunk független, illetve nem független
valószínűségi változóra.
Példák
1. Legyen Ω egy szabályos dobókocka feldobásánál született eredmény. Az E esemény legyen, hogy prímet dobunk
(2, 3, 5), míg F esemény, hogy 5-nél kisebbet (1, 2, 3, 4). Mivel E és F függetlenek, ezért a megjegyzés szerint a

hozzájuk tartozó karakterisztikus valószínűségi változók is azok, hiszen


2. Legyen ismét Ω egy szabályos dobókocka feldobásánál született eredmény. Az egyik változó legyen a

következőképpen megadva:

míg a másik:

Ez a két változó nem független, hiszen például , másrészt és ,


melyek szorzata 1/4 és nem 1/6. Tehát nem függetlenek.

A valószínűségi változók matematikai jellemzésére vezették be a következő fontos fogalmat.

A valószínűségi változó eloszlásfüggvénye a következő függvény: Fξ(x) = P({ω|ξ(ω) < x}), ahol az értelmezési
tartomány természetesen a valós számok halmaza.

Az előző, 2. példa valószínűségi változóinak eloszlásfüggvénye:


26.9. ábra

A következő tulajdonságok a valószínűség alaptulajdonságaiból adódnak az eloszlásfüggvényekre.

a) F a (–∞, ∞) intervallumon értelmezett monoton növő függvény,


b) és
c) F balról folytonos.
Minden a fentieknek eleget tevő eloszlásfüggvényhez konstruálható egy valószínűségi mező s egy olyan ξ valószínűségi
változó, amelynek éppen F az eloszlásfüggvénye.

A fogalom fontos lépés abban az irányban, hogy a konkrét valószínűségi mező vizsgálata helyett sok esetben
áttérhetünk az eloszlások vizsgálatára, amellyel a valós függvénytan terepére kerülünk, illetőleg a mértékelmélet egy
speciális alkalmazásaként is tekinthető a vizsgálódás.

Amennyiben az F eloszlásfüggvénynek létezik deriváltja, akkor az függvényt az eloszlás


sűrűségfüggvényének mondjuk.

A sűrűségfüggvényeknek is vannak karakterisztikus tulajdonságaik. Mivel F monoton növő, ezért a sűrűségfüggvény

nem negatív. Emellett igaz, hogy , ahonnan mivel F határértéke a +∞-ben 1, tehát .
Igaz a következő tétel.

Ha f valós függvényre igaz, hogy f(x) ≥ 0 minden valós x-re, és , akkor létezik olyan ξ valószínűségi
változó, amelynek f a sűrűségfüggvénye.

Ez lényegében azonos módon bizonyítható, mint az eloszlásfüggvényre vonatkozó előző tétel. Megjegyezzük, hogy
diszkrét (azaz véges vagy megszámlálhatóan végtelen értékkészletű) valószínűségi változók esetén az eloszlást szokás
egyszerűen egy sorozat formájában megadni.

Ha az X valószínűségi változó értékkészlete x1, x2, …, xn, …, akkor a P(X = xi) számokat pi-vel jelöljük, és a következő
kétsoros mátrixot hívjuk a diszkrét változó eloszlásának:

Példák eloszlás- és sűrűségfüggvényre


1. Mi az eloszlása a legkisebb kihúzott lottószámnak az ötös lottón? Nyilván a legkisebb szám lehet az 1, 2, …, 86. A 87
már nem, mert még négy nagyobb kell, és 90-ig akkor már csak 3 maradna. Az eloszlás pedig: k valószínűsége:

2. Mi az eloszlás- és sűrűségfüggvénye a [0; 1] szakaszon véletlenszerűen választott pont segítségével keletkező két
szakasz közül a kisebbik hosszának? Nyilván a hossza legalább 0 és legfeljebb ½, tehát

egyenletes eloszlásra, s itt a kisebbik szakasz miatt a

szimmetria ad egy kettes szorzót. A sűrűségfüggvény eszerint:


Együttes eloszlás
Feltételes eloszlások
Műveletek valószínűségi változókkal

Együttes eloszlás
Az (X, Y) vektorváltozó vagy kétdimenziós változó együttes eloszlását nem határozzák meg külön-külön az egyes változók
eloszlásai. Ekkor a következőképpen de niáljuk a vektorváltozó (kétváltozós) eloszlásfüggvényét:

Az (X, Y) vektorváltozó együttes eloszlásfüggvényén a következő függvényt értjük: P(X < x, Y < y) = H(x, y).

Ekkor ennek a függvénynek is fontos tulajdonságai vannak, hasonlóan az egyváltozós esethez.

- H(x, y) mindkét változójában monoton növő függvény;


-
-
- mindkét változójában balról folytonos és
- tetszőleges Δx > 0, Δy > 0 esetén H(x + Δx, y + Δy) – H(x + Δx, y) – H(x, y + Δy) + H(x, y) ≥ 0.

Amennyiben az együttes eloszlásfüggvény mindkét változójában parciálisan di erenciálható, akkor a vegyes parciális
deriváltnak külön neve van.

Ha létezik minden x, y esetén a , akkor ezt a vektorváltozó együttes sűrűségfüggvényének mondjuk és


h(x, y)-nal jelöljük.

Ekkor igaz a következő összefüggés is:

Azaz az együttes sűrűségfüggvényből is megkaphatjuk az eloszlásfüggvényt. Az együttes sűrűségfüggvénynek a két


meghatározó tulajdonsága a következő:

h (x, y) ≥ 0 minden lehetséges x, y értékre, és

Amennyiben egy kétváltozós függvény integrálható, és megvan a fenti tételben megadott két tulajdonsága, tekinthető
egy vektorváltozó sűrűségfüggvényének.
Az együttes eloszlásfüggvény meghatározza az egyes koordináták ún. eloszlását is.

Az , illetve a függvények az (X, Y) vektorváltozó X, Y koordinátái


eloszlásfüggvényei, és peremeloszlás-függvényeknek vagy vetületieloszlás-függvényeknek nevezzük.

Természetesen, ha létezik együttes sűrűségfüggvény, akkor igazak a következő összefüggések is:

Hasonlóan de niálhatók a peremsűrűség-függvények is:

Ha F(x), illetve G(y) di erenciálható, akkor az f(x) = F′(x), illetve g(y) = G′(y) függvényeket peremsűrűség-
függvényeknek nevezzük.

Amennyiben független a két változó, akkor igazak a következők:


Ha X és Y változók függetlenek, akkor H(x, y) = F(x)G(y), illetve hasonlóan sűrűségfüggvényekre: h(x, y) = f(x)g(y). Ez
megfordítva is igaz, amennyiben a sűrűség-, illetve az eloszlásfüggvény ilyen szorzat alakban felírható, akkor a
vektorváltozó koordinátái függetlenek.

Példák
1. Nem független eloszlásra. Legyen az (X, Y) vektorváltozó együttes sűrűségfüggvénye:

Viszont x +y ≠ (x + 0,5) (y + 0,5), tehát nem függetlenek.


2. Független eloszlásra. Legyen adott egy egység élű négyzet alakú céltábla, és a lövés egyenlő területű
tartományokba egyenlő eséllyel esik. Legyenek X és Y a lövés derékszögű koordinátái. Ekkor

lesz az eloszlásfüggvény a feltételek gyelembevételével. Nyilván F(x) = x,


és G(y) = y. Azaz függetlenek a koordináták. A sűrűségfüggvények is mutatják ezt, hiszen mindkettő konstans 1 a
[0; 1] intervallumon, míg az együttes sűrűségfüggvény szintén 1.

Feltételes eloszlások
Az együttes eloszlásokból lehet de niálni a feltételes eloszlást. Valójában, ha két változó van, akkor az egyiknek a másikra
(amelyik abszolút folytonos eloszlású) vonatkozó feltételes eloszlását a következőképpen de niáljuk:

Az X változó Y változó melletti feltételes eloszlásfüggvénye:

ahol H(x, y) az együttes eloszlásfüggvény, g(y) az Y peremsűrűség-függvénye.

Ha létezik az együttes sűrűségfüggvény h(x, y), akkor a következő alakban adható meg az X változó Y = y feltétel
melletti sűrűségfüggvénye:

Hasonlóan az Y változó X = x melletti sűrűségfüggvénye:

A teljes valószínűség tételének folytonos analógiájaként fennáll a következő két összefüggés:

Tehát a feltételes sűrűségfüggvényekből előáll a két változó peremsűrűség-függvénye. Ezt jól lehet használni a
következő valószínűségi változókkal végzett műveletek esetén is.

Műveletek valószínűségi változókkal


A következőkben olyan műveletekről lesz szó, amelyeket a valószínűségi változókkal végezhetünk, s melyek előfordulnak
az alkalmazások során is.

Valószínűségi változók összege


Az összeg eloszlása diszkrét, illetve folytonos esetben
Valószínűségi változók különbsége és eloszlása
Valószínűségi változók szorzata és eloszlása
Valószínűségi változók hányadosa és eloszlása
Valószínűségi változó függvényének eloszlása

Valószínűségi változók összege


Gyakran fordul elő, hogy több hatás összegződik egy adott jelenségnél, s az egyes hatások mind-mind véletlenszerűek
valamilyen eloszlással. Például ha párhuzamosan több asztalnál játszunk a kaszinóban, és a teljes anyagi helyzetünk
érdekel.

Legyenek X és Y ugyanazon a valószínűségi mezőn de niált valószínűségi változók. Ekkor a Z = X + Y valószínűségi


változót az összegüknek mondjuk, ha minden ω > Ω esetén Z(ω) = X(ω) + Y(ω).

Példa. Vegyük a kaszinókból ismert craps játékot, ahol két kockát dobnak fel, és az összegük különböző értékeire
nyerünk, vesztünk vagy tovább dobnak. Nyilván, mivel mindkét kockán 1-től 6-ig terjednek a számok, ezért az összeg
2-től 12-ig terjed. Ha készítünk egy táblázatot, akkor az esélyeket is ki lehet számolni, feltéve, hogy a két kockán
dobott szám értéke egymástól független.

X + Y összeg X Y Esély

2 1 1 1/36

3 1; 2 2; 1 2/36

4 1; 2; 3 3; 2; 1 3/36

5 1; 2; 3; 4 4; 3; 2; 1 4/36

6 1; 2; 3; 4; 5 5; 4; 3; 2; 1 5/36

7 1; 2; 3; 4; 5; 6 6; 5; 4; 3; 2; 1 6/36

8 2; 3; 4; 5; 6 6; 5; 4; 3; 2 5/36

9 3; 4; 5; 6 6; 5; 4; 3 4/36

10 4; 5; 6 6; 5; 4 3/36

11 5; 6 6; 5 2/36

12 6 6 1/36

Ez mutatja az eloszlást is, tehát az egyes értékeket és a valószínűségüket is.

Az összeg eloszlása diszkrét, illetve folytonos esetben


Amennyiben a két változó nem független, akkor ismerni kell az együttes eloszlásukat is, ezt most nem tárgyaljuk.
Amennyiben függetlenek, akkor a két változó eloszlásából az összeg eloszlása megadható. Csak ezekkel foglalkozunk a
következőkben.

Két független valószínűségi változó összegét a két változó konvolúciójának nevezzük.

Először a diszkrét esetet nézzük.

Legyen az X változó értékkészlete: x1; x2; x3; …, xn, míg az Y változóé y1; y2; y3; …, ym. Ekkor, ha Z az összegük, akkor
értékei z1; z2; z3; …, zk, és természetesen minden zi-hez létezik legalább egy olyan xg és yh érték, hogy zi = xg + yh. Ekkor
a Z eloszlása a következő lesz:

Példánkban mindkét változó az {1, 2, 3, 4, 5, 6} halmazon egyenletes eloszlás volt, s összegük a táblázatban szereplő
eloszlás lett. Érdekes ezt tovább folytatni, s három kocka összegét, négy kocka összegét vizsgálni. Érdekes
meg gyelést tehetünk, az eloszlás egyre inkább „harangszerű” lesz. Majd később a centrális határeloszlás tétele
kapcsán derül fény a jelenségre.

Folytonos esetben a következő mutatható meg.

Jelölje X sűrűségfüggvényét f, és a tőle független Y-ét g. Az összegüket jelölje Z, sűrűségfüggvényét h. Erre igaz lesz,

hogy .

Valószínűségi változók különbsége és eloszlása

A Z valószínűségi változót az azonos valószínűségi mezőn értelmezett X és Y változók különbségének mondjuk, ha Z(ω)
= X(ω) – Y(ω) minden ω > Ω esetén.

Példa. Vegyünk egy játékost, aki a bankkal a következőt játssza. A játékvezető és ő is feldob egy-egy kockát.
Nyereménye (vesztesége) a két dobott szám különbsége, mégpedig mindig a játékos által dobott számból kell a
játékvezető által dobott számot kivonni. Milyen lehetőségek adódnak és milyen valószínűség-eloszlással?
Megoldás. A lehetőségek a két dobott szám különbségei, ami a következő táblázat szerint alakulhat:

Játékos dobása → Játékvezető dobása 1 2 3 4 5 6

1 0 1 2 3 4 5

2 –1 0 1 2 3 4

3 –2 –1 0 1 2 3

4 –3 –2 –1 0 1 2

5 –4 –3 –2 –1 0 1

6 –5 –4 –3 –2 –1 0

Ebből adódik, hogy a különbség lehetséges értékei és valószínűségeik, a kockák szabályosságát és a dobások
függetlenségét feltételezve:

Ekkor a Z változó éppen a két egyenletes eloszlású független X és Y változó különbsége.

Folytonos esetben a különbség sűrűségfüggvénye hasonló, mint az összegé, ha függetlenek a változók, és a következő
alakban írható fel:

Valószínűségi változók szorzata és eloszlása


Vannak olyan helyzetek, ahol a két véletlen mennyiség szorzata jelent valamit. Például ha véletlenül választunk két számot
a [0; 1] intervallumból, és a szorzat a kérdés, például a két szám origótól vett távolságából egy téglalapot szerkesztünk, és a
téglalap területére vagyunk kíváncsiak.
A Z valószínűségi változót az azonos valószínűségi mezőn értelmezett X és Y változók szorzatának mondjuk, ha Z(ω) =
X(ω) · Y(ω) minden ω ∈ Ω esetén.

Folytonos esetben a sűrűségfüggvényre az előző műveletekhez hasonlóan igaz egy összefüggés.

Jelölje X sűrűségfüggvényét f, a tőle független Y-ét g. Ha a szorzatukat Z jelöli, sűrűségfüggvényét pedig h, akkor igaz
lesz, hogy

Példánk legyen a bevezető téglalapos feladat. Mivel mindkét szám 0 és 1 közötti, ezért a szorzat is 0 és 1 között lesz.
Feltéve az egyenletes eloszlás f(x) = g(x) = 1 a [0; 1] intervallumon. A h sűrűségfüggvényre igaz lesz a következő

, ahol 0 < z ≤ 1. Tehát annak a valószínűsége, hogy például a terület legfeljebb ½, nem más,

mint , azaz elég valószínű. Nyilván egynél kisebb számok szorzata még
kisebb lesz, nem egyenletes a szorzat eloszlása.
Egy diszkrét példa, ha két kockával dobunk, és a dobások szorzata lesz a nyereményünk.
Vajon milyen eloszlású a nyeremény?

Játékos dobása → Játékvezető dobása 1 2 3 4 5 6

1 1 2 3 4 5 6

2 2 4 6 8 10 12

3 3 6 9 12 15 18

4 4 8 12 16 20 24

5 5 10 15 20 25 30

6 6 12 18 24 30 36

Tehát a lehetséges értékek:

Ez tehát a szorzat eloszlása. Nyilván a többféleképpen bontható számok szerepelnek nagyobb eséllyel, a 4 kivételével
öt négyzetszám pedig 1/36 eséllyel (a 4 bontható 4 × 1-ként is, ezért 3/36 az esélye).

Valószínűségi változók hányadosa és eloszlása

A Z valószínűségi változót az azonos valószínűségi mezőn értelmezett X és Y változók hányadosának mondjuk, ha

minden ω ∈ Ω esetén. Természetesen fel kell tételeznünk, hogy az Y változó a 0 értéket nem veszi fel,
mert ott értelmetlen a hányados.

Folytonos esetben itt is van egy tétel a sűrűségfüggvényre:

Jelölje X sűrűségfüggvényét f, a tőle független Y-ét g. Ha hányadosukat Z jelöli, míg annak sűrűségfüggvényét h, akkor
igaz lesz, hogy

Példa. Egy diszkrét eset a következő. Legyen X egy dobókockával dobott szám értéke, míg Y két pénz feldobása esetén
a fejek száma +1. Azaz Y lehetséges értékei 1, 2, 3, az esélyeik rendre: ¼; ½; ¼. Ekkor a hányados eloszlása a
következő:

Valószínűségi változó függvényének eloszlása

Legyen X egy valószínűségi változó és ψ: U ⊆ R ↦ R mérhető valós függvény. Ekkor az Y = ψ(X) is egy valószínűségi
változó lesz.

Csak a folytonos esettel foglalkozunk.

Ha X abszolút folytonos eloszlású és f a sűrűségfüggvénye, valamint ψ szigorúan monoton, és mindenütt


di erenciálható függvény. Ekkor az Y változó is folytonos, és g-vel jelölt sűrűségfüggvényére a következő igaz:

, ahol ψ–1 jelöli ψ inverz függvényét, ami a monotonitási és di erenciálhatósági


feltétel miatt létezik.

Nézzünk két példát erre! Elsőként vegyünk egy (0; 1)-en egyenletes eloszlású változót (lásd a 26.6. fejezetben),
valamint a transzformációt. Mi lesz a transzformált eloszlás sűrűségfüggvénye? Nyilván a tételt

használva adódik, hogy minden 0 < y < 1-re, mivel f(x) = 1 minden x-re. Így például annak
a valószínűsége, hogy választva véletlenszerűen egy négyzetet, melynek területe 0 és 1 egység közé esik, annak az

oldalhossza legfeljebb ½, nem más, mint


Második példánk legyen a normális eloszlás, és a t(x) = x2 leképezéssel transzformáljuk. Ekkor a statisztikában
sokszor használatos χ2-eloszláshoz jutunk (26.6. fejezet), tekintve, hogy t szigorúan monoton fogy a (–∞, 0)

intervallumon, és szigorúan monoton nő a (0, ∞) intervallumon, ezért , ahol


és

Ebből adódik, hogy


Azt az eloszlást, amelynek ez a sűrűségfüggvénye, nevezzük χ2-eloszlásnak.

26.5. Nevezetes diszkrét eloszlások


Mint már korábban leírtuk, akkor beszélünk diszkrét valószínűségi változóról, ha az értékkészlete véges vagy
megszámlálhatóan végtelen. Ekkor az eloszlás megadható egyszerűen úgy, hogy az egyes értékkészletbeli elemek
valószínűségeit adjuk meg. Formálisan legyen az értékkészlet az y1, y2, …, yn véges, illetve az y1, y2, …, yn, …
megszámlálható halmaz. Az eloszlás megadható úgy, hogy megmondjuk a P({ω|ξ(ω) = yi} = pi értékeket. Ez lehet egy véges,
illetve egy megszámlálhatóan végtelen sorozat. A feltétel természetesen az, hogy minden pi nem negatív, és teljesül a

, illetve a feltétel.

A legegyszerűbb diszkrét változó a már szerepelt ún. karakterisztikus valószínűségi változó, amelyet egy A esemény
karakterizál, értéke 1, ha A bekövetkezett, és 0, ha nem,

Ilyenkor mindössze kételemű az értékkészlet (ennél kisebb számosságú csak a konstans valószínűségi változó
értékkészlete). Ennek eloszlásfüggvénye is egyszerű,
Diszkrét egyenletes eloszlás. Adott valahány kimenetel, s mindegyiknek ugyanannyi az esélye. Ha a felvett értékek
rendezve az x1, x2, …, xn számok, akkor az eloszlása:

Eloszlásfüggvénye:
A következő két eset nagyon fontos, és sok véletlen jelenségnek a modellje.

Visszatevéses urnamodell
Visszatevés nélküli urnamodell
Geometriai eloszlás
Poisson-eloszlás mint határeloszlás és mint „önálló változó”
Multinomiális eloszlás

Visszatevéses urnamodell
Egy urnában van N számú golyó, s köztük K piros. Ebből húzunk n-szer úgy, hogy minden húzás után visszatesszük a kivett
golyót, és megkeverjük az urnában levő golyókat. Azaz minden húzás ugyanolyan összetételű urnából történik. A ξ
valószínűségi változó legyen a húzott pirosak száma. Nyilván ξ értékei 0, 1, 2, …, n természetes számok lehetnek. Diszkrét
esetről lévén szó, a P(ξ = i} valószínűségeket kell megadnunk a lehetséges i értékekre. Ehhez ismét a kombinatorikus
Laplace-modellt használjuk fel. Az elemi események olyan rendezett szám n-esek, ahol P(iros), N(em piros) lehet az egyes
„koordináták” helyén. Mivel K piros és N – K nem piros golyó van, ezért minden piros húzás K-féleképpen, minden nem

piros N – K-féleképpen valósulhat meg. Így ha éppen i pirosat húztunk, akkor lévén, hogy -féleképpen lehet a piros
húzásokat rögzíteni az n húzás között, a keresett esély:

ahol a piros húzás esélyét jelöltük p-vel.

Ezt az eloszlást, tehát amely a 0, 1, 2, …, n értékeket veszi fel

eséllyel, a benne szereplő binomiális együtthatóra utalva, szokás binomiális eloszlásnak nevezni.

Megjegyzés. Elterjedt egyébként a Bernoulli-eloszlás szóhasználat is, Jacob Bernoullira utalva, aki először
foglalkozott ezzel az eloszlással, és nagyon fontos tételeket bizonyított be.

Az eloszlás „egycsúcsú”, azaz egy maximális értékig nő, azután csökken (később látni fogjuk, hogy nagy n értékekre
harangszerűen, lásd a 26.10a–b ábrát). Ez a maximális érték az np szorzat egész része „körül van”. Ennek igazolása egy
egyenlőtlenség megoldásán alapul, vizsgáljuk meg, hogy mikor érvényes az

egyenlőtlenség. Ezzel ekvivalens az egyenlőtlenség,


amelyet k-ra szeretnénk vizsgálni, hiszen n és p adott paraméterek. Erre azt kapjuk, hogy k + 1 – p < np, azaz k < (n + 1)p – 1.
Azaz amíg a jobb oldali valós számnál kisebb k, addig nő a sorozat, utána viszont fordul az egyenlőtlenség, tehát csökken.
Mivel k egész szám, ha k ≤ [np + p – 1], akkor még igaz az egyenlőtlenség, a következő k-ra már fordul, tehát a maximum a k
= [np +p – 1] + 1. Illetve, ha [np + p – 1] = np + p – 1, akkor két maximumérték lesz, mert ekkor (n + 1)p – 1 egész szám, s ha ezzel
k éppen egyenlő, akkor a két szomszédos tag éppen egyenlő lesz. Általában tehát egy maximumérték van, kivéve, ha (n + 1)p
egész szám, ekkor ugyanis k = (n + 1)p – 1 is egész szám, s ekkor a k és a k + 1 értékekre egyenlők lesznek a tagok.

Például, ha n = 3 és , akkor a négy tag esélye rendre: . Azaz két maximális érték van, hasonlóan,

mint pl. ha n = 5 és , ekkor a hat tag esélye rendre: , itt is két maximum van,
hiszen (n + 1)p egész szám.

26.10. ábra

A binomiális eloszlás eloszlásfüggvénye pedig a következő:

Gra kus kalkulátorok ezt binomcdf jelzéssel adják meg, pontosan, ha megadjuk az n és p paraméterek értékét,

valamint egy k értéket, akkor megkapjuk a értéket.

Visszatevés nélküli urnamodell


Ez a közvélemény-kutatás vagy a minőség-ellenőrzés modellje, de a lottó is ilyen. Egy adott összetételű urnából húzunk
többször, de most a kihúzott elemet nem tesszük vissza. Így minden húzás után új összetételű urna áll előttünk. Az n-szeri
húzást helyettesíthetjük, mivel a húzáseredmény sorrendje nem lényeges, egyetlen húzással, ahol n elemet veszünk ki.
Legyen ismét N golyó és K piros. A valószínűségi változónk ezúttal is az n közötti pirosak száma. Ezúttal az összes esetek
száma nem más, mint ahány különböző n elemű részhalmaza van az N elemű (urna) halmaznak. Nyilván ez a változó is 0-
tól n-ig vehet fel egész értékeket. Annak az esélye, hogy éppen a k értéket veszi fel:

, hiszen a számlálóban álló kifejezés mutatja, hányféleképpen lehet olyan n elemű


részhalmazt kiválasztani, ahol éppen k piros és n – k nem piros elem van.

Azt a változót, amely a 0, 1, 2, …, n értékeket veheti fel a fenti


valószínűségekkel, N, K, n paraméterű hipergeometriai eloszlásnak nevezzük (k a változó).

Ez az eloszlás is, hasonlóan a binomiálishoz, egycsúcsú, azaz egy bizonyos k értékig nő, azután csökken. Speciális
esetben két azonos valószínűségű k maximumhely lehet. Hasonló az okoskodás, mint a binomiális esetén, vizsgáljuk a

egyenlőtlenséget. Látható, hogy csak a számlálót kell kifejteni, ahol


egyszerűsítés után az alábbi ekvivalens alak keletkezik:

ahonnan rendezve adódik


Ha a jobb oldal egész szám, akkor éppen egyenlőség lesz, ekkor van két maximum, különben pedig egy, ami éppen a
fenti tört egész részénél eggyel nagyobb szám:

Ha a tört egész, akkor a két maximum: , aminek tehát az a


feltétele, hogy (N + 2) | (K + 1)(n + 1). Ez ritkán teljesül, így általában egy maximum van.
Fontos észrevétel a hipergeometriai eloszlás közelítése a binomiális eloszlással. Ez szemléletesen a következőképpen
indokolható. Ha jóval nagyobb a golyók száma, mint a húzásoké, s ez igaz a piros és a nem piros golyókra külön-külön is,
akkor alig van hatása a visszatevésnek, hiszen kicsi eséllyel húzzuk ki újra azt a golyót. Azaz a következő becslés adódik:

ahol , a piros golyók relatív gyakorisága a kezdeti urnában.


A hipergeometriai eloszlás eloszlásfüggvénye:

Geometriai eloszlás
Vizsgáljuk a következő szituációt. Addig kísérletezünk, amíg egy bizonyos p valószínűségű E esemény be nem következik. A
valószínűségi változó legyen a kísérletek száma. Nyilván ebben az esetben diszkrét, de végtelen változóról van szó, hiszen
elvileg előfordulhat, hogy akármilyen nagy számnál többet kell kísérletezni, amíg az első E-re nézve pozitív eredmény
adódik. Vizsgáljuk meg annak az esélyét, hogy éppen k kísérletet kell elvégeznünk. Ez azt jelenti, hogy az első k – 1
kísérletben nem következett be az E esemény, ennek esélye független kísérleteket feltételezve (1 – p)k–1, míg a k-adik
kísérletben bekövetkezik, azaz ennek p az esélye, s így felírható, hogy P(ξ = k) = p(1 – p)k–1. Ez valóban eloszlás lesz, hiszen

minden érték pozitív, és a végtelen mértani sor összegét felhasználva: . Mivel az


eloszlás egymás utáni tagjai egy mértani (geometria) sorozat tagjait adják meg, innen ered a geometriai eloszlás elnevezés.

Azt az eloszlást, amely az 1, 2, 3, …, n, … természetes számokat P(X=i) = p(1 – p)i–1 valószínűséggel veszi fel, geometriai
eloszlásnak nevezzük.
Talán meglepő, éppen olyan gyerekkori játékokból, amikor csak 6-os dobással lehet játékba kerülni, hogy ez
legvalószínűbben az első dobásra következik be. Azaz a fenti eloszlás szigorúan monoton csökkenő, bármilyen p
valószínűségű eseményről is van szó. Azaz, ha minden játékban rögzítenénk, hogy hányadikra jutottunk be, akkor az 1
szerepelne leggyakrabban. Közben viszont olyan esetek is vannak, amikor elég sokat kell dobni, s ezért van az az érzésünk,
hogy várhatóan többet kell dobni. Egyébként a várható dobásszám nem is az 1, hanem 6, mint majd később látjuk.

Poisson-eloszlás mint határeloszlás és mint „önálló változó”

Vizsgáljuk a határértéket, azaz nemcsak az n változik, hanem közben a p is úgy csökken,


hogy szorzatuk egy állandó értékhez tartson.

Használjuk a nevezetes Stirling-formulát:

Ahol az utolsó tényező határértéke a következő átalakítással adódik egy ismert határértékből:

Ezt az eloszlást, amely nem negatív egész számokat vesz fel valószínűséggel, Poisson-eloszlásnak
nevezzük, H. Poisson nyomán, aki a fenti határértéket először határozta meg.

Az eloszlás az egyik leggyakrabban előforduló diszkrét eloszlás.

Példa. Poisson-eloszlású a sajtóhibák száma egy könyv lapján, egy folyadékrészben levő idegen részecskék vagy
buborékok száma, egy telefonközpontba beérkező hívások száma adott időegység alatt, bizonyos idő alatt elbomlott
radioaktív atomok száma. Mekkora a valószínűsége, hogy egy üzletbe péntek délután 3 és 4 között, amikor a
tapasztalatok szerint átlagosan 5 vevő szokott jönni, most pontosan 3-an jönnek? Legvalószínűbben hányan jönnek?
Megoldás. Mint 26.7. fejezetben látni fogjuk, a várható érték éppen λ, így ha az átlagot ennek becsléseként tekintjük

(lásd még nagy számok törvénye), akkor az első kérdésre a válasz . Míg a másodikhoz meg kell
vizsgálni az eloszlás maximumát, ahogyan a binomiális, illetve a hipergeometriai eloszlás esetén láttuk. Itt

. ből adódik, hogy (k + 1) ≤ λ, esetünkben, mivel λ = 5, ezért k = 5 a maximum. Ellenőrzésképpen k = 4-


re, k = 5-re és k = 6-ra rendre 0,1755, 0,1755, 0,1462. Két maximum van, a 4 és az 5. Tehát ennek a két vevőszámnak
ugyanannyi az esélye. Ha a paraméter egész szám, akkor mindig igaz, hogy a paraméternél eggyel kisebb szám és a
paraméter értékének valószínűsége egyenlő.

Mivel a matematikai statisztikában fontos szerepet játszik, ezért még szót ejtünk a binomiális eloszlás egy
általánosításáról, a multinomiális eloszlásról.

Multinomiális eloszlás

Legyen A1, A2, …, A, ≥ 3 egy teljes eseményrendszer, és jelöljük a P(Aj) valószínűségeket rendre pi-vel, ahol 1 ≤ i ≤ r.
Ismételjünk meg egy kísérletet ezen az eseménytéren N-szer egymástól függetlenül. Jelölje Xi az Ai esemény
bekövetkezéseinek számát az N kísérlet során. Az (X1, X2, …, Xt) vektorváltozó együttes eloszlása N, és p1, p2, …, pr
paraméterű multinomiális eloszlású:
ahol ki: 1 ≤ i ≤ r nem negatív egész számok azzal a feltétellel, hogy összegük N.

26.6. Nevezetes folytonos eloszlások

Egyenletes eloszlás
Exponenciális eloszlás
Γ-eloszlás
Normális eloszlás
Cauchy-eloszlás
Lognormális eloszlás
χ2-eloszlás
Student-féle t-eloszlás
F-eloszlás
β-eloszlás

Egyenletes eloszlás

Az [a, b] intervallumon egyenletes eloszlásúnak nevezzük azt a valószínűségi változót, aminek konstans a

sűrűségfüggvénye: , míg ennek megfelelően eloszlásfüggvénye:

Példa. Valaki a villamosmegállóban várakozik. Ha egyenletes eloszlás szerint érkeznek a villamosok percben mérve a
[0, 10]-ban, akkor mi a valószínűsége annak, hogy legalább 4 percet kell várni? Vajon mennyi annak, hogy legalább 3
és legfeljebb 7 percet?
Mivel a [4, 10] az első kérdésre a válasz, ennek hossza 6, az egész szakaszé pedig 10 perc, tehát 0,6 a kérdezett esély. A
[3, 7]-ba esés esélye hasonlóan 0,4, amit úgy is megkaphatunk, hogy integráljuk a sűrűségfüggvényt, azaz:

Exponenciális eloszlás

Exponenciális eloszlásúnak mondjuk azt a nem negatív értékeket felvevő valószínűségi változót, amelynek

sűrűségfüggvénye: , míg ennek megfelelően eloszlásfüggvénye:

. A λ pozitív valós számot az eloszlás paraméterének hívjuk.


Példa. A radioaktív C12 szénizotóp bomlása. Mennyi a valószínűsége, hogy a 3714 éves felezési idejű C12 izotóp atom
1500 év alatt elbomlik?
Mivel tudjuk, hogy egy atom elbomlási ideje exponenciális eloszlást követ, ezért csak a paraméter meghatározása
szükséges, utána F(1500) adja a kérdezett választ. A felezési idő azt jelenti, hogy az anyag fele ennyi idő alatt bomlik
el, ami egy atomra lebontva azt jelenti, hogy mikor lesz az eloszlásfüggvény értéke ½, hiszen ez azt jelenti, hogy ½
eséllyel bomlik el addig egy atom, és a nagy számok törvénye szerint, akkor a sok atomnak együttesen a fele fog

várhatóan elbomlani. Tehát a Tf felezési időre érvényes a következő összefüggés: , ahonnan –ln 2 = –

λTf, azaz , vagy a paraméter szempontjából . Azaz adataink szerint (az időt években mérve,

mivel a felezési időt is abban adtuk meg) . Ezután a kérdezett valószínűség:


, tehát kb. ¼ eséllyel bomlik el 1500 év alatt az atom, ha a felezési idő 3714 év.
Megjegyzés. A várakozási idő esetén homogén folyamatok, az exponenciális és a Poisson-eloszlás kapcsolata. Ha
nagyszámú radioaktív anyagunk van, akkor az időegység alatt elbomló atomok száma Poisson-eloszlást követ, ahol a
két paraméter viszonyát az alábbi egyenlet adja meg.
Tegyük fel, hogy egy bizonyos rögzített időpontot 0-nak tekintve, minden x > 0-ra igaz, hogy pl. egy adott
anyagmennyiségből elbomlott atomok száma (vagy a villámcsapások, balesetek száma) Poisson-eloszlásúnak
tekinthető. Még a homogenitást is tegyük fel, tehát, hogy az x hosszúságú időintervallumban elbomlott atomok
(villámcsapások vagy balesetek) várható száma arányos x-szel. Ez azt jelenti, hogy ha valamilyen egységnyinek
választott idő alatt elbomló atomok átlagos száma: λ, akkor a [0, x) intervallumban elbomlottak száma λx
paraméterű Poisson-eloszlású lesz. Ez maga után vonja, hogy akkor annak az esélye, hogy egy atom sem bomlik el a
[0, x) intervallumban, éppen e–λx. Vagyis ha azt vizsgáljuk, hogy meddig kell várni az első elbomlott atomra, az
exponenciális eloszlású lesz, mégpedig hogy x-nél nagyobb lesz, annak éppen e–λx az esélye. Tehát hogy az első

hamarabb bomlik el, mint x, ennek az esélye: 1 – e–λx. Mivel ennek várható értéke , ezért azt is mondhatjuk, hogy

az első elbomlott atomra éppen ideig kell várni. Azaz ha pl. egy óra alatt 5 atom bomlik el átlagosan, akkor az
első atomra 1/5 órát, azaz átlagosan 12 percet kell várni (ez nem túl meglepő!). Ezt általánosítva kimondhatjuk a
következő tételt a Poisson- és az exponenciális eloszlás kapcsolatáról.

Ha valamilyen történések száma akármilyen időintervallum esetén az intervallum hosszával arányos paraméterű
Poisson-eloszlású, akkor az első történésig eltelt idő exponenciális eloszlású változó lesz, melynek paramétere
megegyezik az egységnyi idő alatt várható történések Poisson-eloszlásának paraméterével. Így az első történésig
várható időtartam hossza ennek reciproka lesz.

Példa. Statisztikák alapján az egy év alatt bekövetkező halálos közúti balesetek száma Poisson-eloszlású λ = 240
paraméterrel. Mikor várható januárban az első halálos baleset? A válasz, hogy az év 240-edrésze múlva, azaz 365/240
kb. 1,52 nap múlva, vagyis már január 2-án.

Egy másik nevezetes karakterisztikus tulajdonsága az exponenciális eloszlásnak az ún. „örökifjúság”, ami azt jelenti,
hogy ha élettartamot jelöl a változónk, akkor annak a valószínűsége, hogy egy t + τ időtartamot túléljen a vizsgált
objektum, ugyannyi, mint hogy a τ időtartamot túléli, feltéve, hogy a t-t túlélte. Formálisan:

Egy X nem negatív valószínűségi változót „örökifjúnak” nevezünk, ha igaz rá, hogy minden t, τ pozitív valós szám
esetén P(X ≥ t + τ|X ≥ t) = P(X ≥ τ).

Ekkor a következőt állíthatjuk.

Az exponenciális eloszlású X valószínűségi változó örökifjú.

Ez azért igaz, mert az örökifjúság feltételét eloszlásfüggvényre átfogalmazva azt kapjuk, hogy 1 – F(t + τ) = (1 – F(t)(1–
F(τ)), amelyből az exponenciális eloszlás esetében az e–λ(t + τ) = e–λt · e–λτ azonosságot kapjuk, amely természetesen fennáll.
Mivel folytonos függvények körében a G(x + y) = G(x)G(y) egyenlet egyetlen megoldása az exponenciális függvény, ezért a
tétel megfordítása is igaz.

Az abszolút folytonos eloszlások körében az egyetlen örökifjú eloszlás az exponenciális eloszlás.


Γ-eloszlás
Ennek az eloszlásnak az eredete az exponenciális eloszlás, mivel n független exponenciális eloszlású változó összege
(konvolúciója) Γ-eloszlású lesz.

Az X valószínűségi változót p-edrendű λ paraméterű Γ-eloszlásúnak mondjuk, ha sűrűségfüggvénye a következő alakú:

, különben f(x) = 0.

Megjegyzés. Általában gamma-függvénynek nevezzük a integrált. Ez a faktoriális fogalma egy


kiterjesztéseként jelent meg, hiszen ismeretes, hogy minden α > 0-ra az integrál véges, és teljesül, hogy Γ(α) = (α –
1)Γ(α – 1), ha α > 1, speciálisan Γ(n) = (n – 1)!
Példa. Ha van n egyforma izzónk, akkor annak a valószínűsége, hogy nem kell újat vennünk, s a lámpánk t ideig
használható ezekkel, éppen gamma-eloszlású lesz, hiszen ha kiég, akkor a következő izzó élettartamáig „ég” a lámpa,
s így tovább, tehát az n izzó élettartamának összege (konvolúciója) adja az eredményt.

Normális eloszlás
A leggyakoribb folytonos eloszlás, jelentőségét a centrális határeloszlás tételének általános alakja hangsúlyozza, mely
szerint sok apró hatás együttes eredménye nagyon széles tartományban normális eloszláshoz vezet (lásd 26.9. fejezetben).
Az első felismerés a binomiális eloszlás határeloszlásaként való felbukkanása volt, illetve Gauss mérési hibákkal
kapcsolatos vizsgálódásai vezettek el ide.

Gauss-féle vagy normális eloszlásúnak mondjuk azt a valószínűségi változót, amelynek sűrűségfüggvénye a

következő: ahol μ tetszőleges valós szám, míg σ > 0 valós. Ezek a normális eloszlás
paraméterei.

Eloszlásfüggvényét azért nem adtuk meg, mert zárt alakban a primitív függvénye egy nevezetes analízisbeli tétel
szerint nem kifejezhető elemi függvények és a szokásos műveleti jelek (összeadás, szorzás, gyökvonás stb.)
felhasználásával.

Azt a speciális esetet, amikor a μ paraméter 0, és σ = 1, standard normális eloszlásnak nevezzük, s ennek
sűrűségfüggvényét általánosan elterjedt φ(x)-szel jelölni. Az eloszlásfüggvényt, amelyet csak numerikus módszerekkel

lehet meghatározni, szokás Φ-vel jelölni, tehát .

Valójában minden X (μ, σ) paraméterű normális eloszlású változóból lehet standard normális eloszlást képezni a

következő eljárással: . Az így kapott X* változó már standard normális eloszlású lesz, hiszen a várható
értéke 0 és a szórása 1, ahogyan azt a következő fejezetben látni fogjuk.
A normális eloszlás eloszlásfüggvényének értékeit 4 vagy több tizedesjegyre táblázatokban szokás megadni. A
négyjegyű függvénytáblázatban is megtaláljuk. Ezzel különböző intervallumba esési valószínűségeket lehet számolni, mint
a következő példákban láthatjuk. Megjegyezzük, hogy az eloszlás szimmetriája miatt Φ(–x) = 1 – Φ(x), amit gyakran
kihasználunk, s ezért általában helytakarékosságból a táblázatok csak pozitív értékekre tartalmazzák a normális eloszlás
eloszlásfüggvényének értékeit.

Példák
1. Egy gép által töltött liszteszacskók tömege normális eloszlásúnak vehető μ = 1 kg, σ = 0,01 kg paraméterekkel. Mi a
valószínűsége, hogy egy véletlenül választott liszteszacskóban legfeljebb 0,97 kg liszt legyen? Mi a valószínűsége,
hogy legalább 1,01 kg liszt van benne?

Válasz: , mivel a standardizálás szerint le kell vonni 1-et és osztani


kell 0,01-dal. A*-gal jelölt változó már standard normális eloszlású, tehát hogy –3-nál kisebb legyen, annak az
esélye Φ(–3) = 0,0013. A legalább 1,01 kg esetén a komplementert számoljuk ki, hogy legfeljebb 1,01 kg, ami a
transzformációval éppen Φ(1) = 0,84, ahonnan a kérdezett valószínűség 0,16.
2. Az emberek IQ-ja jól közelíthető normális eloszlással μ = 100, és σ = 15 paraméterértékekkel, a) Mekkora a
valószínűsége, hogy egy véletlen találkozásnál a másik egyén legfeljebb 80-as IQ-jú? b) Annak mi az esélye, hogy
az illető IQ-ja 90 és 120 közé esik?
Válasz: a) legfeljebb 80, az, ha standardizáljuk , azaz Φ(–1,33) = 1–Φ(–1,33) = 0,0918, tehát
még 10% esélye sincs.
b) Ismét standardizálással a (90, 120) intervallumból kapjuk a (–0,67, 1,33) intervallumot két tizedesre kerekítve.
Ekkor a keresett esély: Φ(1,33)–Φ(–0,67) = Φ(1,33) + Φ(0,67) – 1 = 0,9082 + 0,7486 – 1 = 0,6568, azaz körülbelül az
esetek 2/3-ában esik ebbe az intervallumba a véletlenül választott személy IQ-ja.

Cauchy-eloszlás

Cauchy-eloszlásúnak mondjuk a valószínűségi változót, ha sűrűségfüggvénye a következő alakú:

minden x valós szám esetén. Eloszlásfüggvénye a következő: .

Megjegyzés. A Cauchy-eloszlás, bár történetileg korábbi, mint a Student-féle t-eloszlás, ezért is szerepel előbb, de
annak egy speciális eseteként az n = 1 szabadsági fokhoz tartozik.
Példa Cauchy-eloszlásra. Nézzük két standard normális eloszlás hányadosát! Ekkor

. Azaz a 26.4. fejezetben a Valószínűségi változó függvényének eloszlása cím

alatt megfogalmazott formula szerint: . Ennek kiszámítása nem

egyszerű, az eredmény: sűrűségfüggvényű Cauchy-eloszlás.

Lognormális eloszlás

Lognormális eloszlásúnak nevezzük azt a valószínűségi változót, amely egy normális eloszlású változónak, az y = ex
függvény szerinti transzformáltjával egyezik meg. Sűrűségfüggvénye a következő alakú, felhasználva a
transzformációra vonatkozó tételt:

, különben pedig 0.

A következő eloszlások főleg a matematikai statisztikában játszanak komoly szerepet (27. fejezet), mindegyike a
normális eloszlásból származik valamilyen módon.

χ2-eloszlás

Elsőrendű χ2-eloszlásról beszélünk, ha egy standard normális eloszlású változót az y = t(x) = x2 leképezéssel
transzformáljuk. Használva a transzformációra bemutatott eljárást (26.4. fejezet) kapjuk, hogy a sűrűségfüggvénye:

Általában n-edrendű vagy n szabadsági fokú χ2-eloszlásról beszélünk, ha n darab független standard normális eloszlású
változó négyzetének összegét veszszük, azaz

az változót, ahol minden Xi standard normális eloszlású, n szabadsági fokú χ2-eloszlásnak


nevezzük. Megmutatható, hogy sűrűségfüggvénye:
Az n = 10 szabadsági fokú χ2-eloszlás sűrűségfüggvénye látható a 26.11. ábrán.

26.11. ábra

Megjegyzés. Valójában azt is mondhatjuk, hogy n darab független elsőrendű χ2-eloszlás összege az n-edrendú.
Sűrűségfüggvénye akkor n-szeres konvolúcióval kapható meg az előbb látott elsőrendű χ2-eloszlás
sűrűségfüggvényéből. A χ2-eloszlás fontosabb értékeit különböző szabadsági fokok mellett táblázatban szokás
megadni, lásd a 27. fejezet végén megadott táblázatot.

Egy másik fontos eloszlás a fenti χ2-eloszlásból származik.

Student-féle t-eloszlás

A változónkat t-eloszlásúnak vagy Student-eloszlásúnak mondjuk, ha egy X standard normális eloszlású változóból és

egy tőle független χ2-eloszlású Y változóból a következőképpen áll elő: . Sűrűségfüggvénye:

A t-eloszlás sűrűségfüggvénye n = 4 szabadsági fokkal a 26.12. ábrán látható (ahol a szaggatott görbe a standard
normális eloszlást jelöli).

26.12. ábra

A különböző szabadsági fokú t-eloszlásfüggvény értékeit szintén táblázatban szokás megadni, lásd a 27. fejezet végén.

Megjegyzés. Ha n = 1-et helyettesítünk a t-eloszlás sűrűségfüggvényébe, akkor felhasználva, hogy

adódik, hogy , amelyről láthatjuk, hogy ez a korábban említett Cauchy-


eloszlás. Egy fontos nevezetességét, hogy nincs várható értéke, a következőkben látjuk majd.

F-eloszlás

F-eloszlásúnak nevezzük a két különböző szabadsági fokú χ2-eloszlásból a következő módon kapott valószínűségi

változó eloszlását: , ahol X egy n1, míg Y egy n2 szabadsági fokú χ2-eloszlású változó, amelyek függetlenek.
Ilyenkor (n1 – 1, n2 – 1) paraméterű F-eloszlásról beszélünk. Általában az (n, m) paraméterű F-eloszlás
sűrűségfüggvénye a következő alakú:
, x > 0, egyébként f(x) = 0.

A 26.13. ábra egy konkrét F-eloszlás sűrűségfüggvényét mutatja.

26.13. ábra

Az eloszlás értékeit szintén táblázatban szokás megadni, mivel csak számítógép segítségével numerikus módszerekkel
számolható. Lásd a 27. fejezet végén levő F-táblázatot.
Végül egy a Bayes-statisztikában (lásd 27.8. fejezet) fontos szerepet játszó eloszlást de niálunk.

β-eloszlás

A valószínűségi változó k, n paraméterű β-eloszlás, ha a [0; 1] intervallumon értelmezett a következő

sűrűségfüggvénnyel: .

Megjegyzés. A szorzótényezők a normálás miatt vannak, ahhoz szükségesek, hogy teljesüljön.

Általában az analízisben béta-függvénynek nevezik az alábbi kétparaméteres integrált:


, ahol α > 0 és β > 0 konstansok. Ellenőrizhető, hogy ez a korábban de niált gamma-függvénnyel is kifejezhető a

következőképpen: . Ezzel a felírással a fent megadott β-eloszlás sűrűségfüggvényét láthatjuk a


26.14. ábrán.

26.14. ábra

26.7. Az eloszlások legfontosabb jellemzői: a várható érték és a szórás


A várható érték fogalma is a szerencsejátékokra vezethető vissza, és eredetileg a várható (átlagos) nyereményértéket
jelentette. Később a nyeremény szó lekopott, és maradt a várható érték, ami nem szerencsés, mert a játék során nem ezt az
értéket várjuk. A fogalom az aritmetikai közép vagy súlyozott átlag megfelelője. Diszkrét esetben egy összeg (esetenként
végtelen soré), míg folytonos esetben egy integrál. Az egyes kimenetelek értékét súlyozzuk a valószínűséggel. Jelölése
általában E, korábban Magyarországon az M jel is előfordult. Az első betű mind az angolszász, mind a német, mind a latin
kifejezésben azonos (Expected value, Erwartungswert, expectation), s így ezekből eredeztethető. A változót zárójelben
írjuk mögé.

A ξ valószínűségi változó várható értékén az , vagy folytonos esetben


számot értjük, feltéve, hogy az összeg, illetve az integrál abszolút konvergens.
Folytonos esetben a második kifejezés csak akkor használható, ha létezik f sűrűségfüggvény.

Megjegyzés. A „feltéve, hogy létezik” fontos feltétel, mert ez nem szükségszerű. A következőkben példákat mutatunk
olyan diszkrét, illetve folytonos változóra, amelyeknek nem létezik várható értéke.
1. Legyen a változó egy rulettjáték esetén az első feketéig tartó duplázó stratégia tétértéke, azaz először felteszünk
egy egységnyi pénzt a feketére, ha elsőre kijön, akkor a tét 1 volt, ha 2-re, akkor 1 + 2 = 3, ha 3-ra, akkor 1 + 2 + 4=7,
általában, ha n-edikre jön ki a fekete, akkor 1 + 2 + 22 + … + 2n–1 = 2n – 1 pénzegység. Ekkor az összes tétünk várható

értéke: , ami +∞-hez tart, azaz nem létezik várható érték.


2.
Cauchy-eloszlás: legyen a ξ folytonos változó eloszlásfüggvénye a következő: . (Látható,

hogy tényleg 0 és 1 között van, monoton növő, tehát valódi eloszlás.) Ekkor minden valós x-re. A

várható értékhez a következő integrált kellene kiszámolni: . Ezt viszont lehet integrálni,

hiszen van primitív függvénye, az függvény, amit deriválással könnyen ellenőrizhetünk. Viszont
a logaritmus a végtelenben nem korlátos, azaz az improprius integrálnak nem lesz határértéke, így nincsen véges
várható értéke a Cauchy-eloszlásnak.

Nevezetes eloszlások várható értékeit a következőkben a bemutatott összefüggések és a szórás fogalmának bevezetése
után adjuk meg.
Sokat használt összefüggés a „várható érték operátor” linearitása, ami azt jelenti, hogy ha

ξ és η két tetszőleges valószínűségi változó, melyeknek létezik várható értéke, akkor a lineáris kombinációjuknak is
létezik, és értéke E(aξ + bη) = aE(ξ) + bE(η).

Egy másik fontos összefüggés.

Ha a ξ és az η változók függetlenek, és létezik a várható értékük, akkor igaz, hogy E(ξη) = E(ξ)E(η).

Még egy fontos fogalmat vezetünk be, a feltételes várható érték fogalmát.

Egy X valószínűségi változó egy A eseményre vonatkoztatott feltételes várható értéke az X-nek az A eseményre

vonatkoztatott feltételes eloszlásának várható értéke, azaz diszkrét esetben , ha pedig a

feltételes eloszlása folytonos, akkor , ahol f(x | A) jelöli az X változó A feltételre vonatkoztatott
feltételes sűrűségfüggvényét.

Ekkor, ha A1, A2, … egy teljes eseményrendszer, akkor a teljes valószínűség tételéből következik, hogy

Ezt értelmezhetjük úgy is, hogy az Ak események jelölik egy másik Y diszkrét változónak a lehetséges értékeit, azaz Ak =
{ω|Y(ω) =yk}, ahol az Y változó lehetséges értékeit jelöltük yk-val. Ez azonban további általánosítást indukál, hogy mi
lenne, ha Y folytonos lenne. Erre az esetre is bevezetjük az X valószínűségi változó Y változóra vonatkoztatott feltételes
várható értékét a következőképpen.

Ha X és Y együttes eloszlása h(x, y) folytonos, és akkor az X változó Y = y feltételre vonatkoztatott feltételes várható

értékén az integrált értjük.

Emlékeztetünk a 26.4. fejezet Feltételes eloszlások című részére, ahol láttuk, hogy .
Ha tehát ezt g(y)-nal, az Y sűrűségfüggvényével megszorozzuk, és y szerint kiintegráljuk, akkor megkapjuk X várható
értékét, azaz igaz a következő összefüggés:
A feltételes várható értékre még a 26.10. fejezetben a regresszió kapcsán viszszatérünk.
A valószínűségi változó szórása fogalom a statisztika empirikus szórásának (lásd a 27.4. fejezetben) a valószínűség-
elméleti megfelelője.

Egy valószínűségi változó szórása a változó várható értéktől való négyzetes eltérése átlagának négyzetgyöke. Jele a
dispersio szóból D. Írjuk fel formálisan az előbbieket:

ahol a második egyenlőség a várható érték operátor korábban emlegetett linearitásából adódik. Utóbbi forma a kiszámítás
leggyakoribb módja is egyben. Azaz, ha a várható érték megvan, akkor a szóráshoz már csak a változó négyzetének a
várható értékét kell kiszámolni.
Tulajdonságok:

A négyzetgyök alatti kifejezést szokás varianciának is mondani, vagy szórásnégyzetnek, jelölése D2(ξ). Erre független
változók esetén van egy fontos azonosság, ami a várható értékkel szemben azonban csak független (pontosabban
korrelálatlan) változók esetében működik.

Ha a ξ és az η valószínűségi változók függetlenek, akkor D2(ξ + η) = D2(ξ) + D2(η).

Ennek a bizonyításnak a gondolatát bemutatjuk, hogy látható legyen, miért is kell a függetlenség.

Az első két-két tag éppen a bizonyítandó összefüggés jobb oldala. Ha független a két változó, akkor a szorzatuk várható
értéke a várható értékek szorzata (lásd 26.2. fejezet), ekkor tehát az utolsó kétszeres tag értéke 0.
Ennek a két tételnek a segítségével lehet független véges összegként is előállítható valószínűségi változók szórását
egyszerűen kiszámolni. Legegyszerűbb példa erre a binomiális eloszlás, ami n darab ζi független karakterisztikus változó
összegének tekinthető. Egy karakterisztikus változó szórásnégyzete egyszerűen p(1 – p), hiszen a négyzetének várható
értéke maga a várható értéke, azaz p. Így D2(ζi) = p–p2 = p(1 – p).
Függetlenség esetében áll a fentiekben belátott linearitás, azaz a binomiális eloszlás szórásnégyzete: np(1 – p), azaz a
szórása: . Lásd később a 26.7. fejezetben Generátorfüggvény cím alatt is, ahol egy másik számolási móddal is
megadjuk a binomiális eloszlás várható értékét és szórását.

Nevezetes folytonos eloszlások várható értékei


Nevezetes folytonos eloszlások szórásai
Generátorfüggvény
A karakterisztikus függvény

Nevezetes folytonos eloszlások várható értékei


Legyen X egyenletes eloszlású az [a, b] intervallumon. Ekkor

Legyen Y egy λ paraméterű, exponenciális eloszlású valószínűségi változó, ekkor

Ez mutatja meg a λ paraméter valódi tartalmát, reciproka a várható érték.

Példa. Egy várhatóan egy év alatt elbomló radioaktív atom esetén mi az esélye, hogy már fél év alatt elbomlik? A
várható érték 1 év, ennek reciproka is 1, tehát λ = 1, azaz a kérdés P(X < 0,5) = 1 – e–0,5 ≈ 0,3935. Azaz közel 40% eséllyel
már fél év alatt elbomlik. Egy év alatt az esély 0,6321, tehát közel kétharmad eséllyel bomlik el egy év alatt.

Legyen Z egy μ és σ paraméterű normális eloszlású valószínűségi változó.

Ez mutatja meg a normális eloszlás μ paraméterének a jelentését, ez az eloszlás várható értéke.

Legyen Xlognormális eloszlású, akkor , hiszen

Ha X Cauchy-eloszlású, akkor, mint korábban láttuk, nincsen várható értéke.


χ2-eloszlás n szabadsági fokkal:

Az integrálban, ha az helyettesítést alkalmazzuk, akkor x = 2u miatt a tényező kiesik, és az integrál

éppen lesz, mivel dx helyett 2du írandó a helyettesítés miatt. Így az eredmény:

. Tehát E(X) = n.
n szabadsági fokú t-eloszlás
Ha n = 1, akkor nincsen várható értéke, egyébként pedig E(t) = 0, ha n > 1.

, ami az eloszlás szimmetriájából is látszik.

F-eloszlás (n, m) szabadsági fok esetén , ha n > 2, ha az első (számláló) szabadsági foka 1 vagy 2, akkor
nincsen várható értéke.
A β-eloszlás várható értéke:

Nevezetes folytonos eloszlások szórásai


Legyen X egyenletes eloszlású az [a, b] intervallumon, ekkor

Ebből adódik, hogy az [a, b]-n egyenletes eloszlású változó szórása

Legyen Y exponenciális eloszlású λ paraméterrel, ekkor , ebből a szórásra

adódik, azaz megegyezik a várható értékkel. Az exponenciális eloszlás paramétere tehát egyidejűleg a várható
értéke, illetve a szórás reciproka.
Legyen Z (μ, σ) paraméterű normális eloszlású változó. Ekkor igaz, hogy

, ahonnan a σ paraméter jelentését is megkaptuk, ez a normális eloszlású


változó szórása, D(Z) = σ.
Legyen Y lognormális eloszlású, akkor

Cauchy-eloszlás: nincsen még várható értéke sem, így szórása sincs.


A következő eloszlások esetén csak az eredményt közöljük, a levezetés néhol hosszasabb számolás eredménye.
χ2-eloszlás esetén , azaz a szórása: .

t-eloszlás szórásnégyzete csak legalább három szabadsági fok esetén létezik, azaz , ha n ≥ 3. Különben
nem létezik.
F-eloszlás (n, m) paraméterrel, szórása csak akkor létezik, ha legalább 5 a számlálójának a szabadsági foka, tehát ha n ≥
5, akkor létezik a szórásnégyzet, és értéke:

β-eloszlás szórásnégyzete mindig létezik, és értéke

A diszkrét eloszlások várható értékének, illetve szórásának meghatározása sokféleképpen történhet, az alábbi
generátorfüggvényeken alapuló számítás egy lehetőség, amely sok más, olykor igen trükkös ötletet elkerül.

Generátorfüggvény
Diszkrét nem negatív egész értékű eloszlások kezelésének egy analitikus útja az ún. generátorfüggvénnyel történik.

Általában egy sorozat generátorfüggvénye, a hatványsor.

Amennyiben a diszkrét valószínűségi változó a természetes számokat veszi fel, akkor értelmezhető az alábbi

hatványsor: , ahol az i értéket pi eséllyel veszi fel a változó. Feltesszük, hogy |x| ≤ 1, mert ekkor biztos
konvergens. Ezt a függvényt a ξ diszkrét változó generátorfüggvényének mondjuk.

Hasznos tételek a generátorfüggvénnyel kapcsolatban:


G(1) = 1 minden generátorfüggvényre.
, ha végtelen a limesz, akkor nincs várható értéke a változónak.
D2(ξ) = E(ξ2) – E2(ξ), azaz E(ξ2) – E(ξ) miatt
D2(ξ) = G″(1) + G′(1) – (G′(1))2.
A nevezetes diszkrét eloszlások generátorfüggvényei a következők.

Egyenletes eloszlás
Binomiális eloszlás
Hipergeometriai eloszlás
Geometriai eloszlás
Poisson-eloszlás

Egyenletes eloszlás
ahonnan , tehát a várható érték és a szórásnégyzet: , és

Binomiális eloszlás

ahonnan azonnal adódik a várható érték és a szórásnégyzet:


E(ξ) = np és D2(ξ) = n(n – 1)p2 + np – (np)2 = – np2 + np = np(1 – p).

Hipergeometriai eloszlás

Látható, hogy ha N jóval nagyobb, mint n, akkor az utolsó tört 1-hez közeli szám, s ahogyan a hipergeometriai eloszlás
ilyenkor a binomiálissal közelíthető, úgy a szórása is a binomiális eloszlás szórásához, np(1–p)-hez lesz közel, ahol nyilván

Geometriai eloszlás
Poisson-eloszlás

, ahonnan
G′(x) = λeλ(x–1) és G″(x) = λeλ(x–1).
Ebből adódik, hogy E(ξ) = λ és D2(ξ) = λ2 + λ – λ2 = λ.
Azaz a Poisson-eloszlás várható értéke és szórásnégyzete egyaránt a paraméterével, λ-val egyenlő. A szórás pedig a
várható érték négyzetgyöke.
Végezetül foglalkozzunk még a multinomiális eloszlással (lásd a 26.5. fejezetben).
Nyilván X1 + X2 + … + Xr = N is fennáll, így bármely r – 1 komponens meghatározza az eloszlást. Néhány nevezetes
tulajdonsága az eloszlásnak.
1. E(Xi) = Npi és D2(Xi) = Npi (1 – pi).
2. Xi és Xj együttes eloszlása i ≠ j esetén:

, ahol ki, kj nem negatív egészek, és összegük


legfeljebb N. Ebből adódik
3. E(XiXj) = N(N – 1)pipj.
Általában a generátorfüggvényeket sok céllal használják a valószínűség-számításban is. A fenti várhatóérték- és
szórásszámítások más módszerekkel is elvégezhetők, csak egy alkalmazásukat szerettük volna megmutatni. Fontos tétel,
hogy nemcsak az eloszlás határozza meg a generátorfüggvényét, hanem fordítva is.

Egy adott hatványsorba fejthető G(x) függvény generátorfüggvény, ha teljesül, hogy G(1) = 1, illetve minden
együtthatója nem negatív.

Az eloszlást a generátorfüggvényből a következőképpen lehet előállítani: p0 = G(0), és minden k ≥ 1


természetes szám esetén, ahol G(k) (x) a generátorfüggvény k-adik deriváltját jelöli.

A továbbiakban még egy fontos, sokat használt összefüggést mutatunk be a generátorfüggvények és valószínűségi
változók között.

Két független diszkrét valószínűségi változó összegének generátorfüggvénye a két változó generátorfüggvényeinek
szorzata. Formálisan, ha a két független változó generátorfüggvényei: Gξ(x) és Gη(x), akkor az összegük Gξ+η(x)
generátorfüggvényére igaz lesz: Gξ+η(x) = Gξ(x)Gη(x), minden |x| ≤ 1-re.

Ennek segítségével is lehet bizonyítani a következő két fontos összefüggést.

Két Poisson-eloszlású független változó összege is Poisson-eloszlású a két eloszlás paraméterének összegével mint
paraméterrel.

A bizonyításhoz csak annyi kell, hogy a fent levezetett generátorfüggvényeket összeszorozzuk, azaz
-et kapjuk. Ez viszont éppen egy λ1 + λ2 paraméterű Poisson-eloszlás generátorfüggvénye.

Hasonlóan két független, azonos p paraméterű n1, illetve n2 rendű binomiális eloszlás összege is binomiális eloszlású
lesz, mégpedig szintén p paraméterrel és n1 + n2 renddel.

A bizonyítás ismét a generátorfüggvények szorzásával megy egyszerűen, hiszen


, s ezzel be is láttuk az összefüggést.
Ezeket az összefüggéseket többször alkalmazva adódik, hogy akárhány független Poisson-eloszlású valószínűségi
változó összege is Poisson-eloszlású lesz a paraméterek összegével mint paraméterrel, valamint hogy azonos p paraméterű
független binomiális eloszlások összege is binomiális ugyanazzal a p paraméterrel, csak a rendek összeadódnak.
Szemléletesen, ha egyszerre húzunk k különböző, de azonos összetételű urnából, és az összes piros húzásokat számoljuk,
akkor az is binomiális eloszlású lesz az összes húzások számával mint renddel és az azonos öszszetételt jellemző p
paraméterrel.

A karakterisztikus függvény
A generátorfüggvények általánosításaként tekinthetjük folytonos eloszlások esetén a karakterisztikus függvényt, amely
nemcsak nem negatív egész értékű valószínűségi változók esetében értelmezett, hanem tetszőleges valószínűségi
változóra. Ennek de níciójával és legfontosabb tulajdonságaival foglalkozunk a következő pontban. Természetesen, mint a
generátorfüggvények esetén tettük, itt is megadjuk a legfontosabb eloszlások karakterisztikus függvényét.

A ξ változó karakterisztikus függvényén az eiξt várható értékét értjük, azaz , ami ha

létezik az f sűrűségfüggvény, akkor tovább egyenlő az alábbi Riemann-integrállal: .

Valójában a karakterisztikus függvény az F(x) eloszlásfüggvény Fourier–Stieltjes-transzformáltja, illetve ha létezik


sűrűségfüggvény, akkor φ(t) az f(x) Fourier-transzformáltja.
Talán a legfontosabb tételek egyike a karakterisztikus függvényekre a következő.

n független valószínűségi változó összegének karakterisztikus függvénye a változók karakterisztikus függvényeinek


szorzata.

Megjegyzés. Az előbbi tétel megfordítása nem igaz, tehát lehet két változó összegének a karakterisztikus függvénye az
egyes változók karakterisztikus függvényeinek szorzata, és a változók nem függetlenek. Lásd ellenpéldaként a Cauchy-
eloszlás karakterisztikus függvénye utáni példát.

Ha a és b konstansok, és ha

(26.1)

Ha az X valószínűségi változó várható értéke létezik, akkor φx(t) di erenciálható, és fennáll, hogy φ′x(0) = iE(X).
Hasonló igaz magasabb momentumokra is.

Egy igen fontos tétel, hogy a karakterisztikus függvényből meghatározhatjuk a valószínűségi változó eloszlását. Ezen
kívül egy konvergenciára vonatkozó tétel következzen még, amelyet majd határeloszlás-tételek bizonyításánál
használhatunk.

Jelölje φ(t) az F(x) eloszlásfüggvény karakterisztikus függvényét, és legyen a és b (a < b) az F(x) eloszlásfüggvény két
folytonossági helye, akkor

(26.2)

Ebből következik, hogy az eloszlásfüggvényt egyértelműen meghatározza a saját karakterisztikus függvénye.

A következő tétel a sűrűségfüggvény előállításáról szól, ha ismert a karakterisztikus függvény.


Ha φ(t) a ξ valószínűségi változó karakterisztikus függvénye, és létezik a következő integrál: , akkor ξ-

nek van f(x) sűrűségfüggvénye, az folytonos, és az alábbi alakban állítható elő: .

Végül

Az Fn(x) eloszlásfüggvények (n = 1, 2, …) akkor és csak akkor konvergálnak egy F(x) eloszlásfüggvényhez F(x) minden
folytonossági pontjában, ha az Fn(x) eloszlásfüggvények φn(t) karakterisztikus függvényei n → ∞ esetén olyan φ(t)
függvényhez konvergálnak, amely a t = 0 pontban folytonos. Ebben az esetben φ(t) az F(x) karakterisztikus függvénye,
és a φn(t) karakterisztikus függvények konvergenciája minden véges intervallumban egyenletes.

Ennek alapján lehet eloszlásokra vonatkozó konvergenciatételeket karakterisztikus függvény módszerrel vizsgálni és
sok esetben bizonyítani.
Néhány fontos eloszlás karakterisztikus függvénye következik, melyeket levezetés nélkül megadunk, az olvasó
utánaszámolhat vagy számos könyvben utána is nézhet.

A standard normális eloszlás karakterisztikus függvénye: .

Általában a μ és σ paraméterű normális eloszlás karakterisztikus függvénye: .

Az exponenciális eloszlás karakterisztikus függvénye:

A karakterisztikus függvények és a valószínűségi változók összege közötti kapcsolatot leíró tétel miatt az is azonnal

adódik, hogy n független azonos eloszlású exponenciális változó összege ξn egy n-edrendű várható értékű Γ-eloszlás,

aminek a karakterisztikus függvénye: , hiszen a karakterisztikus függvények szorzódnak független


változók összege esetén.
A karakterisztikus függvény is megadja a valószínűségi változót, hasonlóan a generátorfüggvényhez, lásd a (26.2)
összefüggést, így ebből következik, hogy

az n és λ paraméterű Γ-eloszlás karakterisztikus függvénye:

Az egyenletes eloszlás karakterisztikus függvénye:

A Cauchy-eloszlás karakterisztikus függvénye: .

Megjegyezzük, hogy ebből következik a karakterisztikus függvények és a valószínűségi változók összege közötti
kapcsolatot leíró tétel megfordításának legegyszerűbb ellenpéldája. Legyen ξ1 = ξ2, ekkor ξ1 + ξ2 = 2ξ1, amelynek
karakterisztikus függvénye (26.1) összefüggés szerint (a = 2 és b = 0 mellett) éppen , azaz éppen a
két azonos változó karakterisztikus függvényeinek szorzata. Mégis biztosan nem függetlenek, hiszen önmagától semmi
nem lehet független, éppenséggel ez a maximális függőség esete.

Megjegyzés. Független Cauchy-eloszlások átlaga ismét Cauchy-eloszlás, hiszen karakterisztikus függvénye ugyanaz.

Az n szabadsági fokú χ2-eloszlás karakterisztikus függvénye:

Alkalmazásként megmutatunk néhány fontos, normális eloszlású változókra érvényes tételt, ahol a bizonyítás a
karakterisztikus függvények segítségével és sok más, olykor igen mély, analízisbeli segédeszköz felhasználásával történik.
A bizonyítások igen hosszadalmasak (lásd például Rényi A.: Valószínűségszámítás. Tankönyvkiadó, Budapest, 1973, 271–
295.), itt lemondunk róluk.

Ha ξ és η független azonos eloszlású és véges szórású valószínűségi változók, továbbá ξ + η és ξ – η függetlenek, akkor ξ
és η eloszlása is normális.

Ez a tétel Bernsteintől származik, és karakterizálja a normális eloszlást, hiszen ha ξ és η független, normális eloszlású
változók, akkor ξ + η és ξ – η is függetlenek. A fenti tétel szerint ez megfordítható, tehát akkor és csak akkor típusú állítás.
Továbbá igaz az alábbi két tétel is.

Legyenek ξ és η független azonos eloszlású valószínűségi változók 0 várható értékkel és véges szórással! Tegyük fel,

hogy eloszlásfüggvénye megegyezik ξ és η közös eloszlásfüggvényével! Akkor a ξ és az η normális eloszlású.

Ha ξ és η független valószínűségi változók, továbbá ξ + η normális eloszlású, akkor ξ is és η is normális eloszlású.

Például, ha két különböző irányból érkező folyó összefolyik, és azt tapasztaljuk, hogy az év adott időpontjaiban a
közös szakaszon mért vízállás normális eloszlású, és valamiért elfogadható az a feltételezés, hogy függetlenek a
folyók vízállásai (más területről jönnek), akkor a két folyó korábbi szakaszain is normális eloszlású lesz a vízállás.
Konkrétan a Duna Budapesten és a Tisza Szegeden mért vízállását nem ismernénk, de a Duna Titel után valahol
mért vízállása normális, akkor erre következtethetünk Budapesten és Szegeden is persze a megfelelő idővel korábbi
vízállásokra (ami a folyók sebességétől függ).

Sorozatunk első tétele messzemenően általánosítható:

Ha a ξ1, ξ2, …, ξr valószínűségi változók függetlenek, az a1, a2, …, ar, b1, b2, …, br számok 0-tól különbözőek, továbbá

és az valószínűségi változók egymástól függetlenek, akkor ξ1, ξ2, …, ξr normális


eloszlású valószínűségi változók.

Végezetül említsünk meg egy utolsó karakterizációt a normális eloszlásra.

Legyenek a ξ1, ξ2, …, ξn valószínűségi változók függetlenek és azonos eloszlásúak, és legyen várható értékük és
szórásuk. A ξ1, ξ2, …, ξn valószínűségi változók akkor és csak akkor normális eloszlásúak, ha

függetlenek.

26.8. A nagy számok törvényei


A nagy számok gyenge törvényei
Nagy számok erős törvényei

A nagy számok gyenge törvényei


Az első ilyen törvény még Bernoulli nevéhez fűződik. Ez a relatív gyakoriság és a valószínűség kapcsolatáról szól nagy
számú kísérlet esetén. Lényegében ez ad lehetőséget ismeretlen valószínűségek „kísérleti úton” való becsléséhez (lásd a
27.6. fejezetet).
A gyakoriság tekinthető binomiális eloszlásúnak, s mielőtt az első ilyen tételt bizonyítanánk, két egyenlőtlenséget
nézünk, amelyek általában valószínűségi változókra igazak.

Legyen X egy nem negatív valószínűségi változó, amelynek létezik véges várható értéke, amit jelöljünk m-mel,

valamint egy λ > 1 valós szám! Ekkor a következő, Markovról elnevezett egyenlőtlenség fennáll: .

A bizonyítás egyszerű, a várható érték fogalmán és egy nagyon durva becslésen alapul. Azért, hogy ne kelljen
szétválasztani a diszkrét és a folytonos esetet, eloszlásfüggvény szerinti integrállal fogunk dolgozni.

ahonnan egyszerűen adódik a bizonyítandó állítás. Ebből viszont levezethető a következő, Csebisevről elnevezett
egyenlőtlenség.

Legyen X valószínűségi változó, amelynek létezik mind a várható értéke, mind a szórása. Ekkor igaz, hogy

Az igazoláshoz elegendő a Markov-egyenlőtlenséget használni a nem negatív értékű (X–E(X))2 változóra, melynek

várható értéke éppen D2(X), azaz Markov szerint: , amiből azonnal adódik az állítás
egy négyzetgyökvonással a nagy zárójelen belül.

Megjegyzés. A magyarul Markov-egyenlőtlenségnek nevezettet Csebisev, míg a Csebisevről elnevezettet éppen


Markov bizonyította.

Ha ezt az egyenlőtlenséget alkalmazzuk a binomiális eloszlásra, akkor megkapjuk az első nagy számok törvényét,
melyet Bernoulli jóval komplikáltabban bizonyított.

Nagy számok (gyenge) törvénye I.

, ahol k a p valószínűségű esemény gyakorisága az n független kísérlet során, míg δ


tetszőleges pozitív valós szám.

Először szorozzunk be n-nel, majd emeljünk négyzetre, akkor kapjuk, hogy a következő egyenlőtlenséget kell
belátnunk:

Mivel a gyakoriság binomiális eloszlású éppen np várható értékkel és np(1 – p) szórásnégyzettel, ezért a Csebisev-
egyenlőtlenség szerint igaz lesz, hogy

Ha most a λ2p(1 – p) = nδ2 egyenlőséget vesszük, akkor a Csebisev-egyenlőtlenség szerint adódik .

Ha még felhasználjuk, hogy , akkor a bal oldalon egy p-től független mennyiséget kapunk, tehát ha

nem ismerjük a valószínűséget, akkor is tudjuk becsülni az eltérést a egyenlőtlenséggel.


Ennek jelentése a következő. Bármilyen kicsi számot is választunk δ-nak, lehet olyan nagyon nagy n értéket venni,
hogy nδ2 is elég nagy legyen, s akkor a reciproka kicsi. Ezt úgy is meg lehet fogalmazni, hogy a relatív gyakoriság a
valószínűséget elég nagy kísérletszám esetén nagyon nagy valószínűséggel tetszőlegesen megközelíti. Ez azonban nem
keverendő össze az analízisbeli konvergenciával. Csak az ún. sztochasztikus konvergenciát láttuk be, ami éppen a fentit
jelenti. (Lásd még nagy számok erős törvényei.)

Példák
1. Hányszor kell feldobni egy dobókockát ahhoz, hogy a 6-os dobás relatív gyakorisága és a valószínűség eltérése
kisebb legyen, mint 0,01 legalább 0,95 biztonsággal?

Válasz: Ez azt jelenti, hogy δ = 0,01 és , ahonnan n ≥ 50 000, tehát 50 000 dobás esetén biztosan
teljesül a feltétel. Ha a pontosabb egyenlőtlenséggel számolunk, akkor feltéve a kocka szabályosságát p = 1/6, tehát

, azaz ekkor n ≥ 27 778, azaz pontosabb számítás szerint elegendő ennyi dobás. Majd később a
centrális határeloszlás tétele segítségével még kisebb érték fog adódni, mivel a Csebisev-egyenlőtlenség bizonyos
esetekben durva felső becslés.
2. Mennyire becsüli 0,95 biztonsággal annak az eseménynek a valószínűségét, amely egy 2000 terjedelmű
kísérletsorozatban 743-szor következett be?

Válasz: Ez azt jelenti, hogy most csak a egyenlőtlenséget tudjuk használni. Ebből n =
2000, és a hányados értéke 0,05-nek vehető, mivel 0,95 a biztonság, hogy az eltérés kisebb, mint δ. Ebből adódik,

hogy δ = 0,05. Azaz a valószínűség eszerint a relatív gyakoriságtól 0,95 biztonsággal legfeljebb
0,05-tel tér el, tehát becslésünk szerint [0,3215, 0,4215] intervallumba esik.

Mielőtt általánosítanánk tetszőleges eloszlású valószínűségi változókra, fogalmazzuk meg a már szerepelt
sztochasztikus konvergencia fogalmát.

Azt mondjuk, hogy az X1, X2, X3, …, Xn, … valószínűségi változók sorozata sztochasztikusan konvergál egy X
valószínűségi változóhoz, ha minden pozitív ϵ számra teljesül, hogy . Jelölése
vagy egyszerűen Xn ⇒ stX.

Ezzel a jelöléssel a Bernoulli-törvény úgy is megfogalmazható, hogy , azaz a relatív gyakoriság


sztochasztikusan a valószínűséghez konvergál. Ezután már megfogalmazható a nagy számok egy általánosabb gyenge
törvénye.

Nagy számok (gyenge) törvénye II.


Legyenek X1, X2, X3, …, Xn, … független azonos eloszlású valószínűségi változók E(Xi) = m várható értékkel és D(Xi) = σ

szórással, akkor az valószínűségi változó sztochasztikusan 0-hoz tart, mivel teljesül a


következő összefüggés:

Ez tovább általánosítható azzal, hogy a változók nem azonos eloszlásúak, de függetlenek, és mindegyiknek létezik a
várható értéke és korlátos a szórásnégyzetek összege.

Legyenek X1, X2, X3, …, Xn, … független valószínűségi változók rendre mi várható értékkel és σi szórással. Ha a

sor konvergens, akkor a változó sztochasztikusan 0-hoz tart, ami a következő

egyenlőtlenség fennállása miatt igaz: .

Nagy számok erős törvényei


A következőkben mélyebb eszközök segítségével megmutatjuk, hogy mértékben is tart a relatív gyakoriság a
valószínűséghez. Ehhez fontos eszközök az ún. Borel–Cantelli-lemmák.

1. Borel–Cantelli-lemma: Ha megszámlálhatóan végtelen sok Ai (i = 1, 2,…, n, …) eseményre teljesül, hogy a


sorozat (n = 1, 2, …) korlátos, akkor 1 annak a valószínűsége, hogy az Ai események közül egyszerre csak véges sok

következik be. Formálisan, legyen esemény. Ekkor P(A) = 1.

Megjegyzés. Az A halmaz egy szokásos jelölése: . A lemma igazolása egyszerű, mivel,

és a jobb oldal 0-hoz tart, hiszen ha egy pozitív sor korlátos, akkor konvergens is, és a
sorozat ún. farka 0-hoz tart (lásd még a 16. fejezetet). Tehát P(A) = 0.

2. Borel–Cantelli-lemma: Ha A1, A2, …, An, … totálisan független események, és , akkor az előző


lemmában de niált A eseményre P(A) = 1.

Az igazoláshoz csak a következőt jegyezzük meg, a részleteket az olvasóra bízva.

Mivel , ezért elég belátni, hogy , mivel ebből adódik, hogy P(Ā) = 0, amiből pedig
az állítás. Ez viszont a következők miatt igaz:

Felhasználtuk, hogy az események totálisan függetlenek egymástól. Az utolsó tag viszont 0-hoz tart, mivel

.
A két lemma összefoglalva és kicsit gyengítve a következőt mondja ki. Ha az események totálisan függetlenek, akkor a

sor konvergens vagy divergens voltától függően P(A) = 0 vagy P(A) = 1. Ennek általánosítása lesz a „nulla vagy
egy törvény” (lásd még Kolmogorov 0 vagy 1 törvényét). Fogalmazzuk meg ezután a fejezet fő tételét.

Legyenek X1, X2, X3, …, Xn, … teljesen független, egyforma eloszlású valószínűségi változók, s tegyük fel, hogy létezik a

várható értékük és a szórásuk: E(Xn) = M és D(Xn) = D. Legyen .

Ekkor .
Az állítást a nagy számok erős törvényének mondják, mivel ebből következik a gyenge törvény, fordítva viszont nem,
tehát ez tényleg többet mond, innen az elnevezés.

Két, Kolmogorovtól származó általánosítást említünk még meg kitekintésképpen.

Legyenek X1, X2, X3, …, Xn, … teljesen független valószínűségi változók, melyeknek létezik a várható értéke E(Xn) = Mn,
és a szórása D(Xn) = Dn.

Ezenkívül tegyük fel, hogy a sor konvergens. Ekkor az valószínűségi változókra

Azaz ebben az egyforma eloszlás feltételt sikerült ejteni.


Egy másik tétel az egyforma eloszlású valószínűségi változók átlagára vonatkozik, ha létezik a közös várható értékük,
és ekkor nem kell a szórás létezését sem feltenni.

Legyenek X1, X2, X3, …, Xn, … teljesen független, egyforma eloszlású valószínűségi változók! Az
valószínűségi változók egy C konstanshoz tartanak pontosan akkor, ha létezik E(Xn) = M, s ekkor C = M;

.
Ez a tétel azt jelenti, hogy a nagy számok erős törvényében a szórásokra vonatkozó feltevés ejthető, a szórás létezése
nélkül is igaz az 1 valószínűségű konvergencia.
A továbbiakban még megemlítjük, hogy a nagy számok erős törvényei is tovább élesíthetők, az egyik ilyen az iterált
logaritmus tétele.

Legyenek X1, X2, X3, …, Xn, … korlátos, teljesen független, egyforma eloszlású valószínűségi változók! Legyenek E(Xn)
= M, és D(Xn) = D, valamint de niáljuk az Yn valószínűségi változót a következő egyenlőséggel:

Befejezésül két további tétel, amelyek ismét csak Kolmogorovtól származnak.

Kolmogorov 0 vagy 1 törvénye. Legyenek A1, A2, …, An, … teljesen független események sorozata; jelöljük J(n)-nel az An
… mindegyikét tartalmazó legszűkebb σ-algebrát, és legyen B egy olyan esemény, amelyik mindegyik J(n) σ-
+ 1, An + 2,
algebrában benne van! Ekkor P(B)(1 – P(B)) = 0, azaz P(B) = 0 vagy 1.

Kolmogorov háromsor tétele. Legyenek X1, X2, X3, …, Xn, … teljesen független valószínűségi változók, és legyen K
tetszőleges adott pozitív szám. Értelmezzük az valószínűségi változókat a következőképpen:

A sor pontosan akkor konvergens 1 valószínűséggel, ha a következő három sor konvergens minden K-ra:

1.

26.9. Nevezetes határeloszlás-tételek


A téma első tétele megmutatja, hogy miért olyan gyakori a normális eloszlás a legkülönbözőbb alkalmazásokban. Ha sok
kis hatás összegződik, akkor nagyon gyakran normális (vagy legalábbis azzal jól közelíthető) eloszlás adódik az összegre.
Gauss volt az első, aki a hibaanalízis vizsgálatakor rábukkant erre.

Centrális határeloszlás-tétel. Legyenek X1, X2, X3, …, Xn, … azonos eloszlású, egymástól független valószínűségi

változók, ismert m várható értékkel, illetve σ szórással! Ekkor az alábbi változó a


standard normális eloszláshoz konvergál, azaz ha n tart a végtelenbe, akkor ∀z ∈ R esetén teljesül a globális alakja a
tételnek:

Ennek a tételnek igen nagy jelentősége van a matematikai statisztikában is, ahol a becsléselméletben nevezetes
eloszlások a t-, a χ2-vagy az F-eloszlás közelíthető lesz a normális eloszlással, amelynek értékeit nagy pontossággal
ismerjük, s ezt fel fogjuk tudni használni a centrális határeloszlás-tétel miatt. Jóval előbb bizonyítottak már egy fontos
tételt, amely a binomiális eloszlásra vonatkozott, és azt mondta ki, hogy a binomiális eloszlás nagy n-re konvergál a
normális eloszláshoz. Ezt a felfedezőiről nevezték el.

A Moivre–Laplace-tétel lokális alakja:

a Moivre–Laplace-tétel globális alakja:


Ennek bizonyítása eredetileg a Stirling-formula segítségével történt, mi azonban mondhatjuk, hogy a centrális
határeloszlás-tétel egy speciális esete miatt érvényes az állítás második része. Hiszen a binomiális eloszlás azonos eloszlású
karakterisztikus valószínűségi változók összegének fogható fel, így rögtön adódik a centrális határeloszlás-tétel
alkalmazásaként az eredmény.

A matematikai statisztika alaptétele

A matematikai statisztika alaptétele


Glivenko bizonyította, hogy egy nagy elemszámú mintából származó empirikus eloszlásfüggvény konvergál mindenütt
egyenletesen a sokaság elméleti eloszlásfüggvényéhez. Ehhez először egy fogalom.

Legyen adott egy X valószínűségi változó, ismeretlen F-eloszlásfüggvénnyel! Végezzünk n meg gyelést, melyek
mindegyike egy-egy realizációja az X-nek, azaz az X1, X2, X3, …, Xn egymástól független valószínűségi változók, azonos

F-eloszlásfüggvénnyel. Legyen , tehát azon valószínűségi változók száma, amelyek kisebbek egy
megadott x értéknél osztva a meg gyelések számával (minta elemszáma). Az így megadott Fπ(x) függvényt empirikus
eloszlásfüggvénynek vagy a minta tapasztalati eloszlásfüggvényének mondjuk.

Ezzel megfogalmazhatjuk már Glivenko tételét.

Glivenko tétele. Legyenek az X1, X2, X3, …, Xn egymástól független valószínűségi változók, azonos F-
eloszlásfüggvénnyel! Ha Fn(x) az előző de nícióban megadott tapasztalati eloszlásfüggvény, akkor 1 valószínűséggel
igaz, hogy Fn(x)e → F(x), ahol e → jelöli az ún. egyenletes konvergenciát, azaz ha

Említsünk meg még egy, a multinomiális eloszlásra vonatkozó határeloszlástételt. Emlékeztetünk, hogy az X = (X1, X2,
…, Xn) vektorváltozót akkor nevezzük multinomiális eloszlásúnak, ha

ki: 1 ≤ i ≤ r nem negatív egész számok azzal a


feltétellel, hogy összegük N.

Legyen X1, X2, …, Xi multinomiális eloszlású N és p1, p2, …, pr paraméterekkel, feltéve, hogy pi > 0 minden 1 ≤ i ≤ r-re.

Ekkor a valószínűségi változó N → ∞ esetén , azaz egy r – 1 szabadsági fokú χ2-eloszláshoz


konvergál.

26.10. Korreláció, regresszió


Egy fontos kérdés a valószínűségi változók kapcsolata. A valószínűségi változók függetlenségét már de niáltuk (a 26.4.
fejezetben), most a függőség mértékét szeretnénk valahogyan de niálni.
Két valószínűségi változó kovarianciáját a következőképpen de niáljuk.

Az X és Y változók kovarianciája az E(XY) – E(X)E(Y) különbség.

Mint tudjuk, ha függetlenek, akkor ez a mennyiség 0, de fordítva, ha 0, nem feltétlenül függetlenek.

Példa. Legyen két diszkrét változónk X és Y a következő együttes eloszlással adva:

Y↓ X → 0 1 2 Y peremeloszlása

0 0,1 0,2 0,1 0,4

1 0,2 0,2 0,2 0,6

X peremeloszlása 0,3 0,4 0,3


Ekkor látható, hogy nem függetlenek, hiszen például P(X = 2, Y = 1) = 0,2 ≠ 0,3 · 0,6 = P(X = 2)P(Y = 1). Másrészt viszont
korrelálatlanok, hiszen E(X) = 0,4 · 1 + 0,3 · 2 = 1, E(Y) = 0,6 · 1 = 0,6, tehát E(X)E(Y) = 0,6, míg E(XY) = 0,2 · 2 + 0,2 · 1 =
0,6, azaz E(XY) – E(X)E(Y) = 0 fennáll. Azaz a kovariancia 0, és nem függetlenek.
Megjegyzés. Nem túl meglepő, hogy a kovariancia gyengébb jóval a függetlenségnél, amely még véges változóknál is
rengeteg összefüggés teljesülését jelenti, míg a kovariancia mindössze egyetlen egyenletét. Azaz jóval kevesebbet
követelünk meg. Emiatt persze sok tétel élesebben kimondható, ha nem függetlenséget, csak 0 kovarianciát
követelünk meg.

A kovariancia normálásával kapjuk a korrelációt, melyről belátható, hogy csak –1 és 1 közötti értékeket vehet fel.

Az X és Y valószínűségi változók korrelációján, jelölése r(X, Y), a következő számot értjük:

Ahogyan a kovarianciánál már említettük, a korreláció lehet 0, ha nem függetlenek a változók. Egy lehetséges
általánosítása a függetlenségnek, ha csak annyit követelünk meg, hogy a korrelációjuk legyen 0.

Két változót, X-et és Y-t korrelálatlannak mondunk, ha r(X, Y) = 0.

Természetesen ha X és Y függetlenek, akkor korrelálatlanok is, fordítva azonban nem. Szokás még gyengén
korreláltnak mondani két változót, ha a korrelációjuk abszolút értéke kisebb, mint 0,3, és erősen korreláltnak mondani, ha
abszolút értéke 0,7-nél nagyobb.

Példa. Vegyük az alábbi két változót, melynek együttes eloszlását a következő táblázat tartalmazza:

X ↓ / Y→ 1 2 3 4 ∑

1 0,1 0,05 0,25 0,2 0,6

2 0,05 0,1 0,15 0,1 0,4

∑ 0,15 0,15 0,4 0,3 1

Számoljuk ki a két változó korrelációját! Ehhez a várható értékek és a szórások mellett még a szorzatuk várható
értéke is kell. Egyszerű számolással adódik, hogy E(X) = 1,4; E(Y) = 2,85; D(X) ≈ 0,49; D(Y) ≈ 1,01; végül E(XY) = 3,85.
Ezzel a korrelációjuk r ≈ –0,28. Azaz gyengén korrelált a két változó.

Ha X és Y két valószínűségi változó, melyek négyzeteinek létezik a várható értéke, akkor fennáll a következő

egyenlőtlenség:

Bizonyítása azon múlik, hogy bármely λ valós szám esetén (X – λY)2 ≥ 0, tehát

akkor adódik, hogy

, amiből már azonnal adódik az állítás. Ebből viszont következik, hogy |r(X, Y) | ≤ 1.
Amennyiben a két változó korrelációja 1 vagy – 1, akkor szokás lineáris kapcsolatról beszélni, mivel ilyenkor egy
lineáris összefüggés áll fenn a két változó között. Előbb a fordítottját mutatjuk meg.

Ha Y = bX + a, ahol a és b valós számok, míg X és Y két valószínűségi változó, akkor r(X, Y) = +1, ha b > 0, és ha b < 0,
akkor –1. Ha b = 0, akkor nincs értelmezve a korreláció.

Igazolása elég egyszerű, hiszen ha felírjuk, hogy mi a korreláció ebben az esetben, akkor

kapjuk, ami pedig b előjelétől függően +1


vagy –1. Illetve nincs korreláció, ha b = 0, mivel ekkor Y konstans, s a szórása 0, ami nem állhat a nevezőben.
Visszafelé is igaz a következő.

Ha | r(X, Y) | = 1, akkor léteznek olyan b ≠ 0 és a valós számok, amelyekkel Y = bX + a. Vagyis az egyik változó a másik
lineáris függvénye.
Ez azonban mutatja a korreláció elégtelenségét is, mivel nemcsak lineáris, hanem más függvényszerű kapcsolat lehet a
két változó között, s mégsem lesz a korreláció a maximális függést jelentő ±1, ez is hiányosság, valamint az is, hogy nemcsak
a függetlenség esetén lesz 0. Mégis ezt a jellemzőt használjuk valószínűségi változók függőségének mérésére.
A kovariancia kiszámítására megadunk még két összefüggést, diszkrét és abszolút folytonos esetre.

, ahol pi, illetve qk az X és az Y változó valószínűség-eloszlása, míg


pik az együttes eloszlás valószínűségeit jelölik.

, ahol h(x, y) az együttes sűrűségfüggvényt, míg f(x)


és g(y) a peremsűrűség-függvényeket jelöli.

Ezekből aztán a korrelációt már a szórások szorzatával „normálva” megkaphatjuk.


Befejezésül megemlítjük még az általánosítását több valószínűségi változóra.

Legyenek X1, X2, X3, …, Xn valószínűségi változók, és páronkénti kovarianciáit, illetve korrelációs együtthatóit egy-egy
szimmetrikus mátrixba rendezzük úgy, hogy de níció szerint az átlóban cii = D2(Xi), illetve rii = 1 értékeket írjuk, míg cij
= c(Xi, Xj) (természetesen (cij = cji)), valamint rij = r(Xi, Xj)(rij = rji). Jelölje a kovariancia- és
a korrelációs mátrixát az n változónak.

A D (Xi) = σi jelöléssel igaz lesz, hogy cik = rikσiσk.

Vezessük be az X1, X2, X3, …, Xn valószínűségi változókhoz tartozó szórásmátrixot, S-et a következőképpen:

Így az alábbi összefüggést fogalmazhatjuk meg:

Emellett a következő két tételben fogalmazhatjuk meg ezeknek a mátrixoknak a legfontosabb tulajdonságait (a
fogalmakat lásd a 12. fejezetben).

C és R mindig pozitív szemide nit-mátrixok.

Az alábbi (A), …, (E) állítások ekvivalensek:


A) C pozitív de nit.
B) R pozitív de nit.
C) C determinánsa (határozottan) pozitív.
D) R deteminánsa (határozottan) pozitív.
E) Az X1, X2, X3, …, Xn valószínűségi változók lineárisan függetlenek, vagyis nincsenek olyan a1, a2, …, an valós
számok, melyek közül legalább egy 0-tól különböző, és P(a0 + a1X1 + …+ anXn = 0) = 1.

Még egy további fogalom, amely a kétdimenziós esetben bevezetett fogalmak általánosításaként fogható fel.

Az R mátrix |R| determinánsának négyzetgyökét szóródási együtthatónak szokás nevezni.

Nem nehéz belátni, hogy a kovarianciamátrix determinánsa nem nagyobb az egyes szórásnégyzetek szorzatánál, azaz
. Másrészt igaz a C = SRS összefüggés miatt, hogy .
Tehát mivel , ezért |R| ≤ 1 mindig teljesül. Azaz a szóródási együttható is mindig 0 és 1 között lesz,
mivel nem negatív. Ha 0, akkor a valószínűségi változók lineárisan függőek, másrészt, ha 1, akkor és csak akkor a
valószínűségi változók korrelálatlanok. Azaz a szóródási együttható azt méri, hogy milyen erős a valószínűségi
változók lineáris függetlensége. Speciálisan ha az n = 2 esetben az r12 = r21 = r jelölést vezetjük be, akkor

, így a szóródási együttható .


Kétváltozós regresszió

Kétváltozós regresszió
Tegyük fel, hogy van két valószínűségi változónk, X és Y, s az Y értékét akarjuk valahogyan becsülni X értéke alapján. Mint
a statisztikai következtetéseket általában, ezt is megelőzi valamilyen elméleti megfontolás, melynek részeként valamilyen
függvénykapcsolatot feltételezünk a két mennyiség között. Azaz megpróbáljuk Y-t X valamilyen függvényeként tekinteni,
azaz Y ~ f(X)-ből indulunk ki. Az alapvető kérdés, hogy minek alapján írjunk fel egy ilyen függvényt. Ha csak az Y
változóval volna dolgunk, akkor leginkább a várható értékével becsülnénk. Mivel azonban X is rendelkezésünkre áll, ezért
célszerűnek tűnik az E(Y|X) feltételes várható értéket használni. (Lásd még a 26.4. fejezetben.)

Az y = E(Y|X = x) függvényt az Y változó X-re vonatkoztatott regressziójának nevezzük.

Példák
1.
Legyen az együttes eloszlása a két diszkrét, független Poisson-eloszlású változónak:
. Ekkor az Y X-re vonatkoztatott regressziója, ha X = i:E(Y|X = i) = μ.
2. Másik példánk legyen egy folytonos eset: (X, Y) normális eloszlású vektorváltozó az alábbi együttes

sűrűségfüggvénnyel: , ahol E(X) = m1, D(X) = σ1, E(Y)


= m2, D(Y) = σ2, és r jelöli a két változó korrelációs együtthatóját. Ekkor az X sűrűségfüggvénye (peremsűrűség!)

. Az Y változó X szerinti feltételes sűrűségfüggvénye szerint:

Ez rögzített x és változó y mellett egy várható értékű és szórású normális eloszlás

sűrűségfüggvénye, amiből következik, hogy . Azaz az Y változó

X-re vonatkoztatott regressziója egy egyenes, melynek meredeksége . Ez csak akkor 0, ha X és Y


függetlenek, és ekkor egy x tengellyel párhuzamos egyenes a regressziós görbe.

Általában is a regressziót, mint függvényt, egy görbével ábrázolhatjuk. Függetlenül attól, hogy a két változó közötti
kapcsolat lineáris függvény-e, lehet, mint az analízisben a di erenciálszámításnál, valamilyen értelemben legjobban
illeszkedő lineáris kapcsolatot keresni a két változó között. Szokás ezt lineáris regressziónak is mondani. Ennek lényege,
hogy keressük azt az Y = bX + a alakú kapcsolatot, amelyre igaz, hogy E((Y – bX – a)2) várható érték minimális. Konkrét
alkalmazását adott adatok esetén megtalálja az olvasó a 27.5. fejezetben a Lineáris regresszió és korreláció cím alatt. Itt
most csak megjegyezzük, hogy megmutatható, hogy az a lineáris függvény, amely legjobban illeszkedik a két változóhoz, a
feljebb említett minimális várható érték értelemben a következő:

Azaz a keresett b meredekség és a konstans meghatározható a két változó várható értékeivel, szórásaival és korrelációs

együtthatójukkal az alábbi két egyenlőséggel:


Megjegyezzük, hogy amíg normális eloszlás esetén ez a lineáris kapcsolat az összes lehetséges függvény közül
optimális, addig általában két tetszőleges változó esetén csak a lineáris függvények közül illeszkedik a fenti a legjobban, de
más függvények lehetnek jobbak, ezt nem tudjuk.
Lehetne még beszélni több változó esetén is regresszióról, de ez meghaladja jelen könyvünk kereteit.

26.11. Egyszerű véletlen folyamatok matematikai leírása


Igen gyakran fordul elő olyan szituáció a mindennapi életben is, ahol egy rendszer bizonyos állapotok között „bolyong”
véletlenszerűen, de úgy, hogy a következő állapota csak az előzőtől függ. Az ilyen rendszerek vizsgálatával foglalkozunk
ebben a fejezetben. Tekintsük a következő egyszerű példát! Ketten játszanak, az A-val, illetve a B-vel jelölt játékos. A
játékosnak 1 eurója, míg B-nek 4 eurója van. A játék úgy zajlik, hogy mindketten letesznek 1-1 euró tétet, s feldobnak egy
pénzérmét. Ha a kimenetel fej, akkor A, ha írás, akkor B nyer, azaz a feltett mindig 2 eurót a nyertes kapja. Mekkora az
esélye, hogy A játékos nyer?
Az állapotokat olyan számpárokkal írjuk le, amelyek a náluk levő pénzt jelölik. Tehát a kezdő állapot (1; 4). Ezután lehet
(0; 5), ilyenkor A vesztett, vagy (2; 3), ilyenkor folytatódik a játék. Ezután (3; 2), illetve újra a kezdeti (1; 4) állapotba
kerülünk. Az előbbiből (4; 1) vagy ismét (2; 3), végül (5; 0), ilyenkor A nyert, az idejutás esélye a kérdés. Összesen tehát 6
állapot van. Ezek közül kettő (0; 5): „vége, és B nyert”, illetve az (5; 0): „vége, és A nyert” az úgynevezett nyelő állapotok,
mert innen nem lehet kijönni. A maradék négy állapotból folytatódik a játék. Jelöljük az állapotokat rendre aszerint, hogy
A-nak mennyi pénze van, tehát A0-lal (= (0; 5) állapot), A1, …, illetve A5-tel. Jelölje Pij annak a valószínűségét, hogy az i-edik
állapotból átlépünk a j-edik állapotba (i=0, 1, 2, 3, 4, 5, illetve hasonlóan j = 0, 1, 2, 3, 4, 5). Ezeket a számokat tekinthetjük
egy mátrix elemeinek. A mátrixot az átmenetek valószínűségi mátrixának, vagy röviden átmenetmátrixnak mondjuk, és
általában a valószínűségre utalva P-vel jelöljük. Esetünkben a mátrix a következőképpen néz ki:

. A főátlóban két l-es van, ez mindig a nyelő állapotot jellemzi, hiszen ott 1
valószínűséggel maradunk, és sehová nem lépünk, tehát minden más elem a sorban 0. Természetesen minden sor összege
0, hiszen 1 valószínűséggel lépünk valahová tovább (beleértve a helyben maradást is). Mivel a folyamatok nem érnek véget
egy lépésnél, érdekes kérdés, hogy miként írható fel a kétlépéses átmenetmátrix. Jelölje azt a valószínűséget, hogy a
rendszer az i-edik állapotból pontosan két lépésben a j-edikbe jut. Ezt a teljes valószínűség tételével (lásd a 26.3. fejezetben)

adhatjuk meg, nevezetesen , amiről felismerhetjük, hogy éppen az átmenetmátrixunk önmagával vett
szorzatának egy elemét kaptuk. Általában igaz, hogy ha a kétlépéses átmenetvalószínűséget egy mátrixba rendezzük, és
P(2)-vel jelöljük, akkor

P(2) = P2, ahol P jelöli az egylépéses átmenet-valószínűségek mátrixát, míg a bal oldalon álló P(2) a kétlépéses átmenetek
mátrixát.

Illetve általában, ha az n lépéses átmenetmátrixot P(n)-nel jelöljük, akkor

P(n) = P(n–1). P = P(n–2) · P2 = … = Pn, ahol P az egylépéses átmenetmátrixot jelöli.

Mivel a kezdeti állapot az A1, s a számunkra érdekes végállapot az A5, ezért arra vagyunk kíváncsiak, hogy vajon n
lépésben mekkora eséllyel jutunk el oda, ezt a P(n) mátrix második sorának utolsó eleme mutatja meg. Amennyiben n tart a
végtelenbe, akkor megkapjuk az A nyerésének a keresett valószínűségét. Ezt egy gra kus számológéppel eljátszva már
viszonylag kis n-ek esetén is (pl. n = 100 vagy 200) láthatóan stabilizálódik az érték, és 0,2 közelében lesz. Majd a
későbbiekben belátjuk, hogy az átmenetmátrix n-edik hatványa milyen feltételek mellett konvergál, s ez esetünkben
teljesül is.
Előbb azonban gondoljunk végig egy másik utat is, amelyik a végtelent ügyesen kizárja a játékból. Jelöljük pi-vel, hogy
az i-edik állapotból az A játékos nyer. Ekkor nyilván p0 = 0. A p1 meghatározása a kérdésünk. A következő egyenleteket
írhatjuk fel:
p1 = 0,5p2 + 0,5 · 0
p2 = 0,5p3 + 0,5p1
p3 = 0,5p4 + 0,5p2
p4 = 0,5p5 + 0,5p3
p5 = 1
innen az első egyenletből p2 = 2p1, a másodikból, ezt is felhasználva p3 = 3p1; a harmadikból p4 = 4p1, végül a negyedikből p5
= 5p1. Másrészt az ötödik egyenletből p5 = 1, tehát a keresett p1 értéke 1/5 (= 0,2). Tehát az A játékos 1/5 eséllyel nyer. Vegyük
észre, hogy a nevező éppen az összes pénzük, míg a számláló éppen A pénze. Bebizonyítható a következő tétel.

Egy kétszemélyes játékban, feltéve, hogy minden körben egyenlő eséllyel nyer a két játékos, és mindig egy egységnyit

tesznek fel, valamint az elsőnek T1, a másodiknak T2 a tőkéje (pénze), akkor az első játékos nyerési esélye ,

míg a másiké , azaz a döntetlen esélye hosszú távon 0.

Megjegyzés. Mohó stratégiával más a helyzet, ha A mindig minden pénzét felteszi, akkor csak a következő állapotok
lehetnek (1; 4), (2; 3), (4; 1) és (5; 0). Ilyenkor 1/8 eséllyel nyer, mert háromszor egymás után nyernie kell, hiszen ha
csak egyszer veszt, akkor mindene elveszett, azaz vége a játéknak. Tehát 0,2 helyett ekkor csak 0,125 a nyerés esélye.

Fogalmazzuk meg a továbbiakban általánosan is a fenti példa sajátosságait.

Ha van egy rendszer, amelynek A1, A2, …, An állapotai vannak, és tudjuk, hogy két A1-vel és Aj-vel jelölt állapot között
milyen valószínűséggel lehet átmenet – amely független a rendszer addigi történetétől –, amit pij-vel jelölünk, akkor
ezen átmenet-valószínűségeket egy mátrixba rendezhetjük, amelyet P-vel jelölünk, és átmenetmátrixnak hívjuk.
Tehát . Az ilyen rendszereket homogén Markov-láncoknak nevezzük.

Legyen továbbá az n lépéses átmeneteket jelölő valószínűségek mátrixa P(n), ahol értelemszerűen P(1) = P.

Ekkor megfogalmazható a korábban már szereplő tétel: P(n) = Pn.

Ha egy mátrix elemei nem negatívak, és minden sor összege 1, akkor azt a mátrixot sztochasztikus mátrixnak
mondjuk. Ha még az oszlopok összegei is 1-et adnak, akkor duplán sztochasztikus mátrixról beszélünk.

Megjegyzés. Természetesen minden sztochasztikus mátrix tekinthető egy átmenetmátrixnak, azaz készíthető hozzá
egy rendszer, melynek állapotai közötti átmenet-valószínűségeket adják a sztochasztikus mátrix elemei.

Be lehet látni, a következő tételt.

Két (duplán) sztochasztikus mátrix szorzata is (duplán) sztochasztikus.

Ha a kezdeti állapot is véletlenszerű, akkor azt egy valószínűségi vektorral adhatjuk meg, amely megmondja, hogy
milyen eséllyel tartózkodunk az egyes állapotokban. Ezt a vektort jelöljük p = p(0)-lal. Természetesen, ha biztosan tudjuk,
honnan indulunk, akkor a vektor egy koordinátája 1, a többi 0 lesz.

Ha a rendszer kezdeti állapotát a p = p(0) vektor adja meg, akkor egy lépés múlva az eloszlását a p(0)P vektor mint a p
vektor és a P mátrix szorzata adja meg.

Általában pedig n lépés után indukcióval belátható, hogy p(n) = p(0)pn lesz az egyes állapotokban tartózkodás
valószínűség-eloszlása. Így az első feladatunk úgy is megfogalmazható, hogy keressük, ha létezik a vektort. Ezt
tesszük a következő tétel megfogalmazásával. Előtte még egy de níció.

Egy Markov-láncot regulárisnak mondunk, ha átmenetmátrixának van olyan hatványa, ahol minden mátrixelem
pozitív. Legegyszerűbb eset, ha ez már magára az átmenetmátrixra is teljesül.

Ezzel már megfogalmazhatjuk a legfontosabb tételt.

Ha P reguláris átmenetmátrix, akkor a Pn hatványok sorozata konvergál egy V mátrixhoz, melynek minden sora
ugyanaz a v vektor, melynek minden komponense pozitív. Ez a v vektor nem más, mint a P mátrix egyetlen
sajátvektora, azaz vP=v.

Ezt szokás a Markov-láncok határeloszlás-tételének is nevezni. Ebben az esetben azonban nincsenek nyelők, hiszen van
olyan hatvány, ahol mindenhonnan mindenhová nem 0 eséllyel lépünk. Kicsit összetettebb a kezdeti feladatunk, amikor
nyelő is van, tehát nem reguláris az átmenetmátrix. Ennek tárgyalása előtt azonban nézzünk egy példát.

Példa. Vegyük a következő háromállapotú rendszert, amelynek átmenetmátrixa reguláris, mert már maga P minden

eleme pozitív: . Megjegyezzük, hogy P duplán sztochasztikus mátrix, hiszen az oszlopok összege is
1.

Ennek a mátrixnak sajátvektorát a karakterisztikus egyenletből kapjuk meg: ,

amelyből kapjuk, hogy az egyetlen sajátvektor az vektor, tehát hosszú idő után bárhonnan is indulunk,
mind a három állapotban ugyanazzal az 1/3 valószínűséggel található a rendszer. A hosszú idő nem is olyan nagy,
már 20-30 lépés után közel vagyunk az 1/3-hoz.

Folytassuk most a nyelő állapotokat tartalmazó Markov-folyamatokkal, amilyen a bevezető példánk volt.

Egy Markov-lánc egy állapota elnyelő állapot, ha ebből lehetetlen átmenni egy másikba. Egy Markov-láncot elnyelő
láncnak nevezünk, ha
1. van legalább egy elnyelő állapota, és
2. bármely állapotból el lehet jutni valamely elnyelő állapotba (nem feltétlenül egy lépésben).

Azt, hogy a folyamat egy elnyelő állapotba jutott, úgy is fogalmazhatjuk, hogy a folyamat befejeződött.

Elnyelő Markov-láncban a folyamat befejeződésének a valószínűsége 1.

Egy ilyen elnyelő Markov-láncban a következő kérdések vethetők fel:


1. milyen valószínűséggel zárul a folyamat egy megadott elnyelő állapotban;
2. átlagosan hány lépésben fejeződik be a folyamat?
A válaszhoz a következőket tesszük. Az állapotokat úgy számozzuk, hogy az első állapotok legyenek az elnyelők, az
utána levők pedig a nem elnyelők. Ezzel a kezdő feladatunk új mátrixa a következő lesz:

, ami a következő alakban adható meg: (láthatóan a bal felső sarokban


egy egységmátrix, tőle jobbra egy 0 mátrix). Könnyen látható, hogy ennek a mátrixnak a hatványai hasonló formájúak,

azaz , ahol a* is egy mátrixot jelöl, de arra nincs szükségünk. Qn elemei adják meg, hogy az egyes nem
elnyelő állapotokból n lépés után milyen eséllyel leszünk egy másik nem elnyelő állapotban. A fenti tétel szerint (hogy az
elnyelő Markov-láncban a folyamat befejeződésének a valószínűsége 1) 1 valószínűséggel elnyelődünk, tehát Qn minden
eleme 0-hoz kell tartson, azaz Qn maga is 0-hoz tart. Ebből viszont következik, hogy az (I–Q)–1 inverzmátrix létezik, amelyet
A-val jelölünk, és az elnyelő lánc alapmátrixának nevezzük. Esetünkben ez az alapmátrix a következő:

A következő tételek válaszolnak az elnyelő Markov-láncokkal kapcsolatos 1. és 2. kérdésünkre, mégpedig sorrendben a


2., majd az 1. kérdésre.

Az A mátrix elemei megadják azoknak az eseteknek a várható számát, amelyekben a lánc az egyes nem elnyelő
állapotokból kiindulva a különböző nem elnyelő állapotokba jut. Továbbá ha e egy csupa l-esből álló oszlopvektort
jelöl, akkor az Aevektor komponensei megadják, hogy a lehetséges nem elnyelő állapotokból várhatóan hány lépés
után fejeződik be a folyamat.

A B = AR mátrix elemei megadják azokat a valószínűségeket, mellyel egy adott nem elnyelő állapotból egy adott elnyelő
állapotba jutunk a folyamat során.

Így megoldottuk ezen az úton is a bevezető feladatunkat, hiszen a B mátrix b32 eleme mutatja meg a keresett
valószínűséget, amire éppen 0,2 adódik, amit már megkaptunk más úton is.
Ezzel befejeztük bevezetőnket a Markov-láncok tanulmányozásába, és egyben végére értünk a valószínűség-számítás
fejezetnek is.
27. Matematikai statisztika
Ez a fejezet sokban kapcsolódik az előzőhöz, amit a középiskolai tantervek és az érettségi követelmények is mutatnak,
hiszen egy témakörnek tekintik a valószínűség-számítást és a statisztikát. A. Engel neves német múlt századi valószínűség-
elméleti szakember fogalmazott egyszer a következőképpen, ami elég tömören, aforisztikusan fejezi ki a lényeget: „A
valószínűség-számításban megadott valószínűségekből különböző módszerekkel újabb valószínűségeket számolunk ki. A
statisztika feladata ezeknek az adott valószínűségeknek a meghatározása.” Érdemes egy kiegészítést tenni – ezzel
kiterjesztve az Engel-idézet tartalmát – s ezt is a matematikai statisztika feladataként tekinteni. Mára a mindennapi élet, a
média, a marketing és társaik a statisztikának ezt a kiegészítő és kisebb matematikai igényű ágát, a leíró statisztikát
fejlesztették nagy ütemben. Ehhez a számítógépek térhódítása és hatalmas adatbázisok létrejötte is hozzájárult, illetve
lehetővé tette, hogy ilyenekkel is tudjunk dolgozni. A következőkben éppen ezzel a témával fogunk kezdeni, s csak a
második részben lesz szó az idézetben említett szigorúbb értelemben vett matematikai statisztikáról, melynek valóban egy
fő feladata ismeretlen valószínűségek, illetve paraméterek becslése, illetve a becslés jóságának a „mérése”.
Végül a statisztika szó különböző jelentéseit vegyük szemügyre. A szó maga a status (állam) szóból származik, ami arra
utal, hogy először az adatokat az állam gyűjtötte (a statisztikai hivatal ma is állami intézmény). Mára három értelemben is
használjuk a szót. Időjárási, gazdasági adatokat, amelyek valójában egyszerűen számok, szokás statisztikának mondani
vagy olykor statisztikai adatokról beszélni e számok kapcsán. A következőkben ilyenkor az adat szót fogjuk használni.
Másrészt ezekből az adatokból különböző módszerekkel jellemzőket készítenek, ezt is szokás statisztikának nevezni, ilyen
például egy munkakörben az átlag zetés, a hőmérsékleti adatok sokéves átlaga vagy az árak szóródása. Erre a statisztikai
jellemzők kifejezést fogjuk használni a következőkben. Harmadrészt statisztikán adatok elemzését, ezekből
következtetések levonását értjük (gyakran a bizonyosság hiánya miatt valószínűségi megfontolásokkal). Igazából ezt a
jelentést fogjuk a következőkben használni. Kicsit általánosabban fogalmazva a statisztika az a tudomány, amely az
adatgyűjtéssel, azok rendszerezésével és interpretációjával foglalkozik.
Fejezzük be ezt a bevezetőt H. G. Wells szavaival: „a statisztikai gondolkozás egy nap éppen olyan szükséges lesz egy
sikeres polgárnak, mint az írni és olvasni tudás.” Azt hiszem ez a nap elérkezett.

27.1. Leíró statisztika, alapfogalmak, mintavétel, adatsokaság


27.2. Adatok szemléltetése, ábrázolása
27.3. Átlag és szórás
27.4. Idősorok
27.5. Összefüggések két ismérv között
27.6. Összetett intenzitási viszonyszámok és indexálás
27.7. A matematikai statisztika alapelvei, hipotézisvizsgálat
27.8. A Bayes-statisztika elemei

27.1. Leíró statisztika, alapfogalmak, mintavétel, adatsokaság


A leíró statisztika tárgya az adatgyűjtés módszerei, az adatok rendszerezése és feldolgozása, illetve szemléltetése, végül
nagy adathalmazok kevés jellemzővel való reprezentálása, amit egyfajta adattömörítésnek is mondhatunk. Először is van
egy vizsgálatba vont csoport.

Ezt a csoportot a statisztika sokaságnak hívja. A sokaság elemei az egyedek. A sokaság elemszámát a statisztikai
sokaság méretének nevezzük.

Ha van egy szempont, egy adott tulajdonság, ami szerint egy sokaságot vizsgálunk, például Veszprém lakóit koruk vagy
nemük szerint szeretnénk osztályozni, akkor a kor vagy a nem lesznek az adott tulajdonságok.

A sokaság elemeinek vizsgált tulajdonságait ismérveknek nevezzük.

Ezután következik az adat fogalma.

Az adat az ismérv egy konkrét megjelenése.


Példák. Veszprém lakói esetén az egyedek Veszprém hivatalosan regisztrált lakosai (az újszülöttektől egészen a
legidősebbekig). A sokaság mérete a város lakosainak száma. Egy ismérv a koruk, mondjuk években mérve. Egy adat,
amennyiben Kiss Elemér 37 éves, a 37 lesz.
Egy adott osztály tanulói legyenek a sokaság elemei. Terjedelem az osztálylétszám. Az ismérv például a matematika
jegyük lehet, adat egy tanuló matematika jegye. Az adatsokaság ezen ismérv szerint az összes tanuló matematika
jegyeinek összessége.

A következőkben vizsgáljuk meg az ismérvek (s ennek megfelelően az adatok) fajtáit. Az ismérv lehet minősítéses,
amikor még ha számmal fejezzük is ki, de mégsem szám jellegű adatról van szó. Ilyen lehet például a nem, a hajszín, egy
városban a kerület megnevezése, ahol lakik valaki. Ezeknek még rendezése sincs, mert nincs közvetlen tartalma annak,
hogy az I. kerület „kisebb” lenne, mint a II. kerület, vagy sokkal kisebb, mint a XXII. kerület. Hasonlóan a nemet sem lehet
sorba rendezni, legalábbis a mai egyenjogú világban.

A nem számmal kifejezhető vagy számmal jelölt, de mégsem szám jellegű ismérveket, minősítéses ismérveknek
nevezzük.

Példák. Az említett nemek vagy „a X. kerületben lakik” ismérvek mellett például ilyen a hord-e kalapot, vagy a
milyen mosóport használ, jár-e moziba, színházba, melyik pártot támogatja stb. tulajdonságok mind minősítéses
ismérvek.

A méréssel meghatározható, számmal jellemezhető ismérveket méréses ismérveknek nevezzük.

Példák. A tanulók testmagassága, kora, tv-nézéssel naponta eltöltött idő, a Duna budapesti vízállása, a reggel mért
hőmérséklet stb. mind méréses ismérvek.

Vannak speciális esetek, amikor egy minősítéses ismérv (akár számmal jellemzett, de nem számként használt)
lehetséges értékei (adatai) rendezhetőek. Például szállodák esetén a * beosztás, van **-os vagy ******-os szálloda. Ilyenkor a
csillagszám kifejez egy rangsort, a magasabb csillagszámú szálloda magasabb minőséget jelent és persze drágább is.
Hasonlóan van I., II. és III. osztályú áru. Itt hasonlóról van szó, ezek nem „számok” valójában, de egy rendezést azért
tartalmaznak.

Az olyan minősítéses ismérvet, amelynek adatai rendezhetők rendezhető minősítéses ismérvnek hívjuk.

Természetesen minden méréses ismérv egyben rendezhető is, mert a számoknak van egy megszokott rendezése, lásd a
számegyenest. Sok ismérv esetén azonban még rendezés sem képzelhető el. Pártpreferencia, hajszín, kedvenc zeneszerző
stb. A méréses ismérveknek létezik még egy osztályozása aszerint, hogy értékei egy véges vagy megszámlálhatóan végtelen
számhalmazból kerülnek ki, avagy bármilyen valós szám lehet.

Azokat a méréses ismérveket, amelyekhez tartozó adatok értékei egy legfeljebb megszámlálható számhalmaz elemei
közül kerülnek ki, diszkrét ismérveknek, illetve a hozzátartozó adatokat diszkrét adatsokaságnak mondjuk.
Ha az értékek nem megszámlálható halmazból kerülnek ki (valós vagy komplex számok halmaza), akkor folytonos
ismérvről (adatsokaságról) beszélünk.

Példák. Folytonos ismérv az idő, a tömeg, a távolság. Sok esetben azonban diszkrétként jelenik meg. Bár elvileg
mérhetnénk nagyon pontosan valakinek a testmagasságát, mégis csak centiméterben mért egész számokat adunk
meg, azaz diszkrét ismérvnek kell mondanunk a testmagasságot.
Megjegyzés. A mai zika álláspontja szerint nincs akármilyen kis tér és időelem, azaz minden kvantált. Így végül is
ez utóbbi megkülönböztetés értelmét veszti, valójában minden adat diszkrét, nincsenek folytonos mennyiségek.
Mégis az analízis hatalmas fejlődése és eredményei akkor használhatók fel, ha eltekintünk attól, hogy pontosan nem
így van a világban, de ez egy leíráshoz jól használható „nyelv”. Tehát valójában minden valóságos adat diszkrét,
hiszen csak elvileg képzelhető el végtelen pontos mérés.

Egy fontos kérdés, milyen módon juthatunk adatokhoz. Ennek különböző lehetőségei vannak. Kérdőív, interjú,
számítógépes megkérdezés, tényleges megmérés. Itt merül fel egy fontos kérdés, hogy ha idő, vagy pénz, vagy mindkettő
hiányában nem tudunk mindenkit megkérdezni, megmérni stb., akkor hogyan válasszuk ki azokat, akiket bevonunk a
vizsgálatba.
Mintavételnek nevezzük azt, amikor egy sokaságból valamilyen eljárással egy általában jóval kisebb terjedelmű
részhalmazt kiválasztunk. A részhalmazt nevezzük mintának. Tehát a minta mindig a sokaság részhalmaza.

Amennyiben a mintavétel során valamilyen véletlen eljárást használunk, aminek a lényegét később, de még ebben a
fejezetben tisztázzuk, akkor véletlen mintavételről beszélünk.

A minta elemszáma a minta terjedelme.

Példák. Legyen a sokaság a magyar háztartások összessége. Ekkor, ha valaki telefonkönyvből kiválaszt valahogyan
1500 nevet, s azokat felhívva érdeklődik a szabadidő-eltöltési szokásaikról, akkor ezek a családok lesznek a minta
elemei, a minta terjedelme pedig 1500. Nyilván ha véletlenül az egyik telefon egy olyan helyen csörög, ahol egy kínai
család bérel 1 hónapra egy lakást, akkor őket nem vesszük be, mivel a sokaság a magyar háztartások voltak, s így a
minta nem lenne részhalmaza ennek. Természetesen, ha a kínai család letelepedett már, s magyar állampolgárok,
akkor belekerülhetnek a mintába.

A mintavétel fajtái a következők:

Egyszerű véletlen minta, amikor minden egyed ugyanolyan eséllyel kerül be a mintába. Szisztematikus minta, ha
például egy rendezett sokaság minden 100. elemét választjuk ki (minőség-ellenőrzés). Például az árukód alapján a
gyártott 00 végű elemek adják a minden 100. elemet.

Rétegzett minta, amikor a sokaságot rétegekbe soroljuk, mert úgy ítélik meg, hogy ezek befolyásolnak egy jelenséget, s
mindegyikből akarnak megfelelő számú reprezentánst, amelyet a rétegek terjedelme szab meg, s végül ezekből
választunk véletlenszerűen az arányok gyelembevételével.
Klaszterminta, amikor a sokaságot osztályokba, úgynevezett klaszterekbe osztják, s ezekből választanak.

Az adatsokaság rendszerezése többféle módon történhet. Például a különböző lehetséges adatok gyakoriságának
megadása.

Egy adat gyakorisága az a szám, ahányszor előfordul az adatsokaságban.

Ezek után az adathalmaz egy rendezett reprezentációja, ha megadjuk egy táblázatban az egyes adatokat és mellettük az
előfordulásuk gyakoriságát.

A gyakorisági táblázat a lehetséges különböző adatokat és a hozzájuk tartozó gyakoriságokat tartalmazza. A táblázatot
gyakorisági eloszlásnak is nevezzük.

Példa. 100 megkérdezett egyetemista arra a kérdésre adott válaszának gyakorisági táblázata, hogy hányszor megy
bulizni havonta:

Hányszor bulizik Gyakoriság

0 5

1 2

2 4

3 2

4 29

5 13

6 8

7 9

8 19

10 4

12 2

15 3
Már ebből is sok minden kiolvasható, például, hogy a leggyakoribb válasz a havi 4, ami kb. heti egy bulit jelent. De
elég nagy a heti kétszer bulizók száma is: 19.

Már az előbbi példánál is felmerülhet az adatok osztályozása, ráadásul nyilván pontos számot nehezen is tud mondani
a megkérdezett. Ilyenkor szokás már a kérdést is másként feltenni, vagy a válaszok alapján osztályokat képezni. Például az
előző példában azt lehet mondani, hogy soha, ritkán, hetente, hetente többször is, nagyon gyakran (legalább két-három
naponta).

Osztályközös gyakoriságnak mondjuk azt a táblázatot, amely az egyes osztályok – amelyekbe az adatokat soroltuk –
gyakoriságait tartalmazza.

Példa. Az előző táblázat sűrítéséről, tömörítéséről van most szó. Az első sor megmarad (soha), a második sor lesz a
ritkán, amibe az 1, 2, 3 adatai kerülnek, a hetente megmarad, utána a hetente többször is (5, 6, 7, 8) adatainak összege,
végül az utolsó három sor egyesítése a két-három naponta osztály.

Milyen gyakran bulizik havonta Osztályközös gyakoriság

Soha 5

Ritkán (kevesebb, mint heti 1) 8

Heti egy alkalommal 29

Hetente akár kétszer is 49

Két-három naponta 9

Megjegyzés. Természetesen nincs előre általános és minden esetben használatos szabály az osztályok képzésére.
Egyfelől a gyakorlati probléma, amelyből az adatok származnak, indokolhatja az osztályozás módszerét, más
esetekre van egy-két szem előtt tartandó elv. Ha lehet, akkor egy nagyobb csomóban levő adatot ne vágjunk szét,
tehát ha lehet, az osztályhatárokat úgy válasszuk, hogy az egymás közelébe eső adatokat lehetőség szerint ritkán
vágjuk szét. Ez főleg folytonos adatok esetén fontos, és a számegyenesen való ábrázolással szemléltethető is.
A 27.1. ábrán egy „jól” osztályokra felbontott és egy „rosszul” felbontott adatsokaság látható. A felső adathalmaz
értelmesen bontott, az alsónál több helyen is összefüggőnek látszó darabot vágunk szét, ezért nem szerencsés.

27.1. ábra

A gyakoriságnál sokszor többet mond, hogy a gyakoriság az összes adathoz képest mekkora. Ez egy nagyon fontos
fogalom, amely igen sokszor szerepel (egyébként még a valószínűség-számításban is).

Egy adat (vagy osztály) relatív gyakorisága az adat (osztály) gyakorisága és az adatsokaság terjedelmének hányadosa.

Ha a gyakoriságot k-val, az adatok számát (terjedelmét) n-nel jelöljük, akkor a relatív gyakoriság a hányados lesz.
Szokás még ezt a számot gyakoriságsűrűségnek is nevezni.

Megjegyzés. A relatív gyakoriság természetesen egy 0 és 1 közé eső szám (hasonlóan a valószínűséghez). A relatív
gyakoriságot szokás még százalékban is megadni. Gyakran mondjuk, hogy az adat relatív gyakorisága 27%.
A bulizás esetén az osztályközös relatív gyakoriságok százalékosan könnyen megadhatók, hiszen lévén éppen 100
adat, az egyes értékek éppen a százalékos relatív gyakoriságok, tehát soha nem bulizik 5%, ritkán 8%, hetente egyszer
29%. Ha őket tekintjük mérsékelteknek, akkor együtt 42%-ot tesznek ki. Hetente esetleg kétszer, de azért nem
háromszor 49%, és végül a notórius bulizok a maradék 9%.

Azt a táblázatot, amely az adatok relatív gyakoriságait tartalmazza, relatív gyakorisági táblázatnak hívjuk.

Példa
Milyen gyakran bulizik havonta Osztályközös relatív gyakoriság

Soha 0,05

Ritkán (kevesebb, mint heti 1) 0,08

Heti egy alkalommal 0,29

Hetente akár kétszer is 0,49

Két-három naponta 0,09

27.2. Adatok szemléltetése, ábrázolása


„Egy kép legnagyobb értéke, ha arra késztet bennünket,
hogy észrevegyük azt, amit sosem vártunk volna látni.”
John Tukey

Ez egy mindennapi téma, ha egy újságot felnyitunk, akkor biztos találunk benne valamilyen gra kus ábrázolást egy
adatsokaságról, például a tőzsdeindex (BUX) változása (27.2. ábra) vagy a munkanélküliség %-os alakulása Európában és
hazánkban (27.3. ábra). Ezek közös lényege, hogy valamilyen adatsort vagy időbeli változást próbálnak látványosan,
mindenki számára informatívan bemutatni. Természetesen gyakran más hatást kelt, mint amit az adatokból ténylegesen
kiolvashatunk, ilyenkor beszélünk manipulációról, melynek különféle lehetőségeit a fejezet végén foglaljuk össze.

27.2. ábra

27.3. ábra

A következőkben vegyük sorra a legismertebb és leggyakrabban használt ábrázolásfajtákat, és illusztráljuk is ezeket


egy-egy példával.

Oszlopdiagram
Hisztogram
Kördiagram
Sávdiagram
Vonaldiagram
Piktogram
Összetett gra konok
Lorenz-görbe és koncentráció
Gra kus manipulációk az egyes diagramfajták esetén

Oszlopdiagram
Ebben az ábrázolásban a gyakoriságokat az oszlopok magassága szemlélteti. Nézzük a következő példát! Egy országban a
közlekedési baleseteket okozóik kora szerint csoportosítva adták meg. Eszerint a következő táblázatot közölték:
A felelős kora 16–20 21–30 31–50 51–60 61–80 81–

Okozott balesetek száma 1345 9756 12 674 5671 8752 643

Az ehhez tartozó oszlopdiagramot a 27.4a ábrán, hézagmentes ábrázolásban a 27.4b ábrán látjuk.

27.4. ábra

Hisztogram
Ez valójában egy speciális oszlopdiagram, ahol azonban az oszlopok nem egyenlően szélesek, és a gyakoriságsűrűséget
ábrázoljuk, azaz ilyenkor a téglalap területe a gyakorisága az adott osztálynak. Az előző példában a baleseteknél nem
egyforma az egyes korosztályok szélessége, így az oszlopdiagram helyett hisztogramot a következőképpen kapunk. Az első
oszlop szélessége öt évfolyamnyi, a másodiké tíz, a harmadiké húsz, aztán ismét tíz, majd kétszer húsz. Így az öt
évfolyamnyira normálva, a második oszlopot fele magasságúra, aztán negyed, majd ismét fél, s végül két negyed
következik. Ez adja a hisztogramot, ahol tehát az oszlopok területe adja a balesetek gyakoriságát, nem a magassága. Ezt a
területarányos ábrázolást mondjuk hisztogramnak (27.5. ábra).

27.5. ábra

Kördiagram
Ez a diagram alkalmas arra, hogy az egyes osztályok, csoportok gyakoriságának az egészhez való viszonyát szemléltessük.
Például ha 5 nagy cég felosztja a piacot, akkor hasznos látni, hogy az egyes cégek mekkora részt hasítanak ki maguknak. A
gyakoriságokat körcikkekkel ábrázoljuk, mégpedig úgy, hogy a 360 fokot osztjuk fel arányosan a gyakoriságokkal.

Példa. Legyen az öt nagy cég részesedése rendre 40%, 25%, 20%, 10% és 5%. Ekkor a legnagyobbhoz tartozó
középponti szög 144°, aztán a 25% (negyedrész) éppen 90°, a következő három pedig rendre 72°, 36° és 18° (27.6a ábra).

27.6. ábra

Megjegyzés. Nagyon gyakran nem kördiagramot, hanem annak térbeli „torta” vagy „sajt” változatát közlik az
újságok. Ez éppen azért, mert a megjelenítés nem szögtartó, a lényegét veszti el, nevezetesen, hogy szemléletesen
láthatók az egyes gyakoriságok egészhez való viszonyai. Az előbbi diagram ilyen „torzított változatban” látható a
27.6b ábrán. Ránézésre például a részesedés sorrendje szerinti második cég piaci része majdnem akkorának tűnik,
mint az elsőé, tehát eltorzult a viszonyuk. A harmadiké kb. fele akkorának tűnik, mint a másodiké, pedig csak 5%-kal
kevesebb.
Sávdiagram
Hasonlóan a kördiagramhoz, itt is az egészhez való viszonyt ábrázoljuk, de hogy ne kelljen szögekkel bajlódni, ezért egy
téglalapot osztunk fel „sávokra”, szeletekre. Az előző ábra sávdiagram-változatát mutatja a 27.7. ábra.

27.7. ábra

Ezen az ábrázoláson talán kicsit kevésbé látszik az egészhez való viszony, ez hátrány a kördiagrammal szemben, előny
azonban, hogy lineáris szakaszhosszakat kell csak összehasonlítani a bonyolultabb (és eszközigényes) szögmérés helyett.

Vonaldiagram
Ez a diagramfajta főleg időbeli változások ábrázolására alkalmas. Legnevezetesebb példák a lázgörbe (27.8. ábra), a
hőmérsékleti görbe egy adott napon vagy a születések száma egyes egymás utáni időtartamokban, például az egyes
években.

27.8. ábra

A személysérüléses közúti balesetek számát 1990-től 2004-ig a 27.9a ábra mutatja. Itt az egyéves időtartam alatt
bekövetkezett baleseteket ábrázoltuk. Ebben az esetben szerencsésebb az oszlopdiagram, mivel így úgy tűnhet, hogy a
közbülső pontokban, ahol a szakasz halad is, van értelme a függvényértéknek, ahogyan a láznál reggel 9 és 12 között is volt
testhőmérséklet, csak arra nincsen adatunk, s egy lineáris approximációval élünk, amikor a lázgörbét rajzoljuk. A
balesetek ábrázolásánál például az egyik adat az 1993-ban, a másik az 1994-ben történt balesetek száma. Így tehát a
vonaldiagram, bár eléggé elterjedt (nyilván a tendencia kifejezésére, hogy lássuk, nőtt vagy csökkent-e a balesetek száma és
milyen arányban az előző év(ek)hez képest), mégsem szerencsés ábrázolás és kerülendő is. Sosem szabad összekötni olyan
pontokat, amelyek nem időpillanatbeli, hanem időtartambeli adatokat jelölnek. Így a következő diagram ellenpéldának
tekinthető.
A megfelelő ábrázolást ugyanezekkel az adatokkal a 27.9b ábra mutatja.

27.9. ábra

Piktogram
Ez egy szemléletes ikonszerű ábrázolás, ahol általában amiről szó van, annak egy vizuális megjelenítése képezi az ábrázolás
alapegységét. Például, ha egy országban a háztartásokban nyilvántartott macskák számáról akarunk egy szemléletes
ábrázolást, akkor egy macska jelképezi a diagram egységét, például egy adott méretű macska jelent 100 000 valódi macskát.
Ebben az esetben, ha Magyarországon 207 000 macskát tartanak nyilván a háztartásokban, akkor ez 2 macskát és még vagy
hét darab kisebb macskát (tizedrésze a nagynak) jelent, vagy egy nagy macska egy részét vesszük a 7000 szemléltetésére. A
27.10. ábra néhány európai ország macskatartását illusztrálja (itt most kerekítéssel).

27.10. ábra

Az éves átlagos sörfogyasztás szemléltetése esetén például, ahol egy tele korsó jelent 10 liter sört, ha az átlag 156,9 liter,
akkor 15 darab tele korsót és egy kb. kétharmadig töltött korsót rajzolnak az adott ország neve mellé.

Összetett gra konok

Kartogram
Radar- (pókháló-) vagy sugárdiagram

Kartogram
Ezt olyan szituációban használjuk, amikor valaminek a földrajzi eloszlása az érdekes. Például Magyarországon a
villamosenergia-fogyasztást regionális nagyvállalatok, a fogyasztás mértéke és típusa szerint akarjuk ábrázolni (27.11.
ábra), vagy például az európai unió kisebbségeit szeretnénk szemléltetni (27.12. ábra). A 27.11. ábrán a körök területe a
fogyasztott energia nagyságával arányos (pl. az ELMŰ a legnagyobb), míg a körcikkek a fogyasztás típusát szemléltetik.

Kartogramnak nevezünk egy olyan statisztikai diagramot, ahol az adatok földrajzi elhelyezkedését is szeretnénk
szemléltetni. Mindig szerepel valamilyen térkép az ábrán.

27.11. ábra

27.12. ábra
Radar- (pókháló-) vagy sugárdiagram
Ez a diagramfajta akkor használatos, amikor két, esetleg több adatsort szeretnénk összehasonlítani egyetlen diagramon, s
minden egyes komponens esetén érdekel az egymáshoz viszonyítás, pontosabban hogy van-e valamiféle arányosság vagy
párhuzamosság. Például két cég négy-öt különböző szegmensbeli összehasonlítása, pl. forgalom, nyereség, beruházás,
hitelállomány, foglalkoztatottak száma stb. A 27.13. ábra csupán szemlélteti ennek a diagramfajtának a megjelenését.

27.13. ábra

Lorenz-görbe és koncentráció
Sokszor fontos lehet egy eloszlás egyenletességének mérése. Egyes országok például összehasonlíthatók azzal, hogy a
jövedelmek mennyire egyenletesen oszlanak el az egyes szereplők között. Nagy eltérés van például a skandináv országok és
egyes dél-amerikai országok jövedelemeloszlása között. Egy másik példán láthatjuk, amit a következőkben majd be is
mutatunk, hogy a Föld népességének és energiafelhasználásának eloszlása mennyire egyenletes. Ezeket lehet a Lorenz-
görbével szemléltetni és számszerűen a Gini-féle együtthatóval kifejezni.
Vegyük a Föld kontinensei népességének és az energiafelhasználásuknak a viszonyát. Az ábrázoláshoz célszerű minden
egyes kontinensre meghatározni az egy főre eső energiafelhasználást, ezt sorba rendezni, s utána a következőképpen
meghatározott gra konon megadni. Az x tengelyen a kontinensek népességét a teljes Föld népessége százalékában
szemléltetjük, összegezve, tehát a legkisebb egy főre jutó energiafelhasználású kontinens ahányad része a teljes
népességnek, az lesz x1. A második kontinens (egy főre jutó energiafelhasználás szerint) népességének arányát hozzáadjuk
az elsőéhez (kumulált népesség), és ez adja x2-t (azaz a második kontinens népessége x2–x1 lesz). És így tovább, ezek lesznek
a diagram pontjainak első koordinátái. Az y tengelyen fogjuk mérni az egyes kontinensek teljes energiafelhasználását,
szintén a Föld teljes energiafelhasználásának százalékában, így ezen a tengelyen is 0 és 1 közötti értékek lesznek. Az első
kontinens teljes energiafelhasználásának az egész felhasználáshoz viszonyított aránya adja y1-et. Ismét kumulatív módon
járunk el, tehát y2 az első két kontinens összegzett energiafogyasztásának az egészhez viszonyított arányát jelzi. Így nyilván
az utolsó kontinens koordinátái (1; 1) lesznek, azaz általában az n-edik érték (1; 1) ponttal jelölődik ezt a módszert követve.
Ehhez általában némi számítást kell végezni, hiszen a „nyers” táblázat ezeket az adatokat nem tartalmazza, csupán az
egyes kontinensek adatait, amiből, mivel egy főre jutó felhasználás van, ki kell számolni az egyes kontinensek teljes
energiafelhasználását és annak százalékos arányait az egészhez. Emiatt kibővítettük két oszloppal és az utolsó sorral az
eredeti adatokat tartalmazó táblázatot.

Lakosok száma (millió fő), a Föld népességének Energiafelhasználás Teljes energia Százalékos
Kontinensek
százalékában (t**) (mt) arány

Európa* 683; 0,129 4,91 3353,53 0,3512

Észak-Amerika 265; 0,050 10,558 2797,87 0,2930

Dél-Amerika 450; 0,085 1,131 508,95 0,0533

Afrika 635; 0,120 0,40 254 0,0266

Ázsia, Ausztrália és
3260; 0,616 0,808 2634,08 0,2759
Óceánia

Összesen 5293; 1 9548,43 1

* Az egykori Szovjetuniót Európához számítottuk.

** Az energiafelhasználást egy tonna kőszén elégetésének energiatartalma szerint mérték, tehát fejenként hány tonna kőszenet égetnének
el.

Az adatokat 1990-ben gyűjtötték.


A 27.14. ábrán az egyes pontok az egyes kontinenseket reprezentálják, az egy főre eső energiafelhasználás nagysága
szerint rendezve. Ha ezeket a pontokat összekötjük, egy töröttvonalat kapunk (az első kontinenst szemléltető pontot az
origóval, a többit a következő kontinenst reprezentáló ponttal összekötve). Így a sorba rendezés miatt egy konvex
tartományt kapunk, ha a (0; 0) és az (1; 1) pontot öszszekötő szakaszt is behúzzuk. A teljesen egyenletes eloszlás az lenne, ha
a töröttvonal egybeesne az y = x egyenes behúzott szakaszával. Minél jobban eltér a töröttvonalunk ettől, annál
egyenetlenebb az eloszlás. A másik szélsőség, ha mindenki 0%-ban részesedik, egy pedig elviszi az egészet, ekkor egy
háromszög lesz a tartomány. Mindennek pontos matematikai formalizálását az olvasóra bízzuk.

27.14. ábra Energiafelhasználás kontinensek szerint

Lorenz-görbének hívjuk a megadott eloszlás fentiekben leírt módon ábrázolt sorba rendezett pontjai által
meghatározott töröttvonalat.

A koncentráció mértékére létezik egy numerikus mérőszám is, amit a következőképpen adunk meg.

A Lorenz-terület nagyságát a maximális koncentrációs területhez képest (ami elméletileg legfeljebb 0,5 lehet) Gini-
együtthatónak nevezzük, azaz

Nagyon egyenlőtlen eloszlást jelentenek az 1-hez közeli értékek, és minél közelebb vagyunk a 0-hoz, annál
egyenletesebb az eloszlás. Jegyezzük meg, hogy az első tényező éppen az egyik mérték adatait jelöli, hiszen a kumulált
eloszlás különbségei éppen az egyes értékek. A második két egymás utáni kumulált érték összege.

Példa. Esetünkben az energiafelhasználást tekintve a következőt kapjuk: 0,64. Ez elég egyenlőtlen eloszlást jelent,
hiszen a 0-tól (egyenletes) nagyon messze esik. Általában 0,5 felett már nagyon egyenlőtlen az eloszlás.

A következőkben összefoglaljuk a leggyakrabban előforduló félrevezetési lehetőségeket a gra kus ábrázolások


kapcsán, ezzel is felhívva a gyelmet arra, hogy nagyon gondosan kell eljárni ezek értelmezése, illetve használata esetén. A
számos lehetőség közül a leggyakoribbakról teszünk csak említést. Mindez a tudatos olvasáshoz és az önálló helyes
véleményalkotáshoz elengedhetetlen, ezért iskolai tanítása nagyon fontos.

Gra kus manipulációk az egyes diagramfajták esetén


Oszlopdiagramok, vonaldiagramok manipulációi. A klasszikus, sokszor nem is tudatos, csupán az ábra kisebb helyen való
elhelyezése miatti manipuláció a koordináta-rendszer origójának eltolása. Ezzel az oszlopok magassága változik, ami
vizuálisan kisebb vagy nagyobb értékek érzetét kelti, főleg összehasonlításkor. Például 90 és 100 között az eltérés 10% a
nagyobbhoz viszonyítva, ha azonban az origót 80-ba helyezzük, akkor a 90-nek 10, míg a 100-nak 20 felel meg, s ez már azt
„mutatja”, hogy a második adat kétszerese az elsőnek, azaz 100% az eltérés a nagyobbhoz viszonyítva, míg valójában csak
10%. Ez gyakori hiba, feltétlenül gyelni kell rá, mert komoly félreértések forrása lehet. Ez valójában egy eltolás, de
változik vele a méret (27.15. ábra).

27.15. ábra
A bal oldali ábrán az origó a helyén van, a jobb oldalin 30-nál indul az y tengely, és a lépték a kétszerese, látható, hogy
mennyire más vizuális kép adódik. Például a 4. oszlop az 5. oszlop háromszorosának tűnik, miközben csak 30%-kal több,
ami az első helyes ábrázoláson jól látható is.
A másik gyakori manipuláció az egységválasztás, ami az előző jobb oldali ábra hatását tovább fokozta. Ezzel egy
nyújtást végzünk az oszlopdiagramon vagy vonaldiagramon. A változások mértékét befolyásolja: felnagyítja vagy
kicsinyíti.

Példa. Nézzük például a Vonaldiagram cím alatti balesetes példát más-más léptékkel, mennyire más képet kapunk.
Kisebb léptékkel, alig látszik valami változás, enyhe csökkenés, kisebb hullámzással (27.16. ábra). Nagyobb léptékkel
egész jelentősnek tűnik az ingadozás mértéke (27.17. ábra).

27.16. ábra

27.17. ábra

Ha még az origót is eltoljuk, akkor végképp eltorzulnak az arányok, és hatalmas különbségeket sugall a gra kus
ábrázolás, szemben a valóságos viszonyokkal, például az első évben (1990-ben) több mint négyszer annyi balesetet
valószínűsítünk az ábra alapján, mint pl. a 11. évben (2000-ben), ami abszolút téves. Az ábrázolás elvileg lehetséges, de meg
kell nézni, hol az origó, és mi a lépték (27.18. ábra).

27.18. ábra

Egy másik, a sajtóban nagyon gyakran meg gyelhető torzítás a térbeliség imitálásával jön létre. A látványosság
kedvéért az oszlop- és kördiagramok helyett térbeli alakzatok, például hasábok és hengerek vannak. Általában
axonometrikus ábrázolásban (lásd 7.3. fejezet) jelennek meg a testek, melyeknek méretei jelölnék az adatokat (magasság,
illetve a kördiagramnál szög). Az a fő probléma, hogy az axonometriánál sem az egyes irányok méretaránya, sem a szög
nem invariáns (állandó), így az első benyomásunk ezekről nagyon eltérő lehet a korrekt téglalap, illetve kördiagramos
ábrázoláshoz képest. Teljesen megfordulhatnak az ábrán látottak. Nem egyszerűen csak az arányok, hanem akár meg is
fordulhatnak a viszonyok, tehát kisebbnek látszó szög valójában nagyobb, mint a nagyobbnak látszó. Nézzünk két példát
ezekre, a környezetszennyező anyagok kibocsátását, illetve a magyarországi erőművek nettó hatásfokának alakulását
(27.19. és 27.20. ábra).

A 27.19. ábráról igen nehéz leolvasni bármit is, a térbeliség zavaró hatását fokozza, hogy három különböző hasábsort
látunk egymás mögött, más-más árnyalatban, és a por hasábsorának takarása miatt az első öt évben nem lehet látni a
nitrogén-oxid-kibocsátás alakulását.
27.19. ábra

A 27.20. ábrán az oszlopdiagram el van forgatva 90 fokkal, ami nehezíti a diagram olvasását, emellett a függőleges
segédvonalak csak zavarnak, hiszen a tényleges összehasonlításhoz az oszlopok jobb végének ferde vonalát kell
levetíteni az alapsíkra, s ott lehet az értékeket megbecsülni.

27.20. ábra

27.3. Átlag és szórás


Az adathalmazok tömörítésének leggyakoribb módjai, amikor egy-egy számmal jellemezzük az adatsokaságot. Ennek is
különböző módozatai lehetnek aszerint, hogy milyen típusú adataink vannak. Számított jellemzők csak méréses adatok
esetén értelmezhetők, fontosak tehát azok a jellemzők is, amelyek másként fejezik ki az adatsokaságot.

Minden adathalmaz esetén létezik a módusz, ami a sokaság leggyakoribb értéke. Amennyiben több ilyen adat is van,
akkor többmóduszú sokaságról beszélünk.

Példa. Hajszín tekintetében a svédek körében valószínűleg a szőke a módusz, míg az olaszoknál a fekete. Itt jegyezzük
meg, hogy az ilyen kijelentések, mint hogy a svédek szőkék, statisztikailag akkor mondható megalapozottnak, ha a
módusza az adott tulajdonságnak a sokaságban éppen a mondott adat.

Méréses adatoknál is van természetesen módusz, a leggyakoribb lábméret vagy a leggyakoribb ruhaméret stb. Ha az
adathalmaz rendezhető (rendezhető minősítéses), akkor az egyes adatokat sorba rendezhetjük nagyság szerint. Ebből is
adódik egy jellemző „középérték”, a medián.

Ha egy rendezhető minősítéses adathalmazt sorba rendezünk, akkor a középső adatot (amennyiben létezik)
mediánnak nevezzük. Ha nincs középső, akkor szétvágjuk két egyenlő terjedelmű részre (ilyenkor mindig páros a
méret, páratlannál van középső), és a „vágás” mellett álló két szám átlaga a medián. Jelölése Me.

Példák
1. A magyar szállodalánc jellemzése csillagszám szerinti. Ekkor a medián a minőség szerint sorba rakott szállodák
közül a középső csillagértéke.
2. Amikor diákok sorba állnak testnevelés órán, vagy katonák egy díszszemlén, akkor általában szintén nagyság
szerint állnak. Ilyenkor könnyen leolvasható az osztály vagy a katonai egység testmagasságainak mediánja,
hiszen az a középen álló (állók átlaga) testmagassága.
A legelterjedtebb középérték, mint jellemző, a számtani közép vagy egyszerűen csak „átlag”. Ez természetesen csak
méréses ismérvek esetén értelmezhető.

Adatok átlaga vagy számtani közepe, méréses adatok esetén az adatok számtani közepe, azaz ,
illetve ha az egyes adatok többször fordulnak elő, akkor

ahol n jelöli az adathalmaz méretét,


nyilván az egyes gyakoriságok összege, míg az rí számok az adatok relatív gyakoriságait.

Példa: iskolai osztályzatok átlaga, átlag zetés, átlagos testmagasság stb.


Megjegyzés. Például iskolai osztályzatoknál elég szerencsétlen az átlag használata. Valójában a jegyek csak
rendezhető minősítéses ismérvek, az egyetlen részleges kivétel az érettségi értékelés, ahol teljesen egyenletes a skála.
Azaz az egyes jegyek egyenletes 0–19, 20–39 és így tovább 80–100%-ig terjedő teljesítmény után járnak, azaz mivel
ugyanannyival nagyobb az 1-nél a 3 és a 2-nél a 4, teljesítményben is pontosan annyival kell többet nyújtani. Ilyenkor
tehát egy méréses teljesítményértéket váltunk át egyenletesen jegyekre. A legtöbb tanár azonban az egyes
dolgozatoknál, feleleteknél nem ezt a mérésértékelési módot követi, s ilyenkor a jegyek nem tekinthetők számoknak,
s legfeljebb a medián vagy a módusz értelmezhető.

További számított középértékek: a harmonikus, a mértani és a négyzetes közép. Ezeknek a meghatározásával


folytatjuk.

Az x1, x2, …, xn adatok harmonikus közepén a számot értjük.

Példa: egy busz átlagsebessége ugyanazon az úton két irányban más sebességgel haladás esetén. Ha az egyik irányban

az átlagsebessége v1, ugyanezen az úton visszafelé v2, akkor a teljes útra vett átlagsebessége:
, azaz a harmonikus közepe a két sebességnek.

Az x1, x2, …, xn adatok mértani (geometriai) közepén a számot értjük.

Példa: átlagkamat a bankban vagy átlaghozam, átlagin áció stb. Legyen három egymás utáni évben rendre 5, 9 és
12% az éves in áció. Mennyit romlott a pénz értéke évente átlagosan? Ugyanazon áru értéke a három év alatt 1,05 ·
1,09 · 1,12-szeresére változott. Az átlagos éves in áció azt jelenti, hogy minden évben ennyi lett volna a pénzromlás,
akkor most ugyanott tartanánk, mint a megadott három in áció hatására. Tehát ha az átlagos in áció p, akkor igaz
lesz, hogy p3 = 1,05 · 1,09 · 1,12, azaz a három érték mértani közepe. A fenti számokkal
egyébként 8 adódik, míg ha gondolkodás nélkül a helytelen számtani közepet használnánk, akkor 8,67% átlagos
in áció adódna.

Az x1, x2, …, xn adatok négyzetes közepén az számot értjük.

Példa: molekuláris zika, a molekulák átlagsebessége adja meg a hőmérsékletet, mivel a hőmérséklet a belső

energiával kapcsolatos, az pedig az egyes részecskék mozgási energiájából adódik, ami, mint tudjuk: .

Mikor melyik középértéket, jellemzőt használjuk, ha több is létezik?


Kvantilisek és kvartilisek
Aszimmetria vagy ferdeségi mutató
Mikor melyik középértéket, jellemzőt használjuk, ha több is létezik?
Először is az adatok eleve meghatározzák, hogy mit lehet. Ha lehet mindegyiket, mert méréses adataink vannak, akkor
kizárólag a kérdésfeltevés számít a választásnál. Általános szabály, hogy ha az adatok összege valamiért fontos, akkor a
számtani közép a legmegfelelőbb közép, hiszen abból a sokaság méretének ismerete esetén azonnal meghatározható az
összeg. Lásd például a költségvetést, ahol az átlag zetés ismeretében számolják például a tb (társadalombiztosítás)
bevételeit, hiszen a bruttó zetésnek egy rögzített százaléka. Így azonnal számolni tudják a zetések számtani közepéből a
teljes kiáramlott bért, s abból a tb bevételét (ez persze egy kissé pontatlan, mert járulékokat csak egy bizonyos
jövedelemszintig kell zetni, így a pontos tervezéshez a zetések pontosabb statisztikájára van szükség). Ha a leggyakoribb
zetést vagy a mediánt ismernék, abból a tb-bevételre semmilyen módon nem lehetne következtetni. Másrészt, ha egy
adott munkahelyre készülök, akkor a medián számomra informatívabb, hiszen az a középen levő zetés, s ha nem
vezérigazgatónak készülök a céghez (akkor sem tudom persze megmondani, hogy mit várhatok sem a számtani közép, sem
a medián esetén), akkor a medián jobb adat, mert a számtani közepet a nagy zetések mindig kicsit felfelé tolják.

Példa. Egy kis cégnél van 10 minimálbéren bejelentett dolgozó 65 000 Ft havi bérrel, 2 alkalmazott 100 000 Ft-os
zetéssel, míg a vezetőt havi 450 000, a könyvelőt pedig 300 000 Ft-tal alkalmazzák. Az átlag zetés 155 000 Ft a fenti
eloszlás esetén, míg a medián és egyben a módusz is 65 000 Ft. A 155 000 Ft a két magas vezetői zetés miatt jött ki.

Hogyan változnak a jellemző középértékek, ha adathalmazokat egyesítünk? Ebben a tekintetben az átlag az egyetlen
középérték, amelyre valamit mondani lehet. A módusz és a medián megjósolhatatlanul, a számtani közép viszont szépen
viselkedik.
Ha az egyik sokaság terjedelme n, és az átlaga x̄, míg a másiké m és ӯ, akkor az egyesített halmaz átlaga:

(27.1)

Ebből az is következik, hogy az egyesített átlag mindenképpen a két rész átlaga közé kell hogy essen, ami sem a
mediánra, sem a móduszra nem igaz. A számított középértékekre lesz csak hasonló igaz, tehát akármilyen közepet veszünk
a fent de niáltak közül, az egyesített halmaz középértéke a két rész középértéke közé esik.

Példa a módusz „rossz viselkedésére”. Legyen A = {1, 1, 1, 4, 4}; illetve B = {2, 2, 2, 4, 4}. Ekkor A módusza 1, B módusza
2. Az egyesített adathalmazé viszont 4 (hiszen ebből 4 lesz, míg 1-ből és 2-ből csak három-három darab lesz), ami nem
esik 1 és 2 közé! Még extrémebb példa: C = {1, 1, 1, 3, 3, 23, 23}, illetve {2, 2, 2, 4, 6, 23, 23}, itt is az első módusza az 1, a
másodiké a 2, míg az egyesítetté a 23. Tehát nagyon eltérhet, a két ismert módusz semmilyen kapcsolatban nincs
vele.
Példa a medián „rossz viselkedésére”. Legyen D = {2, 4, 5, 23, 25}, és E = {6, 7, 7, 40, 41}. Ekkor a mediánok 5 és 7, míg az
egyesített adathalmazé szintén 7:F = {2, 4, 5, 6, 7, 7, 23, 25, 40, 41}.

Speciális esetben, ha mindkét rész átlaga ugyanannyi, akkor az egyesített halmaz átlaga is. Ez azért igaz lesz a
móduszra is, hiszen ha ugyanaz az érték a leggyakoribb mindkét részben, akkor az egyesített halmazban is. A medián is
hasonlóan viselkedik, tehát ezekkel akkor van baj, ha különböző értéket vesznek fel a két részhalmazban, mert akkor nem
tudunk semmit az egyesítésről.

Kvantilisek és kvartilisek
Szokásos még az adathalmazt nemcsak megfelezni a mediánnal, hanem például a felet tovább felezni. Ebből adódik az alsó
és a felső kvartilis fogalma.

A medián alatti elemek mediánját nevezzük alsó kvartilisnek (magyarul alsó negyedelő, hiszen a fél fele a negyed).
Szokásos jelölése Q1. A medián feletti elemek mediánját pedig felső kvartilisnek (felső negyedelő), jelölése Q3. Ezzel a
jelöléssel a mediánnak a Q2 felel meg, azaz Me = Q2.

Példa. Legyen a következő adathalmaz egy osztály tanulóinak magasságai cm-ben már sorba rendezve: 160; 161; 161;
162; 162; 164; 167; 170; 170; 171; 172; 173; 174; 174; 175; 175; 176; 176; 176; 178; 179; 180; 182; 184; 190. A létszám láthatóan 25
fő. Ekkor a 13. tanuló a középső, azaz a medián 174, az alsó kvartilis a 7. tanuló 167, míg a felső kvartilis a 19. tanuló,
aki 176 cm magas. Mivel 25 egy 4k + 1 alakú szám, itt mind a kvartilisek, mind a medián könnyen adódik. Ha csak 24-
en vannak, az egyszerűség kedvéért a legnagyobbat kivesszük az osztályból, akkor a medián a 12. és 13. között lenne,
így ezek átlaga 173,5. Az alsó kvartilis az első 12 tanuló felénél, azaz a 6. és 7. között lenne, tehát 164 és 167 átlaga: 165,5;
míg a felső kvartilis a 18. és 19. között lenne: mivel mindkettő 176, ezért átlaguk is 176.

A kvartilisek általánosításaképpen a különféle kvantiliseket kapjuk, melyek de níciója a következő.

Általában a p-edik kvantilis jelentése, hogy az adathalmazt úgy bontjuk fel két részre, hogy a rendezett minta alsó p-
edrésze legyen alatta, s a felső (1 – p)-edrész felette. Ekkor, ha p = ½, akkor éppen a mediánt kapjuk, ami tehát 0,5-
kvantilis, míg ha p = ¼, akkor az alsó, és ha p = ¾, akkor a felső kvartilist kapjuk.

Ezek után megemlítünk egy érdekes ábrázolási módot, az ún. sodrófadiagramot (az angolszász irodalomban „box-plot”
néven szerepel).

Rajzolunk egy téglalapot, amelynek két széle az alsó és a felső kvartilis. Ebben a téglalapban egy függőleges osztóvonal
a medián. Két irányban, mint egy-egy antenna, jelezzük a legkisebb és a legnagyobb adatot, amit még nem tekintünk
kiugrónak (outlier, extrém). Az így kapott diagramot sodrófadiagramnak (box-plot) mondjuk.

Szokás a kiugró adat meghatározása is, ennek egy lehetséges módja a következő.

Ha egy adat nagyon eltér a többitől, azaz például a szórás legalább 3-4-szeresével tér el az átlagtól, akkor kiugró
adatnak nevezzük. Ezeket általában valamilyen külön jellel jelölik a sodrófadiagram esetén.

A legtöbb gra kus kalkulátoron található ilyen funkció, statisztikai üzemmódban megrajzolja ezt a diagramot, ha az
adatokat bevittük (egyébként több lista esetén is lehet, s összehasonlíthatók is a diagramok). Nagyon jól használható
hasonló típusú adathalmazok szemléletes összehasonlítására.

Példa. Legyen adathalmazunk a már említett sörfogyasztás, lásd a 27.2. fejezetben Piktogram cím alatt.

Ország Egy főre jutó éves sörfogyasztás (liter)

Csehország 156,9

Írország 131,1

Németország 115,8

Ausztrália 109,9

Ausztria 108,3

Nagy-Britannia 99,0

Belgium 93,0

Dánia 89,9

Finnország 85,0

Luxemburg 84,4

Szlovákia 84,1

Spanyolország 83,8

USA 81,6

Horvátország 81,2

Hollandia 79,0

Új-Zéland 77,0

Magyarország 75,3

Lengyelország 69,1

Kanada 68,3

Portugália 59,6

Itt Csehország már kb. 3-szoros szórással tér el az átlagtól, tehát kiugrónak mondható. Így a sodrófa felső
antennája a második helyezett Írországnál van, az alsó Portugália, amelyik viszont egyáltalán nem kiugró adat lefelé.
Aszimmetria vagy ferdeségi mutató
Annak mérésére, hogy egy eloszlás mennyire aszimmetrikus, többféle mutató is létezik. Egy ilyen, a ferdeséget jellemző
mérték, amely kevésbé érzékeny a kiugró adatokra, a sodrófadiagramban is szereplő kvartilisek és a medián
elhelyezkedéséből határozható meg.

Rendezett ferdeségen értjük a következőképpen de niált mérőszámot: . Ez akkor mutat balra ferde
eloszlást, ha 1-nél kisebb, szimmetrikus, ha 1, és jobbra ferde, ha 1-nél nagyobb.

Ezt a mértéket a kiugró adatok semmilyen módon nem befolyásolják, az adatok középső 50%-ának elhelyezkedése
határozza meg.

Példa. Legyen egy kis adathalmaz hét, egymás utáni év júliusi átlaghőmérséklete: 27,2; 24,5; 28,1; 29,2; 26,1; 28,8; 29,7.
Ekkor a medián a 4., azaz 28,1. Az alsó kvartilis a 2. és 3. átlaga 26,65; míg a felső az 5. és 6. átlaga 29. Ekkor az rF
mutató értéke 0,9/1,45 = 0,62 < 1, tehát ez balra ferde eloszlást mutat.

A jellemző középértékek „jóságát”, tehát hogy mennyire jól jellemzik a teljes adathalmazt, azzal mérhetjük, hogy
valamilyen szóródási mértéket is de niálunk, amivel azt mérjük, hogy a középértéktől mennyire térnek el általában az
adatok. Különböző lehetőségek adódnak erre is. A legegyszerűbb a terjedelem.

Egy adathalmaz legnagyobb és legkisebb értékének különbségét terjedelemnek nevezzük.

Természetesen méréses adatok esetén értelmes csak. Fontos megjegyzés, hogy nem keverendő a minta méretével (az
adatok száma), amit néha szintén terjedelemnek mondanak. Még további két szóródási mértéket adunk meg.

Egy adathalmaz egy adott a számtól való átlagos négyzetes eltérését a következőképpen de niáljuk:

. Amennyiben az a szám éppen az átlag, tehát a = x̄ esetén az átlagos négyzetes eltérés neve
empirikus szórás vagy tapasztalati szórás. Jele általában: sn vagy σn, ahol az index az adatok számára utal. A
tapasztalati szórás négyzete a tapasztalati szórásnégyzet.

A legtöbb zsebszámológépen ma már van statisztikai üzemmód, amellyel az átlag mellett a szórást is egy
gombnyomással számíttathatjuk, ha bevittük az adatokat. A gépen is az említett két jel valamelyike mutatja meg a
megfelelő gombot.

Egy adathalmaz egy adott a számtól való átlagos abszolút eltérését az alábbi formulával de niáljuk:

Két tételt is megemlítünk, melyek bizonyítását az olvasó a de níciók felhasználásával és az abszolút érték, valamint a
másodfokú függvény tulajdonságaiból könnyen levezethet.

Egy adott adathalmaz esetén az N(a) függvény minimumhelye éppen a = x̄. Hasonlóan az A(a) függvény minimuma
éppen az adathalmaz mediánja.

Ebből adódik, hogy ha párosítani akarjuk egy méréses adathalmaz esetén a jellemző középértékeket a szóródási
mértékekkel, akkor az átlaghoz szórás, a mediánhoz a mediántól vett átlagos abszolút eltérés passzol. Mivel a szórás
számítása nagyon elterjedt, egy fontos összefüggést mutatunk, amivel sokszor könnyebben lehet számolni.
Ha elvégezzük a gyökjel alatt a négyzetre emeléseket és az összeadást, akkor

vagy négyzetre emelve és átrendezve:

(27.2)
A korábban bevezetett jelöléssel azt is mondhatjuk, hogy az adatok négyzetes közepének négyzete az átlag négyzetének
és a szórásnégyzetnek az összege.
Szóródási mértékek alakulása, az adathalmazok egyesítése esetén a középértékeknél is nehezebb eset. A terjedelemre
nincs szabály, a szórásra van, de nem egyszerű, a mediántól vett átlagos abszolút eltérésre szintén nincs, hiszen már a
mediánra sem volt.
Az egyetlen tétel a következő.

Ha két n, illetve m terjedelmű adathalmazunk van, amelyeknek az átlagai x̄ és ӯ szórásai rendre: σx, σy, akkor az

egyesített n + m elemszámú adathalmaz szórására: lesz igaz.

Az igazoláshoz a de níció mellett a (27.2) azonosságot kell használni kétszer:

Ebből rögtön látszik, hogy az egyesített adathalmaz szórása nem feltétlenül esik a két szórás közé, lehet mindkettőnél
nagyobb is. Nyilván, ha elég messze vannak az átlagok egymástól, akkor az egyesített adathalmaznál még inkább így lesz a
formula szerint is.

Példa. Legyen X = {4; 5; 5; 6} és Y = {9; 11; 12; 16}, x̄ = 5; ӯ = 12, . Ezek felhasználásával az egyesített

adathalmaz átlaga (amelynek négyzete a második kivonandó): 8,5, és így a keresett szórásnégyzet: ,
ami mindkettőnél nagyobb. Ha a hozzáadandó 0, akkor lesz az egyesített szórásnégyzet a legkisebb, s ekkor a kettő
közé esik, hiszen súlyozott közepe lesz a két kiinduló szórásnégyzetnek. Erre példa az X = {1; 3; 8} és az Y = {3; 4; 5}.

Ekkor , míg az egyesített szórásnégyzet éppen köztük lesz (átlagaik egyenlők): .

Fontos észrevétel, hogy a szórást ahhoz viszonyítsuk, mekkora adatokról van szó. Két adathalmaz esetén az
összehasonlításnál nagyon lényeges, hogy nem az abszolút szórásokat kell alapul vennünk.

Példa. Vegyük a következő két tíz-tíz elemű adathalmazt: A = {1,2; 1,4; 1,1; 1,6; 0,9; 1,2; 1,6; 1,3; 1,2; 1,9}, illetve B = {940;
1351; 1023; 987; 1213; 1534; 897; 1123; 1265; 1034}. Mindkettő esetén számoljuk ki a szórást, az első esetben σA = 0,28, míg
az átlag x̄A = 1,34. A második esetben σB = 191,9, míg az átlag x̄A = 1136,7. Ha csak az abszolút szórást néznénk, akkor a
második adathalmazé majdnem négy nagyságrenddel nagyobb. Ám ott jóval nagyobb számokról is van szó. A szórást
éppen ezért célszerű az átlaghoz viszonyítva is megadni.

Relatív szórásnak nevezzük a szórás és az átlag hányadosát, jelekkel .

Példánkban az A adathalmaz esetén a relatív szórás kerekítve 0,21, míg a második B esetén még felfelé kerekítve is csak
0,17. Azaz a második halmaz adatai relatíve kevésbé szórnak, mint az elsőé. Hasonló igaz mérési eredmények esetén a
hibákra is. A relatív hiba értékelhetőbb számot ad az összehasonlításokhoz.

Megjegyzés. Más szóródási mérőszámok is léteznek. Egy ilyen a Gini-féle együttható, amelynek kiszámításához az
ismérv értékeinek egymáshoz viszonyított különbségeit használjuk. Képletszerűen:

Ez tehát minden adat minden másiktól való eltérésének átlagát mutatja. Előző példánkra alkalmazva GA = 0,152
(kevesebb, mint a szórás), illetve GB = 105,7 (itt arányaiban még kevesebb, mint a szórás). Módosítható, ha a 0-kat
kivesszük, s így n(n – 1)-gyel osztunk. Lehet eltérésnégyzet-összegekkel és végül gyökvonással is dolgozni, ahogyan az
empirikus szórásnál járunk el. Ezt azonban már az olvasóra bízzuk. Nem szokásos a használata.

Befejezésül a ferdeség mérésére egy másik, elterjedt jellemző a következő.

Egy gyakoriságeloszlás ferdeségének nevezzük a következő mértéket:


, ahol az adatokat jelöli xi, míg az átlagukat x̄ és Sn a tapasztalati szórást. Ha γ1 negatív, akkor balra
ferde, ha pozitív, akkor jobbra ferde, míg ha 0, akkor szimmetrikus eloszlásról beszélünk.

Látható, hogy itt az átlagtól való nagy eltérések jelentőségét a harmadik hatvány megnöveli, viszont a szórás köbével
való osztás éppen ezt kompenzálandó került a formulába.

Példa. Legyen ismét adathalmazunk az egymás utáni évek júliusi átlaghőmérséklete: 27,2; 24,5; 28,1; 29,2; 26,1; 28,8;
29,7. Átlaguk: 27,66; míg Fe = –3,1/6,39 = –0,485, azaz az eloszlás balra ferde. Emlékeztetünk, hogy ugyanezt kaptuk a
rendezett ferdeség alkalmazásakor is.

27.4. Idősorok
Nagyon gyakran jön elő statisztikai elemzések során az időbeliség, hogyan változik valami az idő múlásával, múltbeli
ismeretekből hogyan lehet jövőbeni következtetéseket tenni, trendeket felismerni.
Idősornak hívjuk valamely jelenségnek egymástól általában egyenlő távol levő időpontokban vagy időtartamokban
mért értékeit. Szokás ezt indexeléssel jelezni, azaz Xt jelöli az idősor egyes adatait, ahol t = 1, 2, …, n, nyilván n jelöli az
idősor „hosszát”.
Állapotidősornak mondjuk, ha adott időpillanatokban rögzítünk egy ismérvértéket. Egy üzletláncban például az
egyes árukészletnagyságok, minden este záráskor.
Tartamidősor egy adott időtartamban bekövetkezett események adataiból áll. Például hány gyermek született 1998-
ban, 1999-ben stb.

Példa a két idősorra.


Állapotidősor: a napi átlaghőmérséklet alakulása 2008 novemberében Budapesten

Dátum Hőmérséklet

1. 13,7

2. 12,9

3. 12,5

4. 12

5. 13,5

6. 12,8

7. 12,7

8. 10,8

9. 10

10. 8,2

11. 5,8

12. 6,2

13. 7,4

14. 7,4

15. 6

16. 4,2

17. 5,6

18. 1,5

19. 2,2

20. 6,6

21. 6,3

22. 0,6

23. -0,4
Dátum Hőmérséklet

24. 0,7

25. 0,8

26. 0,3

27. 0,8

28. 0,1

29. 2,6

30. 5,7

Tartamidősor: vendégéjszakák száma 2001-től 2007-ig ezerben

Megjegyezzük, hogy az eloszlás is változik, míg a vendégéjszakák száma folyamatosan növekedett, addig az egyes
kategóriák nem, a kétcsillagos például folyamatosan csökkent, a teljes növekedést csak a négycsillagos kategória
mutatta, tehát a szerkezet is átalakult, növekedik a minőségi turizmus.

Feladatunk ezen idősorok elemzésének alapeszközeit bemutatni. Ezek a dinamikus viszonyszámok, a gra kus
ábrázolások és az átlagok, melyeket most sorra veszünk.

Dinamikus viszonyszámok
Idősorok gra kus ábrázolása
Idősorok elemzése átlagokkal
Szezonális változások számítása

Dinamikus viszonyszámok
Kettőnél több adatból álló idősor esetén két dinamikus viszonyszámot de niálhatunk a bázis- és a láncviszonyszámot.

Bázisviszonyszám az idősor egyes adatainak a bázisul választott kezdő időszak (időpont) adatához viszonyított arányát

fejezi ki. Formulával: , ahol gyakran b = 1, de természetesen bármely más elemhez is viszonyíthatunk, mint
bázishoz, nemcsak az idősor első eleméhez.

Láncviszonyszámok az idősor egyes adatainak az azokat közvetlenül megelőzőhöz viszonyított arányát fejezi ki,

jelölése .

Ha valaki ismeri vagy a láncviszonyszámokat, vagy a bázisviszonyszámokat, akkor a másikat könnyen kiszámolhatja
anélkül, hogy az idősor adatait ismerné.

A következő összefüggések könnyen láthatók, ha a bázisnak választott elem az idősor első tagja: , illetve

fordítva .

Példaként vegyük a keresetek alakulását 1990-től, amit bázisévnek veszünk. A bal oldali táblázat minden adatot
ehhez viszonyít, míg a jobb oldali táblázat az előző évhez, tehát a bal oldali táblázat bázisviszonyszámokat, a jobb
oldali pedig láncviszonyszámokat tartalmaz. Ellenőrizhetjük az összefüggést is.
Idősorok gra kus ábrázolása
Általában vonaldiagrammal történik, ahol a töröttvonal az (i, Xi) pontokra illeszkedik egy szokásos derékszögű Descartes-
féle koordináta-rendszerben. Ilyet is láttunk már a vonaldiagramok bemutatásánál. Erről leolvashatók tendenciák,
trendek, csak vigyázni kell a gra kus manipulációkkal. A vendégéjszakás példánkat vegyük újra, ezúttal gra kusan a
táblázat helyett (27.21. ábra). Az első adatsor az összes, majd a 2. az öt-, a 3. a négy- és így tovább, a 6. az egycsillagos
hotelekben töltött vendégéjszakák száma szintén ezerben.

27.21. ábra

A korábban mondottak leolvashatók az ábráról. Nevezetesen, hogy nem párhuzamosan változik az egyes
szállodatípusok vendégéjszakáinak száma, de az összegük végig nő.

Idősorok elemzése átlagokkal


Az idősor esetén a lényeges tendenciákat a változások átlagolásával ragadhatjuk meg. Itt gyakran szezonális átlagolást is
végzünk, azaz például téli időszakot téli időszakkal vetünk össze, s nem számolunk egész évre vonatkozó átlagot olyan
helyzetekben, ahol nyilvánvaló szezonális hatások vannak. Télikabátot gyakrabban veszünk télen, míg fürdőruhát inkább
nyáron, hogy két egyszerű példát vegyünk.
A változásokat kétféleképpen mérhetjük: abszolút módon ilyenkor két időszak adatának különbségét, vagy relatív

módon, amikor a két időszak adatának hányadosát vesszük. Formálisan dt = Xt – Xt–1 az abszolút és a relatív
változás.

A fejlődés átlagos mértéke, amit szokás d̄-vel jelölni és a következőképpen de niálni:

A fejlődés átlagos üteme, amit szokás l̄-sal jelölni és következőképpen de niálni: . Mivel ,
ezért kifejezhető alakban is.

További meghatározások. Az állapot- és a tartamidősorokat különbözőképpen átlagoljuk. Mivel a tartamidősorok


összegezhetők, ezért egyszerűen számtani közepet használunk:

, ami az egy időszakra jutó átlagos értéket jelenti.


Az állapotidősorok esetén az összegnek nincs értelme, ezért két időpont (mint pl. nyitó- és záróállomány) átlagát
vesszük, több időpont esetén a két időpontra számított átlagok átlagát.

A átlagot kronologikus átlagnak nevezzük (ezt jelöli a k betű az indexben),

amit a meg gyelt adatokból egyszerűbb alakban is megadhatunk: .


Szezonális változások számítása
Ebben a fejezetben egészen röviden arról beszélünk, hogy miként lehet idősorokban észrevenni szezonális változásokat
(például évszakonként). Nézzük az energiafelhasználást negyedévenként 2000-ben, 2001-ben és 2002-ben. Ábrázoljuk az
adatokat egy vonaldiagramon (27.22. ábra).

Időszak Energiafelhasználás, millió kWh

2000. I. negyedév 142,7

2000. II. negyedév 105,2

2000. III. negyedév 96,5

2000. IV. negyedév 137,8

2001. I. negyedév 152,3

2001. II. negyedév 112,4

2001. III. negyedév 99,8

2001. IV. negyedév 159,4

2002. I. negyedév 149,6

2002. II. negyedév 108,4

2002. III. negyedév 96,8

2002. IV. negyedév 149,2

27.22. ábra

Ebben az esetben trendeket az azonos szezonra vonatkozó adatokkal érdemes készíteni, tehát lehet például egyenest
illeszteni az első, a második, a harmadik és végül a negyedik negyedéves adatokra (27.23. ábra).
Ezekre azután (persze jobb lenne nagyobb adathalmazt vizsgálni) meg lehet próbálni egyenest illeszteni vagy egyéb
függvényt. A módszer lényege, hogy valamiféle periodikusság észrevételével az egyes hasonló periódusokat külön kezeljük.
Ez a módszer lényege, amivel most többet nem kívánunk foglalkozni.

27.23. ábra

27.5. Összefüggések két ismérv között


Az eddigi vizsgálataink ún. egydimenziósak voltak, azaz egy ismérv szerinti eloszlásokat, gyakoriságokat, diagramokat
vizsgáltunk, jellemzőiket és szóródási mértékeiket adtuk meg. Ebben a fejezetben viszont a kétdimenziós leíró statisztikát
mutatjuk be röviden (ennek alapján elképzelhető már a többdimenziós is). Minősítéses ismérvek esetén a
kontingenciaanalízist, míg méréses adatokra az ún. regresszió- és korrelációs analízist foglaljuk össze.

A kontingenciaanalízis elemei
Lineáris regresszió és korreláció
Egyéb nem lineáris regressziófajták
Exponenciális és logaritmikus regresszió számítás

A kontingenciaanalízis elemei
Vizsgáljuk 120 felnőtt, köztük 54 fér és 66 nő kozmetikai kiadásainak alapján a nem és a kozmetikai kiadások kapcsolatát.
Az adatokat az alábbi táblázat tartalmazza:

Havi kozmetikai kiadás forintban

2500 Ft alatt 2500 és 5000 Ft között 5000 Ft felett

Fér 20 28 6

Nő 7 38 21

Az ilyen többmezős táblázat esetén egy plusz sort és oszlopot fogunk hozzáfűzni, amely a sorban, illetve az oszlopban
levő számok összegét mutatja majd. Esetünkben a kibővített táblázat a következőképpen néz ki:

Havi kozmetikai kiadás forintban

2500 Ft alatt 2500 és 5000 Ft között 5000 Ft felett sorösszeg

Fér 20 28 6 54

Nő 7 38 21 66

Oszlopösszeg 27 66 27 120

Itt az oszlopösszegek eloszlása mutatja, hogy összesen (fér ak és nők együtt) hányan költenek 2500 Ft alatt, 2500 és
5000 Ft között, illetve 5000 felett havonta. A sorösszegek azt mutatják, hogy mennyi a fér ak és a nők száma a
megkérdezettek között.
Mind az ún. peremsor és oszlop kifejezhető százalékosan is, gyelembe véve a 120-as számot, mint a minta terjedelmét.
Ekkor az oszlopösszegekből rendre 22,5 – 55,0 – 22,5%, míg a sorösszegekből 45, illetve 55% lesz.
Ha függetlennek feltételeznénk a nemet és a kozmetikai kiadásokat egymástól, akkor a táblázat belső mezőiben a
peremeloszlások szorzata jelenne meg (lásd a 26.2. fejezetet). Azaz 0,225 és 0,45 szorzata 0,101, ami 120-nak kb. 10%-a, tehát
12. Így rendre a következő egészre kerekített számoknak kellene állnia a táblázatban:

12 30 12

15 36 15

Ezek lennének a függetlenség esetén várható értékek a peremeloszlások alapján.


Bevezetünk egy mértéket, amely normáltan a mért értékek (táblázatban szereplő számok) és az elvárt számok közötti
eltérést fejezi ki.

Legyen , ahol n a sorok, m az oszlopok száma (esetünkben n = 2 és m = 3, hiszen kétszer hármas


táblázatból indultunk ki). Mij jelöli az t-edik sor és a j-edik oszlopban álló táblázatbeli elem értékét osztva N-nel, ahol

természetesen N a táblázatban szereplő elemek összege (az összes vizsgált egyed: , míg a Vij szám a
függetlenség feltételezése esetén várhatóan ott álló számot jelöli, amit úgy kapunk meg, hogy a peremeloszlásokat

szorozzuk össze, azaz: .

Könnyen látható, hogy χ2 = 0 csak akkor lép fel, ha minden különbség 0, azaz független egymástól a vizsgált két dolog
(jelen esetben a nem és a kozmetikai érdeklődés). χ2-nek van azonban egy hátrányos tulajdonsága, hogy a függőséget
viszont nem jól méri, mivel végtelen naggyá is válhat. Ezért „normálni” próbáljuk, mint korábban a valószínűséget is, s ezt
a célt szolgálja a kontingenciaegyüttható.

Kontingenciaegyütthatónak nevezzük a következő mértéket: , mivel Pearson vezette be, ezért szokás
Pearson-féle kontingenciaegyütthatónak is nevezni.

Látható, hogy ez már legfeljebb 1-hez tart, ha χ2 tart a végtelenhez, azaz teljesül: 0 ≤ K ≤ 1. Még egy korrekcióval azt is el
lehet érni, hogy az 1-et felvegye, ehhez képezzük a korrigált kontingenciaegyütthatót.

Korrigált kontingenciaegyütthatón értjük a , ahol , és k = min{m; n}.

Példánkban a következők adódnak:

, közel van a 0-hoz, tehát majdnem függetlennek mondható a nem és a

kozmetikára költött pénz mint változók. Egyébként ettől alig tér el a korrigált együttható, , ami
szintén elég kicsi érték.
Vannak más lehetőségek is, ilyen például a Spearman-féle rangkorreláció, amelyet szintén lehet minősítéses
ismérveknél használni, vagy a Cramer-féle együttható, amit C-vel szokás jelölni.

Cramer-féle kontingenciaegyütthatónak nevezik a következő mennyiséget:

ahol χ2 a korábbiakban de niált, N és k ismét az összes adatok számát, illetve k = min{n; m}, azaz a sorok oszlopok
száma közül a kisebbiket jelölik.

Előnye, hogy mindenféle korrekció nélkül igaz, hogy 0 ≤ C ≤ 1, és természetesen, ha függetlenek, akkor 0, hiszen ekkor
χ2 = 0.
Szokás még, mivel a kétszer kettes táblázatok gyakran fordulnak elő, ezekre egy konkrét formulát adni a Cramer-féle
együttható használatával. Legyenek a, b, c, d pozitív egész számok, melyek egy 2 × 2-es táblázatban szerepelnek, akkor erre
a konkrét esetre a Cramer-együtthatót szokás φ-vel jelölni, s a következőképpen lehet számolni:

ami természetesen függ a sorok és oszlopok elrendezésétől, de értéke nem.

Megjegyzés. Használatára általánosan elfogadott, hogy legalább 25 adat esetén számoljuk ki, azaz N > 25. Továbbá, ha

N < 100, akkor még a Yates-korrekció is használatos, a számlálóba | ad – bc | helyett -t írunk.


Példa. Vizsgáljuk meg a nem és a dohányzás kapcsolatát. Megkérdeztünk 60 embert, és a következő táblázatban
összegzett eredmény adódott (elkészítve már a peremadatokat is).

Dohányos Nem dohányos Összesen

Fér 14 18 32

Nő 16 12 28

Összesen 30 30 60

Ebből a képletünk szerint a Yates-korrekció nélkül adódik, a


korrekcióval pedig ugyanez adódik negatív előjellel.
Azaz nem erős, de létező kapcsolat van a dohányzás és a nem között. Ezekből az adatokból az látszik, hogy a nőknél
erősebb a dohányzás, mint a fér aknál. A többi együtthatót is ki lehet számolni, rendre: K= 0,1325, illetve Kkorr =
0,1873. Egyik sem mutat nagyon erős kapcsolatot, de függetlenség sem mondható, ha ezeket az adatokat kaptuk.

Lineáris regresszió és korreláció


Ha mindkét ismérv, amelyek közötti összefüggést vizsgáljuk, méréses, akkor elkészíthető egy koordináta-rendszerben az
ún. pontfelhődiagram, amelyben minden vizsgált objektum vagy személy két ismérv szerinti adata a két koordinátaértékét
adja meg. Erre nézzük a következő példát.

Legyen 15 fér testmagassága és lábmérete a következő: (181, 43); (176, 41); (184, 42); (172; 40); (186, 44); (180, 42); (166,
41); (181, 43); (176, 41); (182, 44); (180, 43); (169, 40); (192, 46); (188, 43); (177, 41).

27.24. ábra

Már közvetlenül is leolvasható több fontos dolog a pontfelhődiagramról (27.24. ábra). Így bizonyos trendek, továbbá a
szétszórtsága is jellemző. Ha van valamilyen trend, mondjuk lineáris kapcsolat, akkor egy egyenessel jól közelíthetők a
pontok. Ezt az egyenest nevezzük regressziós egyenesnek, s a következőkben egy módon de niáljuk is. Ehhez először egy
Gauss által használt módszert, a legkisebb négyzetek módszerét hívjuk segítségül. Fogalmazzuk ezt meg most
matematikailag két esetben is. Egyszer, amikor az egyik, egyszer, amikor a másik koordináta egyenestől való eltérésének
minimalizálását célozzuk.

Megjegyzés. Természetesen nézhetnénk mást is, például egy harmadik eset lehetne, hogy olyan egyenest keresünk,
amelytől a pontfelhő pontjainak távolsága összege minimális, tehát ekkor a Pitagorasz-tétel szerint mindkét
koordináta eltérésének négyzetösszegét kellene minimalizálni. Ez jóval bonyolultabb feladat, s ezért is terjedt el
inkább a fenti, két eltéréssel operáló módszer.

Legyenek Pi(xi, yi) a sokaságot X és Y ismérv szerint jellemző pontok egy koordináta-rendszerben. Azt az y = ax + b
alakú egyenest keressük, amelytől vertikálisan a legkevésbé térnek el ezek a pontok, amit az y koordináták eltérésének

négyzetösszegével mérünk. Tehát azt az a és b valós számot keressük, amire az függvény


minimális, ahol (xi, yi) a mért adataink. Az így meghatározott egyenest nevezzük első regressziós egyenesnek.

Teljesen hasonló módon megy, ha az x koordináták különbségeinek négyzetösszegével dolgozunk. Ez vezet a következő
fogalomhoz.

Legyenek Pi(xi, yi) a sokaságot X és Y ismérv szerint jellemző pontok egy koordináta-rendszerben. Azt az x = a* y + b*
alakú egyenest keressük, amelytől horizontálisan a legkevésbé térnek el ezek a pontok, amit az x koordináták
eltérésének négyzetösszegével mérünk. Tehát azt az a* és b* valós számot keressük, amire az

függvény minimális, ahol (xi, yi) a mért adataink.


Az így meghatározott egyenest nevezzük második regressziós egyenesnek.

A következőkben megmutatjuk, hogyan lehet ezeket az egyeneseket meghatározni. Kétváltozós függvény szélsőértékét
kell megkeresni, s mivel másodfokú polinomfüggvényekről van szó, melyek di erenciálhatók, így lehet az analízisben
tanult módszereket használni. Ehhez először a minimalizálandó függvényt alakítsuk át egyszer úgy, hogy az a változója
szerint, egyszer úgy, hogy a b szerint könnyen di erenciálható legyen.

illetve

Szélsőérték létezésének szükséges feltétele, hogy ezek a parciális deriváltak 0-val egyenlők legyenek. Így az alábbi
lineáris egyenletrendszert kapjuk a keresett a és b értékre:
Ennek megoldása:

Kicsit rövidebb a formula, ha a b kifejezésébe beírjuk az a-t.

Megmutatható például további di erenciálással vagy az előjelváltás módszerével, hogy ez valóban minimumhely, a
Hesse-mátrix pozitív lesz. Azaz megtaláltuk az első regressziós egyenes két paraméterét.
Ugyanezzel a módszerrel kaphatjuk meg a második regressziós egyenes *-gal jelölt paramétereit:

Általában ez a két regressziós egyenes nem esik egybe. Annál szorosabb azonban a lineáris kapcsolat a két ismérv
között, minél kisebb a két egyenes meredekségének az eltérése.
Mivel a második korrelációs egyenest nem y függvényében adtuk meg, ezért végezzünk el először egy átalakítást, a
második egyenes szokásos egyenlete:

A két meredekség (azaz az első és a második regressziós egyenes meredeksége) arányát, tehát az
mennyiséget szokás r2-tel jelölni és ennek négyzetgyökét, |r|-t Pearson-féle lineáris korrelációs együtthatónak
nevezni. Azaz .

Szélsőséges esetben, ha az adatok tényleges egy egyenesre illeszkednek, akkor természetesen mindkét regressziós

egyenes ezzel egybeesik, azaz ekkor , vagyis r = 1. Ilyenkor maximális lineáris korreláció (összefüggés) van a két
ismérv között. A másik szélsőséges eset, ha a két regressziós egyenes merőleges egymásra (két egyenes esetén ennél
nagyobb szöget nem tudunk elképzelni), ilyenkor a lineáris korreláció r = 0. Ebben az esetben gyakorlatilag semmilyen
lineáris összefüggésről nem beszélhetünk.
Általában pedig természetesen a két határeset, a 0 és az 1 közé esik a Pearson-féle lineáris korrelációs együttható.
A Pearson-féle korrelációs együtthatót kifejezhetjük közvetlenül az adatainkkal is, s ekkor előjele is lesz, ha elhagyjuk

az abszolút értéket, tehát az mennyiséget, melynek előjele pontosan


akkor pozitív, ha a regressziós egyenesek növekvők, míg negatív, ha csökkenők. Értéke a [–1, 1]-be esik, és maximális az
összefüggés, ha 1 vagy –1 az értéke. A 0 pedig a teljes lineáris összefüggéstelenséget jelenti.
Összefoglalva: két ismérv közötti lineáris összefüggőség erősségét mérhetjük a Pearson-féle lineáris korrelációs
együtthatóval.
Egy másik korrelációs mérőszám a Spearman-féle korrelációs együttható. Ennek előnye, hogy nemcsak méréses
adatok, hanem rendezhető minősítéses ismérvek esetén is, tehát egy szélesebb körben használható „összefüggésmérték”.
Mivel az adatok különböző ismérv szerinti sorba rendezésével lehet meghatározni, ezért elterjedt a rangkorrelációs
együttható elnevezés.
Ha van n adatunk két különböző ismérv szerint egy sokaságból, akkor minden egyed esetén megmondhatjuk, hogy az
hányadik az első, illetve hányadik a második ismérv szerint sorba rakott adatsorban. Azaz ezúttal egy sokaságból vett
elemhez rendelt (x, y) számpár mindkét eleme egy pozitív egész szám 1 és n között. Azaz a pontfelhő koordinátái az egyes
egyedek adatainak a kétféle rangsorban elfoglalt értékei lesznek. A továbbiakban ugyanúgy dolgozunk, mint a Pearson-féle
lineáris korrelációs együtthatóval, csak egyszerűbbek lesznek a számok, amivel dolgozni kell, hiszen ezúttal:

ahol a két különböző rangsorban elfoglalt hely különbségét jelöltük di-vel.


Ezekkel az összefüggésekkel, ha felírjuk a Pearson-féle lineáris korrelációs együtthatót, akkor a következőt kapjuk:

Ez utóbbi mennyiséget egyszerűsítve kapjuk a Spearman-féle korrelációs együtthatót. Könnyen látható, hogy erre az
együtthatóra is teljesül a – 1 ≤ rs ≤ 1 egyenlőtlenség. De két előnye is van a Pearson-félével szemben:
1. nemcsak méréses ismérvek esetén használható, tehát szélesebb körű,
2. lényegesen kisebb a számolásigénye, mindössze n különböző rangszám-di erencia négyzetösszegét kell képezni, s
abból már könnyen adódik.
Ezért vezetjük be tehát a következő fogalmat:

Spearman-féle rangkorrelációs együtthatónak nevezzük a következő számot: , ahol n jelöli az


adatsokaság terjedelmét, míg di jelöli egy egyed (objektum) két ismérv szerint rangsorolt helyének különbségét.

Példa méréses adathalmazra, ahol mindkét együttható számolható. Vegyük a 12 legnagyobb járműgyártó
multinacionális céget, és vizsgáljuk meg, milyen korreláció van a foglalkoztatottak száma és az éves forgalom között.
Az alábbi táblázat tartalmazza a megfelelő adatokat.

Láthatóan eltérnek egymástól. Csak a Spearman-féle korreláció számolható ki minden olyan esetben, ahol csak
rendezéses adataink vannak.

Egyéb nem lineáris regressziófajták


Ebben a fejezetben azt mutatjuk meg röviden, hogy a fenti módszerek hogyan alkalmazhatók más függvénytípusú
összefüggés esetén. Azaz, amikor a két változó között nem lineáris, hanem például másodfokú vagy egyéb magasabb fokú,
ún. polinomiális kapcsolatot tételezünk fel. Természetesen lehet bármilyen más függvénytípus, így elég gyakori az
exponenciális vagy logaritmikus összefüggés is.

Exponenciális és logaritmikus regresszió számítás


Egy nagyon egyszerű transzformációs lehetőséggel fogunk élni, amivel visszavezetjük a már ismert lineáris regresszió
számításra. Ha azt feltételezzük, hogy az X és az Y között exponenciális a kapcsolat, akkor X és ln Y között lineáris lesz. Ez
az ún. logaritmikus ábrázolás. Tehát vesszük az (xi, ln yi) pontokat, s rájuk az előző fejezetben mutatott két módszerrel
egyeneseket illesztünk. Ha ezek meredeksége közel esik, akkor jogos a lineáris kapcsolat feltételezése, s ekkor, ha pl. ln y =
ax + b a kapcsolatot jellemző első regressziós egyenes, akkor nyilván igaz lesz, hogy y = eax+b = Ceax, ahol a C-vel jelölt
konstansra fennáll, hogy y = eb. Azaz exponenciális kapcsolatot találtunk.
Ugyanennek az inverze a logaritmikus kapcsolat, ilyenkor X és eY között keresünk lineáris kapcsolatot, s abból
visszakapjuk az eredeti logaritmikust. Mindkét esetben a lineáris korrelációs együtthatóval mérjük az exponenciális vagy
logaritmikus kapcsolat erősségét, azaz vesszük X és ln Y, illetve X és eY lineáris korrelációs együtthatóját, s ha ezek 1
közelében vannak, akkor jogos volt a feltételezésünk.
Így már csak a kezdetben felvetett polinomiális korreláció maradt hátra, melyből csak a másodfokút mutatjuk be, a
többit az olvasóra bízzuk, illetve forrásokat adunk (lásd például Kröp , B.–Peschek, W.–Schneider, E.–Schönlieb, O.:
Alkalmazott statisztika. Műszaki Kiadó, Budapest, 2000).

Másodfokú regresszió számítás

Másodfokú regresszió számítás


Legyen a kapcsolatot kifejező összefüggés: Y = aX2 + bX+ c, ahol természetesen az adatokból a három együtthatót, a-t, b-t és

c-t szeretnénk meghatározni. Ehhez ezúttal is minimalizálni fogunk, mégpedig az


függvényt. Ezt ismét di erenciálással tesszük, és a parciális deriváltakat (a, b és c szerint) nullával egyenlővé téve kapjuk a
következő egyenletrendszert:

Ha ebből határozzuk meg a három keresett paramétert Cramer-szabállyal, akkor felhasználva a következő egyszerűsítő
jelöléseket a hatványösszegekre

akkor a következő adódik:

hasonlóan

és
Bonyolultságuk miatt ezeket a számításokat (ahogyan már a lineáris regreszsziót is) általában számítógéppel
számítják.

Példa. Az egyszerűség kedvéért nézzünk egy mindössze négy adatpáros esetet, amiről azt gondoljuk, hogy
másodfokú a kapcsolat a két változó között. Adataink a következők, melyek négy tó hossza km-ben (legnagyobb
távolság a partján lévő települések között) és a vízfelületük nagysága km2-ben adódnak: (72; 256), (45; 168), (13; 85), (6;
28). Ekkor a megfelelő hatványösszegek rendre: s4 = 31 004 338; s3 = 466 786; s2 = 7414 és s1 = 136, míg t2 = 1 682 677; t1 =
12 865; t0 = 537. Ezekkel a három együtthatóra adódik, mint legjobban illeszkedő másodfokú függvény paramétereire:
a = 1,4916; b = –332,13; c = 1338,122.

27.6. Összetett intenzitási viszonyszámok és indexálás

A standardizálás módszere
A standardizálás módszere
Ebben a fejezetben először arra ismerünk meg egy magyar statisztikus, Kőrösy József által kidolgozott módszert, amikor
két időszak között nemcsak az egész sokaságra jellemző átlagok változnak meg, hanem a sokaság bizonyos csoportjainak
egymáshoz viszonyított helyzete is. Például Magyarországon 1999-hez képest 2000-ben nőtt a gazdasági teljesítmény, de ez
nem egyenletesen történt az egész országban, azaz bizonyos régiók közötti különbségek tovább nőttek, mások csökkentek.
Egy másik példa, hogy ha a reálbérek növekedését külön a fér akra és a nőkre vizsgáljuk, akkor szintén eltérő
eredményeket kaphatunk, mint az egész lakosságra vonatkozó átlagok gyelembevételével. Ráadásul időnként egészen
paradox jelenségeknek lehetünk szemtanúi. Vegyünk két vállalkozást, és hasonlítsuk össze a dolgozók átlagkereseteit nem
szerinti megoszlásban, tehát külön a fér ak és külön a nők esetén. Eredményeinket a következő táblázat tartalmazza.

I. vállalkozás II. vállalkozás


Nem
összes jövedelem (ezer Ft) létszám összesjövedelem (ezer Ft) létszám

Fér 4000 40 2750 25

Nő 600 10 2275 35

Összesen 4600 50 5025 60

Ha most a következő táblázatban az átlagokat adjuk meg ezen adatok alapján, akkor találkozunk a paradox jelenséggel.

Nem I. vállalkozás, átlagjövedelem (Ft) II. vállalkozás, átlagjövedelem (Ft)

Fér 100 000 110 000

Nő 60 000 65 000

Cégátlag 92 000 83 750

Azaz mind a fér ak, mind a nők jobban keresnek a második cégnél, mégis az egész cégre vett jövedelemátlag
tekintetében az első cég a jobb. Tehát a részletek ismerete nélkül, pusztán a céges átlagok alapján azt mondhatnánk, hogy
az első cég jobban zet. A részletek tanulmányozása azonban arra vezet, hogy ezt felülbíráljuk. Ezt a különös jelenséget
nevezik Simpson-paradoxonnak, arról a statisztikusról elnevezve, aki először tanulmányozta a jelenséget komolyabban.
Első cikke 1951-ben jelent meg, bár már Yule észrevette, és írt róla egy kevéssé ismert tanulmányt 1900 körül. Ez azt
mutatja, hogy egy-egy összehasonlítandó sokaság főátlagaiból nem lehet önmagában következtetést levonni, mivel
valamilyen szempont szerinti felbontásuk esetén akár az is előfordulhat, mint példánkban, hogy a főátlag szerint jobb
sokaság minden egyes megfelelő részcsoportjában alacsonyabb átlagokat mérünk. Ez mindig olyankor lép fel, ha nagyon
eltérőek a csoportlétszám-arányok a két sokaságban. Példánkban az első cégnél jelentős fér többség van, míg a másikban a
nők vannak többségben. A két főátlag eltérése nem magyarázható tehát a részátlagok eltérésével, hanem a részek eltérő
aránya is szerepet játszik. Így megállapításainkhoz mindkét tényezőt gyelembe kell venni. Ezt a két hatást, tehát a nemi
különbségek és a nemek eloszlásának arányát külön kell választani. Ezt a módszert fogjuk standardizálásnak nevezni.

A standardizálás módszerével időben (térben) eltérő főátlagok (összetett intenzitási viszonyszámok) közötti
különbséget (vagy hányadost) összetevőkre (tényezőkre) bontjuk.

Kőrösy a különböző területeken élők halálozási arányszámait (1000 főre eső halálozás adott években) vizsgálta
Magyarországon területi eloszlásban. Eközben vette észre, hogy helytelen eredményre vezet, ha csak ezeket a számokat
hasonlítja össze, gyelmen kívül hagyva az egyes területek életkörülményeiben meglévő különbségeket, a lakosság időbeli
változását egy adott területen vagy például az egészségügyi ellátás különbözőségeit. Ennek kiküszöbölésére vezette be a
standardizálást, ahol a különböző területek népességének átlagos halálozási arányszámát úgy értelmezte, mint az egyes
életkorcsoportok halálozási arányszámainak összetett intenzitási viszonyszámát, melyet a részviszonyszámok nagysága és
a népesség kor szerinti összetétele együttesen határoz meg. Egy érdekes mai példa, hogy Svédországban jóval magasabb
halálozási számokat mérhetünk, mint Mexikóban. Ez azonban nem arra vezethető vissza, hogy sokkal jobb az életminőség
vagy az egészségügyi ellátás Mexikóban, mint a jóléti Svédországban, hanem arra, hogy a svéd lakosság nagyon
elöregedett. Mexikóban igen nagy a atalok aránya, akik körében bár jóval magasabb a halálozási arány, mint svéd
kortársaiknál (de azért természetesen kisebb, mint a 70 év felettieknél, ahol egyébként szintén Mexikóban rosszabb az
elhalálozási arány), de olyan sokan vannak, hogy ez a teljes halálozási arányt megjavítja.
Általában a térbeli elemzésnél az átlagok különbségeire, míg az időbelinél az egyes időtartamokban mért átlagok
arányainak meghatározására koncentrálunk. Ezért a következő táblázatban mindkettőt együtt mutatjuk be.
Összetett intenzitási viszonyszámok meghatározása és összehasonlítása
ahol a 8. és 9. oszlopban levő számok jelentése: Kj = Vj1 – Vj0, illetve valamint az utolsó sorban K = V̄1 – V̄0, illetve

. A szóban forgó okok hatását úgy fogjuk kimutatni, hogy mind a K különbséget, mind az I hányadost két
„összetevőre” K′ és K″, illetve I′ és I″ bontjuk úgy, hogy
1. K = K′ + K″, illetve I = I′ · I″, valamint
2. az egyes összetevők (tényezők) közül az első K′ (I′) a megfelelő részviszonyszámok közötti átlagos különbséget
(hányadost), míg a második K″ (I″) a két sokaság eltérő összetételének a hatását mérje.
A különbségfelbontást általában a térbeli, míg a hányadost az időben zajló jelenségeknél használjuk.
Valójában arra vagyunk kíváncsiak, hogy az átlagok eltérését mennyire okozza a szerkezeti különbség a két sokaság
között, s mennyire az egyes elemek eltérő tulajdonságai. Ezért úgy bontunk különbséget (hányadost) összetevőkre
(tényezőkre), hogy azok ezt a két okot valahogyan elkülönítsék, amit sokszor hasznos tudni az elemzőnek, aki a statisztikai
átlagokat használja. Első példánkban, a szupermarketek összehasonlításakor arra vagyunk kíváncsiak, hogy az átlagos
vásárlás értékében mutatkozó eltérés milyen mértékben függ a vevők eltérő vásárlási szokásaitól (kártya vagy készpénz), s
mennyire attól, hogy más anyagi erővel rendelkező vevők látogatják az egyik, illetve a másik üzletet.

Példa

Látható, hogy az A szupermarketben mindkét kategóriában alacsonyabb az egy vevőre eső vásárlás értéke. Másrészt
viszont elég eltérőek a vásárlási szokások, az elsőben nagyarányú a bankkártyás zetés, a másikban jóval
alacsonyabb. Emiatt az átlagos vásárlás értéke paradox módon magasabb lesz mégis az elsőben. De akkor ezt az eltérő
szerkezet nagyobb hatása okozza. Ha tehát csak az egy főre jutó vásárlást néznénk, akkor azt gondolnánk, hogy az
első szupermarketbe járnak a jobb módú emberek. Lényegében az első komponenst úgy számoljuk, hogy a második
szupermarketet alapul véve kiszámoljuk az egy főre jutó vásárlást a két eloszlás szerint súlyozva, s ennek különbsége
adja majd K′-t. Azaz 2300 · 0,333 + 11 000 · 0,667 – 3000 · 0,333 + 12 000 · 0,667 = – 900, tehát ha a második
szupermarketbeli vásárlás megoszlását vesszük alapul, akkor –900 Ft lenne a különbség. Ezután K″ meghatározása
következik, ahol az első szupermarket egy főre jutó vásárlását vesszük alapul, és a két különböző megoszlással
számoljuk a különbséget: 2300·0,083 + 11 000·0,917 – 2300·0,333 + 11 000·0,667 = 2175.
Azaz az 1275 eltérés az első szupermarket javára úgy jön ki, hogy az egy főre eső vásárlás hatása –900 Ft-ot ad (azaz
ebből a szempontból a B szupermarketbe járnak a nagyobb pénzű emberek), míg a kártya miatti nagyobb vásárlási
kedv hatása a két üzlet viszonylatában 2175 Ft az első szupermarket javára. A kettő összege 1275 Ft. Tehát a két hatás
együttese így bontható fel a komponensek hatására.

A táblázatunk jelöléseit használva a komponensekre bontás a különbség (K) esetén a következőképpen zajlik.

Jelölje a két hatásra szétbontott különbség komponenseit K′ (részhatáskülönbség) és K″ (összetételhatás-különbség).

Számításuk a következőképpen történik: , ahol Bj(st) a választott „standard”

súlya a j-edik csoportnak, pl. Bj(st) = Bj1. Hasonlóképpen adható meg , ahol Vj(st)
az egyes csoportok választott standard részviszonyszáma, pl. Vj(st) = Vj0. Fontos, hogy ha K′-nél standardnak az 1-es
sokaságot vettük, akkor K″-nél a 0-st kell venni. Természetes fordítva is lehet, ha az elsőnél a 0-st, akkor a másodiknál
az 1-est kell venni. Könnyen látható, hogy ekkor teljesül a K = K′ + K″ egyenlőség.

Következő példánkban időbeli különbség miatt intenzitásokat vizsgálunk, tehát az arányt a különbség helyett.

Az otthonban lakók 1 főre jutó átlagos gyógyszerfogyasztása (ezer Ft) Az otthon lakóinak száma (fő)
Életkor
2000 2003 2000 2003

60–70 2 1 50 40

71–80 4 3 30 80

81– 8 7 20 80

Összesen 100 200


A táblázat adatai alapján meghatározható a két év közötti 1 főre jutó átlagos gyógyszerfogyasztás eltérése. Ehhez a

lakók számát kell használnunk, 2000-ben adódik: , míg 2003-ban ugyanez

az átlagérték: . Azaz mivel ilyenkor hányadost nézünk (időbeli változás),

tehát , azaz 10,5%-kal nőtt az egy főre eső átlagos gyógyszerfogyasztás. (Ezt fogjuk
főátlagindexnek nevezni.) Ez az adatokat nézve elsőre meglepő, hiszen ismét minden korosztály esetén csökkent az
egy főre vetített átlagos gyógyszerfogyasztás költsége. Ne feledjük, hogy változott viszont az otthon lakóinak kor
szerinti összetétele. Ismét próbáljuk szétválasztani a csoportonkénti részátlagok arányainak hatását és a
csoportösszetétel-változás hatását. Ehhez nézzük meg először, hogy a részátlagindex mekkora, azaz milyen hatást
gyakorolnak a részviszonyszámok változásai az összetett viszonyszám (főátlagindex) változására.
Mindig a tárgyidőszakot, esetünkben a 2003-as évet választjuk bázisnak, amikor az összetételt vesszük alapul. Tehát

a számolás menete: . Tehát ha az összetétel-változást


kiküszöböljük, akkor az egyfőre eső gyógyszerfogyasztás értékének átlagos változása az indexre csökkenő hatást
gyakorol. I′ = 0,808. Vagyis kevesebb vagy olcsóbb gyógyszereket fogyasztanak. Az öszszetétel-változás hatását úgy
számoljuk, hogy standardnak a bázisidőszak, tehát a 2000-es év gyógyszerfogyasztását vesszük alapul, azaz:

, azaz 136,8%, tehát 36,8%-kal növelte az összetétel-változás az egy


főre eső gyógyszerfogyasztás értékét (öregedtek a lakók). A két hatás együtt adja az főátlagindex, azaz az egy főre eső
átlagos gyógyszerfogyasztás értékének változási arányát: I′·I″ ≈ 0,808 · 1,368 ≈ 1,105.

A feladatban látottak formális megfogalmazása a következő összefüggés.

Jelölje a két hatásra szétbontott hányados komponenseit I′ (részátlagindex) és I″ (összetételhatás indexe).

Számításuk a következőképpen történik: , ahol mindig Bj(st) = Bj1. Hasonlóképpen adható meg

, ahol Vj(st) az egyes csoportok választott standard részviszonyszáma: Vj(st) = Vj0.


Könnyen látható, hogy ekkor teljesül az I = I′ · I″ egyenlőség.

27.7. A matematikai statisztika alapelvei, hipotézisvizsgálat


Ebben a fejezetben a bevezetőben említett statisztikai feladatot próbáljuk megoldani, nevezetesen ismeretlen
valószínűségeket vagy más eloszlásokra vonatkozó paramétereket meghatározni. A probléma igen általános és a
következőképpen fogalmazható meg. Ha egy esemény valószínűségét szeretnénk „statisztikailag” meghatározni, akkor az
egyetlen, amit tehetünk, hogy lehetőleg sokszor meg gyeljük, azaz kísérleteket végzünk, és ezek alapján próbálunk
következtetéseket levonni. Ebben a valószínűség-számítás eredményeit fogjuk használni, tehát a két téma szoros
kapcsolatára világít rá ez a fejezet. A matematikai statisztika a XX. század első harmadában indult fejlődésnek, egyik első
nagy alakja R. A. Fisher angol kutató (igazából természettudós, biológus), aki a hipotézisteszt fogalmát, módszerét és
gyakorlati alkalmazásait először dolgozta ki és vezette be. Ezzel kezdjük a fejezetet.
A módszer lényege a következő. Először is veszünk egy hipotézist, amit szeretnénk egy véletlenszerűen megkonstruált
kísérlettel ellenőrizni; azaz vagy cáfolni (ilyenkor mondjuk szigni kánsnak), vagy elfogadhatónak tartani. A véletlen
szerepe az, hogy a hipotézisről való döntésünk hibáját valahogyan valószínűségekkel tudjuk mérni (hiszen valószínűségről
véletlen események körében tudunk beszélni). Nyilván azt szeretnénk, ha a hiba valószínűsége kicsi szám lenne. Vegyünk
egy igen egyszerű helyzetet példaként.
Valaki szeretné eldönteni, hogy egy pénzérme szabályos-e. Legyen a hipotézise az, hogy szabályos. Ennek az a jelentése,
hogy a fej (vagy írás) dobás esélye ½. Jelen esetben tehát egy paraméter a pénzérme fej dobásának a valószínűsége az
ismeretlen paraméter.

Paramétertérnek nevezzük mindazon értékek halmazát, amelyek szóba jöhetnek, jelölése általában Θ.

Vizsgálandó példánkban Θ = [0; 1].

A nullhipotézis mindig ennek a paramétertérnek egy részhalmaza, amit Θ0-lal szokás jelölni.
Esetünkben egyetlen elemű: Θ0 = {0,5}.

Az alternatív hipotézis a paramétertér nullhipotézisének komplementere, azaz Θ–Θ0.

Esetünkben Θ–Θ0 = [0; 1] – {0,5}.

Ha a nullhipotézis egyelemű halmaz, akkor a nullhipotézis egyszerű, ellenkező esetben összetett. Hasonlóan az
alternatív hipotézis is lehet egyszerű vagy összetett.

Nyilván példánk egyszerű nullhipotézissel foglalkozik.

Ha H0: ϑ = ϑ0 nullhipotézis és H1: ϑ > ϑ0 (vagy H1: ϑ < ϑ0) alternatív vagy ellenhipotézis, akkor egyoldali ellenhipotézisről,
illetve egyoldali próbáról, míg a H0: ϑ = ϑ0 nullhipotézis és H1: ϑ ≠ ϑ0 alternatív hipotézis esetén kétoldali
ellenhipotézisről, illetve kétoldali próbáról beszélünk.

Esetünkben kétoldali próbáról van szó.


Térjünk vissza a pénzérme szabályosságához! Ezt szeretnénk ellenőrizni egy kísérlettel, ami ebben az esetben a
pénzérme többszöri feldobása lesz. Az eljárást statisztikai próbának nevezzük. Az eredményeket két halmazba osztjuk, az
elfogadási és a kritikus tartományba.

Ha az eredmény az elfogadási tartományba esik, amit szokás C0-lal jelölni, akkor elfogadjuk a hipotézist (innen a név),
ellenkező esetben elvetjük, ekkor a kritikus tartományba esik a kísérlet során született eredmény, amit C1-gyel
jelölünk.

Ezeket mindig a kísérlet előtt szokták rögzíteni, amihez a következő de nícióban szereplő próbaterjedelem játssza a fő
szerepet (ez sem tévesztendő össze a terjedelemmel mint szóródási mértékkel!).

A Pϑ (C1) ≤ α, ϑ Θ0 relációt teljesítő α számot a próba terjedelmének hívjuk. Ha a próba terjedelme α, akkor az 1 – α
értéket a próba szintjének nevezzük, szokás szigni kanciaszintnek is mondani.

A lényege az, hogy előre eldöntünk egy biztonsági szintet (próbaszintet), ez hagyományosan leggyakrabban 95% vagy
esetleg 99%. Megnézzük, hogy a hipotézis feltételezése mellett milyen elfogadási tartományba kell, hogy essen a fejek
száma nagy valószínűséggel (0,95 vagy 0,99). Tehát mindig abból indulunk ki, hogy a hipotézis „igaz”, és e feltevés mellett
számoljuk ki a kísérleti eredmények valószínűségeit. Ha ezen kívül esik, akkor azt mondjuk, hogy az eredmény
szigni káns, és elvetjük a hipotézist. Ha nem, akkor nem mondhatjuk azt, hogy igazoltuk, de nincs nyomós okunk az
elvetésére sem. Esetleg új kísérleteket kell végezni, esetleg más hipotézist választani.
Legyen elsőre a dobások száma 10. Ekkor a hipotézisünk szerint binomiális eloszlású lesz a kísérleti eredmény.
Legvalószínűbb az 5 fej, 5 írás lesz. Nyilván a szélső esetek a kevésbé hihetőek, a 0,1, illetve 9 és 10 fej dobásának esélye
együttvéve is kevesebb, mint 5%, a nullhipotézis teljesülése esetén, ekkor tehát a következő döntési szabályunk lesz erre a
kísérletre.
Ha az eredmény a [2; 8] intervallumban van (elfogadási tartomány), akkor nem tudjuk elutasítani a szabályosság
hipotézisét (ezzel persze nem igazoltuk azt!). Viszont, ha ezen kívül esik az eredmény (kritikus tartomány), akkor ezt olyan
hihetetlennek véljük, hogy inkább a hipotézist tartjuk tévesnek, mint ezt az eredményt lehetségesnek. Ilyenkor
szigni kánsnak mondjuk a kísérletet, és a pénzérmét nem tekintjük szabályosnak. Természetesen ebben van
hibalehetőség, hiszen 0,03 eséllyel lehetséges a 0, 1, 9, 10 fej esete is. Ez a tévedés valószínűsége (a próba terjedelme), de ez
viszonylag kicsi szám, tehát ha sokszor kell döntenünk, akkor az esetek nagy részében, több mint 95%-ában helyesen
fogunk dönteni.
Ez a sheri lozó a lényege. Természetesen nagyon sok alkalmazása van, amire a következőkben mutatunk még két
példát. A következőkben majd még néhány fontos esetet szisztematikusan végigveszünk.
Ha az eredmény nem szigni káns, de például 8 fej van, azt tarthatjuk gyanúsnak, és elvégezhetünk további 10
kísérletet. Ekkor a 20 dobás elfogadási tartományát kell meghatároznunk. Némi számolás után látható, hogy 95%
biztonsággal a [6; 14] intervallum lesz az elfogadási tartomány (pontosan 0,9586 a valószínűség). Azaz nagyobb
kísérletszámnál arányaiban szűkebb intervallum adódik (20 kísérletnél a 21-ből 9 eset, kb. 43%, míg az előző 10 kísérletnél a
11-ből 7 elfogadható volt, ami még kb. 64%). Éppen a nagy számok törvénye (lásd 26.8. fejezet) garantálja, hogy arányaiban
mindig egyre szűkebb lesz az elfogadhatósági intervallum, ha a kísérletek számát növeljük. Azonban a sok kísérlet
többnyire sok pénz és idő, tehát szükséges valamilyen észszerű kompromisszumot találni. Egyébként álljon még itt 100
feldobás esetén (ami még messze nem „nagy szám”) a 95%-os elfogadási tartomány, ami a [40; 60], és ez már csak kb. 21%-a
az összes lehetséges esetnek.

További példánk legyen egy Poisson-eloszlásra vonatkozó hipotézisteszt! Valaki azt állítja, hogy egy
telefonközpontba hétköznap délután 3 és 4 között 140 hívás érkezik várhatóan. Tudjuk, hogy jó közelítéssel a
telefonhívások száma Poisson-eloszlású éppen a várható hívásszámmal mint paraméterrel. Egy ellenőr másnap,
lévén hétköznap, ellenőrzi a központ hívásainak számát. Vajon mikor tudja elutasítani a hipotézist, azaz milyen
eredmény lenne szigni káns 0,95 biztonsággal?
Nyilván kellene konstruálnunk egy olyan intervallumot, amelybe legalább 95% eséllyel a λ = 140 paraméterű Poisson-
eloszlás beleesik. A legvalószínűbb érték a 140, ekörül érdemes „keresgélni”. Számítógép vagy gra kus kalkulátor
segítségével kapjuk, hogy [120; 168] intervallumba kb. 0,951 eséllyel esik. Azaz az eredmény szigni káns, és a
hipotézis el lesz vetve, ha másnap nem esik a [120; 168] intervallumba a hívások száma.

A módszernek objektivitást kölcsönöz az a tény, hogy a kísérlet előtt rögzítve van, hogy mikor mit teszünk, nem
egyénileg döntünk, így objektívnek véljük az eljárást. Az értelmezésnél azonban gyakran hibát követ el a felhasználó. Az
előző példánk ellenőre nem mondhatja azt, hogy a hipotézis kevesebb, mint 5% eséllyel igaz, ezért elvetettük. Ilyen
kijelentés nem is tehető, hiszen a hipotézis vagy igaz, vagy hamis, nem a véletlentől függ, ezért nincs is valószínűsége.
Összetettebb a helyes interpretáció. A szigni káns eredmény (például 95%-os szinten) azt jelenti, hogy a hipotézis
fennállása esetén csupán 5% valószínűségű eredményt kaptunk, s ezt nem akarjuk elhinni, ezért elvetjük a hipotézist.
Csupán annak 5% az esélye, hogy sok-sok ilyen hipotézisvizsgálatból tévedünk, azaz 100 ilyen hipotézisvizsgálat közül kb. 5-
ben tévesen döntünk a hipotézis elvetésével, de hogy egy konkrét esetben mi a tévedés esélye, arról nem is lehet beszélni.
Mégis igen gyakran így értelmezik a hipotézisvizsgálat módszerét, helytelenül. Ilyen interpretáció csak a Bayes-statisztika
esetén van, de ott más valószínűségfogalommal van dolgunk, lásd részletesebben a 27.8. fejezetben.
A következőkben sorra vesszük a normális eloszlással kapcsolatos leggyakrabb hipotézisteszteket. Előtte egy fogalom.

Statisztikai próbának hívjuk azt az eljárást, amikor egy minta segítségével döntünk egy hipotézisről. Amennyiben az
eloszlás jellege ismert, és nullhipotézisünk az eloszlás valamely paraméterére vonatkozik, paraméteres próbáról
beszélünk.

Egymintás u-próba
Kétmintás u-próba
Egymintás t-próba (Student)
A várható értékek egyezőségének ellenőrzése (kétmintás t-próba)
F-próba
Nem paraméteres próbák
Tiszta illeszkedés vizsgálat
Függetlenségvizsgálat
A becsléselmélet elemei

Egymintás u-próba
Alkalmazásként nézzünk egy ismert σ0 szórású normális eloszlású változót, melynek várható értékére vonatkozik a
hipotézisünk: H0: E(X) = m0. Az alternatív hipotézis lehet kétoldali: H1: E(X) ≠ m0 vagy egyoldali: H1:E(X) < m0 (vagy H1: E(X)
> m0). Foglalkozzunk most a kétoldali esettel, és készítsünk egy (1 – α)-szintű próbát egy n elemű, az eloszlás szerinti

sokaságból vett minta alapján! Tudjuk, hogy normális eloszlású változók összege is az, így az változó is

normális eloszlású, E(X̄) = m, és várható értékkel és szórással. Ha a nullhipotézisünk igaz, akkor az

próbastatisztika standard normális eloszlású, így megadható az az uα/2 érték, amelyre igaz, hogy 1 – α =
P(–uα/2 < U < uα/2|H0) = F(uα/2) – Φ(–uα/2) = 2Φ(uα/2) – 1, ahol Φ(z) a standard normális eloszlásfüggvényt jelöli. Azaz az
elfogadási tartomány:

, míg a kritikus tartomány, ahol az eredmény szigni káns, tehát a


hipotézist el kell vetni:

, végül a próba terjedelme az α = P((x1, x2, …, xn) ϵ c1|H0).


Példa. Legyen a következő 7 elemű minta az ismeretlen várható értékű, de ismert 3 szórású normális eloszlásból
származó {23,7; 14,5; 20,9; 16,7; 15,8; 19,6; 12,7}! Legyen a szigni kanciaszint ezúttal 90%-os, azaz 0,9! A hipotézisünk,
hogy a normális eloszlás várható értéke 16. Az előző próba szerint vennünk kell a mintaátlagot, s abból képzett
próbastatisztikát, melyre esetünkben adódik, hogy 1,499, ami kevesebb, mint a 10%-os elsőfajú hibavalószínűséghez
tartozó 1,65 (Φ(1,65) = 0,95). Tehát a hipotézist 0,9-es szigni kanciaszinten nem lehet elvetni. Ha azonban a várható
értékre 14 lenne a hipotézisünk, akkor a próbastatisztika értékére 3,26 adódna, amit még 0,99-es
szigni kanciaszinten is el kell vetnünk (az ehhez tartozó Φ táblázatbeli határérték 2,58, mert Φ(2,58) = 0,995).

Kétmintás u-próba
Ebben az esetben két mintánk van, mindkettőről feltételezzük, hogy normális eloszlású és ismert szórásúak. A hipotézis
az, hogy a várható értékeik azonosak, az ellenhipotézisünk pedig, hogy nem azonosak. Formálisan legyen X m1, σ1, míg Y
m2, σ2 paraméterű normális eloszlások. Ezekből veszünk egy n1, illetve n2 elemű, egymástól függetlenül választott mintát.
Legyen a próba szintje 1 – α. Hipotézisünk H0: m1 = m2 és kétoldali próba, mert ellenhipotézisünk H1: m1 ≠ m2. A

próbastatisztika az lesz. Ez H0 fennállása esetén szintén standard normális eloszlású, mint az egymintás
u-próba esetén, mivel normális eloszlású változók különbsége is az, a hipotézis miatt a várható értéke 0, s a nevező
biztosítja, hogy a szórás 1 legyen. Így lehet ismét a Φ eloszlásfüggvényt használni, és eljárásunk ugyanaz lesz, mint az
egymintás esetben.

Példa. Legyen a két független minta az 5 elemű {4,2; 6,1; 5,3; 6,8; 3,9}, illetve a 4 elemű {4,6; 7,1; 5,8; 6,5}! Tegyük fel,
hogy tudjuk, hogy az első minta szórása 2,4, míg a másodiké 3,2. Vajon tekinthető-e a két minta azonos várható
értékűnek? A mintaátlagok rendre 5,26, illetve 6. Ekkor az u próbastatisztika felhasználva a szórásadatokat is: –
0,383. Legyen a szigni kanciaszint 0,95, ekkor a megfelelő érték, aminél a 0,383-nak kisebbnek kell lennie, hogy
elfogadhassuk a hipotézist, 1,96. Mivel ez bőven teljesül, ezért nem vethetjük el azt a hipotézist, hogy azonos várható
értékű a két minta hátterében álló két normális eloszlás.

Egymintás t-próba (Student)


Ebben az esetben is normális eloszlásról van szó, de nem ismerjük sem a várható értéket, sem a szórást (ez elég gyakran így
van). Ismét erre a változóra vegyünk egy független n elemű mintát: (X1, X2, …, Xn)-t. Legyen a próba szintje szokásosan 1 –
α! A hipotézis csak a várható értékre vonatkozik: H0: E(X) = m0 és H1: E(X) ≠ m0, azaz kétoldali próba lesz.

Ismert, hogy a változó (n – 1) paraméterű t- (Student) eloszlású, ahol m a várható érték,

és . Tehát feltéve, hogy a nullhipotézis igaz, akkor a próbastatisztika (n – 1)


paraméterű t- (Student) eloszlású. Ennek az eloszlásnak a táblázatából (lásd a fejezet végén) kiolvasható az a tn–1(α/2)

kritikus érték, amelyre fennáll. A kritikus tartomány tehát, ahol szigni kánsan elvethető a
hipotézis:

Példaként vegyük a következő helyzetet! Szeretnénk ellenőrizni, hogy az 1 kg-os cukrot töltő automata jól működik-
e. Véletlenszerűen egymástól függetlenül kiválasztunk 10 zacskót. Ezzel a mintával azt szeretnénk tesztelni, hogy
valóban 1 kg-e a termék tömege, és a következő adatokat kaptuk grammban mérve a tömeget: 966, 1004, 996, 992,
1004, 966, 988, 982, 1010, 972.
Döntsük el 95%-os szinten, hogy 1 kg lesz-e a várható érték. Az adatokból x̄ = 988 és adódik, így

, míg a táblázatból 95%-os szinten n – 1 = 9 esetén 2,262 kritikus értéket kapunk, azaz az
eredmény nem szigni káns. Elhihető, hogy 1 kg a termékek várható tömege, annak ellenére, hogy a mintaátlag 12
grammal kisebb, mint a várható érték. Ez még nem szigni káns. Ha gyanúnk van, akkor további méréseket kell
végezni, azaz nagyobb mintát választani.
A várható értékek egyezőségének ellenőrzése (kétmintás t-próba)
Ez egy olyan hipotézis ellenőrzésére való, hogy két normális eloszlásúnak tekinthető sokaságból van egy-egy független
mintánk, s azt szeretnénk tesztelni, hogy a várható értékeik azonosak-e. Ez a következő szituációt jelenti.
Adott az X normális eloszlású változó m1, σ1 paraméterekkel és egy Y normális eloszlású változó m2, σ2
paraméterekkel. Ezekből van egy n1, illetve n2 elemű független mintánk. A hipotézisünk H0: m1 = m2, és az ellenhipotézis
H1:m1 ≠ m2, azaz kétoldali próbáról van szó. Legyen a próba szintje szokásosan 1 – α. Három esetet különböztetünk meg:
a) Az ismeretlen szórások azonosak σ1 = σ2, amit a következő fejezetben bemutatott F-próbával tesztelhetünk.
b) Az ismeretlen szórások nem azonosak σ1 ≠ σ2, de a minták elemszáma igen, azaz n = n1 = n2.
c) Sem a szórások, sem a minták elemszáma nem azonos (Sche é módszere).
Vegyük sorra az eseteket!
a) Ha a nullhipotézis fennáll, akkor a

változó (n1 + n2 – 2) paraméterű t-eloszlású, ahol a jelölések a


szokásosak, a felülvonás a minták átlagait, míg az a korrigált empirikus szórásnégyzetet jelöli. Innentől kezdve
ugyanúgy járunk el, mint az egymintás t-próba esetén, ahol most a értéket kell kikeresnünk a táblázatból,
s a következő kritikus tartomány adódik a szigni kánsnak mondható eredményre:

Ezt a próbát kétmintás t-próbának nevezik.


b) Mivel egyenlő a minta elemszáma, a Zi = Xi – Yi szintén normális eloszlású változók, E(Zi) = m1 – m2 = m várható
értékkel és szórásnégyzettel. A hipotézis fennállása esetén m = 0, azaz egy egymintás kétoldali t-
próbára redukálódik a feladat.

Példa. Két különböző fejfájás elleni gyógyszer gyorsaságát akarják összehasonlítani. Egy próbát végeznek 9-9
fejfájással küzdő betegen, mérve a bevételtől a fájdalom megszűnéséig eltelt időt percben. Legyenek az adataink az
első gyógyszer esetében: 30, 32, 15, 54, 28, 25, 40, 26, 20; míg a második gyógyszert kipróbáló páciensek esetében: 33,
35, 28, 40, 29, 30, 38, 34, 30. Normális eloszlást feltételezve lehet-e szigni káns hatásgyorsasági különbséget mondani
közöttük?
Most az ismeretlen szórások azonosságára vagy különbözőségére nincs szükségünk, mint az előző példában, hiszen a
minta elemszáma azonos, tehát alkalmazhatjuk a különbségekre az egymintás t-próbát. A különbségek: –3, –3, –13,
14, –1, –5, 2, –8, –10. Hipotézisünk az, hogy nincs lényeges különbség, tehát egy 0 várható értékű mintából
származnak a különbségek. Gyors számolás mutatja, hogy a különbségek átlaga: –3, korrigált tapasztalati szórása:

7,87. –gy az egymintás t-próba számított értéke , aminek abszolút értéke 1,14. Ha a
szigni kanciaszintnek a szokásos 95%-t választjuk, akkor a t-táblázat 8 szabadsági fokánál a 2,306 áll (kétoldali
próba!), ami szerint ez az eltérés nem szigni káns. Tehát nem mondható egyik gyógyszer sem gyorsabb
hatékonyságúnak e kísérlet alapján. Egyébként a 8 szabadsági fokú t-eloszlásnál a számított 1,14 szigni káns a 0,85-
nél lenne, ami szerint 70%-os szigni kancia esetén lehet elvetni a hipotézist. A meg gyelések alapján tehát
sejthetjük, hogy az első gyógyszer gyorsabban hat, azonban az eredmény ezt nem támasztja alá egyértelműen. Ilyen
esetben javasolható további kísérletek elvégzése.

c) Legyen n1 < n2 (ez feltehető, hiszen ha fordítva állna fenn, akkor cseréljük meg a két minta elnevezését), és
de niáljuk a Z1, Z2, változókat a következő módszerrel:

Belátható hogy Zi normális eloszlású, E(Zi) = m1 – m2, mivel a várható érték lineáris operátor, és ebből

következik. Kicsit összetettebb a szórás kiszámítása, de megmutatható, hogy

. Így ezek a Zi-k azonos normális eloszlású mintaelemek, melyek várható értéke és szórásnégyzete
ismeretlen. Erre viszont már az egymintás t-próba alkalmazható, a következő hipotézisre H0: E(Z) = 0 (m1 – m2), míg az
alternatív hipotézis a nem egyenlő, azaz kétoldali eset.

Példa. Vizsgáljunk két különböző típusú hangyacsapdát! Az egyiket 9 hasonló helyen, a másikat pedig 16 helyen
állítottuk fel. Egy óra múlva néztük az eredményt. Az első típusú 9 csapda rendre: 8, 12, 4, 15, 8, 9, 11, 7, 7 hangyát
fogott, míg a második típusú 3, 8, 6, 15, 4, 18, 7, 12, 11, 6, 2, 8, 13, 10, 14, 7 hangyát. Ezúttal a Sche é-módszer marad,
mert a következő pontban bemutatott F-próba szerint ezek a szórások nem tekinthetők azonosnak, és a minta
elemszám sem. Azaz képezni kell a c) pontban megadott Zi értékeket.
Ezek a következők lesznek: , ami esetünkben, mivel az első 9 hangyafogó a
második típusból összesen 84-et, míg mind a 16 darab összesen 144-et fogott, ezért elég egyszerű formula lesz, hiszen

, és ezt 9 értékre számoljuk ki, hiszen ennyi van az első csapdatípusból.


Ezek az értékek rendre: 3,75; 4; –2,5; 1,75; 3; –6,5; 3,75; –4; –3,25.
Erre alkalmazzuk most az egymintás kétoldali t-próbát ismét a szokásos 95%-os szigni kanciaszinten, az E(Z) = 0
hipotézisre, akkor a táblázatban a 0,975-nél 8 (n – 1) szabadsági foknál, mint azt az előző példánál láttuk, éppen 2,306
áll, tehát ezt kell összevetnünk a mintából származó értékkel. Mivel a mintaátlag: –0,0555 és a korrigált
szórásnégyzet: 3,869, ezért a t-érték 0,043, ami igen kicsi érték, tehát a két csapda nem tekinthető eltérőnek.

F-próba
Két független normális eloszlású változó szórásainak egyenlőségét teszteli az úgynevezett F-próba.

Legyenek X és Y független normális eloszlású változók m1, σ1, illetve m2, σ2 paraméterekkel. A belőlük választott két

független minta , illetve . Válasszuk a próba szintjét (1–α)-nak. Először a


következő kétoldali hipotézist vizsgáljuk , és ellenhipotézisnek a nem egyenlőt vesszük.

Tudjuk, hogy és χ2-eloszlásnak (n1 – 1), illetve (n2–1) szabadsági fokkal, és függetlenek.

Emiatt ha a hipotézis fennáll, akkor hányadosuk F-eloszlású (n1 – 1, n2 – 1) paraméterrel. Itt és

Mivel is ugyanúgy F-eloszlású, csak (n2 – 1, n1 – 1) paraméterrel, ezért minden olyan k értékre, amelyre

igaz az is, hogy , ezért a gyakorlatban az

statisztikát szokás használni. Az F-eloszlás táblázatából (lásd a fejezet

végén) azt az értéket keressük ki, amelyre , ahol f1 az F* számlálójának és


f2 a nevezőjének paraméterszáma. A kritikus tartományba, ahol tehát szigni káns lesz a próba, és elvetjük az egyenlő
szórás hipotézisét, azok a mintaelemek esnek, amelyekből számított F* értékre teljesül, hogy .
Ez azt jelenti, hogy a kritikus tartomány azon mintaelemek összessége, amelyekre:

Így teljesül, hogy .


Még megvizsgáljuk az egyoldali esetet is, mielőtt példákat néznénk erre a próbára is. Ekkor az ellenhipotézis, hogy

. Ha , akkor máris elutasítjuk az ellenhipotézist, hiszen ha X korrigált tapasztalati

szórásnégyzete kisebb, mint Y-é, akkor ez nem támasztja alá, hogy D2(X) > D2(Y). Ha , akkor a kritikus

tartomány , ahol .

Példák. Vizsgáljuk meg az előző pontban példaként említett hangyacsapdák szórásának egyenlőségét! Az első típusú
csapda eredményei: 8, 12, 4, 15, 8, 9, 11, 7, 7, ebből , a második fajta csapda eredményei: 3, 8, 6, 15, 4, 18, 7,
12, 11, 6, 2, 8, 13, 10, 14, 7, ebből .
Azaz most a második a nagyobb, tehát az 1/F-et kell néznünk, ami 1,403, és a paraméterek (15, 8). A táblázatban a
0,975-ös szinten (kétoldali próba) 3,2 található, ennél kisebb az arány, tehát lehet azonos szórásúnak venni őket.
Ebből az adódik, hogy lehetett volna az a) esetre is visszavezetni. Ott ha a szórásokat egyenlőnek vehetjük, akkor

kétoldali t-próba lesz, a változóval. Erre azt kapjuk, hogy értéke az

adataink mellett: , ami bármilyen táblázatbeli értéknél kisebb, azaz


semmilyen különbség nem mondható a két csapda között, hiszen átlagosan ugyanannyi hangyát fogtak.
Más a helyzet azonban a következő esetben. Legyen két töltőgép, melyeknek azonos töltési darabszámot kellene
biztosítania egy bizonyos cukorkából. Ezt akarjuk ellenőrizni. Az elsőből veszünk egy tízelemű mintát, amelynek
értékei a következők: 82, 80, 79, 81, 82, 80, 81, 79, 80, 81. A második töltőgép ellenőrzését 9-szer tudjuk elvégezni, s
eredményeink: 77, 86, 78, 87, 79, 89, 86, 88, 85. Ekkor az első átlaga és korrigált empirikus szórásnégyzete: 80,5, illetve
1,08. A másodiké 83,88, illetve 4,595. Ekkor a szóráspróba szerint 4,595/1,08 = 4,255 adódik, míg az F-eloszlás kritikus
értéke 95%-os szigni kanciaszinten a (8, 9) paraméterértékeknél: 3,23. Mivel 4,255 ennél nagyobb, ezért
szigni kánsan nem egyenlő a két szórás, és nyilván a második töltőgépé a nagyobb. Ekkor a két különböző
terjedelmű mintát a c) módszerrel lehet összevetni, hogy átlaguk is szigni kánsan eltér-e. Nyilván itt az eltérés a
második javára lehetne szigni káns, mivel közel 4 darab cukorkával átlagosan több volt bennük. (Amiből éppen az
adódhat, hogy az első nem teljesíti az előírást, mert az elég ritka eset, hogy többet töltsenek bele, mint az előírás, a
fogyasztóvédelem éppen a kevesebbet próbálja kiszűrni.) A Sche é-módszer változóját kell legyártanunk, amihez a

változó értékei kellenek, most az első változót Y-nal és


a másodikat X-szel jelölve, mivel az elsőből van több mérési eredmény. Nyilván akkor n1 = 9; n2 = 10, és akkor az

utolsó levonandó éppen a 10 átlaga, 80,5; míg a harmadik tag az első 9 tag összege osztva . Az első 9
összege: 724, így a hozzáadandó érték: 76,31. Tehát a következő értékeket kell számolnunk:

, i = 1, 2, …, 9. A számított 9 darab Zi-érték a következő: –4,98; 5,914; –


1,137; 5,965; –2,983; 8,914; 4,965; 8,863; 4,914. Ezeknek kellene a nullhipotézis fennállása esetén egy 0 várható értékű
mintából származniuk.

A szabadsági fok 8 és a t-érték: , ami kevesebb, mint 2,306, amit a táblázat ad kritikus
értékként, tehát nem szigni káns az eltérés 95%-on. Látszik, mennyire nem lehet érzéssel dolgozni, hiszen ebben az
esetben az ember hajlamos lett volna már szigni kánsnak venni az eltérést.
Utolsó példánkban kétfajta nemesített búza terméshozamát szeretnénk összevetni, hogy szigni kánsan
termékenyebb-e valamelyik. Az egyikből hasonló területen 9 különböző mintánk van, a másikból ugyanott, másik
parcellából 12 minta. A kérdés, hogy – feltételezve a normális eloszlást – várható értékeik egyenlők-e. Az első minta:
30,3; 28,3; 29,6; 28,4; 31,1; 26,4; 28,4; 32,2; 26,2. A másik: 22,5; 40,3; 46,2; 21,6; 41,2; 21,9; 38,7; 39,6; 40,8; 48,2; 42,1; 30,8.
Első lépésben teszteljük, hogy szigni kánsan különböznek-e a szórások, s így szükséges-e a c)-beli Sche é-módszer,
vagy lehet az a)-béli t-próbát használni. Tehát F-próbával kezdünk. Az első minta átlaga és korrigált empirikus
szórásnégyzete: 28,99; 2,016. A másodiké 36,158; illetve 9,51. Nyilván a második szórás a nagyobb, tehát vizsgáljuk
meg a 9,51/2,016 hányadost, értéke 4,37. Mivel a táblázatban ehhez a két paraméterértékhez 3,35 van megadva 95%-os
szigni kanciaszinten, ezért mondhatjuk, hogy szigni kánsan nagyobb a második minta szórása. Ezért tehát a c)-beli
módszerrel kell eldönteni, hogy a várható értékben látszó különbség a második javára szigni káns-e.

A kifejezés esetünkben a következő formát ölti:

, ahol az utolsó két tagot tudjuk az adatokból, az utolsó

értéke (átlaga a második adatsornak): 36,158; míg az első 9 tag összege 312,8, amit -mal kell szorozni, kb. 30,1
adódik. Így a következőket kell számolnunk: Zi = Xi–0,866 Yi–6,058, i = 1, 2, …, 9. Ebből most a következő 9 érték
adódik: 4,757; –12,658; –16,467; 3,636; –10,637; 1,377; –11,172; –8,152; –15,191. Ha hipotézisünk, hogy a két fajta hozama

nem szigni kánsan eltérő 0,95-ös szinten, akkor az itteni 9 adatból készített értéke a 8 szabadsági fokú
t-eloszlás kritikus értékénél kevesebb kell legyen. A kritikus érték: 2,306, mint már többször szerepelt, esetünkben

viszont az átlag: –7,167, a korrigált szórásnégyzet pedig: 8,23. Azaz , így abszolút értékben 2,61
adódik, ami nagyobb, mint 2,306, tehát ebben az esetben szigni kánsan nagyobb a második fajta hozama, hiszen
átlagértéke nagyobb volt, de most szigni káns eredmény. Tehát a termesztő valószínűleg ez utóbbit választja majd,
ha más egyéb ellene szóló tényező nincs.

Befejezésül tekintsünk át néhány nem paraméteres tesztet is! Ekkor nem egy ismert eloszlás paramétereit szeretnénk
becsülni, hanem éppen azt, hogy a minta tekinthető-e egy bizonyos eloszlásból származónak, vagy független-e két
tulajdonság a minta adatai alapján. Először éppen az eloszlásilleszkedést, majd a függetlenséget fogjuk vizsgálni.

Nem paraméteres próbák


A tárgyalt paraméteres próbáknál mindenütt feltettük, hogy a minta normális eloszlásból való. Vajon van-e mód arra, hogy
ezt a hipotézist ellenőrizzük, nevezetesen, hogy egy minta tényleg normális eloszlásból való-e, vagy ezt szigni kánsan
elvethetjük. Természetesen a kérdés általánosabb, bármelyik eloszlást lehet így tesztelni. Induljunk ki egy nagyon
egyszerű példából! Vajon egy konkrét dobókocka szabályos-e? Azaz a hat lehetőség egyenletes eloszlását kellene tesztelni.
Ezeknek és a hasonló kérdéseknek az ellenőrzésére vonatkozik az első alpontunk. Avagy jogos volt-e a Poisson-eloszlás
feltételezése a telefonközpontos példánk esetében.

Tiszta illeszkedés vizsgálat

Legyen adva egy teljes eseményrendszerünk A1, A2, …, Ar és a p1, p2, …, pr pozitív számok a következő feltétellel:

. Döntenünk kell a H0: P(Ai) = pi, i = 1, 2, …, r hipotézis érvényességéről. Hajtsuk végre a fenti
eseményrendszert tartalmazó kísérletet N-szer, és jelöljük ki-vel az Ai bekövetkezéseinek számát. Képezzük a

statisztikát. A multinomiális eloszlás tétele alapján ez aszimptotikusan eloszlású lesz. Ha


ez a statisztika kis értéket vesz fel, akkor közel vannak a meg gyelt és a hipotézis alapján várt értékek egymáshoz,
tehát akkor elfogadhatjuk a hipotézist. A megadott szigni kanciaszinthez megkeressük a táblázatból a kritikus
értéket, s aszerint döntünk, hogy a statisztikánk értéke kisebb vagy nagyobb. Ha nagyobb, akkor szigni kánsan nem
illeszkedőnek mondjuk az adatainkat. Ezt az eljárást nevezik tiszta illeszkedés vizsgálatnak.

Megjegyzés. Az illeszkedésvizsgálatot eloszlások esetén használjuk még, itt a teljes eseményrendszer valószínűségei
alkotják az eloszlást. Később további példákat látunk majd.
Példa. Dobjunk fel egy kockát 600-szor, és vizsgáljuk a szabályossági hipotézist! Jelölje ki az i szám gyakoriságát a 600
dobás közül, nyilván i = 1, 2, 3, 4, 5, 6. A következő eredmény esetén mit mondhatunk a kockáról: k1 = 83, k2 = 91, k3 =
122, k4 = 107, k5 = 74, k6 = 123. A χ2-statisztika ebben az esetben:

értéke 21,08. Ha megnézzük az 5 szabadsági fokú (hiszen 6 – 1 = 5) χ2-eloszlás kritikus értékeit, még 99,9%-os szinten
(ami már igen-igen magas!) is csak 20,51, aminél 21,08 nagyobb. Tehát ez az eredmény a kocka szabályosságának
hipotézisét cáfolni látszik.

Térjünk rá az eloszlásilleszkedésre! Ezt szeretnénk az előzőre visszavezetni. Egy kézenfekvő lehetőség felosztani az
eloszlás értékkészletét r különböző diszjunkt halmazra, melyek az értékkészletet együttesen lefedik. Meghatározzuk, hogy
az eloszlás szerint ezekbe milyen eséllyel kellene, hogy beleessen a változó, ha tényleg ez az eloszlása. Utána végzünk N
meg gyelést, s mint az előző esetben, leszámoljuk, hogy az egyes események hányszor következnek be, s ezt összevetjük a
hipotézis szerinti valószínűségekkel. A kérdés, hogy a χ2-statisztikára kapott érték hogyan viszonyul a χ2-táblázat adott
szinthez tartozó kritikus értékeihez.
Vizsgáljuk meg valamelyik paraméterbecslés eloszlását, ahol elég nagy a minta, hogy az nem mond-e ellent a normális
eloszlásból származásnak.

Vegyük a hangyacsapdás példa második adatsorát, bár a 16 nem igazán nagyszámú mintaelem. Ha viszonylag kis
számú tartományra bontjuk a normális eloszlás értékkészletét, például legyenek A1 = (–1; 1), A2 = (–2; –1) ∪ (1; 2), A3 = (–
3; –2) ∪ (2; 3), végül A4 = (–∞; –3) ∪ (3; ∞), intervallumok, ekkor a megfelelő valószínűségek rendre: P(A1) = 0,6826;
P(A2) = 0,2718; P(A3) = 0,043; P(A4) = 0,0026. Ezután transzformáljuk standard normális eloszlásúvá az adatokat, tehát
vonjuk le az átlagot, és osszunk az empirikus szórással, ekkor a következő standardizált 16 értéket kapjuk. Az eredeti
adatsor: 3, 8, 6, 15, 4, 18, 7, 12, 11, 6, 2, 8, 13, 10, 14, 7. Ennek standardizált változata a korrigált szórással osztva: –1,32; –
0,22; –0,66; 1,32; –1,10; 1,98; –0,44; 0,66; 0,56; –0,85; –1,97; –0,28; 1,13; 0,28; 1,41; –0,56. Eszerint k1 = 9, k2 = 7, k3 = 0, k4 =

0, így az illeszkedés χ2-statisztikája: , ami kb. 0,34 +


1,62 + 0,69 + 0,05 = 2,7. Mivel itt r = 4, ezért a 3 szabadsági fokú értéket kell a táblázatban keresni, amelynek legkisebb
kritikus értéke is 6,25, aminél értékünk jóval kisebb, tehát az adatok alapján nem lehet elvetni a normális eloszlást.
Ugyanezt egy egyenletesebb bontás szerint is elvégezhetjük. Keressük meg azt a 0 körüli szimmetrikus
intervallumot, melyben éppen ¼ a beleesés esélye. Majd a következő ¼-es sávot, és még két ilyet. Ekkor a következő
¼ valószínűségű 4 részhalmaz adódik: A1 = (–0,32; 0,32), A2 = (–0,68; –0,32) ∪ (0,32; 0,68), A3 = (–1,15; –0,68) ∪ (0,68;
1,15), végül A4 = (–∞; –1,15) ∪ (1,15; ∞). Ekkor mind a négy esetén Np értéke 4 lesz, azaz a χ2 értéke, miután k1 = 3, k2 = 5,
k3 = 3, végül k4 = 5, s így az érték még az első változatnál is kisebb lesz, mindössze 1 (az első változatban 2,7 adódott).
Azaz teljesen rendben van, ha nem vetjük el a normális eloszlás hipotézisét.

Diszkrét eloszlások esetén, ha nem túl sok értéket vesz fel az eloszlás, akkor lehet teljes illeszkedés vizsgálat, ha nem,
akkor, mint azt az előbbi normális eloszlásos példánál láttuk, tartományokat képezünk összevonva bizonyos értékeket.
Általában érdemes a kis valószínűségűeket összevonni, mert ha nem nagyon nagy a minta, akkor ezeket úgysem igen
gyeljük meg. Azaz az előző példánál a második felbontással végzett teszt hasznosabb, mint az elsővel, ahol két 0 értéket is
regisztráltunk, ami nem megengedett, mivel legalább 5, de még jobb, ha 10 meg gyelés van az egyes osztályokban
minimálisan.

Függetlenségvizsgálat
Már többször beszéltünk róla, és a kontingenciaanalízis, valamint részben a korrelációszámítás is ezzel a témával
foglalkozott. Most egy olyan próbát mutatunk, amely az illeszkedésvizsgálat módszerét viszi át a függetlenség vizsgálatára,
bár csak elég nagy minták esetén (legalább) alkalmazható, az aszimptotikusan χ2-eloszlás miatt. Ezt is az
illeszkedésvizsgálatra vezetjük vissza. Legyen A1, A2, …, Ar és a B1, B2, …, Bs két teljes eseményrendszer. Ezek
függetlenségét vizsgáljuk. Azaz a hipotézis:

Két eset lehetséges: vagy ismertek a két teljes eseményrendszerhez tartozó valószínűségek, vagy nem.
a) Ha ismertek, akkor H0 = P(AiBj) = piqj, i = 1, 2, …, r, j = 1, 2, …, s, ahol pi = P(Ai), qj = P(Bj) előre adott számok. Mivel itt a
különböző metszetek szintén egy teljes eseményrendszert alkotnak, és adott ehhez a valószínűség-eloszlás is, hiszen a
megfelelő valószínűségek szorzata adja, ezért egy tiszta illeszkedés vizsgálat, mely a hipotézis fennállása esetén
lesz.
b) Gyakoribb az az eset, hogy a pi, qj számok sem adottak, s azt is a mintából kell becsülni. Hajtsuk végre a kísérletet N-
szer, és készítsük el a kontingenciatáblázatot:

B1 B2 … Bs ∑

A1 k11 k12 … k1s k1.

A2 k21 k22 … k21

⋮ …

Ar kr1 kr2 … krs kr

∑ k.1 k.2 … k.s N

A peremeken található számok:

(az Ai esemény gyakorisága), (a Bj esemény gyakorisága).

Az ismeretlen valószínűségeket a relatív gyakorisággal becsüljük: pi = P(Ai) becslése , qj = P(Bj) becslése .

Így az Ai ∩ Bj meg gyelt kij értékének a hipotézis fennállása esetén közel -nek kell lennie. Így a χ2-
statisztika

ahol az ismeretlen paraméterek száma r + s, de ezek között két összefüggés van, mind a p-k, mind a q-k összege 1, így r + s –
2, így aszimptotikusan a , azaz eloszlású lesz a statisztikánk. Tehát más kritikus értékek
lesznek, mint a tiszta illeszkedés vizsgálatnál a más szabadsági fok miatt. Nyilván nagyobb eltérés lesz még elfogadható,
hiszen a valószínűségek is csak a relatív gyakoriságokkal becsültek, ami növeli az eltérést.
Példa. Vajon független-e a szemszín a hajszíntől? Egy 200 fős mintát vizsgáltunk, és meg gyeléseinket a táblázat
szerinti kategóriákba osztottuk.

Szőke Barna Fekete Összesen

Kék szem 39 29 6 74

Barna szem 21 93 12 126

Összesen 60 122 18 200

Ekkor
Mivel a szabadsági fok (2 – 1) (3 – 1) = 2, ezért a -statisztikát kell nézni, a kritikus értékek legnagyobbika is 15,20,
és ez már 0,9995-ös igen magas szigni kanciaszint, s még ezen is el kell vetni a hipotézist, mivel 29,44 nagyon magas
érték. Azaz ezen adatok alapján nem tekinthető függetlennek a szemszín és a hajszín.
Megjegyzés. A függetlenségvizsgálat fontos esete két valószínűségi változó függetlenségének vizsgálata. Ugyanúgy
kell eljárni, mint az eloszlásilleszkedésnél. Felbontjuk a számegyenest (a változó értékkészletét) r, illetve s részre: –∞
= a0 < a1 < a2 < … < ar = ∞, illetve –∞ = b0 < b1 < b2 < …< bs = ∞. Legyen Ai =: {ai–1 ≤ X ≤ ai}, i = 1, 2, …, r és Bj =: {bj–1 ≤ Y ≤ bj},
j = 1, 2, …, s. Az X és Y változó függetlenségének vizsgálatát helyettesítsük a fenti két teljes eseményrendszer
függetlenségének vizsgálatával. Fontos megjegyezni, hogy a függetlenségvizsgálathoz a két változót egyszerre kell
meg gyelni, így a minta (Xi, Yi) párokból áll.

Az utolsó alkalmazás, amit a fenti módszerrel némi ügyeskedéssel el lehet végezni, az az ún. homogenitásvizsgálat.

El kell eldönteni, hogy két változó, X és Y eloszlása megegyezik-e. Vegyünk mintát X-re: X1, X2, …, Xn és Y-ra: Y1, Y2, …,
Ym. Osszuk fel a számegyenest r részre: C1, C2, …, C1. Legyen ki az {X ∈ Ci} esemény gyakorisága és li az {Y ∈ Ci}

esemény gyakorisága. A próbastatisztika: .


Ha a két változó eloszlása megegyezik, akkor m → ∞, n → ∞ esetén χ2 eloszlása r – 1 szabadsági fokú χ2 eloszláshoz tart.
Ezt a módszert nevezzük homogenitásvizsgálatnak.

Példa. Vajon származhat-e azonos eloszlásból a következő két minta: x1 = 12,6; x2 = 10,4; x3 = 9,7; x4 = 14,1; x5 = 11,2; x6 =
8,9, illetve y1 = 13,1; y2 = 10,8; y3 = 14,4; y4 = 10,8; y5 = 9,2.
Mivel az adatok a 8,9 és 14,4 intervallumba esnek, ezért legyenek az intervallumok: (–∞, 9), (9, 11), (11, 12), (12, 14), (14,
∞). Ekkor n = 6, m = 5 és k1 = l, k2 = 2, k3 = l, k4 = 1, k5 = 1, míg l1 = 0, l2 = 3, l3 = 0, l4 = 1, l5 = 1, azaz a statisztika:

és ez 4 szabadsági fokú, tehát bőven tekinthető


azonos eloszlásúnak a két minta, mivel még a legkisebb 7,78-nál is jóval kisebb ez az érték.

A becsléselmélet elemei
A hipotézisvizsgálat fejezetet fejezzük be néhány becsléselméleti fogalommal és összefüggéssel. Egy paraméter becslésére
valamilyen statisztikát használunk, ami ebben az esetben azt jelenti, hogy a rendelkezésre álló adatok egy függvényét
vesszük, s annak a megfelelő helyettesítési értéke a becslésünk.

Példák
1. Szeretnénk egy dobókocka esetén a hatosdobás valószínűségét becsülni, mert a kocka nem tűnik szabályosnak
(cinkelt). Rendelkezésünkre áll 100 dobás eredménye. Szokás a hatosdobás relatív gyakoriságával becsülni a
valószínűséget, ilyenkor a függvény a hatosok száma osztva a dobások számával.
2. Az előző példából legyen most a kockán kidobott szám várható értéke a kérdés, az egyes számok valószínűségétől
függetlenül. Ekkor nyilván a dobott számok átlaga lesz az egyik legkézenfekvőbb lehetőség a várható érték
becslésére, azaz a függvény a dobott számok (változók) összege osztva a számukkal, formálisan:
. Nyilván a becslés konkrét értéke a megfelelő értékek behelyettesítésével
adódik, ahol esetünkben minden xi érték az {1, 2, 3, 4, 5, 6} halmaz elemei közül kerül ki, ez az értelmezési
tartománya a függvény változóinak.

Ha a becslésre használt statisztika várható értéke a paraméter, akkor a becslést torzítatlannak mondjuk.

Példák
1. Egy esemény relatív gyakorisága a valószínűség torzítatlan becslése.
2. A Poisson-eloszlás paraméterének az átlag torzítatlan becslése.
3. Legyen egy 1-től n-ig sorszámozott sokaság, amelyből k elemet kiválasztunk visszatevés nélküli mintavétellel
(mint a különböző lottók). Jelölje ezeket x1, x2, …, xk. Hogyan becsüljük meg ebből n értékét? Két torzítatlan
statisztikát is mutatunk.
a)
Mivel az várható értéke a várható érték additivitása miatt , ezért a 2x̄ - 1 egy
olyan becslés, amelynek várható értéke n, azaz torzítatlan becslés.
b)
Vegyük a max {x1, x2, …, xk} becslést. Megmutatható, hogy ennek várható értéke , azaz n-nek a

ismét torzítatlan becslése lesz.

Sok esetben a becslés nem torzítatlan, csak ha nagyon sok kísérletet végzünk, akkor az n növekedésével válik egyre
torzítatlanabbá. Erre szolgál a következő fogalom.

A becslésre használt statisztika aszimptotikus torzítatlan, ha a becslés várható értékének határértéke tart a
becsülendő paraméterhez.

A torzítatlan becslések „jóságát” a szórásukkal lehet mérni. Amelyiknek kisebb a szórása, azt jobb becslésnek
tekintjük. Ezen alapszik két fogalom.

Egy B1 becslés hatásosabb, mint a B2 becslés, ha σ(B1) ≤ (B2).

Megjegyzés. A torzítatlan becslésre vonatkozó 3. példából b) hatásosabb becslés, mint a), mert szórása kisebb.

Végezetül, ha létezik olyan becslés, amely bármely becslésnél hatásosabb, akkor azt a legjobb becslésnek tekintjük.
Ennek megfogalmazása a következő:

Egy B torzítatlan becslés hatásos, ha bármely másik torzítatlan becslésnél kisebb a szórása.

Természetesen érdekes kérdés, hogyan lehet hatásos (és torzítatlan vagy legalább aszimptotikusan torzítatlan)
becsléseket készíteni. Ennek elméletére vonatkozóan néhány fogalom és tétel.

Példák hatásos becslésekre:


1. Megmutatható, hogy egy esemény valószínűségére a meg gyelt minta relatív gyakorisága hatásos becslés.
Nyilván torzítatlan, hiszen a várható érték éppen p lesz. Ennél kisebb szórású becslés nincsen.
2.
A kihúzott öt lottószámból a legnagyobb kihúzható szám becslésére a statisztika, ami

kisebb szórású, mint a statisztika, ami szintén torzítatlan.

Maximum-likelihood becslés. Igen gyakori, amikor becsült értékként a legvalószínűbbet választjuk, pontosabban,
amely esetén a kísérlet eredménye a legvalószínűbb. Nézzünk erre egy példát!

Példa. Legyen egy tóban ismeretlen a harcsák száma. Ennek becslésére a következőt tesszük. Kifogunk n = 50
harcsát, és ezeket megjelöljük, majd visszaengedjük a tóba. Kellő időt várva (hogy elkeveredhessenek a jelölt és a
nem jelölt harcsák) kifogunk 100 harcsát. Közöttük 13 jelöltet találunk. Mekkorára becsüljük a tóban levő harcsák
számát? Azt az N számot keressük, amelyre a legvalószínűbb a 100-ból 13 jelölt. Ha N harcsánk van, akkor ebből

-féleképpen lehet 100-at kifogni. Ekkor a 13 jelölt esélye: . Ennek maximuma az


egyenletből határozható meg. Ha a binomiális eloszlással becsüljük ezt a hipergeometriai eloszlást,

akkor maximumát kell meghatározni.

Általában maximum-likelihood becslésnek nevezzük az ismeretlen paraméternek azt az értékét, amelyre a kapott
mintastatisztika a legvalószínűbb.

Ennek a matematikai leírása a likelihood-függvénnyel történik.

Diszkrét esetben az L(a) = p(x1, a)p(x2, a) … p(xn, a) szorzatfüggvényt hívjuk likelihood-függvénynek, ahol p(xi, a) jelöli
az a paraméter mellett az xi mintaeredmény valószínűségét. Folytonos esetben sűrűségfüggvények szorzata lesz a
likelihood-függvény: L(a) = f(x1, a)f(x2, a) … f(xn, a).
Ennek a függvénynek a maximuma ugyanott van, ahol a szigorúan monoton logaritmusának a maximuma, így

általában a folytonos a szerint di erenciálva a egyenlet megoldásával keressük meg a maximum-likelihood


becslést. Ezt az egyenletet szokás likelihood-egyenletnek nevezni.

Megjegyzés. A szorzat alakot a meg gyelések független volta indokolja, tehát ha ez nem teljesül, akkor ezt a
módszert nem lehet használni.
Példa. A binomiális eloszlás p paraméterének maximum-likelihood becslése a következő. Legyen N kísérletünk,
amelyet egymás után n-szer ismétlünk, és az eredmények rendre k1, k2, …, kn. Ekkor a likelihood-függvény:

.
Ennek logaritmusát deriválva, s azt 0-val egyenlővé téve kapjuk a likelihood-egyenletet:

ahonnan

maximum-likelihood becslés adódik. Mivel Np a binomiális eloszlás várható értéke, ezért ez a


jól ismert átlaggal való becslését adja az ismeretlen várható értéknek.

Bizonyítás nélkül közöljük az egyik legfontosabb tételt a maximum-likelihood becslésekre.

Ha létezik az ismeretlen paraméternek egy minimális szórású, tehát hatásos becslése, akkor a likelihood-egyenletnek
egy megoldása van, és ez éppen a hatásos becslés, tehát a hatásos becslés egyben maximum-likelihood becslés is.

Egy példa a már szerepelt relatív gyakorisági becslés a valószínűségre, ami egyben maximum-likelihood becslés is,

mivel a paraméterre legvalószínűbb relatív gyakoriság.

27.8. A Bayes-statisztika elemei

A Bayes-statisztika alapjai
A valószínűség fogalma
Bayes-módszer
Klasszikus kontra Bayes-statisztika

A Bayes-statisztika alapjai
Ennek a fejezetnek a célja röviden összefoglalni egy XX. századi statisztikai elmélet alapfelfogását, amely T. Bayes tételén
alapul (innen származik az elnevezése is), de abban a valószínűséget jelentősen tágabban értelmezve, mint azt maga T.
Bayes, illetve az előző két fejezetben bemutatott ún. klasszikus elmélet hívei. Az a kiindulópont, hogy minden olyan
fogalom, amely kielégíti a Kolmogorov-axiómákat, valószínűségnek tekinthető, így az ún. igazságos fogadás eszméjén
alapuló, az illető informáltságától is függő, ún. szubjektív valószínűség fogalma is. A módszer bár technikailag sokszor
nehezebb, mégis könnyebben érthető és természetesebb, mint az eddigiekben látott klasszikus eljárások. Amelyek
egyébként talán jobban érthetőek, ha ezt is ismerjük. Éppen ez indokolja, hogy bemutassuk, annak ellenére, hogy még a
felsőoktatásban sem elterjedt elméletről van szó.

A valószínűség fogalma
A klasszikus elmélet csak a valószínűség ún. objektív, tehát a véletlen kísérletekhez kötött fogalmát használja. Ez a vizsgált
rendszernek tőlünk független (ezért mondjuk objektívnek) tulajdonsága. Például, hogy egy dobókocka milyen eséllyel esik
úgy, hogy a 6-os legyen felül, ez a dobókocka sajátossága (ha feltesszük, hogy a dobás módja nagyjából állandó, és nem
befolyásolja az eredményt). Ebben a felfogásban a valószínűség egy, csak a véletlen rendszertől függő paraméter, tehát
adott, de mi általában nem ismerjük. Éppen az a célunk, hogy valahogy mégis meghatározzuk.
Ebben az értelemben például egy hipotézisnek nincs is valószínűsége, hiszen az vagy igaz, vagy hamis, csak éppen nem
tudjuk, hogy melyik eset áll fenn. Ha mégis használunk esélyeket ilyen esetekben, az csak szubjektív, tehát a meg gyelőtől
függő mérték lehet. Ennek a fogalomnak a sajátja, hogy a kapott információk függvényében változik (tehát nem egy
objektív állandó), viszont megadottnak vehető. Itt most nem akarjuk bebizonyítani, hogy a Kolmogorov-axiómákat
kielégíti egy ilyen szubjektív (az igazságos fogadások felhasználásával de niálható) „valószínűség”-fogalom is. Ezt
elfogadva ugyanúgy számolhatunk vele (pl. a Bayes-tételben), mint a korábbi „objektívnek” mondott valószínűség-
fogalommal.
Vegyünk egy olyan konkrét szituációt, amelyen be tudjuk mutatni az elmélet lényegét. Valaki szeretne két különböző
szituációban dönteni:
a) egy önmagát zeneértőként bemutató személyről, illetve
b) egy önmagát parafenoménnak nevező személyről eldönteni, vajon igazat mond-e.
A módszer nyilván, mint eddig is láttuk, csak az lehet, hogy egy kísérletet tervezünk a személyekkel, s annak
eredményétől függően valahogyan döntünk. Természetesen tisztába kell lennünk azzal, hogy bizonyos eséllyel tévedünk.
Klasszikusan a hipotézisvizsgálat módszerét alkalmazzuk (lásd a 27.7. fejezetet). A kísérlet legyen a következő! Tíz
egymástól független alkalommal teszteljük a „szakértelmet”, a zeneértőnek el kell találnia, hogy milyen művet hall, a
jósnak meg kell mondania, hogy mi fog történni egy érmefeldobáskor, azaz érmedobás eredményét jósolja meg.
Megszámoljuk, hogy hány sikeres kísérlet volt, s ennek alapján döntünk.
A klasszikus hipotézisvizsgálat abból indul ki, hogy nem szakértő az illető, tehát tippel, és 50-50% eséllyel talál vagy
téved. A kérdés, hogy milyen eredmény az, amit már nehéz ilyen feltétellel elhinni. A tíz kísérlet a hipotézisünk mellett

binomiális eloszlású n = 10, paraméterekkel. Nyilván a szakértelem a minél több találat. Véletlenül legfeljebb 9
találat esélye 0,989, a legfeljebb 8 találaté pedig 0,945. Azaz annak az esélye, hogy véletlenül 9 vagy 10 találatot ér el, csak
0,011, a 8, 9 vagy 10 találaté már 0,055. Tehát a „szokásos” 0,95-ös szigni kanciaszinten a 9 és 10 találat esetén már elvetjük a
tippelés hipotézist, tehát valamilyen szakértelmet szigni kánsnak tartunk.
Ez mindkét esetben így van, azaz akár a jós, akár a zenész esetével állunk szemben. Ez némileg ellentmond a
mindennapi értékítéletünknek, mivel nem nagyon hisszük, hogy egy ember jövőbe látó lenne, ezért még 10 találat esetén is
azt mondjuk, hogy nem hisszük, hogy jóssal állunk szembe, míg a zeneértő esetén elhisszük hasonló esetben a
szakértelmét. Mégis hogyan lehetne megkülönböztetni ezeket az eseteket. Nos éppen erről szól a Bayes-statisztika,
amelynek módszerét a következőkben mutatjuk be.

Bayes-módszer
Itt a koncepció az, hogy már a kísérlet elvégzése előtt van egy elképzelésünk a szituációról, jelen esetben valószínűleg
eléggé eltérő. Általában hajlamosak vagyunk zeneértőket felismerni, és tudjuk, hogy ilyen emberek vannak. Míg
jövőmondó ember, ha egyáltalán elhisszük, hogy van ilyen, akkor is nagyon ritka. Azaz kezdetben kicsi esélyt adunk arra,
hogy valaki ilyen képességgel rendelkezik. Míg a másik esetben ez az esély lehet nagyobb. Mindenképpen szubjektív
esélylatolgatásról van azonban szó, hiszen más-más ember másképp ítéli meg ezeket a helyzeteket. Azt az esélyt, amit a
kísérlet elvégzése előtt az adott tényállás megítélésére használunk a priori valószínűségnek nevezzük Kant nyomán.

Megjegyzés. Kant használta az a priori, illetve az a posteriori kifejezéseket, ahol az első a tapasztalást megelőző, míg
a második a tapasztalat (érzékelés) utáni állapotot jelenti.

Két különböző szituációban használhatjuk tehát az esély vagy valószínűség szót. Az egyik, amikor egy véletlen
kísérletben egy esemény bekövetkezésének az esélyéről van szó. Ezt szokás „objektív” valószínűségnek is mondani,
vagy esemény-valószínűségnek. Ez a klasszikus valószínűség-számításban szereplő fogalom. Sajnos általában
számunkra ismeretlen.
A másik eset, amikor véletlenről szó sincs, csupán a világ egy (számunkra ismeretlen) állapotának a valószínűségéről
akarunk beszélni. Fog-e holnap esni? Mi az esélye, hogy egy adott érme szabályos és így tovább. Ezek nem ismételhető
véletlen kísérletek, csupán számunkra jelenleg ismeretlen tényállások, amelyeket informáltságunktól függően
másképp ítélünk meg. Éppen ezért ezeket szubjektív vagy szerencsésebben állapot-valószínűségeknek nevezzük.
Ezek számunkra ismertek, de általában különböző emberek esetén különbözők.

A szóhasználat jogosságát az adja, hogy ezek is kielégítik a Kolmogorov-axiómákat, azaz nevezhetők


valószínűségeknek, s ugyanúgy lehet velük számolni, mint az esemény-valószínűségekkel. Minden valószínűségekre
vonatkozó összefüggés, tétel természetesen ezekre is fennáll.

Egy tényállás vagy a világ egy tetszőleges állapotának fennállására vonatkozó bármilyen elvégzendő kísérletet
megelőző tudásunk kifejezését szolgáló szubjektív esélyt (valószínűséget) a priori valószínűségnek nevezünk. Ez
genuin szubjektív valószínűség-fogalom, hiszen a megismerő személytől függ még akkor is, ha mindenki ugyanúgy
ítélné is meg a helyzetet. Ez utóbbi esetben az interszubjektív megegyezés esete áll fenn. De ez sem lehet objektív, éppen
természete miatt.

Például a bevezető feladatunk esetén annak megítélése, hogy X zeneértő, illetve hogy Y jós, személyenként változó, de
általában az előbbit jóval valószínűbbnek gondoljuk, mint az utóbbit, mivel zeneértőket ismerünk, jövőbe látó
parafenoméneket pedig ritkán, s azokról is gyakran derül ki a csalás. Tehát az egyik esetben annak a valószínűsége, hogy a
zeneértő állapot fennáll X esetében (jelölje X = 1), egy valahogyan számszerűsíthető esély, legyen ez P(X = 1) = 0,01. Míg a
másik esetben, ha egyáltalán hiszünk ilyesmiben, akkor is nagyon kevés ilyen ember lehet, tehát P(Y = 1) = 10–9, azaz azt
gondoljuk, hogy a 6 milliárd ember között kb. 6 ilyen lehet. (Természetesen mindkét esetben az olvasó maga választhat
tetszőleges, számára egy igazságos fogadás esetén elfogadható értéket.) Ezután végezzük el a kísérletet, s annak eredménye
legyen 10-ből 10 találat mindkét esetben. Ekkor az elején említett klasszikus szigni kanciateszt esetén azt kell mondanunk,
hogy mindkét személy esetén egyformán elvetjük a véletlen tippelést mint hipotézist még 99%-os szigni kanciaszinten is.
Azaz mindkét személyt szakértőnek mondjuk a maga nemében.
A bayesi gondolkodás azonban különbséget tesz. Ugyanis a 10 találat utáni új szubjektív valószínűséget mindkét
esetben a Bayes-tétellel lehet kiszámolni:

Míg a másik esetben

Azaz az első esetben a 10 találat után a zeneértőt szakértőnek mondjuk 91,2% eséllyel. Míg a jövendőmondás esélye még
mindig csak egymilliomod körül maradt. (Persze azért kb. 1000-szeresére nőtt!) Vagyis a két eset (ahogyan az életben is)
megkülönböztethető. Ez az egyik nagy előnye a Bayes-statisztika gondolkodásmódjának. A következő példánk előtt
de niáljuk még ezeket az új szubjektív valószínűségeket.

Ha a priori valószínűségekkel a kísérletünk eredményét felhasználva a Bayes-tétel segítségével felírjuk az állapotunk új


szubjektív valószínűségeit, akkor az eredményt a posteriori valószínűségnek nevezzük.

Kiszámítására tehát a következő formula írható fel, ahol K = k jelöli a kísérletben meg gyelt gyakoriságot.

A bal oldalon találjuk az a posteriori valószínűséget, a jobb oldalon pedig az a priori valószínűségek a kísérlet
eredményének az esélyével súlyozva szerepelnek. Természetesen lehet olyan eset, ahol nem két állapot van (szakértő vagy
nem szakértő), hanem több, esetleg megszámlálhatóan végtelen (ezek a diszkrét esetek) vagy akár nem megszámlálhatóan
végtelen is. Például egy ismeretlen valószínűség a [0; 1] intervallum tetszőleges eleme lehet. Ilyenkor az előző formula
általánosított változatát használjuk. Előbb azonban néhány fogalom.

Legyen a lehetséges állapotok száma legfeljebb megszámlálhatóan végtelen. Azaz Θ = {θ1, θ2, …, θn, …}. Ekkor a kísérlet
előtti állapotra vonatkozó előismereteinket, tudásunkat (vagy nem tudásunkat) egy ún. a priori eloszlás formájában
fejezzük ki. Azaz a P(θi) = pi, i = 1, 2, …, n, … eloszlást a priori eloszlásnak nevezzük.
Ezek után legyen egy kísérlet eredménye k, amelynek segítségével az egyes állapotok kísérlet utáni „új” valószínűségeit
számolni szeretnénk. Ekkor igaz lesz a következő összefüggés a Bayes-tétel alapján:

(27.3)

Az előző tételben szereplő eloszlást: P(θi|K = k) a posteriori eloszlásnak nevezzük.

Megjegyzés. Az ún. információhiányos állapot esetén, tehát amikor semmit nem tudunk az egyes állapotokról, akkor
szokás az egyenletes eloszlást a priori eloszlásnak választani.

Minden részletes indoklás nélkül közöljük az ún. folytonos állapotra vonatkozó esetet, tehát ha az állapottér
kontinuum számosságú, akkor az a priori eloszlást egy sűrűségfüggvénnyel fejezzük ki.

Ha Θ = {θα: α ϵ R}, és előzetes informáltságunkat az alábbi állapot-valószínűségeket összegző f(x) sűrűségfüggvény fejezi
ki, akkor f(x) a priori sűrűségfüggvény.

Ekkor is érvényes a Bayes-tétel, amihez a feltételes sűrűségfüggvényt kell használni.

(27.4)

A (27.4) képlet bal oldalán szereplő feltételes sűrűségfüggvényt a posteriori sűrűségfüggvénynek nevezzük.

Megjegyzés. Természetesen, ha többszöri kísérletet végzünk egymás után, akkor a második kísérlet előtti a priori
eloszlás (sűrűségfüggvény), az első kísérlet utáni a posteriori eloszlás (sűrűségfüggvény). A második után kapott új
eloszlás (sűrűségfüggvény) lesz a második kísérlet utáni a posteriori eloszlás (sűrűségfüggvény). Ezt az eljárást
akárhányszor iterálhatjuk.

Két fontos tétel a következő:

Ha van két kísérletünk egy állapottér esetén, akkor mindegy, hogy egymás után dolgozzuk fel az eredményt vagy
összegezve, tehát ugyanoda jutunk mindkét esetben. Formálisan ez a következőt jelenti:
, azaz kifejtve:

, ha összegezve dolgozzuk fel a szerzett információt.

Hasonlóan, ha két lépésben dolgozunk, akkor első lépésben, majd

.
Állításunk, hogy P(1) = P(2), azaz a két a posteriori eloszlás megegyezik.

Ha valójában a világ a θi állapotban van, és elég sok kísérletet végzünk, azaz a kísérletek száma n → ∞, akkor az a
posteriori eloszlás sztochasztikusan konvergál valamilyen i esetén a P(θi) = 1, P(θj) = 0, ha i ≠ j, egy pontra koncentrált
eloszláshoz, függetlenül attól, hogy milyen a priori eloszlásból indulunk ki, feltéve, hogy semelyik állapot
valószínűségét nem vettük 0-nak (azaz minden állapot a priori valószínűsége pozitív).
Megjegyzés. A második tétel lényegében a nagy számok törvényének a Bayes-szituációra vonatkozó alakja. Ebből az
következik, hogy elég sok tapasztalat után bármilyen „előítéletünk” is volt, feltéve, hogy semmit nem zártunk ki
(minden a priori valószínűség pozitív), akkor végül a valóságos állapothoz jutunk, tehát ez az emberi megismerésre
nézve egy igen pozitív tétel.
Példák
1. Legyen adva három átlátszó urnánk, az elsőben a sárga és a zöld borsószemek aránya 3:7, a másodikban fele-fele,
míg a harmadikban 6:4. Valaki egyet kiválaszt belőlük, majd abból visszatevéssel húz 5-ször, s eredményül 4
zöldet és 1 sárgát kap. Ezután mi az esélye, hogy az első, a második vagy a harmadik urnát választotta?
Nézzünk két különböző megközelítést! Először induljunk ki abból, hogy semmi előzetes információnk nincs,
melyik urnát választották ki, amelyikből aztán húztak. Ezt az egyenletes eloszlással lehet modellezni, tehát az a

priori eloszlás a három urna választására: . Nézzük hogyan adható meg az a posteriori
eloszlás:

összefüggést háromszor használva adódik:

Tehát ahogy azt gondoljuk is, az az urna vált a legvalószínűbbé, ahol a zöldek vannak többségben. A kezdeti
33,3%-ról majdnem a duplájára nőtt az esélye, 60,7%-ra. A másik kettő csökkent, a fele sárga, fele zöld (második)
csak néhány százalékot, 26,3%-ra, míg a sárga többségű harmadik urna esélye lecsökkent 13%-ra. Második
változatként vegyük azt, hogy valaki az átlátszó urnán át úgy vélte, hogy a sárgák vannak többségben. Ezért az
alábbi a priori eloszlást választotta: P(θ1) = 0,1; P(θ2) = 0,2; P(θ3) = 0,7. Nézzük, hogy ő mit mond a kísérlet után. Az
előző esethez hasonlóan, csak most a számolás kicsit bonyolultabb, mivel nem lehet az egyenlő a priori értékekkel
osztani a Bayes-tételben, adódik:

Végül az eredetileg legvalószínűbbnek tartott urna esélye 0,7-ről lecsökkent 0,21-re a kísérlet következtében.
Látszik, hogy még ekkor is a legvalószínűtlenebbnek tartott első urna esélye 0,1-ről 0,423-ra nőtt.
2. Legyen adott egy pénzérme, amelynél a fej dobásának esélyét akarjuk meghatározni. Ehhez egy dobássorozatot
végzünk, ahol a 100 dobásból 63 fej. Mit gondoljunk a pénzérméről?
Első esetben itt is válasszuk az a priori egyenletes eloszlást a fej valószínűségére, ami a [0; 1] intervallumban egy
valós szám lehet. Az a priori sűrűségfüggvény az f(x) = 1 lesz. Ekkor az eredmény után az a posteriori feltételes
sűrűségfüggvény:
Egy ún. béta-függvény lesz, ahol a c konstans, a nevezőben levő integrál értékének reciproka: . Tehát
az eredeti egyenletes eloszlás helyett (ami szintén tekinthető egy béta-eloszlásnak a 0; 0 paraméterpárral) egy
másik béta-eloszlást kaptunk, amely azonban a maximumát a 0,63-nál veszi fel, és elég hegyes görbe.
Ha most a szabályosságot a 0,49 és 0,51 közötti fej dobás valószínűségére fogadnánk el, akkor ezen eredmény után

ennek az esélye , amit vagy numerikusan integrálunk, vagy becsüljük a béta-eloszlást


egy normálissal, amit szintén meg lehet tenni. Numerikusan 0,000 149 adódik; míg ha engedékenyebbek
vagyunk, és 0,45 és 0,55 közötti értékek esetén is még szabályosságról beszélünk, akkor ezen eredmény után 0,001
44, tehát még mindig igen kis szám adódik.
Változik azonban a helyzet, ha nem az itt kissé abszurdnak tűnő egyenletes eloszlásból, hanem gyelembe véve a
pénzverdés tapasztalatokat, egy normális eloszlásféléből indulunk, amely 0,5 körül maximális. Egy ilyen béta-
eloszlást is vehetünk a prioriként, mivel az ilyen típusú kísérleteknél béta-eloszlásból a binomiálissal kombinálva

ismét béta-eloszlást kapunk, csak a paraméterek változnak. Például, ha az


sűrűségfüggvényt vesszük a priorinak, akkor a Bayes-tétel után adódik a következő a poszteriori eloszlás:

Erre az esetre a [0,49; 0,51] intervallumba esés valószínűségére a fenti kísérlet után 0,000 021 adódik, míg a [0,45;
0,55] intervallumra 0,000 148, tehát még kevesebb, mint az egyenletes eloszlással.

Klasszikus kontra Bayes-statisztika


Ebben a rövid fejezetben összefoglaljuk a két módszert és összevetjük eredményeit, amikor mindkettőt lehet használni.
Erre talán legalkalmasabb az előző fejezet utolsó feladata, a pénzérmés. A klasszikus elmélet szerint a szabályossági
hipotézist 0,95-ös szigni kanciaszinten tesztelve a [40; 60] intervallum adódik, tehát az eredmény alapján elvetjük a
szabályosság hipotézisét. De nem a téves döntés esélye 0,05, hanem ha szabályos a pénzérme, akkor csupán kevesebb, mint
0,05 annak az esélye, hogy az eredmény kívül esik a [40; 60] intervallumon. Ebből nem következik, hogy a szabályossági
hipotézis esélye 0,05. Ennek nincs is értelme klasszikusan. Pontosan az igaz, hogy sok ilyen alapon végzett döntés közül lesz
kb. 95% helyes, de hogy melyik rossz, azt nem tudjuk. Tehát ez az elmélet tipikusan a tömegjelenségekre,
futószalagszituációkra vagy mamutcégek napi sok ezer döntése esetén kiválóan alkalmas. Viszont az egyes esetekre, vagy
ahol nagyobb szerepe van a kezdeti információknak, illetve ahol egyedi döntést kell hozni, ott igazi konkurens a Bayes-
statisztika. Ennek módszere szerint annak az esélye, hogy a szabályosság fennáll, 0,000 149, feltéve, hogy kezdetben
minden valószínűséget egyenlőnek vettünk. Mégis egy fontos előnye, hogy ez az elmélet az igazi kérdésre válaszol, egy
hipotézis esélyét számolja ki. De ennek ára van, szükség van az a priori eloszlásra, ami szubjektív, tehát ezáltal elvész a
tudomány hőn áhított objektivitása. Sokan éppen ezért utasítják el a Bayes-statisztikát, annak ellenére, hogy napjainkra
sok alkalmazása van.
Formálisan a klasszikus statisztika, mivel a P(θ|K = k) típusú valószínűségekkel nem tud kezdeni, helyette a P(K= k|θ)
típusú valószínűségekkel operál, s ha azt túl kicsinek találja, akkor elveti annak a hipotézisnek (θ) a létjogosultságát,
amelyet vizsgát. De a valószínűség nem a hipotézisre vonatkozik, csak a feltételezése melletti kísérleti eredményre.
A Bayes-statisztika a hipotézis valószínűségét számolja ki, de ehhez szüksége van egy szubjektív állapot-valószínűségre
(a priori) és a Bayes-tétel segítségével egy a posteriori állapot-valószínűséget kap, s ennek alapján következtet. Ezáltal elvész
az egyébként is vitatható objektivitása a válasznak, viszont jóval életszerűbb a valóságos szituációkban. És érthetőbb a
tanulónak, mert a kérdésre válaszol. A klasszikus elmélet szerint a hipotézisnek nem is lehet valószínűsége, így nincs mit
kezdeni, ezért a fordított, nehezebb indirekt okoskodás. Ráadásul a hipotézisteszt aszimmetrikus, hipotézist igazolni nem
lehet, csak elvetni. Azaz, amit gondolunk, annak az ellenkezőjéből kell kiindulni, s ha azt sikerül statisztikailag elvetni
(„cáfolni”), akkor ezzel igazoltuk, amit akartunk.
Mélyebben nem kívánunk a kérdésbe belemenni, a fentiek a rövid összefoglalásai egy bevezető tárgyalásnak.
Megjegyezzük, hogy létezik a bayesi döntéselmélet is, de ez már nem fér ide könyvünk terjedelmi korlátai miatt, ahogyan a
klasszikusból is csak egy kis ízelítőt adtunk.
Az olvasónak ajánljuk még a Fazekas István által szerkesztett Bevezetés a matematikai statisztikába című egyetemi
jegyzetet (Kossuth Egyetemi Kiadó, 2003), amelynek felépítését követtük a 27.7. alfejezetben és egy példáját is átvettük;
Vincze István Matematikai statisztika ipari alkalmazásokkal című (Műszaki Könyvkiadó, 1975), illetve Reimann József és
Tóth Julianna Valószínűségszámítás és matematikai statisztika (Nemzeti Tankönyvkiadó, 1985) című könyveit, valamint a
Bognár–Göndöcs és munkatársai által írt Matematikai statisztika (Nemzeti Tankönyvkiadó, 1995) című egyetemi jegyzetet.
I. táblázat. A standard normális eloszlás eloszlásfüggvényének táblázata

A standard normális eloszlású valószínűségi változó eloszlásfüggvénye:

II. táblázat. A χ2-próba táblázata

Példa. .

III. táblázat. Az F-próba kritikus értékei ϵ=0,05-re f1 a nagyobb empirikus szórásnégyzetű minta elemszámának, f2 pedig a
másik minta elemszámának eggyel kisebbített értéke

IV. táblázat. A t-(Student-) próba kritikus értékei 80%-os (90%-os), 90%-os (95%-os), 95%-os (97,5%-os), 98%-os (99%-os), 99%-os
(99,5%-os), 99,9%-os (99,95%-os) kétoldali (egyoldali) szintre
Statisztikai biztonság
Szabadsági fok, f
80% 90% 95% 98% 99% 99,9%

1 3,0777 6,3138 12,7062 31,8205 63,6567 636,6192

2 1,8856 2,9200 4,3027 6,9646 9,9248 31,5991

3 1,6377 2,3534 3,1824 4,5407 5,8409 12,9240


Statisztikai biztonság
Szabadsági fok, f
80% 90% 95% 98% 99% 99,9%

4 1,5332 2,1318 2,7764 3,7469 4,6041 8,6103

5 1,4759 2,0150 2,5706 3,3649 4,0321 6,8688

6 1,4398 1,9432 2,4469 3,1427 3,7074 5,9588

7 1,4149 1,8946 2,3646 2,9980 3,4995 5,4079

8 1,3968 1,8595 2,3060 2,8965 3,3554 5,0413

9 1,3830 1,8331 2,2622 2,8214 3,2498 4,7809

10 1,3722 1,8125 2,2281 2,7638 3,1693 4,5869

11 1,3634 1,7959 2,2010 2,7181 3,1058 4,4370

12 1,3562 1,7823 2,1788 2,6810 3,0545 4,3178

13 1,3502 1,7709 2,1604 2,6503 3,0123 4,2208

14 1,3450 1,7613 2,1448 2,6245 2,9768 4,1405

15 1,3406 1,7531 2,1314 2,6025 2,9467 4,0728

16 1,3368 1,7459 2,1199 2,5838 2,9208 4,0150

17 1,3334 1,7396 2,1098 2,5669 2,8982 3,9651

18 1,3304 1,7340 2,1009 2,5524 2,8784 3,9216

19 1,3277 1,7291 2,0930 2,5395 2,8609 3,8834

20 1,3253 1,7247 2,0860 2,5280 2,8453 3,8495

21 1,3232 1,7207 2,0796 2,5176 2,8314 3,8193

22 1,3212 1,7171 2,0739 2,5082 2,8188 3,7921

23 1,3195 1,7139 2,0687 2,4999 2,8073 3,7676

24 1,3178 1,7109 2,0639 2,4922 2,7969 3,7454

25 1,3163 1,7081 2,0595 2,4851 2,7874 3,7251

26 1,3150 1,7056 2,0555 2,4786 2,7787 3,7066

27 1,3137 1,7033 2,0518 2,4727 2,7707 3,6896

28 1,3125 1,7011 2,0484 2,4671 2,7633 3,6739

29 1,3114 1,6991 2,0452 2,4620 2,7564 3,6594

30 1,3104 1,6973 2,0423 2,4573 2,7500 3,6460

40 1,3031 1,6839 2,0211 2,4233 2,7045 3,5510

50 1,2989 1,6759 2,0086 2,4033 2,6778 3,4960

60 1,2958 1,6706 2,0003 2,3901 2,6603 3,4602

80 1,2922 1,6641 1,9901 2,3739 2,6387 3,4163

100 1,2901 1,6602 1,9840 2,3642 2,6259 3,3905

200 1,2858 1,6525 1,9719 2,3451 2,6006 3,3398

500 1,2832 1,6479 1,9647 2,3338 2,5857 3,3101

∞ 1,2816 1,6449 1,9600 2,3263 2,5758 3,2905

-->

You might also like