Enoter 1-29

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 757

eNote 1 1

eNote 1

Komplekse tal

I denne eNote introduceres og undersøges talmængden C , de komplekse tal. Da C betragtes


som en udvidelse af R , forudsætter eNoten almindeligt kendskab til de reelle tal, herunder de
elementære reelle funktioner som de trigonometriske funktioner og den naturlige
eksponentialfunktion. Endelig forudsættes elementært kendskab til vektorer i planen.
Opdateret 24.10.21 af Karsten Schmidt

1.1 Indledning

En simpel andengradsligning som x2 = 25 har to reelle løsninger, nemlig

x = 5 og x = 5,

idet 52 = 25 og ( 5)2 = 25 . På tilsvarende vis har ligningen x2 = 2 to løsninger,


nemlig p p
x = 2 og x = 2,
p 2 p 2
idet 2 = 2 og ( 2) = 2 .

I de ovenstående ligninger var højresiden positiv. Med ligningen

x2 = k , k 2 R

skal vi passe mere på. Her afhænger alt nemlig af fortegnet på k . Hvis k 0, har
ligningen løsningerne p p
x = k og x = k,
eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 2

p p
idet k 2 = k og ( k ) 2 = k . Men hvis k < 0 , har ligningen ingen løsninger, da der
ikke findes reelle tal, hvis kvadrat er negativt.

Men kunne man forestille sig en større mængde af tal end de reelle; en mængde, der
indeholder alle de reelle tal, men derudover også en løsning til ligningen

x2 = 1. (1-1)

Lad det komme an på en prøve! Vi antager at (1-1) har en løsning og giver løsningen
symbolet i . Så må (1-1) i analogi med ovenstående ligninger også have løsningen i ,
og vi opnår de to bemærkelsesværdige identiteter

i2 = 1 og ( i)2 = 1.

Vi stiller nu det ekstra krav til det hypotetiske tal i , at man skal kunne regne med det
efter de samme regneregler, som gælder for de reelle tal. Man skal for eksempel kunne
gange i med et reelt tal b og lægge denne størrelse til et andet reelt tal a. Hermed opstår
et nyt slags tal z af typen
z = a + ib , ( a, b) 2 R2 .
Nedenfor beskriver vi, hvordan de nævnte ambitioner om en større talmængde kan
imødekommes. Vi ser på, hvordan strukturen af talmængden må være, og hvilke lovmæs-
sigheder den indeholder. Talmængden kalder vi de komplekse tal og giver den symbolet
C . Den må være to-dimensional i den forstand, at et komplekst tal indeholder to reelle
tal a og b. Og som noget helt afgørende viser det sig at alle ligninger på formen
n 1
an x n + an 1x + · · · + a1 x + a0 = 0

hvor a0 , . . . , an er vilkårlige rationale tal (de såkaldte algebraiske ligninger) har løsninger
inden for C .

p
Man ser ofte tallet i indført ved i = 1 . Da det ligger uden for rammerne
af denne eNote at give en præcis definition af kvadratroden af komplekse tal,
undgår vi i det følgende skrivemåder hvor der tages kvadratrod af andre tal
end reelle tal som er større end eller lig med 0.

1.2 Komplekse tal indført som reelle talpar

Den sædvanlige skrivemåde for et komplekst tal z er

z = a + ib , (1-2)
eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 3

hvor a og b er reelle tal, og i er det nye imaginære tal, der opfylder i2 = 1 . Denne form
er særdeles praktisk ved regning med komplekse tal og derfor den form, der oftest ses
i tekniske anvendelser. Men af teoretiske grunde kan vi ikke definere de komplekse
tal ud fra formen (1-2). For hvad betyder egentlig et produkt som ib , og hvad betyder
additionen a + ib ?

En tilfredsstillende måde at indføre komplekse tal på er som mængden af reelle talpar


( a, b). Vi vil i dette afsnit vise, hvordan man i denne mængde kan definere regneoper-
ationer (addition, subtraktion, multiplikation og division), der opfylder de sædvanlige
regneregler fra reelle tal. De vil vise sig at give skrivemåden (1-2) fuld mening.

Definition 1.1 De komplekse tal


De komplekse tal C defineres som mængden af ordnede reelle talpar:

C = {( a, b) | a, b 2 R } (1-3)

Som symbol for et vilkårligt komplekst tal vil vi ofte bruge bogstavet z .

Eksempel 1.2

Her angives fem forskellige komplekse tal:

z1 = (2, 7) , z2 = (7, 2) , z3 = (0, 1) , z4 = ( 5, 0) , z5 = (0, 0) .

Først indfører vi regnearten addition for komplekse tal. Derefter subtraktion som en
særlig form for addition.
eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 4

Definition 1.3 Addition af komplekse tal


Lad z1 = ( a, b) og z2 = (c, d) være to komplekse tal.

Summen z1 + z2 defineres ved

z1 + z2 = ( a, b) + (c, d) = ( a + c, b + d) . (1-4)

Eksempel 1.4 Addition

For de to komplekse tal z1 = (2, 7) og z2 = (4, 3) gælder:

z1 + z2 = (2, 7) + (4, 3) = (2 + 4, 7 + ( 3)) = (6, 4) .

Det komplekse tal (0, 0) er neutralt med hensyn til addition, idet der for ethvert kom-
plekst tal z = ( a, b) gælder:
z + (0, 0) = ( a, b) + (0, 0) = ( a + 0, b + 0) = ( a, b) = z .
Det er klart, at (0, 0) er det eneste komplekse tal, som er neutralt med hensyn til addi-
tion.

For ethvert komplekst tal findes et modsat tal, som adderet med z giver (0, 0). Det kom-
plekse tal z = ( a, b) har det modsatte tal ( a, b), idet
( a, b) + ( a, b) = ( a + ( a), b + ( b)) = ( a a, b b) = (0, 0) .
Det er klart, at ( a, b) er det eneste modsatte tal for z = ( a, b). Det entydigt bestemte
modsatte tal til et komplekst tal z betegnes z . Ved hjælp heraf kan subtraktion af
komplekse tal indføres som en særlig form for addition.

Definition 1.5 Subtraktion af komplekse tal


For to komplekse tal z1 og z2 defineres differensen z1 z2 ved summen af z1 og det
modsatte tal for z2 :
z1 z2 = z1 + ( z2 ) . (1-5)
eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 5

Lad os for to vilkårlige komplekse tal z1 = ( a, b) og z2 = (c, d) beregne differensen


z1 z2 ud fra definition 1.5:
z1 z2 = ( a, b) + ( c, d) = ( a + ( c), b + ( d)) = ( a c, b d) .
Dette giver den enkle formel
z1 z2 = ( a c, b d) . (1-6)

Eksempel 1.6 Subtraktion af komplekse tal

For de to komplekse tal z1 = (5, 2) og z2 = (4, 3) gælder:

z1 z2 = (5 4, 2 ( 3)) = (1, 5) .

Mens addition (og subtraktion) af komplekse tal synes enkel og naturlig, virker multip-
likation (og division) af komplekse tal mere ejendommelig. Vi skal senere se, at alle fire
regningsarter har markante geometriske ækvivalenter i den såkaldte komplekse talplan,
som er den grafiske fremstilling af komplekse tal. Men i første omgang må vi blot tage
definitionerne for gode varer. Først giver vi definitionen på multiplikation. Derefter på
division som en særlig form for multiplikation.

Definition 1.7 Multiplikation af komplekse tal


Lad z1 = ( a, b) og z2 = (c, d) være to komplekse tal.

Produktet z1 z2 defineres ved

z1 z2 = z1 · z2 = ( ac bd, ad + bc) . (1-7)

Eksempel 1.8 Multiplikation af komplekse tal

For de to komplekse tal z1 = (2, 3) og z2 = (1, 4) gælder:

z1 z2 = (2, 3) · (1, 4) = (2 · 1 (3 · ( 4)), 2 · ( 4) + 3 · 1) = (14, 5) .


eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 6

Det komplekse tal (1, 0) er neutralt med hensyn til multiplikation, idet der for ethvert
komplekst tal z = ( a, b) gælder:
z · (1, 0) = ( a, b) · (1, 0) = ( a · 1 b · 0 , a · 0 + b · 1) = ( a, b) = z .
Det er klart, at (1, 0) er det eneste komplekse tal, som er neutralt med hensyn til multi-
plikation.
For ethvert komplekst tal z udover (0, 0) findes et unikt reciprokt tal, som ganget med
1
det z giver (1, 0). Det betegnes . Det komplekse tal z = ( a, b) har det reciprokke tal
z
✓ ◆
1 a b
= , , (1-8)
z a2 + b2 a2 + b2
idet
✓ ◆ ✓ ◆
a b a2 b2 ab ba
( a, b) · , = + , + 2 = (1, 0) .
a + b2
2 a + b2
2 a2 + b2 a2 + b2 2
a +b 2 a + b2

Opgave 1.9

Vis, at ethvert komplekst tal z 6= (0, 0) har netop ét reciprokt tal.

Ved hjælp af reciprokke tal kan vi nu indføre division som en særlig form for multip-
likation.

Definition 1.10 Division af komplekse tal


Lad z1 og z2 være vilkårlige komplekse tal, hvor z2 6= (0, 0).

z1 1
Kvotienten defineres som produktet af z1 og det reciprokke tal for z2 :
z2 z2
z1 1
= z1 · . (1-9)
z2 z2

Lad os for to vilkårlige komplekse tal z1 = ( a, b) og z2 = (c, d) 6= (0, 0) beregne kvo-


z
tienten 1 ud fra definition 1.10:
z2
✓ ◆ ✓ ◆
1 c d ac + bd bc ad
z1 · = ( a, b) 2 , = , .
z2 c + d2 c2 + d2 c2 + d2 c2 + d2
eNote 1 1.2 KOMPLEKSE TAL INDFØRT SOM REELLE TALPAR 7

Vi får hermed følgende formel for division:


✓ ◆
z1 ac + bd bc ad
= , . (1-10)
z2 c2 + d2 c2 + d2

Eksempel 1.11 Division af komplekse tal

Betragt de to komplekse tal z1 = (1, 2) og z2 = (3, 4).


✓ ◆ ✓ ◆
z1 1·3+2·4 2·3 1·4 11 2
= , = , .
z2 32 + 42 32 + 42 25 25

Vi slutter afsnittet med at vise, at de komplekse tal med de indførte regneoperationer


opfylder regneregler kendt fra de reelle tal.

Sætning 1.12 Egenskaber for komplekse tal


De komplekse tal overholder følgende regneregler:

1. Kommutativ regel for addition: z1 + z2 = z2 + z1

2. Associativ regel for addition: (z1 + z2 ) + z3 = z1 + (z2 + z3 )

3. Tallet (0, 0) er neutralt mht. addition

4. Ethvert z har et modsat tal z hvor z + ( z) = (0, 0)

5. Kommutativ regel for multiplikation: z1 z2 = z2 z1

6. Associativ regel for multiplikation: (z1 z2 ) z3 = z1 (z2 z3 )

7. Tallet (1, 0) er neutralt mht. multiplikation


1 1
8. Ethvert z 6= (0, 0) har et reciprokt tal , hvor z · = (1, 0)
z z
9. Distributiv regel: z1 (z2 + z3 ) = z1 z2 + z1 z3
eNote 1 1.3 KOMPLEKSE TAL PÅ REKTANGULÆR FORM 8

Bevis

Lad os se på egenskab 1, den kommutative regel. Der er givet to komplekse tal z1 = ( a, b) og


z2 = (c, d). Der gælder, at

z1 + z2 = ( a + c, b + d) = (c + a, d + b) = z2 + z1 .

Ved det andet lighedstegn er der for både første- og andenkoordinat benyttet, at den kom-
mutative lov for addition gælder for de reelle tal. Dermed ses at den kommutative regel også
gælder for komplekse tal.

I beviset for egenskaberne 2, 5, 6 og 9 udnyttes på tilsvarende måde, at de tilsvarende regler


gælder for reelle tal. Detaljerne overlades til læseren. For egenskaberne 3, 4, 7 og 8 henvises
til gennemgangen tidligere i dette afsnit.

1.3 Komplekse tal på rektangulær form

Da der til ethvert ordnet reelt talpar svarer et unikt punkt i ( x, y)-planen, og omvendt
til ethvert punkt i ( x, y)-planen svarer et unikt ordnet reelt talpar, kan C opfattes som
mængden af punkter i ( x, y)-planen. På figur 29.1 er vist seks punkter i ( x, y)-planen,
det vil sige seks komplekse tal.

(0,b) (a,b)

(0,1)

X
(0,0) (1,0) (a,0)

Figur 29.1 Seks komplekse tal i ( x, y)-planen

Vi vil i det følgende ændre skrivemåden for komplekse tal.


eNote 1 1.3 KOMPLEKSE TAL PÅ REKTANGULÆR FORM 9

Først identificerer vi alle komplekse tal af typen ( a, 0), det vil sige de tal der ligger på
x-aksen, med de tilsvarende reelle tal a . Specielt skrives tallet (0, 0) som 0 og tallet
(1, 0) som 1 . Bemærk, at dette ikke fører til konflikt mellem de indførte regnearter for
komplekse tal og de sædvanlige for reelle tal, idet

( a, 0) + (b, 0) = ( a + b, 0 + 0) = ( a + b, 0)

og
( a, 0) · (b, 0) = ( a · b 0 · 0 , a · 0 + 0 · b) = ( ab, 0) .

Derved kan x-aksen opfattes som en almindelig reel talakse og betegnes realaksen. På
den måde kan de reelle tal ses som en delmængde af de komplekse. At y-aksen kaldes
imaginæraksen hænger sammen med de forunderlige egenskaber for det komplekse tal
i , som vi nu skal indføre og undersøge.

Definition 1.13 Tallet i


Ved det komplekse tal i forstås tallet (0, 1) .

En afgørende motivation for indføringen af de komplekse tal var ønsket om en


talmængde, der indeholder en løsning på ligningen

x2 = 1.

Med tallet i har vi fået en løsning, idet der gælder:

i2 = i · i = (0, 1) · (0, 1) = (0 · 0 1 · 1 , 0 · 1 + 1 · 0) = ( 1, 0) = 1.

Sætning 1.14 Komplekse tals rektangulære form


Ethvert komplekst tal z = ( a, b) kan skrives på formen

z = a + i · b = a + ib . (1-11)

Den skrivemåde kaldes den rektangulære form af z .


eNote 1 1.3 KOMPLEKSE TAL PÅ REKTANGULÆR FORM 10

Bevis

Beviset består i simple omregninger, hvor den nye skrivemåde for tal af typen ( a, 0) indgår.

( a, b) = ( a, 0) + (0, b) = ( a, 0) + (0, 1) · (b, 0) = a + i b .

Da 0 = (0, 0) er neutralt med hensyn addition, og 1 = (1, 0) er neutralt med


hensyn multiplikation, gælder følgende identiteter:

0 + z = z og 1z = z .

Endvidere ses nemt, at


0z = 0 .

Lad os nu betragte alle komplekse tal af typen (0, b) . Da

(0, b) = 0 + ib = ib ,

kan i forstås som y-aksens enhed, og man omtaler derfor i som den imaginære enhed.
Heraf kommer betegnelsen imaginæraksen for y-aksen.

På figur 29.2 ses en opdatering af situationen fra figur 29.1, hvor tallene betegnes ved
deres rektangulære form.

imaginæraksen

ib a+ib

realaksen
0 1 a

Figur 29.2 Seks komplekse tal på rektangulær form i den komplekse talplan
eNote 1 1.3 KOMPLEKSE TAL PÅ REKTANGULÆR FORM 11

Alle reelle tal er komplekse, men ikke alle komplekse tal er reelle!

Metode 1.15 Udregninger ved hjælp af rektangulær form


En afgørende fordel ved den rektangulære form af komplekse tal er, at man ikke
behøver huske de formler for regneoperationerne addition, subtraktion, multiplika-
tion og division, der blev givet i definitionerne 1.3, 1.5, 1.7 og 1.10. Alle udregninger
kan nemlig udføres ved, at man følger de sædvanlige regneregler for reelle tal og
behandler tallet i, som man ville behandle en reel variabel — dog med den forskel,
at man kan erstatte i2 med 1 .

I det følgende eksempel vises, hvordan multiplikation kan udføres ved sædvanlig reg-
ning med faktorernes rektangulære form.

Eksempel 1.16 Multiplikation vha. rektangulær form

Vi udregner produktet af de to komplekse tal givet på rektangulær form z1 = a + ib og


z2 = c + id :

z1 z2 = ( a + ib)(c + id) = ac + iad + ibc + i2 bd = ac + iad + ibc bd


= ( ac bd) + i( ad + bc) .

Resultatet svarer til definitionen, se definition 1.7!

Opgave 1.17

Bevis, at den følgende regel for reelle tal — den såkaldte nulregel — også gælder for kom-
plekse tal: "‘Et produkt af to tal er 0, hvis og kun hvis mindst én af faktorerne er 0 ."’
eNote 1 1.3 KOMPLEKSE TAL PÅ REKTANGULÆR FORM 12

Bemærkning 1.18 Potenser for komplekse tal


Egenskab 6 i sætning 1.12 giver os mulighed for indføring af heltals-potenser for
komplekse tal, der svarer til heltals-potenser for reelle tal. Lad i det følgende n
betegne et naturligt tal.

1. z1 = z , z2 = z · z , z3 = z · z · z osv.

2. Pr. definition sættes z0 = 1 .

n 1
3. Endelig sættes z = .
zn
De vises nemt at de sædvanlige regneregler for heltals-potenser af reelle tal også
gælder for de komplekse:

zn zm = zn+m og (zn )m = zn m .

Vi afslutter dette afsnit med at indføre begreberne realdel og imaginærdel for komplekse
tal.

Definition 1.19 Realdel og imaginærdel


Givet et komplekst tal z med rektangulær form z = a + ib . Ved realdelen af z forstås
det reelle tal
Re(z) = Re( a + ib) = a , (1-12)
og ved imaginærdelen af z forstås det reelle tal

Im(z) = Im( a + ib) = b . (1-13)


eNote 1 1.4 KONJUGERING AF KOMPLEKSE TAL 13

Udtrykket rektangulær form hentyder til tallets placering i den komplekse


talplan, hvor Re(z) er tallets vinkelrette nedfældningspunkt på real-aksen, og
Im(z) dets vinkelrette nedfældningspunkt på imaginæraksen. Realdelen er
kort sagt tallets førstekoordinat, mens imaginærdelen er tallets andenkoordi-
nat.

Bemærk, at ethvert komplekst tal z kan opskrives på rektangulær form således:

z = Re(z) + i Im(z) .

Eksempel 1.20 Realdel og Imaginærdel

Tre komplekse tal er givet ved

z1 = 3 2i , z2 = i5 , z3 = 25 + i .

Find realdelen og imaginærdelen af hvert tal.

Re(z1 ) = 3 , Im(z1 ) = 2
Re(z2 ) = 0 , Im(z2 ) = 5
Re(z3 ) = 25 , Im(z3 ) = 1

To komplekse tal på rektangulær form er ens, hvis og kun hvis såvel deres
realdele som deres imaginærdele er ens.

1.4 Konjugering af komplekse tal


eNote 1 1.4 KONJUGERING AF KOMPLEKSE TAL 14

Definition 1.21 Konjugering


Lad z være et komplekst tal med rektangulær form z = a + ib . Ved det konjugerede
tal til z forstås det komplekse tal z givet ved

z=a ib . (1-14)

At konjugere et komplekst tal svarer til at det spejles i realaksen som vist på figur 29.3.

imaginæraksen
z=a+ib

v
realaksen
0 v

_
z=a ib
Figur 29.3 Spejling i realaksen

Det er indlysende, at det konjugerede tal til et konjugeret tal er det oprindelige tal selv:
z = z. (1-15)

Endvidere gælder følgende nyttige formel for produktet af et komplekst tal og dets
konjugerede tal:

z · z = | z |2 (1-16)

som bevises ved simpel udregning.

I den følgende metode vises en snild metode til omskrivning af en brøk med imaginær
nævner til rektangulær form, hvor vi udnytter at produktet af et tal z = a + ib og dets
konjugerede z = a ib altid bliver et reelt tal, jf. (1-16).
eNote 1 1.4 KONJUGERING AF KOMPLEKSE TAL 15

Metode 1.22 Udregning af brøk med imaginær nævner


Huskereglen er: Forlæng brøken med nævnerens konjugerede. Her er nævneren op-
skrevet på rektangulær form:

z z( a ib) z( a ib)
= = 2 .
a + ib ( a + ib)( a ib) a + b2

Et eksempel:

2 i (2 i)(1 i) 1 3i 1 3i 1 3
= = 2 2
= = i.
1+i (1 + i)(1 i) 1 +1 2 2 2

For konjugering i forbindelse med de fire sædvanlige regnearter gælder der følgende
meget simple regler.

Sætning 1.23 Regneregler for konjugering

1. z1 + z2 = z1 + z2

2. z1 z2 = z1 z2

3. z1 · z2 = z1 · z2

4. (z1 /z2 ) = z1 /z2 , z2 6= 0 .

Bevis

Beviset gennemføres ved simple omformninger ud fra tallenes rektangulære form. Som
eksempel tager vi den første formel. Antag z1 = a1 + ib1 og z2 = a2 + ib2 . Så gælder:

z1 + z2 = ( a1 + ib1 ) + ( a2 + ib2 ) = ( a1 + a2 ) + i(b1 + b2 )


= ( a1 + a2 ) i(b1 + b2 ) = ( a1 ib1 ) + ( a2 ib2 )
= z1 + z2 .


eNote 1 1.5 POLÆRE KOORDINATER 16

Til sidst bemærker vi, at alle komplekse tal på realaksen er identiske med deres kon-
jugerede tal, og at de er de eneste komplekse tal, der opfylder denne egenskab. Vi kan
af den grund opstille et kriterium for, om et givet tal i en mængde af komplekse tal er
reelt:

Sætning 1.24 Realkriteriet


Lad A være en delmængde af C , og lad AR betegne den delmængde af A , som
består af reelle tal. Der gælder:

AR = { z 2 A | z = z } .

Bevis

Lad z være et vilkårligt tal i A ✓ C med rektangulær form z = a + ib . Der gælder da:

z=z,a ib = a + ib , 2ib = 0 , b = 0 , z 2 AR .

1.5 Polære koordinater

Den oplagte måde at angive et punkt (eller en stedvektor) i et sædvanligt ( x, y)-koordinatsystem


på er naturligvis ved punktets rektangulære, dvs. retvinklede, koordinater ( a, b). I mange
situationer er det imidlertid nyttigt at kunne bestemme et punkt ved dets polære koordi-
nater, som består af punktets afstand til Origo samt dets retningsvinkel fra x-aksen til dets
stedvektor. Retningsvinklen er da positiv, hvis den måles i retning mod uret, og negativ
i retning med uret.

I det følgende indfører på tilsvarende vis polære koordinater for komplekse tal. Lad os
først præcisere en orientering af den komplekse talplan.
eNote 1 1.5 POLÆRE KOORDINATER 17

Definition 1.25 Orientering af den komplekse talplan


Orienteringen af den komplekse talplan fastlægges ved, at en cirkel med centrum i
tallet 0 gennemløbes mod uret.
Im

Re
0

Figur 29.4 Den komplekse talplans orientering

Ingredienserne i det komplekse tals polære koordinater er som nævnt dets afstand til
Origo, kaldet absolutværdien, og dets retningsvinkel, kaldet argumentet. Dem indfører vi
nu.
eNote 1 1.5 POLÆRE KOORDINATER 18

Definition 1.26 Absolutværdi og argument


Givet et komplekst tal z .

Ved absolutværdien af z forstås længden af den til z hørende stedvektor. Absolutvær-


dien skrives | z | og kaldes også for tallets modulus eller numeriske værdi.

Antag z 6= 0 . Enhver vinkel fra realaksens positive del til stedvektoren for z kaldes
et argument for z og betegnes arg(z) . Vinklen regnes med fortegn i overensstem-
melse med orienteringen af den komplekse talplan.
Im
z

|z|

arg(z)
Re
0

Figur 29.5 Absolutværdi og argument

Et sammenhørende par
| z | , arg(z)
af absolutværdien af z og et argument for z kaldes for tallets polære koordinater.

Bemærk, at argumentet for et tal z ikke er entydigt. Hvis man for eksempel
lægger vinklen 2p til et vilkårligt argument for z, opnår man igen en gyldig
retningsvinkel for z og dermed et nyt gyldigt argument. Et komplekst tal har
derfor uendeligt mange argumenter, der hver svarer til at dreje et antal ekstra
hele omgange med eller mod uret for igen at nå samme punkt.

Man kan altid vælge et argument for z, som ligger i intervallet fra p til p. Der er tradi-
tion for at give dette argument en fortrinsstilling. Det kaldes for tallets hovedargument.
eNote 1 1.5 POLÆRE KOORDINATER 19

Definition 1.27 Hovedargument


Givet et komplekst tal z, som ikke er 0 . Ved hovedargumentet Arg(z) for z forstås det
entydigt bestemte argument for z, som opfylder:

arg(z) 2 ] p, p ] .

Vi betegner hovedargumentet med stort forbogstav Arg(z) til forskel fra arg(z),
der betegner et vilkårligt argument. Samtlige argumenter for et komplekst tal z
er da fastlagt ved

arg(z) = Arg(z) + p · 2p , p 2 Z . (1-17)

To komplekse tal er ens, hvis og kun hvis såvel deres absolutværdier som deres
hovedargumenter er ens.

Eksempel 1.28 Hovedargumenter

Im
2+2i 2+2i
3
4

2 Re

_
4
_ 3
4

2 2i 2 2i

Figur 29.6 Hovedargumenter

På figuren er angivet fem komplekse tal, hvoraf de fire ligger på vinkelhalveringslinjer


mellem akserne. Vi aflæser:
eNote 1 1.5 POLÆRE KOORDINATER 20

• 2 + 2i har hovedargumentet p
4 ,

• 2 2i har hovedargumentet p
4 ,
3p
• 2 + 2i har hovedargumentet 4 ,
3p
• 2 2i har hovedargumentet 4 , og

• 2 har hovedargumentet p .

Om det er mest fordelagtigt at benytte komplekse tals rektangulære form eller deres
polære koordinater, afhænger af situationen. Det er derfor vigtigt, at man hurtigt kan
veksle mellem dem. I metode 1.29 demonstreres det, hvordan man kan veksle mellem
de to former.
eNote 1 1.5 POLÆRE KOORDINATER 21

Metode 1.29 Rektangulære og polær koordinater


Vi betragter et komplekst tal z 6= 0, som har den rektangulære form z = a + ib og et
argument v :

i|z|sin(v) z=a+ib

|z| b
i
v a
0 1 |z|cos(v)

Figur 29.7 Omformning mellem rektangulær form og polære koordinater

1. Rektangulær form fås ud fra de polære koordinater således:

a = |z| cos(v) og b = |z| sin(v) . (1-18)

2. Absolutværdien fås ud fra den rektangulære form således:


p
| z | = a2 + b2 . (1-19)

3. Et argument fås ud fra den rektangulære form ved at finde en vinkel v der
opfylder begge disse ligninger:

a b
cos(v) = og sin(v) = . (1-20)
|z| |z|

Når z som på figuren i metode 1.29 er tegnet i første kvadrant, er det oplagt, at
reglerne (1-18) og (1-20) kommer fra velkendte formler for cosinus og sinus til
spidse vinkler i retvinklede trekanter og (1-19) fra Pythagoras’ sætning. Med
de samme formler kan det vises, at de indførte metoder gælder, uanset hvilken
kvadrant z ligger i.
eNote 1 1.5 POLÆRE KOORDINATER 22

Eksempel 1.30 Fra rektangulær til polær form

p
Find de polære koordinater for tallet z = 3+i.

Im
z= 3 +i

|z|
v
Re
0

Figur 29.8 Bestemmelse af polære koordinater

Vi benytter reglerne i metode 1.29. Først identificeres reel- og imaginærdelen af z som


p
a= 3 og b = 1.

Vi bestemmer først absolutværdien:


p q p p
| z | = a2 + b2 = ( 3) 2 + 12 = 3 + 1 = 2 .

Dernæst bestemmes argumentet. Ud fra ligningen


p
a 3
cos(v) = =
|z| 2
får vi to bud på et hovedargument for z , nemlig
5p 5p
v= og v = .
6 6
På figuren ses, at z ligger i 2. kvadrant, og det korrekte hovedargument må derfor være det
førstnævnte. Men dette kan også fastlægges uden inspektion af figuren, idet også ligningen
1
sin(v) =
2
skal være opfyldt. Fra denne får vi også to bud på et hovedargument for z , nemlig
p 5p
v= og v = .
6 6

5p 5p
Da kun v = opfylder begge ligninger, ser vi, at Arg(z) = .
6 6
eNote 1 1.5 POLÆRE KOORDINATER 23

Hermed har vi fundet det polære koordinatsæt for z :


✓ ◆
5p
| z |, Arg(z) = 2 , .
6

Vi afslutter dette afsnit med de vigtige produktregler for absolutværdier og argumenter.

Sætning 1.31 Produktreglen for absolutværdi


Absolutværdien for produktet af to komplekse tal z1 og z2 fås ved

| z1 · z2 | = | z1 | · | z2 | . (1-21)

Af sætning 1.31 fås følgesætningen

Følgesætning 1.32
Absolutværdien for kvotienten af to komplekse tal z1 og z2 , hvor z2 6= 0 , fås ved

z1 |z |
= 1 . (1-22)
z2 | z2 |
Absolutværdien af den n’te potens af et komplekst tal z fås for ethvert n 2 Z ved

| z1 n | = | z1 | n . (1-23)

Opgave 1.33

Nedskriv i ord, hvad formlerne (1-21), (1-22) og (1-23) siger, og bevis dem.
eNote 1 1.6 GEOMETRISK FORSTÅELSE AF DE FIRE REGNEARTER 24

Sætning 1.34 Produktreglen for argumenter


Givet to komplekse tal z1 6= 0 og z2 6= 0 (hvorved også z1 z2 6= 0) . Der gælder, at
hvis v1 er et argument for z1 , og v2 er et argument for z2 , så er v1 + v2 et argument
for produktet z1 z2 .

Følgesætning 1.35
Givet to komplekse tal z1 6= 0 og z2 6= 0 , som begge er forskellige fra 0 . Der gælder:

1. Hvis v1 er et argument for z1 og v2 et argument for z2 , så er v1 v2 et


z
argument for brøken 1 .
z2
2. Hvis v er et argument for z , så er n · v et argument for potensen zn .

Opgave 1.36

Bevis sætning 1.34 og følgesætning 1.35.

1.6 Geometrisk forståelse af de fire regnearter

Vi startede med at indføre addition, subtraktion, multiplikation og division af kom-


plekse tal som algebraiske operationer udført på reelle talpar ( a, b), se definitionerne
1.3, 1.5, 1.7 og 1.10. Derefter viste vi, at de komplekse tals rektangulære form a + ib
fører til en mere praktisk måde at dyrke regnearterne på: man kan regne med de kom-
plekse tal på samme måde som med de reelle, når blot tallet i behandles på samme
måde som en reel parameter, og det udnyttes, at i2 = 1 . I dette afsnit skal vi se, at
regneoperationerne også kan forstås som geometriske konstruktioner.

Den første præcise beskrivelse af de komplekse tal blev givet af den norske landmåler
Caspar Wessel i 1796 . Wessel indførte komplekse tal som linjestykker med givne længder
og retninger, altså det vi i dag kalder vektorer i planen. Regning med komplekse tal var
derfor geometriske operationer udført på vektorer. I det følgende gengiver vi ideen
i Wessels definitioner. Det er nemt at indse ækvivalensen mellem den algebraiske og
eNote 1 1.6 GEOMETRISK FORSTÅELSE AF DE FIRE REGNEARTER 25

geometriske repræsentation af addition og subtraktion — det kræver mere at forstå æk-


vivalensen forsåvidt angår multiplikation og division.

Sætning 1.37 Geometrisk addition


Addition af to komplekse tal z1 og z2 kan opnås geometrisk på følgende måde:

Stedvektoren for z1 + z2 er summen af stedvektorerne for z1 og z2 .

z2=c+id

z1+z2=(a+c)+i( b+d)
i

0 1

z1=a+ib

Figur 29.9 Addition ved parallelogram-metoden

Bevis

Antag at z1 og z2 er givet på rektangulær form ved z1 = a + ib og z2 = c + id . Så har sted-


vektoren for z1 koordinatsættet ( a, b) og stedvektoren for z2 koordinatsættet (c, d) . Summen
af de to stedvektorer er dermed ( a + c, b + d) , som er stedvektoren for det komplekse tal
( a + c) + i(b + d) . Da der algebraisk gælder z1 + z2 = ( a + ib) + (c + id) = ( a + c) + i(b + d) ,
er det ønskede vist.

Geometrisk subtraktion fås som en særlig form af geometrisk addition: Stedvektoren


for z1 z2 er summen af stedvektoren for z1 og den modsatte vektor til stedvektoren
for z2 . Situationen er illustreret på figur 29.10.
eNote 1 1.6 GEOMETRISK FORSTÅELSE AF DE FIRE REGNEARTER 26

z1=a+ib

z1-z2=(a-c)+i(b-d)
z2=c+id
i

0 1

-z2=-c-id

Figur 29.10 Subtraktion ved parallelogram-metoden

Mens vi ved undersøgelsen af geometrisk addition (og substraktion) har benyttet de


komplekse tals rektangulære form, får vi ved geometrisk multiplikation (og division)
brug for deres polære koordinater.

Sætning 1.38 Geometrisk multiplikation


Givet to komplekse tal z1 og z2 , som begge er forskellige fra 0 (hvorved også
z1 z2 6= 0) . Multiplikation af z1 og z2 kan opnås geometrisk på følgende måde:

1. Absolutværdien for produktet z1 z2 fås, når man ganger absolutvær-


dien af z1 med absolutværdien af z2 .

2. Et argument for produktet af z1 z2 fås, når man lægger et argument


for z1 sammen med et argument for z2 .

Bevis

Første del af sætningen fremgår af sætning 1.31, mens anden del fremgår af sætning 1.34.


eNote 1 1.6 GEOMETRISK FORSTÅELSE AF DE FIRE REGNEARTER 27

Eksempel 1.39 Multiplikation vha. polære koordinater

1 p
To komplekse tal z1 og z2 er givet ved de polære koordinater 2, 4 henholdsvis 2, 2p
3 .
Im


z2 3

11π
12

z1 π
z1 z2
4
1/2 1 2 Re

Figur 29.11 Multiplikation

Vi udregner produktet af z1 og z2 ved hjælp af deres absolutværdier og argumenter:

1
| z1 z2 | = | z1 | | z2 | = ·2 = 1
2
p 2p 11p
arg(z1 z2 ) = arg(z1 ) + arg(z2 ) = + = .
4 3 12
11p
Produktet z1 z2 er altså det komplekse tal, som har absolutværdien 1 og argumentet .
12

Bemærk, at det er vigtigt at notere sig, om et koordinatsæt er givet i rektan-


gulære eller i polære koordinater.
eNote 1 1.7 DEN KOMPLEKSE EKSPONENTIALFUNKTION 28

Eksempel 1.40 Division vha. polære koordinater

Tallene z1 og z2 er givet ved |z1 | = 6 og arg(z1 ) = u henholdvis |z2 | = 2 og arg(z2 ) = v .


Im

z1
u
z1
z2
z2 u-v
v
2 3 6 Re

Figur 29.12 Division

z1
Derved kan bestemmes ved
z2
✓ ◆
z1 6 z1
= = 3 og arg =u v.
z2 2 z2

1.7 Den komplekse eksponentialfunktion

Den sædvanlige eksponentialfunktion x 7! ex , x 2 R har som bekendt de karakteris-


tiske egenskaber ,

1. e0 = 1 ,

2. ex1 + x2 = ex1 · ex2 for alle x1 , x2 2 R , og

3. (ex )n = enx for alle n 2 Z og x 2 R .

I dette afsnit vil vi indføre en særdeles nyttig udvidelse af den reelle eksponentialfunk-
tion til en kompleks eksponentialfunktion, der viser sig at opfylde de samme regnere-
gler som den reelle.
eNote 1 1.7 DEN KOMPLEKSE EKSPONENTIALFUNKTION 29

Definition 1.41 Kompleks eksponentialfunktion


Ved den komplekse eksponentialfunktion expC forstås en funktion, som til ethvert
tal z 2 C med rektangulær form z = x + iy lader svarer tallet

expC (z) = expC ( x + iy) = ex · (cos(y) + i sin(y)) , (1-24)

hvor e er grundtallet 2.7182818 . . . for den reelle (naturlige) eksponentialfunktion.

Da vi for ethvert reelt tal x får


expC ( x ) = expC ( x + i · 0) = ex (cos(0) + i sin(0)) = ex ,
ser vi, at den komplekse eksponentialfunktion overalt på realaksen er identisk med den
reelle eksponentialfunktion. Vi risikerer derfor ikke en modstrid, når vi i det følgende
vil tillade (og flittigt bruge) skrivemåden
expC (z) = ez for z 2 C . (1-25)

Vi betragter nu det komplekse tal ez , hvor z er et vilkårligt komplekst tal med rektan-
gulær form z = x + iy . Der gælder da (ved brug af sætning 1.31), at
|ez | = |ex (cos(y) + i sin(y))| = |ex | |(cos(y) + i sin(y))| = |ex | = ex . (1-26)
Endvidere gælder (ved brug af sætning 1.34), at
arg (ez ) = arg (ex ) + arg (cos(y) + i sin(y)) = 0 + y = y . (1-27)

De polære koordinater for e z hvor z = x + iy , er dermed (ex , y) . Dette er illustreret i


figur 29.13.
Im

ez

ex
y

0
Re

Figur 29.13 Geometrisk fortolkning af ez


eNote 1 1.7 DEN KOMPLEKSE EKSPONENTIALFUNKTION 30

For de trigonometriske funktioner cos( x ) og sin( x ) vides, at der for ethvert helt tal p
gælder cos( x + p2p ) = cos( x ) og sin( x + p2p ) = sin( x ) . Hvis man forskyder grafen
for cos( x ) eller sin( x ) med et vilkårligt multiplum af 2p , vil den gå over i sig selv igen.
Funktionerne kaldes derfor periodiske med perioden 2p .

Et lignende fænomen kan ses ved den komplekse eksponentialfunktion. Den har den
imaginære periode i 2p . Dette hænger i høj grad sammen med periodiciteten af de
trigonometriske funktioner, hvilket kan ses i beviset for den følgende sætning.

Sætning 1.42 Periodicitet af ez


For ethvert komplekst tal z og ethvert helt tal p gælder:

ez+ip2p = ez . (1-28)

Bevis

Antag, at z har rektangulær form z = x + iy , og p 2 Z .

Der gælder:

ez+ip2p = ex+i(y+ p2p )


= ex cos(y + p2p ) + i sin(y + p2p ) = ex cos(y) + i sin(y)
= ez .

Hermed er sætningen bevist.

I det følgende eksempel illustreres periodiciteten af den komplekse eksponentialfunk-


tion.

Eksempel 1.43 Eksponentiel ligning

Bestem samtlige løsninger for ligningen


p
ez = 3+i. (1-29)
eNote 1 1.7 DEN KOMPLEKSE EKSPONENTIALFUNKTION 31

Vi skriver først z på rektangulær form: z = x + iy . I eksempel 1.30 har vi fundet, at hjøresiden


i (1-29) har absolutvrdien |z| = 2 og hovedargumentet v = 5p 6 . Da venstresiden og højresiden
skal have samme absolutværdi og samme argument, pånær et vilkårligt multiplum af 2p , fås
p
| ez | = | 3 + i | , ex = 2 , x = ln(2)
p 5p
arg(ez ) = arg( 3 + i) , y = v + p2p = + p2p , p 2 Z .
6
Samtlige løsninger for (1-29) er dermed
✓ ◆
5p
z = x + iy = ln(2) + i + p2p , p 2 Z.
6

Vi slutter afsnittet med at opstille og bevise de i indledningen nævnte regneregler kendt


fra den reelle eksponentialfunktion.

Sætning 1.44 Regneregler for kompleks eksponentialfunktion

1. e0 = 1

2. ez1 +z2 = ez1 · ez2 for alle z1 , z2 2 C

3. (ez )n = enz for alle n 2 Z og z 2 C

Bevis

Punkt 1 i sætningen, at e0 = 1, følger af at den komplekse eksponentialfunktion er identisk


med den reelle på den reelle akse, jf. (1-25).

I punkt 2 sætter vi z1 = x1 + iy1 og z2 = x2 + iy2 . Via polære koordinatsæt og sætning 1.38


fås:

ez1 · ez2 = ( e x1 , y 1 ) · ( e x2 , y 2 ) = (e x1 · e x1 , y 1 + y 2 ) = (e x1 + x2 , y 1 + y 2 )
= e(x1 +x2 )+i(y1 +y2 ) = e(x1 +iy1 )+(x2 +iy2 )
= ez1 + z2 .

I punkt 3 sætter vi z = x + iy og får via polære koordinatsæt samt gentagen anvendelse af


eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 32

sætning 1.38:

(ez )n = ((ex )n , n · y) = (en·x , n · y) = en·x+i·n·y = en(x+i·y)


= en · z .

Hermed er sætningen bevist.

Opgave 1.45

Vis, at der for ethvert z 2 C gælder ez 6= 0 .

1.8 Komplekse tals eksponentielle form

Lad v være et vilkårligt reelt tal. Indsættes det rent imaginære tal iv i den komplekse
eksponentialfunktion, fås af definition 1.41:

eiv = e0+iv = e0 (cos(v) + i sin(v)) ,

hvorved den berømte Eulers formel fremkommer.


eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 33

Sætning 1.46 Eulers formel


For ethvert v 2 R gælder:

eiv = cos(v) + i sin(v) . (1-30)


Im

eiv isin(v)
v
Re
cos(v) 0 1

Figur 29.14 Tallet eiv i den komplekse talplan

Ved hjælp af definitionen på den komplekse eksponentialfunktion, se defini-


tion 1.41, udledte vi Eulers formel. Nu kan vi omvendt benytte Eulers formel
til at opskrive den komplekse eksponentialfunktion på den bekvemme form

ez = ex cos(y) + i sin(y) = ex eiy . (1-31)

De to mest brugte skrivemåder for komplekse tal i både teoretisk og anvendt matematik
er den rektangulære form (som flittigt benyttet ovenfor) og den eksponentielle form. I den
eksponentielle form optræder tallets polære koordinater (absolutværdi og argument) i
forbindelse med den komplekse eksponentialfunktion:

Sætning 1.47 Komplekse tals eksponentiel form


Ethvert komplekst tal z 6= 0 kan skrives på formen

z = |z| eiv , (1-32)

hvor v er et argument for z . Skrivemåden kaldes tallets eksponentielle form.


eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 34

Bevis

Lad v være et argument for det komplekse tal z 6= 0 , og sæt r = |z| . Vi viser, at tallet reiv har
samme absolutværdi og argument som z , hvormed de to tal er ens:

1.
reiv = |r | eiv = r .

2. Da 0 er et argument for r, og v er et argument for eiv , er 0 + v = v et argument for


produktet reiv .

Metode 1.48 Udregninger ved hjælp af eksponentiel form


En afgørende fordel ved den eksponentielle form af komplekse tal er, at man ikke
behøver tænke på regnereglerne for multiplikation, division og potensopløftning,
når tallenes polære koordinater benyttes, se sætning 1.31, følgesætning 1.32 og sæt-
ning 1.34. Alle udregninger kan nemlig udføres ved, at man bruger de sædvanlige
regneregler på tallenes eksponentielle form .

Vi giver nu et eksempel på multiplikation efter metode 1.48; sammenlign med eksempel


1.39.

Eksempel 1.49 Multiplikation på eksponentiel form

To komplekse tal er givet på eksponentiel form,

1 pi 3p
z1 = e 4 og z2 = 2 e 2 i .
2
Produktet af tallene fås på eksponentiel form ved

1 pi 3p 1 3p 3p 7p
2 i = ( · 2)e 4 i+ 2 i = 1ei( 4 + 2 ) = e 4 i .
p p
z1 z2 = e4 2e
2 2
eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 35

Opgave 1.50

Gør rede for, at metode 1.48 er korrekt.

I det følgende vil vi vise hvordan, såkaldte binome ligninger kan løses ved hjælp af ek-
sponentiel form. En binom ligning er en toleddet ligning på formen

zn = w , (1-33)

hvor w 2 C og n 2 N . Binome ligninger er beskrevet dybere i eNote 2 om polynomier,


se afsnit 2.4.1. polynomier.

Vi viser først et eksempel på løsning af en binom ligning ved hjælp af eksponentiel form
og opstiller derefter den generelle metode.

Eksempel 1.51 Binom ligning på eksponentiel form

Find samtlige løsninger på den binome ligning


p
z4 = 8 + 8 3 i . (1-34)

Ideen er, at vi skriver såvel z som højresiden på eksponentiel form.

Hvis z har den eksponentielle form z = seiu , kan ligningens venstreside udregnes ved

z4 = (seiu )4 = s4 (eiu )4 = s4 ei4u . (1-35)

Højresiden opstilles nu ligeledes på eksponentiel form. Højresidens absolutværdi r findes


ved q
p p
r = | 8 + 8 3 i | = ( 8)2 + (8 3)2 = 16 .
Højresidens argument v opfylder
p p
8 1 8 3 3
cos(v) = = og sin(v) = = .
16 2 16 2
Ved hjælp af de to ligninger kan højresidens hovedargument fastlægges til
p 2p
v = arg( 8 + 8 3i) = ,
3
eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 36

og dermed er den eksponentielle form af højresiden


2p
reiv = 16e 3 i . (1-36)

Vi indsætter nu (1-35) og (1-36) i (1-34) for at erstatte højre- og venstresiden med de ekspo-
nentielle former
2p
s4 ei4u = 16e 3 i .
Da ventresidens absolutværdi skal være lig højresidens, får vi
p
s4 = 16 , s = 16 = 2 .
4

Venstresidens argument 4u og højresidens argument 2p 3 skal være ens på nær et multiplum


af 2p . Heraf fås
2p p p
4u = + p2p , u = + p , p 2 Z .
3 6 2
Disse uendeligt mange argumenter svarer vel at mærke, som vi har set tidligere, kun til fire
halvlinjer ud fra Origo bestemt ved de argumenter, der fås ved p = 0, p = 1, p = 2 og
p = 3 . For alle andre værdier af p vil den tilsvarende halvlinje være identisk med en af de
fire nævnte. For eksempel vil halvlinjen for p = 4 være givet ved argumentet
p p p
u= + 4 = + 2p ,
6 2 6
det vil sige samme halvlinje som svarer til p = 0 , da forskellen på argumenterne er en hel
omgang, altså 2p .

Den givne ligning (1-34) har derfor netop fire løsninger, som ligger på de nævnte fire halvlin-
jer i afstanden s = 2 fra 0 . Angivet på eksponentiel form:

z = 2 ei( 6 + p 2 ) , p = 0 , 1 , 2 , 3 .
p p

Eller omregnet hver for sig til rektangulær form ved brug af Eulers formel (1-30):
p p p p
z0 = 3 + i , z1 = 1 + i 3 , z2 = 3 i , z3 = 1 i 3 .

Alle løsningerne for en binom ligning ligger på en cirkel med centrum i 0 og radius lig
med højresidens absolutværdi. Forbindelseslinjerne mellem Origo og løsningerne deler
cirklen i lige store vinkler. Dette eksemplificeres på figur 29.15, der viser løsningerne på
fjerdegradsligningen fra eksempel 1.51.
eNote 1 1.8 KOMPLEKSE TALS EKSPONENTIELLE FORM 37

Im
z1

z0

2
Re
0 2

z2

z3
p
Figur 29.15 De fire løsningerne for z4 = 8 + 8 3i

Fremgangsmåden i eksempel 1.51 generaliserer vi i den følgende sætning. Sætningen


bevises i eNote 2 om polynomier.

Sætning 1.52 Binom ligning løst vha. eksponentiel form


Givet et komplekst tal w , som ikke er 0 , og som har den eksponentielle form

w = |w| eiv .

Den binome ligning


zn = w , n 2 N (1-37)
har n løsninger, som kan findes ved formlen
q v 2p
z = n |w| ei( n + p n ) , hvor p = 0 , 1 , . . . , n 1. (1-38)

Opgave 1.53 Binom ligning med negativ højreside

Lad r være et vilkårligt positivt reelt tal. Vis ved hjælp af sætning 1.52, at den binome an-
dengradsligning
z2 = r
har de to løsninger p p
z0 = i r og z1 = i r.
eNote 1 1.9 FØRSTE OG ANDENGRADSLIGNINGER 38

1.9 Første og andengradsligninger

Lad a og b være komplekse tal med a 6= 0 . En kompleks førstegradsligning på formen


az = b
har ligesom den tilsvarende reelle førstegradsligning netop én løsning
b
.
z=
a
Hvis a og b er på rektangulær form, finder man nemt en løsning på rektangulær form,
som vist i det følgende eksempel.

Eksempel 1.54 Løsning af førstegradsligning

Ligningen
(1 i) z = (5 + 2i)
har løsningen
5 + 2i (5 + 2i)(1 + i) 3 + 7i 3 7
z= = = = + i.
1 i (1 i)(1 + i) 2 2 2

Også ved løsning af komplekse andengradsligninger benytter vi en formel, der svarer til
den velkendte løsningsformel for reelle andengradsligninger. Dette gives i følgende
sætning, der bevises i eNote 2 om polynomier.

Sætning 1.55 Løsningsformel for kompleks andengradsligning


Lad a, b og c være vilkårlige komplekse tal med a 6= 0 . Vi definerer diskriminanten
ved D = b2 4ac . Andengradsligningen

az2 + bz + c = 0 (1-39)

har to løsninger
b w0 b + w0
z0 = og z1 = , (1-40)
2a 2a
hvor w0 er en løsning til den binome andengradsligning w2 = D .

b
Hvis specielt D = 0 , gælder der, at z0 = z1 = .
2a
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 39

I denne eNote indfører vi ikke kvadratrødder af komplekse tal. Derfor afviger


den komplekse løsningsformel ovenfor i en enkelt detalje fra den sædvanlige
reelle løsningsformel.

Konkrete eksempler på anvendelsen af sætning 1-39 findes i eNote 2 om polynomier, se


afsnit 2.4.2.

1.10 Komplekse funktioner af en reel variabel

I dette afsnit benyttes teorien om såkaldte epsilonfunktioner til indføring af differentiabilitet.


Stoffet er en anelse mere avanceret end hidtil, og viden om epsilonfunktioner fra eNote 3 kan
være en fordel. Desuden bør læseren være bekendt med differentiationsregneregler for sædvanlige
reelle funktioner.

Du bør bide godt mærke i funktioner af typen

f : t 7! ect , t 2 R , (1-41)

hvor c er et givet komplekst tal. Denne type funktioner har vid udbredelse i såvel teo-
retisk som anvendt matematik. Et hovedformål med dette afsnit er at beskrive dem
nærmere. De er eksempler på de såkaldte komplekse funktioner af en reel variabel. Vores
undersøgelse starter bredt med denne større klasse af funktioner. Vi viser blandt andet,
hvordan begreber som differentiabilitet og differentialkvotient kan overføres til dem.
Derefter går vi i dybden med funktionstypen (1-41).

Definition 1.56 Kompleks funktion af en reel variabel


Ved en kompleks funktion af en reel variabel forstås en funktion f , som til ethvert t 2 R
knytter ét komplekst tal, som betegnes f (t) . En kort skrivemåde for en funktion f
af denne type er
f : R 7! C .
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 40

Notationen f : R 7! C fortæller, at vi i funktionen f benytter en variabel i


det reelle talrum, men ender med et resultat i det komplekse talrum. Tag for
eksempel funktionen f (t) = eit . I det reelle tal t = p4 får vi den komplekse
funktionsværdi
⇣p⌘ ⇣p⌘ ⇣p⌘ p p
p
i 2 2
f = e 4 = cos + i sin = + i.
4 4 4 2 2

Lad os betragte en funktion f : R 7! C . Vi indfører to reelle funktioner g og h ved

g(t) = Re f (t) og h(t) = Im f (t)

for alle t 2 R . Herved kan f angives på rektangulær form:

f (t) = g(t) + i · h(t) , t 2 R . (1-42)

Når vi i det følgende skal indføre differentiabilitet for komplekse funktioner af en reel
variabel, får vi brug for en speciel type af dem, nemlig de såkaldte epsilonfunktioner. I
lighed med reelle epsilonfunktioner er det hjælpefunktioner, hvis funktionsudtryk man
som regel ikke er interesseret i. De to afgørende egenskaber for en reel epsilonfunktion
e : R 7! R er, at den opfylder e(0) = 0 , og at e(t) ! 0 når t ! 0 . De komplekse
epsilonfunktion indføres på tilsvarende vis.

Definition 1.57 Epsilon-funktion


Ved en kompleks epsilonfunktion af en reel variabel forstås en funktion e : R 7! C, som
opfylder:

1. e(0) = 0, og

2. |e(t)| ! 0 for t ! 0 .

Bemærk, at hvis e er en epsilonfunktion, så følger det direkte af definition


1.57, at der for ethvert t0 2 R gælder:

| e(t t0 ) | ! 0 for t ! t0 .

I det følgende eksempel vises et par komplekse epsilonfunktioner af en reel variabel.


eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 41

Eksempel 1.58 Epsilonfunktioner

Funktionen
t 7! i sin(t) , t 2 R
er en epsilonfunktion. Det ses, da krav 1 i definition 1.57 er opfyldt ved

i sin(0) = i · 0 = 0

og krav to ved
|i sin(t)| = |i| |sin(t)| = |sin(t)| ! 0 for t ! 0 .

Også funktionen
t 7! t + it , t 2 R
er en epsilonfunktion, idet
0+i·0 = 0
og p p
|t + it| = t2 + t2 = 2 |t| ! 0 for t ! 0 .

Vi er nu rede til af indføre begrebet differentiabilitet for komplekse funktioner af en reel


variabel.

Definition 1.59 Differentialkvotient for kompleks funktion


En funktion f : R 7! C kaldes differentiabel i t0 2 R, hvis der findes en konstant
c 2 C og en epsilon-funktion e : R 7! C sådan, at

f ( t ) = f ( t0 ) + c ( t t0 ) + e ( t t0 )(t t0 ) , t 2 R . (1-43)

Hvis f er differentiabel i t0 , kaldes c for differentialkvotienten for f i t0 .

Hvis f er differentiabel i ethvert t0 i et åbent interval I , siges f at være differentiabel


på I .

Differentiabilitet for en kompleks funktion af en reel variabel hænger nøje sammen med
differentiabiliteten for de to reelle dele af dens rektangulære form. Det viser vi nu.
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 42

Sætning 1.60
For en funktion f : R 7! C med rektangulær form f (t) = g(t) + ih(t) og et kom-
plekst tal c med rektangulær form c = a + ib gælder:

f er differentiabel i t0 2 R med
f 0 ( t0 ) = c ,
hvis og kun hvis g og h er differentiable i t0 med

g0 (t0 ) = a og h0 (t0 ) = b .

Bevis

Antag først, at f er differentiabel i t0 og f 0 (t0 ) = a + ib, hvor a, b 2 R . Så findes der en


epsilon-funktion e sådan, at f for ethvert t kan skrives på formen

f (t) = f (t0 ) + ( a + ib)(t t0 ) + e ( t t0 )(t t0 ) .

Vi omskriver såvel ventre- som højresiden til rektangulær form:

g(t) + ih(t) =
g(t0 ) + ih(t0 ) + a(t t0 ) + ib(t t0 ) + Re(e(t t0 )(t t0 )) + iIm(e(t t0 )(t t0 )) =
( g ( t0 ) + a ( t t0 ) + Re(e(t t0 ))(t t0 )) + i(h(t0 ) + b(t t0 ) + Im(e(t t0 ))(t t0 )) .

Heraf fås

g ( t ) = g ( t0 ) + a ( t t0 ) + Re(e(t t0 ))(t t0 ) og h(t) = h(t0 ) + b(t t0 ) + Im(e(t t0 ))(t t0 ) .

For at kunne konkludere, at g og h er differentiable i t0 med g0 (t0 ) = a og h0 (t0 ) = b ,


mangler vi blot at vise, at Re(e) og Im(e) er reelle epsilonfunktioner. Dette følger af, at

1. e(0) = Re(e(0)) + iIm(e(0)) = 0 medfører, at Re(e(0)) = 0 og Im(e(0)) = 0 , og at


q
2. |e(t)| = |Re(e(t))|2 + |Im(e(t))|2 ! 0 for t ! 0 medfører, at Re(e(t)) !
0 for t ! 0 og Im(e(t)) ! 0 for t ! 0 .

Den omvendte påstand i sætningen vises på tilsvarende vis.


eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 43

Hvis f (t) = g(t) + ih(t) er differentiabel på et åbent interval I gælder der

f 0 (t) = g0 (t) + ih0 (t) , t 2 I.

Eksempel 1.61 Differentialkvotient af kompleks funktion

Ved udtrykket
f (t) = t + it2
er der defineret en funktion f : R 7! C . Da realdelen af f har den afledede funktion 1 og
imaginærdelen af f den afledede 2t , får vi af sætning 1.60:

f 0 (t) = 1 + i2t , t 2 R .

Eksempel 1.62 Differentialkvotient af kompleks funktion

Betragt funktionen f : R 7! C givet ved

f (t) = eit = cos(t) + i sin(t) , t 2 R .

Da cos0 (t) = sin(t) og sin0 (t) = cos(t) , ses af sætning 1.60, at

f 0 (t) = sin(t) + i cos(t) , t 2 R .

I den følgende sætning betragter vi de såkaldte lineære egenskaber ved differentiation.


Disse er velkendte fra reelle funktioner.
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 44

Sætning 1.63 Regneregler for differentialkvotient


Lad f 1 og f 2 være differentiable komplekse funktioner af en reel variabel, og lad c
være et vilkårligt komplekst tal. Der gælder da:

1. Funktionen f 1 + f 2 er differentiabel med differentialkvotienten

( f 1 + f 2 )0 (t) = f 1 0 (t) + f 2 0 (t) . (1-44)

2. Funktionen c · f 1 er differentiabel med differentialkvotienten

(c · f 1 )0 (t) = c · f 1 0 (t) . (1-45)

Bevis

Lad f 1 (t) = g1 (t) + i h1 (t) og f 2 (t) = g2 (t) + i h2 (t), hvor g1 , h1 , g2 og h2 er differentiable


reelle funktioner. Lad endvidere c = a + ib være et vilkårligt komplekst tal på rektangulær
form.

Sætningens første del:

( f 1 + f 2 )(t) = f 1 (t) + f 2 (t) = g1 (t) + i h1 (t) + g2 (t) + i h2 (t)


= ( g1 (t) + g2 (t)) + i (h1 (t) + h2 (t)) .

Vi får da fra sætning 1.60 og ved brug af regneregler for differentialkvotienter af reelle funk-
tioner:

( f 1 + f 2 ) 0 ( t ) = ( g1 + g2 ) 0 ( t ) + i ( h 1 + h 2 ) 0 ( t )
= g10 (t) + g20 (t) + i h10 (t) + h20 (t)
= g10 (t) + i h10 (t) + g20 (t) + i h20 (t)
= f 10 (t) + f 20 (t) .

Hermed er sætningens første del bevist.

Sætningens anden del:

c · f 1 (t) = ( a + ib) · ( g1 (t) + i h1 (t))


= ( a g1 ( t ) b h1 (t)) + i ( a h1 (t) + b g1 (t)) .
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 45

Vi får fra sætning 1.60 og ved brug af regneregler for differentialkvotienter af reelle funk-
tioner:

( c · f 1 ) 0 ( t ) = ( a g1 b h 1 ) 0 ( t ) + i ( a h 1 + b g1 ) 0 ( t )
= a g10 (t) b h10 (t) + i a h10 (t) + b g10 (t)
= ( a + ib) g10 (t) + i h10 (t)
= c · f 10 (t) .

Hermed er sætningens anden del bevist.

Opgave 1.64

Vis, at hvis f 1 og f 2 er differentiable komplekse funktioner af en reel variabel, så er funktionen


f 1 f 2 differentiabel med differentialkvotienten

( f1 f 2 )0 (t) = f 10 (t) f 20 (t) . (1-46)

Vi vender nu tilbage til funktioner af typen (1-41). Først giver vi et nyttigt resultat om
deres konjugering.

Sætning 1.65
For et vilkårligt komplekst tal c og ethvert reelt tal t gælder:

ect = ec t . (1-47)
eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 46

Bevis

Lad c = a + ib være den rektangulære form af c . Vi får da ved brug af definition 1.41 og
regnereglerne for konjugering i sætning 1.23:

ect = eat+ibt
= e at (cos(bt) + i sin(bt))
= e at (cos(bt) + i sin(bt))
= e at (cos(bt) i sin(bt))
at
= e (cos( bt) + i sin( bt))
ibt
= e at
= ect .

Hermed er sætningen bevist.

For sædvanlige reelle eksponentialfunktioner af typen

f : x 7! ekx , x 2 R ,

hvor k er en reel konstant, gælder der som bekendt, at

f 0 ( x ) = k f ( x ) = kekx . (1-48)

Vi slutter eNoten af med at vise, at den komplekse eksponentialfunktion af en reel vari-


abel opfylder en helt tilsvarende differentiationsregel.

Sætning 1.66 Differentiation af ect


Betragt et vilkårligt tal c 2 C . Funktionen f : R 7! C givet ved

f (t) = ect , t 2 R (1-49)

er differentiabel, og dens differentialkvotient er bestemt ved

f 0 (t) = c f (t) = cect . (1-50)


eNote 1 1.10 KOMPLEKSE FUNKTIONER AF EN REEL VARIABEL 47

Bevis

Lad c’s rektangulære form være c = a + ib . Vi får da

ect = eat+ibt
= e at (cos(bt) + i sin(bt))
= e at cos(bt) + i e at sin(bt) .

Vi har altså

f (t) = g(t) + ih(t) , hvor g(t) = e at cos(bt) og h(t) = e at sin(bt) .

Da g og h er differentiable, er også f differentiabel . Da endvidere

g0 (t) = aeat cos(bt) eat b sin(bt) og h0 (t) = aeat sin(bt) + eat b cos(bt) ,

får vi nu

f 0 (t) = aeat cos(bt) eat b sin(bt) + i aeat sin(bt) + eat b cos(bt)


= ( a + ib)e at (cos(bt) + i sin(bt))
= ( a + ib)e at+ibt
= c ect .

Hermed er sætningen bevist.

Hvis c i sætning 1.66 er reel, udtrykker (1-50) naturligvis blot den sædvanlige differenti-
ation af den reelle eksponentialfunktion som antydet i (1-48). Også hvad differentiation
angår er den komplekse eksponentialfunktion af en reel variabel dermed en udvidelse
af den reelle.
eNote 2 1

eNote 2

Polynomier af én variabel

I denne eNote introduceres komplekse polynomier af én variabel. Der forudsættes elementært


kendskab til komplekse tal, og kendskab til reelle polynomier af én reel variabel er en fordel.
Opdateret 24.10.21 af Karsten Schmidt

2.1 Indledning

Polynomier forekommer overalt i den tekniske litteratur som matematiske modeller for
fysiske problemer. En stor fordel ved polynomier er at de er uhyre simple i beregninger
da de kun kræver addition, multiplikation og potensopløftning. Derfor er polynomier
bl.a. populære ved approksimation af mere komplicerede funktionstyper.

Kendskab til polynomiers rødder er en kongevej til forståelsen af deres egenskaber og


effektive brug og vil derfor være et hovedemne i det følgende. Men først introducerer
vi nogle generelle egenskaber.
eNote 2 2.1 INDLEDNING 2

Definition 2.1
Ved et polynomium af grad n forstås en funktion der kan skrives på formen
n 1
P(z) = an zn + an 1z + · · · + a1 z + a0 (2-1)

hvor a0 , a1 , . . . , an er komplekse konstanter med an 6= 0 , og z er en kompleks


variabel.

ak kaldes koefficienten for zk , k = 0, 1, . . . , n , og an er den ledende koefficient.


Et reelt polynomium er et polynomium hvori alle koefficienterne er reelle.
Et reelt polynomium af en reel variabel er et reelt polynomium hvori z 2 R .

Polynomier navngives ofte med et stort P eller tilsvarende bogstav Q, R, S . . .


Hvis det i situationen er naturligt at medtage variabelnavnet, skrives poly-
nomiet som P(z) hvor det underforstås at z er en uafhængig kompleks vari-
abel.

Eksempel 2.2 Eksempler på polynomier

P(z) = 2 z3 + (1 + i) z + 5 er et tredjegradspolynomium.
Q(z) = z2 + 1 er et reelt andengradspolynomium.
R(z) = 17 er et 00 te-gradspolynomium.
S(z) = 0 kaldes 0-polynomiet og tildeles ingen grad.
p
T (z) = 2 z3 + 5 z 4 er ikke et polynomium.

Når man ganger et polynomium med en konstant, og når man adderer, subtraherer,
multiplicerer og sammensætter polynomier med hinanden, får man et nyt polynomium.
Dette polynomium kan reduceres ved at led af samme grad samles så formen (2-1) op-
nås.

Eksempel 2.3 Addition og multiplikation af polynomier

To polynomier P og Q er givet ved P(z) = z2 1 og Q(z) = 2 z2 z + 2 . Polynomierne


R = P + Q og S = P · Q bestemmes således:
eNote 2 2.2 POLYNOMIERS RØDDER 3

R ( z ) = ( z2 1) + (2 z2 z + 2) = ( z2 + 2 z2 ) + ( z ) + ( 1 + 2) = 3 z2 z +1.
2 2 4 3 2 2
S(z) = (z 1) · (2 z z + 2) = (2 z z +2z )+( 2z +z 2)
= 2 z4 z3 + (2 z2 2 z2 ) + z 2 = 2 z4 z3 + z 2.

2.2 Polynomiers rødder

Definition 2.4 Rod i polynomium


Ved en rod i et polynomium P(z) forstås et tal z0 for hvilket P(z0 ) = 0 .

Eksempel 2.5 Om et givet tal er rod i et polynomium

Vis at 3 er rod i P(z) = z3 5z 12 , og at 1 ikke er rod.

Da P(3) = 33 5·3 12 = 0 , er 3 rod i P .


Da P(1) = 13 5·1 12 = 16 6= 0 , er 1 ikke rod i P .

Til at udvikle teorien for polynomiers rødder får vi brug for følgende hjælpesætning.
eNote 2 2.2 POLYNOMIERS RØDDER 4

Hjælpesætning 2.6 Nedstigningssætningen


Et n0 te-gradspolynomium P er givet ved
n 1
P(z) = an zn + an 1z + · · · + a1 z + a0 . (2-2)

Hvis z0 er et vilkårligt tal, og Q er det n-10 te-gradspolynomium som er givet ved


koefficienterne

bn = an
1 (2-3)
bk = ak+1 + z0 · bk+1 for k = n 2, . . . , 0 , (2-4)

så gælder der at P kan skrives på den faktoriserede form

P(z) = (z z0 ) Q ( z ) (2-5)

hvis og kun hvis z0 er rod i P .

Bevis

Lad polynomiet P være givet som i sætningen, og lad a være et vilkårligt tal. Betragt et
vilkårligt n-10 te-gradspolynomium
1 2
Q ( z ) = bn 1 zn + bn 2 zn + · · · + b1 z + b0 .
Ved simpel udregning fås
n 1
(z a ) Q ( z ) = bn 1 z n + ( bn 2 abn 1) z + · · · + (b0 ab1 )z ab0 .
Det ses at polynomierne (z a) Q(z) og P(z) har samme forskrift hvis vi successivt fastsæt-
ter bk -koefficienterne for Q som angivet i (2-3) og (2-4), og der samtidig gælder:
ab0 = a0 , b0 a = a0 .
Vi undersøger om denne betingelse er opfyldt ved at benytte (2-3) og (2-4) i modsat række-
følge:
b0 a = ( a1 + ab1 )a = b1 a2 + a1 a
= ( a2 + ab2 )a2 + a1 a = b2 a3 + a2 a2 + a1 a
..
.
n 1
= bn 1a
n
+ an 1a + · · · + a2 a2 + a1 a
n 1
= an an + an 1a + · · · + a2 a2 + a1 a = a0
n 1
, P(a) = an an + an 1a + · · · + a2 a2 + a1 a + a0 = 0 .
eNote 2 2.2 POLYNOMIERS RØDDER 5

Det ses at betingelsen er opfyldt hvis og kun hvis a er rod i P . Hermed er beviset fuldført.

Eksempel 2.7 Nedstigning

Givet polynomiet P(z) = 2z4 12z3 + 19z2 6z + 9 . Det ses at 3 er en rod idet
P(3) = 0 . Bestem et tredjegradspolynomium Q således at

P(z) = (z 3) Q ( z ) .

Vi sætter a4 = 2, a3 = 12, a2 = 19, a1 = 6 og a0 = 9 og finder koefficienter for Q ved


hjælp af (2-3) og (2-4):

b3 = a4 = 2
b2 = a3 + 3b3 = 12 + 3 · 2 = 6
b1 = a2 + 3b2 = 19 + 3 · ( 6) = 1
b0 = a1 + 3b1 = 6+3·1 = 3.

Vi konkluderer at
Q(z) = 2z3 6z2 + z 3

P(z) = (z 3) (2z3 6z2 + z 3) .

Når et polynomium P med roden z0 er skrevet på formen P(z) = (z z0 ) Q1 (z) ,


hvor Q1 er et polynomium, kunne det tænkes at z0 også er rod i Q1 . I så fald kan Q1
tilsvarende skrives som Q1 (z) = (z z0 ) Q2 (z) hvor Q2 er et polynomium. Og således
vil nedstigningen successivt kunne videreføres indtil P(z) = (z z0 )m R(z) hvor R er
et polynomium hvori z0 ikke er rod. Vi viser nu at denne faktorisering er unik.
eNote 2 2.2 POLYNOMIERS RØDDER 6

Sætning 2.8 En rods multiplicitet


Hvis z0 er rod i polynomiet P , kan det på netop én måde skrives på faktoriseret
form således:
P ( z ) = ( z z0 ) m R ( z ) (2-6)
hvor R(z) er et polynomium hvori z0 ikke er rod.

Eksponenten m kaldes den algebraiske multiplicitet af roden z0 .

Bevis

Antag at a er rod i P , og at der (i modsætning til påstanden i sætningen) findes to forskellige


faktoriseringer
P ( z ) = ( z a )r R ( z ) = ( z a ) s S ( z )
hvor r > s , og R(z) henholdsvis S(z) er polynomier hvori a ikke er rod. Vi får da

(z a )r R ( z ) (z a)s S(z) = (z a)s (z a)k R(z) S(z) = 0 , for alle z 2 C

hvor k = r s. Denne ligning er kun opfyldt hvis

(z a)k R(z) = S(z) for alle z 6= a .

Da venstre- og højresiden i denne ligning er kontinuerte funktioner, må de også have samme


værdi i a . Herved opnår vi
S(a) = (z a)k R(a) = 0
hvilket er i modstrid med antagelsen, at a ikke er rod i S .

Eksempel 2.9

I eksempel 2.7 fandt vi at

P(z) = (z 3) (2z3 6z2 + z 3)

hvor 3 er rod. Men 3 er også rod i den anden faktor 2z3 6z2 + z 3 . Ved at benytte
nedstigningssætningen, sætning 2.6, på dette polynomium får vi

P(z) = (z 3) ( z 3)(2z2 + 1) = (z 3)2 (2z2 + 1) .


eNote 2 2.2 POLYNOMIERS RØDDER 7

Da 3 ikke er rod i 2z2 + 1 , har roden 3 i P multipliciteten 2 .

Nu har vi startet en nedstigningsproces! Hvor langt kan vi komme ad den vej? For
at komme videre i undersøgelsen får vi brug for et grundlæggende resultat, nemlig
fundamentalsætningen.

2.2.1 Algebraens fundamentalsætning

En afgørende motivation for indføringen af komplekse tal er at ethvert polynomium


har rødder inden for de komplekse tal. Dette resultat blev vist af matematikeren Gauss
i hans ph.d.-afhandling fra 1799 . Beviset for sætningen er krævende, og Gauss arbe-
jdede videre på det hele sit liv for at gøre det endnu mere elegant. Hele fire versioner
foreligger der fra hans hånd, så ingen tvivl om at han lagde meget stor vægt på sætnin-
gen. Her tillader vi os at angive Gauss’ resultat uden bevis:

Sætning 2.10 Algebraens fundamentalsætning


Ethvert polynomium af grad n 1 har inden for de komplekse tal mindst én rod.

Polynomiet P(z) = z2 + 1 har ingen rødder inden for de reelle tal. Men inden
for de komplekse tal har det hele to rødder i og i fordi

P ( i ) = i2 + 1 = 1 + 1 = 0 og P( i) = ( i)2 + 1 = i2 + 1 = 0 .

Vejen fra algebraens fundamentalsætning til fuldt kendskab til antallet af polynomiers
rødder er ikke lang. Vi skal blot videreudvikle idéen i nedstigningssætningen.

Vi betragter et n0 te-gradspolynomium P med ledende koefficient an . Hvis n 1 , har


P ifølge algebraens fundamentalsætning en rod a1 og kan derfor med koefficientmeto-
den i nedstigningssætningen, sætning 2.6, skrives som

P(z) = (z a1 ) Q1 ( z ) (2-7)

hvor Q1 er et polynomium af grad n-1 med ledende koefficient an . Hvis n 2 , så


har Q1 en rod a2 og kan skrives som

Q1 ( z ) = ( z a2 ) Q2 ( z )
eNote 2 2.2 POLYNOMIERS RØDDER 8

hvor Q2 er et polynomium af grad n-2 ligeledes med ledende koefficient an . Ved ind-
sættelse fås nu
P(z) = (z a1 )(z a2 ) Q2 (z) .
Således fortsættes konstruktionen af nedstigningspolynomier Qk af graden n k for
k = n 1, . . . , 0 indtil vi når polynomiet Qn af graden n-n = 0 der som angivet i
eksempel 2.2, er lig med sin ledende koefficient an . Herefter kan P opskrives på fuld-
stændig faktoriseret form:

P(z) = an (z a1 )(z a2 ) · · · ( z an ) . (2-8)

I dette udtryk skal vi bemærke tre ting:

• Den første er at alle de n tal a1 , . . . , an der er oplistet i (2-8), er rødder i P da de


ved indsættelse i forskriften giver værdien 0 .

• Den anden ting vi bemærker, er at P ikke kan have andre rødder end de n
nævnte. At der ikke kan være flere, ses nemt således: Hvis et vilkårligt tal a 6=
ak , k = 1, . . . , n , indsættes på z0 s plads i (2-8), vil samtlige faktorer på højresiden
af (2-8) være forskellige fra nul. Dermed vil også deres produkt være forskelligt
fra nul. Derfor er P(a) 6= 0 , og a er ikke en rod i P .

• Den sidste ting vi bemærker i (2-8), er at rødderne ikke nødvendigvis er forskel-


lige. Hvis z1 , z2 , . . . , z p er de p forskellige rødder som P har, og mk er multi-
pliciteten (antal forekomster) af zk , k = 1, . . . , p , s kan den fuldstændigt faktoris-
erede form (2-8) reduceres til

P(z) = an (z z 1 ) m1 ( z z 2 ) m2 · · · ( z z p )m p (2-9)

hvor der gælder:


m1 + m2 · · · + m p = n .

Efter dette er vi nu klar til at præsentere følgende udvidede udgave af algebraens fun-
damentalsætning.

Sætning 2.11 Algebraens fundamentalsætning — version 2


Ethvert polynomium af grad n 1 har inden for de komplekse tal netop n rødder,
når rødderne regnes med multiplicitet.
eNote 2 2.3 IDENTISKE POLYNOMIER 9

Eksempel 2.12 Andengradspolynomier på fuldstændig faktoriseret form

Et vilkårligt andengradspolynomium P(z) = az2 + bz + c kan skrives på formen

P(z) = a(z a)(z b)

hvor a og b er rødder i P . Hvis a 6= b , har P to forskellige rødder, hver med algebraisk


multiplicitet 1 . Hvis a = b , har P én rod med algebraisk multiplicitet 2 . Roden kaldes da
en dobbeltrod.

Eksempel 2.13 Algebraisk multiplicitet

Et polynomium P er angivet på fuldstændig faktoriseret form således:

P ( z ) = 7( z 1)2 ( z + 4)3 ( z 5) .

Vi ser at P har tre forskellige rødder: 1, 4 og 5 med de algebraiske multipliciteter 2 hen-


holdsvis 3 og 1 .

Det bemærkes at summen af de algebraiske multipliciteter er 6 hvilket er lig med graden af


P i overensstemmelse med algebraens fundamentalsætning, version 2.

Eksempel 2.14 Algebraisk multiplicitet

Angiv antallet af rødder i P(z) = z3 .

P har kun én rod z = 0 . Rodens algebraiske multiplicitet er 3. Man siger at 0 er en trippelrod


i polynomiet.

2.3 Identiske polynomier

To polynomier P og Q kaldes ens hvis P(z) = Q(z) for alle z . Men hvad skal der til
for at to polynomier er ens? Kunne man for eksempel tænke sig at et fjerdegrads- og et
femtegradspolynomium har samme værdi i alle variable hvis man blot vælger de rette
koefficienter? Dette er ikke tilfældet idet der gælder følgende sætning.
eNote 2 2.3 IDENTISKE POLYNOMIER 10

Sætning 2.15 Identitetssætning for polynomier


To polynomier er ens hvis og kun hvis de er af samme grad, og alle koefficienter for
led af samme grad fra de to polynomier er ens.

Bevis

Vi betragter to vilkårlige polynomier P og Q . Hvis de har samme grad, og alle koefficien-


terne for led af samme grad er ens, må de klart have samme værdi i alle variable og er derfor
identiske. Hermed er første del af Identitetssætningen vist.

Antag herefter at P og Q er identiske, men at ikke alle koefficienterne for led af samme
grad fra de to polynomier er ens. Vi antager videre at P har grad n og Q grad m hvor
n m . Lad ak være koefficienterne for P og lad bk være koefficienterne for Q , og betragt
differenspolynomiet

R(z) = P(z) Q(z) (2-10)


n n 1
=( an bn ) z + ( a n 1 bn 1 )z + · · · + ( a1 b1 )z + ( a0 b0 )

hvor vi i tilfældet n > m sætter bk = 0 for m < k  n . Vi bemærker at 0’te-


gradskoefficienten ( a0 b0 ) ikke kan være den eneste for R(z) som er forskellig fra 0, for så
ville P(z) Q(z) = ( a0 b0 ) 6= 0 hvilket er i modstrid med at P og Q er identiske. Derfor
er graden af R større end eller lig med 1. På den anden side viser (2-10) at graden af R højst
er n . Lad nu zk , k = 1, . . . , n + 1 , være n + 1 forskellige tal. De er alle rødder i R idet

R(zk ) = P(zk ) Q(zk ) = 0 , k = 1 . . . n + 1 . (2-11)

Dette er imidlertid i modstrid med Algebraens fundamentalsætning, version 2, sætning 2.11:


R kan ikke have et antal rødder der er højere end dets grad. Antagelsen, at ikke alle koeffi-
cienterne for led af samme grad fra P og Q er ens, må derfor være forkert. Heraf følger også
at P og Q har samme grad. Hermed er anden del af Identitetssætningen er bevist.

Eksempel 2.16 To identiske polynomier

Ligningen
3 z2 z + 4 = a z2 + b z + c
eNote 2 2.4 POLYNOMIUMSLIGNINGER 11

er opfyldt for alle z netop når a = 3, b = 1 og c = 4 .

Opgave 2.17 To identiske polynomier

Bestem tallene a, b og c således at

(z 2)( a z2 + b z + c) = z3 5 z + 2 for alle z .

I det følgende afsnit behandler vi metoder til at finde rødder for visse typer af poly-
nomier.

2.4 Polynomiumsligninger

Fra algebraens fundamentalsætning, sætning 2.10, ved vi at ethvert polynomium af


grad større end eller lig med 1 har rødder. I dens udvidede version, sætning 2.11,
slås det endog fast at for ethvert polynomium er graden lig antallet af rødder hvis rød-
derne regnes med multiplicitet. Men sætningen er en teoretisk eksistenssætning som
ikke hjælper os med at bestemme rødderne.

I det følgende introduceres metoder til at finde rødderne for simple polynomier. Men
lad os holde ambitionsniveauet på et rimeligt niveau for i begyndelsen af 18-hundredtallet
beviste den norske algebraiker Abel at der ikke kan opstilles generelle metoder til at finde
rødderne i vilkårlige polynomier af grad større end fire!

For polynomier af højere grad end fire findes der en række smarte tricks hvorved man
kan være heldig at finde en enkelt rod. Herefter nedstiger man til et polynomium af
én lavere grad — og kan måske gradvist nå ned til et polynomium af fjerde grad eller
lavere hvortil der findes generelle metoder til at finde de resterende rødder.

Lad os indledningsvist slå fast at når man ønsker at finde rødderne for et polynomium
P(z) , skal man løse den tilsvarende polynomiumsligning P(z) = 0 . Som en simpel illus-
tration kan vi se på roden for et vilkårligt førstegradspolynomium:

P(z) = az + b .

For at finde den skal vi løse ligningen

az + b = 0 .
eNote 2 2.4 POLYNOMIUMSLIGNINGER 12

b
Det er ikke svært. Den har løsningen z0 = som derfor er rod i P(z) .
a

Når man skal finde rødderne for et polynomium P , finder man løsningerne på
polynomiumsligningen P(z) = 0 .

Eksempel 2.18 Roden i et førstegradspolynomium

Find roden til førstegradspolynomiet P givet ved

P ( z ) = (1 i) z (5 + 2i) .

Vi skal løse ligningen

(1 i) z (5 + 2i) = 0 , (1 i) z = (5 + 2i) .

Vi isolerer z på venstre side:

5 + 2i (5 + 2i)(1 + i) 3 + 7i 3 7
z= = = = + i.
1 i (1 i)(1 + i) 2 2 2

3 7
Altså har ligningen løsningen z0 = + i som samtidig er P0 s rod.
2 2

2.4.1 Binome ligninger

En binom ligning er en n0 tegradsligning hvor kun koefficienterne an (højestegradsled-


det) og a0 (konstantleddet) er forskellige fra 0 . En given binom ligning kan reduceres
til den følgende form:

Definition 2.19 Binom ligning


En binom ligning har formen zn = w hvor w 2 C og n 2 N .

For binome ligninger findes en eksplicit løsningsformel som vi præsenterer i den føl-
eNote 2 2.4 POLYNOMIUMSLIGNINGER 13

gende sætning.

Sætning 2.20 Binom ligning løst vha. eksponentiel form


Lad w 6= 0 være et komplekst tal med den eksponentielle form

w = |w| eiv .

Den binome ligning


zn = w (2-12)
har n forskellige løsninger givet ved formlen
q v 2p
z p = n |w| ei( n + p n ) hvor p = 0 , 1 , . . . , n 1. (2-13)

Bevis

p v 2p
For ethvert p 2 {0, 1, . . . , n 1} er z p = n
|w| ei( n + p n ) en løsning til (2-12), idet
✓q ◆n
i( nv + p 2p
n
(z p ) = n
| w |e n ) = |w| ei(v+ p 2p ) = |w| eiv = w.

Det ses at de n løsninger p


set som punkter i den komplekse talplan alle ligger på en cirkel med
centrum i Origo, radius n |w| og en fortløbende vinkelafstand på 2p n . Forbindelseslinjerne
mellem Origo og løsningerne deler med andre ord cirklen i n lige store vinkler.

Det følger heraf at de n løsninger er indbyrdes forskellige. At der ikke er flere løsninger, er
en følge af algebraens fundamentalsætning, version 2, sætning 2.11. Hermed er sætningen
bevist.

Vi vil i de næste eksempler betragte nogle vigtige særtilfælde af binome ligninger.


eNote 2 2.4 POLYNOMIUMSLIGNINGER 14

Eksempel 2.21 Binom andengradsligning

Vi betragter et komplekst tal på eksponentiel form w = |w| eiv . Det følger af (2-13) at anden-
gradsligningen
z2 = w
har to løsninger q q
v v
z0 = |w| ei 2 og z1 = |w| ei 2 .

Eksempel 2.22 Binom andengradsligning med negativ højreside

Lad r være et vilkårligt positivt reelt tal. Ved i eksempel 2.21 at sætte v = Arg( r ) = p ses
at den binome andengradsligning
z2 = r
har to løsninger p p
z0 = i r og z1 = i r.
Med et konkret eksempel har ligningen z2 = 16 løsningerne z = ±i 4 .

Den benyttede metode i eksempel 2.21 kan i mange tilfælde være vanskelig at gennem-
føre. I det følgende eksempel vises en alternativ metode.

Eksempel 2.23 Binom andengradsligning, metode 2

Løs ligningen
z2 = 8 6i . (2-14)

Da vi forventer at løsningerne for z kan være på kompleks form, sætter vi z = x + iy hvor


x og y er reelle tal. Hvis vi kan finde x og y, så har vi fundet løsningerne for z. Vi har derfor
z2 = ( x + iy)2 = x2 y2 + 2xyi og ser at (2-14) er ækvivalent med

x2 y2 + 2xyi = 8 6i .

Da en kompleks ligning er sand netop når såvel realdelen som imaginærdelen af ligningens
højreside og venstreside er identiske, må (2-14) videre være ækvivalent med

x2 y2 = 8 og 2xy = 6. (2-15)
eNote 2 2.4 POLYNOMIUMSLIGNINGER 15

6 3
Indsættes y = = i x2 y2 = 8 , og sættes x2 = u , opnås en andengradsligning som
2x x
kan løses:

✓ ◆2
2 3 9
x = 8 , x2 =8,
x x2
✓ ◆
2 9
x x2 = 8x2 , x4 9 = 8x2 , x4 8x2 9=0,
x2
u2 8u 9 = 0 , u = 9 eller u = 1.

Ligningen x2 = u = 9 har løsningerne x1 = 3 og x2 = 3, mens ligningen x2 = u = 1


ingen løsninger har, da x og y skal være reelle tal. Indsættes x1 = 3 henholdsvis x2 = 3 i
(2-15), fås de tilsvarende y-værdier y1 = 1 og y2 = 1 .

Hermed konkluderes at den givne ligning (2-14) har rødderne

z1 = x1 + iy1 = 3 i og z2 = x2 + iy2 = 3+i.

2.4.2 Andengradsligninger

Til løsning af andengradsligninger opstiller vi nedenfor den formel der svarer til den
velkendte løsningsformel for reelle andengradsligninger. Der er dog en enkelt afvigelse,
nemlig at vi ikke tager kvadratroden af diskriminanten hvilket skyldes at vi ikke her
forudsætter kendskab til kvadratrødder af komplekse tal.
eNote 2 2.4 POLYNOMIUMSLIGNINGER 16

Sætning 2.24 Løsningsformel for andengradsligning


For andengradsligningen

az2 + bz + c = 0 , a 6= 0 (2-16)

indføres diskriminanten D ved D = b2 4ac . Ligningen har to løsninger

b w0 b + w0
z1 = og z2 = (2-17)
2a 2a
hvor w0 er en løsning til den binome andengradsligning w2 = D .

b
Hvis specielt D = 0 , gælder der at z1 = z2 = .
2a

Bevis

Lad w0 være en vilkårlig løsning til den binome ligning w2 = D . Der gælder da:
✓ ◆
2 2 b c
az + bz + c = a z + z +
a a
✓ ◆2 !
b b2 c
=a z+ +
2a 4a2 a
✓ ◆ !
b 2 b2 4ac
=a z+
2a 4a2
✓ ◆ !
b 2 D
=a z+
2a 4a2
✓ ◆ !
b 2 w02
=a z+
2a 4a2
✓✓ ◆ ◆ ✓✓ ◆ ◆
b w0 b w0
=a z+ + z+
2a 2a 2a 2a
✓ ◆✓ ◆
b + w0 b w0
= a z+ z+ =0
2a 2a
b w0 b + w0
,z= eller z = .
2a 2a
Hermed er løsningsformlen (2.24) udledt.


eNote 2 2.4 POLYNOMIUMSLIGNINGER 17

Eksempel 2.25 Reel andengradsligning med positiv diskriminant

Løs følgende andengradsligning med reelle koefficienter:

2z2 + 5z 3 = 0.

Vi identificerer koefficienterne: a = 2, b = 5, c = 3 . Diskriminanten findes:

D = 52 4 · 2 · ( 3) = 49 .

Det ses at w0 = 7 er en løsning til den binome andengradsligning w2 = D = 49 . Nu kan


løsningerne udregnes:

5+7 1 5 7
z1 = = og z2 = = 3. (2-18)
2·2 2 2·2

Eksempel 2.26 Reel andengradsligning med negativ diskriminant

Løs følgende andengradsligning med reelle koefficienter:

z2 2z + 5 = 0 .

Vi identificerer koefficienterne: a = 1, b = 2, c = 5 . Diskriminanten findes:

D = ( 2)2 4·1·5 = 16 .

Ifølge eksempel 2.22 er en løsning til den binome andengradsligning w2 = D = 16 givet


ved w0 = 4i . Nu kan løsningerne udregnes:

( 2) + 4i ( 2) 4i
z1 = = 1 + 2i og z2 = =1 2i . (2-19)
2·1 2·1

Eksempel 2.27 Andengradsligning med komplekse koefficienter

Løs andengradsligningen

z2 (1 + i) z 2 + 2i = 0 . (2-20)
eNote 2 2.4 POLYNOMIUMSLIGNINGER 18

Lad os først identificere koefficienterne: a = 1, b = (1 + i), c = 2 + 2i . Diskriminanten


findes:
D = ( (1 + i))2 4 · 1 · ( 2 + 2i) = 8 6i .
Fra eksempel 2.23 ved vi at en løsning til den binome ligning w2 = D = 8 6i er w0 = 3 i.
Herefter findes løsningerne for (2-20) ved

( (1 + i)) + (3 i) ( (1 + i)) (3 i)
z1 = = 2 og z2 = = 1+i. (2-21)
2·1 2·1

2.4.3 Tredje- og fjerdegradsligninger

Fra antikken kendes geometriske metoder til løsning af (reelle) andengradsligninger.


Men først omkring år 800 e.Kr. blev algebraiske løsningsformler kendt via den persiske
(arabisk skrivende) matematiker Muhammad ibn Musa al-Khwarismes berømte bog al-
Jabr. Navnet al-Khwarisme blev i Vesten til det velkendte ord algoritme, mens bogens
titel blev til algebra.

Tre hundrede år senere gentog historien sig. Omkring år 1100 e.Kr. angav en anden per-
sisk matematiker (og digter) Omar Khayyám eksakte metoder til hvordan man finder
løsninger til reelle tredje- og fjerdegradsligninger ved hjælp af mere avancerede ge-
ometriske konstruktioner. For eksempel løste han ligningen x3 + 200x = 20x2 + 2000
ved skæring mellem en cirkel og en hyperbel hvis ligninger han kunne udlede af tred-
jegradsligningen.

Omar Khayyám mente ikke det ville være muligt at opstille algebraiske formler for
løsninger til ligninger af grad større end to. Her tog han dog fejl idet italieneren Gero-
lamo Cardano i 1500-tallet offentliggjorde formler til løsning af tredje- og fjerdegrad-
sligninger.

Khayyáms metoder og Cardanos formler ligger ikke inden for rammerne af denne eNote.
Her giver vi blot — se eksempel 2.9 tidligere samt nedenstående eksempel 2.28 —
enkelte eksempler på hvordan man ved hjælpåaf "‘nedstigningsmetoden"’, sætning 2.6,
kan finde alle løsninger til ligninger af grad større end to hvis man i forvejen kender
eller kan gætte et tilstrækkeligt antal af løsningerne.
eNote 2 2.5 REELLE POLYNOMIER 19

Eksempel 2.28 En tredjegradsligning med et indledende gæt

Løs tredjegradsligningen
z3 3z2 + 7z 5 = 0.

Det gættes nemt, at 1 er en løsning. Ved hjælpåaf nedstigningsaloritmen får man nemt fak-
toriseringen:
z3 3z2 + 7z 5 = (z 1)(z2 2z + 5) = 0 .
Vi ved at 1 er en løsning, de resterende løsninger fås ved løsning af andengradsligningen

z2 2z + 5 = 0 ,

som ifølge eksempel 2.26 har løsningerne 1 + 2i og 1 2i .

Samlet har tredjegradsligningen løsningerne 1, 1 + 2i og 1 2i .

2.5 Reelle polynomier

Teorien som har været udfoldet i de forrige afsnit, gælder for alle polynomier med kom-
plekse koefficienter. I dette afsnit vil vi præsentere to sætninger der kun gælder for poly-
nomier med reelle koefficienter — altså den delmængde som kaldes de reelle polynomier.
Den første sætning viser at ikke-reelle rødder altid optræder i par.

Sætning 2.29 Rødder i reelle polynomier


Hvis tallet a + ib er rod i et polynomium som kun har reelle koefficienter, så er også
det konjugerede tal a ib rod i polynomiet.

Bevis

Lad
1
P(z) = an zn + an 1 zn + · · · + a1 z + a0
være et reelt polynomium. Ved brug af regneregler for konjugering af sum og produkt af
komplekse tal (se eNote 29 om komplekse tal) samt forudsætningen at alle koefficienterne er
eNote 2 2.5 REELLE POLYNOMIER 20

reelle, fås

P(z) = an zn + an zn 1 + · · · + a1 z + a0
1
1
= an zn + an 1 zn + · · · + a1 z + a0
= P(z) .

Hvis z0 er rod i P , får vi


P ( z0 ) = 0 = 0 = P ( z0 )
hvoraf det ses at også z0 er rod. Hermed er sætningen bevist.

Eksempel 2.30 Konjugerede rødder

Det oplyses, at polynomiet

P(z) = 3z2 12z + 39 (2-22)

har roden 2 3i . Bestem alle rødder i P , og opskriv P på fuldstændig faktoriseret


form.

Vi ser at alle tre koefficienter for P er reelle. Derfor er også den oplyste rods konjugerede
2 + 3i rod i P . Da P er et andengradspolynomium, er der ikke flere rødder.

Ifølge eksempel 2.12 er den fuldstændigt faktoriserede form for P :

P(z) = 3 (z (2 3i))(z (2 + 3i)) .

I et polynomiums fuldstændigt faktoriserede form vil de to faktorer der svarer til et


par af konjugerede rødder, altid kunne ganges sammen til et reelt andengradspolynomium
således:
(z ( a + ib))(z (a ib)) = ((z a) + ib))((z a) ib)
= (z a )2 (ib)2
= z2 2az + ( a2 + b2 ) .

Fra sætning 2.29 ved vi at komplekse rødder i et reelt polynomium altid optræder i
konjugerede par. Heraf udspringer følgende sætning:
eNote 2 2.5 REELLE POLYNOMIER 21

Sætning 2.31 Reel faktorisering


Et reelt polynomium kan skrives som et produkt af reelle førstegradspolynomier og
reelle andengradspolynomier som ikke har reelle rødder.

Eksempel 2.32 Reel faktorisering

Om et reelt syvendegradspolynomium P oplyses at det har rødderne 1, i, 1 + 2i


samt dobbeltroden 2 , og at koefficienten til dets højestegradsled er a7 = 5 . Skriv
P som et produkt af reelle førstegradspolynomier og reelle andengradspolynomier
der ikke har reelle rødder.

Vi udnytter at de komplekse rødders konjugerede også er rødder, og sætter P på fuldstændig


faktoriseret form:

P(z) = 5 (z 1)(z i)(z + i)(z (1 + 2i))((z (1 2i))(z + 2)2 .

Der er to par af faktorer der svarer til konjugerede rødder. Når de ganges sammen, fås den
ønskede form:
P(z) = 5 (z 1)(z2 + 1)(z2 2z + 5)(z + 2)2 .

Hermed afsluttes behandlingen af polynomier af én variabel.


eNote 3 1

eNote 3

Elementære funktioner

I denne eNote vil vi dels repetere nogle af de basale egenskaber for et udvalg af de (fra
gymnasiet) velkendte funktioner f ( x ) af én reel variabel x, og dels introducere enkelte nye
funktioner, som typisk optræder i mangfoldige sammenhænge. De grundlæggende spørgsmål
vedrørende enhver funktion drejer sig typisk om følgende: Hvordan og for hvilke x er
funktionen defineret? Hvilke værdier af f ( x ) får vi, når vi bruger funktionen på elementerne
x i definitionsmængden? Er funktionen kontinuert? Hvad er differentialkvotienten f 0 ( x ) af
funktionen – hvis den eksisterer? Som noget nyt vil vi indføre en meget stor klasse af
funktioner, epsilon-funktionerne, som betegnes med fællesbetegnelsen #( x ), og som vi
gennemgående vil benytte til at beskrive kontinuitet og differentiabilitet – også af funktioner af
flere variable, som vil blive indført og analyseret i de efterfølgende eNoter.
Opdateret 24.10.21 af Karsten Schmidt

3.1 Definitionsmængde og værdimængde

Ved beskrivelsen af en reel funktion f ( x ) anføres dels de reelle tal x, hvor funktionen
er defineret, og dels de værdier, som kan fås ved at benytte funktionen på definitions-
mængden. Definitionsmængden kalder vi D m( f ) og værdimængden kalder vi V m( f ).
eNote 3 3.1 DEFINITIONSMÆNGDE OG VÆRDIMÆNGDE 2

Eksempel 3.1 Nogle definitionsmængder og værdimængder

Her er definitonsmængder og tilhørende værdimængder for nogle velkendte funktioner.

f1 (x) = exp( x ) , D m( f 1 ) = R = ] •, •[ , V m( f 1 ) = ]0, •[


f2 (x) = ln( x ) , D m( f 2 ) =]0, •[ , V m( f 2 ) = R = ] •, •[
p
f3 (x) = x , D m( f 3 ) = [0, •[ , V m( f 3 ) = [0, •[
f4 (x) = x2 , D m( f 4 ) = R = ] •, •[ , V m( f 4 ) = [0, •[
f5 (x) = x7 + 8x3 + x 1 , D m( f 5 ) = R = ] •, •[ , V m( f 5 ) = R = ] •, •[
f6 (x) = exp(ln( x )) , D m( f 6 ) = ]0, •[ , V m( f 6 ) = ]0, •[
f7 (x) = sin(1/x ) , D m( f 7 ) = ] •, 0[[]0, •[ , V m( f 7 ) = [ 1, 1]
f8 (x) = | x |/x , D m( f 8 ) = ] •, 0[[]0, •[ , V m ( f 8 ) = { 1} [ {1}
(3-1)

Figure 3.1: Den velkendte eksponentialfunktion e x = exp( x ) og den naturlige logarit-


mefunktion ln( x ). De røde cirkler på den negative x-akse og i 0 indikerer, at logarit-
mefunktionen ikke er defineret i ] •, 0].
eNote 3 3.1 DEFINITIONSMÆNGDE OG VÆRDIMÆNGDE 3

Funktionen f 8 ( x ) i eksempel 3.1 er defineret ud fra | x |, som betegner den nu-


meriske værdi af x, dvs.
8
< x>0, for x > 0
|x| = 0, for x = 0 (3-2)
:
x > 0 , for x < 0 .

Heraf følger definitionsmængde og værdimængde for f 8 ( x ) direkte.

Eksempel 3.2 Tangens

Funktionen
sin( x )
f ( x ) = tan( x ) = (3-3)
cos( x )
har definitionsmængden D m( f ) = R \ A, hvor A betegner de reelle tal x, hvor nævneren
cos( x ) er 0, dvs.

D m( f ) = R \ { x | cos( x ) = 0} = R \ {(p/2) + p · p , hvor p er et helt tal} . (3-4)

Værdimængden V m( f ) er alle de reelle tal, se figur 3.2.

Figure 3.2: Graferne for funktionerne tan( x ) og cot( x ).


eNote 3 3.1 DEFINITIONSMÆNGDE OG VÆRDIMÆNGDE 4

Opgave 3.3

Lad g( x ) betegne den reciprokke funktion til funktionen tan( x ):

cos( x )
g( x ) = cot( x ) = (3-5)
sin( x )

Se figur 3.2. Bestem definitionsmængden for g( x ), og skriv den på samme måde som for
tan( x ) ovenfor.

3.1.1 Udvidelser af definitionsmængden til hele R

En funktion f ( x ), som ikke er defineret i alle reelle tal, kan kan let udvides til en funktion
fb( x ), som har D m( fb) = R. Det kan for eksempel gøres ved hjælp af en krøllet parentes
som i følgende definition.

Definition 3.4 0-udvidelsen


Givet en funktion f ( x ) med D m( f ) 6= R. Så definerer vi 0-udvidelsen af f ( x ) ved

f ( x ) , for x 2 D m( f )
fb( x ) = (3-6)
0, for x 2 R \ D m( f ) .

Det er klart, at afhængig af anvendelsen kan man plombere og udvide defini-


tionsmængden for f ( x ) på mange andre måder end ved at vælge konstanten
0 som værdi for den udvidede funktion i de punkter, hvor den oprindelige
funktion ikke er defineret.

Værdimængden V m( fb) for den 0-udvidede funktion er naturligvis den


oprindelige værdimængde for f ( x ) forenet med værdien 0, dvs. V m( fb) =
V m ( f ) [ {0}.

Vi vil herefter typisk — medmindre andet nævnes helt tydeligt — antage, at de funk-
eNote 3 3.2 EPSILON-FUNKTIONER 5

tioner, vi betragter, er definerede i hele R (eventuelt ved hjælp af en udvidelseskon-


struktion) som ovenfor.

3.2 Epsilon-funktioner

Vi indfører en særlig klasse af funktioner, som vi vil benytte til at definere det vigtige
begreb kontinuitet for funktioner.

Definition 3.5 Epsilon-funktioner


Enhver funktion #( x ), som er defineret i et åbent interval, der indeholder 0, og som
antager værdien #(0) = 0 i x = 0 og derudover går imod 0, når x går imod 0,
kaldes en epsilon-funktion af x. Epsilon-funktioner er altså karakteriserede ved egen-
skaberne
#(0) = 0 og #( x ) ! 0 for x ! 0 . (3-7)
Den sidste betingelse er ækvivalent med, at den numeriske værdi af #( x ) kan gøres
så lille som ønsket ved blot at vælge den numeriske værdi af x tilstrækkelig lille.
Helt præcis betyder betingelsen: For ethvert helt tal k > 0 findes der et helt tal
K > 0 sådan, at |#( x )| < 1/k for alle x med | x | < 1/K.

Mængden af epsilon-funktioner er meget stor, som næste eksempel viser.

Eksempel 3.6 Epsilon-funktioner

Her er nogle simple eksempler på epsilon-funktioner:

# 1 (x) = x
# 2 (x) = |x|
(3-8)
# 3 ( x ) = ln(1 + x )
# 4 ( x ) = sin( x ) .
eNote 3 3.3 KONTINUERTE FUNKTIONER 6

Egenskaben "‘at være en epsilon-funktion"’ er ret stabil: Produktet af en


epsilon-funktion med en vilkårlig anden funktion, der blot er begrænset, er
også en epsilon-funktion. Summen og produktet af to epsilon-funktioner er
igen epsilon-funktioner. Den numeriske værdi af en epsilon-funktion er en
epsilon-funktion.

Funktioner, der er 0 andre steder end i x = 0, kan også give anledning til epsilon-
funktioner:

Hvis en funktion g( x ) har egenskaberne g( x0 ) = 0 og g( x ) ! 0 for x ! x0 , så


er g( x ) en epsilon-funktion af x x0 , dvs. vi kan skrive g( x ) = # g ( x x0 ).

Opgave 3.7

Vis, at 0-udvidelsen fb8 ( x ) af funktionen f 8 ( x ) = | x |/x ikke er en epsilon-funktion.

Vink: Hvis vi vælger k = 10, så findes der helt klart ikke nogen værdi af K sådan, at

1 1
| f 8 ( x )| = | | x |/x | = 1 < , for alle x med |x| < . (3-9)
10 K

Tegn grafen for fb8 ( x ). Den kan ikke tegnes uden at "‘løfte blyanten fra papiret"’!

Opgave 3.8

Vis, at 0-udvidelsen af funktionen f ( x ) = sin(1/x ) ikke er en epsilon-funktion.

3.3 Kontinuerte funktioner

Vi kan nu formulere kontinuitetsbegrebet ved hjælp af epsilon-funktioner.


eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 7

Definition 3.9 Kontinuitet


En funktion f ( x ) er kontinuert i x0 , hvis der eksisterer en epsilon-funktion # f ( x x0 )
således, at følgende gælder i et åbent interval, der indeholder x0 :

f ( x ) = f ( x0 ) + # f ( x x0 ) . (3-10)

Hvis f ( x ) er kontinuert i alle x0 i et givet åbent interval i D m( f ), så siger vi, at f ( x )


er kontinuert i intervallet.

Læg mærke til, at selvom det er klart, hvad epsilon-funktionen helt præcist
er i definition 3.9, nemlig f ( x ) f ( x0 ), så er den eneste egenskab, vi er inter-
esserede i, følgende: # f ( x x0 ) ! 0 for x ! x0 sådan, at f ( x ) ! f ( x0 ) for
x ! x0 , altså præcis som vi kender kontinuitets-begrebet fra gymnasiet!

Opgave 3.10

Alle epsilon-funktioner er herefter per definition kontinuerte i x0 = 0 (med værdien 0 i x0 =


0). Konstruér en epsilon-funktion, som ikke er kontinuert i nogen som helst af punkterne
x0 = 1/n, hvor n = 1, 2, 3, 4, · · · .

Selvom epsilonfunktionsbegrebet er helt fundamentalt for definitionen af kon-


tinuitet (og, som vi skal se nedenfor, for definitionen af differentiabilitet), så
behøver epsilonfunktionerne altså ikke selv at være kontinuerte andre steder
end netop i x0 = 0.

Opgave 3.11

Vis, at 0-udvidelsen fb( x ) af funktionen f ( x ) = | x 7| / ( x 7) ikke er kontinuert i R.

3.4 Differentiable funktioner


eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 8

Definition 3.12 Differentiabilitet


En funktion f ( x ) er differentiabel i x0 2 D m( f ), hvis der findes en konstant a og en
epsilon-funktion # f ( x x0 ) sådan, at

f ( x ) = f ( x0 ) + a · ( x x0 ) + ( x x0 ) · # f ( x x0 ) . (3-11)

Tallet a kaldes f 0 ( x0 ), og det er veldefineret i den forstand, at hvis f ( x ) i det hele


taget kan fremstilles på ovenstående form (altså hvis f ( x ) er differentiabel i x0 ), så
er der én og kun én værdi for a, som gør formlen rigtig. Med denne definition af
differentialkvotienten f 0 ( x0 ) af f ( x ) i x0 har vi altså

f ( x ) = f ( x0 ) + f 0 ( x0 ) · ( x x0 ) + ( x x0 ) · # f ( x x0 ) . (3-12)

Hvis f ( x ) er differentiabel i alle x0 i et givet åbent interval i D m( f ), så siger vi


naturligvis, at f ( x ) er differentiabel i intervallet. Vi skriver ofte differentialkvotien-
ten af f ( x ) i x på følgende alternative måde:

d
f 0 (x) = f (x) . (3-13)
dx

Forklaring 3.13 Differentialkvotienten er entydig

Vi vil vise, at der kun findes én værdi af a, som kan opfylde (3-11). Antag nem-
lig omvendt, at der er to forskellige værdier a1 og a2 , som opfylder ligningen med
muligvis to forskellige epsilon-funktioner:
f ( x ) = f ( x0 ) + a1 · ( x x0 ) + ( x x0 ) · # 1 ( x x0 )
(3-14)
f ( x ) = f ( x0 ) + a2 · ( x x0 ) + ( x x0 ) · # 2 ( x x0 ) .
Ved at trække nederste ligning i (3-14) fra den øverste får vi så
0 = 0 + ( a1 a2 ) · ( x x0 ) + ( x x0 ) · ( # 1 ( x x0 ) # 2(x x0 )) (3-15)
således, at
a1 a2 = # 2 ( x x0 ) # 1(x x0 ) (3-16)
for alle x 6= x0 . Det kan klart ikke være rigtigt; højresiden går jo imod 0, når x går
imod x0 ! Antagelsen ovenfor, altså at a1 6= a2 , er derfor forkert. De to konstanter a1
og a2 må være ens, og det var det, vi skulle indse.
eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 9

Ovenstående definition er helt ækvivalent med den, vi kender fra gymnasiet.


Hvis vi nemlig først trækker f ( x0 ) fra begge sider af lighedstegnet i (3-12) og
dernæst dividerer igennem med ( x x0 ), får vi

f (x) f ( x0 )
= f 0 ( x0 ) + # f ( x x0 ) ! f 0 ( x0 ) for x ! x0 , (3-17)
x x0
altså den velkendte grænseværdi for kvotienten mellem funktionstilvæksten
f (x) f ( x0 ) og x-tilvæksten x x0 . Grunden til, at vi ikke bruger denne
kendte definition af f 0 ( x0 ), er den simple, at for funktioner af flere variable
giver kvotient-brøken ikke mening — men mere om det i en senere eNote.

Sætning 3.14 Differentiabel medfører kontinuert


Hvis en funktion f ( x ) er differentiabel i x0 , så er f ( x ) også kontinuert i x0 .

Bevis

Vi har, at
f ( x ) = f ( x0 ) + f 0 ( x0 ) · ( x x0 ) + ( x x0 ) # f ( x x0 )
⇥ ⇤ (3-18)
= f ( x0 ) + f 0 ( x0 ) · ( x x0 ) + ( x x0 ) # f ( x x0 ) ,
og da hele den kantede parentes på højre side er en epsilon-funktion af ( x x0 ), så er f ( x )
kontinuert i x0 .

Men det omvendte gælder ikke nødvendigvis, som følgende eksempel viser.

Eksempel 3.15 Kontinuert men ikke differentiabel

Funktionen f ( x ) = | x | er kontinuert men ikke differentiabel i x0 = 0. Funktionen er selv en


epsilon-funktion, og f ( x ) er derfor kontinuert i 0. Men antag nu, at der findes en konstant a
og en epsilon-funktion # f ( x x0 ) sådan, at
f ( x ) = f ( x0 ) + a · ( x x0 ) + ( x x0 ) # f ( x x0 ) . (3-19)
Så skulle der gælde, at
|x| = 0 + a · x + x · # f (x) (3-20)
eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 10

og dermed for alle x 6= 0 at


|x|
= a + # f (x) . (3-21)
x
Det kan ikke lade sig gøre, for så skulle a være både 1 og 1 og det er umuligt! Derfor er
ovenstående antagelse om, at der skulle findes en sådan konstant a, altså forkert. f ( x ) er
derfor ikke differentiabel.

Definition 3.16 Approksimerende førstegradspolynomium


Det approksimerende førstegradspolynomium for f ( x ) med udviklingspunkt x0 de-
fineres ved
P1,x0 ( x ) = f ( x0 ) + f 0 ( x0 ) · ( x x0 ) . (3-22)

Bemærk, at P1,x0 ( x ) virkelig er et førstegradspolynomium i x. Grafen for funk-


tionen P1,x0 ( x ) er tangenten til grafen for f ( x ) igennem punktet ( x0 , f ( x0 )), se
figur 3.3. Ligningen for tangenten er y = P1,x0 ( x ), alts y = f ( x0 ) + f 0 ( x0 ) ·
( x x0 ). Hældningskoefficienten for tangenten er klart a = f 0 ( x0 ), og tan-
genten skærer y-aksen i punktet (0, f ( x0 ) x0 · f 0 ( x0 )). Vi skal senere finde
ud af, hvordan vi kan approksimere med polynomier af højere grad n, altså
polynomier der så betegnes Pn,x0 ( x ).

3.4.1 Differentiation af et produkt

Sætning 3.17 Differentiation af f ( x ) · g( x )


Et produkt h( x ) = f ( x ) · g( x ) af to differentiable funktioner f ( x ) og g( x ) er differ-
entiabel og differentieres på følgende velkendte måde:

d
( f ( x ) · g( x )) = f 0 ( x ) · g( x ) + f ( x ) · g0 ( x ) . (3-23)
dx

Selv om denne formel formentlig er ganske velkendt fra gymnasiet, vil vi kort skitsere
eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 11

Figure 3.3: Konstruktion af tangenten y = P1,x0 ( x ) = f ( x0 ) + a · ( x x0 ) med hæld-


ningskoefficienten a = f 0 ( x0 ) for funktionen f ( x ). Til højre ses forskellen mellem funk-
tionsværdien f ( x ) og "‘tangentværdien"’ P1,x0 ( x ).

et bevis for den igen for at illustrere brugen af epsilon-funktioner.

Bevis

Da f ( x ) og g( x ) er differentiable i x0 , har vi

f ( x ) = f ( x0 ) + f 0 ( x0 ) · ( x x0 ) + ( x x0 ) # f ( x x0 )
0
(3-24)
g ( x ) = g ( x0 ) + g ( x0 ) · ( x x0 ) + ( x x0 ) # g ( x x0 )

sådan, at produktet af de to højresider bliver

h( x ) = f ( x ) · g( x )
(3-25)
= f ( x0 ) · g( x0 ) + ( f 0 ( x0 ) · g( x0 ) + f ( x0 ) · g0 ( x0 )) · ( x x0 ) + ( x x0 ) # h ( x x0 ) ,

hvor vi har benyttet ( x x0 )# h ( x x0 ) som kort skrivemåde for den resterende del af pro-
duktsummen. Enhver af addenderne i denne resterende del indholder faktoren ( x x0 )2
eller et produkt af ( x x0 ) med en epsilon-funktion og kan derfor netop skrives på den an-
givne form. Men så følger produktformlen ved direkte at aflæse faktoren foran ( x x0 ) i
(3-25):
h 0 ( x0 ) = f 0 ( x0 ) · g ( x0 ) + f ( x0 ) · g 0 ( x0 ) . (3-26)


eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 12

3.4.2 Differentiation af en brøk

Følgende differentiationsregel er ligeledes velkendt fra gymnasiet:

Sætning 3.18 Differentiation af f ( x )/g( x )


En brøk h( x ) = f ( x )/g( x ) mellem to differentiable funktioner f ( x ) og g( x ) er dif-
ferentiabel overalt, hvor g( x ) 6= 0, og differentieres på følgende velkendte måde:
✓ ◆
d f (x) f 0 (x) f ( x ) · g0 ( x ) f 0 ( x ) · g( x ) f ( x ) · g0 ( x )
= = . (3-27)
dx g( x ) g( x ) g2 ( x ) g2 ( x )

Opgave 3.19

Benyt et epsilonfunktions-argument på samme måde som i differentiationsreglen for et pro-


dukt til at vise sætning 3.18.

3.4.3 Differentiation af sammensatte funktioner

Sætning 3.20 Kædereglen for sammensatte funktioner


En funktion h( x ) = f ( g( x )), der er sammensat af de to differentiable funktioner
f ( x ) og g( x ), er selv differentiabel i ethvert x0 med differerentialkvotienten

h0 ( x0 ) = f 0 ( g( x0 )) · g0 ( x0 ) (3-28)

Bevis

Vi benytter, at de to funktioner f ( x ) og g( x ) er differentiable. Specielt er g( x ) differentiabel i


x0 ,
g( x ) = g( x0 ) + g0 ( x0 )( x x0 ) + ( x x0 ) · # g ( x x0 ) , (3-29)
eNote 3 3.4 DIFFERENTIABLE FUNKTIONER 13

og funktionen f (u) er differentiabel i u0 = g( x0 ),

f (u) = f (u0 ) + f 0 (u0 )(u u0 ) + ( u u0 ) · # f ( u u0 ) . (3-30)

Heraf fås så, når vi sætter u = g( x ) og u0 = g( x0 ):

h( x ) = f ( g( x ))
= f ( g( x0 )) + f 0 ( g( x0 ))( g( x ) g( x0 )) + ( g( x ) g( x0 )) · # f ( g( x ) g( x0 ))
0 0
= h( x0 ) + f ( g( x0 ))( g ( x0 )( x x0 ) + ( x x0 ) · # g ( x x0 )) (3-31)
0
+ ( g ( x0 )( x x0 ) + ( x x0 ) · # g ( x x0 )) · # f ( g( x ) g( x0 ))
0 0
= h( x0 ) + f ( g( x0 )) g ( x0 ) · ( x x0 ) + ( x x0 ) · # h ( x x0 ) ,

hvoraf det direkte aflæses, at h0 ( x0 ) = f 0 ( g( x0 )) g0 ( x0 ) — fordi dette netop er den entydige


koefficient på ( x x0 ) i ovenstående udtryk.

Opgave 3.21

Vi har i ovenstående — sidst i (3-31) — benyttet, at

f 0 ( g( x0 )) · # g ( x x0 ) + ( g 0 ( x0 ) + # g ( x x0 )) · # f ( g( x ) g( x0 )) (3-32)

er en epsilon-funktion, som vi derfor kaldte # h ( x x0 ). Overvej, hvorfor dette er helt OK.

Opgave 3.22

Find differentialkvotienterne af følgende funktioner for enhver x-værdi i de respektive defi-


nitionsmængder:
f 1 ( x ) = ( x2 + 1) · sin( x )
f 2 ( x ) = sin( x )/( x2 + 1) (3-33)
2
f 3 ( x ) = sin( x + 1) .
eNote 3 3.5 OMVENDTE FUNKTIONER 14

3.5 Omvendte funktioner

Exponentialfunktionen exp( x ) og logaritmefunktionen ln( x ) er hinandens omvendte


funktioner – der gælder som bekendt:

exp(ln( x )) = x for x 2 D m(ln) = ]0, •[ = V m(exp)


(3-34)
ln(exp( x )) = x for x 2 D m(exp) = ] •, •[ = V m(ln) .

Læg mærke til, at selv om exp( x ) er defineret for alle x, så er den omvendte
funktion ln( x ) kun defineret for x > 0 – og omvendt (!)

Funktionen f ( x ) = x2 har en omvendt funktion i sine respektive monotoni-intervaller,


dvs. der hvor f ( x ) er voksende henholdsvis aftagende: Den omvendte funktion i det
p
interval, [0, •[, hvor f ( x ) er voksende er den velkendte funktion g( x ) = x. Funktio-
nen f ( x ) afbilder altså intervallet A = [0, •[ en-entydigt på intervallet B = [0, •[, og
den omvendte funktion g( x ) afbilder intervallet B en-entydigt på intervallet A således
at: p
f ( g( x )) = ( x )2 = x for x 2 B = [0, •[
p (3-35)
g( f ( x )) = x2 = x for x 2 A = [0, •[ .
Den omvendte funktion til f ( x ) i det interval, ] •, 0], hvor f ( x ) er aftagende er funk-
p
tionen h( x ) = x, som ikke er defineret på det samme interval som f ( x ). Funktionen
f ( x ) afbilder intervallet C =] •, 0] en-entydigt på intervallet D = [0, •[, og den
omvendte funktion h( x ) afbilder intervallet D en-entydigt på intervallet C således at:
p 2
f (h( x )) = ( x ) = x for x 2 D = [0, •[
p (3-36)
h( f ( x )) = x2 = x for x 2 C = ] •, 0] .

Hvis f ( x ) ikke er monoton på et interval, så betyder det essentielt, at vi kan


opnå samme funktions-værdi f ( x ) for flere forskellige x-værdier – på samme
måde som x2 = 1 både for x = 1 og for x = 1, og så er funktionen ikke
en-entydig på intervallet. Funktionerne cos( x ) og sin( x ) er kun monotone på
bestemte del-intervaller på x-aksen, se figur 3.7. Hvis vi ønsker at definere en
omvendt funktion til de funktioner må vi altså vælge et sådant interval med
omhu, se afsnit 3.8 og figur 3.8.
eNote 3 3.5 OMVENDTE FUNKTIONER 15

Definition 3.23 Notation for omvendte funktioner


Den omvendte funktion til en given funktion f ( x ) vil vi betegne med f 1 ( x ). Den
omvendte funktion er generelt defineret ved følgende egenskaber på passende valg-
te intervaller A og B som er indeholdt i henholdsvis D m( f ) og D m( f 1 )
1
f ( f ( x )) = x for x 2 A ⇢ D m( f )
1 1
(3-37)
f(f ( x )) = x for x 2 B ⇢ D m( f ) .

Vi bruger betegnelsen f 1 ( x ) for ikke at forveksle med ( f ( x )) 1 = 1/ f ( x ).


Grafen for den omvendte funktion g( x ) = f 1 ( x ) til en funktion f ( x ) kan fås
ved at spejle grafen for f ( x ) i diagonal-linjen i ( x, y)-koordinatsystemet – dvs.
linjen med ligningen y = x – se figur 3.4.

3.5.1 Differentiation af omvendte funktioner

Sætning 3.24 Differentiation af omvendt funktion


Hvis en differentiabel funktion f ( x ) har den omvendte funktion f 1 ( x ) og hvis
f 0 ( f 1 ( x0 )) 6= 0, så er den omvendte funktion f 1 ( x ) selv differentiabel i x0 :

1 0 1
(f ) ( x0 ) = 1(x
(3-38)
f 0( f 0 ))

Bevis

Pr. definition af omvendt funktion gælder, at


1
h( x ) = f ( f ( x )) = x , (3-39)
så h0 ( x0 ) = 1, men vi har så også fra kædereglen i (3-28):
1 1 0
h 0 ( x0 ) = f 0 ( f ( x0 )) · ( f ) ( x0 ) = 1 , (3-40)
eNote 3 3.6 HYPERBOLSKE FUNKTIONER 16

Figure 3.4: Grafen for en funktion f ( x ) og grafen for dens omvendte funktion g( x ). Der
gælder g( x ) = f 1 ( x ) og f ( x ) = g 1 ( x ), men de har hver deres egne definitionsin-
tervaller.

hvoraf vi får resultatet ved at dividere med f 0 ( f 1 (x


0 )).

3.6 Hyperbolske funktioner


eNote 3 3.6 HYPERBOLSKE FUNKTIONER 17

Definition 3.25 Hyperbolsk cosinus og hyperbolsk sinus


Vi vil definere to nye funktioner cosh( x ) og sinh( x ) som de entydigt bestemte løs-
ninger til følgende differentialligningssystem med begyndelsesbetingelser. De to
funktioner benævnes henholdsvis hyperbolsk cosinus og hyperbolsk sinus:

cosh0 ( x ) = sinh( x ) , cosh(0) = 1


0 (3-41)
sinh ( x ) = cosh( x ) , sinh(0) = 0 .

Betegnelserne cosh( x ) og sinh( x ) ligner cos( x ) og sin( x ), men funktionerne er meget


forskellige, som vi skal se nedenfor.

Der er dog også fundamentale strukturelle ligheder mellem de to par af funktioner og


det er dem der motiverer betegnelserne. I differentialligningssystemet for cos( x ) og
sin( x ) optræder kun et enkelt minus-tegn som eneste forskel i forhold til (3-41):

cos0 ( x ) = sin( x ) , cos(0) = 1


0 (3-42)
sin ( x ) = cos( x ) , sin(0) = 0 .

Desuden gælder (igen med et helt afgørende minustegn som eneste forskel) følgende
simple analogi til den velkendte og ofte brugte relation cos2 ( x ) + sin2 ( x ) = 1:

Sætning 3.26 Fundamentale relation for cosh( x ) og sinh( x )

cosh2 ( x ) sinh2 ( x ) = 1 . (3-43)

Bevis

Differentier med hensyn til x på begge sider af ligningen (3-43) og konkludér, at cosh2 ( x )
sinh2 ( x ) er en konstant. Brug til sidst begyndelsesbetingelserne.


eNote 3 3.6 HYPERBOLSKE FUNKTIONER 18

Figure 3.5: Hyperbolsk cosinus, cosh( x ), og hyperbolsk sinus, sinh( x ).

Opgave 3.27

Vis direkte ud fra differentialligningssystemet (3-41) at de to ”nye” funktioner faktisk ikke er


så nye endda:

ex + e x
cosh( x ) = , D m(cosh) = R , V m(cosh) = [1, •[
2 (3-44)
ex e x
sinh( x ) = , D m(sinh) = R , V m(sinh) = ] •, •[
2

Opgave 3.28

Vis direkte ud fra de fundne udtryk i opgave 3.27, at

cosh2 ( x ) sinh2 ( x ) = 1 . (3-45)


eNote 3 3.6 HYPERBOLSKE FUNKTIONER 19

Opgave 3.29

Grafen for funktionen f ( x ) = cosh( x ) ligner meget en parabel, nemlig grafen for funktionen
g( x ) = 1 + ( x2 /2) når vi plotter begge funktionerne i et passende lille interval omkring
x0 = 0. Prøv det! Hvis vi derimod plotter begge graferne over et meget stort x-interval, vil
vi opdage, at de to funktioner har meget forskellige grafiske opførsler. Prøv det, dvs. prøv
at plotte begge funktioner over intervallet [ 50, 50]. Kommentér og forklar de kvalitative
forskelle. Prøv tilsvarende at sammenligne de to funktioner sinh( x ) og x + ( x3 /6) på samme
måde.

Det er naturligt og nyttigt at definere de hyperbolske analogier til tan( x ) og cot( x ). Det
gør vi således:

Definition 3.30 Hyperbolsk tangens og hyperbolsk cotangens

sinh( x ) e2x 1
tanh( x ) = = 2x , D m(tanh) = R , V m(tanh) = ] 1, 1[
cosh( x ) e +1

(3-46)
cosh( x ) e2x + 1
coth( x ) = = 2x , D m(coth) = R {0} ,
sinh( x ) e 1
V m(coth) = ] •, 1[ [ ]1, •[ .

Differentialkvotienterne af cosh( x ) og sinh( x ) er allerede givet ved det definerende sys-


tem i (3-41).

d
cosh( x ) = sinh( x )
dx
d
sinh( x ) = cosh( x )
dx
d 1 (3-47)
tanh( x ) = =1 tanh2 ( x )
dx cosh2 ( x )
d 1
coth( x ) = 2
=1 coth2 ( x ) .
dx sinh ( x )
eNote 3 3.7 AREAFUNKTIONERNE 20

Figure 3.6: Hyperbolsk tangens, tanh( x ), og hyperbolsk cotangens, coth( x ).

Opgave 3.31

Vis de to sidste udtryk for differentialkvotienterne for tanh( x ) og coth( x ) i (3-47) ved at
benytte differentiationsreglen i sætning 3.18.

3.7 Areafunktionerne

De omvendte funktioner til de hyperbolske funktioner kaldes areafunktioner og beteg-


nes med henholdsvis cosh 1 ( x ) = arcosh( x ), sinh 1 ( x ) = arsinh( x ), tanh 1 ( x ) =
artanh( x ), og coth 1 ( x ) = arcoth( x ).

Da funktionerne cosh( x ), sinh( x ), tanh( x ), og coth( x ) alle kan udtrykkes ved ekspo-
nentialfunktioner er det ikke overraskende, at de omvendte funktioner og deres dif-
ferentialkvotienter kan udtrykkes ved logaritmefunktioner. Vi samler informationerne
eNote 3 3.8 ARCUSFUNKTIONERNE 21

her:

p
arcosh( x ) = ln( x + x2 1) for x 2 [1, •[
p
arsinh( x ) = ln( x + x2 + 1) for x 2 R
✓ ◆
1 1+x (3-48)
artanh( x ) = ln for x 2 ] 1, 1[
2 1 x
✓ ◆
1 x 1
arcoth( x ) = ln for x 2 ] •, 1[ [ ]1, •[ .
2 x+1
d 1
arcosh( x ) =p for x 2]1, •[
dx x2 1
d 1
arsinh( x ) =p for x 2 R
dx x2 + 1 (3-49)
d 1
artanh( x ) = for x 2 ] 1, 1[
dx 1 x2
d 1
arcoth( x ) = for x 2 ] • 1[ [ ]1, •[ .
dx 1 x2

3.8 Arcusfunktionerne

Figure 3.7: Cosinus og sinus funktionerne.

De omvendte funktioner som hører til de trigonometriske funktioner er lidt mere kom-
plicerede. Som nævnt bliver vi her nødt til for hver trigonometrisk funktion at vælge
et interval, hvor den pågældende funktion er monoton. Til gengæld, når vi har valgt
et sådant interval, så er det klart, hvordan den omvendte funktion skal defineres og
derefter hvordan den skal differentieres. De omvendte funktioner til cos( x ), sin( x ),
tan( x ), cot( x ) betegnes henholdsvis arccos( x ), arcsin( x ), arctan( x ), og arccot( x ); de
eNote 3 3.8 ARCUSFUNKTIONERNE 22

benævnes arcus-cosinus, arcus-sinus, arcus-tangens, og arcuscotangens. Ligesom oven-


for samler vi resultaterne her:

1
cos ( x ) = arccos( x ) 2 [0, p ] for x 2 [ 1, 1]
1
sin ( x ) = arcsin( x ) 2 [ p/2, p/2] for x 2 [ 1, 1]
1
(3-50)
tan ( x ) = arctan( x ) 2 [ p/2, p/2] for x 2 R
1
cot ( x ) = arccot( x ) 2]0, p [ for x 2 R .
d 1
arccos( x ) =p for x 2] 1, 1[
dx 1 x2
d 1
arcsin( x ) =p for x 2] 1, 1[
dx 1 x2 (3-51)
d 1
arctan( x ) = for x 2 R
dx 1 + x2
d 1
arccot( x ) = for x 2 R .
dx 1 + x2

Figure 3.8: Arcus-cosinus funktionen defineres her.


eNote 3 3.8 ARCUSFUNKTIONERNE 23

Figure 3.9: Arcus-cosinus og arcus-sinus. De røde cirkler indikerer igen, at arcus-


funktionerne ikke er defineret udenfor intervallet [ 1, 1]. De grønne cirkelskiver indik-
erer tilsvarende, at arcus-funktionerne er defineret i endepunkterne x = 1 og x = 1.

Læg mærke til, at differerentialkvotienterne for arccos( x ) og arcsin( x ) ikke er


defineret i x0 = 1 og i x0 = 1. Det skyldes dels, at hvis den funktion vi
betragter kun er defineret i et begrænset interval, så kan vi ikke sige at funktio-
nen er differentiabel i endepunkterne af intervallet. Desuden viser formlerne
for arccos0 ( x ) og arcsin0 ( x ) at de ikke er definerede i x0 = 1 eller x0 = 1; de
værdier giver jo 0 i nævnerne.

Opgave 3.32

Benyt en passende modifikation af arctan( x ) til at konstruere en ny differentiabel (og derfor


kontinuert) funktion f ( x ), som ligner 0-udvidelsen af | x |/x (der hverken er kontinuert eller
differentiabel), dvs. vi ønsker en funktion f ( x ) med følgende egenskaber: 1 > f ( x ) > 0.999
for x > 0.001 og 0.999 > f ( x ) > 1 for x < 0.001. Se figur 3.10. Vink: Prøv at plotte
arctan(1000x ).
eNote 3 3.8 ARCUSFUNKTIONERNE 24

Figure 3.10: Arcus-tangens funktionen.


eNote 3 3.9 OPSUMMERING 25

3.9 Opsummering

Vi har behandlet nogle af de fundamentale egenskaber ved nogle kendte og knap så


kendte funktioner. Hvordan er de defineret, hvad er deres definitions-intervaller, er de
kontinuerte, er de differentiable, hvad er i så fald deres differentialkvotienter?

• En funktion f ( x ) er kontinuert i x0 hvis f ( x ) f ( x0 ) er en epsilon-funktion af


( x x0 ), dvs.
f ( x ) = f ( x0 ) + # f ( x x0 ) . (3-52)

• En funktion f ( x ) er differentiabel i x0 med differentialkvotienten f 0 ( x0 ) hvis

f ( x ) = f ( x0 ) + f 0 ( x0 )( x x0 ) + ( x x0 ) # f ( x x0 ) .

• Hvis en funktion er differentiabel i x0 , så er den også kontinuert i x0 . Det omvendte


gælder ikke.

• Differentialkvotienten af et produkt af to funktioner er

d
( f ( x ) · g( x )) = f 0 ( x ) · g( x ) + f ( x ) · g0 ( x ) . (3-53)
dx

• Differentialkvotienten af en brøk mellem to funktioner er


✓ ◆
d f (x) f 0 (x) f ( x ) · g0 ( x ) f 0 ( x ) · g( x ) f ( x ) · g0 ( x )
= = . (3-54)
dx g( x ) g( x ) g2 ( x ) g2 ( x )

• Differentialkvotienten af en sammensat funktion er


d
f ( g( x )) = f 0 ( g( x )) · g0 ( x ) . (3-55)
dx

• Differentialkvotienten af den omvendte funktion f 1 (x) er


⇣ ⌘0 1
1
f (x) = 1 ( x ))
. (3-56)
f 0( f
eNote 4 1

eNote 4

Taylor’s approksimationsformler for


funktioner af én variabel

I eNote 3 er det vist hvordan funktioner af én variable kan approksimeres med


førstegradspolynomier i ethvert (udviklings-)punkt og at graferne for de approksimerende
førstegradspolynomier netop er tangenter til de tilhørende grafer for funktionerne. I denne
eNote vil vi vise, hvordan funktionerne kan approksimeres endnu bedre med polynomier af
højere grad. Sådanne approksimationer har enormt mange anvendelser – det er meget nemmere
at regne med polynomier end med andre funktioner, så hvis approksimationen til en funktion er
tilstrækkelig god, så kan man bruge og regne videre med det approksimerende polynomium i
stedet for funktionen selv og så i øvrigt håbe på, at den fejl man derved begår er tilstrækkelig
lille. Men hvad betyder tilstrækkelig god og tilstrækkelig lille? Og hvordan afhænger det af
graden på det approksimerende polynomium? Det finder du svarene på i denne eNote.
Opdateret 24.10.21 af Karsten Schmidt

4.1 Højere-ordens afledede

Vi vil først se på funktioner f ( x ) af én variabel x i et åbent interval i de reelle tal. Vi


vil også antage, at funktionen kan differentieres vilkårligt mange gange, altså at alle de
afledede funktioner eksisterer for ethvert x i intervallet: f 0 ( x0 ), f 00 ( x0 ), f 000 ( x0 ), f (4) ( x0 ),
f (5) ( x0 ), osv. hvor f (4) ( x0 ) betyder den 4. afledede af f ( x ) i x0 . Disse højere afledede
skal vi bruge til at konstruere (koefficienterne i) de approksimerende polynomier.
eNote 4 4.1 HØJERE-ORDENS AFLEDEDE 2

Definition 4.1
Hvis en funktion f ( x ) kan differentieres vilkårligt mange gange i ethvert punkt x i
et givet åbent interval I så siger vi, at funktionen er glat i intervallet I.

Eksempel 4.2 Højere-ordens afledede af nogle elementære funktioner

Her er nogle højere-ordens afledede af nogle kendte glatte funktioner:

f (x) f 0 (x) f 00 ( x ) f 000 ( x ) f (4) ( x ) f (5) ( x )


ex ex ex ex ex ex
x2 2x 2 0 0 0
x3 3x2 6x 6 0 0
x 4 4x 3 12x 2 24x 24 0
x5 5x4 20x3 60x2 120x 120 (4-1)
( x x0 )5 5 · ( x x0 )4 20 · ( x x0 )3 60 · ( x x0 )2 120 · ( x x0 ) 120
cos( x ) sin( x ) cos( x ) sin( x ) cos( x ) sin( x )
sin( x ) cos( x ) sin( x ) cos( x ) sin( x ) cos( x )
cosh( x ) sinh( x ) cosh( x ) sinh( x ) cosh( x ) sinh( x )
sinh( x ) cosh( x ) sinh( x ) cosh( x ) sinh( x ) cosh( x )
eNote 4 4.1 HØJERE-ORDENS AFLEDEDE 3

Læg mærke til, at

1. Den n’te afledede f (n) ( x ) af funktionen f ( x ) = ( x x0 )n er

f (n) ( x ) = n · ( n 1) · ( n 2) · · · 2 · 1 = n! , (4-2)

hvor n! (n fakultet) er den korte skrivemåde for produktet af heltallene


fra og med 1 til og med n, jævnfør tabel 4.2, hvor n! optræder med 2! = 2,
3! = 6, 4! = 24, 5! = 120.

2. Ved gentagen differentiation af cos( x ) fås det samme ”sæt” af funktioner


periodisk med perioden 4: Hvis f ( x ) = cos( x ), så er

f ( p ) ( x ) = f ( p +4) ( x ) for alle p 1 . (4-3)

Det samme gælder for f ( x ) = sin( x ).

3. Ved gentagen differentiation af den hyperbolske cosinusfunktion cosh( x )


fås igen det samme ”sæt” af funktioner periodisk med perioden 2: Hvis
f ( x ) = cosh( x ) fås

f ( p ) ( x ) = f ( p +2) ( x ) for alle p 1 . (4-4)

Det samme gælder for den hyperbolske sinusfunktion f ( x ) = sinh( x ).

Eksempel 4.3 De afledede af en knap så elementær funktion

En funktion f ( x ) kan eksempelvis være givet ved et integral (som i dette tilfælde ikke kan
udtrykkes ved de sædvanlige elementære funktioner):
Z x
t2
f (x) = e dt . (4-5)
0

Men vi kan sagtens differentiere og finde de højere afledede af funktionen for ethvert x:

x2 x2 x2 x2
f 0 (x) = e , f 00 ( x ) = 2·x·e , f 000 ( x ) = 2·e + 4 · x2 · e osv. (4-6)
eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 4

Eksempel 4.4 De afledede af en ukendt funktion

Vi antager at en funktion f ( x ) er givet som løsning til en differentialligning med begyndelses-


betingelser i x0 :

f 00 ( x ) + 3 f 0 ( x ) + 7 f ( x ) = q( x ) , hvor f ( x0 ) = 1 , og f 0 ( x0 ) = 3 (4-7)

hvor q( x ) er en given glat funktion af x. Vi kan igen rimelig let finde de højere afledede af
funktionen i x0 ved at benytte begyndelsesbetingelserne direkte og ved at differentiere differ-
entialligningen. Følgende fås fra begyndelsesbetingelserne og fra differentialligningen selv:

f 0 ( x0 ) = 3 , f 00 ( x0 ) = q( x0 ) 3 f 0 ( x0 ) 7 f ( x0 ) = q ( x0 ) + 2 . (4-8)
Den tredje (og de højere) afledede af f ( x ) fås derefter ved at differentiere begge sider af
differentialligningen. F.eks. får vi ved at differentiere én gang:

f 000 ( x ) + 3 f 00 ( x ) + 7 f 0 ( x ) = q0 ( x ) , (4-9)

hvoraf vi får:
f 000 ( x0 ) = q0 ( x0 ) 3 f 00 ( x0 ) 7 f 0 ( x0 )
= q 0 ( x0 ) 3 · ( q ( x0 ) + 2) 7 · ( 3) (4-10)
0
= q ( x0 ) 3q( x0 ) + 15 .

4.2 Approksimation med polynomier

Ideen med det følgende går nu ud på at finde det polynomium, f.eks. det andengrads-
polynomium, som bedst approksimerer en given glat funktion f ( x ) i og omkring et
givet x0 i funktionens definitionsmængde D m( f ).

Vi prøver derfor at skrive f ( x ) på følgende måde:

f ( x ) = a0 + a1 · ( x x0 ) + a2 · ( x x0 )2 + R2,x0 ( x ) , (4-11)

hvor a0 , a1 , og a2 er passende konstanter der skal vælges således at restfunktionen


R2,x0 ( x ) er så lille som muligt i og omkring x0 . Restfunktionen kan vi udtrykke ved
f ( x ) og det polynomium, som vi afprøver:

R2,x0 ( x ) = f ( x ) a0 a1 · ( x x0 ) a2 · ( x x0 )2 , (4-12)

og det er denne funktion, der skal være så tæt på at være 0 som muligt når x er tæt på
x0 sådan at forskellen mellem funktionen f ( x ) og andengradspolynomiet bliver så lille
eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 5

som muligt – i det mindste tæt på x0 .

Det første naturlige krav er derfor at:

R2,x0 ( x0 ) = 0 svarende til at f ( x0 ) = a0 , (4-13)

hvorved a0 nu er bestemt.

Det næste naturlige krav, er at grafen for restfunktionen har vandret tangent i x0 således
at tangenten til restfunktionen derefter er identisk med x aksen:
0
R2,x 0
( x0 ) = 0 sådan at f 0 ( x0 ) = a1 , (4-14)

hvorved a1 er bestemt.

Det næste krav til restfunktionen er derefter:


00
R2,x 0
( x0 ) = 0 svarende til at f 00 ( x0 ) = 2 · a2 , (4-15)
1 00
hvorved også a2 = 2 f ( x0 ) dermed er bestemt og fastlagt.

Vi har dermed fundet


f 0 ( x0 ) f 00 ( x0 )
f ( x ) = f ( x0 ) + · (x x0 ) + · (x x0 )2 + R2,x0 ( x ) (4-16)
1! 2!
hvor restfunktionen R2,x0 ( x ) tilfredsstiller følgende krav som gør den meget lille omkring
x0 :
0 00
R2,x0 ( x0 ) = R2,x 0
( x0 ) = R2,x 0
( x0 ) = 0 . (4-17)

Hvis vi på tilsvarende måde havde ønsket at finde et approksimerende n’te grads poly-
nomium for den samme funktion f ( x ) havde vi fundet:

f 0 ( x0 ) f ( n ) ( x0 )
f ( x ) = f ( x0 ) + · (x x0 ) + · · · + · (x x0 )n + Rn,x0 ( x ) , (4-18)
1! n!
hvor restfunktionen Rn,x0 ( x ) er en glat funktion der tilfredsstiller alle kravene:
(n)
Rn,x0 ( x0 ) = R0n,x0 ( x0 ) = · · · = Rn,x0 ( x0 ) = 0 . (4-19)

Det er herefter rimeligt at forvente, dels at disse krav til restfunktionen kan opfyldes og
dels at de tilsammen betyder, at restfunktionen selv må ’ligne’ og være lige så lille som
eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 6

en potens af ( x x0 ) tæt ved x0 .

Det er præcis indholdet af følgende hjælpesætning:

Hjælpesætning 4.5 Restfunktioner


Restfunktionen Rn,x0 ( x ) kan udtrykkes ud fra f ( x ) på to ret forskellige måder, og vi
skal benytte dem begge i det følgende:

f (n+1) (x ( x ))
Rn,x0 ( x ) = · (x x0 ) n +1 , (4-20)
( n + 1) !

hvor x ( x ) ligger imellem x og x0 i intervallet I.

Den anden fremstilling er følgende som indeholder en epsilonfunktion:

Rn,x0 ( x ) = ( x x0 ) n · # f ( x x0 ) , (4-21)

hvor # f ( x x0 ) er en epsilonfunktion af ( x x0 ).

Bevis

Vi vil nøjes med at indse den første påstand (4-20) i det allersimpleste tilfælde, nemlig for
n = 0, dvs. følgende: I intervallet mellem (et fastholdt) x og x0 findes altid en værdi x således
at følgende gælder:
f 0 (x )
R0,x0 ( x ) = f ( x ) f ( x0 ) = · (x x0 ) . (4-22)
(1) !
Men dette er blot en iklædning af middelværdisætningen: Hvis en glat funktion har
værdierne henholdsvis f ( a) og f (b) i endepunkterne af et interval [ a, b], så har grafen for
f ( x ) et sted en tangent som er parallel med det linjestykke der forbinder de to punkter
( a, f ( a)) og (b, f (b)), se figur 4.1.

f ( n +1) ( x )
Den anden fremstilling (4-21) følger af den første (4-20) ved at observere, at ( n +1) !
· (x
f ( n +1) ( x )
x0 )n+1 er en epsilonfunktion af ( x x0 ), da ( n +1) !
er begrænset og da ( x x0 )n+1 selv er en
epsilonfunktion.


eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 7

Figure 4.1: To punkter på den blå graf-kurve for en funktion forbindes med et
linjestykke (rød). Middelværdisætningen siger så, at der findes mindst ét sted (i det
viste tilfælde præcis to steder, markeret med grønt) på kurven mellem de givne punkter
hvor hældningskoefficienten f 0 ( x ) for tangenten (sort) til kurven er præcis den samme
som hældningskoefficienten for det rette linjestykke.

Definition 4.6 Approksimerende polynomium


Lad f ( x ) betegne en glat funktion i et interval I. Polynomiet

f 0 ( x0 ) f ( n ) ( x0 )
Pn,x0 ( x ) = f ( x0 ) + · (x x0 ) + · · · + · (x x0 ) n (4-23)
1! n!
kaldes det approksimerende polynomium af n’te grad for funktionen f ( x ) med ud-
viklingspunkt x0 .

Opsamlende har vi derfor:


eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 8

Sætning 4.7 Taylor’s formler


Enhver glat funktion f ( x ) kan for ethvert n opdeles i et approksimerende poly-
nomium af grad n og en restfunktion således:

f ( x ) = Pn,x0 ( x ) + Rn,x0 ( x ) , (4-24)

hvor restfunktionen kan udtrykkes på følgende måder:

f (n+1) (x ( x ))
Rn,x0 ( x ) = · (x x 0 ) n +1 for et x ( x ) mellem x og x0
( n + 1) !
(4-25)
og
Rn,x0 ( x ) = ( x x0 ) n · # f ( x x0 ) .

Det er især Taylor’s grænseformel (hvor restfunktionen udtrykkes med en epsilonfunk-


tion) vi vil gøre brug af i det følgende. Vi nævner den version eksplicit:

Sætning 4.8 Taylor’s grænseformel


Lad f ( x ) betegne en glat funktion i et åbent interval I som indeholder et givet x0 . Så
gælder der for alle x i intervallet og for ethvert helt tal n 0 følgende

f 0 ( x0 ) f ( n ) ( x0 )
f ( x ) = f ( x0 ) + · (x x0 ) + · · · + · (x x0 ) n + ( x x0 ) n · # f ( x x0 ) ,
1! n!
hvor # f ( x x0 ) betegner en epsilonfunktion af ( x x0 ), dvs. # f ( x x0 ) ! 0 for
x ! x0 .

Eksempel 4.9 Et polynomiums approksimerende polynomier

Man kunne forledes til at tro, at ethvert polynomium er sit eget approksimerende poly-
nomium fordi ethvert polynomium må da være den bedste approksimation til sig selv. Her
er et eksempel der viser, at det ikke er så simpelt. Vi ser på tredjegradspolynomiet

f ( x ) = 1 + x + x2 + x3 . (4-26)

Polynomiet f ( x ) har følgende ret forskellige approksimerende polynomier - i afhængighed


eNote 4 4.2 APPROKSIMATION MED POLYNOMIER 9

af valg af udviklingspunkt x0 og udviklingsgrad n:

P7,x0 =0 ( x ) = 1 + x + x2 + x3
P3,x0 =0 ( x ) = 1 + x + x2 + x3
P2,x0 =0 ( x ) = 1 + x + x2
P1,x0 =0 ( x ) = 1 + x
P0,x0 =0 ( x ) = 1
P7,x0 =1 ( x ) = 1 + x + x2 + x3
P3,x0 =1 ( x ) = 1 + x + x2 + x3
P2,x0 =1 ( x ) = 2 2 · x + 4 · x2 (4-27)
P1,x0 =1 ( x ) = 2+6·x
P0,x0 =1 ( x ) = 4
P7,x0 =7 ( x ) = 1 + x + x2 + x3
P3,x0 =7 ( x ) = 1 + x + x2 + x3
P2,x0 =7 ( x ) = 344 146 · x + 22 · x2
P1,x0 =7 ( x ) = 734 + 162 · x
P0,x0 =7 ( x ) = 400 .

Opgave 4.10 Rest-funktioner for polynomier

For funktionen f ( x ) = 1 + x + x2 + x3 betragtes følgende to opdelinger i approksimerende


polynomier og tilhørende restfunktioner:

f ( x ) = P2,x0 =1 ( x ) + R2,x0 =1 ( x ) og
(4-28)
f ( x ) = P1,x0 =7 ( x ) + R1,x0 =7 ( x ) ,

hvor de to approksimerende polynomier P2,x0 =1 ( x ) og P1,x0 =7 ( x ) allerede er angivet i eksem-


pel 4.9. Bestem de to restfunktioner R2,x0 =1 ( x ) og R1,x0 =7 ( x ) udtrykt på begge de to måder
som er vist i (4-25): For hver af de to restfunktioner angives de respektive udtryk for x ( x ) og
for #( x x0 ).
eNote 4 4.3 KONTINUERTE UDVIDELSER 10

Eksempel 4.11 Taylor’s grænseformel med udviklingspunkt x0 = 0

Her er nogle ofte benyttede funktioner med deres respektive approksimerende poly-
nomier (og tilhørende restfunktioner udtrykt med epsilonfunktioner) med det fælles ud-
viklingspunkt x0 = 0 og vilkårlig høj grad:

x2 xn
ex = 1 + x + +···+ + xn · #( x )
2! n!
2 x4 x2n
ex = 1 + x2 + +···+ + x2n · #( x )
2! n!
x2 x4 x2n
cos( x ) =1 + + · · · + ( 1) n · + x2n · #( x )
2! 4! (2n)!
x3 x5 x2n+1
sin( x ) =x + + · · · + ( 1) n · + x2n+1 · #( x )
3! 5! (2n + 1)! (4-29)
x2 xn
ln(1 + x ) =x + · · · + ( 1) n 1 · + xn · #( x )
2 n!
x2 xn
ln(1 x) = x ··· xn · #( x )
2 n!
1
= 1 x + x 2 x 3 + · · · + ( 1) n 1 · x n 1 + x n · # ( x )
1+x
1
= 1 + x + x2 + x3 + · · · + x n 1 + x n · #( x )
1 x

Bemærk, at der i Taylor’s grænseformel altid afsluttes med en epsilon-funktion


og med en potens af x der er præcis den samme som den sidste potens der
benyttes i det foranstående approksimerende polynomium.

4.3 Kontinuerte udvidelser

Funktionen f ( x ) = sin( x )/x er ikke defineret i x = 0. Vi vil undersøge, om vi kan ud-


vide funktionen til at have en værdi i 0, således at den udvidede funktion er kontinuert
i 0. Dvs. vi vil finde en værdi a, således at a-udvidelsen
(
sin( x )
for x 6= 0
fe = x (4-30)
a for x = 0
er kontinuert i x = 0, dvs. således at
sin( x )
!a for x!0 . (4-31)
x
eNote 4 4.3 KONTINUERTE UDVIDELSER 11

En direkte anvendelse af Taylor’s grænseformel optræder ved bestemmelse af græn-


seværdier for sådanne brøker f ( x )/g( x ) hvor begge funktionerne, altså tælleren f ( x )
og nævneren g( x ), går imod 0 for x gående imod 0. Hvad sker der med brøken når x går
imod 0? Vi illustrerer med en række eksempler. Bemærk, at selv om tæller-funktionen
og nævner-funktionen begge er kontinuerte i 0, så behøver brøken ikke selv at være det.

Eksempel 4.12 Grænseværdier for funktionsbrøker

sin( x ) x + x1 · #( x )
= = 1 + #( x ) ! 1 for x!0 . (4-32)
x x

sin( x ) x 3!1 x3 + x3 · #( x ) 1 x
2
= 2
= + x · #( x ) , (4-33)
x x x 3!
som ikke har nogen grænseværdi for x ! 0. Derfor findes der ikke nogen kontinuert ud-
videlse i dette tilfælde.

sin( x2 ) sin(u)
!1 for x!0 fordi !1 for u!0 . (4-34)
x2 u

1 3
sin( x ) x x 3! x + x3 · #( x ) x x
= = + x · #( x ) ! 0 for x!0 . (4-35)
x2 x2 3!

1 3
sin( x ) x x 3! x + x3 · #( x ) x 1 1
= = + ·#( x ) ! for x!0 . (4-36)
x3 x3 3! 6

Ved bestemmelse af sådanne grænseværdier udvikles de approksimerende


polynomier i tæller og nævner til så høje grader at grænseværdien ”fremkom-
mer” ved division i tæller og nævner med en potens af x.

Her er et lidt mere kompliceret eksempel:


eNote 4 4.3 KONTINUERTE UDVIDELSER 12

Figure 4.2: Funktionen f ( x ) = sin( x )/x (blå) sammen med tællerfunktionen sin( x )
(rød) og nævnerfunktionen x (også rød). Funktionen f ( x ) er kontinuert i x = 0 netop
når den tildeles værdien 1 der.

Eksempel 4.13 Grænseværdi for funktionsbrøk

1
2 cos( x ) 2 + x2 2 · (1 2! · x2 + 4!1 · x4 + x4 · # 1 ( x )) 2 + x2
2
= 1 1
x · sin( x ) x x · (x 3 5 5
3! · x + 5! · x + x · # 2 ( x )) x2
1
2 x2 + 12 · x4 + 2 · x4 · # 1 ( x ) 2 + x2
= 1
x2 3! · x4 + 5!1 · x6 + x6 · # 2 ( x ) x2
1
12 · x4 + 2 · x4 · # 1 ( x ) (4-37)
= 1
3! · x4 + 5!1 · x6 + x6 · # 2 ( x )
1
12 + 2 · # 1 ( x )
= 1 1 2 2
6 + 5! · x + x · # 2 ( x )
1
! for x!0 ,
2
1 1
idet tælleren går imod 12 for x ! 0 og nævneren går imod 6 for x ! 0.
eNote 4 4.4 VURDERING AF RESTFUNKTIONERNE 13

4.4 Vurdering af restfunktionerne

Hvor stor er den fejl man begår ved at benytte det approksimerende polynomium
(som er let at regne med) i stedet for funktionen selv (som kan være kompliceret at
beregne) i et givet (typisk lille) interval omkring udviklingspunktet? Det kan restfunk-
tionen selvfølgelig give et svar på. Vi giver her et par eksempler der viser, hvordan
restfunktionsudtrykket kan benyttes til sådanne fejl-vurderinger for givne funktioner.

Figure 4.3: Funktionen f ( x ) = ln( x ) fra eksempel 4.14 (blå), det approksimerende
første-gradspolynomium (sort) med udviklingspunkt x0 = 1 og den tilhørende rest-
funktion (rød) illustreret
⇥ 3 5 ⇤som forskellen mellem f ( x ) og det approksimerende poly-
nomium i intervallet 4 , 4 . Til højre er zoomet ind på figuren omkring punktet (1, 0).

Eksempel 4.14 Approksimation af elementær funktion

Logaritmefunktionen ln( x ) er defineret for positive værdier af x. Vi approksimerer med det


approksimerende førstegrads-polynomium med udviklingspunkt i x0 = 1 og vil vurdere
restleddet i et passende lille interval omkring x0 = 1, dvs. udgangspunktet er følgende:

3 5
f ( x ) = ln( x ) , x0 = 1 , n = 1 , x 2 , . (4-38)
4 4
Ifølge Taylor’s formel med restfunktion har vi - idet vi udvikler i udviklingspunktet x0 = 1
hvor f (1) = 0 og f 0 (1) = 1 og bruger f 00 ( x ) = 1/x2 for alle x i definitionsmængden:
f 0 (1) f 00 (x ) 1
f ( x ) = ln( x ) = ln(1) + ( x 1) + · ( x 1)2 = x 1 · (x 1)2 (4-39)
1! 2! 2 · x2
for en værdi af x imellem x og 1. Vi har altså hermed fundet:
1
P1,x0 =1 ( x ) = x 1 , og R1,x0 =1 ( x ) = · (x 1)2 . (4-40)
2 · x2
eNote 4 4.4 VURDERING AF RESTFUNKTIONERNE 14

Den numeriske værdi af restfunktionen i det givne interval kan nu vurderes for alle x i det givne
interval - også selvom vi ikke ved ret meget om hvor x ligger i intervallet udover at x ligger
imellem x og 1:

Vi har ✓ ◆2
1 2 1 1
| R1,x0 =1 ( x )| = | · (x 1) |  | · | , (4-41)
2 · x2 2 · x2 4
idet minus-tegnet kan fjernes fordi vi kun ser på den numeriske værdi og idet ( x 1)2 jo
klart er størst (med værdien (1/4)2 ) for x = 3/4 og for x = 5/4 i intervallet. Derudover er x
mindst og dermed (1/x )2 størst i intervallet for x = 3/4. (Bemærk at vi ikke bruger her, at x
ligger imellem x og 1 - vi bruger kun, at x ligger i intervallet!) Det vil sige, at

1 1 1
| R1,x0 =1 ( x )|  | 2
|| 2
|= , (4-42)
32 · x 32 · 34 18

således at vi dermed har vist, at



1 3 5
| ln( x ) (x 1)|  for alle x2 , . (4-43)
18 4 4
eNote 4 4.4 VURDERING AF RESTFUNKTIONERNE 15

Man kan med nogen ret spekulere over, hvorfor restfunktions-vurderingen


af en så simpel funktion som f ( x ) = ln( x ) i eksempel 4.14 skal være så
bøvlet, når det er tydeligt for enhver (!), at den røde restfunktion i det tilfælde
antager sin største numeriske (absolut-)værdi i et af endepunkterne i det
aktuelle interval, se figur 4.3 – en påstand som vi endda kan vise med en helt
almindelig funktionsundersøgelse.

Ved at differentiere restfunktionen får vi jo:

0 d 1
R1,x 0 =1
(x) = (ln( x ) (x 1)) = 1 , (4-44)
dx x
som netop er mindre end 0 for x > 1 (sådan at R1,x0 =1 ( x ) til højre for x = 1 er
negativ og aftagende fra værdien 0 i x = 1) og større end 0 for x < 1 (sådan
at R1,x0 =1 ( x ) til venstre for x = 1 er negativ og voksende op mod værdien 0
i x = 1). Men problemet er, at vi i princippet ikke ved hvad værdien af ln( x )
faktisk er – hverken i x = 3/4 eller i x = 5/4 medmindre vi bruger Maple
eller et andet værktøj til hjælp. Restfunktions-vurderingen benytter kun de
definerende egenskaber ved f ( x ) = ln( x ), dvs. f 0 ( x ) = 1/x og f (1) = 0, og
vurderingen giver værdierne (også i endepunkterne af intervallet) med en
(numerisk) fejl på højst 1/18 i dette tilfælde.

Hvis vi faktisk får serveret den oplysning, at ln(3/4) = 0.2877 og ln(5/4) =


0.2223 så har vi selvfølgelig dermed ⇥ 3 5også
⇤ en direkte vurdering af den største
værdi af | R1,x0 =1 ( x )| i intervallet 4 , 4 :

| R1,x0 =1 ( x )|  max{| 0.2877 + 0.25| , |0.2223 0.25|}


(4-45)
= 0.0377 < 1/18 = 0.0556 .

Med den almindelige funktionsanalyse får vi altså en noget bedre vurdering af


restfunktionen – men kun fordi vi i forvejen kan vurdere værdien af funktionen
i endepunkterne.

Opgave 4.15 Approksimation af en ikke-elementær funktion

Givet funktionen fra eksempel 4.3:


Z x
t2
f (x) = e dt (4-46)
0

Der ønskes en vurdering af størrelsen af forskellen mellem f ( x ) og funktionens ap-


proksimerende førstegradspolynomium P1,x0 =0 ( x ) med udviklingspunkt i x0 = 0. Opgaven
eNote 4 4.4 VURDERING AF RESTFUNKTIONERNE 16

Figure 4.4: Funktionen f ( x ) fra eksempel 4.15 (blå), de approksimerende første- og


tredjegrads-polynomier (sorte) med udviklingspunkt x0 = 0 og de tilhørende restfunk-
tioner (røde) i intervallet [ 1, 1].

går altså ud på at bestemme den største absolut-værdi som restfunktionen | R1,x0 =0 ( x )| an-
tager i intervallet [ 1, 1].
Vink: Benyt de tidligere fundne højere afledede af f ( x ) evalueret i x0 = 0, jf. eksempel 4.3:
2
f (0) = 0, f 0 (0) = 1, f 00 ( x ) = 2 · x · e x . Se figur 4.4.

Eksempel 4.16 Approksimation af ukendt (men elementær) funktion

Givet funktionen fra eksempel 4.4, dvs. funktionen tilfredsstiller følgende differentialligning
med begyndelsesbetingelser:

f 00 ( x ) + 3 f 0 ( x ) + 7 f ( x ) = x2 , hvor f (0) = 1 , og f 0 (0) = 3 , (4-47)

hvor vi har antaget, at højresiden i ligningen er q( x ) = x2 og at udviklingspunktet er x0 = 0.


Derved får vi nu:
f 0 (0) = 3 , f 00 (0) = 2 , f 000 (0) = 15 . (4-48)
Vi har
f 00 (0) 2 f 000 (0) 3
f ( x ) = f (0) + f 0 (0) · x + ·x + · x + x3 · #( x )
2 6 (4-49)
5 3
=1 3 · x + x2 +
· x + x3 · #( x ) ,
2
således at det approksimerende tredjegrads-polynomium for f ( x ) med udviklingspunkt
x0 = 0 er
5
P3,x0 =0 ( x ) = 1 3 · x + x2 + · x3 . (4-50)
2
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 17

Figure 4.5: Funktionen f ( x ) fra eksempel 4.16 (blå) og de approksimerende første-,


anden-, og tredjegrads-polynomier (sorte) med udviklingspunkt x0 = 0. De tilhørende
respektive restfunktioner (røde) er illustreret som forskellene mellem f ( x ) og de ap-
proksimerende polynomier.

Bemærk, at P3,x0 =0 ( x ) tilfredsstiller begyndelsesbetingelserne i (4-47) men polynomiet


P3,x0 =0 ( x ) er ikke en løsning til selve differentialligningen!

4.5 Funktionsundersøgelser

En meget vigtig egenskab ved kontinuerte funktioner er følgende, som betyder at der
er styr på hvor store og små værdier en kontinuert funktion kan antage på et interval,
når blot intervallet er tilstrækkelig pæn:
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 18

Sætning 4.17 Hovedsætning for kontinuerte funktioner af én variabel


Lad f ( x ) betegne en funktion som er kontinuert i hele sin definitionsmængde
D m( f ) ⇢ R. Lad I = [ a , b ] være et begrænset, afsluttet, og sammenhængende
interval i D m( f ).

Så er værdimængden for funktionen f ( x ) i intervallet I også et begrænset, afsluttet,


og sammenhængende interval [ A , B ] ⇢ R. Vi kan skrive således:

V m( f | I ) = f ( I ) = { f ( x ) | x 2 I } = [ A , B ] , (4-51)

hvor der tillades den mulighed at A = B og det sker jo præcis når f ( x ) er konstant i
hele intervallet I.

Definition 4.18 Globalt minimum og globalt maksimum


Når en funktion f ( x ) har værdimængden V m( f | I ) = f ( I ) = [ A , B ] på et interval
I = [ a, b] siger vi, at

1. A er den globale minimumværdi for f ( x ) i I, og hvis f ( x0 ) = A for x0 2 I så


er x0 et globalt minimumpunkt for f ( x ) i I.

2. B er den globale maksimumværdi for f ( x ) i I, og hvis f ( x0 ) = B for x0 2 I så


er x0 et globalt maksimumpunkt for f ( x ) i I.

En velkendt og vigtig opgave går ud på at finde de globale maksimum- og minimum-


værdier for givne funktioner f ( x ) i givne intervaller og at bestemme de x-værdier for
hvilke disse maksimum- og minimum-værdier antages altså minimum- og maksimum-
punkterne. For at løse den opgave er følgende en uvurderlig hjælp – se figur 4.6:

Hjælpesætning 4.19 Maksima og minima i stationære punkter


Lad x0 være en global maksimum- eller minimum-værdi for f ( x ) i I. Antag, at x0
ikke er et endepunkt for intervallet I og at f ( x ) er differentiabel i x0 .
Så er x0 et stationært punkt for f ( x ) i betydningen: f 0 ( x0 ) = 0.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 19

Bevis

Vi antyder argumentet. Da f ( x ) er antaget differentiabel, har vi:

f ( x ) = f ( x0 ) + f 0 ( x0 ) · ( x x0 ) + ( x x0 ) · # f ( x x0 )
0
(4-52)
= f ( x0 ) + ( x x0 ) · ( f ( x0 ) + # f ( x x0 )) .

Hvis vi nu antager, at f 0 ( x0 ) er positiv, så er parentesen ( f 0 ( x0 ) + # f ( x x0 )) også positiv


for x tilstrækkelig tæt på x0 (idet # f ( x x0 ) ! 0 for x ! x0 ), men så er ( x x0 ) · ( f 0 ( x0 ) +
# f ( x x0 )) også positiv for x tilstrækkeligt tæt på x0 og dermed er f ( x ) > f ( x0 ) for sådanne
x > x0 , og f ( x ) < f ( x0 ) for sådanne x < x0 . Derfor kan f ( x0 ) ikke være hverken maksimum-
værdi eller minimumværdi for f ( x ). Tilsvarende konklusion fås med antagelsen f 0 ( x0 ) < 0.
Hvis x0 er en global maksimum- eller minimum-værdi for f ( x ) i I må den antagelse derfor
medføre, at f 0 ( x0 ) = 0.

Hermed har vi følgende undersøgelsesmetode til rådighed:

Metode 4.20 Undersøgelsesmetode


Lad f ( x ) være en kontinuert funktion og I = [ a, b] et interval i definitionsmængden
D m ( f ).

Maksimum- og minimum-værdierne for funktionen f ( x ), x 2 I, altså A og B


i værdimængden [ A, B] for f ( x ) i I findes ved at finde og sammenligne funk-
tionsværdierne i følgende punkter:

1. Interval-endepunkterne (randpunkterne a og b for intervallet I).

2. Undtagelsespunkter, dvs. de punkter i det åbne interval ] a, b[ hvor funktionen


ikke er differentiabel.

3. De stationære punkter, dvs. samtlige de punkter x0 i det åbne interval ] a, b[


hvor f 0 ( x0 ) = 0.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 20

Ved denne undersøgelsesmetode findes naturligvis ikke blot de globale


maksimum- og minimum-værdier men også de x-værdier i I for hvilke det
globale maksimum og det globale minimum antages, altså maksimum- og
minimum-punkterne i det aktuelle interval.

Eksempel 4.21 En kontinuert funktion undersøges

En kontinuert funktion f ( x ) er defineret for alle x på følgende måde:


8
>
> 0.75 for x  1.5
>
> 2
>
< 0.5 + ( x + 1 ) for 1.5  x  0
f (x) = 1.5 · (1 x ) 3 for 0  x  1 (4-53)
>
>
>
> x 1 for 1  x  2
>
: 1 for x > 2

Se figur 4.6, hvor vi kun betragter funktionen i intervallet I = [ 1.5, 2.0]. Der er to und-
tagelspunkter, hvor funktionen ikke er differentiabel: x0 = 0 og x0 = 1. Der er ét stationært
punkt i ] 1.5, 2.0[ hvor f 0 ( x0 ) = 0 nemlig x0 = 1. Og endelig er der de to randpunkter,
intervalendepunkterne x0 = 1.5 og x0 = 2 som skal undersøges.

Vi har derfor følgende kandidater til globale maksimum- og minimumværdier for f ( x ) i I:

x0 = 1.5 1 0 1 2
(4-54)
f ( x0 ) = 0.75 0.5 1.5 0 1

Vi aflæser konkluderende heraf, at maksimumværdien for f ( x ) er B = 1.5 som antages i


maksimumpunktet x0 = 0. Minimumværdien er A = 0 som antages i minimumpunktet
x0 = 1. Der er ikke andre maksimum- og minimum-punkter for f ( x ) i I.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 21

Figure 4.6: Den kontinuerte funktion f ( x ) fra eksempel 4.21 (blå). På grafen er markeret
(med rødt) de 5 punkter som skal undersøges specielt med henblik på at bestemme
værdimængden for f ( x ) i intervallet [ 1.5, 2], jvf. metode 4.20.

Definition 4.22 Lokale minima og lokale maksima


Lad f ( x ) betegne en funktion på et interval I = [ a, b] som indeholder et givet x0 2
] a, b[.

1. Hvis f ( x ) f ( x0 ) for alle x i en (gerne lille) omegn om x0 , så kaldes f ( x0 ) en


lokal minimumværdi for f ( x ) i I, og x0 er et lokalt minimumpunkt for f ( x ) i
I. Hvis der faktisk gælder f ( x ) > f ( x0 ) for alle x i omegnen fraregnet x0 selv,
så kaldes f ( x0 ) en egentlig lokal minimumværdi.

2. Hvis f ( x )  f ( x0 ) for alle x i en (gerne lille) omegn om x0 , så kaldes f ( x0 ) en


lokal maksimumværdi for f ( x ) i I, og x0 er et lokalt maksimumpunkt for f ( x )
i I. Hvis der faktisk gælder f ( x ) < f ( x0 ) for alle x i omegnen (fraregnet x0
selv), så kaldes f ( x0 ) en egentlig lokal maksimumværdi.

Hvis den funktion vi vil undersøge er glat i sine stationære punkter, så kan vi kvalificere
metoden 4.20 endnu bedre, idet det approksimerende polynomium af grad 2 med ud-
viklingspunkt i det stationære punkt kan hjælpe med at afgøre, om værdien af f ( x ) i det
stationære punkt er en kandidat til at være en maksimumværdi eller minimumværdi.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 22

Hjælpesætning 4.23 Lokal analyse i et stationært punkt


Lad f ( x ) være en glat funktion og antag, at x0 er et stationært punkt for f ( x ) i et
interval I =] a, b[. Så gælder følgende:

1. Hvis f 00 ( x0 ) > 0 så er f ( x0 ) en egentlig lokal minimumværdi for f ( x ).

2. Hvis f 00 ( x0 ) < 0 så er f ( x0 ) en egentlig lokal maksimumværdi for f ( x ).

3. Hvis f 00 ( x0 ) = 0 så er dette ikke tilstrækkelig information til at sikre, at f ( x0 )


er lokal minimumværdi eller lokal maksimumværdi.

Opgave 4.24

Bevis hjælpesætningen 4.23 ved at bruge Taylors grænseformel med det approksimerende
andengrads-polynomium for f ( x ) og udviklingspunkt x0 . Husk, at x0 er et stationært punkt,
således at f 0 ( x0 ) = 0.

Eksempel 4.25 Lokale maksima og minima

Den kontinuerte funktion f ( x )


8
>
> 0.75 for x  1.5
>
>
>
< 0.5 + ( x + 1)2 for 1.5  x  0
f (x) = 1.5 · (1 x3 ) for 0  x  1 (4-55)
>
>
>
> x 1 for 1  x  2
>
: 1 for x 2

er vist i figur 4.6. I intervallet I = [ 1.5, 2.0] har funktionen de egentlige lokale mini-
mumværdier 0.5 og 0 i de respektive egentlige lokale minimumpunkter x0 = 1 og x0 = 1 og
funktionen har en egentlig lokal maksimumværdi 1.5 i det egentlige lokale maksimumpunkt
x0 = 0. Hvis vi udvider intervallet til J = [ 7, 7] og bemærker at funktionsværdierne per
definition er konstante udenfor intervallet I fås de nye lokale maksimum-værdier 0.75 og 1
for f ( x ) i J – ingen af dem er egentlige lokale maksimumværdier. Alle x0 2] 7, 1.5] og
alle x0 2 [2, 7[ er lokale maksimumpunkter for f ( x ) i J men ingen af dem er egentlige lokale
maksimumpunkter. Alle x0 i det åbne interval x0 2] 7, 1.5[ og alle x0 i det åbne interval
x0 2]2, 7[ er i øvrigt også lokale minimumpunkter for f ( x ) i J men ingen af dem er egentlige
lokale minimumpunkter.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 23

Figure 4.7: Egentlige lokale maksima og egentlige lokale minima for funktionen fra
eksempel 4.26 er her antydet på grafen for funktionen. For en ordens skyld bemærkes:
De lokale maksimum- og minimum-punkter for funktionen er de markerede røde graf-
punkters x-koordinater og de lokale maksimum- og minimum-værdier for funktionen
er de markerede røde graf-punkters y-koordinater.

Eksempel 4.26 En ikke-elementær funktion

Funktionen f ( x ) Z x
f (x) = cos(t2 ) dt (4-56)
0
har stationære punkter i de værdier af x0 som tilfredsstiller:
p
f 0 ( x0 ) = cos( x02 ) = 0 , dvs. x02 = +p·p hvor p er et helt tal . (4-57)
2
Da vi også har, at
f 00 ( x ) = 2 · x · sin( x2 ) , (4-58)
sådan at der i de angivne stationære punkter gælder

f 00 ( x0 ) = 2 · x0 · ( 1) p . (4-59)

Heraf følger – via lemma 4.23 – at hvert andet stationært punkt x0 langs x-aksen er et
egentligt lokalt maksimumpunkt for f ( x ) og de øvrige stationære punkter er egentlige
lokale minimumpunkter. Se figur 4.7. I figur 4.8 er vist graferne (parabler) for et par af
de approksimerende andengradspolynomier for f ( x ) med udviklingspunkter i udvalgte sta-
tionære punkter.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 24

Figure 4.8: Grafen for funktionen i eksempel 4.26 og to approksimerende parabler med
udviklingspunkter i to stationære punkter, som er henholdsvis et egentligt lokalt mini-
mumpunkt og et egentligt lokalt maksimumpunkt for f ( x ).

Eksempel 4.27 Når approksimation til grad 2 ikke er nok

Som angivet i hjælpesætning 4.23 kan man ikke ud fra f 0 ( x0 ) = f 00 ( x0 ) = 0 slutte, at funk-
tionen har lokalt maksimum eller minimum i x0 . Det viser de tre simple funktioner i figur
4.9 med al ønskelig tydelighed: f 1 ( x ) = x4 , f 2 ( x ) = x4 og f 3 ( x ) = x3 . Alle tre funktioner
har stationært punkt i x0 = 0 og alle har f 00 ( x0 ) = 0, men f 1 ( x ) har et egentligt lokalt min-
imumpunkt i 0, f 2 ( x ) har et egentligt lokalt maksimumpunkt i 0, og f 3 ( x ) har hverken et
lokalt minimimumpunkt eller et lokalt maksimumpunkt i 0.
eNote 4 4.5 FUNKTIONSUNDERSØGELSER 25

Figure 4.9: Tre elementære funktioner med approksimerende andengrads-polynomium


P2,x0 =0 ( x ) = 0 for alle x. Funktionerne er henholdsvis: f 1 ( x ) = x4 (rød), f 1 ( x ) = x4
(sort), og f 3 ( x ) = x3 (blå).
eNote 4 4.6 OPSUMMERING 26

4.6 Opsummering

I denne eNote har vi studeret hvordan man kan approksimere glatte funktioner med
polynomier.

• Enhver glat funktion f ( x ) på et interval I kan opdeles i et approximerende n’te-


grads-polynomium Pn,x0 ( x ) med udviklingspunkt x0 og en tilhørende restfunk-
tion Rn,x0 ( x ) således:
f ( x ) = Pn,x0 ( x ) + Rn,x0 ( x ) , (4-60)
hvor polynomiet og restfunktionen i Taylor’s grænseformel skrives således:

f 0 ( x0 ) f ( n ) ( x0 )
f ( x ) = f ( x0 ) + · (x x0 ) + · · · + · (x x0 ) n + ( x x0 ) n · # f ( x x0 ) ,
1! n!
hvor # f ( x x0 ) betegner en epsilonfunktion af ( x x0 ), dvs. # f ( x x0 ) ! 0 for
x ! x0 .

• Taylor’s grænseformel kan benyttes til at finde kontinuerte udvidelser af brøk-


funktioner ved at finde (om muligt) deres grænseværdier for x ! x0 hvor x0 er de
værdier hvor nævner-funktionen er 0 således at brøkfunktionen i udgangspunktet
ikke er defineret i x0 :

sin( x ) x + x1 · #( x )
= = 1 + #( x ) ! 1 for x!0 . (4-61)
x x

• Vurdering af restfunktionen giver en øvre grænse for den største numeriske forskel
mellem en given funktion og det approksimerende polynomium af en passende
grad og med et passende udviklingspunkt i et givet undersøgelsesinterval. En så-
dan vurdering kan også foretages for funktioner, som måske kun ”kendes” via en
differentialligning eller som et ikke-elementært integral:

1 3 5
| ln( x ) ( x 1)|  for alle x 2 , . (4-62)
18 4 4

• Taylor’s grænseformel med approksimerende anden-grads-polynomium benyt-


tes til effektiv funktionsundersøgelse, herunder bestemmelse af værdimængde,
globale og lokale maksima og minima for givne funktioner.
eNote 5 1

eNote 5

Talrummene R n og C n

Denne eNote handler om talrummene R n og C n , der er afgørende byggesten i Lineær Algebra.


Opdateret 24.10.21 af Karsten Schmidt

5.1 Talrum

Bemærkning 5.1 Fællesbetegnelsen L


Definitioner og regler i denne eNote gælder både for de reelle tal R og de komplekse
tal C . Mængden af reelle tal og mængden af komplekse tal er eksempler på tallege-
mer. Tallegemer har fælles regneregler, hvad angår de elementære regneoperationer.
Når vi i det følgende benytter symbolet L , betyder det, at det, der beskrives, gælder
for mængden af både komplekse såvel som reelle tal.

R n er symbol for mængden af alle ordnede talsæt, som indeholder n reelle elementer.
Fx er
(1, 4, 5) og (1, 5, 4)
to forskellige talsæt, som tilhører R3 . Tilsvarende er C n symbol for mængden af alle
ordnede talsæt, som indeholder n komplekse elementer. Komplekse tal behandles i
eNote 1. Fx er
(1 + 2i, 0, 3i, 1, 1) og (1, 2, 3, 4, 5)
eNote 5 5.1 TALRUM 2

to forskellige talsæt, som tilhører C5 . Mere formelt kan vi opskrive L n på mængdeform


således:
L n = {( a1 , a2 , . . . , an ) | ai 2 L } . (5-1)

Vi indfører addition af elementer i L n og multiplikation af et element i L n med et ele-


ment i L (en skalar) ved følgende definition:

Definition 5.2
Lad ( a1 , a2 , . . . , an ) og (b1 , b2 , . . . , bn ) være elementer i L n , og lad k være et tal i L (en
skalar). Summen af talsættene defineres ved

( a1 , a2 , . . . , an ) + (b1 , b2 , . . . , bn ) = ( a1 + b1 , a2 + b2 , . . . , an + bn ), (5-2)

og produktet af ( a1 , a2 , . . . , an ) med k defineres ved

k · ( a1 , a2 , . . . , a n ) = ( a1 , a2 , . . . , a n ) · k = ( k · a1 , k · a2 , . . . , k · a n ). (5-3)

R n udstyret med regneoperationerne (5-2) og (5-3) kaldes det n-dimensionale reelle tal-
rum. Tilsvarende kaldes C n udstyret med regneoperationerne (5-2) og (5-3) det n-dimensionale
komplekse talrum.

Eksempel 5.3 addition

Et eksempel på addition af to talsæt i R4 er

(1, 2, 3, 4) + (2, 1, 2, 5) = (3, 3, 1, 1).

Eksempel 5.4 multiplikation

Et eksempel på multiplikation af et talsæt i R3 med en skalar er


5 · (2, 4, 5) = (10, 20, 25) .
Et eksempel på multiplikation af et talsæt i C2 med en skalar er
i · (2 + i, 4) = ( 1 + 2i, 4 i ) .
eNote 5 5.1 TALRUM 3

Som kort notation for talsæt vil vi bruge små fede bogstaver. Vi kan for eksempel skrive
a = (3, 2, 1) eller b = (b1 , b2 , . . . , bn ) .
For talsættet (0, 0, . . . , 0), som kaldes nulelementet i L n , benyttes skrivemåden
0 = (0, 0, . . . , 0) .

Når man skal foretage mere sammensatte regneopgaver i talrummene, får man brug for
de følgende regneregler.

Sætning 5.5 Regneregler i L n


Med de i definition 5.2 indførte regneoperationer opfylder talrummene L n for en-
hver værdi af n de følgende otte regneregler:

1. a + b = b + a (additionen er kommutativ)

2. (a + b) + c = a + (b + c) (additionen er associativ)

3. For ethvert a gælder, at a + 0 = a (dvs. 0 er neutralt mht. addition)

4. Til ethvert a findes et modsat element a således, at a + ( a) = 0

5. k1 (k2 a) = (k1 k2 )a (produkt med skalarer er associativt)

6. (k1 + k2 )a = k1 a + k2 a (distributiv regel)

7. k1 (a + b) = k1 a + k1 b (distributiv regel)

8. 1a = a (tallet 1 er neutralt mht. multiplikation)

Bevis

Vedrørende regel 4: Givet to vektorer a = ( a1 , . . . , an ) og b = (b1 , . . . , bn ) . Der gælder da

a + b = ( a1 + b1 , . . . , an + bn ) = 0 , b1 = a 1 , . . . , bn = an .

Heraf ses, at a har en modsat vektor a givet ved a = ( a1 , . . . , an ) . Det fremgår endda,
at a kun har denne modsatte vektor.

De øvrige regneregler bevises ved simpel udregning af venstreside og højreside og efterføl-


gende sammenligning.
eNote 5 5.1 TALRUM 4

Af beviset for regel 4 i sætning 5.5 fremgår, at der for et vilkårligt talsæt a
gælder, at a = ( 1)a .

Opgave 5.6

Gennemfør et formelt bevis for regel 2 og regel 5 i sætning 5.5.

Definition 5.7 Subtraktion


Givet a 2 L n og b 2 L n . Differensen a b indføres ved

a b = a + ( b) . (5-4)

Eksempel 5.8 Subtraktion

(1 + 2i, 1) (i, 2) = (1 + 2i, 1) + ( (i, 2)) = (1 + 2i, 1) + ( i, 2) = (1 + i, 1) .

Opgave 5.9 Nulreglen

Vis, at den følgende variant af nulreglen gælder:

k a = 0 , k = 0 eller a = 0 . (5-5)
eNote 5 5.1 TALRUM 5

Bemærkning 5.10 Talsæt som vektorer


Ofte skriver man et talsæt som en søjlevektor. Vi har dermed to ækvivalente
skrivemåder, her vist med et eksempel fra R4 :
2 3
1
627
v = (1, 2, 3, 4) og v = 6
435.
7

Hvis man i en bestemt sammenhæng har brug for at opfatte talsættet som en
rækkevektor, udfører man en såkaldt transponering, som ændrer en søjlevektor til
en rækkevektor (og omvendt). Transponering har symbolet > :
⇥ ⇤
v> = 1 2 3 4 .
eNote 6 1

eNote 6

Lineære ligningssystemer

Denne eNote handler om lineære ligningssystemer, om metoder til at beskrive dem og løse dem,
og om hvordan man kan få overblik over løsningsmængdernes struktur. Noten kan læses uden
særlige forudsætninger, dog bør man kende til talrummene R n og C n , se eNote 5.
Opdateret 24.10.21 af Karsten Schmidt

6.1 Lineære ligninger

Bemærkning 6.1 Fællesbetegnelsen L


Definitioner og regler i denne eNote gælder både for de reelle tal R og de komplekse
tal C . Mængden af reelle tal og mængden af komplekse tal er eksempler på tallege-
mer. Tallegemer har fælles regneregler, hvad angår de elementære regneoperationer.
Når vi i det følgende benytter symbolet L , betyder det, at det, der beskrives, gælder
for mængden af både komplekse såvel som reelle tal.

En lineær ligning med n ubekendte x1 , x2 , . . . , xn er en ligning af formen


a1 · x1 + a2 · x2 + . . . + a n · x n = b . (6-1)
Tallene a1 , a2 , . . . , an kaldes koefficienter, og tallet b kaldes højresiden. Koefficienterne og
højresiden betragtes som kendte tal i modsætning til de ubekendte. Ligningen kaldes
homogen, hvis b = 0, ellers inhomogen.
eNote 6 6.1 LINEÆRE LIGNINGER 2

Definition 6.2 Løsning til en lineær ligning


Ved en løsning til ligningen

a1 · x1 + a2 · x2 + . . . + a n · x n = b . (6-2)

forstås et talsæt x = ( x1 , x2 , . . . , xn ) 2 L n , der ved indsættelse i ligningen får den


til at passe, det vil sige, at venstresiden ved indsættelse bliver lig med højresiden.

Ved den fuldstændige løsning eller blot løsningsmængden forstås mængden af alle løs-
ninger til ligningen.

Eksempel 6.3 Ligning for en ret linje i planen

Et eksempel på en lineær ligning er ligningen for en ret linje i ( x, y)-planen

y = 2x +5. (6-3)

Her fremstår y isoleret på venstresiden, og koefficienterne 2 og 5 har velkendte geometriske


fortolkninger. Men ligningen kunne også skrives som

2 x1 + 1 x2 = 5 , (6-4)

hvor x og y er erstattet af de mere generelle navne for ubekendte x1 og x2 , og hvor ligningen


er opskrevet på formen (6-1).

Løsningsmængden for (6-3) og (6-4) er selvfølgelig koordinatsættene for samtlige punkter på


linjen — ved indsættelse vil de netop opfylde ligningen, mens ingen andre punkter gør det!

Eksempel 6.4 Trivielle og inkonsistente ligninger

Den lineære ligning


0x1 + 0x2 + 0x3 + 0x4 = 0 , 0 = 0 (6-5)
hvor alle koefficienterne samt højresiden er 0, er et eksempel på en triviel ligning. Ligningens
løsningsmængde består af alle x = ( x1 , x2 , x3 , x4 ) 2 L4 .

Hvis alle ligningens koefficienter er 0, men højresiden er forskellig fra 0, opstår en inkonsis-
tent ligning; det vil sige en ligning, som ingen løsninger har. Det gælder fx ligningen

0x1 + 0x2 + 0x3 + 0x4 = 1 , 0 = 1 . (6-6)


eNote 6 6.1 LINEÆRE LIGNINGER 3

Til at undersøge lineære ligninger, husker vi på de sædvanlige omformningsre-


gler:

• Man ændrer ikke ved løsningsmængden for ligningen, hvis man lægger
den samme størrelse til på begge sider af lighedstegnet, og

• man ændrer heller ikke ved løsningsmængden, hvis man ganger på


begge sider af lighedstegnet med en konstant, som er forskellig fra 0.

Alle lineære ligninger, som ikke er inkonsistente, og som indeholder mere end én ubek-
endt, har uendeligt mange løsninger. Det følgende eksempel viser, hvordan man i så
fald kan opskrive løsningsmængden.

Eksempel 6.5 Uendeligt mange løsninger på standard-parameterform

Find alle løsninger til den følgende inhomogene lineære ligning med tre ubekendte:

2 x1 x2 + 4 x3 = 5 . (6-7)

Ved indsættelse af x1 = 1, x2 = 1 og x3 = 1 i (6-7) ses, at x = ( x1 , x2 , x3 ) = (1, 1, 1) er en


løsning. Men hermed har vi ikke fundet den fuldstændige løsning, da vi for eksempel kan
konstatere, at x = ( 12 , 0, 1) også er en løsning. Hvordan kan vi angive hele løsningsmængden?

Lad os starte med at isolere x1 ,


5 1
x1 = + x2 2 x3 . (6-8)
2 2
Til ethvert valg af talværdier for x2 og x3 svarer der netop én ny værdi af x1 . Lad os fx sætte
x2 = 1 og x3 = 4, og så får vi x1 = 5. Det betyder, at talsættet ( 5, 1, 4) er en løsning.
Vi kan derfor betragte x2 og x3 som frie parametre, der fastlægger værdien af x1 . Vi omdøber
derfor x2 og x3 til de mere passende parameter-navne s henholdsvis t sådan, at s = x2 og
t = x3 . Herefter kan x1 udtrykkes således (sammenlign med (6-8)):
5 1
x1 = + s 2t. (6-9)
2 2
Vi kan nu opskrive den fuldstændige løsning for (6-7) på følgende standard-parameterform:
2 3 253 213 2 3
x1 2 2 2
x = 4 x2 5 = 4 0 5+ s ·4 1 5+ t ·4 0 5 hvor s, t 2 L . (6-10)
x3 0 0 1
eNote 6 6.2 SYSTEM AF LINEÆRE LIGNINGER 4

Bemærk, at parameterfremstillingens midterste ligning x2 = 0 + s · 1 + t · 0 sådan set blot


udtrykker navneskiftet fra x2 til s . Tilsvarende udtrykker nederste ligning blot navneskiftet
fra x3 til t .

Hvis vi opfatter (6-7) som ligningen for en plan i rummet, så angiver (6-10)
en parameterfremstilling for den samme plan. Første søjlevektor på højresi-
den (den, der ikke ganges med en fri parameter) angiver begyndelsespunktet i
planen, og de to sidste søjlevektorer er retningsvektorer for planen. Dette er
beskrevet nærmere i eNote 10 om "‘Geometriske vektorer"’.

6.2 System af lineære ligninger

Et lineært ligningssystem bestående af m lineære ligninger med n ubekendte skrives på


formen
a11 · x1 + a12 · x2 + . . . + a1n · xn = b1
a21 · x1 + a22 · x2 + . . . + a2n · xn = b2
.. (6-11)
.
am1 · x1 + am2 · x2 + . . . + amn · xn = bm .

Ligningssystemet har m rækker med hver én ligning. De n ubekendte, som betegnes


x1 , x2 , . . . , xn , optræder i hver af de m ligninger, med mindre nogle led har koefficien-
ten 0 og er udeladt. Koefficienten til x j i ligningens række nummer i betegnes aij . Lign-
ingssystemet kaldes homogent, hvis alle de m højresiders bi er lig med 0; i modsat fald
inhomogent.
eNote 6 6.2 SYSTEM AF LINEÆRE LIGNINGER 5

Definition 6.6 Løsning for et lineært ligningssystem


Ved en løsning til det lineære ligningssystem

a11 · x1 + a12 · x2 + . . . + a1n · xn = b1


a21 · x1 + a22 · x2 + . . . + a2n · xn = b2
.. (6-12)
.
am1 · x1 + am2 · x2 + . . . + amn · xn = bm

forstås et talsæt x = ( x1 , x2 , . . . , xn ) 2 L n , der ved indsættelse får alle de m lineære


ligninger i systemet til at passe — det vil sige, at venstresiden er lig højresiden i hver
ligning.

Ved den fuldstændige løsning eller blot løsningsmængden forstås mængden af alle løs-
ninger til ligningssystemet. En enkelt løsning betegnes ofte som en partikulær løs-
ning.

Eksempel 6.7 Homogent lineært ligningssystem

Der er givet et homogent lineært ligningssystem bestående af to ligninger med fire


ubekendte:
x1 + x2 + 2 x3 + x4 = 0
(6-13)
2 x1 x2 x3 + x4 = 0 .
Er talsættene x = (1, 1, 2, 6) og y = (3, 0, 1, 5) partikulære løsninger til
ligningerne?

Ved indsættelse af x i systemets venstreside får vi


1+1+2·2 6=0
2·1 1 2 6= 7.
Da venstresiden kun i det første tilfælde er lig højresiden 0 , er x kun en løsning til den første
af de to ligninger. Derfor er x ikke en løsning til hele ligningssystemet.

Ved indsættelse af y får vi


3+0+2·1 5=0
2·3 0 1 5 = 0.
Da venstresiden i begge tilfælde er lig højresiden 0 , er y en løsning til begge de to ligninger.
Derfor er y en partikulær løsning til ligningssystemet.
eNote 6 6.3 KOEFFICIENTMATRIX OG TOTALMATRIX 6

Løsningsmængden til et lineært ligningssystem er fællesmængden af løs-


ningsmængderne til hver af de ligninger, som indgår i systemet — dvs. kun de
løsninger, ligningerne har til fælles.

6.3 Koefficientmatrix og totalmatrix

Når man skal undersøge et lineært ligningssystem, er det ofte bekvemt at benytte sig
af matricer. En matrix er et rektangulært talskema, som består af et vist antal rækker og
søjler. For eksempel har den matrix M, som er givet ved

1 0 5
M= , (6-14)
8 3 2
to rækker og tre søjler. De seks tal kaldes matricens elementer. Matricens diagonal består
af de elementer, hvis rækkenummer er lig med søjlenummer. I M består diagonalen
således af elementerne 1 og 3.

Ved koefficientmatricen A til det lineære ligningssystem (6-11) forstås den matrix, hvis
første række består af koefficienterne til den første ligning, hvis anden række består af
koefficienterne til den anden ligning og så videre. Kort sagt den følgende matrix med
m rækker og n søjler: 2 3
a11 a12 · · · a1n
6a 7
6 21 a22 · · · a2n 7
A =6 . .. .. .. 7 . (6-15)
4 .. . . . 5
am1 am2 · · · amn

Ligningssystemets totalmatrix T fremkommer ved, at man i koefficientmatricens højre


side tilføjer en ny søjle, som består af ligningssystemets højresider bi . T har dermed
m rækker og n + 1 søjler, hvor n var antal ubekendte. Hvis vi samler højresiderne bi i
en søjlevektor b, som vi kalder ligningssystemets højreside, er T sammensat således, hvor
den lodrette hjælpelinje symboliserer systemets lighedstegn:
2 3
a11 a12 · · · a1n b1
⇥ ⇤ 66 a21 a22 · · · a2n b2 7
7
T = A b =6 . .. .. .. .. 7 . (6-16)
4 .. . . . . 5
am1 am2 · · · amn bm

Den lodrette hjælpelinje før sidste søjle i (6-16) har blot den pædagogiske funk-
tion at skabe klarere overblik. Man kan vælge at udelade linjen, hvis det i
sammenhængen ikke kan føre til misforståelser.
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 7

Eksempel 6.8 Koefficientmatrix, højresider og totalmatrix

For det lineære ligningssystem bestående af 3 ligninger med 3 ubekendte

x2 + x3 = 2
2x1 + 4x2 2x3 = 2 (6-17)
3x1 + 4x2 + x3 = 9

har vi 2 3 2 3 2 3
0 1 1 2 0 1 1 2
A =4 2 4 25, b = 4 2 5 og T = 4 2 4 2 2 5. (6-18)
3 4 1 9 3 4 1 9
Bemærk, at det 0, som er placeret øverst til venstre i A og T, angiver, at koefficienten til x1 i
ligningssystemets øverste række er 0.

Det smarte ved en koefficientmatrix (og en totalmatrix) er, at vi ikke behøver


at skrive de ubekendte op. Koefficienternes entydige placering i matricen gør,
at vi ikke er i tvivl om, hvilken af de ubekendte hver af dem hører til. Vi har
fjernet overflødige symboler! En matrix er simpelthen en kompakt og simplere
måde at opskrive mange ligninger på.

6.4 Reduktion af lineære ligningssystemer

Lineære ligningssystemer kan reduceres, det vil sige gøres enklere, ved hjælp af en
metode, der kaldes Gauss-elimination. Metoden har flere forskellige varianter, og den
særlige variant der, benyttes i disse eNoter, går under navnet GaussJordan-elimination.
Det algebraiske grundlag for alle varianterne er, at man kan omforme et lineært ligningssy-
stem ved såkaldte rækkeoperationer, uden at man derved ændrer på ligningssystemets
løsningsmængde. Når ligningssystemet er reduceret mest muligt, er det som regel nemt
at aflæse og opskrive dets løsningsmængde.
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 8

Sætning 6.9 Rækkeoperationer


Man ændrer ikke på et lineært ligningssystems løsningsmængde hvis man om-
former ligningssystemet ved en af de følgende tre rækkeoperationer:

ro1 : Lad to af ligningerne bytte række.

ro2 : Gang en af ligningerne med en konstant, som ikke er 0.

ro3 : Læg til en ligning en af de øvrige ligninger ganget med en konstant.

Vi fastlægger her en kort notation for hver af de tre rækkeoperationer:


ro1 : Ri $ R j : Ligningen i række i ombyttes med ligningen i række j.
ro2 : k · Ri : Ligningen i række i ganges med k.
ro3 : R j + k · Ri : Til ligningen i række j lægges ligningen i række i ganget med k.

I det følgende eksempel afprøver vi de tre rækkeoperationer.

Eksempel 6.10 Rækkeoperationerne

Vi eksemplificerer ro1
Betragt ligningssystemet nedenfor til venstre. Vi bytter om på de to ligninger, hvorved vi har
udført R1 $ R2 ,
x1 + 2x2 = 3 x1 + x2 = 0
! (6-19)
x1 + x2 = 0 x1 + 2x2 = 3 .
Systemet til højre har samme løsningsmængde som systemet til venstre.

Vi eksemplificerer ro2
Betragt ligningssystemet nedenfor til venstre. Vi ganger ligningen i anden række med 5,
hvorved vi har udført 5 · R2 :

x1 + 2x2 = 3 x1 + 2x2 = 3
! (6-20)
x1 + x2 = 0 5 x1 + 5 x2 = 0 .

Systemet til højre har samme løsningsmængde som systemet til venstre.

Vi eksemplificerer ro3
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 9

Betragt ligningssystemet nedenfor til venstre. Til ligningen i anden række lægger vi ligningen
i første række ganget med 2. Vi har dermed udført R2 + 2 · R1 :

x1 + 2x2 = 3 x1 + 2x2 = 3
! (6-21)
x1 + x2 = 0 3x1 + 5x2 = 6.

Systemet til højre har samme løsningsmængde som systemet til venstre.

Pilen !, som er brugt i de tre eksempler, indikerer, at en (eller flere) rækkeopera-


tion(er) har fundet sted.

Bevis

Bevis for ro1


Første del af beviset for sætning 6.9 er enkel. Da løsningsmængden for et ligningssystem
er identisk med fællesmængden F af løsningsmængderne til hver af de ligninger, der indgår
i systemet, ændres F naturligvis ikke ved, at ligningernes rækkefølge ændres. Derfor er ro1
tilladt.

Bevis for ro2


Da én lignings løsningsmængde ikke ændres, ved at den ganges med en konstant k 6= 0, vil
F ikke kunne påvirkes af, at en af ligningerne i et ligningssystem erstattes af ligningen selv
ganget med en konstant forskellig fra 0. Derfor er ro2 tilladt.

Bevis for ro3


Betragt endelig et lineært ligningssystem A med n ubekendte x = ( x1 , x2 , . . . xn ). Venstresi-
den af en ligning i A opskriver vi som L(x) og højresiden som b . Vi udfører nu en vilkårlig
rækkeoperation af typen ro3 på følgende måde: En vilkårlig ligning L1 (x) = b1 ganges med
et vilkårligt tal k og lægges dernæst til en vilkårlig anden ligning L2 (x) = b2 . Herved dannes
en ny ligning L3 (x) = b3 , hvor

L3 (x) = L2 (x) + k L1 (x) og b3 = b2 + k b1 .

Vi viser nu, at det ligningssystem B, som opstår, ved at L2 (x) = b2 i A erstattes af L3 (x) = b3 ,
har samme løsningsmængde som A, og at ro3 dermed er tilladt. Antag først, at x0 er en
vilkårlig løsning til A . Så gælder ifølge omformningsregler for én ligning, at

k L1 (x0 ) = k b1

og videre, at
L2 (x0 ) + k L1 (x0 ) = b2 + k b1 .
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 10

Heraf følger, at L3 (x0 ) = b3 og dermed, at x0 også er en løsning til B. Antag nu omvendt, at


x1 er en vilkårlig løsning til B . Så følger på samme måde, at

k L1 (x1 ) = k b1

og videre, at
L3 (x1 ) k L1 (x1 ) = b3 k b1 .
Venstresiden svarer til L2 (x1 ) og højresiden til b2 , så derfor er L2 (x1 ) = b2 , og x1 er også en
løsning til A. Samlet er det som ønsket vist, at ro3 er tilladt.

Af sætning 6.9 får vi umiddelbart:

Følgesætning 6.11
Man ændrer ikke på et lineært ligningssystems løsningsmængde, hvis man om-
former det et vilkårligt antal gange og i en vilkårlig rækkefølge ved hjælp af de
tre rækkeoperationer.

Vi er nu rede til at benytte de tre rækkeoperationer til at reducere et lineært lignings-


system. Vi følger i det følgende eksempel principperne i GaussJordan-elimination, og vil
senere i afsnit 6.5 give en præcis karakteristik af denne metode.
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 11

Eksempel 6.12 GaussJordan-elimination

Vi betragter nedenfor til venstre et lineært ligningssystem, som består af tre ligninger, hvori
der indgår de tre ubekendte x1 , x2 og x3 . Til højre er ligningssystemets totalmatrix opskrevet:
x2 + x3 = 2 2 3
0 1 1 2
2x1 + 4x2 2x3 = 2 T =4 2 4 2 2 5. (6-22)
3x1 + 4x2 + x3 = 9 3 4 1 9

Ideen i reduktionen er gennem rækkeoperationerne at opnå følgende situation:

• x1 skal være det eneste tilbageværende led på venstresiden af den øverste lign-
ing,

• x2 det eneste på venstresiden af den midterste ligning og

• x3 det eneste på venstresiden af den nederste ligning.

Hvis dette er muligt, er ligningssystemet ikke blot reduceret men også løst!

Vi går herunder frem efter en række trin, som følger GaussJordan-algoritmen, mens vi sam-
tidig ser på rækkeoperationernes indvirkning på totalmatricen.

For at opfylde ønsket, at x1 er eneste led i første lignings venstreside, skal vi først og fremmest
sørge for, at den øverste ligning, altså række et, i det hele taget indeholder x1 og med koeffi-
cienten 1. Det kan vi i denne opgave opnå i to trin. Vi ombytter de to øverste ligninger (ved
ro1 ) og ganger derefter den ligning, som nu står i række et, med 12 (ved ro2 ). Kort sagt
1
R1 $ R2 og · R1 :
2
x1 + 2x2 x3 = 1 2 3
1 2 1 1 (6-23)
x2 + x3 = 2 40 1 1 2 5.
3x1 + 4x2 + x3 = 9 3 4 1 9

Nu fjerner vi alle andre forekomster af x1 . Der er her kun én forekomst, der skal fjernes,
nemlig i række tre. Vi ganger derfor ligningen i række et med tallet 3 og lægger dette
produkt til ligningen i række tre (ved re3 ) — sagt på en anden måde, "‘vi lægger række et til
række tre 3 gange"’, eller "‘vi trækker række et fra række tre 3 gange"’. Dvs.
R3 3 · R1 :
x1 + 2x2 x3 = 1 2 3
1 2 1 1 (6-24)
x2 + x3 = 2 40 1 1 2 5.
2x2 + 4x3 = 6 0 2 4 6
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 12

Husk, at brugen af ro3 kun påvirker én række — i dette tilfælde påvirkes kun række
3, ikke række 1.

Vi har nu opnået, at x1 kun optræder i række et. Der skal den blive! Arbejdet med x1 er
afsluttet, hvilket svarer til, at der øverst i totalmatricens første søjle er et 1-tal og under 1-
tallet kun 0-er. Arbejdet med første søjle er færdiggjort!

De næste omformninger skal forsøge at sikre, at den ubekendte x2 kun er repræsenteret i


række to. Først sørger vi lige for, at x2 i række to får koefficienten 1 fremfor 1, hvilket gøres
med operationen ro2
( 1) · R2 :
x1 + 2x2 x3 = 1 2 3
1 2 1 1 (6-25)
x2 x3 = 2 40 1 1 2 5.
2x2 + 4x3 = 6 0 2 4 6

Nu kan vi fjerne forekomsterne af x2 fra række et og række tre ved to gange at benytte ro3
R1 2 · R2 og R3 + 2 · R2 :
x1 + x3 = 5 2 3
1 0 1 5 (6-26)
x2 x3 = 2 40 1 1 2 5.
2x3 = 2 0 0 2 2

Herefter er arbejdet med x2 afsluttet, hvilket svarer til, at der i række to i totalmatricens anden
søjle er et 1-tal med 0 ovenfor og nedenunder. Ligesom med den første søjle vil vi undgå at
ændre på denne søjle to senere rækkeoperationer.

Til sidst ønsker vi, at den ubekendte x3 er repræsenteret alene i række tre med koefficienten
1, hvorfor x3 skal fjernes fra række et og række to. Det kan vi opnå i to trin. Først fås korrekt
koefficient (ved ro2 )
1
· R3 :
2
x1 + x3 = 5 2 3
1 0 1 5 (6-27)
x2 x3 = 2 40 1 1 2 5.
x3 = 1 0 0 1 1
Derefter ro3 to gange
R1 R3 og R2 + R3 :
x1 = 4 2 3
1 0 0 4 (6-28)
x2 = 1 40 1 0 1 5.
x3 = 1 0 0 1 1
Nu optræder x3 kun i række tre. Det svarer til, at der i række tre i totalmatricens tredje søjle
er et 1-tal, mens der er rene 0-er i resten af denne søjle. Vi har nu gennemført en fuldstændig
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 13

reduktion af ligningssystemet og kan konkludere, at der findes netop én løsning til det lign-
ingssystem, vi har arbejdet med, nemlig

x = ( x1 , x2 , x3 ) = (4, 1, 1). (6-29)

Lad os huske på, hvad en løsning er: Det er et talsæt, der får alle ligningerne
i ligningssystemet til at passe! Lad os derfor eftervise, at (6-29) faktisk er en
løsning til ligningssystemet (6-22):

( 1) + 1 = 2
2 · 4 + 4 · ( 1) 2 · 1 = 2
3 · 4 + 4 · ( 1) + 1 = 9 .
Som forventet passer alle tre ligninger!

I (6-28) har ligningssystemets totalmatrix efter rækkeoperationerne opnået en særlig


smuk form med tre såkaldt ledende 1-taller i diagonalen og 0-er alle andre steder. Man
siger, at den omformede matrix er en trappematrix, idet de ledende 1-taller danner en
"‘trappe"’, man kan gå ned ad fra venstre mod højre! Det er dog ikke altid muligt at
få trappens 1-taller til at følge en ret linje, men mindre kan også gøre det! Ofte må
man flytte sig mere end én søjle mod højre for at finde næste trin. Den generelle lidt
kringlede definition følger herunder.
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 14

Definition 6.13 Trappematrix


Et lineært ligningssystem kaldes et fuldstændigt reduceret ligningssystem, hvis dets
tilhørende totalmatrix er en trappematrix. En matrix er en trappematrix, hvis den
opfylder de følgende fire betingelser:

1. Det første tal i en række, som ikke er et 0, skal være et 1-tal. Det kaldes for
rækkens ledende 1-tal.

2. I to på hinanden følgende rækker, som begge har et ledende 1-tal, står den
øverste rækkes ledende 1-tal længere til venstre end den følgende rækkes
ledende 1-tal (trappen går nedad fra venstre mod højre).

3. I en søjle, hvori der optræder et ledende 1-tal, består de øvrige elementer i


søjlen udelukkende af 0-er.

4. Eventuelle rækker, som udelukkende består af 0-er, er placeret i bunden af


matricen.

Definitionen på en trappematrix fra definition 6.13 betegnes i den interna-


tionale litteratur som matricens reduced row echelon form.

Eksempel 6.14 Trappematricer

Betragt de følgende tre matricer


2 3 2 3 2 3
1 0 0 1 2 0 1 3 1
A =4 0 1 0 5 , B = 4 0 0 1 5 og C =4 0 0 0 5 . (6-30)
0 0 1 0 0 0 0 0 0

De tre viste matricer er alle trappematricer. De ledende 1-taller (markeret med fed) betragtes
som trappens "‘trin"’. I A er trinene smukt placeret i diagonalen. B har kun to ledende 1-taller,
og man må gå to søjler mod højre for at komme fra første til andet trin. I C har trappen kun
ét trin.
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 15

Eksempel 6.15

Ingen af de følgende fire matricer er trappematricer, idet hver af dem strider mod netop én
af reglerne i definition 6.13. Det overlades til læseren at afgøre hvilken!
2 3 2 3 2 3 2 3
1 1 0 0 0 0 1 0 0 1 0 0
A =4 0 1 0 5 , B =4 1 2 0 5 , C = 4 0 2 1 5 og D =4 0 0 1 5 . (6-31)
0 0 1 0 0 1 0 0 0 0 1 0

Der gælder nu følgende vigtige sætning om forholdet mellem en matrix og den trappe-
matrix, som den kan omformes til ved hjælp af rækkeoperationer.

Sætning 6.16 Trappeform


Hvis en given matrix M ved to forskellige serier af rækkeoperationer kan omformes
til trappematricer, så er disse to fremkomne trappematricer identiske.

Den unikke trappematrix, som en given matrix M kan omformes til ved hjælp af
rækkeoperationer, kaldes matricens trappeform og har symbolet trap(M).

Bevis

Vi benytter følgende model for de seks matricer, som introduceres i løbet af beviset:
f1 f2
A M ! B
# (6-32)
f1 f2
A1 M1 ! B1

Antag, at en matrix M ved to forskellige serier af rækkeoperationer f 1 og f 2 er blevet om-


formet til to forskellige trappematricer A og B. Lad søjle nummer k være den første søjle
i A og B, hvor de to matricer afviger fra hinanden. Vi danner nu en ny matrix M1 ud fra
M på følgende måde. Først fjerner vi alle de søjler i M, hvis søjlenummer er større end k .
Dernæst fjerner vi netop de søjler i M, hvis søjlenummer er mindre end k , og som har samme
søjlenummer som en søjle i A (og dermed B, da søjlerne i A og B er ens før søjle k), der ikke
indeholder et ledende 1-tal.

Nu omformer vi M1 ved rækkeoperationsfølgerne f 1 og f 2 , og de matricer, der dannes


herved, kalder vi for A1 henholdsvis B1 . Da vil A1 nødvendigvis være den samme matrix,
eNote 6 6.4 REDUKTION AF LINEÆRE LIGNINGSSYSTEMER 16

som vil fremkomme, hvis vi fra A fjerner alle de søjler, der svarer til dem, vi fjernede fra M for
at opnå M1 . Og det samme forhold er der mellem B1 og B. A1 og B1 vil derfor have ledende
1-taller i diagonalen i alle søjler pånær den sidste, da den sidste søjle er den første, hvor de
to matricer er forskellige fra hinanden. I denne sidste søjle er der to muligheder: Enten har
én af matricerne et ledende 1-tal eller også har ingen af dem det. Et eksempel på, hvordan
situationen i det første tilfælde kunne være, er:
2 3 2 3
1 0 0 1 0 0
A1 = 4 0 1 0 5 B1 = 4 0 1 2 5 . (6-33)
0 0 1 0 0 0

Vi fortolker nu M1 som totalmatrix for et lineært ligningssystem L (dvs., at den tredje søjle
i A1 og B1 er højresiden). Både A1 og B1 vil da repræsentere et fuldstændigt reduceret lign-
ingssystem, der skal have samme løsningsmængde som L. Men dette fører til en modstrid,
da det ene, A1 , af de fuldstændigt reducerede systemer indeholder en inkonsistent ligning,
mens det andet, B1 , vil have netop én løsning. Vi kan derfor udelukke, at én af A1 og B1
indeholder et ledende 1-tal i sidste søjle.

Vi undersøger nu den anden mulighed: at ingen af A1 og B1 indeholder et ledende 1-tal i


sidste søjle. Situationen kunne da fx være således:
2 3 2 3
1 0 1 1 0 1
A1 = 4 0 1 3 5 B1 = 4 0 1 2 5 . (6-34)
0 0 0 0 0 0

Både det fuldstændigt reducerede ligningssystem, som repræsenteres af A1 , og det, der


repræsenteres af B1 , vil i dette tilfælde have netop én løsning. Men da den sidste søjle er
forskellig i de to matricer, vil løsningen for A1 ’s ligningssystem være forskellig fra løsningen
for B1 ’s ligningssystem, hvorved vi igen er havnet i en modstrid.

Vi kan herefter konkludere, at antagelsen om at M kan omformes til to forskellige trappema-


tricer, ikke kan være rigtig. Ergo hører der til M en unik trappematrix: trap(M).

Fra sætning 6.16 får vi relativt nemt det næste resultat om matricer, som ved hjælp af
rækkeoperationer kan omformes til hinanden:
eNote 6 6.5 GAUSSJORDAN-ELIMINATION 17

Følgesætning 6.17
Hvis en matrix M ved en vilkårlig serie af rækkeoperationer er blevet omformet til
matricen N, så gælder der, at

trap(N) = trap(M). (6-35)

Bevis

Lad s være en serie af rækkeoperationer, der omformer matricen M til matricen N , og lad t
være en serie af rækkeoperationer, der omformer N til trap(N) . Så vil den serie rækkeoper-
ationer, der består af s efterfulgt af t , omforme M til trap(N). Men da M ifølge sætning 6.16
har en unik trappeform, må trap(M) være lig med trap(N) .

Hvis vi i den foregående følgesætning opfatter M og N som totalmatricer for to lineære


ligningssystemer, så følger umiddelbart af definition 6.13:

Følgesætning 6.18
Hvis to lineære ligningssystemer kan omformes til hinanden ved hjælp af række-
operationer, så er de på fuldstændigt reduceret form (efter udeladelse af eventuelle
trivielle ligninger) identiske.

6.5 GaussJordan-elimination

Vi er nu i stand til præcist at indføre den eliminationsmetode, der benyttes i disse


eNoter.
eNote 6 6.5 GAUSSJORDAN-ELIMINATION 18

Definition 6.19 GaussJordan-elimination


Et lineært ligningssystem er reduceret fuldstændigt ved GaussJordan-elimination, når
dets tilhørende totalmatrix efter brug af de tre rækkeoperationer (se sætning 6.9) er
bragt på trappeform (se sætning 6.16) efter følgende fremgangsmåde:

Vi går frem fra venstre mod højre: Først ordnes totalmatricens første søjle,
så den ikke strider mod trappeformen. Dernæst ordnes den anden søjle, så
den ikke strider mod trappeformen og så videre indtil og med den sidste
søjle i totalmatricen.

Dette er altid muligt!

Når man skal reducere lineære ligningssystemer, er man fri til at afvige fra
GaussJordan-metoden, hvis det i situationen skønnes nemmere. Hvis man
ved andre følger af rækkeoperationer har nået fuldstændigt reduceret form
(trappeform), er det jo den samme form, som man ville have opnået ved strikst
at have fulgt GaussJordan-metoden. Dette fremgår af følgesætning 6.18.

I eksempel 6.12 var det muligt direkte at aflæse løsningen ud fra det fuldstændigt re-
ducerede lineære ligningssystem. I det efterfølgende hovedeksempel er situationen
lidt mere kompliceret, hvilket hænger sammen med, at ligningssystemet har uendeligt
mange løsninger.

Eksempel 6.20 GaussJordan-elimination

Reducer dette system af fire lineære ligninger med fem ubekendte:

x1 + 3x2 + 2x3 + 4x4 + 5x5 = 9


2x1 + 6x2 + 4x3 + 3x4 + 5x5 = 3
(6-36)
3x1 + 8x2 + 6x3 + 7x4 + 6x5 = 5
4x1 + 14x2 + 8x3 + 10x4 + 22x5 = 32 .

Vi opskriver ligningssystemets totalmatrix,


2 3
1 3 2 4 5 9
62 6 4 3 5 37
T =6 43 8
7. (6-37)
6 7 6 55
4 14 8 10 22 32
eNote 6 6.5 GAUSSJORDAN-ELIMINATION 19

I det følgende reducerer vi ligningssystemet ved hjælp af de tre rækkeoperationer.

I det følgende viser vi kun omformningen ved ligningssystemets totalmatrix og und-


lader at vise selve ligningssystemet. Først til sidst skriver vi igen ligningssystemet
op på fuldstændig reduceret form.

R2 2 · R1 , R3 3 · R1 og R4 4 · R1 :
2 3
1 3 2 4 5 9
60 0 0 5 5 15 7 (6-38)
6 7.
40 1 0 5 9 22 5
0 2 0 6 2 4
Herefter er vi færdige med behandlingen af første søjle, da vi har et ledende 1-tal i første
række og lutter 0-er på de andre pladser i søjlen.
R2 $ R3 og ( 1) · R2 :
2 3
1 3 2 4 5 9
60 1 0 5 9 22 7 (6-39)
6 7.
40 0 0 5 5 15 5
0 2 0 6 2 4
R1 3 · R2 og R4 2 · R2 :
2 3
1 0 2 11 22 57
60 1 0 5 9 22 7 (6-40)
6 7.
40 0 0 5 5 15 5
0 0 0 16 16 48
Arbejdet med anden søjle er nu afsluttet.

Herefter følger en afvigelse fra det, vi så i det forrige eksempel, hvor vi skaffede 1-taller i
diagonalen. Det er nemlig ikke muligt at skaffe et ledende 1-tal som tredje element i den
tredje række. Vi kan ikke bytte række et og række tre, for så ændrer vi jo den første søjle, som
er færdigbehandlet. Dermed er vi også færdige med søjle tre (2-tallet i øverste række kan
ikke fjernes). For at fortsætte reduktionen går vi videre til det fjerde element i række tre, hvor
det er muligt at skaffe et ledende 1-tal.
1
5 · R3 :
2 3
1 0 2 11 22 57
60 1 0 5 9 22 7 (6-41)
6 7.
40 0 0 1 1 35
0 0 0 16 16 48
R1 + 11 · R3 , R2 5 · R3 og R4 + 16 · R3 :
2 3
1 0 2 0 11 24
60 1 0 0 4 77 (6-42)
6 7.
40 0 0 1 1 35
0 0 0 0 0 0
eNote 6 6.6 BEGREBET RANG 20

Herefter er GaussJordan-eliminationen afsluttet. og vi kan opskrive det fuldstændigt reduc-


erede ligningssystem:
1x1 + 0x2 + 2x3 + 0x4 11x5 = 24
0x1 + 1x2 + 0x3 + 0x4 + 4x5 = 7
(6-43)
0x1 + 0x2 + 0x3 + 1x4 + 1x5 = 3
0x1 + 0x2 + 0x3 + 0x4 + 0x5 = 0 .
I første omgang kan vi konstatere, at det oprindelige ligningssystem faktisk er blevet reduc-
eret (gjort mere enkelt) ved, at mange af ligningssystemets koefficienter er udskiftet med 0-er.

Men derudover kan systemet med fire ligninger nu erstattes af et system bestående af 3. Den
sidste række er nemlig en triviel ligning, der har hele L5 som sin løsningsmængde. Det æn-
drer derfor ikke på ligningssystemets løsningsmængde, at den sidste ligning udelades af det
reducerede system (idet fællesmængden af løsningsmængderne for hver af de fire ligninger
er lig med fællesmængderne af løsningsmængderne for de første tre). Helt enkelt kan vi
derfor opskrive det fuldstændigt reducerede ligningssystem således:

x1 + 2x3 11x5 = 24
x2 + 4x5 = 7 (6-44)
x4 + x5 = 3 .

Hermed er ligningssystemet reduceret mest muligt, og opgaven er løst.

Men hvordan kommer vi videre fra det reducerede ligningssystem til at indse, hvad
løsningsmængden er, og til at kunne angive den på en overskuelig form? Vi fortsætter
ovenstående eksempel senere (i eksempel 6.30) for at tilføje denne løsning. Men først
har vi brug for at indføre begrebet rang.

6.6 Begrebet rang

I eksempel 6.20 er et lineært ligningssystem bestående af 4 ligninger med 5 ubekendte


blevet reduceret fuldstændigt til (6-44). Der resterer her kun 3 ligninger, idet den triv-
ielle ligning 0x1 + 0x2 + 0x3 + 0x4 + 0x5 = 0 er udeladt, da den blot udtrykker, at 0 = 0.
At et reduceret lineært ligningssystem indeholder en triviel ligning, er ensbetydende
med, at trappeformen af dens totalmatrix indeholder en 0-række som i (6-42). Dette
giver anledning til de følgende definitioner.
eNote 6 6.6 BEGREBET RANG 21

Definition 6.21 Rang


Ved rangen r af en matrix forstås antallet af rækker i matricens trappeform, som
ikke er 0-rækker. Rangen svarer dermed til antallet af ledende 1-taller i matricens
trappeform.

Af definition 6.21 og følgesætning 6.18 samt følgesætning 6.17 får vi direkte:

Sætning 6.22 Rang og rækkeoperationer


To matricer, som kan omformes til hinanden ved hjælp af rækkeoperationer, har
samme rang.

Rangen angiver det mindst mulige antal ikke-trivielle ligninger, som et lign-
ingssystem kan omformes til ved hjælp af rækkeoperationer. Man kan altså
aldrig med rækkeoperationer omforme et lineært ligningssystem, så det in-
deholder færre ikke-trivielle ligninger, end det gør, når det er fuldstændigt
reduceret. Dette er en konsekvens af sætning 6.22.

Eksempel 6.23 Matricers rang

En matrix M med 3 rækker og 4 søjler er bragt på trappeform således:


2 3 2 3
3 1 7 2 1 0 3 0
M =4 1 3 3 1 5 ! trap(M) = 4 0 1 2 0 5. (6-45)
2 3 0 3 0 0 0 1

Da trap(M) ikke indeholder 0-rækker, er r(M) = 3.

En matrix N med 5 rækker og 3 søjler er bragt på trappeform således:


2 3 2 3
2 2 1 1 0 0
6 2 5 47 60 1 07
6 7 6 7
6 7 6 7
N =6 3 1 7 7 ! trap(N) = 6 0 0 1 7 . (6-46)
6 7 6 7
4 2 1 85 40 0 05
3 1 7 0 0 0

Da trap(N) indeholder tre rækker, som ikke er 0-rækker, er r(N) = 3.


eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 22

Hvis vi fortolker M og N som totalmatricer for lineære ligningssystemer (hvor sid-


ste søjle da vil være højresiden), ser vi i begge tilfælde, at rangen af de tilsvarende
koefficientmatricer er 2, altså mindre end rangen af totalmatricerne.

Vi vil nu undersøge relationen mellem rang og antallet af rækker og søjler. Først be-
mærker vi, at det direkte af definition 6.21 følger, at rangen af en matrix aldrig kan være
større end antallet af matricens rækker.

I eksempel 6.23 er rangen af M lig med antallet af rækker i M, mens rangen af N er


mindre end antallet af rækker i N.

Men rangen af en matrix kan heller ikke være større end antallet af søjler. Rangen er
jo lig med antallet af ledende 1-taller i matricens trappeform, og hvis trappeformen af
matricen indeholder flere ledende 1-taller, end der er søjler, så må der være mindst én
søjle, der indeholder mere end ét ledende 1-tal. Men dette strider mod betingelse nr. 3 i
definition 6.13.

I eksempel 6.23 er rangen af M mindre end antallet af søjler i M, mens rangen N er lig
med antallet af søjler i N.

Vi opsummerer de ovenstående iagttagelser i følgende sætning:

Sætning 6.24 Rang, rækker og søjler


For en matrix M med m rækker og n søjler gælder der, at

r(M)  min {m, n} . (6-47)

6.7 Fra trappeform til løsningsmængde

I visse tilfælde kan man umiddelbart aflæse løsningsmængden for et lineært ligningssystem,
når dets totalmatrix er bragt på trappeform. Det gælder, når ligningssystemet ingen
løsninger har, eller når det har netop én løsning. Hvis ligningssystemet har uendeligt
mange løsninger, er der stadig et arbejde, der skal gøres, før man klart kan karakteris-
ere løsningsmængden. En klart karakteriseret løsningsmængde kan med fordel opnås
ved at bringe den på standard-parameterform.
eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 23

Begrebet rang viser sig velegnet til at give et overblik over forskellige former for løs-
ningsmængder. De næste tre underafsnit beskriver de tre særlige situationer.

6.7.1 Når r(A) < r(T)

Totalmatricen T for et lineært ligningssystem har det samme antal rækker som lignings-
systemets koefficientmatrix A, men den har én ekstra søjle, som indeholder ligningernes
højresider. Der foreligger derfor to muligheder. Enten har vi r(T) = r(A), eller også er
r(T) = r(A) + 1, dvs. r(A) < r(T), hvilket svarer til, at sidste søjle i trap(T) indeholder
et ledende 1-tal. Konsekvensen af den sidste mulighed undersøges i eksempel 6.25.

Eksempel 6.25 Inkonsistent ligning (ingen løsning)

Totalmatricen T for et lineært ligningssystem bestående af tre ligninger med to ubekendte er


bragt på trappeformen
2 3
1 2 0
trap(T) = 4 0 0 1 5. (6-48)
0 0 0
Ligningssystemet er altså blevet reduceret til

x1 2x2 = 0
0x1 + 0x2 = 1 (6-49)
0x1 + 0x2 = 0 .

Bemærk her, at ligningen i anden række er inkonsistent (svarer til 0 = 1), og at den derfor
ingen løsninger har. Da ligningssystemets løsningsmængde er fællesmængden af de enkelte
ligningers løsningsmængder, har ligningssystemet ingen løsninger overhovedet.

Lad os betragte trappeformen af ligningssystemets koefficientmatrix A ved at se bort fra


højresiden,
2 3
1 2
trap(A) = 4 0 0 5. (6-50)
0 0
Vi bemærker, at r(A) = 1. Rangen af A er altså mindre end rangen af T, da r(T) = 2. Dette
skyldes lige præcis det reducerede ligningssystems inkonsistente ligning. Derfor er situatio-
nen r(A) < r(T) et signal om, at ligningssystemet indeholder inkonsistente ligninger.

Overvejelserne i eksempel 6.25 kan generaliseres til følgende sætning.


eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 24

Sætning 6.26 Når r(A) < r(T)


Hvis det for et lineært ligningssystems koefficientmatrix A og totalmatrix T gælder,
at
r (A) < r (T) , (6-51)
så indeholder det fuldstændigt reducerede ligningssystem en inkonsistent ligning.
Ligningssystemet har derfor ingen løsninger.

⇥ ⇤
Hvis trap(T) har en række af formen 0 0 · · · 0 1 , så har ligningssys-
temet ingen løsninger.

Opgave 6.27

Bestem trappeformen af totalmatricen for det følgende lineære ligningssystem, og bestem


ligningssystemets løsningsmængde:

x1 + x2 + 2x3 + x4 = 1
(6-52)
2x1 2x2 4x3 2x4 = 3 .

6.7.2 Når r(A) = r(T) = antal ubekendte

Lad os kalde antallet af ubekendte i et givet lineært ligningssystem for n. Så må der ud


fra den måde, hvorpå koefficientmatricer dannes, være n søjler i en koefficientmatrix A.

Vi antager endvidere, at der i et givent eksempel gælder r(A) = n. I så fald indeholder


trap(A) præcis n ledende 1-taller. De ledende 1-taller må derfor være placeret i diago-
nalen i trap(A), og der er lutter 0-er på de øvrige pladser.

Endelig antager vi, at der i det givne eksempel også gælder, at r(A) = r(T). Så kan løs-
ningsmængden umiddelbart aflæses af trap(T). Den første række i trap(T) vil nemlig
svare til en ligning hvor den første ubekendte har koefficienten 1, mens alle de andre
har koefficienten 0. Den første ubekendtes værdi er derfor lig med det sidste element
i første række (højresiden). Samme gælder med de øvrige rækker, så den i-te række
svarer til en ligning, hvor den i-te ubekendte er den eneste ubekendte, så dens værdi er
eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 25

lig med det sidste element i den i-te række. Da der i så fald til hver ubekendt svarer én
bestemt værdi, og da r(A) = r(T) sikrer, at det fuldstændigt reducerede ligningssys-
tem ingen inkonsistente ligninger indeholder, så har det givne ligningssystem netop én
løsning.

Eksempel 6.28 Netop én løsning

Totalmatricen for et lineært ligningssystem bestående af tre ligninger med to ubekendte er


bragt på trappeformen
2 3
1 0 3
trap(T) = 4 0 1 5 5. (6-53)
0 0 0
Vi betragter trappeformen af ligningssystemets koefficientmatrix
2 3
1 0
trap(A) = 4 0 1 5 , (6-54)
0 0

som har et ledende 1-tal i hver søjle og 0-er på alle andre pladser. Vi bemærker endvidere, at
r (A) = r (T) = 2 .

Ud fra trap(T) kan vi opskrive det fuldstændigt reducerede ligningssystem

1x1 + 0x2 = 3
0x1 + 1x2 = 5 (6-55)
0x1 + 0x2 = 0 ,

hvilket viser, at ligningssystemet har én løsning, nemlig x = ( x1 , x2 ) = ( 3, 5).

Generelt kan man vise følgende sætning:

Sætning 6.29 Når r(A) = r(T) = antal ubekendte


Hvis der for et lineært ligningssystems koefficientmatrix A og totalmatrix T gælder,
at
r(A) = r(T) = antal ubekendte, (6-56)
så har ligningssystemet netop én løsning, som umiddelbart kan aflæses af trap(T).
eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 26

6.7.3 Når r(A) = r(T) < antal ubekendte

Vi er nu rede til at genoptage diskussionen af vores hovedeksempel 6.20 om et lineært


ligningssystem med 5 ubekendte, hvor vi fandt frem til, at det fuldstændigt reducerede
ligningssystem består af 3 ikke-trivielle ligninger. Lad os nu finde løsningsmængden og
undersøge dens struktur.

Eksempel 6.30 Uendeligt mange løsninger

I eksempel 6.20 blev totalmatricen T for et lineært ligningssystem bestående af 4 ligninger


med 5 ubekendte reduceret til
2 3
1 0 2 0 11 24
60 1 0 0 4 77
trap(T) = 6
40
7. (6-57)
0 0 1 1 35
0 0 0 0 0 0

Det ses heraf, at r(A) = r(T) = 3, det vil sige mindre end 5, som er antallet af ubekendte.

Ud fra trap(T) opskriver vi det fuldstændigt reducerede ligningssystem

x1 + 2x3 11x5 = 24
x2 + 4x5 = 7 (6-58)
x4 + x5 = 3 .

Ligningssystemet har uendeligt mange løsninger. Til ethvert valg af talværdier for x3 og x5
kan man finde netop én ny værdi af de øvrige ubekendte x1 , x2 og x4 . Det kan vi tydeliggøre
ved at isolere x1 , x2 og x4 :
x1 = 24 2x3 + 11x5
x2 = 7 4x5 (6-59)
x4 = 3 x5 .
Hvis vi for eksempel vælger x3 = 1 og x5 = 2, kan vi se, at ligningssystemet har løsningen
x = ( x1 , x2 , x3 , x4 , x5 ) = ( 4, 1, 1, 1, 2). Vi kan derfor betragte x3 og x5 som frie parametre,
der fastlægger betydningen af de tre øvrige ubekendte, og omdøber derfor på højresiden x3
og x5 til parameternavnene t1 henholdsvis t2 . Herefter kan vi opskrive løsningsmængden
således:
x1 = 24 2t1 + 11t2
x2 = 7 4t2
x3 = t1 (6-60)
x4 = 3 t2
x5 = t2 ,
eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 27

eller mere overskueligt på standard-parameterform


2 3 2 3 2 3 2 3
x1 24 2 11
6x 7 6 77 6 07 6 47
6 27 6 7 6 7 6 7
6 7 6 7 6 7 6 7
x = 6 x3 7 = 6 0 7+ t16 1 7+ t26 0 7 hvor t1 , t2 2 L . (6-61)
6 7 6 7 6 7 6 7
4 x4 5 4 35 4 05 4 15
x5 0 0 1

Med et geometrisk inspireret sprogbrug vil vi kalde vektoren ( 24, 7, 0, 3, 0) for løs-
ningsmængdens begyndelsespunkt og de to vektorer ( 2, 0, 1, 0, 0) og (11, 4, 0, 1, 1) for
dens retningsvektorer. Hvis vi kalder begyndelsespunktet for x0 og retningsvektorerne for v1
henholdsvis v2 , kan vi opskrive parameterfremstillingen således:

x = x0 + t1 v1 + t2 v2 hvor t1 , t2 2 L . (6-62)

Da løsningsmængden har to frie parametre svarende til to retningsvektorer, siger man, at den
har en dobbelt-uendelighed af løsninger.

Linje 3 og 5 i (6-61) udtrykker blot at x3 = t1 og x5 = t2 .

Lad os, inspireret af eksempel 6.30, formulere en generel fremgangsmåde til at bringe
løsningsmængden på standard-parameterform ud fra det fuldstændigt reducerede lign-
ingssystem:
eNote 6 6.7 FRA TRAPPEFORM TIL LØSNINGSMÆNGDE 28

Metode 6.31 Fra totalmatrix til løsning på standard-parameterform


Vi betragter et lineært ligningssystem med n ubekendte, som har koefficientmatricen
A og totalmatricen T. Det forudsættes desuden, at

r (A) = r (T) = k < n . (6-63)

Ligningssystemets løsningsmængde bringes på standard-parameterform således:

1. Vi finder trap(T) og opskriver herudfra det fuldstændigt reducerede lig-


ningssystem (som gjort i (6-58)).

2. I hver af de k ikke-trivielle ligninger i det fuldstændigt reducerede ligningssy-


stem isolerer vi den førststående ubekendte på venstresiden (som gjort i (6-59)).

3. Vi har hermed isoleret i alt k forskellige ubekendte på venstresiden af det sam-


lede system. De øvrige n k ubekendte, som nu findes på højresiden, omdøbes
til parameternavnene t1 , t2 , . . . , tn k .

4. Nu kan vi opskrive løsningsmængden på standard-parameterform:

x = ( x1 , x2 , . . . , xn ) = x0 + t1 v1 + t2 v2 + · · · + tn k vn k , (6-64)

hvor vektoren x0 angiver parameterfremstillingens begyndelsespunkt, mens


v1 , v2 , . . . , vn k er dens retningsvektorer (som gjort i (6-61)).

Bemærk, at tallene t1 , t2 , . . . , tn k kan vælges frit. Uanset valg vil (6-64) vre en gyldig
lsning. De kaldes derfor for frie parametre.

Hvis man har fulgt GaussJordan-eliminationens algoritme til punkt og prikke,


når man frem til et bestemt begyndelsespunkt og et bestemt sæt af retningsvek-
torer for løsningsmængden, se (6-64). Men løsningsmængden kan opskrives
med et andet valg af begyndelsespunkt (hvis ligningssystemet er inhomogent)
og med et andet valg af retningsvektorer (fx er kortere og længere vektorer
stadig retningsvektorer, da retningen ikke ændres). Dog vil retningsvektor-
ernes antal altid være (n k).

Bemærk, at der findes eksempler på løsningsmængder, hvor der ganske vist er uen-
deligt mange løsninger, da der er frie parametre til stede, men hvor en eller flere af
de ubekendte alligevel har fastlåste værdier, dvs. at de ikke afhænger af denne frie pa-
rameter. I det følgende eksempel har den frie parameter kun betydning for én af de
eNote 6 6.8 OM ANTALLET AF LØSNINGER 29

ubekendte. De to andre er fastlåste.

Eksempel 6.32 Uendeligt mange løsninger med en fri parameter

For et givet lineært ligningssystem har man fundet, at



1 0 0 2
trap(T) = . (6-65)
0 0 1 5

Vi konstaterer, at r(A) = r(T) = 2 < n = 3. Der er derfor én fri parameter. Løsningsmæng-


den opskrives:
2 3 2 3 2 3
x1 2 0
4
x = x2 =5 4 0 + t 1 5,
5 4 (6-66)
x3 5 0
hvor t er en skalar, der kan vælges frit. Som det ses, afhænger x1 og x3 ikke af den frie
parameter men har faste værdier.

Generelt kan man vise følgende sætning:

Sætning 6.33 Når r(A) = r(T) < antal ubekendte


Hvis det for et lineært ligningssystem med n ubekendte og med koefficientmatrix A
og totalmatrix T gælder, at

r (A) = r (T) = k < n , (6-67)

så har ligningssystemet uendeligt mange løsninger, som kan opskrives på standard-


parameterform med begyndelsespunkt og n k retningsvektorer.

6.8 Om antallet af løsninger

Vi har tidligere understreget, at løsningsmængden for et ligningssystem er fællesmæng-


den af løsningsmængderne for hver af de ligninger, der indgår i systemet. Lad os be-
tragte et system bestående af tre lineære ligninger med to ubekendte:
a1 · x + b1 · y = c1
a2 · x + b2 · y = c2 (6-68)
a3 · x + b3 · y = c3 .
eNote 6 6.8 OM ANTALLET AF LØSNINGER 30

Ligningssystemet svarer til ligninger for tre rette linjer i et koordinatsystem i planen.
Løsningsmængden for ligningssystemet svarer så til mængden af de punkter, som er fælles
for alle de tre linjer. For at besvare spørgsmålet om "‘antallet"’ af løsninger, tegner vi de
væsensforskellige situationer, der findes, i figur 6.1. I situation 2 er to af linjerne par-

Figure 6.1: De seks mulige løsningsstrukturer for tre ligninger med to ubekendte

allelle, og i situation 3 er alle tre linjer parallelle. Der er derfor ingen fælles punkter
for alle de tre linjer i situationerne 1, 2 og 3. I situation 5 er to af linjerne (blå og rød)
sammenfaldende. Der er derfor netop ét fælles punkt i situationerne 4 og 5. I situation
6 er alle tre linjer sammenfaldende. Der er derfor i denne situation uendeligt mange
fællespunkter.

Dette eksempel med tre ligninger med to ubekendte illustrerer den følgende sætning,
som følger af vores studium af løsningsmængder i det foregående afsnit, se sætningerne
6.26, 6.29 og 6.33:

Sætning 6.34 Bemærkning om antal løsninger


Et lineært ligningssystem har enten ingen, én eller uendeligt mange løsninger. Andre
muligheder findes ikke.
eNote 6 6.9 LØSNINGSMÆNGDERS LINEÆRE STRUKTUR 31

6.9 Løsningsmængders lineære struktur

I dette afsnit vil vi gå lidt dybere ned i spørgsmålet om strukturen af løsningsmængder


for lineære ligningssystemer. Det er i særlig grad vigtigt at bemærke sammenhængen
mellem løsningsmængden for et inhomogent lineært ligningssystem og løsningsmæng-
den for det tilsvarende homogene lineære ligningssystem. Vi starter med at undersøge ho-
mogene lineære ligningssystemer.

6.9.1 Homogene lineære ligningssystemers egenskaber

Et homogent lineært ligningssystem af m lineære ligninger med n ubekendte skrives på


formen
a11 · x1 + a12 · x2 + . . . + a1n · xn = 0
a21 · x1 + a22 · x2 + . . . + a2n · xn = 0
.. (6-69)
.
am1 · x1 + am2 · x2 + . . . + amn · xn = 0 .

I den følgende sætning beskriver vi en vigtig egenskab ved strukturen af løsnings-


mængden for homogene lineære ligningssystemer.

Sætning 6.35 Løsninger til homogent lineært ligningssystem


Lad Lhom betegne løsningsmængden for et homogent lineært ligningssystem. Så
findes der mindst én løsning til systemet. Hvis Lhom 6= 0, og

x = ( x1 , x2 , . . . , x n ) og y = ( y1 , y2 , . . . , y n ) (6-70)

er to vilkårlige løsninger, og k er en vilkårlig skalar, så vil både summen

x + y = ( x1 + y1 , x2 + y2 , . . . , x n + y n ) (6-71)

og produktet
k · x = ( k · x1 , k · x2 , . . . , k · x n ) (6-72)
tilhøre Lhom .
eNote 6 6.9 LØSNINGSMÆNGDERS LINEÆRE STRUKTUR 32

Bevis

En oplagt egenskab ved systemet (6-69) er, at r(A) = r(T) (fordi højresiderne er lutter nuller).
Systemet har derfor mindst én løsning — det følger af sætning 6.29. Vi kan ogås straks finde
en løsning, nemlig nulvektoren 0 2 L n . At den er en løsning fremågr jo af, at når vi erstatter
alle de n ubekendte i systemet med tallet 0, s består systemet af m ligninger af formen 0 =
0. Vi forudsætter i det følgende, at Lhom 6= 0, altså at der også findes andre løsninger end
nulløsningen.

Sætningen indeholder derudover to dele, som bevises hver for sig:

1. Hvis
ai1 x1 + ai2 x2 + · · · + ain xn = 0 for ethvert i = 1, 2, . . . , m , (6-73)
og
ai1 y1 + ai2 y2 + · · · + ain yn = 0 for ethvert i = 1, 2, . . . , m , (6-74)
så fås ved addition af de to ligninger og efterfølgende faktorisering med hensyn til
koefficienterne

ai1 ( x1 + y1 ) + ai2 ( x2 + y2 ) + · · · + ain ( xn + yn ) = 0


(6-75)
for ethvert i = 1, 2, . . . , m ,

hvilket viser, at x + y er en løsning.

2. Hvis
ai1 x1 + ai2 x2 + · · · + ain xn = 0 for ethvert i = 1, 2, . . . , m , (6-76)
og k er en vilkårlig skalar, så fås ved multiplikation på begge sider med k og efterføl-
gende faktorisering med hensyn til koefficienterne

ai1 (k · x1 ) + ai2 (k · x2 ) + · · · + ain (k · xn ) = 0 for ethvert i = 1, 2, . . . , m , (6-77)

hvilket viser, at k · x er en løsning.


eNote 6 6.9 LØSNINGSMÆNGDERS LINEÆRE STRUKTUR 33

Bemærkning 6.36
Hvis man tager et vilkårligt antal løsninger fra Lhom , ganger dem med vilkårlige kon-
stanter og lægger disse produkter sammen, så vil denne såkaldte linearkombination
af løsninger også selv være en løsning. Dette er en konsekvens af sætning 6.35.

6.9.2 Struktursætningen

Vi skal nu betragte en afgørende relation mellem et inhomogent lineært ligningssystem


af formen
a11 · x1 + a12 · x2 + . . . + a1n · xn = b1
a21 · x1 + a22 · x2 + . . . + a2n · xn = b2
.. (6-78)
.
am1 · x1 + am2 · x2 + . . . + amn · xn = bm

og det tilhørende homogene lineære ligningssystem, hvilket er det samme ligningssystem


som (6-78) blot med alle højresider bi udskiftet med 0. Løsningsmængden for det in-
homogene ligningssystem kaldes Linhom og løsningsmængden for det tilhørende homo-
gene ligningssystem Lhom .

Sætning 6.37 Struktursætningen


Hvis der er fundet bare en enkelt løsning (en såkaldt partikulær løsning x0 ) til et
inhomogent lineært ligningssystem, så kan Linhom findes som summen af x0 og Lhom .

Der gælder med andre ord

Linhom = x = x0 + y y 2 Lhom , (6-79)

eller kort skrevet


Linhom = x0 + Lhom . (6-80)
eNote 6 6.9 LØSNINGSMÆNGDERS LINEÆRE STRUKTUR 34

Bevis

Sætningen rummer to påstande. Den ene er, at summen af x0 og en vilkårlig vektor fra Lhom
tilhører Linhom . Den anden er, at en vilkårlig vektor fra Linhom kan skrives som summen af x0
og en vektor fra Lhom . Vi beviser de to påstande hver for sig:

1. Antag y 2 Lhom . Vi ønsker at vise, at

x = x0 + y = ( x01 + y1 , x02 + y2 , . . . , x0n + yn ) 2 Linhom . (6-81)

Da
ai1 x01 + ai2 x02 + · · · + ain x0n = bi for ethvert i = 1, 2, . . . , m , (6-82)
og
ai1 y1 + ai2 y2 + · · · + ain yn = 0 for ethvert i = 1, 2, . . . , m , (6-83)
så fås ved addition af de to ligninger og efterfølgende faktorisering med hensyn til
koefficienterne

ai1 ( x01 + y1 ) + · · · + ain ( x0n + yn ) = bi for ethvert i = 1, 2, . . . , m , (6-84)

hvilket viser det ønskede.

2. Antag, at x 2 Linhom . Vi ønsker at vise, at der findes en vektor y 2 Lhom , der opfylder,
at
x = x0 + y . (6-85)
Da både x og x0 tilhører Linhom , gælder, at

ai1 x1 + ai2 x2 + · · · + ain xn = bi for ethvert i = 1, 2, . . . , m , (6-86)

og
ai1 x01 + ai2 x02 + · · · + ain x0n = bi for ethvert i = 1, 2, . . . , m . (6-87)
Når vi trækker den nederste ligning fra den øverste, får vi efter faktorisering

ai1 ( x1 x01 ) + · · · + ain ( xn x 0n ) = 0 for ethvert i = 1, 2, . . . , m , (6-88)

hvilket viser, at den vektor y, som defineres ved y = x x0 , tilhører Lhom og opfylder
det ønskede: x = x0 + y.


eNote 7 1

eNote 7

Matricer og Matrixalgebra

Denne eNote introducerer matricer og regneoperationer for matricer og udvikler hertil hørende
regneregler. Noten kan læses uden andet grundlag end gymnasiet, men det kan være en idé at
være bekendt med talrummet R n , som beskrives i eNote 5.
Opdateret 24.10.21 af Karsten Schmidt

7.1 Matricer

En matrix er en form for talskema. Her er et eksempel på en matrix kaldet M:



1 4 3
M= . (7-1)
1 2 7

En matrix karakteriseres ved antallet af rækker og søjler, og matricen M kaldes derfor


en (2 ⇥ 3)-matrix. Matricen M siges at indeholde 2 · 3 = 6 elementer. Udover rækker,
søjler og elementer har matricer en række andre begreber tilknyttet. For at beskrive
dem, opstilles en generel matrix, her kaldet A:
2 3
a11 a12 . . . a1n
6a 7
6 21 a22 . . . a2n 7
A =6 . .. .. 7 . (7-2)
4 .. . . 5
am1 am2 . . . amn

Matricen A har således m rækker og n søjler, og man kan ligeledes skrive Am⇥n eller
(m ⇥ n)-matricen A. Matricen A siges også at være af typen m ⇥ n.
eNote 7 7.2 MATRIXSUM OG PRODUKT AF MATRIX MED SKALAR 2

To (m ⇥ n)-matricer A og B kaldes ens, hvis de elementvis er ens, og man skriver da


A = B.

En matrix, som kun har én søjle (n = 1), kaldes en søjlematrix. Tilsvarende kaldes en
matrix med kun én række (m = 1) en rækkematrix.

En matrix med lige mange rækker og søjler (m = n) kaldes en kvadratisk matrix. Kvadratiske
matricer underkastes særlig undersøgelse i eNote 8.

Er alle elementerne i en (m ⇥ n)-matrix reelle tal, kaldes matricen en reel matrix. Mæng-
den af disse matricer betegnes R m⇥n .

Er alle elementer i en matrix lig med 0, kaldes den nulmatricen uanset type og betegnes
0 eller evt. 0m⇥n . Enhver anden matrix kaldes en egentlig matrix.

7.2 Matrixsum og produkt af matrix med skalar

Det er muligt at lægge to matricer sammen, hvis de er af samme type. Man lægger da
elementerne sammen pladsvis og danner derved en ny matrix af samme type. Ligeså
kan man gange en matrix med en skalar (et tal). Det sker ved at gange alle elementerne
med skalaren.
eNote 7 7.2 MATRIXSUM OG PRODUKT AF MATRIX MED SKALAR 3

Definition 7.1 Matrixsum og produkt med skalar


Givet en skalar k 2 R og to reelle matricer Am⇥n og Bm⇥n :
2 3 2 3
a11 a12 . . . a1n b11 b12 . . . b1n
6a 7 6 . . . b2n 7
6 21 a22 . . . a2n 7 6 b21 b22 7
A =6 . . . . 7 og B = 6 . .. ... .. 7 . (7-3)
4 .. .. .. .. 5 4 .. . . 5
am1 am2 . . . amn bm1 bm2 . . . bmn

Summen af matricerne defineres således:


2 3
a11 + b11 a12 + b12 ... a1n + b1n
6 a +b a22 + b22 ... a2n + b2n 7
6 21 21 7
A + B =6 .. .. .. .. 7. (7-4)
4 . . . . 5
am1 + bm1 am2 + bm2 . . . amn + bmn

Summen er kun defineret, når matricerne er af samme type.

Produktet af matricen A med skalaren k skrives kA eller Ak og defineres således:


2 3
k · a11 k · a12 . . . k · a1n
6 k·a 7
6 21 k · a22 . . . k · a2n 7
kA = Ak = 6 . .. ... .. 7 . (7-5)
4 .. . . 5
k · am1 k · am2 . . . k · amn

Den modsatte vektor A til en matrix A defineres som den matrix, der fremkommer ved,
at alle elementerne i A ganges med 1 . Det ses, at A = ( 1)A .
eNote 7 7.2 MATRIXSUM OG PRODUKT AF MATRIX MED SKALAR 4

Eksempel 7.2 Simple matrixoperationer

Der er givet to matricer A og B ved


 
4 1 4 3
A= og B= . (7-6)
8 0 9 12

Matricerne er begge af typen 2 ⇥ 2. Bestem matricerne C = 4A og D = 2A + B.

Dette kan gøres ved hjælp af definition 7.1:


  
4 1 4 · 4 4 · ( 1) 16 4
C = 4A = 4 · = =
8 0 4·8 4·0 32 0
   (7-7)
8 2 4 3 4 1
D = 2A + B = + 1 = .
16 0 9 2 25 12

I følgende sætning opsummeres de regneregler, der gælder for sum af matricer og pro-
dukt med skalar.

Sætning 7.3 Regneregler for matrixsum og produkt med skalar


For vilkårlige matricer A, B og C i R m⇥n og ligeledes vilkårlige reelle tal k1 og k2
gælder følgende regneregler:
1. A+B = B+A Addition er kommutativ
2. (A + B) + C = A + (B + C) Addition er associativ
3. A+0 = A 0 er en neutral matrix for addition i R m⇥n
4. A + ( A) = 0 Alle matricer i R m⇥n har en modsat matrix
5. k 1 ( k 2 A) = ( k 1 k 2 )A Multiplikation af matrix med skalar er associativ
6. ( k 1 + k 2 )A = k 1 A + k 2 A
De distributive regler gælder
7. k 1 (A + B) = k 1 A + k 1 B
8. 1A = A Skalaren 1 er neutral i produkt med matrix

Regnereglerne i sætning 7.3 kan vises ved hjælp af sædvanlige regneregler for reelle tal.
Fremgangsmåden eksempliceres for to af regnereglernes vedkommende i det følgende
eksempel.
eNote 7 7.2 MATRIXSUM OG PRODUKT AF MATRIX MED SKALAR 5

Eksempel 7.4 Eftervisning af regneregel 6 og 7 i tilfældet R2⇥2

Givet er de to matricer
 
a a b11 b12
A = 11 12 og B= (7-8)
a21 a22 b21 b22

samt konstanterne k1 og k2 . Vi prøver nu som eksempel at eftervise de distributive regler,


som står i sætning 7.3. Først haves
 
a11 a12 (k1 + k2 ) a11 (k1 + k2 ) a12
( k 1 + k 2 )A = ( k 1 + k 2 ) =
a21 a22 (k1 + k2 ) a21 (k1 + k2 ) a22
   (7-9)
k1 a11 k1 a12 k2 a11 k2 a12 k a + k2 a11 k1 a12 + k2 a12
k1 A + k2 A = + = 1 11 .
k1 a21 k1 a22 k2 a21 k2 a22 k1 a21 + k2 a21 k1 a22 + k2 a22

Sættes a11 , a12 , a21 og a22 uden for parentes i hvert af elementerne i det sidste udtryk, ses det,
at (k1 + k2 )A = k1 A + k2 A. For at sætte a-elementerne uden for parentes for hvert element
blev netop den distributive regel for de reelle tal brugt.

Den anden distributive regel efterprøves på de givne matricer og konstanter:


 
a11 + b11 a12 + b12 k ( a + b11 ) k1 ( a12 + b12 )
k 1 (A + B) = k 1 = 1 11
a21 + b21 a22 + b22 k1 ( a21 + b21 ) k1 ( a22 + b22 )
   (7-10)
k a k a k b k b k a + k1 b11 k1 a12 + k1 b12
k1 A + k1 B = 1 11 1 12 + 1 11 1 12 = 1 11 .
k1 a21 k1 a22 k1 b21 k1 b22 k1 a21 + k1 b21 k1 a22 + k1 b22

Sættes k1 uden for parentes i hvert af elementerne i matricen i det sidste udtryk, ses det,
at den anden distributive regel også gælder i dette tilfælde: k1 (A + B) = k1 A + k1 B. Den
distributive regel for de reelle tal bruges altså endnu en gang elementvist.

Det bemærkes, at nulmatricen i R m⇥n er den eneste matrix i R m⇥n , som er neu-
tral for addition, og at A er den eneste løsning til ligningen A + X = 0.
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 6

Definition 7.5 Differens mellem matricer


Differensen A B mellem to matricer A og B af samme type indføres ved

A B = A + ( 1)B . (7-11)

B trækkes med andre ord fra A ved at hvert element i B trækkes fra det tilsvarende
element i A.

Eksempel 7.6 Simpel matrixoperation med differens

Med de i eksempel 7.2 givne matricer fås


  
8 2 4 3 12 5
D = 2A B = 2A + ( 1)B = + 1 = 1 . (7-12)
16 0 9 2 7 2

7.3 Matrix-vektorproduktet og matrix-matrixproduktet

I dette afsnit beskrives produktet af en matrix med en vektor og dernæst produktet af


en matrix med en anden matrix.

En vektor v = (v1 , v2 , . . . , vn ) kan opskrives på samme måde som en søjlematrix og


kaldes i så fald en søjlevektor:
2 3
v1
6 v2 7
6 7
v = ( v1 , v2 , . . . , v n ) = 6 . 7 . (7-13)
4 .. 5
vn

Man kan på den måde opdele en matrix Am⇥n i dens søjlevektorer. Det skrives på
følgende vis:
⇥ ⇤
A = a1 a2 · · · a n
22 3 2 3 2 33 2 3
a11 a12 a1n a11 a12 . . . a1n
66 a 7 6 a22 7 6 a2n 77 6 a 7
66 21 7 6 7 6 77 6 21 a22 . . . a2n 7 (7-14)
= 66 .. 7 6 .. 7 · · · 6 .. 77 = 6 .. .. . . 7 .
44 . 5 4 . 5 4 . 55 4 . . .. .. 5
am1 am2 amn am1 am2 . . . amn
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 7

Der er altså n søjlevektorer med hver m elementer.

Læg mærke til, at de firkantede parenteser rundt om søjlevektorerne kan


fjernes uden videre! Det kan man i alle de sammenhænge med matricer, hvor
dobbelt firkantede parenteser forekommer. Det vil altid være de inderste par-
enteser, som fjernes. Der er på den måde ingen forskel på de to udtryk — man
vil dog altid foretrække det sidste udtryk, fordi det er mest overskueligt.

Vi definerer nu et produkt af en matrix og en vektor, hvor matricen har ligeså mange


søjler, som vektoren har elementer:

Definition 7.7 Matrix-vektorprodukt


Lad A være en vilkårlig matrix i R m⇥n , og lad v være en vilkårlig vektor i R n .

Matrix-vektorproduktet af A med v er defineret således:


2 3
v1
⇥ ⇤6 v2 7
6
7 ⇥ ⇤
Av = a1 a2 . . . an 6 . 7 = v1 a1 + v2 a2 + . . . + vn an . (7-15)
4 .. 5
vn

Resultatet er en søjlevektor med m elementer. Resultatet er summen af produkterne


af matricens k’te søjle og søjlevektorens k’te element for alle k = 1, 2, . . . , n.

Der skal være lige mange søjler i matricen, som der er rækker i søjlevektoren, her n.

Læg mærke til rækkefølgen i matrix-vektorproduktet: først matrix, derefter


vektor! Det er ikke et vektor-matrixprodukt så at sige. Antallet af søjler og
rækker vil ikke passe sammen i den anden konfiguration medmindre matricen
er af typen 1 ⇥ 1.

⇥ ⇤
Bemærk i definition 7.7, at Av = v1 a1 + v2 a2 + . . . + vn an ligeså godt kunne
skrives uden firkantede parenteser, Av = v1 a1 + v2 a2 + . . . + vn an .
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 8

Eksempel 7.8 Matrix-vektorprodukt

Der er givet følgende matrix og vektor (søjlevektor):


2 3
 3
a b c
A = A2⇥3 = og v = 4 4 5. (7-16)
d e f
1

Vi danner nu matrix-vektorproduktet af A med v ved hjælp af definition 7.7:


2 3
 3     
a b c 4 a b c 3a + 4b c
Av = 4 5= 3 +4 + ( 1) = . (7-17)
d e f d e f 3d + 4e f
1

Er A givet ved

1 2 6
A= , (7-18)
2 1 4
har man da produktet
 
3 · ( 1) + 4 · 2 6 1
Av = = . (7-19)
3·2+4·1 4 6
Det ses, at resultatet (i begge tilfælde) er en søjlevektor med lige så mange rækker, som ma-
tricen A har rækker.

Opgave 7.9 Matrix-vektorprodukt

Dan matrix-vektorproduktet A med x i ligningen Ax = b, når det er givet, at


2 3 2 3 2
3
a11 a12 a13 x1 b1
A = 4 a21 a22 a23 5 , x = 4 x2 5 og b = 4 b2 5 . (7-20)
a31 a32 a33 x3 b3

Er det noget du er stødt på før? Hvor kommer det fra?

Som det er nævnt kan en matrix betragtes som søjlevektorer stillet op efter hinanden.
Dette udnyttes i den følgende definition af et matrix-matrixprodukt som en række af
matrix-vektorprodukter.
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 9

Definition 7.10 Matrix-matrixprodukt


Lad A være en vilkårlig matrix i R m⇥n , og lad B være en vilkårlig matrix i R n⇥ p .

Matrix-matrixproduktet eller bare matrixproduktet af A med B er defineret på denne


måde: ⇥ ⇤ ⇥ ⇤
AB = A b1 b2 . . . b p = Ab1 Ab2 . . . Ab p . (7-21)
Resultatet er en matrix af typen m ⇥ p. Den k’te søjle i resultatmatricen er et matrix-
vektorprodukt af den førststående matrix (her A) med den k’te søjlevektor i den
sidststående matrix (her B), jf. definition 7.7.

Der skal være lige mange søjler i den førststående matrix, som der er rækker i den
sidststående matrix.

Eksempel 7.11 Matrix-matrixprodukt

Der er givet to matricer A2⇥2 og B2⇥3 ved


 
4 5 8 3 3
A= og B = . (7-22)
1 2 2 9 9

Bestem matrix-matrixproduktet af A med B.

Dette gøres ved hjælp af definition 7.10:


     
4 5 8 4 5 3 4 5 3
AB =
1 2 2 1 2 9 1 2 9
  (7-23)
4 · ( 8) + 5 · 2 4 · 3 + 5 · 9 4 · 3 + 5 · ( 9) 22 57 33
= = .
8+2·2 3+2·9 3 + 2 · ( 9) 4 21 15

Det er ikke muligt at danne matrix-matrixproduktet BA, fordi der ikke er lige så
mange søjler i B, som der er rækker i A (3 6= 2).
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 10

Eksempel 7.12 Matrix-matrixprodukt to veje

Givet er de to matricer A2⇥2 og B2⇥2 ved


 
3 2 4 4
A= og B= . (7-24)
5 1 1 0

Idet de to matricer er kvadratiske matricer af samme type kan begge matrix-


matrixprodukterne AB og BA beregnes. Bestem dem.

Til det bruges definition 7.10:


   
3 2 4 3 2 4
AB =
5 1 1 5 1 0
 
3 · 4 + 2 · ( 1) 3·4+2·0 10 12
= =
5 · 4 + 1 · ( 1) 5·4+1·0 21 20
    (7-25)
4 4 3 4 4 2
BA =
1 0 5 1 0 1
 
4 · 3 + 4 · ( 5) 4 · 2 + 4 8 12
= = .
1·3 1·2 3 2

Der gælder altså at AB 6= BA. Faktorernes orden er ikke ligegyldig!

Her opsummeres de regneregler, der gælder for matrix-matrixprodukter og matrixsum-


mer. Fordi matrix-vektorproduktet er et særtilfælde af matrix-matrixproduktet, er re-
glerne også gældende for dem.

Sætning 7.13 Regneregler for matrixsum og -produkt


For vilkårlige matricer A, B og C og ligeledes et vilkårligt reelt tal k gælder følgende
regneregler, såfremt de respektive matrix-matrixprodukter kan dannes:
(kA)B = A(kB) = k(AB) Produkt med skalar er associativ
A(B + C) = AB + AC
De distributive regler gælder
(A + B)C = AC + BC
A(BC) = (AB)C Matrix-matrixprodukter er associative

På samme måde som med regnereglerne i sætning 7.3 efterprøves som eksempel den
eNote 7 7.3 MATRIX-VEKTORPRODUKTET OG MATRIX-MATRIXPRODUKTET 11

sidste regneregel i sætning 7.13:

Eksempel 7.14 Er matrixprodukter associative?

Den sidste regneregel i sætning 7.13 efterprøves på matricerne


2 3
  4 5
1 2 3 2 1 4
A= , B= og C = 2 1 5. (7-26)
3 4 0 0 7
1 3

Først udregnes AB og BC:


      
1 2 3 1 2 2 1 2 1 3 2 13
AB = =
3 4 0 3 4 0 3 4 7 9 6 25
2 2 3 2 33
 4  5  (7-27)
3 2 1 4 5 3 2 1 4 17 16
BC = 4 2 1 5 5 = .
0 0 7 0 0 7 7 21
1 3

Dernæst bestemmes A(BC) og (AB)C:


   
1 2 171 2 16 3 26
A(BC) = =
3 4 73 4 21 23 36
2 2 3 2 33
 4  5  (7-28)
3 2 13 4 5 3 2 13 4 3 26
(AB)C = 4 2 1 55 = .
9 6 25 9 6 25 23 36
1 3

Vi kan se, at A(BC) = (AB)C, og at det derfor er ligemeget, hvilket af matrixprodukterne


AB og BC man udregner først. Dette gælder for alle matricer.

På samme måde, som det er vist i sætning 7.14, kan man eftervise resten af regnere-
glerne. Ved at bruge mere "‘generelle"’ matricer kan man også bevise dem på rigtig
vis.

Opgave 7.15 Eftervisning af regneregel

Eftervis første regneregel i sætning 7.13 med de to generelle reelle matricer A2⇥2 og B2⇥2 og
konstanten k.
eNote 7 7.4 TRANSPONERING AF MATRIX 12

7.4 Transponering af matrix

Ved at bytte om på rækker og søjler i en matrix, fremkommer matricens transponerede


matrix. Fx:
2 3
 a d
a b c
A= har den transponerede A> = 4 b e 5 . (7-29)
d e f
c f
A> læses "‘A transponeret"’. Man har da også, at (A> )> = A. Her er en nyttig regneregel
for transponeret matrix-matrixprodukt.

Sætning 7.16 Transponering af matrix


Lad der være givet to vilkårlige matricer Am⇥n og Bn⇥ p . Man danner de
transponerede matricer A> henholdsvis B> , ved at bytte om på søjler og rækker i
de respektive matricer.

At transponere matrix-matrixproduktet AB er det samme som at lave matrix-


matrixproduktet af B> med A> (altså i modsat rækkefølge):

(AB)> = B> A> . (7-30)

I følgende eksempel afprøves sætning 7.16.

Eksempel 7.17 Eftervisning af transponeringsregel

Givet er de to matricer
2 3
 9 1
0 1 6
A= og B =4 1 0 5. (7-31)
7 3 2
6 3

Man har da, at


2 2 3
2 33
 9 
1
0 1 6 4 1 6 4 55 0
AB = 4 150
7 3 2 3 2 7
6 3 (7-32)
 
1·1 6·6 6·3 35 18
= = .
7·9 3·1 2·6 7·1+2·3 48 13
eNote 7 7.4 TRANSPONERING AF MATRIX 13

Vi prøver nu at lave matrix-matrixproduktet B> A> , og vi har, at


2 3
0 7 
9 1 6
A> = 4 1 3 5 og >
B = , (7-33)
1 0 3
6 2

så 2 2 333 2
 0 
7
9 1 6 4 5 9 1 6 4
B> A> = 4 3 55
1
1 0 3 1 0 3
6
2 (7-34)
 
1·1 6·6 9·7 1·3 6·2 35 48
= = .
3·6 1·7+3·2 18 13
De to resultater ser ens ud
 > 
35 18 35 48
= , (AB)> = B> A> , (7-35)
48 13 18 13

hvilket stemmer med sætning 7.16.

Opgave 7.18 Matrixprodukt og transponering

Givet er matricerne
 
1 1 2 0 1 1
A= og B= . (7-36)
1 2 1 1 2 1

Udregn følgende, hvis det er muligt:

a) 2A 3B b) 2A> 3B> c) 2A 3B> d) AB


e) AB> f) BA> g) B> A h) A> B
eNote 8 1

eNote 8

Kvadratiske matricer

I denne eNote undersøges grundlæggende egenskaber ved mængden af kvadratiske matricer


herunder indførelse af en invers matrix for visse kvadratiske matricer. Det forudsættes, at man
kender til de basale matrixoperationer, se for eksempel eNote 7.
Opdateret 24.10.21 af Karsten Schmidt

8.1 Kvadratiske matricer

Kvadratiske matricer er ganske enkelt matricer, som har lige mange rækker og søjler, så
de er af typen n ⇥ n. Noten her vil introducere nogle af de grundlæggende operationer,
der findes med kvadratiske matricer.

En kvadratisk n ⇥ n matrix A ser således ud:


2 3
a11 a12 . . . a1n
6a 7
6 21 a22 . . . a2n 7
A =6 . .. .. 7 . (8-1)
4 .. . . 5
an1 an2 . . . ann

Elementer a11 , a22 , . . . , ann siges at stå i hoveddiagonalen eller bare diagonalen i A.

En kvadratisk matrix D, som kun har elementer forskellige fra nul i hoveddiagonalen,
kaldes en diagonalmatrix, og man kan betegne den D = diag( a11 , a22 , . . . , ann ).

En symmetrisk matrix A er en kvadratrisk matrix, som er lig sin egen transponerede, altså
A = A> .
eNote 8 8.1 KVADRATISKE MATRICER 2

Den kvadratiske matrix, som har 1-taller i hoveddiagonalen og nuller ellers, kaldes for
enhedsmatricen uanset antallet af rækker og søjler. Enhedsmatricen betegnes med E. Man
har altså, at 2 3
1 0 ··· 0
60 1 ··· 07
6 7
E = En ⇥ n = 6 . . .
. . . .. 7 . (8-2)
4 . . . .5
0 0 ... 1

I udenlandsk litteratur betegnes enhedsmatricen ofte med I (identity matrix).

Sætning 8.1 Enhedsmatricen


Enhedsmatricen E i R n⇥n er den eneste matrix i R n⇥n , som opfylder

AE = EA = A (8-3)

for en vilkårlig matrix A 2 R n⇥n .

Bevis

Man kan forestille sig en anden matrix D, hvor samme sammenhænge var gældende, altså at
AD = DA = A for en vilkårlig matrix A. Denne vilkårlige matrix kunne være enhedsmatri-
cen, og sammenfatter man så de to ligninger får man: D = ED = DE = E.

Da E = D, findes der altså ikke andre matricer end enhedsmatricen E, der er et neutralt
element for matrixproduktet.

Enhedsmatricen kan betragtes som "‘matricernes 1-tal"’: Ligesom man ikke


ændrer en skalar ved at gange den med 1, ændrer man ikke en matrix ved at
lave matrixproduktet af matricen med enhedsmatricen af samme type.

Som det vil fremgå af det følgende, er det ofte ved brug af kvadratiske matricer afgørende,
om de har fuld rang eller ej. Derfor indfører vi nu særlige begreber til at udtrykke dette.
eNote 8 8.2 INVERS MATRIX 3

Definition 8.2 Regulær og singulær matrix


En kvadratisk matrix kaldes regulær, hvis den har fuld rang, det vil sige, at
r(An⇥n ) = n.

En kvadratisk matrix kaldes singulær, hvis den ikke har fuld rang, det vil sige, at
r(An⇥n ) < n.

8.2 Invers matrix

Den reciprokke til en skalar a 6= 0 opfylder følgende ligning: a · x = 1, hvor x er den


reciprokke. Man kan omskrive det til, at x = a 1 . Denne idé vil vi nu generalisere til
kvadratiske matricer. Læg her mærke til, at man ikke kan bestemme den reciprokke
til en skalar a, hvis a = 0. En lignende undtagelse dukker op, når vi generaliserer til
kvadratiske matricer.

Til at bestemme den "‘reciprokke matrix"’ til en matrix A, kaldet A’s inverse matrix,
opstilles en matrixligning svarende til a · x = 1:
AX = XA = E . (8-4)
Den ubekendte X er en matrix. Hvis der findes en løsning X , betegnes den A 1 og
kaldes den inverse matrix til A. Vi ønsker altså at finde en bestemt matrix kaldet A 1 ,
som netop opfylder, at matrixproduktet af A med den giver enhedsmatricen.

Det er dog ikke alle kvadratiske matricer, som har en invers matrix. Det postuleres i
følgende sætning.

Sætning 8.3 Invers matrix


En kvadratisk matrix An⇥n har en invers matrix A 1, der opfylder AA 1 =A 1A =
E, hvis og kun hvis A er regulær.

Den inverse matrix bestemmes entydigt ved løsning af matrixligningen AX = E,


hvor X er den ubekendte.

I den følgende metode forklares, hvordan man løser den før beskrevne matrixligning
(8-4), og derved finder den inverse, såfremt matricen er regulær.
eNote 8 8.2 INVERS MATRIX 4

Metode 8.4 At bestemme den inverse matrix


Man bestemmer den inverse matrix A 1 til den regulære kvadratiske matrix A ved
hjælp af matrixligningen
AX = E . (8-5)
Ligningen løses med hensyn til den ubekendte X på følgende måde:
⇥ ⇤
1. Totalmatricen T = A E opstilles.

2. Ved sædvanlig GaussJordan-elimination bestemmes trappeformen trap(T) af


T.

3. Ved eliminationen dannes til slut enhedsmatricen på venstre side af den lo-
drette streg,
⇥ mens
⇤ løsningen
⇥ ⇤(den inverse til A) kan aflæses på højre side:
trap(T) = E X = E A 1 .

Eksempel 8.5 Invers matrix

Bestem den inverse matrix A 1 til matricen A, som er givet ved


2 3
16 9 10
A =4 9 5 6 5. (8-6)
2 1 1

Dette kan gøres ved hjælp af metode 8.4. Først opstilles totalmatricen
2 3
⇥ ⇤ 16 9 10 1 0 0
T = A E =4 9 5 6 0 1 0 5. (8-7)
2 1 1 0 0 1
Nu danner vi det ledende 1-tal i første række. Først rækkeoperationen R1 + R2 og derefter
R1 + 4 · R3 . Det giver
2 3 2 3
7 4 4 1 1 0 1 0 0 1 1 4
4 9 5 6 0 1 05 ! 49 5 6 0 1 0 5. (8-8)
2 1 1 0 0 1 2 1 1 0 0 1
Så fjernes tallene i første søjle af anden og tredje række ved R2 9 · R1 og R3 2 · R1 . End-
videre ombyttes anden og tredje række, R2 $ R3 . Vi får da
2 3 2 3
1 0 0 1 1 4 1 0 0 1 1 4
40 5 6 9 8 36 5 ! 4 0 1 1 2 2 7 5. (8-9)
0 1 1 2 2 7 0 5 6 9 8 36
eNote 8 8.2 INVERS MATRIX 5

Nu ændrer vi fortegnet på række to, ( 1) · R2 , og fjerner dernæst tallet i anden søjle af tredje
række, R3 + 5 · R2 ,
2 3 2 3
1 0 0 1 1 4 1 0 0 1 1 4
40 1 1 2 2 75 ! 40 1 1 2 2 7 5. (8-10)
0 5 6 9 8 36 0 0 1 1 2 1

Sidste skridt er da at færdiggøre tredje søjle ved R2 + R3 ,


2 3
1 0 0 1 1 4
trap(T) = 4 0 1 0 3 4 6 5. (8-11)
0 0 1 1 2 1

Det ses, at r(A) = r(T) = 3, altså har A fuld rang, og derfor kan man aflæse den inverse til
A på højresiden af den lodrette streg,
2 3
1 1 4
1 4
A = 3 4 6 5. (8-12)
1 2 1

Læg mærke til, at venstresiden af trap(T) er enhedsmatricen. Den er altså i løbet af


reduktionen "‘flyttet"’ fra højre til venstre side af lighedstegnene (den lodrette streg).

Til sidst kontrollerer vi, om A 1 som forventet opfylder AA 1 = E og A 1 A = E:


2 32 3
16 9 10 1 1 4
1
AA =4 9 5 6 54 3 4 65
2 1 1 1 2 1
22 32 3 2 32 3 2 32 33
16 9 10 1 16 9 10 1 16 9 10 4
= 44 9 5 6 54 3 5 4 9 5 6 54 4 5 4 9 5 6 54 6 55 (8-13)
2 1 1 1 2 1 1 2 2 1 1 1
2 3 2 3
16 + 27 10 16 + 36 20 64 + 54 + 10 1 0 0
=4 9 15 + 6 9 20 + 12 36 30 6 5 = 4 0 1 0 5 = E .
2 3+1 2 4+2 8 6 1 0 0 1

Det passer! Ved brug af samme fremgangsmåde ses, at også A 1A = E passer.

Som man kan se i næste eksempel, kan man bruge den inverse til at løse matrixligninger
med kvadratiske matricer. I matrixligninger kan man nemlig også bytte rundt på led og
gange med skalarer for at isolere den ubekendte ligesom i almindelige lineære ligninger
med skalarer. Ydermere kan man gange igennem med matricer – dette kan enten gøres
eNote 8 8.2 INVERS MATRIX 6

fra højre eller venstre på alle leddene i ligningen, hvilket giver forskellige resultater.

Eksempel 8.6 Matrixligning

Løs matrixligningen
AX = B CX , (8-14)
hvor
2 3 2 3 2 3
4 2 1 0 1 0 12 7 9
A =4 9 5 55 , B =4 8 12 5 5 og C =4 0 10 11 5 . (8-15)
2 0 7 5 0 0 0 1 6

Først reduceres ligningen så meget som muligt, se eventuelt sætning 7.13:

AX = B CX , AX + CX = B CX + CX , (A + C)X = B . (8-16)

Da X er den ubekendte, vil vi prøve at isolere den helt. Er (A + C) en regulær matrix, kan
man gange med den inverse til (A + C) fra venstre på begge sider af lighedstegnet. Altså
1
(A + C) (A + C)X = (A + C) 1 B , EX = X = (A + C) 1 B , (8-17)

fordi (A + C) 1 (A + C) = E ifølge definitionen på inverse matricer. Vi laver nu matrixsum-


men A + C og ser, om matricen er regulær:
2 3 2 3 2 3
4 2 1 12 7 9 16 9 10
A + C =4 9 5 5 5+4 0 10 11 5 = 4 9 5 6 5. (8-18)
2 0 7 0 1 6 2 1 1

Den inverse til denne matrix er allerede bestemt i eksempel 8.5, og den del af proceduren
springes derfor over. X kan da bestemmes:
2 3 12 3
16 9 10 0 1 0
1
X = (A + C) B =4 9 5 65 48 12 5 5
2 1 1 5 0 0
2 32 3 2 3 (8-19)
1 1 4 0 1 0 28 11 5
4
= 3 4 6 54 8 12 5 5 = 4 62 45 20 5 .
1 2 1 5 0 0 11 23 10

For videre undersøgelse af invertibilitet af den transponerede eller inverse af en regulær


matrix samt invertibilitet af produktet af to eller flere regulære matricer får vi brug for
eNote 8 8.2 INVERS MATRIX 7

følgende hjælpesætning, der anføres uden bevis.

Hjælpesætning 8.7 Arvet regularitet

1. Hvis og kun hvis A er en regulær kvadratisk matrix, er såvel A> som A 1 også
regulære.

2. Produktet AB af to kvadratiske matricer er regulært, hvis og kun hvis både A


og B er regulære.

Vi kan herefter opstille regneregler for inverse matricer.

Sætning 8.8 Regneregler ved invers matrix


For de regulære kvadratiske matricer A, B og C gælder der følgende regneregler:

1. Den inverse til den inverse af en matrix er lig matricen selv,


1 1
(A ) = A. (8-20)

2. Den transponerede til en invers matrix er den samme som den inverse
transponerede matrix,
(A> ) 1 = (A 1 )> . (8-21)

3. I matrixligninger kan man gange igennem med den inverse til en regulær ma-
trix. Dette kan gøres enten fra højre eller fra venstre på begge sider af lighed-
stegnet,
1 1
AX = B , X = A B og XC = D , X = DC . (8-22)

4. Den inverse til et matrixprodukt af to matricer er lig produktet af de


tilsvarende inverse matricer i omvendt rækkefølge,
1 1 1
(AB) =B A . (8-23)
eNote 8 8.2 INVERS MATRIX 8

Bevis

Alle regnereglerne i sætning 8.8 bevises nemt ved at "‘gøre prøve"’.

Herunder afprøves en af reglerne i et eksempel. Regnereglen i (8-22) er allerede blevet


brugt i eksempel 8.6.

Eksempel 8.9 Eftervisning af regneregel ved invers matrix

Der er givet to kvadratiske matricer


 
2 4 1 1
A= og B= . (8-24)
6 10 2 3

Afprøv den sidste regneregel i sætning 8.8, nemlig at (AB) 1 = B 1A 1.

Først bestemmes A 1
og B 1 ved hjælp af metode 8.4,
  1
 5
⇥ ⇤ 2 4 1 0 1 2 2 0 1 0 2 1
A E = ! ! 3 1 . (8-25)
6 10 0 1 0 2 3 1 0 1 2 2

På samme måde med B,


  
⇥ ⇤ 1 1 1 0 1 1 1 0 1 0 3 1
B E = ! ! . (8-26)
2 3 0 1 0 1 2 1 0 1 2 1

Da det er lykkedes, at få enhedsmatricen på venstresiden af stregen i begge tilfælde, har vi


nu, at  5 
1 2 1 1 3 1
A = 3 1 og B = . (8-27)
2 2 2 1
B 1A 1 bestemmes:
  5
   7
1 1 3 1 2 3 1 1 9 2
B A = 3 1 = 13 5 . (8-28)
2 1 2 2 1 2 2 2

Højresiden i regnereglen er nu bestemt. På venstresiden skal vi i første omgang finde AB,


    
2 4 1 2 4 1 10 14
AB = = . (8-29)
6 10 2 6 10 3 26 36
eNote 8 8.3 POTENSER AF MATRICER 9

Nu bestemmes den inverse til AB:


  7 1
 7
⇥ ⇤ 10 14 1 0 1 5 10 0 1 0 9 2
AB E = ! 2 13 ! 13 5 . (8-30)
26 36 0 1 0 5 5 1 0 1 2 2

Vi har altså, at  7
1 9 2
(AB) = 13 5 . (8-31)
2 2

Sammenlignes (8-28) og (8-31), ses det, at der er fuldstændig lighed: (AB) 1 = B 1A 1.

Opgave 8.10 Invers matrix

Givet er matricerne 2 3
0 1 
3 2 1
A = 4 1 0 5 og B= . (8-32)
0 1 2
2 3

a) Bestem (BA) 1.

b) Vis, at AB ikke er regulær, og at man derfor ikke kan bestemme (AB) 1.

Opgave 8.11 Invers matrix

Givet er matricerne
   
2 3 1 0 1 3 1 0
A= , B= , C= og D= . (8-33)
1 1 4 1 1 2 4 1

a) Udregn AC, BD og DC.

b) Angiv, hvis det er muligt, A 1, B 1 og (AB) 1.

c) Er det muligt at sige, om (AB) 1 findes efter at have prøvet at bestemme A 1 og B 1?

Hvis ja, hvordan?

8.3 Potenser af matricer

Vi har nu set, hvordan den inverse til en regulær matrix bestemmes, og vi siger, at den
har potensen 1. Tilsvarende defineres nu vilkårlige heltallige potenser af kvadratiske
eNote 8 8.3 POTENSER AF MATRICER 10

matricer.

Definition 8.12 Potens af matrix


For en vilkårlig kvadratisk matrix A defineres følgende naturlige potenser:
n gange
z }| {
0 n
A =E og A = AA · · · A for n 2 N . (8-34)

For en vilkårlig regulær kvadratisk matrix B defineres yderligere de negative


potenser:
n gange
z }| {
B n = (B 1 )n = B 1 B 1 · · · B 1 for n 2 N . (8-35)

Som følge af definitionen på potenserne kan nogle regneregler opskrives.

Sætning 8.13 Regneregler for potenser af matricer


For en vilkårlig kvadratisk matrix A og to vilkårlige ikke-negative heltal a og b
gælder følgende potensregneregler:

A a Ab = A a + b og (Aa )b = Aab . (8-36)

Er A regulær, gælder disse regneregler også for negative heltal a og b.

Herunder er et eksempel på to (simple) matricer, som har nogle pudsige egenskaber.


Egenskaberne er ikke typiske for matricer!

Eksempel 8.14 To pudsige matricer mht. potenser

Givet er matricerne  
1 0 2 1
A= og B= . (8-37)
2 1 4 2
Med hjælp fra både definition 8.12 og sætning 8.13 laves de efterfølgende udregninger. Først
bestemmes A2 ,   
2 1 0 1 0 1 0
A = AA = = = E. (8-38)
2 1 2 1 0 1
eNote 8 8.3 POTENSER AF MATRICER 11

Da E er regulær, følger det af punkt 2 i hjælpesætning 8.7, at A er regulær, og desuden er


A = A 1 . Det giver

.. ..
. .
A 3 = (AA2 ) 1 =A 1 =A A 2 = (A2 ) 1 =E
A 1=A A0 = E (8-39)
A1 = A A2 = E
.. ..
. .

Alle ulige potenser af A giver altså A, mens de lige potenser giver enhedsmatricen,

A2n = E og A2n+1 = A for n 2 Z . (8-40)

Bemærk, at når n er et heltal, så opnås netop kun lige heltal ved 2n og netop kun ulige
heltal ved 2n + 1.

B2 udregnes:
  
2 2 1 2 1 0 0
B = = = 0. (8-41)
4 2 4 2 0 0
Ifølge samme regneregel er B singulær. Man har da, at

B0 = E , B1 = B , B2 = 0 og Bn = 0 for n 2. (8-42)
eNote 8 8.4 OPSUMMERING 12

8.4 Opsummering

• Kvadratiske matricer er matricer med lige mange rækker og søjler.

• Enhedsmatricen E er en kvadratisk matrix med ettaller i diagonalen og nuller


ellers: 2 3
1 0 ··· 0
60 1 ··· 07
6 7
E = En ⇥ n = 6 . . . .. 7 (8-43)
.
4 . .. . . .5
0 0 ... 1

• Hvis en kvadratisk matrix har fuld rang, kaldes den regulær, ellers kaldes den
singulær.

• En kvadratisk matrix, som kun har tal forskellige fra nul i diagonalen, kaldes en
diagonalmatrix.

• En kvadratisk matrix, som er lig sin egen transponerede, kaldes en symmetrisk


matrix.

• Til en regulær matrix A findes den inverse, betegnet A 1, der opfylder at


1 1
AA =A A=E (8-44)

Den inverse kan bestemmes ved hjælp af metode 8.4.

• Der findes regneregler med kvadratiske og inverse matricer, se sætning 8.8.

• Potenser af kvadratiske matricer er defineret, se definition 8.12. Dertil findes også


nogle regneregler.

• Inverse matricer bruges for eksempel i forbindelse med basisskifte og egenværdiprob-


lemet. Desuden defineres determinanten af en kvadratisk matrix i eNote 9.
eNote 9 1

eNote 9

Determinanter

I denne eNote ser vi på kvadratiske matricer. Deres type er altså n ⇥ n for n 2, se eNote 8.
Det er en fordel, men ikke absolut nødvendigt, at kende determinantbegrebet for
(2 ⇥ 2)-matricer på forhånd. Matrix-algebraen fra eNote 7 forudsættes bekendt (sum, produkt,
transponering og inverse af matricer) samt den generelle løsningsmetode for linæere
ligningssystemer fra eNote 6.
Opdateret 25.09.21 af Karsten Schmidt

9.1 Intro til determinanter

Determinanten af en reel kvadratisk (n ⇥ n)-matrix A er et reelt tal, som vi betegner med


det(A) eller nogle gange kort med |A|. Determinanten af en matrix kan betragtes som
et mål for, hvor meget matricen "‘vejer"’ (med fortegn). Det vil vi illustrere visuelt og
geometrisk for (2 ⇥ 2)-matricer og (3 ⇥ 3)-matricer i eNote 10.

Determinanten er en ganske bestemt funktion af de i alt n2 tal, der står som elementer i
en (n ⇥ n)-matrix.

For at definere — og derefter beregne — determinant-værdien af (n ⇥ n)-matricer di-


rekte ud fra deres n2 elementer har vi brug for to ting:

• Dels den velkendte determinant-formel for (2 ⇥ 2)-matricer (definition 9.1 neden-


for)
eNote 9 9.2 DETERMINANTER AF (2 ⇥ 2) MATRICER 2

• og dels en metode til at snitte en vilkårlig (n ⇥ n)-matrix op i (2 ⇥ 2)-matricer og


derfra at beregne determinanten ud fra determinanterne af disse (2 ⇥ 2)-matricer.

9.2 Determinanter af (2 ⇥ 2) matricer

Definition 9.1 Determinanter af (2 ⇥ 2)-matricer


Lad A være den vilkårlige (2 ⇥ 2)-matrix

a a
A = 11 12 . (9-1)
a21 a22

Så er determinanten af A defineret ved

det(A) = a11 · a22 a21 · a12 . (9-2)

Opgave 9.2 Invers (2 ⇥ 2) matrix

Husk, at den inverse matrix A 1 til en regulær matrix A har den karakteristiske egenskab,
at A 1 · A = A · A 1 = E. Vis direkte ud fra (9-1) og (9-2), at den inverse matrix A 1 til en
(2 ⇥ 2)-matrix A kan udtrykkes på følgende måde (når altså det(A) 6= 0):

1 1 a22 a12
A = . (9-3)
det(A) a21 a11

Opgave 9.3 Regneregler for (2 ⇥ 2) matricer

For generelle kvadratiske matricer gælder en række fundamentale determinant-regneregler,


som vil blive præsenteret i sætning 9.20 nedenfor. Tjek allerede nu de tre første ligninger
i sætning 9.20 for (2 ⇥ 2)-matricerne A og B. Brug direkte udregning af begge sider af
ligningerne ved hjælp af (9-2).
eNote 9 9.3 SNIT-MATRICER 3

9.3 Snit-matricer

Definition 9.4 Snitmatricer


b ij som den ((n 1) ⇥ (n 1))-
For en (n ⇥ n)-matrix A defineres (i, j)-snitmatricen A
undermatrix af A, der fremkommer ved, at hele række i og hele søjle j slettes fra
matricen A.

Hver enkelt af de i alt n2 snit-matricer A


b ij (hvor 1  i  n og 1  j  n) er
mindre end A, da de er af typen (n 1) ⇥ (n 1) og derfor kun indeholder
(n 1)2 elementer.

Eksempel 9.5 Snitmatricerne for en (3 ⇥ 3) matrix

b ij . For eksempel, hvis


En (3 ⇥ 3)-matrix A har i alt 9 stk. (2 ⇥ 2)-snitmatricer A
2 3
0 2 1
A =4 1 3 2 5 , (9-4)
0 5 1

så er de 9 snitmatricer hørende til A givet ved


  
b 11 = 3
A
2
, b 12 = 1
A
2
, b 13 = 1
A
3
,
5 1 0 1 0 5
  
b 21 = 2
A
1
, b 22 = 0
A
1
, b 23 = 0
A
2
, (9-5)
5 1 0 1 0 5
  
b 31 = 2
A
1
, b 32 = 0
A
1
, b 33 = 0
A
2
.
3 2 1 2 1 3

Disse 9 (2 ⇥ 2)-snitmatricers respektive determinanter kan hver for sig direkte beregnes ud
fra definitionen 9.1:
b 11 ) = 7 ,
det(A b 12 ) = 1 ,
det(A b 13 ) = 5 ,
det(A
b 21 ) = 3 ,
det(A b 22 ) = 0 ,
det(A b 23 ) = 0 ,
det(A (9-6)
b 31 ) = 1 ,
det(A b 32 ) = 1 ,
det(A b 33 ) = 2 .
det(A
eNote 9 9.4 INDUKTIV DEFINITION AF DETERMINANTER 4

9.4 Induktiv definition af determinanter

Determinanten af en (3 ⇥ 3)-matrix kan vi bestemme ud fra determinanterne af tre af


dens i alt ni snitmatricer. Generelt gælder nemlig, at determinanten af en (n ⇥ n)-matrix
defineres ved hjælp af determinanterne af de n snitmatricer, der hører til en frit valgt
(men fast) række r. Metoden kaldes også opløsning efter r’te række.

Definition 9.6 Determinanter defineres ved opløsning


For en vilkårlig værdi af rækkeindeks r defineres determinanten af en given (n ⇥ n)-
matrix A induktivt på følgende måde:
n
det(A) = Â( 1)r+ j arj det(A
b rj ) , (9-7)
j =1

hvor arj er elementet på plads (r, j) i A.

Vi benytter her og senere følgende korte skrivemåder og notationer for sum-


mer og produkter af mange led:
n
c1 + c2 + · · · + c n 1 + cn = Â ci , og
i =1
n
(9-8)
c1 · c2 · · · · · c n 1 · c n = ’ ci .
i =1

Eksempel 9.7 Opløsning af en determinant efter 1. række

Vi vil benytte definition 9.6 direkte til at beregne determinanten af den (3 ⇥ 3)-matrix A, som
er givet i eksempel 9.5. Vi vælger r = 1 og skal derfor opløse efter første række. Da n = 3, har
vi således brug for de tre snitmatrix-determinanter det(A b rj ) for j = 1, 2, 3, som allerede er
udregnet i eksempel 9.5:

b 11 ) = 7
det(A
b 12 ) = 1
det(A
b 13 ) = 5 .
det(A
eNote 9 9.4 INDUKTIV DEFINITION AF DETERMINANTER 5

Vi har desuden brug for de tre elementer i den række, vi opløser efter, som blot aflæses af
matricen:

a11 = 0
a12 = 2
a13 = 1 .

Determinanten af A findes:
3
det(A) = Â( 1)1+ j a1j det(A
b 1j )
j =1

= ( 1)1+1 a11 det(A


b 11 ) + ( 1)1+2 a12 det(A
b 12 ) + ( 1)1+3 a13 det(A
b 13 ) (9-9)
= ( 1)2 · 0 · ( 7) + ( 1)3 · 2 · 1 + ( 1)4 · 1 · 5
=0 2+5 = 3.

Læg mærke til, at snitmatricernes determinanter skal ganges med det element
i A, som står på plads (r, j), og med fortegns-faktoren ( 1)r+ j , før de lægges
sammen.

Hvis A har flere rækker hhv. søjler end tre, n > 3, så bliver snitmatricerne
ikke (2 ⇥ 2)-matricer. For at finde snitmatricernes determinanter til at bruge i
formlen er det selvfølgelig ikke noget problem at "‘trævle dem op"’ også efter
samme formel og opnå endnu mindre snitmatricer. Således ender vi altid med
til sidst kun at skulle bestemme vægtede summer af determinanter af (2 ⇥ 2)-
matricer! Men vi kan dog ende med mange (2 ⇥ 2)-matricer.

Opgave 9.8 Valg af "‘opløsningsrække"’ er ligegyldig

Vis direkte ved beregning, at vi får samme værdi for determinanten ved at bruge en af de
andre to rækker til opløsningen af determinanten i eksempel 9.5.
eNote 9 9.4 INDUKTIV DEFINITION AF DETERMINANTER 6

Definition 9.9 Alternativ: Opløsning efter søjle


Determinanten af en given (n ⇥ n)-matrix A kan alternativt defineres induktivt ved
opløsning efter en vilkårlig valgt søjle:
n
det(A) = Â( 1)i+s ai s det(A
b i s) . (9-10)
i =1

Her er opløsningen udtrykt ved opløsning efter søjle s.

Som det er antydet allerede med definitionerne og som vist i det konkrete tilfælde med
matricen i eksempel 9.5, er det ligegyldigt, hvilken række (eller søjle) man opløser efter.

Sætning 9.10 Valg af opløsnings-række eller -søjle er ligegyldig


De to definitioner 9.6 og 9.9 af determinanten af en kvadratisk matrix giver samme
værdi og er uafhængige af valg af række hhv. søjle til de respektive opløsninger.

Opgave 9.11 Valg af "‘opløsningssøjle"’ er ligegyldig

Vis direkte ved beregning, at vi får samme værdi for determinanten i eksempel 9.5 ved at
bruge søjle-opløsning efter en vilkårlig valgt søjle i A.

Det er selvsagt smartest at opløse efter en række (eller søjle), som indeholder en
masse 0’er, netop fordi leddene i formlen ganges med elementerne i den valgte
række (eller søjle). Vælges en række (eller søjle) med mange 0’er, forsvinder
mange af leddene, så udregningen forsimples voldsomt.
eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 7

Opgave 9.12 Determinanter af nogle større matricer

Benyt de ovenfor givne anvisninger og resultater til at finde determinanten af hver af føl-
gende matricer:
2 3
2 3 0 0 2 1 5 3
2 3 0 2 1 0 5 60
0 2 7 1 61 3 2 0 27 6 1 3 2 2 177
61 3 0 27 6 7 6
7 60 0 5 1 1 47
7
6 7,66 0 5 1 0 1 7,6 7. (9-11)
40 0 1 05 6 7 61 0 0 0 0 07
40 0 1 0 05 6 7
0 5 8 1 40 0 1 0 0 05
5 2 7 1 9
0 5 2 7 1 9

Hvis der er en række (eller søjle), hvori alle elementer på nær ét er 0, så er det
klart smartest at vælge den at opløse efter. Og det er tilladt at "‘skaffe"’ sig en
masse 0’er ved de velkendte rækkeoperationer, hvis man blot holder øje med,
hvilke konstanter der divideres med, og hvor mange gange der byttes om på
rækkerne. Dette behandles i sætning 9.16 og bruges i eksempel 9.17 nedenfor.

9.5 Beregningstekniske egenskaber ved determinanter

Vi samler her nogle af de vigtigste redskaber, som ofte benyttes til beregning og inspek-
tion af determinanter af matricer.

Det er ikke svært at vise følgende sætning — fx direkte ved først at opløse efter første
søjle eller efter første række, hvorefter mønsteret, som sætningen udtrykker, viser sig.

Sætning 9.13 Trekantsmatricer


Hvis en (n ⇥ n)-matrix har lutter 0’er over diagonalen (kaldet en nedre trekantsma-
trix) eller lutter 0’er under diagonalen (kaldet en øvre trekantsmatrix), så er determi-
nanten givet ved produktet af diagonalelementerne.

Specielt har vi derfor:


eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 8

Hjælpesætning 9.14 Determinanten af en diagonalmatrix


Lad L betegne en (n ⇥ n)-diagonalmatrix med diagonal-elementerne l1 , l2 , . . . , ln
og ellers med 0’er uden for diagonalen:
2 3
l1 0 · · · 0
6 0 l2 · · · 0 7
6 7
L = diag(l1 , l2 , · · · , ln ) = 6 . .. . . .. 7 . (9-12)
4 .. . . . 5
0 0 . . . ln

Så er determinanten
n
det(L) = l1 l2 · · · · · ln = ’ li . (9-13)
i =1

Opgave 9.15 Determinanten af en bidiagonal-matrix

Bestem determinanten af (n ⇥ n)-bidiagonal-matricen med vilkårligt givne værdier µ1 , . . . , µn


i bidiagonalen (den "‘omvendte"’ diagonal) og ellers 0’er udenfor:
2 3
0 · · · 0 µ1
6 0 · · · µ2 0 7
6 7
M = bidiag(µ1 , µ2 , · · · , µn ) = 6 .. . .. .. 7 . (9-14)
4 . . . . . 5
µn ... 0 0

For generelle matricer og derfor også kvadratiske matricer gælder som bekendt fra
eNote 6 om lineære ligningssystemer, at de kan omformes til trappeform ved brug af
rækkeoperationer. Hvis man holder godt øje med, hvad der sker ved hvert skridt i
den omformning, så kan determinanten af matricen direkte aflæses ud fra processen.
Determinanten af en matrix opfører sig nemlig "‘pænt"’, selvom der udføres rækkeop-
erationer på matricen.
eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 9

Sætning 9.16 Rækkeoperationers indflydelse på determinanten


Determinanten har følgende egenskaber:

1. Hvis alle elementer i en række i A er 0, så er det(A) = 0.

2. Hvis to rækker ombyttes i A — dvs. Ri $ R j — så skifter determinanten


fortegn.

3. Hvis alle elementerne i en række i A ganges med en konstant k — dvs. k · Ri


— så bliver determinanten ganget med k.

4. Hvis to rækker i en matrix A er ens, så er det(A) = 0.

5. En rækkeoperation af typen R j + k · Ri , hvor i 6= j, ændrer ikke determinanten.

Som antydet ovenfor følger det af disse egenskaber ved determinantfunktionen, at den
velkendte reduktion af en given matrix A til trappeform trap(A) via rækkeoperationer
som beskrevet i eNote 6, faktisk indeholder en helt eksplicit beregning af determinanten
af A. Vi illustrerer med et simpelt eksempel.

Eksempel 9.17 Inspektion af determinant ved reduktion til trappeform

Vi betragter (3 ⇥ 3)-matricen A1 (matricen A i eksempel 9.5):


2 3
0 2 1
A1 = 4 1 3 2 5 . (9-15)
0 5 1

Vi reducerer den til trappeform på sædvanlig måde med Gauss–Jordan rækkeoperationer


og holder hele tiden øje med, hvad der sker med determinanten ved at bruge reglerne fra
sætning 9.16 (og ved eventuelt derudover at checke dem med direkte udregninger).

Operation: R1 $ R2 , ombyt række et og række to.


Determinanten: Skifter fortegn.
2 3
1 3 2
A2 = 4 0 2 1 5 (9-16)
0 5 1

det(A2 ) = det(A1 ) . (9-17)


eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 10

Operation: 12 R2 , række to ganges med 12 .


Determinanten: Ganges med 12 .
2 3
1 3 2
A3 = 4 0 1 1/2 5 (9-18)
0 5 1

1 1
det(A3 ) =det(A2 ) = det(A1 ) . (9-19)
2 2
Operation: R1 3R2 , række to trukket fra række et 3 gange.
Determinanten: Uændret. 2 3
1 0 1/2
A4 = 4 0 1 1/2 5 (9-20)
0 5 1
1 1
det(A4 ) = det(A3 ) =det(A2 ) = det(A1 ) . (9-21)
2 2
Operation: R3 5R2 , række to trukket fra række tre 5 gange.
Determinanten: Uændret. 2 3
1 0 1/2
A5 = 4 0 1 1/2 5 (9-22)
0 0 3/2
1 1
det(A5 ) = det(A4 ) = det(A3 ) =
det(A2 ) = det(A1 ) . (9-23)
2 2
Determinanten er nu diagonal-produktet, fordi alle elementerne under diagonalen er 0, se
sætning 9.13. Vi har derfor

3 3 1 1
·1·1 = = det(A5 ) = det(A4 ) = det(A3 ) = det(A2 ) = det(A1 ) . (9-24)
2 2 2 2
Heraf får vi direkte (ved at læse "‘baglæns"’)

1 3
det(A1 ) = (9-25)
2 2
således, at
det(A1 ) = 3 . (9-26)

Derudover har vi følgende sammenhæng mellem rang og determinant. Determinanten


afslører nemlig, om matricen er singulær eller regulær.
eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 11

Sætning 9.18 Rang versus determinant


Rangen af en kvadratisk (n ⇥ n)-matrix A er skarpt mindre end n, hvis og kun hvis
determinanten af A er 0. Med andre ord, A er singulær hvis og kun hvis det(A) = 0.

Hvis en matrix indeholder en variabel (en parameter), så er determinanten af matri-


cen en funktion af denne parameter. I anvendelserne af matrix-algebra er det ofte ret
afgørende at kunne finde nulpunkterne for en sådan funktion. Dette er klart, da den
tilhørende matrix er singulær for de parameterværdier, der giver determinanten værdien
nul ifølge ovenstående sætning, hvilket svarer til, at der måske ikke findes en (entydig)
løsning til det tilsvarende lineære ligningssystem.

Opgave 9.19 Determinant af matrix med variabel

Givet matricen 2 3
1 a a2 a3
61 0 a2 a3 7
A =6 7 hvor a 2 R . (9-27)
41 a a a3 5
1 a a2 a

1. Bestem determinanten af A som et polynomium i a.

2. Bestem rødderne i dette polynomium.

3. Find rangen af A for a 2 { 4, 3, 2, 1, 0, 1, 2, 3, 4} . Hvad har rangen at gøre med


de fundne rødder i determinanten?

4. Find rangen af A for alle a.


eNote 9 9.5 BEREGNINGSTEKNISKE EGENSKABER VED DETERMINANTER 12

Sætning 9.20 Regneregler for determinanter


Lad A og B betegne to (n ⇥ n)-matricer. Så gælder:

1. det(A) = det(A> ) .

2. det(AB) = det(A) det(B) .

3. det(A 1) = det(A) 1, når blot A er regulær, altså det(A) 6= 0 .

4. det(Ak ) = det(A)k , for alle k 1.

5. det(B 1 AB) = det(A), når blot B er regulær, hvilket vil sige, at det(B) 6= 0 .

Opgave 9.21

Bevis de 3 sidste ligninger i sætning 9.20 ved at bruge ligningen det(AB) = det(A) det(B).

Opgave 9.22 Determinanten af en sum er ikke determinantsummen

Vis med et simplest muligt eksempel, at determinant-funktionen det() ikke er additiv. Altså
find to (n ⇥ n)-matricer A og B således, at

det(A + B) 6= det(A) + det(B) . (9-28)

Opgave 9.23 Brug af regnereglerne for determinanter

Lad a betegne et reelt tal. Der er givet følgende matricer:


2 3 2 3
3 4 4 2 1 0
A = 4 1 a 2 5 og B = 4 5 3 1 5. (9-29)
2 3 3 0 1 a

1. Find det(A) og det(B) .


⇣ ⌘
4
2. Find det(A B) og det A> B .
eNote 9 9.6 CRAMERS LØSNINGSMETODE 13

3. Angiv de værdier af a, for hvilke A er regulær, og find for disse værdier af a udtrykket
for det(A 1 ) .

9.6 Cramers løsningsmetode

Hvis A er en regulær (n ⇥ n)-matrix, og b = (b1 , . . . , bn ) er en vilkårlig vektor i R n , så


findes der (som det vides fra eNote 6) præcis én løsning x = ( x1 , . . . , xn ) til det linæere
ligningssystem Ax = b, og vi har i eNote 6 fundet metoder til at finde denne løsning.

Cramers metode til løsning af sådanne ligningssystemer er en direkte metode. Den


består essentielt i at udregne passende determinanter af matricer, der konstrueres ud
fra A og b, og så skrive løsningen ned direkte ud fra de beregnede determinanter.

Sætning 9.24 Cramers løsningsformel


Lad A være en regulær (n ⇥ n)-matrix, og lad b = (b1 , . . . , bn ) betegne en vilkårlig
vektor i R n . Så findes der præcis én løsning x = ( x1 , . . . , xn ) til det lineære lign-
ingssystem
Ax = b , (9-30)
og elementerne i denne løsning er givet ved

1
xj = det(A†bj ) for j = 1, . . . , n , (9-31)
det(A)

hvor A†bj betegner den (n ⇥ n)-matrix, der fremkommer ved at erstatte søjle j i A
med b.

Forklaring 9.25 Hvad † betyder

Hvis A er matricen (fra eksempel 9.5)


2 3
0 2 1
A =4 1 3 2 5 , (9-32)
0 5 1
eNote 9 9.6 CRAMERS LØSNINGSMETODE 14

og hvis b = (b1 , b2 , b3 ), så er
2 3 2 3 2 3
b1 2 1 0 b1 1 0 2 b1
A†b1 = 4 b2 3 2 5 , A†b2 = 4 1 b2 2 5 , A†b3 = 4 1 3 b2 5 . (9-33)
b3 5 1 0 b3 1 0 5 b3

Opgave 9.26 Brug af Cramers løsningsformel

Hvis vi specielt lader A være den samme matrix som ovenfor i forklaring 9.25 og nu helt
konkret lader b = (1, 3, 2), så får vi ved at indsætte b i (9-33) og dernæst udregne de relevante
determinanter: 02 31
1 2 1
det(A†b1 ) = det @4 3 3 2 5A = 4
2 5 1
02 31
0 1 1
det(A†b2 ) = det @4 1 3 2 5A = 1 (9-34)
0 2 1
02 31
0 2 1
det(A†b3 ) = det @4 1 3 3 5A = 1 .
0 5 2
Da vi også kender det(A) = 3, kan vi nu konstruere løsningen til ligningssystemet Ax = b
vha. (9-31): ✓ ◆ ✓ ◆
1 1 1 4 1 1
x = ( x1 , x2 , x3 ) = · 4, · 1, · 1 = , , . (9-35)
3 3 3 3 3 3

1. Tjek ved direkte indsættelse, at x er en løsning til Ax = b.

2. Bestem A 1, og brug den direkte til løsning af ligningssystemet.

3. Løs ligningssystemet ved reduktion af totalmatricen til trappeform som øvet i eNote 6
og efterfølgende aflæsning af løsningen.

For at vise, hvad der faktisk foregår i Cramers løsningsformel, definerer vi først den
adjungerede matrix for en matrix A.
eNote 9 9.6 CRAMERS LØSNINGSMETODE 15

Definition 9.27 Den adjungerede matrix


Den adjungerede matrix adj(A) defineres ved de elementer, som benyttes i definition
9.6 om determinanten for A:
2 3
( 1)1+1 det(Ab 11 ) · · · ( 1)1+n det(Ab 1n ) >
adj(A) = 4
6 .. .. .. 7 (9-36)
. . . 5
( 1)n+1 det(Ab n 1 ) · · · ( 1)n+n det(A
b n n)

Med andre ord: elementet på plads (i, j) i den adjungerede matrix adj(A)
er den ( 1)i+ j -fortegns-modificerede determinant af (i, j)-snitmatricen, altså:
( 1)i+ j det(A
b ij ). Bemærk transponeringen i (9-36).

Eksempel 9.28 En adjungeret matrix

I eksempel 9.5 betragtede vi følgende matrix


2 3
0 2 1
A =4 1 3 2 5 . (9-37)
0 5 1

Matricen A har følgende adjungerede matrix


2 3
7 3 1
adj(A) = 4 1 0 15, (9-38)
5 0 2

som fås direkte ud fra den tidligere beregning af snitmatrix-determinanterne, som her gent-
ages

b 11 ) = 7 , det(A
det(A b 12 ) = 1 , det(A
b 13 ) = 5 ,
b b
det(A21 ) = 3 , det(A22 ) = 0 , det(A b 23 ) = 0 , (9-39)
b 31 ) = 1 , det(A
det(A b 32 ) = 1 , det(A
b 33 ) = 2 ,

idet vi husker, dels at de enkelte elementer skal have et fortegn, der afhænger af "‘positio-
nen"’, og dels at udtrykket (9-36) involverer en transponering.
eNote 9 9.6 CRAMERS LØSNINGSMETODE 16

Opgave 9.29 Adjungeret versus invers matrix

Vis, at alle kvadratiske matricer A opfylder, at

A adj(A) = det(A)E (9-40)

sådan, at den inverse matrix til A (som jo findes, netop hvis det(A) 6= 0) kan findes på
følgende måde:
1
A 1= adj(A) . (9-41)
det(A)
Vink: Opgaven er ikke helt nem. Det anbefales, at man først øver sig på en (2 ⇥ 2)-matrix.
0’erne i enhedsmatricen i (9-40) fås ved at bruge den egenskab, at determinanten af en matrix
med to ens søjler er 0.

Beviset for sætning 9.24 er nu ganske kort:

Bevis

Ved at gange på begge sider af (9-30) med A 1 fås


1 1
x=A b= adj(A)b , (9-42)
det(A)
hvor resultatet fra opgave 9.29 benyttes. Vi betegner nu elementerne i adj(A) med aij :
2 3 2 32 3
x1 a11 · · · a1n b1
6 .. 7 1 6 . . .
4 . 5= 4 .. .. .. 54 ... 7
76
5 . (9-43)
det(A)
xn an1 · · · ann bn
Heraf aflæses direkte
n
1
det(A) iÂ
xj = a ji bi
=1
n
1
= Â
det(A) i=1
( 1)i+ j bi det(A
b ij ) (9-44)

1
= det(A†bj ) ,
det(A)
hvor vi til etablering af det sidste lighedstegn har benyttet, at
n
Â( 1)i+ j bi det(A
b ij ) (9-45)
i =1

lige præcis er opløsningen af det(A†bj ) efter søjle nummer j, altså opløsningen efter b-søjlen i
det(A†bj ) (se definition 9.9).
eNote 9 9.6 CRAMERS LØSNINGSMETODE 17


eNote 10 1

eNote 10

Geometriske vektorer

Formålet med denne note er at give en introduktion til geometriske vektorer i planen og
rummet, som sigter mod at introducere en række af de metoder, der gør sig gældende i den
generelle vektorrumsteori. Nøglebegreberne er her lineær uafhængighed og lineær afhængighed,
samt basis og koordinater. eNoten forudsætter kendskab til elementær plan- og rumgeometri, til
lineære ligningssystemer som beskrevet i eNote 6 og til matrixalgebra som beskrevet i eNote 7.
Opdateret 24.09.21 af Karsten Schmidt.

10.1 En geometrisk vektor

Ved en geometrisk vektor i planen eller rummet forstås et sammenhørende par af en


længde og en retning. Geometriske vektorer skriver vi med små fede bogstaver, for ek-
sempel v.

En vektor kan repræsenteres af et orienteret linjestykke med et givet begyndelsespunkt


og endepunkt. Hvis vektoren v er repræsenteret af det orienterede linjestykke fra begy-
!
ndelsespunktet A til endepunktet B, benytter vi skrivemåden v = AB. Alle andre orien-
terede linjestykker med samme længde og retning er også repræsentanter for v, selvom
de måske er placeret et andet sted i planen eller rummet.
eNote 10 10.1 EN GEOMETRISK VEKTOR 2

Eksempel 10.1 Parallelforskydninger ved hjælp af vektorer

Geometriske vektorer kan benyttes til at angive parallelforskydninger i planen eller rummet.
På figur 6.1 er linjestykket CD fremkommet af linjestykket AB ved, at alle punkterne på AB
er blevet forskudt med vektoren u. På samme måde er linjestykket EF fremkommet af AB
ved parallelforskydning med vektoren v.

u
F

v
A

E
Figur 6.1: Parallelforskydning ved hjælp af vektorer

! ! ! ! !
Der gælder, at AB = CD = EF, men bemærk for eksempel også, at AB 6= FE.

I det følgende forudsætter vi, at der er valgt et enhedslinjestykke, hvilket vil sige et
linjestykke, der tillægges længden 1. Ved |v| forstås længden af vektoren v set i forhold
til længden af enhedslinjestykket. |v| er dermed et reelt tal. Alle vektorer med samme
længde som enhedslinjestykket kaldes enhedsvektorer.

Af praktiske grunde indføres en særlig vektor, som har længden 0 , og som ikke tillægges
!
en retning. Den kaldes nulvektoren og skrives 0. For ethvert punkt A sætter vi AA = 0.
En vektor, som ikke er nulvektoren, kaldes en egentlig vektor.

For enhver egentlig vektor v defineres den modsatte vektor v som den vektor, der har
! !
samme længde som v men modsat retning. Hvis v = AB, gælder dermed, at BA = v.
For nulvektoren sættes 0 = 0 .
eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 3

Det er ofte praktisk at benytte et fælles begyndelsespunkt, når forskellige vektorer skal
repræsenteres af orienterede linjestykker. Man vælger derfor et fast punkt O, kaldet
origo, og betragter vektorer ved de repræsentanter, der har O som begyndelsespunkt.
Vektorer repræsenteret på denne måde kaldes stedvektorer, fordi der til enhver given
!
vektor v hører ét unikt punkt (eller sted) P, der opfylder, at v =OP. Tilsvarende hører
!
der til ethvert punkt Q én unik vektor u således, at OQ = u.

Ved vinklen mellem to egentlige vektorer i planen forstår man den entydigt bestemte vinkel
mellem deres stedvektorer (deres repræsentanter med samme startpunkt, nemlig udgående
fra O ), som ligger i intervallet [ 0 ; p ] . Hvis en vektor v i planen drejes vinklen p/2 mod
uret, fremkommer en ny vektor, der kaldes v’s tværvektor og betegnes v b.

Ved vinklen mellem to egentlige vektorer i rummet forstås vinklen mellem deres sted-
vektorer i den plan i rummet, som indeholder begge stedvektorer.

Det giver god og brugbar mening "‘at lægge vektorer sammen"’, idet man både tager
højde for vektorernes længde og deres retning. Vi vil derfor i det følgende indføre nogle
regneoperationer for geometriske vektorer. I første omgang drejer det sig om de to
lineære regneoperationer:

• addition af vektorer og

• multiplikation af vektor med en skalar (et reelt tal).

Senere skal vi se på tre forskellige måder at multiplicere vektorer med hinanden på,
nemlig prikprodukt og for rumvektorer krydsprodukt og rumprodukt.

10.2 Addition og multiplikation med skalar


eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 4

Definition 10.2 Addition


Der er givet to vektorer i planen eller rummet, u og v. Summen u + v fastlægges
ved følgende metode:
! !
• Vi vælger origo O og afsætter stedvektorerne u =OQ og v =OR.

• Ved parallelforskydning af linjestykket OR med u fremkommer


linjestykket QP.
! !
• OP er da stedvektor for summen af u og v. Kort sagt: u + v = OP.

R P

v u+v

u
O Q

I fysik taler man om "‘kræfternes parallelogram"’: Hvis et objekt er påvirket


af kræfterne u og v, kan den resulterende kraft bestemmes som sumvektoren
u + v, hvis retning angiver den resulterende krafts retning, og hvis længde an-
giver kraftens størrelse. Hvis specielt u og v har samme længde, men modsat
retning, er den resulterende kraft lig med 0-vektoren, da de to kræfter derved
netop modvirker hinanden.

Vi indfører nu multiplikation af vektor med skalar.


eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 5

Definition 10.3 Multiplikation med skalar


Der er givet en vektor v i planen eller rummet og en skalar k. Hvis v = 0, sætter vi
kv = vk = 0. I modsat fald forstås der ved produktet kv følgende:

• Hvis k > 0 , så er kv = vk den vektor, der har samme retning som v, men som
er k gange så lang som v .

• Hvis k = 0 , så er kv = 0 .

• Hvis k < 0 , så er kv = vk den vektor, der har modsat retning af v, og som er


k = | k | gange så lang som v .

Eksempel 10.4 Multiplikation med skalar

En given vektor v ganges med henholdsvis 1 og 2 :

v
(-1)v
2v

Figur 6.2: Multiplikation af en vektor med 1 og 2

Det følger umiddelbart af definition 10.3, at multiplikation af en vektor med


1 giver vektorens modsatte vektor,

( 1)u = u.

I forlængelse heraf bruger vi skrivemåder som

( 5)v = (5v) = 5v .

Af definition 10.3 følger umiddelbart nulreglen for geometriske vektorer:

kv = 0 , k = 0 eller v = 0 .

I det følgende eksempel vises, at multiplikation af en vilkårlig vektor med en vilkårlig


eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 6

skalar kan udføres ved ren passer/lineal-konstruktion.

Eksempel 10.5 Geometrisk multiplikation

Givet en vektor a og et linjestykke med længden k. Konstruer vektoren ka.

ka Q

O 1 k
Figur 6.3: Konstruktion af multiplikation af vektor med vilkårlig skalar

!
Først afsættes OQ= a, og linjen OQ forlænges. Derefter indlægges der med O som begyn-
delsespunkt en målelinje (lineal), som ikke er parallel med a, og hvor tallene 1 og k afsættes.

Trekanten 4OkP tegnes, så den er ensvinklet med trekanten 4O1Q. Da de to trekanter er


!
ensvinklede, må der gælde, at ka =OP.

Opgave 10.6

Der er givet to parallelle vektorer a og b samt en målelinje. Hvordan kan man med en passer
og målelinjen konstruere et linjestykke, som har længden k, og som opfylder, at b = ka?

Opgave 10.7

1
Der er givet en egentlig vektor v, og der er givet en målelinje (lineal). Tegn vektoren |v|
v.
eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 7

Parameterfremstillinger for rette linjer i planen eller rummet opstilles ved hjælp af egentlige
vektorer. Nedenfor giver vi først et eksempel på en linje, der går gennem origo, og
dernæst et eksempel på en linje, der ikke gør.

Eksempel 10.8 Parameterfremstilling for ret linje

Der er givet en ret linje l , som går gennem origo. Beskriv punkterne på linjen ved
hjælp af en parameterfremstilling.

tr P
R
r
O

Figur 6.4: Parameterfremstilling for linje gennem origo

!
Der vælges et punkt R på l, der ikke er det samme som origo. Vektoren r =OR kaldes en
retningsvektor for l . Til ethvert punkt P på l svarer der netop ét reelt tal t, der opfylder,
! !
at OP= tr. Omvendt svarer der til ethvert tal t netop ét punkt P på l, så OP= tr . Når
t gennemløber de reelle tal fra • til +•, vil P gennemløbe hele l i den retning, som er
bestemt ved r. Man siger, at
!
{ P | OP= tr hvor t 2 R }
er en parameterfremstilling for l .
eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 8

Eksempel 10.9 Parameterfremstilling for ret linje

Givet linjen m , der ikke går gennem origo. Beskriv punkterne på m ved hjælp af en
parameterfremstilling.

tr
r
B
R
m P
b

Figur 6.5: Parameterfremstilling for linje

!
Først vælges et begyndelsespunkt B på m, og vi sætter b =OB. Dernæst vælges et punkt R 2 m ,
!
som ikke er det samme som B. Vektoren r = BR er da en retningsvektor for m . Til ethvert
!
punkt P på m svarer der netop ét reelt tal t, der opfylder, at OP= b + tr. Omvendt svarer
!
der til ethvert tal t netop ét punkt P på l, så OP= b + tr. Når t gennemløber de reelle tal fra
• til +•, vil P gennemløbe hele m i den retning, som er bestemt ved r. Man siger, at
!
{ P | OP= b + tr hvor t 2 R }

er en parameterfremstilling for m .

Bemærk, at også den omvendte vektor r er en gyldig retningsvektor i oven-


stående eksempler.

Parameterfremstillinger som ovenfor beskriver rette linjer, der er uendeligt lange i hver
retning. Men parameterfremstillinger kan afgrænses og derved også bruges til at beskrive
linjestykker, hvilket er emnet for de følgende to opgaver.

Opgave 10.10

Betragt situationen i eksempel 10.9. Indtegn det orienterede linjestykke, som har parameter-
fremstillingen
!
{ P | OP= b + tr hvor t 2 [ 1; 2 ] } .
eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 9

Opgave 10.11

Givet to (ikke ens) punkter A og B . Beskriv med en parameterfremstilling det orienterede


linjestykke fra A til B .

Efter disse betragtninger opstiller vi en generel sætning for en parameterfremstilling for


en ret linje på et vilkårligt interval I.

Metode 10.12 Parameterfremstilling for ret linje


Givet en ret linje l og to forskellige punkter R og B på l samt origo O, hvor R 6= O.
!
Vektoren r = BR kaldes en retningsvektor for l . En parameterfremstilling for l er da
!
l = { P | OP= b + tr hvor t 2 I } ,
!
hvor b =OB, og I er et givent interval.

Vi får snart brug for mere avancerede regneregler for addition af geometriske vektorer
og multiplikation af geometriske vektorer med skalarer end dem, vi har givet eksempler
på ovenfor. Vi ridser derfor generelle regneregler op i følgende sætning og diskuterer
bagefter eksempler på, hvordan regnereglerne kan begrundes ud fra de allerede de-
finerede regneoperationer og sætninger kendt fra elementær geometri.
eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 10

Sætning 10.13 Regneregler


For vilkårlige geometriske vektorer u, v og w og for vilkårlige reelle tal k1 og k2
gælder følgende regneregler:
1. u+v = v+u Addition er kommutativ
2. (u + v) + w = u + (v + w) Addition er associativ
3. u+0 = u Nulvektoren er neutral ved addition
4. u + ( u) = 0 Summen af en vektor og dens modsatte er 0
5. k 1 ( k 2 u) = ( k 1 k 2 )u Multiplikation af vektor med skalar er associativ
6. ( k 1 + k 2 )u = k 1 u + k 2 u
De distributive regler gælder
7. k 1 (u + v) = k 1 u + k 1 v
8. 1u = u Skalaren 1 er neutral i produkt med vektorer

Bevis

Regnereglerne i sætning 10.13 kan illustreres og eftervises ved hjælp af geometriske kon-
struktioner. Lad os som eksempel tage den første regel, den kommutative lov.

Her behøver vi blot igen at rette blikket mod figuren i definition 10.2, hvor u + v er kon-
strueret. Hvis vi nu konstruerer v + u, skal vi parallelforskyde linjestykket OQ med v og
betragte det fremkomne linjestykke RP2 . Der må gælde, at parallelogrammet OQPR er iden-
tisk med parallelogrammet OQP2 R, hvorfor P2 = P, og dermed u + v = v + u.

I de følgende to opgaver opfordres læseren til selv at redegøre for to af de andre regneregler.


eNote 10 10.2 ADDITION OG MULTIPLIKATION MED SKALAR 11

Opgave 10.14

Gør ved hjælp af figur 6.6 rede for regnereglen k (u + v) = ku + kv.

ka
kb

a b

a+b
O
k(a+b)
Figur 6.6: Regnereglen k (u + v) = ku + kv

Opgave 10.15

Tegn en figur, som illustrerer regnereglen (u + v) + w = u + (v + w).

For en given vektor u er det klart, at den modsatte vektor u er den eneste vektor, som
opfylder ligningen u + x = 0 . For to vilkårlige vektorer u og v er det også klart, at
der findes netop én vektor, der opfylder ligningen u + x = v , nemlig vektoren x =
v + ( u) , hvilket illustreres på figur 6.7.

x v

-u u

Figur 6.7: Løsningen til u + x = v er x = v + ( u)

Vi kan derfor indføre subtraktion af vektorer som en variant af addition.


eNote 10 10.3 LINEARKOMBINATIONER 12

Definition 10.16 Subtraktion


Ved differensen af to vektorer v og u forstås vektoren

v u = v + ( u) . (10-1)

Det er ikke nødvendigt at indføre en højtidelig definition for division af vektor


med skalar. Vi betragter den blot som en omskrivning af multiplikation med
skalar:
v 1
= · v , k 6= 0
k k

10.3 Linearkombinationer

En pointe ved regnereglen (u + v) + w = u + (v + w) fra sætning 10.13 er, at man kan


udelade parenteser, når man skal addere en række vektorer, da det ingen betydning
har for den resulterende vektor, i hvilken rækkeflge man har lagt vektorerne sammen.
Dette er baggrunden for linearkombinationer, hvor et sæt af vektorer er multipliceret med
skalarer og derefter er opskrevet som en sum.

Definition 10.17 Linearkombination


Når der er givet reelle tal k1 , k2 , . . . , k n og i planen eller rummet vektorerne
v1 , v2 , . . . , vn , så kaldes summen

k1 v1 + k2 v2 + . . . + k n vn

en linearkombination af de n givne vektorer.

Hvis alle koefficienterne k1 , · · · , k n er lig med 0, kaldes linearkombinationen ue-


gentlig. Men hvis blot én af dem er forskellig fra 0, er den egentlig.
eNote 10 10.3 LINEARKOMBINATIONER 13

Eksempel 10.18 Konstruktion af en linearkombination

d
3c
c b

O a O 2a
-b

Figur 6.9: Konstruktion af linearkombination

På figur 6.9 til venstre er vektorerne a, b og c indtegnet. På figuren til højre har vi konstrueret
linearkombinationen d = 2a b + 3c.

Som eksempel 10.18 viser, beskriver en linearkombination netop blot den nye
vektor, man får ved at forlænge andre vektorer og lægge dem sammen.

Opgave 10.19

Der er i planen givet vektorerne u, v, s og t samt parallelogrammet A, se figur 6.10.

A
s t

O u

Figur 6.10: Linearkombinationer

1. Opskriv s som en linearkombination af u og v.


1
2. Vis, at v kan udtrykkes ved linearkombinationen v = 3 s + 16 t.
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 14

3. Indtegn linearkombinationen s + 3u v.

4. Bestem reelle tal a, b, c og d således, at A kan beskrives ved parameterfremstillingen


!
A = { P OP= xu + yv hvor x 2 [ a; b ] og y 2 [ c; d ]} .

10.4 Lineær afhængighed og lineær uafhængighed

Hvis to vektorer har repræsentanter på den samme rette linje, siger man, at de er lineært
afhængige. Det er klart, at to egentlige vektorer er lineært afhængige, hvis de er paral-
lelle. I modsat fald er de lineært uafhængige. Vi kan formulere det således, at to vektorer u
og v er lineært afhængige, hvis den ene kan fremkomme af den anden ved multiplikation
med en skalar forskellig fra 0, dvs. hvis der findes et tal k 6= 0 således, at
v = ku .

Kort sagt, to vektorer er lineært afhængige, "‘hvis den ene kan beskrive den an-
den"’. To parallelle vektorer kan beskrive hinanden ved, at den ene kopieres
og lægges til (eller trækkes fra) sig selv et vist antal gange; altså, ved at den
forlænges eller forkortes.

To vinkelrette eller blot ikke-parallelle vektorer kan derimod aldrig beskrive hi-
nanden, uanset hvor meget vi forlænger eller forkorter dem, da vi er nødt til
at dreje den ene, før det bliver muligt. Disse er derfor lineært uafhængige.

Denne oprindelige betydning af begreberne lineær afhængighed og uafhængighed ønsker


vi at generalisere sådan, at begreberne kan bruges om et vilkårligt sæt af vektorer.

Definition 10.20 Lineær afhængighed og uafhængighed


Et sæt af vektorer (v1 , v2 , . . . , vn ), hvor n 2 , kaldes lineært afhængigt, hvis mindst
én af vektorerne kan skrives som en linearkombination af de øvrige.

Hvis ingen af vektorerne kan skrives som en linearkombination af de øvrige, kaldes


sættet for lineært uafhængigt.

Et sæt, som kun består af én vektor, kaldes lineært afhængigt, hvis vektoren er 0-
vektoren, og ellers lineært uafhængigt.
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 15

Eksempel 10.21 Lineært afhængige og lineært uafhængige vektorsæt

I planen er givet tre vektorsæt (u, v), (r, s) og (a, b, c) , se figur 6.11.

c
u
v

b
a

r
s

Figur 6.11: Tre vektorsæt

Sættet (u, v) er lineært afhængigt, idet der for eksempel gælder:

u= 2v .

Også sættet (a, b, c) er lineært afhængigt, da for eksempel

b=a c.

Kun sættet (r, s) er lineært uafhængigt, da der ikke findes måder, hvorpå de kan beskrive
hinanden.

Opgave 10.22

Gør rede for, at tre vektorer i rummet er lineært afhængige, hvis og kun hvis de har repræsen-
tanter, som ligger i samme plan. Hvilke betingelser må tre vektorer i rummet opfylde, for at
de er lineært uafhængige?

Opgave 10.23

Overvej (intuitivt), hvad der er det maksimale antal vektorer, som et vektorsæt i planen kan
rumme, hvis sættet skal være lineært uafhængigt. Samme spørgsmål for rummet.
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 16

Når man skal undersøge, om et sæt af vektorer er lineært uafhængigt eller lineært
afhængigt, giver definition 10.20 ikke umiddelbart en praktisk fremgangsmåde. Det
kan være nemmere at bruge sætningen, der følger nedenfor. Den bygger på, at et vek-
torsæt er lineært afhængigt, hvis og kun hvis 0-vektoren kan opskrives som en egentlig
linearkombination af vektorerne. Antag som en opvarmning til sætningen, at sættet
(a, b, c) er lineært afhængigt, fordi

c = 2a 3b.

Så kan 0-vektoren fremstilles ved den egentlige linearkombination

2a 3b c = 0.

Antag omvendt, at 0-vektoren er en egentlig linearkombination af vektorerne u, v og w


således:
2u 2v + 3w = 0 .
Så har vi for eksempel, at
2 2
w=
u+ v
3 3
og dermed, at vektorerne er lineært afhængige.

Sætning 10.24 Lineær uafhængighed


Lad k1 , k2 , . . . , k n være reelle tal. At vektorsættet (v1 , v2 , . . . , vn ) er lineært
uafhængigt, er ensbetydende med, at ligningen

k1 v1 + k2 v2 + · · · + k n vn = 0 (10-2)

kun er opfyldt, når alle koefficienterne k1 , k2 , . . . , k n er lig med 0 .

Bevis

Antag, at sættet (v1 , v2 , . . . , vn ) er lineært afhængigt, og lad vi være en vektor, som kan
skrives som en linearkombination af de øvrige. Vi nyordner (om nødvendigt) sættet, så i = 1,
hvorefter v1 kan skrives på formen

v1 = k 2 v2 + · · · + k n v n , v1 k 2 v2 ··· k n vn = 0 . (10-3)

0-vektoren er hermed opskrevet på formen (10-2), hvor ikke alle koefficienter er 0 , idet koef-
ficienten til v1 er 1 .
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 17

Antag omvendt, at sættet er skrevet på formen (10-2), og lad k i 6= 0 . Vi nyordner (om nød-
vendigt) sættet, så i = 1, hvorefter vi har

k2 kn
k1 v1 = k2 v2 ··· k n vn , v1 = v2 ··· vn . (10-4)
k1 k1
Heraf ses det, at sættet er lineært afhængigt.

Eksempel 10.25 Lineært afhængigt sæt

Ethvert vektorsæt, som indeholder nul-vektoren, er lineært afhængigt. Betragt for eksempel
sættet (u, v, 0, w). Det er oplagt, at nul-vektoren kan skrives som linearkombination af de
øvrige tre vektorer:
0 = 0u + 0v + 0w .

Parameterfremstillinger for planer i rummet opstilles ved hjælp af to lineært uafhængige


vektorer. Nedenfor giver vi først et eksempel på en plan, der indeholder origo, og
dernæst et eksempel på en plan, der ikke indeholder origo.

Eksempel 10.26 Parameterfremstilling for en plan

Der er givet en plan i rummet, som går gennem origo. Beskriv punkterne i planen
ved hjælp af en parameterfremstilling.
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 18

R
v
O

P
u

Figur 6.12: En plan i rummet gennem origo

På den givne plan vælges to punkter Q og R, som ikke er origo, og som ikke ligger på en
! !
fælles linje gennem origo. Vektorerne u =OQ og v =OR vil da være lineært uafhængige, og
kaldes planens retningsvektorer. Til ethvert punkt P i planen findes der netop ét reelt talpar
!
(s, t) således, at OP= su + tv . Omvendt findes der også til ethvert reelt talpar (s, t) netop ét
!
punkt P i planen, som opfylder OP= su + tv . Man siger, at
!
{ P | OP= su + tv , (s, t) 2 R2 }

er en parameterfremstilling for den givne plan.

Eksempel 10.27 Parameterfremstilling for en plan

En plan i rummet går ikke gennem origo. Beskriv den ved hjælp af en para-
meterfremstilling.
eNote 10 10.4 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 19

R
P
v

B u
Q

Figur 6.13: En plan i rummet

!
Først vælges der et begyndelsespunkt B i planen, og vi sætter b =OB. Dernæst vælges der
! !
to lineært uafhængige retningsvektorer u = BQ og v = BR, hvor Q og R ligger i planen. Til
ethvert punkt P i planen findes der så netop ét reelt talpar (s, t) således, at
! ! !
OP=OB + BP= b + su + tv .

Omvendt findes der ligeledes til ethvert reelt talpar (s, t) netop ét punkt P i planen, som
!
opfylder OP= b + su + tv . Man siger, at
!
{ P | OP= b + su + tv , (s, t) 2 R2 }

er en parameterfremstilling for den givne plan.

Vi anfører nu en generel metode til at opstille en parameterfremstilling for en plan.


Bemærk at intervallerne, her kaldt I1 og I2 , kan vælges frit med det formål at afgrænse
planen fremfor at lade den strække sig uendeligt i hver retning.
eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 20

Metode 10.28 Parameterfremstilling for en plan


Givet en plan m og tre forskellige punkter R, B og Q på m samt origo O. Vektorerne
! !
v = BR og u = BQ kaldes retningsvektorer for m . En parameterfremstilling for m er da
!
m = { P | OP= b + su + tv hvor s 2 I1 og t 2 I2 } ,
!
hvor b =OB, og I1 såvel som I2 er givne intervaller.

Opgave 10.29

Giv en parameterfremstilling for det i planen liggende parallelogram A, som vist i figur 6.14.

v
A B
u

Figur 6.14: Et parallellogram i planen

10.5 De sædvanlige baser i planen og rummet

I den analytiske geometri viser man, hvordan tal og ligninger kan beskrive geometriske
objekter og fænomener herunder vektorer. Her er begrebet koordinater afgørende. Det
handler nemlig om, hvordan vi kan fastlægge de geometriske objekters placering i rum-
met og i forhold til hinanden ved hjælp af tal og talsæt.

For at få grundlaget i orden skal vi vælge et vist antal vektorer, som vi udnævner til
basisvektorer. Basisvektorer er vektorer, der ved hinandens hjælp udspænder et rum fuld-
stændigt (fx et 2D- eller 3D-rum), forstået på den måde at de kan beskrive alle andre
eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 21

vektorer i dette rum. Basisvektorerne ordnes — dvs. arrangeres i en bestemt rækkefølge


— og udgør herefter en basis for det pågældende rum. Når en basis er givet, kan samtlige
vektorer, der overhovedet er mulige at lave i det pågældende rum, beskrives ved hjælp
af koordinater, som er basisvektorernes koefficienter, og koordinaterne samler vi som
regel i såkaldte koordinatvektorer.

Hvordan hele denne procedure foregår, udfolder vi først gennem standardbaserne i pla-
nen og rummet. Senere kommer vi ind på, at det ofte kan være hensigtsmæssigt at
benytte andre baser end de sædvanlige, og på hvordan relationen mellem en vektors
koordinater er i forskellige baser.

Definition 10.30 Standardbasis i planen


Ved en standardbasis eller sædvanlig basis for de geometriske vektorer i planen forstås
et ordnet sæt af to vektorer (i, j), som opfylder:

• i har længden 1 , og

• j = bi (det vil sige, j er tværvektor for i ).

Ved et sædvanligt koordinatsystem i planen forstås en standardbasis (i, j) sammen med


et valgt origo O . Koordinatsystemet skrives (O, i, j) . Ved x-aksen og y-aksen forstås
orienterede tallinjer gennem O, som er parallelle med henholdsvis i og j .
Y

j
i
X
O 1

Figur 6.15: Sædvanligt koordinatsystem i planen


eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 22

Sætning 10.31 En vektors koordinater


Hvis e = (i, j) er en standardbasis, kan enhver vektor v i planen på netop én måde
skrives som en linearkombination af i og j:

v = xi + yj.

Koefficienterne x og y i linearkombinationen kaldes v’s koordinater med hensyn til


basen e, eller kortere: v’s e-koordinater, og de samles i en koordinatvektor med følgende
skrivemåde: 
x
ev = .
y

Bemærk at den basis som v’s koordinater er udtrykt i, er angivet sænket på


venstre side af vektornavnet: e v.

Man giver normalt standardbasen navnet e.

Bevis

Medtages i næste opdatering af eNoten.


eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 23

Definition 10.32 Et punkts koordinater


Lad P være et vilkårligt punkt i planen, og lad (O, i, j) være et sædvanligt koor-
dinatsystem i planen. Ved koordinaterne for P med hensyn til koordinatsystemet
!
forstås koordinaterne for stedvektoren OP med hensyn til standardbasen (i, j) .

Y
P(x,y)
y

a
yj
j
X
x xi O i

Figur 6.16: Et punkts koordinater

Indføringen af sædvanlig basis og koordinater for vektorer i rummet er en simpel ud-


videlse af den i planen.
eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 24

Definition 10.33 Standardbasis i rummet


Ved en standardbasis eller sædvanlig basis for de geometriske vektorer i rummet
forstås et ordnet sæt af tre vektorer (i, j, k), som opfylder:

• i, j og k har alle længden 1,

• i, j og k er parvist ortogonale, og

• når i, j og k afsættes ud fra et valgt punkt, og når vi betragter i og j fra en-


depunktet af k, så overgår i i j, når i drejes omkring det valgte punkt med
vinklen p2 mod uret.

Ved et sædvanligt koordinatsystem i rummet forstås en standardbasis (i, j, k) sammen


med et valgt origo O . Koordinatsystemet skrives (O, i, j, k) . Ved x-aksen, y-aksen
og z-aksen forstås orienterede tallinjer gennem origo O, som er parallelle med hen-
holdsvis i , j og k .

k
j 1
i O Y
1

Figur 6.17: Sædvanligt koordinatsystem i rummet


eNote 10 10.5 DE SÆDVANLIGE BASER I PLANEN OG RUMMET 25

Sætning 10.34 En vektors koordinater


Hvis e = (i, j, k) er en standardbasis, kan enhver vektor v i rummet på netop én
måde skrives som en linearkombination af i, j og k:

v = xi + yj + zk.

Koefficienterne x, y og z i linearkombinationen kaldes v’s koordinater med hensyn til


e-basis, eller kortere: v’s e-koordinater, og de samles i en koordinatvektor med følgende
skrivemåde: 2 3
x
ev = y 5 .
4
z

Definition 10.35 Et punkts koordinater


Lad P være et vilkårligt punkt i rummet, og lad (O, i, j, k) være et sædvanligt koor-
dinatsystem i rummet. Ved koordinaterne for P med hensyn til koordinatsystemet
!
forstås koordinaterne for stedvektoren OP med hensyn til standardbasen (i, j, k) .

P
k a
y
i j Y
O zk
xi+yj
x
Q
X
Figur 6.18: Et punkts koordinator i rummet
eNote 10 10.6 VILKÅRLIGE BASER I PLANEN OG I RUMMET 26

10.6 Vilkårlige baser i planen og i rummet

Hvis der i planen er givet to lineært uafhængige vektorer, er det muligt at skrive enhver
anden vektor i planen som en linearkombination af de to givne vektorer. På figur 6.19
betragter vi som eksempel de to lineært uafhængige vektorer a1 og a2 samt to andre
vektorer u og v.

v u

a2

O a1

Figur 6.19: Koordinatsystem i planen med basis (a1 , a2 )

Vi ser, at
u = 1a1 + 2a2 og v= 2a1 + 2a2 . (10-5)
Disse linearkombinationer er entydige, idet u og v ikke kan skrives som linearkombi-
nation af a1 og a2 ved at benytte andre koefficienter end dem, der her indgår. Enhver
anden vektor i planen kan på tilsvarende vis skrives som en entydig linearkombination
af a1 og a2 . Man siger, at de to vektorer a1 og a2 udspænder hele planen.

Dette gør det muligt at generalisere begrebet basis. I stedet for en standardbasis e =
(i, j) kan vi lige såvel vælge at benytte vektorsættet (a1 , a2 ) som en basis for vektorerne
i planen, netop fordi sættet af a1 og a2 udspænder samme plan som e. Hvis vi kalder
basen a, så a = (a1 , a2 ), siger man, at koefficienterne, der ses i linearkombinationerne
ovenfor, er koordinaterne til u henholdsvis v med hensyn til basen a, eller kortere: u og v’s
a-koordinater, hvilket skrives således:
 
1 2
au = og a v = . (10-6)
2 2

For mængden af geometriske vektorer i rummet går vi frem på tilsvarende måde. Er


der givet tre lineært uafhængige vektorer, kan enhver vektor i rummet på entydig vis
skrives som en linearkombination af de tre givne vektorer. De udspænder hele rummet.
Vi kan derfor i samme stil vælge de tre vektorer som en basis for alle rumvektorer og
eNote 10 10.6 VILKÅRLIGE BASER I PLANEN OG I RUMMET 27

udtrykke en vilkårlig rumvektor ved hjælp af koordinater med hensyn til denne basis.
En fremgangsmåde til at bestemme koordinaterne er vist på figur 6.20, hvor der er givet
en a-basis (a1 , a2 , a3 ) samt en vilkårlig vektor u.

a3
a2
O
Q
a1

Figur 6.20: Koordinatsystem med basis (a1 , a2 , a3 )

Husk på, at vektorerne i en basis ikke behøver at være vinkelrette på hinanden


(ortogonale), som vi ellers er vant til med den sædvanlige standardbasis både
i planen og i rummet. De skal blot være lineært uafhængige.

Gennem u’s endepunkt P trækkes en linje, som er parallel med a3 . Det punkt,
hvor denne linje skærer den plan, der indeholder a1 og a2 , betegnes Q. Der
!
findes da to tal k1 og k2 , så OQ= k1 a1 + k2 a2 , fordi (a1 , a2 ) udgør en basis i den
!
plan, som indeholder a1 og a2 . Endvidere findes der et tal k3 , så QP= k3 a3 , da
!
QP og a3 er parallelle. Så har vi:
! !
u =OQ + QP= k1 a1 + k2 a2 + k3 a3 .

u har dermed koordinatsættet (k1 , k2 , k3 ) med hensyn til basis a.

Eksempel 10.36 Koordinater med hensyn til en vilkårlig basis

I rummet er der givet tre lineært uafhængige vektorer a1 , a2 og a3 som vist på figur 6.21.
eNote 10 10.6 VILKÅRLIGE BASER I PLANEN OG I RUMMET 28

a1
a3
O
a2

Figur 6.21: Koordinatsystem med basis (a1 , a2 , a3 )

Da u kan skrives som en linearkombination af a1 , a2 og a3 ved

u = 3a1 + a2 + 2a3 , (10-7)

så har u koordinaterne (3, 1, 2) med hensyn til basen a givet ved a = (a1 , a2 , a3 ), hvilket kort
skrives som en koordinatvektor således:
2 3
3
au = 1 5 .
4 (10-8)
2

Vi samler overvejelserne om vilkårlige baser ovenfor i den følgende mere formelle def-
inition.
eNote 10 10.6 VILKÅRLIGE BASER I PLANEN OG I RUMMET 29

Definition 10.37 Vektorers koordinater med hensyn til en basis

• Ved en basis a for de geometriske vektorer i planen forstås et vilkårligt ordnet


sæt af to lineært uafhængige vektorer (a1 , a2 ). Lad en vilkårlig vektor u være
bestemt ved linearkombinationen u = xa1 + ya2 . Koefficienterne x og y kaldes
u’s koordinater med hensyn til basis a, eller kortere: u’s a-koordinater, og de samles
i en koordinatvektor med følgende skrivemåde:

x
au = . (10-9)
y

• Ved en basis b for de geometriske vektorer i rummet forstås et vilkårligt ordnet


sæt af tre lineært uafhængige vektorer (b1 , b2 , b3 ). Lad en vilkårlig vektor v
være bestemt ved linearkombinationen v = xb1 + yb2 + zb3 . Koefficienterne
x, y og z kaldes for v’s koordinater med hensyn til basis b, eller kortere: v’s b-
koordinater, og de samles i en koordinatvektor med følgende skrivemåde:
2 3
x
4
bv = y .
5 (10-10)
z

En given vektors koordinatsæt ændres, når man skifter basis. Denne afgørende pointe
tager vi hul på i den følgende opgave.
eNote 10 10.6 VILKÅRLIGE BASER I PLANEN OG I RUMMET 30

Opgave 10.38

j a2

O i
a1

Figur 6.22: Basisskifte

På figur 6.22 er der i planen givet standardbasis e = (i, j) samt en anden basis a = (a1 , a2 ).

1. En vektor u har koordinaterne (5, 1) med hensyn til basis e. Bestem u’s
a-koordinater.

2. En vektor v har koordinaterne ( 1, 2) med hensyn til basis a. Bestem v’s


e-koordinater.

Bemærk hvor vigtigt det er at man er klar over, hvilken basis koordinaterne er
givet i!
eNote 10 10.7 VEKTORREGNING VED HJÆLP AF KOORDINATER 31

Opgave 10.39

c
O
a d

Figur 6.23

1. Det fremgår af figur 6.23, at a, b og c er lineært uafhængige. En basis m kan derfor


defineres ved (a, b, c). Bestem koordinatvektoren m d.

2. Det fremgår også af figuren, at (a, b, d) er en basis. Lad os kalde denne basis n. Bestem
koordinatvektoren n c.

3. Indtegn med origo som begyndelsespunkt den vektor u, som har m-koordinaterne
2 3
2
m u = 4 1 5.
1

10.7 Vektorregning ved hjælp af koordinater

Når man har valgt en basis for de geometriske vektorer i planen (eller i rummet), så
kan alle vektorer beskrives og fastlægges ved hjælp af deres koordinater med hensyn
til den valgte basis. Til de to regneoperationer addition og multiplikation med skalar,
som tidligere er indført i denne eNote ved geometrisk konstruktion, får vi hermed et
særdeles praktisk alternativ. I stedet for at udføre de geometriske regne-konstruktioner
kan vi blot gennemføre taludregninger med de koordinater, der svarer til den valgte
basis.
eNote 10 10.7 VEKTORREGNING VED HJÆLP AF KOORDINATER 32

Vi illustrerer dette med et eksempel fra planen, hvor der er givet en basis a ved a =
(a1 , a2 ) samt to vektorer u og v afsat ud fra O, se figur 6.24. Opgaven består i at
bestemme vektoren b = 2u v, og vi vil gøre det på to forskellige måder.

v
a2 u
b (4,2)

O a1

Figur 6.24: Linearkombination bestemt vha. koordinater

Metode 1 (geometrisk): Vi udfører regneoperationerne som defineret i defini-


tion 10.2 og definition 10.3 ud fra de grå hjælpevektorer i figur 6.24.

Metode 2 (algebraisk): Vi aflæser koordinaterne for u og v og udfører regne-


operationerne direkte på koordinaterne:
  
1 2 4
ab = 2 au a v = 2 = . (10-11)
2 2 2

Herefter kan b tegnes direkte ud fra dens koordinater (4, 2) med hensyn til
basen a.

At vi har ret til at følge denne fremgangsmåde, fremgår af den følgende sætning.
eNote 10 10.7 VEKTORREGNING VED HJÆLP AF KOORDINATER 33

Sætning 10.40 Grundlæggende koordinat-regneregler


I planen eller rummet er der givet to vektorer u og v samt et reelt tal k . Der er
endvidere valgt en vilkårlig basis a. De to regneoperationer u + v og k u kan da
udføres ved hjælp af koordinater således:

1. a (u + v) = a u + a v

2. a (ku) = k a u

Sagt med ord: Koordinaterne for en vektorsum fås ved at lægge koordinaterne for
addenderne sammen. Og koordinaterne for en vektor ganget med et tal er vektorens
koordinater ganget med tallet.

Bevis

Vi gennemfører beviset for mængden af de geometriske rumvektorer. Antag, at koordi-


naterne for u og v med hensyn til den valgte basis a er givet ved
2 3 2 3
u1 v1
4
a u = u2 5 og a v = v2 5 .
4 (10-12)
u3 v3
Vi har da:
u = u1 a1 + u2 a2 + u3 a3 og v = v1 a1 + v2 a2 + v3 a3 (10-13)
og dermed ifølge den kommutative, associative og distributive regel fra sætning 10.13:
u + v = (u1 a1 + u2 a2 + u3 a3 ) + (v1 a1 + v2 a2 + v3 a3 )
(10-14)
= (u1 + v1 )a1 + (u2 + v2 )a2 + (u3 + v3 )a3 ,
hvilket medfører, at
2 3 2 3 2 3
u1 + v1 u1 v1
a (u + v) = u2 + v2 = u2 + v2 5 = a u + a v ,
4 5 4 5 4 (10-15)
u3 + v3 u3 v3
hvorefter første del af beviset er fuldført. Ved anden del af beviset benytter vi igen en dis-
tributiv regneregel fra sætning 10.13:
ku = k (u1 a1 + u2 a2 + u3 a3 ) = (k · u1 )a1 + (k · u2 )a2 + (k · u3 )a3 , (10-16)
hvilket medfører, at 2 3 2 3
k · u1 u1
a ( ku ) = 4 k · u2 5 = k4 u2 5 = k a u , (10-17)
k · u3 u3
eNote 10 10.7 VEKTORREGNING VED HJÆLP AF KOORDINATER 34

hvorefter anden del af beviset er fuldført.

Sætning 10.40 gør det muligt at gennemføre mere komplicerede regneopgaver ved hjælp
af koordinater, som de følgende eksempler viser.

Eksempel 10.41 Koordinatvektor for en linearkombination

De tre plane vektorer a, b og c har følgende koordinatvektorer med hensyn til en


valgt basis v:
  
1 0 5
va = , vb = og v c = . (10-18)
2 1 1
Bestem koordinatvektoren for d = a 2b + 3c med hensyn til basis v.

Vi går frem sådan:

vd = v (a 2b + 3c)
= v (a + ( 2)b + 3c)
= v a + v ( 2b) + v (3c)
= va 2 vb + 3 vc
   
1 0 5 16
= 2 +3 = .
2 1 1 3

Her opnås det tredje lighedstegn ved første del af sætning 10.40 og det fjerde lighedstegn ved
anden del af sætning 10.40.
eNote 10 10.7 VEKTORREGNING VED HJÆLP AF KOORDINATER 35

Eksempel 10.42 En plans parameterfremstilling i koordinater

R
v
O

P
u

Figur 6.25: En plan i rummet

Planen gennem origo, som er vist på figur 6.25, har ifølge eksempel 10.26 parameterfremstill-
ingen
!
{ P | OP= su + tv , (s, t) 2 R2 }. (10-19)
Antag, at der i rummet er givet en basis a, og at
2 3 2 3
u1 v1
4
a u = u2 5 og a v = v2 5 .
4
u3 v3

Parameterfremstillingen (10-19) kan da skrives på koordinatform således:


2 3 2 3 2 3
x u1 v1
4 y 5 = s4 u2 5+ t4 v2 5 , (10-20)
z u3 v3
!
hvor a OP= ( x, y, z) og (s, t) 2 R2 .
eNote 10 10.8 VEKTORLIGNINGER OG MATRIXALGEBRA 36

Eksempel 10.43 En plans parameterfremstilling i koordinater

R
P
v

B u
Q

Figur 6.26: En plan i rummet

Planen i figur 6.26 har ifølge eksempel 10.27 parameterfremstillingen


!
{ P | OP= b + su + tv ; (s, t) 2 R2 }. (10-21)

Antag, at der i rummet er givet en basis a, og at


2 3 2 3 2 3
b1 u1 v1
a b = 4 b2
5, a u = 4 u 2
5 og a v = 4 v2 5 .
b3 u3 v3

Parameterfremstillingen (10-21) kan da skrives på koordinatform således:


2 3 2 3 2 3 2 3
x b1 u1 v1
4 y 5 = 4 b2 5+ s4 u2 5+ t4 v2 5 , (10-22)
z b3 u3 v3
!
hvor a OP= ( x, y, z) og (s, t) 2 R2

10.8 Vektorligninger og matrixalgebra

En lang række problemer vedrørende vektorer fører til vektorligninger. Hvis vi ønsker
at løse ligningerne ved hjælp af vektorernes koordinater med hensyn til en given basis,
opstår der lineære ligningssystemer. Problemerne kan da løses ved hjælp af matrix-
eNote 10 10.8 VEKTORLIGNINGER OG MATRIXALGEBRA 37

metoder, der ligger i forlængelse af eNote 6. Det viser vi eksempler på i dette afsnit,
som opsummeres ved hjælp af begrebet koordinatmatricer (se særligt den afsluttende
opgave 10.47).

Eksempel 10.44 Om en vektor er en linearkombination af andre vektorer

Der er i rummet givet en basis a og tre vektorer u, v og p, som med hensyn til basis
a har koordinaterne
2 3 2 3 2 3
2 1 0
4 5
au = 1 , av = 4 4 5 og a p = 7 5 .
4
5 3 1

Undersøg, om p er en linearkombination af u og v.

Vi skal undersøge, om der findes koefficienter k1 , k2 således, at

k1 u + k2 v = p .

Vi opstiller den tilsvarende koordinatvektorligning


2 3 2 3 2 3
2 1 0
k 1 4 1 5+ k 2 4 4 5 = 4 7 5 ,
5 3 1

som er ækvivalent med det lineære ligningssystem

2k1 + k2 = 0
k1 + 4k2 = 7 (10-23)
5k1 + 3k2 = 1 .

Vi ser på ligningssystemets totalmatrix T og angiver (uden mellemregninger) matricens


trappeform:
2 3 2 3
2 1 0 1 0 1
T = 4 1 4 7 5 ! trap(T) = 4 0 1 2 5, (10-24)
5 3 1 0 0 0
hvor trappeformen er ækvivalent med det reducerede lineære ligningssystem

1k1 + 0k2 = 1
k1 = 1
0k1 + 1k2 = 2 , (10-25)
k2 = 2 .
0k1 + 0k2 = 0
eNote 10 10.8 VEKTORLIGNINGER OG MATRIXALGEBRA 38

Ligningssystemet har altså netop én løsning for de to ubekendte: k1 = 1 og k2 = 2, hvorfor


der åbenbart gælder:
1u + 2v = p .

Eksempel 10.45 Om et vektorsæt er lineært afhængigt

Der er i rummet givet en basis v og tre vektorer a, b og c, som med hensyn til denne
basis har koordinaterne
2 3 2 3 2 3
5 1 2
v a = 4 1 5, v b = 4 0 5 og v c = 4 3 5.
3 4 1

Undersøg, om vektorsættet (a, b, c) er lineært afhængigt.

Vi vil undersøge, om der findes en egentlig linearkombination

k1 a + k2 b + k3 c = 0 ,

da sætning 10.24 fortæller, at vektorerne er lineært afhængige, hvis der findes andre løsninger
til denne ligning end nulløsningen (k1 , k2 , k3 ) = 0. Vi ser på den tilsvarende koordinatvek-
torligning,
2 3 2 3 2 3 2 3
5 1 2 0
k 1 4 1 5+ k 2 4 0 5+ k 3 4 3 5 = 4 0 5 ,
3 4 1 0
som er ækvivalent med det homogene lineære ligningssystem

5k1 + k2 + 2k3 = 0
k1 + 3k3 = 0 (10-26)
3k1 + 4k2 + k3 = 0 .

Vi opstiller ligningssystemets totalmatrix T og angiver (uden mellemregninger) matricens


trappeform:
2 3 2 3
5 1 2 0 1 0 0 0
T =4 1 0 3 0 5 ! trap(T) = 4 0 1 0 0 5 (10-27)
3 4 1 0 0 0 1 0
Vi ser, at ligningssystemet kun har nulløsningen k1 = 0, k2 = 0 og k3 = 0. Det undersøgte
vektorsæt (a, b, c) er derfor lineært uafhængigt. Man ville derfor kunne vælge (a, b, c) som
en ny basis for mængden af rumvektorer.
eNote 10 10.8 VEKTORLIGNINGER OG MATRIXALGEBRA 39

I det følgende eksempel genoptager vi diskussionen om forholdet mellem koordinater


og basisskifte fra opgave 10.38.

Eksempel 10.46 Nye koordinater når der skiftes basis

j a2

O i
a1

Figur 6.27: Basisskifte

På figur 6.27 er der i planen givet en standardbasis e = (i, j) og en anden basis a = (a1 , a2 ).
Når der skiftes basis, ændres givne vektorers koordinater. Her opstiller vi en systematisk
metode til at udtrykke ændringen i koordinater ved hjælp af et matrixvektorprodukt. Først
aflæser vi a-basisvektorernes e-koordinater:
 
1 1
e a1 = og e a2 = . (10-28)
2 1


v1
Antag, at en vektor v har koordinatsættet a v = . Bestem e-koordinaterne for v.
v2

Vi har, at v = v1 a1 + v2 a2 , og dermed ifølge sætning 10.40:


    
1 1 1 1 v1 1 1
e v = v1 + v2 = = av .
2 1 2 1 v2 2 1

1 1
Hvis vi sætter M = , udtrykkes v’s e-koordinater ved matrixvektorproduktet
2 1

ev = M · av . (10-29)
eNote 10 10.8 VEKTORLIGNINGER OG MATRIXALGEBRA 40

Det ses, at matricen M "‘skifter basis"’ på vektoren i denne operation. Vi kan med
fordel tilføje en synlig markering af, at den skifter fra a-koordinater til e-koordinater,
ved at skrive e Ma . Denne notation vil blive brugt flittigt fremover.


v1
Antag, at en vektor v har koordinatsættet e v = . Bestem a-koordinaterne for v.
v2

Vi benytter den allerede fundne sammenhæng (10-29) og ganger fra venstre på begge sider
af ligmedtegnet med den inverse matrix til M. Vi får herved a v isoleret som ønsket:
1 1 1
M ·e v = M · M · av , av =M · ev . (10-30)

Mens M "‘skiftede basis"’ på vektoren før, er det nu M 1 der har denne rolle. Det
tyder på at hvis en matrix skifter koordinater én vej, så skifter dens inverse matrix
koordinater den anden vej. Dette undersøges nærmere i eNote 11 hvor vi viser:
1
e Ma , a (M )e .

Opgave 10.47

Ved en koordinatmatrix med hensyn til en given basis a for et sæt af vektorer forstår man
den matrix, der opstår, når man sætter vektorernes a-koordinatvektorer sammen til en matrix.

Beskriv matricen T i eksempel 10.44 og eksempel 10.45 og matricen M i eksempel 10.46 som
koordinatmatricer.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 41

10.9 Sætninger om vektorer i en standard e-basis

I dette afsnit arbejder vi med standard-koordinatsystemer både i planen og rummet.


Vi indfører to forskellige multiplikationer mellem vektorer: prikproduktet, der både de-
fineres i planen og rummet, og krydsproduktet, der kun defineres i rummet. Vi ser på ge-
ometriske anvendelser af disse multiplikationsformer og på geometriske fortolkninger
af determinanter.

10.9.1 Prikproduktet af to vektorer

Definition 10.48 Prikprodukt i planen


 
a1 b
I planen er der givet to vektorer e a = og e b = 1 . Ved prikproduktet (eller
a2 b2
skalarproduktet) af a og b forstås tallet

a · b = a1 · b1 + a2 · b2 . (10-31)

Definition 10.49 Prikprodukt i rummet


2 3 2 3
a1 b1
I rummet er der givet to vektorer e a = a2 og e b = b2 5. Ved prikproduktet (eller
4 5 4
a3 b3
skalarproduktet) af a og b forstås tallet

a · b = a1 · b1 + a2 · b2 + a3 · b3 . (10-32)

For prikproduktet mellem to vektorer gælder de følgende regneregler.


eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 42

Sætning 10.50 Regneregler for prikprodukt


Givet tre vektorer a, b og c i planen eller rummet samt tallet k. Der gælder:

1. a · b = b · a (kommutativ regel)

2. a · (b + c) = a · b + a · c (distributiv regel)

3. (ka) · b = a · (kb) = k (a · b)

4. a · a = |a|2

5. |a + b|2 = |a|2 + |b|2 + 2a · b.

Bevis

Reglerne 1, 2 og 3 følger af simpel koordinatudregning. Regel 4 følger af Pythagoras’ sætning,


og regel 5 er en direkte følge af reglerne 1, 2 og 4.

I de efterfølgende tre sætninger ser vi på geometriske anvendelser af prikproduktet.

Sætning 10.51 Længde af en vektor


Lad v være en vilkårlig vektor i planen eller rummet. Længden af v opfylder:
p
|v| = v · v . (10-33)

Bevis

Sætningen følger umiddelbart af regneregel 4 i sætning 10.50.


eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 43

Eksempel 10.52 Længde af en vektor

Givet vektoren v i rummet og, at e v = (1, 2, 3). Vi har da


p p
|v| = 12 + 22 + 32 = 14 .

Den efterfølgende sætning handler om vinklen mellem to vektorer, se figur 6.28.

b v

O a

Figur 6.28: Vinklen mellem to vektorer

Sætning 10.53 Vinkel mellem vektorer


I planen eller rummet er der givet to egentlige vektorer a og b. Vinklen v mellem a
og b opfylder:
a·b
cos(v) = (10-34)
|a||b|

Bevis

Sætningen kan vises ud fra cosinus-relationen. Undervejs får man også brug for regel 5 i
sætning 10.50. Detaljerne overlades til læseren.

Af sætningen ovenfor følger umiddelbart følgende sætning.


eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 44

Følgesætning 10.54 Vinklers størrelsesforhold


Betragt situationen i figur 6.28. Der gælder:

1. a · b = 0 , vinkel(a, b) = p
2

2. a · b > 0 , vinkel(a, b) < p


2

3. a · b < 0 , vinkel(a, b) > p


2

De to følgende sætninger er tilegnet ortogonale projektioner. På figur 6.29 er der i planen


eller rummet afsat to vektorer a og b ud fra origo.

O v a P
proj(b,a)

Figur 6.29: To vektorer afsat i planen

Betragt det vinkelrette nedfældningspunkt P af b’s endepunkt på den linje, som inde-
!
holder a. Ved den ortogonale projektion af b på a forstås vektoren proj(b, a) =OP.

Sætning 10.55 Længden af en projektion


Givet to egentlige vektorer a og b i planen eller rummet. Om længden af den ortog-
onale projektion af b på a gælder:

|a · b|
|proj(b, a)| = . (10-35)
|a|

Hvis du siger "‘projektionen af b på a"’, så er det nemt at huske rækkefølgen af


vektorerne i udtrykket proj(b, a) ..
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 45

Bevis

Ved brug af kendt sætning vedrørende retvinklede trekanter samt sætning (10.53) fås

|a · b|
|proj(b, a)| = | cos(v)| |b| = .
|a|

Sætning 10.56 Formel for projektionsvektor


Givet to egentlige vektorer a og b i planen eller rummet. Om den ortogonale projek-
tion af b på a gælder:
a·b
proj(b, a) = a. (10-36)
|a|2

Bevis

Hvis a og b er ortogonale, er sætningen klart opfyldt, da projektionen i så fald er nul-


vektoren. I modsat fald lad sign(a · b) betegne fortegnet for a · b. Der gælder, at sign er
positiv netop, når a og proj(b, a) er ensrettede, og negativ netop, når de er modsatrettede. Vi
får derfor:
a a·b
proj(b, a) = sign(a · b) · |proj(b, a)| = a,
|a| |a|2
a
hvor vi undervejs har benyttet sætning 10.55 samt, at |a|
er en enhedsvektor pegende i a’s
retning.

Bemærk i beviset, at en enhedsvektor altid kan skaffes i en bestemt retning ved


at dividere en vilkårlig vektor i den retning med sin egen længde.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 46

10.9.2 Geometrisk tolkning af determinant af (2 ⇥ 2)-matrix

En trekant 4( p, a, b) er bestemt ved to vektorer afsat ud fra et fælles begyndelsespunkt


p, se figur 6.30. Sætningen herunder viser, hvordan en sådan trekants areal kan udreg-
nes vha. determinanten.

Figur 6.30: En trekant udspændt af to vektorer i planen

Sætning 10.57 Areal af trekant ved determinant


Arealet af trekant 4( p, a, b), hvor a og b er vektorer afsat ud fra et fælles begyn-
delsespunkt p, er den numeriske værdi af den halve determinant af den (2 ⇥ 2)-
matrix, der fås ved at sætte a og b ind som søjler i matricen:

1
Areal(4( p, a, b)) = | det ( [a b] ) |
2

Bevis

Arealet af en trekant er som bekendt halvdelen af grundlinjen gange højden, Areal(4) = 12 gh.
Vi kan vælge længden |a| af a som grundlinje, g = |a|. Højden i trekanten er længden af b’s
projektion ind på en linje vinkelret på a, dvs. a’s tværvektor b
a:
|b · b
a|
h = |proj(b, b
a)| = (10-37)
a|
|b
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 47


a2
jævnfør sætning 10.55. Tværvektoren er givet ved b
a= . Derfor er arealet:
a1

1
Areal(4( p, a, b)) = hg
2
1 |b · b a|
= |a|
2 a|
|b
1
= |b · ba|
2
(10-38)
1
= | a1 b2 a2 b1 |
2
✓ ◆
1 a1 b1
= det
2 a2 b2
1
= | det ( [a b] ) | .
2

Vi har benyttet ved tredje ligmedtegn, at |a| = |b


a|, og har ved femte ligmedtegn brugt formlen
for determinanten af en (2 ⇥ 2)-matrix baglæns. Sætningen er hermed blevet bevist.

Af sætning 10.57 følger umiddelbart følgende.

Følgesætning 10.58 Areal af parallelogram ved determinant


Arealet af det af vektorerne a og b udspændte parallelogram er lig med den nu-
meriske værdi af determinanten af den (2 ⇥ 2)-matrix, der fås ved at sætte a og b
ind som søjler i matricen.

10.9.3 Krydsprodukt og rumprodukt

Krydsproduktet af to vektorer og rumproduktet af tre vektorer indføres ved hjælp af deter-


minanter.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 48

Definition 10.59 Krydsprodukt


2 3 2 3
a1 b1
I rummet er der givet to vektorer e a = a2 og e b = b2 5.
4 5 4
a3 b3
Ved krydsproduktet (eller vektorproduktet) a ⇥ b af a og b forstås vektoren v givet ved
2  3
a2 b2
6 det a3 b3 7
6  7
6 a 3 b3
7
6
e v = 6 det
7. (10-39)
a 1 b1
7
6  7
4 a b 5
det 1 1
a2 b2

Krydsproduktet har en markant geometrisk betydning. Sammenhold figur 6.31 og den


efterfølgende sætning.

axb

b
p v
a

Figur 6.31: Krydsprodukt vist geometrisk


eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 49

Sætning 10.60 Areal af trekant ved krydsprodukt


For to lineært uafhængige vektorer a og b, som har den mellemliggende vinkel v,
opfylder krydsproduktet a ⇥ b følgende:

1. a ⇥ b er ortogonal på både a og b .

2. |a ⇥ b| = 2 · Areal(4( p, a, b)) .

3. Vektorsættet (a, b, a ⇥ b) er i højrestilling: Set fra spidsen af a ⇥ b er retningen


fra a til b mod uret.

Som det sidste punkt i sætningen antyder, er faktorernes orden ikke ligegyldig
i krydsprodukter.

Højrehåndsreglen er god til at huske højrestillinger: Grib fat med din højre hånd
om vektor a ⇥ b, så tommelfingeren peger langs med vektoren i positiv retning.
Dine andre fingre, der kurver omkring vektoren, peger da i retningen fra a
imod b.

Omvendt, hvis du tager krydsproduktet af to vektorer a og b, så kurv dine


fingre i retningen fra a imod b, og du ved straks, hvilken vej den resulterende
vektor a ⇥ b peger, nemlig langs med tommelfingeren.

Af sætning 10.60 følger umiddelbart følgende.

Følgesætning 10.61 Areal af parallelogram ved krydsprodukt


Arealet af det parallelogram, der udspændes af vektorerne a og b, er lig med |a ⇥ b|.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 50

Definition 10.62 Rumprodukt


32 2 3 2 3
a1 b1 c1
Rumproduktet Rum(a, b, c) af tre vektorer e a = a2 , e b = b2 og e c = c2 5
4 5 4 5 4
a3 b3 c3
defineres ved
Rum(a, b, c) = (a ⇥ b) · c ,
hvilket videre kan udtrykkes ved

Rum(a, b, c) = (a ⇥ b) · c
= (c1 ( a2 b3
a3 b2 ) + c2 ( a3 b1 a1 b3 ) + c3 ( a1 b2 a2 b1 )
02 31
a1 b1 c1
(10-40)
= det @4 a2 b2 c2 5A
a3 b3 c3
= det ([e a e b e c]) .

10.9.4 Geometrisk tolkning af determinant af (3 ⇥ 3)-matrix

Et tetraeder ⇥( p, a, b, c) (en "‘trekantet pyramide"’) er udspændt af vektorerne a, b og c


afsat ud fra punktet p som vist i figur 6.32. Herunder gives en sætning til udregning af
rumfanget af et sådant tetraeder vha. determinanten.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 51

Figur 6.32: Et tetraeder udspændt af tre vektorer i rummet

Trekanter symboliseres sædvanligvis ved 4, tetraedre ved ⇥ og firkanter ved


⇤.

Sætning 10.63 Rumfang af tetraeder


Rumfanget af tetraederet ⇥( p, a, b, c) er

1
Vol(⇥( p, a, b, c)) = | det ([a b c]) | . (10-41)
6

Bevis

Fra elementær rumgeometri vides, at rumfanget Vol(⇥( p, a, b, c)) af et tetraeder ⇥( p, a, b, c),


der er udspændt af vektorerne a, b og c afsat ud fra punktet p, er en tredjedel af grundfladens
areal gange højden, Vol(⇥) = 13 Ah.

Vi vælger en vilkårlig af fladerne som grundflade. Arealet A af den trekantede grundflade


4( p, a, b) kan bestemmes vha. sætning 10.60:
1
A = Areal(4( p, a, b)) = |a ⇥ b| .
2
Den tilhørende højde h er den vinkelrette afstand fra grundfladen til modstående spids,
hvilket er lig med længden af projektionen af c på en vektor, der står lodret på grundfladen.
Jævnfør definitionen af krydsprodukt ved vi, at a ⇥ b netop står vinkelret på grundtrekanten.
Denne kan derfor bruges, så højden er

|(a ⇥ b) · c|
h = |proj(c, a ⇥ b)| = . (10-42)
|a ⇥ b|
Volumet bestemmes:
1
Vol(⇥( p, a, b, c)) =Ah
3
1 1 |(a ⇥ b) · c|
= · |a ⇥ b| (10-43)
3 2 |a ⇥ b|
1
= |(a ⇥ b) · c| .
6
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 52

Sammenholdes dette med definition på rumprodukt fra sætning 10.62, (a ⇥ b) · c =


det ([a b c]), fås udtrykket på determinantform, og sætningen er bevist.

Et tetraeder har rumfanget 0 og er kollapset, når determinanten i (10-41) er 0. Det sker


netop, når en af vektorerne kan skrives som en linearkombination af de to andre, hvilket
undersøges i de følgende opgaver.

Definition 10.64 Regulært tetraeder


Et regulært tetraeder er et tetraeder, der har et egentligt rumfang; altså et rumfang,
der er skarpt større end 0.

Opgave 10.65

Lad A betegne en (2 ⇥ 2)-matrix med søjlevektorerne a og b:

A = [a b]. (10-44)

Vis, at determinanten af A er 0, hvis og kun hvis a og b er lineært afhængige i R2 .

Et parallelepipidum udspændt af vektorerne a, b, og c kan sammensættes af de seks


tetraeder:

⇥( p1 , a, b, c), ⇥( p2 , a, b, c), ⇥( p3 , a, b, c),


(10-45)
⇥( p4 , a, b, c), ⇥( p5 , a, b, c) og ⇥( p6 , a, b, c).

Derfor følger udmiddelbart af sætning 10.63 følgende.

Følgesætning 10.66 Rumgang af parallelepipedum ved determinant


Rumfanget af et parallelepipedum, som er udspændt af vektorerne a, b, og c, er
| det ([a b c]) |.
eNote 10 10.9 SÆTNINGER OM VEKTORER I EN STANDARD E-BASIS 53

Opgave 10.67

Lad A betegne en (3 ⇥ 3)-matrix med søjlevektorerne a, b, og c:

A = [a b c]. (10-46)

Vis, at determinanten af A er 0, hvis og kun hvis a, b og c udgør et lineært afhængigt system


af vektorer i R3 .

Opgave 10.68

Benyt de geometriske tolkninger af determinanten ovenfor til at vise, at Hadamards ulighed


herunder gælder for (2 ⇥ 2)-matricer og for (3 ⇥ 3)-matricer (faktisk er uligheden gældende
for alle kvadratiske matricer):
!
n n
det(A)2  ’ Â a2ij . (10-47)
j i

Hvornår gælder der lighedstegn i (10-47)?


eNote 11 1

eNote 11

Vektorrum

I denne eNote opstilles en generel teori for mængder, for hvilke der er defineret addition og
multiplikation med skalar, og som opfylder de samme regneregler som geometriske vektorer i
planen og rummet. Det vises, hvordan man ved hjælp af begreberne basis og koordinater kan
forenkle og standardisere løsningen af opgaver, der er fælles for alle disse mængder, som kaldes
vektorrum. Kendskab til eNote 10 om geometriske vektorer er en fordel, og der forudsættes
kendskab til løsningsmængder for linæere ligningssystemer eNote 6, til elementær
matrixalgebra og til et par vigtige resultater angående determinanter.
Opdateret 24.09.21 af Karsten Schmidt

11.1 Generalisering af begrebet vektor

Begrebet vektor kommer fra plan- og rumgeometrien, hvor det betegner et sammen-
hørende par af en længde og en retning. Vektorer kan repræsenteres af orienterede
linjestykker, hvorefter det er muligt at definere to geometriske regneoperationer: addi-
tion af vektorer og multiplikation af vektorer med tal (skalarer). Til brug ved lidt mere
sammensatte regneoperationer beviser man otte regneregler, se sætning 10.13 i eNote
10, der handler om de to indførte regneoperationer.

I mange andre mængder af matematiske objekter har man ligeledes brug for at definere
addition af objekter samt multiplikation af et objekt med en skalar. Det er talrummene
R n og C n og matrixmængderne R m⇥n gode eksempler på, se eNote 5 henholdsvis eNote
7. Det bemærkelsesværdige er, at de regneregler for addition og multiplikation med
skalar, som det er muligt at bevise inden for hver af disse mængder, er de samme som de
regneregler, der gælder for geometriske vektorer i planen og rummet! Man siger derfor:
eNote 11 11.1 GENERALISERING AF BEGREBET VEKTOR 2

Lad os lave én teori, der gælder for alle de mængder, hvor der kan defineres addition
og multiplikation med skalar, og hvor de otte regneregler kendt fra geometrien gælder.
Man foretager hermed en generalisering af læren om geometriske vektorer, og enhver
mængde, der omfattes af teoriens betingelser, kaldes et vektorrum.

I eNote 10 om de geometriske vektorer er det demonstreret, hvordan man kan indføre


en basis for vektorerne, hvorefter alle vektorer i det pågældende rum er bestemt ved
deres koordinater med hensyn til denne basis. Fordelen er, at man derved kan erstatte
geometrisk vektorregning med regning med vektorernes koordinater. Det viser sig, at
det også er muligt at overføre begreberne vedrørende basis og koordinater til mange
andre mængder af matematiske objekter, hvor også addition af objekter og multiplika-
tion med skalar gælder.

Når vi i det følgende undersøger vektorrum abstrakt, betyder det, at vi ser på hvilke be-
greber, sætninger og metoder, der er en følge af de fælles regneregler, idet vi ser bort fra
den konkrete betydning, som addition og multiplikation med skalar har i de mængder
af konkrete objekter, hvor de er indført. Man får derved generelle metoder gældende for
enhver mængde af den ovennævnte art. Når man i en bestemt arbejdsopgave er tilbage
i et konkret vektorrum, må man fortolke, hvad de opnåede resultater betyder i denne
særlige sammenhæng. Fremgangsmåden kaldes den aksiomatiske metode. Med henblik
på alt dette fremlægger vi nu den abstrakte definition af vektorrum.
eNote 11 11.1 GENERALISERING AF BEGREBET VEKTOR 3

Definition 11.1 Vektorrum


Lad L betegne R eller C , og lad V være en mængde af matematiske elementer, hvori
der er defineret de to regneoperationer

I. addition, der ud fra to elementer a og b i V danner summen a + b , som også


tilhører V, samt

II. multiplikation med skalar, der ud fra ethvert a 2 V og enhver skalar k 2 L


danner et produkt ka eller ak, som også tilhører V.

V kaldes et vektorrum, og elementerne i V kaldes vektorer, hvis de følgende otte


regneregler er opfyldt:
1. a+b = b+a Addition er kommutativ
2. (a + b) + c = a + (b + c) Addition er associativ
3. a+0 = a I V findes 0, som er neutral mht. addition
4. a + ( a) = 0 Til ethvert a 2 V findes et modsat objekt a2V
5. k 1 ( k 2 a) = ( k 1 k 2 )a Multiplikation med skalarer er associativ
6. ( k 1 + k 2 )a = k 1 a + k 2 a
De distributive regler gælder
7. k 1 (a + b) = k 1 a + k 1 b
8. 1a = a Skalaren 1 er neutral i produkt med vektorer

Hvis L i definition 11.1 står for R, taler man om V som et vektorrum over de reelle
tal. Det betyder, at skalaren k kun kan være et vilkårligt reelt tal. Tilsvarende
taler man om V som et vektorrum over de komplekse tal, hvis L står for C , hvor k
er et vilkårligt komplekst tal.

Kravene I og II i definition 11.1 om, at resultatet af addition og af multiplikation


med skalar selv skal være et element i V, kaldes for stabilitetskravene. V skal
således være stabil med hensyn til de to regnearter.

Mængden af geometriske vektorer i planen og mængden af geometriske vektorer i rum-


met er naturligvis de mest oplagte eksempler på vektorrum, da de otte regneregler i
definition 11.1 er opstillet ud fra netop geometriske vektorer i disse rum. Men lad os
alligevel lige se efter, om stabilitetskravene gælder.

Er summen af to vektorer i planen selv en vektor i planen? Og er en vektor i planen


eNote 11 11.1 GENERALISERING AF BEGREBET VEKTOR 4

ganget med et tal selv en vektor i planen? Ud fra definitionen på de to regnearter (se
definition 10.2 og definition 10.3 i eNote 10) er svaret oplagt ja, og derfor er mængden af
vektorer i planen et vektorrum. På samme måde ses, at mængden af vektorer i rummet
er et vektorrum.

Sætning 11.2 Entydighed af 0-vektor og modsat vektor


For ethvert vektorrum V gælder:

1. V indeholder kun ét neutralt element med hensyn til addition.


2. Enhver vektor a 2 V har kun ét modsat element.

Bevis

Første del
Lad 01 og 02 være to elementer i V, der begge er neutrale med hensyn til addition. Der gælder
da:
01 = 01 + 02 = 02 + 01 = 02 ,
hvor vi har udnyttet, at addition er kommutativ. Der findes altså kun én 0-vektor neutral for
addition: 0 .

Anden del
Lad a1 , a2 2 V være to modsatte elementer for a 2 V . Der gælder da:

a1 = a1 + 0 = a1 + ( a + a2 ) = ( a + a1 ) + a2 = 0 + a2 = a2 ,

hvor vi har udnyttet, at addition er både kommutativ og associativ. Der findes altså for a kun
én modsat vektor, a .

Definition 11.3 Subtraktion


Lad V være et vektorrum, og lad a, b 2 V . Ved differensen a b forstås vektoren

a b = a + ( b) . (11-1)
eNote 11 11.1 GENERALISERING AF BEGREBET VEKTOR 5

Opgave 11.4

Bevis, at ( 1)a = a.

Opgave 11.5 Nul-reglen

Bevis, at følgende variant af nul-reglen gælder i ethvert vektorrum:

ka = 0 , k = 0 eller a = 0 . (11-2)

Eksempel 11.6 Matricer som vektorer

For to vilkårlige naturlige tal m og n er R m⇥n (det vil sige mængden af reelle (m ⇥ n)-matricer)
et vektorrum. Ligeledes er C m⇥n (det vil sige mængden af komplekse (m ⇥ n)-matricer) et
vektorrum.

Betragt for eksempel R2⇥3 . Hvis vi lægger to matricer af denne type sammen, får vi en ny
matrix af samme type, og hvis vi ganger en (2 ⇥ 3)-matrix med et tal, får vi også en ny
(2 ⇥ 3)-matrix (se definition 7.1). Dermed er stabilitetskravene opfyldt. At R2⇥3 desuden
opfylder de otte regneregler, fremgår af sætning 7.3.

Opgave 11.7

Gør rede for, at der for ethvert naturligt tal n gælder, at talrummet L n er et vektorrum. Husk
også at tænke over tilfældet n = 1 !

I de følgende to eksempler skal vi se, at den geometrisk inspirerede vektorrumsteori


overraskende nok kan bringes i spil på velkendte mængder af funktioner. Matema-
tikhistorikere har i den forbindelse talt om den matematiske analyses geometrisering!
eNote 11 11.1 GENERALISERING AF BEGREBET VEKTOR 6

Eksempel 11.8 Polynomier som vektorer

Mængden af polynomier P : R 7! R af højst n’te grad betegnes Pn (R ). Et element P i


Pn (R ) er altså givet ved

P ( x ) = a0 + a1 x + · · · + a n x n , (11-3)

hvor koefficienterne a0 , a1 , · · · , an er vilkårlige reelle tal. Vis, at Pn (R ) er et vektor-


rum.

Stabilitetskravene I og II fra definition 11.1 skal først og fremmest være opfyldt og derudover
også de otte regneregler.

Addition af to polynomier i Pn (R ) defineres ved parvis addition af koefficienter, der hører


til led af samme grad. Multiplikation af et polynomium i Pn (R ) med et tal k defineres som
multiplikation af hver af koefficienterne med k. Som eksempel på disse to regneoperationer
ser vi på to polynomier fra P3 (R ) (altså to polynomier af højst tredje grad):

P( x ) = 1 2x + x3 = 1 2x + 0x2 + 1x3

og
Q( x ) = 2 + 2x 4x2 = 2 + 2x 4x2 + 0x3 .

Ved summen af P og Q forstår vi polynomiet R = P + Q bestemt ved

R ( x ) = (1 + 2) + ( 2 + 2) x + (0 4) x 2 + (1 + 0) x 3 = 3 4x2 + x3 ,

og ved multiplikation af P med skalaren k = 3 forstår vi polynomiet S = 3P bestemt ved

S( x ) = (3 · 1) + (3 · ( 2)) x + (3 · 0) x2 + (3 · 1) x3 = 3 6x + 3x3 .

Vi vil nu argumentere for, at Pn (R ) med de indførte regneoperationer er et vektorrum! At


Pn (R ) overholder stabilitetskravene, følger, som eksemplerne herover antyder, af, at

• summen af to polynomier af højst n’te grad selv er et polynomium af højst n’te grad
og, at

• multiplikation af et polynomium af højst n’te grad med et reelt tal igen giver et poly-
nomium af højst n’te grad.

Betingelserne 1, 2 og 5 til 8 i definition 11.1 er opfyldt, fordi samme regneregler gælder for
de udregninger på polynomiernes koefficienter, som regneoperationerne er defineret ved.
Endelig er betingelse 3 og 4 opfyldt, idet polynomiet

P( x ) = 0 + 0x + · · · 0x n = 0
eNote 11 11.2 LINEARKOMBINATIONER OG UDSPÆNDINGER 7

udfylder rollen som nulvektor, og idet den modsatte vektor til P( x ) 2 Pn (R ) er givet ved poly-
nomiet
P ( x ) = a0 a1 x · · · a n x n .
På samme måde kan det vises, at også mængden af polynomier P : C 7! C af højst n’te grad,
som betegnes Pn (C ) , er et vektorrum.

Opgave 11.9

Gør rede for, at P(R ), det vil sige mængden af alle reelle polynomier, er et vektorrum.

Eksempel 11.10 Kontinuerte funktioner som vektorer

Mængden af kontinuerte reelle funktioner defineret på R betegnes C0 (R ) . Additionen


m = f + g af to funktioner f og g i C0 (R ) indføres ved

m( x ) = ( f + g)( x ) = f ( x ) + g( x ) for ethvert x 2 R ,

og multiplikationen n = k · f af f med et reelt tal k ved

n( x ) = (k · f )( x ) = k · f ( x ) for ethvert x 2 R .

Argumenter for, at C0 (R ) med de indførte regneoperationer er et vektorrum.

Da m = f + g og n = k · f er kontinuerte (ifølge grundlæggende teori for kontinuerte funk-


tioner), ser vi, at C0 (R ) opfylder de to stabilitetskrav.

Endvidere findes der en funktion, der udfylder rollen som nulvektor, nemlig nulfunktionen,
det vil sige den funktion, som antager værdien 0 for alle x 2 R. Samtidig findes den modsatte
vektor til den kontinuerte reelle funktion f ved vektoren ( 1) f = f , som for alle x 2 R har
værdien f ( x ).

Herefter er det let at indse, at C0 (R ) med de indførte regneoperationer opfylder alle 8


betingelser i definition 11.1, og at C0 (R ) dermed er et vektorrum.

11.2 Linearkombinationer og udspændinger

En pointe ved regneregler som u + v = v + u og (u + v) + w = u + (v + w) fra


definition 11.1 er, at man udelader parenteser, når man skal addere en række vektorer,
eNote 11 11.2 LINEARKOMBINATIONER OG UDSPÆNDINGER 8

da det ingen betydning har for den resulterende vektor, i hvilken rækkefølge man har
lagt vektorerne sammen parvist. Dette er baggrunden for linearkombinationer, hvor et
sæt af vektorer er multipliceret med skalarer og derefter opskrevet som en sum.

Definition 11.11 Linearkombination


Når der i et vektorrum V er givet p vektorer v1 , v2 , . . . , v p , og der er valgt vilkårlige
skalarer k1 , k2 , . . . , k p , så kaldes summen

k1 v1 + k2 v2 + . . . + k p v p

en linearkombination af de p givne vektorer.

Hvis alle koefficienterne k1 , . . . , k p er lig med 0, kaldes linearkombinationen uegent-


lig, men hvis blot én af dem er forskellig fra 0, er den egentlig.

I definition 11.11 omtales blot en enkelt linearkombination. Udregnes den, fås en re-
sulterende vektor i samme rum. I mange sammenhænge har det interesse at se på den
samlede mængde af mulige linearkombinationer af givne vektorer. Mængden kaldes
for udspændingen af vektorerne, da en sådan mængde indeholder samtlige vektorer, som
kan dannes ved linearkombinationer af de givne vektorer. Betragt for eksempel den
plan i rummet, som går gennem origo og indeholder stedvektorerne for to ikke par-
allelle vektorer u og v, se figur 7.1. Planen kan betragtes som udspændingen af de to
vektorer, idet stedvektoren
!
OP= k1 u + k2 v
"‘gennemløber"’ alle punkter P i planen, når k1 og k2 antager alle tænkelige reelle værdier.
Vha. af disse to vektorer kan alle andre punkter (eller vektorer) i denne plan altså
bestemmes.
eNote 11 11.2 LINEARKOMBINATIONER OG UDSPÆNDINGER 9

R
v
O

P
u

Figur 7.1: u og v udspænder en plan i rummet

Definition 11.12 Udspænding og span


Ved udspændingen af et givet sæt vektorer v1 , v2 , . . . , v p i et vektorrum V forstås den
samlede mængde af alle tænkelige linearkombinationer af vektorerne. Udspændin-
gen af de p vektorer skrives kort som

span{v1 , v2 , . . . , v p } ,

eller i tilfælde af uendeligt mange basisvektorer som

span{v1 , v2 , . . .} .

Eksempel 11.13 Linearkombination og span

Vi betragter i vektorrummet R2⇥3 de tre matricer/vektorer


  
1 0 3 2 1 0 1 2 9
A= , B= og C = . (11-4)
0 2 2 0 3 1 0 0 4
Et eksempel på en linearkombination af de tre vektorer er

3 2 3
2A + 0 B + ( 1)C = . (11-5)
0 4 0
Vi har dermed 
3 2 3
2 span{A, B, C} . (11-6)
0 4 0
eNote 11 11.3 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 10

11.3 Lineær afhængighed og lineær uafhængighed

To geometriske vektorer u og v er lineært afhængige, hvis de er parallelle, det vil sige,


hvis der findes et tal k, så v = ku. Mere generelt er et vilkårligt sæt af vektorer lineært
afhængigt, hvis en af vektorerne er en linearkombination af de øvrige. Dette begreb
ønsker vi at overføre til vektorrumsteorien, se den følgende definition.

Definition 11.14 Lineær afhængighed og uafhængighed


Et sæt bestående af p vektorer (v1 , v2 , . . . , v p ) i et vektorrum V er lineært afhængigt,
hvis mindst én af vektorerne kan skrives som en linearkombination af de øvrige,
altså hvis for eksempel

v1 = k2 v2 + k3 v3 + · · · + k p v p .

Hvis ingen af vektorerne kan skrives som en linearkombination af de øvrige, kaldes


sættet lineært uafhængigt.

Hvis vektorsættet kun består af en enkelt vektor, kaldes sættet lineært afhængigt,
hvis det består af 0-vektoren, og ellers lineært uafhængigt.

Eksempel 11.15 Lineær afhængighed

Ethvert vektorsæt, som indeholder nul-vektoren, er lineært afhængigt! Betragt for eksempel
sættet (u, v, 0, w). Her kan nul-vektoren jo helt trivielt skrives som en linearkombination af
de tre andre vektorer i sættet:
0 = 0u + 0v + 0w .

Eksempel 11.16 Lineær afhængighed

Betragt i vektorrummet R2⇥3 de tre matricer/vektorer


  
1 0 3 2 1 0 1 2 9
A= , B= og C = . (11-7)
0 2 2 0 3 1 0 0 4
C kan skrives som en linearkombination af A og B, da der gælder, at
C = 3A 2B .
eNote 11 11.3 LINEÆR AFHÆNGIGHED OG LINEÆR UAFHÆNGIGHED 11

Derfor er A, B og C lineært afhængige. Hvis man som her kan finde blot ét eksempel på en
linearkombination, så er sættet altså lineært afhængigt.

Derimod er sættet bestående af A og B lineært uafhængigt, da de to vektorer ikke er "‘paral-


lelle"’, idet der tydeligvis ikke findes et tal k således, at B = kA. Ligeså med sættene (A, C)
og (B, C) .

Når man skal undersøge, om et sæt af vektorer er lineært afhængigt, opstår ved brug af
definition 11.14 spørgsmålet om, hvilken af sættets vektorer der evt. er en linearkombi-
nation af de øvrige. Hvor skal undersøgelsen starte? Dilemmaet kan undgås, hvis man
i stedet for definitionen bruger den følgende sætning:

Sætning 11.17 Lineær afhængighed og uafhængighed


At et vektorsæt (v1 , v2 , . . . , v p ) i et vektorrum V er lineært afhængigt, er ensbety-
dende med, at nul-vektoren kan skrives som en egentlig linearkombination af vek-
torerne. Der skal altså findes skalarer k1 , k2 , . . . , k p , som ikke alle er lig med 0 (kaldet
nul-løsningen), der opfylder

k1 v1 + k2 v2 + · · · + k p v p = 0 . (11-8)

I modsat fald — altså hvis nul-løsningen er den eneste løsning — er vektorerne


lineært uafhængige.
.

Bevis

Antag, at (v1 , v2 , . . . , v p ) er lineært afhængigt. Så kan en af dem skrives som en linearkombi-


nation af de øvrige. For eksempel er
v1 = k 2 v2 + k 3 v3 + · · · + k p v p . (11-9)
Men dette er ensbetydende med, at
v1 k 2 v2 k 3 v3 ··· k pvp = 0 , (11-10)
hvorved nul-vektoren er skrevet som en linearkombination af vektorsættet, hvor mindst én
af koefficienterne k2 , k3 , . . . , k p ikke er 0, da vi jo har koefficienten 1 til v1 .

Antag omvendt, at nul-vektoren er skrevet som en egentlig linearkombination af vektorsæt-


tet, hvor for eksempel koefficienten k1 til v1 er forskellig fra 0. Så har vi
k2 kp
k1 v1 + k2 v2 + · · · + k p v p = 0 , v1 = ( 1) v2 + · · · + ( 1) v p . (11-11)
k1 k1
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 12

Hermed er v1 skrevet som en egentlig linearkombination af de øvrige vektorer, og beviset er


fuldført.

Eksempel 11.18 Lineær afhængighed

I talrummet R4 er der givet vektorerne a = (1, 3, 0, 2), b = ( 1, 9, 0, 4) og c = (2, 0, 0, 1). Da


der gælder:
3a b 2c = 0 ,
er nul-vektoren skrevet som en egentlig linearkombination af de tre vektorer. De er derfor
lineært afhængige.

11.4 Basis og dimension for et vektorrum

En afgørende begrundelse for at indføre en basis i et vektorrum er, at alle vektorer i


vektorrummet derefter kan beskrives ved hjælp af koordinater. I et senere afsnit vises
det, hvordan man kan forenkle og standardisere regneopgaver med vektorer, når man
benytter koordinater. Men i dette afsnit vil vi diskutere de krav, man må stille til en
basis, og undersøge de teoretiske konsekvenser af kravene.

En basis for et vektorrum består af et vist antal vektorer opskrevet i en bestemt række-
følge. En afgørende opgave for basisvektorerne er at udspænde hele vektorrummet.
Men mere præcist ønsker vi dette job udført af så få vektorer som muligt. I så fald viser
det sig nemlig, at alle vektorer i vektorrummet på entydig vis kan skrives som en linear-
kombination af basisvektorerne. Og det er netop koefficienterne i den entydige linear-
kombination vi vil bruge som koordinater.

Lad os tage udgangspunkt i nogle karakteristiske egenskaber ved baser for de geo-
metriske vektorer i planen.
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 13

v
a2

O
a1
a3

Figur 7.2: Koordinatsystem i planen med basis (a1 , a2 )

Betragt vektorsættet (a1 , a2 , a3 ) på figur 7.2. Ingen tvivl om at enhver anden vektor i
planen kan skrives som en linearkombination af de tre vektorer. Men linearkombinatio-
nen er ikke entydig. For eksempel kan en bestemt vektor v skrives på disse to måder:

v = 2a1 + 3a2 1a3


v = 1a1 + 2a2 + 0a3 .

Dermed kan vi ikke bruge koefficienterne som koordinater, for hvilke af de to ligninger
skal vi da bruge? Problemet er, at a-vektorerne er lineært afhængige af hinanden; for
eksempel er a3 = a1 a2 . Men hvis vi fjerner én af dem, for eksempel a3 , er sættet
lineært uafhængigt, og der er så kun én mulig skrivemåde:

v = 1a1 + 2a2 .

Dermed er koefficienterne unikke og kan bruges som et unikt koordinatsæt (1, 2).

Vi kan opsummere de karakteristiske egenskaber for en basis for de geometriske vek-


torer i planen således:

1. Enhver basis skal bestå af lineært uafhængige vektorer,

2. enhver basis skal indeholde netop to vektorer, og

3. ethvert sæt bestående af to lineært uafhængige vektorer er en basis.

Egenskab nr. 2 herover fortæller, at der kræves netop to vektorer til en basis for
planen. Hvis der nemlig er flere end to, så er de lineært afhængige, og hvis der
er færre end to, udspænder de ikke hele vektorrummet.
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 14

Disse egenskaber lader sig overføre til alle andre vektorrum. Det tager vi hul på nu, og
vi starter med den generelle definition af en basis.

Definition 11.19 Basis


Ved en basis for et vektorrum V forstås en mængde (v1 , v2 , . . . , vn ) af vektorer fra
V, som opfylder:

1. (v1 , v2 , . . . , vn ) udspænder V .

2. (v1 , v2 , . . . , vn ) er lineært uafhængigt.

Her bør vi stoppe op og sørge for, at definition 11.19 faktisk opfylder vores entydighed-
skrav til en basis. Dette fastslås i den følgende sætning.

Sætning 11.20 Entydighedssætningen


Hvis der i et vektorrum V er givet en basis, kan enhver vektor i V skrives som en
unik linearkombination af basisvektorerne.

Bevis

Vi giver idéen i beviset ved at se på et vektorrum V, som har en basis bestående af tre ba-
sisvektorer (a, b, c) , og antager, at v er en vilkårlig vektor i V, som på to måder kan skrives
som en linearkombination af basisvektorerne. Vi kan da opstille to de ligninger
v = k1 a + k2 b + k3 c
(11-12)
v = k4 a + k5 b + k6 c .
Ved at trække den nederste ligning i (11-12) fra den øverste opnår vi ligningen
0 = (k1 k 4 )a + ( k 2 k 5 )b + ( k 3 k 6 )c . (11-13)
Da a, b og c er lineært uafhængige, kan nul-vektoren kun skrives som en uegentlig linear-
kombination af dem. Derfor er hver af koefficienterne i (11-13) lig med 0, hvilket medfører,
at k1 = k4 , k2 = k5 og k3 = k6 . Men så er de to måder, som v har været skrevet som linear-
kombination af basisvektorerne på, i virkeligheden den samme, og der findes dermed kun
én måde!
Dette ræsonnement lader sig umiddelbart udvide til en basis, som består af et vilkårligt antal
basisvektorer.
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 15

Vi vender nu tilbage til det faktum, at enhver basis for de geometriske vektorer i planen
altid indeholder to lineært uafhængige vektorer, og at der tilsvarende for geometriske
vektorer i rummet gælder, at en basis må bestå af tre lineært uafhængige vektorer. Det
viser sig, at det faste antal basisvektorer er en egenskab ved alle vektorrum, der har en
basis, og dette gør det muligt at tale om dimensionen af et vektorrum. For at bevise, at
egenskaben findes, får vi brug for følgende hjælpesætning.

Hjælpesætning 11.21
Hvis et vektorrum V har en basis bestående af n basisvektorer, så vil ethvert sæt fra
V, som indeholder mere end n vektorer, være lineært afhængigt.

Bevis

Vi viser idéen i beviset ved at betragte et vektorrum V, som har en basis af to vektorer (a, b),
og undersøger tre vilkårlige vektorer c, d og e fra V. Vi viser, at de tre vektorer nødvendigvis
må være lineært afhængige.

Da (a, b) er en basis for V, kan vi opstille de tre ligninger

c = c1 a + c2 b
d = d1 a + d2 b (11-14)
e = e1 a + e2 b .

Betragt endvidere nul-vektoren opskrevet ved følgende linearkombination:

x1 c + x2 d + x3 e = 0 . (11-15)

Ved indsættelse af (11-14) i (11-15) er linearkombinationen ensbetydende med

( x 1 c 1 + x 2 d 1 + x 3 e1 ) a + ( x 1 c 2 + x 2 d 2 + x 3 e2 ) b = 0 . (11-16)
Da nul-vektoren kun kan opnås som en linearkombination af a og b, hvis hver af koefficien-
terne er lig med 0, er (11-16) ensbetydende med følgende ligningssystem:

c 1 x 1 + d 1 x 2 + e1 x 3 = 0
(11-17)
c 2 x 1 + d 2 x 2 + e2 x 3 = 0 .
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 16

Dette er et homogent lineært ligningssystem, hvor antallet af ligninger er mindre end antallet
af ubekendte. Ligningssystemet har derfor uendeligt mange løsninger, hvilket betyder, at
(11-16) ikke kun er opnåelig under betingelsen af x1 = 0, x2 = 0 og x3 = 0 men også har
andre løsninger. Dermed er det vist, at sættet (c, d, e) er lineært afhængigt.

Generelt: Antag nu at basen for V består af n vektorer, og at der gives m vektorer fra V, hvor
m > n. Ved at følge samme fremgangsmåde som ovenfor opstår der et homogent lineært
ligningssystem bestående af n ligninger med m ubekendte som, fordi m > n , ligeledes har
uendeligt mange løsninger. Derved er det vist, at de m vektorer er lineært afhængige.

Og så er vi klar til at fremsætte den følgende vigtige sætning.

Sætning 11.22 Antal af basisvektorer


Hvis et vektorrum V har en basis bestående af n basisvektorer, så vil enhver basis for
V ligeledes bestå af n basisvektorer.

Bevis

Antag, at V har to baser med forskelligt antal basisvektorer. Vi kalder basen med færrest
basisvektorer for a og den med flest for b. Ifølge hjælpesætning 11.21 må b-basisvektorerne
være lineært afhængige, og dette er i modstrid med, at de udgør en basis. Antagelsen om, at
V kan have to baser med forskelligt antal basisvektorer, må derfor være forkert.

At antallet af basisvektorer ifølge sætning 11.22 er en egenskab ved vektorrum, motiverer


indførelsen af begrebet dimension.

Definition 11.23 Dimension


Ved dimensionen af et vektorrum V, som har en basis b, forstås antallet af basisvek-
torer i b. Hvis dette antal er n, siger man, at V er n-dimensionalt og skriver

dim(V ) = n . (11-18)
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 17

Eksempel 11.24 Dimension af geometriske vektorrum

Heldigvis bekræfter definition 11.23 en intuitiv fornemmelse af, at mængden af geometriske


vektorer i planen har dimensionen to, og at mængden af geometriske vektorer i rummet har
dimensionen tre!

Eksempel 11.25 Standardbasis for talrum

En vilkårlig vektor v = ( a, b, c, d) i R4 eller i C4 (det vil sige i L4 ) kan på oplagt måde skrives
som en linearkombination af fire særlige vektorer i L4 :

v = a (1, 0, 0, 0) + b (0, 1, 0, 0) + c (0, 0, 1, 0) + d (0, 0, 0, 1) . (11-19)

Vi sætter e1 = (1, 0, 0, 0), e2 = (0, 1, 0, 0), e3 = (0, 0, 1, 0) og e4 = (0, 0, 0, 1) og konstaterer ved


hjælp af (11-19), at e-sættet (e1 , e2 , e3 , e4 ) udspænder L4 .

Da det endvidere ses, at ingen af vektorerne i sættet kan skrives som en linearkombination af
de øvrige, er sættet lineært uafhængigt, og (e1 , e2 , e3 , e4 ) er dermed en basis for L4 . Denne
særlige basis kaldes en standardbasis for L4 . Da antallet af basisvektorer i standard e-basen er
fire, er dim(L4 ) = 4 .

Dette kan umiddelbart generaliseres til L n . For ethvert n er e-sættet (e1 , e2 , . . . , en ) , hvor

e1 = (1, 0, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, 0, . . . , 1) ,

en basis for L n . Denne særlige basis kaldes en standardbasis for L n . Det bemærkes, at
dim(L n ) = n .

Eksempel 11.26 Standardbasis for matrix-rum

Ved standardbasen for vektorrummet R2⇥3 eller C2⇥3 forstås matrixsættet


✓      ◆
1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0
, , , , , (11-20)
0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 1

På samme måde defineres en standardbasis for et vilkårligt matrixrum R m⇥n og for et


vilkårligt matrixrum C m⇥n .
eNote 11 11.4 BASIS OG DIMENSION FOR ET VEKTORRUM 18

Opgave 11.27

Gør rede for, at det matrixsæt, der i eksempel 11.26 omtales som standardbasis for R2⇥3 ,
faktisk er en basis for dette vektorrum.

I det følgende eksempel og den efterfølgende sætning betragter vi igen en mængde af


funktioner, nemlig mængden af polynomier. Systematikken i polynomier gør os i stand
til at definere en særlig basis — en såkaldt monomiebasis — for netop dem.

Eksempel 11.28 Monomiebasis for polynomiumsrum

I vektorrummet P2 (R ) af reelle polynomier af højst anden grad er vektorsættet (1, x, x2 ) en


basis. Det ses på følgende måde:

1. Ethvert polynomium P( x ) 2 P2 (R ) kan skrives på formen

P ( x ) = a0 · 1 + a1 · x + a2 · x 2 ,

det vil sige som en linearkombination af de tre vektorer i sættet.

2. Vektorsættet (1, x, x2 ) er lineært uafhængigt, idet ligningen

a0 · 1 + a1 · x + a2 · x2 = 0 forallex

ifølge identitetssætningen for polynomier kun er opfyldt, hvis alle koefficienterne a0 ,


a1 og a2 er lig med 0 .

Et monomium er et polynomium med kun ét led. Derfor kaldes det ordnede sættet (1, x, x2 )
monomiebasen for P2 (R ), og der gælder dim( P2 (R )) = 3 .

For ethvert n er det ordnede sæt (1, x, x2 , . . . , x n ) en basis for Pn (R ). Derfor gælder
dim( Pn (R )) = n + 1 .

Tilsvarende er det ordnede sæt (1, z, z2 , . . . , zn ) en basis for Pn (C ), og der gælder


dim( Pn (C )) = n + 1 .

I mængden af plane geometriske vektorer kan man vælge ethvert par af to lineært uafhængige
vektorer som basis. Tilsvarende udgør i rummet ethvert sæt af tre lineært uafhængige
vektorer en basis. Vi slutter afsnittet af med en videreførsel af dette til generelle n-
dimensionale vektorrum.
eNote 11 11.5 VEKTORREGNING VED HJÆLP AF KOORDINATER 19

Sætning 11.29 Tilstrækkelige betingelser for basis


I et n-dimensionalt vektorrum V udgør et vilkårligt sæt af n lineært uafhængige
vektorer fra V en basis for V .

Bevis

Da V er forudsat n-dimensionalt, må det have en basis bestående af n basisvektorer. Lad


a-sættet (a1 , a2 , · · · , an ) være et vilkårligt lineært uafhængigt sæt af n vektorer fra V. Sættet
er da en basis for V, hvis det udspænder V. Antag, at dette ikke er tilfældet, og lad v være
en vektor i V, som ikke tilhører span{a1 , a2 , . . . , an }. Så må (v, a1 , a2 , . . . , an ) være lineært
uafhængigt, men dette er i modstrid med sætning 11.21, da der er n + 1 vektorer i sættet.
Derfor er antagelsen om, at a-sættet ikke udspænder V, forkert, og det må derfor være en
basis for V.

Opgave 11.30

I rummet er der givet to geometriske vektorer a = (1, 2, 1) og b = (2, 2, 0) . Bestem en


vektor c således, at sættet (a, b, c) er en basis for mængden af rumvektorer.

Opgave 11.31

Betragt i det 4-dimensionale vektorrum R2⇥2 vektorerne


  
1 1 1 1 1 0
A= , B= og C = . (11-21)
1 0 0 1 1 1

Gør rede for, at (A, B, C) er et lineært uafhængigt sæt, og supplér sættet op med en (2 ⇥ 2)-
matrix D således, at (A, B, C, D) er en basis for R2⇥2 .

11.5 Vektorregning ved hjælp af koordinater

Koordinater hænger snævert sammen med begrebet basis. Når der i et endeligt dimen-
sionalt (ikke-uendeligt) vektorrum er valgt en basis, kan enhver vektor i vektorrum-
met beskrives ved hjælp af dens koordinater med hensyn til den valgte basis. Vi får
eNote 11 11.5 VEKTORREGNING VED HJÆLP AF KOORDINATER 20

hermed et særdeles praktisk alternativ til regneoperationerne addition og multiplikation


med skalar, som de oprindeligt er defineret ud fra det konkrete vektorrums anatomi. I
stedet for at udføre disse særligt definerede regneoperationer, kan vi blot gennemføre
taludregninger med de koordinater, der svarer til den valgte basis. Det viser sig endda,
at vi kan forenkle og standardisere løsningen af typiske opgaver, som er fælles for alle
vektorrum. Men først giver vi en formel indføring af koordinater med hensyn til en
valgt basis.

Definition 11.32 Koordinater mht. given basis


I et n-dimensionalt vektorrum V er der givet basen a = (a1 , a2 , . . . , an ) samt en vek-
tor x. Vi betragter den unikke linearkombination af basisvektorerne, som x ifølge
sætning 11.20 kan opskrives ved:

x = x1 a1 + x2 a2 + · · · + xn an . (11-22)

Koefficienterne x1 , x2 , . . . , xn i (11-22) kaldes x’s koordinater med hensyn til basen


a, eller kortere: x’s a-koordinater, og de samles i en koordinatvektor med følgende
skrivemåde: 2 3
x1
6 x2 7
6 7
a x = 6 .. 7 . (11-23)
4 . 5
xn

Eksempel 11.33 Koordinater mht. en ny basis

I talrummet R3 er der givet en basis a ved (0, 0, 1), (1, 2, 0), (1, 1, 1) . Endvidere er der
givet vektoren v = (7, 2, 6). Da der gælder

2 · (0, 0, 1) + 3 · (1, 2, 0) + 4 · (1, 1, 1) = (7, 2, 6) ,

ser vi, at 2 3
2
av = 3 5 .
4
4
Vektoren, som i det sædvanlige koordinatsystem har koordinatsættet (7, 2, 6), har dermed
a-koordinaterne (2, 3, 4) .
eNote 11 11.5 VEKTORREGNING VED HJÆLP AF KOORDINATER 21

For at kunne jonglere med mange vektorers koordinater i diverse regneopgaver får vi
brug for følgende vigtige sætning.

Sætning 11.34 Koordinatsætningen


I et vektorrum V er der givet to vektorer u og v samt et reelt tal k . Der er endvidere
valgt en basis a. Koordinaterne for en vektorsum fås ved at lægge koordinaterne for
vektorerne sammen, og koordinaterne for en vektor ganget med et tal er vektorens
koordinater ganget med tallet:

1. a (u + v) = a u + a v .

2. a (ku) = k a u .

Bevis

Se beviset for den tilsvarende sætning 10.40 for geometriske vektorer i rummet. Beviset for
det generelle tilfælde fås som en simpel udvidelse.

Vi udfører nu et eksempel på vektorregning ved hjælp af koordinater. Eksemplet er ikke


specielt matematisk interessant, men vi gennemfører det detaljeret for at demonstrere
teknikken i sætning 11.34.

Eksempel 11.35 Vektorregning ved hjælp af koordinater

Der er givet tre polynomier i vektorrummet P2 (R ):

R( x ) = 2 3x x2 , S( x ) = 1 x + 3x2 og T ( x ) = x + 2x2 .

Bestem polynomiet P( x ) = 2R( x ) S( x ) + 3T ( x ) .

Vi løser opgaven ved hjælp af koordinaterne for polynomierne med hensyn til
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 22

monomiebasen for P2 (R ).

m P( x ) = m 2R( x ) S( x ) + 3T ( x )
= m (2R ( x )) + m ( S( x )) + m (3T ( x ))
= 2 m R( x ) m S( x ) + 3 m T ( x )
2 3 2 3 2 3 2 3
2 1 0 3
= 24 3 5 4 1 5+ 34 1 5 = 4 2 5.
1 3 2 1

Nu oversætter vi tilbage fra den fundne koordinatvektor til det ønskede polynomium:

P( x ) = 3 2x + x2 .

11.6 Om brug af koordinatmatricer

Når man giver sig i kast med opgaver om vektorer og benytter sig af deres koordi-
nater med hensyn til en given basis, fører det meget ofte til, at man opstiller et lineært
ligningssystem og løser opgaven ved hjælp af matrixregning. En bestemt type ma-
trix påkalder sig særlig opmærksomhed, nemlig den, der fremkommer, når man sætter
nogle vektorers koordinatsøjler sammen til en koordinatmatrix:

Forklaring 11.36 Koordinatmatrix for vektorsæt

Hvis der i et n-dimensionalt vektorrum V findes en basis a, og der er givet et sæt af


m nummererede vektorer, så opstår sættets a-koordinatmatrix ved, at man i den givne
rækkefølge sætter de m vektorers a-koordinatsøjler sammen til en (n⇥m)-matrix.

Tag for eksempel et sæt bestående af tre vektorer i R2 : (1, 2), (3, 4), (5, 6) . Sættets
koordinatmatrix med hensyn til standard e-basen for R2 er 2⇥3-matricen

1 3 5
.
2 4 6

Vi vil nu vise, hvordan koordinatmatricer opstår, via en række eksempler, som vi for
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 23

afvekslingens skyld tager fra forskellige vektorrum. Metoderne lader sig umiddelbart
bruge på andre typer af vektorrum, og efter hvert eksempel gengiver vi metoden i en
koncentreret og generel form.

Det er vigtigt for din samlede forståelse af vektorrumsteorien, at du selv øver


dig i og indser, hvordan koordinatmatricer faktisk opstår, når man er i gang
med typiske opgaver.

11.6.1 Afgør, om en vektor er linearkombination af andre vektorer

Eksempel 11.37

Der er i R4 givet fire vektorer,

a1 = (1, 1, 1, 1)
a2 = (1, 0, 0, 1)
(11-24)
a3 = (2, 3, 1, 4)
b = (2, 2, 0, 1)

Undersøg, om b er en linearkombination af a1 , a2 og a3 .

Vi skal undersøge, om der findes x1 , x2 , x3 2 R således, at

x 1 a1 + x 2 a2 + x 3 a3 = b . (11-25)

Ved hjælp af sætning 11.34 kan vi omskrive (11-25) til e-koordinatvektorligningen


2 3 2 3 2 3 2 3
1 1 2 2
617 607 637 6 27
x1 6 7 6 7 6 7 6 7
4 1 5+ x2 4 0 5+ x3 4 1 5 = 4 0 5 ,
1 1 4 1

som er ensbetydende med det lineære ligningssystem

x1 + x2 + 2x3 = 2
x1 + 3x3 = 2
x1 + x3 = 0
x1 + x2 + 4x3 = 1 .
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 24

Vi opstiller ligningssystemets totalmatrix og angiver (uden mellemregninger) dens trappe-


form: 2 3 2 3
1 1 2 2 1 0 0 0
61 0 3 277 6 0 1 0 07
T =641 0 1 ! trap(T) = 6 7. (11-26)
05 40 0 1 05
1 1 4 1 0 0 0 1
Af (11-26) ses det, at rangen af ligningssystemets koefficientmatrix er 3, mens rangen af total-
matricen er 4. Den sidste ligning er en inkonsistent ligning, og ligningssystemet har derfor
ingen løsninger. Dette medfører, at (11-25) ikke kan løses. Vi konkluderer, at

/ span{a1 , a2 , a3 } .
b2

Metode 11.38 Linearkombination


Man kan afgøre, om en given vektor b, er en linearkombination af andre vektorer
a1 , a2 , . . . , a p , ved at løse det lineære ligningssystem, hvis totalmatrix er identisk
med koordinatmatricen for (a1 , a2 , . . . , a p , b ) med hensyn til en given basis.

Generelt kan der være ingen, én eller uendeligt mange måder, hvorpå vektoren kan
skrives som linearkombinationer af de øvrige.

11.6.2 Om vektorer er lineært afhængige

Eksempel 11.39

Vi betragter i vektorrummet R2⇥3 de tre matricer


  
1 0 3 2 1 0 1 2 9
A= , B= og C = . (11-27)
0 2 2 0 3 1 0 0 4

Undersøg, om de tre matricer er lineært afhængige.

Vi benytter sætning 11.17 og forsøger at finde tre reelle tal x1 , x2 og x3 , som ikke alle er lig
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 25

med 0, men som opfylder



0 0 0
x1 A + x2 B + x3 C = . (11-28)
0 0 0

Ved hjælp af sætning 11.34 kan vi omskrive (11-28) til e-koordinatvektorligningen


2 3 2 3 2 3 2 3
1 2 1 0
607 617 6 27 607
6 7 6 7 6 7 6 7
6 7 6 7 6 7 6 7
637 607 6 97 607
x1 6 7+ x2 6 7+ x3 6 7=6 7 .
607 607 6 07 607
6 7 6 7 6 7 6 7
425 435 4 05 405
2 1 4 0

Da hvert element i en matrix ved rækkeoperationer kun påvirker det tilsvarende


element på samme plads i de andre matricer (se rækkeoperationerne nedenfor), gør
det ikke noget, at vi har opstillet matricer som søjlevektorer her. Vi kan ændre det
tilbage igen efterfølgende.

Dette er ensbetydende med det homogene lineære ligningssystem, hvis totalmatrix her op-
stilles sammen med dens trappeform (mellemregninger udelades):
2 3 2 3
1 2 1 0 1 0 3 0
60 1 2 0 7 60 1 2 07
6 7 6 7
6 7 6 7
63 0 9 07 60 0 0 07
T =6 7 ! trap(T) = 6 7. (11-29)
60 0 0 07 60 0 0 07
6 7 6 7
42 3 0 05 40 0 0 05
2 1 4 0 0 0 0 0

Af (11-29) ses, at såvel ligningssystemets koefficientmatrix som dets totalmatrix har rangen
2, og da antallet af ubekendte er større, nemlig 3, konkluderer vi, at ligningen (11-28) har
uendeligt mange løsninger. Derfor er de tre matricer lineært afhængige. For eksempel kan
man af trap(T) udlede, at

0 0 0
3A + 2B + C = .
0 0 0
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 26

Metode 11.40 Lineær afhængighed eller uafhængighed


Man kan afgøre, om vektorerne v1 , v2 , . . . , v p er lineært afhængige, ved at løse det
homogene lineære ligningssystem, hvis totalmatrix er identisk med koordinatmatri-
cen for (v1 , v2 , . . . , v p , 0) med hensyn til en given basis.

Da ligningssystemet er homogent, er der én løsning eller uendeligt mange løsninger.

• Hvis rangen af koordinatmatricen er lig med antal ubekendte p, er der én løs-


ning, og denne løsning må være nul-løsningen. I så fald er de p vektorer derfor
lineært uafhængige.

• Hvis rangen af koordinatmatricen er mindre end p, er der uendeligt mange


løsninger. I så fald findes der andre løsninger end nulløsningen, og de p vek-
torer er derfor lineært afhængige.

11.6.3 Om et sæt af vektorer er en basis

I et n-dimensionalt vektorrum kræves der n basisvektorer, ifølge sætning 11.22. Når


man bliver spurgt, om et forelagt sæt af vektorer kan være en basis, kan man straks
slutte, at dette ikke er tilfældet, hvis antallet af vektorer i sættet er større end eller mindre
end n. Da vil sættet nemlig være hhv. afhængigt eller ikke tilstrækkeligt til at udspænde
rummet.

Men hvis der er n vektorer i sættet, behøver man ifølge sætning 11.29 kun at under-
søge, om sættet er lineært uafhængigt, og her har vi allerede metode 11.40 at gå frem
efter. Vi kan dog på en interessant måde videreudvikle metoden, idet vi kan bringe
determinanten af vektorsættets koordinatmatrix i spil!

Eksempel 11.41

Lad os for eksempel undersøge om polynomierne

P1 ( x ) = 1 + 2x2 , P2 ( x ) = 2 x + x2 og P3 ( x ) = 2x + x2

udgør en basis for P2 (R ). Da dim( P2 (R )) = 3, er antallet af polynomier i orden. For at under-


søge, om de også er lineært uafhængige, benytter vi deres koordinatvektorer med hensyn til
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 27

monomiebasen og opstiller ligningen


2 3 2 3 2 3 2 3
1 2 0 0
x1 P1 ( x ) + x2 P2 ( x ) + x3 P3 ( x ) = x14 0 5+ x24 1 + x3 2 = 0 5 ,
5 4 5 4
2 1 1 0

som, hvis sættet er lineært uafhængigt, kun har løsningen x1 = x2 = x3 = 0 , altså nul-
løsningen. Ligningen er ensbetydende med et homogent lineært ligningssystem bestående
af 3 ligninger med 3 ubekendte. Systemets koefficientmatrix og totalmatrix er
2 3 2 3
1 2 0 1 2 0 0
A =4 0 1 2 5 og T = 4 0 1 2 0 5.
2 1 1 2 1 1 0

Som for ethvert homogent lineært ligningssystem består totalmatricens højreside af lutter
0’er. Derfor er det på forhånd givet, at r(A) = r(T), og at der er løsninger. Der er én løsning
netop, når r(A) er lig med antallet af ubekendte, det vil sige 3. Og denne løsning må da være
nul-løsningen x1 = x2 = x3 = 0 , idet Lhom altid indeholder nul-løsningen.

Her kan vi udnytte, at A er en kvadratisk matrix og dermed har en determinant. A har fuld
rang netop, når den er regulær, altså når det(A) 6= 0.

Ved udregning ses det, at det(A) = 5 . Derfor er matricen regulær, altså har fuld rang,
og der findes kun nulløsningen, hvorfor sættet er lineært uafhængigt. Vi konkluderer, at
P1 ( x ), P2 ( x ), P3 ( x ) udgør en basis for P2 (R ) .

Metode 11.42 Bevis for basis


Når man i et n-dimensionalt vektorrum V skal afgøre, om et vektorsæt bestående
af n vektorer (v1 , v2 , . . . , vn ) er en basis for V, behøver man blot undersøge, om
sættet er lineært uafhængigt. En særlig mulighed for at undersøge dette opstår, når
vektorsættets koordinatmatrix er en kvadratisk (n⇥n)-matrix.

Sættet udgør da en basis for V netop, når determinanten af sættets koordinatmatrix


med hensyn til en basis a er forskellig fra 0, kort sagt:
⇥ ⇤
(v1 , v2 , . . . , vn ) er en basis , det a v1 a v2 · · · a vn 6= 0 . (11-30)
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 28

11.6.4 At finde de nye koordinater når der skiftes basis

Et teknisk problem af afgørende betydning for videregående brug af lineær algebra, er


at kunne udregne nye koordinater for en vektor, når der vælges ny basis. I den sam-
menhæng får en såkaldt basisskiftematrix en vigtig rolle. Det smarte i en basisskiftem-
atrix blev kort illustreret i eksempel 10.46. Vi demonstrerer nu i de næste to eksempler,
hvordan basisskiftematricer opstår.

Eksempel 11.43 Dannelse af basisskiftematrix

I et 3-dimensionalt vektorrum V er der givet en basis a. Der vælges nu en ny basis b,


som er bestemt ved sine basisvektorers a-koordinater:
2 3 2 3 2 3
1 1 2
4 5 4
a b1 = 1 , a b2 = 0 5 og a b3 = 3 5 .
4
1 2 0

Bestem a-koordinaterne for en vektor v, som er givet ved b-koordinater således:


2 3
5
bv =4 4 5. (11-31)
1

Udtrykket (11-31) svarer til vektorligningen

v = 5b1 4b2 1b3 .

Vi omsætter ligningen til en a-koordinatvektorligning og løser den:


2 3 2 3 2 3
1 1 2
av = 5 a b1 4 a b2 1 a b3 = 5 1 5
4 4 05
4 1 35
4
1 2 0
2 32 3 2 3
1 1 2 5 1
= 4 1 0 3 54 5
4 = 4 2 5.
1 2 0 1 3

Vi har undervejs i løsningen til eksempel 11.43 trukket vektorerne ud til et matrixvektor-
produkt. Bemærk to ting:

• (3 ⇥ 3)-matricen, der indgår i dette produkt, er koordinatmatricen for b-basisvektorerne


eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 29

med hensyn til basen a (altså matricen består af b-basens a-koordinater).


• Den vektor, der indgår i produktet, er den oprindelige vektor v (altså i de oprindelige
b-koordinater).

Koordinatmatricen spiller en vigtig rolle, da vi åbenbart kan finde de nye koordinater


for en vektor ved at gange koordinatmatricen med vektoren i de originale koordinater!
Matricen får således vektoren til at skifte fra ét sæt koordinater til et andet og får derfor
betegnelsen basisskiftematrix. Den tildeles symbolet a Mb . Koordinatskifterelationen kan
da skrives på denne bekvemme måde:
av = a Mb b v . (11-32)

En huskeregel er, at den basis, der er noteret på venstre side af en vektor eller
matrix, er den basis, som vektorens eller matricens egne koordinater er an-
givet i. Det gælder for både a v og b v samt for a Mb , som jo netop består af
b-basisvektorerne i a-koordinater.

Eksempel 11.44 Brug af basisskiftematrix

Fortsæt med det i eksempel 11.43 angivne og fundne, og bestem b-koordinaterne for
en vektor u givet ved a-koordinater således:
2 3
1
au = 2 5 .
4 (11-33)
3

Da a Mb som fundet i eksempel 11.43 er en koordinatmatrix for en basis, ved vi, at den er
regulr og dermed har en invers matrix. Vi kan derfor benytte koordinatskifterelationen (11-
32) således:

au = a Mb b u ,
1 1
a Mb au = a Mb a Mb b u ,
1
bu = a Mb au ,
2 3 12 3 2 3
1 1 2 1 11
b u = 4 1 0 3 5 4 2 5=4 4 5 ,
1 2 0 3 3
1
hvor a Mb a Mb = E, som er neutral i udtrykket og forsvinder.
eNote 11 11.6 OM BRUG AF KOORDINATMATRICER 30

Det ses i eksemplet, at den inverse basisskiftematrix løser opgaven med at skifte den an-
den vej! I dette tilfælde skiftes der netop fra a-koordinater til b-koordinater. Erfaringerne
samles i den følgende metode.

Metode 11.45 Koordinatskifte ved basisskifte


Når der i et vektorrum er givet en basis a , og når en ny basis b kendes ud fra dens
basisvektorers a-koordinater, opstilles basisskiftematricen a Mb som er identisk med
a-koordinatmatricen for b-basisvektorerne.

1. Hvis b-koordinaterne for en vektor v er kendte, kan dens a-koordinater findes


ved matrix-vektorproduktet:

av = a Mb b v .

2. Hvis det omvendt er a-koordinaterne for v som er kendte, kan dens b-


koordinater findes ved matrix-vektorproduktet:
1
bv = a Mb av .

Kort sagt er den basisskiftematrix, der oversætter a-koordinater til b-


koordinater, den inverse til den basisskiftematrix, der oversætter b-koordinater
til a-koordinater:
1
b Ma = (a Mb ) .

Bemærk, hvordan en basisskiftematrix fra basis a til samme basis a naturligvis blot er
enhedsmatricen, da der ikke skal ændres noget:
2 3
1 0 ··· 0
6 0 1 ··· 0 7
6 7
a Ma = [a a1 a a2 · · · a an ] = 6 .. .. .. .. 7 = En ⇥ n ,
4 . . . . 5
0 0 ··· 1

hvor a a1 i sine egne koordinater selvfølgelig blot har koordinatsættet (1, 0, . . . , 0) og tilsvarende
for de andre søjler.
eNote 11 11.7 UNDERRUM 31

11.7 Underrum

Ofte kommer man ud for, at en delmængde af et vektorrum i sig selv er et vektorrum.


! !
På figur 7.3 ses to stedvektorer OP og OQ, som udspænder planen F :

F Q

Figur 7.3: En plan (2D) fortolket som et underrum i rummet (3D)

! !
Da span{OP, OQ} kan betragtes som et selvstændigt (2-dimensionalt) vektorrum, om-
tales det som et underrum i det (3-dimensionale) vektorrum af stedvektorer i rummet.

Definition 11.46 Underrum


En delmængde U af et vektorrum V kaldes et underrum i V, hvis det med de
nedarvede regneoperationer fra V i sig selv er et vektorrum.

I ethvert vektorrum V kan man straks udpege to underrum:

1. V er selv et underrum i V.

2. Mængden { 0 } er et underrum i V.

Disse underrum kaldes de trivielle underrum i V.

Når man skal tjekke om en delmængde er et underrum, behøver man kun at undersøge,
om stabilitetskravene er opfyldte. Det fremgår af følgende sætning.
eNote 11 11.7 UNDERRUM 32

Sætning 11.47 Tilstrækkelige betingelser for underrum


En ikke tom delmængde U af et vektorrum V er et underrum i V, hvis U er stabil
med hensyn til addition og multiplikation med skalar. Det betyder:

1. Summen af to vektorer fra U tilhører også U :

u1 , u2 2 U , u1 + u2 2 U .

2. Produktet af en vektor i U med en skalar tilhører også U :

k 2 L, u 2 U , ku 2 U .

Bevis

Da U opfylder de to stabilitetskrav i definition 11.1, mangler vi blot at argumentere for, at U


også overholder de otte regneregler i definitionen. Men dette er klart, da alle vektorer i U
også er vektorer i V, hvor de gælder.

Eksempel 11.48 Basis for et underrum

Vi betragter en delmængde M1 af R2⇥2 , som består af alle matricer af typen



a b
, (11-34)
b a
hvor a og b er vilkårlige reelle tal. Vi prøver at lægge to matricer af typen (11-34) sammen,
  
a1 b1 a2 b2 a + a2 b1 + b2
+ = 1 ,
b1 a1 b2 a2 b1 + b2 a1 + a2
og ganger én af typen (11-34) med en skalar k,
 
a b ka kb
k = .
b a kb ka
I begge tilfælde er den resulterende matrix af typen (11-34). Det følger derfor af sætning
11.47, at M1 er et underrum i R2⇥2 .
eNote 11 11.7 UNDERRUM 33

Bemærk endvidere, at M1 udspændes af to lineært uafhængige (2 ⇥ 2)-matricer, idet


  
a b 1 0 0 1
=a +b .
b a 0 1 1 0

Derfor er M1 et 2-dimensionalt underrum i R2⇥2 , og en mulig basis for M1 er givet ved


✓  ◆
1 0 0 1
, .
0 1 1 0

Eksempel 11.49 Delmængde, som ikke er et underrum

Delmængden M2 af R2⇥2 består af alle matricer af typen



a b
, (11-35)
a·b 0

hvor a og b er vilkårlige reelle tal. Vi prøver at lægge to matricer af typen (11-35) sammen,
  
1 2 2 3 3 5
+ = ,
2 0 6 0 8 0

og vi ganger én af typen (11-34) med en skalar,


 
1 2 3 6
3 = .
2 0 6 0

I ingen af tilfældene er den resulterende matrix af typen (11-35). M2 er derfor ikke et under-
rum i R2⇥2 .

11.7.1 Om udspændinger som underrum

Sætning 11.50 Udspændinger er underrum


For vilkårlige vektorer a1 , a2 , . . . , a p i et vektorrum V er span{a1 , a2 , . . . , a p } et un-
derrum i V .
eNote 11 11.7 UNDERRUM 34

Bevis

Stabilitetskravene er opfyldt, fordi

1. summen af to linearkombinationer af de p vektorer selv er en linearkombination af


dem, og fordi

2. en linearkombination af de p vektorer ganget med en skalar selv er en linearkombina-


tion af dem.

Resten følger af sætning 11.47.

Løsningsmængden Lhom for et homogent lineært ligningssystem med n ubekendte er


altid et underrum i talrummet R n , og dimensionen af underrummet er det samme som
antallet af frie parametre i Lhom . Det viser vi et eksempel på nedenfor.

Eksempel 11.51 Lhom er et underrum

Det følgende homogene lineære ligningssystem af 3 ligninger med 5 ubekendte

x1 + 2 x3 11 x5 = 0
x2 + 4 x5 = 0
x4 + x5 = 0

har løsningmængden (mellemregninger udelades):


2 3 2 3 2 3
x1 2 11
6 x 7 6 0 7 6 4 7
6 2 7 6 7 6 7
6 7 6 7 6 7
6 x3 7 = t1 6 1 7 + t2 6 0 7 hvor t1 , t2 2 R . (11-36)
6 7 6 7 6 7
4 x4 5 4 0 5 4 1 5
x5 0 1

Vi ser her, at Lhom er en udspænding af to vektorer i R5 . Den er da ifølge sætning 11.50


et underrum i R5 . Da de to vektorer endvidere klart er lineært uafhængige, er Lhom et 2-
dimensionalt underrum i R5 , som vi kan give basen

( 2, 0, 1, 0, 0) , (11, 4, 0, 1, 1) .
eNote 11 11.7 UNDERRUM 35

Igennem det følgende eksempel vil vi udarbejde en metode for, hvordan man kan skaffe
en basis for et underrum, som udspændes af et antal givne vektorer i et vektorrum.

Eksempel 11.52

Betragt i R3 de fire vektorer

v1 = (1, 2, 1), v2 = (3, 0, 1), v3 = ( 1, 4, 3) og v4 = (8, 2, 4) .

Bestem en basis for underrummet

U = span {v1 , v2 , v3 , v4 } .

Lad b = (b1 , b2 , b3 ) være en vilkårlig vektor, som tilhører U. Vi har dermed forudsat, at den
følgende vektorligning har en løsning:
x1 v1 + x2 v2 + x3 v3 + x4 v4 = b . (11-37)
Ved indsættelse af koordinatvektorerne for de fem vektorer i (11-37) ses det, at (11-37) er
ækvivalent med et inhomogent lineært ligningssystem, som har totalmatricen:
2 3 2 3
1 3 1 8 b1 1 0 2 1 c1
T =4 2 0 4 2 b2 5 ! trap(T) = 4 0 1 1 3 c2 5 . (11-38)
1 1 3 4 b3 0 0 0 0 0
c1 står for det tal, som b1 er blevet omformet til efter de rækkeoperationer, der har ført til
trap(T). Tilsvarende med c2 . Bemærk, at da rangen af koefficientmatricen viser sig at være
2 med en nul-række nederst, skal b3 efter rækkeoperationerne være omformet til 0. Ellers
ville vi have en inkonsistent ligning, og ( x1 , x2 , x3 , x4 ) ville ikke kunne være en løsning som
forudsat.

Det er dog især de ledende 1-taller i trap(T), vi skal være opmærksomme på! De viser
nemlig, at v1 og v2 udspænder hele U, og at v1 og v2 er lineært uafhængige af hinanden (de
afhænger af v3 og v4 men ikke af hinanden). Begge disse observationer kan vi overbevise os
om ved igen at betragte ligningen (11-37).

For det første


Antag, at vi kun havde spurgt, om v1 og v2 udspænder hele U. Så skulle vi have udeladt
leddene med v3 og v4 fra (11-37), og så havde vi haft
2 3
1 0 c1
trap(T2 ) = 4 0 1 c2 5 .
0 0 0
eNote 11 11.7 UNDERRUM 36

Denne trappeform viser, at x1 v1 + x2 v2 = c1 v1 + c2 v2 = b . Da c1 og c2 kan antage ethvert


reelt tal, kan v1 og v2 dermed beskrive samtlige vektorer af formen b, dvs. alle vektorer i
rummet U. De to vektorer alene udspænder derfor hele U.

For det andet


Antag, at vi havde spurgt, om v1 og v2 er lineært uafhængige. Så skulle vi have udeladt
leddene med v3 og v4 fra (11-37), og sat b = 0. Og så havde vi fået
2 3
1 0 0
trap(T3 ) = 4 0 1 0 5 ,
0 0 0

som viser, at nul-vektoren kun kan skrives som linearkombination af v1 og v2 , hvis begge
koefficienterne x1 og x2 er 0. Dermed er v1 og v2 lineært uafhængige.

Samlet er det nu vist ved to forklaringer, at (v1 , v2 ) er en basis for U. Desuden er dim(U ) = 2,
og tredjekoordinaten i b var derfor ligegyldig.

Konklusionen er, at en basis for U kan udpeges ved hjælp af de ledende 1-taller i trap(T)
uanset højreside, se (11-38). Højresiden i trap(T) indgik oprindeligt i vores argumenta-
tion men ses nu at være uden praktisk betydning. Vi kan derfor opsummere resultatet i
den følgende metode.

Metode 11.53 Om at udtynde en udspænding til en basis


Når man i et vektorrum V, hvori der er valgt en basis a , skal finde en basis for
underrummet
U = span v1 , v2 , . . . , v p ,
kan alt aflæses af ⇥ ⇤
trap a v1 a v2 ... avp . (11-39)
Hvis der i den i’te søjle i (11-39) ikke optræder et ledende 1-tal, så fjernes vi fra
sættet (v1 , v2 , . . . , v p ) . Det således udtyndede vektorsæt er en basis for U .

Da antallet af ledende 1-taller i (11-39) er lig med antallet af basisvektorer i den


valgte basis for U , følger det, at
⇣ ⇥ ⇤ ⌘
Dim(U ) = r trap a v1 a v2 . . . a v p . (11-40)
eNote 11 11.7 UNDERRUM 37

11.7.2 Uendeligt-dimensionale vektorrum

Inden vi afslutter denne eNote, der har dyrket brugen af baser og koordinater, må vi
indrømme, at det ikke er alle vektorrum, der har en basis. Der findes nemlig uendeligt-
dimensionale vektorrum!
Det kan vi indse med det følgende eksempel.

Eksempel 11.54 Uendelig-dimensionalt vektorrum

Alle polynomier i vektorrummet Pn (R ) er kontinuerte funktioner. Derfor er Pn (R ) et n+1-


dimensionalt underrum i vektorrummet C0 (R ) af alle reelle kontinuerte funktioner. Betragt
nu P(R ) , mængden samtlige af reelle polynomier, der med samme begrundelse også er et
underrum i C0 (R ). P(R ) må da være uendeligt-dimensionalt, da den for ethvert n har Pn (R )
som underrum. Af samme grund må også C0 (R ) være uendeligt-dimensionalt.

Opgave 11.55

Ved C1 (R ) forstås mængden af alle differentiable funktioner af en reel variabel, som har sin
kontinuert afledede på R.

Gør rede for, at C1 (R ) er et uendeligt-dimensionalt underrum i C0 (R ) .


eNote 12 1

eNote 12

Lineære Afbildninger

Denne eNote undersøger afbildninger mellem vektorrum af en bestemt type, nemlig lineære
afbildninger. Det vises, at kernen og billedrummet for lineære afbildninger er underrum i
henholdsvis definitionsrummet og dispositionsrummet. Når definitionsrummet og
dispositionsrummet har endelig dimension, og der er valgt en basis for hver af dem, kan
spørgsmål vedrørende lineære afbildninger standardiseres. I så fald kan en lineær afbildning
udtrykkes som et produkt mellem en såkaldt afbildningsmatrix og koordinaterne for de vektorer,
der ønskes afbildet. Da afbildningsmatricer afhænger af de to valgte baser, beskrives det,
hvordan afbildningsmatricerne ændres, når en af baserne eller de begge udskiftes med andre.
Forudsætninger for eNoten er viden om lineære ligningssystemer, se eNote 6, matrixalgebra, se
eNote 7, og vektorrum, se eNote 11.

Opdateret 05.11.21 af Karsten Schmidt.

12.1 Om afbildninger

En afbildning er en forskrift f , der til et element i en mængde A knytter et element i en


mængde B, og forskriften skrives f : A ! B . A kaldes definitionsmængden og B disposi-
tionsmængden.

CPR-nummerering kan betragtes som en afbildning af mængden af statsborgere i Dan-


mark ind i R10 . Hvert af de ti cifre i CPR-nummeret tilhører nemlig det reelle talrum.
Man siger, at der er en 10-dobbelt uendelighed af elementer i dispositionsmængden
R10 . Men selvom hvert ciffer tilhører det reelle talrum, kan de hver især ikke antage
alle reelle tal (fx bruges der ikke negative tal). Derfor bliver der kun benyttet en langt
eNote 12 12.1 OM AFBILDNINGER 2

mindre delmængde af dette meget store 10-dimensionelle talrum, nemlig ca. fem mil-
lioner! De elementer i R10 , som på et givet tidspunkt er i brug, kaldes billedmængden
eller værdimængden for CPR-afbildningen.

En enkel type af afbildninger er elementære 15 funktioner af typen f : R ! R . Pilen !


udtrykker her, at f til ethvert reelt tal x knytter
14
et andet reelt tal y = f ( x ) . Betragt for
eksempel den kontinuerte funktion
13

1 2
x ! f ( x ) 12= x 2. (12-1)
2
11

Her har forskriften form af en regneprocedure: Sæt tallet i anden, gang det med en halv,
10
og træk 2 fra. Reelle funktioner har en stor fordel i, at deres graf { ( x, y) | y = f ( x ) }
kan tegnes og give et godt overblik over afbildningen,
9
se Figur 12.1.
8

7
Y
6

X
10 8 6 4 2 0 2 4 6

1
Figur 12.1: Graf for funktion
3 x! 2 x2 2
4

Typiske spørgsmål i forbindelse med elementære


5
funktioner kommer igen i forbindelse
med mere avancerede afbildninger. Lad os derfor indledningsvis kigge på nogle af de
6
vigtigste opgavetyper:
7

1. Bestem nulpunkterne for f . Det betyder,


8
at vi skal finde alle x, for hvilke f ( x ) = 0.
I eksemplet herover er svaret x = 2 9og x = 2.

2. Løs for et givet b ligningen f ( x ) = b . For b = 6 er der i eksemplet herover de to


løsninger x = 4 og x = 4 .

3. Bestem billedmængden (eller værdimængden) for f . Vi skal finde alle de b, for hvilke
ligningen f ( x ) = b har en løsning. I eksemplet er billedmængden [ 2; • [.
eNote 12 12.2 EKSEMPLER PÅ LINEÆRE AFBILDNINGER I PLANEN 3

Alle tre ovenstående resultater aflæses tydeligt af grafen på Figur 12.1.

I denne eNote ser vi på definitionsmængder og dispositionsmængder som er vektor-


rum. De kaldes derfor definitionsrum og dispositionsrum. En afbildning f : V ! W
knytter til enhver vektor x i definitionsrummet V en vektor y = f (x) i dispositionsrummet
W . Alle de vektorer i W , som er billede ved f af en vektor i V , udgør billedmængden.
Hvis f er en lineær afbildning (emnet for denne eNote) er billedmængden et underrum
i dispositionsrummet (jf. sætning12.11), og vi kalder i så tilfælde billedmængden for et
billedrum.

Eksempel 12.1 Afbildning fra vektorrum til vektorrum

En afbildning g : R2⇥3 ! R2⇥2 er givet ved

g(X) = X X> . (12-2)

Der gælder for eksempel, at


2 3
⇣ 1 0 2 ⌘  1 0 2 1 0 
g = 4 0 3 5= 5 0 .
0 3 0 0 3 0 0 9
2 0

5 0
Definitionsrummet er R2⇥3 , dispositionsrummet er R2⇥2 , og det ses at tilhører billed-
0 9
mængden. Opgave: Vis at billedmængden i tilfældet g ikke er et billedrum.

12.2 Eksempler på lineære afbildninger i planen

Vi undersøger i det følgende en afbildning f , der har mængden af geometriske vektorer


i planen som både definitionsrum og dispositionsrum. Denne afbildning f er givet ved

f(x) = 2 x̂ , (12-3)

hvor vi ved x̂ forstår tværvektoren til en given geometrisk vektor x . Til enhver vektor i
planen er der altså knyttet dens tværvektor multipliceret (forlænget) med 2. På Figur
12.2 er der tegnet to vektorer u og v og deres billeder f (u) og f (v).
eNote 12 12.2 EKSEMPLER PÅ LINEÆRE AFBILDNINGER I PLANEN 4

f(u)

f(v)
v

u
O

Figur 12.2: To vektorer (blå) og deres billeder (røde)

Figur 12.2 giver anledning til et par interessante spørgsmål: Hvordan afbildes sumvek-
toren u + v ? Mere præcist: Hvordan forholder billedvektoren f (u + v) sig til de to
billedvektorer f (u) og f (v)? Og hvad er relationen mellem billedvektorerne f (ku) og
f (u) , når k er et givet reelt tal?

f(u+v)
f(ku)

f(u)
f(u)
f(v)
v
u+v
u

u
O ku
O

Figur 12.3: Konstruktion af f (u + v) og f (ku) .

Som antydet på figur 12.3 opfylder f to meget enkle regler:

f (u + v) = f (u) + f (v) og f (ku) = k f (u) . (12-4)

Ved hjælp af de velkendte regneregler for tværvektorer

1. u[
+ v = û + v̂ og
c = kû
2. ku
eNote 12 12.2 EKSEMPLER PÅ LINEÆRE AFBILDNINGER I PLANEN 5

kan vi nu bekræfte påstanden (12-4) :


f (u + v) = 2u[
+ v = 2(û + v̂) = 2û + 2v̂
= f (u) + f (v)
c = 2kû = k (2û)
f (ku) = 2ku
= k f (u) .

Opgave 12.2

En afbildning f 1 af plane vektorer er givet ved f 1 (v) = 3v, se figur 12.4.

f(v)=3v

v
O

Figur 12.4: Skalering af vektor

Tegn en figur, der illustrerer, at f 1 opfylder reglerne (12-4) .

Opgave 12.3

I planen er der givet en linje l gennem origo. En afbildning f 2 spejler vektorer afsat ud fra
origo i l , se figur 12.5.

l
O

f(v)

Figur 12.5: Spejling af vektor

Tegn en figur, der illustrerer, at f 2 opfylder reglerne (12-4) .


eNote 12 12.3 LINEÆRE AFBILDNINGER 6

Opgave 12.4

En afbildning f 3 drejer vektorer afsat ud fra origo vinklen t omkring origo mod uret, se figur
12.6.

f(v)

t
v

Figur 12.6: Drejning af vektor

Tegn en figur, der demonstrerer, at f 3 opfylder reglerne (12-4) .

Alle afbildninger, der har været berørt i dette afsnit, er lineære, fordi de opfylder (12-
4) . Vi tager nu spørgsmålet om lineære afbildninger mellem vektorrum op til generel
behandling.

12.3 Lineære afbildninger

Definition 12.5 Lineær afbildning


Lad V og W være to vektorrum over L, og lad L betegne enten R eller C. En af-
bildning f : V ! W kaldes lineær, hvis den for alle u, v 2 V og alle skalarer k 2 L
opfylder de følgende to linearitetsbetingelser:

L1 : f (u + v) = f (u) + f (v) .

L2 : f (ku) = k f (u) .

V kaldes definitionsrummet og W dispositionsrummet for f .


eNote 12 12.3 LINEÆRE AFBILDNINGER 7

Ved at sætte k = 0 i linearitetsbetingelsen L2 i definition 12.5 ses det, at

f (0) = 0 . (12-5)

Der gælder med andre ord for enhver lineær afbildning f : V ! W , at nul-
vektoren i V afbildes i nul-vektoren i W .

Billedet af en linearkombination bliver på en meget enkel måde en linearkom-


bination af billederne af de vektorer, der indgår:

f (k1 v1 + k2 v2 + . . . + k p v p ) = k1 f (v1 ) + k2 f (v2 ) + . . . + k p f (v p ) . (12-6)

Dette resultat fås ved gentagen anvendelse af L1 og L2 .

Bemærk ligheden mellem linearitetsbetingelserne L1 og L2 i definition 12.5 og


stabilitetskravene I og II i sætning 11.1. Men husk også forskellen: linearitets-
betingelserne er til at teste, om en afbildning er liner, mens stabilitetskravene er
til at teste, om et rum er et vektorrum.

Eksempel 12.6 Lineær afbildning

En afbildning f : R2 ! R4 er givet ved forskriften

f ( x1 , x2 ) = (0, x1 , x2 , x1 + x2 ) . (12-7)

R2 og R4 er reelle vektorrum, og vi undersøger, om f er lineær. Vi tester først venstresiden


VS og højresiden HS af L1 med vektorerne (1, 2) og (3, 4):

VS : f ( (1, 2) + (3, 4) ) = f (4, 6) = (0, 4, 6, 10) .


HS : f (1, 2) + f (3, 4) = (0, 1, 2, 3) + (0, 3, 4, 7) = (0, 4, 6, 10) .

VS = HS, så L1 er opfyldt i dette tilfælde. Dernæst testes L2 med vektoren (2,3) og skalaren
5:

VS : f ( 5 · (2, 3) ) = f (10, 15) = (0, 10, 15, 25) .


HS : 5 · f (2, 3) = 5 · (0, 2, 3, 5) = (0, 10, 15, 25) .

Igen er VS = HS. Undersøgelsen tyder umiddelbart på, at f er lineær, men kun for disse
eNote 12 12.3 LINEÆRE AFBILDNINGER 8

eksempler. Dette vises nu generelt. Først testes L1 :

VS : f ( ( x1 , x2 ) + ( y1 , y2 ) ) = f ( x1 + y1 , x2 + y2 )
= (0, x1 + y1 , x2 + y2 , x1 + x2 + y1 + y2 )
HS : f ( x1 , x2 ) + f (y1 , y2 ) = (0, x1 , x2 , x1 + x2 ) + (0, y1 , y2 , y1 + y2 )
= (0, x1 + y1 , x2 + y2 , x1 + x2 + y1 + y2 ) .

Dernæst testes L2 :

VS : f ( k · ( x1 , x2 ) ) = f (k · x1 , k · x2 ) = (0, k · x1 , k · x2 , k · x1 + k · x2 )
HS : k · f ( x1 , x2 ) = k · (0, x1 , x2 , x1 + x2 ) = (0, k · x1 , k · x2 , k · x1 + k · x2 ) .

Højre- og venstreside er ens i begge tilfælde, så f opfylder begge linearitetsbetingelser og er


derfor lineær.

Eksempel 12.7 Afbildning, som ikke er lineær

I eksempel 12.1 betragtede vi afbildningen g : R2⇥3 ! R2⇥2 givet ved

Y = g(X) = X X> . (12-8)

At denne afbildning ikke er lineær, kan man dokumentere ved at finde blot ét eksempel, hvor
enten L1 eller L2 ikke gælder. Nedenfor gives et sådan eksempel på en matrix X, der med en
skalar 2 ikke opfylder g(2X) = 2 g(X) :

2 3
⇣ 1 0 0 ⌘ ⇣ 2 0 0 ⌘  2 0 0 2 0 
VS : g 2 =g = 4 0 0 5= 4 0 ,
0 0 0 0 0 0 0 0 0 0 0
0 0
men 2 3
⇣ 1 0 0 ⌘  1 0  
1 0 0 4 5 1 0 2 0
HS : 2g =2 0 0 =2 = .
0 0 0 0 0 0 0 0 0 0
0 0
Derfor opfylder g ikke linearitetsbetingelse L2 , og g er ikke lineær.

Eksempel 12.8 Lineær afbildning

Der er givet en afbildning f : P2 (R ) ! R ved forskriften

f P ( x ) = P 0 (1) . (12-9)

Til ethvert andengradspolynomium er altså knyttet dets tangenthældning i x = 1 .


Er f en lineær afbildning?
eNote 12 12.4 KERNE OG BILLEDRUM 9

Et vilkårligt andengradspolynomium P( x ) kan opskrives ved P( x ) = ax2 + bx + c , hvor a, b


og c er reelle konstanter. Da P0 ( x ) = 2ax + b , må højresiden af afbildningen være P0 (1) =
2a · 1 + b = 2a + b :
f P( x ) = 2a + b .
Hvis vi sætter P1 ( x ) = a1 x2 + b1 x + c1 og P2 ( x ) = a2 x2 + b2 x + c2 , får vi

f P1 ( x ) + P2 ( x ) = f ( a1 + a2 ) x2 + (b1 + b2 ) x + (c1 + c2 )
= 2( a1 + a2 ) + (b1 + b2 )
= (2a1 + b1 ) + (2a2 + b2 )
= f P1 ( x ) + f P2 ( x ) .

Endvidere gælder for ethvert reelt tal k og ethvert andengradspolynomium P( x ):

f k · P( x ) = f k · ax2 + k · bx + k · c
= (2k · a + k · b) = k · (2a + b)
= k · f P( x ) .

Det er hermed vist, at f opfylder linearitetsbetingelserne L1 og L2 , og at f dermed er en


lineær afbildning.

Opgave 12.9

Ved C • (R ) forstås vektorrummet, som består af alle funktioner f : R ! R , der kan differ-
entieres et vilkårligt antal gange. Et eksempel (blandt uendeligt mange) er sinus-funktionen.
Betragt afbildningen D : C • (R ) ! C • (R ), som til en funktion f 2 C • (R ) knytter dens
afledte:
D f (x) = f 0 (x) .
Vis, at D er en lineær afbildning.

12.4 Kerne og billedrum

Nulpunkterne eller rødderne for en elementær funktion f : R ! R er alle de reelle tal x,


som opfylder f ( x ) = 0 . Det tilsvarende begreb for lineære afbildninger kaldes kernen
og betegnes ker( f ).

Billedmængden (eller værdimængden) for en elementær funktion f : R ! R er alle de


reelle tal b, hvortil der findes et reelt tal x således, at f ( x ) = b . Som nævnt tidligere
kaldes det tilsvarende begreb for lineære afbildninger billedrummet. Lad os straks ret-
færdiggøre, at ordet rum optræder her. Det er nemlig således, at kernen er et underrum
eNote 12 12.4 KERNE OG BILLEDRUM 10

i definitionsrummet, mens billedrummet er et underrum i dispositionsrummet. Dette


viser vi nu.

Definition 12.10 Lineær ligning. Kerne og billedrum


Givet to vektorrum V og W . En ligning på formen

f (x) = b (12-10)

hvor f : V ! W er en lineær afbildning og b 2 W kaldes en lineær ligning.

Lad f : V ! W være en lineær afbildning.


Ved kernen for f forstås løsningsmængden for den lineære ligning f (x) = 0 :

ker( f ) = { x 2 V | f (x) = 0 2 W } . (12-11)

Ved billedrummet f (V ) for f forstås mængden af vektorer b 2 W for hvilke den


lineære ligning f (x) = b har mindst én løsning:

f (V ) = { b 2 W | Der findes mindst ét x 2 V , hvor f (x) = b } . (12-12)

Sætning 12.11 Kernen og billedrummet er underrum


Lad f : V ! W være en lineær afbildning. Der gælder:

1. Kernen for f er et underrum i V .

2. Billedrummet f (V ) er et underrum i W .

Bevis

Første punkt
Vi skal ifølge sætning 11.47 vise, at kernen for f opfylder stabilitetskravene. Antag, at
x1 , x2 2 V og f (x1 ) = f (x2 ) = 0, og at k er en vilkårlig skalar. Da der (ved brug af L1 ,
da vi forudsætter, at f er lineær) gælder:

f (x1 + x2 ) = f (x1 ) + f (x2 ) = 0 + 0 = 0 ,


eNote 12 12.4 KERNE OG BILLEDRUM 11

er kernen for f stabil med hensyn til addition. Da der endvidere (med brug af L2 ) gælder:

f (kx1 ) = k f (x1 ) = k 0 = 0 ,

er kernen for f også stabil med hensyn til multiplikation med skalar. Samlet er det dermed
vist, at kernen for f er et underrum i V .

Andet punkt
Vi skal vise, at billedrummet f (V ) opfylder stabilitetskravene. Antag, at vektorerne b1 og b2
tilhører billedrummet, b1 2 f (V ) og b2 2 f (V ), og at k er en vilkårlig skalar. Der findes ifølge
definition 12.10 vektorer x1 2 V og x2 2 V, som opfylder f (x1 ) = b1 og f (x2 ) = b2 . Vi skal
vise, at der findes et x 2 V, så f (x) = b1 + b2 . Det gør der, da vi blot kan tage x = x1 + x2 ,
for så gælder:
f (x) = f (x1 + x2 ) = f (x1 ) + f (x2 ) = b1 + b2 .
Hermed er det vist, at f (V ) er stabil med hensyn til addition. Vi skal nu på lignende måde
vise, at der findes et x 2 V, så f (x) = kb1 . Vi vælger x = kx1 , så der gælder

f (x) = f (kx1 ) = k f (x1 ) = kb1 ,

hvoraf det fremgår, at f (V ) er stabil med hensyn til multiplikation med skalar. Samlet er det
vist, at begge stabilitetskrav er opfyldt, så f (V ) er et underrum i W.

Men hvorfor er det så interessant, at kernen og billedrummet for en lineær afbildning


er underrum? Svaret er, at det bliver enklere at beskrive dem, når vi ved, at de har
vektorrumsegenskaber, og dermed på forhånd kender deres struktur. Særligt elegant er
det, når vi kan bestemme kernen og billedrummet ved at angive en basis for dem. Dette
forsøger vi i det næste eksempel.

Eksempel 12.12 Bestemmelse af kerne og billedrum

En lineær afbildning f : R3 ! R2 er givet ved forskriften

f ( x1 , x2 , x3 ) = ( x1 + 2x2 + x3 , x1 2x2 x3 ) . (12-13)

Bestem kernen ker( f ) og billedrummet f (R3 ) for f .

Det er givet, at f er lineær, så det behøver vi ikke at undersøge.

Bestemmelse af kernen
eNote 12 12.4 KERNE OG BILLEDRUM 12

Vi skal løse ligningen


 
x1 + 2x2 + x3 0
f (x) = 0 , = . (12-14)
x1 2x2 x3 0
Dette er et lineært ligningssystem bestående af to ligninger med tre ubekendte. Det har
totalmatricen  
1 2 1 0 1 2 1 0
T= ! trap(T) = .
1 2 1 0 0 0 0 0
Vi ser, at ligningssystemet har løsningsmængden
2 3 2 3 2 3
x1 2 1
4 x2 5 = t1 4 1 5+ t2 4 0 5 , t1 , t2 2 R.
x3 0 1

Løsningsmængden er udspændt af to lineært uafhængige vektorer. Vi kan derfor konklud-


ere, at kernen for f er et 2-dimensionalt underrum i definitionsrummet R3 , som kan beskrives
ved en basis.
En basis for kernen er : ( 2, 1, 0), ( 1, 0, 1) .

Der er altså en hel plan af vektorer i rummet, som ved indsættelse i forskriften giver
billedet 0. Denne basis angiver dem alle.

Bestemmelse af billedrummet
Vi skal finde alle de resulterende vektorer (billeder) b = (b1 , b2 ), for hvilke følgende ligning
har en løsning:
 
x1 + 2x2 + x3 b
f (x) = b , = 1 . (12-15)
x1 2x2 x3 b2

Bemærk, at det ikke er x1 , x2 og x3 , vi leder efter, som vi ellers plejer i sådan et


ligningssystem. Derimod er det højresidens b1 og b2 , som vi vil bestemme netop i de
tilfælde, hvor der ér løsninger! For når systemet har løsninger for en bestemt højreside,
så må denne højreside være med i billedmængden, som vi netop leder efter.

Det lineære ligningssystem har totalmatricen og trappeformen


 
1 2 1 b1 1 2 1 b1
T= ! trap(T) = .
1 2 1 b2 0 0 0 b1 + b2

Hvis b1 + b2 = 0 , altså hvis b1 = b2 , har ligningssystemet uendeligt mange løsninger.


Hvis derimod b1 + b2 6= 0, er der ingen løsninger. Alle de b = (b1 , b2 ) 2 R2 , som er billeder
eNote 12 12.4 KERNE OG BILLEDRUM 13

af mindst ét x 2 R3 , skal altså opfylde b1 = b2 . Vi kan betragte b2 som en fri parameter, og


løsningsmængden kan opskrives som
 
b1 1
=t .
b2 1

Vi konkluderer, at f (V ) er et 1-dimensionalt underrum i R2 , som kan beskrives ved en basis.

En basis for billedrummet er : ( 1, 1) .

Opgave 12.13 Bestemmelse af kerne og billedrum

I eksempel 12.8 blev det vist, at afbildningen f : P2 (R ) ! R givet ved forskriften

f P ( x ) = P 0 (1) (12-16)

er lineær. Kernen for f består af alle andengradspolynomier, der har billedet 0, altså alle dem,
der opfylder P0 (1) = 0 . Grafen for to, der opfylder dette, er vist på figuren.

O 1 X

Bestem kernen for f .

I eNote 6 er sammenhængen mellem løsningsmængden for et inhomogent lineært lign-


ingssystem og løsningsmængden for det tilsvarende homogene ligningssystem præsen-
teret i struktursætningen 6.37. Vi viser nu at der gælder en tilsvarende sammenhæng
eNote 12 12.4 KERNE OG BILLEDRUM 14

for alle lineære ligninger.

Sætning 12.14 Struktursætning for lineære ligninger


Lad f : V ! W være en lineær afbildning og b en vilkårlig egentlig vektor i W .
Lad endvidere x0 være en vilkårlig (såkaldt partikulær) løsning til den inhomogene
lineære ligning
f (x) = b . (12-17)
Da er den fuldstændige løsning Linhom til den lineære ligning givet ved

Linhom = x = x0 + x1 x1 2 ker( f ) , (12-18)

eller kort skrevet


Linhom = x0 + ker( f ) . (12-19)

Bevis

Sætningen rummer to påstande. Den ene er at summen af x0 og en vilkårlig vektor fra ker( f )
tilhører Linhom . Den anden er at en vilkårlig vektor fra Linhom kan skrives som summen af x0
og en vektor fra ker( f ) . Vi viser de to påstande hver for sig:

1. Antag x1 2 ker( f ) . Da gælder med brug af linearitetsbetingelse L1 :

f (x1 + x0 ) = f (x1 ) + f (x0 ) = 0 + b = b (12-20)

hvorved vist at også x1 + x0 er en løsning til (12-17).

2. Antag at x2 2 Linhom . Da gælder med brug af linearitetsbetingelse L1 :

f (x2 x0 ) = f (x2 ) f (x0 ) = b b = 0 , x2 x0 2 ker( f ) . (12-21)

Der findes dermed en vektor x1 2 ker( f ) som opfylder

x2 x0 = x1 , x2 = x0 + x1 (12-22)

hvorved vi har opskrevet x2 på den ønskede form. Beviset er hermed fuldført.


eNote 12 12.5 AFBILDNINGSMATRIX 15

Opgave 12.15

Betragt afbildningen D : C • (R ) ! C • (R ) fra Opgave 12.9 som til en funktion f 2 C • (R )


knytter dens afledte:
D f (x) = f 0 (x) .

Opskriv den fuldstændige løsning til den inhomogene lineære ligning

D( f ( x )) = x2

og fortolk den i lyset af struktursætningen.

12.5 Afbildningsmatrix

Alle lineære afbildninger fra et endeligt-dimensionalt definitionsrum V til et endeligt


dispositionsrum W lader sig beskrive ved hjælp af en afbildningsmatrix. Forudsætningen
er blot, at der vælges en basis for både V og W, og at vi overgår fra vektorregning til
regning med vektorernes koordinater med hensyn til de valgte baser. Den store fordel
ved dette setup er, at vi kan opstille generelle regnemetoder for alle lineære afbildninger
mellem endeligt-dimensionale vektorrum. Det ser vi på senere i afsnit 12.6. Men nu
drejer det sig om, hvordan man opstiller afbildningsmatricer.

Lad A være en reel eller kompleks (m ⇥ n)-matrix. Vi betragter en afbildning f : L n !


L m , som er beskrevet ved et matrix-vektorprodukt:

f(x) = A x . (12-23)

Ved at benytte regneregler for matrixprodukt, se sætning 7.13, opnår vi for ethvert valg
af x1 , x2 2 R n og enhver skalar k:

f (x1 + x2 ) = A (x1 + x2 ) = Ax1 + Ax2 = f (x1 ) + f (x2 )

f (kx1 ) = A (kx1 ) = k(A x1 ) = k f (x1 ) .


Vi ser, at afbildningen opfylder linearitetsbetingelserne L1 og L2 . Enhver afbildning af
formen (12-23) er derfor lineær.
eNote 12 12.5 AFBILDNINGSMATRIX 16

Eksempel 12.16 Matrix-vektor produkt som lineær afbildning

Udtrykket
2 3 2 3 2 3
y1 1 2  x1 + 2x2
x
4 y2 5 = 4 3 4 5 1 = 4 3x1 + 4x2 5
x2
y3 5 6 5x1 + 6x2
angiver en lineær afbildning fra vektorrummet R2 til vektorrummet R3 .

Men også det modsatte gælder: Enhver lineær afbildning mellem endeligt-dimensionale
vektorrum kan skrives som et matrix-vektorprodukt på formen (12-23), hvis vi erstatter
x og y med deres koordinater med hensyn til en valgt basis i definitionsrummet hen-
holdsvis dispositionsrummet. Dette viser vi i det følgende.

Vi betragter en lineær afbildning f : V ! W , hvor V er et n-dimensionalt og W et


m-dimensionalt vektorrum, se figur 12.8.

V med dim = n W med dim = m

x
y = f(x)

a-basis: (a1, a2, ..., an ) c-basis: (c1, c2, ..., cm )

Figur 12.8: Lineær afbildning

For V er der valgt en basis a og for W en basis c. Det betyder, at en given vektor x 2 V
kan skrives som en unik linearkombination af a-basisvektorerne, og at billedet y = f (x)
kan skrives som en unik linearkombination af c-basisvektorerne:
x = x1 a1 + x2 a2 + . . . + xn an og y = y1 c1 + y2 c2 + · · · + ym cm .
Det betyder, at ( x1 , x2 , . . . , xn ) er koordinatsæt for x med hensyn til a-basis, og at (y1 , y2 , . . . , ym )
er koordinatsæt for y med hensyn til c-basis.
eNote 12 12.5 AFBILDNINGSMATRIX 17

Vi stiller nu spørgsmålet: Hvordan kan vi beskrive relationen mellem a-koordinatvektoren


for vektor x 2 V og c-koordinatvektoren for billedvektoren y? Vi er med andre ord på
jagt efter relationen mellem
2 3 2 3
y1 x1
6 y2 7 6 x2 7
6 7 6 7
c y = 6 .. 7 og a x = 6 .. 7 ,
4 .5 4 .5
ym xn

hvor a x skal omformes til c y ved en lineær afbildning f . Denne relation udvikler vi
igennem de følgende omskrivninger, hvor vi først ved hjælp af L1 og L2 får opskrevet y
som en linearkombination af billederne af a-vektorerne:

y = f (a x)
= f ( x1 a1 + x2 a2 + · · · + xn an )
= x1 f (a1 ) + x2 f (a2 ) + · · · + xn f (an ) .

Herefter fortsætter vi ved at undersøge koordinatvektoren for y med hensyn til c-basis,
idet vi først bruger koordinatsætningen, se sætning 11.34, og derefter definitionen på
matrixvektor-produkt, se definition 7.7.

cy = c x1 f (a1 ) + x2 f (a2 ) + · · · + xn f (an )


= x1 c f (a1 ) + x2 c f (a2 ) + · · · + xn c f (an )
⇥ ⇤
= c f ( a1 ) c f ( a2 ) · · · c f ( a n ) a x .

⇥ ⇤
Matricen c f (a1 ) c f (a2 ) · · · c f (an ) i den sidste ligning kaldes afbildningsmatricen
for f med hensyn til a-basis i V og c-basis i W.

Vi har hermed opnået dette vigtige resultat: Koordinatvektoren c y kan findes ved, at man
ganger afbildningsmatricen med koordinatvektoren a x. En afbildning kan dermed gennem-
føres blot ved et matrix-vektorprodukt! Resultaterne opsummerer vi nu i det følgende.
eNote 12 12.5 AFBILDNINGSMATRIX 18

Definition 12.17 Afbildningsmatrix


Lad f : V ! W være en lineær afbildning fra et n-dimensionalt vektorrum V til et
m-dimensionalt vektorrum W . Ved afbildningsmatricen for f med hensyn til basis a
i V og basis c i W forstås (m ⇥ n)-matricen
⇥ ⇤
c Fa = c f (a1 ) c f (a2 ) · · · c f (an ) . (12-24)

Afbildningsmatricen for f består dermed af koordinatvektorerne med hensyn til ba-


sis c for billederne af de n basisvektorer i basis a.

Bemærk, at der benyttes samme notation for en afbildningsmatrix, c Fa , som


for en basisskiftematrix, c Ma . Mens en basisskiftematricen består af a-
basisvektorerne i c-koordinater, består afbildningsmatricen af a-basisvektorernes
billeder i c-koordinater.

Hovedopgaven for en afbildningsmatrix er naturligvis at kunne bestemme billeder i W


af vektorer i V, og den legitimeres af den følgende sætning, som er en opsummering af
undersøgelserne ovenfor.

Sætning 12.18 Hovedsætning om afbildningsmatrix


Lad V være et n-dimensionalt vektorrum med valgt basis a og W et m-dimensionalt
vektorrum med valgt basis c .

1. For en lineær afbildning f : V ! W gælder, at hvis y = f (x) er billedet af en


vilkårlig vektor x 2 V , så gælder der:

cy = c Fa a x , (12-25)

hvor c Fa er afbildningsmatricen for f med hensyn til basis a i V og basis c i


W.

2. Antag omvendt, at billederne y = g(x) for en afbildning g : V ! W kan fås


på koordinatform ved
c y = c Ga a x , (12-26)
hvor c Ga 2 L m⇥n . Så er g lineær, og c Ga er afbildningsmatricen for g med
hensyn til basis a i V og basis c i W .
eNote 12 12.5 AFBILDNINGSMATRIX 19

Herefter følger tre eksempler på opstilling og elementær brug af afbildningsmatricer.

Eksempel 12.19 Opstilling og brug af afbildningsmatrix

Drejning af plane vektorer afsat ud fra origo er et enkelt eksempel på en lineær afbildning, se
opgave 12.4. Lad v være en vilkårlig vinkel, og lad f være den lineære afbildning, der drejer
en vilkårlig vektor vinkel v omkring origo mod uret, se figur 12.9.

f(x)

x
j
v
i
O

Figur 12.9: Lineær drejning omkring origo

Vi ønsker at bestemme afbildningsmatricen for f med hensyn til standardbasen for vektorer
i planen. Vi har derfor brug for billederne af basisvektorerne i og j , se figur 12.10.

j f(i)
v
f(j) v
O i

Figur 12.10: Bestemmelse af afbildningsmatrix

Det ses, at f (i) = (cos(v), sin(v)) og f (j) = ( sin(v), cos(v)). Den ønskede afbildningsma-
trix er derfor 
cos(v) sin(v)
e Fe = [e f (i) e f (j)] = .
sin(v) cos(v)
eNote 12 12.5 AFBILDNINGSMATRIX 20

Koordinaterne for billedet y = f (x) af en given vektor x fås dermed ud fra formlen
  
y1 cos(v) sin(v) x1
ey = e Fe e x , = .
y2 sin(v) cos(v) x2

Eksempel 12.20 Opstilling og brug af afbildningsmatrix

I et 3-dimensionalt vektorrum V er der valgt en basis a = (a1 , a2 , a3 ) , og i et 2-dimensionalt


vektorrum W er der valgt en basis c = (c1 , c2 ) . En lineær afbildning f : V ! W opfylder, at

f (a1 ) = 3c1 + c2 , f (a2 ) = 6c1 2c2 og f (a3 ) = 3c1 + c2 . (12-27)

Vi ønsker at finde billedet ved f af vektoren v = a1 + 2a2 + a3 2 V . Vi har altså fået vektoren
i a-koordinater, a v = (1, 2, 1). Vi finder billedet ved hjælp af afbildningsmatricen c Fa , der
netop afbilder fra et rum med basis a til et rum med basis c. Afbildningsmatricen, som derfor
skal indeholde i V ’s a-basisvektorers billeder i c-koordinater, opstilles nemt, da vi allerede
fra (12-27) kender billederne af basisvektorerne:

⇥ ⇤ 3 6 3
c Fa = c f (a1 ) c f (a2 ) c f (a3 ) . =
1 2 1

Da v har koordinatsættet (1, 2, 1) med hensyn til basis a, finder vi koordinatvektoren for
billedet f (v) således:
2 3
 1 
3 6 3 4 5 12
c f (v) = c Fa a v = 2 = .
1 2 1 2
1

Vi har hermed fundet billedet som f (v) = 12c1 2c2 .


eNote 12 12.5 AFBILDNINGSMATRIX 21

Eksempel 12.21 Opstilling og brug af afbildningsmatrix

En lineær afbildning f : R4 ! R3 er givet ved


2 3
x1 + 2x2 + x4
f ( x1 , x2 , x3 , x4 ) = 4 2x1 x2 + 2x3 x4 5 . (12-28)
x1 3x2 + 2x3 2x4

Bestem afbildningsmatricen for f med hensyn til standardbasis e i R4 og standard-


basis e i R3 . Find desuden billedet af vektoren x = (1, 1, 1, 1).

Først finder vi billederne af de fire basisvektorer i R4 ved hjælp af forskriften (12-28):


2 3 2 3
1 2
f (1, 0, 0, 0) = 4 2 5 , f (0, 1, 0, 0) = 4 15
1 3
2 3 2 3
0 1
f (0, 0, 1, 0) = 4 2 5 , f (0, 0, 0, 1) = 4 1 5.
2 2
Vi kan nu opstille afbildningsmatricen for f :
2 3
1 2 0 1
4
e Fe = 2 1 2 1 5. (12-29)
1 3 2 2

Vi vil nu finde billedet y = f (x) af den givne vektor x = (1, 1, 1, 1). Til rådighed har vi
naturligvis forskriften (12-28), men vi vælger at finde billedet ved hjælp af afbildningsmatri-
cen:

2 3
2 3 1 2 3
1 2 0 1 6 7 4
17 4
e y = F
e ee x = 4 2 1 2 1 56
4 1 5= 2 5.
1 3 2 2 2
1
Vi har hermed fundet y = f (1, 1, 1, 1) = (4, 2, 2) .

Opgave 12.22

I planen er der givet et sædvanligt (O, i, j)-koordinatsystem. Spejling af stedvektorer i linjen


y = 12 x er en lineær afbildning; lad os kalde den s .
eNote 12 12.6 OM BRUG AF AFBILDNINGSMATRICER 22

Bestem s(i) og s(j), opstil afbildningsmatricen e Se for s , og bestem et udtryk for spejlingen
af en vilkårlig stedvektor v med koordinaterne (v1 , v2 ) med hensyn til standardbasen.

Figur 12.11 indholder nogle hints til bestemmelse af s(i). Gå frem på tilsvarende vis med
s (j) .
Y

y =½ x

s(i) P
j
t
t X
O i E
s(j)

Figur 12.11: Spejling af standardbasisvektorer

12.6 Om brug af afbildningsmatricer

Afbildningsmatricer er et meget nyttigt redskab. Det tillader os at oversætte spørgsmål


om lineære afbildninger mellem vektorrum til spørgsmål om matricer og koordinatvek-
torer, som vi umiddelbart kan regne på. Metoderne forudsætter blot, at der er valgt en
basis i hvert af vektorrummene, og at den afbildningsmatrix, som hører til de to baser, er
opstillet. Sådan kan vi reducere spørgsmål af så forskellig karakter som at finde poly-
nomier med visse egenskaber, at finde resultatet af en geometrisk konstruktion og at
løse differentialligninger, til spørgsmål der kan undersøges ved hjælp af matrixalgebra.

Som gennemgående eksempel i dette afsnit ser vi på en lineær afbildning f : V ! W ,


hvor V er et 4-dimensionalt vektorrum med valgt basis a = (a1 , a2 , a3 , a4 ), og hvor W er
et 3-dimensionalt vektorrum med valgt basis c = (c1 , c2 , c3 ) . Afbildningsmatricen for f
er 2 3
1 3 1 8
c Fa = 4 2 0 4 25. (12-30)
1 1 3 4
eNote 12 12.6 OM BRUG AF AFBILDNINGSMATRICER 23

12.6.1 At finde kernen for f

Når man skal finde kernen for f , skal man finde alle x 2 V, som afbildes i 0 2 W. Det
vil sige, at man skal løse vektorligningen

f (x) = 0 .

Denne ligning er ifølge sætning 12.18 ensbetydende med matrixligningen

c Fa a x = c0
2 3
2 3 x1 2 3
1 3 1 8 6 7 0
4 56 x2 7 4 5
, 2 0 4 2 4 5= 0 ,
x3
1 1 3 4 0
x4
som svarer til det homogene lineære ligningssystem med totalmatricen:
2 3 2 3
1 3 1 8 0 1 0 2 1 0
4
T= 2 0 4 5 4
2 0 ! trap(T) = 0 1 1 3 05.
1 1 3 4 0 0 0 0 0 0

Det ses, at løsningsmængden er udspændt af to lineært uafhængige vektorer i V mht.


basis a, som vi kalder v1 og v2 :

a v1 = ( 2, 1, 1, 0) og a v2 = (1, 3, 0, 1) .

(v1 , v2 ) er dermed en basis for kernen for f , og kernen for f har dimensionen 2.

Pointen er, at antallet af ubekendte n = 4 i det løste ligningssystem pr. definition er lig
med antallet af søjler i c Fa , som igen er lig med dim(V ), se definition 12.17. Endvidere
bemærkes det, at ligningssystemets koefficientmatrix er identisk med c Fa . Hvis rangen
af koefficientmatricen er k , ved vi, at løsningsmængden og dermed kernen er udspændt
af (n k) lineært uafhængige retningsvektorer, hvor k er rangen af koefficientmatricen.
Derfor har vi:
dim(kernen) = n r (c Fa ) = 4 2 = 2 .
eNote 12 12.6 OM BRUG AF AFBILDNINGSMATRICER 24

Metode 12.23 Bestemmelse af kernen


I et vektorrum V er der valgt en basis a, og i et vektorrum W er der valgt en basis
c. Kernen for en lineær afbildning f : V ! W kan i koordinatform findes som
løsningsmængden for det homogene lineære ligningssystem, som har totalmatricen
⇥ ⇤
T = c Fa c 0 .

Kernen er et underrum i V , og dens dimension er bestemt ved:

dim( ker( f ) ) = dim(V ) r (c Fa ) . (12-31)

12.6.2 At løse vektorligningen f (x) = b

Hvordan kan man afgøre, om en vektor b 2 W, som ligger i dispositionsrummet, også


tilhører billedrummet for en given lineær afbildning? Spørgsmålet er, om der findes
(mindst) et x 2 V, som afbildes i b . Og spørgsmålet kan udvides til, hvordan man
kan bestemme alle de x 2 V med denne egenskab, som afbildes i b .

Vi betragter igen den lineære afbildning f : V ! W , der er repræsenteret af af-


bildningsmatricen (12-30), og vælger som eksempel den vektor b 2 W, som har c-
koordinaterne (1, 2, 3) . Vi skal løse vektorligningen
f (x) = b .
Regner vi i koordinater, svarer vektorligningen til følgende matrixligning:

c Fa a x = cb ,
hvilket vil sige matrixligningen
2 3
2 3 x1 2 3
1 3 1 8 6 7 1
42 6 x 2 7
0 4 2 54 5 = 4 2 5 ,
x3
1 1 3 4 3
x4
som svarer til et inhomogent lineært ligningssystem med totalmatricen
2 3
1 3 1 8 1
T =4 2 0 4 2 25,
1 1 3 4 3
eNote 12 12.6 OM BRUG AF AFBILDNINGSMATRICER 25

der ved GaussJordan-elimination reduceres til


2 3
1 0 2 1 0
4
trap(T) = 0 1 1 3 05.
0 0 0 0 1

Da rangen af totalmatricen her er større end rangen af koefficientmatricen, har det in-
homogene ligningssystem ingen løsninger. Vi har altså fundet en vektor i W, som ingen
"´originalvektor"’ har i V.

Metode 12.24 Løsning af inhomogen vektorligning f (x) = b


I et vektorrum V er der valgt en basis a og i et vektorrum W er der valgt en basis c.
For en lineær afbildning f : V ! W, og en egentlig vektor b 2 W er den lineære
ligning
f (x) = b
ækvivalent med det inhomogene lineære ligningssystem, som har totalmatricen
⇥ ⇤
T = c Fa c b .

Eventuelle løsninger kan derfor findes ved sædvanlig GaussJordan-elimination.

Et inhomogent lineært ligningssystem, bestående af m ligninger med n ubek-


endte, med koefficientmatricen A og højresiden b kan på matrixform skrives
som
Ax = b .
Afbildningen f : L n ! L m givet ved

f (x) = Ax

er lineær. Den lineære ligning f (x) = b er dermed ækvivalent med det be-
tragtede lineære ligningssystem. Vi kan herved indse at struktursætningen for
lineære ligningssystemer (se eNote 6 sætning 6.37) blot er et særtilfælde af den
generelle struktursætning for lineære ligninger (sætning 12.14).
eNote 12 12.6 OM BRUG AF AFBILDNINGSMATRICER 26

12.6.3 At bestemme billedrummet

Vi har tidligere fundet, at billedrummet for en lineær afbildning er et underrum i dispo-


sitionsrummet, se sætning 12.11. Hvordan kan dette underrum afgrænses og beskrives?

Vi betragter igen den lineære afbildning f : V ! W , der er repræsenteret af af-


bildningsmatricen (12-30). Da der er valgt basen (a1 , a2 , a3 , a4 ) for V, kan vi opskrive
samtlige vektorer i V på én gang:

x = x1 a1 + x2 a2 + x3 a3 + x4 a4 ,

idet vi tænker os at x1 , x2 , x3 og x4 gennemløber alle tænkelige kombinationer af reelle


værdier. Men så kan samtlige billeder i W af vektorer i V opskrives ved

f (x) = f ( x1 a1 + x2 a2 + x3 a3 + x4 a4 )
= x1 f (a1 ) + x2 f (a2 ) + x3 f (a3 ) + x4 f (a4 ) ,

hvor vi har brugt L1 og L2 , og hvor vi fortsat tænker os, at x1 , x2 , x3 og x4 gennemløber


alle tænkelige kombinationer af reelle værdier. Men så er

f (V ) = span { f (a1 ), f (a2 ), f (a3 ), f (a4 ) } .

Billedrummet udspændes altså af a-basisvektorernes billeder! Men så kan vi ifølge


metode 11.53 bestemme en basis for billedrummet ved at finde de ledende 1-taller i
trappeformen af ⇥ ⇤
c f(a1 ) c f(a2 ) c f(a3 ) c f(a4 ) .

Dette er jo afbildningsmatricen for f med hensyn til de valgte baser


2 3
1 3 1 8
F
c a = 4 2 0 4 25,
1 1 3 4

som ved GaussJordan-elimination reduceres til


2 3
1 0 2 1
4
trap(c Fa ) = 0 1 1 35.
0 0 0 0

Til de to ledende 1-taller i trap(c Fa ) svarer de to første søjler i c Fa . Vi konkluderer


derfor:
eNote 12 12.7 DIMENSIONSSÆTNINGEN 27

Lad w1 og w2 være de to vektorer i W, som er bestemt ved c-koordinater,


således:

c w1 =c f (a1 ) = (1, 2, 1) og c w2 =c f (a2 ) = (3, 0, 1) .

Så er (w1 , w2 ) en basis for billedrummet f (V ) .

Metode 12.25 Bestemmelse af billedrummet


I et vektorrum V er der valgt en basis a, og i et vektorrum W er der valgt en basis c.
Billedrummet f (V ) for en lineær afbildning f : V ! W kan findes ud fra

trap(c Fa ) (12-32)

på følgende måde: Hvis der i den i’te søjle i (12-32) ikke er et ledende 1-tal, så
fjernes f (a i ) fra vektorsættet f (a1 ), f (a2 ), . . . , f (a n ) . Efter denne udtynding
udgør vektorsættet en basis for f (V ) .

Da antallet af ledende 1-taller i (12-32) er lig med antallet af basisvektorer i den


valgte basis for f (V ) , følger det, at

dim( f (V )) = r (c Fa ) . (12-33)

12.7 Dimensionssætningen

I det foregående afsnits metode 12.23 fandt vi følgende udtryk for dimensionen af ker-
nen for en lineær afbildning f : V ! W :

dim( ker( f ) ) = dim(V ) r (c Fa ) (12-34)

og i metode 12.25 et tilsvarende udtryk for dimensionen af billedrummet f (V ) :

dim( f (V )) = r (c Fa ) . (12-35)

Ved at sammensætte (12-34) og (12-35) opnås en bemærkelsesværdig enkel sammen-


hæng mellem definitionsrummet, kernen og billedrummet for en lineær afbildning i
den følgende sætning.
eNote 12 12.7 DIMENSIONSSÆTNINGEN 28

Sætning 12.26 Dimensionssætningen


Lad V og W være to endeligt-dimensionale vektorrum. For en lineær afbildning
f : V ! W gælder:

dim(V ) = dim( ker( f ) ) + dim f (V ) .

Bevis

Beviset medtages i næste opdatering af eNoten.

Her er nogle umiddelbare konsekvenser af sætning 12.26:

• Billedrummet for en lineær afbildning kan aldrig have højere dimension end def-
initionsrummet.

• Hvis kernen kun indeholder 0-vektoren, bevarer billedrummet definitionsrummets


dimension.

• Hvis kernen har dimensionen p > 0, så "‘forsvinder"’ der gennem afbildningen p


dimensioner.

Opgave 12.27

En lineær afbildning f : R3 ! R3 har med hensyn til standardbasen i R3 afbildningsmatricen


2 3
1 2 1
e Fe = 4 2 4 0 5 .
3 6 0

Det oplyses, at kernen for f har dimensionen 1. Find straks ved hovedregning en basis for
f (V ) og dimensionen af f (V ) .
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 29

Opgave 12.28

I rummet er der givet et sædvanligt (O, i, j, k)-koordinatsystem. Afbildningen p projicerer


stedvektorer ned i ( x, y)-planen i rummet, se figur 12.12 .

v
k
O Y
i j

p(v)

Figur 12.12: Projektion ned i ( x, y)-planen

Vis, at p er lineær, og opstil afbildningsmatricen e Pe for p. Bestem en basis for projektionens


kerne og billedrum. Tjek, at dimensionssætningen er opfyldt.

12.8 Ændring af afbildningsmatricen når der skiftes basis

I eNote 11 er det vist, hvordan en vektors koordinater skifter, når der skiftes basis i
vektorrummet, se metode 11.45. Vi indleder dette afsnit med at repetere de vigtigste
pointer og vise to eksempler.

Antag, at der i V er givet en a-basis (a1 , a2 , . . . , an ) , og at der vælges en ny b-basis


(b1 , b2 , . . . , bn ) i V. Hvis en vektor x har b-koordinatvektoren b x , så kan dens a-
koordinatvektor udregnes ved matrixvektor-produktet

av = a Mb b v , (12-36)

hvor basisskiftematricen a Mb er givet ved


⇥ ⇤
a Mb = a b1 a b2 ... a bn . (12-37)
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 30

Vi viser nu to eksempler på brug af (12-37). I det første er det de "‘nye"’ koordinater,


der er givne, hvorefter de "´gamle"’ beregnes. I det andet er det omvendt: de "‘gamle"’
kendes, og de "‘nye"’ bestemmes.

Eksempel 12.29 Fra nye koordinater til gamle

I et 3-dimensionalt vektorrum V er der givet en basis a = (a1 , a2 , a3 ) , hvorefter der


vælges en ny basis b bestående af vektorerne

b1 = a1 a3 , b2 = 2a1 2a2 + a3 og b3 = 3a1 + 3a2 a3 .

Bestem koordinatvektoren a x for x = b1 + 2b2 + 3b3 .

Først ser vi, at 2 3 2 3


1 1 2 3
4 5 og a Mb = 4
bx = 2 0 2 3 5. (12-38)
3 1 1 1
Herefter får vi 2 32 3 2 3
1 2 3 1 4
ax = a Mb b x = 4 0 2 3 54 2 5=4 5 5. (12-39)
1 1 1 3 2

Eksempel 12.30 Fra gamle koordinater til nye

I et 2-dimensionalt vektorrum W er der givet en basis c = (c1 , c2 ) , hvorefter der


vælges en ny basis d bestående af vektorerne

d1 = 2c1 + c2 og d2 = c1 + c2 .

Bestem koordinatvektoren d y for y = 10c1 + 6c2 .

Først ser vi, at


  
10 2 1 1 1 1
cy = og c Md = ) d Mc = (c Md ) = . (12-40)
6 1 1 1 2

Herefter får vi   
1 1 10 4
dy = d Mc c y = = . (12-41)
1 2 6 2
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 31

Vi går nu videre med at se, hvordan en afbildningsmatrix ændres, når der skiftes basis
i definitionsrummet og/eller dispositionsrummet.

For to vektorrum V og W med endelig dimension kan afbildningsmatricen for en lineær


afbildning f : V ! W kun opstilles, når der er valgt en basis i V og en basis i W. Med
afbildningsmatricens symbol c Fa viser vi netop, at dens grundlag er en given basis a i
V og en given basis c i W.

Ofte ønsker man at skifte basen i V eller basen i W. I det første tilfælde ændres koordi-
naterne for de vektorer x 2 V, der skal afbildes, mens koordinaterne for deres billeder
y = f (x) er uforandrede. I det andet tilfælde er det omvendt. Her er koordinaterne for
x de samme, mens billedets koordinater skifter. Hvis der skiftes basis i både V og W, så
ændres koordinaterne både for x og for y = f (x).

I de følgende underafsnit opstilles metoder til at finde den nye afbildningsmatrix for f ,
når der skiftes basis i definitionsrummet, dispositionsrummet eller begge. Først viser
vi, hvordan en vektors koordinater skifter, når der skiftes basis i vektorrummet (som
nærmere beskrevet i metode 11.45.)

12.8.1 Basisskifte i definitionsrummet

V med dim = n W med dim = m

x
y = f(x)

b-basis: (b1, b2, ..., bn )

a-basis: (a1, a2, ..., an ) c-basis: (c1, c2, ..., cm )

Figur 12.12: Lineær afbildning

På figur 12.12 er der givet en lineær afbildning f : V ! W , som med hensyn til basis a
i V og basis c i W har afbildningsmatricen c Fa . Vi skifter nu basis i V fra basis a til basis
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 32

b. Afbildningsmatricen for f skal nu ændres til c Fb , før den kan tage imod vektorer i
basis b. Lad os finde den. Ligningen
y = f (x)
oversættes til koordinater og omformes:
cy = c Fa a x = c Fa (a Mb b x) = (c Fa a Mb ) b x .
Heraf kan vi udlede, at afbildningsmatricen for f med hensyn til basis b i V og basis c i
W kan dannes ved matrixproduktet
c Fb = c Fa a Mb . (12-42)

Eksempel 12.31 Ændring af afbildningsmatrix

Vi betragter det 3-dimensionale vektorrum V, som er behandlet i eksempel 12.29,


og det 2-dimensionale vektorrum W som er behandlet i eksempel 12.30. En lineær
afbildning f : V ! W er givet ved afbildningsmatricen

9 12 7
c Fa = .
6 8 5

Bestem y = f (x), hvor x = b1 + 2b2 + 3b3 .

Vi afprøver to forskellige veje.

Metode 1
Vi bruger a-koordinaterne for x som fundet i (12-39):
2 3
 4 
9 12 7 4 5 10
c y = c Fa a x = 5 = .
6 8 5 6
2
Metode 2
Vi ændrer afbildningsmatricen for f vha. basisskiftematricen fra (12-38):
2 3
 1 2 3 
9 12 7 4 5 2 1 2
c Fb = c Fa a Mb = 0 2 3 = .
6 8 5 1 1 1
1 1 1
Så kan vi direkte bruge de givne b-koordinater for x :
2 3
 1 
2 1 2 4 5 10
c y = c Fb b x = 2 = .
1 1 1 6
3
I begge tilfælde får vi y = 10c1 + 6c2 .
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 33

12.8.2 Basisskifte i dispositionsrummet

V med dim = n W med dim = m

x
y = f(x)

d-basis: (d1, d2, ..., dm )

a-basis: (a1, a2, ..., an ) c-basis: (c1, c2, ..., cm )

Figur 12.13: Lineær afbildning

På figur 12.13 er der givet en lineær afbildning f : V ! W , som med hensyn til basis a i
V og basis c i W har en afbildningsmatrix c Fa . Vi skifter nu basis i W fra basis c til basis
d . Afbildningsmatricen for f skal nu i stedet være d Fa . Lad os finde den. Ligningen

y = f (x)

oversættes til matrixligningen


cy = c Fa a x ,
som er ensbetydende med
d Mc c y = d Mc (c Fa a x) ,
hvoraf fås
dy = (d Mc c Fa ) a x .

Heraf udleder vi, at afbildningsmatricen for f med hensyn til a-basis i V og d-basis i W
dannes ved et matrixprodukt:
d Fa = d Mc c Fa . (12-43)
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 34

Eksempel 12.32 Ændring af afbildningsmatrix

Vi betrager det 3-dimensionale vektorrum V, som er behandlet i eksempel 12.29,


og det 2-dimensionale vektorrum W som er behandlet i eksempel 12.30. En lineær
afbildning f : V ! W er givet ved afbildningsmatricen

9 12 7
c Fa = .
6 8 5

Givet vektoren x = 4a1 + 5a2 2a3 . Bestem billedet y = f (x) som en linearkom-
bination af d1 og d2 .

Vi afprøver to forskellige veje.

Metode 1
Vi bruger den givne afbildningsmatrix,
2 3
 4 
9 12 7 4 5 10
cy = c Fa a x = 5 = ,
6 8 5 6
2

og oversætter resultatet til d-koordinater ved hjælp af basisskiftematricen fra (12-40):


  
1 1 10 4
dy = d Mc c y = = .
1 2 6 2

Metode 2
Vi ændrer først afbildningsmatricen for f ved hjælp af basisskiftematricen fra (12-40):
  
1 1 9 12 7 3 4 2
d Fa = d Mcc Fa = = .
1 2 6 8 5 3 4 3

Så kan vi direkte udregne d-koordinaterne:


2 3
 4 
3 4 2 4 4
dy = d Fa a x = 5 5= .
3 4 3 2
2

I begge tilfælde får vi y = 4d1 + 2d2 .


eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 35

12.8.3 Basisskifte i både definitions- og dispositionsrummet

V med dim = n W med dim = m

x
y = f(x)

b-basis: (b1, b2, ..., bn ) d-basis: (d1, d2, ..., dm )

a-basis: (a1, a2, ..., an ) c-basis: (c1, c2, ..., cm )

Figur 12.14: Lineær afbildning

På figur 12.14 er der er givet en lineær afbildning f : V ! W som med hensyn til basis
a i V og basis c i W har afbildningsmatricen c Fa . Vi skifter basis i V fra basis a til basis
b og i W fra basis c til basis d . Afbildningsmatricen for f være d Fb . Lad os finde den.
Ligningen
y = f (x)
svarer i koordinater til
cy = c Fa a x ,
som er ensbetydende med

d Mc c y = d Mc c Fa (a Mb b x) ,

hvoraf fås
dy = (d Mc c Fa a Mb ) b x .

Heraf udleder vi, at afbildningsmatricen for f med hensyn til b-basis i V og d-basis i W
dannes ved et matrixprodukt:

d Fb = d Mc c Fa a Mb . (12-44)
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 36

Eksempel 12.33 Ændring af afbildningsmatrix

Vi betrager det 3-dimensionale vektorrum V, som er behandlet i eksempel 12.29,


og det 2-dimensionale vektorrum W, som er behandlet i eksempel 12.30. En lineær
afbildning f : V ! W er givet ved afbildningsmatricen

9 12 7
c Fa = .
6 8 5

Givet vektoren x = b1 + 2b2 + 3b3 . Bestem y = f (x) som en linearkombination af


d1 og d2 .

Vi ændrer afbildningsmatricen ved hjælp af (12-40) og (12-38):


2 3
  1 2 3 
1 1 9 12 7 4 1 0 1
d Fb = d Mc c Fa a Mb = 0 2 3 5= .
1 2 6 8 5 0 1 0
1 1 1

Så kan vi direkte bruge de givne b-koordinater for x og udregne d-koordinaterne:


2 3
 1 
1 0 1 4 5 4
d y = d Fb b x = 2 = .
0 1 0 2
3

Konklusionen er, at y = 4d1 + 2d2 .

Basisskiftet viser sig i dette eksempel at være ganske praktisk. Den nye afbildningsmatrix er
langt simplere end de tilsvarende for andre baser fra de forrige eksempler.

12.8.4 Opsummering vedrørende basisskifte

Vi samler resultaterne vedrørende basisskifte i de foregående underafsnit i den følgende


metode.
eNote 12 12.8 ÆNDRING AF AFBILDNINGSMATRICEN NÅR DER SKIFTES BASIS 37

Metode 12.34 Ændring af afbildningsmatrix ved basisskifte


I vektorrummet V er der givet en basis a = (a1 , a2 , . . . , an ) og en ny basis b =
(b1 , b2 , . . . , bn ) . I vektorrummet W er der givet en basis c = (c1 , c2 , . . . , cm ) og en
ny basis d = (d1 , d2 , . . . , dm ) .

Hvis f er en lineær afbildning f : V ! W , som med hensyn til basis a i V og basis


c i W har afbildningsmatricen c Fa , så gælder:

1. Afbildningsmatricen for f med hensyn til basis b i V og basis c i W er

c Fb = c Fa a Mb . (12-45)

2. Afbildningsmatricen for f med hensyn til basis a i V og basis d i W er


1
d Fa = (c Md ) c Fa = d Mc c Fa . (12-46)

3. Afbildningsmatricen for f med hensyn til basis b i V og basis d i W er


1
d Fb = (c Md ) c Fa a Mb = d Mc c Fa a Mb . (12-47)

I de tre formler har vi brugt basisskiftematricerne:


⇥ ⇤ ⇥ ⇤
a Mb = a b1 a b2 · · · a bn og c Md = c d1 c d2 ··· c dm .
eNote 13 1

eNote 13

Egenværdier og egenvektorer

Denne note indfører begreberne egenværdier og egenvektorer for lineære afbildninger i


vilkårlige generelle vektorrum og går derefter i dybden med egenværdier og egenvektorer til
kvadratiske matricer. Noten bygger derfor på viden omkring generelle vektorrum, se eNote 11,
på viden om algebra med matricer, se eNote 7, kvadratiske matricer, se eNote 8, og på viden om
lineære afbildninger se eNote 12.

Opdateret 15.20.21 af Karsten Schmidt.

13.1 Egenværdiproblemet for lineære afbildninger

13.1.1 Indledning

I denne eNote betragter vi lineære afbildninger af typen

f : V ! V. (13-1)

det vil sige lineære afbildninger, hvor definitionsrummet og dispositionsrummet er det


samme vektorrum. Dette åbner op for et særligt fænomen, nemlig at en vektor kan
være identisk med sin billedvektor:

f (v) = v . (13-2)

Vektorer af denne type kaldes fiksvektorer for f . Mere generelt er vi på jagt efter egen-
vektorer, det vil sige vektorer, som er proportionale med deres billedvektorer. Man taler
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 2

i denne forbindelse om egenværdiproblemet: at finde en skalar, typisk betegnet l , og en


egentlig vektor v, som opfylder vektorligningen

f (v) = lv . (13-3)

Hvis l er en skalar og v en egentlig vektor, som opfylder (13-3), så kaldes propor-


tionalitetsfaktoren l en egenvæørdi for f og v en til l hørende egenvektor. Lad os som
eksempel tage en lineær afbildning f : R3 ! R3 , det vil sige en lineær afbildning af
mængden af rumvektorer ind i sig selv. På figur 13.1 afbildes de tre vektorer a, b og c.

c
f(c)

a
f(a)
f(b)

Figur 13.1: Tre egenvektorer i rummet og deres billedvektorer

• Som antydet på figur 13.1 er f (a) = 2a . Derfor er 2 en egenværdi for f med


tilhørende egenvektor a ,
l1 = 2 og v1 = a.

• Da endvidere f (b) = b , er også 1 en egenværdi for f med tilhørende egen-


vektor b ,
l2 = 1 og v2 = b.

• Og da endelig f (c) = c , er 1 en egenværdi for f med tilhørende egenvektor c ,

l3 = 1 og v3 = c.

Specielt er c dermed også en fiksvektor for f .

At løse egenværdiproblemer for lineære afbildninger er en af de mest afgørende prob-


lemstillinger i ingeniørmæssige anvendelser af lineær algebra. Dette hænger snævert
sammen med, at en lineær afbildning, hvis afbildningsmatrix med hensyn til en given
basis er en diagonalmatrix, er særlig enkel at overskue og arbejde med. Og her gælder
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 3

der den komfortable regel, at hvis man vælger en basis bestående af egenvektorer for
afbildningen, så bliver afbildningsmatricen automatisk en diagonalmatrix.

I det følgende eksempel illustrerer vi disse pointer ved hjælp af lineære afbildninger i
planen.

Eksempel 13.1 Egenværdier og egenvektorer i planen

Lad G2 (R ) betegne vektorrummet af vektorer i planen. Vi betragter en lineær afbildning

f : G2 (R ) ! G2 (R ) (13-4)

af mængden af plane vektorer ind i sig selv, som med hensyn til en given basis a = (a1 , a2 )
har følgende diagonalmatrix som afbildningsmatrix:

2 0
a Fa = . (13-5)
0 3

Ved afbildning af basisvektorerne fra basis a fås følgende:


   
2 0 1 2 1
a f (a1 ) = a Fa a a1 = = = 2· = 2a1
0 3 0 0 0
og
   
2 0 0 0 0
a f (a2 ) = a Fa a a2 = = = 3· = 3a2 ,
0 3 1 3 1
hvor basisvektorerne mht. deres egen basis naturligvis blot er a a1 = (1, 0) og a a2 = (0, 1).
Vi har altså, at f (a1 ) = 2a1 og f (a2 ) = 3a2 . Begge basisvektorer er egenvektorer for
f , og a1 tilhører egenværdien 2 , mens a2 tilhører egenværdien 3 . Egenværdierne er
diagonalelementerne i a Fa .

Vi betragter nu en vilkårlig vektor x = x1 a1 + x2 a2 og finder dens billedvektor:


  
2 0 x1 2x1
a f (x) = = .
0 3 x2 3x2

Ved afbildningen bliver x1 -koordinaten ganget med egenværdien 2, mens x2 -koordinaten


bliver ganget med egenværdien 3. Geometrisk betyder dette, at hele planen ved afbildningen
"´strækkes"’, først med faktoren 2 i retningen a1 og dernæst med faktoren 3 i retningen a2 .
Virkningen på en vilkårligt vektor x illustreres på figur 13.2.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 4

f(x)

a2 x

O a1

Figur 13.2: Vektoren x strækkes vandret med faktor 2 og lodret med faktor 3
14

På figur 13.3 har vi valgt standardbasen


12
(i, j) og illustrerer, hvordan den lineære afbildning
g, som har afbildningsmatricen

2 0
e Ge = ,
10 0 3
afbilder det "‘blå hus"’ over i det "‘røde hus"’ ved, at alle stedvektorer til punkter i det "‘blå
hus"’ strækkes med faktoren 2 i vandret 8 retning og med faktoren 3 i lodret retning.

j
5 O i 5 10

Figur 13.3: Det blå hus strækkes


2 vandret med faktor 2 og lodret med faktor 3

Vi undersøger nu en anden lineær afbildning


4
h , hvis afbildningsmatrix med hensyn til stan-
dardbasen ikke er en diagonalmatrix:

6 7/3 2/3
e He = .
1/3 8/3

Her kan man ikke straks afgøre om afbildningen


8 er sammensat af to strækninger i to givne
retninger. Og man får ikke umiddelbart hints ved at afbilde det blå hus ved hjælp af h som
vist på figur 13.4.
10
12

10

eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER


8
5

j
5 i 5 10

2 Figur 13.4: Hus

Men faktisk er det også i tilfældet h muligt at vælge en basis, som består af to lineært
uafhængige egenvektorer for h . Lad6
nemlig b1 være givet ved e-koordinaterne (2, 1) og
b2 ved e-koordinaterne (1, 1) . Så gælder der:

8
   
7/3 2/3 2 4 2
e h (b1 ) = e He e b1 = = = 2·
1/3 8/3 1 2 1
10

og

   
7/3 2/3 1 3 1
e h (b2 ) = e He e b2 = = = 3· .
1/3 8/3 1 3 1

Resultatet er h(b1 ) = 2b1 og h(b2 ) = 3b2 . Det viser sig altså, at b1 og b2 faktisk er egen-
vektorer for h . Ved at vælge (b1 , b2 ) som basis får afbildningsmatricen for h med hensyn til
denne basis formen:

2 0
b Gb = .
0 3

Det viser sig dermed overraskende nok, at afbildningsmatricen for h også kan skrives på for-
men (13-5). Afbildningen h er også sammensat af to strækninger med faktorerne 2 og 3. Blot
er de to strækningsretninger nu bestemt ved egenvektorerne b1 og b2 . Dette ses tydeligere,
hvis vi afbilder et nyt blåt hus, hvis hovedlinjer er parallelle med b-basisvektorerne, se figur
13.5.
12

10

eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 6


6

b2

5 O b 5 10
1

Figur 13.5: Det blå hus strækkes med faktor 2 hhv. faktor 3 i egenvektorernes retning
6

Vi har hermed eksemplificeret, at hvis man kan finde to lineært uafhængige egenvektorer for
en lineær afbildning i planen, så er det muligt at
8

1. skrive dens afbildningsmatrix på diagonalform ved at vælge egenvektorerne som basis


10

samt at
12
2. beskrive afbildningen som strækninger i egenvektorernes retninger med deres
tilhørende egenværdier som strækningsfaktorer.

13.1.2 Egenværdier og deres tilhørende egenvektorer

Egenværdiproblemet for en lineær afbildning går i korthed ud på at besvare spørgsmålet:


Findes der egentlige vektorer, hvor billedvektoren er proportional med vektoren selv? Det korte
svar er, at det kan man ikke svare generelt på! Det afhænger af den enkelte afbild-
ning. I det følgende forsøger vi at indkredse, hvad vi faktisk kan sige generelt om
egenværdiproblemet.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 7

Definition 13.2 Egenværdi og egenvektor


Lad f : V ! V være en lineær afbildning af vektorrummet V ind i sig selv. Hvis
der findes en egentlig vektor v 2 V og en skalar l således, at

f (v) = lv , (13-6)

så kaldes proportionalitetsfaktoren l en egenværdi for f , mens v kaldes en egenvektor,


som hører til l.

Hvis det IKKE i definition 13.2 var krævet, at der skulle findes en egentlig vek-
tor som opfylder f (v) = lv , ville enhver skalar l være en egenværdi, idet
der jo for enhver skalar l gælder f (0) = l 0 . Men bemærk, at hvis l er en
egenværdi, så er nul-vektoren en egenvektor hørende til l .

Tallet 0 kan godt være en egenværdi. Det kræver blot, at der findes en egentlig
vektor v, som opfylder f (v) = 0 , da vi så har f (v) = 0v .

Hvis en lineær afbildning f har blot én egenvektor v , så har den uendeligt mange
egenvektorer. Dette er en simpel konsekvens af den følgende sætning.

Sætning 13.3 Underrum af egenvektorer


Hvis l er en egenværdi for en lineær afbildning f : V ! V , så er mængden af
egenvektorer, som hører til l , et underrum i V.

Bevis

Lad f : V ! V være en lineær afbildning af vektorrummet V ind i sig selv, og antag, at l er


en egenværdi for f . Vi skal vise, at mængden af egenvektorer, som hører til l, opfylder de to
stabilitetskrav for underrum, se sætning 11.47. Lad k være en vilkårlig skalar, og lad u og v
være to vilkårlige egenvektorer, som hører til l. Så gælder der under anvendelse af L1 :
f (u + v) = f (u) + f (v) = lu + lv = l(u + v) .
Sumvektoren u + v er dermed en egenvektor hørende til l , og vi har hermed vist, at egen-
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 8

vektorerne hørende til l opfylder stabilitetskravet vedrørende addition. Endvidere gælder


der under anvendelse af L2 :

f (ku) = k f (u) = k (lu) = l(ku) .

Hermed er det vist, at egenvektorerne hørende til l også opfylder stabilitetskravet ve-
drørende multiplikation med skalar. Samlet er det vist, at mængden af egenvektorer, som
hører til en given egenværdi l, er et underrum i definitionsrummet.

Sætning 13.3 giver anledning til den følgende definition.

Definition 13.4 Egenvektorrum


Lad f : V ! V være en lineær afbildning af vektorrummet V ind i sig selv, og lad
l være en egenværdi for f .

Ved egenvektorrummet (eller kort egenrummet) El hørende til l forstås underrummet


af egenvektorer, som hører til l ,

El = {v 2 V | f (v) = lv } .

Hvis El er endeligt-dimensionalt, kaldes dim( El ) for den geometriske multiplicitet af


l , betegnet gm(l).

I det følgende eksempel betragtes en lineær afbildning, som har to egenværdier, begge
med geometrisk multiplicitet 1 .
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 9

Eksempel 13.5 Egenrum for spejling

I planen er der tegnet en ret linje m gennem origo. Med s betegnes den lineære afbildning,
der afbilder en vektor v afsat ud fra origo i dens spejling s(v) i m , se figuren:

v
m
s(b)

O
a
s(v)
s(a)
b

Lad a være en vilkårlig egentlig vektor, som ligger på m. Ved afbildning spejles vektoren i
linjen m, og der sker derfor ingen ændring. Der gælder:

s (a) = a = 1 · a ,

og derfor er 1 en egenværdi for s . Egenrummet E1 indeholder mængden af samtlige


vektorer, der ikke ændres ved spejlingen; dvs. mængden af vektorer, som ligger på m .

Vi tegner nu en ret linje n gennem origo vinkelret på m . Lad b være en vilkårlig egentlig
vektor, som ligger på n. Da der gælder:

s (b) = b = ( 1) · b ,

er 1 en egenværdi for s . Egenrummet E 1 er mængden af vektorer som ligger på n .

At ikke alle lineære afbildninger har egenværdier og dermed egenvektorer, fremgår af


det følgende eksempel.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 10

Eksempel 13.6

Lad G2 (R ) betegne vektorrummet af vektorer i planen. Lad os undersøge egenværdiprob-


lemet for den lineære afbildning f : G2 ! G2 , som til en egentlig vektor v i planen knytter
dens tværvektor:
b.
f (v) = v
Da en egentlig vektor v aldrig kan være proportional (parallel) med sin tværvektor, må der
for ethvert valg af en skalar l nødvendigvis gælde, at

b 6= lv .
v

Derfor findes der ikke egenværdier og dermed heller ikke egenvektorer for f .

Af den følgende opgave fremgår det blandt andet, at dimensionen af et egenvektorrum


meget vel kan være større end 1.

Opgave 13.7

I rummet er der givet et standard (O, i, j, k)-koordinatsystem. Alle vektorer tænkes afsat ud
fra origo. Afbildningen p projicerer vektorer ned i ( x, y)-planen i rummet, se figur 13.6.

v
k
O Y
i j

p(v)

Figur 13.6: Egenværdiproblemet for projektion ned i ( x, y)-planen.

Det er vist i opgave 12.28, at p er lineær. Bestem samtlige egenværdier og de egenrum, der
hører til egenværdierne, udelukkende ved hovedregning (grubling).
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 11

Eksempel 13.8 Egenværdiproblem for differentiation

Lad C • (R ) betegne mængden af differentiable reelle funktioner. Vi betragter den lineære


afbildning f : C • (R ) ! C • (R ), som er givet ved

f ( x (t)) = x 0 (t) .

Lad l være en vilkårlig skalar. Da der gælder:

f (elt ) = l elt ,

er l en egenværdi for f , og elt er en egenvektor, som hører til l .

Dette var blot én løsning. Samtlige løsninger til differentialligningen

x 0 (t) = lx (t)

er givet ved k · elt , hvor k er et vilkårligt reelt tal, er egenrummet hørende til l bestemt ved

El = k · elt k2R .

13.1.3 Teoretiske pointer

Den følgende hjælpesætning giver et vigtigt resultat for lineære afbildninger af vek-
torrum ind i sig selv. Den gælder uanset, om det betragtede vektorrum har endelig
dimension eller ej.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 12

Hjælpesætning 13.9
Lad f : V ! V være en lineær afbildning af et vektorrum V ind i sig selv, og antag,

1. at f har en række egenværdier med tilhørende egenrum,

2. at der udvælges nogle af egenrummmene, og inden for hvert af de udvalgte


egenrum udvælges nogle lineært uafhængige vektorer,

3. og at alle de således udvalgte vektorer sættes sammen til ét vektorsæt v .

Så er v et lineært uafhængigt vektorsæt.

Bevis

Lad f : V ! V være en lineær afbildning, og lad v være et vektorsæt, der er sammensat


i overensstemmelse med punkt 1 til 3 i hjælpesætning 13.9. Vi skal vise, at v er lineært
uafhængigt. Den røde tråd i beviset er, at vi antager det modsatte; det vil sige, at vi antager,
at v er lineært afhængigt men viser, at dette fører til en modstrid.

Vi udtynder først v til en basis for span{v}. Da sættet er lineært afhængigt, må der da være
mindst én vektor i v, som ikke er med i basen. Vi vælger en af dem (en af de vektorer, der
er afhængig af de andre); lad os kalde den x. Nu skriver vi x som en linearkombination af
basisvektorerne, idet vi udelader de trivielle led, det vil sige dem, som har koefficienten 0:

x = k1 v1 + · · · + k m vm . (13-7)

Vi kalder egenværdien, der hører til x, for l, og egenværdierne hørende til vi for li . Vi kan
ud fra (13-7) opnå et udtryk for lx på to forskellige måder — dels ved at gange (13-7) med
l og dels ved at finde billedet ved f af højre- og venstresiden i (13-7). Vi benytter begge
fremgangsmåder:

lx = lk1 v1 + · · · + lk m vm
lx = l1 k1 v1 + · · · + lm k m vm .

Ved subtraktion af den nederste ligning fra den øverste medfører dette:

0 = k1 (l l1 )v1 + · · · + k m (l l m ) vm . (13-8)

Hvis alle koefficienterne til vektorerne på højresiden af (13-8) er lig med nul, må l = li
for alle i = 1, 2, . . . , m. Men så har x og alle basisvektorerne vi samme egenværdi og må
være valgt ud fra det samme egenvektorrum. De skulle derfor være lineært uafhængige,
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 13

da en forudsætningen i hjælpesætning 13.9 for, at de blev valgt ud som et sæt, netop var,
at de indenfor samme egenvektorrum var lineært uafhængige. Dette strider mod at x er en
linearkombination af basisvektorerne, da det ikke er muligt, hvis den er en del af et lineært
uafhængigt sæt.

Derfor må mindst én koefficienterne i (13-8) være forskellig fra 0. Men så er nul-vektoren


opskrevet som en egentlig linearkombination af basisvektorerne. Dette strider mod kravet
om, at en basis er lineært uafhængig.

Konklusionen er, at antagelsen om, at v er et lineært afhængigt vektorsæt, nødvendigvis fører


til en modstrid. Derfor er v lineært uafhængigt.

Eksempel 13.10 Egenvektorers lineære uafhængighed

En lineær afbildning f : V ! V har tre egenværdier l1 , l2 og l3 , som har de geometriske


multipliciteter 2, henholdsvis 1 og 3 . Hvis vektorsættet (a1 , a2 ) er en basis for El1 , (b) en
basis for El2 og (c1 , c2 , c3 ) en basis for El3 , så følger det af hjælpesætning 13.9, at ethvert
udvalg af de seks basisvektorer er et lineært uafhængigt vektorsæt.

Værdien af hjælpesætning 13.9 viser sig ved, at den direkte fører til de følgende vigtige
resultater.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 14

Sætning 13.11 Generelle egenskaber


Lad V være et vektorrum med dim(V ) = n , og lad f : V ! V være en lineær
afbildning af V ind i sig selv. Der gælder:

1. Egentlige egenvektorer, som hører til forskellige egenværdier for f , er lineært


uafhængige.

2. f kan højst have n forskellige egenværdier.

3. Hvis f har n forskellige egenværdier, findes der en basis for V bestående af


egenvektorer for f .

4. Summen af de geometriske multipliciteter af egenværdierne for f kan højst


være n .

5. Hvis og kun hvis summen af de geometriske multipliciteter af egenværdierne


for f er lig med n, findes der en basis for V bestående af egenvektorer for f .

Opgave 13.12

Det første punkt i sætning 13.11 er et simpelt specialtilfælde af hjælpesætning 13.9 og følger
derfor umiddelbart af hjælpesætningen. Det andet punkt kan bevises således:

Antag at en lineær afbildning har k forskellige egenværdier. Vi vælger en egentlig vektor fra hvert af
de k egenrum. Sættet af de k valgte vektorer er da ifølge hjælpesætning 13.9 lineært uafhængigt, og k
må derfor være mindre end eller lig med vektorrummets dimension (se hjælpesætning 11.21).

Gør på tilsvarende vis rede for, hvordan de tre sidste punkter i sætning 13.11 følger af
hjælpesætning 13.9.

Motiveret af sætning 13.11 indfører vi begrebet egenbasis.


eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 15

Definition 13.13 Egenvektorbasis


Lad f : V ! V være en lineær afbildning af et endeligt-dimensionalt vektorrum V
ind i sig selv.

Ved en egenvektorbasis, eller kort egenbasis, for V med hensyn til f forstås en basis
bestående af egenvektorer for f .

Herefter kan vi præsentere dette afsnits hovedresultat.

Sætning 13.14 Hovedsætning


Lad f : V ! V være en lineær afbildning af et n-dimensionalt vektorrum V ind i
sig selv, og lad v = (v1 , . . . , vn ) være en basis for V . Der gælder da:

1. Afbildningsmatricen v Fv for f med hensyn til v er en diagonalmatrix, hvis og


kun hvis v er en egenbasis for V med hensyn til f .

2. Antag, at v er en egenbasis for V med hensyn til f . Lad L betegne den diag-
onalmatrix, som er afbildningsmatrix for f med hensyn til v . Rækkefølgen af
diagonalelementerne i L er da bestemt ud fra den valgte basis således: Ba-
sisvektoren vi hører til den egenværdi li , som står i den i’te søjle i L .

Vi udskyder beviset for denne sætning til eNote 14 om diagonalisering, se sætning 14.7.
eNote 13 13.1 EGENVÆRDIPROBLEMET FOR LINEÆRE AFBILDNINGER 16

Eksempel 13.15 Diagonalmatrix for spejling

Lad os igen betragte situationen i eksempel 13.5, hvor vi betragtede afbildningen s , som
spejler vektorer afsat ud fra origo i linjen m :

v
m
s(b)

O
a
s(v)
s(a)
b

Figur 13.7: Spejling om m-aksen

Vi fandt, at a er en egenvektor, som hører til egenværdien 1 , og at b er en egenvektor, som


hører til egenværdien 1 . Da planen har dimensionen 2, følger det af sætning 13.14, at hvis
vi vælger basen (a, b) , så har f den følgende afbildningsmatrix med hensyn til denne basis:
 
l1 0 1 0
L= = .
0 l2 0 1

Eksempel 13.16 Lineær afbildning uden egenværdier

I eksempel 13.6 fandt vi, at den afbildning, som til en vektor i planen lader svare dens
tværvektor, ingen egenværdier har. Der findes derfor ingen egenbasis for afbildningen, og
der kan for denne afbildning derfor ikke opstilles en afbildningsmatrix, som er en diagonal-
matrix.

Eksempel 13.17 Diagonalisering af kompleks afbildning

Lad f : C2 ! C2 være en lineær afbildning, som opfylder


f ( z1 , z2 ) = ( z2 , z1 ) .
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 17

Da der gælder:

f (i, 1) = ( 1, i ) = i (i, 1) og f ( i, 1) = ( 1, i ) = ( i )( i, 1) ,

ses det, at i er en egenværdi for f med en tilhørende egenvektor (i, 1), og at i er en egen-
værdi for f med en tilhørende egenvektor ( i, 1) .

Da (i, 1) og ( i, 1) er lineært uafhængige, er (i, 1), ( i, 1) en egenbasis for C2 . Afbild-


ningsmatricen for f med hensyn til denne basis er ifølge sætning 13.14
 
l1 0 i 0
L= = .
0 l2 0 i

Opgave 13.18

Betragt igen situationen i eksempel 13.7. Vælg to forskellige egenbaser (baser bestående af
egenvektorer for p ), og bestem i hvert af de to tilfælde den diagonalmatrix, som bliver af-
bildningsmatrix for p med hensyn til den valgte basis.

13.2 Egenværdiproblemet for kvadratiske matricer

Når en lineær afbildning f : V ! V afbilder et n-dimensionalt vektorrum V ind i


vektorrummet selv, bliver afbildningsmatricen for f med hensyn til en vilkårligt valgt
basis a en kvadratisk matrix. Egenværdiproblemet f (v) = lv er da ækvivalent med
matrixligningen
a Fa a v = l a v . (13-9)
Dette giver os anledning til at formulere et egenværdiproblem for kvadratiske matricer
generelt, det vil sige uden, at vi nødvendigvis behøver at tænke på den kvadratiske
matrix som en afbildningsmatrix. Vi vil standardisere måden at gå frem på, når egen-
værdier og egenvektorer for kvadratiske matricer søges bestemt. Dermed fås sam-
tidigt i kraft af (13-9) metoder til at finde egenværdier og egenvektorer for alle endeligt-
dimensionelle lineære afbildninger af vektorrum ind i sig selv, der kan beskrives ved
hjælp af afbildningsmatricer.

Først præciserer vi, hvad der forstås ved egenværdiproblemet for en kvadratisk matrix.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 18

Definition 13.19 Egenværdiproblemet for matricer


At løse egenværdiproblemet for en kvadratisk reel (n ⇥ n)-matrix A vil sige at finde
skalarer l med tilhørende egentlige vektorer v = (v1 , . . . , vn ), som opfylder lignin-
gen
A v = lv . (13-10)
Opfyldes denne ligning for et par bestående af l og v 6= 0, kaldes l en egenværdi for
A og v en til l hørende egenvektor for A .

Eksempel 13.20 Egenværdiproblem for kvadratisk matrix

Det ønskes undersøgt, om v1 = (2, 3), v2 = (4, 4) og v3 = (2, 1) er egenvektorer for en


matrix A givet ved

4 2
A= . (13-11)
3 1
Til dette opstilles egenværdiproblemet, som beskrevet i definition 13.19:
  
4 2 2 2
Av1 = = = 1 · v1
3 1 3 3
  
4 2 4 8
Av2 = = = 2 · v2 (13-12)
3 1 4 8
  
4 2 2 10
Av3 = = 6= l · v3 for ethvert l .
3 1 1 7

Af dette ses, at v1 og v2 er egenvektorer for A. v1 hører til egenværdien 1, og v2 hører til


egenværdien 2. Endvidere ses det, at v3 ikke er en egenvektor for A.

Eksempel 13.21 Egenværdiproblem for kvadratisk matrix

Givet matricen 
2 2
A= .
2 2
Da    
2 2 1 0 1
= =0 ,
2 2 1 0 1
er 0 en egenværdi for A, og (1, 1) er en til egenværdien 0 hørende egenvektor for A .
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 19

Eksempel 13.22 Egenværdiproblem for kvadratisk matrix

Givet matricen 
0 1
A= .
1 0
Da    
0 1 i 1 i
= =i ,
1 0 1 i 1
er i en kompleks egenværdi for A, og ( i, 1) er en til egenværdien i hørende kompleks egen-
vektor for A .

Til brug for de følgende undersøgelser knytter vi nogle vigtige kommentarer til defini-
tion 13.19.
Først bemærker vi, at selv om den kvadratiske matrix A i definition 13.19 er reel, er man
ofte interesseret i ikke kun at finde reelle løsninger til ligningen (13-10) men generelt
komplekse løsninger. Der søges med andre ord en skalar l 2 C og en vektor v 2 C n ,
der opfylder (13-10).
Det kan derfor være hensigtsmæssigt at opfatte venstresiden i (13-10) som en afbildning
f : C n ! C n givet ved
f (v) = A v .
Denne afbildning er lineær. Lad nemlig u 2 C n , v 2 C n og k 2 C . Der gælder da ifølge
sædvanlige regneregler for matricer, at
L1 : f (u + v) = A (u + v) = A u + A v
L2 : f ( k u) = A( k u) = k (A u) .
Hermed er lineariteten vist. Da egenværdiproblemet f (v) = lv i dette tilfælde er
identisk med egenværdiproblemet Av = lv , kan det sluttes at resultaterne opnået i af-
snit 13.1 for egenværdiproblemet i almindelighed, umiddelbart kan overføres til egen-
værdiproblemet for matricer. Lad os således straks karakterisere mængden af egenvek-
torer, der hører til en given egenværdi for en kvadratisk, reel matrix (sammenlign med
sætning 13.3).

Sætning 13.23 Underrum af egenvektorer


Lad l være en reel eller kompleks egenværdi for en reel (n ⇥ n)-matrix A. Der
gælder da, at mængden af komplekse egenvektorer for A hørende til l er et under-
rum i C n .
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 20

Hvis man kun er interesseret i reelle løsninger på egenværdiproblemet for reelle kvadratiske
matricer, kan man alternativt opfatte venstresiden i (13-10) som en reel afbildning f :
R n ! R n givet ved:
f (v) = A v .
Denne afbildning er naturligvis også lineær. Vi opnår herved den følgende variant af
sætning 13.23.

Sætning 13.24 Underrum af egenvektorer


Lad l være en reel egenværdi for en reel (n ⇥ n)-matrix A. Der gælder da, at mæng-
den af reelle egenvektorer for A hørende til l, er et underrum i R n .

I lyset af sætning 13.23 og sætning 13.24 indfører vi begrebet egenvektorrum (sammenlign


med definition 13.4).

Definition 13.25 Egenvektorrum


Lad A være en kvadratisk, reel matrix, og lad l være en egenværdi for A .

Underrummet af alle de til l hørende egenvektorer kaldes egenvektorrummet (eller


kort egenrummet) hørende til l og betegnes El .

Efter at vi nu har opridset de grundlæggende strukturelle rammer for egenværdiprob-


lemet for kvadratiske matricer, vil vi i de to følgende delafsnit helt elementært under-
søge, hvordan man overhovedet kan gå i gang med at finde egenværdier og egenvek-
torer for kvadratiske matricer.

13.2.1 At finde egenværdierne for en kvadratisk matrix

Vi ønsker at bestemme de egenværdier, som hører til en reel (n ⇥ n)-matrix A . Udgangspunk-


tet er som nævnt ligningen
Av = lv . (13-13)

I første omgang sætter vi lv over på venstresiden af lighedstegnet, hvorefter v "‘tages


eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 21

uden for parentes"’. Det kan gøres, fordi v = E v , hvor E er enhedsmatricen:

Av = lv ,
Av lv = Av l(Ev) = Av (lE)v = 0 , (13-14)
(A lE)v = 0 .

Den sidste ligning i (13-14) svarer til et homogent linæert ligningssystem bestående af n
ligninger med de n ubekendte v1 , . . . , vn , som er elementerne i v = (v1 , . . . , vn ) . Det er
dog ikke muligt straks at løse ligningssystemet, netop fordi vi ikke kender l. Vi er nødt
til at arbejde videre med ligningssystemets koefficientmatrix, som tildeles det særlige
symbol
KA (l) = (A lE)
og kaldes den karakteristiske matrix for A.

Da det er et homogent lineært ligningssystem, som skal løses, er der som udgangspunkt
to muligheder for løsningsstrukturen: Enten er den karakteristiske matrix regulær, og så
er den eneste løsning v = 0 . Eller også er matricen singulær, og der vil findes uendeligt
mange løsninger v. Men da definition 13.19 kræver, at v skal være en egentlig vektor,
altså en vektor forskellig for nulvektoren, må den karakteristiske matrix være singulær.
For at undersøge, om dette gælder, tages determinanten af den karakteristiske matrix.
Den er nul netop, når matricen er singulær, som vist i en tidligere eNote,

det(A lE) = 0 . (13-15)

Bemærk, at venstresiden i (13-15) er et polynomium med l som variabel, hvis det


skrives ud. Polynomiet tildeles det særlige symbol

KA (l) = det(A lE) = det(KA (l))

og kaldes det karakteristiske polynomium for A .

Den ligning, der fremkommer, når det karakteristiske polynomium sættes lig nul

KA (l) = det(A lE) = det(KA (l)) = 0 ,

kaldes karakterligningen for A.

Ved hjælp af udregningsmetoden for determinanter kan det indses, at det karakteris-
tiske polynomium altid er et n’tegradspolynomium. Se også de efterfølgende eksem-
pler. Hovedpointen er, at rødderne i det karakteristiske polynomium (løsningerne til
karakterligningen) er egenværdierne for matricen, fordi egenværdierne netop opfylder,
at den karakteristiske matrix er singulær.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 22

Eksempel 13.26 En karakteristisk matrix

Givet en (3 ⇥ 3)-matrix A ved


2 3
3 2 0
4
A= 0 1 05, (13-16)
1 1 2
så er den tilhørende karakteristiske matrix

KA (l) = A l E
2 3 2 3
3 2 0 1 0 0
= 4 0 1 0 5 l4 0 1 0 5
1 1 2 0 0 1
2 3 2 3
3 2 0 l 0 0 (13-17)
=4 0 1 0 5 4 0 l 0 5
1 1 2 0 0 l
2 3
3 l 2 0
=4 0 1 l 0 5.
1 1 2 l

Eksempel 13.27 Et karakteristisk polynomium

Vi fortsætter fra eksempel 13.26 og fra det karakteristiske polynomium for A (ved at opløse
den karakteristiske matrix efter sidste søjle jf. metoderne i eNote 9):
02 31
3 l 2 0
KA (l) = det @4 0 1 l 0 5A
1 1 2 l
✓ ◆ (13-18)
3+3 3 l 2
= ( 1) (2 l) det
0 1 l
= (2 l)(3 l)(1 l) .

Det karakteristiske polynomium for A har altså rødderne 1, 2 og 3.


eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 23

Eksempel 13.28 Egenværdier for 2 ⇥ 2-matricer

Givet to matricer A og B,
 
4 2 1 4
A= og B= . (13-19)
3 1 2 3

Bestem egenværdierne for A og B.

Først betragtes A. Dens karakteristiske matrix opskrives:


  
4 2 l 0 4 l 2
KA (l) = A lE = = . (13-20)
3 1 0 l 3 1 l

Nu bestemmes det karakteristiske polynomium:


✓ ◆
4 l 2
KA (l) = det(KA (l)) = det
3 1 l (13-21)
2
= (4 l)( 1 l) ( 2) · 3 = l 3l + 2 .

Polynomiet har som forventet graden 2 . Karakterligningen kan opskrives, og løsningerne til
den kan bestemmes:

KA ( l ) = 0 , l 2 3l + 2 = 0 , l = 1 eller l = 2 . (13-22)

Altså har A de to egenværdier l1 = 1 og l2 = 2 .

Den samme teknik bruges for at bestemme eventuelle egenværdier til B:


  
1 4 l 0 1 l 4
KB (l) = B lE = =
2 3 0 l 2 3 l
✓ ◆
1 l 4 (13-23)
KB (l) = det(KB (l)) = det
2 3 l
=( 1 l)(3 l) 4 · ( 2) = l2 2l + 5 .

Der er i dette tilfælde ingen reelle løsninger til KB (l) = 0, fordi diskriminanten d = ( 2)2
4 · 1 · 5 = 16 < 0, og derfor har B ingen reelle egenværdier. Men den har to komplekse
egenværdier. Vi tager den komplekse "‘værktøjskasse"’ frem: Diskriminanten kan omskrives
til d = (4i )2 , hvilket giver de to komplekse løsninger
2 ± 4i
l= , l = 1 + 2i og l = 1 2i . (13-24)
2
Altså har B de to komplekse egenværdier l1 = 1 + 2i og l2 = 1 2i .
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 24

Bemærk, at de to komplekse egenværdier, der blev fundet sidst i eksemplet


herover, viser sig at være hinandens konjugerede, l1 = 1 + 2i og l2 = l1 =
1 2i . Dette er nemlig en generel regel, som vi ser nærmere på senere i afsnit
13.2.4.

I den følgende sætning opsummeres konklusionerne i dette delafsnit.

Sætning 13.29 Karakteristisk polynomium og karakterligning


For den kvadratiske reelle (n ⇥ n)-matrix A haves

1. den karakteristiske matrix KA (l) = A lE ,

2. det karakteristiske polynomium KA (l) = det(KA (l)) = det(A lE) og

3. karakterligningen KA (l) = 0 .

Der gælder:

1. Det karakteristiske polynomium er et n’tegradspolynomium med den variable


l , og karakterligningen er tilsvarende en n’tegradsligning med den ubekendte
l.

2. Rødderne i det karakteristiske polynomium (løsningerne for karakterlignin-


gen) er samtlige egenværdier for A .

Opgave 13.30 Graden af det karakteristiske polynomium

Argumentér for, at det karakteristiske polynomium KA (l) for en (n ⇥ n)-matrix A er et poly-


nomium i l af graden n.

Opgave 13.31 Nogle karakteristiske polynomier og deres rødder

Bestem de karakteristiske polynomier for følgende matricer, og find alle reelle rødder i hvert
af polynomierne:

1 2
A1 = , A2 = diag( a1 , a2 , a3 ) , A3 = bidiag(b1 , b2 , b3 ) . (13-25)
3 4
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 25

Opgave 13.32 Find matricer med givne karakter-egenskaber

Konstruér to (4 ⇥ 4)-matricer A og B sådan, at den ene har lutter reelle rødder i sit karak-
teristiske polynomium, og sådan at den anden ikke har nogen som helst reelle rødder i sit
karakteristiske polynomium.

13.2.2 At finde egenvektorerne for en kvadratisk matrix

Efter at egenværdierne til en reel (n ⇥ n)-matrix A er bestemt, er det muligt at bestemme


de tilhørende egenvektorer. Proceduren tager udgangspunkt i ligningen

(A lE)v = 0 , (13-26)

som vi nåede frem til i (13-14). Når egenværdierne er kendte, kan det til (13-26) svarende
homogene lineære ligningssystem løses med hensyn til de n ubekendte v1 , . . . , vn , som
er elementer i v = (v1 , . . . , vn ) . Vi skal blot indsætte egenværdierne efter tur og løse
ligningssystemet for hver af dem. Som allerede nævnt er den karakteristiske matrix sin-
gulær, når den indsatte l er en egenværdi. Derfor findes der uendeligt mange løsninger
til ligningssystemet. At finde disse svarer til at finde samtlige egenvektorer v, der hører
til l .

I den følgende metode sammenfattes opgaven med at bestemme egenværdier og tilhørende


egenvektorer for en kvadratisk matrix.

Metode 13.33 Bestemmelse af egenvektorer


Samtlige (reelle eller komplekse) egenværdier l for den kvadratiske matrix A findes
som løsningerne til karakterligningen for A,

KA (l) = 0 , det(A lE) = 0 . (13-27)

Derefter kan egenvektorerne v tilhørende hver enkelt egenværdi l bestemmes. De


er løsningerne til det følgende lineære ligningssystem

(A lE)v = 0 , (13-28)

når egenværdien l er indsat. E er enhedsmatricen.


eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 26

Metode 13.33 udfoldes i de fløgende tre eksempler, der også giver os anledning til, i
forlængelse af sætning 13.23 og sætning 13.24, at beskrive mængden af egenvektorer, der
tilhører en given egenværdi.

Eksempel 13.34 Egenværdiers tilhørende egenvektorer

Givet den kvadratiske matrix 


2 1
A= . (13-29)
1 2
Bestem egenværdier og egenvektorer til A.

Vi bruger metode 13.33. Først findes den karakteristiske matrix,


  
2 1 l 0 2 l 1
KA (l) = A lE = = . (13-30)
1 2 0 l 1 2 l
Dernæst opstilles det karakteristiske polynomium,

KA (l) = det(A lE)


✓ ◆
2 l 1 (13-31)
= det = (2 l)(2 l) 1 · 1 = l2 4l + 3 .
1 2 l

Karakterligningen, som er l2 4l + 3 = 0, har løsningerne l1 = 1 og l2 = 3, der er samtlige


reelle egenværdier til A.

For at bestemme de til l1 hørende egenvektorer indsættes l1 i (A lE)v = 0, hvorefter vi


løser dette lineære ligningssystem, som har totalmatricen

2 1 1 0
T = [A l1 E | 0 ] = . (13-32)
1 2 1 0
Ved GaussJordan-elimination fås

1 1 0
trap(T) = . (13-33)
0 0 0
Der er altså uendeligt mange løsninger v = (v1 , v2 ), da der kun er én ikke-triviel ligning,
v1 + v2 = 0. v2 svarer til en fri parameter og betegnes t, og vi opskriver samtlige reelle
egenvektorer hørende til l1 ved

1
v = t· , t 2 R. (13-34)
1

Vektoren v1 = ( 1, 1) er et eksempel på en egenvektor. Da t kan gennemløbe alle reelle tal,


kan man blot vælge et vilkårligt t og deraf få en ny egenvektor. Der findes således uendeligt
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 27

mange egenvektorer til egenværdien. Løsningen er et 1-dimensionalt underrum i R2 , og det


er nemlig egenrummet, som hører til egenværdien 1 , hvilket vi kan angive således:

E1 = span{( 1, 1)} . (13-35)

Egenvektorerne til den anden egenværdi l2 skal også findes. l2 indsættes i (A lE)v = 0,
hvorefter vi løser det hertil svarende lineære ligningssystem, som har totalmatricen

2 3 1 0
T = [A l2 E | 0 ] = . (13-36)
1 2 3 0

Ved GaussJordan-elimination fås



1 1 0
trap(T) = . (13-37)
0 0 0

Heraf ses, at v2 = (1, 1) er en egenvektor tilhørende egenværdien l2 . Samtlige reelle egen-


vektorer hørende til l2 kan opskrives som

1
v = t· , t 2 R. (13-38)
1

Dette er et én-dimensionalt underrum i R2 , som vi også kan angive ved

E3 = span{(1, 1)} . (13-39)

Der vil nu blive ført kontrol: Når v1 = ( 1, 1) afbildes med A, vil billedvektoren da
udelukkende være en skalering (længdeændring) af v1 ?
  
2 1 1 1
Av1 = = = v1 . (13-40)
1 2 1 1

Det passer! Man kan oven i købet se, at egenværdien er 1 .

Nu kontrolleres v2 :   
2 1 1 3
Av2 = = = 3 · v2 . (13-41)
1 2 1 3
v2 er altså som forventet også en egenvektor, og egenværdien er 3.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 28

Eksempel 13.35 Komplekse egenværdier og egenvektorer

I eksempel 13.28 er der givet en matrix B med



1 4
B= , (13-42)
2 3

som ingen reelle egenværdier har. Men vi fandt to komplekse egenværdier, l1 = 1 + 2i og


l2 = 1 2i .

Vi indsætter l1 i (B lE)v = 0, hvorefter vi løser det hertil svarende lineære ligningssystem,


som har totalmatricen

1 (1 + 2i ) 4 0
T = [B l1 E | 0 ] = . (13-43)
2 3 (1 + 2i ) 0

Ved GaussJordan-elimination fås



1 1+i 0
trap(T) = . (13-44)
0 0 0

Dette svarer til én ikke-triviel ligning v1 + ( 1 + i )v2 = 0. Sættes den frie parameter til
v2 = s, ser vi, at samtlige komplekse egenvektorer hørende til l1 er givet ved

1 i
v = s· , s 2 C. (13-45)
1

Dette er et 1-dimensionalt underrum i C2 , nemlig egenrummet hørende til egenværdien 1 +


2i, som vi også kan angive ved

E1+2i = span{(1 i, 1)} . (13-46)

Tilsvarende kan samtlige komplekse løsninger hørende til l2 findes til



1+i
v = s· , s 2 C. (13-47)
1

Dette er ligeledes et 1-dimensionalt underrum i C2 , som vi i samme stil kan angive ved

E1 2i = span{(1 + i, 1)} . (13-48)

I det følgende eksempel finder vi egenværdier og tilhørende egenrum for en (3 ⇥ 3)-


eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 29

matrix. Det viser sig, at der i dette tilfælde hører et to-dimensionalt egenrum til en af
egenværdierne.

Eksempel 13.36 Egenværdi med multiplicitet 2

Givet matricen A, 2 3
6 3 12
A =4 4 5 45 (13-49)
4 1 10
Bestem egenværdierne til A.

Vi bruger metode 13.33:


02 31
6 l 3 12
det(KA (l)) = det(A lE) = det@4 4 5 l 4 5A
4 1 10 l (13-50)

= l3 9l2 + 108 = (l 3)(l + 6)2 = 0

Af den sidste faktorisering ses, at A har to forskellige egenværdier. Egenværdien l1 = 6 er


en dobbeltrod i karakterligningen, mens egenværdien l2 = 3 er en enkeltrod.

Nu bestemmes egenvektorrummet tilhørende l1 = 6, se sætning 13.23:

A l1 E = 0 ,
2 3
6 ( 6) 3 12 0
4 4 5 ( 6) 4 0 5!
4 1 10 ( 6) 0 (13-51)
2 3 2 3
12 3 12 0 4 1 4 0
4 4 1 4 0 5!4 0 0 0 0 5 .
4 1 4 0 0 0 0 0

Her er kun én ikke-triviel ligning: 4x1 + x2 + 4x3 = 0. Sættes x1 og x3 til de to frie parametre
s og t, fås samtlige reelle egenvektorer til egenværdien 6 ved
2 3 2 3 2 3
x1 1 0
x = 4 x2 5 = s ·4 4 5+ t ·4 4 5 , s, t 2 R . (13-52)
x3 0 1

Dette er et 2-dimensionalt underrum i R3 , som vi også kan angive ved

E 6 = span{(1, 4, 0), (0, 4, 1)} . (13-53)


eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 30

Det er dermed muligt at finde to lineært uafhængige egenvektorer til l1 fx de to, der her
er opskrevet som udspændingen af egenrummet. Hvad med antallet af lineært uafhængige
egenvektorer for l2 = 3?

A l2 E = 0 ,
2 3
6 3 3 12 0
4 4 5 3 4 0 5!
4 1 10 3 0 (13-54)
2 3 2 3 2 3
3 3 12 0 1 1 4 0 1 0 3 0
4 4 8 4 0 5!4 0 3 3 0 5!4 0 1 1 0 5 .
4 1 13 0 0 3 3 0 0 0 0 0

Her er to ikke-trivielle ligninger, x1 + 3x3 = 0 og x2 + x3 = 0. Sættes x3 = s som den frie


parameter, fås samtlige reelle egenvektorer til egenværdien 3 ved
2 3 2 3
x1 3
x = 4 x2 5 = s ·4 15 , s 2 R. (13-55)
x3 1

Dette er et 1-dimensionalt underrum i R3 , som vi også kan angive ved

E3 = span{( 3, 1, 1)} . (13-56)

Det er altså kun muligt at finde én lineært uafhængig egenvektor til l2 .

Opgave 13.37

Givet den kvadratiske matrix 2 3


5 4 4
4
A= 0 1 6 5. (13-57)
0 1 4

1. Bestem samtlige egenværdier til A.

2. Bestem for hver af egenværdierne det tilhørende egenrum.

3. Opskriv mindst 3 egenvektorer tilhørende hver egenværdi. De må gerne være lineært


afhængige.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 31

13.2.3 Algebraisk og geometrisk multiplicitet

Som det fremgår af eksempel 13.36 er det både vigtigt at være opmærksom på, om en
egenværdi er enkeltrod eller flerdobbeltrod i karakterligningen for en kvadratisk, reel
matrix, og på dimensionen af det tilhørende egenrum. I dette delafsnit undersøges
relationen mellem de to fænomener. Det giver anledning til de følgende definitioner.

Definition 13.38 Algebraisk og geometrisk multiplicitet


Lad A være en kvadratisk, reel matrix, og lad l være en egenværdi for A .

1. l siges at have den algebraiske multiplicitet n, når l er en n-dobbeltrod i karak-


terligningen til den kvadratiske matrix A. Dette betegnes am(l) = n.

2. l siges at have den geometriske multiplicitet m, når dimensionen af det til l


hørende egenvektorrum er m. Dette betegnes gm(l) = m. Der gælder med
andre ord, at dim( El ) = gm(l) .

Det er ikke altid, at am(l) = gm(l) . Dette tages op i sætning 13.39.

Vi kan betragte den algebraiske multiplicitet som antallet af forekomster


af egenværdien l og den geometriske multiplicitet som antallet af lineært
uafhængige egenvektorer til egenværdien l.

Den følgende sætning viser nogle vigtige egenskaber vedrørende algebraisk og ge-
ometrisk multiplicitet for egenværdier for kvadratiske matricer (sammenlign med sæt-
ning 13.11).
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 32

Sætning 13.39 Egenskaber for multipliciteter


Givet en reel (n ⇥ n)-matrix A .

1. A har højst n forskellige reelle egenværdier, og også summen af de reelle egen-


værdiers algebraiske multipliciteter er højst n .

2. A har højst n forskellige komplekse egenværdier, og summen af de komplekse


egenværdiers algebraiske multipliciteter er lig med n .

3. Er l en reel eller kompleks egenværdi for A, gælder der:

1  gm(l)  am(l)  n (13-58)

Det vil sige, at den geometriske multiplicitet af en egenværdi mindst vil være
1, at den vil være mindre end eller lig med den algebraiske multiplicitet af
egenværdien, som igen vil være mindre eller lig antallet af søjler og rækker i
A.

Opgave 13.40

Kontroller, at alle tre punkter i sætning 13.39 er gældende for egenværdierne og egenvektor-
erne i eksempel 13.36.

Lad os knytte nogle kommentarer til sætning 13.39.

Punkt 1 og 2 følger direkte af læren om polynomier. Det karakteristiske polynomium


for en reel (n ⇥ n)-matrix A er et n’tegradspolynomium, og det har højst n forskellige
reelle såvel som komplekse rødder. Endvidere er summen af de reelle rødders multi-
plicitet højst n , mens summen af de komplekse rødders multiplicitet er lig med n .

Vi har tidligere vist, at der for enhver lineær afbildning af et n-dimensionalt vektorrum
ind i sig selv gælder, at summen af de geometriske multipliciteter af egenværdierne
højst kan være n , se sætning 13.11. Bemærk at dette direkte kan udledes af udsagnene
om mulipliciteter i sætning 13.39.

Som noget nyt og interessant påstås det i punkt 3, at den geometriske multiplicitet for
en enkelt egenværdi kan være mindre end den algebraiske multiplicitet — det kommer
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 33

der et eksempel på i det følgende opsamlende eksempel 13.41 — og videre at den ge-
ometriske multiplicitet af en enkelt egenværdi ikke kan være større end den algebraiske.
Beviset for punkt 3 i sætning 13.39 udelades.

Eksempel 13.41 Geometrisk multiplicitet mindre end algebraisk

Givet er matricen 2 3
9 10 0
A =4 3 1 5 5. (13-59)
1 4 6
Egenværdierne til A bestemmes ved karakterligningen det(KA (l)) = 0:
02 31
9 l 10 0
det(KA (l)) = det(A lE) = det@4 3 1 l 5 5A
1 4 6 l (13-60)

= l3 2l2 + 7l 4= (l + 4)(l 1)2 = 0 .


Af faktoriseringen før sidste lighedstegn fås, at A har to forskellige egenværdier, l1 = 4 og
l2 = 1. Desuden er am( 4) = 1 og am(1) = 2, som det også fremgår af faktoriseringen.

Egenvektorrummet til l1 = 4 bestemmes ved at løse (A l1 E)v = 0:


2 3
9 ( 4) 10 0 0
4 3 1 ( 4) 5 0 5!
1 4 6 ( 4) 0
2 3 2 3 (13-61)
1 2 0 0 1 0 10 0
40 1 5 0 5!4 0 1 5 05
0 2 10 0 0 0 0 0
Der er to ikke-trivielle ligninger, v1 10v3 = 0 og v2 5v3 = 0. Sættes v3 til den frie param-
eter, ses det, at samtlige til l1 hørende reelle egenvektorer kan angives ved

E 4 = s · (10, 5, 1) s 2 R = span{(10, 5, 1)} . (13-62)

Man har, at gm( 4) = dim( E 4 ) = 1, og at en egenvektor til l1 er v1 = (10, 5, 1). Det ses, at
gm( 4) = am( 4) for denne egenværdi.

Det tilsvarende udføres for l2 = 1:


2 3
9 1 10 0 0
4 3 1 1 5 0 5!
1 4 6 1 0
2 3 2 3 (13-63)
1 1 0 0 1 0 5/3 0
40 3 5 0 5 ! 4 0 1 5/3 0 5
0 3 5 0 0 0 0 0
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 34

Her er der igen to ikke-trivielle ligninger, v1 v2 = 0 og 3v2 5v3 = 0. Sættes v3 = 3s, ses
det, at samtlige til l2 hørende reelle egenvektorer kan angives ved

E1 = s · (5, 5, 3) s 2 R = span{(5, 5, 3)} . (13-64)

Det giver følgende resultater: gm(1) = dim( E1 ) = 1, og at en egenvektor til l2 er


v2 = (5, 5, 3). Desuden ses det, at gm(1) = 1 < am(1) = 2.

Bemærk, at den frie parameter i eksemplet herover ikke blot er navngivet s


men derimod 3s. Derved undgås nemlig brøker i elementerne. Ender man
nogensinde med brøker eller andre "‘grimme"’ tal som elementer i de ud-
spændende vektorer, kan man ofte blot forlænge vektoren men en vilkårlig
passende faktor. Det gør ingen forskel, da den frie parameter i forvejen gen-
nemløber alle tal.

13.2.4 Mere om den komplekse problemstilling

Vi vil bruge matricen


1 4
B= (13-65)
2 3

fra eksempel 13.35 til at præcisere nogle særlige fænomener for kvadratiske, reelle ma-
tricer, når deres egenværdiproblem studeres i kompleks ramme.

Vi fandt, at B har egenværdierne l1 = 1 + 2i og l2 = 1 2i . Der gælder således, at


egenværdierne er hinandens konjugerede. En anden bemærkelsesværdig ting i eksem-
pel 13.35 er, at når 
1 i
v=
1
er en egenvektor for l1 = 1 + 2i , så er den konjugerede vektor

1+i
v=
1
en egenvektor for l2 = 1 2i . Begge dele er eksempler på generelle regler.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 35

Sætning 13.42 Konjugerede egenværdier og egenvektorer


For en kvadratisk, reel matrix A gælder:

1. Hvis l er en kompleks egenværdi for A med rektangulær form l = a + ib , så


er også l = a ib en egenværdi for A .

2. Hvis v er en egenvektor for A hørende til den komplekse egenværdi l, så er


den konjugerede vektor v en egenvektor for A hørende til den konjugerede
egenværdi l .

Bevis

Første del af sætning 13.42 følger af læren om polynomier. Det karakteristiske polynomium
for en kvadratisk, reel matrix er et polynomium med reelle koefficienter. Derom vides, at
rødderne for polynomiet altid optræder i konjugerede par.

Anden del af beviset foretages således:

Av = lv , Av = lv , Av = lv , Av = l v.
Hvis v er en egenvektor til egenværdien l, så er v altså samtidig en egenvektor til egenvær-
dien l. Hermed er sætningen vist.

Ved sporet for en kvadratisk matrix forstås summen af diagonalelementerne. Sporet af B er


dermed 1 + 3 = 2 . Læg nu mærke til, at summen af egenværdierne for B er (1 i ) +
(1 + i ) = 2 , altså det samme som sporet af B . Også dette er et generelt fænomen, som
her anføres uden bevis.

Sætning 13.43 Sporet


For en kvadratisk, reel matrix A gælder, at sporet af A, det vil sige summen af
diagonalelementerne i A, er lig med summen af alle (reelle som komplekse) egen-
værdier for A , idet hver egenværdi indgår i summen det antal gange, som svarer til
egenværdiens algebraiske multiplicitet.
eNote 13 13.2 EGENVÆRDIPROBLEMET FOR KVADRATISKE MATRICER 36

Opgave 13.44

I eksempel 13.36 fandt vi, at det karakteristiske polynomium for matricen


2 3
6 3 12
A =4 4 5 45
4 1 10

har dobbeltroden 6 og enkeltroden 3 . Eftervis, at sætning 13.43 gælder i dette tilfælde.


eNote 14 1

eNote 14

Similaritet og diagonalisering

I denne note forklares, hvordan visse kvadratiske matricer kan diagonaliseres ved hjælp af
egenvektorer. Det forudsættes derfor, at man ved, hvordan egenværdier og egenvektorer til en
kvadratisk matrix bestemmes, og desuden er bekendt med tilhørende begreber, såsom algebraisk
og geometrisk multiplicitet, se eNote 13.

Opdateret 15.10.21 af Karsten Schmidt.

14.1 Introduktion til afbildningsmatricer som


diagonalmatricer

Hvis vi betragter en lineær afbildning f : V ! V af et n-dimensionalt vektorrum V ind


i sig selv, så vil afbildningsmatricen for f med hensyn til en vilkårlig basis for f være
en kvadratisk (n ⇥ n)-matrix. Er der givet to baser a og b for V, er relationen mellem de
tilsvarende afbildningsmatricer a Fa henholdsvis b Fb givet ved
1
b Fb = ( a Mb ) a Fa a Mb , (14-1)
⇥ ⇤
hvor a Mb = a b1 a b2 ··· a bn er basisskiftematricen der skifter fra b til a koordi-
nater.

Af særlig interesse er det, hvis der findes en basis v bestående af egenvektorer for f .
Lad nemlig a være en vilkårlig basis for V og a Fa den hertil hørende afbildningsmatrix
for f . Lad endvidere v være en egenvektorbasis for V til f . Af sætning 13.14 fremgår
det, at afbildningsmatricen for f med hensyn til basis v er en diagonalmatrix L, hvori
eNote 14 14.2 SIMILÆRE MATRICER 2

diagonalelementerne er egenværdierne for f . Hvis V betegner basisskiftematricen, som


skifter fra v-koordinater til a-koordinater, vil L ifølge (14-1) fremkomme således:
1
L=V a Fa V . (14-2)

(14-1) og (14-2) inspirerer naturligt til spørgsmål, der tager udgangspunkt i kvadratiske
matricer: Hvilke betingelser skal være opfyldt for, at to givne kvadratiske matricer kan
fortolkes som afbildningsmatricer for den samme linæere afbildning med hensyn til to
forskellige baser? Og hvilke betingelser skal en kvadratisk matrix opfylde for, at den
er afbildningsmatrix for en lineær afbildning, som i en anden basis har en diagonalma-
trix som afbildningsmatrix? Vi studerer først disse spørgsmål i en ren matrixalgebra-
opsætning, og vender i sidste underafsnit tilbage til afbildningssynsvinklen. Til dette
formål indføres nu begrebet similære matricer.

14.2 Similære matricer

Definition 14.1 Similære matricer


Givet (n ⇥ n)-matricerne A og B . Man siger, at A er similær med B, hvis der findes
en regulær matrix M således, at
1
B=M AM. (14-3)

Eksempel 14.2 Similære matricer

 
2 3 8 21
Givet matricerne A = og B = .
3 4 3 10
 
2 3 1 2 3
Matricen M = er regulær og har den inverse matrix M = .
1 2 1 2

Udregningen
   
2 3 2 3 2 3 8 21
=
1 2 3 4 1 2 3 10
viser, at A er similær med B .
eNote 14 14.2 SIMILÆRE MATRICER 3

Hvis A er similær med B, så er B også similær med A . Hvis vi nemlig sætter


N = M 1 , så er N regulær, og
1 1 1
B=M AM , MBM =A , A=N BN.

Derfor bruger man også talemåden: A og B er similære matricer .

Sætning 14.3 Similaritet er transitivt


Lad A , B og C være (n ⇥ n)-matricer. Hvis A er similær med B, og B er similær med
C , så er A similær med C .

Opgave 14.4

Bevis sætning 14.3.

Om egenværdierne for similære matricer gælder følgende sætning.

Sætning 14.5 Similaritet og egenværdier


Hvis A er similær med B , har de to matricer identiske egenværdier med de samme
tilhørende algebraiske og geometriske multipliciteter.

Bevis

Lad M være en regulær matrix, der opfylder B = M 1 AM , og lad E betegne enhedsmatricen


af samme kvadratiske form som de tre nævnte matricer. Så gælder:
1 1
det(B lE) = det(M AM lM EM)
1
= det(M (A lE)M)
1
= det(M ) · det(A lE) · det(M) (14-4)
1
= · det(A lE) · det(M)
det(M)
= det(A lE) .
eNote 14 14.2 SIMILÆRE MATRICER 4

Hermed vist, at de to matricer har samme karakteristiske polynomium og dermed de samme


egenværdier med de samme tilhørende algebraiske multipliciteter. At de har samme egen-
værdier fremgår i øvrigt af sætning 14.13 nedenfor:

Når A og B kan repræsentere den samme lineære afbildning f med hensyn til to forskellige
baser, har de identiske egenværdier, nemlig egenværdierne for f .

Men egenværdierne har også de samme dimensioner, dvs. geometriske multipliciteter. Dette
følger af, at egenrummene for A og B med hensyn til enhver af egenværdierne kan fortolkes
som to forskellige koordinatfremstillinger for dette samme egenrum, nemlig egenrummet for
f med hensyn til den pågældende egenværdi.

Læg mærke, til at sætning 14.5 siger, at to similære matricer har samme egen-
værdier, men ikke omvendt: at to matricer, som har samme egenværdier, er
similære. Der er en forskel, og kun det første udsagn er sandt.

To similære matricer A og B har samme egenværdier, men en egenvektor for


den ene er i almindelighed ikke egenvektor for den anden. Der gælder dog,
at hvis v er en egenvektor for A tilhørende egenværdien l, så er M 1 v en
egenvektor for B tilhørende egenværdien l, hvor M er den regulære matrix,
der opfylder B = M 1 AM , A = M B M 1 . Der gælder nemlig:
1 1
Av = lv , M Av = M lv
1 1 1
,M (M B M )v = M lv
1 1
, B(M v) = l (M v) .

Opgave 14.6

Gør rede for, at to kvadratiske (n ⇥ n)-matricer er similære, hvis de har identiske egenværdier
med samme tilhørende geometriske multipliciteter, og at summen af de geometriske multi-
pliciteter er n .
eNote 14 14.3 DIAGONALISERING AF MATRICER 5

14.3 Diagonalisering af matricer

Betragt en matrix A og en regulær matrix V , som er givet ved


 
1 2 1 2
A= og V = . (14-5)
1 4 1 1

Da der gælder, at
   
1 1 2 1 2 1 2 3 0
V AV = = ,
1 1 1 4 1 1 0 2

besidder A en særlig egenskab: den er similær med en diagonalmatrix, nemlig diago-


nalmatricen 
3 0
L= .
0 2
Man siger da, at A er blevet diagonaliseret ved similartransformation.

Vi vil nu for en vilkårlig given kvadratisk matrix A stille spørgsmålet, om den kan
diagonaliseres ved similartransformation eller ej. Vi opstiller derfor ligningen
1
V A V = L,

hvor V er en regulær matrix og L en diagonalmatrix. Vi beviser nedenfor, at ligningen


har en løsning netop, hvis søjlerne i V er lineært uafhængige egenvektorer for A , og
diagonalelementerne i L er egenværdierne for A opført således, at den i-te søjle i V
er egenvektor hørende til egenværdien i den i-te søjle i L .

Vi bemærker, at dette er i overensstemmelse med eksempel-matricerne i (14-5) ovenfor:


   
1 2 1 3 1
= =3 (14-6)
1 4 1 3 1
og    
1 2 2 4 2
= =2 . (14-7)
1 4 1 2 1
Vi ser i (14-6), at første sjle i V som forventet er egenvektor for A hørende til det første
diagonalelement i L, og vi ser i (14-7), at den anden søjle i V er egenvektor hørende til
det andet diagonalelement i L.
eNote 14 14.3 DIAGONALISERING AF MATRICER 6

Sætning 14.7 Diagonalisering ved similartransformation


Hvis en kvadratisk matrix (n ⇥ n)-matrix A har n lineært uafhængige egenvektorer
v1 , v2 , . . . , vn respektivt tilhørende de n (ikke nødvendigvis forskellige) egenværdier
l1 , l2 , . . . , ln , kan den diagonaliseres ved similartransformationen
1 1
V AV = L , A = VLV , (14-8)

hvor ⇥ ⇤
V = v1 v2 · · · vn og L = diag(l1 , l2 , . . . , ln ) . (14-9)
Hvis A ikke har n lineært uafhængige egenvektorer, kan den ikke diagonaliseres
ved similartransformation.

Bevis

Antag, at A har n lineært uafhængige egenvektorer v1 , v2 , . . . , vn , og at vi for i = 1, . . . , n


hører til egenværdien li . Så gælder de følgende n ligninger:

Av1 = l1 v1 , Av2 = l2 v2 , ... , Avn = ln vn . (14-10)

De n ligninger kan samles i et ligningssystem:


⇥ ⇤ ⇥ ⇤
Av1 Av2 · · · Avn = v1 l1 v2 l2 · · · vn ln
2 3
l1 0 · · · 0
⇥ ⇤ ⇥ ⇤6
6 0 l2 · · · 0 7
7
, A v1 v2 · · · vn = v1 v2 · · · vn 6 . . . (14-11)
4 .. .. . . . .. 7
5
0 0 · · · ln
, AV = VL
Nu er alle egenvektorerne indsat (lodret efter hinanden) i matricen V i samme rækkefølge
som egenværdierne er i diagonalen af matricen L, som uden for diagonalen kun indeholder
nuller. Da egenvektorerne er lineært uafhængige, er matricen V regulær. Derfor findes den
inverse V 1 , og den ganges på fra venstre på begge sider af lighedstegnet:
1 1 1
V AV = V VL , V AV = L . (14-12)

Hermed er første del af af sætningen vist.

Antag omvendt, at
⇥ A kan diagonaliseres
⇤ ved en similartransformation. Så findes der en reg-
ulær matrix V = v1 v2 · · · vn og en diagonalmatrix L = diag(l1 , l2 , . . . , ln ) således,
at
V 1 AV = L . (14-13)
eNote 14 14.3 DIAGONALISERING AF MATRICER 7

Hvis vi nu gentager omformningerne i første del af beviset blot i modsat rækkefølge, ses det,
at (14-13) er ensbetydende med de følgende n ligninger:

Av1 = l1 v1 , Av2 = l2 v2 , ... , Avn = ln vn , (14-14)

hvoraf det fremgår, at vi for i = 1, . . . , n er en egenvektor for A tilhørende egenværdien li .

Diagonalisering ved similartransformation kan derfor kun opnås på den måde, der er omtalt
i sætningens første del.

Den følgende sætning kan være til stor hjælp, når man i forskellige sammenhænge un-
dersøger, om matricer kan diagonaliseres ved similartransformation. Hovedresultatet
har vi allerede givet i sætning 14.7, men her forfines betingelserne, idet vi trækker på
tidligere viste sætninger om egenværdiproblemet for lineære afbildninger og matricer.

Sætning 14.8 Matricers diagonaliserbarhed


For en given (n ⇥ n)-matrix A gælder:

A kan diagonaliseres ved similartransformation,

1. hvis der findes n forskellige egenværdier for A , eller

2. hvis summen af egenværdiernes geometriske multipliciteter er n .

A kan ikke diagonaliseres ved similartransformation,

3. hvis summen af egenværdiernes geometriske multipliciteter er mindre end n ,


eller

4. hvis der findes blot én egenværdi l med gm(l) < am(l) .

Bevis

Ad. 1
Hvis der vælges en egentlig egenvektor fra hvert af de n egenrum, følger det af hjælpesæt-
ning 13.9, at det samlede sæt af n egenvektorer er lineært uafhængigt. Derfor kan A ifølge
sætning 14.7 i så fald diagonaliseres ved similartransformation.
eNote 14 14.3 DIAGONALISERING AF MATRICER 8

Ad. 2
Hvis der vælges en basis for hvert af egenrummene, så er det samlede sæt af de valgte n
egenvektorer ifølge hjælpesætning 13.9 lineært uafhængigt. Derfor kan A ifølge sætning
14.7 i så fald diagonaliseres ved similartransformation.

Ad. 3
Hvis summen af de geometriske multipliciteter er mindre end n, findes der ikke n lineært
uafhængige egenvektorer for A . Derfor kan A ifølge sætning 14.7 i så fald ikke diagonalis-
eres ved similartransformation.

Ad. 4
Da der ifølge sætning 13.39 pkt. 2 gælder, at summen af de algebraiske multipliciteter er n,
og da der ifølge samme sætning pkt. 3 for enhver egenværdi l gælder, at gm(l)  am(l) ,
kan summen af de geometriske multipliciteter ikke blive n, hvis blot én af egenværdiernes
geometriske multiplicitet er mindre end dens algebraiske. I så fald kan A derfor ikke diago-
naliseres ved similartransformation.

Et typisk særtilfælde er, når en kvadratisk (n ⇥ n)-matrix har i alt n forskellige


egenværdier. Sætning 14.8 pkt. 1 sikrer, at alle matricer af denne type kan
diagonaliseres ved similartransformation.

I de følgende eksempler skal vi se, hvordan man konkret kan undersøge, om diago-
nalisering ved similartransformation er mulig og i givet fald gennemføre den.

Eksempel 14.9

Den kvadratiske matrix 2 3


5 3 2
A = 4 2 10 4 5 (14-15)
2 6 8
har egenværdierne l1 = 4 og l2 = 15 . Vektorerne v1 = ( 2, 0, 1) og v2 = ( 3, 1, 0) er to
lineært uafhængige vektorer, der hører til l1 , og vektoren v3 = (1, 2, 2) er en egentlig egen-
vektor, der hører til l2 . Det samlede sæt af de tre nævnte egenvektorer er lineært uafhængigt
ifølge hjælpesætning 13.9. Det er derfor ifølge sætning 14.7 muligt at diagonalisere A, fordi
der findes n = 3 lineært uafhængige egenvektorer. Man kan derfor skrive, at L = V 1 AV,
hvor
2 3 2 3 2 3
l1 0 0 4 0 0 ⇥ ⇤ 2 3 1
L = 4 0 l1 0 5 = 4 0 4 0 5 og V = v1 v2 v3 = 4 0 1 2 5. (14-16)
0 0 l2 0 0 15 1 0 2
eNote 14 14.4 KOMPLEKS DIAGONALISERING 9

14.4 Kompleks diagonalisering

Hvad vi indtil nu har sagt om similære matricer gælder generelt for kvadratiske, kom-
plekse matricer. Grundligningen for diagonalisering ved similartransformation
1
V AV = L (14-17)
skal derfor forstås i bredest mulig forstand, hvor matricerne A, V og L er komplekse
(n ⇥ n)-matricer. Indtil nu har vi indskrænket os til reelle eksempler, det vil sige eksem-
pler, hvor det har været muligt at opfylde grundligningen (14-17) med reelle matricer.
Vi vil i det følgende beskæftige os med en særlig situation, som er typisk i tekniske an-
vendelser af diagonalisering: Til en given reel (n ⇥ n)-matrix A søges en regulær matrix
M og en diagonalmatrix L, som opfylder grundligningen i bred ramme, hvor M og L
muligvis er komplekse (ikke-reelle) (n ⇥ n)-matricer.

Det følgende eksempel viser en reel (3 ⇥ 3)-matrix, som ikke kan diagonaliseres reelt,
fordi dens karakteristiske polynomium kun har én reel rod. Til gengæld kan den diag-
onaliseres komplekst.

Eksempel 14.10 Kompleks diagonalisering af reel matrix

Den kvadratiske matrix 2 3


2 0 5
4
A= 0 0 15 (14-18)
0 1 0
har egenværdierne l1 = 2 , l2 = i og l3 = i . v1 = (1, 0, 0) er en egentlig egenvektor, der
hører til l1 , v2 = ( 2 + i, i, 1) en egentlig egenvektor, der hører til l2 , og v3 = ( 2 i, i, 1)
en egentlig egenvektor, der hører til l3 . Det samlede sæt af de tre nævnte egenvektorer er
lineært uafhængigt ifølge hjælpesætning 13.9. Det er derfor ifølge sætning 14.7 muligt at
diagonalisere A. Man kan derfor skrive L = V 1 AV, hvor
2 3 2 3
l1 0 0 2 0 0
L= 4 5
0 l2 0 = 0 4 i 0 5 og
0 0 l3 0 0 i
2 3 (14-19)
⇥ ⇤ 1 2+i 2 i
V = v1 v2 v3 = 4 0 i i 5.
0 1 1

Det næste eksempel viser en reel, kvadratisk matrix, som ikke kan diagonaliseres, hverken
reelt eller komplekst.
eNote 14 14.5 DIAGONALISERING AF LINEÆRE AFBILDNINGER 10

Eksempel 14.11 Ikke-diagonaliserbar kvadratisk matrix

Givet den kvadratiske matrix 2 3


4 1 2
A =4 1 4 1 5, (14-20)
0 0 3
hvor A har egenværdierne l1 = 3 og l3 = 5. Egenværdien 3 har den algebraiske multiplicitet
2, men der kan kun vælges én lineært uafhængig egenvektor til denne egenværdi, for eksem-
pel v1 = (1, 1, 0). Egenværdien har altså geometrisk multiplicitet 1, og gm(3) < am(3).
Derfor er det ifølge sætning 14.7 ikke muligt at diagonalisere A ved similartransformation.

Opgave 14.12

Til matricen 
2 9
A= (14-21)
1 6
ønskes følgende:

1. Bestem alle egenværdier og deres algebraiske multipliciteter.

2. Bestem samtlige tilhørende lineært uafhængige egenvektorer og derved egen-


værdiernes geometriske multipliciteter.

3. Hvis det er muligt, skal A diagonaliseres: Bestem en diagonalmatrix L og en regulær


matrix V, hvorom der gælder, at V 1 AV = L. Hvilke krav er der for at diagonaliserin-
gen kan lade sig gøre? Hvilke tal og vektorer indgår i L og V ?

14.5 Diagonalisering af lineære afbildninger

I indledningen til denne eNote stillede vi spørgsmålet: Hvilke betingelser skal være
opfyldt for at to givne kvadratiske matricer kan fortolkes som afbildningsmatricer for
den samme lineære afbildning med hensyn til to forskellige baser? Svaret er enkelt, som
næste sætningen siger.
eNote 14 14.5 DIAGONALISERING AF LINEÆRE AFBILDNINGER 11

Sætning 14.13 Similære matricer som afbildningsmatricer


Der er givet et n-dimensionalt vektorrum V . To (n ⇥ n)-matricer A og B er afbild-
ningsmatricer for den samme lineære afbildning f : V ! V med hensyn til to
forskellige baser for V, hvis og kun hvis A og B er similære.

Opgave 14.14

Bevis sætning 14.13.

I indledningen spurgte vi også: Hvilke betingelser skal en kvadratisk matrix opfylde


for, at den er afbildningsmatrix for en lineær afbildning, som i en anden basis har en
diagonalmatrix som afbildningsmatrix? Svaret fremgår af sætning 14.7 kombineret med
sætning 14.13, nemlig at matricen skal have n linæert uafhængige egenvektorer.

Vi slutter eNoten af med et eksempel på diagonalisering af en lineær afbildning — det


vil sige, vi finder en passende basis med hensyn til hvilken en afbildningsmatrix er en
diagonalmatrix.

Eksempel 14.15 Diagonalisering af lineær afbildning

En lineær afbildning f : P1 (R ) ! P1 (R ) er givet med følgende afbildningsmatrix


med hensyn til standard monomiebasis m:

17 21
m Fm = . (14-22)
14 18

Undersøg, om der findes en (reel) egenbasis for f . Undersøg i bekræftende fald


derudover, hvordan afbildningsmatricen ser ud med hensyn til denne basis, og
bestemt basisvektorerne.

Søjlerne i m Fm betyder, at f (1) = 17 + 14x og f ( x ) = 21 + 18x.


eNote 14 14.5 DIAGONALISERING AF LINEÆRE AFBILDNINGER 12

Egenværdierne til matricen m Fm bestemmes:


✓ ◆
17 l 21
det(m Fm lE) = det
14 18 l (14-23)
2
=l l 12 = (l + 3)(l 4) = 0 .

Det er allerede nu muligt at bekræfte, at der findes en reel egenbasis til f , da der findes 2 =
dim( P1 (R )) egenværdier, nemlig l1 = 3 og l2 = 4, som hver har algebraisk multiplicitet
1. Egenvektorer til l1 bestemmes:
 
17 + 3 21 0 1 32 0
! (14-24)
14 18 + 3 0 0 0 0

Det giver en egenvektor m v1 = ( 3, 2), hvis den frie parameter sættes til 2. Tilsvarende fås
den anden egenvektor:
 
17 4 21 0 1 1 0
! . (14-25)
14 18 4 0 0 0 0

Det giver en egenvektor m v2 = ( 1, 1), hvis den frie parameter sættes til 1.

Der findes altså en reel egenbasis v til f , der er givet ved basisvektorerne m v1 og m v2 . Vi har
da, at  
3 1 3 0
m Mv = og v Fv = . (14-26)
2 1 0 4
Den nye v-basis udgøres af basisvektorerne v1 = 3 + 2x og v2 = 1 + x, og afbildningen er
"‘simplere"’ med hensyn til denne nye basis. Grundligningen ser da naturligvis således ud:
1
v Fv = (m Mv ) m Fm m Mv

Man kan gøre prøve ved fx at afbilde v1 :

f (v1 ) = f ( 3 + 2x ) = 3 · f (1) + 2 · f ( x )
= 3 · ( 17 + 14x ) + 2 · ( 21 + 18x ) (14-27)
=9 6x = 3( 3 + 2x ) = 3v1

Det passer!
eNote 15 1

eNote 15

Symmetriske matricer

I denne eNote vil vi beskæftige os med et af de mest benyttede resultater fra lineær algebra – den
såkaldte spektralsætning for symmetriske matricer. Den siger kort fortalt, at alle symmetriske
matricer kan diagonaliseres ved en similartransformation, altså ved et basisskift foretaget med
en passende substitutionsmatrix.
Indførelsen af disse begreber og tilhørende metoder blev givet i eNote 14, som derfor er en
fundamental basis for nærværende eNote.
Netop i den eNote blev det klart, at ikke alle matricer kan diagonaliseres. Diagonalisering
kræver, at der er tilstrækkelig mange egenværdier (de algebraiske multipliciteter summer op til
at være størst mulig) og at deres egenvektorrum faktisk udfylder hele vektorrummet (de
geometriske multipliciteter summer op til at være størst mulig). Det er disse egenskaber, som vi
vil beskæftige os med, men nu for symmetriske matricer, der viser sig at opfylde betingelserne og
faktisk mere til: De egenvektorer vi benytter i den resulterende substitutionsmatrix kan vælges
parvis ortogonale, sådan at den nye basis fremkommer ved en rotation af den gamle sædvanlige
basis i R n .
For at kunne diskutere og anvende spektralsætningen mest effektivt må vi først indføre et
naturligt skalarprodukt for vektorer i R n sådan at vi kan måle vinkler og længder i alle
dimensioner. Det gør vi selvfølgelig med udgangspunkt i det velkendte sædvanlige
skalarprodukt fra R2 og R3 . Som antydet vil vi specielt benytte baser bestående af parvis
ortogonale vektorer til at opstille og forstå hvad spektralsætningen går ud på og hvad vi kan
bruge den til.
eNote 15 15.1 SKALARPRODUKT 2

15.1 Skalarprodukt

I vektorrummet R n indføres et indre produkt, dvs. et skalarprodukt, som er en naturlig


generalisering af det velkendte skalarprodukt fra plangeometri og rumgeometri, se
eNote 6.

Definition 15.1 Skalarprodukt


Lad a og b være to givne vektorer i R n med koordinaterne henholdsvis ( a1 , ..., an )
og (b1 , ..., bn ) med hensyn til den sædvanlige basis e i R n :

ea = ( a1 , ..., an ) , og eb = (b1 , ..., bn ) . (15-1)

Så definerer vi skalarproduktet, det indre produkt, af de to vektorer på følgende


måde:
n
a·b = a1 b1 + a2 b2 + · · · an bn = Â a i bi . (15-2)
i =1

Når R n udstyres med dette skalarprodukt er (R n , ·) dermed et eksempel på et


såkaldt Euklidisk vektorrum, eller et vektorrum med indre produkt.

Skalarproduktet kan udtrykkes som et matrix-produkt:


2 3
b1
6 · 7
⇥ ⇤ 6 7
>
a · b = ea · eb = a1 · · · an · 6
6 · 7
7 (15-3)
4 · 5
bn

For det indførte skalarprodukt gælder følgende regneregler


eNote 15 15.1 SKALARPRODUKT 3

Sætning 15.2 Regneregler for skalarprodukt


Hvis a , b og c er vektorer i (R n , ·) og k er et vilkårligt reelt tal gælder:

a·b = b·a (15-4)


a · (b + c) = a · b + a · c (15-5)
a · (kb) = (ka) · b = k(a · b) (15-6)

En hovedpointe ved indførelsen af et skalarprodukt er, at vi nu kan tale om længder af


vektorerne i (R n , ·):

Definition 15.3 Længden af en vektor


Lad a være en vektor i (R n , ·) med koordinaterne ( a1 , ..., an ) med hensyn til standard
e-basis i R n . Så er længden af a defineret ved
s
p n
|a| = a · a = Â a2i . (15-7)
i =1

Længden af a kaldes også normen af a med hensyn til skalarproduktet i (R n , ·). En


vektor a kaldes en egentlig vektor hvis |a| > 0 .
eNote 15 15.1 SKALARPRODUKT 4

Det følger af definition 15.1 at der gælder

a·a 0 for alle a 2 (R n , ·) og


(15-8)
a·a = 0 , a = 0 .

Heraf ses umiddelbart at

|a| 0, for alle a 2 (R n , ·) og


(15-9)
|a| = 0 , a = 0 .

En egentlig vektor er altså en vektor som ikke er 0-vektoren.

Endelig følger det af definition 15.1 og definition 15.3 at der for a 2 (R n , ·) og


et vilkårligt reelt tal k gælder gælder

|ka| = |k| |a| . (15-10)

Vi er nu i stand til at vise følgende vigtige sætning:

Sætning 15.4 Cauchy-Schwarz’ ulighed


For vilkårlige vektorer a og b i (R n , ·) gælder

|a · b|  | a | | b | , (15-11)

hvor lighedstegnet gælder, hvis og kun hvis a og b er lineært afhængige.

Bevis

Hvis b = 0 , er begge sider i (15.1.11) lig 0 og uligheden dermed opfyldt. I det følgende
forudsættes b at være en egentlig vektor.

1
Vi sætter k = b · b og e = p b . Så følger det af (15.1.6) at
k
1 1 1
e · e = ( p b) · ( p b) = (b · b) = 1
k k k

og dermed at |e| = 1 .
p
Ved at indsætte b = k e i venstresiden og højresiden af (15.1.11) fr vi ved brug af (15.1.6) og
eNote 15 15.1 SKALARPRODUKT 5

(15.1.10): p p
|a · b| = | a · ( k e) | = k |a · e|
og p p
|a| |b| = |a| | ke| = k |a| |e| .
Vi behøver derfor kun at vise at der for vilkårlige a og e , hvor |e| = 1 , gælder

|a · e|  | a | (15-12)

hvor lighedstegnet skal gælde, hvis og kun hvis a og e er lineært afhængige.

For et vilkårligt t 2 R gælder ifølge (15.1.8), (15.1.5) og (15.1.6):

0  (a te) · (a te) = a · a + t2 (e · e) 2t(a · e) = a · a + t2 2t(a · e) .

Hvis vi her specielt vælger t = a · e , får vi


p
0  a·a (a · e)2 , |a · e|  a · a = |a| .

Da det ifølge (15.1.8) glder at (a te) · (a te) = 0 hvis og kun hvis (a te) = 0 , ser vi at
|a · e| = | a | hvis og kun hvis a og e er lineært afhængige. Beviset er hermed fuldført.

Af Cauchy-Schwarz’ ulighed følger trekantuligheden, som er en generalisering af den


fra elementær plangeometri kendte sætning, at en side i en trekant altid er mindre end
eller lig med summen af de to øvrige sider:

Følgesætning 15.5 Trekant-uligheden


For vilkårlige vektorer a og b og i (R n , ·) gælder

|a + b|  |a| + |b| . (15-13)

Opgave 15.6

Bevis følgesætning 15.5.


eNote 15 15.2 SYMMETRISKE MATRICER OG SKALARPRODUKTET 6

Bemærk at der af Cauchy-Schwarz’ ulighed følger:

a·b
1 1 . (15-14)
|a| · |b|

Vinklen mellem to vektorer i (R n , ·) kan derfor indføres således:

Definition 15.7 Vinklen mellem vektorer


Lad a og b være to givne egentlige vektorer i (R n , ·) med koordinaterne ( a1 , ..., an )
og (b1 , ..., bn ) med hensyn til den sædvanlige basis i (R n , ·). Så er vinklen mellem a
og b defineret ved den værdi af q i intervallet [0, p ] som opfylder

a·b
cos(q ) = . (15-15)
|a| · |b|
Hvis a · b = 0 så siger vi, at de to egentlige vektorer er ortogonale eller vinkelrette
på hinanden. Det optræder præcis når cos(q ) = 0, altså når q = p/2.

15.2 Symmetriske matricer og skalarproduktet

Vi kender symmetri-begrebet for kvadratformede matricer:

Definition 15.8
En kvadratformet matrix A er symmetrisk hvis den er lig med sin egen
transponerede
A = A> , (15-16)
altså hvis aij = a j i for alle elementerne i matricen.

Hvad har symmetriske matricer med skalarproduktet at gøre? Det ser vi på her:
eNote 15 15.2 SYMMETRISKE MATRICER OG SKALARPRODUKTET 7

Sætning 15.9
Lad v og w betegne to vektorer i vektorrummet (R n , ·) med det indførte skalarpro-
dukt. Hvis A er en vilkårlig (n ⇥ n) matrix gælder
⇣ ⌘
>
(A v) ·w = v· A w . (15-17)

Bevis

Vi benytter, at skalarproduktet kan udtrykkes ved et matrixprodukt:

(A v) · w = (A v) > · w
⇣ ⌘
= v> A> · w
⇣ ⌘ (15-18)
= v> · A> w
⇣ ⌘
= v · A> w .

Det kan vi nu bruge til at karakterisere symmetriske matricer:

Sætning 15.10
En matrix A er en symmetrisk (n ⇥ n) matrix hvis og kun hvis

(A v) ·w = v· (A w) (15-19)

for alle vektorer v og w i (R n , ·).

Bevis

Hvis A er symmetrisk, så har vi at A = A> og derfor ligning (15.2.19) direkte fra (15.2.17).
Omvendt, hvis vi antager at (15.2.19) gælder for alle v og w, s skal vi vise, at A er symmetrisk.
eNote 15 15.2 SYMMETRISKE MATRICER OG SKALARPRODUKTET 8

Men det følger let ved blot at vlge passende vektorer, f.eks. v = e2 = (0, 1, 0, ..., 0) og w =
e3 = (0, 0, 1, ..., 0) og indsætte i (15.2.19) som nedenfor. Bemærk, at A ei er den i’te søjle-vektor
i A.
(A e2 ) · e3 = a23
= e2 · (A e3 )
(15-20)
= (A e3 ) ·e2
= a32 ,
sådan at a23 = a32 . Helt tilsvarende fås for alle andre valg af indices i og j at aij = a j i – og det
var det vi skulle vise.

En basis a i (R n , ·) består (som bekendt fra eNote 7) af n lineæet uafhængige vektorer


(a1 , ..., an ). Hvis vektorerne derudover er parvis ortogonale og har længden 1 med hen-
syn til det indførte skalarprodukt, s er (a1 , ..., an ) en ortonormal basis for (R n , ·) :

Definition 15.11
En basis a = (a1 , ..., an ) er en ortonormal basis hvis

1 for i = j ,
ai · a j = (15-21)
0 for i 6= j .

Opgave 15.12

Vis, at hvis n vektorer (a1 , ..., an ) i (R n , ·) opfylder ligningen (15.2.21), så er a = (a1 , ..., an ) au-
tomatisk en basis for (R n , ·), dvs. vektorerne er garanteret lineært uafhængige og udspænder
hele (R n , ·).

Opgave 15.13

Vis, at følgende 3 vektorer (a1 , a2 , a3 ) udgør en ortonormal basis a for (R3 , ·) for enhver given
værdi af q 2 R :
a1 = (cos(q ), 0, sin(q ))
a2 = (0, 1, 0) (15-22)
a3 = (sin(q ), 0, cos(q )) .
eNote 15 15.2 SYMMETRISKE MATRICER OG SKALARPRODUKTET 9

Hvis vi sætter vektorerne fra en ortonormal basis ind som søjler i en matrix fås en or-
togonal matrix:

Definition 15.14
En (n ⇥ n) matrix A siges at være ortogonal hvis søjlevektorerne i A udgør en
ortonormal basis for (R n , ·), altså hvis søjlevektorerne er parvis ortogonale og alle
har længden 1 – som også udtrykt i ligning (15.2.21).

Bemærk, at ortogonale matricer alternativt (og måske mere betegnende) kunne


kaldes ortonormale, idet søjlerne i matricen ikke bare er parvis ortogonale men
også normerede, så de alle har længde 1. Vi vil følge international skik og brug
og kalder matricerne ortogonale.

Det er let at checke om en given matrix er ortogonal:

Sætning 15.15
En (n ⇥ n) matrix Q er ortogonal hvis og kun hvis

Q> · Q = En⇥n , (15-23)

som er helt ækvivalent med


1
Q> = Q . (15-24)

Bevis

Se eNote 3 om beregningen af matrixproduktet og sammenlign dernæst med betingelsen for


ortogonalitet af søjlevektorerne i Q (ligning (15.2.21)).

Ortogonale matricer er regulære:


eNote 15 15.3 GRAM–SCHMIDT ORTONORMALISERING 10

Opgave 15.16

Vis, at for at en matrix A kan være ortogonal, så er det en nødvendig betingelse at

| det(A)| = 1 . (15-25)

Vis at den betingelse ikke er tilstrækkelig, altså at der findes matricer, som opfylder denne
determinant-betingelse, men som ikke er ortogonale.

Definition 15.17
En ortogonal matrix Q kaldes positiv ortogonal hvis det(Q) = 1 og den kaldes
negativ ortogonal hvis det(Q) = 1.

Læg mærke til, at determinanten af en ortogonal matrix aldrig er 0, så enhver


ortogonal matrix er enten positiv ortogonal eller negativ ortogonal.

Opgave 15.18

Givet matricen 2 3
0 a 0 a
6 a 0 a 0 7
A=6
4
7 , hvor a 2 R . (15-26)
0 a 0 a 5
a 0 a 0
Bestem de værdier af a for hvilke A er ortogonal og angiv i hvert tilfælde om A er positiv
ortogonal eller negativ ortogonal.

15.3 Gram–Schmidt ortonormalisering

Vi beskriver her en procedure til at bestemme en ortonormal basis i et underrum af


vektorrummet (R n , ·). Lad U være et p dimensionalt underrum af (R n , ·); vi antager,
at U er udspændt af p givne lineært uafhængige vektorer (u1 , · · ·, u p ), som altså derved
udgør en basis u for U. Gram–Schmidt ortonormaliseringen går ud på at konstruere en
eNote 15 15.3 GRAM–SCHMIDT ORTONORMALISERING 11

ny basis v = (v1 , v2 , · · ·, v p ) for underrummet U ud fra den givne basis u sådan at de


nye vektorer v1 , v2 , · · ·, v p er parvis ortogonale og har længden 1.
eNote 15 15.3 GRAM–SCHMIDT ORTONORMALISERING 12

Metode 15.19 Gram–Schmidt ortonormalisering


Gram–Schmidt ortonormalisering af p lineært uafhængige vektorer u1 , · · ·, u p i
(R n , ·):

1. Begynd med at normere u1 og kald resultatet v1 , dvs.:


u1
v1 = . (15-27)
| u1 |

2. Den næste vektor v2 i basen v vælges nu i span{u1 , u2 } men sådan at det


samtidig sikres, at v2 er ortogonal på v1 , altså v2 ·v1 = 0; til sidst normeres.
Først konstrueres en hjælpevektor w2 .

w2 = u2 (u2 · v1 ) v1
w2 (15-28)
v2 = .
|w2 |
Læg mærke til, at w2 (og derfor også v2 ) så er ortogonal på v1 :

w2 · v1 = (u2 (u2 · v1 ) v1 ) · v1
= u2 · v1 (u2 · v1 ) v1 · v1
= u2 · v1 (u2 · v1 ) |v1 |2 (15-29)
= u2 · v1 (u2 · v1 )
=0 .

3. Således fortsættes
wi = ui (ui · v1 ) v1 (ui · v2 ) v2 ··· ( ui · vi 1 ) vi 1
wi (15-30)
vi = .
| wi |

4. Indtil sidste vektor u p er brugt:

wp = up u p · v1 v1 u p · v2 v2 ··· up · vp 1 vp 1
wp (15-31)
vp = .
|w p |

De konstruerede v-vektorer udspænder samme underrum U som de givne lineært


uafhængige u-vektorer, U = span{u1 , · · ·, u p } = span{v1 , · · ·, v p } og v = (v1 , · ·
·, v p ) udgør en ortonormal basis for U.
eNote 15 15.3 GRAM–SCHMIDT ORTONORMALISERING 13

Eksempel 15.20

I (R4 , ·) vil vi ved hjælp af Gram–Schmidt ortonormaliserings-metoden finde en ortonormal


basis v = (v1 , v2 , v3 ) for det 3 dimensionale underrum U, der er udspændt af tre givne
lineært uafhængige (!) vektorer som har følgende koordinater med hensyn til standard e-
basis i R4 :

u1 = (2, 2, 4, 1) , u2 = (0, 0, 5, 5) , u3 = (5, 3, 3, 3) .

Vi konstruerer de nye basisvektorer med hensyn til standard e-basis i R4 ved at gå igen-
nem ortonormaliseringsproceduren. Der er 3 ’step’ da der i dette eksempel er 3 lineært
uafhængige vektorer i U :

1.
u1 1
v1 = = (2, 2, 4, 1) . (15-32)
|u1 | 5

2.
w2 = u2 (u2 · v1 ) v1 = u2 + 5v1 = (2, 2, 1, 4)
w2 1 (15-33)
v2 = = (2, 2, 1, 4) .
| w2 | 5

3.
w3 = u3 (u3 · v1 ) v1 (u3 · v2 ) v2 = u3 5v1 5v2 = (1, 1, 0, 0)
w3 1 (15-34)
v3 = = p (1, 1, 0, 0) .
| w3 | 2

Vi har dermed konstrueret en ortonormal basis for underrummet U bestående af de vektorer,


der med hensyn til den sædvanlige basis har koordinaterne:

1 1 1
v1 = · (2, 2, 4, 1) , v2 = · (2, 2, 1, 4) , v3 = p · (1, 1, 0, 0) .
5 5 2

Vi kan checke, at der virkelig er tale om en ortonormal basis ved at stille vektorerne op som
søjler i en matrix, som dermed får typen (4 ⇥ 3) således :
2 p 3
2/5 2/5 1/p2
6 7
6 2/5 2/5 1/ 2 7
V=6 7 (15-35)
4 4/5 1/5 0 5
1/5 4/5 0

Matricen V kan ikke være en ortogonal matrix (på grund af typen), men alligevel kan V til-
fredsstille følgende ligning, som viser, at de tre nye basisvektorer netop er parvis ortogonale
eNote 15 15.4 DET ORTOGONALE KOMPLEMENT TIL ET UNDERRUM 14

og alle har længden 1 !


2 p 3
2 3 2/5 2/5 1/p2
2/5 2/5 4/5 1/5 6 7
> 6 2/5 2/5 1/ 2 7
V ·V = 4 2/5
p 2/5
p 1/5 4/5 5 · 6 7
4 4/5 1/5 0 5
1/ 2 1/ 2 0 0
1/5 4/5 0 (15-36)
2 3
1 0 0
=4 0 1 0 5 .
0 0 1

Opgave 15.21

I (R4 , ·) er givet følgende vektorer med hensyn til den sædvanlige basis e:

u1 = (1, 1, 1, 1) , u2 = (3, 1, 1, 3) , u3 = (2, 0, 2, 4) , u4 = (1, 1, 1, 3) .

Vi lader U betegne det underrum i (R4 , ·), som er udspændt af de fire givne vektorer, altså

U = span{u1 , u2 , u3 , u4 } . (15-37)

1. Vis, at u = (u1 , u2 , u3 ) er en basis for U, og find koordinaterne for u4 med hensyn til
denne basis.

2. Angiv en ortonormal basis for U.

Eksempel 15.22

I (R3 , ·) kræves en given første enheds-vektor v1 benyttet til en ny ortonormal basis v=


(v1 , v2 , v3 ) og opgaven er at finde de to andre vektorer til basen. Lad os antage at den givne
vektor er v1 = (3, 0, 4)/5. Det ses umiddelbart, at f.eks. v2 = (0, 1, 0) er en enhedsvektor, der
er ortogonal på v1 . En sidste vektor til den ortonormale basis kan så findes direkte ved brug
af krydsproduktet: v3 = v1 ⇥ v2 = 15 · ( 4, 0, 3).

15.4 Det ortogonale komplement til et underrum

Lad U være et underrum i (R n , ·), som er udspændt af p givne lineært uafhængige


vektorer, U = span{u1 , u2 , · · ·, u p }. Mængden af de vektorer i (R n , ·) som hver for sig er
eNote 15 15.4 DET ORTOGONALE KOMPLEMENT TIL ET UNDERRUM 15

ortogonal på samtlige vektorer i U er selv et underrum i (R n , ·), og det har dimensionen


n p:

Definition 15.23
Det ortogonale komplement til et underrum U i (R n , ·) betegnes med U ? og består
af alle vektorer i (R n , ·) som er ortogonale på hver eneste vektor i U:

U ? = {x 2 R n | x · u = 0 , for alle u 2 U } . (15-38)

Sætning 15.24
Det ortogonale komplement U ? til et givet p dimensionalt underrum U i (R n , ·)
er selv et underrum i (R n , ·) og det har dimensionen dim(U ? ) = n p .

Bevis

Det er let at checke alle underrums-egenskaberne for U ? ; det er klart, at hvis a og b er ortog-
onale på alle vektorerne i U og k er et reelt tal, så er a + kb også ortogonal på alle vektorerne
i U. Da den eneste vektor, der er ortogonal på sig selv er 0 er dette også den eneste vektor i
fællesmængden: U \ U ? = {0}. Hvis vi lader v= (v1 , · · ·, v p ) betegne en ortonormal basis for
U og w= (w1 , · · ·, wr ) en ortonormal basis for U ? , så er (v1 , · · ·, v p , w1 , · · ·, wr ) en ortonormal
basis for underrummet S = span{v1 , · · ·, v p , w1 , · · ·, wr } i (R n , ·). Hvis vi nu antager, at S
ikke er hele (R n , ·), så kan basen for S udvides med mindst én vektor så det udvidede system
er lineært uafhængig i (R n , ·); dermed får vi - ved at bruge det sidste step i Gram–Schmidt
metoden - en ny vektor, som er ortogonal på alle vektorer i U men som ikke er element i
U ? ; og det er en modstrid, fordi U ? er defineret til at være alle de vektorer i (R n , ·), som er
ortogonal på hver enkelt vektor i U. Derfor er antagelsen om, at S ikke er hele (R n , ·) forkert.
Det vil sige, at S = R n og derfor er r + p = n, sådan at dim(U ? ) = r = n p; og det var det
vi skulle vise.


eNote 15 15.5 SPEKTRALSÆTNINGEN FOR SYMMETRISKE MATRICER 16

Eksempel 15.25

Det ortogonale komplement til U = span{a, b} i R3 (for lineært uafhængige vektorer – og


derfor egentlige vektorer – a og b) er U ? = span{a ⇥ b}.

Opgave 15.26

Bestem det ortogonale komplement til underrummet U = span{u1 , u2 , u3 } i (R4 , ·), når de
udspændende vektorer er givet ved deres respektive koordinater med hensyn til den sæd-
vanlige basis e i R4 således:

u1 = (1, 1, 1, 1) , u2 = (3, 1, 1, 3) , u3 = (2, 0, 2, 4) . (15-39)

15.5 Spektralsætningen for symmetriske matricer

Vi vil nu tage fat på at formulere spektralsætningen og begynder med følgende ikke-


trivielle observation om symmetriske matricer:

Sætning 15.27
Lad A betegne en symmetrisk (n ⇥ n) matrix. Så har det karakteristiske poly-
nomium KA (l) for A præcis n reelle rødder (regnet med multiplicitet):

l1 l2 ··· ln . (15-40)

Dvs. A har n reelle egenværdier (regnet med multiplicitet).

Hvis f.eks. {7, 3, 3, 2, 2, 2, 1} er rødderne i KA (l) for en (7 ⇥ 7) matrix A,


så skal disse rødder altså repræsenteres med deres respektive multiplicitet i
egenværdi-listen:

l1 = 7 l2 = 3 l3 = 3 l4 = 2 l5 = 2 l6 = 2 l7 = 1 .

Da sætning 15.27 udtrykker en helt afgørende egenskab ved symmetriske matricer, vil
vi her give et bevis for den:
eNote 15 15.5 SPEKTRALSÆTNINGEN FOR SYMMETRISKE MATRICER 17

Bevis

Fra algebraens fundamentalsætning ved vi, at KA (l) har præcis n komplekse rødder - vi ved
bare ikke om de er reelle; det er det vi skal vise. Så vi lader a + i b være en kompleks rod i
KA (l) og skal så vise, at b = 0. Læg mærke til, at a og b naturligvis begge er reelle tal.

Vi har altså
det (A ( a + i b )E) = 0 , (15-41)
og derfor også, at
det (A (a + i b)E) · det (A (a i b )E) = 0 (15-42)
sådan at
det ((A (a + i b)E) · (A (a i b)E)) = 0
⇣ ⌘ (15-43)
det (A a E)2 + b2 E = 0 .
⇣ ⌘
Den sidste ligning giver, at rangen af den reelle matrix (A a E)2 + b2 E er mindre end
n; det medfører nu (se eNote 2), at der findes egentlige reelle løsninger x til det tilsvarende
ligningssystem ⇣ ⌘
(A a E)2 + b2 E x = 0 . (15-44)

Lad os vælge sådan en egentlig reel løsning v til (15.5.44) med |v| > 0. Ved at benytte, at A
antages at være symmetrisk har vi så:
⇣⇣ ⌘ ⌘
0= (A a E)2 + b2 E v · v
⇣ ⌘
2
= (A a E) v · v + b2 (v · v)
(15-45)
2 2
= ((A a E) v) · ((A a E) v) + b |v|
= | (A a E) v|2 + b2 |v|2 ,

men da |v| > 0 så må vi konkludere, at b = 0, fordi ellers kan det sidste udtryk i ovenstående
omskrivninger ikke være 0; og det var det vi skulle vise.

Opgave 15.28

Hvor var det så lige, at vi faktisk brugte symmetrien af A i ovenstående bevis?


eNote 15 15.5 SPEKTRALSÆTNINGEN FOR SYMMETRISKE MATRICER 18

Til hver egenværdi li for en given matrix A hører et egenvektorrum Eli , som
er et større eller mindre underrum i (R n , ·). Hvis to eller flere egenværdier for
en given matrix er ens, dvs. hvis der er tale om en multipel (f.eks. k gange) rod
li = li+1 = · · ·li+k 1 i det karakteristiske polynomium, så er de tilhørende
egenvektorrum selvfølgelig også ens: Eli = Eli+1 = · · · Eli+k 1 . Vi vil se neden-
for i sætning 15.30 at for symmetriske matricer er dimensionen af det fælles
egenvektorrum Eli præcis lig med den algebraiske multiplicitet k af egenvær-
dien li .

Hvis to egenværdier li og l j for en symmetrisk matrix er forskellige, så er de to tilhørende


egenvektorrum ortogonale, Eli ? El j i følgende forstand:

Sætning 15.29
Lad A være en symmetrisk matrix og lad l1 og l2 være to forskellige egenværdier
for A og lad v1 og v2 betegne to tilhørende egenvektorer. Så er v1 · v2 = 0, dvs. de
er ortogonale.

Bevis

Da A er symmetrisk har vi fra (15.2.19):

0 = (Av1 ) ·v2 v1 · (Av2 )


= l1 v1 ·v2 v1 · (l2 v2 )
(15-46)
= l1 v1 ·v2 l2 v1 ·v2
= ( l1 l 2 ) v1 · v2 ,

og da l1 6= l2 får vi derfor følgende konklusion: v1 ·v2 = 0, og det var det, vi skulle vise.

Vi kan nu formulere en af de oftest anvendte resultater for symmetriske matricer, spek-


tralsætningen for symmetriske matricer, som af gode grunde også kaldes sætningen
om diagonalisering af symmetriske matricer:
eNote 15 15.5 SPEKTRALSÆTNINGEN FOR SYMMETRISKE MATRICER 19

Sætning 15.30
Lad A betegne en symmetrisk (n ⇥ n) matrix. Så findes der en positiv ortogonal
matrix Q således at
1
L=Q AQ = Q> AQ er en diagonal-matrix . (15-47)

Det vil sige, at en reel symmetrisk matrix kan diagonaliseres ved en positiv ortogonal
substitution, dvs. en simulartransformation (se eNote 14) hvor den diagonaliserende
matrix er positiv ortogonal.

Det er muligt at konstruere diagonalmatricen simpelt ud fra de n reelle egenværdier


l1 l2 · · · ln for A således:
2 3
l1 0 · 0
6 0 l2 · 0 7
L = diag(l1 , l2 , ..., ln ) = 6
4 ·
7. (15-48)
· · · 5
0 0 · ln

Husk: En symmetrisk matrix har præcis n reelle egenværdier når vi tæller dem med
multiplicitet.

Den positive ortogonale matrix Q konstrueres ved som søjler i matricen at bruge
egenvektorer fra de tilhørende egenvektor-rum El1 , El2 , · · ·, Eln i den rigtige række-
følge:
Q = [v1 v2 · · · vn ] , (15-49)
hvor v1 2 El1 , v2 2 El2 , · · ·, vn 2 Eln , idet valget af egenvektorer i de respektive
egenvektorrum foretages således at

1. De valgte egenvektorer hørende til samme egenværdi er ortogonale (brug


Gram–Schmidt ortonormalisering i hvert fælles egenvektorrum)

2. De valgte egenvektorer har alle længden 1 (ellers skal de bare normeres)

3. Den resulterende matrix Q er positiv ortogonal (hvis den ikke er det, så skift
fortegn på én af de valgte egenvektorer)

At dette kan lade sig gøre følger af de ovenstående resultater og bemærkninger – vi


gennemgår en række konstruktive eksempler nedenfor.
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 20

15.6 Eksempler på diagonalisering

Her er nogle typiske eksempler der viser, hvordan man diagonaliserer passende små
symmetriske matricer, dvs. symmetriske matricer af type (2 ⇥ 2) eller type (3 ⇥ 3):

Eksempel 15.31 Diagonalisering ved ortogonal substitution

En symmetrisk (3 ⇥ 3) matrix A er givet således:


2 3
2 2 1
A= 4 2 5 2 5 . (15-50)
1 2 2

Vi vil bestemme en positiv ortogonal matrix Q således at Q 1 AQ er en diagonalmatrix:


1
Q AQ = Q> AQ = L . (15-51)

Først bestemmes egenværdierne for A: Det karakteristiske polynomium for A er


02 31
2 l 2 1
KA (l) = det @4 2 5 l 2 5 A = ( l 1)2 · (7 l ) , (15-52)
1 2 2 l

så A har egenværdierne l1 = 7, l2 = 1, og l3 = 1. Dermed ved vi allerede nu via sætning


15.30, at det er muligt at konstruere en positiv ortogonal matrix Q således at
2 3
7 0 0
Q 1 AQ = diag(7, 1, 1) = 4 0 1 0 5 . (15-53)
0 0 1

Resten af opgaven består nu i at finde de egenvektorer for A der kan bruges som søjler i den
ortogonale matrix Q.

Egenvektorerne for A hørende til egenværdien l1 = 7 fås ved at løse det homogene lign-
ingssystem, der har koefficientmatricen
2 3
5 2 1
KA (7) = A 7E = 4 2 2 2 5 , (15-54)
1 2 5

som med passende rækkeoperationer ses at have


2 3
1 0 1
trap(KA (7)) = 4 0 1 2 5 . (15-55)
0 0 0
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 21

Egenvektor-løsningerne til det tilsvarende homogene ligningssystem aflæses til


u = t · (1, 2, 1) , t2R , (15-56)
p
sådan at E7 = span{(1, 2, 1)}. Den normerede egenvektor v1 = (1/ 6) · (1, 2, 1) er derfor
en ortonormal basis for E7 (og den kan altså bruges som første søjle vektor i den søgte Q:
2 p 3
1/p6 ⇤ ⇤
6 7
Q = 4 2/p6 ⇤ ⇤ 5 . (15-57)
1/ 6 ⇤ ⇤
Vi ved fra sætning 15.30, at de to resterende søjler fås ved tilsvarende at finde alle egen-
vektorerne E1 hærende til egenværdien l2 = l3 = 1 og dernæst udvælge to ortonormale
egenvektorer fra E1 .

Reduktionsmatricen hørende til egenværdien 1 er


2 3
1 2 1
KA (1) = A E = 4 2 4 2 5 , (15-58)
1 2 1
som igen via passende rækkeoperationer ses at have
2 3
1 2 1
trap(KA (1)) = 4 0 0 0 5 . (15-59)
0 0 0
Egenvektor-løsningerne til det tilsvarende homogene ligningssystem aflæses til
u = t1 · (2, 1, 0) + t2 · ( 1, 0, 1) , t1 2 R , t2 2 R , (15-60)
sådan at E1 = span{( 1, 0, 1), (2, 1, 0)}.

Vi finder en ortonormal basis for E1 ved hjælp af Gram–Schmidt ortonormalisering af


span{( 1, 0, 1), (2, 1, 0)} således: Da vi allerede har defineret v1 sætter vi v2 til at være
( 1, 0, 1) p
v2 = = (1/ 2) · ( 1, 0, 1) , (15-61)
|( 1, 0, 1)|
og dernæst, som i Gram–Schmidt proceduren:
w3 = (2, 1, 0) ((2, 1, 0) · v2 ) · v2 = (1, 1, 1) . (15-62)
p
Ved normering får vi derved endelig v3 = (1/ 3) · (1, 1, 1) og dermed har vi alle ingredi-
enserne til den søgte ortogonale matrix Q:
2 p p p 3
1/p6 1/ 2 1/p3
6 7
Q = [v1 v2 v3 ] = 4 2/ 6
p p0 1/p3 5 . (15-63)
1/ 6 1/ 2 1/ 3
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 22

Det skal til sidst undersøges, om de valgte egenvektorer giver en positiv ortogonal matrix.
Da 02 31
1 1 1
det @4 2 0 1 5A = 6 < 0 , (15-64)
1 1 1
er Q negativ ortogonal. En positiv ortogonal matrix fås ved at skifte fortegn på en af søjlerne
i Q, eksempelvis den sidste. Bemærk, at en vektor v er en egenvektor for A hvis og kun hvis
v også er en egenvektor for A. Vi har altså, at
2 p p p 3
1/p6 1/ 2 1/p3
6 7
Q = v1 v2 ( v3 ) = 4 2/ 6 p0 1/p3 5 (15-65)
p
1/ 6 1/ 2 1/ 3

er en positiv ortogonal matrix, der diagonaliserer A.

Det eftervises ved en direkte udregning:


1
Q AQ = Q> AQ
2 p p p 3 2 3 2 p p p 3
1/p6 2/ 6 1/p6 2 2 1 1/p6 1/ 2 1/p3
6 7 6 7
= 4 1/p2 p0 1/p2 5 · 4 2 5 2 5·4 2/p6 p0 1/p3 5
1/ 3 1/ 3 1/ 3 1 2 3 1/ 6 1/ 2 1/ 3
2 3
7 0 0
=4 0 1 0 5 ,
0 0 1
(15-66)
så pengene passer.

Vi skal også til slut lige bemærke her, at i stedet for at bruge Gram–Schmidt ortonormalisering
til bestemmelse af v3 kunne vi have brugt krydsproduktet v1 ⇥ v2 (se 15.22):
p
v3 = v1 ⇥ v2 = (1/ 3) · ( 1, 1, 1) . (15-67)
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 23

Eksempel 15.32 Diagonalisering ved ortogonal substitution

En symmetrisk (2 ⇥ 2) matrix A er givet således:



11 12
A= . (15-68)
12 4

Vi vil bestemme en positiv ortogonal matrix Q således at Q 1 AQ er en diagonalmatrix:


1
Q AQ = Q> AQ = L . (15-69)

Først bestemmes egenværdierne for A: Det karakteristiske polynomium for A er


✓ ◆
11 l 12
KA (l) = det = (l 20) · (l + 5) , (15-70)
12 4 l

så A har egenværdierne l1 = 20 og l2 = 5. Dermed har vi nu:



20 0
L= . (15-71)
0 5

Egenvektorerne for A hørende til egenværdien l1 = 20 fås ved at løse det homogene lign-
ingssystem, der har koefficientmatricen

9 12
KA (20) = A 20E = , (15-72)
12 16

som med passende rækkeoperationer ses at have den ækvivalente trappe-matrix:



3 4
trap(KA (20)) = . (15-73)
0 0

Egenvektor-løsningerne til det tilsvarende homogene ligningssystem aflæses til

u = t · (4, 3) , t2R , (15-74)

sådan at E20 = span{(4, 3)}. Den normerede egenvektor v1 = (1/5) · (4, 3) er derfor en
ortonormal basis for E20 (og den kan altså bruges som første søjle vektor i den søgte Q:

4/5 ⇤
Q= . (15-75)
3/5 ⇤

Den sidste søjle i Q er en egenvektor hørende til den anden egenværdi l2 = 5 og kan
derfor findes ud fra den totale løsningsmængde E 5 til det homogene ligningssystem, der
har koefficientmatricen

16 12
KA ( 5) = A 5 · E = , (15-76)
12 9
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 24

men da vi jo ved, at den søgte egenvektor er ortogonal på egenvektoren v1 , kan vi umid-


delbart blot bruge tværvektoren, v2 = (1/5) · (3, 4), som klart er en enhedsvektor, der er
ortogonal på v1 . Det er let at checke, at v2 er en egenvektor for A hørende til egenværdien
5:   
16 12 3 0
KA ( 5) · v2 = · = . (15-77)
12 9 4 0
Vi indsætter derfor v2 som anden søjle i Q og får

4/5 3/5
Q= . (15-78)
3/5 4/5

Denne matrix har determinanten det (Q) = 1 > 0, så Q er en positiv ortogonal substitution-
smatrix, der opfylder at Q 1 AQ er en diagonalmatrix:
1
Q AQ = Q> AQ
  
4/5 3/5 11 12 4/5 3/5
= · ·
3/5 4/5 12 4 3/5 4/5
 (15-79)
20 0
=
0 5
= diag(20, 5) = L .

Eksempel 15.33 Diagonalisering ved ortogonal substitution

En symmetrisk (3 ⇥ 3) matrix A er givet således:


2 3
7 2 0
A= 4 2 6 2 5 . (15-80)
0 2 5
Vi vil bestemme en positiv ortogonal matrix Q således at Q 1 AQ er en diagonalmatrix:
1 >
Q AQ = Q AQ = L . (15-81)
Først bestemmes egenværdierne for A: Det karakteristiske polynomium for A er
02 31
7 l 2 1
KA (l) = det @4 2 6 l 2 5 A = ( l 3) · ( l 6) · ( l 9) , (15-82)
1 2 5 l
hvoraf vi aflæser de tre forskellige egenværdier l1 = 9, l2 = 6, og l3 = 3 og dermed den
diagonalmatrix vi på vej til at kunne skrive som Q 1 AQ :
2 3
9 0 0
L = diag(9, 6, 3) = 4 0 6 0 5 (15-83)
0 0 3
eNote 15 15.6 EKSEMPLER PÅ DIAGONALISERING 25

Egenvektorerne for A hørende til egenværdien l3 = 3 fås ved at løse det homogene lign-
ingssystem, der har koefficientmatricen
2 3
4 2 0
KA (3) = A 3 · E = 4 2 3 2 5 , (15-84)
0 2 2
som med passende rækkeoperationer ses at have
2 3
2 0 1
trap(KA (3)) = 4 0 1 1 5 . (15-85)
0 0 0
Egenvektor-løsningerne til det tilsvarende homogene ligningssystem aflæses til
u3 = t · (1, 2, 2) , t2R , (15-86)
sådan at E3 = span{(1, 2, 2)}. Den normerede egenvektor v1 = (1/3) · (1, 2, 2) er derfor
en ortonormal basis for E3 og den kan altså bruges som tredje søjle vektor i den søgte Q; be-
mærk nemlig, at vi netop har fundet egenvektorrummet til den tredje egenværdi på listen over
egenværdier for A :
2 3
⇤ ⇤ 1/3
Q = 4 ⇤ ⇤ 2/3 5 . (15-87)
⇤ ⇤ 2/3
Vi ved fra sætning 15.30, at de to resterende søjler fås ved tilsvarende at finde egenvek-
torrummene E6 hørende til egenværdien l2 = 6, og egenvektorrummet E9 hørende til
egenværdien l1 = 9.

For l2 = 6 har vi: 2 3


1 2 0
KA (6) = A 6·E = 4 2 0 2 5 , (15-88)
0 2 1
som med passende rækkeoperationer ses at have følgende ækvivalente trappematrix:
2 3
1 0 1
trap(KA (6)) = 4 0 2 1 5 . (15-89)
0 0 0
Egenvektor-løsningerne til det tilsvarende homogene ligningssystem aflæses til
u2 = t · ( 2, 1, 2) , t2R , (15-90)
sådan at E6 = span{( 2, 1, 2)}. Den normerede egenvektor v2 = (1/3) · ( 2, 1, 2) er
derfor en ortonormal basis for E6 (og den kan altså bruges som anden søjle vektor i den søgte
Q: 2 3
⇤ 2/3 1/3
Q=4 ⇤ 1/3 2/3 5 . (15-91)
⇤ 2/3 2/3
eNote 15 15.7 KONTROLLERET KONSTRUKTION AF SYMMETRISKE MATRICER 26

I stedet for på samme måde at bestemme egenvektorrummet E9 for den resterende egenværdi
l1 = 9 benytter vi, at det egenvektorrum er udspændt af en vektor v1 , der er ortogonal på
både v3 og v2 , altså kan vi bruge v1 = v2 ⇥ v3 = (1/3) · ( 2, 2, 1), således at vi dermed
endelig har
2 3
2/3 2/3 1/3
Q = 4 2/3 1/3 2/3 5 . (15-92)
1/3 2/3 2/3
Denne matrix er positiv ortogonal fordi det(Q) = 1 > 0, og dermed har vi bestemt en positiv
ortogonal matrix Q, der diagonaliserer A til diagonalmatricen L. Det eftervises også let ved
en direkte udregning:
1
Q AQ = Q> AQ
2 3 2 3 2 3
2/3 2/3 1/3 7 2 0 2/3 2/3 1/3
= 4 2/3 1/3 2/3 5 · 4 2 6 2 5·4 2/3 1/3 2/3 5
1/3 2/3 2/3 0 2 5 1/3 2/3 2/3
2 3 (15-93)
9 0 0
=4 0 6 0 5
0 0 3
= diag(9, 6, 3) = L .

15.7 Kontrolleret konstruktion af symmetriske matricer

I lyset af ovenstående eksempler er det klart, at hvis vi blot kan konstruere alle ortogo-
nale (2 ⇥ 2)- og (3 ⇥ 3)-matricer Q (eller for den sags skyld (n ⇥ n)-matricer), så kan vi
konstruere alle symmetriske (2 ⇥ 2)- og (3 ⇥ 3)-matricer A på formen A = Q · L · Q> . Vi
skal blot vælge de ønskede egenværdier i diagonalen for L.

Enhver positiv ortogonal 2 ⇥ 2-matrix har følgende form, som viser at den er en rotation,
en drejning, givet ved en rotations-vinkel j :

cos( j) sin( j)
Q= , (15-94)
sin( j) cos( j)

hvor j er en vinkel i intervallet [ p, p ]. Bemærk, at søjlevektorerne er ortogonale og


begge har længden 1. Derudover er determinanten det(Q) = 1, så Q er positiv ortogo-
nal.
eNote 15 15.7 KONTROLLERET KONSTRUKTION AF SYMMETRISKE MATRICER 27

Opgave 15.34

Bevis påstanden om, at enhver positiv ortogonal matrix kan fremstilles på formen (15.7.94)
for et passende valg af drejningsvinkel j.

Hvis j > 0 så roterer eller drejer Q vektorer i positiv omløbsretning, altså imod uret;
hvis j < 0 så drejer Q vektorer i negativ omløbsretning, altså med uret.

Definition 15.35 Drejnings-matricer


Enhver positiv ortogonal (2 ⇥ 2)-matrix kaldes også en drejnings-matrix.

Da enhver positiv ortogonal 3 ⇥ 3-matrix tilsvarende kan fremstilles ved et produkt af


rotationer omkring de tre koordinatakser – se nedenfor – vil vi udvide navngivningen
som følger:

Definition 15.36 Rotations-matricer


Enhver positiv ortogonal (3 ⇥ 3)-matrix kaldes en rotations-matrix.

En koordinatakse-rotation, dvs. en rotation med en given vinkel om en af koordinatak-


serne, er givet ved en af følgende positive ortogonale matricer:
2 3
1 0 0
Rx (u) = 4 0 cos(u) sin(u) 5
0 sin(u) cos(u)

2 3
cos(v) 0 sin(v)
Ry ( v ) = 4 0 1 0 5 (15-95)
sin(v) 0 cos(v)

2 3
cos(w) sin(w) 0
4
Rz (w) = sin(w) cos(w) 0 5 ,
0 0 1
eNote 15 15.7 KONTROLLERET KONSTRUKTION AF SYMMETRISKE MATRICER 28

hvor de respektive rotationsvinkler er henholdsvis u, v, og w.

Opgave 15.37

Vis ved direkte udregninger, at de tre akserotationsmatricer og ethvert produkt af aksero-


tationsmatricer virkelig er positive ortogonale matricer, dvs. de opfylder R 1 = R> og
det(R) = 1.

Opgave 15.38

Find billedvektorerne af hver af de angivne vektorer a, b, og c ved brug af de givne afbild-


ningsmatricer Qi :

Q1 = Rx (p/4) , a = (1, 0, 0), b = (0, 1, 0), c = (0, 0, 1)


Q2 = Ry (p/4) , a = (1, 1, 1), b = (0, 1, 0), c = (0, 0, 1)
Q3 = Rz (p/4) , a = (1, 1, 0), b = (0, 1, 0), c = (0, 0, 1) (15-96)
Q4 = Ry (p/4) · Rx (p/4) , a = (1, 0, 0), b = (0, 1, 0), c = (0, 0, 1)
Q5 = Rx (p/4) · Ry (p/4) , a = (1, 0, 0), b = (0, 1, 0), c = (0, 0, 1) .

Sammensætning af rotationer om koordinatakserne med givne drejningsvinkler u, v, og


w om henholdsvis x aksen, y aksen, og z aksen fås ved at finde matrixproduktet af
de tre tilsvarende rotationsmatricer.

Her er det helt generelle udtryk for det matrixprodukt for alle værdier af u, v og w:

R(u, v, w) = Rz (w) · Ry (v) · Rx (u)

2 3
cos(w) cos(v) sin(w) cos(u) cos(w) sin(v) sin(u) sin(w) sin(u) cos(w) sin(v) cos(u)
4
= sin(w) cos(v) cos(w) cos(u) sin(w) sin(v) sin(u) cos(w) sin(u) sin(w) sin(v) cos(u) 5 .
sin(v) cos(v) sin(u) cos(v) cos(u)

Der gælder som antydet følgende sætning:


eNote 15 15.7 KONTROLLERET KONSTRUKTION AF SYMMETRISKE MATRICER 29

Sætning 15.39 Akse-rotationsvinkler for en given rotationsmatrix


Enhver rotationsmatrix R (dvs. enhver positiv ortogonal matrix Q) kan skrives som
et produkt af 3 akserotationsmatricer:

R = R(u, v, w) = Rz (w) · Ry (v) · Rx (u) . (15-97)

Med andre ord: Virkningen af enhver rotationsmatrix kan realiseres ved tre på hi-
nanden følgende rotationer om koordinatakserne – med drejningsvinklerne hen-
holdsvis u, v, og w som i ovenstående matrix-produkt.

Når en givet positiv ortogonal matrix R er givet (med sine matrix-elementer


rij ), er det ikke svært at finde disse akserotations-vinkler. Som det fremgår af
matrixproduktet ovenfor er f.eks. sin(v) = r31 sådan at v = arcsin(r31 ) eller
v = p arcsin(r31 ), og cos(w) cos(v) = r11 sådan at w = arccos(r11 / cos(v))
eller v = arccos(r31 / cos(v)), når blot cos(v) 6= 0 dvs. når blot v 6= ±p/2.

Opgave 15.40

Vis, at hvis v = p/2 eller v = p/2, så er der mange værdier af u og w som giver den
samme R(u, v, w). Det vil sige, at vinkelværdierne ikke i alle tilfælde er entydigt bestemte i
intervallet ] p, p ] for enhver givet rotationsmatrix R.

Opgave 15.41

Vis, at hvis R er en rotationsmatrix (en positiv ortogonal matrix), så er R> også en rotations-
matrix, og omvendt: hvis R> er en rotationsmatrix, så er R også en rotationsmatrix.

Opgave 15.42

Vis, at hvis R1 og R2 er rotationsmatricer, så er R1 · R2 og R2 · R1 også rotationsmatricer. Giv


eksempler på, at R1 · R2 ikke nødvendigvis er den samme rotationsmatrix som R2 · R1 .
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 30

15.8 Reduktion af andengradspolynomier

En kvadratisk form i (R n , ·) er et andengrads-polynomium i n variable – men uden


førstegrads- og konstant-led.

Definition 15.43
Lad A være en symmetrisk (n ⇥ n)-matrix og lad ( x1 , x2 , · · · , xn ) betegne koor-
dinaterne for en vilkårlig vektor x i (R, ·) med hensyn til den sædvanlige basis e i R n .

En kvadratisk form i (R, ·) er en funktion af de n variable ( x1 , x2 , · · · , xn ) på føl-


gende form:
2 3
x1
6 x2 7
⇥ ⇤ 6 7
PA (x) = PA ( x1 , x2 , · · · , xn ) = x1 x2 · · x n ·A·6
6 · 7
7
4 · 5
(15-98)
xn
n n
= ÂÂ aij · xi · x j ,
i =1 j =1

hvor aij er de enkelte elementer i A.

Eksempel 15.44 Kvadratisk form som del af andengradspolynomium

Lad f ( x, y) betegne følgende andengradspolynomium i de to variable x og y.


f ( x, y) = 11 · x2 + 4 · y2 24 · x · y 20 · x + 40 · y 60 . (15-99)
Så kan vi opdele polynomiet i to dele:
f ( x, y) = PA ( x, y) + ( 20 · x + 40 · y 60) , (15-100)
hvor PA ( x, y) er den kvadratiske form
PA ( x, y) = 11 · x2 + 4 · y2 24 · x · y (15-101)
som repræsenteres ved matricen

11 12
A= (15-102)
12 4
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 31

Vi vil nu se, hvordan spektralsætningen kan bruges til at skrive enhver kvadratisk
form på kort form ved hjælp af egenværdierne for den matrix, der repræsenterer den
kvadratiske form.

Sætning 15.45 Reduktion af kvadratisk form


Lad A være en symmetrisk matrix og lad PA ( x1 , · · · , xn ) betegne den tilhørende
kvadratiske form i (R n , ·) med hensyn til de sædvanlige koordinater. Ved basisskift
til nye koordinater xe1 , · · · , xen givet ved den positive ortogonale basisskiftematrix Q
som diagonaliserer A fås det reducerede udtryk for den kvadratiske form:

PA ( x1 , · · · , xn ) = PeL ( xe1 , · · · , xen ) = l1 · xe12 + · · · + ln · xen2 , (15-103)

hvor l1 , · · · , ln er de n reelle egenværdier for den symmetriske matrix A.

Reduktionen i sætningen består i, at det nye udtryk ikke indeholder noget pro-
duktled af typen xi · x j for i 6= j.

Bevis

Da A er symmetrisk kan den ifølge spektralsætningen diagonaliseres ved en ortogonal


substitutionsmatrix Q. Samlingen af søjlevektorer (v1 , · · · , vn ) i Q udgør en ny basis v i
(R n , ·).

Lad x være en vilkårlig vektor i R n . Så har vi følgende koordinatsæt for x, dels med hensyn
til den sædvanlige standard e-basis og dels med hensyn til den nye basis v

ex = ( x1 , · · · , x n ) ,
(15-104)
vx = ( xe1 , · · · , xen ) .
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 32

Så er
PA (x) = PA ( x1 , · · · , xn )
2
3
x1
⇥ ⇤ 6 · 7
= x1 · · · xn · A · 6
4 · 5
7

xn
3 2
x1
⇥ ⇤ 6 · 7
= x1 · · · x n · Q · L · Q 1 · 6
4 · 5
7

xn
0 2 31
x1
⇥ ⇤ B > 6 · 7C
= x1 · · · x n · Q · L · B 6 7C
@Q · 4 · 5 A
(15-105)
xn
2 3
xe1
⇥ ⇤ 6 · 7
= xe1 · · · xen · L · 6
4 · 5
7

xen
2 3 2 3
l1 0 · · · 0 xe1
6
⇤ 6 0 l2 · · · 7 6
0
⇥ 7 6 · 7 7
= xe1 · · · xen · 6 . .. . . 7·4
..
4 .. . . 5 . · 5
0 0 . . . ln xen

= PeL ( xe1 , · · · , xen ) = l1 · xe12 + · · · + ln · xen2 .

Læg mærke til, at den matrix, der repræsenterer den kvadratiske form i ek-
sempel 15.44, ligning (15.8.102), ikke er meget forskellig fra Hesse-matricen
H f ( x, y) for f ( x, y), som jo også er en konstant matrix, fordi f ( x, y) er et anden-
gradspolynomium. Se eNote 18. Faktisk observerer vi, at:

1
A= · H f ( x, y) , (15-106)
2
og det er ikke nogen tilfældighed.
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 33

Hjælpesætning 15.46
Lad f ( x1 , x2 , · · · , xn ) betegne et vilkårligt andengrads-polynomium uden
førstegrads- og konstant-led. Så kan f ( x1 , x2 , · · · , xn ) udtrykkes som en kvad-
ratisk form på netop én måde – dvs. der findes netop én symmetrisk matrix A
sådan at:
f (x) = f ( x1 , x2 , · · · , xn ) = PA ( x1 , x2 , · · · , xn ) . (15-107)
Den søgte matrix er:
1
· H f (x) ,
A= (15-108)
2
hvor H f (x) er (den konstante) Hesse-matrix for funktionen f (x) = f ( x1 , x2 , · · · , xn ).

Bevis

Vi nøjes her med tilfældet n = 2 og refererer til analysen af funktioner af to variable i eNote
18: Hvis f ( x, y) er et polynomium i to variable uden førstegrads- (og konstant-)led, altså en
kvadratisk form i (R2 , ·), s er den søgte A-matrix lige præcis (den konstante) Hesse-matrix
for f ( x, y).

Det gælder generelt, hvis vi udvider definitionen af Hesse-matricer til funktioner af


flere variable således: Lad f ( x1 , x2 , · · · , xn ) være en vilkårlig glat funktion af n variable
i den oplagte betydning for funktioner af flere variable (end to). Så er de tilsvarende
Hesse-matricer følgende symmetriske (n ⇥ n)-matricer som indeholder alle de partielle
afledede af anden orden for funktionen f (x) evalueret i et vilkårligt punkt x 2 R n :

2 3
f x001 x1 (x) f x001 x2 (x) · · · f x001 xn (x)
6 f x002 x1 (x) f x002 x2 (x) · · · f x002 xn (x) 7
6 7
H f ( x1 , x2 , · · · , x n ) = 6 .. .. .. .. 7 . (15-109)
4 . . . . 5
f x00n x1 (x) f x00n x2 (x) . . . f x00n xn (x)
Specielt, hvis f ( x, y, z) er en glat funktion af tre variable (som i nedenstående eksempel
15.47) fs i ethvert punkt ( x, y, z) 2 R3 :
2 3
00 ( x, y, z ) f 00 ( x, y, z ) f 00 ( x, y, z )
f xx xy xz
6 00 00 ( x, y, z ) f 00 ( x, y, z ) 7
H f ( x, y, z) = 4 f xy ( x, y, z) f yy yz 5 , (15-110)
00 00 00
f xz ( x, y, z) f yz ( x, y, z) f zz ( x, y, z)
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 34

00 ( x, y, z ) =
hvor vi eksplicit har benyttet os af symmetrien i Hesse-matricen, f.eks. f zx
00 ( x, y, z ).
f xz

Eksempel 15.47 Kvadratisk form med repræsenterende matrix

Lad f ( x, y, z) betegne følgende funktion af tre variable:

f ( x, y, z) = x2 + 3 · y2 + z2 8·x·y+4·y·z . (15-111)

Så er f ( x, y, z) en kvadratisk form PA ( x, y, z) med


2 3 2 3
f 00 ( x, y, z) f xy
00 ( x, y, z ) 00 ( x, y, z )
f xz 1 4 0
1 1 6 xx 7 4
A = · H f ( x, y, z) = · 4 f xy 00 ( x, y, z ) f 00 ( x, y, z )
yy
00
f yz ( x, y, z) 5 = 4 3 2 5 .
2 2 00 ( x, y, z ) f 00 ( x, y, z )
f xz yz
00 ( x, y, z )
f zz 0 2 1
(15-112)
Vi kan efterprøve 15.8.108 ved direkte udregning:
2
3 2 3
⇥ 4 0⇤ x 1
PA ( x, y, z) = x y z ·4 4
3 2 5·4 y 5
2 1 z 0
32
⇥ ⇤ x 4·y
= x y z ·4 3·y 4·x+2·z 5 (15-113)
z+2·y
= x · (x 4 · y ) + y · (3 · y 4 · x + 2 · z) + z · (z + 2 · y)
2 2 2
= x +3·y +z 8·x·y+4·y·z
= f ( x, y, z) .

Som vist i afsnit 21.4 i eNote 18 spiller fortegnene på egenværdierne for Hesse-matricen
en afgørende rolle nr vi analyserer og inspicerer en glat funktion f ( x, y) i og omkring
et stationært punkt. Og da det netop igen er (den samme) Hesse-matrix der optræder i
nærværende sammenhæng vil vi her knytte et par definitioner til denne fortegnsdiskus-
sion – nu for generelle (n ⇥ n) Hesse-matricer, og dermed ogs for generelle kvadratiske
former repræsenteret ved symmetriske matricer A :
eNote 15 15.8 REDUKTION AF ANDENGRADSPOLYNOMIER 35

Definition 15.48 Definitte og indefinitte symmetriske matricer


Vi lader A betegne en symmetrisk matrix. Lad A have de n reelle egenværdier
l1 , l2 , · · · , ln . Så siger vi, at

1. A er positiv definit hvis alle egenværdierne li er positive.

2. A er positiv semi-definit hvis alle egenværdierne li er ikke-negative (hver


enkelt er større end eller lig med 0).

3. A er negativ definit hvis alle egenværdierne li er negative.

4. A er negativ semi-definit hvis alle egenværdierne li er ikke-positive (hver


enkelt er mindre end eller lig med 0).

5. A er indefinit hvis A hverken er positiv semi-definit eller negativ semidefinit.

Vi formulerer nu et intuitivt rimeligt resultat, der relaterer denne ”definithed” til de


værdier, som andengradspolynomiet PA (x) antager for forskelllige x 2 R n .

Sætning 15.49 Betydningen af positiv definithed


Hvis A er en symmetrisk positiv definit matrix, så er den kvadratiske form PA (x)
positiv for alle x 2 R n 0.

Bevis

Vi refererer til sætning 15.45 og kan derfra benytte det reducerede udtryk for den kvadratiske
form:
PA ( x1 , · · · , xn ) = PeL ( xe1 , · · · , xen ) = l1 · xe12 + · · · + ln · xen2 , (15-114)
hvoraf det tydeligt se, at da A er positiv definit får vi li > 0 for alle i = 1, · · · , n og så er
PA (x) > 0 for alle x 6= 0, som jo svarer til, at ingen af koordinatsættene for x er (0, · · · , 0).

Tilsvarende sætninger kan formuleres for negativt definitte og indefinitte matricer, og


eNote 15 15.9 REDUKTION AF ANDENGRADS-POLYNOMIER 36

de er oplagt nyttige ved funktionsundersøgelser, specielt ved undersøgelse af funk-


tionsværdierne omkring stationære punkter, som behandlet i eNote 18.

15.9 Reduktion af andengrads-polynomier

Ved at reducere den kvadratiske form del af et andengrads-polynomium fås naturligvis


et tilsvarende simplere andengradspolynomium – nu uden produktled. Vi ser på et par
eksempler.

Eksempel 15.50 Reduktion af andengrads-polynomium, to variable

Vi ser på følgende andengradspolynomium i to variable:

f ( x, y) = 11 · x2 + 4 · y2 24 · x · y 20 · x + 40 · y 60 (15-115)

Den del af polynomiet som kan beskrives ved en kvadratisk form er nu

PA ( x, y) = 11 · x2 + 4 · y2 24 · x · y , (15-116)

hvor 
11 12
A= . (15-117)
12 4
Netop denne matrix er diagonaliseret ved en positiv ortogonal substitution Q i eksempel
15.31: Egenvrdierne for A er l1 = 20 og l2 = 5 og
 
4/5 3/5 cos( j) sin( j)
Q= = , hvor j= arcsin(3/5) . (15-118)
3/5 4/5 sin( j) cos( j)

Koordinatskiftet til de nye koordinater xe, ye foregår altså ved en rotation af det sædvanlige
koordinatsystem med en vinkel på arcsin(3/5).

Vi bruger reduktionssætningen 15.45 og får, at den kvadratiske form PA ( x, y) i de nye koor-


dinater har følgende reducerede udtryk:

PA ( x, y) = PeL ( xe, ye) = 20 · xe2 5 · ye2 . (15-119)

Ved at indsætte dette reducerede udtryk for den kvadratiske form i polynomiet f ( x, y) får vi:

f ( x, y) = 20 · xe2 5 · ye2 + ( 20 · x + 40 · y 60) , (15-120)


eNote 15 15.9 REDUKTION AF ANDENGRADS-POLYNOMIER 37

hvor vi klart nu blot mangler at udtrykke den sidste parentes ved hjælp af de nye koordinater.
Det gøres ved hjælp af substitutionsmatricen Q. Vi har jo den lineære sammenhæng mellem
koordinaterne ( x, y) og ( xe, ye):
   
x xe 4/5 3/5 xe
= Q· = · (15-121)
y ye 3/5 4/5 ye

sådan at:
1
· (4 · xe + 3 · ye)
x=
5 (15-122)
1
y = · ( 3 · xe + 4 · ye) .
5
Vi indsætter disse omskrivninger af x og y i (15.9.120) og får:

f ( x, y) = 20 · xe2 5 · ye2 + ( 4 · (4 · xe + 3 · ye) + 8 · ( 3 · xe + 4 · ye) 60)


2 2
(15-123)
= 20 · xe 5 · ye 40 · xe + 20 · ye 60 .

Vi har dermed reduceret udtrykket for f ( x, y) til følgende udtryk i de nye koordinater xe og
ye), som er fremkommet ved en passende drejning af det sædvanlige koordinatsystem:

f ( x, y) = 11 · x2 + 4 · y2 24 · x · y 20 · x + 40 · y 60
2 2
= 20 · xe 5 · ye 40 · xe + 20 · ye 60 (15-124)
= fe( xe, ye) .

Bemærk igen, at reduktionen i eksemplet 15.50 består i, at det reducerede anden-


gradspolynomium fe( xe, ye) ikke indeholder noget produktled af formen xe · ye.
Den reduktionsteknik og det udbytte af det store arbejde bliver lidt tydeligere
når vi ser på et andengradspolynomium i tre variable.

Eksempel 15.51 Reduktion af andengrads-polynomium, tre variable

I eksempel 15.33 har vi diagonaliseret den matrix A, der repræsenterer den kvadratiske form
i følgende andengradspolynomium i tre variable:

f ( x, y, z) = 7 · x2 + 6 · y2 + 5 · z2 4·x·y 4·y·z 2 · x + 20 · y 10 · z 18 . (15-125)

Dette polynomium reduceres til følgende andengradspolynomium i de nye variable opnået


efter samme forskrift som i eksempel 15.50:

f ( x, y) = fe( xe, ye, e


z)
(15-126)
= 9 · xe2 + 6 · ye2 + 3 · e
z2 + 18 · xe 12 · ye + 6 · e
z 18
eNote 15 15.9 REDUKTION AF ANDENGRADS-POLYNOMIER 38

med den positive ortogonale substitution


2 3
2/3 2/3 1/3
Q=4 2/3 1/3 2/3 5 . (15-127)
1/3 2/3 2/3

Substitutionsmatricen Q kan faktoriseres til et produkt af akserotationsmatricer således:

Q = Rz ( w ) · Ry ( v ) · R x ( u ) , (15-128)

hvor rotationsvinklerne er henholdsvis:


✓ ◆
p 1 p
u= , v= arcsin , og w = 3· , (15-129)
4 3 4

Ved at rotere koordinatsystemet og benytte de nye koordinater xe, ye, og e z opnår vi den reduk-
tion af polynomiet f ( x, y, z) at der i polynomiet fe( xe, ye, e
z) ikke optræder produktled mens der
i f ( x, y, z) optræder to produktled, med henholdsvis x · y og y · z
eNote 15 15.10 OPSUMMERING 39

15.10 Opsummering

Hovedresultatet i denne eNote er at symmetriske (n ⇥ n)-matricer kan diagonaliseres


ved en positiv ortogonal substitutionsmatrix Q. Vi har brugt den sætning til at reducere
andengrads-polynomier i n variable – dog især for n = 2 og n = 3.

• En symmetrisk (n ⇥ n)-matrix A har præcis n reelle egenværdier l1 , · · · , ln .

• I vektorrummet R n indføres et skalarprodukt ved udvidelse af det sædvanlige


skalarprodukt i R2 og R3 , og vi refererer til dette skalarprodukt, når vi skriver
(R n , ·). Hvis a = ( a1 , · · · , an ) og b = (b1 , · · · , bn ) med hensyn til den sædvanlige
basis e i R n , så er
n
a·b = Â a i · bi . (15-130)
i

• Længden, normen, af en vektor a er givet ved


s
p n
|a| = a · a = Â a2i . (15-131)
i =1

• Cauchy-Schwarz’ ulighed gælder for alle vektorer a og b i (R n , ·)

|a · b|  | a | | b | , (15-132)

og lighedstegnet gælder hvis og kun hvis a og b er lineært afhængige.

• Vinklen q 2 [0, p ] mellem to egentlige vektorer a og b i (R n , ·) er bestemt ved

a·b
cos(q ) = . (15-133)
|a| · |b|

• To egentlige vektorer a og b i (R n , ·) er ortogonale hvis a · b = 0.

• En matrix Q er ortogonal hvis søjlevektorerne er parvis ortogonale og hver har


længden 1 med hensyn til det indførte skalarprodukt. Det svarer præcis til at

Q> · Q = E (15-134)

eller ækvivalent:
1
Q = Q> . (15-135)
eNote 15 15.10 OPSUMMERING 40

• Spektralsætningen: Hvis A er symmetrisk, så findes en positiv ortogonal substi-


tutionsmatrix Q således at
A = Q · L · Q> , (15-136)
hvor L = diag(l1 , · · · , ln ).

• Enhver positiv ortogonal matrix Q er en substitutionsmatrix (basisskiftematrix)


der roterer koordinatsystemet. Den kan for n = 3 faktoriseres i tre akserotations-
matricer:
Q = Rz ( w ) · Ry ( v ) · R x ( u ) , (15-137)
for passende valg af drejningsvinkler u, v, og w.

• For n = 3: Ved rotation af koordinatsystemet, dvs. ved brug af en positiv or-


togonal koordinatskiftematrix Q, kan den kvadratiske form PA ( x, y, z) (som er et
andengradspolynomium uden lineære led og uden konstantled) udtrykkes ved en
kvadratisk form PeL ( xe, ye, e
z) i de nye koordinater xe, ye, og e
z således at

PA ( x, y, z) = PeL ( xe, ye, e


z) for alle ( x, y, z), (15-138)

og således at den reducerede kvadratiske form PeL ( xe, ye, e


z) ikke indeholder noget
produktled af typen x · y, x · z, eller y · z :
e e e e e e

z) = l1 · xe2 + l2 · ye2 + l3 · e
PeL ( xe, ye, e z2 , (15-139)

hvor l1 , l2 , og l3 er de tre reelle egenværdier for A.


eNote 16 1

eNote 16

Førsteordens lineære differentialligninger

I denne eNote gives først en kort introduktion til differentialligninger i almindelighed, hvorefter
hovedemnet er en særlig type af differentialligninger, de såkaldte 1. ordens lineære
differentialligninger. eNoten bygger på kendskab til specielle funktioner, differential- og
integralregning samt lineære afbildninger.

Version 23.10.18 ved Karsten Schmidt.

16.1 Hvad er en differentialligning?

En differentialligning er en ligning, hvori der optræder én eller flere ubekendte funktioner


sammen med en eller flere af deres afledede. I denne eNote betragter vi kun differential-
ligningerne der indeholder én ubekendt funktion. Differentialligninger opstår naturligt
ved modellering af fysiske, mekaniske, økonomiske, kemiske og mangfoldige andre
problemer, hvorfor det er et vigtigt ingeniørmæssigt emne.

Man siger at en differentialligning har orden n hvis den indeholder den n-te afledede af
den ukendte funktion, men ingen afledede af orden højere end n . Den ukendte funktion
betegnes i denne eNote med x eller med x (t) hvis navnet på den uafhængige variabel
t er vigtigt i sammenhængen.

Et eksempel på en differentialligning er

x 000 (t) 2x 0 (t) + x (t) = t , t 2 R. (16-1)


eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER2

Differentialligningen har orden 3, da det højeste antal gange den ukendte funktion x er
differentieret i ligningen, er 3. En løsning til differentialligningen er en funktion x0 som
indsat i ligningen gør den sand. Hvis vi for eksempel skal undersøge om funktionen

x 0 ( t ) = et + t + 2 , t2R

er en løsning til (16-1), gør vi prøve, dvs. indsætter x0 i stedet for x i ligningen. Idet
der gælder

x0000 (t) 2x00 (t) + x0 (t) = (et + t + 2)000 2(et + t + 2)0 + ((et + t + 2))
= et 2 (et + 1 ) + et + t + 2
=t

er x0 en løsning.

Denne eNote handler om en vigtig type af førsteordens differentialligninger, de såkaldte


lineære. For at kunne undersøge dem præcist tager vi udgangspunkt i deres standard
opskrivningsform.

16.2 Introduktion til 1. ordens lineære differentialligninger

Definition 16.1
Ved en førsteordens lineær differentialligning forstås en differentialligning der kan
bringes på standardformen

x0 (t) + p(t) x (t) = q(t) , t2I (16-2)

hvor I er åbent interval i R , og p og q er (kendte) kontinuerte funktioner defineret


på I .

Differentialligningen kaldes homogen hvis q(t) = 0 for alle t . I modsat fald kaldes
den inhomogen.
eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER3

Eksempel 16.2 Standardform

1. ordens differentialligningen

x 0 (t) + 2x (t) = 30 + 8t , t 2 R. (16-3)

ses umiddelbart at være på standardformen (16-2) med p(t) = 2 og q(t) = 30 + 8t , t 2 R.


Den er derfor lineær.

Eksempel 16.3 Standardform

Lad I være et åbent interval i R . Betragt 1. ordens differentialligningen

t · x 0 (t) + 2x (t) 8t2 = 10 , t 2 R. (16-4)

For at bringe den på standardform må vi først lægge 8t2 til på begge sider af lighedstegnet,
idet der på venstresiden kun må optræde led med den ukendte funktion x (t) . Derefter di-
viderer vi med t på begge sider af lighedstegnet, da x (t) ikke må have en koefficient forskel-
lig fra 1. For at undgå division med 0, må vi beslutte os for om vi skal forudsætte t større
eller mindre nul, lad os vælge det første:

2 10
x0 (t) + x (t) = 8t , t > 0. (16-5)
t t
2 10
Hermed er differentialligningen på standardform med p(t) = og q(t) = 8t , t > 0.
t t

Opgave 16.4 Standardform

Gør rede for at 1. ordens differentialligningen

1 2
x0 (t) + t = 0, t2R
2
ikke er homogen.

Opgave 16.5 Flere løsninger

Der er givet differentialligningen


x 0 (t) + 2x (t) = 30 + 8t , t 2 R.
eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER4

Vis at uanset om c = 1, c = 2 eller c = 3 , så er funktionen


2t
x0 (t) = 13 + 4t + ce , t2R

en løsning.

Af opgave 16.5 fremgår det at en differentialligning meget vel kan have flere løsninger.
Vi skal i det følgende undersøge spørgsmålet om antallet af løsninger nærmere. For
at forstå hvad der mere præcist ligger i at en 1. ordens differentialligning er lineær, og
hvad det betyder for dens løsningsmængde, får vi brug for den følgende hjælpesætning.

Hjælpesætning 16.6
Lad p være en kontinuert funktion defineret på et åbent interval I i R . Så gælder
at afbildningen f : C1 ( I ) ! C0 ( I ) givet ved

f ( x (t)) = x 0 (t) + p(t) x (t) (16-6)

er lineær.

Bevis

Vi skal vise at f opfylder de to linearitetskrav L1 og L2 . Lad x1 , x2 2 C1 ( I ) (dvs. de


to funktioner er vilkårlige differentiable funktioner med kontinuerte afledede på I ), og lad
k 2 R . At f opfylder L1 fremgår af

f ( x1 (t) + x2 (t)) = ( x1 (t) + x2 (t))0 + p(t)( x1 (t) + x2 (t))


= x10 (t) + x20 (t) + p(t)( x1 (t) + p(t) x2 (t)
= ( x10 (t) + p(t) x1 (t)) + ( x20 (t) + p(t) x2 (t))
= f ( x1 (t)) + f ( x2 (t)) .

At f opfylder L2 fremgår af

f (kx1 (t)) = (kx10 (t)) + p(t)(kx1 (t)) = k ( x10 (t) + p(t) x1 (t))
= k f ( x1 (t)) .

Hermed at beviset fuldført.


eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER5

Fra hjælpesætning 16.6 kan vi uddrage tre vigtige egenskaber for løsningsmængden for
1. ordens lineære differentialligninger. Forinden indfører vi nogle bekvemme beteg-
nelser for de løsningsmængder vi skal behandle.

Linhom betegner samtlige løsninger for en given inhomogen differentialligning.


De omtales kort som løsningsmængden eller den fuldstændige løsning.
Lhom betegner løsningsmængden for den til en inhomogen differentialligning
hørende homogene differentialligning (hvor højresiden q(t) er erstattet med
0).

Sætning 16.7 Tre egenskaber


For en 1. ordens lineær differentialligning x 0 (t) + p(t) x (t) = q(t) , t 2 I gælder:

1. Hvis differentialligningen er homogen (dvs. q(t) er 0-funktionen), så er


løsningsmængden et underrum i C1 ( I ) .

2. Struktursætningen: Hvis differentialligningen er inhomogen, kan løsnings-


mængden Linhom skrives på formen

Linhom = x0 (t) + Lhom (16-7)

hvor x0 (t) er en partikulær løsning til den inhomogene differentialligning, og


Lhom er løsningsmængden til den tilsvarende homogene differentialligning.

3. Superpositionsprincippet: Hvis x1 (t) er en løsning når differenttialligningens


højreside erstattes af funktionen q1 (t) , og x2 (t) er en løsning når højresiden
erstattes af funktionen q2 (t) , så er x1 (t) + x2 (t) en løsning når højresiden er-
stattes af funktionen q1 (t) + q2 (t) .

Bevis

Vi betragter afbildningen f : C1 ( I ) ! C0 ( I ) givet ved

f ( x (t)) = x 0 (t) + p(t) x (t) . (16-8)

Den er ifølge hjælpesætning (16.6) lineær. Derfor gælder:


eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER6

1. Lhom er identisk med ker ( f ) . Da kernen for enhver lineær afbildning er et underrum i
defintionsrummet, er Lhom et underrum i C1 ( I ) .

2. Da ligningen f ( x (t)) = x 0 (t) + p(t) x (t) = q(t) er lineær, følger struktursætningen her
direkte af den generelle struktursætning for lineære ligninger (se eNote 12, sætning
12.14).

3. Superpositionsprincippet er en følge af at f opfylder linearitetbetingelsen L1 . Antag


nemlig at f ( x1 (t)) = q1 (t) og f ( x2 (t)) = q2 (t) . Så gælder

f ( x1 (t) + x2 (t)) = f ( x1 (t)) + f ( x2 (t)) = q1 (t) + q2 (t) .

Hermed er beviset fuldført.

Når vi kalder en 1. ordens differentialligning på formen (16-2) for lineær, hænger det
som vist snævert sammen med at dens venstreside repræsenterer en linæer afbildning,
og at dens løsningsmængde derfor har de unikke egenskaber i sætning . 16.7 I det
følgende eksempel jonglerer vi med egenskaberne ved på forskellig vis at afgøre at en
given differentialligning ikke er lineær.

Eksempel 16.8 1. ordens differentialligning som ikke er lineær

Vi betragter en 1. ordens differentialligning

x0 (t) ( x (t))2 = q(t) , t 2 R . (16-9)

hvor vi på sædvanlig vis har isoleret de led der indeholder den ukendte funktion på ven-
stresiden. Venstresiden repræsenterer afbildningen f : C1 (R ) ! C0 (R ) givet ved

f ( x (t)) = x 0 (t) ( x (t))2 . (16-10)

Vi vil her vise at man på forskellige måder kan demonstrere at differentialligningen ikke er
lineær.

1. Det er oplagt at differentialligningen ikke kan bringes på standardformen (16-2) da den


ukendte funktion optræder i anden potens. Differentialligningen er derfor ikke lineær.

2. Løsningsmængden til den tilhørende homogene ligning er ikke et underrum. Den op-
fylder fx ikke stabilitetskravet vedrørende multiplikation med skalar hvilket vi kan
vise således:
eNote 16 16.2 INTRODUKTION TIL 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER7

1
Funktionen x0 (t) = er en løsning til den homogene ligning idet
t
1 1
x00 (t) ( x0 (t))2 = = 0.
t2 t2

2
Men det er 2 · x0 (t) = ikke, idet
t
2 4 2
(2 · x0 (t))0 (2 · x0 (t))2 = = 6= 0 .
t2 t2 t2

Differentialligningen er derfor ikke linæer.

3. Løsningsmængden opfylder ikke superpositionsprincippet. Vi ser fx at


✓ ◆ ✓ ◆ ✓ ◆
1 1 2 2
f +f = 0+ 2
= , mens
t t t t2
✓ ◆
1 1
f + = f (0) = 0 .
t t

Differentialligningen er derfor ikke linæer.

4. Til sidst viser vi at f ikke opfylder linearitetsbetingelserne. For at vise det behøver vi
blot afprøve L2 , fx med k = 2 . Vi udregner de to sider i L2 :

f (2x (t)) = (2x (t))0 (2x (t))2 = 2x 0 (t) 4( x (t))2


2 f ( x (t)) = 2( x 0 (t) ( x (t))2 ) = 2x 0 (t) 2( x (t))2 .

Ved subtraktion af de to ligninger fås:

f (2x (t)) 2 f ( x (t)) = 2( x (t))2

hvor højresiden kun er 0-funktion når x (t) er 0-funktionen. Da L2 skal gælde for alle
x (t) 2 C1 (R ) , er L2 ikke opfyldt. Differentialligningen er derfor ikke lineær.

Det følger af struktursætningen at de homogene differentialligninger spiller en helt


speciel rolle for lineære differentialligninger. Derfor tager vi dem op til særskilt be-
handling i næste afsnit.
eNote 16 16.3 HOMOGENE 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER 8

16.3 Homogene 1. ordens lineære differentialligninger

Vi opstiller i det følgende en løsningsformel for homogene 1. ordens lineære differen-


tialligninger.

Sætning 16.9 Løsning af den homogene ligning


Lad p(t) være en kontinuert funktion defineret på et åbent reelt interval I , og lad
P(t) være en vilkårlig stamfunktion til p(t) .
Den fuldstændige løsning for den homogene 1. ordens lineære differentialligning

x0 (t) + p(t) x (t) = 0 , t 2 I . (16-11)

er da givet ved
P(t)
x (t) = c e , t2I (16-12)
hvor c er et vilkårligt reelt tal.

Bevis

Sætningen følger af det følgende ræsonnement:


x0 (t) + p(t) x (t) = 0 (gang med eP(t) på begge sider)
, x 0 ( t )e P ( t ) + x ( t ) p ( t )e P ( t ) = 0 (brug kædereglen baglæns)
0
, x 0 ( t )e P ( t ) + x ( t ) e P ( t ) =0 (brug produktreglen baglæns)
0
, x ( t )e P ( t ) =0 (integrér på begge sider)
, x ( t )e P ( t ) = c (gang med e P(t) på begge sider)
, x (t) = ce P(t) .
I de sidste to linjer står c for et vilkårligt reelt tal.

Hermed er beviset gennemført.


eNote 16 16.3 HOMOGENE 1. ORDENS LINEÆRE DIFFERENTIALLIGNINGER 9

Vi ved at løsningsmængden er et underrum i C1 ( I ) . Af formlen (16-12)


fremgår det dels at underrummet er 1-dimensionalt, dels at funktionen e P(t)
er en basis for løsningsmængden.

Bemærkning 16.10
Sætning 16.9 gælder også hvis p er en kontinuert kompleks funktion af reel variabel
med den modifikation af den arbitrære konstant c i så fald er en kompleks konstant.
Beviset er det samme fordi produktreglen også gælder for funktioner af den nævnte
type. Hvis man skriver P(t) = u(t) + i · v(t) får man at den afledte af eP(t) stadig er
P(t) · e P(t) . Endelig finder man igen, ved at skrive funktionen på rektangulær form,
at den afledte af en funktion af den nævnte type er 0 hvis og kun hvis funktionen er
en kompleks konstant.

Opgave 16.11

I sætning 16.9 benyttes en vilkårlig stamfunktion P(t) til p(t) . Gør rede for at det ikke har
betydning for løsningsmængden, hvilken stamfunktion man vælger at bruge, når man benyt-
ter sætningen.

Eksempel 16.12 Løsning af homogen ligning

Der er givet en homogen 1. ordens lineær differentialligning ved

x 0 (t) + cos(t) x (t) = 0, t 2 R. (16-13)

Vi ser at kvotientfunktionen er p(t) = cos(t) . En stamfunktion til p(t) er dermed


P(t) = sin(t) . Herefter kan den fuldstændige løsning opskrives
P(t) sin(t)
x (t) = ce = ce , t2R (16-14)

hvor c er et vilkårligt reelt tal.


eNote 16 16.4 INHOMOGENE LIGNINGER LØST MED GÆTTEMETODEN 10

16.4 Inhomogene ligninger løst med gættemetoden

Nu hvor vi ved hvordan løsningsmængden for homogene 1. ordens lineære differential-


ligner kan findes, er det på tide at kigge på de inhomogene. Hvis man allerede kender
eller kan gætte en partikulær læsning til den inhomogene ligning, er det oplagt at ud-
nytte struktursætningen, se 16.7. Det demonstrerer vi med de følgende eksamenpler.

Eksempel 16.13 Løsning med gæt og struktursætningen

En inhomogen 1. ordens lineær differentialligning er givet ved

x 0 (t) + tx (t) = t, t 2 R. (16-15)

Det ses nemt at x0 (t) = 1 er en partikulær løsning. Herefter løser vi den tilsvarende homo-
gene differentialligning
x 0 (t) + tx (t) = 0, t 2 R . (16-16)
Med brug af betegnelser fra sætning 16.9 har vi p(t) = t som har stamfunktionen

1 2
P(t) = t .
2
Den fuldstændige løsning består derfor af følgende funktioner hvor c er et vilkårligt reelt
tal:
1 2
x (t) = ce 2 t , t 2 R . (16-17)
Kort sagt: n o
1 2
Lhom = ce 2t , t2R c2R . (16-18)

Vi kan nu opstille den fuldstændige løsningsmængde til den inhomogene differentialligning


ved hjælp af struktursætningen:
n o
1 2
Linhom = x0 (t) + Lhom = 1 + ce 2 t , t 2 R c 2 R .

Eksempel 16.14 Løsning med gæt og struktursætningen

En inhomogen 1. ordens lineær differentialligning er givet ved


x 0 (t) + 2x (t) = 30 + 8t, t 2 R. (16-19)
Lad os først forsøge at gætte en partikulær løsning. Da højresiden er et 1. grads polynomium
kan man med den givne venstreside, hvor der kun skal differentieres og ganges med 2, for-
eNote 16 16.4 INHOMOGENE LIGNINGER LØST MED GÆTTEMETODEN 11

mode at et 1. grads polynomium kan være en løsning. Vi forsøger derfor at indsætte et


vilkårligt 1. grads polynomium x0 (t) = b + at i differentialligningens venstreside:

x00 (t) + 2x0 (t) = (b + at)0 + 2(b + at) = a + 2b + 2at .

Vi sammenligner det opnåede udtryk med den givne højreside:

a + 2b + 2at = 30 + 8t

som er opfyldt for alle t 2 R netop når

a + 2b = 30 og 2a = 8 , a = 4 og b = 13 .

Vi har dermed fundet en partikulær løsning

x0 (t) = 13 + 4t , t 2 R .

Vi løser herefter den tilsvarende homogene differentialligning

x 0 (t) + 2x (t) = 0, t 2 R. (16-20)

Med brug af betegnelser fra sætning 16.9 har vi p(t) = 2 som har stamfunktionen P(t) = 2t .
Den fuldstændige løsning består derfor af følgende funktioner hvor c er et vilkårligt reelt tal:

2t
x (t) = ce , t 2 R. (16-21)
Kort sagt:
Lhom = ce 2t , t2R c2R . (16-22)

Det er nu muligt at opstille den fuldstændige løsningsmængde til den inhomogene differen-
tialligning ved hjælp af struktursætningen:

Linhom = x0 (t) + Lhom = 13 + 4t + ce 2t , t2R c2R .

Eksempel 16.15 Løsning med gæt og struktursætningen

En inhomogen 1. ordens lineær differentialligning er givet ved


x 0 (t) + x (t) = 1 + sin(2t), t 0. (16-23)
Lad os først forsøge at gætte en partikulær løsning. Da højresiden består af en konstant plus
en sinusfunktion med vinkelfrekvensen 2, er det oplagt at gætte på en løsning af typen
x (t) = k + a cos(2t) + b sin(2t) .
eNote 16 16.4 INHOMOGENE LIGNINGER LØST MED GÆTTEMETODEN 12

Ved indsættelse af denne i differentialligningen fås:

2a sin(2t) + 2b cos(2t) + k + a cos(2t) + b sin(2t) = 1 + sin(2t)


, (2b + a) cos(2t) + (b 2a 1) sin(2t) + (k 1) 1 = 0 .

Da sættet (cos(2t), sin(2t), 1) er lineært uafhængigt, er denne ligning opfyldt netop når

2 1
2b + a = 0 , b 2a 1 = 0 og k = 1 , a = , b= og k = 1 .
5 5

Vi har hermed fundet en partikulær løsning

2 1
x0 ( t ) = 1 cos(2t) + sin(2t) , t 2 R .
5 5

Da den tilsvarende homogene differentialligning

x 0 (t) + x (t) = 0, t 0 (16-24)

klart har løsningsmængden


x (t) = ce t , t 0, (16-25)
får vi den fuldstændige løsningsmængde til den givne inhomogene differentialligning ved
hjælp af struktursætningen:
2
Linhom = x0 (t) + Lhom = 1 5 cos(2t) + 15 sin(2t) + ce t , t2R c2R .

Som demonstreret i de tre foregående eksempler er det oplagt at bruge gættemetoden i


de inhomogene tilfælde hvor man allerede kender en partikulær løsning eller nemt kan
finde én. Det kræver blot at man kan finde en stamfunktion P(t) til koefficientfunktio-
nen p(t) .

Har man derimod ikke umiddelbar adgang til en partikulær løsning, må man i stedet
benytte den generelle løsningsformel som sine steder går under navnet Panserformlen.
Her slipper man for alt gætteri, til gengæld skal man finde to stamfunktioner, den ene
er P(t) som ovenfor, mens den anden oftest er noget vanskeligere (om ikke umulig) at
finde idet man skal integrere et produkt af funktioner. I det følgende afsnit opstiller vi
den generelle løsningsformel og diskuterer de nævnte problemer.
eNote 16 16.5 DEN GENERELLE LØSNINGSFORMEL 13

16.5 Den generelle løsningsformel

Vi betragter nu den generelle 1. ordens lineære differentialligning på standardformen

x 0 ( t ) + p ( t ) x ( t ) = q ( t ), t 2 I, (16-26)

Vi ønsker at bestemme den fuldstændige løsning ved hjælp af den følgende generelle
formel, som populært kaldes Panserformlen.

Sætning 16.16 Panserformlen


Lad p(t) og q(t) være kontinuerte funktioner på et åbent reelt interval I , og lad P(t)
være en vilkårlig stamfunktion til p(t) . Differentialligningen

x 0 ( t ) + p ( t ) x ( t ) = q ( t ), t2I (16-27)

har da løsningsmængden
Z
P(t)
x (t) = e eP(t) q(t)dt + ce P(t)
, t2I (16-28)

hvor c er et vilkårligt reelt tal.

Bevis

Det andet led i løsningsformlen (16-28) identificerer vi som Lhom . Hvis vi kan vise at det
første led er en partikulær løsning til differentialligningen, så følger det af struktursætningen
at vi med løsningsformlen har fundet den fuldstændige løsning til differentialligningen.
Først må vi naturligvis stille os det spørgsmål om det ubestemte integral der indgår i løs-
ningsformen, overhovedet eksisterer. Det gør det! Se detaljeret begrundelse for det i beviset
for eksistens- og entydighedssætningen, sætning 16.24 . At det første led
Z
P(t)
x0 ( t ) = e eP(t) q(t)dt

er en partikulær løsning, viser vi ved at gøre prøve: Vi indsætter det i differentialligningens


eNote 16 16.5 DEN GENERELLE LØSNINGSFORMEL 14

venstreside, og ser at resultatet er lig med den givne højreside.


✓ Z ◆0 Z
P(t) P(t) P(t)
x00 (t) + p ( t ) x0 ( t ) = e e q(t) dt + p(t) e eP(t) q(t) dt
Z Z
P(t)
= p ( t )e eP(t) q(t) dt + e P(t) P(t)
e q ( t ) + p ( t )e P(t)
eP(t) q(t)dt

= q(t) .

Hermed er beviset gennemført.

Bemærkning 16.17
Ved brug af 16.10 fås det nemt at sætning 16.16 også gælder hvis p(t) og q(t) er
kontinuerte komplekse funktioner af reel variabel med den tilføjelse af den arbitrære
konstant c i så fald er en kompleks konstant.

Sætter man i q(t) = 0 i Panserformlen (16-27), forsvinder det første led i (16-
28), tilbage er det andet led som er formlen (16-12) for homogene ligninger.
Derfor er Panserformlen en "‘generel formel"’ der både dækker det homogene
og det inhomogene tilfælde.

Opgave 16.18

Z
I Panserformlen indgår det ubestemte eP(t) q(t)dt , som står for en vilkårlig stamfunktion til
e P(t) q(t) . Gør rede for at det ikke har betydning for løsningsmængden, hvilken stamfunktion
man vælger at bruge, når man benytter formlen.

Vi tager nu et par eksempler med brug af Panserformlen. Da den indeholder et ubestemt


integral over et produkt af funktioner, får man ofte brug for partiel integration, hvilket
det andet eksempel demonstrerer.
eNote 16 16.5 DEN GENERELLE LØSNINGSFORMEL 15

Eksempel 16.19 Løsning med Panserformlen

Givet er differentialligningen

2 10
x 0 (t) + x (t) = 8t , t > 0. (16-29)
t t

Med betegnelserne i Panserformlen har vi p(t) = 2t og q(t) = 8t 10


t . En stamfunktion til
p(t) er givet ved:
P(t) = 2 ln t . (16-30)
Vi har da
2 ln t 2) 1
e P(t)
=e = eln(t =t 2
= . (16-31)
t2
Af dette følger, at eP(t) = t2 . Nu bruges Panserformlen:
Z
P(t)
x (t) = e eP(t) q(t) dt + ce P(t)
Z ✓ ◆
1 2 10 1
= t 8t dt + c 2
t2 t t
Z
1 1 (16-32)
= 2 (8t3 10t) dt + c 2
t t
1 ⇣ ⌘
= 2 2t4 5t2 + c
t
c
x (t) = 2t2 5+ , t > 0.
t2
Den fuldstændige løsning består af disse funktioner hvor c er et vilårligt reelt tal. Kort sagt:
n c o
Linhom = x (t) = 2t2 5 + 2 , t > 0 c 2 R . (16-33)
t

Eksempel 16.20 Løsning med Panserformlen

Vi skal løse differentialligningen


1
x0 (t) x (t) = t2 sin(2t), t > 0. (16-34)
t
Med betegnelserne i Panserformlen har vi p(t) = 1t og q(t) = t2 sin(2t). En stamfunktion
til p(t) er givet ved:
P(t) = ln t . (16-35)
Vi har da
1
e P(t)
= eln t = t og eP(t) = e ln t
= (eln t ) 1
= . (16-36)
t
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 16

Nu bruges Panserformlen:
Z
P(t)
x (t) = e eP(t) q(t) dt + ce P(t)

Z
1 2
=t t sin(2t) dt + ct
Z t
= t t sin(2t) dt + ct .

Vi laver nu en mellemregning hvor vi bruger partiel integration til at finde stamfunktionen.


Z Z
1 1
t sin(2t)dt = t cos(2t) cos(2t) dt
2 2
Z
1 1
= t cos(2t) + cos(2t) dt
2 2
1 1
= t cos(2t) + sin(2t) .
2 4
Og vender tilbage til udregningen
Z
x (t) = t t sin(2t) dt + ct
✓ ◆
1 1
=t t cos(2t) + sin(2t) + ct
2 4
1 2 1
x (t) = t cos(2t) + t sin(2t) + ct t > 0 .
2 4
Den fuldstændige løsning består af disse funktioner hvor c er et vilårligt reelt tal. Kort sagt:
1 2 1
Linhom = x (t) = 2 t cos(2t ) + 4 t sin(2t ) + ct , t > 0 c 2 R . (16-37)

Indtil nu har vi beskæftiget os med den fuldstændige løsning til differentialligningen.


Ofte er man interesseret i at gå et skridt videre og finde en bestemt løsning som i en
given værdi af t antager en ønsket funktionsværdi, et såkaldt begyndelsesværdiprob-
lem. Det behandler vi i næste afsnit.

16.6 Begyndelsesværdiproblemer

Vi ser på en 1. ordens lineær differentialligning på standardformen


x 0 ( t ) + p ( t ) x ( t ) = q ( t ), t 2 I. (16-38)
Hvis vi skal bruge en løsning til differentialligningen som i en bestemt værdi af t an-
tager en ønsket funktionsværdi, opstår spørgsmålene: 1) Findes der overhoveddet en
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 17

løsning som opfylder det ønskede og 2) Hvis ja, hvor mange løsninger er der så? Inden
vi besvarer spørgsmålet generelt, ser vi på et par eksempler.

Eksempel 16.21 Et begyndelsesværdiproblem

I eksempel 16.13 fandt vi den fuldstændige løsning til differentialligningen

x 0 (t) + tx (t) = t, t 2 R. (16-39)

nemlig
1 2
x (t) = 1 + ce 2t , t2R
hvor c er et vilkårligt reelt tal.

Vi vil nu finde den løsning x0 (t) som opfylder begyndelsesværdibetingelsen x0 (0) = 3 . Det
sker ved at indsætte begyndelsesværdien i den fuldstændige løsning, hvorved c bestemmes:

1 2
x0 (0) = 1 + ce 2 ·0 = 1+ c = 3 , c = 2. (16-40)
Derfor er den betingede løsningsfunktion til differentialligningen givet ved
1 2
x0 (t) = 1 + 2e 2t , t 2 R. (16-41)

Figuren nedenfor viser graferne for de syv løsninger som svarer til begyndelsesværdi-
betingelserne x0 (0) = b hvor b 2 { 3, 2, 1, 0, 1, 2, 3} . Den løsning vi netop fandt, er
den øverste. De øvrige findes på samme måde.
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 18

Eksempel 16.22 Et begyndelsesværdiproblem

I eksempel 16.19 fandt vi den fuldstændige løsning til differentialligningen

2 10
x 0 (t) + x (t) = 8t , t > 0, (16-42)
t t
nemlig
c
x (t) = 2t2 5+ , t>0
t2
hvor c er et vilkårligt reelt tal.

Vi vil nu finde den løsning x0 (t) som opfylder begyndelsesværdibetingelsen x0 (1) = 2 . Det
sker ved at indsætte begyndelsesværdien i den fuldstændige løsning, hvorved c bestemmes:
c
x 0 ( 1 ) = 2 · 12 5+
2 5+ c = 2 , c = 5. (16-43)
12
Derfor er den betingede løsningsfunktion til differentialligningen givet ved

5
x0 (t) = 2t2 5+ , t > 0. (16-44)
t2

Figuren nedenfor viser graferne for de syv løsninger som svarer til begyndelsesværdi-
betingelserne x0 (0) = b hvor b 2 { 4, 3, 2, 1, 0, 1, 2} . Den løsning vi netop fandt,
er den øverste. De øvrige findes på samme måde.
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 19

Eksempel 16.23 Det stationære svar

I eksempel 16.15 fandt vi den fuldstændige løsning til differentialligningen

x 0 (t) + x (t) = 1 + sin(2t), t 0 (16-45)

nemlig
2 1
x (t) = 1 cos(2t) + sin(2t) + ce t , t 0. (16-46)
5 5

Vi viser her en række løsninger med begyndelsesværdier fra -1 til 3 for t = 0 :

Figuren antyder at alle løsninger nærmer sig en periodisk svingning når t ! • . At dette er
tilfældet ses af differentialligningens løsningsmængde hvor det fjerde led ce t uanset valg af
c er forsvindende på grund af den negative eksponent. De første tre led udgør det stationære
svar.

I de tre foregående eksempler havde vi ikke problemer med at finde en løsning på differ-
entialligningen som opfyldte en given begyndelsesværdibetingelse. Faktisk så vi at der
for hver af de betragtede begyndelsesværdibetingelser fandtes netop én løsning som
opfyldte den. At dette gælder helt generelt, viser vi i den følgende sætning.
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 20

Sætning 16.24 Eksistens og entydighed af løsninger


Givet differentialligningen

x 0 ( t ) + p ( t ) x ( t ) = q ( t ), t2I (16-47)

hvor I er et åbent interval og p(t) og q(t) er kontinuerte funktioner på I . Da


gælder:

Til ethvert talsæt (t0 , b) findes der netop én (partikulær) løsning x0 (t) til differential-
ligningen som opfylder begyndelsesværdibetingelsen

x0 ( t0 ) = b . (16-48)

Bevis

Vi har fra sætning 16.16 at løsningsmængden til differentialligningen (16-47) er givet ved
Z
P(t)
x (t) = e eP(t) q(t)dt + ce P(t)
(16-49)

hvor c er et vilkårligt reelt tal.

Lad os først undersøge det ubestemte integral der indgår i formlen. Findes det? Det svarer til
at spørge: Findes der en stamfunktion til den funktion som står under integrationstegnet. Vi
må starte med p(t) . Da den er kontinuert, har den en stamfunktion som vi kalder P(t) . Som
stamfunktion er P(t) differentiabel og dermed kontinuert. Da også eksponentialfunktionen
er kontinuert, er den sammensatte funktion eP(t) kontinuert. Endelig, da q(t) er kontinuert,
er produktet eP(t) q(t) kontinuert.

Hermed er det vist at funktionen under integrationstegnet er kontinuert. Derfor har den
en stamfunktion. Ja, uendeligt mange stamfunktioner, som kun adskiller sig fra hinanden
med en konstant. Vi vælger en vilkårlig af dem og kalder den F (t) . Vi kan nu reformulere
løsningsformlen som
x (t) = e P(t) F (t) + ce P(t) (16-50)

hvor c er et vilkårligt reelt tal. Vi indsætter nu begyndelsesværdibetingelsen:


P ( t0 ) P ( t0 ) P ( t0 )
x ( t0 ) = e F (t0 ) + ce = b , c = F (t0 ) + be
eNote 16 16.6 BEGYNDELSESVÆRDIPROBLEMER 21

hvor vi først gangede med eP(t0 ) på begge sider af lighedstegnet og derefter isolerede c .
I den samlede løsningsmængde findes der altså netop én løsning der opfylder den givne
begyndelsesværdi betingelse, nemlig den der fremkommer når vi i (16-50) indsætter den
fundne værdi af c .

Hermed er beviset gennemført.

Opgave 16.25

Lad os igen betragte den lineære afbildning f : C1 ( I ) ! C0 ( I ) som repræsenterer venstres-


iden i en 1. ordens lineære differentialligning. Vi ved at ker ( f ) er éndimensional og har
basisvektoren e P(t) . Men hvad er så billedrummet for f ?

f ( x (t)) = x 0 (t) + p(t) x (t) (16-51)

Vi afslutter dette afsnit med et eksempel der viser hvordan det er muligt at "‘gå baglæns"’
fra en given løsningsmængde til den differentialligning den løser.

Eksempel 16.26 Fra løsning til differentialligning

Løsningsmængden til en lineær 1. ordens inhomogen differentialligning er givet ved

Linhom = x (t) = te 5t + ct , t > 0 c 2 R . (16-52)


Bestem den tilhørende differentialligning, som har formen

x0 (t) + p(t) x (t) = q(t) . (16-53)

(Altså bestem p(t) og q(t)).

Først betragtes den tilsvarende homogene differentialligning. Vi spotter straks via struk-
tursætningen at
Lhom = x (t) = ct , t > 0 c 2 R
eNote 16 16.7 ENDELIGT DIMENSIONALT DEFINITIONSRUM 22

Ved indsættelse af x (t) = ct i den homogene differentialligning x 0 (t) + p(t) x (t) = 0 fås

c + p(t)ct = 0 , (16-54)

og da denne ligning skal gælde for alle c

1
p(t) = . (16-55)
t

Da vi nu kender p(t) , mangler vi kun at bestemme højresiden q(t) . Ok, den finder vi ved at
indsætte den partikulære løsning x (t) = te 5t i differentialligningens venstreside.

5t 5t 1 5t 5t
e 5te · te = 5te = q(t) . (16-56)
t
Da nu både p(t) og q(t) er bestemt, er hele differentialligningen bestemt:

1 5t
x0 (t) x (t) = 5te , t > 0. (16-57)
t

16.7 Endeligt dimensionalt definitionsrum

I visse situationer ved man i forvejen hvilke typer af løsninger på differentialligningen


man er interesseret i at finde. Man kan derfor vælge at indskrænke definitionsrummet
C1 (R ) . Vi afslutter denne eNote med et eksempel hvor definitionsrummet er et endeligt
dimensionalt underrum i C1 (R ) hvilket giver anledning til introduktion af matrixme-
toder.

Eksempel 16.27 Løsning ved matrixregning

Der er givet differentialligningen

x 0 ( t ) + (1 2t) x (t) = 7t 4t3 . (16-58)

I dette eksempel er vi kun interesseret i løsninger der tilhører polynomiumsrummet P2 (R ) ,


dvs. det underrum i C1 (R ) som har monomiebasen (1, t, t2 ) .

For at finde billedrummet f ( P2 (R )) ved den lineære afbildning f som repræsenterer differ-
entialligningens venstreside, bestemmer vi først billederne af basisvektorerne:

f (1) = 1 2t , f (t) = 1 + t 2t2 og f (t2 ) = 2t + t2 2t3 .


eNote 16 16.7 ENDELIGT DIMENSIONALT DEFINITIONSRUM 23

Idet P3 (R ) har monomiebasen (1, t, t2 , t3 ) , og de fundne billeder ligger i dens udspænding,


ser vi at billedrummet f ( P2 (R )) er et underrum i P3 (R ) .

Vi skal løse ligningen


f ( x (t)) = 7t 4t3
som kan udtrykkes på matrixform ved

Fx = b

hvor F er afbildningsmatricen for f med hensyn til monomiebaserne i P2 (R ) og P3 (R ) ,


x er koordinatmatricen for det ukendte polynomium med hensyn til monomiebasen i
P2 (R ) , og b er koordinatmatricen for differentialligningens højreside med hensyn til
monomiebasen i P3 (R ) .

Differentialligningen kan dermed løses som et inhomogent lineært ligningssystem. De første


tre søjler i ligningssystemets totalmatrix T udgøres af F , mens den fjerde søjle er b :
2 3 2 3
1 1 0 0 1 0 0 1
6 2 1 2 77 60 1 0 17
T =6
4
7 ! trap(T) = 6 7.
0 2 1 05 40 0 1 25
0 0 2 4 0 0 0 0

Da rangen af T ses at være 3, har differentialligningen kun én løsning. Da fjerde søjle i


trap(T) angiver løsningens koordinatvektor med hensyn til monomiebasen i P2 (R ) , kan
løsningen umiddelbart aflæses
x0 (t) = 1 + t + 2t2 .

Opgave 16.28

1. Løs differentialligningen i eksempel 16.27 ved gættemetode eller Panserformlen.

2. Hvordan adskiller løsningsmængden sig fra den der blev fundet i eksemplet?
eNote 16 16.7 ENDELIGT DIMENSIONALT DEFINITIONSRUM 24

Opgave 16.29

Erstat højresiden i differentialligningen i eksempel 16.27 med funktionen q(t) = 1 .

1. Vis ved matrixregning at differentialligningen ikke har en løsning inden for det i ek-
semplet givne underrum P2 (R ) .

2. Find med Maple (eller anden software) den løsning x0 (t) til differentialligningen som
opfylder begyndelsesværdibetingelsen x0 (t) = 0 og tegn den.
eNote 17 1

eNote 17

Lineære 1. ordens
differentialligningssystemer

Denne eNote beskriver 1. ordens differentialligningssystemer og viser, hvordan de kan løses.


Der bruges egenværdier og egenvektorer i løsningsproceduren, se eNote 13 og eNote 14.
Version: 22.11.18

Vi vil her kigge på lineære koblede homogene differentialligninger af 1. orden med


konstante koefficienter (se eventuelt forklaring 17.1). Sådan en samling af koblede dif-
ferentialligninger kaldes et differentialligningssystem. Et differentialligningssystem af
1. orden med n ligninger ser principielt således ud:

x10 (t) = a11 x1 (t) + a12 x2 (t) + . . . + a1n xn (t)


x20 (t) = a21 x1 (t) + a22 x2 (t) + . . . + a2n xn (t)
.. .. .. .. (17-1)
. . . .
xn0 (t) = an1 x1 (t) + an2 x2 (t) + . . . + ann xn (t)

I systemets venstreside er differentialkvotienterne af de n ukendte funktioner x1 (t),


x2 (t), . . ., xn (t) linet op. Mens hver højreside er en linearkombination af de n ukendte
funktioner. Koefficienterne (a’erne) er reelle konstanter. I matrix-format kan systemet
skrives således: 2 0 3 2 32 3
x1 ( t ) a11 a12 . . . a1n x1 ( t )
6 x0 (t) 7 6 a 76 7
6 2 7 6 21 a22 . . . a2n 76 x2 (t) 7
6 .. 7 = 6 .. .. . . . 76 . 7 (17-2)
4 . 5 4 . . . .. 54 .. 5
xn0 (t) an1 an2 . . . ann xn (t)
eNote 17 2

Endnu mere kompakt skrives det

x0 (t) = Ax(t) (17-3)

A kaldes systemmatricen. Det er nu målet at løse et sådant differentialligningssystem,


altså bestemme x(t) = ( x1 (t), x2 (t), . . . , xn (t)).

Forklaring 17.1 Hvad er et differentialligningssystem?

Differentialligningssystemer er samlinger af differentialligninger. Grunden til, at


man ikke betragter differentialligningerne enkeltvis, er, at de ikke kan løses hver
for sig, fordi de samme ukendte funktioner optræder i flere ligninger. Altså er
ligningerne koblede. En enkelt differentialligning fra et system kan for eksempel se
således ud:
x10 (t) = 4x1 (t) x2 (t) (17-4)
Det er ikke muligt at bestemme hverken x1 (t) eller x2 (t), da der er to ukendte funk-
tioner, men kun én differentialligning.

For at kunne løse et sådant system fuldt ud, skal man have lige så mange ligninger,
som man har ukendte funktioner (med deres tilhørende afledede). Den anden lign-
ing i systemet kunne derfor være:

x20 (t) = 6x1 (t) + 2x2 (t) (17-5)

Vi har nu lige så mange ligninger (to), som vi har ukendte funktioner (to), og det er
nu muligt at bestemme både x1 (t) og x2 (t).

For overskuelighedens skyld skriver man differentialligningssystemer på matrix-


form. Systemet ovenfor ser således ud:
 0   
x1 ( t ) 4 1 x1 ( t ) 0 4 1
0 = , x (t) = x(t) = Ax(t) (17-6)
x2 ( t ) 6 2 x2 ( t ) 6 2

Ser man bort fra, at det er vektorer og matricer, der opereres med, ligner ligningssys-
temet noget, vi har set før: x 0 (t) = A · x (t), som man allerede kunne løse i gymnasiet.
Løsningen til denne differentialligning er triviel: x (t) = ce At , hvor c er en arbitrær
konstant. Nedenfor finder vi ud af, at løsningen til det tilsvarende system af differ-
entialligninger er sammenlignelig med x (t) = ce At .
eNote 17 3

Vi løser nu differentialligningssystemet i følgende sætning.

Sætning 17.2 Diagonaliseringsmetoden.


Et lineært differentialligningssystem bestående af n ligninger med i alt n ukendte
funktioner er givet ved
x0 (t) = Ax(t), t 2 R . (17-7)
Hvis A har n lineært uafhængige egenvektorer v1 , v2 , . . . , vn tilhørende (ikke nød-
vendigvis forskellige) egenværdier, l1 , l2 , . . . , ln , er systemets fuldstændige løs-
ning bestemt ved

x(t) = c1 el1 t v1 + c2 el2 t v2 + . . . + cn eln t vn , t 2 R, (17-8)

hvor c1 , c2 , . . . , cn er vilkårlige komplekse konstanter:

I sætningen er angivet den fuldstændige komplekse løsningsængde for differ-


entialligningssystemet. Den fuldstændige reelle løsningsængde kan derefter
findes som den reelle delmængde af den komplekse løsningsmængde. Hvis
alle egenværdierne i systemmatricen A er reelle, er den fuldstændige reelle
løsning umiddelbart givet ved (17.0.8) hvor koefficienterne c1 , c =2 . . . , cn er
reelle.

Læg mærke til, at det ikke altid er muligt, at finde n lineært uafhængige egen-
vektorer. Derfor kan man ikke altid bruge sætning 17.2 til løsning af differen-
tialligningssystemer af 1. orden.

Hvis systemmatricen A i (17.0.7) er symmetrisk, kan der altid findes n lineært


uafhængige egenvektorer, og alle egenværdierne er reelle. Derfor er den fuld-
stændige reelle løsning i det tilfælde umiddelbart givet ved (17.0.8) hvor koef-
ficienterne c1 , c =2 . . . , cn er reelle.
eNote 17 4

Bevis

Vi gætter på, at en løsning til differentialligningssystemet x0 (t) = Ax(t) er en vektor v ganget


på elt , hvor l er en konstant, så x(t) = elt v. Vi har da den differentierede

x0 (t) = lelt v . (17-9)

Sættes dette udtryk for x0 (t) ind i ligning (17-7) sammen med udtrykket for x(t) fås:

lelt v = Aelt v , Av lv = 0 , (A lE)v = 0 (17-10)

elt er forskellig for nul for ethvert t 2 R, hvorfor det kan divideres ud. Denne ligning er et
egenværdiproblem. l er en egenværdi til A og v er den tilhørende egenvektor. De kan begge
bestemmes. Det er nu lykkedes os at vise at elt v er én løsning til differentialligningssystemet,
når l er en egenværdi og v den tilhørende egenvektor til A.

Til at bestemme den fuldstændige løsningsmængde bruges den såkaldte diagonaliser-


ingsmetode:

Vi antager, at A = An⇥n har n lineært uafhængige (reelle eller komplekse) egenvektorer


v1 , v2 , . . . , vn hørende til egenværdierne l1 , l2 , . . . , ln . Vi indfører nu den regulære matrix V,
som indeholder alle egenvektorerne:
⇥ ⇤
V = v1 v2 · · · vn (17-11)

Endvidere indføres funktionen y, så y(t) = (y1 (t), y2 (t), . . . , yn (t)), således at

x(t) = Vy(t) (17-12)

Vi har da, at x0 (t) = Vy0 (t). Indsættes disse udtryk for x(t) og x0 (t) i ligning (17-7), fås
1
Vy0 (t) = AVy(t) , y0 (t) = V AVy(t) = Ly(t), (17-13)

hvor L = V 1 AV = diag(l1 , l2 , . . . ln ) er en diagonalmatrix med egenværdierne tilhørende


A.

Vi har nu ligningen y0 (t) = Ly(t), der kan skrives på følgende måde:

y10 (t) = l1 y1 (t)


y20 (t) = l2 y2 (t)
.. (17-14)
.
y0n (t) = ln yn (t)

da L kun har elementer forskellig fra nul i diagonalen. Dette ligningssystem er ikke koblet: I
hver ligning optræder kun én funktion og dens afledede. Derfor kan man løse dem enkeltvis,
og den fuldstændige løsningsmængde til hver ligning er y(t) = celt for alle c 2 C. Samlet
eNote 17 5

giver det den fuldstændige løsningsmængde bestående af nedenstående funktioner for alle
c1 , c2 , . . . , cn 2 C: 2 3 2 3
y1 ( t ) c 1 el1 t
6 y 2 ( t ) 7 6 c 2 el2 t 7
6 7 6 7
y( t ) = 6 . 7 = 6 . 7 (17-15)
.
4 . 5 4 . 5 .
yn (t) c n el n t
Da vi nu har løsningen y(t) kan vi også finde løsningen x(t) = Vy(t):
2 3
c 1 el1 t
l2 t
⇥ ⇤6
6 c2 e
7
7
x(t) = v1 v2 . . . vn 6 . 7
4 .. 5 (17-16)
cn el n t
l1 t l2 t
= c1 e v1 + c2 e v2 + . . . + cn eln t vn .

Vi har nu fundet den fuldstændige komplekse løsningsmængde til ligningssystemet i ligning


(17-7) som består af funktionerne x(t) for alle c1 , c2 , . . . , cn 2 C.

Eksempel 17.3

Der er givet differentialligningssystemet

x10 (t) = x1 (t) + 2x2 (t)


(17-17)
x20 (t) = 3x1 (t)

som på matrixform skrives som



1 2
x0 ( t ) = x(t) = Ax(t). (17-18)
3 0
Det kan vises, at A har egenværdierne l1 = 3 og l2 = 2 med de tilhørende egenvektorer
v1 = (1, 1) og v2 = (2, 3) (prøv selv!). Derfor er den fuldstændige reelle løsningsmængde
til differentialligningssystemet givet ved nedenstående funktioner for alle c1 , c2 2 R:
  
x1 ( t ) 3t 1 2t 2
x( t ) = = c1 e + c2 e , t2R (17-19)
x2 ( t ) 1 3
Løsningen er fundet ved brug af sætning 17.2. En anden måde at opskrive løsningsmængden
på er ved at skille ligningssystemet ad, så

x1 (t) = c1 e3t + 2c2 e 2t


(17-20)
x2 (t) = c1 e3t 3c2 e 2t
eNote 17 17.1 TO KOBLEDE DIFFERENTIALLIGNINGER 6

udgør løsningsmængden, hvor t 2 R, for alle c1 , c2 2 R.

17.1 To koblede differentialligninger

Givet et lineært homogent 1. ordens differentialligningssystem med konstante koeffi-


cienter med n ligninger og n ukendte funktioner

x0 (t) = Ax(t) . t2R (17-21)

Hvis systemmatricen A har n lineært uafhængige egenvektorer, kan systemets reelle løs-
ningsmængde findes ved hjælp af sætning 17.2. Hvis egenværdierne er reelle, kan den
reelle løsningsmængde umiddelbart opskrives efter sætningens formel (17.0.8), hvor de
de n tilhørende lineært uafhængige egenvektorer er reelle, og de arbitrære konstanter
angives som reelle. Hvis systemmatricen har egenværdier som ikke er reelle, kan den
reelle løsningsmænde finde2 ved at uddrage den reelle delmængde af den komplekse
løsningsmængde. Også i dette tilfælde vil løsningsmængden kunne opskrives som en
linearkombination af n lineært uafhængige reelle løsninger til differentialligningssys-
tem.

Tilbage har vi særtilfældet, hvor systemmatricen ikke har n lineært uafhængige egen-
vektorer. Også her vil den reelle løsningsmængde være en linearkombination af n
lineært uafhængige reelle løsninger til differentialligningssystemet. Her kan diagonalis-
eringsmetoden af gode grunde ikke benyttes, og man må bruge andre metoder.

I dette afsnit gennemgår vi de nævnte tre tilfælde for systemer der består af 2 koblede
differentialligninger med 2 ukendte funktioner.
eNote 17 17.1 TO KOBLEDE DIFFERENTIALLIGNINGER 7

Metode 17.4
Den fuldstændige reelle løsningsmængde til differentialligningssystemet

x0 (t) = Ax(t), t 2 R, (17-22)

bestående af 2 ligninger med 2 ukendte funktioner, kan opskrives som

x(t) = c1 u1 (t) + c2 u2 (t) , t 2 R, (17-23)

hvor u1 og u2 er reelle lineært uafhængige partikulære løsninger og c1 , c2 2 R.

Bestem først egenværdierne til A. For rødderne i det karakteristiske polynomium A


foreligger der tre muligheder:

• To reelle enkeltrødder. I så fald har begge egenværdier l1 og l2 algebraisk


multiplicitet 1 og geometrisk multiplicitet 1, og vi kan sætte

u1 (t) = el1 t v1 og u2 (t) = el2 t v2 , (17-24)

hvor v1 og v2 er egentlige egenvektorer tilhørende l1 og l2 respektivt.

• To komplekse rødder. De to egenværdier l og l̄ er da hinandens konjugerede


komplekse tal. Vi bestemmer da u1 og u2 ved hjælp af metode 17.5.

• En dobbeltrod. Her har egenværdien l algebraisk multiplicitet 2. Hvis den


geometriske multiplicitet af l er 1, bestemmes u1 og u2 ved hjælp af metode
17.7.

Ved den første mulighed i metode 17.4 med to forskellige reelle egenværdier, kan man
udmiddelbart benytte sætning 17.2, idet de arbitrære konstanter vælges som reelle, se
eksempel 17.3equation.17.0.17.

Nu følger metoden, der tager sig af tilfældet med to komplekse egenværdier.


eNote 17 17.1 TO KOBLEDE DIFFERENTIALLIGNINGER 8

Metode 17.5
To lineært uafhængige reelle løsninger til differentialligningssystemet

x0 (t) = Ax(t), t 2 R, (17-25)

hvor A har det komplekse egenværdipar l = a + bi og l̄ = a bi med tilhørende


egenvektorer v og v̄, er
⇣ ⌘
u1 (t) = Re elt v = eat (cos( bt)Re(v) sin( bt)Im(v))
⇣ ⌘ (17-26)
lt at
u2 (t) = Im e v = e (sin( bt)Re(v) + cos( bt)Im(v))

Beviset medtages i næste version af denne eNote.

Eksempel 17.6

Givet differentialligningssystemet

0 1 1
x (t) = x(t) = Ax(t) (17-27)
1 1
Vi ønsker at bestemme den fuldstændige reelle løsningsmængde.

Egenværdierne er bestemt til l = 1 + i henholdsvis l̄ = 1 i med de tilhørende egenvektorer


v = ( i, 1) henholdsvis v̄ = (i, 1). Det ses, at der er to komplekse egenværdier og dertil to
komplekse egenvektorer. Med l = 1 + i haves
  
i 0 1
v= = +i = Re(v) + iIm(v) (17-28)
1 1 0
Bruges metode 17.5 har vi da de to løsninger:
✓   ◆ 
0 1 sin(t)
u1 (t) = et cos(t) sin(t) = et (17-29)
1 0 cos(t)
✓   ◆ 
t 0 1 t cos(t)
u2 (t) = e sin(t) + cos(t) =e (17-30)
1 0 sin(t)
Den fuldstændige reelle løsningsmængde til differentialligningssystemet (17-27) er da givet
ved følgende funktioner for alle c1 , c2 2 R:
✓   ◆
t sin(t) cos(t)
x ( t ) = c 1 u1 ( t ) + c 2 u2 ( t ) = e c 1 + c2 , t2R (17-31)
cos(t) sin(t)
fundet ved hjælp af metode 17.4.
eNote 17 17.1 TO KOBLEDE DIFFERENTIALLIGNINGER 9

Endelig beskrives metoden der kan bruges, hvis systemmatricen har egenværdien l
med am(l) = 2 og gm(l) = 1, dvs. hvor diagonalisering ikke mulig.

Metode 17.7
Hvis systemmatricen A til differentialligningssystemet

x0 (t) = Ax(t), t 2 R, (17-32)

har en egenværdi l med algebraisk multiplicitet 2, men det tilhørende egenvektor-


rum kun har geometrisk multiplicitet 1, findes to lineært uafhængige løsninger til
differentialligningssystemet af formen:

u1 (t) = elt v
(17-33)
u2 (t) = telt v + elt b,

hvor v er egenvektoren tilhørende egenværdien l, og b er løsning til nedenstående


lineære ligningssystem:
(A lE)b = v (17-34)

Bevis

Det er åbenlyst, at den ene løsning til differentialligningssystemet er u1 (t) = elt v. Det svære
er at finde endnu en løsning.

Vi gætter på en løsning af formen

u2 (t) = telt v + elt b = elt (tv + b), (17-35)

hvor v er en egenvektor tilhørende l. Vi har da

u2 0 (t) = (elt + ltelt )v + lelt b = elt ((1 + lt)v + lb) (17-36)

Vi kontrollerer, om u2 (t) er en løsning ved at indsætte det i x0 (t) = Ax(t):

u2 0 (t) = Au2 (t) ,


(1 + lt)v + lb = A(tv + b) ,
(17-37)
t(lv Av) + (v + lb Ab) = 0 ,
lv Av = 0 ^ v + lb Ab = 0

Den første ligning kan nemt omformes til Av = lv, og den ses at være sand, da v er en
eNote 17 17.1 TO KOBLEDE DIFFERENTIALLIGNINGER 10

egenvektor tilhørende l. Den anden ligning omformes:

v + lb Ab = 0 ,
Ab lb = v , (17-38)
(A lE)b = v

Hvis b opfylder det foreskrevne ligningssystem, vil u2 (t) også være en løsning til differen-
tialligningssystemet. Vi har nu fundet to løsninger, og vi skal finde ud af, om de er lineært
uafhængige. Dette gøres ved et normalt linearitetskriterium: Hvis ligningen k1 u1 + k2 u2 = 0
kun har løsningen k1 = k2 = 0 er u1 og u2 lineært uafhængige.

k1 u1 + k2 u2 = 0 )
k1 e v + k2 (telt v + belt ) = 0 ,
lt
(17-39)
t ( k 2 v) + ( k 1 v + k 2 b) = 0 ,
k2 v = 0 ^ k1 v + k2 b = 0

Da v er en egenvektor, er den forskellig fra nulvektoren, og derfor er k2 = 0 ifølge den første


ligning. Den anden ligning er derved blevet reduceret til k1 v = 0, og med samme argument
haves k1 = 0. Derfor er de løsninger lineært uafhængige, og metoden er nu bevist.

Eksempel 17.8

Givet differentialligningssystemet

0 16 1
x (t) = x(t) = Ax(t). (17-40)
4 12

Egenværdierne bestemmes for A:

16 l 1
det(A lE) = = (16 l)(12 l) + 4
4 12 l (17-41)
2 2
=l 28l + 196 = (l 14) = 0

Der er altså kun én egenværdi, nemlig l = 14, selvom det er et 2 ⇥ 2-system. Egenvektorerne
bestemmes:    1
16 14 1 2 1 1 2
A 14E = = ! (17-42)
4 12 14 4 2 0 0
Man har da egenvektoren ( 12 , 1), eller v = (1, 2). Vi må altså konstatere, at egenværdien l
har algebraisk multiplicitet 2, men at det tilhørende vektorrum har geometrisk multiplicitet
1. For at bestemme to uafhængige løsninger til differentialligningsystemet kan metode 17.7
eNote 17 17.2 N-DIMENSIONALT LØSNINGSRUM 11

bruges.

Først løses følgende ligningssystem:


 
2 1 1
(A lE)b = v ) b= (17-43)
4 2 2
  1 1
2 1 1 1 2 2
! (17-44)
4 2 2 0 0 0
Dette giver b = (1, 1), hvis den frie variabel sættes til 1. De to løsninger er da

1
14t
u1 (t) = e
2
  (17-45)
14t 1 14t 1
u2 (t) = te +e .
2 1

Ved hjælp af metode 17.4 kan den fuldstændige løsningsmængde bestemmes til at være føl-
gende funktioner for alle c1 , c2 2 R:
 ✓  ◆
14t 1 14t 1 1
x(t) = c1 u1 (t) + c2 u2 (t) = c1 e + c2 e t + . (17-46)
2 2 1

17.2 n-dimensionalt løsningsrum

I det foregående afsnit har vi betragtet koblede systemer bestående af to lineære lign-
ingssystemer med to ukendte funktioner. Løsningsrummet er to-dimensionalt, idet det
kan opskrives som en linearkombination af to lineært uafhængige løsninger. Dette kan
generaliseres til vilkårlige systemer med n 2 koblede lineære differentialligninger
med n ukendte funtioner: Løsningsmængden er en linearkombination af netop n lineært
uafhængige løsninger. Dette formuleres i generel form i følgende sætning.
eNote 17 17.2 N-DIMENSIONALT LØSNINGSRUM 12

Sætning 17.9
Givet det lineære homogene 1. ordens differentialligningssystem med konstante
reelle koefficienter
x0 (t) = Ax(t), t 2 R, (17-47)
bestående af n ligninger og med i alt n ukendte funktioner. Den fuldstændige reelle
løsningsmængde til systemet er n-dimensionalt kan opskrives ved

x(t) = c1 u1 (t) + c2 u2 (t) + · · · + cn un (t), (17-48)

hvor u1 (t), u2 (t), . . . , un (t) er lineært uafhængige reelle løsninger til differentiallign-
ingssystemet, og c1 , c2 , . . . , cn 2 R.

Herunder er et eksempel med et koblet system af tre differentiallinger, der eksemplifi-


cerer sætning 17.9.

Eksempel 17.10 Advanced

Givet differentialligningssystemet
2 3
9 10 0
x0 ( t ) = 4 3 1 5 5x(t) = Ax(t) (17-49)
1 4 6

Vi ønsker at bestemme den fuldstændige reelle løsningsmængde til differentialligningssys-


temet. Egenværdierne og egenvektorene kan bestemmes og er som følger:

l1 = 4 : v1 = (10, 5, 1)
l2 = 1 : v2 = (5, 5, 3)

Desuden har l2 algebraisk multiplicitet 2, men det tilhørende egenvektorrum har geometrisk
multiplicitet 1. Fordi n = 3 skal vi bruge 3 lineært uafhængige løsninger til at danne den
fuldstændige løsningsmængde, som set i sætning 17.9. Egenværdierne betragtes hver for
sig:

1) Den første egenværdi, l1 = 4, har både geometrisk og algebraisk multiplicitet lig 1. Det
giver netop én løsning
2 3
10
u1 (t) = el1 t v1 = e 4t4 5 5 (17-50)
1
eNote 17 17.3 EKSISTENS OG ENTYDIGHED AF LØSNINGER 13

2) Den anden egenværdi, l2 = 1, har algebraisk multiplicitet 2, men geometrisk multiplicitet


1. Derfor kan vi bruge metode 17.7 til at finde to løsninger. Først bestemmes b:
2 3 2 3
10 10 0 5
(A l 2 E ) b = v2 ) 4 3 0 5 5b = 4 5 5 (17-51)
1 4 5 3

En partikulær løsning til dette ligningssystem er b = (0, 12 , 1). Med denne viden har vi
yderligere to lineært uafhængige løsninger til differentialligningssystemet:
2 3
5
l2 t t4 5
u2 ( t ) = e v2 = e 5
3
2 3 2 3 (17-52)
5 0
u3 (t) = tel2 t v2 + el2 t b = tet4 5 5+ et4 12 5
3 1

Det er op til læseren at vise, at de tre løsninger er lineært uafhængige.

Ifølge metode 17.9 er den fuldstændige reelle løsningsmængde udgjort af følgende linear-
kombination for alle c1 , c2 , c3 2 R:

x(t) = c1 u1 (t) + c2 u2 (t) + c3 u3 (t) (17-53)

Dette giver altså


2 3 2 3 0 2 3 2 31
10 5 5 0
x(t) = c1 e 4t4 5 5+ c2 et4 5 5+ c3 @tet4 5 5+ et4 12 5A (17-54)
1 3 3 1

hvor t 2 R og alle c1 , c2 , c3 2 R.

17.3 Eksistens og entydighed af løsninger

Ifølge struktursætningen 17.9 indeholder den fuldstændige løsningsmængde til et dif-


ferentialligningssystem med n ligninger n arbitrre konstanter. Hvis man har n begyn-
delsesvrdibetingelser, s kan konstanterne bestemmes, og vi får da en entydig løsning.
Dette formuleres i følgende eksistens- og entydighedssætning.
eNote 17 17.3 EKSISTENS OG ENTYDIGHED AF LØSNINGER 14

Sætning 17.11 Eksistens og entydighed afløsninger


Et 1. ordens differentialligningssystem bestående af n ligninger og n ukendte funk-
tioner med konstante koefficienter er givet ved

x0 (t) = Ax(t), t 2 I. (17-55)

For ethvert t0 2 I og ethvert talsæt y0 = (y1 , y2 , . . . , yn ) findes der netop én løsning


x(t) = ( x1 (t), x2 (t) . . . , xn (t) ) der opfylder begyndelsesværdibetingelsen

x(t0 ) = y0 , (17-56)

hvilket vil sige at

x1 ( t0 ) = y1 , x2 ( t0 ) = y2 , . . . , x n ( t0 ) = y n . (17-57)

Beviset udelades.

Eksempel 17.12

I eksempel 17.3equation.17.0.17 fandt vi den fuldstændige løsningsmængde til differential-


ligningssystemet

0 1 2
x (t) = x(t), t 2 R, (17-58)
3 0
nemlig
  
x1 ( t ) 3t 1 2t 2
x( t ) = = c1 e + c2 e , t2R (17-59)
x2 ( t ) 1 3
Vi ønsker nu at bestemme den entydige løsning x(t) = ( x1 (t), x2 (t)) som opfylder begyn-
delsesværdibetingelsen x(0) = ( x1 (0), x2 (0)) = (6, 6). Dette giver ligningssystemet
    
6 0 1 0 2 1 2 c1
= c1 e + c2 e = (17-60)
6 1 3 1 3 c2
Med sædvanlig GaussJordan-elimination fås
  
1 2 6 1 2 6 1 0 6
! ! (17-61)
1 3 6 0 5 0 0 1 0
Man får altså løsningen (c1 , c2 ) = (6, 0), og den entydige og betingede løsning er derfor

3t 1
x(t) = 6e , t 2 R, (17-62)
1
eNote 17 17.4 OMFORMNING AF N-TE ORDENS DIFFERENTIALLIGNINGER 15

hvilket er det samme som at

x1 (t) = 6e3t x2 (t) = 6e3t . (17-63)

I dette særtilfælde er de to funktioner altså identiske.

17.4 Omformning af lineære n-te ordens homogene


differentialligninger til et 1. ordens
differentialligningssystem

Med lidt snilde er det muligt at omforme en vilkårlig homogen n-te ordens differential-
ligning med konstante koefficienter til et differentialligningssystem, som kan løses ved
hjælp af denne note.

Metode 17.13
En n-te ordens lineær differentialligning,
( n 1) ( n 2)
x (n) ( t ) + an 1x (t) + an 2x ( t ) + · · · + a1 x 0 ( t ) + a0 x ( t ) = 0 (17-64)

for t 2 R, kan omformes til et 1. ordens differentialligningssystem, og systemet vil


se således ud:
2 0 3 2 32 3
x1 ( t ) 0 1 0 ··· 0 x1 ( t )
6 x0 (t) 7 6 0 0 1 ··· 0 7 6 7
6 2 7 6 76 x2 (t) 7
6 .. 7 6 .. .
.. .
.. ... . 7
.. 766 .
.. 7
(17-65)
6 . 7=6 . 7
6 0 7 6 76 7
4 xn 1 (t) 5 4 0 0 0 ··· 1 54 xn 1 (t) 5
0
xn (t) a0 a1 a2 · · · an 1 xn (t)

og x1 (t) = x (t).

Beviset for denne omskrivning er simpelt og giver god forståelse for omformningen.
eNote 17 17.4 OMFORMNING AF N-TE ORDENS DIFFERENTIALLIGNINGER 16

Bevis

Lad der være givet en n-te ordens differentialligning som i ligning (17-64). Vi indfører n
funktioner på denne måde:

x1 ( t ) = x ( t )
x2 (t) = x10 (t) = x0 (t)
x3 (t) = x20 (t) = x 00 (t)
.. .. (17-66)
. .
xn = xn0 = x (n 2) ( t )
1 (t) 2 (t)
xn (t) = xn0 (n 1) ( t )
1 (t) = x

Disse nye udtryk indsættes i differentialligningen (17-64):

xn0 (t) + an 1 xn (t) + an 2 xn 1 (t) + . . . + a1 x2 ( t ) + a0 x1 ( t ) = 0 (17-67)

Denne ligning kan sammen nu med ligningerne (17-66) skrives op på matrixform.


2 3 2 32 3
x10 (t) 0 1 0 ··· 0 x1 ( t )
6 x20 (t) 7 6 0 0 1 ··· 0 76 x2 ( t ) 7
6 7 6 76 7
6 .. 7 6 .. .. .. .. .. 76 .. 7
(17-68)
6 . 7=6 . . . . . 76 . 7
6 7 6 76 7
4 x0 ( t ) 5 4 0 0 0 ··· 1 54 xn 1 (t)
5
n 1
0
xn (t) a0 a1 a2 · · · an xn (t)
1

Metoden er nu bevist.

Eksempel 17.14

Givet en lineær differentialligning af 3. orden med konstante koefficienter:


x 000 (t) 4x 00 (t) 7x 0 (t) + 10x (t) = 0, t 2 R. (17-69)
Vi ønsker at bestemme den fuldstændige løsningsmængde. Derfor indføres funktionerne
x1 ( t ) = x ( t )
x2 (t) = x10 (t) = x 0 (t) (17-70)
x3 (t) = x20 (t) = x 00 (t)

På denne måde kan vi omskrive differentialligningen til


x30 (t) 4x3 (t) 7x2 (t) + 10x1 (t) = 0 (17-71)
eNote 17 17.4 OMFORMNING AF N-TE ORDENS DIFFERENTIALLIGNINGER 17

Og vi kan da samle de tre sidste ligninger i et ligningssystem.

x10 (t) = x2 ( t )
x20 (t) = x3 ( t ) (17-72)
x30 (t) = 10x1 (t) + 7x2 (t) + 4x3 (t)

Det skrives på matrixform på denne måde:


2 3
0 1 0
x0 ( t ) = 4 0 0 1 5x(t) (17-73)
10 7 4

Egenværdierne bestemmes til at være l1 = 2, l2 = 1 og l3 = 5. Den fuldstændige løs-


ningsmængde til differentialligningssystemet er ifølge sætning 17.2 givet ved følgende funk-
tioner for alle de arbitrære konstanter c1 , c2 , c3 2 R:
2t
x( t ) = c1 e v1 + c2 et v2 + c3 e5t v3 , t 2 R, (17-74)

hvor v1 , v2 , v3 er respektive egenvektorer.

Vi skal imidlertid kun bruge løsningsmængden til x1 (t) = x (t), hvorfor den tages ud af
systemet. Desuden indfører vi nu tre nye arbitrære konstanter k1 , k2 , k3 2 R, der skal gøre
det ud for produkterne mellem c’erne og egenvektorernes førstekoordinat. Resultatet bliver
således
x (t) = x1 (t) = k1 e 2t + k2 et + k3 e5t , t 2 R (17-75)
Dette udgør den fuldstændige løsningsmængde til differentialligningen (17-69). Hvis
førstekoordinaten i v1 er 0 sættes k1 = 0 , i modsat fald kan k1 være et vilkårligt reelt tal.
På samme måde med k2 og k3 .
eNote 18 1

eNote 18

Lineære 2. ordens differentialligninger


med konstante koefficienter

I forlængelse af eNote 16 og eNote 17 om differentialligninger, behandler vi her 2. ordens


differentialligninger. Dele af bevisførelser m.m. læner sig op af de foregående eNoter, hvorfor det
forudsættes, at man har kendskab til dem. Endvidere benyttes de komplekse tal, se eNote 1.

Version 29.11.19.

18.1 Lineære 2. ordens differentialligninger

Lineære 2. ordens differentialligninger med konstante koefficienter har følgende ud-


seende:
x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, q : I ! R . (18-1)
a0 , a1 2 R er konstante koefficienter til x (t) henholdsvis x 0 (t). Højresiden q(t) er en
kontinuert reel funktion, hvis definitionsmængde er et interval I (som undertiden er
hele R ). Differentialligningen kaldes homogen, hvis q(t) = 0 for alle t 2 I , og i modsat
fald inhomogen.

At denne type differentialligning er lineær, vises ved, at dens venstreside opfattet som
en afbildning f : C • (R ) ! C • (R ) givet ved
f x (t) ) = x 00 (t) + a1 x 0 (t) + a0 x (t) (18-2)
opfylder linearitetsbetingelserne L1 og L2 . Den fremgangsmåde, der benyttes i denne
eNote til at løse den inhomogene differentialligning, udnytter denne egenskab.
eNote 18 18.2 DEN HOMOGENE DIFFERENTIALLIGNING 2

Metode 18.1 Løsninger og deres struktur

1. Den fuldstændige løsningsmængde Lhom for en homogen lineær 2. ordens dif-


ferentialligning
x 00 (t) + a1 x 0 (t) + a0 x (t) = 0, t 2 I , (18-3)
hvor a0 , a1 2 R , kan bestemmes ved hjælp af sætning 18.2.

2. Den fuldstændige løsningsmængde Linhom for en inhomogen lineær 2. ordens


differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, q : I ! R, (18-4)

hvor a0 , a1 2 R , kan ved hjælp af sætning 16.2.7 opdeles i to:

(a) Først bestemmes den fuldstændige løsningsmængde Lhom til den


tilsvarende homogene differentialligning. Denne fremkommer ved, at man
i (18.1.4) erstatter q(t) med 0 .
(b) Dernæst bestemmes en partikulær løsning x0 (t) til (18.1.4) for eksempel
ved et kvalificeret gæt. Se angående dette afsnit 18.3.

Den fuldstændige løsning har da følgende struktur

Linhom = x0 (t) + Lhom . (18-5)

18.2 Den homogene differentialligning

Vi betragter nu den lineære homogene 2. ordens differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = 0, t 2 R, (18-6)

hvor a0 og a1 er reelle konstanter. Vi ønsker at bestemme den fuldstændige løsningsmængde.


Det kan gøres ved hjælp af eksakte formler, som afhænger af ligningens udseende.
eNote 18 18.2 DEN HOMOGENE DIFFERENTIALLIGNING 3

Sætning 18.2 Løsning til den homogene ligning


Den homogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = 0, t 2 R, (18-7)

har den såkaldte karakterligning

l2 + a1 l + a0 = 0. (18-8)

Typen af rødder til denne ligning afgør udseendet af den fuldstændige løs-
ningsmængde Lhom til den homogene differentialligning.

• To forskellige reelle rødder l1 og l2 giver løsningen

x ( t ) = c 1 el1 t + c 2 el2 t , t 2 R. (18-9)

• To komplekse rødder l = a ± bi giver den reelle løsning

x (t) = c1 eat cos( bt) + c2 eat sin( bt), t 2 R. (18-10)

• Dobbeltroden l giver løsningen

x (t) = c1 elt + c2 telt , t 2 R. (18-11)

For alle tre tilfælde gælder, at de respektive funktioner for alle c1 , c2 2 R udgør den
fuldstændige løsningsmængde Lhom .

I afsnit 17.4.64section.17.4 gennemgås teorien for at omforme netop denne type


differentialligning til et system af 1. ordens differentialligninger. Det er en
brugbar metode her. Systemet vil da se således ud:
 0  
x1 ( t ) 0 1 x1 ( t )
0 = (18-12)
x2 ( t ) a0 a1 x2 ( t )

hvor x1 (t) = x (t) og x2 (t) = x10 (t) = x 0 (t). Vi kan nu bruge teorien i det
nævnte afsnit til at løse problemet.
eNote 18 18.2 DEN HOMOGENE DIFFERENTIALLIGNING 4

Bevis

Den homogene 2. ordens lineære differentialligning (18-7) omformes til et 1. ordens differen-
tialligningsystem:
 0   
x1 ( t ) 0 1 x1 ( t ) x (t)
0 = =A 1 (18-13)
x2 ( t ) a0 a1 x2 ( t ) x2 ( t )
hvor x1 (t) = x (t) er den søgte løsning, som udgør den fuldstændige løsning. Bevisførelsen
tager udgangspunkt i sætningerne og metoderne i afsnit 17.1. Til det skal man bruge egen-
værdierne til systemmatricen A:

l 1
det(A lE) = = l2 + a1 l + a0 = 0, (18-14)
a0 a1 l

hvilket netop er karakterligningen tilhørende differentialligningen, og l er egenværdier til


systemmatricen A. Røddernes udseende i denne ligning er afgørende for løsningen x (t) =
x1 (t), hvilket giver følgende tre delbeviser:

Første del
Karakterligningen har to forskellige reelle rødder: l1 og l2 . Ved hjælp af metode 17.4 findes
derved to lineært uafhængige løsninger u1 (t) = v1 el1 t og u2 (t) = v2 el2 t , hvor v1 og v2
er egenvektorer tilhørende de to egenværdier respektivt. Den fuldstændige løsning er da
udspændt af:
x(t) = k1 u1 (t) + k2 u2 (t) = k1 el1 t v1 + k2 el2 t v2 , (18-15)
for alle k1 , k2 2 R. Førstekoordinaten x1 (t) = x (t) er den søgte løsning:

x 1 ( t ) = x ( t ) = c 1 el1 t + c 2 el2 t , (18-16)

der for alle de arbitrære konstanter c1 , c2 2 R udgør den fuldstændige løsning. c1 og c2 er to


nye indførte arbitrære konstanter, og de er produktet mellem k-konstanterne og egenvektor-
ernes førstekoordinat: c1 = k1 v11 og c2 = k2 v21 .

Anden del
Karakterligningen har det komplekse rodpar l = a + bi og l̄ = a bi. Den fuldstændige
løsning er mulig at finde med metode 17.5.

x(t) = k1 u1 (t) + k2 u2 (t)


= k1 eat (cos( bt)Re(v) sin( bt)Im(v)) + k2 eat (sin( bt)Re(v) + cos( bt)Im(v)) (18-17)
at at
= e cos( bt) · (k1 Re(v) + k2 Im(v)) + e sin( bt) · ( k1 Im(v) + k2 Re(v)).

v er en egenvektor tilhørende l og k1 og k2 er arbitrære konstanter. Førstekoordinaten x1 (t) =


x (t) er den søgte løsning, og er med ovenstående givet ved

x1 (t) = x (t) = c1 eat cos( bt) + c2 eat sin( bt). (18-18)


eNote 18 18.2 DEN HOMOGENE DIFFERENTIALLIGNING 5

For alle c1 , c2 2 R udgør x (t) den fuldstændige løsning. c1 og c2 er to nye indførte arbitrære
konstanter, som er givet ved c1 = k1 Re(v1 ) + k2 Im(v1 ) og c2 = k1 Im(v1 ) + k2 Re(v1 ). v1 er
førstekoordinaten til v.

Tredje del
Karakterligningen har dobbeltroden l. Pga. systemmatricens udseende (matricen er ækvi-
valent med en øvre trekantsmatrix) er det muligt at se, at den geometriske multiplicitet af
det tilhørende egenvektorrum er 1, og det er da muligt at bruge metode 17.7 til at finde den
fuldstændige løsning

x(t) = k1 u1 (t) + k2 u2 (t) = k1 elt v + k2 (telt v + elt b) = elt (k1 v + k2 b) + k2 telt v, (18-19)

hvor v er en egenvektor tilhørende l, b er løsning til ligningssystemet (A lE)b = v og


k1 , k2 er to arbitrære konstanter. Udtages førstekoordinaten, fås

x (t) = c1 elt + c2 telt , (18-20)

der for alle c1 , c2 2 R udgør den fuldstændige løsning. c1 og c2 er to nye indførte arbitrære
konstanter, givet ved c1 = k1 v1 + k2 b1 og c2 = k2 v1 , hvor v1 er førstekoordinaten i v, ligesom
b1 er førstekoordinaten i b.

Alle de tre forskellige tilfælde af rødder i karakterligningen er nu gennemgået, og sætningen


er derfor bevist.

Læg mærke til, at det også er muligt at nå frem til karakterligningen ved at gætte på
en løsning til differentialligningen med formen x (t) = elt . Man får da følgende:

x 00 (t) + a1 x 0 (t) + a0 x (t) = 0 ) l2 elt + a1 lelt + a0 elt = 0 (18-21)

Divideres denne ligning igennem med elt , der er forskelligt fra nul for ethvert t,
fremkommer karakterligningen.

Eksempel 18.3 Løsning til homogen ligning

Givet den homogene differentialligning

x 00 (t) + x 0 (t) 20x (t) = 0, t 2 R, (18-22)

som har karakterligningen


l2 + l 20 = 0. (18-23)
eNote 18 18.2 DEN HOMOGENE DIFFERENTIALLIGNING 6

Vi ønsker at bestemme den fuldstændige løsningsmængde Lhom til denne homogene differ-
entialligning.

Karakterligningen har rødderne l1 = 5 og l = 4. Derfor er den fuldstændige løs-


ningsmængde til den homogene differentialligning

Lhom = c1 e 5t + c2 e4t , t 2 R c1 , c2 2 R , (18-24)

som er fundet ved hjælp af sætning 18.2.

Eksempel 18.4 Løsning til homogen ligning

Givet er den homogene 2. ordens differentialligning med konstante koefficienter

x 00 (t) 8x 0 (t) + 16x (t) = 0, t 2 R. (18-25)

Vi ønsker at bestemme Lhom , som er den fuldstændige løsning til denne homogene differen-
tialligning. Karakterligningen er

l2 8l + 16 = 0 , (l 4)2 = 0 (18-26)

Vi har altså dobbeltroden l = 4, og den fuldstændige løsning er følgende funktioner for alle
c1 , c2 2 R:
x (t) = c1 e4t + c2 te4t , t 2 R. (18-27)
Resultatet er bestemt ved hjælp sætning 18.2.

Som det ses er det forholds trivielt at bestemme løsningen til den homogene differen-
tialligning. Det er oven i købet muligt at bestemme differentialligningen, hvis man har
løsningen, altså “gå baglæns”. Det illustreres i nedenstående eksempel.

Eksempel 18.5 Fra løsning til ligning

Løsningen til en differentialligning kendes:

x (t) = c1 e2t cos(7t) + c2 e2t sin(7t), t 2 R, (18-28)

som for de arbitrære konstanter c1 , c2 udgør den fuldstændige løsning.

Siden løsningen udelukkende indeholder led med arbitrære konstanter, må differential-


ligningen være homogen. Endvidere ses, at løsningsstrukturen ligner den i (18-10) i sætning
18.2. Det betyder, at karakterligningen til den 2. ordens differentialligning har to komplekse
eNote 18 18.3 DEN INHOMOGENE LIGNING 7

rødder: l = 2 ± 7i. Karakterligningen sættes op:

(l 2 + 7i )(l 2 7i ) = (l 2)2 (7i )2 =


(18-29)
l2 4l + 4 + 49 = l2 4l + 53 = 0

Direkte ud fra karakterligningens koefficienter kan differentialligningen opstilles:

x 00 (t) 4x 0 (t) + 53x (t) = 0, t 2 R. (18-30)

Det ses også af sætning 18.2.

18.3 Den inhomogene ligning

I dette afsnit ønsker vi at bestemme en partikulær løsning x0 (t) til den inhomogene
differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, q : I ! R. (18-31)

Vi ønsker at finde en partikulær løsning, fordi den indgår i den fuldstændige løsnings
Linhom sammen med den fuldstændige løsningsmængde Lhom til den tilsvarende homo-
gene differentialligning jævnfør metode 18.1.4evncount.18.1.

I denne eNote bruges ikke nogen konkret løsningsformel a la Panserformlen for 1. or-
dens differentialligninger, i stedet bruges forskellige metoder, alt efter formen af q(t).
Generelt kan man sige, at den partikulære løsning x0 (t) har en form som ligner q(t),
hvilket fremgår af følgende metoder. Læg mærke til, at disse metoder dækker nogle
ofte forekommende former på q(t), men ikke alle.

Endvidere vil begrebet superpositionsprincippet blive behandlet. Superposition er en


grundlæggende egenskab ved lineære ligninger. Pointen er at opsplitte en differen-
tialligning i flere, hvor venstresiderne er ens, mens summen af højresiderne er lig den
oprindelige differentiallignings højreside. Hvis den oprindelige differentialligning har
højresiden q(t) = sin(2t) + 2t2 , kan det være en ide, at opdele differentialligningen i
to, hvor højresiderne bliver q1 (t) = sin(2t) henholdsvis q2 (t) = 2t2 . De to differential-
ligninger er nemmere at bestemme partikulære løsninger til. En partikulær løsning til
den egentlige differentialligning vil da være summen af de to partikulære løsninger.

Slutteligt vil den komplekse gættemetode blive introduceret. Den komplekse gættemetode
kan bruges, hvis højresiden q(t) i differentialligningen er realdelen af et simplere kom-
plekst udtryk. Det kunne for eksempel være, at q(t) = et sin(3t), som er realdelen af
ie(1+3i)t . Det er nemmere at finde en løsning til en differentialligning, hvor højresiden
eNote 18 18.3 DEN INHOMOGENE LIGNING 8

er simpel, og derfor løses den tilsvarende komplekse ligning i stedet. Løsningerne til
den reelle differentialligning og den tilsvarende komplekse differentialligning er nært
forbundet.

18.3.1 Generelle løsningsmetoder

Metode 18.6 Polynomium


Givet den inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, (18-32)

hvor q er et n-te gradspolynomium. Hvis a0 6= 0 findes der et polynomium af grad


n som er en partikulær løsning til differentialligningen. Generelt findes der et poly-
nomium af grad højst n + 2 som er en partikulær løsning til differentialligningen.
Man finder partikulære løsninger på de nævnte former ved at indsætte polynomier
af passende grad med ubekendte koefficienter i differentialligningens venstreside
og afstemme med q , jf. identitetssætningen for polynomier, eNote 2, sætning 2.15.

Eksempel 18.7 Polynomium

Der er givet en inhomogen 2. ordens differentialligning med konstante koefficienter


x 00 (t) 3x 0 (t) + x (t) = 2t2 16t + 25, t 2 R. (18-33)
Vi ønsker at bestemme en partikulær løsning x0 (t) til den inhomogene differentialligning.
Da højresiden er et andengradspolynomium, indsætter vi et ubekendt polynomium af grad
2 i differentialligningens venstreside og afstemmer med højresiden:
x0 (t) = b2 t2 + b1 t + b0 , t 2 R. (18-34)
Koefficienterne bestemmes ved at indsætte udtrykket i differentialligningens venstreside
sammen med x00 (t) = 2b2 t + b1 og x000 (t) = 2b2 .
2b2 3(2b2 t + b1 ) + b2 t2 + b1 t + b0 = 2t2 16t + 25 ,
(b2 2)t2 + ( 6b2 + b1 + 16)t + (2b2 3b1 + b0 25) = 0 , (18-35)
b2 2 = 0 og 6b2 + b1 + 16 = 0 og 2b2 3b1 + b0 25 = 0
eNote 18 18.3 DEN INHOMOGENE LIGNING 9

Den første ligning giver nemt b2 = 2, hvilket indsat i den anden ligning giver b1 = 4.
Slutteligt giver dette i den sidste ligning, at b0 = 9. Derfor er en partikulær løsning til ligning
(18-33) givet ved
x0 (t) = 2t2 4t + 9, t 2 R. (18-36)

Opgave 18.8 Polynomium

Der er givet følgende differentialligning hvor højresiden er et førstegradspolynomium:

x 00 (t) = t + 1 , t 2 R. (18-37)

Vis at man kan skal op i grad 3 for at finde et polynomium som er en partikulær løsning til
differentialligningen.

Metode 18.9 Trigonometrisk


En partikulær løsning x0 (t) til den inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, (18-38)

hvor q(t) = a cos(wt) + b sin(wt), har samme form:

x0 (t) = A sin(wt) + B cos(wt), t 2 I, (18-39)

hvor A og B bestemmes ved at indsætte udtrykket for x0 (t) som løsning i den inho-
mogene differentialligning.

Det er også muligt at bestemme en partikulær løsning til en differentialligning


som den i metode 18.9 ved hjælp af den komplekse gættemetode. Se eventuelt
afsnit 18.3.3.

Eksempel 18.10 Trigonometrisk

Givet er differentialligningen

x 00 (t) + x 0 (t) x (t) = 20 sin(3t) + 6 cos(3t), t 2 R. (18-40)


eNote 18 18.3 DEN INHOMOGENE LIGNING 10

En partikulær løsning x0 (t) til differentialligningen ønskes bestemt. Ved hjælp af metode
18.9 er en partikulær løsning

x0 (t) = A sin(wt) + B cos(wt) = A sin(3t) + B cos(3t). (18-41)

Vi har desuden
x00 (t) = 3A cos(3t) 3B sin(3t)
(18-42)
x000 (t) = 9A sin(3t) 9B cos(3t)
Dette indsættes i differentialligningen.

( 9A sin(3t) 9B cos(3t)) + (3A cos(3t) 3B sin(3t)) ( A sin(3t) + B cos(3t))


= 20 sin(3t) + 6 cos(3t) ,
(18-43)
( 9A 3B A + 20) sin(3t) + ( 9B + 3A B 6) cos(3t) = 0 ,
9A 3B A + 20 = 0 og 9B + 3A B 6=0
3
Dette er to ligninger med to ubekendte. Indsættes A = 10 B + 2 fra den første ligning i den
anden fås
✓ ◆
3 9
9B + 3 B+2 B 6 = 0 , 10B B=0,B=0 (18-44)
10 10

Af dette fås A = 2, og en partikulær løsning til differentialligningen er da

x0 (t) = 2 sin(3t), t 2 R. (18-45)

Læg mærke til at tallet w = 3 er det samme under både cosinus og sinus
i eksempel 18.10, hvilket også er det eneste metode 18.9 faciliterer. Hvis
der optræder to forskellige tal er metode 18.9 ikke brugbar, for eksempel
q(t) = 3 sin(t) + cos(10t). Det er superpositionsprincippet eller den komplekse
gættemetode til gengæld, og dette bliver beskrevet i afsnit 18.3.2 og afsnit 18.3.3.
eNote 18 18.3 DEN INHOMOGENE LIGNING 11

Metode 18.11 Eksponentialfunktion


En partikulær løsning x0 (t) til den inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, (18-46)

hvor q(t) = beat og a, b 2 R, er også en eksponentialfunktion:

x0 (t) = geat , t 2 I, (18-47)

hvor g bestemmes ved indsættelse af udtrykket for x0 (t) som løsning i den inhomo-
gene differentialligning. Det præciseres, at a ikke må være rod i differentiallignin-
gens karakterligning.

Som det kommenteres til sidst i metode 18.11 må eksponenten a ikke være
rod i karakterligningen. Hvis det er tilfældet vil gættet være en løsning til
den tilsvarende homogene differentialligning jævnfør sætning 18.2. Dette er et
gennemgående “problem” i alle ordener af differentialligninger.

Eksempel 18.12 Eksponentialfunktion

Givet er differentialligningen

x 00 (t) + 11x 0 (t) + 5x (t) = 20e t , t 2 R. (18-48)

Vi ønsker at bestemme en partikulær løsning x0 (t) til differentialligningen. Ifølge metode


18.11 er en partikulær løsning givet ved x0 (t) = geat = ge t . Vi ved endnu ikke om a = 1
er rod i karakterligningen, men hvis det gr godt med at finde g, er den ikke. Vi har x00 (t) =
ge t og x000 (t) = ge t , og dette indsættes i differentialligningen:
t
ge + 11( ge t ) + 5ge t
= 20e t
, 5g = 20 , g = 4 (18-49)

Det er altså lykkedes at bestemme g, og derfor haves en partikulær løsning til differential-
ligningen:
x0 (t) = 4e t , t 2 R. (18-50)
eNote 18 18.3 DEN INHOMOGENE LIGNING 12

Metode 18.13 Uheldig eksponentialfunktion


En partikulær løsning x0 (t) til den inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, (18-51)

hvor q(t) = belt , b 2 R og l er rod i differentialligningens karakterligning, har


følgende form:
x0 (t) = gtelt , t 2 I, (18-52)
hvor g bestemmes ved indsættelse af udtrykket for x0 (t) som løsning i den inhomo-
gene differentialligning.

Eksempel 18.14 Uheldig eksponentialfunktion

Givet er differentialligningen

x 00 (t) 7x 0 (t) + 10x (t) = 3e2t , t 2 R. (18-53)

Vi ønsker at bestemme en partikulær løsning til differentialligningen. Vi prøver først at bruge


metode 18.11, og gætter på en løsning af formen x0 (t) = geat = ge2t . Man har da x00 (t) =
2ge2t og x000 (t) = 4ge2t , hvilket ved indsættelse i differentialligningen giver

4ge2t 7 · 2ge2t + 10ge2t = 3e2t , 0 = 3 (18-54)

Det ses at g ikke optræder i den sidste ligning, og at ligningen i øvrigt er usand. Derfor må
a = l være rod i karakterligningen. Karakterligningen ser således ud:

l2 7l + 10 = 0 (18-55)

Denne andengradsligning har rødderne 2 og 5. Det passer altså, at a = 2 er rod.

På grund af overstående bruges nu metode 18.13, og vi gætter på en løsning af formen x0 (t) =


gtelt = gte2t . Vi har da

x00 (t) = ge2t + 2gte2t


(18-56)
x000 (t) = 2ge2t + 2ge2t + 4gte2t = 4ge2t + 4gte2t

Dette indsættes i differentialligningen for at bestemme g.

4ge2t + 4gte2t 7(ge2t + 2gte2t ) + 10gte2t = 3e2t ,


(4g 14g + 10g)t + (4g 7g + 3) = 0 , (18-57)
g=1
eNote 18 18.3 DEN INHOMOGENE LIGNING 13

Det er nu lykkedes at finde g, og derfor er en partikulær løsning til differentialligningen

x0 (t) = te2t , t 2 R. (18-58)

18.3.2 Superpositionsprincippet

Inden for alle typer af lineære differentialligninger findes konceptet superpositionsprin-


cippet. Vi gennemgår det her for 2. ordens lineære differentialligninger med konstante
koefficienter. Superpositionsprincippet bruges her til at bestemme en partikulær løs-
ning til den inhomogene differentialligning, når højresiden (q(t)) er en kombination
(addition) af flere typer af funktioner, f.eks. en sinusfunktion lagt sammen med et poly-
nomium.

Sætning 18.15 Superpositionsprincippet


Hvis x0i (t) er en partikulær løsning til den inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = qi (t) (18-59)

for ethvert i = 1, . . . , n, er

x0 (t) = x01 (t) + x02 (t) + . . . + x0n (t) (18-60)

en partikulær løsning til

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t) = q1 (t) + q2 (t) + . . . + qn (t), (18-61)

hvor højresiderne q og q1 , q2 , . . . , qn er kontinuerte funktioner i et interval I.

Bevis

Superposition er en følge af at differentialligningerne er lineære. Vi gennemfører her et


generelt bevis for alle typer af lineære differentialligninger.
eNote 18 18.3 DEN INHOMOGENE LIGNING 14

Venstresiden af en differentialligning kaldes f ( x (t)). Vi opstiller nu n differentialligninger:

f ( x01 (t)) = q1 (t), f ( x02 (t)) = q2 (t), . . . , f ( x0n (t)) = qn (t) (18-62)

hvor x01 , x02 , . . . , x0n er partikulære løsninger til de respektive inhomogene differential-
ligninger. Vi definerer nu x0 = x01 + x02 + . . . + x0n og indsætter denne i venstresiden:

f ( x0 (t)) = f ( x01 (t) + x02 (t) + . . . + x0n (t))


= f ( x01 (t)) + f ( x02 (t)) + . . . + f ( x0n (t)) (18-63)
= q1 ( t ) + q2 ( t ) + . . . + q n ( t )

På højresiden fås en sum af funktionerne q1 , q2 , . . . , qn , som kaldes for q. Sætningen er da


bevist.

Eksempel 18.16 Superposition

Givet er den inhomogene differentialligning

x 00 (t) x0 (t) 3x (t) = 9e4t + 3t 14, t 2 R. (18-64)

Vi ønsker at bestemme en partikulær løsning x0 (t) til differentialligningen. Det ses, at


højresiden er en kombination af en eksponentialfunktion (q1 (t) = 9e4t ) og et polynomium
(q2 (t) = 3t 14). Derfor bruges superpositionsprincippet fra sætning 18.15 og differential-
ligningen opsplittes i to dele.

x 00 (t) x0 (t) 3x (t) = 9e4t = q1 (t) (18-65)


00 0
x (t) x (t) 3x (t) = 3t 14 = q2 (t) (18-66)

Først behandles ligning (18-65), hvortil vi skal bruge metode 18.11. En partikulær løsning er
da af formen x01 (t) = geat = ge4t . Vi har x00 1 (t) = 4ge4t og x0001 (t) = 16ge4t . Dette indsættes i
ligningen.
16ge4t 4ge4t 3ge4t = 9e4t , g = 1 (18-67)
Derfor er x01 (t) = e4t .

Nu behandles ligning (18-66), hvor en partikulær løsning er et polynomium af højst grad 1,


jævnfør metode 18.6, alts er x02 (t) = b1 t + b0 . Derfor er x00 2 (t) = b1 og x0002 (t) = 0. Dette
indsættes i differentialligningen.

0 b1 3(b1 t + b0 ) = 3t 14 , ( 3b1 3)t + ( b1 3b0 + 14) = 0 (18-68)

Vi har således to ligninger med to ubekendte, og vi finder, at b1 = 1, og derfor er b0 = 5.


Altså er en partikulær løsning x02 (t) = t + 5. Den samlede partikulære løsning til (18-64)
eNote 18 18.3 DEN INHOMOGENE LIGNING 15

findes da som summen af de to allerede fundne partikulære løsninger til de to opsplittede


ligninger:
x0 (t) = x01 (t) + x02 (t) = e4t t + 5, t 2 R. (18-69)

18.3.3 Den komplekse gættemetode

Den komplekse gættemetode benyttes når det er bekvemt at omskrive differentiallignin-


gens højreside til en kompleks højreside, således at den givne reelle højreside er realde-
len af den komplekse.

Er højresiden for eksempel 2e2t cos(3t) , og man til denne lægger i ( 2e2t sin(3t)) , fås

2e2t (cos(3t) i sin(3t)) = 2e(2 3i )t


. (18-70)

Her gælder der klart nok at Re(2e(2 3i)t ) = 2e2t cos(3t) . Man finder nu en kompleks
partikulær løsning til differentialligningen med den komplekse højreside. Den ønskede
reelle partikulære løsning til den oprindelige differentialligning er da realdelen af den
fundne komplekse løsning.

Bemærk at denne metode kan kun benyttes fordi differentialligningen er lineær. Det
er netop lineariteten der sikrer at realdelen af den fundne komplekse løsning er den
ønskede reelle løsning. Dette vises ved at vi opfatter differentialligningens venstreside
som en lineær afbildning f (z(t)) i mængden af komplekse funktioner af en reel variabel
og bruger følgende generelle sætning:

Sætning 18.17
Der er givet en lineær afbildning f : (C • (R ), C ) ! (C • (R ), C ) og ligningen

f (z(t)) = s(t) . (18-71)

Hvis vi sætter z(t) og s(t) på rektangulær form ved z(t) = x (t) + i · y(t) og s(t) =
q(t) + i · r (t) , så gælder der at (18.3.71) sand hvis og kun hvis

f ( x (t)) = q(t) og f (y(t)) = r (t) . (18-72)


eNote 18 18.3 DEN INHOMOGENE LIGNING 16

Bevis

Givet er funktionen z(t) og Lad den lineære afbildning f og funktionerne z(t) og s(t) være
givet som i sætning 18.17. Som følge af egenskaberne ved lineære afbildninger, se definition
??, gælder der følgende:

f (z(t)) = s(t) ,
f ( x (t) + i · y(t)) = q(t) + i · r (t) ,
(18-73)
f ( x (t)) + i · f (y(t)) = q(t) + i · r (t) ,
f ( x (t)) = q(t) og f (y(t)) = r (t) .

Sætningen er dermed bevist.

Metode 18.18 Den komplekse gættemetode


En partikulær løsning x0 (t) til den reelle inhomogene differentialligning

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 R, (18-74)

hvor a0 og a1 er reelle koefficienter og


⇣ ⌘
q(t) = Re ( a + bi )e(a+wi)t = aeat cos(wt) beat sin(wt), (18-75)

bestemmes i første omgang ved at finde den tilsvarende komplekse partikulære løs-
ning til følgende komplekse differentialligning

z00 (t) + a1 z0 (t) + a0 z(t) = ( a + bi )e(a+wi)t , t 2 R, (18-76)

Den komplekse partikulære løsning har formen z0 (t) = (c + di )e(a+wi)t , hvor c og d


bestemmes ved indsættelse af z0 (t) i differentialligningen (18-76).

Efterfølgende er en partikulær løsning til differentialligningen (18-74) givet ved

x0 (t) = Re(z0 (t)) . (18-77)


eNote 18 18.3 DEN INHOMOGENE LIGNING 17

En afgørende grund til, at man benytter den komplekse gættemetode, er, at det
er så enkelt at differentiere eksponentialfunktionen, selv når den er kompleks.

Eksempel 18.19 Den komplekse gættemetode

Givet er en 2. ordens inhomogene differentialligning:

x 00 (t) 2x 0 (t) 2x (t) = 19e4t cos(t) 35e4t sin(t), t 2 R. (18-78)

Bestem en partikulær løsning til denne differentialligning.

Det er oplagt at bruge den komplekse gættemetode fra metode 18.18 til denne opgave. Det ses
nemlig i første omgang, at højresiden svarer til reeldelen af et kompleks tal:

q(t) = 19e4t cos(t) 35e4t sin(t)


⇣ ⌘
= Re 19e4t (cos(t) + i sin(t)) + 35ie4t (cos(t) + i sin(t))
⇣ ⌘
4t it 4t it
= Re 19e e + 35ie e (18-79)
⇣ ⌘
= Re 19e4t+it + 35ie4t+it
⇣ ⌘
= Re (19 + 35i )e(4+i)t .

Bemærk brugen af Eulers formel fra eNote 29 for at opnå omskrivningen fra cos og
sin til eksponentiel form, eiv = cos(v) + sin(v).

Det kan være en anelse kringlet at gennemskue leddenes komplekse form. Leddet
19e4t cos(t) er nemt; det udvides let til 19e4t (cos(t) + i sin(t)), hvor sin-leddet som
imaginærdelen er tilføjet. Men leddet 35e4t sin(t) kræver lidt mere; det får tilføjet
et cos-led som imaginærdel, og derfor skal i’et flyttes fra cos til sin ved, at udtrykket
ganges med i.

Vi "‘udvider"’ differentialligningen, så vi har det nye tilsvarende komplekse tal (19 +


35i )e(4+i)t på højresiden i stedet. Vi skal så i stedet finde en kompleks partikulær løsning
til denne differentialligning:

z00 (t) 2z0 (t) 2z(t) = (19 + 35i )e(4+i)t , t 2 R. (18-80)


eNote 18 18.4 EKSISTENS OG ENTYDIGHED 18

hvor vi har erstattet x (t) med z(t) for tydeligt at markere, at den løsning, vi nu finder, netop
ikke er en løsning til den originale ligning, men kun en løsning til denne udvidede komplekse
form af ligningen. Vi gætter nu på, at z0 (t) = (c + di )e(4+i)t er en løsning, hvor c og d er reelle
konstanter. Vi har

z00 (t) = (c + di )(4 + i )e(4+i)t = (4c d + (c + 4d)i ) e(4+i)t og


(18-81)
z000 (t) = (4c d + (c + 4d)i )(4 + i )e(4+i)t = (15c 8d + (8c + 15d)i )e(4+i)t .

Disse udtryk samt z0 (t) indsættes i den komplekse differentialligning for at bestemme c og
d:

(15c 8d + (8c + 15d)i )e(4+i)t 2(4c d + (c + 4d)i )e(4+i)t 2(c + di )e(4+i)t


= (19 + 35i )e(4+i)t ,
15c 8d + (8c + 15d)i 2(4c d + (c + 4d)i ) 2(c + di ) = 19 + 35i , (18-82)
5c 6d + (6c + 5d)i = 19 + 35i ,
5c 6d = 19 ^ 6c + 5d = 35

Dette er to ligninger med to ubekendte. Ligningssystemets totalmatrix opskrives:


  6 19

5 6 19 1 5 5 1 0 5
! 61 61 ! . (18-83)
6 5 35 0 5 5 0 1 1

Vi har altså, at c = 5 og d = 1, hvilket giver z0 (t) = (5 + i )e(4+i)t . Dette er som sagt løsningen
til den komplekse udvidelse af differentialligningen. En partikulær løsning til den originale
differentialligning (18-78) er derfor reeldelen af z0 (t),
⇣ ⌘
x0 (t) = Re(z0 (t)) = Re (5 + i )e(4+i)t = 5e4t cos(t) e4t sin(t), t 2 R. (18-84)

18.4 Eksistens og entydighed

Vi formulerer her en sætning om eksistens og entydighed for differentialligninger af 2. or-


den med konstante koefficienter. Vi har behov for to begyndelsesværdibetingelser, nemlig
funktionens værdi og den afledtes værdi for en værdi af variablen.
eNote 18 18.4 EKSISTENS OG ENTYDIGHED 19

Sætning 18.20 Eksistens og entydighed


Til ethvert talsæt (t0 , x0 , v0 ) (dobbelt begyndelsesværdibetingelse) findes netop én løs-
ning x (t) til differentialligningen

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t), t 2 I, q:I!R (18-85)

således, at
x ( t0 ) = x0 og x 0 ( t0 ) = v0 , (18-86)
hvor t0 2 I, x0 2 R og v0 2 R.

Eksempel 18.21 Eksistens og entydighed

Givet differentialligningen

x 00 (t) 5x 0 (t) 36x (t) = 0, t 2 R. (18-87)

Bestem en funktion x (t), som er løsning til differentialligningen og har begyn-


delsesværdibetingelsen (t0 , x0 , v0 ) = (0, 5, 6).

Det ses, at differentialligningen er homogen. Den har karakterligningen

l2 5l 36 = 0. (18-88)

Karakterligningen har rødderne l1 = 4 og l2 = 9. Derfor er den fuldstændige løs-


ningsmængde til den homogene differentialligning (ved hjælp af sætning 18.2) udspændt
af følgende funktioner for alle c1 , c2 2 R:
4t
x ( t ) = c1 e + c2 e9t , t 2 R. (18-89)

Man har da
4t
x0 (t) = 4c1 e + 9c2 e9t . (18-90)
Indsættes begyndelsesværdibetingelserne x (0) = 5 og x 0 (0) = 6 i de to ligninger, kan det
løses for (c1 , c2 ),
5= c1 + c2
(18-91)
6 = 4c1 + 9c2 .

Ligningerne er blevet meget simple, da e0 = 1. Indsættes c2 = 5 c1 i den anden ligning, fås

6 45
6= 4c1 + 9(5 c1 ) = 13c1 + 45 , c1 = = 3. (18-92)
13
eNote 18 18.4 EKSISTENS OG ENTYDIGHED 20

Derfor er c2 = 5 3 = 2, og den betingede løsning er


4t
x (t) = 3e + 2e9t , t 2 R. (18-93)

Herunder er et eksempel, som gennemgår hele løsningsproceduren for en inhomogen


differentialligning med en dobbelt begyndelsesværdibetingelse. Efter det kommer et
eksempel, hvor formålet er at finde en differentialligning, hvor den fuldstændige løs-
ning er opgivet. Den falder derfor i tråd med eksempel 18.5, og nu er der også en
højreside forskellig fra nul.

Eksempel 18.22 Opsamlende eksempel

Givet differentialligningen

x 00 (t) + 6x 0 (t) + 5x (t) = 20t2 + 48t + 13, t 2 R. (18-94)

Bestem den fuldstændige løsningsmængde Linhom samt den betingede løsning x (t),
som opfylder begyndelsesværdibetingelserne (t0 , x0 , v0 ) = (0, 5, 8) .

Først løses den tilsvarende homogene differentialligning, og karakterligningen ser således


ud:
l2 + 6l + 5 = 0 . (18-95)
Denne har rødderne l1 = 5 og l2 = 1. Da disse rødder er reelle og forskellige, er den
fuldstændige homogene løsning ifølge sætning 18.2 givet ved

Lhom = c1 e 5t + c2 e t , t 2 R c1 , c2 2 R . (18-96)

Nu bestemmes en partikulær løsning til den inhomogene ligning. Da højresiden er et an-


dengradspolynomium, gætter vi ved hjælp af metode 18.6 p, at x0 (t) = b2 t2 + b1 t + b0 er en
løsning. Vi har da, at x00 (t) = 2b2 t + b1 og x000 (t) = 2b2 . Dette indsættes i differentialligningen:

2b2 + 6(2b2 t + b1 ) + 5(b2 t2 + b1 t + b0 ) = 20t2 + 48t + 13 ,


(5b2 20)t2 + (12b2 + 5b1 48)t + (2b2 + 6b1 + 5b0 13) = 0 , (18-97)
5b2 20 = 0 ^ 12b2 + 5b1 48 = 0 ^ 2b2 + 6b1 + 5b0 13 = 0 .
Den første ligning giver nemt b2 = 4. Indsættes det i den anden ligning, fås ved lidt hove-
dregning b1 = 0. Til sidst i den tredje ligning får man b0 = 1. En partikulær løsning til den
inhomogene differentialligning er derfor

x0 (t) = 4t2 + 1, t 2 R. (18-98)


eNote 18 18.4 EKSISTENS OG ENTYDIGHED 21

Ifølge struktursætningen, for eksempel metode 18.1.4evncount.18.1, er den fuldstændige løs-


ningsmængde til den inhomogene differentialligning givet ved

Linhom = x0 (t) + Lhom = 4t2 + 1 + c1 e 5t + c2 e t , t 2 R c1 , c2 2 R . (18-99)

Vi bestemmer nu den løsning, der opfylder de givne begyndelsesværdibetingelser. En


vilkårlig løsning har formen

x (t) = 4t2 + 1 + c1 e 5t
+ c2 e t , t 2 R. (18-100)

Den afledede er
5t
x 0 (t) = 8t 5c1 e c2 e t , t 2 R. (18-101)
Indsættes x (0) = 5 og x 0 (0) = 8, fås de to ligninger

5= c1 + c2 + 1
(18-102)
8= 5c1 c2 .

Indsættes c1 = 4 c2 fra den første ligning i den anden, fås

8= 5(4 c2 ) c2 , 8 + 20 = 4c2 , c2 = 3 . (18-103)

Det giver c1 = 1, og den betingede løsning er derfor


5t
x (t) = e + 3e t
+ 4t2 + 1, t 2 R. (18-104)

Eksempel 18.23 Fra løsning til ligning

Givet den fuldstændige løsning til en lineær 2. ordens differentialligning med kon-
stante koefficienter
2t 1
Linhom = c1 e + c2 e2t 2 sin(2t) , t 2 R c1 , c2 2 R . (18-105)

Opstil differentialligningen, som generelt har dette udseende:

x 00 (t) + a1 x 0 (t) + a0 x (t) = q(t) . (18-106)

a1 , a0 og q(t) skal altså bestemmes.

I første omgang splittes løsningen op i en partikulær løsning og den fuldstændige homogene


løsningsmængde:
1 2t
x0 ( t ) = 2 sin(2t), t 2 R og Lhom = c1 e + c2 e2t t 2 R c1 , c2 2 R . (18-107)
eNote 18 18.4 EKSISTENS OG ENTYDIGHED 22

Nu betragtes den fuldstændige homogene løsning. Udseendet på denne stemmer overens


med den første situation i sætning 18.2. Karakterligningen har altså to forskellige reelle rød-
der, og de er l1 = 2 og l2 = 2. Karakterligningen er derfor

(l + 2)(l 2) = l2 4 = 0. (18-108)

Dette afgør koefficienterne på venstresiden af differentialligningen: a1 = 0 og a0 = 4.


Differentialligningen ser altså indtil videre således ud:

x 00 (t) 4x (t) = q(t), t 2 R. (18-109)

Da x0 (t) er en partikulær løsning til den inhomogene differentialligning kan højresiden q(t)
bestemmes ved at indsætte x0 (t). Vi har, at x000 (t) = 2 sin(2t), og

x000 (t) 4x0 (t) = q(t) ,


1
2 sin(2t) 4( 2 sin(2t)) = q(t) , (18-110)
4 sin(2t) = q(t) .

Nu er samtlige ubekendte i differentialligningen bestemt, og den endelige ligning er

x 00 (t) 4x (t) = 4 sin(2t), t 2 R. (18-111)

I denne eNote beskæftiger vi os ikke med systemer af 2. ordens homogene


lineære differentialligninger med konstante koefficienter. Det skal dog tilføjes,
at vi allerede med den gennemgåede teori og lidt snilde kan løse sådanne prob-
lemer. Hvis vi har et system af 2. ordens homogene differentialligninger, kan vi
betragte hver differentialligning for sig. Ved hjælp af afsnit 17.4.64section.17.4
kan en sådan ligning omformes til 2 ligninger af 1. orden. Gøres det med alle
differentialligningerne i systemet, ender vi med dobbelt så mange differential-
ligninger, nu af 1. orden. Dette nye system kan vi løse med den gennemgåede
teori i eNote 12. Systemer af 2. ordens homogene lineære differentialligninger
findes mange steder i mekanisk fysik, kemi, elektromagnetisme m.fl.
eNote 19 1

eNote 19

Funktioner af to variable

I denne og i de efterfølgende eNoter vil vi udvide funktionsbegrebet til at omfatte reelle


funktioner af flere variable; vi starter udvidelsen med 2 variable, så vi vil i denne eNote definere
værdimængder, kontinuitet, og differentiabilitet af funktioner f ( x, y) af to variable, her x og y.
Ligesom for funktioner af én variabel vil vi bruge epsilon-funktions-begrebet (nu ligeledes af to
variable) til formålet.

19.1 Definitionsmængder

Ved beskrivelsen af en reel funktion f ( x, y) af to variable anføres dels de punkter ( x, y),


i ( x, y)-planen hvor funktionen er defineret, og dels de værdier, som kan fås ved at
benytte funktionen på defintionsmængden. Definitionsmængden kalder vi D m( f ) og
værdimængden kalder vi V m( f ). Det er især definitionsmængderne vi vil fokusere på
her.

Som noget nyt i forhold til funktioner af én variabel er definitionsmængderne i planen


generelt ikke så simple som intervallerne på den reelle talakse.

Eksempel 19.1 Definitionsmængde for en funktion af to variable

Lad os se på en funktion f ( x, y) af to variable:


q
f ( x, y) = ln( 5 x2 y2 ) . (19-1)
eNote 19 19.1 DEFINITIONSMÆNGDER 2

p
For hvilke punkter ( x, y) i R2 er denne funktion defineret? Vi har f.eks. at f (0, 0) = ln( 5),
f (2, 0) = f (0, 2) = 0, f (1, 0) = f (0, 1) = ln(2), og faktisk er f (cos(t), sin(t)) = ln(2) for
alle t, men f (3, 7) er ikke defineret for denne funktion. Ved inspektion af funktionen ses
det, at definitionsmængden for f ( x, y) består præcis
p af de punkter, der ligger helt inde i den
cirkelskive, der har centrum i (0, 0) og radius 5:

D m( f ) = ( x, y) 2 R2 x2 + y2 < 5 . (19-2)

Læg mærke til, at cirkel-randen af cirkelskiven ikke er med i definitionsmængden.

Vi vil nu indføre nogle vigtige begreber til beskrivelse af definitionsmængder og i øvrigt


generelt til beskrivelse af vilkårlige delmængder af ( x, y)-planen som kan være gode at
benytte sig af, når man f.eks. skal tegne eller skitsere mængderne:

19.1.1 Åbne og afsluttede mængder i planen

Definition 19.2 Åbne mængder i planen


En delmængde eller et område M i planen kaldes en åben mængde hvis ethvert
punkt ( x0 , y0 ) i mængden er centrum for en eller anden (gerne meget lille) cirkel-
skive, som selv er helt indeholdt i M.

Eksempel 19.3 En cirkelskive

Mængden D m = ( x, y) 2 R2 x2 + y2 < 5 er en åben mængde. Men mængden


( x, y) 2 R2 x2 + y2  5 er ikke en åben mængde.
eNote 19 19.1 DEFINITIONSMÆNGDER 3

Definition 19.4 Randen af en mængde i planen, indre og ydre


Randen af et område M i planen består af de punkter ( x0 , y0 ) i planen som har
følgende egenskab: Enhver cirkelskive med centrum i ( x0 , y0 ) indeholder både
punkter som tilhører M og punkter som ikke tilhører M. Bemærk, randpunkterne
for M ikke selv behøver at være med i mængden M. Mængden af randpunkter for
M betegnes med ∂M.

Det indre af et område M er alle de punkter i M, som ikke ligger på randen af M.


Det indre af M betegnes med M̊.

Det ydre af et område M i planen er alle de punkter i planen som ikke tilhører
hverken M eller ∂M.

Eksempel 19.5 Randen af en åben cirkelskive

Mængden D m = ( x, y) 2 R2 x2 + y2 < 5 har randen:

∂D m = ( x, y) 2 R2 x2 + y2 = 5 . (19-3)

Definition 19.6 Afslutningen af en mængde i planen


Hvis en mængde M tilføjes sine randpunkter ∂M fås afslutningen af mængden som
betegnes med:
M̄ = M [ ∂M . (19-4)
Hvis randpunkterne allerede er med i mængden M fås ikke derved nogen udvidelse
af M. Mængden M kaldes afsluttet hvis M̄ = M.

Eksempel 19.7 Figurativt om åbne og afsluttede mængder

Mængden A i figur 19.1 er hverken åben eller afsluttet (der er nogle punkter på randen, som
selv er med i mængden og der er andre punkter på randen som ikke er med i mængden.
Tegne-forskriften er følgende: Punkter, der er med i mængden er grønne eller ligger på et
eNote 19 19.1 DEFINITIONSMÆNGDER 4

fuldt optrukket stykke af randen; punkter, der ikke er med i mængden er ikke farvede eller
(hvis de er en del af randen) markerede med røde cirkler. Mængden B i figur 19.1 er en åben
mængde. Mængden C i figur 19.1 er en afsluttet mængde.

Figure 19.1: Områder i planen. Mængden A er hverken åben eller afsluttet, B er en åben
mængde, og C er en afsluttet mængde.

Figure 19.2: Afslutningerne Ā, B̄, og C̄ af områderne A, B, og C fra figur 19.1.

19.1.2 Stjerneformede mængder i planen


eNote 19 19.1 DEFINITIONSMÆNGDER 5

Definition 19.8 Stjerneformede områder


Hvis ethvert punkt ( x, y) i en mængde M i planen kan ’ses’ fra et punkt ( x0 , y0 ) i
mængden sådan at hele syns-linjestykket fra og med ( x0 , y0 ) til og med ( x, y) er in-
deholdt i mængden, så siges M at være stjerneformet ud fra stjernepunktet ( x0 , y0 ).
Med andre ord: Ethvert punkt ( x, y) i mængden kan forbindes med stjernepunktet
med et linjestykke, der helt er indeholdt i mængden. Se figur 19.3.

Opgave 19.9 Stjerneform og dobbelt-stjerneform

Hvilke punkter i den mængde der er vist til venstre figur 19.3 kan bruges som stjernepunkter
for mængden? Er mængden af samtlige mulige stjernepunkter afsluttet eller åben? I hvilken
forstand ville man kunne sige, at figuren til højre i 19.3 er dobbelt-stjerneformet?

Figure 19.3: Mængden til venstre er stjerneformet. Mængden til højre er ikke stjerne-
formet.

19.1.3 Begrænsede mængder i planen


eNote 19 19.2 GRAFER FOR FUNKTIONER AF TO VARIABLE 6

Definition 19.10 Begrænsede mængder


En mængde M i planen siges at være begrænset hvis den er helt indeholdt i en (gerne
meget stor) cirkelskive med centrum i (0, 0).

Eksempel 19.11

De tre mængder A, B, og C i figur 19.1 er tydeligvis begrænsede – de er helt indeholdt i den


cirkelskive som har centrum i (0, 0) og radius 100. Den mængde af punkter, der udgøres af
punkterne på x-aksen er ikke begrænset.

19.1.4 Udvidelser af definitionsmængden til hele R2

Ligesom vi kan udvide definitionsmængder for funktioner af én variabel, kan vi gøre


præcis det samme for funktioner f ( x, y) af to variable:

Definition 19.12 Udvidelse af definitionsmængden


Givet funktionen f ( x, y) med definitionsmængde D m( f ), så definerer vi 0-
udvidelsen fb( x, y) af f ( x, y) på følgende måde:

f ( x, y) , for ( x, y) 2 D m( f )
fb( x, y) = (19-5)
0, for ( x, y) 2 R2 \ D m( f ) .

19.2 Grafer for funktioner af to variable

Med henblik på at illustrere funktioner af to variable tegner vi dem i rummet – vi


plotter den punktmængde, der fremkommer ved at konstruere graferne i { O , x, y, z }-
koordinatsystemet:
eNote 19 19.3 NIVEAU-MÆNGDER OG HØJDESNIT 7

Definition 19.13 Grafer for funktioner af to variable


Lad f ( x, y) være en funktion af to variable med definitionsmængden D m( f ). Så er
grafen for en funktion af to variable givet ved:

z = f ( x, y) , hvor ( x, y) 2 D m( f ) . (19-6)

Grafen består altså af den punktmængde i rummet som vi også kan beskrive på
følgende måde:

G( f ) = ( x, y, f ( x, y)) ( x, y) 2 D m( f ) . (19-7)

Hvert enkelt punkt på grafen fremkommer på følgende måde: Fra punktet ( x, y, 0)


i ( x, y)-planen går vi højden (med fortegn) f ( x, y) lodret op (eller ned) fra den
(vandrette) ( x, y)-plan og markere graf-punktet ( x, y, f ( x, y) i den højde som funk-
tionsværdien f ( x, y) foreskriver – lige over (eller under) punktet ( x, y, 0).

19.3 Niveau-mængder og højdesnit

I ( x, y)-planen hvor funktionen f ( x, y) er defineret kan vi gøre noget helt andet for at
vise, hvordan funktionsværdierne varierer fra punkt til punkt.

Definition 19.14 Niveau-mængder


For en funktion f ( x, y) af to variable definerer vi for ethvert reelt tal c den tilhørende
niveau-mængde på følgende måde:

Kc ( f ) = ( x, y) 2 D m( f ) f ( x, y) = c . (19-8)

Mængden Kc kan være tom, hele planen, en kurve, eller hvilken som helst punkt-
mængde i planen.
eNote 19 19.3 NIVEAU-MÆNGDER OG HØJDESNIT 8

Eksempel 19.15 Niveaumængder

Vi lader A betegne en vilkårlig mængde i planen og konstruerer en funktion f ( x, y) i hele


planen på følgende måde:

1 for ( x, y) 2 A
f ( x, y) = (19-9)
0 for ( x, y) 2 R2 \ A ,

dvs. f er 0-udvidelsen af den funktion, som er konstant 1 på A. Så er


8
< A for c = 1
Kc ( f ) = R2 \ A for c = 0 (19-10)
:
∆ for c 6= 1 og c 6= 0 .

Ofte er niveau-mængden Kc dog meget mere velstruktureret og består typisk af en eller


flere kurver. De kurver kan med fuld ret kaldes niveau-kurver eller højdekurver, for
de angiver jo præcis de punkter ( x, y) i definitionsmængden hvor funktionen antager
værdien c og hvor grafen for f derfor lige præcis har højden (med fortegn) c over ( x, y)-
planen. Med andre ord, hvis vi skærer grafen for f med den vandrette plan z = c i
højden c over ( x, y)-planen, så fås en snitkurve, hvis projektion ned i (eller op i) ( x, y)-
planen netop er Kc , se figurerne 19.4 19.6, 19.5.

Nedenfor i afsnit 19.8.1 vil vi i ethvert punkt i definitionsmængden for f ( x, y)


definere en vektor, gradientvektoren for f ( x, y), som har den særlige egenskab,
at hvis den ikke er 0 i et åbent område omkring et givet punkt ( x0 , y0 ), så er
den niveau-mængde der indeholder ( x0 , y0 ) en kurve igennem punktet. Gra-
dientvektorer er dog kun veldefinerede for differentiable funktioner, så den
egenskab må vi derfor først have indført forfunktioner af to variable.

Eksempel 19.16 Grafer og niveau-kurver

Følgende funktioner er alle definerede i hele ( x, y)-planen.

f ( x, y) = x+y+2
1 2
f ( x, y) = 1 x + y2 (19-11)
2
f ( x, y) = cos(3x ) · sin(3y) .

Funktionernes grafer er vist i figurerne 19.4, 19.5, og 19.6 dels sammen med deres respek-
tive niveau-kurver i ( x, y)-planen og dels sammen med en figur, der antyder, hvordan
eNote 19 19.4 EPSILON-FUNKTIONER AF TO VARIABLE 9

niveaukurverne i ( x, y)-planen kan opfattes som projektionerne af de højde-snit-kurver der


fremkommer ved at skære graffladerne for funktionerne i forskellige højder, altså med plan-
erne z = c, hvor c er den konstante værdi som den aktuelle funktion f ( x, y) antager p niveau-
kurven Kc . Bemærk, at niveaumængderne Kc virkelig er kurver (eller punkter) i disse til-
fælde.

Figure 19.4: Grafen i ( x, y, z)-rummet, niveaukurverne i ( x, y)-planen, og


højdesnitkurverne for funktionen f ( x, y) = x + y + 2. Læg mærke til, at det
naturligvis ikke er hele grafen for funktionen vi kan plotte. Her er kun vist det udsnit
der hører til 1  x  1 og 1  y  1.

19.4 Epsilon-funktioner af to variable

En meget vigtig klasse af funktioner af to variable er afstandsfunktionerne. For ethvert


punkt ( x0 , y0 ) i planen definerer vi afstanden til ( x0 , y0 ) på velkendt måde:
eNote 19 19.4 EPSILON-FUNKTIONER AF TO VARIABLE 10

Figure 19.5: Grafen i ( x, y, z)-rummet, niveaukurverne i ( x, y)-planen, og


1 2 2
højdesnitkurverne for funktionen f ( x, y) = 1 2 x +y .

Definition 19.17 Afstandsfunktioner


Afstanden fra et punkt ( x, y) til et punkt ( x0 , y0 ) i ( x, y)-planen betegnes med
q
r( x0 ,y0 ) ( x, y) = ( x x0 )2 + (y y0 )2 . (19-12)

Dette er den sædvanlige afstand mellem de to punkter ( x, y) og ( x0 , y0 ) i planen –


bestemt med Pythagoras’ sætning.

Det er denne funktion vi vil bruge på samme måde som vi benyttede funktio-
nen ( x x0 ) til definitionerne af epsilon-funktioner af én variabel og til def-
inition af kontinuitet og differerentiabilitet af funktioner af én variabel. Læg
mærke til, at r( x0 ,y0 ) ( x, y) altid er positiv eller 0; og læg mærke til at værdien
0 dog kun optræder for ( x, y) = ( x0 , y0 ). Funktionen r(0,0) ( x, y), altså afs-
tanden fra ( x, y) til ( x0 , y0 ) = (0, 0), er vist i figur 19.7. Læg mærke til, at
niveaukurverne er ækvidistante, og at grafen er ’konisk spids’ i kontaktpunk-
tet til ( x, y)-planen!

Vi er nu klar til at definere klassen af epsilonfunktioner af to variable:


eNote 19 19.4 EPSILON-FUNKTIONER AF TO VARIABLE 11

Figure 19.6: Grafen i ( x, y, z)-rummet, niveaukurverne i ( x, y)-planen, og


højdesnitkurverne for funktionen f ( x, y) = cos(3x ) · sin(3y).

Definition 19.18 Epsilonfunktioner af to variable


Enhver funktion #( x, y) som er defineret i et åbent område i R2 indeholdende (0, 0),
og som antager værdien 0 i ( x, y) = (0, 0), og som derudover går imod 0 når ( x, y)
går imod (0, 0) kaldes en epsilon-funktion af ( x, y). Epsilon-funktioner af to variable
er altså karakteriserede ved egenskaberne:

#(0, 0) = 0 og #( x, y) ! 0 for ( x, y) ! (0, 0) . (19-13)

Den sidste betingelse betyder, at den numeriske værdi af funktionsværdierne #( x, y)


kan gøres så lille som ønsket ved blot at vælge ( x, y) tilstrækkelig tæt på (0, 0). Helt
præcis betyder betingelsen: For ethvert helt positivt tal k findes der et helt positivt
tal K sådan at |#( x, y)| < 1/k for alle ( x, y) med r( x0 ,y0 ) ( x, y) < 1/K .

Det følger direkte af definitionen, at afstandsfunktionen r( x0 ,y0 ) ( x, y) til et


punkt ( x0 , y0 ) selv er en epsilonfunktion af x x0 og y y0 .
eNote 19 19.5 KONTINUERTE FUNKTIONER AF TO VARIABLE 12

Figure 19.7: Grafen for afstandsfunktionen r(0,0) ( x, y) til punktet ( x0 , y0 ) = (0, 0), funk-
tionens niveaukurver, og højdesnit-kurverne på grafen.

19.5 Kontinuerte funktioner af to variable

Som for funktioner af én variabel definerer vi kontinuitet for funktioner af to variable


ved hjælp af klassen af epsilonfunktioner:

Definition 19.19 Kontinuerte funktioner af to variable


En funktion f ( x, y) er kontinuert i ( x0 , y0 ) hvis der eksisterer en epsilon-funktion
# f ( x x0 , y y0 ) sådan at følgende gælder i et åbent område der indeholder ( x0 , y0 ):

f ( x, y) = f ( x0 , y0 ) + # f ( x x0 , y y0 ) . (19-14)
Hvis f ( x, y) er kontinuert i alle ( x0 , y0 ) i et givet åbent område i D m( f ), så siger vi,
at f ( x, y) er kontinuert i hele området.

Enhver epsilonfunktion af x x0 og y y0 som f.eks. r( x0 ,y0 ) ( x, y) er derfor kontinuert


i ( x0 , y0 ). Grafer og niveaukurver kan ofte afsløre, om en funktion er kontinuert i et
punkt.
eNote 19 19.5 KONTINUERTE FUNKTIONER AF TO VARIABLE 13

Sætning 19.20 Inspektion af niveau-mængder


Hvis en funktion f ( x, y) har to niveau-mængder Kc1 og Kc2 (hvor c1 6= c2 ) som begge
indeholder punkter ( x, y) vilkårligt tæt på ( x0 , y0 ), så er f ( x, y) ikke kontinuert i
( x0 , y0 ).

Bevis

Antag, at f ( x, y) er kontinuert i ( x0 , y0 ). Hvis vi går i mængden Kc1 hen mod ( x0 , y0 ) så skal


(pr. kontinuitet) f ( x0 , y0 ) være c1 . Hvis vi derimod går i mængden Kc2 hen mod ( x0 , y0 ) får
vi f ( x0 , y0 ) = c2 , hvilket er en modstrid, da c1 6= c2 .

To niveaukurver hørende til forskellige funktionsværdier for en funktion


f ( x, y) kan ligge meget tæt på hinanden i ( x, y)-planen – men altså ikke
vilkårligt tæt – hvis funktionen er kontinuert.

Eksempel 19.21 En funktion som ikke er kontinuert

Vi ser på 0-udvidelsen fb( x, y) af funktionen


x2 y
f ( x, y) = , hvor ( x, y) 2 R2 \ { (0, 0) } . (19-15)
x 4 + y2
Det vil sige: (
x2 y
for ( x, y) 6= (0, 0)
fb( x, y) = x 4 + y2 (19-16)
0 for ( x, y) = (0, 0) .
Funktionen kan inspiceres i figur 19.8. Ved den inspektion bemærkes, at niveaukurverne
’ligner parabler’ igennem (0, 0). Vi vil teste den hypotese, at det faktisk er parabler: Hvis vi
sætter y = c x2 (parabelligning) får vi følgende udregninger:
f ( x, y) = f ( x, c x2 )
x2 c x2
=
x 4 + ( c x 2 )2
c x4 (19-17)
=
(1 + c2 ) x 4
c
= ,
1 + c2
eNote 19 19.5 KONTINUERTE FUNKTIONER AF TO VARIABLE 14

hvilket netop betyder, at parablerne y = c x2 er (indeholdt i) niveau-mængden Kc/(1+c2 ) . Da


alle parablerne går igennem (0, 0) følger det af sætning 19.20 at funktionen f ( x, y) ikke er
kontinuert i (0, 0).

Figure 19.8: Grafen i rummet og niveaukurve-forløbet i planen for funktionen i eksem-


pel 19.21.

Opgave 19.22

Vis, at 0-udvidelsen fb( x, y) af følgende funktion ikke er kontinuert i (0, 0):


x
f ( x, y) = . (19-18)
x 2 + y2

Eksempel 19.23 Første-grads-polynomier er kontinuerte

Vi vil vise, at f ( x, y) = ax + by + g er kontinuert i ( x0 , y0 ). Det følger direkte af, at

f ( x, y) f ( x0 , y0 ) = a ( x x0 ) + b ( y y0 ) ! 0 for ( x, y) ! ( x0 , y0 )) , (19-19)
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 15

sådan at
f ( x, y) = f ( x0 , y0 ) + # f ( x x0 , y y0 ) (19-20)
med epsilonfunktionen # f ( x x0 , y y0 ) = a ( x x0 ) + b ( y y0 ). Overvej hvorfor dette er
en epsilonfunktion.

Opgave 19.24

Vis, at følgende anden-grads polynomium er kontinuert i (0, 0):

f ( x, y) = x2 + y2 . (19-21)

Opgave 19.25

Vis, at 0-udvidelsen af følgende funktion er kontinuert i (0, 0):

x y2
f ( x, y) = . (19-22)
x 2 + y2

Eksempel 19.26 Kvadratroden af afstandsfunktionen

q
Funktionen f ( x, y) = r( x0 ,y0 ) ( x, y) er – ligesom r( x0 ,y0 ) ( x, y) selv – en epsilonfunktion og er
derfor kontinuert i ( x0 , y0 ). Se figur 19.9.

19.6 Differentiable funktioner af to variable

Langt de fleste af de funktioner vi betragter i Matematik 1 er differentiable i deres def-


initionsområder og af den grund også kontinuerte, som vi skal se nedenfor – jævnfør
tilsvarende for funktioner af én variabel.

Differentiabilitet defineres som for funktioner af én variabel, men her igen ved brug af
de indførte epsilonfunktioner af to variable:
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 16

Figure 19.9: Grafen, niveau-kurverne, og højdesnitkurverne q for kvadratroden af afs-


tandsfunktionen til punktet ( x0 , y0 ) = ( 1, 1) : f ( x, y) = r( x0 ,y0 ) ( x, y) .

Definition 19.27 Differentiabilitet og partielle afledede


En funktion f ( x, y) er differentiabel i ( x0 , y0 ) 2 D m( f ) hvis der findes to konstanter
a og b og en epsilon-funktion # f ( x x0 , y y0 ) sådan at

f ( x, y) = f ( x0 , y0 ) + a · ( x x0 ) + b · ( y y0 )
(19-23)
+ r( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) .

Det er de to konstanter a og b vi herefter (når de findes, altså når f ( x, y) er differen-


tiabel) kalder de partielle afledede af f i ( x0 , y0 ). De betegnes henholdsvis:

a = f x0 ( x0 , y0 ) og b = f y0 ( x0 , y0 ) (19-24)

Med denne notation gælder altså – når f ( x, y) er differentiabel i ( x0 , y0 ):

f ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 )
(19-25)
+ r( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) .
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 17

Definition 19.28 Partielle afledede af partielle afledede


Hvis f ( x, y) er differentiabel i alle punkter ( x0 , y0 ) i et givet åbent område i D m( f ) ⇢
R2 siger vi, at f ( x, y) er differentiabel i hele området. Vi skriver så ofte de partielle
afledede af f ( x, y) på følgende måde, idet de jo dermed selv er funktioner af de to
variable ( x0 , y0 ):

∂ ∂f ∂ ∂f
f x0 ( x, y) = f ( x, y) = ( x, y) og f y0 ( x, y) = f ( x, y) = ( x, y) . (19-26)
∂x ∂x ∂y ∂y

Hvis disse partielle afledede af f ( x, y) selv er differentiable, kan vi fortsætte og finde


de tilhørende partielle afledede af de partielle afledede, etc. De benævnes på føl-
gende måde:
00 ∂ 0 ∂2 f
f xx ( x, y) = f x ( x, y) = ( x, y)
∂x ∂x∂x
00 ∂ 0 ∂2 f
f xy ( x, y) = f x ( x, y) = ( x, y)
∂y ∂y∂x
(19-27)
00 ∂ 0 ∂2 f
f yx ( x, y) = f ( x, y) = ( x, y)
∂x y ∂x∂y
00 ∂ 0 ∂2 f
f yy ( x, y) = f ( x, y) = ( x, y) .
∂y y ∂y∂y

Hvordan finder vi så konkret de partielle afledede af en given funktion f ( x, y), f.eks.


f ( x, y) = x · sin(y)? Det er ikke svært:
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 18

Sætning 19.29 Hjælpefunktioner giver partielle afledede


De partielle afledede af en funktion f ( x, y), der er differentiabel i ( x0 , y0 ) kan findes
ved sædvanlig differentiation af to funktioner af én variabel. Sæt

f 1 ( x ) = f ( x, y0 )
(19-28)
f 2 ( y ) = f ( x0 , y ) .

Så er funktionerne f 1 ( x ) og f 2 (y) to funktioner af hver én variabel, henholdsvis x og


y, og de er begge differentiable i henholdsvis x0 og y0 , og differentialkvotienterne er
netop de partielle afledede:

f x0 ( x0 , y0 ) = f 10 ( x0 ) og f y0 ( x0 , y0 ) = f 20 (y0 ) (19-29)

Med andre ord: Ved at indføre de to hjælpefunktioner af én variabel, f 1 ( x ) og f 2 (y),


fås de partielle afledede af f ( x, y) ved at finde de sædvanlige differentialkvotienter
af f 1 ( x ) og f 2 (y) i henholdsvis x0 og y0 .

Bevis

Hvis vi sætter y = y0 overalt i ligning (19.6.25) får vi:

f 1 ( x ) = f ( x, y0 ) = f 1 ( x0 ) + f x0 ( x0 , y0 ) · ( x x0 )
(19-30)
+ r(x0 ,y0 ) ( x, y0 ) · # f ( x x0 , 0) ,

sådan at koefficienten til faktoren ( x x0 ) lige præcis er f x0 ( x0 , y0 ). Vi aflæser altså for det
første, at f 1 ( x ) er differentiabel i x0 og for det andet, at f 10 ( x0 ) = f x0 ( x0 , y0 ). Og det var den
ene halvdel af det vi skulle vise; den anden halvdel – vedrørende f 20 (y0 ) = f y0 ( x0 , y0 ) – fås på
helt tilsvarende måde.

Eksempel 19.30 Bestemmelse af partielle afledede

Vi vil bestemme de partielle afledede af funktionen f ( x, y) = 3 x2 + 7 y3 + 10 x y7 i ethvert


punkt ( x0 , y0 ) i R2 . Vi opstiller først de to hjælpefunktioner f 1 ( x ) = f ( x, y0 ) og f 2 (y) =
f ( x0 , y ):
f 1 ( x ) = 3 x2 + 7 y30 + 10 x y70
(19-31)
f 2 (y) = 3 x02 + 7 y3 + 10 x0 y7 .
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 19

De to hjælpefunktioner har differentialkvotienterne henholdsvis:

f 10 ( x ) = 6 x + 0 + 10 y70 da y0 jo er en konstant her,


(19-32)
f 20 (y) = 0 + 21 y + 70 x0 y6
2
da x0 er en konstant .

Heraf får vi dernæst hjælpefunktionernes differentialkvotienter i x0 henholdsvis y0 :

f 10 ( x0 ) = 6 x0 + 10 y70 = f x0 ( x0 , y0 )
(19-33)
f 20 (y0 ) = 21 y20 + 70 x0 y60 = f y0 ( x0 , y0 ) .

Heraf fås generelt, det vil sige for alle ( x, y) i R2 :

f x0 ( x, y) = 6 x + 10 y7
(19-34)
f y0 ( x, y) = 21 y2 + 70 x y6 .

Opgave 19.31

Vis (på samme måde som for differentiable funktioner af én variabel), at hvis f ( x, y) er dif-
ferentiabel i ( x0 , y0 ), så er de to konstanter a og b, altså konstanterne f x0 ( x0 , y0 ) og f y0 ( x0 , y0 ),
veldefinerede i følgende forstand: Der findes ikke to forskellige par af konstanter a1 , b1 og
a2 , b2 og to epsilonfunktioner # 1 og # 2 sådan at der samtidig gælder:

f ( x, y) = f ( x0 , y0 ) + a1 · ( x x0 ) + b1 · (y y0 )
+ r(x0 ,y0 ) ( x, y) · # 1 ( x x0 , y y0 )
(19-35)
f ( x, y) = f ( x0 , y0 ) + a2 · ( x x0 ) + b2 · (y y0 )
+ r(x0 ,y0 ) ( x, y) · # 2 ( x x0 , y y0 ) .

Opgave 19.32

Bestem samtlige partielle afledede af de partielle afledede i ethvert punkt ( x, y) for funktio-
nen f ( x, y) = 3 x2 + 7 y3 + 10 x y7 .

Opgave 19.33

Bestem samtlige partielle afledede af de partielle afledede i ethvert punkt ( x, y) for funktio-
nen f ( x, y) = cos(3x ) · sin(3y).
eNote 19 19.6 DIFFERENTIABLE FUNKTIONER AF TO VARIABLE 20

Den opmærksomme opgaveløser vil have observeret (f.eks. i opgaverne ovenfor) at


00 ( x, y ) og f 00 ( x, y ) typisk er ens! Det er ikke nogen tilfældighed, det gælder sædvan-
f xy yx
ligvis at man kan nøjes med at beregne den ene af de to dobbeltafledede:

Sætning 19.34 De blandede dobbeltafledede er ens


Hvis alle de 4 dobbelt afledede af en given funktion f ( x, y) er kontinuerte i et åbent
område, så gælder i hele området:
00 00
f xy ( x, y) = f yx ( x, y) . (19-36)

Opgave 19.35

Vis (på samme måde som for funktioner af én variabel) at: Hvis en funktion f ( x, y) af to
variable er differentiabel i et punkt ( x0 , y0 ), så er funktionen også kontinuert i dette punkt.
Vis også med et eksempel, at hvis en funktion er kontinuert i ( x0 , y0 ), så behøver den ikke at
være differentiabel i ( x0 , y0 ). Se f.eks. på r( x0 ,y0 ) ( x, y).

Den opmærksomme vil også have noteret, at vi mangler en overvejelse: Hvis f ( x, y) er


differentiabel i et punkt ( x0 , y0 ), så findes de partielle afledede i konsekvens af differen-
tiabiliteten og de kan bestemmes ved hjælp af de differentiable hjælpefunktioner f 1 ( x )
og f 2 (y). Man kan nu med god grund spørge: Hvis de to hjælpefunktioner findes for
en given funktion f ( x, y), og det viser sig, at de er differentiable i henholdsvis x0 og y0 ,
betyder det så, at f ( x, y) er differentiabel i ( x0 , y0 )?

Følgende sætning kaster lys over dette spørgsmål:

Sætning 19.36 Fra partielle afledede til differentiabilitet


Hvis f ( x, y) har partielle afledede (fundet via hjælpefunktionerne f 1 ( x ) og f 2 (y)) i et
åbent område A indeholdende ( x0 , y0 ), og hvis de partielle afledede af f ( x, y) begge
er kontinuerte i A, så er f ( x, y) differerentiabel.

At der nødvendigvis må være en ekstra betingelse i sætning 19.36 følger af eksemplet


eNote 19 19.7 DET APPROKSIMERENDE FØRSTE-GRADS-POLYNOMIUM 21

her:

Eksempel 19.37 Differentiable hjælpefunktioner er ikke nok

Vi ser på 0-udvidelsen af følgende funktion:

x y2
f ( x, y) = . (19-37)
x 2 + y4

Den funktion er ikke differentiabel i (0, 0) – den er nemlig ikke engang kontinuert i (0, 0) (!)
(Hvorfor ikke?) Ikke desto mindre findes de to hjælpefunktioner

f 1 ( x ) = f ( x, 0) = 0
(19-38)
f 2 (y) = f (0, y) = 0 ,

og som det ses, er de begge to særdeles differentiable i (0, 0). Selv om hjælpefunktionerne er
differentiable behøver den aktuelle funktion selv ikke at være differentiabel.

19.7 Det approksimerende første-grads-polynomium

Som for funktioner af én variabel kan vi trunkere udtrykket i ligning (19.6.25) ved sim-
pelthen at fjerne ’epsilon-funktions-delen’ hvorved vi står tilbage med et førstegrads-
polynomium i de to variable x og y:
P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 ) . (19-39)
Funktionen P1,( x0 ,y0 ) ( x, y) kaldes det approksimerende første-gradspolynomium for f ( x, y)
med udviklingspunkt ( x0 , y0 ).

Læg mærke til, at P1,( x0 ,y0 ) ( x, y) virkelig er et første-grads-polynomium i de to variable


x og y fordi de højst optræder med potensen 1 og alle andre faktorer og addender er
konstanter.

Eksempel 19.38 Paraboloide med tangentplan

Vi ser på funktionen
1 2 1 2
f ( x, y) = 1 x y . (19-40)
2 2
Så er
f x0 ( x0 , y0 ) = x0
(19-41)
f y0 ( x0 , y0 ) = y0 ,
eNote 19 19.7 DET APPROKSIMERENDE FØRSTE-GRADS-POLYNOMIUM 22

sådan at
P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) x0 · ( x x0 ) y0 · (y y0 )
1 2 1 2
=1 x y x · x0 + x02 y · y0 + y20 (19-42)
2 0 2 0
1 1
= 1 + x02 + y20 x · x0 y · y0 . .
2 2
Specielt får vi med udviklingspunktet ( x0 , y0 ) = (1, 1):

P1,(1, 1) ( x, y ) =y x+2 . (19-43)

Se figur 19.10, hvor grafen for dette approksimerende første-gradspolynomium for f ( x, y)


er plottet sammen med grafen for funktionen selv. Højde-snit-kurverne og niveau-kurverne
er ligeledes gengivet for begge funktionerne. I og omkring det markerede udviklingspunkt
er funktionerne meget ens - grafen for det approksimerende førstegrads-polynomium med
udviklingspunkt ( x0 , y0 ) fortjener helt klart at blive kaldt tangentplanen til grafen for f ( x, y)
i punktet ( x0 , y0 , f ( x0 , y0 ).

Definition 19.39 Tangentplan til grafen for en funktion af to variable


Givet en differentiabel funktion f ( x, y). Tangentplanen til grafen for f ( x, y) i punk-
tet ( x0 , y0 , f ( x0 , y0 )) er givet ved ligningen:

z = P1,( x0 ,y0 ) ( x, y) , (19-44)

hvor højresiden er det approksimerende polynomium af første grad for f ( x, y) med


udviklingspunkt ( x0 , y0 ).

Opgave 19.40

Bestem det approksimerende første-grads-polynomium for følgende funktion i ethvert punkt


( x0 , y0 ):
f ( x, y) = cos(3x ) · sin(3y) . (19-45)
eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 23

Figure 19.10: Tangentplanen approksimerer grafen over udviklingspunktet og


niveaulinjerne for det approksimerende førstegradspolynomium approksimerer
niveaulinjerne for funktionen omkring udviklingspunktet i ( x, y)-planen

19.8 Partielle afledede af sammensatte funktioner

Sammensatte funktioner af to variable optræder i rigtig mange anvendelser, lige fra GPS
teknologi til geologi og termodynamik.

En sammensat funktion af to variable fås typisk således: Lad f ( x, y) være en funktion af


to variable, hvor ( x, y) 2 D m( f ) ⇢ R2 og lad p(u, v) og q(u, v) være to andre funktioner
af to variable, hvor vi så antager, at (u, v) 2 D m( p) \ D m(q) ⇢ R2 . Antager vi nu
yderligere, at (u, v) tilhører et område A i R2 sådan at der gælder, at værdierne af p(u, v)
og q(u, v) ligger i definitionsmængden for f ( x, y) i den forstand, at ( p(u, v), q(u, v)) 2
D m( f ) for (u, v) 2 A, så er den sammensatte funktion
h(u, v) = f ( p(u, v), q(u, v)) veldefineret for alle ( x, y) 2 A . (19-46)

Vi vil sædvanligvis kun se på sammensatte funktioner som er definerede i hele planen,


sådan at A = R2 .
eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 24

Eksempel 19.41 Sammensatte funktioner af to variable

Lad f ( x, y), p(u, v), og q(u, v) være bestemt ved de angivne funktioner nedenfor. Så fås de
tilsvarende sammensatte funktioner h(u, v) ved at sætte x = p(u, v), y = q(u, v), og h(u, v) =
f ( x, y) = f ( p(u, v), q(u, v)) i de respektive definitions-områder (de anføres ikke her):

f ( x, y) = x + y , p(u, v) = 2u · v , q(u, v) = u2 + v2 , h(u, v) = (u + v)2


f ( x, y) = y · ex , p(u, v) = ln(uv) , q(u, v) = 1/uv , h(u, v) = 1
p
f ( x, y) = x + y , p(u, v) = u4 , q(u, v) = 8 u4 , h(u, v) = 3 · u2
(19-47)

Sætning 19.42 Kædereglen i planen


Lad f ( x, y), p(u, v), og q(u, v) være tre differentiable funktioner - hver af to variable.
Lad h(u, v) betegne den sammensatte funktion

h(u, v) = f ( p(u, v), q(u, v)) . (19-48)

Så kan de partielle afledede af h(u, v) udtrykkes ved hjælp af dels de partielle afled-
ede af f ( x, y), dels de partielle afledede af p(u, v), og dels de partielle afledede
af q(u, v). Vi vil udtrykke de partielle afledede af h(u, v) i (u0 , v0 ) så vi sætter
x0 = p(u0 , v0 ) og y0 = q(u0 , v0 ).
Så har vi:
h0u (u0 , v0 ) = f x0 ( x0 , y0 ) · p0u (u0 , v0 ) + f y0 ( x0 , y0 ) · q0u (u0 , v0 )
(19-49)
h0v (u0 , v0 ) = f x0 ( x0 , y0 ) · p0v (u0 , v0 ) + f y0 ( x0 , y0 ) · q0v (u0 , v0 ) .

Bevis

Resultatet følger efter præcis samme opskrift som beviset for differentiation af den sammen-
satte funktion f ( g( x )) af én variabel – der er bare lidt flere konstanter og funktioner at holde
styr på.


eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 25

Opgave 19.43

Bestem de partielle afledede i ethvert punkt (u, v) for hver af de sammensatte funktioner
nedenfor – dels ved at beregne dem direkte ud fra det givne eksplicitte udtryk for h(u, v) og
dels ved at benytte kædereglen og de parteille afledede af ingredienserne i h(u, v), altså de
partielle afledede af f ( x, y), p(u, v) og q(u, v).

f ( x, y) = x + y , p(u, v) = 2u · v , q(u, v) = u2 + v2 , h(u, v) = (u + v)2


f ( x, y) = y · e x , p(u, v) = ln(uv) , q(u, v) = 1/uv , h(u, v) = 1
p 4 4
f ( x, y) = x + y , p(u, v) = u , q(u, v) = 8 u , h(u, v) = 3 · u2
(19-50)

Læg mærke til, at hver af de partielle afledede af den sammensatte


funktion h(u, v) = f ( p(u, v), q(u, v)) i et punkt (u0 , v0 ) effektivt kan
udtrykkes
⇣ ved prikprodukter
⌘ hvori indgår en fælles faktor, nemlig vektoren
f x0 ( x0 , y0 ) , f y0 ( x0 , y0 ) hvor x0 = p(u0 , v0 ) og y0 = q(u0 , v0 ):
⇣ ⌘
h0u (u0 , v0 ) = f x0 ( x0 , y0 ) , f y0 ( x0 , y0 ) · p0u (u0 , v0 ) , q0u (u0 , v0 )
⇣ ⌘
hv (u0 , v0 ) = f x ( x0 , y0 ) , f y ( x0 , y0 ) · p0v (u0 , v0 ) , q0v (u0 , v0 )
0 0 0
.

19.8.1 Gradientvektorer
eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 26

Definition 19.44 Gradientvektor


Lad f ( x, y) betegne en differentiabel funktion af to variable. De partielle afledede af
f ( x, y) i et punkt ( x0 , y0 ) definerer gradientvektoren for f ( x, y) i ( x0 , y0 ) på følgende
måde: ⇣ ⌘
0 0
r f ( x0 , y0 ) = f x ( x0 , y0 ) , f y ( x0 , y0 ) . (19-51)
På denne måde får vi altså defineret en ganske bestemt vektor i ethvert punkt, hvor
f ( x, y) er differentiabel:
⇣ ⌘
r f ( x, y) = f x0 ( x, y) , f y0 ( x, y) . (19-52)

Hvis vi for ethvert fodpunkt ( x0 , y0 ) afsætter gradientvektoren r f ( x0 , y0 ) for f ( x, y) ud


fra det fodpunkt i planen R2 får vi konstrueret gradientvektorfeltet for f ( x, y).

Opgave 19.45

Bestem gradientvektorfeltet i ethvert punkt ( x, y) for hver af følgende funktioner i deres re-
spektive definitionsmængder: f ( x, y) = x + y, f ( x, y) = y · ex , og f ( x, y) = r2x0 ,y0 ( x, y).

Ved hjælp af gradientvektorfeltet r f ( x, y) for f ( x, y) kan vi nu formulere de partielle


afledede af den sammensatte funktion h(u, v) = f ( p(u, v), q(u, v)) lidt smartere:

Sætning 19.46 Kædereglen udtrykt med gradienten af f ( x, y)


Lad f ( x, y), p(u, v), og q(u, v) være tre differentiable funktioner - hver af to variable.
Lad h(u, v) betegne den sammensatte funktion

h(u, v) = f ( p(u, v), q(u, v)) . (19-53)

Så kan de partielle afledede af h(u0 , v0 ) med hensyn til henholdsvis u og v i (u0 , v0 )


udtrykkes ved gradienten af f ( x, y) i ( x0 , y0 ) = ( p(u0 , v0 ), q(u0 , v0 ) ) :

h0u (u0 , v0 ) = r f ( x0 , y0 ) · p0u (u0 , v0 ), q0u (u0 , v0 )


(19-54)
h0v (u0 , v0 ) = r f ( x0 , y0 ) · p0v (u0 , v0 ), q0v (u0 , v0 ) .
eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 27

19.8.2 Kædereglen ’langs’ kurver i planen

Hvis funktionerne p(u, v) og q(u, v) kun afhænger af den ene variable u kan vi selvføl-
gelig betegne funktionerne med henholdsvis p(u) og q(u). Den sammensattte funktion
h(u) = f ( p(u), q(u)) – hvor f ( x, y) er en givet differerentiabel funktion i planen – an-
giver så de funktionsværdier, som f ( x, y) antager langs den kurve i planen, som er givet
ved de to funktioner p(u) og q(u):

Definition 19.47 Parametriserede kurver i planen


En kurve i planen består af en punktmængde C i planen, som vi vil antage er givet
ved to funktioner p(u) og q(u) på følgende måde:

Cr : r(u) = ( p(u), q(u)) hvor u 2 ]a, b[ ⇢ R . (19-55)

Det vil sige, at kurven er en parametriseret punktmængde med stedvektorerne r(u)


og parameteren u i et givet interval. Kurven er differentiabel hvis de to funktioner
p(u) og q(u) begge er differentiable i hele intervallet ]a, b[ .

Den parametriserede kurve siges at være regulær, hvis r0 (u) 6= 0 for alle u 2 ]a, b[ .

Sætning 19.48 Tangent til kurve


Lad Cr betegne en differentiabel kurve med parameterfremstillingen r(u) og antag at
r0 (u0 ) 6= (0, 0). Tangenten Lu0 (igennem punktet r(u0 )) til Cr er så givet ved følgende
parameterfremstilling:

L u0 : T ( t ) = r ( u 0 ) + t · r0 ( u 0 ) hvor t2R . (19-56)


eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 28

Bevis

Vi nøjes med at se på det tilfælde hvor p(u) er meget elementær: p(u) = u. Så er Cr sim-
pelthen grafen for funktionen q( x ) i ( x, y)-planen. Grafen for den funktion har en tangent i
punktet ( x0 , q( x0 ), som er givet ved ved det velkendte udtryk: y = q( x0 ) + q0 ( x0 )( x x0 ). En
parameterfremstilling for den tangent er derfor:

T(t) = ( x0 , q( x0 )) + t · (1, q0 ( x0 ))
= ( p(u0 ), q(u0 )) + t · ( p0 (u0 ), q0 (u0 )) (fordi x = p(u) = u (19-57)
= r ( u 0 ) + t · r0 ( u 0 ) ,

og det var det, vi skulle indse.

Vi kan nu undersøge hvordan kædereglen ser ud og simplificeres langs parametriserede


kurver – vi skal blot ’bruge’ den generelle kæderegel på de to v-uafhængige funktioner
p(u) og q(u):

Sætning 19.49 Kædereglen langs kurver


Lad r(u) = ( p(u), q(u)) være en differentiabel parametriseret kurve i ( x, y)-planen.
En differentiabel funktion f ( x, y) antager så værdierne h(u) = f ( p(u), q(u)) =
f (r(u)) langs kurven. Den sammensatte funktion h(u) af den ene variabel u er dif-
ferentiabel, og

h0 (u) = r f ( p(u), q(u))·( p0 (u), q0 (u)) = r f (r(u)) · r0 (u) . (19-58)

Bevis

Resultatet følger direkte af den øverste ligning i (19.8.54). Bemærk, at funktionerne h(u),
p(u), og q(u) jo ikke afhænger af v, sådan at den nederste ligning i (19.8.54) reducerer til
0 = 0.


eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 29

Motiveret af dette simple udtryk for den afledede af funktionen f ( x, y) langs en parametris-
eret kurve r(u) indfører vi den retningsafledede af funktionen i den retning fra et givet
punkt ( x0 , y0 ) som er givet ved en enhedsvektor e:

Definition 19.50 Retningsafledede


Den retningsafledede af f ( x, y) i punktet ( x0 , y0 ) i retningen med enhedsret-
ningsvektor e betegnes med f 0 (( x0 , y0 ); e) og er givet ved prikproduktet:

f 0 (( x0 , y0 ); e) = r f ( x0 , y0 )·e . (19-59)

Kædereglen langs kurver kan nu formuleres ved hjælp af den retningsafledede:

Sætning 19.51 Kæderegel langs kurver udtrykt ved retningsafledede


Funktionen f ( x, y) antager værdierne h(u) = f ( p(u), q(u)) = f (r(u)) langs r(u).
Hvis r(u) er en regulær parameterfremstilling for kurven får vi differentialkvotien-
ten af h(u):

h0 (u) = r f ( p(u), q(u))·( p0 (u), q0 (u)) = f 0 (( x0 , y0 ); e) · |r0 (u)| . (19-60)

Læg mærke til, at den afledede af den sammensatte funktion h(u) = f (r(u)) i
et punkt på kurven r(u) kun afhænger af tangentvektoren til kurven i punktet
– h0 (u) er uafhængig af ’resten’ af kurven.

Eksempel 19.52 Retningsafledede

Funktionen f ( x, y) = 2 x2 + 3 y2 har de partielle afledede

f x0 ( x, y) = 4 x , f y0 ( x, y) = 6 y , (19-61)

og derfor gradientvektorfeltet
r f ( x, y) = (4 x , 6 y) (19-62)
Den retningsafledede af f ( x, y) i punktet ( x0 , y0 ) = (1, 1) i retningen bestemt ved e(q ) =
eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 30

(cos(q ), sin(q )), hvor q 2 [0, 2p ] er derfor:

f 0 ((1, 1); (cos(q ), sin(q ))) = 4 cos(q ) + 6 sin(q ) . (19-63)

19.8.3 Kædereglen ’langs’ niveau-kurver for en funktion

En kurve ( p(u), q(u)) som er niveaukurve for en funktion f ( x, y) giver anledning til en
særlig simpel – og meget vigtig – version af kædereglen:

Sætning 19.53 Kædereglen langs niveaukurver


Lad r(u) = ( p(u), q(u)) være en parametriseret kurve i ( x, y)-planen. Antag, at kur-
ven er en niveau-kurve for f ( x, y), dvs. f ( x, y) er en konstant c langs hele kurven,

f ( p(u), q(u)) = c for alle u . (19-64)


Så er
r f (r(u))·r0 (u) = 0 . (19-65)
Med andre ord: Gradienten for en funktion f ( x, y) er i ethvert punkt hvor den ikke
er 0 vinkelret på den niveau-kurve for f ( x, y) som går igennem punktet:

r f (r(u)) ? r0 (u) . (19-66)

Bevis

Funktionen h(u) = f ( p(u), q(u)) = c har tydeligvis h0 (u) = 0 og da sætning 19.49 giver
h0 (u) = r f ( p(u), q(u))·( p0 (u), q0 (u)) fås resultatet.


eNote 19 19.8 PARTIELLE AFLEDEDE AF SAMMENSATTE FUNKTIONER 31

Læg mærke til, at sætning 19.53 mere end antyder en anden sætning, som vi
dog ikke vil vise her: Hvis en differentiabel funktion f ( x, y) har et egentligt
gradientvektorfelt – dvs. hvis r f ( x, y) 6= (0, 0) for alle ( x, y) i et givet åbent
område A i definitionsmængden – så består alle niveau-mængderne for f ( x, y)
i A af pæne kurver, dvs. de kan parametriseres med differentiable vektorfunk-
tioner r(u) som ovenfor.
eNote 19 19.9 OPSUMMERING 32

19.9 Opsummering

Funktioner af to variable er behandlet i denne eNote efter samme ’skema’ som funk-
tioner af én variabel: Definitionsmængderne er her delmængder af planen og giver
derfor anledning til nye begreber og deskriptorer, som kan bruges til beskrivelse af
generelle mængder i planen. Vi har indført og illustreret begreberne: Åbne, afsluttede,
begrænsede, og stjerneformede mængder samt defineret det indre af en mængde og det
ydre af en mængde. Grafer og niveau-mængder for en funktion er vigtige hjælpemi-
dler til at forstå hvordan funktionsværdierne f ( x, y) ’opfører sig’ i afhængighed af hvor
punktet ( x, y) befinder sig i definitionsmængden. Kontinuitet og differentiabilitet (eller
mangel på samme) for en funktion kan ofte inspiceres ved at konstruere eller tegne
grafen for funktionen eller ved at tegne niveau-mængderne for funktionen.

• Niveaumængden hørende til værdien c for funktionen f ( x, y) er givet ved

Kc ( f ) = ( x, y) 2 D m( f ) f ( x, y) = c . (19-67)

• En funktion f ( x, y) er kontinuert i ( x0 , y0 ) hvis f ( x, y) f ( x0 , y0 ) er en epsilon-


funktion af x x0 , y y0 ), dvs.

f ( x, y) = f ( x0 , y0 ) + # f ( x x0 , y y0 ) . (19-68)

• En funktion f ( x, y) er differentiabel med de partielle afledede f x0 ( x0 , y0 ) og f x0 ( x0 , y0 )


i ( x0 , y0 ) hvis

f ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 )
(19-69)
+ r( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) .

• De partielle afledede af f ( x, y) i et punkt ( x0 , y0 ) kan findes ved at beregne de


sædvanlige differentialkvotienter af de to hjælpefunktioner f 1 ( x ) = f ( x, y0 ) og
f 2 (y) = f ( x0 , y) i henholdsvis x0 og y0 :

f x0 ( x0 , y0 ) = f 10 ( x0 ) og f y0 ( x0 , y0 ) = f 20 (y0 ) (19-70)

• Det approksimerende førstegradspolynomium for f ( x, y) med udviklingspunkt


( x0 , y0 ) er givet ved:
P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 ) . (19-71)

• Tangentplanen til grafen for f ( x, y) i punktet ( x0 , y0 , f ( x0 , y0 ) er givet ved:

z = P1,( x0 ,y0 ) ( x, y) . (19-72)


eNote 19 19.9 OPSUMMERING 33

• Gradientvektorfeltet for en funktion f ( x, y) er givet ved:


⇣ ⌘
r f ( x0 , y0 ) = f x0 ( x0 , y0 ) , f y0 ( x0 , y0 ) . (19-73)

• Den retningsafledede af f ( x, y) i punktet ( x0 , y0 ) i retningen givet ved en en-


hedsvektor e er givet ved:

f 0 (( x0 , y0 ); e) = r f ( x0 , y0 )·e . (19-74)
eNote 20 1

eNote 20

Gradienter og tangentplaner

I denne eNote vil vi fokusere lidt nærmere på den geometriske analyse og inspektion af
funktioner af to variable. Vi vil især studere sammenhængen mellem gradientvektorerne i
( x, y)-planen og tangentplanerne i ( x, y, z)-rummet. Vi vil se på parameterfremstillinger for –
og normalvektorer til – tangentplanerne for grafen for en funktion f ( x, y) af to variable via det
approksimerende førstegradspolynomium for f ( x, y). De partielle afledede er i hele eNoten de
grundlæggende ingredienser. Et globalt resultat om de partielle afledede er at gradienten kan
benyttes til at bestemme funktionen overalt i et sammenhængende område hvis vi blot kender
funktionsværdien i et enkelt punkt. Kurver i ( x, y)-planen kan løftes til graf-fladen for f ( x, y),
og vi vil vise, at alle tangenterne for enhver kurve igennem et givet punkt på graf-fladen er
indeholdt i tangentplanen for fladen i det punkt.

20.1 Gradienterne bestemmer funktionen

For funktioner af én variabel ved vi, at vi kan finde og rekonstruere funktionen f ( x ) ud


fra den afledede f 0 ( x ) = q( x ) og ud fra værdien af f ( x ) i blot ét punkt x0 . Vi skal ’bare’
integrere og finde en stamfunktion til q( x ). Stamfunktionen er så den ønskede funktion
f ( x ) pånær en konstant, der til sidst kan bestemmes ud fra kendskabet til f ( x0 ). Det
samme er tilfældet for funktioner af to variable.

Selv om vi kun kender de partielle afledede, dvs. de sædvanlige afledede af hjælpefunk-


tionerne f 1 ( x, y0 ) og f 2 ( x0 , y), i de to koordinatakseretninger, så er de faktisk tilstrækkelige
til at rekonstruere funktionen. Men for at kunne integrere og rekonstruere funktionen
eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 2

ud fra gradientvektorfeltet har vi brug for, at det område vi betragter i ( x, y)-planen er


sammenhængende:

Definition 20.1 Sammenhængende mængde


En mængde M i planen siges at være kurve-sammenhængende eller blot sammen-
hængende hvis ethvert punkt i M kan forbindes med ethvert andet punkt i M via en
differentiabel parametriseret kurve r(u) = ( p(u), q(u)), hvor u 2 ]a, b[.

Eksempel 20.2 Stjerneformede mængder er sammenhængende

Enhver stjerneformet mængde i ( x, y)-planen er kurvesammenhængende. Vi kan forbinde


to givne punkter via rette linjestykker til stjernepunktet, hvor der så imidlertid typisk vil
optræde et ’knæk’. Overvej, hvorfor det ikke er et problem.

Vi har så følgende sætning, som vi vil give et konstruktivt bevis for:

Sætning 20.3 Gradientvektorfeltet giver funktionen pånær en konstant


Antag, at vi kender gradientvektorfeltet r f ( x, y) for en funktion f ( x, y) overalt i
et åbent kurvesammenhængende område i definitionsmængden. Og antag, at vi
kender funktionsværdien i et enkelt punkt ( x0 , y0 ). Så kan vi rekonstruere alle funk-
tionsværdierne for f ( x, y) i hele området.

Bevis

Vi bruger kædereglen fra eNote 15 på den sammensatte funktion h(u) = f (r(u)) hvor r(u),
u 2 ]u0 , u1 [, er en vilkårlig differentiabel kurve fra ( x0 , y0 ) = r(u0 ) til ( x1 , y1 ) = r(u1 ) og får
derved:
h0 (u) = r0 (u) · r f (r(u)) . (20-1)
Heraf følger, at h(u) er en stamfunktion til funktionen på højresiden af ovenstående ligning:
Z u1
h ( u1 ) h ( u0 ) = r0 (u) · r f (r(u)) du . (20-2)
u0
eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 3

Men da
h(u0 ) = f (r(u0 )) = f ( x0 , y0 ) ,
(20-3)
h(u1 ) = f (r(u1 )) = f ( x1 , y1 ) ,
får vi dermed Z u1
f ( x1 , y1 ) = f ( x0 , y0 ) + r0 (u) · r f (r(u)) du , (20-4)
u0

og det var præcis det vi skulle – rekonstruere værdien af f ( x, y) i punktet ( x1 , y1 ) ud fra


værdien af f ( x, y) i punktet ( x0 , y0 ) og gradientvektorfeltet.

Som en direkte konsekvens af sætning 20.3 og beviset for den, isr ligning (20.1.4), har vi

Sætning 20.4 Nul gradient giver konstant funktion


Hvis en funktion f ( x, y) har gradienten r f ( x, y) = (0, 0) overalt i et åbent
kurvesammenhængende område, så er funktionen konstant i hele området.

Bemærk, at det er ligegyldigt hvilken kurve man vælger at integrere langs for at finde
funktionsværdien i endepunktet. Hvis man har mulighed for det vil man naturligvis
vælge den simpleste kurve til formålet. Det gør vi i følgende eksempel:

Eksempel 20.5 Bestemmelse af funktionen ud fra de partielle afledede

Vi vil bestemme funktionen f ( x, y) udelukkende ud fra kendskab til en given funktionsværdi


f (0, 0) = 0 samt kendskab til gradientvektorfeltet i ( x, y)-planen:
r f ( x, y) = (6 x + 10 y7 , 21 y2 + 70 x y6 ) . (20-5)
Lad r(u) være en parameterfremstilling for det rette linjestykke i ( x, y)-planen fra ( x0 , y0 ) =
(0, 0) til et vilkårligt andet punkt ( x1 , y1 i ( x, y)-planen:
r(u) = (0, 0) + u · ( x1 , y1 ) = (u x1 , u y1 ) , hvor u 2 ]0, 1[ , (20-6)
sådan at
r0 ( u ) = ( x 1 , y 1 ) ,

r f (r(u)) = (6ux1 + 10u7 y71 , 21u2 y21 + 70u7 x1 y61 ) , (20-7)

r0 (u)·r f (r(u)) = 6ux12 + 10u7 x1 y71 + 21u2 y31 + 70u7 x1 y71 .


eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 4

Heraf får vi så ved at benytte (20.1.4), at


Z 1
f ( x1 , y1 ) = 0 + 6ux12 + 10u7 x1 y71 + 21u2 y31 + 70u7 x1 y71 du
0
Z 1 Z 1 Z 1
(20-8)
= x12 6u du + 80x1 y71 u7 du + 21y31 u2 du
0 0 0
= 3x12 + 10x1 y71 + 7y31 .

Vi får derfor den rekonstruerede funktion:

f ( x, y) = 3 x2 + 7 y3 + 10 x y7 . (20-9)

Vi kan for en ordens skyld gøre prøve og undersøge, om denne funktion faktisk er 0 i (0, 0)
(det er den) og desuden har det korrekte gradientvektorfelt, som er givet ved ligning (20.1.5)
(det har den).

Opgave 20.6

En funktion f ( x, y) vides at være differentiabel i hele R2 med f (1, 0) = 1 og

r f ( x, y) = (cos(y), x sin(y)) . (20-10)

Bestem f ( x, y) i ethvert ( x, y).

20.1.1 Gradientvektorfelter

Gradientvektoren for en funktion af to variable f ( x, y) indeholder information om den


lokale tilvækst af funktionen omkring ethvert punkt ( x0 , y0 ):
eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 5

Sætning 20.7 Gradienten udpeger retningen med størst tilvækst


Lad f ( x, y) betegne en funktion af to variable, der har en egentlig gradientvektor i
et punkt ( x0 , y0 ), dvs. r f ( x0 , y0 ) 6= 0. Der gælder så:

• Den retningsafledede f 0 (( x0 , y0 ); e) af f ( x, y) i punktet ( x0 , y0 ) er størst i den


retning e som er bestemt ved gradientvektoren r f ( x0 , y0 ), dvs. for

r f ( x0 , y0 )
e = emax = (20-11)
| r f ( x0 , y0 ) |

• Den retningsafledede f 0 (( x0 , y0 ); e) af f ( x, y) er mindst i den retning som er


bestemt ved minus gradientvektoren i punktet:

r f ( x0 , y0 )
e = emin = (20-12)
| r f ( x0 , y0 ) |

• Den retningsafledede er 0 i hver af de to (niveukurve-)retninger der er vinkel-


rette på gradientvektoren.

Bevis

Vi lader g betegne den enhedsvektor, der angiver gradientens retning:


r f ( x0 , y0 )
g= . (20-13)
|r f ( x0 , y0 )|
Enhver (anden) enheds-retningsvektor e i planen kan derefter ’opløses’ efter g på følgende
måde
e = cos( j) · g + sin( j) · g? , (20-14)
hvor j er vinklen mellem de to enhedsvektorer e og g, og hvor g? betegner den ortogonale
(tvær-)vektor til g. Så er den retningsafledede af f ( x, y) i punktet ( x0 , y0 ):
f 0 (( x0 , y0 ); e) = r f ( x0 , y0 ) · e
= (|r f ( x0 , y0 )| · g) · e
⇣ ⌘
= (|r f ( x0 , y0 )| · g) · cos( j) · g + sin( j) · g?
⇣ ⌘ (20-15)
?
= |r f ( x0 , y0 )| · cos( j) · g · g + g · g
= |r f ( x0 , y0 )| · cos( j) · (1 + 0)
= |r f ( x0 , y0 )| · cos( j) .
eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 6

Da cos( j) er størst (med værdien 1) når j = 0 (dvs. når e og g peger i samme retning) og da
cos( j) er mindst (med værdien 1) når j = p (dvs. når e og g peger i modsatte retninger),
og da cos( j) er 0 når j = p/2 (dvs. når e og g er ortogonale retninger), så følger de tre
påstande i sætningen. Den sidste påstand i sætningen kender vi allerede fra eNote 15 hvor
vi så, at den retningsafledede er 0 i de retninger som står vinkelret på gradientvektoren.

Hvis vi står i punktet ( x0 , y0 ) i ( x, y)-planen og ønsker at flytte til nabo-


punkter med højere funktionsværdier f ( x, y), så er det mest effektivt at gå i den
retning, som gradienten af f ( x, y) udpeger i punktet, altså i retningen med
enheds-retningsvektor r f ( x0 , y0 )/|r f ( x0 , y0 )|.

Hvis vi ønsker at flytte til nabo-punkter med lavere funktionsværdier, så er det


mest effektivt at gå i den modsatte retning af gradienten i ( x0 , y0 ).

Hvis vi ønsker at bevæge os til nabopunkter med samme funktionsværdi


f ( x0 , y0 ) så skal vi blot gå langs den niveaukurve K f ( x0 ,y0 ) for f ( x, y) som går
igennem ( x0 , y0 ) (!) – det svarer (lokalt) til at gå i en af de to (niveaukurve-)
retninger, der er bestemt ved en vektor, som er vinkelret på gradientvektoren i
punktet.

Eksempel 20.8 Geometrisk analyse af en funktion af to variable

En funktion er givet ved


x2 2y2
f ( x, y) = 3 + 2 e . (20-16)
De partielle afledede af f ( x, y) i ( x, y) er så

x2 2y2
f x0 ( x, y) = 4xe
(20-17)
x2 2y2
f y0 ( x, y) = 8ye .

Gradientvektorfeltet er derfor
⇣ ⌘
x2 2y2 x2 2y2
r f ( x, y) = 4xe , 8ye . (20-18)

Dette vektorfelt er skitseret i figur 20.1 sammen med niveaukurverne for f ( x, y) og sammen
med en kurve (en cirkel) med parameterfremstillingen
✓ ◆
1 1
r( u ) = + cos(u) , + sin(u) , hvor u 2 ] p, p [ . (20-19)
2 2
eNote 20 20.1 GRADIENTERNE BESTEMMER FUNKTIONEN 7

Bemærk, at gradientvektorfeltet overalt er vinkelret på niveaukurverne, og at de alle peger


ind mod midten, hvor funktionsværdierne er størst – se grafen for funktionen i figur 20.2.

Bemærk også, at der på cirklen er præcis to punkter, hvor gradienten står vinkelret på
cirklen. I de punkter har den sammensatte højde-funktion h(u) = f (r(u)) derfor den afled-
ede h0 (u) = 0. Cirklen har i de punkter samme tangent som de respektive niveaukurver
igennem de to punkter. Vi kan bestemme de to punkter på cirklen ved at bestemme de to
værdier af u som løser ligningen h0 (u) = r f (r(u)) · r0 (u) = 0.

Figure 20.1: Niveaukurver og gradientvektorfelt for funktionen f ( x, y) = 3 + 2 e x2 2y2 .

Opgave 20.9

Bestem gradientvektorfelterne for følgende funktioner og skitser vektorfelterne ved at tegne


et passende antal af gradientvektorerne r f ( x0 , y0 ) med forskellige fodpunkter ( x0 , y0 ) i
( x, y)-planen:
f ( x, y) = 3x + y ,
f ( x, y) = x2 + y2 , (20-20)
x
f ( x, y) = y · e .
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 8

Figure 20.2: Grafen i ( x, y, z)-rummet for f ( x, y) = 3 + 2 e x2 2y2 .

Hvis vi bevæger os på cirklen i ( x, y)-planen i figur 20.1 (for eksempel i positiv


omløbsretning) og samtidig holder øje med hvilke niveau-kurver der krydses
undervejs vil vi kunne afgøre, om vi bevæger os mod stigende eller faldende
funktionsværdier – dels ved at holde øje med farveskiftet og dels ved at se,
om projektionen af gradientvektoren ind på bevægelsesretningen (den ret-
ningsafledede) er positiv eller negativ; hvis projektionen er positiv er vi på
vej mod større funktionsværdier, hvis projektionen er negativ er vi på vej mod
mindre funktionsværdier. Det samme kan naturligvis ses på grafen for funk-
tionen, hvor det på ethvert sted på den løftede kurve er klart om vi er på vej
opad eller nedad på graf-fladen.

20.2 Løftede kurver på graf-flader

Motiveret af graf-fladen med den løftede cirkel i figur 20.2 og motiveret af analysen i
eksempel 20.8 vil vi nu helt generelt definere og undersøge løftede kurver:
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 9

Definition 20.10 Løftede kurver


Vi lader f ( x, y) betegne en funktion af to variable og lader r(u) betegne en differen-
tiabel parametriseret kurve i ( x, y)-planen:

r(u) = ( p(u), q(u)) , hvor u 2 ]a, b[ , (20-21)

og hvor p(u) og q(u) betegner to differentiable funktioner af én variabel u.

Den løftede kurve som hører til den plane kurve r(u) defineres til at være følgende
kurve i ( x, y, z)-rummet:

Cer ( f ) : er(u) = ( p(u), q(u), f ( p(u), q(u))) , hvor u 2 ]a, b[ . (20-22)

Den løftede kurve er(u) er en rumlig kurve, som ligger på graf-fladen G( f ) for
funktionen f ( x, y).

Projektionen (lodret, langs z-aksen) af er(u) på ( x, y)-planen er naturligvis den plane


kurve r(u).

De løftede kurver er(u) har tangentvektorer og tangentlinjer i rummet – og de må jo


afhænge dels af kurven r(u) i ( x, y)-planen og dels af funktionen f ( x, y). Følgende
udtryk fås direkte ud fra kædereglen for funktionen f ( x, y) langs kurven r(u) – dvs.
kædereglen for den sammensatte funktion h(u) = f (r(u)) = f ( p(u), q(u)):
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 10

Sætning 20.11 Tangenter for løftede kurver


Den u-afledede af den løftede kurve er(u) er givet ved de u-afledede af de tre koor-
dinatfunktioner:
✓ ◆
0 0 0 d
er (u) = p (u), q (u), f ( p(u), q(u))
du
(20-23)
= p 0 ( u ), q 0 ( u ), h 0 ( u )
= p0 (u), q0 (u), r f ( p(u), q(u)) · ( p0 (u), q0 (u)) .

Tangenten til den løftede kurve på graf-fladen for f ( x, y) er derfor bestemt ved
følgende udtryk i et givet kurvepunkt er(u0 ) = ( p(u0 ), q(u0 ), f ( p(u0 ), q(u0 )) =
( x0 , y0 , f ( x0 , y0 )):
e e (t) = er(u0 ) + t · er 0 (u0 )
L u0 : T
= ( x0 , y0 , f ( x0 , y0 ))+ (20-24)
t · p0 (u0 ), q0 (u0 ), r f ( x0 , y0 ) · ( p0 (u0 ), q0 (u0 )) ,

hvor parameteren t gennemløber hele R.

20.2.1 Løftede koordinat-kurver

Koordinatkurverne i ( x, y)-planen er de særligt simple kurver (rette linjer), som er par-


allelle med koordinatakserne. Igennem punktet ( x0 , y0 ) har vi følgende to:

r1 (u) = (u, y0 ) hvor u 2 R ,


(20-25)
r2 (u) = ( x0 , u) hvor u 2 R .

De har derfor også særligt simple løft til graf-fladen for en given funktion f ( x, y):

er1 (u) = (u, y0 , f (u, y0 )) , u2R ,


(20-26)
er2 (u) = ( x0 , u, f ( x0 , u)) , u2R ,

med særligt simple u-afledede for ethvert u:

er 10 (u) = (1, 0, f x0 (u, y0 )) , u2R ,


(20-27)
er 20 (u) = (0, 1, f y0 ( x0 , u)) , u2R .
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 11

Tangenterne i punktet ( x0 , y0 , f ( x0 , y0 )) til de løftede koordinatkurver er derfor også


rimeligt simple:

e
L1 : ( x0 , y0 , f ( x0 , y0 )) + t · (1, 0, f x0 ( x0 , y0 )) , t2R
(20-28)
e
L2 : ( x0 , y0 , f ( x0 , y0 )) + t · (0, 1, f y0 ( x0 , y0 )) , t2R

Opgave 20.12

Bestem (for ethvert punkt ( x0 , y0 ) i ( x, y)-planen) tangenterne til de løftede koordinatkurver


igennem graf-fladepunktet ( x0 , y0 , f ( x0 , y0 )) for funktionerne:

f ( x, y) = 3x + y ,
f ( x, y) = x2 + y2 , (20-29)
x
f ( x, y) = y · e .

I figurerne 20.3 ses den løftede cirkel og graf-fladen for funktionen f ( x, y) fra eksempel
20.8. Den løftede kurves tangenter er indtegnet i et par udvalgte punkter. Bemærk, at
de rumlige tangenter til den løftede kurve projicerer ned på de tilsvarende tangenter til
cirklen i ( x, y)-planen – som det også følger af ligning (20.2.24).

Figure 20.3: Grafen for f ( x, y) = 3 + 2 e x2 2y2 med udvalgte tangenter til en løftet
cirkel.
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 12

Graf-fladens tangentplan i et givet punkt ( x0 , y0 , f ( x0 , y0 )) er jo selv graf-


fladen for det approksimerende første-gradspolynomium for f ( x, y) med
udviklingspunktet ( x0 , y0 ) og er derfor uafhængig af hvilken kurve vi måtte
finde på at løfte op på graf-fladen igennem punktet ( x0 , y0 , f ( x0 , y0 ))! Ikke
desto mindre ser det i figurerne ud til, at kurvens tangenter ligger helt indeholdt
i de respektive tangentplaner.

Den inspektion giver derfor anledning til følgende formodning, som vi vil vise
rigtigheden af i sætning 20.13 nedenfor: Enhver tangent til enhver løftet kurve
igennem et givet punkt ( x0 , y0 , f ( x0 , y0 )) ligger i tangentfladen for f ( x, y) i
punktet. Og omvendt: Enhver ret linje i tangentplanen som går igennem punk-
tet ( x0 , y0 , f ( x0 , y0 )) er tangent til en eller anden løftet kurve som går igennem
punktet.

Figure 20.4: Grafen for f ( x, y) = 3 + 2 e x2 2y2 og tangentplanen igennem et udvalgt


punkt på den løftede cirkel, se figur 20.2.
eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 13

2 2
Figure 20.5: Grafen for f ( x, y) = 3 + 2 e x 2y og tangentplanen igennem et andet
udvalgt punkt på den løftede cirkel, se figur 20.2.

Sætning 20.13 Tangenterne ligger i tangentplanen


Lad f ( x, y) være en differentiabel funktion af to variable og lad er(u) betegne en
løftet kurve igennem punktet er(u0 ) = ( x0 , y0 , f ( x0 , y0 )) på graf-fladen G( f ). Så er
tangenten til den løftede kurve indeholdt i tangentplanen til G( f ) for f ( x, y).

Med andre ord: Ethvert punkt ( x, y, z) som ligger på tangenten e


Lu0 tilfredsstiller
også tangentplanens ligning:

z = P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 ) . (20-30)


eNote 20 20.2 LØFTEDE KURVER PÅ GRAF-FLADER 14

2 2
Figure 20.6: Grafen for f ( x, y) = 3 + 2 e x 2y og tangentplanen igennem et tredje
udvalgt punkt på den løftede cirkel, se figur 20.2.

Bevis

Vi skal blot indse, at tangentvektoren er 0 (u0 ) er vinkelret på en normalvektor til tangentpla-


nen. En sådan normalvektor konstrueres i næste afsnit (se nedenfor):
N( x0 ,y0 ) ( f ) = ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 ), 1) , (20-31)
og da
er 0 (u0 ) = p0 (u0 ), q0 (u0 ), r f ( p(u0 ), q(u0 )) · ( p0 (u0 ), q0 (u0 ))
⇣ ⇣ ⌘ ⌘ (20-32)
= p0 (u0 ), q0 (u0 ), f x0 ( x0 , y0 ), f y0 ( x0 , y0 ) · ( p0 (u0 ), q0 (u0 )) ,
får vi ortogonaliteten ved at beregne skalarproduktet:
er 0 (u0 ) · N( x0 ,y0 ) ( f ) = f x0 ( x0 , y0 ) · p0 (u0 ) f y0 ( x0 , y0 ) · q0 (u0 )
⇣ ⌘
+ 1 · f x0 ( x0 , y0 ), f y0 ( x0 , y0 ) · ( p0 (u0 ), q0 (u0 )) (20-33)
=0 .
eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 15

20.3 Gradienten bestemmer normalvektoren

En plan i rummet med ligningen

a·x+b·y+c·z+d = 0 (20-34)

har en normalvektor N = ( a, b, c) som altså fås direkte fra koefficienterne til x, y, og z


i ligningen. Vi kan nu skrive ligningen for tangentplanen for graf-fladen for f ( x, y) i
punktet ( x0 , y0 , f ( x0 , y0 ) på netop den form således:

z = P1,( x0 ,y0 ) ( x, y) ,
z = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 ) ,
som er ækvivalent med:
(20-35)
f x0 ( x0 , y0 ) · ( x x0 ) f y0 ( x0 , y0 ) · (y y0 ) + z f ( x0 , y0 ) = 0 ,
og dermed:
f x0 ( x0 , y0 ) · x f y0 ( x0 , y0 ) · y + z + d = 0 ,

hvor d = x0 · f x0 ( x0 , y0 ) + y0 · f y0 ( x0 , y0 ) f ( x0 , y0 ).

Normalvektoren til tangentplanen aflæses direkte af den sidste ligning i (20.3.35):

N( x0 ,y0 ) ( f ) = ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 ), 1) . (20-36)

En normalvektor til tangentplanen for graf-fladen for f ( x, y) kan altså ’bygges’


af de samme ingredienser som gradienten til f ( x, y) – de partielle afledede.
Læg dog mærke til minusserne og 1-tallet. Og bemærk, at gradienten er en
vektor i planen, normalvektoren er en vektor i rummet.

En alternativ udledning af normalvektorens koordinater fås på følgende måde: Hvis vi


kan finde to lineært uafhængige vektorer i tangentplanen, så er deres krydsprodukt en
normalvektor til planen.
eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 16

Vi kender altid to lineært uafhængige vektorer i tangentplanen igennem ( x0 , y0 , f ( x0 , y0 )),


nemlig tangentvektorerne til de løftede koordinatkurver igennem punktet, dvs.

er 10 ( x0 ) = (1, 0, f x0 ( x0 , y0 )) ,
(20-37)
er 20 (y0 ) = (0, 1, f y0 ( x0 , y0 )) .

En normalvektor til tangentplanen er derfor

N( x0 ,y0 ) ( f ) = er 10 ( x0 ) ⇥ er 20 (y0 )
(20-38)
= ( f x0 ( x0 , y0 ) , f y0 ( x0 , y0 ), 1)

- altså præcis den samme normalvektor som fundet ovenfor.

De to tangentvektorer er 10 ( x0 ) og er 20 (y0 ) giver os ligeledes en parameterfremstilling for


tangentplanen:

Sætning 20.14 Parameterfremstilling for tangentplaner


Tangentplanen igennem punktet ( x0 , y0 , f ( x0 , y0 )) på graf-fladen G( f ) for funktio-
nen f ( x, y) har parameterfremstillingen

T( x0 ,y0 ) ( f ) : T(t1 , t2 ) = ( x0 , y0 , f ( x0 , y0 )) + t1 · er10 ( x0 ) + t2 · er20 (y0 )


= ( x0 , y0 , f ( x0 , y0 )) + t1 · (1, 0, f x0 ( x0 , y0 )) + t2 · (0, 1, f y0 ( x0 , y0 )) ,
(20-39)
hvor t1 2 R og t2 2 R.

Eksempel 20.15 Løftede koordinatkurver

Enhedsnormalvektoren i retningen N til de tangentplaner, der er vist i figurerne 20.4, 20.5,


20.6 er også indtegnet på de figurer. Desuden ses koordinatkurverne i ( x, y)-planen samt de
løftede koordinatkurver på graf-fladerne, dels for funktionen f ( x, y) og dels for de respektive
approksimerende førstegradspolynomier (tangentplanerne).
eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 17

Eksempel 20.16 Funktioner af én variabel

Enhver funktion af én variabel kan betragtes som en funktion af to variable. Vi må forvente,


at niveau-kurverne, gradientvektorfelterne, tangentplanerne, etc. er forholdsvis simple for
sådanne funktioner. Vi ser på nogle eksempler, der viser det:

1. Funktionen f ( x, y) = x2 har følgende gradientfelt, tangentplaner, og normalvektorer:

r f ( x, y) = (2x, 0) ,
T(x0 ,y0 ) ( f ) : T(t1 , t2 ) = ( x0 + t1 , y0 + t2 , x02 + 2x0 · t1 ) , (20-40)
N( x0 ,y0 ) ( f ) = ( 2x0 , 0, 1) .

Se figur 20.7 hvor niveu-kurverne, gradientvektorfeltet, og graf-fladen er vist for funk-


tionen.

2. Funktionen f ( x, y) = x3 har

r f ( x, y) = (3x2 , 0) ,
T(x0 ,y0 ) ( f ) : T(t1 , t2 ) = ( x0 + t1 , y0 + t2 , x03 + 3x02 · t1 ) , (20-41)
N( x0 ,y0 ) ( f ) = ( 3x02 , 0, 1) .

Se figur 20.8 hvor kun niveu-kurverne og gradientvektorfeltet er vist. Sammenlign


med niveaukurver og gradientvektorfeltet for f ( x, y) = x2 i figur 20.7.

3. Funktionen f ( x, y) = cos(3x ) har

r f ( x, y) = ( 3 sin(3x ), 0) ,
T(x0 ,y0 ) ( f ) : T( t1 , t2 ) = ( x0 + t1 , y0 t1 · 3 sin( x0 ) + t2 , cos(3x0 )) , (20-42)
N( x0 ,y0 ) ( f ) = (3 sin(3x0 ), 0, 1) .

Se figur 20.9. Sammenlign med figur 20.10. Inspektion af grafen og af niveaukurverne


for funktionen i 20.10 leder til den ide, at man mske ved at dreje koordinatsystemet – og
dermed skifte koordinater i planen – også kan beskrive den funktion som en funktion
af én variabel. Det er da også tilfældet, idet den viste funktion er f ( x, y) = cos(3x +
3y).
eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 18

Figure 20.7: Grafen for f ( x, y) = x2 samt tilhørende niveaukurver og gradientvektorfelt


i ( x, y)-planen.

Opgave 20.17

Bestem enheds-normalvektoren til tangentplanerne igennnem punktet ( x0 , y0 , f ( x0 , y0 ) på


graf-fladerne for enhver af følgende funktioner for ethvert punkt ( x0 , y0 ) i ( x, y)-planen.

f ( x, y) = 3x + y
f ( x, y) = x2 + y2 (20-43)
x
f ( x, y) = y · e .
eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 19

Figure 20.8: Niveaukurver og gradientvektorfelt for f ( x, y) = x3 .

Figure 20.9: Grafen, niveaukurver, og gradientvektorfelt for f ( x, y) = cos(3x ).


eNote 20 20.3 GRADIENTEN BESTEMMER NORMALVEKTOREN 20

Figure 20.10: Grafen, niveaukurver, og gradientvektorfelt for f ( x, y) = cos(3x + 3y).


eNote 20 20.4 OPSUMMERING 21

20.4 Opsummering

De partielle afledede af en funktion af to variable har forskellige geometriske iklæd-


ninger, som er særdeles nyttige at bruge ved beskrivelse og analyse af funktionerne.
Gradientvektorfeltet – der jo har de partielle afledede som koordinatfunktioner – in-
deholder (næsten) al information om funktionen. I denne eNote har vi arbejdet med
følgende:

• Gradienten udpeger i ethvert punkt den retning hvori funktionen lokalt vokser
mest og den (modsatte) retning hvori funktionen aftager mest.

• Længden af gradienten for f ( x, y) i punktet ( x0 , y0 )) er værdien af den største


retningsafledede af f ( x, y) i punktet, og den tilsvarende negative værdi er værdien
af den mindste retningsafledede i punktet.

• Gradientvektorfeltet for f ( x, y) er overalt ortogonal på niveaukurverne for f ( x, y).

• De løftede kurver på graf-fladen for en funktion har tangenter, der er helt inde-
holdt i tangentplanen til graf-fladen.

• Tangentplanen til graf-fladen for funktionen f ( x, y) i et givet punkt ( x0 , y0 , f ( x0 , y0 ))


har en normalvektor, der er ’bygget’ op af de partielle afledede:

N( x0 ,y0 ) ( f ) = ( f x0 ( x0 , y0 ) , f y0 ( x0 , y0 ), 1) .

• Tangentplanen til graf-fladen for funktionen f ( x, y) i et givet punkt ( x0 , y0 , f ( x0 , y0 ))


er repræsenteret dels ved ligningen

z = P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 )

og dels ved parameterfremstillingen

T( x0 ,y0 ) ( f ) : T(t1 , t2 ) = ( x0 , y0 , f ( x0 , y0 )) + t1 · er10 ( x0 ) + t2 · er20 (y0 )


= ( x0 , y0 , f ( x0 , y0 )) + t1 · (1, 0, f x0 ( x0 , y0 )) + t2 · (0, 1, f y0 ( x0 , y0 )) ,

hvor t1 2 R og t2 2 R.
eNote 21 1

eNote 21

Taylor’s grænseformel for funktioner af to


variable

I eNote 4 har vi studeret Taylor’s grænseformel for én variabel og fundet approksimerende


polynomier af vilkårlig høj grad til givne funktioner. For funktioner af to variable gælder en
tilsvarende formel, som vi dog vil nøjes med at udvikle til approksimation med
andengrads-polynomier. Vi kan også her benytte Taylor’s grænseformel til at undersøge
funktionsværdierne i og omkring ethvert punkt hvor funktionen er glat. Specielt vil vi i første
omgang benytte formlen for funktioner af to variable til at finde og undersøge lokale og globale
minima og maksima for funktionerne.

21.1 Højere-ordens afledede

Vi vil i denne eNote undersøge funktioner f ( x, y) af to variable i et område M som er


en delmængde af definitionsmængden for f ( x, y) i planen, M ⇢ D m( f ) ⇢ R2 .

Vi vil antage, at funktionen kan differentieres partielt vilkårligt mange gange, altså
at alle de afledede funktioner eksisterer for ethvert ( x, y) i det indre af M: f x0 ( x, y),
f y0 ( x, y), f xx
00 ( x, y ), f 00 ( x, y ), f 00 ( x, y ), f 000 ( x, y ) osv. Disse højere afledede vil vi bruge til
xy yy xyx
at konstruere (koefficienterne i) de approksimerende polynomier af to variable præcis
på samme måde som vi konstruerede dem for funktioner af én variabel.
eNote 21 21.1 HØJERE-ORDENS AFLEDEDE 2

Definition 21.1
Hvis en funktion f ( x, y) kan differentieres partielt vilkårligt mange gange i ethvert
punkt ( x, y) i det indre M̊ af et givet område M i planen, så siger vi, at funktionen
er glat i M̊.

Eksempel 21.2 Højere-ordens afledede af nogle elementære funktioner

Her er nogle første- og anden-ordens afledede af nogle kendte funktioner af to variable. Læg
mærke til, at f yx00 ( x, y ) ikke optræder eksplicit i tabellen – det er fordi f 00 ( x, y ) = f 00 ( x, y )
yx xy
for alle ( x, y) når funktionerne er glatte, som antaget, se eNote 15. Funktionen r(0,0) ( x, y) =
p
x2 + y2 betegner afstandsfunktionen fra (0, 0) til ( x, y); den er kun glat for ( x, y) 6= (0, 0)
som det også fremgår af de viste første- og anden-ordens partielle afledede af r(0,0) ( x, y) i
tabellen. Funktionen r2(0,0) ( x, y) = x2 + y2 er derimod (som det ogs fremgår af tabellen) en
glat funktion i hele definitionsomrdet, dvs. for alle ( x, y) 2 R2 . Det er kvadratet p afstanden
fra et vilkårligt punkt ( x0 , y0 ) tilsvarende også, dvs. funktionen:

r2( x0 ,y0 ) ( x, y) = ( x x0 )2 + ( y y0 )2 .

f ( x, y) f x0 ( x, y) f y0 ( x, y) 00 ( x, y )
f xx 00 ( x, y )
f xy 00 ( x, y )
f yy
ex ex 0 ex 0 0
ex +y ex +y ex +y ex +y ex +y ex +y
2 2 2 2 2 2 2 + y2 2 2 2 2
ex +y 2 · x · ex +y 2 · y · ex +y (2 + 4 · x 2 ) · e x 4 · x · y · ex +y (2 + 4 · y2 ) · e x + y
ex ·y y · ex ·y x · ex ·y y2 · e x · y ex ·y + x · y · ex ·y x2 · ex ·y
x y y2 x ·y x2
r(0,0) ( x, y) p p
( x2 +y2 )3/2 ( x2 +y2 )3/2 ( x2 +y2 )3/2
x 2 + y2 x 2 + y2
r2(0,0) ( x, y) 2·x 2·y 2 0 2
r2( x ) ( x, y ) 2 · (x x0 ) 2 · (y y0 ) 2 0 2
0 ,y0

I eksemplet 21.2 ovenfor er de partielle afledede sat p linje i tabellen. I det følgende viser
det sig smart at samle eller pakke de partielle afledede, dels de to første-ordens afledede
til en vektor, gradientvektoren for f ( x, y) i ( x0 , y0 ), som ogs indfres og benyttes i eNote
15:

r f ( x0 , y0 ) = ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 )) , (21-1)
eNote 21 21.1 HØJERE-ORDENS AFLEDEDE 3

og dels de tre anden-ordensafledede i en matrix H f ( x0 , y0 ) – den såkaldte Hesse-matrix


for funktionen f ( x, y) i punktet ( x0 , y0 ), som er bestemt ved
" #
00 ( x , y ) f 00 ( x , y )
f xx 0 0 xy 0 0
H f ( x0 , y0 ) = 00 ( x , y ) f 00 ( x , y ) . (21-2)
f yx 0 0 yy 0 0

00 ( x , y ) = f 00 ( x , y ).
Bemærk specielt at denne matrix er symmetrisk fordi f xy 0 0 yx 0 0
Den har derfor nogle særlige egenskaber, som er afgørende i den geometriske
analyse af funktioner til anden orden.

Eksempel 21.3 Gradienter og Hesse-matricer

Ud fra tabellen aflæser vi følgende gradienter og Hesse-matricer for de givne elementære


glatte funktioner i punktet ( x0 , y0 ):

f ( x, y) r f ( x, y) H f ( x, y)
 x
e 0
ex (e x , 0)
0 0
 x +y x +y
e e
ex +y (e x + y , e x + y ) x y
e + ex +y

2 0
r2(0,0) ( x, y) = x2 + y2 (2 · x, 2 · y)
0 2

(3 · ( x x0 )2 + ( y y0 )2 , 6 · ( x x0 ) 2 · ( y y0 )
(x x0 ) · r2( x0 ,y0 ) ( x, y)
2 · ( x x0 ) · (y y0 )) 2 · ( y y0 ) 2 · ( x x0 )

Bemærk, at funktionen f ( x, y) = ( x x0 ) · r2( x ,y ) ( x, y) har gradientvektoren 0


0 0
og Hesse-matricen 0 når de udregnes i selve basispunktet ( x0 , y0 ) for afstands-
funktionen r( x0 ,y0 ) ( x, y).

Opgave 21.4

Bestem gradienten r f ( x, y) og Hesse-matricen H f ( x, y) i ethvert punkt ( x, y) 2 R2 for hver


af følgende funktioner:
f ( x, y) = cos( x + y) , f ( x, y) = cos( x · y) , f ( x, y) = x3 + y2 + x · y . (21-3)
eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 4

21.2 Approksimation af funktioner af to variable

Vi vil nu sammenligne funktionen f ( x, y) med et vilkårligt andengrads-polynomium


i de to variable x og y og bestemme koefficienterne i polynomiet ved at kræve, at
forskellen skal være lille i og omkring punktet x0 .

Det polynomium, vi vil afprøve og sammenligne med, er følgende:

a + b1 · ( x x0 ) + b2 · (y y0 )
✓ ◆ ✓ ◆
h11 h22 (21-4)
+ · ( x x0 )2 + h12 · ( x x0 ) · ( y y0 ) + · (y y0 )2 .
2 2

Vi vil vælge koefficienterne a, b1 , b2 , h11 , h12 , og h22 , så præcise at restfunktionen R( x, y) =


R2,( x0 ,y0 ) ( x, y) i forhold til f ( x, y) bliver så (numerisk) lille som muligt i og omkring
punktet ( x0 , y0 ) – på samme måde som vi motiverede Taylor’s formler for funktioner af
én variabel i eNote 17:
f ( x, y) = a + b1 · ( x x0 ) + b2 · (y y0 )
✓ ◆ ✓ ◆
h11 h22
+ · ( x x0 )2 + h12 · ( x x0 ) · ( y y0 ) + · (y y0 )2 (21-5)
2 2
+ R( x, y) .

Det polynomium af anden grad, som vi prøver at approksimere med i (21.2.5),


er et helt generelt andengradspolynomium; ethvert andengradspolynomium
kan skrives p denne form også selv om værdierne af x0 og y0 er givet på
forhånd. Bemærk, at der er 6 koefficienter, der endnu ikke er bestemt: a, b1 , b2 ,
h11 , h12 , og h22 . Og mængden af andengradspolynomier i to variable er netop
et 6-dimensionalt vektorrum!

Kunsten er at finde de bedste værdier af disse 6 koefficienter, således at R( x, y)


bliver numerisk lille i og tæt på punktet ( x0 , y0 ).

Restfunktionen R( x, y) kan skrives som forskellen mellem f ( x, y) og polynomiet:

R( x, y) = f ( x, y) a b1 · ( x x0 ) b2 · (y y0 )
✓ ◆ ✓ ◆
h11 2 h22 (21-6)
· (x x0 ) h12 · ( x x0 ) · ( y y0 ) · (y y0 )2 .
2 2
eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 5

Vi vil nu stille følgende naturlige krav til restfunktionen – krav som sikrer, at restfunk-
tionen er meget lille i og omkring ( x0 , y0 ) og dermed, at polynomiet vi får frem på den
måde er meget tæt på funktionen f ( x, y).

Det første krav er naturligvis, at restfunktionen er 0 i ( x0 , y0 ). Vi indsætter kravet i


ligningen (21.2.6) og får:

R ( x0 , y0 ) = 0 giver 0 = f ( x0 , y0 ) a , (21-7)

hvorved konstantleddet i det approksimerende polynomium allerede er bestemt:

a = f ( x0 , y0 ) . (21-8)

Det næste krav er selvfølgelig at R0x ( x0 , y0 ) = R0y ( x0 , y0 ) = 0 således at r R( x0 , y0 ) =


(0, 0), hvilket geometrisk betyder, at grafen for restfunktionen har vandret tangentplan
– identisk med ( x, y)-planen – i ( x0 , y0 ). Indsættes disse krav til R( x, y) i ligningen
(21.2.6) får vi at

R0x ( x0 , y0 ) = 0 som giver 0 = f x0 ( x0 , y0 ) b1 ,


(21-9)
R0y ( x0 , y0 ) = 0 som giver 0 = f y0 ( x0 , y0 ) b2 ,

hvorved koefficienterne b1 = f x0 ( x0 , y0 ) og b2 = f x0 ( x0 , y0 ) også er bestemte. Vi har:

(b1 , b2 ) = r f ( x0 , y0 ) . (21-10)

Det sidste krav til R( x, y) vi vil anvende er at alle de tre anden-ordens partielle afledede
af R( x, y) også er 0 i ( x0 , y0 ):

Indsættes disse 3 krav til R( x, y) i ligningen (21.2.6) får vi at

R00xx ( x0 , y0 ) = 0 som giver 00


0 = f xx ( x0 , y0 ) h11 ,

R00xy ( x0 , y0 ) = 0 som giver 00


0 = f xy ( x0 , y0 ) h12 , (21-11)

R00yy ( x0 , y0 ) = 0 som giver 00


0 = f yy ( x0 , y0 ) h22 .

Dermed er de sidste 3 koefficienter i det søgte polynomium fundet.


eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 6

Vi kan skrive resultatet således – når vi stadig husker på, at f xy 00 ( x , y ) = f 00 ( x , y ) =


0 0 xy 0 0
h12 : " #
 00 ( x , y ) f 00 ( x , y )
h11 h12 f xx 0 0 xy 0 0
= 00 ( x , y ) f 00 ( x , y ) = H f ( x0 , y0 ) . (21-12)
h12 h22 f yx 0 0 yy 0 0

Vi har dermed indset, at de stillede krav til restfunktionen kan opfyldes, og at det re-
sulterende andengradspolynomium, der opfylder kravene, derefter netop fortjener at
blive kaldt det approksimerende polynomium af anden grad for f ( x, y) med udviklingspunkt
( x0 , y0 ):

Definition 21.5 Approksimerende andengrads-polynomium


Lad f ( x, y) betegne en glat funktion i et område M i R2 som indeholder punktet
( x0 , y0 ) 2 M̊. Polynomiet

P2,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 )
1 00
+ · f xx ( x0 , y0 ) · ( x x0 )2
2 (21-13)
00
+ f xy ( x0 , y0 ) · ( x x0 ) · ( y y0 )
1 00
+ · f yy ( x0 , y0 ) · ( y y0 )2
2
kaldes det approksimerende polynomium af anden grad for funktionen f ( x, y) med
udviklingspunkt ( x0 , y0 ).

Ligesom for funktioner af én variabel er det nu rimeligt at forvente, at med de benyttede


krav til restfunktionen R( x, y) = R2,( x0 ,y0 ) ( x, y) må den være numerisk sammenlignelig
med en potens af afstandsfunktionen r( x0 ,y0 )( x, y) til det betragtede punkt ( x0 , y0 ). For ek-
sempel kan vi se af det sidste eksempel i 21.3 at alle de krav, vi har stillet til R( x, y), er
opfyldte for funktionen ( x x0 ) · r2( x ,y ) ( x, y).
0 0

Det er præcis indholdet af følgende sætning som udtrykker netop dette ved hjælp af en
epsilonfunktion, som selvfølgelig sædvanligvis ikke er så simpel som ( x x0 ):
eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 7

Hjælpesætning 21.6 Restfunktion med epsilon-led


Givet en glat funktion f ( x, y). Så kan restfunktionen R2,( x0 ,y0 ) ( x, y) skrives på føl-
gende form:

R2,( x0 ,y0 ) ( x, y) = r2( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) , (21-14)

hvor # f ( x x0 , y y0 ) er en epsilonfunktion af ( x x0 , y y0 ), dvs.

# f (x x0 , y y0 ) ! 0 for ( x, y) ! ( x0 , y0 ) . (21-15)

Vi har nu alle ingredienserne til hovedsætningen i denne eNote:

Sætning 21.7 Taylor’s grænseformel for funktioner af to variable


Enhver glat funktion f ( x, y) af to variable kan opdeles i et approksimerende
andengrads-polynomium med givet udviklingspunkt ( x0 , y0 ) og en restfunktion
med epsilon-led således:

f ( x, y) = P2,( x0 ,y0 ) ( x, y) + R2,( x0 ,y0 ) ( x, y)

= f ( x0 , y0 ) + f x0 ( x0 , y0 ) · ( x x0 ) + f y0 ( x0 , y0 ) · (y y0 )
1 00
+ · f xx ( x0 , y0 ) · ( x x0 )2 (21-16)
2
00
+ f xy ( x0 , y0 ) · ( x x0 ) · ( y y0 )
1 00
+ · f yy ( x0 , y0 ) · ( y y0 )2
2
+ r2( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) .

Ved at bruge gradienten af f ( x, y) og Hesse-matricen for f ( x, y) kan vi skrive Taylor’s


grænseformel (21.2.16) p en mere kompakt form, som vi vil benytte i det følgende med
henblik p den geometriske analyse af f ( x, y) i og omkring udviklingspunktet ( x0 , y0 ):
eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 8

Sætning 21.8 Taylor’s grænseformel, kompakt, geometrisk


Enhver glat funktion f ( x, y) af to variable er en sum af et approksimerende
andengrads-polynomium med givet udviklingspunkt ( x0 , y0 ) og en restfunktion
således:
f ( x, y) = f ( x0 , y0 ) + r f ( x0 , y0 ) · ( x x0 , y y0 )

1 ⇥ ⇤ x x0
+ · x x0 y y0 · H f ( x0 , y0 ) · (21-17)
2 y y0
+ r2( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) ,

hvor
r f ( x0 , y0 ) = ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 )) og

" # (21-18)
00 ( x , y ) f 00 ( x , y )
f xx 0 0 xy 0 0
H f ( x0 , y0 ) = 00 00 ( x , y ) .
f yx ( x0 , y0 ) f yy 0 0

Bevis

En direkte udregningen af følgende matrixprodukt viser, at (21.2.17) er ækvivalent med


(21.2.16), og det er det eneste nye i sætningen:

⇥ ⇤ x x0
x x0 y y0 · H f ( x0 , y0 ) ·
y y0
" # 
⇥ ⇤ 00 ( x , y ) f 00 ( x , y )
f xx 0 0 xy 0 0 x x0
= x x0 y y0 · 00 ( x , y ) f 00 ( x , y ) ·
f yx 0 0 yy 0 0 y y0 (21-19)
00 2
= f xx ( x0 , y0 ) · ( x x0 )
00
+ 2 · f xy ( x0 , y0 ) · ( x x0 ) · ( y y0 )
00 2
+ f yy ( x0 , y0 ) · ( y y0 ) .

Det approksimerende andengrads-polynomium for f ( x, y) med udviklingspunkt ( x0 , y0 )


eNote 21 21.2 APPROKSIMATION AF FUNKTIONER AF TO VARIABLE 9

er derfor på kompakt form:

P2,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + r f ( x0 , y0 ) · ( x x0 , y y0 )

1 ⇥ ⇤ x x0 (21-20)
+ · x x0 y y0 · H f ( x0 , y0 ) · .
2 y y0

Læg mærke til, at det approksimerende førstegrads-polynomium for f ( x, y)


netop er den lineære del (lineariseringen) af det approksimerende andengrads-
polynomium:

P1,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + r f ( x0 , y0 ) · ( x x0 , y y0 ). (21-21)

I eNote ?? har vi set, at den geometriske tolkning af P1,( x0 ,y0 ) ( x, y) er at grafen


for det approksimerende førstegrads-polynomium P1,( x0 ,y0 ) ( x, y) (dvs. planen
z = P1,( x0 ,y0 ) ( x, y) i ( x, y, z)-rummet), netop er tangentplanen til graf-fladen for
f ( x, y) i punktet ( x0 , y0 , f ( x0 , y0 )).

Definition 21.9 Stationære punkter for funktioner af to variable


Lad f ( x, y) betegne en glat funktion i et område M i D m( f ) ⇢ R2 . Ved et stationært
punkt for f ( x, y) vil vi forstå ethvert punkt ( x0 , y0 ) i M̊ hvor gradienten for f ( x, y)
er (0, 0).

I et stationært punkt for f ( x, y) har vi altså:


⇣ ⌘
r f ( x0 , y0 ) = f x0 ( x0 , y0 ), f y0 ( x0 , y0 ) = (0, 0) . (21-22)

Geometrisk betyder definition 21.9, at ( x0 , y0 ) er et stationært punkt i


M̊ for f ( x, y) hvis tangentplanen til grafen for f ( x, y) igennem punktet
( x0 , y0 , f ( x0 , y0 )) er vandret, alts parallel med ( x, y)-planen, således at enheds-
normalvektoren til graf-fladen i punktet ( x0 , y0 , f ( x0 , y0 )) er N( x0 ,y0 ) ( f ) =
(0, 0, 1).
eNote 21 21.3 FUNKTIONSUNDERSØGELSER 10

21.3 Funktionsundersøgelser

Ligesom for kontinuerte funktioner af én variabel gælder det for kontinuerte funktioner
af to variable, at hvis det aktuelle område for funktionsundersøgelsen er tilstrækkelig
pæn, så er funktionsværdierne f ( x, y) begrænsede i området:

Sætning 21.10 Hovedsætning for kontinuerte funktioner af to variable


Lad f ( x, y) betegne en funktion som er kontinuert i hele sin definitionsmængde
D m( f ) ⇢ R2 . Lad M være en begrænset, afsluttet, og sammenhængende mængde i
D m ( f ).

Så er værdimængden for funktionen f ( x, y) i mængden M et begrænset, afsluttet,


og sammenhængende interval [ A , B ] ⇢ R. Vi kan skrive således:

V m( f | M ) = f ( M) = { f ( x ) | x 2 M} = [ A , B ] , (21-23)

hvor der stadig tillades den mulighed at A = B og det sker naturligvis netop når
f ( x, y) er konstant i hele M.

Præcis som for funktioner af én variabel definerer vi nu:

Definition 21.11 Globalt minimum og globalt maksimum


Når en funktion f ( x, y) har værdimængden V m( f | M ) = f ( M ) = [ A , B ] i en
mængde M siger vi, at

1. A er den globale minimumværdi for f ( x, y) i M, og hvis f ( x0 , y0 ) = A for


( x0 , y0 ) 2 M så er ( x0 , y0 ) et globalt minimumpunkt for f ( x, y) i M.

2. B er den globale maksimumværdi for f ( x, y) i M, og hvis f ( x0 , y0 ) = B for


( x0 , y0 ) 2 M så er ( x0 , y0 ) et globalt maksimumpunkt for f ( x, y) i M.

En helt naturlig og meget ofte forekommende opgave går ud på at finde de globale


maksimum- og minimum-værdier for givne funktioner f ( x, y) i givne mængder og om-
råder M i R2 og samtidig dermed at bestemme de ( x, y)-punkter i M for hvilke disse
eNote 21 21.3 FUNKTIONSUNDERSØGELSER 11

maksimum- og minimum-værdier antages – altså bestemme minimum- og maksimum-


punkterne.

For at løse den opgave er følgende igen en uvurderlig hjælp (på samme måde som ved
undersøgelsen af funktioner af én variabel):

Hjælpesætning 21.12 Maksima og minima i stationære punkter


Lad ( x0 , y0 ) være et globalt maksimum- eller minimum-punkt for f ( x, y) i M.

Antag, at ( x0 , y0 ) ikke er et punkt på randen af området M, dvs. vi antager, at


( x0 , y0 ) er et indre punkt i M. Antag yderligere, at f ( x, y) er differentiabel i punktet
( x0 , y0 ).

Så er ( x0 , y0 ) et stationært punkt for f ( x, y) i ( x0 , y0 ) 2 M̊:

( f x0 ( x0 , y0 ), f y0 ( x0 , y0 )) = r f ( x0 , y0 ) = 0 = (0, 0) . (21-24)

Bevis

Beviset følger det tilsvarende argument for funktioner af én variabel. Kort fortalt: Hvis
r f ( x0 , y0 ) 6= (0, 0) så stiger funktionsværdierne effektivt i retningen r f ( x0 , y0 ) fra ( x0 , y0 )
og funktionsværdierne aftager effektivt i den modsatte retning r f ( x0 , y0 ) fra ( x0 , y0 ) og
( x0 , y0 ) kan i så fald hverken være et minimum- eller et maksimum-punkt.

Hermed har vi undersøgelsesmetoden for funktioner af to variable:


eNote 21 21.3 FUNKTIONSUNDERSØGELSER 12

Metode 21.13 Undersøgelsesmetode


Lad f ( x, y) være en kontinuert funktion og M et afsluttet, begrænset, og sammen-
hængende område i definitionsmængden D m( f ) ⇢ R2 .

Maksimum- og minimum-værdierne for funktionen f ( x, y), altså A og B i


værdimængden [ A, B] for f ( x, y) i M findes ved at finde og sammenligne funk-
tionsværdierne i følgende punkter:

1. Randpunkterne for mængden M.

2. Undtagelsespunkter, dvs. de punkter i det indre af M hvor funktionen f ( x, y)


ikke er differentiabel.

3. De stationære punkter, dvs. samtlige de punkter ( x0 , y0 ) i det indre af M hvor


funktionen f ( x, y) er differentiabel og ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 ) = r f ( x0 , y0 ) =
0 = (0, 0).

Ved denne undersøgelsesmetode findes naturligvis ikke blot de globale


maksimum- og minimum-værdier A og B men også de ( x, y)-punkter i M ⇢
R2 for hvilke det globale maksimum B og det globale minimum A antages, altså
maksimum- og minimum-punkterne i det aktuelle område.

Eksempel 21.14 Funktionsundersøgelse, værdimængde

Lad f ( x, y) = 1 + x2 x · y2 . Vi vil undersøge funktionen i det afsluttede begrænsede


cirkulære område M i planen som er afgrænset af cirklen med radius 1 og centrum i (0, 0), se
figur 21.1.
r f ( x, y) = (2 · x + y2 , 2 · y · x ) . (21-25)

Funktionen er differentiabel i hele sin definitionsmængde D m( f ) = R2 . I det indre af M, som


er den åbne cirkelskive med radius 1 og centrum i (0, 0) har funktionen netop ét stationært
punkt ( x0 , y0 ) = (0, 0) og værdien af f ( x0 , y0 ) er f (0, 0) = 1. Da der ikke er undtagelsespunk-
ter for f ( x, y) i den åbne cirkelskive mangler vi blot at undersøge funktionen på randen af
området, altså funktionsværdierne på cirklen med radius 1 og centrum i (0, 0). Vi parametris-
erer den aktuelle cirkel i planen på sædvanlig måde:

r(u) = (cos(u), sin(u)) , u 2 [ p, p ] , (21-26)


eNote 21 21.3 FUNKTIONSUNDERSØGELSER 13

og indsætter cirklens punkter i funktionsudtrykket og får dermed følgende sammensatte


funktion, som angiver funktionsværdierne på cirklen når u gennemløber intervallet [ p, p ]:

h(u) = f (r(u)) = 1 + cos2 (u) cos(u) · sin2 (u) . (21-27)


Vi differentierer h(u) og finder:

h0 (u) = sin(u) · (2 · cos(u) + 3 · cos2 (u) 1) (21-28)

som giver h0 (u) = 0 for u = 0, u = ±p, og u = ± arccos(1/3). I disse stationære punkter for
funktionen h(u) antager h(u) værdierne: h(0) = 2, h(±p ) = 2, og h(± arccos(1/3)) = 22/27.

Ved at sammenligne alle kandidatværdierne for henholdsvis maksimum- og minimumværdi


for f ( x, y) som givet ved metoden 21.13 konkluderer vi, at værdimængden for f ( x, y) i den
givne cirkelskive er: 
22
f ( M) = ,2 , (21-29)
27
og maksimumpunkter og minimumpunkter findes alle på randen af cirkelområdet og er hen-
holdsvis: maksimumpunkterne er (cos(0), sin(0)) = (1, 0) og (cos(±p ), sin(±p )) = ( 1, 0)
p
og minimumpunkterne er (cos(± arccos(1/3)), sin(± arccos(1/3))) = (1/3, ±2 2/3).

Definition 21.15 Lokale minima og lokale maksima


Lad f ( x, y) betegne en funktion i et område M som indeholder et givet indre punkt
( x0 , y0 ) 2 M̊.

1. Hvis f ( x, y) f ( x0 , y0 ) for alle ( x, y) i en (gerne lille) omegn om ( x0 , y0 ) dvs.


for alle ( x, y) tilstrækkelig tæt på ( x0 , y0 ), så kaldes f ( x0 , y0 ) en lokal mini-
mumværdi for f ( x, y) i M, og ( x0 , y0 ) er et lokalt minimumpunkt for f ( x, y) i
M. Hvis der faktisk gælder f ( x, y) > f ( x0 , y0 ) for alle ( x, y) i omegnen frareg-
net punktet ( x0 , y0 ) selv, så kaldes f ( x0 , y0 ) en egentlig lokal minimumværdi.

2. Hvis f ( x, y)  f ( x0 , y0 ) for alle ( x, y) i en (gerne lille) omegn om ( x0 , y0 ),


så kaldes f ( x0 , y0 ) en lokal maksimumværdi for f ( x, y) i M, og ( x0 , y0 ) er et
lokalt maksimumpunkt for f ( x, y) i M. Hvis der faktisk gælder at f ( x, y) <
f ( x0 , y0 ) for alle ( x, y) i omegnen (fraregnet ( x0 , y0 ) selv), så kaldes f ( x0 , y0 )
en egentlig lokal maksimumværdi.
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 14

Figure 21.1: Grafen for funktionen f ( x, y) = 1 + x2 x · y2 . Til højre inspiceres


niveaukurver og gradientvektorfeltet for funktionen. Den røde cirkel er randen af det
cirkulære område, der betragtes i eksempel 21.14. Det ses, at gradientvektorfeltet for
f ( x, y) er ortogonal på cirklen præcis i de 4pfundne punkter hvor ’højde’-funktonen h(u)
har h0 (u) = 0 nemlig (±1, 0) og (1/3, ±2 2/3).

21.4 Speciel undersøgelse i stationære punkter

Hvis den funktion vi vil undersøge er glat i sine stationære punkter, så kan vi kvalificere
metoden 21.13 endnu bedre, idet det approksimerende andengrads-polynomium med
udviklingspunkt i et stationært punkt ( x0 , y0 ) kan hjælpe med at afgøre, om værdien af
f ( x, y) i det stationære punkt er en kandidat til at være en global maksimumværdi eller
global minimumværdi.

Et egentligt lokalt minimumpunkt i det indre af M kan begribeligvis ikke


være et globalt maksimumpunkt for f ( x, y) i M og et egentligt lokalt maksi-
mumpunkt i det indre af M kan ikke være et globalt minimumpunkt for f ( x, y)
i M.

Til den lokale analyse af f ( x, y) omkring et stationært punkt vil vi bruge egenværdierne
for Hesse-matricen H f ( x0 , y0 ) for f ( x, y) i det stationære punkt. Som nævnt er symme-
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 15

trien af H f ( x0 , y0 ) en vigtig egenskab, for som vi nu skal se betyder det, at H f ( x0 , y0 )


kan diagonaliseres ved en similartransformation, som indført og behandlet i eNote 10.

Følgende sætning om symmetriske matricer er også helt central for rigtig mange andre
anvendelser. Som det vises i eNote 15 kan resultatet generaliseres til vilkårlige sym-
metriske matricer. For 2 ⇥ 2-matricer er beviset rimelig simpelt, så vi går igennem be-
grundelserne nedenfor – som en opvarmning til det generelle resultat.

Sætning 21.16 Diagonalisering af symmetriske 2 ⇥ 2-matricer


Enhver symmetrisk 2 ⇥ 2-matrix A har reelle egenværdier l1 og l2 og A kan
diagonaliseres ved en 2 ⇥ 2-similartransformation D (basisskiftematrix) hvori de to
søjlevektorer er ortogonale enheds-egenvektorer for A.

Det betyder at D 1 = D> og



l1 0
L= ,
0 l2
1 (21-30)
A = D·L·D = D · L · D> , og
1
L=D · A · D = D> · A · D .

Bevis

For det første kan vi direkte se, at enhver symmetrisk 2 ⇥ 2-matrix har reelle egenværdier: Det
karakteristiske polynomium for den symmetriske matrix

a b
A= (21-31)
b c
er
KA (l) = ( a l) · (c l) b2 = l2 l · ( a + c) + ( a · c b2 ) , (21-32)
der har rødderne (egenværdierne)
✓ q ◆
1
l1 = a + c + (a c )2 +4· b2 og
2
✓ q ◆ (21-33)
1
l2 = a+c (a c )2 +4· b2 ,
2
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 16

som begge er reelle tal.

De to egenværdier er ens netop når a = c og b = 0, dvs. når A allerede er på diagonalform


og er et produkt af enhedsmatricen – muligvis 0-matricen. I de tilfælde kan vi vælge D = E.

Hvis l1 6= l2 får vi også direkte fra eNote 10, sætning 10.4, at der findes en similartransfor-
mation D der diagonaliserer A:
L = D 1·A·D . (21-34)
Søjlevektorerne i D er egenvektorer v1 og v2 hørende til henholdsvis l1 og l2 .

Vi vil vise, at v1 og v2 er ortogonale vektorer. Da A er symmetrisk har vi


v1 · (Av2 ) = v2 · (Av1 ) ; (21-35)
det kan ses ved en direkte udregning med vilkårlige vektorer v1 og v2 .

Da v1 er en egentlig egenvektor for A hørende til l1 og tilsvarende v2 er en egentlig egenvek-


tor for A hørende til l2 har vi derfor:
Av2 = l2 · v2
(21-36)
Av1 = l1 · v1 ,
som indsat i (21.4.35) giver:
l2 · v1 · v2 = l1 · v2 · v1 , (21-37)
således at
(v1 · v2 ) · (l1 l2 ) = 0 . (21-38)
Da l1 6= l2 kan denne ligning kun være opfyldt for v1 · v2 = 0. De to egenvektorer er altså
ortogonale som påstået i sætningen.

Vi kan dernæst gerne antage, at de to egenvektorer v1 og v2 er enhedsvektorer – ellers


dividerer vi blot med deres respektive længder, og det ændrer ikke deres ”egenvektor-
egenskab”.

De to enhedsegenvektorer benyttes som søjlevektorerne i similartransformationsmatricen D,


som dermed opfylder følgende ligning :
D> · D = E , (21-39)
og dermed
1
D> = D (21-40)
som ønsket og påstået i sætningen .


eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 17

Specielt er egenværdierne for Hesse-matricen altid to reelle tal og det er disse egen-
værdier vi nu vil benytte som hjælp til at afgøre, om et givet stationært punkt er et
egentligt maksimum- eller minimum-punkt.

Hjælpesætning 21.17 Lokal analyse omkring et stationært punkt


Lad f ( x, y) være en glat funktion og antag, at ( x0 , y0 ) er et stationært punkt for
f ( x, y) i et åbent område M̊ ⇢ D m( f ) ⇢ R2 . Lad l1 ( x0 , y0 ) og l2 ( x0 , y0 ) betegne
egenværdierne for Hesse-matricen for f ( x, y) i ( x0 , y0 ). Så gælder følgende:

1. Hvis l1 ( x0 , y0 ) > 0 og l2 ( x0 , y0 ) > 0 så er f ( x0 , y0 ) en egentlig lokal mini-


mumværdi for f ( x, y) .

2. Hvis l1 ( x0 , y0 ) < 0 og l2 ( x0 , y0 ) < 0 så er f ( x0 , y0 ) en egentlig lokal maksi-


mumværdi for f ( x, y).

3. Hvis l1 ( x0 , y0 ) · l2 ( x0 , y0 ) < 0 så er f ( x0 , y0 ) hverken lokal minimumværdi


eller lokal maksimumværdi for f ( x, y).

4. Hvis l1 ( x0 , y0 ) · l2 ( x0 , y0 ) = 0 så er dette ikke tilstrækkelig information til


at sikre at f ( x0 , y0 ) er lokal minimumværdi eller lokal maksimumværdi for
f ( x, y).

Bevis

Fra Taylor’s grænseformel har vi i det stationære punkt følgende fremstilling af f ( x, y):

1 ⇥ ⇤ x x0
f ( x, y) = f ( x0 , y0 ) + · x x0 y y0 · H f ( x0 , y0 ) · + R2 ( x, y) . (21-41)
2 y y0
Vi diagonaliserer H f ( x0 , y0 ) med similartransformationen D, jvf. sætning 21.16, sådan at
 
1 ⇥ ⇤ l1 0 1 x x0
f ( x, y) = f ( x0 , y0 ) + · x x0 y y0 · D · ·D · + R2 ( x, y)
2 0 l2 y y0
 ✓  ◆
1 ⇥ ⇤ l1 0 x x0
= f ( x0 , y0 ) + · x x0 y y0 · D · · D> · + R2 ( x, y) ,
2 0 l2 y y0
(21-42)
hvor vi bemærker, at følgende to vektorer er ens (pånær transponeringen)
✓  ◆ 
⇥ ⇤ > > x x0 a
x x0 y y0 · D = D · = . (21-43)
y y0 b
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 18

Det vil sige vi kan skrive på kort form:


 
1 ⇥ ⇤ l1 0 a
f ( x, y) = f ( x0 , y0 ) + · a b · · + R2 ( x, y)
2 0 l2 b
(21-44)
1
= f ( x0 , y0 ) + · l1 · a2 + l2 · b2 + R2 ( x, y)
2
Hvis både l1 og l2 er positive og l1 l2 > 0 fås direkte heraf at:

f ( x, y) f ( x0 , y0 ) + l2 · a2 + b2 + R2 ( x, y) . (21-45)
Men vi har også, at a2 + b2 = ( x x0 )2 + ( y y0 )2 fordi D er så skikkelig:
⌘ ✓
⇣⇥ 
a


2 2 >
a +b = a b ·D · D·
b

⇥ ⇤ x x0
= x x0 y y0 · (21-46)
y y0
= (x x0 )2 + ( y y0 )2
= r2(x0 ,y0 ) ( x, y) .

Hvis vi dernæst indfører restfunktionen R2 ( x, y) med epsilon-led, får vi sluttelig:

f ( x, y) f ( x0 , y0 ) + r2( x0 ,y0 ) ( x, y) · (l2 + # f ( x x0 , y y0 )) . (21-47)

Vi kan hermed konkludere, at for alle ( x, y) tilstrækkelig tæt på (men forskellig fra) ud-
viklingspunktet ( x0 , y0 ) er f ( x, y) > f ( x0 , y0 ) fordi l2 > 0 og # f ( x x0 , y y0 ) ! 0 for
( x, y) ! ( x0 , y0 ).

Tilsvarende kan naturligvis sluttes, at f ( x, y) < f ( x0 , y0 ) for alle punkter ( x, y) tilstrækkeligt


tæt på (men forskellig fra) ( x0 , y0 ) hvis begge egenværdierne er negative.

Hvis l1 > 0 og l2 < 0 så kan vi benytte (21.4.44) direkte med b = 0 henholdsvis a = 0


og derved opnå værdier af f ( x, y) som er større henholdsvis mindre end f ( x0 , y0 ) for de
tilsvarende punkter ( x, y) tilstrækkeligt tæt på (men forskellig fra) ( x0 , y0 ) således at f ( x0 , y0 )
ikke kan være hverken lokal minimum- eller maksimum-værdi. Tilsvarende konklusion fås
på samme måde for l1 < 0 og l2 > 0. Og det var det, vi skulle vise.


eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 19

Man kunne måske forledes til at tro, at hvis blot alle andenordens-afledede
af f ( x, y) er positive i et stationært punkt ( x0 , y0 ) så må funktionen have et
egentligt minimumpunkt i ( x0 , y0 ). Men så simpelt er det ikke. For eksempel
har følgende Hesse-matrix ikke positive egenværdier selv om alle elementerne
er positive: 
1 2
H f ( x, y) = . (21-48)
2 1
Egenværdierne er henholdsvis l1 = 3 og l2 = 1, så ifølge hjælpesætningen
21.17 kan vi konkludere, at eventuelt stationært punkt for f ( x, y) ikke er
hverken et lokalt maksimum- eller minimum-punkt for f ( x, y).

Den viste matrix er den konstante Hesse-matrix for funktionen


1 ⇣ ⌘
f ( x, y) = · x2 + y2 + 4 · x · y . (21-49)
2
Funktionen har klart et stationært punkt i ( x0 , y0 ) = (0, 0) men tydeligvis ikke
noget egentligt minimumpunkt i (0, 0), som det også fremgår af figur 21.2.
Den betragtede funktion er sit eget approksimerende polynomium af anden
grad med udviklingspunkt i (0, 0).

Figure 21.2: Grafen for funktionen f ( x, y) = 12 · x2 + y2 + 4 · x · y er vist til venstre og


funktionens niveaukurver med gradientvektorfelt til højre.
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 20

Eksempel 21.18 Inspektion af stationært punkt

Lad funktionen f ( x, y) være givet ved



3 2 2 6·x 1
f ( x, y) = x + y + x · y , r f ( x, y) = (3 · x + y, x + 2 · y) , H f ( x, y) = .
1 2

Så er (0, 0) et stationært punkt for f ( x, y) og egenværdierne for H f (0, 0) er henholdsvis


p p
l1 ( x0 , y0 ) = 1 + 2 > 0 og l2 ( x0 , y0 ) = 1 2 < 0. Se figur 21.3. Der er tydeligvis
hverken lokalt minimum eller lokalt maksimum i det stationre punkt i overensstemmelse
med hjælpesætning21.17.

Figure 21.3: Grafen for funktionen f ( x, y) = x3 + y2 + x · y er vist til venstre, grafen


for det approksimerende andengrads-polynomium med udviklingspunkt (0, 0) er vist i
midten, begge i samme plot til højre.

Opgave 21.19

Funktionen f ( x, y) = x3 + y2 + x · y som vi undersøgte i eksempel 21.18 har også et sta-


tionært punkt i ( x0 , y0 ) = (1/12 , 1/24). Undersøg, om dette stationære punkt er et lokalt
maksimum eller et lokalt minimum eller ingen af delene for f ( x, y).

Eksempel 21.20 Inspektion af stationært punkt

Lad funktionen f ( x, y) være givet med følgende data i R2 :


f ( x, y) = sin( x ) · cos( x · y) ,
(21-50)
r f ( x, y) = (cos( x ) cos( x · y) y · sin( x ) · sin( x · y), x · sin( x ) · sin( x · y)) .
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 21

Figure 21.4: Niveaukurver (sorte) og gradientvektorfeltet for funktionen f ( x, y) = x3 +


y2 + x · y sammen med nogle niveaukurver (røde) for det approksimerende andengrads-
polynomium for f ( x, y) omkring det stationære punkt ( x0 , y0 ) = (0, 0).

Så er ( x0 , y0 ) = (p/2, 0) et stationært punkt for f ( x, y) og i det punkt har vi



1 0
H f (p/2, 0) = (21-51)
0 p 2 /4

I det stationære punkt har Hesse-matricen således egenværdierne 1 og p 2 /4. Vi konklu-


derer, at det stationære punkt er et egentligt lokalt maksimumpunkt for f ( x, y) i overensstem-
melse med inspektion af figur 21.5 – og i overensstemmelse med hjælpesætning 21.17. Det
approksimerende andengradspolynomium for f ( x, y) med udviklingspunkt i det stationære
punkt ( x0 , y0 ) = (p/2, 0) er:

1⇣ p ⌘2 1 p 2 2
P2,(p/2,0) ( x, y) = 1 x · ·y
✓ 2 2◆ 2 2 4
(21-52)
p p 1 2 p2 2
= 1 + ·x ·x ·y .
8 2 2 8

Eksempel 21.21 Inspektion af stationært punkt

Lad funktionen f ( x, y) være givet med følgende data i R2 :

f ( x, y) = 1 + x2 + (1 y )2 + x · y ,
(21-53)
r f ( x, y) = (2 · x + y, 2 · y 2 + x) .

Så er ( x0 , y0 ) = ( 2/3 , 4/3) et stationært punkt for f ( x, y) og i det punkt har vi som i alle
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 22

Figure 21.5: Til venstre: Grafen for funktionen f ( x, y) = sin( x ) · cos( x · y). I
midten: Grafen for det approksimerende andengradspolynomium for f ( x, y) med ud-
viklingspunkt i det stationære punkt (p/2, 0). Til højre: Gradientvektorfeltet for funk-
tionen f ( x, y), dens niveaukurver (sorte) samt niveaukurver for det approksimerende
andengradspolynomium (røde).

andre punkter

2 1
H f ( x0 , y0 ) = (21-54)
1 2
I det stationære punkt har Hesse-matricen således egenværdierne 3 og 1. Vi konkluderer,
at det stationære punkt er et egentligt lokalt minimumpunkt for f ( x, y) i overensstemmelse
med inspektion af figur 21.6 og i overensstemmelse med hjælpesætning21.17.

Det approksimerende andengradspolynomium for f ( x, y) med udviklingspunkt i det sta-


tionære punkt ( x0 , y0 ) = (p/2, 0) er funktionen selv:

P2,( 2/3 , 4/3) ( x, y ) = f ( x, y) . (21-55)

Eksempel 21.22 Inspektion af stationært punkt

Lad funktionen f ( x, y) være givet med følgende data i R2 :


1
f ( x, y) = · sin(p · x2 + p · y2 ) ,
2 (21-56)
r f ( x, y) = (p · x · cos(p · x2 + p · y2 ), p · y · cos(p · x2 + p · y2 )) .
p
Så er ( x0 , y0 ) = (0, 1/ 2) et (blandt rigtig mange) stationært punkt for f ( x, y) og i det punkt
har vi 
0 0
H f ( x0 , y0 ) = (21-57)
0 p2
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 23

Figure 21.6: Til venstre: Grafen for funktionen f ( x, y) = 1 + x2 + (1 y)2 + x · y. Til


højre: Gradientvektorfeltet for funktionen f ( x, y), og dens niveaukurver (røde) omkring
det stationære punkt ( x0 , y0 ) = ( 2/3 , 4/3). Bemærk, at funktionen er sit eget ap-
proksimerende andengradspolynomium med udviklingspunkt i det stationære punkt.

I det stationære punkt har Hesse-matricen således egenværdierne 0 og p 2 . Hjælpesætning


21.17 kan
p derfor ikke afgre, om vi har lokalt maksimum eller minimum i punktet.p Men da
f (0, 1/ 2) = 1/2, som er den maksimale værdi f ( x, y) kan antage, s er (0, 1/ 2) et lokalt
masimumpunkt for f ( x, y) men det er ikke et egentligt lokalt maksimumpunkt fordi alle
punkter p hele cirklen x2 + y2 = 1/2 er ogs lokale maksimumpunkter for f ( x, y). Se ogs
figur 21.7.

Eksempel 21.23 Inspektion af stationært punkt

Vi ser på en funktion f ( x, y) som er defineret ved


1
f ( x, y) = · 1 (1 y )2 x 2 · 4 (2 y )2 x 2 . (21-58)
5
Så er ( x0 , y0 ) = (0, 0) et stationært punkt for f ( x, y) og i det punkt har vi

0 0
H f (0, 0) = (21-59)
0 16/5
I det stationære punkt har Hesse-matricen således egenværdierne 0 og 16/5. Hjælpesætning
21.17 kan derfor ikke afgre, om vi har lokalt maksimum eller minimum i punktet. Det er dog
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 24

Figure 21.7: Til venstre: Grafen for funktionen f ( x, y) = 12 · sin(p · x2 + p · y2 ). I midten:


Det approksimerende
p andengradspolynomium for funktionen med udviklingspunkt
(0, 1/ 2). Til højre: Gradientvektorfeltet for funktionen f ( x, y), og dens niveaukurver
(sorte) samt niveaukurver for det approksimerendep andengradspolynomium (røde)
omkring det stationære punkt ( x0 , y0 ) = (0, 1/ 2).

forholdsvis let at se, at der vilkårligt tt p (0, 0) findes punkter ( x, y) hvor funktionsværdierne
f ( x, y) er negative og at der også vilkårligt tæt p (0, 0) findes punkter ( x, y) hvor funk-
tionsværdierne f ( x, y) er positive. Se figur 21.8. Det stationære punkt (0, 0) er derfor ikke
lokalt minimumpunkt for f ( x, y).

Den funktion, der inspiceres i eksempel 21.23 har følgende forbavsende egen-
skab: Lad r(u) vre parameterfremstillingen for en vilkårlig ret linje gennem
r(0) = (0, 0). S har den sammensatte (hjde-)funktion h(u) = f (r(u)) et
egentligt lokalt minimum i u = 0. Dette forekommer altså til trods for, at
funktionen f ( x, y) ikke selv har noget lokalt minimum i (0, 0). En fyldest-
gørende funktionsundersøgelse af en funktion af to variable omkring et sta-
tionært punkt kan altså ikke opnås ved blot at undersøge restriktionerne af
funktionen til de rette linjer igennem punktet!
eNote 21 21.4 SPECIEL UNDERSØGELSE I STATIONÆRE PUNKTER 25

Figure 21.8: Til venstre: Grafen for funktionen f ( x, y) = 15 · 1 (1 y)2 x2 ·


4 (2 y)2 x2 . I midten: Grafen for f ( x, y) sammen med det approksimerende
andengradspolynomium for funktionen med udviklingspunkt (0, 0). Til højre: Gradi-
entvektorfeltet for funktionen f ( x, y) og dens niveaukurver (sorte) samt niveaukurver
for det approksimerende andengradspolynomium (røde) omkring det stationære punkt
( x0 , y0 ) = (0, 0).
eNote 21 21.5 OPSUMMERING 26

21.5 Opsummering

Denne eNote handler om analyse af funktioner af to variable.

• Vi bruger den kompakte notation for gradientvektorfeltet og Hesse-matricen som


er givet ved de afledede af f ( x, y) til og med anden orden:

r f ( x0 , y0 ) = ( f x0 ( x0 , y0 ), f y0 ( x0 , y0 )) , (21-60)

" #
00 ( x , y ) f 00 ( x , y )
f xx 0 0 xy 0 0
H f ( x0 , y0 ) = 00 ( x , y ) f 00 ( x , y ) . (21-61)
f yx 0 0 yy 0 0

• Det approksimerende polynomium af anden grad for f ( x, y) er så givet ved:

P2,( x0 ,y0 ) ( x, y) = f ( x0 , y0 ) + r f ( x0 , y0 ) · ( x x0 , y y0 )

1 ⇥ ⇤ x x0 (21-62)
+ · x x0 y y0 · H f ( x0 , y0 ) · .
2 y y0

• Taylor’s grænseformel for funktioner af to variable kan dermed skrives

f ( x, y) = f ( x0 , y0 ) + r f ( x0 , y0 ) · ( x x0 , y y0 )

1 ⇥ ⇤ x x0
+ · x x0 y y0 · H f ( x0 , y0 ) · (21-63)
2 y y0
+ r2( x0 ,y0 ) ( x, y) · # f ( x x0 , y y0 ) .

• Stationære punkter ( x0 , y0 ) for funktioner f ( x, y) af to variable er karakteriserede


ved at r f ( x0 , y0 ) = (0, 0).

• Egenværdierne for Hesse-matricen i et stationært punkt kan hjælpe med at afgøre,


om punktet er et egentligt lokalt maksimum- eller minimum-punkt for en glat
funktion f ( x, y). Hvis egenværdierne er positive, så er punktet et egentligt lokalt
minimumpunkt. Hvis de begge er negative, så er punktet et egentligt lokalt mak-
simumpunkt. Hvis egenværdierne begge er forskellige fra 0 og har modsatte
fortegn, så er der hverken maksimum- eller minimum-punkt i det stationære punkt.
eNote 22 1

eNote 22

Andengradsligninger i to og tre variable

I denne eNote vil vi igen beskæftige os med andengradspolynomierne i to og tre variable som
også er behandlet og undersøgt med forskellige teknikker i henholdsvis eNote 15 og eNote 21.
Ved den indledende behandling af funktioner af to variable definerede vi niveau-mængderne
Kc ( f ) for funktioner f ( x, y) af to variable, se eNote 19. Vi skal se i denne eNote, at for
andengradspolynomier i to variable er niveaumængderne typisk velkendte kurver i
( x, y)-planen som for eksempel ellipser og hyperbler og det er formålet med denne eNote at vise
hvilke typer niveaukurver der optræder for givne ligninger. Vi vil dertil i udstrakt grad benytte
den reduktionsmetode, der er udviklet i eNote 15. Den virker for andengradspolynomier af både
to og tre (og flere) variable, og som vi skal se, kan de tilhørende niveau-kurver og -flader
identificeres ud fra en kort navneliste. Niveaukurverne for andengradspolymier i to variable og
niveaufladerne for andengradspolynomier i tre variable kendes klassisk under navnene
henholdsvis keglesnit og keglesnitsflader.

22.1 Andengradsligninger i to variable

Fra eNote 18 ved vi fra inspektion af de viste niveaukurver, at der typisk optræder el-
lipser og hyperbler eller ellipse-lignende og hyperbel-lignende kurver som niveaukur-
ver for funktioner af to variable – især omkring stationære punkter. Det er ikke nogen
tilfældighed; andengradspolynomier har netop sådanne niveaukurver. Og passende
valgte andengradspolynomier er jo samtidig gode approksimationer til givne glatte
funktioner af to variable.

I det følgende vil vi med nogle eksempler gennemgå standardmetoden til reduktion
af de ligninger, der fremkommer når vi vil finde de punkter i R2 for hvilke et givet
eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 2

andengradspolynomium er 0, altså netop de punkter, der udgør niveaumængden K0 ( f )


for f ( x, y).

Eksempel 22.1 Ellipse

For et andengradspolynomium f ( x, y) bestemmer vi følgende ingredienser til reduktion af


polynomiet på præcis den måde som er gennemgået i eNote 18. Vi har specielt igen brug
for den positive ortogonale substitutionsmatrix Q som diagonaliserer matricen 12 · H f ( x, y)
for derved at opnå et udtryk for f ( x, y) som ikke indeholder produktled – nu i de nye koor-
dianter xe og ye. Resultatet af reduktionen er fe( xe, ye) som vist nedenfor:

f ( x, y) = 2 · x2 + 2 · y2 + 2 · x · y 8·x 10 · y + 13 .

r f ( x, y) = (4 · x + 2 · y 8, 2· x +4· y 10) .


1 2 1
· H f ( x, y) = .
2 1 2


3 0
L= . (22-1)
0 1

" p p # 
2/2 2/2 cos(p/4) sin(p/4)
Q= p p = .
2/2 2/2 sin(p/4) cos(p/4)

p p
fe( xe, ye) = 3 · xe2 + ye2 9 · 2 · xe 2 · ye + 13
✓ ◆ ✓ ◆
3 p 2 1 p 2
= 3 · xe · 2 + ye · 2 1 .
2 2

Den sidste ligning i ovenstående beregning af det reducerede andengradspolynomium


fe( xe, ye) fremkommer ved kvadratkomplettering. Den kan foretages for xe-leddene først og
dernæst for ye-leddene. For de førstnævnte foregår det sådan:

p p
3 · xe2 9· 2 · xe = 3 · ( xe2 3 · 2 · xe)
✓ ◆ !
3p 2 9 (22-2)
= 3· xe 2 .
2 2

Den andengradsligning som giver niveaukurven K0 ( f ) er nu bestemt ved hver af følgende


eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 3

ækvivalente ligninger:

f ( x, y) = 0 = fe( xe, ye)

p !2 ✓ ◆ (22-3)
xe 3
2 · 2 1 p 2
+ ye · 2 =1 .
p1 2
3

Denne sidste ligning fremstiller en ellipse med centrum i e C = p ( x01, y0p) = (1, 2) (med hensyn
3
til de gamle koordinater) svarende til v C = ( xe0 , ye0 ) = ( 2 · 2 , 2 · 2) (med hensyn til de
nye koordinater) og halvakserne p13 og 1 , se figurerne 22.1 og 22.2. Det nye koordinatsystem
fremkommer ved drejning af det gamle koordinatsystem med drejningsvinklen f = p/4.

Funktionen f ( x, y) har et stationært punkt i centrum for ellipsen, hvor funktionsværdien er


1. Hesse-matricen er positiv definit og derfor er det stationære punkt et egentligt lokalt
minimumpunkt. Der er tydeligvis tale om et globalt minimumpunkt.

Figure 22.1: Grafen for funktionen f ( x, y) = 2 · x2 + 2 · y2 + 2 · x · y 8 · x 10 · y + 13


samt niveaukurver og gradientvektorfelt for funktionen. Bemærk specielt niveaukur-
ven svarende til niveau 0, som er den ellipse vi analyserer i eksempel 22.1.
eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 4

Figure 22.2: Grafen for funktionen med den elliptiske niveaukurve i niveau 0 for funk-
tionen i eksempel 22.1.

Eksempel 22.2 Ellipse

f ( x, y) = 29 · x2 + 36 · y2 + 24 · x · y 152 · x 336 · y + 620 .

r f ( x, y) = (58 · x + 24 · y 152 , 72 · y + 24 · x 336) .


1 29 12
· H f ( x, y) = .
2 12 36


45 0 (22-4)
L= .
0 20


3/5 4/5
Q= .
4/5 3/5

fe( xe, ye) = 45 · xe2 + 20 · ye2 360 · xe 80 · ye + 620


2 2
= 45 · ( xe 4) + 20 · (ye 2) 180 .
Den andengradsligning som giver niveaukurven K0 ( f ) er derfor givet ved hver enkelt af
følgende ækvivalente ligninger:
f ( x, y) = 0 = fe( xe, ye)
✓ ◆ ✓ ◆ (22-5)
xe 4 2 ye 2 2
+ =1 .
2 3
eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 5

Figure 22.3: Grafen for den funktion, der blot er løftet 1/2 i forhold til værdierne for
funktionen i eksempel 22.1. Niveaukurven K0 ( f ) i niveau 0 er tilsvarende mindre med
tilsvarende mindre halvakser, men den er orienteret efter de samme akseretninger.

Dette er ligningen for en ellipse med centrum i e C = ( x0 , y0 ) = (4/5, 22/5) (med hensyn til de
gamle koordinater) svarende til v C = ( xe0 , ye0 ) = (4, 2) (med hensyn til de nye koordinater)
og halvakserne 2 og 3, se figur 22.4. Det nye koordinatsystem fremkommer ved drejning af
det gamle koordinatsystem med drejningsvinklen f = arccos(3/5).

Andengradspolynomiet f ( x, y) har et stationært punkt i centrum med værdien 180. Hesse-


matricen er positiv definit og derfor er det stationære punkt et egentligt lokalt mini-
mumpunkt med minimumværdi 180. Der er igen tydeligvis tale om et globalt mini-
mumpunkt.
eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 6

Figure 22.4: Niveaukurven K0 ( f ) for andengradspolynomiet f ( x, y) = 29 · x2 + 36 ·


y2 + 24 · x · y 152 · x 336 · y + 620 fra eksempel 22.2.

Eksempel 22.3 Hyperbel

Vi ser igen på eksempel 15.50 fra eNote 19 som handler om andengradspolynomiet f ( x, y)


med følgende data:

f ( x, y) = 11 · x2 + 4 · y2 24 · x · y 20 · x + 40 · y 60 .

r f ( x, y) = (22 · x 24 · y 20 , 24 · x + 8 · y + 40) .


1 11 12
· H f ( x, y) = .
2 12 4


20 0
L= .
0 5

 
4/5 3/5 cos( j) sin( j)
Q= = , hvor j= arcsin(3/5) .
3/5 4/5 sin( j) cos( j)

fe( xe, ye) = 20 · xe2 5 · ye2 40 · xe + 20 · ye 60


2 2
= 20 · ( xe 1) 5 · (ye 2) 60 .
(22-6)
Den andengradsligning som giver niveaukurven K0 ( f ) er derfor givet ved hver af følgende
eNote 22 22.1 ANDENGRADSLIGNINGER I TO VARIABLE 7

ligninger:
f ( x, y) = 0 = fe( xe, ye)
✓ ◆ ✓ ◆ (22-7)
xe 1 2 ye 2 2
p p =1 .
3 2· 3
Ligningerne fremstiller en hyperbel med centrum i e C = ( x0 , y0 ) = (2, 1) (med hensyn til de
gamle koordinater)
p svarende p til v C = ( xe0 , ye0 ) = (1, 2) (med hensyn til de nye koordinater)
og halvakserne 3 og 2 · 3. Det nye koordinatsystem fremkommer ved drejning af det
gamle koordinatsystem med drejningsvinklen f = arcsin(3/5).

Funktionen har et stationært punkt i centrum med værdien 60. Hesse-matricen er indefinit
og derfor er det stationære punkt hverken et lokalt minimumpunkt eller maksimumpunkt.

Eksempel 22.4 Hyperbel

En anden hyperbel er givet ved K0 ( f ) for følgende andengradspolynomium:

5 2 1 2 3 p p 21
f ( x, y) = ·x + ·y + · 3·x·y+5·x 3· 3·y .
4 4 2 4

5 3 p 3 p 1 p
r f ( x, y) = ( · x + · 3· y +5, · 3· x + · y 3· 3) .
2 2 2 2

" p #
1 5/2 3 · 3/4
· H f ( x, y) = p .
2 3/4 1/4


1 0 (22-8)
L= .
0 2

" p # 
Q= p1/2 3/2
=
cos(p/3) sin(p/3)
.
3/2 1/2 sin(p/3) cos(p/3)

p 21
fe( xe, ye) = xe2 2 · ye2 2 · xe 4· 3 · ye
4
p 1
= ( xe 1)2 2 · (ye + 3)2 .
4
Den andengradsligning som giver niveaukurven K0 ( f ) er derfor givet ved hver af følgende
eNote 22 22.2 ANDENGRADSLIGNINGER I TRE VARIABLE 8

ækvivalente ligninger, hvor den sidste fås ved kvadratkomplettering:

f ( x, y) = 0 = fe( xe, ye) = 0


!2 p !2
xe 1 ye + 3 (22-9)
1 1
=1 .
p
2 2· 2

Det er en hyperbel med centrum i e Cp= ( x0 , y0 ) = (2, 0) (med hensyn til de gamle koordinater)
svarende til v C
p = ( xe0 , ye0 ) = (1, 3) (med hensyn til de nye koordinater) og halvakserne
1/2 og 1/(2 · 2), se figur 22.5. Det nye koordinatsystem fremkommer ved drejning af det
gamle koordinatsystem med drejningsvinklen f = p3 .

Funktionen har et stationært punkt i centrum med værdien 1/4. Hesse-matricen er in-
definit og derfor er det stationære punkt hverken et lokalt minimumpunkt eller maksi-
mumpunkt, som det også tydeligt fremgår af figur 22.5.

Figure 22.5: Grafen for funktionen fra eksempel 22.4 med snit i niveau 0, gradientfelt,
niveaukurver og specielt niveaukurven K0 ( f ).

22.2 Andengradsligninger i tre variable

For andengradspolynomier f ( x, y, z) i tre variable kan vi gennemføre samme analyse


som ovenfor men nu af de niveaumængder i rummet, dvs. de niveau-flader der fremkom-
mer ved at sætte f ( x, y, z) = 0. Vi viser metoden via nogle eksempler:
eNote 22 22.2 ANDENGRADSLIGNINGER I TRE VARIABLE 9

Eksempel 22.5 Ellipsoide

Et andengradspolynomium i tre variable undersøges:

f ( x, y, z) = 7 · x2 + 6 · y2 + 5 · z2 4·x·y 4·y·z 2 · x + 20 · y 10 · z + 15 .

r f ( x, y, z) = (14 · x 4·y 2, 4 · x + 12 · y 4 · z + 20, 4 · y + 10 · z 10) .

2 3
7 2 0
1
· H f ( x, y, z) = 4 2 6 2 5 .
2
0 2 5

2 3
9 0 0
L=4 0 6 0 5 .
0 0 3

2 3
2/3 2/3 1/3
Q= 4 2/3 1/3 2/3 5 .
1/3 2/3 2/3

z) = 9 · xe2 + 6 · ye2 + 3 · e
fe( xe, ye, e z2 18 · xe 12 · ye 6·e
z + 15
2 2 2
= 9 · ( xe 1) + 6 · (ye 1) + 3 · ( e
z 1) 3 .
(22-10)
Den andengradsligning som giver niveaufladen K0 ( f ) er derfor givet ved hver af følgende
ækvivalente ligninger:

f ( x, y, z) = 0 = fe( xe, ye, e


z)
!2 !2
xe 1 ye 1 (22-11)
1
+ 1
+ (ez 1)2 = 1 .
p p
3 2

Det er ligningen for en ellipsoide med centrum i e C = ( x0 , y0 , z0 ) = ( 1/3, 5/3, 173) (med
hensyn til de gamle koordinater) svarende til v C = ( xe0 , ye0 , e
z0 ) = (1, 1, 1) (med hensyn til de
1 1
nye koordinater) og halvakserne p3 og p , og 1, se figur 22.6 og navnetabellen i afsnit 22.3.
2
Det nye koordinatsystem fremkommer ved rotation af det gamle koordinatsystem med den
positive ortogonale substitution Q.
eNote 22 22.2 ANDENGRADSLIGNINGER I TRE VARIABLE 10

Figure 22.6: Niveaufladen K0 ( f ) for den funktion som er analyseret i eksempel 22.5.
Det nye roterede koordinatsystem hvori ellipsoiden har reduceret form er antydet med
den røde xe-akse, bl ye-akse, og grønne e
z-akse.

Funktionen f ( x, y, z), som er undersøgt i eksempel 22.5, har et stationært punkt


i det fundne centrum med værdien 3. Hesse-matricen er positiv definit og
derfor er det stationære punkt for f ( x, y, z) i rummet et egentligt lokalt mini-
mumpunkt, et globalt minimumpunkt.

Hvis vi kunne tegne grafen for funktionen f ( x, y, z) i det 4-dimensionale


( x, y, z, w)-rum, dvs. hvis vi betragtede mængden af de punkter i R4 der kan
skrives på formen ( x, y, z, f ( x, y, z)) når ( x, y, z) gennemløber ( x, y, z)-rummet i
R4 , så vil niveaufladen for f ( x, y, z) være den mængde vi får i ( x, y, z)-rummet
ved at sætte w = 0, altså netop f ( x, y, z) = 0.
eNote 22 22.2 ANDENGRADSLIGNINGER I TRE VARIABLE 11

Eksempel 22.6 Hyperboloide med ét net

f ( x, y, z) = x2 + 2 · y2 + z2 + 2 · x 4·y+2·z 4·x·z 1 .

r f ( x, y, z) = (2 · x 4 · z + 2, 4·y 4, 4 · x + 2 · z + 2) .

2 3
1 0 2
1 4
· H f ( x, y, z) = 0 2 0 5 .
2
2 0 1
(22-12)
2 3
3 0 0
L=4 0 2 0 5 .
0 0 1

2 p p 3
2/2 0 2/2
Q = 4 p0 1 p0
5 .
2/2 0 2/2
p
z) = 3 · xe2 + 2 · ye2
fe( xe, ye, e z2
e 4 · ye 2 · 2 · e
z 1
⇣ p ⌘2 (22-13)
= 3 · xe2 + 2 · (ye 1)2 z+ 2
e 1 .

Den andengradsligning som giver niveaufladen K0 ( f ) er derfor givet ved hver af følgende
ækvivalente ligninger:

f ( x, y, z) = 0 = fe( xe, ye, e


z)
!2 !2
xe ye 1 ⇣ p ⌘2 (22-14)
1
+ 1
z
e + 2 =1 .
p p
3 2

Ligningerne repræsenterer en hyperboloide med ét net der har centrum i e C = ( x0 , y0 , z0 ) =


p
(1, 1, 1) (med hensyn til de gamle koordinater) svarende til v C = ( xe0 , ye0 ) = (0, 1, 2) (med
hensyn til de nye koordinater) og halvakserne p13 og p1 , og 1, se figur 22.7 og navnetabellen i
2
afsnit 22.3. Det nye koordinatsystem fremkommer ved rotation af det gamle koordinatsystem
med den positive ortogonale substitution Q.

Funktionen f ( x, y, z), som er undersøgt i eksempel 22.6, har et stationært punkt


i det fundne centrum med værdien 1. Hesse-matricen er indefinit og derfor
er det stationære punkt for f ( x, y, z) i rummet hverken minimumpunkt eller
maksimumpunkt.
eNote 22 22.2 ANDENGRADSLIGNINGER I TRE VARIABLE 12

Figure 22.7: Niveaufladen K0 ( f ) for funktionen som analyseres i eksempel 22.6.

Eksempel 22.7 Hyperboloide med to net

Et andengradspolynomium f ( x, y, z) er givet ved følgende data:


1 2 1 2
f ( x, y, z) = x2 + ·y + ·z +2·x+4·y+4·z 5·y·z 6 .
2 2

r f ( x, y, z) = ( 2 · x + 2, y 5 · z + 4, 5 · y + z + 4) .

2 3
1 0 0
1 4
· H f ( x, y, z) = 0 1/2 5/2 5 .
2
0 5/2 1/2

2 3
3 0 0
(22-15)
L=4 0 2 0 5 .
0 0 1

2 3
p0 1 p0
Q = 4 p 2/2 0 p2/2 5 .
2/2 0 2/2

p
z) = 3 · xe2
fe( xe, ye, e ye2 2·ez2 + 2 · ye + 4 · 2 · e
z 6
⇣ p 2 ⌘
= 3 · xe2 (ye 1)2 2 · e z 2 1 .
eNote 22 22.3 NAVNETABEL FOR ANDENGRADSPOLYNOMIERS NIVEAUFLADER 13

Den andengradsligning som giver niveaufladen K0 ( f ) er derfor givet ved:

f ( x, y, z) = 0 = fe( xe, ye, e


z)
!2 p !2
xe z
e 2 (22-16)
1
(ye 1)2 =1 .
p p1
3 2

Det er ligningen for en hyperboloide med to net der har centrum i e C = ( x0 , y0 , z0 ) = (1, 1, 1)
p
(med hensyn til de gamle koordinater) svarende til v C = ( xe0 , ye0 ) = (0, 1, 2) (med hensyn
til de nye koordinater) og halvakserne p13 , p1 og 1 – se figur 22.8.
2

Figure 22.8: En hyperboloide med to net er niveaufladen K0 ( f ) for den funktion, der
analyseres i eksempel 22.7.

22.3 Navnetabel for andengradspolynomiers niveauflader

De maksimalt reducerede udtryk for andengradspolynomiers niveauflader præsenteres


her under antagelse af at eventuelt centrum (eller såkaldt toppunkt) optræder i v C =
(0, 0, 0). For en given konkret niveauflade kan navnet aflæses fra tabellen; beliggen-
heden angives med koordinaterne for det fundne centrum C for niveaufladen; orien-
teringen angives ved den fundne substitutionsmatrix Q og størrelsen af niveaufladen
eNote 22 22.3 NAVNETABEL FOR ANDENGRADSPOLYNOMIERS NIVEAUFLADER 14

angives ved de enkelte halvakser a, b, og c, eller p og k i de enkelte tilfælde for så vidt


de optræder i den reducerede ligning for niveaufladen.

Ligning Navn Punktet (0, 0, 0) Eksempel


xe2 ye2 z2
e
a2
+ b2
+ c2
=1 ellipsoide centrum 22.5
xe2 ye2 z2
e
a2
+ b2 c2
=1 hyperboloide med ét net centrum 22.6
xe2 ye2 z2
e
a2 b2 c2
=1 hyperboloide med to net centrum 22.7
xe2 ye2 z2
e
a2
+ b2 c2
=0 keglesnitskegleflade centrum fig 22.9
xe2 ye2
a2
+ b2
z
=e elliptisk paraboloide toppunkt fig 22.9
xe2 ye2
a2
=e
b2
z hyperbolsk paraboloide toppunkt fig 22.9
xe2
a2
= p·e
z parabolsk cylinderflade toppunkt fig 22.9
xe2 ye2
a2
+ b2
=1 elliptisk cylinderflade centrum
xe2 ye2
a2 b2
=1 hyperbolsk cylinderflade centrum
xe2 ye2 z2
e
a2
+ b2
+ c2
=0 punktet (0, 0, 0) ”centrum”
xe2 ye2
a2
+ b2
=0 z-aksen
e
xe2 ye2
a2
=0 b2
to planer gennem e z-aksen
xe2 =k>0 to planer parallelle med (ye, e
z)-planen
2
xe = 0 (ye, e
z)-planen

Figure 22.9: En keglesnitskegleflade, en elliptisk paraboloide, en hyperbolsk


paraboloide, og en parabolsk cylinderflade.
eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 15

Opgave 22.8

Vis, at listen i navnetabellen over niveauflader for andengradspolynomier i tre variable er


komplet; dvs. enhver totalt reduceret andengradsligning i tre variable (som indeholder
mindst én af de variable xe, ye, eller e
z med grad 2) er at finde på listen.

Opgave 22.9

Vis, at enhver totalt reduceret andengradsligning i to variable fremkommer af tabellen over


totalt reducerede andengradsligninger i tre variable ved at sætte e
z = 0.

22.4 Parametrisering af en ellipsoide

Vi vil her kort skitsere hvordan man kan parametrisere en niveauflade for et andengrads-
polynomium i tre variable med henblik på at kunne plotte og undersøge dens øvrige
geometriske egenskaber. Som eksempel vil vi benytte en ellipsoide med givet (eller fun-
det) centrum C, givne halvakser (aflæst fra diaognalmatricen L), og givne orienterings-
vektorer e v1 , e v2 , og e v3 (fra den positive ortogonale substitutionsmatrix Q) – altså netop
ud fra de data der bestemmes via reduktionsanalysen eksemplificeret ovenfor.

Vi antager for eksemplets skyld, at der her er tale om en ellipsoide, således at A =


1
2 · H f ( x, y, z ) er positiv definit, dvs. alle tre egenværdier l1 , l2 , og l3 er positive for
A = 12 · H f ( x, y, z). Tilsvarende konstruktion kan gennemføres for enhver af de andre
niveauflader.

Vi antager, at ellipsoidens ligning i reduceret form er givet ved

l1 · ( xe xe0 )2 + l2 · (ye ye0 )2 + l3 · (e


z ze0 )2 = d2 , (22-17)

hvor d er en positiv konstant og hvor v C = ( xe0 , ye0 , ze0 ) er koordinaterne for ellipsoidens
centrum med hensyn til det nye koordinatsystem, således at centerkoordinaterne med
hensyn til det gamle system er givet ved: e C = Q · v C. Vi har altså følgende ingredienser
eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 16

til rådighed til konstruktionen af ellipsoiden:

eC = (C1 , C2 , C3 )
d
a= p
l1
d
b= p (22-18)
l2
d
c= p
l
⇥ 3 ⇤
Q = e v1 e v2 e v3 .

Vi vil udelukkende betragte koordinater, der refererer til den sædvanlige basis e i (R n , ·).

En kugleflade S1 med radius 1 og centrum i (0, 0, 0) kan beskrives som mængden af de


punkter ( x, y, z), der har afstanden 1 til (0, 0, 0):

r(0,0,0) ( x, y, z) = 1 , som er ækvivalent med


q
x 2 + y2 + z2 = 1 , eller (22-19)
x 2 + y2 + z2 = 1 .

Kuglefladen kan også præsenteres ved hjælp af geografiske koordinater u og v, hvor u 2


[0, p ] og v 2 [ p, p ]:

S : ( x, y, z) = r(u, v) = (sin(u) · cos(v), sin(u) · sin(v), cos(u)) . (22-20)

Når u og v gennemløber deres respektive intervaller u 2 [0, p ] og v 2 [ p, p ] så får


vi punkter ( x, y, z) = r(u, v) på kuglefladen – og alle punkterne rammes. Lad os se på
den første af de to påstande, altså at alle punkterne r(u, v) ligger på kuglefladen. Indsæt
x = sin(u) · cos(v), y = sin(u) · sin(v), og z = cos(u) i kuglens ligning 22.4.19:

x2 + y2 + z2 = sin2 (u) · cos2 (v) + sin2 (u) · sin2 (v) + cos2 (u)
⇣ ⌘
= sin2 (u) · sin2 (u) + cos2 (u) + cos2 (u) (22-21)
= sin2 (u) + cos2 (u) = 1 ,

så alle punkterne der fremstilles på formen r(u, v) ligger på kuglefladen.


eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 17

Opgave 22.10

Vis, at den anden påstand om r(u, v) også er rigtig, altså at alle punkter på kuglefladen
’rammes’ af r(u, v) når u og v gennemløber intervallerne u 2 [0, p ] og v 2 [ p, p ]. Findes der
punkter på kuglefladen som rammes mere end én gang? Beskriv i så fald den punktmængde
og hvor ’mange gange’ de punkter rammes.

Vi skalerer kuglefladen med de tre egenværdier i hver koordinatakseretning og får


dermed en fremstilling af en ellipsoide med de korrekte, ønskede, halvakser:

d d d
r1 (u, v) = ( p · sin(u) · cos(v), p · sin(u) · sin(v), p · cos(u)) , (22-22)
l1 l2 l3

hvor u 2 [0, p ] , v 2 [ p, p ] således at ethvert punkt x, y, z som rammes af afbildnin-


gen r1 (u, v) nu tilfredsstiller:

l1 · x 2 + l2 · y2 + l3 · z2 = d2

0 12 0 12 0 12 (22-23)
@ x A +@ y A +@ z A = 1
d p d d p p
l1 l2 l3

eller, hvis vi benytter halvaksebetegnelserne a, b, og c:


⇣ x ⌘2 ⇣ y ⌘2 ⇣ z ⌘2
+ + =1 , (22-24)
a b c
som netop er ligningen for en standard ellipsoide med de ønskede halvakser men kon-
strueret i ( x, y, z)-systemet. De punkter der fremstilles ved r1 (u, v) ligger alle på denne
elipsoide.

Til sidst roterer vi ellipsoiden med rotationsmatricen Q og parallelforskyder til det kor-
rekte ønskede centrum:

r2 (u, v) = Q · r1 (u, v) + C . (22-25)


Alle de punkter, der har stedvektorer givet ved r2 (u, v) ligger nu på den ønskede ellip-
soide og alle punkterne på ellipsoiden rammes når u 2 [0, p ] , v 2 [ p, p ].
eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 18

Eksempel 22.11 Ellipsoide parametrisering

En konkret ellipsoide er givet ved følgende data, som stammer fra en undersøgelse af anden-
gradspolynomiet

f ( x, y, z) = 2 · x2 + 2 · y2 + 2 · z2 2·x 4·y 2·z 2·x·z+3 : (22-26)

eC = (1, 1, 1)
1
a= p
3
1
b= p
2 (22-27)
c=1
2 p p 3
1/ 2 0 1/ 2
Q=4 0p 1 0p 5 .
1/ 2 0 1/ 2

Vi vil konstruere en parameterfremstilling på formen r2 (u, v) som i (22.4.25) for den givne
ellipsoide. Den skalerede kugleflade er givet ved:
✓ ◆
1 1
r1 (u, v) = p · sin(u) · cos(v), p · sin(u) · sin(v), cos(u) (22-28)
3 2

og den Q-roterede skalerede kugleflade parallelforskudt til punktet (1, 1, 1) får derefter pa-
rameterfremstillingen:

r2 (u, v) =
1 1
= ( p · sin(u) · cos(v) p · cos(u) + 1 ,
6 2
1 (22-29)
p · sin(u) · sin(v) + 1 ,
2
1 1
p · sin(u) · cos(v) p · cos(u) + 1) .
6 2
Konstruktionen er antydet i figur 22.10.
eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 19

Figure 22.10: Konstruktion af ellipsoiden fra eksempel 22.11 ud fra data om beliggen-
hed, akser, og rotationsmatrix.

Eksempel 22.12 Ellipsoidedata

Den konstruerede ellipsoide i eksempel 22.11 er 0-niveaufladen for andengradspolynomiet


med følgende data:

f ( x, y, z) = 2 · x2 + 2 · y2 + 2 · z2 2·x 4·y 2·z 2·x·z+3 .

r f ( x, y, z) = (4 · x 2·z 2, 4· y 4, 2·x+4·z 2) .

2 3
2 0 1
1
· H f ( x, y, z) = 4 0 2 0 5 .
2
1 0 2

2 3
3 0 0
L=4 0 2 0 5 . (22-30)
0 0 1

2 p p 3
2/2 0 2/2
Q= 4 5 .
p0 1 p0
2/2 0 2/2

p
z) = 3 · xe2 + 2 · ye2 + e
fe( xe, ye, e z2 4 · ye + 2 · 2 · e
z+3
⇣ p ⌘2
= 3 · xe2 + 2 · (ye 1)2 + e z+ 2 1 .
eNote 22 22.4 PARAMETRISERING AF EN ELLIPSOIDE 20

Den andengradsligning som giver niveaufladen K0 ( f ) er derfor givet ved ligningen:


!2 !2
xe ye 1 ⇣ p ⌘2
+ + ez+ 2 = 1 , (22-31)
p1 p1
3 2

hvorfra vi aflæser de ovenfor givne halvakser a = p13 , b = p1 , og c = 1 samt centerko-


p 2
ordinaterne v (C) = (0, 1, 2) som via substitutionsmatricen Q svarer til koordinaterne
e (C) = (1, 1, 1) med hensyn til standard-basis e.
eNote 22 22.5 OPSUMMERING 21

22.5 Opsummering

Hovedresultatet i denne eNote er en identifikation – via en række konkrete eksempler


– af de mulige niveaukurver og -flader for andengradspolynomier i to og tre variable.
Metoden er reduktionsmetoden for kvadratiske former og andengradspolynomier, som
er indført i eNote 18. Baseret på samme metode angives en strategi til parametrisering
og præsentation af de enkelte niveauflader for funktioner af tre variable.
eNote 23 1

eNote 23

Riemann-integraler

I denne eNote vil vi opstille og give eksempler på de teknikker, metoder, og resultater, som er helt
nødvendige hjælpemidler når vi skal finde længder af kurver, arealer af plane områder og af
overflader, samt rumfang, massemidtpunkter, og inertimomenter af rumlige områder etc. Det
handler i første omgang om at kunne integrere og om at kunne finde stamfunktioner til givne
kontinuerte funktioner, især til funktioner af én variabel. Vi vil derfor et par gange referere til
eNote 14. Vi skal i denne eNote se hvordan uendelige summer af uendeligt små addender i
grænsen fører til de såkaldte Riemann-integraler, som igen kan udtrykkes og beregnes ved brug
af passende stamfunktioner. Metoderne og de fundamentale resultater for Riemann-integralerne
er ikke afgørende forskellige i de dimensioner vi betragter, men vi vil alligevel diskutere og
analysere betegnelser, resultater, og eksempler helt eksplicit for funktioner af én, to, og tre
variable med henblik på at kunne bruge Riemann-integralerne mest effektivt i de anvendelser,
som dyrkes i de eNoter der handler om integration i flere variable.

23.1 Indledning

Ideen med denne og de efterfølgende eNoter er at motivere, opstille, og anvende det


unikke værktøj, der kan besvare spørgsmål som helt naturligt opstår i mangfoldige
sammenhænge: Hvor lang er den kurve? Hvor stort er det område i planen? Hvad
vejer det fladestykke? Hvad er rumfanget af det område i rummet? Hvad er energi-
optaget på det solfangertag i løbet af i dag? Hvor meget deformeres det legeme, når det
flyder langs det vektorfelt?

Det værktøj – den metode – der kan besvare disse spørgsmål, hedder integration. Det
vil sige, vi skal kunne integrere givne funktioner f ( x ) og finde stamfunktioner til dem.
eNote 23 23.2 RUMFANG-PROBLEMET 2

Som bekendt er en stamfunktion til f ( x ) en funktion F ( x ) hvis differentialkvotient er


f ( x ). Men dem er der jo mange af; hvis vi differentierer F ( x ) + c, hvor c er en konstant,
så får vi igen f ( x ). Det vil sige, hvis F ( x ) er en stamfunktion, så er F ( x ) + c også en
stamfunktion!

Derudover er det på ingen måde på forhånd klart, at sådanne stamfunktioner skulle


have noget som helst at gøre med længder, arealer, rumfang, eller vægt. Og hvilken
funktion f ( x ) skal vi iøvrigt bruge, når vi for eksempel vil finde rumfanget af en kugle?
Og hvis vi ellers kan finde en stamfunktion til f ( x ), hvilken konstant skal der så lægges
til for at vi kan få det rigtige rumfang? For at få en ide om det, må vi først se på, hvordan
vi i det hele taget kan prøve på at definere hvad vi skal forstå ved begrebet rumfang.

Figure 23.1: Kuglefyldninger med kubiske klodser. Den antydede kugle, som ønskes fyldt med
klodserne, har radius 1. Til venstre er der plads i kuglen til 8 klodser hver med sidelængde 0.5;
i midten er der brugt 304 klodser, hver med sidelængden 0.2; til højre er benyttet 3280 klodser,
hver med sidelængden 0.1.

23.2 Rumfang-problemet

Rumfanget af et givet område i rummet, f.eks. en massiv kugle med radius 1, kan
bygges op af standard-elementer med simplest mulig kasseformet geometri, for eksem-
pel kubiske klodser. Men resultatet af en sådan opbygning af kuglen kan jo kun blive en
grov tilnærmelse til kuglen, se figur 23.1. Og summen af de kubiske klodsers rumfang
er derfor kun en grov tilnærmelse til kuglens rumfang.
eNote 23 23.2 RUMFANG-PROBLEMET 3

Hvis vi imidlertid fylder den samme kugle med kubiske klodser, der hver for sig har
1000 gange mindre rumfang (altså 10 gange mindre sidelængde) er det klart, at den
ønskede kugle derved kan tilnærmes meget bedre ved brug af (mere end 1000 gange)
flere kubiske klodser; og det er stadig (i princippet) en simpel sag at lægge alle klod-
sernes rumfang sammen. Det giver dermed også en meget bedre værdi for rumfanget
af kuglen.

Eksemplet i Figur 23.1 viser princippet: Approksimationen af en kugle


med radius 1 med 8 kubiske klodser med sidelængde 1/2 har rumfanget
8 · (1/2)3 = 1; i midten har vi 304 kubiske klodser (alle med sidelængde 1/5)
der giver et tilnærmet rumfang på 304 · (1/5)3 = 2.432, mens approksimatio-
nen med 3280 klodser (med sidelængde 0.1) i højre figur klart giver en endnu
bedre tilnærmelse: 3280 · (1/10)3 = 3.280. Til sammenligning vidste allerede
Archimedes, at det eksakte volumen af enhedskuglen er 4p/3 ⇡ 4.1888 .

Når først dette er klart, så er ønsket selvfølgelig at ’gå til grænsen’ ved at lade an-
tallet af standard-klodser gå imod uendelig samtidig med at de benyttede klodser gøres
tilsvarende mindre i hvert forsøg. Og således pakke og udfylde kuglen bedre og bedre,
med flere og flere, mindre og mindre kuber, og derved opnå Archimedes’ resultat i
grænsen.

Men hvordan lægger vi uendelig mange uendelig små rumfang sammen? Og går det
virkelig godt? Integrationsbegrebet og de tilhørende stamfunktionsbestemmelser giver
præcise anvisninger og overraskende positive svar på begge disse spørgsmål.

Vi viser i denne eNote hvilke formelle overvejelser og metoder, der ligger bag den suc-
ces og tager dernæst straks i de efterfølgende eNoter fat på at bruge integrationsteknikkerne
til at bestemme længder af kurver, arealer af fladestykker, rumfang af rumlige områder,
etc.

I eNoten om integration i tre variable vises for eksempel, hvordan kuglens rumfang kan
beregnes eksakt ved hjælp af ’udfyldninger’ med kasseformede blokke (med forskellig
størrelse og form i stil med udfyldningerne af kuglen ovenfor), se figurerne 23.1, 23.2
og eksempel 23.26.
eNote 23 23.3 APPROKSIMERENDE SUMMER OG EKSAKTE INTEGRALER 4

Figure 23.2: Delvis opbygning af en kugleskal.

23.3 Approksimerende summer og eksakte integraler

På den reelle u-akse betragter vi en fast valgt kontinuert reel funktion f (u) på intervallet
[0, 1], f.eks. f (u) = 1 + u + u2 . For et givet helt tal n > 0 gør vi nu følgende. Først deles
intervallet [0, 1] i n lige store delintervaller, som derved hver får længden du = n1 .
Delintervallernes venstre endepunkter har u koordinaterne:

1 2 3 n 2 n 1
u1 = 0, u2 = , u3 = , u4 = ,··· , un 1 = , un = .
n n n n n

Det vil sige, at det i’te intervals venstre endepunkt har u koordinaten ui = (i 1) n1 =
(i 1) du , hvor i = 1, 2, 3, ..., n 1, n .

Opgave 23.1

Bemærk, at hvis vi forøger antallet af delintervaller n med 1, og nu ønsker en deling af [0, 1]


i n + 1 lige store delintervaller, så vil alle de tidligere placerede n venstre endepunkter i
intervallet [0, 1] skulle flyttes lidt (pånær u1 ) for at give plads til det ekstra delinterval. Hvor
meget?
eNote 23 23.3 APPROKSIMERENDE SUMMER OG EKSAKTE INTEGRALER 5

Figure 23.3: Gottfried Wilhelm von Leibniz (til venstre) og Georg Friedrich Bernhard Riemann.

For et fast antal delintervaller, n, finder vi funktionsværdien af f i hvert af delinter-


vallernes venstre endepunkter, altså de n værdier f (0), f ( n1 ), f ( n2 ), f ( n3 ), ..., f ( n n 1 ).

Summen af disse værdier vil sædvanligvis afhænge meget af antallet n af funktionsværdier,


men hvis vi først ganger hver enkelt funktionsværdi med delinterval-længden du får
vi følgende såkaldte vægtede sum af funktionsværdierne, som iøvrigt derved netop er
en approksimation til det med fortegn regnede areal af området imellem u aksen og
grafen for f (u) over intervallet (jvf. figur 23.4):
i=n ✓ ◆ i=n i=n
1 1
I( f , n, [0, 1]) = Â f (i 1) = Â f ((i 1)du ) du = Â f (ui ) du . (23-1)
i =1
n n i =1 i =1

Opgave 23.2

Vis, at den vægtede sum af funktionsværdierne af f i ligning (23.3.1) er opadtil begrænset af


f ’s største værdi og nedadtil begrænset af f ’s mindste værdi i intervallet [0, 1].

Den vægtede sum er ikke blot begrænset for alle n . Det viser sig nemlig, at den også har
en grænseværdi for n gående imod uendelig – i hvert fald hvis f (u) er kontinuert; det
er den grænseværdi vi kalder Riemann-integralet af f (u) over intervallet [0, 1] (efter
B. Riemann, se figur 23.3). Selve grænseværdien betegnes (efter G. Leibniz, se figur 23.3)
med følgende notation
Z 1
lim I( f , n, [0, 1]) = f (u) du . (23-2)
n!• 0
eNote 23 23.3 APPROKSIMERENDE SUMMER OG EKSAKTE INTEGRALER 6

Figure 23.4: Figuren viser areal-repræsentationen af integralsummen I( f , n, [ 1, 1]) for funktio-


nen f (u) = 1 + u + u2 (se opgave 23.14) med n = 20 delintervaller i intervallet [ a, b] = [ 1, 1] .
De 20 addender i summen er repræsenteret ved rektangulære søjler med den fælles bredde
(b a)/20 = 1/10 og højder givet ved værdierne af funktionen f (u) = 1 + u + u2 i delin-
tervallernes venstre endepunkter.

Eksempel 23.3 Konstant funktion

Lad f (u) = a for alle u 2 [0, 1], hvor a er en konstant. Så er

i=n
I( f , n, [0, 1]) = Â f (ui ) du
i =1
i=n
1
= Â a·
n
i =1
(23-3)
a i=n
n iÂ
= · 1
=1
a
= ·n
n
=a ,
eNote 23 23.3 APPROKSIMERENDE SUMMER OG EKSAKTE INTEGRALER 7

således at Z 1
lim I( f , n, [0, 1]) = a du = a . (23-4)
n!• 0

Eksempel 23.4 Førstegradspolynomium

Lad f (u) = a + b · u for u 2 [0, 1], hvor a og b er konstanter. Det vil sige at grafen for f (u) er
et ret linjestykke over intervallet u 2 [0, 1] på u-aksen. Så er
i=n
I( f , n, [0, 1]) = Â f (ui ) du
i =1
i=n
1
= Â ( a + b · ui ) ·
n
i =1
i=n ✓ ◆
1 1
= Â a + b · (i 1) ·
n
·
n
i =1
! ! (23-5)
i=n i=n
1 1
= a· Â n
+b· Â (i 1) · 2
n
i =1 i =1
i=n i=n
i 1
= a+b· Â b· Â
i =1
n2 i =1
n2
i=n
1 1
= a+b·
n2 Â i b·
n
,
i =1

hvor vi så har brug for følgende identitet:


i=n
1 1 ( n + 1) · n ( n + 1)
n2 Â i=
n2
·
2
=
2·n
, (23-6)
i =1

sådan at
( n + 1) 1
I( f , n, [0, 1]) = a + b · b· . (23-7)
2·n n
Det følger heraf, at
1
lim I( f , n, [0, 1]) = a + b · , (23-8)
n!• 2
og dermed
Z 1
1
a + b · u du = a + ·b . (23-9)
0 2

Bemærk, at den fundne værdi er præcis arealet af området imellem grafen for f (u) = a + b · u
og u-aksen over intervallet [0, 1] for så vidt grafen der ligger helt over u-aksen.
eNote 23 23.3 APPROKSIMERENDE SUMMER OG EKSAKTE INTEGRALER 8

Hvis vi benytter den samme strategi som ovenfor, men nu med en deling af det mere
generelle interval [ a, b] på u -aksen i n lige store delintervaller, har vi følgende sætning:

Sætning 23.5 Integralsum og Riemann-integral


Lad f (u) betegne en kontinuert funktion på intervallet [ a, b]. For ethvert n inddeles
intervallet i n lige store delintervaller, hver med længden du = (b a)/n . Disse
delintervallers venstre endepunkter har så koordinaterne ui = a + (i 1)du for
i = 1, 2, 3, ..., n 1, n . Lad I( f , n, [ a, b]) betegne følgende sum:
i=n ✓ ◆✓ ◆
b a b a
I( f , n, [ a, b]) = Â f a + (i 1)
n n
i =1
(23-10)
i=n i=n
= Â f ( a + (i 1)du ) du = Â f (ui ) du .
i =1 i =1

Så har I( f , n, [ a, b]) en grænseværdi for n gående imod •. Grænseværdien kaldes


Rb
Riemann-integralet af f (u) over [ a, b ] og betegnes med a f (u) du:

i=n Z b
I( f , n, [ a, b]) = Â f (ui ) du !
a
f (u) du for n!• . (23-11)
i =1

Opgave 23.6

Lad f (u) = a + b · u for givne konstanter a og b og lad [ a, b] betegne et interval på u-aksen.


Bestem for ethvert n værdien af
I( f , n, [ a, b]) , (23-12)
find dernæst grænseværdien
lim I( f , n, [ a, b]) , (23-13)
n!•

og sammenlign med arealet af området mellem (den retlinjede) grafen for f (u) og u-aksen.

Summer af typen I( f , n, [ a, b]) vil vi i det følgende kalde integralsummer. Det er ek-
sistensen af grænseværdier af disse integralsummer, der er det helt afgørende for vort
Rb
forehavende. Bemærk for eksempel, at grænseværdien a f (u) du jo nu er det bedste
bud på, hvad vi skal forstå ved arealet af det plane område imellem u aksen og grafen
for f (u) over intervallet [ a, b] (for så vidt at f (u) er positiv i hele intervallet). I opgave
eNote 23 23.4 STAMFUNKTIONSBESTEMMELSE 9

23.14 og i eksemplerne 23.15 og 23.16 behandles andre eksempler p, hvordan sådanne


grænseværdier (og arealer) kan beregnes direkte ud fra en analyse af, hvordan sum-
merne Âii= n
=1 f ( ui ) du opfører sig når n ! •.

Bemærk, at Riemann-integralet netop konstrueres og opstår som en uendelig


sum af uendeligt små addender Âii= n
=1 f ( ui ) du for n ! • , altså præcis som vi
havde brug for det i forbindelse med vore overvejelser om rumfanget af kuglen
ovenfor og i figur 23.1.

23.4 Stamfunktionsbestemmelse

Riemann-integraler kan bestemmes ved hjælp af stamfunktioner – det er præcis ind-


holdet af den fundamentalsætning, som vi vil formulere og bruge i næste afsnit. Vi vil
antage i det følgende, at vi allerede for passende elementære funktioner f ( x ) er i stand
til at finde stamfunktionerne F ( x ) til f ( x ). Som bekendt går det ud på at finde alle de
funktioner F ( x ) der opfylder, at F 0 ( x ) = f ( x ). De funktioner betegner vi som følger
ved hjælp af integraltegnet, og vi siger, at integranden f ( x ) integreres og giver integralet
eller stamfunktionen F ( x ): Z
F(x) = f ( x ) dx . (23-14)

Hvis F ( x ) er en stamfunktion til f ( x ) og c en reel konstant, så er F ( x ) + c også en stam-


funktion til f ( x ). Og alle stamfunktionerne til f ( x ) fås ved at finde én stamfunktion og
dertil lægge vilkårlige (arbitrære) konstanter c.

Her er nogle eksempler på stamfunktioner til nogle velkendte funktioner f ( x ) (vi an-
eNote 23 23.4 STAMFUNKTIONSBESTEMMELSE 10

giver kun én stamfunktion til hver af de givne funktioner):

Z
f (x) = a , F(x) = f ( x ) dx = ax
Z
4 3
f (r ) = 4pr2 , F (r ) = f (r ) dr = pr
Z 3
f (t) = 1/(1 + t2 ) , F (t) = f (t) dt = arctan(t)
Z
2 1 1
f (u) = 1 + u + u , F (u) = f (u) du = u + u2 + u3 (23-15)
2 3
Z r r !
p 2
f ( x ) = sin( x2 ) , F(x) = f ( x ) dx = · FresnelS x ·
2 p
Z
x2 1p
f (x) = e , F(x) = f ( x ) dx = p erf( x )
Z 2
f ( x ) = ex , F(x) = f ( x ) dx = ex .

Da vi i de eNoter der handler om integration i flere variable har udstrakt brug for
at kunne finde stamfunktioner – også for lidt mere indviklede integrand-funktioner –
nævner vi følgende to sætninger, der kan være en hjælp til omformning af givne stam-
funktionsproblemer til bestemmelse af simplere stamfunktioner.

Sætning 23.7 Partiel integration


Lad f ( x ) betegne en kontinuert funktion med en stamfunktion F ( x ) og lad g( x )
være en differentiabel funktion med kontinuert afledet g0 ( x ). Så kan alle stamfunk-
tioner til produktet f ( x ) · g( x ) bestemmes ved:
Z Z
f ( x ) · g( x ) dx = F ( x ) · g( x ) F ( x ) · g0 ( x ) dx. (23-16)
eNote 23 23.4 STAMFUNKTIONSBESTEMMELSE 11

Bevis

Vi skal blot vise, at de to sider af ligningen (23.4.16) har samme differentialkvotienter for alle
x! To funktioner er stamfunktioner for den samme integrandfunktion, hvis deres differens er
en konstant. De afledede er ens fordi:
✓Z ◆
d
f ( x ) · g( x ) dx = f ( x ) · g( x )
dx

✓ Z ◆ (23-17)
d 0
F ( x ) · g( x ) F ( x ) · g ( x ) dx = F 0 ( x ) · g( x ) + F ( x ) · g0 ( x ) F ( x ) · g0 ( x )
dx
= f ( x ) · g( x ) .

Eksempel 23.8 Partiel integration

Vi vil bestemme en stamfunktion til h( x ) = x · sin( x ). Først skriver vi h( x ) = f ( x ) · g( x ) med


f ( x ) = sin( x ) og g( x ) = x. Så har vi i henhold til reglen om partiel integration:
Z Z
x · sin( x ) dx = x · ( cos( x )) 1·( cos( x )) dx = x · cos( x ) + sin( x ) . (23-18)

Opgave 23.9

Bestem samtlige stamfunktioner til funktionen f ( x ) = cos( x ) · sin( x ).

Sætning 23.10 Integration ved substitution


Lad f ( x ) være en kontinuert funktion og lad g(u) betegne en monoton, differentia-
bel funktion med kontinuert afledet g0 (u). Så kan vi bestemme en stamfunktion til
f ( x ) ved hjælp af den sammensatte funktion f ( g(u)) således:
Z ✓Z ◆
0
f ( x ) dx = f ( g(u)) · g (u) du , (23-19)
u= g 1 (x)

hvor g 1 (x) betegner den omvendte funktion til g(u).


eNote 23 23.4 STAMFUNKTIONSBESTEMMELSE 12

Bevis

Vi skal igen vise, at de to sider i (23.4.19) har samme differentialkvotient for alle x:
✓Z ◆
d
f ( x ) dx = f ( x ) og
dx

✓Z ◆
d 0
f ( g(u)) · g (u) du
dx u= g 1 (x)
✓Z ◆
d 0 d ⇣ 1

= f ( g(u)) · g (u) du · g (x)
du u= g 1 (x) dx
1
= f ( g(u)) · g0 (u) u= g 1 (x) ·
g0 (u)
= f ( g(u))
= f (x) ,
(23-20)
hvor vi undervejs har benyttet reglen om differentiation af sammensatte funktioner
(kædereglen) og reglen om differentiation af omvendte funktioner, se eNote 14.

Eksempel 23.11 Substitution

Vi vil bestemme en stamfunktion til funktionen


p
x
f (x) = , x 2 ]0, •[ (23-21)
1+x
altså: Z Z p
x
f ( x ) dx = dx. (23-22)
1+x
Hvis vi substituerer med funktionen g(u) = u2 for u 2 ]0, •[ får vi ’fjernet’ kvadratrodsteg-
net og har dermed ingredienserne til brug i substitutionsreglen:
u
f ( g(u)) =
1 + u2 (23-23)
g0 (u) = 2 · u .
eNote 23 23.5 FUNDAMENTAL-SÆTNINGEN 13

Vi indsætter og får:
Z Z p
x
f ( x ) dx = dx
✓Z 1 + x ◆
u
= · 2 · u du
1 + u2 u= g 1 ( x )
✓Z 2

u +1 1
= 2· du (23-24)
1 + u2 p
u= x
✓Z ✓ ◆ ◆
1
= 2· 1 du
1 + u2 u= x
p

= 2 · (u arctan(u))u=px
p p
= 2· x arctan( x ) , x 2 ]0, •[ .

Opgave 23.12

2
Bestem samtlige stamfunktioner til funktionen f ( x ) = x · ex .

23.5 Fundamental-sætningen

Følgende fundamentale sætning etablerer den antydede relation mellem stamfunktions-


bestemmelse og Riemann-integralerne, og det er den vi benytter os kraftigt af i de eNo-
ter, der handler om integration i flere variable.

Sætning 23.13 Integralregningens fundamentalsætning


Lad f (u) betegne en kontinuert funktion på intervallet [ a, b]. Antag, at F (u) er en
(vilkårlig) stamfunktion for f (u). Så gælder følgende:
Z b
lim I( f , n, [ a, b]) = f (u) du = [ F (u) ]uu= b
=a = F (b) F ( a) . (23-25)
n!• a
eNote 23 23.5 FUNDAMENTAL-SÆTNINGEN 14

Vi vil ikke her bevise fundamentalsætningen – blot bemærke, at man godt kan
forvente, at stamfunktionen til f (u) kan give integralsummens grænseværdi
som i sætning 23.13: Hvis vi for et givet n lader

Fb( x0 ) = I( f , n, [ a, x0 ]) (23-26)

og hvis vi sætter x0 = un+1 og x = x0 + du , så er

Fb( x ) = I( f , n + 1, [ a, x ])
= I( f , n, [ a, x0 ]) + f (un+1 ) · du (23-27)
= Fb( x0 ) + f ( x0 ) · ( x x0 ) ,

Hvis vi et øjeblik tillader os at se bort fra n-afhængighederne og de nødvendige


involverede grænseværdier for n ! •, så ’følger’ det af (23.5.27), at Fb( x ) er
’differentiabel’ i x0 med ’differentialkvotienten’ f ( x0 ), se definitionen på differ-
entiabilitet af en funktion af én variabel i eNote 14, afsnit 3.4. I den forstand m
vi forvente, at Fb( x ) faktisk er en ’stamfunktion’ til f ( x ). Denne grove overve-
jelse er naturligvis kun en pejling i retning af et egentligt bevis for fundamen-
talsætningen.

Riemann-integralerne kan herefter beregnes på to måder, dels som græn-


seværdi af integralsummer og dels som en differens mellem evalueringerne
af en stamfunktion i interval-endepunkterne. Det er sædvanligvis den sidste
metode, det er smartest at benytte sig af, hvis altså de relevante stamfunktioner
kan findes eller bestemmes.

Figure 23.5: Henri Léon Lebesgue, Richard P. Feynman, og Kiyosi Ito.


eNote 23 23.5 FUNDAMENTAL-SÆTNINGEN 15

Riemann-integration er senere blevet udviklet betydeligt til gavn for og brug


i adskillige anvendelser. Lebesgue’s integral- og målteori fra 1901 gør det for
eksempel muligt at udvide begreberne længde, areal, og volumen til også at
give konsistent mening for f.eks. fraktale geometriske objekter. Ito-calculus,
Santalo’s integralgeometri, og Feynman’s sti-integraler er blandt de nyeste ud-
viklinger med spændende anvendelser i så vidt forskellige discipliner som fi-
nansiel matematik og kvantefeltteori.

Vi illustrerer her fundamentalsætningen og de to beregningsmetoder i form af en op-


gave og et par eksempler:

Opgave 23.14

Lad f (u) = 1 + u + u2 , u 2 [ 1, 1] . Så er

i=n ✓ ◆ ✓ ◆2 !
2 2 2
I( f , n, [ 1, 1]) = Â 1+ 1 + (i 1)
n
+ 1 + (i 1)
n n
i =1
✓ ◆ (23-28)
i=n
8 + 4 n + 2 n2 16 i 4i n + 8i2
= Â n3
.
i =1

Benyt tabellen over del-summerne nedenfor til at beregne summen i (23.5.28) som funktion
af n og dernæst til at eftervise
Z 1
8
lim I( f , n, [ 1, 1]) = 1 + u + u2 du = F (1) F (0) = , (23-29)
n!• 1 3

idet en stamfunktion til f (u) i dette tilfælde jo er F (u) = u + 12 u2 + 13 u3 således at F (1) = 8


3
og F (0) = 0.

Der gælder følgende om størrelsen af de del-summer, der (pånær faktorer, som kan sættes
udenfor  tegnet) optræder i det sidste udtryk for I( f , n, [ 1, 1]) i ligning (23.5.28 ):
i=n ✓ ◆ i=n
1 1 1
 n3
=
n3 Â 1 =
n2
,
i =1 i =1
i=n ⇣ n ⌘ ✓ ◆
i=n i=n
1 1 1
 n3 =  n2 = n2  1 = n , (23-30)
i =1 i =1 i =1
i=n ✓ 2 ◆ i=n ✓ ◆ i=n
n 1 1
 n3 =  n = n  1 = 1 ,
i =1 i =1 i =1
eNote 23 23.5 FUNDAMENTAL-SÆTNINGEN 16

i=n ✓ ◆ i=n
i 1 n+1
 n3
=
n3 Â i =
2 n2
,
i =1 i =1
i=n ✓ ◆ ✓ ◆ i=n i=n
in i 1 n+1
 n 3
= Â
n 2
= 2Â i =
n i =1 2n
,
(23-31)
i =1 i =1
i=n ✓ ◆ i=n ✓ ◆
in i 1 i=n n+1
 n2
= Â n
=
n Âi= 2 ,
i =1 i =1 i =1

i=n ✓ ◆ i=n
i2 1 2 n2 + 3 n + 1
 n3
=
n3 Â i2 =
6 n2
i =1 i =1
i=n ✓ ◆ i=n
i2 1 2 n2 + 3 n + 1
 n2
=
n2 Â i2 =
6n (23-32)
i =1 i =1
i=n ✓ 2◆ i=n
i 1 2 n2 + 3 n + 1
 n
= Â i2 =
n i =1 6
i =1

Vi har benyttet ovenfor, at


i=n
1 2 1
 i =
2
n + n
2
og
i =1
(23-33)
i=n
1 1 1
 i 2
= n3 + n2 + n
3 2 6
.
i =1

Bevis de to ligninger i (23.5.33) – evt. ved matematisk induktion, se Wikipedia.

Hvis vi ønsker at bestemme Riemann-integraler for funktioner, der ikke er så


simple som polynomier, så er det ofte simplest at benytte stamfunktionsbereg-
ningen i stedet for at vurdere grænseværdierne for integral-summerne.

Eksempel 23.15 Sinus som integralsum

Vi betragter en velkendt funktion f (u) = cos(u) med stamfunktionen:


Z Z
f (u) du = cos(u) du = sin(u) , (23-34)

således at Z u0
cos(u) du = sin(u0 ) (23-35)
0
eNote 23 23.5 FUNDAMENTAL-SÆTNINGEN 17

for ethvert u0 2 R. En ’baglæns læsning’ af fundamentalsætningen giver derfor sin(u0 )


udtrykt ved værdier af cos(u) for u 2 [0, u0 ]:
⇣u ⌘ i=n ✓ ◆
0 (i 1) · u0
sin(u0 ) = lim · Â cos (23-36)
n!• n i =1
n

Eksempel 23.16 FresnelC og FresnelS

Vi vil vurdere følgende sum for n ! •:


✓ ◆
1 k=n (k 1)2
S(n) = Â cos . (23-37)
n k =1 n2

Summen har form som en integralsum


i=n
S(n) = I( f , n, [0, 1]) = Â f (ui ) · du (23-38)
i =1

nemlig for funktionen f (u) = cos(u2 ) med du = 1/n over intervallet [0, 1]. Ifølge fundamen-
talsætningen har vi derfor:
Z 1
S(n) ! cos(u2 ) du for n!• . (23-39)
0

Den stamfunktion F (u) til f (u) = cos(u2 ) som har værdien F (0) = 0 i u = 0, kan udtrykkes
ved en funktion der hedder FresnelC(u):
Z r r !
p 2
F (u) = cos(u2 ) du = · FresnelC u · , (23-40)
2 p

sådan at:
✓ ◆ r r !
1 k=n (k 1)2 p 2
n kÂ
cos ! · FresnelC = 0.905 for n!• . (23-41)
=1
n2 2 p

Tilsvarende er den funktion som benævnes FresnelS stamfunktion til sin(u2 ) (med værdien
0 i u = 0), således at
✓ ◆ r r !
1 k=n ( k 1)2 p 2
n kÂ
sin 2
! · FresnelS = 0.310 for n ! • . (23-42)
=1
n 2 p
eNote 23 23.6 DOBBELTSUMMER OG DOBBELTINTEGRALER 18

23.6 Dobbeltsummer og dobbeltintegraler

For funktioner af to variable har vi svarende til sætning 23.5 følgende:


eNote 23 23.6 DOBBELTSUMMER OG DOBBELTINTEGRALER 19

Sætning 23.17
Lad f (u, v) betegne en kontinuert reel funktion på et rektangel [ a, b] ⇥ [c, d] i (u, v)-
planen. Intervallet [ a, b] deles i n lige store delintervaller og intervallet [c, d] deles i
m lige store delintervaller. Så har hvert u-delinterval længden du = (b a)/n og
hvert v-delinterval har længden dv = (d c)/m. Tilsvarende bliver delepunkternes
koordinater i (u, v)-parameterområdet (som jo er rektanglet [ a, b] ⇥ [c, d] i R2 ):

(u1 , v1 ) = ( a, c),
(u1 , v j ) = ( a, c + ( j 1)dv ),
( u i , v1 ) = ( a + ( i 1)du , c),
(23-43)
( ui , v j ) = ( a + (i 1)du , c + ( j 1)dv ),
....
(un , vm ) = ( a + (n 1)du , c + (m 1)dv ) .

Derved bliver det rektangulære parameterområde tilsvarende underopdelt i ialt


n · m helt ens under-rektangler, der hver har arealet du · dv . De definerede delepunk-
ter er de nederste venstre hjørnepunkter i disse underrektangler.

Lad nu II( f , n, m, [ a, b] ⇥ [c, d]) betegne følgende dobbeltsum, hvor hver addend er
et vægtet areal; vægtene er de respektive værdier af f (u, v) i hvert af de ovenfor de-
finerede nederste venstre hjørnepunkter i de rektangler der opdeler parameterom-
rådet, og hvert enkelt del-areal er det konstante areal af hver del-rektangel du · dv :

II( f , n, m, [ a, b] ⇥ [c, d])


j=m i=n ✓ ◆ ✓ ◆ ✓ ◆!
b a d c b a d c
= Â Â f a + ( i 1) , c + (j 1) · ·
j =1 i =1
n m n m
!
j=m i=n
= Â Â f ( a + (i 1)du , c + ( j 1)dv ) · du · dv
j =1 i =1
!
j=m i=n
= Â Â f ui , v j · du · dv .
j =1 i =1
(23-44)
Så har II( f , n, m, [ a, b] ⇥ [c, d]) en grænseværdi for n ! •, m ! •, og den betegnes
med:
⇣ ⌘ Z d ✓Z b ◆
lim lim II( f , n, m, [ a, b] ⇥ [c, d]) = f (u, v) du dv . (23-45)
n !• m !• c a
eNote 23 23.7 FUNDAMENTAL-SÆTNINGEN FOR DOBBELTE INTEGRALSUMMER 20

Summer af typen II( f , n, m, [⌘a, b] ⇥ [c, d] ) vil vi kalde dobbelt integralsummer og græn-
R d ⇣R b
seværdien c a f ( u, v ) du dv kaldes tilsvarende igen Riemann-integralet af f (u, v)
over [ a, b] ⇥ [c, d] .

Bemærk, at vi nu kan tillade os at skrive følgende – når Riemann-integralet af


f (u, v) over [ a, b] ⇥ [c, d] eksisterer:
! Z ✓Z ◆
• • d b
  f ui , v j · du · dv =
c a
f (u, v) du dv , (23-46)
j =1 i =1
R
således at vi groft sagt har at Â-tegnet bliver til et -tegn i grænsen, og
tilsvarende du og dv bliver til henholdsvis du og dv.

Riemann-integralet af f (u, v) over [ a, b] ⇥ [c, d]


Z d ✓Z b ◆
f (u, v) du dv (23-47)
c a

i sætning 23.17 er kun et symbol, en betegnelse, for grænseværdien af dobbelt-


integralsummen for f (u, v). Sætningens essentielle påstand er at den græn-
seværdi eksisterer når f (u, v) er kontinuert i det rektangulære område. Men
den reduktion af dobbeltsummen, der foregår i ligning (23.6.44) og selve no-
tationen for Riemnan-integralet mere end antyder, at Riemann-integralet fak-
tisk kan beregnes ved hjælp af stamfunktioner for passende funktioner af én
variabel. Det er selvfølgelig indholdet af fundamentalsætningen for dobbelte
integralsummer.

23.7 Fundamental-sætningen for dobbelte integralsummer

De Riemann’ske dobbeltintegraler beregnes via stamfunktionsbestemmelse således:


eNote 23 23.7 FUNDAMENTAL-SÆTNINGEN FOR DOBBELTE INTEGRALSUMMER 21

Sætning 23.18
Lad f (u, v) betegne en kontinuert funktion på [ a, b] ⇥ [c, d] . Antag, at F (u, v) er en
(vilkårlig) stamfunktion for f (u, v) (betragtet som en funktion af den ene variabel
u) for et vilkårligt givet v 2 [c, d] . Lad dernæst G ( a, v) være en vilkårlig stamfunk-
tion til F ( a, v) og lad G (b, v) være en vilkårlig stamfunktion til F (b, v). Så gælder
følgende:
⇣ ⌘ Z d ✓Z b ◆
lim lim II( f , n, m, [ a, b] ⇥ [c, d]) = f (u, v) du dv
n !• m !• c a
Z d
= [ F (u, v) ]uu= b
= a dv
c
Z d
= ( F (b, v) F ( a, v)) dv (23-48)
c
= [ G (b, v) ]vv=
=c
d
[ G ( a, v) ]vv=
=c
d

= ( G (b, d) G (b, c))


( G ( a, d) G ( a, c)) .

Vi illustrerer beregningen af Riemann’ske dobbeltintegraler med enkelte eksempler –


mest for at vise, at i konkrete tilfælde kan beregningerne være simplere end (23.7.48)
lader ane:

Figure 23.6: Volumen-repræsentation af integralsummen II( f , 10, 10, [0, 1] ⇥ [0, 1]) for funktio-
nen f (u, v) = u v .
eNote 23 23.7 FUNDAMENTAL-SÆTNINGEN FOR DOBBELTE INTEGRALSUMMER 22

Eksempel 23.19 Et Riemann’sk dobbeltintegral

Lad f (u, v) = u · v2 for u 2 [ 0, 1] og v 2 [ 1, 1] . Så er


Z 1 ✓Z 1 ◆ Z
2 1 1 2 2 u =1
v udu dv = [ v u ]u=0 dv
1 0 2 1
Z
1 1 2
= v dv
2 1 (23-49)
1
= [ v3 ]vv= 1
= 1
6
1
= .
3
Bemærk, at beregningen af dobbeltintegralet foretages ’indefra’ – det inderste integral er et
integral over u-intervallet, her [0, 1], og beregnes først, dvs. med fastholdt v. En stamfunktion
til v2 · u med konstant v er v2 · u2 /2 sådan at:
Z 1
1 1 2
v2 cdotu du = · [ v2 u2 ]uu= 1
=0 = ·v . (23-50)
0 2 2

I beregningen kunne vi alternativt have benyttet, at Fv (u) = v2 u2 /2 og dermed Ga (v) =


v3 a2 /6, Gb (v) = v3 b2 /6 og indsat direkte i det sidste udtryk i (23.7.48).

Eksempel 23.20 Et dobbeltintegral med symmetri

Lad f (u, v) = u · v for u 2 [ 1, 1] og v 2 [ 1, 1] . Så er


Z 1 ✓Z 1 ◆ Z
1 1
v u du dv = [ v u2 ]uu= 1
= 1 dv = 0 , (23-51)
1 1 2 1
mens Z 1 ✓Z 1 ◆ Z
1 1
v udu dv = [ v u2 ]uu= 1
=0 dv
0 0 2 0
Z
1 1
= v dv
2 0 (23-52)
1 1
= · · [ v2 ]vv= =0
1
2 2
1
= .
4
eNote 23 23.8 TREDOBBELTE SUMMER OG TREDOBBELTE INTEGRALER 23

Eksempel 23.21 Dobbelt integralsum

Volumen-repræsentation af integralsummen II( f , 10, 10, [0, 1] ⇥ [0, 1]) for funktionen
f (u, v) = u v er vist i figur 23.6. De 100 addender i summen er til højre repræsenteret
ved søjler med samme kvadratiske tværsnit og med højder, som er givet ved de respektive
værdier af funktionen f (u, v) = u v i (u, v)-kvadratets delepunkter. Der opnås derved en
approksimation til rumfanget af det område i rummet, der er afgrænset af ( x, y) planen og
graf-fladen for funktionen f ( x, y) = xy over kvadratet ( x, y) 2 [0, 1] ⇥ [0, 1], som vist til
venstre. Det eksakte rumfang er 14 .

23.8 Tredobbelte summer og tredobbelte integraler


eNote 23 23.9 FUNDAMENTAL-SÆTNINGEN FOR TREDOBBELTE
INTEGRALSUMMER 24

Sætning 23.22
Lad f (u, v, w) betegne en kontinuert reel funktion på et kasseformet parameterom-
råde [ a, b] ⇥ [c, d] ⇥ [ h, l ] i (u, v, w)-rummet. Intervallet [ a, b] deles i n lige store delin-
tervaller, intervallet [c, d] deles i m lige store delintervaller, og intervallet [ h, l ] deles
i q lige store delintervaller. Så har hvert u-delinterval længden du = (b a)/n,
hvert v-delinterval har længden dv = (d c)/m og hvert w-delinterval har læng-
den dw = (h l )/q. Tilsvarende bliver delepunkternes koordinater i (u, v, w)-
parameterområdet [ a, b] ⇥ [c, d] ⇥ [ h, l ] i R3 :

(u1 , v1 , w1 ) = ( a, c, h),
.... (23-53)
(un , vm , wq ) = ( a + (n 1)du , c + (m 1)dv , h + (q 1)dw ) .
Lad nu III( f , n, m, q, [ a, b] ⇥ [c, d] ⇥ [ h, l ]) betegne følgende :

III( f , n, m, q, [ a, b] ⇥ [c, d] ⇥ [ h, l ])
! !
k=q j=m i=n (23-54)
= Â Â Â f ui , v j , wk du dv dw .
k =1 j =1 i =1

Så gælder
✓ ✓ ◆◆
lim lim lim III( f , n, m, q, [ a, b] ⇥ [c, d] ⇥ [ h, l ])
n !• m !•
q !•
Z l ✓Z d ✓Z b ◆ ◆ (23-55)
= f (u, v, w) du dv dw .
h c a

Summer af typen III( f , n, m, q, [ a, b] ⇥⇣[c, d]⇣⇥ [ h, l ] ) vil vi naturligvis


⌘ ⌘ kalde tredobbelte
Rl Rd Rb
integralsummer og grænseværdien h c a f ( u, v, w ) du dv dw kaldes Riemann-
integralet af f (u, v, w) over [ a, b] ⇥ [c, d] ⇥ [ h, l ] .

23.9 Fundamental-sætningen for tredobbelte


integralsummer

De Riemann’ske tredobbelte integraler beregnes således:


eNote 23 23.9 FUNDAMENTAL-SÆTNINGEN FOR TREDOBBELTE
INTEGRALSUMMER 25

Sætning 23.23
Lad f (u, v, w) betegne en kontinuert funktion på [ a, b] ⇥ [c, d] ⇥ [ h, l ] .
Antag, at F (u, v, w) er en (vilkårlig) stamfunktion for f (u, v, w) (betragtet som en
funktion af den ene variabel u) for vilkårligt givne v 2 [c, d] og w 2 [ h, l ] .

• Lad G ( a, v, w) være en vilkårlig stamfunktion til F ( a, v, w) (betragtet som en


funktion af den ene variabel v) for vilkårligt givet w 2 [ h, l ] .

• Lad G (b, v, w) være en vilkårlig stamfunktion til F (b, v, w) (igen betragtet som
en funktion af den ene variabel v) for vilkårligt givet w 2 [ h, l ] .

• Lad endelig H ( a, c, w) være en vilkårlig stamfunktion til G ( a, c, w), og


tilsvarende H (b, c, w), H ( a, d, w), og H (b, d, w) stamfunktioner for G (b, c, w),
G ( a, d, w), og G (b, d, w) .

Så gælder :
✓ ✓ ◆◆
lim lim lim III( f , n, m, q, [ a, b] ⇥ [c, d] ⇥ [ h, l ])
n !• m !•q !•
Z l ✓Z d ✓Z b ◆ ◆
= f (u, v, w) du dv dw (23-56)
h c a
= H (b, d, l ) H (b, d, h) ( H (b, c, l ) H (b, c, h))
(( H ( a, d, l ) H ( a, d, h)) ( H ( a, c, l ) H ( a, c, h))) .

Vi illustrerer med et par simple beregninger:

Eksempel 23.24 Tredobbelt integration

Lad f (u, v, w) = u v sin(w) for u 2 [ 0, 1] , v 2 [ 0, 2] og w 2 [ 0, p/2] . Så er


Z p/2 ✓Z 2 ✓Z 1 ◆ ◆ Z p/2 ✓Z 2 ◆
2 u =1
u v sin(w) du dv dw = v sin(w) [ u /2 ]u=0 dv dw
0 0 0 0 0
Z ✓Z 2 ◆
1 p/2
= v sin(w) dv dw
2 0 0
Z
1 p/2
= sin(w) [ v2 /2 ]vv= 2
=0 dw
2 0
Z p/2
= sin(w) dw
0
= [ cos(w)]w =p/2
w =0
= 1 .
eNote 23 23.9 FUNDAMENTAL-SÆTNINGEN FOR TREDOBBELTE
INTEGRALSUMMER 26

Eksempel 23.25 Et tre-dobbeltintegral med symmetri

Lad f (u, v, w) = u · v · w for u 2 [ 1, 1] og v 2 [ 1, 1] , og w 2 [ 1, 1] . Så er


Z 1 ✓Z 1 ✓Z 1 ◆ ◆
w v u du dv dw = 0 , (23-57)
1 1 1

mens Z 1 ✓Z 1 ✓Z 1 ◆ ◆
1
w v u du dv dw = , (23-58)
0 0 0 8

Eksempel 23.26 Enhedskuglens rumfang

Som gennemgået i eNoten om integration over rumlige områder beregnes volumenet af den
massive enhedskugle ved følgende tredobbelte Riemann-integral (som vil blive motiveret i
den eNote). Dermed verificeres Archimedes’ resultat:
Z 1 ✓Z p ✓Z p ◆ ◆
2
Vol(Enhedskuglen) = w sin(u) du dv dw
0 p 0

Z 1 Z p ◆
2 u=p
= w [ cos(u) ]u=0 dv dw
0 p
Z 1 ✓Z p ◆
2
= 2 w dv dw
0 p
Z 1 (23-59)
= 2 w2 [ v ]vv= p
= p dw
0
Z 1
= 4p w2 dw
0
= 4p [w3 /3 ]w =1
w =0
4p
= .
3
eNote 23 23.10 OPSUMMERING 27

23.10 Opsummering

I denne eNote har vi beskæftiget os med basis for de metoder og resultater, der er
helt uomgåelige hjælpemidler for at kunne finde længder, arealer, rumfang, massemidt-
punkter, inertimomenter etc. af henholdsvis kurver, og områder i plan og rum.

• For enhver given kontinuert funktion f (u) af én variabel u på et interval [ a, b]


opstiller vi de integralsummer I( f , n, [ a, b]), der i grænsen for n ! • definerer
Riemann-integralet af funktionen over intervallet. Disse Riemann-integraler kan
derefter selv beregnes (via fundamentalsætningen) ved hjælp af en stamfunktion
F (u) for f (u) således:
i=n
I( f , n, [ a, b]) = Â f (ui ) du
i =1
i=n Z b
(23-60)
 f (ui ) du !
a
f (u) du for n!•
i =1
Z b
f (u) du = [ F (u)]uu= b
=a = F (b) F ( a) ,
a

hvor
b a)
ui = a + (i 1) · du og du = . (23-61)
n
• Helt tilsvarende grænseværdier for tilsvarende summer for kontinuerte funktioner
af to og tre variable er opstillet og eksemplificeret.
eNote 24 1

eNote 24

Kurve- og plan-integraler

Vi vil her med udgangspunkt i de metoder og resultater der er opstillet i eNote 21 vise, hvordan
Riemann-integralerne derfra kan benyttes til blandt andet at finde længder af kurver og arealer
af plane områder, for så vidt de er beskrevet på en passende parameterform.

24.1 Kurveintegraler

Vi vil i udgangspunktet betragte kurver som er parametriserede på følgende måde ved


en parameterfremstilling.

En parametriseret kurve Kr i rummet er givet ved en parameterfremstilling således:

Kr : r(u) = ( x (u), y(u), z(u)) 2 R3 , u 2 [ a, b] . (24-1)

En given kurve kan sædvanligvis parametriseres på uendelig mange måder.


Figur 24.1 viser tre forskellige parametriseringer af det rette linjestykke fra
(0, 2, 12 ) til (0, 2, 12 ) . Figur 24.2 viser tilsvarende to forskellige parametris-
eringer af en cirkel med radius 1 og centrum i (0, 0, 0). Figur 24.4 viser
tilsvarende 2 forskellige parametriseringer af en skruelinje.

Vi antager her og i det følgende, at de tre koordinatfunktioner x (u), y(u) og z(u) i


parameterfremstillingerne er pæne funktioner af u. Vi antager simpelthen, at de alle tre
er glatte funktioner af u således at de kan differentieres vilkårligt mange gange. Specielt
eNote 24 24.1 KURVEINTEGRALER 2

Figure 24.1: Linjestykket fra (0, 2, 12 ) til (0, 2, 12 ) er her parametriseret på 3 forskellige
måder: r1 (u) = 0, 2u, 12 , u 2 [ 1, 1] ; r2 (u) = 0, 2 u3 , 12 , u 2 [ 1, 1] , og r3 (u) =
0, 2 sin( p2 u), 12 , u 2 [ 1, 1] . Markeringerne på de enkelte linjestykker stammer fra den ind-
deling af det fælles parameterinterval [ 1, 1] som består af 20 lige store delintervaller. Bemærk,
at længden af de tre ’kurver’ klart er den samme, selv om parametriseringerne er ret forskellige.
Se Opgave 24.16.

er de afledede funktioner x 0 (u), y0 (u) og z0 (u) derfor kontinuerte i intervallet [ a, b]. Så


har vi også, at q
|r0 (u)| = x 0 (u)2 + y0 (u)2 + z0 (u)2 (24-2)
er en kontinuert funktion i intervallet [ a, b]. Specielt kan denne funktion derfor integreres
over intervallet, jvf. eNote 21 og det har vi om lidt brug for i definition 24.5 nedenfor.

Definition 24.1 Regulær parameterfremstilling


En parameterfremstilling r(u) for en kurve Kr - som i (24.1.1) - siges at være en
regulær parameterfremstilling hvis følgende betingelse er opfyldt:

r0 (u) 6= 0 for alle u 2 [ a, b] . (24-3)

Opgave 24.2

Hvilke af parameterfremstillingerne i figurerne 24.1, 24.2, 24.4, og 24.5 er regulære?


eNote 24 24.1 KURVEINTEGRALER 3

En parametriseret kurve er andet og mere end blot billedmængden (punkt-


mængden) r([ a, b]), idet selve parametriseringen eksempelvis kan foreskrive
at dele af punktmængden skal gennemløbes flere gange, se eksempel 24.10
nedenfor.

Man kan gerne tænke på intervallet [ a, b] som en retlinet elastik i hvile. Vektor-
afbildningen r deformerer elastikken (ind i rummet) ved at bøje, strække
eller komprimere elastikken. En lokal strækning gør selvfølgelig elastikken
lokalt længere, mens en lokal komprimering gør elastikken lokalt kortere. Et
første naturligt spørgsmål er derfor hvor lang hele elastikken er efter brug af
afbildningen r. Kurveintegralet indføres blandt andet med henblik på at finde
den totale længde af den deformerede kurve i rummet.

Vi kan ligeledes forestille os, at den parametriserede kurve selv er masseløs,


men at den til gengæld efter deformationen med r farves med en maling på
en sådan måde at massetætheden af malingen langs med kurven (i gram pr.
centimeter, f.eks.) er givet som en funktion f af stedet ( x, y, z) i rummet – altså
sådan at massetætheden af malingen på stedet r(u) er f (r(u)). Opgaven er da
at finde den totale masse af den deformerede og farvelagte parametriserede
kurve. Bemærk, at med lidt fantasi kan vi endda gerne tillade, at ’massetæthe-
den’ f antager negative værdier.

Disse forestillinger skal naturligvis kun hjælpe os til at få en passende intuitiv


forståelse af de indførte begreber; vi skal i de relaterede eNoter se adskillige
andre tolkninger og brug af kurveintegralet.

Eksempel 24.3 Skruelinje

Skruelinjen i figur 24.4 er præsenteret med 2 forskellige parametriseringer:

r1 (u) = cos(2pu), sin(2pu), 5u


p
, u 2 [ 1, 1] , og

r2 (u) = cos(2p u3 ), sin(2p u3 ), p 3


5u , u 2 [ 1, 1] .

Markeringerne stammer fra den inddeling af parameterintervallet [ 1, 1] som består af 200


lige store delintervaller. Kurverne er igen klart lige lange (se opgave 24.16).
eNote 24 24.1 KURVEINTEGRALER 4

Figure 24.2: En cirkel i ( x, y)-planen er her parametriseret på 2 forskellige måder: r1 (u) =


(cos(p u), sin(p u), 0) , u 2 [ 1, 1] , og r2 (u) = cos(p u3 ), sin(p u3 ), 0 , u 2 [ 1, 1] . Mar-
keringerne stammer fra den inddeling af parameterintervallet [ 1, 1] som består af 100 lige store
delintervaller. Længden af cirklen er 2p - uafhængig af parametriseringen.

Eksempel 24.4 Knude

Knuden i Figur 24.5 har den noget komplicerede parameterfremstilling


1 1 1 1 1 1 1
r( u ) = 3 cos( u ) 15 cos(5u ) + 2 sin(2u ) , 3 sin( u ) 15 sin(5u ) 2 cos(2u ) , 3 cos(3u) ,
hvor u 2 [ p, p ].

Vi definerer kurveintegration på følgende måde, og motiverer definitionen i afsnit 24.1.1


nedenfor:
eNote 24 24.1 KURVEINTEGRALER 5

Figure 24.3: Carl Gustav Jakob Jacobi. Se Biografi.

Definition 24.5 Kurveintegral


Lad f ( x, y, z) betegne en kontinuert funktion på R3 . Kurveintegralet af funktionen
f over en parametriseret kurve Kr defineres ved
Z Z b
f dµ = f (r(u)) Jacobir (u) du , (24-4)
Kr a

hvor Jacobi-funktionen Jacobir (u) er givet ved:

Jacobir (u) = |r0 (u)| . (24-5)

Jacobi-funktionen Jacobir (u) betegner altså længden af tangentvektoren r0 (u) til kur-
ven på stedet r(u).

Læg mærke til, at det symbol, der står på venstre side af lighedstegnet i (24.1.4),
kun er et symbol for kurveintegralet. Det integral vi skal regne ud står på højre
side. Og det kan lade sig gøre at integrere, fordi både f , r og |r0 | er kontinuerte,
således at integranden er kontinuert.

Hvis vi indsætter r(u) = ( x (u), y(u), z(u)) i udtrykket for kurveintegralet får vi:
Z Z b q
f dµ = f ( x (u), y(u), z(u)) x 0 (u)2 + y0 (u)2 + z0 (u)2 du . (24-6)
Kr a
eNote 24 24.1 KURVEINTEGRALER 6

Figure 24.4: En skruelinje i rummet med to forskellige parametriseringer. Se eksempel 24.3.

Bemærkning 24.6
Parameterfremstillingen (24.1.1) for kurven er regulær hvis parameterfremstillingens
Jacobi-funktion er positiv: Jacobir (u) = |r0 (u)| > 0 for alle u i det givne interval
[ a, b] .

Eksempel 24.7 En vægtet cirkel

Givet funktionen f ( x, y, z) = 7x og et parametriseret cirkelstykke


p
Cr : r(u) = ( x (u), y(u), z(u)) = (cos(u), sin(u), 0) , u 2 [ , p] .
2
Kurveintegralet af f over Cr er
Z Z p q
f dµ = f ( x (u), y(u), z(u)) x 0 (u)2 + y0 (u)2 + z0 (u)2 du
Cr p/2
Z p q
= 7 cos(u) ( sin(u))2 + (cos(u))2 du
p/2
Z p
= 7 cos(u) du = 7 .
p/2
eNote 24 24.1 KURVEINTEGRALER 7

Figure 24.5: En knude. Se eksempel 24.4

Som nævnt, og som vi vil godtgøre nedenfor - i afsnit 24.1.1 om Motivering af kurveinte-
gralet - kan kurveintegraler benyttes til at finde længder af parametriserede kurver og
til at finde den totale masse af parametriserede kurver med givne massetætheder. Hvis
massetætheden er konstant 1 fås længden (man kan finde længden af en sådan kurve
ved at veje den):

Definition 24.8 Længden af en kurve


Længden af den parametriserede kurve

Kr : r(u) = ( x (u), y(u), z(u)) , u 2 [ a, b]

defineres som kurveintegralet


Z Z b
L ( Kr ) = 1 dµ = |r0 (u)| du . (24-7)
Kr a
eNote 24 24.1 KURVEINTEGRALER 8

Eksempel 24.9 Længde af cirkelstykke

Det parametriserede cirkelstykke


p
Cr : r(u) = (cos(u), sin(u), 0) , u 2 [ , p]
2
har længden Z Z p q
L(Cr ) = 1 dµ = x 0 (u)2 + y0 (u)2 + z0 (u)2 du
Cr p/2
Z p q
= ( sin(u))2 + cos(u))2 du
p/2
Z p 3p
= 1 du = .
p/2 2

Eksempel 24.10 Multiple cirkelvindinger

Den parametriserede plane kurve

er : r(u) = (cos(u), sin(u), 0) , u 2 [ p , 7p ]


C
2

har længden L(Cer ) = 15 p svarende til at parametriseringen ’lægger’ det lange interval flere
2
gange rundt på enhedscirklen!

Eksempel 24.11 Længden af en plan spiral

Den parametriserede plane spiral (se figur 24.6)


Kr : r(u) = ( u cos(u), u sin(u), 0 ) , u 2 [0, p/2]
har længden
Z Z p/2 q
L ( Kr ) = 1 dµ = x 0 (u)2 + y0 (u)2 + z0 (u)2 du
Kr 0
Z p/2 q
= (cos(u) u sin(u))2 + (sin(u) + u cos(u))2 du
0
Z p/2 p
= 1 + u2 du
0
h p ip/2 (24-8)
= (1/2)u 1 + + (1/2) arcsinh(u) u2
0
q
2
= (p/4) 1 + (p/2) + (1/2) arcsinh(p/2)
p p
= (p/8) 4 + p 2 + (1/2) ln(2) (1/2) ln( p + 4 + p 2 )
= 2.079 .
eNote 24 24.1 KURVEINTEGRALER 9

Figure 24.6: Del af en plan spiral. Se eksempel 24.11.

Eksempel 24.12 Ellipsens længde

Længden af en ellipse. Den parametriserede ellipse (se Figur 24.7)

Kr : r(u) = ( a cos(u), b sin(u), 0 ) , u 2 [ p, p ]

har længden Z Z p q
L ( Kr ) = 1 dµ = x 0 (u)2 + y0 (u)2 + z0 (u)2 du
Kr p
Z p q
= a2 sin2 (u) + b2 cos2 (u) du
p
0s 1
✓ ◆2
b
= 4aE @ 1 A ,
a

hvor E betegner det såkaldte fuldstændige elliptiske integral af 2. orden. Om funktionen


E(u) nævner vi her kun, at funktionsværdien i u = 0 er E(0) = p/2, således at ovenstående
resultat betyder, at når ellipsen specielt er en cirkel, dvs. når a = b, så får vi den korrekte
omkreds af cirklen med radius a: L = 2pa .

Eksempel 24.13 Skruelinjens længde

Den parametriserede skruelinje

Kr : r(u) = (cos(u), sin(u), u) , u 2 [ 2p, 2p ]


eNote 24 24.1 KURVEINTEGRALER 10

Figure 24.7: En ellipse med halvakser a = 1 og b = 2. Se eksempel 24.12.

har længden
Z Z 2p q
L ( Kr ) = 1 dµ = x 0 (u)2 + y0 (u)2 + z0 (u)2 du
Kr 2p
Z 2p q
= ( sin(u))2 + (cos(u))2 + 1 du
2p
Z 2p p p
= 2 du = 4p 2 .
2p

Definition 24.14 En-entydig parameterfremstilling


Parameterfremstillingen i (24.1.1) for kurven Kr siges at være en-entydig hvis der for
alle u1 2 [ a, b] og for alle u2 2 [ a, b] gælder følgende:

u1 6 = u2 medfører at r(u1 ) 6= r(u2 ) . (24-9)


eNote 24 24.1 KURVEINTEGRALER 11

Opgave 24.15

Hvilke af parameterfremstillingerne i figurerne 24.1, 24.2, og 24.4, henholdsvis i eksemplerne


24.9, 24.10, og 24.13, er en-entydige?

Opgave 24.16

Vis, at Definition 24.8 giver samme længde for de tre parametriseringer af linjestykket i figur
24.1, samme længde af de to cirkelstykker i figur 24.2 og samme længde af de to skruelinjer i
figur 24.4.

Opgave 24.17

Find længden (med 3 decimaler) af knuden i figur 24.5.

Opgave 24.18

Find regulære, en-entydige parameterfremstillinger af linjestykket (figur 24.1), cirklen (figur


24.2), og skruelinjen (figur 24.4), således at alle parameterfremstillingerne har det fælles pa-
rameterinterval [0, p ] .

24.1.1 Motivering af kurveintegralet

Hvis vi deler intervallet [ a, b] i n lige store dele, så har hvert delinterval længden du =
(b a)/n og delepunkternes koordinater i [ a, b] bliver:
u1 = a,
u2 = u1 + du = a + du ,
u3 = u2 + du = a + 2du ,
(24-10)
u4 = u3 + du = a + 3du ,
....
b = un + du = a + ndu .

Med hver af disse fast valgte værdier af ui som udviklingspunkt kan vi nu bruge Tay-
lor’s grænseformel for hver af de 3 koordinat-funktioner x (u), y(u), og z(u) for r(u) =
eNote 24 24.1 KURVEINTEGRALER 12

( x (u), y(u), z(u)) til første orden og med de tilhørende epsilon-funktioner som følger,
se eNote 17:
x ( u ) = x ( ui ) + x 0 ( ui ) ( u ui ) + # x ( u ui ) · | u ui |
y ( u ) = y ( ui ) + y 0 ( ui ) ( u ui ) + # y ( u ui ) · | u ui | (24-11)
0
z ( u ) = z ( ui ) + z ( ui ) ( u ui ) + # z ( u ui ) · | u ui | .

Disse 3 formler kan vi samle og udtrykke med vektor-notation således:

r ( u ) = r ( u i ) + r0 ( u i ) · ( u
ui ) + #i ( u ui ) · ri , (24-12)
p
hvor vi bruger den korte skrivemåde ri = |u ui | = (u ui )2 for afstanden mellem
den variable værdi u og den faste værdi ui i parameterintervallet. Desuden gælder at
vektoren #i (u ui ) = ( # x (u ui ), # y (u ui ), # z (u ui ) ) ! (0, 0, 0) = 0 for u ! ui
.

Hvert del-interval [ui , ui + du ] fra u-aksen afbildes på kurve-stykket r(u), u 2 [ui , ui +


du ] , og dette kurve-stykke kan vi approksimere med den lineære del af udtrykket i
(24.1.12), som fås ved at fjerne #i -bidraget fra højre side i (24.1.12):

rapp i (u) = r(ui ) + r0 (ui ) · (u ui ) , u 2 [ui , ui + du ] . (24-13)

Se figurerne 24.8 og 24.9 hvor de approksimerende linjestykker er vist for en parametris-


eret cirkel, for to forskellige parametriseringer og for forskellige værdier af n. Det i’te
linjestykke har pr. definition kontakt med kurven i sit ene endepunkt. Det kalder vi
kontaktpunktet for linjestykket.

Længden af en kurve

Hvert enkelt af de i alt n approksimerende linjestykker har en længde, se Figur 24.8.


Længden af det i’te linjestykke er ifølge (24.1.13)

D Li = |rapp i (ui + du ) rapp i (ui )| = |r0 (ui )| · du . (24-14)

Summen af disse n længder er (for store værdier af n) klart en god approksimation til
længden af kurven, således at vi kan skrive
n n
Lapp (n) = Â D Li = Â |r0 (ui )| · du , (24-15)
i =1 i =1
eNote 24 24.1 KURVEINTEGRALER 13

Da ovenstående sum er en integralsum (se eNote 21) for den kontinuerte funktion
|r0 (u)| over intervallet [ a, b] , opnås i grænsen, hvor n går imod uendelig:
Z b
Lapp (n) ! L = |r0 (u)| du for n ! • . (24-16)
a

Vi har dermed motiveret definitionen af længden af en kurve som angivet ovenfor, nem-
lig som kurveintegralet af den konstante funktion 1 over den parametriserede kurve.

Figure 24.8: Kurven r(u) = (cos(2pu), sin(2pu), 0) , u 2 [ 1, 1] , med henholdsvis 10, 20,
og 30 approksimerende linjestykker. Det er rimeligt at definere længden af kurven som den
totale længde af de approksimerende linjestykker i den grænse hvor antallet af linjestykker går
mod uendelig.

Figure 24.9: Kurven r(u) = cos(2pu3 ), sin(2pu3 ), 0 , u 2 [ 1, 1] , med henholdsvis 30,


60 og 100 approksimerende linjestykker. Det er stadig rimeligt at definere længden af kurven
som den totale længde af de approksimerende linjestykker i den grænse hvor antallet af ap-
proksimerende linjestykker går mod uendelig.
eNote 24 24.2 PLANINTEGRALER 14

Masse, vægten af en kurve med massetæthed

Hvis vi antager, at hvert enkelt linjestykke i (24.1.13) tildeles en konstant massetæthed


givet ved værdien af funktionen f ( x, y, z) i linjestykkets kontaktpunkt med kurven, så
får vi massen af det i’te linjestykke:

D Mi = f ( x (ui ), y(ui ), z(ui )) |r0 (ui )| · du = f (r(ui )) |r0 (ui )| · du .

Den totale masse af hele systemet af linjestykker er derfor følgende, som er en god
approksimation til massen af hele kurven, når kurven tildeles massetætheden f (r(u))
på stedet r(u) :
n n
Mapp (n) = Â D Mi = Â f (r(ui )) |r0 (ui )| · du . (24-17)
i =1 i =1

Dette er igen en integralsum, men nu for den kontinuerte funktion f (r(u)) |r0 (u)| over
intervallet [ a, b] . Vi får altså i grænsen, hvor n går mod uendelig:
Z b
Mapp (n) ! M = f (r(u))|r0 (u)| du for n!• . (24-18)
a

Dermed har vi motiveret definitionen af massen af en kurve med massetætheden f (r(u))


(for så vidt denne funktion er positiv i [ a, b] ) og dermed den generelle definition af
kurveintegralet, Definition 24.5.

24.2 Planintegraler

Et parametriseret område i planen er givet ved en parameterfremstilling

Pr : r(u, v) = ( x (u, v), y(u, v)) 2 R2 , u 2 [ a, b] , v 2 [c, d] , (24-19)

hvor x (u, v) og y(u, v) er givne (typisk glatte) funktioner af de to parameter-variable u


og v.

Planintegraler opstilles, betegnes, og beregnes helt analogt til kurveintegralerne:


eNote 24 24.2 PLANINTEGRALER 15

Figure 24.10: Dette område i planen er givet ved følgende parameterfremstilling, der repræsen-
terer polære koordinater i planen: r(u, v) = (u cos(v), u sin(v)) , u 2 [0, 1] , v 2 [ p, p ] . Param-
eterrektanglet ses til venstre. Den deformeres og afbildes (ved brug af r) på det plane område i
midten. Til højre er antydet placeringen og størrelsen (pånær en faktor 4) af de til det givne net
hørende approksimerende parallelogrammer (her er der tale om rektangler).

Definition 24.19 Planintegral


Lad f ( x, y) betegne en kontinuert funktion på R2 . Planintegralet af funktionen f
over det parametriserede område Pr defineres ved
Z Z dZ b
f dµ = f (r(u, v)) Jacobir (u, v) du dv , (24-20)
Pr c a

hvor Jacobi-funktionen Jacobir (u, v),

Jacobir (u, v) = |r0u (u, v)| · |r0v (u, v)| · sin(q (u, v)) , (24-21)

er arealet af det parallelogram i planen, der på stedet r(u, v) udspændes af de to tan-


gentvektorer r0u (u, v) og r0v (u, v) til de respektive koordinatkurver igennem punk-
tet r(u, v) i planen (funktionen q (u, v) 2 [0, p ] betegner vinklen mellem disse tan-
gentvektorer).
eNote 24 24.2 PLANINTEGRALER 16

Figure 24.11: Plant område med parabelkoordinater. Dette område i planen er givet ved para-
meterfremstillingen r(u, v) = (u v, 12 (u2 v2 )) , u 2 [ 2, 2] , v 2 [0, 2] . Figuren til højre anty-
der igen et system af areal-approksimerende parallelogrammer pånær faktor 4.

Definition 24.20 Regulær parameterfremstilling for et område i planen


Parameterfremstillingen (24.2.19) siges at vre en regulr parameterfremstilling for det
plane område hvis der gælder følgende:

Jacobir (u, v) > 0 for alle u 2 [ a, b] , v 2 [c, d] . (24-22)

Definition 24.21 En-entydig parameterfremstilling


Som for parametriserede kurver siges parameterfremstillingen i (24.2.19) at vre en-
entydig hvis forskellige punkter i definitionsmængden afbildes i forskellige punkter
i billedmængden i planen.

Opgave 24.22

Vis, at Jacobir (u, v) (i (24.2.21)) også kan findes som den numeriske værdi af determinanten
af den (2 ⇥ 2)-matrix, der som søjler har koordinaterne for de to vektorer r0u (u, v) og r0v (u, v).
eNote 24 24.2 PLANINTEGRALER 17

Eksempel 24.23 Standard graf-afgrænset område

Laf f ( x ) betegne en positiv funktion på et x-interval [ a, b]. Så kan vi parametrisere området


imellem x-aksen og grafen for funktionen f ( x ) på følgende simple måde:

Pr : r(u, v) = (u, v · f (u)) , u 2 [ a, b] , v 2 [0, 1] . (24-23)

Se figur 24.12 (hvor funktionen f ( x ) = 1 + x + x2 er benyttet til illustration). Til bestemmelse


af arealet af området imellem grafen for f ( x ) og x-aksen har vi nu helt generelt:

Jacobir (u, v) = f (u) , (24-24)

fordi
r0u (u, v) = (1, v · f 0 (u)) og
(24-25)
r0v (u, v) = (0, f (u)) ,
sådan at determinanten af den matrix, der har søjlerne r0u (u, v) og r0v (u, v), netop i dette til-
fælde er funktionen f (u) selv og dermed er også Jacobifunktionen givet ved f (u) ifølge op-
gave 24.22. Heraf fås det ønskede areal rekonstrueret som:

Z Z 1 ✓Z b ◆
Areal( Pr ) = 1 dµ = f (u) du dv
Pr 0 a
Z b (24-26)
= f (u) du .
a

Overvej, hvad der sker med integralet i (24.2.26), hvis f ( x ) tillades at være negativ på givne
delintervaller af [ a, b].

Eksempel 24.24 Elliptisk område

Det parametriserede elliptiske område i planen (se figur 24.13)

Pr : r(u, v) = ( av cos(u), bv sin(u) ) , u 2 [ p, p ] , v 2 [0, 1] .

har arealet Z Z 1Z p
Areal( Pr ) = 1 dµ = abv du dv = abp ,
Pr 0 p

idet Jacobir (u, v) = abv . Sammenlign med beregningen af længden af ellipsen i eksempel
24.12.
eNote 24 24.2 PLANINTEGRALER 18

Figure 24.12: Parametrisering af området imellem x-aksen og grafen for funktionen f ( x ) =


1 + x + x2 . Se eksempel 24.23.

Opgave 24.25 Niveau-afgrænset elliptisk område

Et elliptisk område i planen er afgrænset af niveaukurven K0 ( f ) for andengradspolynomiet

f ( x, y) = 2 · x2 + 2 · y2 + 2 · x · y 8·x 10 · y + 13 . (24-27)

Bestem længden af niveukurven og bestem arealet af det afgrænsede elliptiske område i


( x, y)-planen. Se figur 24.14. Vink: eksempel 22.1 i eNote 20.

Eksempel 24.26 Spiral-område

Det parametriserede spiral-afgrænsede område i planen (se Figur 24.15)

Pr : r(u, v) = ( vu cos(u), vu sin(u) ) , u 2 [ 0, p/2] , v 2 [ 0, 1] .

har arealet Z Z 1 Z p/2


Areal( Pr ) = 1 dµ = v2 u du dv = p 3 /48 ,
Pr 0 0

idet Jacobir (u, v) = v2 u . Sammenlign med beregningen af længden af spiralen i eksempel


24.11.
eNote 24 24.2 PLANINTEGRALER 19

Figure 24.13: Et elliptisk område i planen med halvakser a = 1 og b = 2. Se eksempel 24.24.


Bemærk, at de approksimerende parallelogrammer (her vist skalerede) ikke er rektangler.

24.2.1 Motivering af plan-integralet

Hvis vi i analogi med opstillingen af kurveintegralet deler begge parameter-intervallerne


[ a, b] og [c, d] i henholdsvis n og m lige store dele, så har hvert u-delinterval længden
du = (b a)/n og hvert v-delinterval har længden dv = (d c)/m. Tilsvarende bliver
delepunkternes koordinater i (u, v)-parameterområdet (som jo er rektanglet [ a, b] ⇥ [c, d]
i R2 ) - jvf. eNote 20:

(u1 , v1 ) = ( a, c),
(u1 , v j ) = ( a, c + ( j 1)dv ),
( u i , v1 ) = ( a + ( i 1)du , c),
(24-28)
( ui , v j ) = ( a + (i 1)du , c + ( j 1)dv ),
....
(b, d) = ( a + ndu , c + mdv ) .

Med hvert af disse faste punkter (ui , v j ) som udviklingspunkt kan vi igen benytte Tay-
lor’s grænseformel, nu for hver af de 2 koordinat-funktioner x (u, v) og y(u, v) for r(u, v) =
eNote 24 24.2 PLANINTEGRALER 20

Figure 24.14: Et elliptisk område i planen er afgrænset af en ellipse som er niveaukurven K0 ( f )


for andengradspolynomiet f ( x, y) = 2 · x2 + 2 · y2 + 2 · x · y 8 · x 10 · y + 13. Se opgave 24.25
og eksempel 22.1 i eNote 20.

( x (u, v), y(u, v)) til første orden med tilhørende epsilon-funktioner:

r(u, v) = r(ui , v j )
+ r0u (ui , v j ) · (u ui )
(24-29)
+ r0v (ui , v j ) · (v vj )
+ rij · #ij (u ui , v vi ) ,
⇥ ⇤ q
hvor u 2 [ ui , ui + du ] , v 2 v j , v j + dv . Her betegner rij = (u u i )2 + ( v v j )2
afstanden mellem det variable punkt (u , v) og det faste udviklingspunkt (ui , v j ) i pa-
rameterområdet. Der gælder her, at vektorfunktionen #ij (u ui , v v j ) ! (0, 0) = 0
for (u ui , v v j ) ! (0, 0) .

Hvert del-rektangel [ui , ui + du ] ⇥ [v j , v j + dv ] afbildes på det plane del-område, som vi


kan angive med r(u, v) evalueret i parameter-del-rektanglet u 2 [ui , ui + du ], v 2 [v j , v j +
dv ] og dette delområde af det plane område kan vi approksimere med den lineære del
af udtrykket i (24.2.29), som igen netop fås ved at fjerne #ij -bidraget fra højre side i
(24.2.29):

rapp ij (u, v) = r(ui , v j ) + r0u (ui , v j ) · (u ui ) + r0v (ui , v j ) · (v vj ) , (24-30)


⇥ ⇤
hvor u og v stadig gennemløber del-intervallerne u 2 [ ui , ui + du ] , v 2 v j , v j + dv .
eNote 24 24.2 PLANINTEGRALER 21

Figure 24.15: Et spiral-afgrænset område i planen. Se eksempel 24.26.

Disse lineære approksimationer er parallelogrammer, som udspændes af de to tan-


gentvektorer r0u (ui , v j ) · du og r0v (ui , v j ) · dv .

Areal af plant område

Hvert enkelt af de ialt n · m approksimerende parallelogrammer har et areal. Arealet af


det (i, j)’te parallelogram er givet ved

D Arealij = |r0u (ui , v j )| · |r0v (ui , v j )| sin(q (ui , v j )) · du · dv


(24-31)
= Jacobir (ui , v j ) · du · dv .

Opgave 24.27

Bevis denne påstand: Arealet af et parallelogram er produktet af længderne af de to udspæn-


dende vektorer og sinus til den mellemliggende vinkel. Se eNote 6

Summen af disse ialt n m arealer er klart en god approksimation til arealet af hele
fladestykket, således at vi har
m n m n
Arealapp (n, m) = Â Â D Arealij = Â Â Jacobir (ui , v j ) · du dv . (24-32)
j =1 i =1 j =1 i =1

Da ovenstående sum er en dobbelt integralsum for den kontinuerte funktion Jacobir (u, v)
over parameter-rektanglet [ a, b] ⇥ [c, d] får vi i grænsen, hvor n og m begge går mod
eNote 24 24.2 PLANINTEGRALER 22

uendelig (se eNote 21 ):


Z dZ b
Arealapp (n, m) ! Areal = Jacobir (u, v) du dv for n, m ! • . (24-33)
c a

Dette er begrundelsen for definitionen af arealet af et parametriseret område i planen


som angivet ovenfor, nemlig som fladeintegralet af den konstante funktion 1.

Massen, vægten af et plant område

Hvis vi nu antager, at hvert enkelt parallelogram i (24.2.30) tildeles en konstant mas-


setæthed givet ved værdien af funktionen f ( x, y) i parallelogrammets kontaktpunkt
med fladen, så får vi massen af det (i, j)’te parallelogram :

D Mij = f ( x (ui , v j ), y(ui , v j )) Jacobir (ui , v j ) · du dv


(24-34)
= f (r(ui , v j )) Jacobir (ui , v j ) · du dv .

Den totale masse af hele systemet af parallelogrammer er derfor følgende, som er en


god approksimation til massen af hele det plane område når dette gives massetætheden
f (r(u, v)) i punktet r(u, v).
m n m n
Mapp (n, m) = Â Â D Mij = Â Â f (r(ui , v j )) Jacobir (ui , v j ) · du dv . (24-35)
j =1 i =1 j =1 i =1

Dette er en dobbelt integralsum for den kontinuerte funktion f (r(u, v)) Jacobir (u, v)
over parameter-rektanglet [ a, b] ⇥ [c, d] . Vi får altså i grænsen, hvor n og m går mod
uendelig:
Z dZ b
Mapp (n, m) ! M = f (r(u, v)) Jacobir (u, v) du dv for n, m ! • . (24-36)
c a

Dermed har vi motiveret definitionen af massen af et parametriseret område i planen


med massetætheden f (r(u, v)) og dermed også den generelle definition af planinte-
gralet, definition 24.19.
eNote 24 24.2 PLANINTEGRALER 23

Eksempel 24.28 Total vægt af ring-område

Lad f ( x, y) = 1 + x være vægtfunktion på det plane område i ( x, y)-planen der er afgrænset


af x-aksen og de to øvre halvcirkelbuer af cirklerne med radius henholdsvis 1 og 1/2, begge
med centrum i (0, 0), se figur 24.16. En parametrisering af området er for eksempel:

Pr : r(u, v) = (u · cos(v), u · sin(v)) , hvor u 2 [1/2, 1] , v 2 [0, p ] . (24-37)

Når området er vægtet med vægtfunktionen f ( x, y) bliver den totale vægt af området:
Z Z pZ 1
M ( Pr ) = f dµ = f (r(u, v)) · Jacobir (u, v) du dv , (24-38)
Pr 0 1/2

hvor
f (r(u, v)) = 1 + x (u, v) = 1 + u · cos(v) og
(24-39)
Jacobir (u, v) = u ,
sådan at Z pZ 1
M ( Pr ) = (1 + u · cos(v)) · u du dv
0 1/2
Z p  u =1
1 2 1 3
= u + u · cos(v) dv
2 0 3 u=1/2
Z p ✓ ◆
3 7 (24-40)
= + · cos(v) dv
0 8 24
 v=p
3 7
= v+ · sin(v)
8 24 v =0
3
= ·p .
8
Den totale masse af området med den givne vægtfordeling er altså M( Pr ) = 3p/8. Til sam-
menligning er arealet af området jo også Areal( Pr ) = 3p/8 – men det er et tilfælde.
eNote 24 24.2 PLANINTEGRALER 24

Figure 24.16: Et (halvt) ring-område i planen med antydet vægtfordeling. Se eksempel 24.28.
eNote 24 24.3 OPSUMMERING 25

24.3 Opsummering

Vi har i denne eNote opstillet de begreber og metoder, der giver os præcise udtryk for
længder af kurver, arealer af plane områder og mere generelt kurve- og plan-integraler
af (vægt-)funktioner på kurver og plane områder, der er parametriserede ud fra hen-
holdsvis et interval eller et rektangulært parameter-område. Kurve- og plan-integralerne
er opstillet ved hjælp af de respektive Jacobi-funktioner, som angiver hvor meget para-
meterintervallet eller parameter-området lokalt deformeres når det afbildes over i den
ønskede kurve eller over i det ønskede plane område ved de valgte vektor-afbildninger
r(u) og r(u, v).

• For en rum-kurve Kr med parameterfremstillingen r(u) = ( x (u), y(u), z(u)) har


vi følgende motiverede kurveintegral af funktionen f ( x, y, z) over rumkurven:
Z Z b
f dµ = f (r(u)) Jacobir (u) du , (24-41)
Kr a

hvor Jacobi-funktionen Jacobir (u) er givet ved længden af parametriseringens tan-


gentvektor:
Jacobir (u) = |r0 (u)| . (24-42)

• For et plant område Pr med parameterfremstillingen r(u, v) = ( x (u, v), y(u, v)) har
vi ligeledes motiveret følgende definition af planintegralet af funktionen f ( x, y)
over området:
Z Z dZ b
f dµ = f (r(u, v)) Jacobir (u, v) du dv , (24-43)
Pr c a

hvor Jacobi-funktionen Jacobir (u, v) nu er givet ved parallelogram-arealet udspændt


af koordinatkurvernes tangentvektorer:

Jacobir (u, v) = |r0u (u, v)| · |r0v (u, v)| · sin(q (u, v)) , (24-44)

hvor q (u, v) 2 [0, p ] betegner vinklen mellem de to tangentvektorer r0u (u, v) og


r0v (u, v).
eNote 25 1

eNote 25

Flade- og rum-integraler

Flade og rumintegraler opstilles her på stort set samme måde som kurve- og planintegralerne i
eNote 22, som derved sammen med den grundlæggende generelle indførelse i
Riemann-integralerne eNote 21 danner basis for nærværende eNote. Udgangspunktet for
bestemmelse af flade- og rum-integralerne er fladernes og de rumlige områders respektive
parameterfremstillinger. Til hver parameterfremstillling hører en Jacobi-funktion og det er
denne funktion der benyttes til opstilling og beregning af integralerne.

25.1 Flade-integraler

En parametriseret flade i rummet er givet ved en parameterfremstilling som meget lig-


ner parameterfremstillingerne for plane områder, jvf. eNote 22. Forskellen er dog den
helt essentielle, at her er også z-koordinaten en funktion af de to parameterværdier u og
v:

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) 2 R3 , u 2 [ a, b] , v 2 [c, d] , (25-1)

hvor x (u, v), y(u, v), og z(u, v) er givne glatte funktioner af de to variable u og v.

Eksempel 25.1 Graf-flader for funktioner af to variable

En funktion h( x, y) af to variable ( x, y) 2 R2 har en grafflade F i rummet, som let kan


’parametriseres’ på den anviste form:

F : r(u, v) = (u, v, h(u, v)) , u2R, v2R . (25-2)


eNote 25 25.1 FLADE-INTEGRALER 2

Figure 25.1: Graf-fladen for funktionen h( x, y) = x2 y2 + y dels over kvadratet ( x, y) 2


[ 1, 1] ⇥ [ 1, 1] og dels over cirkelskiven med radius 1 og centrum i (0, 0) i (( x, y))-planen.

Typisk er vi kun interesserede i et udsnit af sådanne graf-flader, f.eks. det udsnit, der ligger
over et rektangel i ( x, y) planen: x 2 [ a, b], y 2 [c, d]. Det udsnit parametriseres lige så let
som hele graffladen:

Fb : br(u, v) = (u, v, h(u, v)) , u 2 [ a, b] , v 2 [c, d] . (25-3)

Hvis vi derimod er interesserede i det udsnit af graffladen som ligger over cirkelskiven med
radius a og centrum i (0, 0) så må vi først parametrisere cirkelskiven i ( x, y)-planen med de
to parametre u og v, hvorefter grafflade-udsnittet kan præsenteres ved at ’løfte’ cirkelskive-
punkterne til den korrekte ’højde’ med funktionen h( x, y):

Fe : er(u, v) = (u · cos(v), u · sin(v), h (u · cos(v), u · sin(v))) , (25-4)

hvor parametrene u og v nu gennemløber parameterområdet for cirkelskive-


parametriseringen:
u 2 [0, a] , v 2 [ p, p ] . (25-5)

I analogi med planintegralerne (jvf. eNote 22) definerer vi nu fladeintegralerne således:


eNote 25 25.1 FLADE-INTEGRALER 3

Definition 25.2 Fladeintegralet


Lad f ( x, y, z) betegne en kontinuert funktion i R3 . Fladeintegralet af funktionen
f ( x, y, z) over den parametriserede flade Fr defineres ved
Z Z dZ b
f dµ = f (r(u, v)) Jacobir (u, v) du dv , (25-6)
Fr c a

hvor Jacobi-funktionen Jacobir (u, v)

Jacobir (u, v) = |r0u (u, v) ⇥ r0v (u, v)| (25-7)

er arealet af det parallelogram, der på stedet r(u, v) udspændes af de to tangentvek-


torer r0u (u, v) og r0v (u, v) til de respektive koordinatkurver igennem punktet r(u, v)
på fladen.

Definition 25.3 Regulær parameterfremstilling


Parameterfremstillingen (25.1.1) siges at være en regulær parameterfremstilling hvis
der gælder følgende:

Jacobir (u, v) > 0 for alle u 2 [ a, b] , v 2 [c, d] . (25-8)

Definition 25.4 En-entydig parameterfremstilling


Som for parametriserede kurver siges parameterfremstillingen i (25.1.1) at være en-
entydig hvis forskellige punkter i definitionsmængden afbildes i forskellige punkter
i billedmængden.

Eksempel 25.5 Kugleflade-parametrisering

Hele kuglefladen med radius R og centrum i (0, 0, 0) kan parametriseres med ’geografiske’
parametre således:

SR : r(u, v) = ( R · sin(u) · cos(v), R · sin(u) · sin(v), R · cos(u)) , (25-9)


eNote 25 25.1 FLADE-INTEGRALER 4

Figure 25.2: Enheds-kuglefladen og en del af enheds-kuglefladen. Delen er konstrueret ved at


indskrænke parameterdomænet til (u, v) 2 [p/3, 2p/3] ⇥ [ 2p/3, 2p/3].

hvor u 2 [0, p ] og v 2 [ p, p ].

Jacobi-funktionen hørende til denne parametrisering fås af følgende beregninger:

r0u = R · (cos(u) · cos(v), cos(u) · sin(v), sin(v)) ,


r0v = R · ( sin(u) · sin(v), sin(u) · cos(v), 0) , (25-10)
2
Jacobir (u, v) = |r0u ⇥ r0v | = R · sin(u) .

Denne parametrisering er hverken regulær overalt eller en-entydig i det givne parameter-
område. Hvorfor ikke? Hvor og hvordan er der brud på regulariteten? Hvor og hvordan er
der brud på en-entydigheden? Se afnit afsnit 22.4 i eNote 20.

Eksempel 25.6 Grafflader

Enhver standard-parametrisering af en grafflade for en glat funktion h( x, y) af to variable er


en-entydig og regulær overalt. Hvis vi ser på standard-parametriseringen

r(u, v) = (u, v, h(u, v)) , u 2 [ a, b] , v 2 [c, d] (25-11)

får vi Jacobifunktionen ved følgende generelle beregning:

r0u (u, v) = (1, 0, h0u (u, v)) ,


r0v (u, v) = (0, 1, h0v (u, v)) ,
r0u (u, v) ⇥ r0v (u, v)
=( h0u (u, v), , h0v (u, v), 1) (25-12)
q q
Jacobir (u, v) = 1 + (hu (u, v)) + (hv (u, v)) = 1 + |rh(u, v)|2
0 2 0 2 ,
eNote 25 25.1 FLADE-INTEGRALER 5

som jo klart er positiv for alle (u, v) i parameter-området.

Definition 25.7 Areal af flade


Arealet af den parametriserede flade

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) , u 2 [ a, b] , v 2 [c, d]

defineres som fladeintegralet af den konstante funktion 1 over fladen:


Z Z dZ b
Areal( Fr ) = 1 dµ = Jacobir (u, v) du dv . (25-13)
Fr c a

Eksempel 25.8 Areal af graf-flader

Arealet af graffladen for funktionen h( x, y) over det rektangulære område [ a, b] ⇥ [c, d] i


( x, y)-planen er derfor:
Z Z dZ b
Areal(Fb ) = 1 dµ = Jacobir (u, v) du dv , (25-14)
Fb c a

hvor
Fb = Fr : r(u, v) = (u, v, h(u, v)) , u 2 [ a, b] , v 2 [c, d] ,
q (25-15)
Jacobir (u, v) = 1 + |rh(u, v)|2
sådan at Z dZ bq
Areal(Fb ) = 1 + |rh(u, v)|2 du dv . (25-16)
c a

Opgave 25.9

Bestem arealet af den del af graffladen for funktionen h( x, y) = x + y 1 som ligger over
kvadratet ( x, y) 2 [0, 1] ⇥ [0, 1] i ( x, y)-planen. Bemærk, at denne del af graffladen er et
plant parallelogram. Brug dels dobbelt-integration som i eksempel 25.8 og dels den klassiske
arealbestemmelse ved hjælp af grundlinje og højde.
eNote 25 25.1 FLADE-INTEGRALER 6

Figure 25.3: Dele af en plan grafflade.

Opgave 25.10

Bestem arealet af den del af graffladen for funktionen h( x, y) = x + y 1 som ligger over den
cirkelskive i ( x, y)-planen som har radius 1/2 og centrum i (1/2, 1/2). Bemærk, at denne del
af graffladen er et plant område, som er afgrænset af en ellipse.

Opgave 25.11

Bestem arealet af den del af graf-fladen for funktionen h( x, y) = x · y som ligger over kvad-
ratet ( x, y) 2 [ 1, 1] ⇥ [ 1, 1] i ( x, y)-planen.

Eksempel 25.12 Areal af kugleflade

En del af en kugleflade med radius R og centrum i (0, 0, 0) er parametriseret således:

Sb : br(u, v) = ( R · sin(u) · cos(v), R · sin(u) · cos(v), R · cos(u)) , (25-17)

hvor u 2 [ a, b] ⇢ [0, p ] og v 2 [c, d] ⇢ [ p, p ].


eNote 25 25.1 FLADE-INTEGRALER 7

Arealet af den del af kuglefladen er så, idet Jacobibr (u, v) = R2 · sin(u):


Z dZ b
b =
Areal(S) R2 · sin(u) du dv
c a
(25-18)
2
= R · (d c) · [ cos(u)]uu=
=a
b

= R2 · ( d c) · (cos( a) cos(b)) .

Specielt får vi derfor også arealet af hele kuglefladen med a = 0, b = p, c = p, og d = p:

Areal(S R ) = 4p · R2 . (25-19)

25.1.1 Motivering af fladeintegralet

Hvis vi – i stil med motiveringen af kurveintegralet – deler begge intervallerne [ a, b] og


[c, d] i henholdsvis n og m lige store dele, så har hvert u-delinterval længden du =
(b a)/n og hvert v-delinterval har længden dv = (d c)/m. Tilsvarende bliver
delepunkternes koordinater i (u, v)-parameterområdet (som jo er rektanglet [ a, b] ⇥ [c, d]
i R2 ) - jvf. afsnittet om dobbelt-integralsummer i eNote 21:

(u1 , v1 ) = ( a, c),
(u1 , v j ) = ( a, c + ( j 1)dv ),
( u i , v1 ) = ( a + ( i 1)du , c),
(25-20)
( ui , v j ) = ( a + (i 1)du , c + ( j 1)dv ),
....
(b, d) = ( a + ndu , c + mdv ) .

Med hvert af disse faste punkter (ui , v j ) som udviklingspunkt kan vi betragte Taylor’s
grænseformel for hver af de 3 koordinat-funktioner for r(u, v) = ( x (u, v), y(u, v), z(u, v))
til første orden med tilhørende epsilon-funktioner:

r(u, v) = r(ui , v j )
+ r0u (ui , v j ) · (u ui )
(25-21)
+ r0v (ui , v j ) · (v vj )
+ rij · #ij (u ui , v vi ) ,
eNote 25 25.1 FLADE-INTEGRALER 8

⇥ ⇤ q
hvor u 2 [ ui , ui + du ] , v 2 v j , v j + dv . Her betegner rij = (u u i )2 + ( v v j )2
afstanden mellem det variable punkt (u , v) og det faste udviklingspunkt (ui , v j ) i pa-
rameterområdet. Der gælder her, at #ij (u ui , v v j ) ! (0, 0, 0) = 0 for (u ui , v
v j ) ! (0, 0) .

Hvert delrektangel [ui , ui + du ] ⇥ [v j , v j + dv ] afbildes på flade-stykket r(u, v), u 2 [ui , ui +


du ], v 2 [v j , v j + dv ] og dette fladestykke kan vi approksimere med den lineære del af
udtrykket i (25.1.21), som fås ved at fjerne #ij -bidraget fra højre side i (25.1.21):

rapp ij (u, v) = r(ui , v j ) + r0u (ui , v j ) · (u ui ) + r0v (ui , v j ) · (v vj ) , (25-22)


⇥ ⇤
hvor u og v stadig gennemløber del-intervallerne u 2 [ ui , ui + du ] , v 2 v j , v j + dv .

Disse lineære approksimationer er parallelogrammer, som udspændes af de to tan-


gentvektorer r0u (ui , v j ) · du og r0v (ui , v j ) · dv . Se Figur 25.4 hvor de approksimerende par-
allelogrammer er vist for en parametrisering af en kegleflade.

Areal

Hvert enkelt af de ialt n m approksimerende parallelogrammer har et areal. Arealet af


det (i, j)’te parallelogram er længden af krydsproduktet af de to vektorer, der udspæn-
der det pågældende parallelogram:

D Arealij = |(r0u (ui , v j ) · du ) ⇥ (r0v (ui , v j ) · dv )| = Jacobir (ui , v j ) · du dv . (25-23)

Opgave 25.13

Bevis denne påstand: Arealet af et parallelogram er længden af krydsproduktet af de to


vektorer, der udspænder parallelogrammet.

Summen af disse ialt n · m arealer er klart en god approksimation til arealet af hele
fladestykket, således at vi har
m n m n
Arealapp (n, m) = Â Â D Arealij = Â Â Jacobir (ui , v j ) · du dv . (25-24)
j =1 i =1 j =1 i =1

Da ovenstående sum er en dobbelt integralsum for den kontinuerte funktion Jacobir (u, v)
over parameter-rektanglet [ a, b] ⇥ [c, d] får vi i grænsen, hvor n og m begge går mod
eNote 25 25.1 FLADE-INTEGRALER 9

uendelig (jvf. eNote 21):


Z dZ b Z
Arealapp (n, m) ! Areal = Jacobir (u, v) du dv = 1 dµ for n, m ! • .
c a Fr
(25-25)

Dette er begrundelsen for definitionen af arealet af en parametriseret flade som angivet


ovenfor, nemlig som fladeintegralet af den konstante funktion 1.

Figure 25.4: Kegle-fladen er givet ved parameterfremstillingen r(u, v) =


(u cos(v), u sin(v), u) , u 2 [ 1, 1] , v 2 [ p, p ]. Et system af koordinatkurver på fladen
er vist til venstre og de tilsvarende areal-approksimerende parallelogrammer er vist til højre.

Opgave 25.14

Vis, at den givne parameterfremstilling i figur 25.4 hverken er regulær eller en-entydig i
det givne parameterområde. Overvej, om der findes en regulær parameterfremstilling for
keglefladen.

Opgave 25.15

Hvorfor er de approksimerende parallelogrammer på den øvre halvdel af keglefladen i figur


25.4 mindre end de tilsvarende parallelogrammer (med samme afstand til toppunktet) på
den nedre halvdel?
eNote 25 25.1 FLADE-INTEGRALER 10

Figure 25.5: Denne vindelflade er givet ved parameterfremstillingen r(u, v) =


(sinh(u) cos(v), sinh(u) sin(v), v) . Figuren viser også en approksimation af fladen med par-
allelogrammer, som faktisk alle er kvadrater af forskellig størrelse. Se opgave 25.16.

Opgave 25.16

Vis, at de approksimerende parallelogrammer i figur 25.5 alle er kvadrater.

Massen af en flade

Hvis vi nu antager, at hvert enkelt parallelogram i (25.1.22) tildeles en konstant mas-


setæthed givet ved værdien af funktionen f ( x, y, z) i parallelogrammets kontaktpunkt
med fladen, så får vi massen af det (i, j)’te parallelogram :

D Mij = f ( x (ui , v j ), y(ui , v j ), z(ui , v j )) Jacobir (ui , v j ) · du dv


(25-26)
= f (r(ui , v j )) Jacobir (ui , v j ) · du dv .

Den totale masse af hele systemet af parallelogrammer er derfor følgende, som er en


god approksimation til massen af hele fladen når denne gives massetætheden f (r(u, v))
i punktet r(u, v).
m n m n
Mapp (n, m) = Â Â D Mij = Â Â f (r(ui , v j )) Jacobir (ui , v j ) · du dv . (25-27)
j =1 i =1 j =1 i =1

Dette er en dobbelt integralsum for den kontinuerte funktion f (r(u, v)) Jacobir (u, v)
over parameter-rektanglet [ a, b] ⇥ [c, d] . Vi får altså i grænsen, hvor n og m går mod
eNote 25 25.1 FLADE-INTEGRALER 11

uendelig:
Z dZ b
Mapp (n, m) ! M = f (r(u, v)) Jacobir (u, v) du dv for n, m ! • . (25-28)
c a

Dermed har vi motiveret definitionen af massen af en parametriseret flade med mas-


setætheden f (r(u, v)) og dermed også den generelle definition af fladeintegralet, defi-
nition 25.2.

25.1.2 Omdrejningsflader

Omdrejningsflader er de specielle flader, der fremkommer ved at dreje en plan kurve


omkring en ret linje (omdrejningsaksen) som også ligger i samme plan. Kurven kaldes
en profil-kurve eller en frembringer-kurve. Det antages, at profilkurven ikke skærer om-
drejningsaksen. Profilkurven vælges typisk i ( x, z)-planen og drejes om z-aksen i et
( x, y, z)-koordinatsystem. Profil-kurven kan så repræsenteres ved en parameterfrem-
stilling således:

Gp : p(u) = ( g(u), 0, h(u)) 2 R3 , u 2 [ a, b] , (25-29)

hvor g(u) > 0 og h(u) er givne funktioner af parameteren u. Den omdrejningsflade,


der fremkommer ved at dreje Gp en hel gang omkring z-aksen har derfor parameter-
fremstillingen:

FGr : r(u, v) = ( g(u) cos(v), g(u) sin(v), h(u)) , u 2 [ a, b] , v 2 [ p, p ] . (25-30)

Opgave 25.17

Vis, at Jacobifunktionen Jacobir (u, v) for parameterfremstillingen r(u, v) for den generelle
omdrejningsflade FGr i (25.1.30) er givet ved
q
Jacobir (u, v) = g(u) (h0 (u))2 + ( g0 (u))2 . (25-31)
eNote 25 25.1 FLADE-INTEGRALER 12

Figure 25.6: Omdrejnings-fladen her er givet ved parameterfremstillingen r(u, v) =


( g(u) cos(v), g(u) sin(v), h(u)) , u 2 [ p, p ] , v 2 [ p, p ], hvor g(u) = 12 + 14 sin(u) og
h(u) = u.

Eksempel 25.18 Torus-areal

En given torus er parametriseret på følgende måde:

T : r(u, v) = ( g(u) cos(v), g(u) sin(v), h(u)) , u 2 [ p, p ] , v 2 [ p, p ] , (25-32)

hvor g(u) = 2 + cos(u) og h(u) = sin(u).

Jacobifunktionen er
q
Jacobir (u, v) = g(u) (h0 (u))2 + ( g0 (u))2 = 2 + cos(u) , (25-33)

så arealet af denne torus er simpelthen:


Z p Z p
Areal(T ) = (2 + cos(u)) du dv = 8p 2 . (25-34)
p p

Hvis vi ’belaster’ denne torus med en vægtfunktion, massetæthed, givet ved funktionen
f ( x, y, z) = 2 + z får vi den totale vægt af torusen:
Z p Z p
M(T ) = (2 + sin(u)) · (2 + cos(u)) du dv = 16p 2 . (25-35)
p p
eNote 25 25.2 RUM-INTEGRALER 13

Figure 25.7: Denne såkaldte torus er omdrejningsfladen givet ved parameterfremstillingen


r(u, v) = ( g(u) cos(v), g(u) sin(v), h(u)) , u 2 [ p, p ] , v 2 [ p, p ], hvor nu g(u) = 2 +
cos(u) og h(u) = sin(u).

25.2 Rum-integraler

Et parametriseret rumligt område er på samme måde som kurver og flader givet ved en
parameterfremstilling, nu med følgende form hvor de tre koordinatfunktioner x, y, og
z nu er funktioner af de ialt 3 parameter-variable u, v, og w:

Wr : r(u, v, w) = ( x (u, v, w), y(u, v, w), z(u, v, w)) 2 R3 ,


(25-36)
u 2 [ a, b] , v 2 [c, d], w 2 [ h, l ] .

Definition 25.19 Rumintegral


Lad f ( x, y, z) betegne en kontinuert funktion i R3 . Rumintegralet af funktionen
f ( x, y, z) over det parametriserede rumlige område Wr defineres ved
Z Z lZ dZ b
f dµ = f (r(u, v, w)) Jacobir (u, v, w) du dv dw , (25-37)
Wr h c a

hvor Jacobi-funktionen Jacobir (u, v, w) nu er givet ved

Jacobir (u, v, w) = | (r0u (u, v, w) ⇥ r0v (u, v, w)) · r0w (u, v, w) | . (25-38)

Det vil sige, Jacobir (u, v, w) er volumenet (her beregnet som et rumprodukt) af det
parallelepipedum, der på stedet r(u, v, w) udspændes af de tre koordinatkurve-
tangentvektorer r0u (u, v, w) , r0v (u, v, w) og r0w (u, v, w).
eNote 25 25.2 RUM-INTEGRALER 14

Figure 25.8: Denne torus er den samme som i figur 25.7, men er her givet vægtfunktionen
f ( x, y, z) = 2 + z. Den totale masse af den vgtede torus er M = 16p 2 .

Opgave 25.20

Vis, at Jacobifunktionen Jacobir (u, v, w) også kan findes som den numeriske værdi af de-
terminanten af den matrix, der som søjler har koordinaterne for de tre vektorer r0u (u, v, w),
r0v (u, v, w) og r0w (u, v, w).

Definition 25.21 Regulær parameterfremstilling


Parameterfremstillingen i (25.2.36) kaldes en regulær parameterfremstilling hvis
Jacobir (u, v, w) > 0 for alle u 2 [ a, b] , v 2 [c, d], w 2 [ h, l ] .
eNote 25 25.2 RUM-INTEGRALER 15

Definition 25.22 En-entydig parameterfremstilling


Som for kurver og flader vil vi kalde parameterfremstillingen i (25.2.36) en-entydig
hvis forskellige punkter i definitionsmængden afbildes i forskellige punkter i billed-
mængden.

Definition 25.23 Rumfang, volumen


Volumenet eller rumfanget af det rumlige område

Wr : r(u, v, w) = ( x (u, v, w), y(u, v, w), z(u, v, w)) , (25-39)

hvor
u 2 [ a, b] , v 2 [c, d] , og w 2 [ h, l ] , (25-40)
defineres som rumintegralet af den konstante funktion 1:
Z Z lZ dZ b
Vol(Wr ) = 1 dµ = Jacobir (u, v, w) du dv dw . (25-41)
Wr h c a

Figure 25.9: Billeder af det rumlige område givet ved parameterfremstillingen r(u, v, w) =
(u v cos(w), u v sin(w), 12 (u2 v2 )) , u 2 [ 12 , 1] , v 2 [ 12 , 1] , w 2 [p, 2p ].

Opgave 25.24

Vis, at parameterfremstillingen i figur 25.9 er regulær og en-entydig.


eNote 25 25.2 RUM-INTEGRALER 16

25.2.1 Motivering af rumintegralet

Intervallerne [ a, b], [c, d] og [ h, l ] inddeles i henholdsvis n, m og q lige store dele. Så


har hvert u-delinterval længden du = (b a)/n, hvert v-delinterval har længden dv =
(d c)/m og hvert w-interval har længden dw = (l h)/q. Tilsvarende bliver delepunk-
ternes koordinater i (u, v, w)-parameterområdet (som her er det retvinklede ’kasse-område’
[ a, b] ⇥ [c, d] ⇥ [h, k] i R3 .

(u1 , v1 , w1 ) = ( a, c, h),
....
(ui , v j , wk ) = ( a + (i 1)du , c + ( j 1)dv , h + (k 1)dw ), (25-42)
....
(b, d, l ) = ( a + ndu , c + mdv , h + qdw ) .

Med hvert af disse faste punkter (ui , v j , wk ) som udviklingspunkt kan vi igen bruge
Taylors grænseformel for hver af de 3 koordinat-funktioner for

r(u, v, w) = ( x (u, v, w), y(u, v, w), z(u, v, w))

til første orden og med tilhørende epsilon-funktioner:

r(u, v, w) = r(ui , v j , wk )
+ r0u (ui , v j , wk ) · (u ui )
+ r0v (ui , v j , wk ) · (v vj ) (25-43)
+ r0w (ui , v j , wk ) · (w wk )
+ rijk · #ijk (u ui , v v j , w wk ) ,
⇥ ⇤ ⇥ ⇤
hvor u 2 [ ui , ui + du ] , v 2 v j , v j + dv , w 2 w j , w j + dw . Afstanden mellem
det variable punkt (u , v , w) og det faste punkt (ui , v j , wk ) i parameterområdet beteg-
nes med rijk og vi har som før #ijk (u ui , v v j , w wk ) ! 0 for (u ui , v v j , w
wk ) ! (0, 0, 0) .

Hvert parameter-delområde eller delkasse [ui , ui + du ] ⇥ [v j , v j + dv ] ⇥ [wk , wk + dw ] af-


bildes på det rumlige billed-område r(u, v, w), u 2 [ui , ui + du ], v 2 [v j , v j + dv ], w 2
[wk , wk + dw ] i billedrummet og dette område kan vi approksimere med den lineære del
eNote 25 25.2 RUM-INTEGRALER 17

af udtrykket i (25.2.43), som fås ved at fjerne #ijk -bidraget fra højre side i (25.2.43):

rapp ijk (u, v, w) = r(ui , v j , wk )


+ r0u (ui , v j , wk ) · (u ui )
(25-44)
+ r0v (ui , v j , wk ) · (v vj )
+ r0w (ui , v j , wk ) · (w wk ) ,
⇥ ⇤ ⇥ ⇤
hvor vi stadig har at u 2 [ ui , ui + du ] , v 2 v j , v j + dv , w 2 w j , w j + dw .

Disse lineære rumlige approksimationer er parallelepipeda, som udspændes af de tre


tangentvektorer r0u (ui , v j , wk ) · du , r0v (ui , v j , wk ) · dv og r0w (ui , v j , wk ) · dw .

Volumen

Hvert enkelt af de ialt n m q approksimerende parallelepipeda har et volumen. Vol-


umenet af det (i, j, k )’te parallelepipedum er den numeriske værdi af rumproduktet af
de tre vektorer, der udspænder det pågældende parallelepipedum:

D Volijk = | (r0u (ui , v j , wk ) · du ) ⇥ (r0v (ui , v j , wk ) · dv ) · (r0w (ui , v j , wk ) · dw )|


(25-45)
= Jacobir (ui , v j , wk ) · du · dv · dw .

Opgave 25.25

Bevis denne påstand: Volumenet af et parallelepipedum er den numeriske værdi af rumpro-


duktet af de tre udspændende vektorer.

Summen af de ialt n m q volumener er en god approksimation til volumenet af hele det


rumlige område, således at vi har
q m n
Volapp (n, m, q) = Â Â Â D Volijk
k =1 j =1 i =1
q m n
(25-46)
= Â Â Â Jacobir (ui , v j , wk ) · du dv dw .
k =1 j =1 i =1

Da ovenstående sum er en tredobbelt integralsum for den kontinuerte funktion af de tre


variable, Jacobir (u, v, w) , over parameter-kassen [ a, b] ⇥ [c, d] ⇥ [ h, l ] får vi i grænsen,
eNote 25 25.2 RUM-INTEGRALER 18

hvor n, m og q alle går mod uendelig:


Z lZ dZ b
Volapp (n, m, q) ! Vol = Jacobir (u, v, w) du dv dw for n, m, q ! • .
h c a
(25-47)

Dette er begrundelsen for definitionen af volumenet af et parametriseret område i rum-


met som angivet ovenfor, nemlig som rumintegralet af den konstante funktion 1.

Figure 25.10: To forskellige delvise kugle-fyldninger med parallelepipeda. Se Opgave 25.26.

Opgave 25.26

Kugle-parameterfremstillingerne i figur 25.10 er henholdsvis følgende:

r1 (u, v, w) = [ w sin(u) cos(v), w sin(u) sin(v), w cos(u) ]


r2 (u, v, w) = [ w sin(v) cos(u + v), w sin(v) sin(u + v), w cos(v) ] ,

hvor parameterintervallerne i begge tilfælde er givet ved:

u 2 [ p, 0] , v 2 [0, p ] , w 2 [0, 1] .

Bestem Jacobi-funktionerne for hver af de to parameterfremstillinger, og vis, at begge de


viste rumlige områder har volumenet 2p/3, altså præcis halvdelen af hele enheds-kuglens
volumen.
eNote 25 25.2 RUM-INTEGRALER 19

Masse

Hvis vi nu antager, at hvert enkelt parallelepipedum givet ved (25.2.44) tildeles en kon-
stant massetæthed som er givet ved værdien af funktionen f ( x, y, z) på stedet r(ui , v j , wk ),
så bliver massen af det (i, j, k )’te parallelepipedum:

D Mijk = f ( x (ui , v j , wk ), y(ui , v j , wk ), z(ui , v j , wk )) Jacobir (ui , v j , wk ) · du dv dw


(25-48)
= f (r(ui , v j , wk )) Jacobir (ui , v j , wk ) · du dv dw .

Den totale masse af hele systemet af appproksimerende parallelepipeda er derfor føl-


gende, som nødvendigvis er en god approksimation til massen af hele det rumlige om-
råde:
q m n
Mapp (n, m, q) = Â Â Â D Mijk
k =1 j =1 i =1
q m n
(25-49)
= Â Â Â f (r(ui , v j , wk )) Jacobir (ui , v j , wk ) · du dv dw .
k =1 j =1 i =1

Dette er en tredobbelt integralsum for den kontinuerte funktion f (r(u, v, w)) Jacobir (u, v, w)
over parameter-kassen [ a, b] ⇥ [c, d] ⇥ [ h, l ] . Vi får i grænsen, hvor n, m og q går mod
uendelig:
Z lZ dZ b
Mapp (n, m, q) ! M = f (r(u, v, w)) Jacobir (u, v, w) du dv dw
h c a (25-50)
for n, m, q ! • .

Dermed har vi motiveret definitionen af massen af et parametriseret område med mas-


setætheden f (r(u, v, w)) og dermed også den generelle definition 25.19 af rumintegralet.

Opgave 25.27

I figur 25.11 betragtes følgende parametrisering af et rumligt område:

r(u, v, w) = (u sin(v) cos(w), u sin(v) sin(w), u cos(v)) , (25-51)

hvor u 2 [1/2, 1], v 2 [p/3, 2p/3], og w 2 [ p, p ]. Ved afbildning af det kasseformede pa-
rameterområde forventes ialt 6 sideflader for billed-mængden, dvs. for det rumlige område,
der fremkommer ved parameterfremstillingen. Vi ser på figuren kun tre af de 6 sideflader.
Hvor er de andre og hvordan ser de ud?
eNote 25 25.2 RUM-INTEGRALER 20

Figure 25.11: Dette rumlige område er givet ved parameterfremstillingen r(u, v, w) =


(u sin(v) cos(w), u sin(v) sin(w), u cos(v)) , u 2 [1/2, 1] , v 2 [p/3, 2p/3] , w 2 [ p, p ]. Pa-
rameterkassen, koordinatkurverne, billedet af det rumlige område ved parameterfremstillingen
og et system af volumen-approksimerende parallellepipida er vist.

Eksempel 25.28 Rumfang af massiv ellipsoide

En massiv ellipsoide med halvakser a, b, og c har en parameterfremstilling:

r(u, v, w) = ( a u sin(v) cos(w), b u sin(v) sin(w), c u cos(v)) , (25-52)

hvor u 2 [0, 1], v 2 [0, p ] og w 2 [ p, p ].

Jacobi-funktionen for denne parametrisering er Jacobi(u, v, w) = abc u2 sin(v) , og deraf føl-


ger volumenet ved tredobbelt integration:
Z
Vol(Wr ) = 1 dµ
Wr
Z p Z pZ 1
= Jacobir (u, v, w) du dv dw
p 0 0
Z p Z pZ 1 (25-53)
2
= abc u sin(v) du dv dw
p 0 0
4
= p abc .
3
For en massiv kugle Ba med radius a får vi derfor rumfanget

4
Vol( Ba ) = p · a3 . (25-54)
3
eNote 25 25.2 RUM-INTEGRALER 21

Figure 25.12: Dette rumlige område er et ’rumvinkel’-udsnit af kuglefladen repræsenteret


ved r(u, v, w) = (u sin(v) cos(w), u sin(v) sin(w), u cos(v)) , u 2 [0, 1] , v 2 [0, p/6] , w 2
[ p, p ].

Eksempel 25.29 Graf-flade-afgrænset rumligt område

En positiv funktion h( x, y) af to variable ( x, y) har en grafflade, der over et givet område P i


( x, y)-planen afgrænser et rumligt område. Det er let at parametrisere det rumlige område,
når først det plane område er parametriseret.

Hvis det plane område er givet ved et rektangel ( x, y) 2 [ a, b] ⇥ [c, d] har vi parameterfrem-
stillingen for det rumlige område:

Wr : r(u, v, w) = (u, v, w · h(u, v)) , (u, v) 2 [ a, b] ⇥ [c, d] , w 2 [0, 1] . (25-55)

Jacobifunktionen er særlig simpel:

Jacobir (u, v, w) = |((1, 0, w · h0u (u, v)) ⇥ (0, 1, w · h0v (u, v))) · (0, 0, h(u, v))|
= |((1, 0, ⇤) ⇥ (0, 1, ⇤⇤)) · (0, 0, h(u, v))| (25-56)
= h(u, v) .

Rumfanget af det rumlig område, som graf-fladen afgrænser sammen med det plane område
i ( x, y)-planen er derfor:
Z 1Z dZ b Z dZ b
Vol(Wr ) = h(u, v) du dv dw = h(u, v) du dv . (25-57)
0 c a c a

Hvis det plane område P i ( x, y)-planen ikke er et rektangel som ovenfor, må vi først pa-
rametrisere P. Vi antager derfor nu, at det plane område P er billedet af et rektangulært
eNote 25 25.2 RUM-INTEGRALER 22

parameterområde ved en vektorfunktion br:

P : br(u, v) = (x (u, v), h (u, v)) , u 2 [ a, b] , v 2 [c, d] , (25-58)

hvor x (u, v) og h (u, v) er givne funktioner af u og v. Så er det rumlige område imellem P og


graffladen for h( x, y) givet ved parameterfremstillingen:

Wr : r(u, v, w) = (x (u, v), h (u, v), w · h(x (u, v), h (u, v))) , (25-59)

hvor (u, v) 2 [ a, b] ⇥ [c, d] og w 2 [0, 1] med tilhørende Jacobi-funktion:

Jacobir (u, v, w) =
= |((x u0 (u, v), hu0 (u, v), ⇤) ⇥ (x v0 (u, v), hv0 (u, v), ⇤⇤)) · (0, 0, h(x (u, v), h (u, v)))| (25-60)
= h(x (u, v), h (u, v)) · Jacobibr (u, v) .

Rumfanget af det rumlig område, som graf-fladen afgrænser sammen med det plane område
i ( x, y)-planen er derfor i denne mere generelle situation:
Z 1Z dZ b
Vol(Wr ) = h(x (u, v), h (u, v)) · Jacobibr (u, v) du dv dw
0 c a
Z d Z b (25-61)
= h(x (u, v), h (u, v)) · Jacobibr (u, v) du dv .
c a

Figure 25.13: Planetariet er afgrænset af graffladen for f ( x, y) = 2 x y over en cirkulær


grundplan i ( x, y)-planen med radius 1 og centrum i (0, 0). Rumfanget er 2p.
eNote 25 25.2 RUM-INTEGRALER 23

Figure 25.14: Et ’planetarium’ med en lidt mere kompliceret tag-graf-flade; den benyttede funk-
tion er her f ( x, y) = y2 x2 + 2x + 3. Rumfanget er ca. 2.36.

Eksempel 25.30 Planetariet

Rumfanget i en cylinder mellem to plane afskæringer (se figur 25.13) er bestemt ved parame-
terfremstillingen:

Wr : r(u, v, w) = (x (u, v), h (u, v), w · h(x (u, v), h (u, v))) , (25-62)

hvor højdefunktionen er h( x, y) = 2 x y, parametrene er (u, v) 2 [0, 1] ⇥ [ p, p ], w 2


[0, 1], og det cirkulære grundareal er givet ved

P : br(u, v) = (u · cos(v), u · sin(v)) , u 2 [0, 1] , v 2 [ p, p ] (25-63)

med Jacobi-funktionen
Jacobibr (u, v) = u , (25-64)
således at
Z p Z 1
Vol(Wr ) = h(x (u, v), h (u, v)) · Jacobibr (u, v) du dv
p 0
Z p Z 1
= (2 u · cos(v) u · sin(v)) · u du dv
p 0
Z p Z 1
= u2 · cos(v) u2 · sin(v)) du dv
(2u
p 0 (25-65)
Z p ⇥ ⇤  
2 u =1 1 3 u =1 1 3 u =1
= ( u u =0 u · cos(v) u · sin(v)) dv
p 3 u =0 3 u =0
Z p ✓ ◆
1 1
= 1 · cos(v) · sin(v) dv
p 3 3
= 2·p .
Bemærk, at det rumfang også vha. symmetri kan findes meget lettere som halvdelen af rum-
fanget af den cylinder, der har samme grundflade og er skåret vinkelret i højden 4.
eNote 25 25.3 OMDREJNINGSLEGEMER 24

25.3 Omdrejningslegemer

Omdrejningslegemer er de specielle rumlige områder, der fremkommer ved at dreje et


plant område (f.eks. defineret i ( x, z)-planen) omkring en omdrejningsakse i samme
plan (z-aksen), som antages at ligge udenfor området. Jævnfør definitionen af omdrej-
ningsflader i afsnit 25.1.2.

Det plane område - profilområdet - repræsenteres ved en parameterfremstilling således:

Pr : r(u, v) = ( g(u, v), 0, h(u, v)) 2 R3 , u 2 [ a, b] , v 2 [c, d] , (25-66)


hvor g(u, v) > 0 og h(u, v) er givne funktioner af parametrene u og v. Det rumlige
område, det legeme, der fremkommer ved at dreje profilområdet en hel gang omkring
z-aksen har derfor parameterfremstillingen:

WPr : r(u, v, w) = ( g(u, v) cos(w), g(u, v) sin(w), h(u, v)) 2 R3 ,


(25-67)
u 2 [ a, b] , v 2 [c, d] , w 2 [ p, p ] .

Figur 25.9 viser halvdelen af et omdrejningslegeme. Figur 25.11 viser overfladen af


et omdrejningslegeme defineret ved brug af kuglekoordinater. Cylinder-koordinater i
rummet giver tilsvarende velkendte omdrejningslegemer som f.eks. det, der er vist i
figur 25.15.

Figure 25.15: Cylinderkoordinatiseret rumligt område givet ved parameterfremstillingen


r(u, v, w) = ( g(u, v) cos(w), g(u, v) sin(w), h(u, v)) , u 2 [0, 12 ] , v 2 [ 12 , 12 ] , w 2 [ p, p ],
hvor g(u, v) = u og h(u, v) = v.
eNote 25 25.3 OMDREJNINGSLEGEMER 25

Opgave 25.31

Vis, at Jacobifunktionen Jacobir (u, v, w) for parameterfremstillingen r(u, v, w) for det


generelle omdrejningslegeme WPr i (25.3.67) er givet ved

Jacobir (u, v, w) = g(u, v) | gu0 (u, v) h0v (u, v) h0u (u, v) gv0 (u, v)| . (25-68)

Figure 25.16: Dele af henholdsvis omdrejnings-flaske og -fad, se Opgave 25.32.

Opgave 25.32

En omdrejnings-flaske (eller -fad?) er (pånær bunden) givet ved sin profilkurves parameter-
fremstilling i ( x, z) planen således:

Gr : r(u) = ( g(u), 0, h(u)) 2 R3 , u 2 [0, 1] , (25-69)

hvor
g ( u ) = 2( R1 R2 ) u3 + 3( R2 R1 ) u2 + R1
(25-70)
h(u) = H u ,
for passende valg af positive konstanter R1 , R2 , og H.

1. Plot forskellige versioner af disse omdrejningsflader, se f.eks. figur 25.16.

2. Vis, at omdrejningsfladen står vinkelret på ( x, y) planen for ethvert valg af positive


konstanter R1 , R2 , og H.
eNote 25 25.4 FLERE ARKITEKTONISK MOTIVEREDE RUMLIGE OMRÅDER 26

3. Hvor meget rumfang (vand, f.eks.) kan omdrejningsfladen ’indeholde’ for givne
værdier af positive konstanter R1 , R2 , og H?

4. Hvad er arealet af overfladen af omdrejningsfladen + bund for givne værdier af posi-


tive konstanter R1 , R2 , og H?

5. Hvilke(t) valg af konstanter giver mest rumfang i forhold til det totale overfladeareal?

25.4 Flere arkitektonisk motiverede rumlige områder

Opgave 25.33

Inspireret af Malmø’s Turning Torso er det en interessant opgave at finde rumfang og over-
fladeareal af forskellige ’snoede’ bygningsværker:

1. Find en parameterfremstilling for det rumlige område, der er vist i figur 25.17 til ven-
stre. Vlg selv dimensionerne p din bygning, dvs. grundflade og hjde. Vink: De opad-
gende sidelinjer er skruelinjer, se eksempel ?? i eNote 22 .

2. Hvad er rumfanget af din bygning?

3. Hvad er overfladearealet af bygningens sidevægge?

4. Med fastholdt højde og tværsnitsfigur: Vis, at rumfanget er uafhængig af drejningstal-


let (det antal gange tværsnitsfiguren drejes fra bund til top - for Torsoen er drejningstal-
let 1/5). Hvordan afhænger overfladearealet af drejningstallet? Med hvilket drejnings-
tal fås det største volumen i forhold til det totale overfladeareal (af sidevæggene)?

Opgave 25.34

Find parameterfremstillinger af de to (højeste) tårne der vises i figur 25.18. Vælg selv di-
mensionerne. Vink: Tårnet i venstre billede har elliptiske tværsnit. Find rumfang og over-
fladeareal for hver af bygningerne.
eNote 25 25.4 FLERE ARKITEKTONISK MOTIVEREDE RUMLIGE OMRÅDER 27

Figure 25.17: Fem-kantet Turning Torso model og ’the real thing in Malmø’.

Figure 25.18: Chinese–Canadian projekt.


eNote 25 25.5 OPSUMMERING 28

25.5 Opsummering

Vi har i denne eNote opstillet de begreber og metoder der gør det muligt at beregne
(vægtede) arealer og rumfang af henholdsvis flader og rumlige områder – for så vidt
de er givet ved parameterfremstillinger ud fra rektangulære og kasseformede parame-
terområder. En række eksempler og opgaver viser hvordan meget forskellige flader og
områder kan parametriseres ved rimeligt simple vektorfunktioner r(u, v) og r(u, v, w).

Når først en relevant parametrisering er opstillet er ’resten’ kun et spørgsmål om at


beregne den tilhørende Jacobifunktion Jacobir (u, v) eller Jacobir (u, v, w), gange den med
en eventuel vægtfunktion f ( x, y, z) restringeret til parametriseringens billedmængde i
rummet, og til sidst beregne dobbelt- eller tredobbelt- integralet af dette produkt over
parameter-rektanglet eller parameter-kassen:

• For en flade Fr med parameterfremstillingen


Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) 2 R3 , u 2 [ a, b] , v 2 [c, d] (25-71)
er integralet af (vægt-)funktionen f ( x, y, z) over fladen givet ved:
Z Z dZ b
f dµ = f (r(u, v)) Jacobir (u, v) du dv , (25-72)
Fr c a

hvor Jacobi-funktionen Jacobir (u, v)


Jacobir (u, v) = |r0u (u, v) ⇥ r0v (u, v)| (25-73)
er arealet af det parallelogram, der på stedet r(u, v) udspændes af de to tangentvek-
torer r0u (u, v) og r0v (u, v) til de respektive koordinatkurver igennem punktet r(u, v)
på fladen.

• Specielt er arealet af Fr bestemt ved:


Z Z dZ b
Areal( Fr ) = 1 dµ = Jacobir (u, v) du dv . (25-74)
Fr c a

• For et rumligt område Wr med parameterfremstillingen


Wr : r(u, v, w) = ( x (u, v, w), y(u, v, w), z(u, v, w)) , (25-75)
hvor u 2 [ a, b], v 2 [c, d], og w 2 [ h, l ] er integralet af (vægt-)funktionen f ( x, y, z)
over området givet ved:
Z Z lZ dZ b
f dµ = f (r(u, v, w)) Jacobir (u, v, w) du dv dw , (25-76)
Wr h c a
eNote 25 25.5 OPSUMMERING 29

hvor Jacobi-funktionen Jacobir (u, v, w)

Jacobir (u, v, w) = | r0u (u, v, w) ⇥ r0v (u, v, w) · r0w (u, v, w)| (25-77)

er volumenet af det parallelepipedum, der på stedet r(u, v, w) udspændes af de


tre tangentvektorer r0u (u, v, w), r0v (u, v, w), og r0w (u, v, w) til de respektive koordi-
natkurver igennem punktet r(u, v, w) i det rumlige område.

• Specielt er rumfanget af Wr bestemt ved:


Z Z lZ dZ b
Vol(Wr ) = 1 dµ = Jacobir (u, v, w) du dv dw . (25-78)
Wr h c a
eNote 26 1

eNote 26

Vektorfelter

I eNote 10 indføres og studeres vektorer i plan og rum. I eNote 20 ser vi på gradienterne for
funktioner f ( x, y) af to variable. Et gradientvektorfelt for en funktion af to variable er – som
navnet rigeligt antyder – et eksempel på et plant vektorfelt. I denne eNote vil vi begynde at
studere vektorfelter helt generelt. Både i planen og i rummet. Vi vil præcisere, hvad det betyder
at flyde med et givet vektorfelt og beregne, hvor man kommer hen i rummet eller i planen på
den måde i løbet af et givet tidsrum. For at finde disse såkaldte flow-kurver får vi brug for at
kunne løse (her passende simple) første ordens differentialligningssystemer hvorved eNote 17
ligesom de ovenfor nævnte eNoter bliver aktuelt materiale for nærværende eNote. Vi vil også
begynde på at undersøge, hvad der sker med større systemer af punkter eller partikler når de
hver for sig flyder med vektorfeltet.

26.1 Vektorfelter

Et vektorfelt V i rummet er givet ved 3 glatte funktioner V1 ( x, y, z) , V2 ( x, y, z) og V3 ( x, y, z)


som hver er funktioner af de tre variable x, y, og z således:

V( x, y, z) = (V1 ( x, y, z) , V2 ( x, y, z) , V3 ( x, y, z) ) for ( x, y, z) 2 R3 . (26-1)


eNote 26 26.1 VEKTORFELTER 2

Figure 26.1: En grafflade for en funktion af to variable og det tilhørende gradientvektorfelt


i planen sammen med nogle af niveaukurverne. Gradientvektorfeltet er overalt vinkelret på
niveaukurverne, se eNote 20.

Et vektorfelt V( x, y, z) tegnes og angives sædvanligvis i rummet ved i et


passende antal udvalgte punkter ( xi , yi , zi ) at afsætte vektoren som en pil med
fodpunkt i ( xi , yi , zi ) og spidspunkt i ( xi + V1 ( xi , yi , zi ), yi + V2 ( xi , yi , zi ), zi +
V3 ( xi , yi , zi )). Der kan være gode grunde til at angive vektorfeltet på andre
måder. F.eks. hvis der er stor variation i længden af vektorerne i et givet om-
råde, så kan det være en fordel at benytte tykkelsen af pilene som en længde-
indikerende parameter.

Et vektorfelt i planen er tilsvarende givet ved to koordinatfunktioner V1 ( x, y) og V2 ( x, y)


som hver er glatte funktioner af de to variable x og y:
V( x, y) = (V1 ( x, y) , V2 ( x, y) ) for ( x, y) 2 R2 . (26-2)

Gradientvektorfeltet for en glat funktion f ( x, y) af to variable (som indføres og studeres


i eNote 20 er et eksempel på et vektorfelt i planen, se figuren.

Som for funktioner af tre variable defineres gradientvektorfeltet for funktioner f ( x, y, z)


af tre variable:
eNote 26 26.1 VEKTORFELTER 3

Definition 26.1 Gradientfelt i rummet


Lad f ( x, y, z) betegne en glat funktion af tre variable i R3 . Så defineres gradientvek-
torfeltet for f ( x, y, z) på følgende måde ved hjælp af de tre første partielle afledede
af f ( x, y, z):
⇣ ⌘
r f ( x, y, z) = f x0 ( x, y, z) , f y0 ( x, y, z) , f z0 ( x, y, z) , ( x, y, z) 2 R3 . (26-3)

Eksempel 26.2 Et gradientfelt i rummet

Vi lader f ( x, y, z) betegne andengradspolynomiet

f ( x, y, z) = 2 · x2 + 2 · y2 + 2 · z2 2·x·z 2·x 4·y 2·z+3 . (26-4)

Gradientvektorfeltet for f ( x, y, z) er så:

r f ( x, y, z) = (4 · x 2·z 2, 4· y 4, 2·x+4·z 2) . (26-5)

Se figur 26.2. Vi refererer til eksempel 22.11 i eNote 20 vedrørende konstruktionen af den viste
ellipsoide-niveauflade K0 ( f ) for f ( x, y, z). Niveaufladen og det beregnede gradientvektorfelt
er antydet i figur 26.2. Gradientvektorfeltet ses at være vinkelret på niveaufladen.

Man kan nu meget vel spørge om alle glatte vektorfelter i planen og alle glatte
vektorfelter i rummet stammer fra en funktion på den måde, at de hver for
sig er gradientvektorfeltet for en eller anden funktion af henholdsvis to og tre
variable. Men så simpelt er det ikke!
eNote 26 26.1 VEKTORFELTER 4

Figure 26.2: Niveauflade (i åbnet version) for en funktion (andengradspolynomium) af tre vari-
able og nogle tilhørende gradientvektorer fra gradientvektorfeltet i rummet.

Eksempel 26.3 Et vektorfelt som ikke er et gradientvektorfelt

Lad V( x, y) betegne det meget simple vektorfelt i planen V( x, y) = ( y, x ), hvor ( x, y) 2 R2 .


Så findes der ikke nogen funktion f ( x, y) som opfylder at r f ( x, y) = V( x, y).

Hvis vi nemlig (indtil modstrid) antager, at der findes en sådan funktion med den egenskab:

r f ( x, y) = V( x, y) , sådan at
⇣ ⌘
f x0 ( x, y), f y0 ( x, y) = ( y, x ) , så får vi at

f x0 ( x, y) = y
(26-6)
f y0 ( x, y) =x , og dermed

00
f xy ( x, y) = 1
00
f yx ( x, y) = 1 ,
og det stemmer jo ikke overens med at der for alle glatte funktioner gælder
00
f xy 00
( x, y) = f yx ( x, y) , for alle ( x, y) 2 R2 . (26-7)

Det viser, at der ikke findes nogen funktion hvis gradientvektorfelt er det givne vektorfelt.
eNote 26 26.1 VEKTORFELTER 5

Gradientvektorfelterne er altså kun eksempler på vektorfelter – men en meget


stor og meget vigtig samling af eksempler på vektorfelter.

Et vektorfelt V( x, y) i planen kan let udvides til et vektorfelt W( x, y, z) i rum-


met ved simpelthen at parallelforskyde alle vektorerne fra planen i z-aksens
retning og iøvrigt sætte W3 ( x, y, z) = 0 for alle ( x, y, z) 2 R3 :

Det helt generelle plane vektorfelt V( x, y) = (V1 ( x, y), V2 ( x, y)) har således
følgende rumlige udvidelse:

W( x, y, z) = (V1 ( x, y), V2 ( x, y), 0) dvs.

W1 ( x, y, z) = V1 ( x, y) , (26-8)
W2 ( x, y, z) = V2 ( x, y) ,
W3 ( x, y, z) = 0 .

Se figur 26.3 som antyder de rumlige udvidelser af tre forskellige vektorfel-


ter V( x, y) = (1, 0), V( x, y) = ( x, y), og V( x, y) = ( y, x ), alts W( x, y, z) =
(1, 0, 0), W( x, y, z) = ( x, y, 0), og W( x, y, z) = ( y, x, 0) henholdsvis.

Figure 26.3: Tre plane vektorfelter er her udvidet til rumlige vektorfelter.

Nogle vektorfelter er særlig simple. Det gælder især de vektorfelter hvor alle 3 koor-
dinatfunktioner er polynomier af højest første grad i de rumlige variable ( x, y, z), dvs.
eNote 26 26.1 VEKTORFELTER 6

Figure 26.4: De tre rumlige vektorfelter fra figur 26.3 er her modificerede til at have W3 = 1/2
i stedet for W3 = 0 .

V( x, y, z) = ( a11 x + a12 y + a13 z + b1 ,


a21 x + a22 y + a23 z + b2 , (26-9)
a31 x + a32 y + a33 z + b3 ) .
I så fald kan vektorfeltet skrives kort ved hjælp af den matrix, A , der har elementerne
aij og den vektor, b, der har koordinaterne bi :

Definition 26.4 Vektorfelt af første grad


Et vektorfelt af første grad er et vektorfelt V( x, y, z), der kan skrives på følgende form
ved hjælp af en konstant matrix A og en konstant vektor b :
⇥ ⇤>
V> = (V( x, y, z))> = A · x y z + b> , (26-10)

hvor > betyder transponering af de respektive matricer, sådan at


2 3 2 3 2 3 2 3
V1 ( x, y, z) a11 a12 a13 x b1
4 V2 ( x, y, z) 5 = 4 a21 a22 a23 5 · 4 y 5 + 4 b2 5 . (26-11)
V3 ( x, y, z) a31 a32 a33 z b3
eNote 26 26.1 VEKTORFELTER 7

Eksempel 26.5 Konstant vektorfelt

Et konstant vektorfelt kan for eksempel modellere en konstant vind lokalt tæt ved ( x, y)-
planen (jordoverfladen):
V( x, y, z) = b , (26-12)
hvor b er en konstant vektor, f.eks. b = (0, 7, 0) – hvis vinden blæser med 7km/t i y-aksens
retning.

Eksempel 26.6 Roterende vektorfelt

Et eksempel på et såkaldt roterende vektorfelt er givet ved

V( x, y, z) = ( y, x, 0) . (26-13)

Se figur 26.3 i midten.

Definition 26.7
Sporet af en kvadratisk n ⇥ n-matrix A med elementerne ai j er summen af matricens
n diagonalelementer:
i=n
spor( A) = Â ai i . (26-14)
i =1

Opgave 26.8

Find A og b (som i Definition 26.4) for vektorfeltet i eksempel 26.6. Hvad er sporet af A i
dette tilflde tilflde? Kan A diagonaliseres (diagonalisering beskrives i eNote 4)?

Eksempel 26.9 Eksplosions- og implosions-vektorfelter

Et eksempel på hvad vi kunne kalde et eksplosionsvektorfelt er givet ved følgende koordinat-


funktioner (se hvorfor i figur 26.6):

V( x, y, z) = ( x, y, z) . (26-15)
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 8

Tilsvarende er følgende et eksempel på et vektorfelt, som vi kan kalde et implosionsvektorfelt


(se hvorfor i figur 26.7):
V( x, y, z) = ( x, y, z) . (26-16)

Opgave 26.10

Find A og b for vektorfelterne i ovenstående eksempel 26.9. Hvad er sporet af A for de to


vektorfelter? Kan A diagonaliseres?

Vi vil nu begrunde de (dynamiske) navne, som vi har givet vektorfelterne i ovenstående


eksempler 26.6 og 26.9. For at gøre det vil vi bevæge os sammen med – eller flyde langs
med – vektorfeltet i en meget præcis forstand, som vi nu vil definere.

26.2 Flowkurver for et vektorfelt

Lad os først repetere, at hvis vi har givet en kurve med en parameterfremstilling

Kr : r(t) = ( x (t), y(t), z(t)) 2 R3 , t 2 [ a, b] , (26-17)

så har denne kurve til enhver værdi af parameteren t en tangentvektor nemlig

r0 (t) = ( x 0 (t), y0 (t), z0 (t)) . (26-18)

Hvis vi betragter parameteren t 2 [ a, b] som en tids-parameter for den bevægelse (af en


partikel) i rummet, der er givet ved r(t), så er r0 (t) hastigheden af partiklen til tidspunk-
tet t.

Hvis vi konstruerer tilstrækkelig mange kurver (en kurve igennem ethvert punkt i rum-
met), der ikke skærer hverken sig selv eller hinanden får vi på den måde et vektorfelt i
rummet.

Det oplagte omvendte spørgsmål er nu: Givet et startpunkt p = ( x0 , y0 , z0 ) og givet et


vektorfelt V( x, y, z) i rummet, findes der så en parametriseret kurve r(t) igennem p
(med r(0) = ( x0 , y0 , z0 ) ), således at kurvens tangentvektorfelt hele vejen langs med kur-
ven netop er det givne vektorfelt V( x, y, z) langs med kurven? Hvis det er tilfældet så
vil vi kalde kurven r(t) en integralkurve eller en flowkurve for vektorfeltet. Disse navne
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 9

skyldes dels at kurven kan findes ved integration (løsning af et differentialligningssys-


tem) og dels at bevægelsen langs kurven er som at flyve eller flyde med det givne vek-
torfelt, altså med en fart og en retning, som vektorfeltet angiver på ethvert sted for
bevægelsen, idet kravet til bevægelsen r(t) jo udtrykkes ved:

Definition 26.11 Flowkurver, Integralkurver


Lad V( x, y, z) betegne et glat vektorfelt i rummet. En parametriseret kurve

Kr : r(t) = ( x (t), y(t), z(t)) , t 2 [ a, b] , (26-19)

kaldes en flowkurve eller integralkurve for vektorfeltet V( x, y, z) hvis r(t) opfylder


flowkurve-ligningen:

V(r(t)) = r0 (t) for alle t 2 [ a, b] , (26-20)

som er ækvivalent med følgende første ordens differential-ligningssystem


2 3 2 3
x0 (t) V1 ( x (t), y(t), z(t))
4 y0 (t) 5 = (V( x (t), y(t), z(t)))> = 4 V2 ( x (t), y(t), z(t)) 5 . (26-21)
z0 (t) V3 ( x (t), y(t), z(t))

Hvis V( x, y, z) er givet og hvis vi har fået givet et startpunkt p = r( a)


for en flowkurve, så er opgaven selvfølgelig den typiske, at finde løsnin-
gen til differentialligningssystemet med denne begyndelsesbetingelse, dvs.
finde koordinatfunktionerne x (t), y(t), og z(t) således at p = ( x ( a), y( a), z( a)).

Med andre ord: Hvis vi har givet et vektorfelt i rummet så går opgaven ud på
at starte en bevægelse af en partikel (en lille kugle) langs vektorfeltet sådan at
kuglens hastighedsvektor til ethvert tidspunkt er givet ved vektorfeltets værdi
i det punkt hvor kuglen befinder sig til det tidspunkt. Og det er naturligvis
interessant at kunne afgøre hvor kuglen befinder sig efter lang tid. Og det er
interessant at finde ud af, hvordan en kugle-hob (partikler som til start er tæt
på hinanden) udvikler sig i tiden – bliver hoben tættere eller tyndere, mast
sammen eller trukket ud?

Der gælder følgende eksistens- og entydighedssætning som er grundlaget for vore første
eksempler og de første overvejelser om de naturlige spørgsmål der vedrører flowkurver
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 10

og deres opførsel.

Sætning 26.12 Eksistens og entydighedssætningen


Lad V( x, y, z) være et vektorfelt af første grad, givet ved en koefficientmatrix A og en
vektor b som i definition 26.4. Lad ( x0 , y0 , z0 ) betegne et vilkårligt punkt i rummet.
Så findes der netop én kurve r(t), der opfylder de to betingelser:

r(0) = ( x0 , y0 , z0 ) og
(26-22)
0
r (t) = V( x (t), y(t), z(t)) for alle t 2 [ •, •] .

Den sidste ligning (26.2.22) er ækvivalent med følgende differentialligningssystem


med en konstant koefficientmatrix A:
2 0 3
x (t)
4 y0 (t) 5 = (V( x (t), y(t), z(t)))>
z0 (t)
⇥ ⇤>
= A · x (t) y(t) z(t) + b> (26-23)
2 3 2 3 2 3
a11 a12 a13 x (t) b1
= 4 a21 a22 a23 5 · 4 y(t) 5 + 4 b2 5 .
a31 a32 a33 z(t) b3

Hvis vi har givet et vektorfelt af første grad, så kan vi altså ”starte” et punkt, en par-
tikel, et vilkårligt sted i rummet og lade den ”flyde” med vektorfeltet sådan at partiklen
befinder sig på en entydigt bestemt flowkurve til enhver tid derefter.

To flowkurver kan ikke skære hinanden, fordi hvis de gjorde det ville der jo
ikke være en entydig flowkurve igennem skæringspunktet.
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 11

Sætningen kan udvides til vektorfelter der ikke nødvendigvis er af første


grad, men så er det ikke længere sikkert, at alle tids-parameterintervallerne
for flowkurverne er hele det dobbeltuendelige interval R =] •, •[ . Inte-
gralkurverne for et vektorfelt af første grad kan findes og vises med Maple og
er eksemplificeret i figurerne 26.5, 26.6, og 26.7.

Hvis vektorfeltet ikke er af første grad er der som sagt ingen garanti for, at
flowkurverne kan bestemmes explicit (heller ikke med Maple), men i visse til-
fælde kan numeriske værktøjer jo alligevel benyttes med succes indenfor de
”vinduer” hvor løsningerne findes og er veldefinerede.

Begrundelsen, beviset, for sætning 26.12 er kendt fra studiet af systemer af lineære
koblede differentialligninger, se eNote 17. Lad os kort repetere de overvejelser, der skal
i sving ved at finde flowkurverne for nogle af de simpleste vektorfelter.

Eksempel 26.13 Flowkurver for et konstant vektorfelt

Det konstante vektorfelt V( x, y, z) = (0, 7, 0) har flowkurver ( x (t), y(t), z(t)) som skal op-
fylde de to betingelser: Begyndelsebetingelsen ( x (0), y(0), z(0)) = ( x0 , y0 , z0 ) og de 3 differ-
entialligninger for x (t), y(t), og z(t), som følger af hastighedsvektor-betingelsen

r0 (t) = ( x 0 (t), y0 (t), z0 (t)) = V( x (t), y(t), z(t)) = (0, 7, 0) . (26-24)

Opgaven er at finde de tre koordinatfunktioner x (t), y(t), og z(t) sådan at

x0 (t) = 0
y0 (t) = 7 (26-25)
0
z (t) = 0 .

De 3 differentialligninger er i dette tilfælde ikke koblede og de løses direkte med de angivne


begyndelsebetingelser med følgende resultat: x (t) = x0 , y(t) = y0 + 7 t, og z(t) = z0 . Dvs.
flowkurverne er (ikke overraskende) alle de rette linjer parallelle med y-aksen, parametriseret
sådan at alle har farten 7.

Eksempel 26.14 Flowkurver for et roterene vektorfelt

Eksemplet med det roterende vektorfelt V( x, y, z) = ( y, x, 1) har tilsvarende flowkurver,


der nu tilfredsstiller betingelserne: ( x (0), y(0), z(0)) = ( x0 , y0 , z0 ) samt differentiallignin-
gerne
r0 (t) = ( x 0 (t), y0 (t), z0 (t)) = ( y(t), x (t), 1) . (26-26)
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 12

Opgaven er altså her at finde de tre koordinatfunktioner x (t), y(t), og z(t) sådan at

x0 (t) = y(t)
y0 (t) = x (t) (26-27)
0
z (t) = 1 .

Differentialligningerne for x (t) og y(t) er koblede lineære differentialligninger med kon-


stante koefficienter og løses præcis som i eNote 12 . Bemærk, at systemmatricen allerede
er fundet i opgave 26.8. Resultatet er x (t) = x0 cos(t) y0 sin(t) , y(t) = x0 sin(t) + y0 cos(t) ,
og z(t) = z0 + t. Disse flowkurver kan findes og inspiceres med Maple. Det fremgår også
deraf at det er ganske rimeligt at kalde vektorfeltet et roterende vektorfelt. Se figur 26.5.

Figure 26.5: Det roterende vektorfelt fra eksempel 26.14, en ”flowkurve” for en enkelt par-
tikel og systemet af flowkurver, som går igennem en terning (den nederste terning flyder langs
flowkurverne med vektorfeltet indtil tiden p.

Opgave 26.15

Lad V( x, y, z) = ( y, x, 0) og benyt Maple til at finde flowkurver og bevægelsen af punkter


i samme terning som i figur 26.5 når tidsintervallet for flowet sættes til T = [0, 2 p ] . Sam-
menlign dernæst med ’virkningen’ af vektorfelterne W( x, y, z) = ( y, x, 0) W( x, y, z) =
( y, 2 x, 0) på terningens punkter i samme tidsinterval. Forklar forskellene på de tre
’virkninger’ af de tre forskellige vektorfelter på terningen.
eNote 26 26.2 FLOWKURVER FOR ET VEKTORFELT 13

Eksempel 26.16 Flowkurver for et eksplosions- hhv. implosions-vektorfelt

Eksplosionsvektorfeltet
V( x, y, z) = ( x, y, z) (26-28)
har flowkurver, der tilfredsstiller en begyndelsesbetingelse

( x (0), y(0), z(0)) = ( x0 , y0 , z0 ) (26-29)

og differentialligningerne

r0 (t) = ( x 0 (t), y0 (t), z0 (t)) = ( x (t), y(t), z(t)) . (26-30)

Vi finder de tre koordinatfunktioner x (t), y(t), og z(t) sådan at

x0 (t) = x (t)
y0 (t) = y(t) (26-31)
0
z (t) = z(t) .

Differentialligningerne for x (t), y(t), og z(t) er her u-koblede lineære differentialligninger,


som let løses en af gangen. Resultatet er

x (t) = x0 exp(t) , y(t) = y0 exp(t) , og z(t) = z0 exp(t) . (26-32)

Bemærk, at hvis ( x (0), y(0), z(0)) = (0, 0, 0) så er ( x (t), y(t), z(t)) = (0, 0, 0) for alle
t 2 [ •, •] . Flowkurven ’igennem’ punktet (0, 0, 0) er derfor ikke nogen egentlig ’kurve’
men består ’kun’ af punktet selv. Bemærk også, at alle andre flowkurver kommer vilkårligt
tæt på punktet (0, 0, 0) for t ! •, idet exp(t) ! 0 for t ! • , men de går ikke igennem
punktet. Hvis vi følger flowkurverne i figur 26.6 tilbage i tid fra t = 0 igennem negative
værdier vil vi derfor se en eksponentielt aftagende implosion af terningen. Hvis vi derimod
følger flowkurverne frem i tid fra t = 0 igennem større og større positive værdier for t vil
vi se en eksponentielt voksende eksplosion af terningen. Flowkurverne kan igen findes og
inspiceres med Maple. Se figur 26.6.

Implosionsvektorfeltet er givet ved

V( x, y, z) = ( x, y, z) (26-33)

med de ”tids-omvendte” løsninger (i forhold til eksplosionsvektorfeltet)

x (t) = x0 exp( t) , y(t) = y0 exp( t) , og z(t) = z0 exp( t) . (26-34)

Se figur 26.7.
eNote 26 26.3 DIVERGENSEN AF ET VEKTORFELT 14

Figure 26.6: Eksplosionsvektorfeltet fra eksempel 26.16 sammen med de integralkurver, som
går igennem en terning. Terningen er vist solid til tiden t = 1 og ”åben” til tiden t = 0. Sam-
menlign med figur 26.7.

Opgave 26.17

Lad V betegne vektorfeltet V( x, y, z) = ( x, 2y, 3z) . Find og vis et passende antal af


flowkurverne for vektorfeltet igennem den kugle der har centrum i (1, 0, 0) og radius 14 .

26.3 Divergensen af et vektorfelt

Med henblik på den geometriske analyse af vektorfelter og deres flowkurve-egenskaber


vil vi her indføre to værktøjer, to begreber, til lokal beskrivelse af generelle glatte vektor-
felter. Beskrivelsen er lokal fordi begge begreberne er udtrykt ved de partielle afledede
af vektorfeltets koordinatfunktioner.
eNote 26 26.3 DIVERGENSEN AF ET VEKTORFELT 15

Figure 26.7: Implosionsvektorfeltet fra eksempel 26.16 sammen med de integralkurver, som går
igennem en terning. Terningen er vist solid til tiden t = 1 og ”åben” til tiden t = 0. Sammenlign
med figur 26.6.

Definition 26.18
Lad V( x, y, z) = (V1 ( x, y, z), V2 ( x, y, z), V3 ( x, y, z) ) være et vektorfelt i rummet.
Divergensen af V i punktet ( x0 , y0 , z0 ) defineres således:

∂V1 ∂V ∂V
Div(V)( x0 , y0 , z0 ) = ( x0 , y0 , z0 ) + 2 ( x0 , y0 , z0 ) + 3 ( x0 , y0 , z0 ) . (26-35)
∂x ∂y ∂z

Hvis V( x, y) = (V1 ( x, y), V2 ( x, y) ) er et plant vektorfelt definerer vi helt tilsvarende:

∂V1 ∂V
Div(V)( x0 , y0 ) = ( x0 , y0 ) + 2 ( x0 , y0 ) . (26-36)
∂x ∂y

Divergensen af et glat vektorfelt i R3 er en glat funktion i R3 .

Læg mærke til, at divergensen af et plant vektorfelt er det samme som diver-
gensen af feltets rumlige udvidelse.
eNote 26 26.3 DIVERGENSEN AF ET VEKTORFELT 16

Eksempel 26.19 Simple divergenser

Ethvert konstant vektorfelt V( x, y, z) = b har divergens Div(V) = 0 .

Eksplosionsvektorfeltet V( x, y, z) = ( x, y, z) har konstant divergens Div(V) = 3 .

Implosionsvektorfeltet V( x, y, z) = ( x, y, z) har divergensen Div(V) = 3.

Det roterende vektorfelt V( x, y, z) = ( y, x, 0) har også konstant divergens: Div(V) = 0 .

Opgave 26.20

Lad V( x, y, z) = ( x + sin(y), z + cos(y), x + y z). Bestem Div(V) i ethvert punkt i rum-


met.

Opgave 26.21

Lad V( x, y, z) være et vektorfelt af første grad med matrix-fremstilling som i ligning (26.1.10).
Vis, at divergensen af V( x, y, z) er konstant lig med sporet af A.

Opgave 26.22

Lad V( x, y, z) = rh( x, y, z) være gradientvektorfeltet for en given funktion h( x, y, z) . Vis,


at divergensen af V( x, y, z) er

∂2 h ∂2 h ∂2 h
Div(rh( x, y, z)) = + 2+ 2 . (26-37)
∂ x2 ∂y ∂z

I anvendelserne af vektoranalysen benyttes meget ofte divergensen af gradienvektor-


felter for givne funktioner, Div(rh( x, y, z)), som derfor gives sin egen betegnelse:
eNote 26 26.4 ROTATIONEN AF ET VEKTORFELT 17

Definition 26.23
Lad h( x, y, z) betegne en glat funktion i R3 . Så skriver vi:

Dh( x, y, z) = Div(rh( x, y, z))


∂2 h ∂2 h ∂2 h (26-38)
= + + 2 .
∂ x 2 ∂ y2 ∂z

Funktionen Dh( x, y, z) kaldes den Laplace-afledede af funktionen h( x, y, z).

Eksempel 26.24 Laplace afledede

Laplace-afledede af nogle elementære funktioner af tre variable:

Funktion r f ( x, y, z) D f ( x, y, z)
f ( x, y, z) = a · x + b · y + c · z ( a, b, c) 0
2 2
f ( x, y, z) = x + y + z 2 (2x, 2y, 2z) 6 (26-39)
f ( x, y, z) = y · sin( x ) (y · cos( x ), sin( x ), 0) y · sin( x )
f ( x, y, z) = ex · cos(z) (ex · cos(z), 0 , ex · sin(z)) 0

Den Laplace afledede af en glat funktion f ( x, y, z) er sporet af 3 ⇥ 3-Hesse-


matricen for f (se eNote 18):

D f ( x, y, z) = spor( H f ( x, y, z)) . (26-40)

26.4 Rotationen af et vektorfelt

Det andet helt centrale begreb og værktøj til analyse af vektorfelter er følgende:
eNote 26 26.4 ROTATIONEN AF ET VEKTORFELT 18

Definition 26.25 Rotation af vektorfelt


Lad V( x, y, z) = (V1 ( x, y, z), V2 ( x, y, z), V3 ( x, y, z) ) være et vektorfelt i rummet.
Rotationen af V i punktet ( x0 , y0 , z0 ) defineres som følgende vektor:

∂V3 ∂V2
Rot(V)( x0 , y0 , z0 ) = ( ( x0 , y0 , z0 ) ( x0 , y0 , z0 ) ,
∂y ∂z
∂V1 ∂V3
( x0 , y0 , z0 ) ( x0 , y0 , z0 ) , (26-41)
∂z ∂x
∂V2 ∂V1
( x0 , y0 , z0 ) ( x0 , y0 , z0 ) ) .
∂x ∂y

Rotationen af et glat vektorfelt i R3 er selv et glat vektorfelt i R3 .

Eksempel 26.26 Rotation af simple vektorfelter

Eksplosionsvektorfeltet V( x, y, z) = ( x, y, z) har konstant rotation Rot(V) = 0 .

Implosionsvektorfeltet V( x, y, z) = ( x, y, z) har (ikke overraskende) også konstant


rotation Rot(V) = 0 .

Det roterende vektorfeltet (som roterer mod uret) V( x, y, z) = ( y, x, 0) har (heldigvis) kon-
stant rotation forskellig fra 0 : Rot(V) = (0, 0, 2) .

Det roterende vektorfeltet (som roterer med uret) V( x, y, z) = (y, x, 0) har (heldigvis) også
konstant rotation som er den modsatte af rotationen mod uret: Rot(V) = (0, 0, 2) .

Opgave 26.27

Lad V( x, y, z) = ( x + sin(y), z + cos(y), x + y z). Bestem Rot(V) i ethvert punkt i rum-


met.
eNote 26 26.5 EN BRO MELLEM DIVERGENS OG ROTATION 19

Opgave 26.28

Lad V( x, y, z) være et vektorfelt af første grad med matrix-fremstilling som i ligning (26.1.10).
Vis, at rotationen af V( x, y, z) er en konstant vektor og udtryk vektoren ved elementerne i A.

26.5 En bro mellem divergens og rotation

Vi nævner her nogle sammenhænge mellem divergens, rotation og gradientvektorfelter:

Sætning 26.29 Divergens versus Rotation


Lad h( x, y, z) betegne en glat funktion i rummet. Så er

Rot(rh) = 0 . (26-42)

Lad V( x, y, z) og W( x, y, z) betegne to vektorfelter i R3 . Så gælder følgende iden-


titet
Div(V ⇥ W) = Rot(V) · W V · Rot(W) . (26-43)
Specielt har vi derfor: Hvis W er et gradient-vektorfelt for en funktion h( x, y, z) i
R3 , dvs. på kort form W = rh , så er

Div(V ⇥ rh) = Rot(V) · rh . (26-44)

Opgave 26.30

Vis ved direkte udregning, at de to ligninger (26.5.42) og (26.5.43) begge er opfyldte.


eNote 26 26.6 FLOW AF KURVER OG FLADER 20

Ud fra de helt simple overvejelser og eksempler vi har været igennem i denne


eNote er det rimeligt at forvente, at divergensen er et mål for hvor meget en
given samling af partikler spredes eller samles når de flyder med vektorfeltet.
Det er netop indholdet af Gauss’ sætning som er så vigtig for anvendelserne
af disse begreber, at den har sin egen eNote26.

Tilsvarende må vi forvente, at den totale rotation af en samling af partikler,


der flyder med vektorfeltet kan udtrykkes ved hjælp af rotationsvektorfeltet
for det given vektorfelt. Det er netop indholdet af Stokes’ sætning, der også –
af samme grund – har sin helt egen eNote27.

26.6 Flow af kurver og flader

Som allerede antydet med figurerne 26.5, 26.6, og 26.7 kan vi lade ethvert geometrisk
veldefineret område, flade, eller kurve flyde med et givet vektorfelt – på den måde at
ethvert punkt på objektet følger den entydige flowkurve for vektorfeltet, der netop går
igennem punktet. Ideen er som sagt at forstå vektorfeltets geometri ved at observere
hvordan det ’flyder rundt med’ og deformerer geometriske objekter. Se også figurerne
26.8 og 26.9.

Figure 26.8: Et linjestykke flyder med flowkurverne for vektorfeltet V( x, y, z) = ( y, x, 0.3).


eNote 26 26.6 FLOW AF KURVER OG FLADER 21

Figure 26.9: Et kvadrat flyder med flowkurverne for vektorfeltet V( x, y, z) = ( y +


( x/9), z + (y/9), x + (z/9)).

26.6.1 Flow af niveaukurver og niveauflader

Gradientvektorfelterne for funktioner af to og tre variable deformerer også kurver og


flader via de respektive flowkurver. Man kunne nu forledes til at tænke, at niveaukurver
og niveauflader nok flyder over i andre niveaukurver og niveauflader ved gradientvek-
torflowet. Så simpelt er det ikke – men næsten.

Ved nærmere eftertanke vil man indse, at det heller ikke kan være rigtigt at
gradientvektorfeltet generelt skulle flyde niveaumængder i niveaumængder.
Hvis f.eks. to nabo-niveaukurver i figur 26.1.2 ligger tæt på hinanden, så er
gradientvektoren tilsvarende stor og omvendt hvis to nabo-niveaukurver lig-
ger længere fra hinanden, så er gradientvektoren tilsvarende mindre. Dvs. der
hvor gradienvektorerne er store skal vi flyde langsomt og der for de er små
skal vi flyde hurtigt for at niveaukurverne kan flyde over i hinanden.
eNote 26 26.6 FLOW AF KURVER OG FLADER 22

Sætning 26.31 Niveau-mængde flow


Lad f ( x, y, z) betegne en glat funktion af tre variable med et egentligt gradientvek-
torfelt r f ( x, y, z) 6= 0. Lad V( x, y, z) være det kvadratisk normerede gradientvek-
torfelt:
r f ( x, y, z)
V( x, y, z) = . (26-45)
| r f ( x, y, z) |2
Hvis vi lader ethvert punkt p på niveaufladen Kc ( f ) flyde tiden t0 med den
flowkurve for V( x, y, z) som starter i p, så vil hele niveaufladen flyde over i
niveaufladen Kc+t0 ( f ).

Et tilsvarende resultat gælder for gradientvektorfelter for glatte funktioner f ( x, y) af


to variable og deres tilhørende niveaukurver i planen.

Bevis

Vi skal bare vise, at hvis vi starter (til tiden t = 0) i et punkt p hvor f ( p) = c så lander vi
med flowkurven r(t) for vektorfeltet V( x, y, z) efter tiden t0 i et punkt r(t0 ) hvor f ( x, y, z)
har værdien f (r(t0 )) = c + t0 .

Vi bruger kædereglen for tilvæksten af funktionsværdier langs en flowkurve, se eNote 15:


d
f (r(t)) = r f (r(t)) · r0 (t) , (26-46)
dt
og da r(t) er en flowkurve for V( x, y, z) ved vi, at r0 (t) = V(r(t)) som indsat i (26.6.46) giver:

d
f (r(t)) = r f (r(t)) · V(r(t))
dt
r f (r(t))
= r f (r(t)) ·
| r f (r(t)) |2 (26-47)
r f (r(t)) · r f (r(t))
=
| r f (r(t)) |2
=1 .
Heraf fås det ønskede direkte:
Z t0
d
f (r(t0 )) = c + f (r(t)) dt
0 dt
Z t0
(26-48)
= c+ 1 dt
0
= c + t0 .
eNote 26 26.6 FLOW AF KURVER OG FLADER 23


eNote 26 26.7 OPSUMMERING 24

26.7 Opsummering

Vi har i denne eNote etableret de første begreber og metoder til analyse af vektorfelter i
plan og rum.

• Nogle men ikke alle vektorfelter fremkommer som gradientvektorfelter for funk-
tioner f ( x, y, z) (her af tre variable):
⇣ ⌘
r f ( x, y, z) = f x0 ( x, y, z) , f y0 ( x, y, z) , f z0 ( x, y, z) , ( x, y, z) 2 R3 . (26-49)

• Ethvert vektorfelt V( x, y, z) af første grad kan skrives og angives ved hjælp af en


systemmatrix A og en konstant vektor b:
2 3 2 3 2 3 2 3
V1 ( x, y, z) a11 a12 a13 x b1
4 V2 ( x, y, z) 5 = 4 a21 a22 a23 5 · 4 y 5 + 4 b2 5 . (26-50)
V3 ( x, y, z) a31 a32 a33 z b3

• For at forstå geometrien af et givet vektorfelt er det vigtigt at kunne bestemme vek-
torfeltets flow-kurver – det er de parametriserede kurver r(t) = ( x (t), y(t), z(t)),
t 2 [ a, b], som i alle kurve-punkter har det givne vektorfelt som tangentvektor.
Hvis vektorfeltet er givet ved V( x, y, z) = (V1 ( x, y, z), V2 ( x, y, z), V3 ( x, y, z)), så er
flowkurve-ligningen:
2 0 3 2 3
x (t) V1 ( x (t), y(t), z(t))
4 y0 (t) 5 = (V( x (t), y(t), z(t)))> = 4 V2 ( x (t), y(t), z(t)) 5 . (26-51)
0
z (t) V3 ( x (t), y(t), z(t))

• Divergensen af et vektorfelt V( x, y, z) har vi defineret som den funktion, der i et


vilkårligt punkt ( x0 , y0 , z0 ) har værdien:
∂V1 ∂V ∂V
Div(V)( x0 , y0 , z0 ) = ( x0 , y0 , z0 ) + 2 ( x0 , y0 , z0 ) + 3 ( x0 , y0 , z0 ) , (26-52)
∂x ∂y ∂z
og vi har antydet med meget simple eksempler, at divergensen er et lokalt mål
for hvor meget vektorfeltet spreder eller samler en given mængde af partikler, der
flyder med vektorfeltet, dvs. følger vektorfeltets flowkurver.
• Rotationen af et vektorfelt har vi defineret som følgende vektorfelt
∂V3 ∂V2
Rot(V)( x0 , y0 , z0 ) = ( ( x0 , y0 , z0 ) ( x0 , y0 , z0 ) ,
∂y ∂z
∂V1 ∂V3
( x0 , y0 , z0 ) ( x0 , y0 , z0 ) , (26-53)
∂z ∂x
∂V2 ∂V1
( x0 , y0 , z0 ) ( x0 , y0 , z0 ) ) ,
∂x ∂y
eNote 26 26.7 OPSUMMERING 25

og vi har antydet med meget simple eksempler, at rotationen er et lokalt mål for
hvor meget vektorfeltet roterer en given mængde af partikler, der flyder med vek-
torfeltet dvs. følger vektorfeltets flowkurver.
eNote 27 1

eNote 27

Vektorfelter langs kurver

I eNote 26 dyrkes de indledende overvejelser om vektorfelter. I denne eNote vil vi se på


vektorfelternes værdier langs kurver og benytte metoder fra eNote 24 om kurveintegration til at
opstille de såkaldte tangentielle kurveintegraler og bruge dem til at undersøge om et givet
vektorfelt er et gradientvektorfelt eller ej. Hvis et vektorfelt er et gradientvektorfelt for en
funktion f ( x, y, z) så kan vi konstruere alle sådanne stamfunktioner ved hjælp af tangentiel
kurveintegration af vektorfeltet. Og som vi skal se, gælder det også omvendt, at hvis det
tangentielle kurveintegral af et givet vektorfeltet over enhver lukket kurve er 0, så er vektorfeltet
et gradientvektorfelt. Det tangentielle kurveintegral af et vektorfelt over en lukket kurve kaldes
cirkulationen af vektorfeltet over kurven. Alene ud fra navnet er det ikke overraskende, at en
sådan generel cirkulation 0 er ækvivalent med, at vektorfeltet selv har rotationsvektorfeltet 0.

Version 20.10.16. Karsten Schmidt.

27.1 Det tangentielle kurveintegral

Lad V( x, y, z) være et glat vektorfelt i rummet, se eNote 26 og lad Kr betegne en glat


parametriseret kurve:

Kr : r(u) = ( x (u), y(u), z(u)) , u 2 [ a, b] . (27-1)

Langs med kurven Kr har vi så – i ethvert punkt r(u) på kurven – to vektorer, dels
vektorfeltets værdi i punktet, V(r(u)), og dels tangentvektoren r0 (u) til kurven i punk-
tet. Ved hjælp af disse to vektorer kan vi konstruere en glat funktion på kurven, som
derefter kan integreres over kurven:
eNote 27 27.1 DET TANGENTIELLE KURVEINTEGRAL 2

Det tangentielle kurveintegral af V( x, y, z) langs en given parametriseret kurve Kr er kurve-


integralet af længden af projektionen (med fortegn) af V(r(u)) på kurvens tangent der er
repræsenteret ved r0 (u).

Det ønskede integral er altså defineret således:

Definition 27.1
Det tangentielle kurveintegral af V( x, y, z) langs Kr er defineret ved:
Z
Tan(V, Kr ) = V · e dµ . (27-2)
Kr

Integranden er altså i dette tilfælde givet ved skalarproduktet:


f (r(u)) = V(r(u)) · e(u) , (27-3)
hvor e(u) er defineret ved
(
r0 (u)/kr0 (u)k hvis r0 ( u ) 6 = 0
e( u ) = (27-4)
0 hvis r0 ( u ) = 0 .
Bemærk, at så har vi for alle u:
e(u) kr0 (u)k = r0 (u) . (27-5)

Det tangentielle kurveintegral Tan(V, Kr ) af V langs Kr er derfor relativt simpelt at


udregne - vi behøver faktisk ikke først at finde Jacobi-funktionen Jacobir (u) , altså læng-
den af r0 (u) : Z
Tan(V, Kr ) = V · e dµ
Kr
Z b
= (V(r(u)) · e(u)) Jacobir (u) du
a
Z b (27-6)
0
= V(r(u)) · e(u) kr (u)k du
a
Z b
= V(r(u)) · r0 (u) du .
a

Vi har altså følgende simple udtryk for tangentielle kurveintegraler:


eNote 27 27.1 DET TANGENTIELLE KURVEINTEGRAL 3

Sætning 27.2
Det tangentielle kurveintegral af V( x, y, z) langs Kr kan beregnes således:
Z Z b
Tan(V, Kr ) = V · e dµ = V(r(u)) · r0 (u) du . (27-7)
Kr a

Læg mærke til, at den sidste integrand i (27.1.6equation.27.1.7) er kontinuert


når V( x, y, z) og r0 (u) er kontinuerte selv om det ikke umiddelbart fremgår af
definitionen (vektorfeltet e(u) er jo ikke nødvendigvis kontinuert - medmindre
r(u) er en regulær parameterfremstilling).

Hvis kurven gennemløbes baglæns, så skifter Tan(V, Kr ) fortegn.

Lad nemlig

Kr : r( u ) = r( b + a u) , u 2 [ a, b] . (27-8)

Så er r0 (u) = r0 (u) og e(u) = e(u) sådan at

Tan(V, Kr ) = Tan(V, Kr ) . (27-9)

Definition 27.3
I analogi med det tangentielle kurveintegral definerer vi det ortogonale kurveintegral
Ort(V, Kr ) af V langs Kr ved at projicere V(r(u)) vinkelret ind på den plan i rummet,
som selv står vinkelret på r0 (u) og dernæst finde kurveintegralet af længden af den
projektion (som funktion af u).

Eksempel 27.4

Lad V( x, y, z) = (0, z, y) . Vi ønsker at bestemme det tangentielle kurveintegral af V langs


følgende parametriserede stykke af en skruelinje
h pi
Kr : r(u) = (cos(u), sin(u), u) , u 2 0, . (27-10)
2
eNote 27 27.1 DET TANGENTIELLE KURVEINTEGRAL 4

1
Figure 27.1: Skruelinjen r(u) = cos(u), sin(u), 10 u , u 2 [ 2p, 2p ] , og vektorfeltet
V( x, y, z) = ( x, ( x + y), 2z) er her antydet – dels i rummet og dels langs skruelinjen.

Ved at indsætte i (27.1.6equation.27.1.7) fås


Z p/2
Tan(V, Kr ) = V(r(u)) · r0 (u) du
0
Z p/2
= (0, u, sin(u)) · ( sin(u), cos(u), 1) du
0
Z p/2 (27-11)
= (u cos(u) + sin(u)) du
0
p
= [u sin(u)]0p/2 = .
2

Opgave 27.5

Lad V( x, y, z) = (0, x, z) . Bestem både det tangentielle og det ortogonale kurveintegral af V


langs følgende parametriserede stykke af en cirkel
h pi
Kr : r(u) = (cos(u), sin(u), 0) , u 2 0, . (27-12)
2
eNote 27 27.1 DET TANGENTIELLE KURVEINTEGRAL 5

Metode 27.6 Tangentielle linjeintegraler til variabel punkt


Lad V( x, y, z) være et givet vektorfelt i rummet. Vi vil nu konstruere en funktion
F ⇤ ( x, y, z) i rummet som i punktet ( x0 , y0 , z0 ) er defineret til at være kurveintegralet
af V( x, y, z) langs det rette linjestykke fra (0, 0, 0) til punktet ( x0 , y0 , z0 ), dvs. F ⇤
defineres således:
F ⇤ ( x0 , y0 , z0 ) = Tan(V, Kr ) , (27-13)
hvor kurven er givet ved den simplest mulige kurve fra (0, 0, 0) til ( x0 , y0 , z0 ):

Kr : r(u) = (u · x0 , u · y0 , u · z0 ) = u · ( x0 , y0 , z0 ) , u 2 [0, 1] . (27-14)

Så har vi dermed følgende funktionsværdier for (stjerne-)funktionen hørende til


V( x, y, z):

F ⇤ ( x0 , y0 , z0 ) = Tan(V, Kr )
Z 1
= V(r(u)) · r0 (u) du (27-15)
0
Z 1
= ( x0 , y0 , z0 ) · V(u · x0 , u · y0 , u · z0 ) du .
0

Det sidste integral i (27.1.15) skal forstås som et integral af hver af de tre koordi-
natfunktioner af V(u · x0 , u · y0 , u · z0 ). Integralet giver dermed en vektor med tre
komposanter sådan at skalarproduktet med stedvektoren ( x0 , y0 , z0 ) derefter giver
en talværdi, som altså er værdien af ⇤-funktionen F ⇤ ( x, y, z) i ( x0 , y0 , z0 ).

Eksempel 27.7 Konstruktion af tangentiel linjeintegral til variable punkt

Lad V( x, y, z) betegne følgende vektorfelt i rummet:


V( x, y, z) = ( x, 2y, 3z) . (27-16)
Så er den tilhørende ⇤-funktion:
Z 1

F ( x0 , y0 , z0 ) = ( x0 , y0 , z0 ) · V(u · x0 , u · y0 , u · z0 ) du
0
Z 1
= ( x0 , y0 , z0 ) · (u · x0 , 2u · y0 , 3u · z0 ) du
0
1 (27-17)
= · ( x0 , y0 , z0 ) · ( x0 , 2 · y0 , 3 · z0 )
2
1
= · x02 + 2 · y20 + 3 · z20
2
1 3
= · x02 + y20 + · z20 .
2 2
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 6

Bemærk, at (stjerne-)funktionen

1 2 3
F ⇤ ( x, y, z) = · x + y2 + · x 2
2 2
som er konstrueret i eksempel 27.7 har følgende gradient, som netop er det
vektorfelt vi begyndte med:

r F ⇤ ( x, y, z) = ( x, 2y, 3z) = V( x, y, z) . (27-18)

Det er ikke nogen tilfældighed! Vektorfeltet har rotationsvektorfelt Rot = 0,


og er derfor et gradientvektorfelt, som vi skal se i sætning 27.14 nedenfor.

27.2 Stamfunktion til et gradientvektorfelt

Definition 27.8 Stamfunktion for et gradientvektorfelt


Lad V( x, y, z) være et glat vektorfelt i rummet. Hvis der findes en glat funktion
f ( x, y, z) således at
r f ( x, y, z) = V( x, y, z) , (27-19)
så siges f ( x, y, z) at være en stamfunktion til vektorfeltet V( x, y, z).

Hvis vi kender én stamfunktion, så kender vi enhver af dem – på nær en arbi-


trær konstant! Som vi skal se giver metode 27.6 en konstruktion af alle stam-
funktioner til et givet vektorfelt. Hvis der ikke findes nogen stamfunktion til
vektorfeltet, så får vi ikke desto mindre alligevel med den metode konstrueret
en ⇤-funktion i rummet – den funktion er imidlertid i så fald ikke nogen stam-
funktion. Det kan og bør selvfølgelig afgøres ved at gøre prøve, altså ved direkte
at beregne gradienten af ⇤-funktionen og sammenligne med det givne vektor-
felt.
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 7

Opgave 27.9

Lad V( x, y, z) betegne vektorfeltet:

V( x, y, z) = ( x, 2y, 3z) . (27-20)

bestem funktionsværdierne for (stjerne-)funktionen Fp⇤ ( x, y, z) ud fra det generelle punkt


p = ( a, b, c) hørende til V( x, y, z).

Vink: Det rette linjestykke fra punktet ( a, b, c) til ( x0 , y0 , z0 ) kan parametriseres således:

Kr : r ( u ) = ( a + u · ( x 0 a ), b + u · ( y0 b ), c + u · ( z0 c)) , u 2 [0, 1] . (27-21)

således at
r0 ( u ) = ( x 0 a ), y0 b, z0 c) . (27-22)
Gælder det stadig, at
r Fp⇤ ( x, y, z) = V( x, y, z) ? (27-23)

Sætning 27.10 Tangentielt kurveintegral af et gradientvektorfelt


Lad f ( x, y, z) betegne en glat funktion af de tre variable i rummet, og lad
V( x, y, z) = r f ( x, y, z) betegne gradientvektorfeltet for f ( x, y, z). Lad Kr være en
glat parametriseret kurve fra et punkt p til et punkt q i rummet. Kurven behøver
ikke nødvendigvis at være retlinjet.
Så gælder følgende: Det tangentielle kurveintegral af r f ( x, y, z) langs Kr afhænger
kun af p og q og er uafhængig af kurven:

Tan(V, Kr ) = f (q) f ( p) . (27-24)

Bevis

Vi bruger kædereglen fra eNote 19 på den sammensatte funktion h(u) = f (r(u)) hvor r(u),
u 2 ]u0 , u1 [, er en vilkårlig differentiabel kurve fra p = ( x0 , y0 , z0 ) = r(u0 ) til q = ( x1 , y1 , z1 ) =
r(u1 ) og får derved:
h0 (u) = r0 (u) · r f (r(u)) . (27-25)
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 8

Heraf følger, at h(u) er en stamfunktion til funktionen på højresiden af ovenstående ligning:


Z u1
h ( u1 ) h ( u0 ) = r0 (u) · r f (r(u)) du . (27-26)
u0

Men da
h(u0 ) = f (r(u0 )) = f ( p) ,
(27-27)
h(u1 ) = f (r(u1 )) = f (q) ,
får vi dermed Z u1
f (q) = f ( p) + r0 (u) · r f (r(u)) du
u0 (27-28)
= f ( p) + Tan(V, Kr ) ,
og det var det vi skulle vise.

Hvis kurven er lukket – gerne sammensat af et endeligt antal glatte kurver som
f.eks i en polygon med retlinede kanter – får vi at det tangentielle kurveintegral
af et gradientvektorfelt over den lukkede kurve er 0.

Definition 27.11 Cirkulationen af et vektorfelt langs en lukket kurve


Lad Kr betegne en lukket kurve i rummet (som gerne kan være sammensat af et
endeligt antal glatte kurver). Lad V( x, y, z) være et glat vektorfelt i rummet. Så
kalder vi det tangentielle kurveintegral af V( x, y, z) over Kr cirkulationen af V( x, y, z)
over Kr og skriver:
Cirk(V, Kr ) = Tan(V, Kr ) . (27-29)

Betegnelsen cirkulation er helt rimelig. Hvis vektorfeltet er et gradientvektor-


felt ved vi, at rotationen er 0 overalt, se eNote 26, og det stemmer med, at
cirkulationen i disse tilfælde også er 0 for enhver lukket kurve.

Vi har allerede nu indset den ene halvdel af følgende sætning – den anden (lidt vanske-
ligere) halvdel er bevist nedenfor:
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 9

Figure 27.2: Den lukkede kurve r(u) = (cos(t), sin(t), cos(2 · t)) , u 2 [ p, p ] og gradient-
vektorfeltet V( x, y, z) = ( x, y, z) = r f ( x, y, z) for f ( x, y, z) = ( x2 + y2 + z2 )/2 er her antydet
– dels i rummet og dels langs kurven.

Sætning 27.12 Cirkulationssætningen


Et glat vektorfelt V( x, y, z) i rummet er et gradientvektorfelt hvis og kun hvis der
gælder:
Cirk(V, Kr ) = 0 (27-30)
for alle lukkede kurver Kr .

En stamfunktion kan konstrueres ved linjeintegralmetoden 27.6.

Bevis

Som nævnt ved vi allerede, at hvis V( x, y, z) er et gradientvektorfelt, så er cirkulationen 0 for


enhver lukket kurve. Den anden vej handler altså om at antage, at alle lukkede kurver giver
cirkulation 0 og derudfra slutte, at så er det pågældende vektorfelt et gradientvektorfelt. Vi
vil derfor konstruere en funktion F ( x, y, z) hvis gradientvektorfelt er det givne vektorfelt.
Der er i ovenstående fremstilling stort set kun én kandidat, der eventuelt ville kunne bruges
som en sådan funktion, nemlig ⇤-funktionen F ⇤ ( x, y, z) hørende til V( x, y, z):
Z 1
F ⇤ ( x, y, z) = ( x, y, z) · V(u · x, u · y, u · z) du . (27-31)
0

Da cirkulationen er 0 langs enhver lukket kurve ved vi, at denne funktion ikke afhænger af
integrationsvejen: Det tangentielle kurveintegral af V( x, y, z) langs enhver anden kurve fra
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 10

(0, 0, 0) til ( x, y, z) vil give samme værdi som F ⇤ ( x, y, z).

Vi vil vise, at gradienten af F ⇤ ( x, y, z) i punktet ( x0 , y0 , x0 ) er V( x0 , y0 , z0 ), så vi ser på

F ⇤ ( x, y, z) = F ⇤ ( x0 , y0 , z0 ) + Tan(V, Kr ) , (27-32)

hvor Kr er en vilkårlig glat kurve fra (udviklings-)punktet ( x0 , y0 , z0 ) til et vilkårligt andet


punkt ( x, y, z). Vi vælger igen det rette linjestykke mellem de to punkter:

Kr : r(u) = ( x0 , y0 , z0 ) + u · (( x, y, z) ( x0 , y0 , z0 )) , u 2 [0, 1] , (27-33)

og får så:
Z 1
Tan(V, Kr ) = ( x x0 , y y0 , z z0 ) · V(r(u)) du (27-34)
0
Det første bidrag til dette skalarprodukt er
Z 1
(x x0 ) · V1 (r(u)) du . (27-35)
0

Vi vil nu benytte den observation (se opgave 27.13), at der for enhver glat funktion g(u) på
[0, 1] gælder, at der findes en værdi x imellem 0 og 1 således at
Z 1
g(u) du = g(x ) . (27-36)
0

Ved at bruge den integral-middelværdisætning får vi til indsættelse i (27.2.35):


Z 1
(x x0 ) · V1 (r(u)) du = ( x x0 )V1 (r(x 1 ))
0 (27-37)
= (x x0 ) · (V1 ( x0 , y0 , z0 ) + # 1 ( x x0 , y y0 , z z0 )) ,

idet V1 ( x, y, z) ! V1 ( x0 , y0 , z0 ) for ( x, y, z) ! ( x0 , y0 , z0 ).

Tilsvarende fås for de to andre bidrag til skalarproduktet i (27.2.34), således at vi samlet har:

Tan(V, Kr ) = ( x x0 , y y0 , z z0 ) · (V( x0 , y0 , z0 ) + # ( x x0 , y y0 , z z0 ))
= (x x0 , y y0 , z z0 ) · V( x0 , y0 , z0 ) (27-38)
+ r(x0 ,y0 ,z0 ) ( x, y, z) · #( x x0 , y y0 , z z0 )

Vi indsætter til sidst i (27.2.32) og får følgende ligning

F ⇤ ( x, y, z) = F ⇤ ( x0 , y0 , z0 ) + Tan(V, Kr )
= F ⇤ ( x0 , y0 , z0 ) + ( x x0 , y y0 , z z0 ) · V( x0 , y0 , z0 ) (27-39)
+ r(x0 ,y0 ,z0 ) ( x, y, z) · #( x x0 , y y0 , z z0 ) .
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 11

Gradienten af (stjerne-)funktionen F ⇤ ( x, y, z) i ( x0 , y0 , z0 ) kan derefter aflæses ved direkte


inspektion – det er jo ”faktoren” på ( x x0 , y y0 , z z0 ) før epsilon-leddet:

r F ⇤ ( x0 , y0 , z0 ) = V( x0 , y0 , z0 ) , (27-40)

hvilket netop betyder, at V( x, y, z) er et gradientvektorfelt (med F ⇤ ( x, y, z) som stamfunk-


tion), og det var det vi skulle vise.

Opgave 27.13

Overvej – og indse – den påstand vi har brugt i beviset for sætning 27.12:
For enhver glat funktion g(u) på [0, 1] gælder, at der findes en værdi x imellem 0 og 1 således
at Z 1
g(u) du = g(x ) . (27-41)
0

I analogi med cirkulationssætningen 27.12 har vi ligeledes en to-vejs kobling mellem


gradientvektorfelt-egenskaben og rotation 0:

Sætning 27.14 Stamfunktions-sætningen


Et glat vektorfelt V( x, y, z) i rummet er et gradientvektorfelt hvis og kun hvis der
gælder:
Rot(V)( x, y, z) = (0, 0, 0) . (27-42)
En stamfunktion til vektorfeltet V( x, y, z) kan konstrueres ved linjeintegralmetoden
27.6.

Bevis

Vi nøjes med at se på den ene (lette) vej – rotationen af et gradientvektorfelt er 0. Se også den
påstand i sætning 26.29 i eNote 26. Lad altså f ( x, y, z) være en glat funktion i rummet. Så er
⇣ ⌘
r f ( x, y, z) = f x0 ( x, y, z), f y0 ( x, y, z), f z0 ( x, y, z) . (27-43)
eNote 27 27.2 STAMFUNKTION TIL ET GRADIENTVEKTORFELT 12

Idet vi nøjes med at fokusere på første koordinat i rotationsvektoren får vi heraf:


✓ ◆
∂ 0 ∂ 0
Rot(r f )( x, y, z) = f ( x, y, z) f ( x, y, z), ⇤, ⇤
∂y z ∂z y
⇣ ⌘
00 00 (27-44)
= f zy ( x, y, z) f yz ( x, y, z), ⇤, ⇤
= (0, ⇤, ⇤) ,

og tilsvarende 0 for de to andre koordinater.

Eksempel 27.15 Tangentielt kurveintegral af et ikke-gradientvektorfelt

Lad V( x, y, z) = ( y, x, 0). Så er V( x, y, z) ikke et gradientvektorfelt idet Rot(V)( x, y, z) =


(0, 0, 2) 6= (0, 0, 0), se også eksempel 26.3 i eNote 26.

Hvis vi vælger den lukkede kurve:


Kr : r(u) = (cos(u), sin(u), 0) , u 2 [ p, p ] , (27-45)
får vi i overensstemmelse med cirkulationssætningen en cirkulation, der ikke er 0:
Z p
Tan(V, Kr ) = ( sin(u), cos(u), 0) · ( sin(u), cos(u), 0) du
p
Z p
= sin2 (u) + cos2 (u) du
Z
p (27-46)
p
= 1 du
p
= 2·p .

Hvis vi konstruerer ⇤-funktionen hørende til V( x, y, z) = ( y, x, 0) får vi en veldefineret


funktion i rummet:
Z 1

F ( x, y, z) = ( x, y, z) · V(u · x, u · y, u · z) du
0
Z 1
= ( x, y, z) · ( u · y, u · x, 0) du
0 (27-47)
1
= · (( x, y, z) · ( y, x, 0))
2
=0 ,
og det er klart ikke en stamfunktion til V( x, y, z), hvilket er i fuld overensstemmelse med
stamfunktionssætningen.
eNote 27 27.3 OPSUMMERING 13

27.3 Opsummering

Vi har defineret det tangentielle kurveintegral for glatte vektorfelter langs glatte pa-
rametriserede kurver og vist, hvordan de tangentielle kurveintegraler kan benyttes til
at konstruere stamfunktioner til et vektorfelt V( x, y, z) – hvis ellers vektorfeltet er et
gradientvektorfelt.

• Det tangentielle kurveintegral af V( x, y, z) langs den parametriserede kurve Kr


kan beregnes således:
Z b
Tan(V, Kr ) = V(r(u)) · r0 (u) du . (27-48)
a

Hvis kurven Kr er lukket, så betegnes kurven med Kr , det tangentielle kurveinte-


gral kaldes i så fald cirkulationen af vektorfeltet langs den lukkede kurve, og vi
skriver
Cirk(V, Kr ) = Tan(V, Kr ) . (27-49)

• Stamfunktionssætningen giver en nødvendig og tilstrækkelig betingelse for at et


givet vektorfelt er et gradientvektorfelt:

V( x, y, z) er et gradientvektorfelt hvis og kun hvis Rot(V)( x, y, z) = (0, 0, 0).

• Cirkulationssætningen udtrykker en tilsvarende nødvendig og tilstrækkelig betingelse


for gradientfelt-egenskaben udtrykt ved cirkluationen af vektorfeltet langs lukkede
kurver:

V( x, y, z) er et gradientvektorfelt hvis og kun hvis Cirk(V, Kr ) = 0 for alle lukkede


kurver Kr .

• Stjerne-funktionen F ⇤ ( x, y, z) hørende til et gradientvektorfelt V( x, y, z) er en stam-


funktion til V( x, y, z). Funktionen beregnes som det tangentielle linjeintegral fra
(0, 0, 0) til punktet ( x, y, z) således:

F ⇤ ( x, y, z) = Tan(V, Kr )
Z 1
= V(r(u)) · r0 (u) du (27-50)
0
Z 1
= ( x, y, z) · V(u · x, u · y, u · z) du .
0
eNote 28 1

eNote 28

Gauss’ divergenssætning

I denne eNote bruger vi flowkurver for vektorfelter til at undersøge hvordan overfladen af et
rumligt område deformeres ved flowet og dermed afspejler en tilsvarende ændring i rumfanget
af det område, der begrænses af overfladen. Vi får derfor brug for at kende til analysen af
vektorfelter fra eNote 26 samt flade- og rum-integraler fra eNote 25. Vi skal se, at divergensen
af vektorfeltet er den lokale ’motor’ for volumenændring. Hvis vi derfor integrerer divergensen
over hele det rumlige område så får vi den totale øjeblikkelige volumen-ekspansion (med
fortegn). Hvis vektorfeltet er overalt eksploderende (med positiv divergens) så vokser rumfanget
af ethvert rumligt område, hvis vektorfeltet er imploderende alle steder (med negativ divergens)
så aftager rumfanget af ethvert rumligt område, der flyder med flowkurverne for vektorfeltet.
Alternativt kan man holde øje med om overfladen af et rumligt område er lokalt ekspanderende
udad eller lokalt sammentrækkende indad i forhold til det rumlige område. Det gør vi præcis
med det ortogonale fladeintegral af vektorfeltet over overfladen – et integral som også kaldes
fluxen.
Dermed har vi to muligheder for at beregne ekspansion eller sammentrækning af et givet
rumligt område når det flyder langs flowkurverne for vektorfeltet. Og de giver præcis det
samme resultat – det er indholdet af Gauss’ divergenssætning.

28.1 Det ortogonale fladeintegral, fluxen

Lad V( x, y, z) være et glat vektorfelt i rummet, se eNote 26 og lad Fr betegne en glat


parametriseret flade:

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) , (u, v) 2 [ a, b] ⇥ [c, d] . (28-1)
eNote 28 28.1 DET ORTOGONALE FLADEINTEGRAL, FLUXEN 2

Ligesom ved konstruktionen af kurveintegralerne i eNote 24 har vi så i ethvert punkt


på fladen to veldefinerede vektorer, dels vektorfeltets værdi i punktet, V(r(u, v)), og
dels normalvektoren r0u (u, v) ⇥ r0v (u, v) til fladen i punktet. Det er ved hjælp af disse to
vektorer vi vil konstruere fluxen af vektorfeltet igennem fladen.

Det ortogonale fladeintegral af V( x, y, z) langs en given parametriseret flade Fr – også


kaldet fluxen af V( x, y, z) igennem Fr – er fladeintegralet af projektionen (med fortegn)
af V(r(u, v)) på fladens normal repræsenteret ved den standard enhedsvektor nF der
er proportional med og i samme retning som krydsproduktet NF (u, v) = r0u (u, v) ⇥
r0v (u, v).

Definition 28.1 Fluxen af et vektorfelt


Det ortogonale fladeintegral af vektorfeltet V( x, y, z) langs en parametriseret flade
Fr , dvs. fluxen af vektorfeltet igennem fladen, er defineret ved
Z
Flux(V, Fr ) = V · nF dµ . (28-2)
Fr

Integranden i det fladeintegral, der giver fluxen, er altså givet ved skalarproduktet

f (r(u, v)) = V(r(u, v)) · nF (u, v) , (28-3)

hvor nF (u, v) er defineret ved


(
r0u (u, v) ⇥ r0v (u, v)/kr0u (u, v) ⇥ r0v (u, v)k hvis r0u (u, v) ⇥ r0v (u, v) 6= 0
nF (u, v) =
0 hvis r0u (u, v) ⇥ r0v (u, v) = 0
(28-4)
Fluxen af V( x, y, z) gennem Fr i retningen nF er derfor relativt simpel at udregne - vi
behøver ikke først at finde længden af r0u (u, v) ⇥ r0v (u, v) (jævnfør omformningen af det
eNote 28 28.1 DET ORTOGONALE FLADEINTEGRAL, FLUXEN 3

tangentielle kurveintegral):
Z
Flux(V, Fr ) = V · nF dµ
Fr
Z dZ b
= (V(r(u, v)) · nF (u, v)) Jacobir (u, v) du dv
c a
Z dZ b
= (V(r(u, v)) · nF (u, v)) kr0u (u, v) ⇥ r0v (u, v)k du dv (28-5)
c a
Z dZ b
= V(r(u, v)) · (r0u (u, v) ⇥ r0v (u, v)) du dv
c a
Z dZ b
= V(r(u, v)) · NF (u, v) du dv .
c a

Bemærk, at den sidste integrand i (28.1.5) er kontinuert og dermed integrabel,


selv om det ikke umiddelbart fremgår af definitionen, idet vektorfeltet nF (u, v)
ikke nødvendigvis er kontinuert - medmindre r(u, v) er en regulær parameter-
fremstilling.

Vi har dermed et simpelt direkte udtryk for flux-beregninger:

Sætning 28.2 Fluxen, det ortogonale fladeintegral


Det ortogonale fladeintegral af V( x, y, z) over fladen Fr , altså fluxen af V( x, y, z)
igennem Fr , beregnes således:
Z dZ b
Flux(V, Fr ) = V(r(u, v)) · (r0u (u, v) ⇥ r0v (u, v)) du dv
c a
Z dZ b (28-6)
= V(r(u, v)) · NF (u, v) du dv .
c a

Læg mærke til, at hvis en flade Fr parametriseres med en anden parametriser-


ing Fbbr som giver den modsat rettede standard enhedsnormalvektor nFb i ethvert
punkt på fladen: nFb(ub, vb) = nF (u, v), hvor r(u, v) = br(ub, vb), så skifter fluxen
fortegn:
Flux(V, Fbbr ) = Flux(V, Fr ) . (28-7)
eNote 28 28.1 DET ORTOGONALE FLADEINTEGRAL, FLUXEN 4

Det ortogonale kurveintegral er kort indført som et dualt begreb i forhold til
det mere naturlige tangentielle kurveintegral i eNote 25. Det duale begreb i
forhold til det ovenfor indførte naturlige ortogonale fladeintegral er det tan-
gentielle fladeintegral af et givet vektorfelt over en given flade.

Definition 28.3 Det tangentielle fladeintegral


I analogi med det ortogonale fladeintegral, fluxen, definerer vi det tangentielle
fladeintegral, som vi vil kalde Tan(V, Fr ) af V over fladen Fr , ved at projicere
V(r(u, v)) vinkelret ind på tangentplanen til Fr (udspændt af r0u (u, v) og r0v (u, v)
i punktet r(u, v)) og dernæst finde fladeintegralet af længden af denne projektion
(som funktion af (u, v)).

Figure 28.1: Denne kalot af en kugleflade er givet ved parameterfremstillingen r(u, v) =


(sin(u) cos(v), sin(u) sin(v), cos(u)) , u 2 [0, p3 ] , v 2 [ p, p ] . Vektorfeltet er givet ved
V( x, y, z) = (0, 1, 0).

Opgave 28.4

Vedrørende figurerne 28.1 og 28.2:

1. Bestem det tangentielle


p fladeintegral
p for hver af vektorfelteterne V( x, y, z) = (0, 1, 0)
og V( x, y, z) = (1/ 5, 0, 2/ 5) langs kuglekalotten.

2. Bestem de respektive ortogonale fladeintegraler (fluxene) for hver af vektorfelterne


igennem kuglekalotten.
eNote 28 28.1 DET ORTOGONALE FLADEINTEGRAL, FLUXEN 5

Figure 28.2:
p Samme kalot som i figur 28.1. Vektorfeltet er her givet ved V( x, y, z) =
(1, 0, 2)/ 5).

Opgave 28.5 En solfanger-opgave

2
Et solfangertag har form som en del af en cylinder med ligningen x2 + z 12 = 1 , nemlig
den del, som ligger over ( x, y) planen og er afgrænset af 1  y  1 (vi antager som
sædvanligt, at ( x, y) planen er vandret og at ’over’ betyder z 0), se Figur 28.3.

• Lad os – lidt simplificerende – antage, at Solen stråler fra en skyfri himmel ind på
solfangertaget til et givet ’tidspunkt’ t langs det enhedsvektorfelt i rummet, som til
tiden t er parallelt med vektoren V = V(t) = (0, cos(t), sin(t)) hvor t 2 [0, p ] .
• Solen står altså op til tiden t = 0 og sender lige på det tidspunkt vandrette stråler
parallelt med y-aksen i retningen (0, 1, 0) . Midt på dagen, til tiden t = p2 er strålerne
lodrette og parallelle med z-aksen i retningen (0, 0, 1) . Til tiden t = p går solen
ned, men lige før det sker, sender den (næsten) vandrette stråler parallelt med y-aksen
i retningen (0, 1, 0) .
• Den energi solfangeren optager pr. arealenhed og pr. tidsenhed på et givet sted antages
at være lig med skalarproduktet V · n mellem Solstråle-vektorfeltet V og tagfladens
indadrettede enhedsnormalvektor n på stedet. Bemærk, at det indadrettede normalfelt
n ikke nødvendigvis er lig med nF , som jo afhænger af den valgte parametrisering af
taget.

• Spørgsmål A:
1. Begrund antagelsen om, at energioptaget er lig med skalarproduktet V · n, og
bemærk, at energioptag selvsagt kun kan finde sted hvor omtalte skalarprodukt
er positiv.
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 6

2. Hvad er solfangerens energioptag pr. tidsenhed på et givet tidspunkt, t , på da-


gen?
3. Hvad er solfangerens totale energioptag på ’en dag’?

• Spørgsmål B: Antag at vi drejer det cylindriske tag p/2 mod uret (eller med) omkring
z aksen.

1. Hvad er denne drejede solfangers energioptag pr. tidsenhed på et givet tidspunkt,


t , på dagen?
2. Hvad er den drejede solfangers totale energioptag på ’en dag’?

• Spørgsmål C: Antag at vi drejer det oprindelige cylindriske tag fra spørgsmål A vinklen
q mod uret (eller med) omkring z aksen, hvor q 2 [ 0, p/2].

1. Hvilke(t) af disse solfangertage giver det største totale energioptag pr. dag?

Figure 28.3: Det solfangertag der benyttes i opgave 28.5.

28.2 Motivering af fluxen via flow-ekspansion

Integralkurverne, flowkurverne, for et givet vektorfelt V( x, y, z) kan benyttes til at ’skub-


be’ en given flade Fr i retning af vektorfeltet og med en lokal fart, der er givet ved læng-
den af vektorfeltet i ethvert punkt. Med andre ord: ethvert punkt på fladen flyder en
given tid langs vektorfeltets flowkurver.

Derved gennemløber fladen – fladen ’fejer’ igennem – et rumligt område Wr (t) som
til ethvert tidspunkt t (den tid vi lader fladen flyde langs vektorfeltet) har et rumfang
Vol± (Wr (t)) = Vol± (t). Det rumfang er klart 0 for t = 0 og derefter er det lille, hvis vek-
torfeltet er næsten tangentielt til fladen og stort hvis vektorfeltet er vinkelret på fladen
i samme retning som standard-normalvektorfeltet på fladen. Hvis vektorfeltet peger i
modsat retning af standard-normalvektorfeltet vil vi regne de tilsvarende lokale bidrag
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 7

til rumfanget negativt – derfor betegnelsen Vol± (Wr (t)).

Se figurerne 28.4, 28.5, og 28.7 samt eksemplerne 28.7 og 28.8 hvor det illustreres hvor-
dan Jacobifunktionen (uden numerisk tegn) kan benyttes til beregning af de lokale
bidrag til rumfanget (med fortegn).

Der gælder følgende fundamentale sammenhæng mellem fluxen og den afledede af


volumen-funktionen til tiden t = 0:

Sætning 28.6 Fluxen som volumen-differentialkvotient ved flade-flow


Lad Wr (t) betegne det rumlige område, der fejes igennem når fladestykket Fr flyder
tiden t med flowkurverne gennem fladens punkter. Så gælder følgende sammen-
hæng, hvor Vol± (Wr (t)) betegner det med fortegn beregnede volumen af området,
dvs. i forhold til den valgte standard normalvektor nF (u, v) for Fr .

d
Flux(V, Fr ) = Vol± (Wr (t)) = Vol0± (0) . (28-8)
dt |t=0

Det er den egenskab (i sætning 28.6), der motiverer betegnelsen flux: Lokalt
er fluxen et mål for den (med fortegn regnede) volumen-vækst-rate, der øjeb-
likkeligt genereres ved flowet af fladen langs vektorfeltets integralkurver igen-
nem fladens punkter. Fortegnet er positivt hvor vektorfeltet danner en spids
vinkel med standard normalvektorfeltet nF (u, v), og negativt hvor vinklen er
stump. Se figurerne 28.7 og 28.4.

Bevis

Vi antager som vanligt, at fladen Fr er givet ved en glat parameterfremstilling:

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) , (u, v) 2 [ a, b] ⇥ [c, d] . (28-9)

Flowkurven for V( x, y, z) igennem flade-punktet r(u, v) vil vi kalde r̃(u, v, t). Det område
W Fr (t) i rummet, som fejes ud af fladen ved at den flyder med flowkurverne indtil tiden t er
derfor givet ved parameterfremstillingen:

W Fr (t) : r̃(u, v, w) , w 2 [0, t] , u 2 [ a, b] , v 2 [c, d] . (28-10)


eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 8

Til bestemmelse af rumfanget (med fortegn) af dette område benytter vi Taylor’s grænse-
formel til første orden med udviklingspunkt w = 0 for hver af de glatte vektorfunktioner
r̃0u (u, v, w), r̃0v (u, v, w), og r̃0w (u, v, w) betragtet som funktioner af w for ethvert fastholdt (u, v):

r̃0u (u, v, w) = r̃0u (u, v, 0) + #(u,v) (w) = r0u (u, v) + #(u,v) (w)
r̃0v (u, v, w) = r̃0v (u, v, 0) + #(u,v) (w) = r0v (u, v) + #(u,v) (w) (28-11)
r̃0w (u, v, w) = r̃0w (u, v, 0) + #(u,v) (w) = V(r(u, v)) + #(u,v) (w) ,
sådan at Jacobifunktionen for volumen-beregningen – med fortegn – ser således ud:

Jacobir̃ (u, v, w) = r̃0u (u, v, w) ⇥ r̃0v (u, v, w) · r̃0w (u, v, w)


= r0u (u, v) ⇥ r0v (u, v) · V(r(u, v)) + # (u,v) (w) (28-12)
= NF (u, v) · V(r(u, v)) + # (u,v) (w) .

Vi ser her, at når w går imod 0 opnår vi præcis det ønskede fortegn på Jacobifunktionen,
som jo er det lokale bidrag (integranden) til rumfangsberegningen : Jacobifunktionen er
positiv tæt ved fladen når vektorfeltet V(r(u, v)) på fladen peger i samme retning som standard
normalvektoren NF (u, v), og Jacobifunktionen er negativ tæt ved fladen når vektorfeltet
V(r(u, v)) på fladen peger i modsatte retning som standard normalvektoren NF (u, v).

Det med fortegn regnede rumfang Vol± (Wr (t)) er nu for tilstrækkeligt små flow-tider t givet
ved:
Z tZ dZ b
Vol± (Wr (t)) = Jacobir̃ (u, v, w) du dv dw
0 c a
Z tZ dZ b⇣ ⌘
= NF (u, v) · V(r(u, v)) + # (u,v) (w) du dv dw
0 c a
Z t ✓✓Z d Z b ◆ ✓Z d Z b ◆◆
= NF (u, v) · V(r(u, v)) du dv + # (u,v) (w) du dv dw
0 c a c a
Z t Z t
= Flux(V, Fr ) dw + # (u,v) (w) dw ,
0 0
(28-13)
hvoraf vi aflæser:
d
Vol± (Wr (t)) = Flux(V, Fr ) + #(t) (28-14)
dt
og dermed
Vol0± (0) = Flux(V, Fr ) . (28-15)


eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 9

Eksempel 28.7 Flow af cirkelskive ved parallelforskydning

Vi ser på en cirkelskive Fr i ( x, y)-planen. Skiven har radius 1 og centrum i (0, 0, 0):

Fr : r(u, v) = (u · cos(v), u · sin(v), 0) , (u, v) 2 [0, 1] ⇥ [ p, p ] . (28-16)

Standard normalvektoren til cirkelskiven er givet ved parametriseringen:

NF (u, v) = ru (u, v) ⇥ rv (u, v)


= (cos(v), sin(v), 0) ⇥ ( u · sin(v), u · cos(v), 0) (28-17)
= (0, 0, u) .
Cirkelskivens enhedsnormalvektorfelt med denne parametrisering er den konstante vektor:

nF = (0, 0, 1) . (28-18)

Lad nu V( x, y, z) betegne vektorfeltet:

V( x, y, z) = (a, b, g) , (28-19)

hvor a, b, og g er konstanter. Så er i dette tilfælde:


Z p Z 1
Flux(V, Fr ) = V(r(u, v)) · NF (u, v) du dv
p 0
Z p Z 1
= (a, b, g) · (0, 0, u) du dv
p 0 (28-20)
Z p Z 1
= u · g du dv
p 0
= g·p ,
Bemærk, at fluxen er negativ for g < 0 og positiv for g > 0, altså i afhængighed af, om
vektorfeltet peger i cirkelskivens standard normalvektor-retning eller i den modsatte retning.

Vi vil nu tilsvarende bestemme rumfanget af det rumlige område, som flowet af cirkelskiven
’fejer igennem’ ved at følge integralkurverne, og dermed illustrere indholdet i – og beviset
for – sætning 28.6:

Flowkurven r(u, v, t) for V( x, y, z) igennem punktet r(u, v) er en ret linje igennem punktet,
nemlig den der har den konstante tangentvektor (a, b, g):

r(u, v, t) = r(u, v) + t · (a, b, g)


(28-21)
= (u · cos(v), u · sin(v), 0) + t · (a, b, g) , t 2 [0, •[ .

Det ses, at
r0t (u, v, t) = (a, b, g) = V(r(u, v, t)) , (28-22)
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 10

sådan at integralkurve-betingelsen netop er opfyldt.

Det rumlige område W Fr (t), som cirkelskiven danner ved at flyde med flowkurverne for
V( x, y, z) indtil tiden t, er dermed givet ved en parameterfremstilling, som direkte aflæses
af flow-kurve parameterfremstillingen igennem punkterne på fladen:

W Fr (t) : r = r(u, v, w) , w 2 [0, t] , (u, v) 2 [0, 1] ⇥ [ p, p ] . (28-23)

Rumfanget af dette område kan findes ved hjælp af standardmetoden via Jacobifunktionen,
som vi her benytter med fortegn for at bestemme rumfanget med fortegn i forhold til normalvek-
toren:

Jacobir (u, v, w) = (ru (u, v, w) ⇥ rv (u, v, w)) · rw (u, v, w)


= NF (u, v) · rw (u, v, w)
= (cos(v), sin(v), 0) ⇥ ( u · sin(v), u · cos(v), 0) · (a, b, g) (28-24)
= (0, 0, u) · (a, b, g)
= u·g ,

hvor vi har benyttet, at der i dette simple konkrete tilfælde, hvor vektorfeltet paralleltrans-
porterer cirkelskiven i vektorfeltets retning gælder: (ru (u, v, w) ⇥ rv (u, v, w)) = NF (u, v) som
er uafhængig af w. Rumfanget med fortegn af W Fr (t) i forhold til cirkelskivens normalvektor-
felt (0, 0, 1) er derfor
Z tZ p Z 1
Vol± (t) = u · g du dv dw = t · g · p . (28-25)
0 p 0

Heraf får vi
Vol0± (0) = g · p , (28-26)
altså den samme værdi som den ovenfor fundne Flux(V, Fr ). Vi har dermed verificeret
sætningen 28.6.

Hvis vektorfeltet (a, b, g) er i samme retning som standard normalen til fladen (dvs. hvis g >
0), så er både fluxen, rumfanget Vol± (t), og volumen-differentialkvotienten Vol0± (0) positiv;
hvis vektorfeltet (a, b, g) er i modsatte retning i forhold til standard normalen (dvs. hvis g <
0), så er både fluxen, rumfanget (med fortegn) Vol± (t), og volumen-differentialkvotienten
Vol0± (0) negativ.
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 11

Figure 28.4: Et simpelt, konstant vektorfelt, og tilsvarende kort-tids flow af en cirkelskive. I


forhold til cirkelskivenormalen (0, 0, 1) er fluxen og volumen-tilvæksten positiv.

Figure 28.5: Et simpelt, konstant vektorfelt, og tilsvarende kort-tids flow af en cirkelskive.


Fluxen og volumen-tilvæksten er 0.

Eksempel 28.8 Flow af cirkelskive ved rotation

Vi ser som i eksempel 28.7 p cirkelskiven Fr i ( x, y)-planen. Skiven har radius 1 og centrum i
(0, 0, 0):

Fr : r(u, v) = (u · cos(v), u · sin(v), 0) , (u, v) 2 [0, 1] ⇥ [ p, p ] . (28-27)

Vi vil her lade cirkelskiven flyde med flowkurverne for følgende roterende vektorfelt:

V( x, y, z) = ( z, 0, x ) . (28-28)

Flowkurven er(u, v, t) = ( x (t), y(t), z(t)) for dette vektorfelt igennem et cirkelskive-punkt
( x0 , y0 , z0 ) = r(u, v) er givet som løsning til første-ordens differentialligningssystemet:
2 0 3 2 3
x (t) z(t)
4 y0 (t) 5 = (V( x (t), y(t), z(t)))> = 4 0 5 (28-29)
0
z (t) x (t)
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 12

med begyndelsesbetingelsen ( x (0), y(0), z(0) = ( x0 , y0 , z0 ) = r(u, v). Det koblede differen-
tialligningssystem har de generelle løsninger, se løsningsmetoderne i eNote 17:
2 3 2 3
x (t) c1 · cos(t) c3 · sin(t)
4 y(t) 5 = 4 c2 5 (28-30)
z(t) c1 · sin(t) + c3 · cos(t)

hvor c1 , c2 , og c3 er arbitrære konstanter. De specielle løsninger, flowkurverne er(u, v, t) igen-


nem cirkelskivepunkterne ( x0 , y0 , z0 ) = r(u, v) = (u · cos(v), u · sin(v), 0) er så givet ved
følgende parametriserede cirkler i rummet:
2 3 2 3
x0 · cos(t) z0 · sin(t) u · cos(v) · cos(t)
(er(u, v, t))> = 4 y0 5=4 u · sin(v) 5 . (28-31)
x0 · sin(t) + y0 · cos(t) u · cos(v) · sin(t)

Det udfejede rumlige område W Fr (t) er dermed allerede parametriseret:

W Fr (t) : er(u, v, w) = (u · cos(v) · cos(w), u · sin(v), u · cos(v) · sin(w)) , (28-32)

hvor w 2 [0, t], u 2 [0, 1], og v 2 [ p, p ]. Se figur 28.6.

Fluxen af vektorfeltet igennem cirkelskiven forventes at være 0 fordi det område, som cirkel-
skiven fejer igennem ved rotationen har rumfang 0 når rumfanget regnes med fortegn: Den
ene halvdel af området ses jo at ligge over cirkelskiven (i retning af (0, 0, 1)) og den anden
halvdel ligger under cirkelskiven (i retning af (0, 0, 1)); de to halvdele af det udfejede område
har rumfang med modsatte fortegn og de ophæver derfor hinanden. Vi beregner fluxen af
vektorfeltet igennem cirkelskiven:
Z p Z 1
Flux(V, Fr ) = V(r(u, v)) · NF (u, v) du dv
p 0
Z p Z 1
= (0, 0, u · cos(v)) · (0, 0, u) du dv
p 0
Z p Z 1
= u2 · cos(v) du dv
p 0
Z p
1 (28-33)
= · cos(v) dv
p 3
Z
1 p
= · cos(v) dv
3 p
1
= · [sin(v)]p p
3
=0 .

Med henblik på igen at illustrere den generelle rumfangsberegning (med fortegn) og igen
verificere sætning 28.6 med konkrete udregninger, vil vi vise, at det med fortegn beregnede
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 13

rumfang af omrdet W Fr (t) som fejes ud af cirkelskiven ved flowet virkelig er 0. Den med
fortegn beregnede Jacobifunktion er bestemt ved:

Jacobier (u, v, w) = u2 · cos(v) . (28-34)

sådan at det fortegns-vægtede volumen af W Fr (t) er:


Z tZ p Z 1
Vol± (W Fr (t)) = u2 · cos(v) du dv dw
0 p 0
Z tZ p
1
= · · cos(v) dv dw
3 0 p (28-35)
1
= · t · [sin(v)]p p
3
=0 .

Bemærk, at det ordinære rumfang Vol(W Fr (t)) af W Fr (t) selvfølgelig ikke er 0, men derimod:
Z tZ p Z 1
Vol(W Fr (t)) = u2 · | cos(v)| du dv dw
0 p 0
Z tZ p
1
= · | cos(v)| dv dw
3 0 p (28-36)
1
= · t · 4 · [sin(v)]0p/2
3
4
= ·t .
3

Figure 28.6: Et roterende vektorfelt og tilsvarende kort-tids flow af en cirkelskive. Fluxen og


volumen-tilvæksten er 0.
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 14

Eksempel 28.9 Flux gennem en elliptisk paraboloide

Et vektorfelt V( x, y, z) og en elliptisk paraboloide Fr er givet ved henholdsvis


✓ ◆
2 2 1 2
r(u, v) = 2 · u · cos(v), 2 · u · sin(v), 2 · u · (cos (v) + · sin (v)) , (28-37)
9

hvor (u, v) 2 [0, 1/2] ⇥ [ p, p ], og V( x, y, z) = ( y, x, 1).

Til bestemmelse af fluxen Flux(V, Fr ) af V( x, y, z) gennem Fr har vi


✓ ◆
2 8 2
ru (u, v) ⇥ rv (u, v) = 8 · u · cos(v), · u · sin(v), 4 · u) (28-38)
9

V(r(u, v)) = ( 2 · u · sin(v), 2 · u · cos(v), 1) . (28-39)


sådan at:
Z p Z 1/2
Flux(V, Fr ) = V(r(u, v)) · (ru (u, v) ⇥ rv (u, v)) du dv
p 0
Z Z 1/2
p 4
= · u · 32 · u2 · cos(v) · sin(v) + 9 du dv (28-40)
p 0 9
= ···
=p .

Figure 28.7: Et roterende vektorfelt, og tilsvarende kort-tids flow af en elliptisk paraboloide. I


forhold til cirkelskivenormalen er fluxen og volumen-tilvæksten positiv. Se eksempel 28.9.
eNote 28 28.2 MOTIVERING AF FLUXEN VIA FLOW-EKSPANSION 15

Som vi skal se i næste afsnit er den totale flux af et givet vektorfelt gennem overfladen af
et givet rumligt område Wr særlig interessant. Overfladen kan gerne være sammensat
af endeligt mange glatte fladestykker, som f.eks. overfladen af et polyeder. Den eneste
konvention vi skal holde os for øje er, at det altid er den udadrettede normal (i forhold til
det rumlige område) vi skal benytte overalt på overfladen, når vi beregner fluxen.

Eksempel 28.10 Flux gennem overfladen af en massiv cylinder

Vi vil illustrere fluxberegningen gennem en total-overflade af et rumligt område ved at


beregne fluxen af det simple vektorfelt

V( x, y, z) = ( f ( x ), 0, 0) , ( x, y, z) 2 R3 , (28-41)

hvor f ( x ) er en glat funktion af x. Vi vælger også et meget simpelt område W i rummet,


nemlig den massive cylinder med radius 1/2 og x-aksen som symmetriakse samt tilhørende
x-interval x 2 [0, 1]. Se figur 28.8.

Overfladen, randen, af cylinderen, som vi vil betegne med F = ∂W, består af 3 dele: Dels den
cylindriske krumme overflade og dels de to ende-cirkelskiver. Da vektorfeltet er parallelt
med den cylindriske krumme del af overfladen vil der ikke være noget fluxbidrag derfra
(!). Det vil sige, de eneste bidrag til fluxen gennem total-overfladen af den massive cylinder
stammer fra de to endecirkelskiver.

Da vektorfeltet er vinkelret på begge disse skiver er fluxen gennem cirkel-endeskiven ved


x = 0 givet ved: f (0) · p4 , idet den udadrettede enhedsnormal for den cirkelskive er
( 1, 0, 0) og fluxen gennem cirkel-endeskiven ved x = 1 er tilsvarende givet ved: f (1) · p4 ,
idet enhedsnormalen der er (1, 0, 0).

Den totale flux af V( x, y, z) ud gennem overfladen ∂W af den massive cylinder er derfor:


p
Flux(V, ∂W) = ( f (1) f (0)) · . (28-42)
4
Det vil sige: Hvis f ( x ) (og dermed vektorfeltet) er større ved x = 0 en ved x = 1, så er den
totale flux ud gennem cylinderoverfladen negativ.
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 16

Figure 28.8: Et vektorfelt som er parallelt med x-aksen og et billede efter lidt længere tids
flow. Efter meget lang tid bliver hele cylinderen mast sammen til en cirkelskive ved x = 2. Se
eksempel 28.10.

Fluxen gennem de to endeskiver på cylinderen i figur 28.8 afhænger af vektor-


feltets værdi i disse endpunkter – se eksempel 28.10. Da rumfanget af cylin-
deren antydes at blive mindre ved flowet giver den inspektion en formod-
ning om, at den totale flux ud gennem de to endeskiver er negativ. Det er i
fuld overensstemmelse med, at vektorfeltet i det viste tilfælde er V( x, y, z) =
( f ( x ), 0, 0) = (2 x, 0, 0), som i henhold til beregningen i eksempel 28.10 giver
den totale flux:
p p
Flux(V, ∂W) = (1 2) · = . (28-43)
4 4
Det vil sige at der er større rumfang-deformation ind i cylinderen ved x = 0 end
der er rumfang-deformation ud af cylinderen ved x = 1. Den tidsafledede af
rumfanget ved flowet er negativ, således at cylinderen netop bliver mindre når
alle punkter følger med deres respektive flowkurver. Det gælder faktisk i dette
tilfælde ikke bare for små t-værdier men for alle t > 0, således at cylinderen
bliver helt kollapset og trykket totalt sammen til en flad cirkelskive ved x = 2
til tiden t = • .

28.3 Motivering af divergensen via flow-ekspansion

Lad os betragte en massiv kugle Kr i rummet med radius r og centrum i (0, 0, 0) og lad
os udvide denne kugle ved at lade alle punkterne i den flyde med flowkurverne for
eksplosionsvektorfeltet V( x, y, z) = ( x, y, z).
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 17

Den massive kugle har parameterfremstillingen:

Kr : r(u, v, w) = (u · sin(v) · cos(w), u · sin(v) · sin(w), u · cos(v)) , (28-44)

hvor (u, v, w) 2 [0, r] ⇥ [0, p ] ⇥ [ p, p ].

Ifølge flow-løsningerne til dette eksplosionsvektorfelt vokser radius af kuglen med fak-
toren e T , hvor T er flow-tiden. Det ser vi på følgende måde:

De generelle flow-kurver for vektorfeltet findes jo ved at løse differentialligningssys-


temet: 2 0 3 2 3
x (t) x (t)
4 y0 (t) 5 = (V( x (t), y(t), z(t)))> = 4 y(t) 5 . (28-45)
0
z (t) z(t)
Den generelle løsning er her:
2 3 2 3
x (t) c 1 · et
4 y ( t ) 5 = 4 c 2 · et 5 (28-46)
z(t) c 3 · et
hvor c1 , c2 , og c3 er arbitrære konstanter.

De specielle løsninger, flowkurverne er(u, v, w, t) igennem kuglepunkterne ( x0 , y0 , z0 ) =


r(u, v, w) = (u · sin(v) · cos(w), u · sin(v) · sin(w), u · cos(v)) er så givet ved følgende
parametriserede linjer i rummet:
2 3 2 t 3
x 0 · et e · (u · sin(v) · cos(w))
(er(u, v, w, t))> = 4 y0 · et 5 = 4 et · (u · sin(v) · sin(w)) 5 . (28-47)
z 0 · et et · (u · cos(v))
Disse linjer og deres parametriseringer giver flow-kurven igennem ethvert punkt i den
massive kugle.

Det rumlige område W Fr (t) som efter tiden t er tilføjet den massive kugle, er dermed
allerede parametriseret: Vi skal blot sætte u = r i ovenstående flowlinje-parametrise-
ringer. Det vil sige, vi finder igen ud af, hvordan flowet af kuglens overflade bidrager
til volumenforøgelsen (regnet med fortegn):

W Fr ( T ) : er(r, v, w, t) = et · r · (cos(v) · cos(w), sin(v), cos(v) · sin(w)) , (28-48)

hvor t 2 [0, T ], v 2 [0, p ], og w 2 [ p, p ]. Det ses, at er(r, v, w, T ) er en parameterfrem-


stilling for den eksploderende kugles overflade efter tiden T, og at det er en kugleflade
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 18

med radius eT · r. Ved at flyde med flowkurverne for eksplosionsvektorfeltet udvider


den oprindelige kugle (med radius r til tiden t = 0) sig til en kugle, der har radius eT · r
som påstået.

Rumfanget af den eksploderende kugle til tiden T er summen af de to rumfang


Vol± (W Fr ( T )) og Vol(Kr ). Det førstnævnte rumfang er det med fortegn reg-
nede volumen af det område, som kuglens overflade fejer igennem i løbet af
tiden T.

Volumenet af kuglen som funktion af flow-tiden t er dermed givet ved: Vol(W Fr (t)) +
Vol(Kr ) = Vol(t) = (4 p/3) r3 e3t . Volumenet af kuglen vokser derfor (til tiden t = 0)
med differentialkvotienten
d
Vol(t)|t=0 = 4 p r3 . (28-49)
dt

Denne vækst i volumen har vi essentielt fundet ved at holde øje med udvidelsen af den
massive kugles overflade ∂Kr når alle kuglens punkter flyder langs med vektorfeltets
flowkurver – præcis som vi har dyrket i første halvdel af denne eNote.

Intuitivt har vi derfra, at hvis skalarproduktet imellem vektorfeltet V og den udadrettede


enhedsnormalvektor n et sted på overfladen er stor, så vil det lokale bidrag til volu-
menforøgelse derfra tilsvarende være stor, fordi overfladen på det sted skubbes hurtigt
udad når den flyder med flowkurverne for vektorfeltet.

Dette kan selvfølgelig modsvares af at skalarproduktet andre steder på overfladen er


negativt, således at fladen skubbes indad på de steder.

Kort sagt ser vi igen, at den totale udadrettede flux af vektorfeltet igennem overfladen
af det rumlige område giver (den med fortegn regnede) volumenforøgelse.

Den tilsvarende udvidelse af sætning 28.6 er derfor:


eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 19

Sætning 28.11 Total flux ud gennem overflade af rumligt område


Lad Wr betegne et vilkårligt parametriseret område i rummet med udadrettet
enhedsnormalvektorfelt n∂W langs overfladen ∂Wr .

Overfladen kan gerne være sammensat af glatte parametriserede fladestykker som


f.eks. overfladen på et polyeder.

Lad V( x, y, z) betegne et vilkårligt glat vektorfelt i rummet.

Vi lader alle punkterne i Wr flyde tiden t langs flowkurverne for vektorfeltet


V( x, y, z) .

Det med fortegn (i forhold til n∂W ) regnede volumen Vol± (t) af området efter denne
deformation har da følgende differentialkvotient til tiden t = 0 :
Z
d
Vol± (t)|t=0 = V · n∂W dµ = Flux(V, ∂Wr ) . (28-50)
dt ∂Wr

Eksempel 28.12 Eksplosion af massiv kugle

Vi checker sætningen i det konkrete tilfælde med den eksploderende kugle: Fluxen af ek-
splosionsvektorfeltet ud igennem kuglens overflade er simpelthen overfladens areal 4 p r2
gange skalarproduktet V · n, fordi dette skalarprodukt i dette specielle tilfælde er konstant:
p
V · n = kVk = x2 + y2 + z2 = r . Derfor er den totale flux 4 p r3 , altså præcis differen-
tialkvotienten (til tiden t = 0) af volumenet som funktion af flowtiden t . Vi har således
verificeret sætningen i dette specielle eksempel.
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 20

De parametriserede rumlige områder, vi betragter, har jo sædvanligvis en


rand, der består af 6 sideflader. Det betyder, at beregningen af volumenvæk-
sten af området ved deformationen langs flowkurverne kræver beregning af 6
udadrettede flux-bidrag – eet bidrag for hver sideflade.

Hvis to af de 6 sideflader ved en standardparametrisering af et rumligt om-


råde er sammenfaldende eller delvis sammenfaldende, så vil standard enheds-
normalerne for den ene sideflade være præcis modsatrettet standard enheds-
normalerne for den anden sideflade der hvor sidefladerne er sammenfaldende,
således at de tilsvarende fluxbidrag der vil ophæve hinanden!

For et vilkårligt glat vektorfelt i rummet kan vi undersøge volumenforøgelsen (ved flow
langs vektorfeltets flowkurver) for en lille massiv kugle Kr , der har centrum i et givet
punkt, f.eks. p = ( x0 , y0 , z0 ) og radius r. Vi Taylor-udvikler vektorfeltets koordinat-
funktioner V1 , V2 og V3 , til 1. orden med udviklingspunkt ( x0 , y0 , z0 ) og finder den
udadrettede flux af vektorfeltet igennem den lille kugles overflade ∂Kr . Denne flux
divideret med volumenet (4 p/3) r3 af den massive kugle Kr har en grænseværdi når
radius r går imod 0. Se skitsen til den beregning nedenfor.

Det viser sig (se nedenfor) at denne grænseværdi netop er divergensen af vektorfeltet i det
betragtede punkt! I lyset af sætning 28.11 og ligning (28.3.50) har vi derfor motivereret
følgende tolkning af divergensen:

Sætning 28.13
Divergensen af et vektorfelt udtrykker den volumen-relative lokale flux ud gennem over-
fladen for vektorfeltet og dermed også den relative lokale volumen-vækst ved deforma-
tion langs flowkurverne for vektorfeltet:
✓ ◆
1
Div(V)( x0 , y0 , z0 ) = lim Flux(V, ∂Kr )
r!0 Vol( Kr )
✓ ◆ (28-51)
1 d
= lim Vol± (t)|t=0 .
r!0 Vol( Kr ) dt
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 21

Bevis

Vi vil kun skitsere, hvordan divergensen fremkommer ved den antydede fremgangsmåde.
Vi simplificerer fremstillingen på to måder: Dels vil vi vælge et koordinatsystem så
p = (0, 0, 0), og dels vil vi kun medtage lineariseringen af V( x, y, z) omkring (0, 0, 0)
(#-leddene fra Taylors grænseformler for de 3 koordinatfunktioner tages altså ikke med). (Til
gengæld er beregningerne helt eksakte for vektorfelter af højest første grad.)

Opgaven er altså at genfinde Div(V) i punktet (0, 0, 0) ved hjælp af en fluxberegning. Vi


begynder med at bruge Taylors grænseformel på V( x, y, z) . Det underforstås, at Vi og de
partielle afledede af Vi evalueres i udviklingspunktet (0, 0, 0) medmindre andet antydes.

∂V1 ∂V ∂V1
V( x, y, z) = ( V1 + x +y 1 +z ,
∂x ∂y ∂z
∂V2 ∂V2 ∂V2
V2 + x +y +z , (28-52)
∂x ∂y ∂z
∂V3 ∂V3 ∂V3
V3 + x +y +z ) .
∂x ∂y ∂z

Idet enhedsnormalvektorfeltet på overfladen af den lille massive r-kugle Kr med centrum


(0, 0, 0) er givet ved n = ( x/r, y/r, z/r) følger det, at integranden i fluxberegningen er
følgende:

✓ ◆
1 ∂V ∂V ∂V
V( x, y, z) · n = ( x V1 + x2 1 + xy 1 + xz 1 +
r ∂x ∂y ∂z
∂V2 ∂V2 ∂V2
y V2 + yx + y2 + yz + (28-53)
∂x ∂y ∂z
∂V3 ∂V3 ∂V3
z V3 + zx + zy + z2 ) .
∂x ∂y ∂z

Tilbage er nu kun at integrere dette udtryk over kuglens overflade ∂Kr og dernæst dividere
med kuglens volumen Vol(Kr ). Selv om det nok kan se kompliceret ud, så er det faktisk
rimelig simpelt i betragtning af følgende identiteter:

Z Z Z
x dµ = y dµ = z dµ = 0 ,
∂Kr ∂Kr ∂Kr
Z Z Z
x2 dµ = y2 dµ = z2 dµ = (4 p/3) r4 = r Vol(Kr ) , (28-54)
∂Kr ∂Kr ∂Kr
Z Z Z
x y dµ = x z dµ = z y dµ = 0 .
∂Kr ∂Kr ∂Kr
eNote 28 28.3 MOTIVERING AF DIVERGENSEN VIA FLOW-EKSPANSION 22

Fra ligning (28.3.54) følger nu f.eks. følgende bidrag til integralet over kuglefladen ∂Kr af
højresiden i ligning (28.3.53). (Bemærk, at ∂V ∂x (0, 0, 0) er en konstant, der kan sættes udenfor
1

integraltegnet.):
Z ✓ ◆
1 ∂V1 ∂V
x2 (0, 0, 0) dµ = Vol(Kr ) 1 (0, 0, 0) . (28-55)
∂Kr r ∂x ∂x

Ialt fås naturligvis 3 sådanne bidrag til integralet over kuglefladen ∂Kr af højresiden i lign-
ing (28.3.53), og da integralet over ∂Kr af venstresiden i ligning (28.3.53) netop er fluxen
Flux(V, ∂Kr ) har vi derfor følgende identitet i dette simplificerede tilfælde:
Z
1 1
Flux(V, ∂Kr ) = V · n dµ
Vol(Kr ) Vol(Kr ) ∂Kr
∂V1 ∂V2 ∂V3 (28-56)
= (0, 0, 0) + (0, 0, 0) + (0, 0, 0)
∂x ∂y ∂z
= Div(V)(0, 0, 0) .

For generelle vektorfelter gælder den tilsvarende identitet kun i den grænse, hvor r er meget
lille (altså for r ! 0), således at ovenstående brug af Taylor’s grænseformel for V( x, y, z) til
første orden netop bliver den dominerende repræsentant for vektorfeltet indenfor kuglen
Kr . For vektorfelter af højest første grad gælder identiteten (28.3.56) dog som nævnt for
alle værdier af r. Det skyldes naturligvis, at uanset radius r er vektorfeltet jo i det specielle
tilfælde eksakt repræsenteret i hele Kr ved sin Taylors grænseformel til første orden med
udviklingspunkt i centrum.

Hermed har vi afsluttet skitseringen af beviset for den lokale bestemmelse af divergensen af
et vektorfelt og vist den geometriske tolkning i sætning 28.13.

Opgave 28.14

Vis de ovenstående identiteter i ligning (28.3.54). I de tilfælde hvor integralet er 0 kan dette
vises ved en fortegns- og symmetribetragtning.

Denne fremstilling af divergensen åbner nu op for en naturlig ide, som går i den mod-
satte retning:

Da den lokale punktvise volumen-vækst ved deformation af et rumligt område langs


eNote 28 28.4 GAUSS’ DIVERGENS-SÆTNING 23

flowkurverne for et givet vektorfelt er bestemt af divergensen af vektorfeltet, så er føl-


gende en rimelig formodning: Hvis vi integrerer divergensen over et område i rummet,
så skulle resultatet gerne være sammenlignelig med den totale volumenvækst af hele
området. Altså groft sagt skulle summen af de lokale volumentilvækster gerne være
den totale volumentilvækst.

Dette er præcis indholdet af Gauss’ sætning, som vi nu formulerer i kombination med


Sætning 28.11:

28.4 Gauss’ divergens-sætning

Figure 28.9: Carl Friedrich Gauss. Se Biografi.

Sætning 28.15 Gauss’ divergens-sætning


Lad Wr betegne et rumligt område med randoverflade ∂Wr og udadrettet enheds-
normalvektorfelt n∂W på randoverfladen. For ethvert glat vektorfelt V i rummet
gælder så følgende:
Z Z
d
Vol± (t)|t=0 = Div(V) dµ = V · n∂W dµ = Flux(V, ∂Wr ) , (28-57)
dt Wr ∂Wr

hvor fluxen altså skal beregnes med hensyn til det udadrettede enhedsnormalvektor-
felt på randoverfladen af det givne rumlige område.
eNote 28 28.4 GAUSS’ DIVERGENS-SÆTNING 24

Begge sider af følgende ligning, der er essensen af Gauss’ sætning, kan jo beregnes i
konkrete tilfælde og dermed verificere Gauss’ sætning:
Z
Div(V) dµ = Flux(V, ∂Wr ) . (28-58)
Wr

Vi vil her gennemgå nogle eksempler på sådanne dobbelt-beregninger.

I visse tilfælde er det meget simplere at udregne divergens-integralet over et


givet rumligt område end at udregne fluxen af vektorfeltet gennem områdets
totale overflade. Hvis man skal udregne sidstnævnte vil man selvfølgelig i
stedet bare udregne førstnævnte integral og henvise til Gauss’ divergenssæt-
ning. Omvendt er der tilfælde hvor fluxintegralet er simplest at beregne – så
benyttes selvfølgelig tilsvarende duale strategi.

Eksempel 28.16

Hvis vektorfeltet V har divergensen 0 i alle punkter i rummet, så vil ethvert rumligt område,
der flyder med vektorfeltet, bevare sit volumen. Formen kan naturligvis ændres meget som
tiden går, men volumenet er konstant. Desuden er fluxen ud igennem overfladen af ethvert
fastholdt rumligt område tilsvarende 0.

Eksempel 28.17

For eksplosionsvektorfeltet V( x, y, z) = ( x, y, z), der har den konstante divergens Div(V) =


3 , gælder altså følgende for et vilkårligt rumligt område: 3 Vol(W) = Flux(V, ∂W) .

Opgave 28.18

Vis (ved direkte udregninger) påstanden om V( x, y, z) = ( x, y, z) i ovenstående eksempel


28.17 for det rumlige område, der består af den massive cylinder i figur 28.8.
eNote 28 28.4 GAUSS’ DIVERGENS-SÆTNING 25

Figure 28.10: Et vektorfelt som er parallelt med x-aksen og cylinderen fra eksempel 28.10.

Eksempel 28.19 Divergensen og fluxen i cylinder-eksemplet

Vi vil illustrere Gauss’ sætning for vektorfeltet


V( x, y, z) = ( f ( x ), 0, 0) , ( x, y, z) 2 R3 , (28-59)
hvor f ( x ) er en glat funktion af x, idet vi vil beregne integralet af divergensen af vektorfeltet
over den massive cylinder med radius 1/2, x-aksen som symmetriakse, og x-interval x 2
[0, 1], som vi studerede i eksempel 28.10. I det eksempel fandt vi den totale flux af vektorfeltet
ud gennem cylinderens overflade:
p
Flux(V, ∂W) = ( f (1) f (0)) · . (28-60)
4
Den totale divergens af vektorfeltet i den massive cylinder er lige så let at beregne: Den lokale
divergens af V( x, y, z) = ( f ( x ), 0, 0) er i et vilkårligt punkt ( x, y, z):
Div(V)( x, y, z) = f 0 ( x ) . (28-61)
Den massive cylinder har en parameterfremstilling:
Wr : r(u, v, w) = (w, u · cos(v), u · sin(v)) , (28-62)
hvor (u, v, w) 2 [0, 1/2] ⇥ [ p, p ] ⇥ [0, 1]. Jacobifunktionen for parametriseringen er så
Jacobir (u, v, w) = u , (28-63)
således at den totale divergens af vektorfeltet er
Z Z 1 Z p Z 1/2
Div(V) dµ = f 0 (w) · u du dv dw
Wr 0 p 0
Z 1Z p 1 0
= · f (w) dv dw
0 p 8
Z 1
1
= · 2 · p · f 0 (w) dw
8 0 (28-64)
Z 1
p
= · f 0 (w) dw
4 0
p =1
= · [ f (w)]w w =0
4
p
= ( f (1) f (0)) · ,
4
eNote 28 28.4 GAUSS’ DIVERGENS-SÆTNING 26

altså præcis samme resultat som ved flux-beregningen.

Eksempel 28.20 Vektorfelt igennem en kantet torus

Vi betragter en delmængde af en massive kugle med radius 1/2, se figur 28.11. En parame-
terfremstilling for det massive område er givet ved:

Wr : r(u, v, w) = (u · sin(v) · cos(w), u · sin(v) · sin(w), u · cos(v)) , (28-65)


hvor parametrene gennemløber følgende restringerede intervaller:
 
1 p 2p
u2 ,1 , v2 , , w 2 [ p, p ] . (28-66)
2 3 3
Et vektorfelt i rummet er givet således:

V( x, y, z) = ( z, y, x · z) . (28-67)

Opgaven er at bestemme den totale flux af vektorfeltet ud igennem overfladen af Wr . Det kan
godt være kompliceret – overfladen har 4 fladestykker, der alle bidrager til flux-beregningen.
I stedet vil vi udregne integralet af divergensen af vektorfeltet over det rumlige område og
til sidst henvise til Gauss’ divergenssætning.

Jacobifunktionen for den angivne parametrisering af det massive kugleområde er:

Jacobir (u, v, w) = u2 · sin(v) , (28-68)

og divergensen af vektorfeltet er

Div(V)( x, y, z) = 1 + x , sådan at
(28-69)
Div(V)(r(u, v, w)) = 1 + u · sin(v) · cos(w) .
Divergensintegralet over Wr er derfor:
Z Z p Z 2p/3 Z 1
Div(V) dµ = (1 + u · sin(v) · cos(w)) · u2 · sin(v) du dv dw
Wr p p/3 1/2
= ··· (28-70)
7p
= ,
12
som derfor – i henhold til Gauss’ sætning – også er den søgte totale flux ud igennem over-
fladen:
7p
Flux(V, ∂Wr ) = . (28-71)
12
eNote 28 28.5 EN KONSEKVENS FOR ROTATIONSFELTER 27

Figure 28.11: Et vektorfelt omkring og igennem en kantet torus.

28.5 En konsekvens for rotationsfelter

Vi nævner her en observation, som følger direkte af Gauss’ divergenssætning i kombi-


nation med følgende lokale information om rotationsvektorfelter:

Sætning 28.21 Divergensen af et rotationsvektorfelt er 0


Lad V( x, y, z) betegne et glat vektorfelt, som selv er rotationen af et vektorfelt
W( x, y, z) i rummet. Så er
Div(V)( x, y, z) = 0 . (28-72)
Rotationsvektorfelter er altså divergensfrie:

Div(Rot(W))( x, y, z) = 0 . (28-73)

Bevis

Vi ved pr. antagelse at

∂W3 ∂W2 ∂W1 ∂W3 ∂W2 ∂W1


V( x, y, z) = ( , , ) , (28-74)
∂y ∂z ∂z ∂x ∂x ∂y
eNote 28 28.5 EN KONSEKVENS FOR ROTATIONSFELTER 28

sådan at
✓ ◆ ✓ ◆ ✓ ◆
∂2 W3 ∂2 W2 ∂2 W1 ∂2 W3 ∂2 W2 ∂2 W1
Div(V)( x, y, z) = + + = 0 , (28-75)
∂y∂x ∂z∂x ∂z∂y ∂x∂y ∂x∂z ∂y∂z

hvor vi har benyttet, at differentiationsordenen kan ombyttes, e.g.:

∂2 W3 ∂2 W3
= . (28-76)
∂y∂x ∂x∂y

Hvis vi bruger sætning 28.21 i kombination med Gauss’ sætning får vi

Følgesætning 28.22 Totale flux af et rotationsvektorfelt er 0


Lad W( x, y, z) betegne et glat vektorfelt i rummet og lad W være et område i rummet
med stykkevis glat overflade ∂W med udadrettet enhedsnormalvektorfelt n∂W .

Så er den totale flux af Rot(W)( x, y, z) ud gennem overfladen ∂W af W lig med 0:


Z
Flux(Rot(W), ∂W) = Rot(W) · n∂W dµ = 0 . (28-77)
∂W

Hvis det rumlige område flyder med flowkurverne for Rot(W( x, y, z) så er rum-
fanget konstant under hele flowdeformationen:

d
Vol± (t) = 0 for alle t . (28-78)
dt

Eksempel 28.23 Et rotationsvektorfelt igennem en kugle

Vi lader W( x, y, z) = (z2 · x, x2 · y, y2 · z).

Så er
Rot(W)( x, y, z) = (2 · y · z, 2 · z · x, 2 · x · y) , (28-79)
samt tydeligvis
Div(Rot(W))( x, y, z) = 0 . (28-80)
eNote 28 28.5 EN KONSEKVENS FOR ROTATIONSFELTER 29

Figure 28.12: Et rotationsvektorfelt V( x, y, z) = Rot(W)( x, y, z) omkring og igennem en kugle.


Den totale flux ud igennem kuglefladen er 0, men den lokale flux ud igennem passende valgte
fladestykker af kuglefladen er tydeligvis ikke 0.

Lad nu Fr betegne kuglefladen med radius 1 placeret med centrum i (0, 0, 0):

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) = (sin(u) · cos(v), sin(u) · sin(v), cos(u)) ,
(28-81)
hvor u 2 [0, p ] og v 2 [ p, p ]. Som bekendt er Jacobifunktionen for denne parametrisering
af kuglefladen givet ved:
Jacobir (u, v) = sin(u) , (28-82)
og enhedsnormalvektoren til kuglefladen er i dette specielle tilfælde:

nF (u, v) = ( x (u, v), y(u, v), z(u, v)) , (28-83)

sådan at
Rot(W)( x, y, z) · nF (u, v) = 2 · (y · z, y · z, y · z) · ( x, y, z)
= 6 · x (u, v) · y(u, v) · z(u, v) (28-84)
2
= 6 · sin (u) · cos(v) · sin(v) · cos(u) .
Det totale flux-integral af Rot(W)( x, y, z) ud igennem kuglefladen er derfor:
Z
Flux(Rot(W), Fr ) = Rot(W) · nF dµ
F
Z rp Z p
= 6 · sin2 (u) · cos(v) · sin(v) · cos(u) · Jacobir (u, v) du dv
p 0
Z p Z p
= 6 · sin2 (u) · cos(v) · sin(v) · cos(u) · sin(u) du dv
p 0
Z p Z p
= 6 · sin3 (u) · cos(v) · sin(v) · cos(u) du dv
p 0
(28-85)
eNote 28 28.5 EN KONSEKVENS FOR ROTATIONSFELTER 30

og da en stamfunktion til sin3 (u) · cos(u) er 14 · sin4 (u) som er 0 både for u = 0 og for u = p,
så er
Flux(Rot(W), Fr ) = 0 (28-86)
i overensstemmelse med følgesætning 28.22.

Læg mærke til, at hvis integrationsintervallerne for u og v i ligning (28.5.85)


i eksempel 28.23 havde været mindre, dvs. hvis vi havde betragtet fluxen af
rotationsvektorfeltet ud igennem en del af kugleoverfladen, så ville resultatet
ikke nødvendigvis blive 0, hvilket også fremgår tydeligt af figur 28.12.

Fluxen af Rot(W( x, y, z) igennem et fladestykke kan alternativ beregnes som


cirkulationen af W( x, y, z) langs med fladestykkets rand – det er indholdet af
Stokes’ sætning, som er emnet for eNote 27.

Figure 28.13: Et divergensfrit vektorfelt V( x, y, z) = ( z, (y x )/2, x (z/2)) omkring og


igennem en kugle.

Eksempel 28.24 Divergensfrit førstegrads-vektorfelt

Første-grads vektorfeltet
V( x, y, z) = ( z, (y x )/2, x (z/2)) (28-87)
har divergensen Div(V)( x, y, z) = 0. Den totale flux af vektorfeltet ud igennem overfladen
af ethvert rumligt område er derfor 0 og rumfanget af det rumlige område er bevaret ved
flow med vektorfeltets flowkurver.

For første-gradsvektorfelter gælder, at enhver massiv kugle deformeres igennem massive


ellipsoider ved at flyde med vektorfeltet, se figur 28.13, figur 28.14 og opgave 28.25.
eNote 28 28.5 EN KONSEKVENS FOR ROTATIONSFELTER 31

Figure 28.14: Det divergensfrie vektorfelt V( x, y, z) = ( z, (y x )/2, x (z/2)) deformerer


en massiv kugle til en massiv ellipsoide ved at alle kuglens punkter flyder med flowkurverne
for vektorfeltet. Rumfanget er bevaret. Til højre er vist, hvordan et udsnit af kugleoverfladen
flyder og danner en del af ellipsoide-overfladen.

Opgave 28.25 (Advanced)

Lad V( x, y, z) betegne et vilkårligt førstegrads-vektorfelt (se eNote 24) og lad F0 betegne en


vilkårlig niveauflade for et givet andengradspolynomium f 0 ( x, y, z) i x, y, og z (se eNote 20).
Vi lader s F0 flyde tiden t med flowkurverne for V( x, y, z) og får derved en flade Ft . Vis, at Ft
også er en niveauflade for et andengradspolynomium f t ( x, y, z) i x, y, og z. Vink: Se eNote
12.
eNote 28 28.6 OPSUMMERING 32

28.6 Opsummering

Vi har indført det fundamentale begreb flux af et vektorfelt igennem en flade og relateret
fluxen dels til den lokale volumen-ekspansions-rate ved selve fladen når denne flyder
med flowkurverne for vektorfeltet, og dels til divergensen af vektorfeltet inde i et rum-
ligt område der er afgrænset af en given overflade.

• For en glat parametriseret flade Fr og et glat vektorfelt V( x, y, z) er fluxen af vek-


torfeltet igennem fladen:
Z dZ b
Flux(V, Fr ) = V(r(u, v)) · (r0u (u, v) ⇥ r0v (u, v)) du dv
c a
Z dZ b (28-88)
= V(r(u, v)) · NF (u, v) du dv .
c a

• Ved at lade fladen flyde en tid t med flowkurverne for V( x, y, z) fejer fladen igen-
nem et tids-afhængigt rumligt område Wr (t), som lokalt enten ligger i retning af
fladens standardnormal eller i modsatte retning. Det med fortegn vægtede rum-
fang beregnes ved hjælp af Jacobifunktionen for parameterfremstillingen – uden
numerisk tegn. Dette rumfang kalder vi Vol± (t). Så er fluxen relateret til dette
volumen på følgende måde:
d
Flux(V, Fr ) = Vol± (Wr (t)) = Vol0± (0) . (28-89)
dt |t=0

• Divergensen af vektorfeltet er også et mål for lokal volumen-ekspansion (hvor


Div(V)( x, y, z) > 0) henholdsvis volumen-kontraktion (hvor Div(V)( x, y, z) < 0)
ved flow langs flowkurverne for vektorfeltet. Integralet af divergensen over et
rumligt område Wr er derfor et mål for hele områdets totale volumen-ekspansion
(eller kontraktion) og giver derfor ligeledes værdien Vol0± (0), hvor Vol± (t) her
beregnes for hele overfladens volumen-bidrag (med fortegn) ved flow langs flow-
kurverne i forhold til den udadrettede normalvektor n∂W på overfladen.

Det er indholdet af Gauss’ divergenssætning:


Z Z
d
Vol± (t)|t=0 = Div(V) dµ = V · n∂W dµ = Flux(V, ∂Wr ) . (28-90)
dt Wr ∂Wr

• En konsekvens af Gauss’ divergenssætning er følgende: Hvis et vilkårligt rum-


ligt område flyder langs flowkurverne for et divergensfrit vektorfelt, så er om-
rådets rumfang konstant i tid – selv om formen af området i tiden selvfølgelig kan
eNote 28 28.6 OPSUMMERING 33

ændre sig meget. Ethvert rotationsvektorfelt Rot(W)( x, y, z) er divergensfrit. Et


rumligt område, der ’roterer’ i den meget generelle forstand, at det flyder langs
flowkurverne for Rot(W)( x, y, z) bevarer derfor sit rumfang.
eNote 29 1

eNote 29

Stokes’ rotationssætning

I denne eNote benytter vi Gauss’ divergenssætning fra eNote 28 til at motivere, bevise, og
illustrere Stokes’ sætning, som udtrykker en præcis sammenhæng mellem rotation og
cirkulation af et givet vektorfelt: For enhver glat parametriseret flade Fr er fluxen af rotationen
af et glat vektorfelt V( x, y, z) igennem Fr lig med cirkulationen af vektorfeltet langs randkurven
∂F. Som hermed antydet får vi brug for både rum-, flade-, og kurve-integraler samt viden om
vektorfelter og deres restriktioner til flader og kurver. Det vil sige, at basismaterialet for
nærværende eNote skal findes i en række eNoter: eNote 24 (om plan- og kurve-integraler),
eNote 26 (om fladeintegraler), eNote 24 (om vektorfelter), eNote 27 (om tangentielle
kurveintegraler og cirkulationer), og eNote 28 (om flux-beregninger og Gauss’ sætning).

29.1 Stokes’ sætning

Stokes’ sætning er en af de mest elegante og mest benyttede resultater fra analysen af


vektorfelter i rummet. Sætningen har ligesom Gauss’ divergenssætning mangfoldige
anvendelser - f.eks. i fluid mekanik og i elektromagnetisme.

Her er et citat som fortæller lidt om historien bag resultatet:

The history of Stokes’ Theorem is clear but very complicated. It was first
given by Stokes without proof - as was necessary since it was given as an ex-
amination question for the Smith’s Prize Examination of that year [at Cam-
bridge in 1854]! Among the candidates for the prize was Maxwell, who later
eNote 29 29.1 STOKES’ SÆTNING 2

Figure 29.1: George Gabriel Stokes. Se Biografi.

traced to Stokes the origin of the theorem, which by 1870 was frequently
used. On this see George Gabriel Stokes, Mathematical and Physical Papers,
vol. V (Cambridge, England, 1905), 320–321. See also the important histori-
cal footnote which indicates that Kelvin in a letter of 1850 was the first who
actually stated the theorem, although others as Ampére had employed "the
same kind of analysis ... in particular cases."

M. J. Crowe, [A history of vector analysis, 1967], s. 147.

Figure 29.2: James Clerk Maxwell (Biografi), William Thomson (Lord Kelvin) (Biografi), og
Andrè-Marie Ampére (Biografi).

Som antydet er Stokes’ resultat af samme kaliber som Gauss’ divergens-sætning. De


er begge to medlemmer af en ’familie’ af resultater, hvor hovedideen er at omskrive et
eNote 29 29.1 STOKES’ SÆTNING 3

integral over et område til en andet integral over områdets rand - altså så at sige ’skubbe
integrationen ud på randen’. Det ældste medlem af den familie er Integralregningens
fundamental-sætning, jvf. sætning 23.13 eNote 23 som vi gentager her med følgende
formulering:

Sætning 29.1 Integralregningens fundamentalsætning


Lad f (u) betegne en kontinuert funktion på R. Så er følgende funktion differentiabel
Z x
A( x ) = f (u) du med A0 ( x ) = f ( x ) . (29-1)
0
Hvis F ( x ) er en (anden) funktion, som opfylder F 0 ( x ) = f ( x ), så er
Z b
f (u) du = F (b) F ( a) . (29-2)
a

Her er nu formuleringen af Stokes’ sætning:

Sætning 29.2 Stokes’ sætning


Lad Fr betegne en glat parametriseret flade med randkurven ∂Fr og enheds-normal-
vektorfelt nF og lad V være et glat vektorfelt i R3 . Så gælder
Z Z
Rot(V) · nF dµ = V · e∂F dµ . (29-3)
F ∂F

Ved beregning af højresiden skal orienteringen (givet ved retningen af enheds-


tangent-vektorfeltet e∂F ) af randen vælges således at krydsproduktet e∂F ⇥ nF peger
væk fra fladen langs med randen.
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 4

Stokes’ sætning udtrykker altså – ligesom (29.1.2) – at et indre integral (her på


et fladestykke) kan udtrykkes som et rand-integral (langs fladestykkets rand).
Stokes’ sætning kan også formuleres som følger, idet vi henviser til definition-
erne af flux og cirkulation i henholdsvis eNote 28 og eNote 27:

Flux(Rot(V), Fr ) = Cirk(V, ∂F ) . (29-4)

Det vil sige: Fluxen af rotationen af vektorfeltet V igennem fladen Fr er lig med
cirkulationen af vektorfeltet langs fladestykkets lukkede randkurve ∂F.

Læg mærke til, at hvis Fr er hele overfladen af et rumligt område, så er ∂F = ∆,


og derfor følger det af Stokes’ sætning at

Flux(Rot(V), Fr ) = 0 (29-5)

i overensstemmelse med den følgesætning fra Gauss’ divergenssætning som


er nævnt i sætning 28.15 i eNote 28.

29.2 Motivering af – og et bevis for – Stokes’ sætning

Vi får brug for følgende resultat, som også er nævnt i afsnit 26.4 i eNote 26:

Sætning 29.3
Lad V( x, y, z) og W( x, y, z) betegne to vektorfelter i R3 . Så gælder følgende iden-
titet
Div(V ⇥ W) = Rot(V) · W V · Rot(W) . (29-6)
Specielt har vi derfor: Hvis W er et gradient-vektorfelt for en funktion y( x, y, z) i
R3 , dvs. W = r(y) , så får vi fra Rot(r(y)) = 0 :

Div(V ⇥ r(y)) = Rot(V) · r(y) . (29-7)

Ved at bruge Gauss’ divergens-sætning (sætning 28.15 eNote 28) i forbindelse med
(29.2.7) får vi direkte et interessant resultat om integraler over rumlige områder således:
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 5

Sætning 29.4 En konsekvens af Gauss’ divergenssætning


Lad y( x, y, z) betegne en glat funktion og V( x, y, z) et glat vektorfelt i R3 . Lad W
være et rumligt område med randen ∂W og udadrettet enheds-normalvektorfelt
n∂W på ∂W.

Så har vi direkte fra Gauss’ sætning 28.15:


Z Z
Div(V ⇥ r(y)) dµ = (V ⇥ r(y)) · n∂W dµ . (29-8)
W ∂W

Ved brug af (29.2.7) har vi derfor også


Z Z
Rot(V) · r(y) dµ = (n∂W ⇥ V) · r(y) dµ . (29-9)
W ∂W

På højresiden i ligning (29.2.9) har vi benyttet, at rumproduktet [abc ] = (a ⇥


b) · c af tre vektorer a, b, og c tilfredsstiller følgende identiteter (hvoraf vi har
brugt den første):

[abc ] = [cab ] = [bca ] = [bac ] = [cba ] = [acb ] . (29-10)

Specielt får vi den totale rotationsvektor af vektorfeltet V i W således:

Følgesætning 29.5 Totale rotation i et rumligt område


Lad W være et rumligt område med randen ∂W og udadrettet enheds-
normalvektorfelt n∂W på ∂W. Så gælder for ethvert glat vektorfelt V( x, y, z):
Z Z
Rot(V) dµ = n∂W ⇥ V dµ . (29-11)
W ∂W

Bevis

Dette følger direkte af (29.2.9) ved at vælge, skiftevis, y( x, y, z) = x , y( x, y, z) = y , og


y( x, y, z) = z , således at r(y) er henholdsvis (1, 0, 0), (0, 1, 0), og (0, 0, 1).
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 6

Højresiden af ligningen (29.2.11) vil vi tillade os at kalde den totale vridning af fladen ∂W
med vektorfeltet V med hensyn til normalvektorfeltet n∂W og i øvrigt betegne denne
vektor med Vrid(V, ∂W) således:

Definition 29.6 Vridning


Lad Fr betegne en glat flade i rummet med standard enheds-normalvetorfelt nF , og
lad V( x, y, z) være et glat vektorfelt. Så definerer vi vridningen af Fr med vektorfeltet
V( x, y, z) på følgende måde:
Z
Vrid(V, Fr ) = nF ⇥ V dµ . (29-12)
Fr

Generelt er den totale rotation af et givet vektorfelt i et rumligt område (også kaldet ’to-
tal vorticity’ i fluid mekanik) altså – via 29.5 – lig med vridningen af områdets overflade
med vektorfeltet. Dette minder meget om Gauss’ tilsvarende identitet for den totale
divergens af et glat vektorfelt, sætning 28.15: Den totale divergens af vektorfeltet i et
område er lig med fluxen af vektorfeltet ud igennem overfladen af området.

I lighed med sætning 28.13 har vi da også følgende tolkning og konstruktion af rota-
tionsvektoren i et givet punkt:

Sætning 29.7
Rotationen af et vektorfelt udtrykker den volumen-relative lokale vridning af overfladen
for vektorfeltet i følgende forstand: Lad Kr betegne en massiv kugle med radius r
og centrum i punktet ( x0 , y0 , z0 ). Så gælder:
✓ ◆
1
lim Vrid(V, ∂Kr ) = Rot(V)( x0 , y0 , z0 ) . (29-13)
r!0 Vol( Kr )
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 7

Sætning 29.7 indses på samme måde som for den analoge identitet for diver-
gensen. Vektorfeltet udvikles til første orden med udviklingspunkt p og ind-
sættes i vridningsudtrykket, hvorefter følgende identiteter benyttes:

Z Z Z
x dµ = y dµ = z dµ = 0 ,
∂Kr ∂Kr ∂Kr
Z Z Z
2 2
x dµ = y dµ = z2 dµ = (4 p/3) r4 = r Vol(Kr ) ,
∂Kr ∂Kr ∂Kr
Z Z Z
x y dµ = x z dµ = z y dµ = 0 .
∂Kr ∂Kr ∂Kr
(29-14)
De eneste partielle afledede af vektorfeltets koordinatfunktioner, der ikke in-
tegreres væk, er præcis dem, der optræder i rotationsvektoren Rot(V) når
denne evalueres i p. Prøv det!

Eksempel 29.8 Lokal vridning af kugleflade giver rotationsvektoren

Vi ser på et roterende vektorfelt V( x, y, z) = ( y, x, 1). Dette felt har den konstante rotation
Rot(V) = (0, 0, 2) . Vi vil vise, hvordan Vrid(V, ∂Kr ) netop giver denne rotation i punk-
tet (0, 0, 0). Lad altså Kr betegne den kugleflade, der har radius r , centrum i (0, 0, 0), og
overflade ∂Kr med udadrettet normalvektorfelt n = 1r ( x, y, z). Så er
Z
Vrid(V, ∂Kr ) = n∂K ⇥ V dµ
∂Kr
Z
1
= ( x, y, z) ⇥ ( y, x, 1) dµ
r ∂Kr
Z
1
= ( y x z , x y z , x2 + y2 ) dµ
r ∂Kr
= (0, 0, 2 Vol(Kr ) )
= Vol(Kr ) Rot(V)(0, 0, 0) ,

i overensstemmelse med sætning 29.7.

I mere komplicerede tilfælde kan den totale vridning af en flade med et givet
vektorfelt beregnes med Maple. Hvis den aktuelle flade er randoverfladen af
et givet rumligt område kan vridningen også beregnes som integralet af det
tilhørende rotationsvektorfelt over det rumlige område. Derved muliggøres
naturligvis også konkrete eftervisninger af ligning (29.2.11).
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 8

29.2.1 Fladen, randen, og normal-vektorfeltet

De flader, der betragtes i Stokes’ sætning er parametriserede på sædvanlig vis:

Fr : r(u, v) = ( x (u, v), y(u, v), z(u, v)) 2 R3 , (29-15)

hvor
(u, v) 2 D = [ a, b] ⇥ [c, d] ⇢ R2 . (29-16)

Randen ∂Fr af Fr fremkommer ved at bruge vektorfunktionen r på de 4 rette linjestykker,


der udgør randen ∂D af det rektangulære parameterområde D = [ a, b] ⇥ [c, d]. Vi
parametriserer hele ∂D på én gang ved hjælp af en parameter q og en vektor-funktion
d:
∂D : d(q ) = (u(q ), v(q )) 2 ∂D ⇢ R2 , q 2 I ⇢ R ,
hvor u(q ) og v(q ) kun er stykkevis differentiable funktioner af q. De kan f.eks. vælges
som lineære funktioner af q for hvert enkelt af de 4 linjestykker der udgør ∂D.

Randen af Fr er så

∂Fr : b(q ) = r(d(q )) = r(u(q ), v(q )) 2 R3 , q 2 I ⇢ R .

Jacobi-funktionerne for r og b er henholdsvis:

Jacobir (u, v) = kr0u ⇥ r0v k , og (29-17)

Jacobib (q ) = kb0q k . (29-18)


Regulariteten af r giver

Jacobir (u, v) > 0 for all (u, v) 2 D .


Enheds-normalvektorfeltet langs Fr er tilsvarende nF = n(u, v):
r0u ⇥ r0v
n(u, v) = for alle (u, v) 2 D . (29-19)
kr0u ⇥ r0v k

29.2.2 Tubulære skaller og en afstandsfunktion

Vi definerer den tubulære skal med tykkelse t ud fra Fr som følgende område i R3 :

Wt : R(u, v, w) = r(u, v) + w n(u, v) , (u, v) 2 D , w 2 [0, t] . (29-20)


eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 9

Specielt er fladen Fr netop basis-fladen for skallen og fås ved at bruge afbildningen R på
D (hvor w = 0):
F0 = FR (0) = Fr : r(u, v) = R(u, v, 0) , (u, v) 2 D . (29-21)
Tilsvarende får vi, for w = t, top-fladen af skallen. Den er parametriseret således:
Ft = FR (t) = Fbr : br(u, v) = R(u, v, t) , (u, v) 2 D . (29-22)

Figure 29.3: En tubulær skal der er defineret ved flow langs enheds-normalvektorfeltet nF
fra et kvadrat.

Figure 29.4: En tubulær skal der er defineret ved flow langs enheds-normalvektorfeltet nF
fra et fladestykke af en kugleflade.

Jacobi-funktionen for R er
JacobiR (u, v, w) = | R0u ⇥ R0v · R0w |
(29-23)
= | (r0u + w n0u ) ⇥ (r0v + w n0v ) · nF | .
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 10

Da nF er et enhedsvektorfelt som er parallelt med r0u ⇥ r0v langs Fr , får vi specielt (for
w = 0):
JacobiR (u, v, 0) = | r0u ⇥ r0v · nF |
= kr0u ⇥ r0v k (29-24)
= Jacobir (u, v) > 0 .

Afbildningen R er regulær og bijektiv på D ⇥ [0, t] - hvis blot t er tilstrækkelig lille. Det


følger dels af JacobiR (u, v, 0) > 0 og dels af kontinuiteten af JacobiR (u, v, w).

Værdien af w betragtet som en funktion på Wt ⇢ R3 er en differentiabel funktion af


de tre rum-variable ( x, y, z). Selv om dette kan forekomme at være helt tydeligt, rent
intuitivt, så er det faktisk et resultat, der finder sin bedste formulering og begrundelse i
den såkaldte invers funktions-sætning, som dyrkes i kurset Matematik 3:

Sætning 29.9 Invers funktionssætning


Lad Q betegne en åben mængde i R3 og lad f : Q ! R3 betegne en differentiabel
bijektiv afbildning med Jacobif (x) > 0 for alle x 2 Q.

Så er den omvendte afbildning f 1 : f( Q) ! Q også differentiabel med


Jacobif 1 (y) > 0 for alle y 2 f( Q).

Intuitionen er altså i dette tilfælde præcis og korrekt. Når t er tilstrækkelig lille, så er


w en differentiabel funktion af de tre rum-variable, ( x, y, z); lad os kalde den funktion
h( x, y, z), ( x, y, z) 2 Wt . Den funktion har så en egentlig gradient r(h)( x, y, z), som er
vinkelret på niveaufladerne for h. Specielt er r(h) vinkelret på top-fladen Ft = FR (t) af
skallen Wt , hvor h = t og den er tilsvarende vinkelret på basis-fladen F0 = FR (0) = Fr ,
hvor h = 0.

Gradienten r(h) er faktisk præcis lig med nF på basis-fladen. For at indse dette behøver
vi kun at vise, at længden af gradienten der er 1. Retningen er jo den samme. Lad derfor
(u0 , v0 ) betegne et punkt i D og betragt restriktionen af h til den rette linje r(u0 , v0 ) +
w n(u0 , v0 ), hvor w 2 [0, t]. Lad os benytte notationen r0 = r(u0 , v0 ) og n0 = n(u0 , v0 ).
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 11

Så giver kædereglen
d
1 = | h(r0 + w n0 ) |
dw
= | n0 · r(h)(r0 + w n0 ) | (29-25)
= kr(h)(r0 + w n0 ) k ,
således at vi på fladen Fr , hvor w = 0, har kr(h)(r0 )k = 1 . Det var det, vi skulle vise.
Vi har derfor:
r(h)| F = nF . (29-26)

Funktionen h( x, y, z) er den Euklidiske afstand fra punktet ( x, y, z) til fladen


Fr . Lokalt, dvs. tilstrækkeligt tæt på (og i normalretningen af) fladen Fr er
rh( x, y, z) en udvidelse af enhedsnormalvektorfeltet nF til fladen. Vektorfel-
tet rh( x, y, z) er selv et enhedsvektorfelt. Ved at lade Fr flyde tiden t langs
flowkurverne for rh( x, y, z) dannes (udfejes) det rumlige område, den mas-
sive skal, Wt , se figurerne 29.3, 29.4.

29.2.3 Integration i skallen

For en funktion f ( x, y, z) som er defineret i Wt fås integralet af f over området således:


Z
f dµ
Wt
Z t ✓Z ◆ (29-27)
= f (R(u, v, w)) JacobiR (u, v, w) du dv dw .
0 D

Den t-afledede af dette integral er, for t = 0, simpelthen fladeintegralet af f over Fr :

Hjælpesætning 29.10 Fladeintegral som t-afledet af rumintegral

✓ ◆ Z Z
d
f dµ = f dµ . (29-28)
dt | t =0 Wt Fr
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 12

Bevis

Det følger direkte af fundamentalsætningen 29.1:


✓ ◆ Z
d
f dµ
dt |t=0 Wt
✓ ◆ Z t ✓Z ◆
d
= f (R(u, v, w)) JacobiR (u, v, w) du dv dw
dt |t=0 0 D
Z
(29-29)
= f (R(u, v, 0)) JacobiR (u, v, 0) du dv
ZD
= f (r(u, v)) Jacobir (u, v) du dv
ZD
= f dµ .
Fr

29.2.4 The Wall - Væggen

Skallen Wt har en rand ∂Wt som består af top-fladen Ft , basis-fladen F0 = Fr = FR (0)


og en ’væg’ Wt med højden t. Se figurerne 29.3 og 29.4. Væg-komponenten fås ved
restriktion af afbildningen R til ∂D ⇥ [0, t] således:

Wt : B(q, w) = R(u(q ), v(q ), w)


= r(u(q ), v(q )) + w n(u(q ), v(q )) (29-30)
= b(q ) + w n(d(q )) , q 2 I , w 2 [0, t] .

Jacobi-funktionen for denne afbildning er derfor

JacobiB (q, w) = kB0q ⇥ B0w k


(29-31)
= k(b0q + w (n d)0q ) ⇥ nF k .

Da nF står vinkelret på fladen Fr og derfor også på randen ∂Fr (parametriseret via b), får
vi:
JacobiB (q, 0) = kb0q ⇥ nF k = kb0q k = Jacobib (q ) . (29-32)
eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 13

29.2.5 Integration langs væggen

For en given funktion g( x, y, z) defineret på Wt fås integralet af g over den flade:


Z Z t ✓Z ◆
g dµ = g(B(q, w)) JacobiB (q, w) dq dw . (29-33)
Wt 0 I

Den t-afledede af dette integral er, for t = 0, kurve-integralet af g over ∂F:

Hjælpesætning 29.11 Kurveintegral som t-afledet af fladeintegral

✓ ◆ Z Z
d
g dµ = g dµ . (29-34)
dt |t=0 Wt ∂F

Bevis

Det følger igen af fundamentalsætningen, Sætning 29.1:


✓ ◆ Z
d
g dµ
dt |t=0 Wt
✓ ◆ Z t ✓Z ◆
d
= g(B(q, w)) JacobiB (q, w) dq dw
dt |t=0 0 I
Z
(29-35)
= g(B(q, 0)) JacobiB (q, 0) dq
ZI
= g(b(q )) Jacobib (q ) dq
ZI
= g dµ .
∂F

29.2.6 Bevis for Stokes’ sætning

Vi er nu parate til at bevise Stokes’ Sætning


eNote 29 29.2 MOTIVERING AF – OG ET BEVIS FOR – STOKES’ SÆTNING 14

Bevis

Funktionen h( x, y, z) fra det foregående afsnit indsættes i stedet for y( x, y, z) i Sætning 29.4,
ligning (29-9). Med integrations-området W = Wt får vi så:
Z
Rot(V) · r(h) dµ
Wt
Z
= (n∂Wt ⇥ V) · r(h) dµ
∂Wt
Z
= (nFt ⇥ V) · r(h) dµ (29-36)
Ft
Z
(nF0 ⇥ V) · r(h) dµ
F0
Z
+ (nWt ⇥ V) · r(h) dµ .
Wt

Men i ligning (29-36) har vi


Z
(nFt ⇥ V) · r(h) dµ = 0 og
Ft
Z (29-37)
(nF0 ⇥ V) · r(h) dµ = 0 ,
F0

idet r(h) er vinkelret på begge fladerne Ft og F0 således at r(h) er proportional med hen-
holdsvis nFt og nF0 på de respektive flader.
Langs ∂F ⇢ Wt har vi nWt = e∂F ⇥ nF og derfor e∂F = nF ⇥ nWt - i overensstemmelse med
orienteringsreglen i Sætning 29.2. Hvis vi t-afleder begge sider af den reducerede ligning
(29-36) får vi: ✓ ◆ Z
d
Rot(V) · r(h) dµ
dt |t=0 Wt
✓ ◆ Z (29-38)
d
= (nWt ⇥ V) · r(h) dµ ,
dt |t=0 Wt
således at vi endelig har - i kraft af ligningerne (29-28) og (29-34):
Z
Rot(V) · nF dµ
ZF
= (nWt ⇥ V) · nF dµ
Z∂F (29-39)
= V · (nF ⇥ nWt ) dµ
Z∂F
= V · e∂F dµ .
∂F

Stokes’ sætning er dermed bevist.


eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 15

29.3 Verificering af Stokes’ sætning i konkrete eksempler

I lighed med Gauss’ divergens-sætning kan Stokes’ sætning verificeres ved i konkrete
givne tilfælde at beregne begge sider af identiteten (29.1.3) i Stokes’ sætning.

Eksempel 29.12 Stokes’ sætning med en cirkelskive

En standard cirkelskive i ( x, y)-planen er givet ved sin sædvanlige parameterfremstilling:


Fr : r(u, v) = (u · cos(v), u · sin(v), 0) , (u, v) 2 [0, 1] ⇥ [ p, p ] (29-40)
med Jacobifunktionen
Jacobir (u, v) = u , (29-41)
standard enhedsnormalvektorfelt til fladen
nF = (0, 0, 1) , (29-42)
og standard enheds-tangentvektorfelt langs den cirkulære rand ∂F:
e∂F = r0v (1, v) = ( sin(v) , cos(v) , 0) . (29-43)

Bemærk, at det er r(1, v), v 2 [ p, p ], der giver hele randen, at r0v (1, v) er en
enhedsvektor for alle v, og at r0v (1, v) ⇥ nF peger væk fra cirkelskiven langs hele
randkurven.

Et glat vektorfelt i rummet er givet ved sine koordinatfunktioner således:


V( x, y, z) = ( x · y , x , x2 ) , (29-44)
og har det tilhørende rotationsvektorfelt
Rot(V)( x, y, z) = (0 , 2·x, 1 x) . (29-45)
Vi vil verificere Stokes’ sætning ved at beregne ”begge sider” af ligning (29.1.3) i dette
konkrete tilfælde.

Den totale flux af vektorfeltet Rot(V)( x, y, z) igennem Fr i retning af standard-


enhedsnormalen nF = (0, 0, 1) er
Z
Flux(Rot(V), Fr ) = Rot(V) · nF dµ
Fr
Z
= (1 x ) dµ
Fr
Z p Z 1
= (1 u · cos(v)) · u du dv (29-46)
p 0
Z p ✓ ◆
1 1
= · cos(v) dv
p 2 3
=p .
eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 16

Cirkulationen af vektorfeltet V( x, y, z) langs ∂Fr i retning af standard-enhedstangentvekto-


rfeltet e∂F = ( sin(v), cos(v) , 0) er
Z
Cirk(V, ∂F ) = V · e∂F dµ
∂F
Z p
= V(r(1, v)) · ( sin(v), cos(v) , 0) dv
p
Z p
= (cos(v) · sin(v) , cos(v) , ⇤) · ( sin(v), cos(v) , 0) dv
p
Z p
= ( cos(v) · sin2 (v) + cos2 (v)) dv
Z p
p (29-47)
2
= cos (v) dv
p
Z
1 p
= cos2 (v) + sin2 (v) dv
2 p
Z
1 p
= 1 dv
2 p
=p .

Begge sider i ligningen (29-3) giver altså p i dette eksempel – og vi har derfor verificeret
Stokes’ sætning.

Figure 29.5: En cirkelskive i et vektorfelt V( x, y, z) = ( x · y, x, x2 ) (i midten) og vektorfeltets


rotationsvektorfelt Rot(V)( x, y, z) = (0, 2 · x, 1 x ).

Eksempel 29.13 Stokes’ sætning med en paraboloide

Et udsnit af en paraboloide er givet ved en parameterfremstilling således:

Fr : r(u, v) = (2 · u · cos(v), 2 · u · sin(v), u2 ) , (29-48)


eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 17

Figure 29.6: Restriktionen af rotationsvektorfeltet Rot(V)( x, y, z) = (0, 2 · x, 1 x ) til en


cirkelskive, cirkelskivens rand, og vektorfeltet V( x, y, z) = ( x · y, x, x2 ) restringeret til randen.

hvor
(u, v) 2 [1/2, 1] ⇥ [0, p ] (29-49)
Parameterfremstillingen har Jacobifunktionen
p
Jacobir (u, v) = 4 · u cot 1 + u2 , (29-50)
og standard-normalvektorfeltet (ikke nødvendigvis enheds-vektorer) til fladen er givet ved
NF (u, v) = r0u (u, v) ⇥ r0v (u, v) = ( 4 · u2 · cos(v), 4 · u2 · sin(v), 4 · u) . (29-51)
Et glat vektorfelt i rummet er givet ved sine koordinatfunktioner således:
V( x, y, z) = (z, y, x) , (29-52)
med det tilhørende rotationsvektorfelt
Rot(V)( x, y, z) = (0 , 2 , 0) . (29-53)
Vi vil verificere Stokes’ sætning ved at beregne ”begge sider” af ligning (29-3) i dette
konkrete tilfælde.

Den totale flux af vektorfeltet Rot(V)( x, y, z) igennem Fr i retning af standard-


enhedsnormalen er, idet vi benytter normalvektorfeltet NF (u, v) direkte:
Z
Flux(Rot(V), Fr ) = Rot(V) · nF dµ
Fr
Z p Z 1
= Rot(V) · NF (u, v) du dv
0 1/2
Z pZ 1
= 8 · u2 · sin(v) du dv (29-54)
0 1/2
Z p✓ ◆
7
= · sin(v) dv
0 3
14
= .
3
eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 18

Cirkulationen af vektorfeltet V( x, y, z) langs ∂Fr i retning af den korrekt orienterede rand-


kurve består af fire komponenter. De fås fra fladens parameterfremstilling r(u, v) dels ved at
fastholde v til at være henholdsvis 0 og p, og dels ved at fastholde u til at være henholdsvis
1/2 og 1, idet det i hvert tilfælde samtidigt sikres, at den frie parameter løber den ’rigtige
vej’, dvs. således at alle fire randkomponenter får den rette orientering i forhold til fladens
normalvektorfelt:
∂1 F : r1 (u) = r(u, 0) = (2 · u, 0, u2 ) , u 2 [1/2, 1]
r10 (u) = (2, 0, 2 · u)
(29-55)
V(r1 (u)) = (u2 , 0, 2 · u)
r10 (u) · V(r1 (u)) = 2 · u2 ,

∂3 F : r3 (u) = r(1 u + 1/2, v) = ( 3 + 2 · u, 0, ( 3/2 + u)2 ) , u 2 [1/2, 1]


r30 (u) = (2, 0, 2 · u 3)
2
V(r3 (u)) = (( 3/2 + u) , 0, 3 2 · u)
9
r30 (u) · V(r3 (u)) = + 6 · u 2 · u2 ,
2
(29-56)

∂2 F : r2 (v) = r(1, v) = (2 · cos(v), 2 · sin(v), 1) , v 2 [0, p ]


r20 (v) = ( 2 · sin(v), 2 · cos(v), 0)
(29-57)
V(r2 (v)) = (1, 2 · sin(v), 2 · cos(v))
r20 (v) · V(r2 (v)) = 2 · sin(v) · (2 · cos(v) 1) ,

∂4 F : r4 (v) = r(1/2, p v) = ( cos(v), sin(v), 1/4) , v 2 [0, p ]


r40 (v)
= (sin(v), cos(v), 0)
1 (29-58)
V(r4 (v)) = ( , sin(v), cos(v))
4
1
r40 (v) · V(r4 (v)) = · sin(v) · (cos(v) + 1) .
4

Vi har dermed følgende totale cirkulation af V( x, y, z) langs randen:


4
Cirk(V, ∂F ) = Â Cirk(V, ∂i F)
i =1
4 Z
= Â V(ri (t)) · ri0 (t) dt
i =1 ∂i F
Z 1
= 2 · u2 du
1/2
Z 1 ✓ ◆
(29-59)
9 2
+ +6·u 2·u du
1/2 2
Z p
+ 2 · sin(v) · (2 · cos(v) 1) dv
0
Z p
1
+ · sin(v) · (cos(v) + 1) dv
0 4
7 7 1 14
= 4+ = .
12 12 2 3
eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 19

Begge sider i ligningen (29-3) giver altså 14/3 i dette eksempel, og vi har således igen
verificeret Stokes’ sætning.

Figure 29.7: Et stykke af en paraboloide i et vektorfelt V( x, y, z) = (z, y, x ) (i midten) og


vektorfeltets rotationsvektorfelt Rot(V)( x, y, z) = (0, 2, 0).

Figure 29.8: Restriktionen af rotationsvektorfeltet Rot(V)( x, y, z) = (0, 2, 0) til et stykke af en


paraboloide, fladestykkets rand, og vektorfeltet V( x, y, z) = (z, y, x ) restringeret til randen.

Opgave 29.14

Lad Fr betegne den flade, der har følgende parameterfremstilling og parameter-område:

Fr : r(u, v) = ((1 + u2 ) cos(v), (1 + u2 ) sin(v), sin(u)) , (29-60)

hvor
p p p
(u, v) 2 [ , ] ⇥ [ p, ] . (29-61)
2 2 2
Verificér at Stokes’ sætning er opfyldt for vektorfeltet V = (yx , yz , xz) over fladen Fr med
den givne rand ∂Fr .
eNote 29 29.3 VERIFICERING AF STOKES’ SÆTNING I KONKRETE EKSEMPLER 20

Figure 29.9: August Ferdinand Möbius, se Biografi.

Opgave 29.15

Lad Fr betegne den flade – et såkaldt Möbius-bånd – der har følgende parameterfremstilling
og parameter-område:

Fr : r(u, v)
(29-62)
= (2 cos(u) + v cos(u/2) cos(u) , 2 sin(u) + v cos(u/2) sin(u) , v sin(u/2)) ,

hvor (u, v) 2 [ p, p ] ⇥ [ 1, 1]. Verificér at Stokes’ sætning er opfyldt for vektorfeltet V =


( y , x , 1) over fladen Fr med den givne rand ∂Fr , se Figur 29.10: Vis eksplicit, at der gælder:
Z Z
Rot(V) · nF dµ = V · e∂F dµ = 32 . (29-63)
F ∂F

Figure 29.10: Et Möbius bånd i et vektorfelt V( x, y, z) = ( y, x, 1) (i midten) og vektorfeltets


rotationsvektorfelt Rot(V)( x, y, z) = (0, 0, 2).
eNote 29 29.4 STOKES’ SÆTNING I PLANEN 21

Opgave 29.16

Lad nu Gr betegne det samme Møbius-bånd som i opgave 29.15:

Gr : r(u, v)
(29-64)
= (2 cos(u) + v cos(u/2) cos(u) , 2 sin(u) + v cos(u/2) sin(u) , v sin(u/2)) ,

men nu med et lidt modificeret parameterområde:

(u, v) 2 [0, 2p ] ⇥ [ 1, 1] . (29-65)

Verificér at Stokes’ sætning er opfyldt for vektorfeltet V = ( y , x , 1) over fladen Gr med


den givne rand ∂Gr : Vis eksplicit, at der gælder:
Z Z
Rot(V) · nG dµ = V · e∂G dµ = 0 . (29-66)
Gr ∂Gr

Opgave 29.17

Forklar forskellen mellem de to (værdi-)resultater (henholdsvis 32 og 0), der opnås i


henholdsvis (29-63) og (29-66). Vink: Hold je med normalvektorfeltet nF .

Hvilke værdier for rotationsflux og cirkulation opnås ved at skifte intervaller i parametris-
eringen, dvs. ved blot at benytte følgende parameterintervaller for forskellige a 2 R:

(u, v) 2 [ p + a, p + a] ⇥ [ 1, 1] ? (29-67)

29.4 Stokes’ sætning i planen

Plane områder, for eksempel områder i ( x, y) planen, kan parametriseres således:

Fr : r(u, v) = ( x (u, v), y(u, v), 0) 2 R3 , (u, v) 2 D = [ a, b] ⇥ [c, d] ⇢ R2 .


(29-68)

Et plant område har et særligt simpelt enhedsnormal-vektorfelt i rummet, dvs. når


vi betragter det plane område som en flade i rummet, der tilfældigvis ligger helt i
eNote 29 29.4 STOKES’ SÆTNING I PLANEN 22

Figure 29.11: Restriktionen af rotationsvektorfeltet Rot(V)( x, y, z) = (0, 0, 2) til et stykke af et


Möbius bånd, båndets rand, og vektorfeltet V( x, y, z) = ( y, x, 1) restringeret til randen.

( x, y) planen: nF = (0, 0, 1).

Med hensyn til randen af det plane område repeterer vi notationen fra afsnit 29.2.1:
Randen ∂Fr af Fr fremkommer ved at bruge vektorfunktionen r på de 4 rette linjestykker,
der udgør randen ∂D af det rektangulære parameterområde D = [ a, b] ⇥ [c, d]. Vi
parametriserer hele ∂D på én gang ved hjælp af en parameter q og en vektor-funktion
d:
∂D : d(q ) = (u(q ), v(q )) 2 ∂D ⇢ R2 , q 2 I ⇢ R ,
hvor u(q ) og v(q ) kun er stykkevis differentiable funktioner af q. De kan f.eks. vælges
som lineære funktioner af q for hvert enkelt af de 4 linjestykker der udgør ∂D.

Randen af Fr er så

∂Fr : b(q ) = r(d(q )) = r(u(q ), v(q )) 2 R2 ⇢ R3 , q 2 I = [0, T ] ⇢ R . (29-69)

Lad nu V( x, y, z) = (V1 ( x, y, z), V2 ( x, y, z), V3 ( x, y, z)) betegne et vilkårligt vektorfelt i


rummet, så har vi følgende konsekvens af Stokes’ sætning:
eNote 29 29.4 STOKES’ SÆTNING I PLANEN 23

Sætning 29.18 Stokes’ sætning i planen


Med ovenstående notation gælder:
Z Z
Rot(V) · nF dµ = V · e∂F dµ
Fr ∂F
Z Z
Rot(V) · (0, 0, 1) dµ = (V1 , V2 , V3 ) · e∂F dµ
Z Fr Z∂F (29-70)
Rot(V) · (0, 0, 1) dµ = (V1 , V2 , V3 ) · b0 (q ) dq
Fr I
Z ✓ ◆ Z T
∂V2 ∂V1
dµ = V1 b10 (q ) + V2 b20 (q ) dq ,
Fr ∂x ∂y 0

og dermed
Z dZ b ✓ ◆ Z T
∂V2 ∂V1
Jacobir (u, v) du dv = V1 b10 (q ) + V2 b20 (q ) dq . (29-71)
c a ∂x ∂y 0

Bemærkning 29.19
Det ses, at vektorfeltets tredie koordinat-funktion V3 ( x, y, z) ikke spiller nogen rolle i
sætningen. Sætningen er derfor et resultat om vektorfunktioner i planen: V( x, y) =
(V1 ( x, y), V2 ( x, y)) . Vi illustrerer med et detaljeret - men simpelt - eksempel neden-
for.

Eksempel 29.20 Stokes’ sætning i planen

Lad V( x, y) = ( y, x ) og r(u, v) = (3u, 4v), u 2 [ a, b], v 2 [c, d], så får vi: Jacobir (u, v) = 12
∂V1
og ∂V
∂x
2
∂y = 2 sådan at venstre side i ligning (29.4.71) giver:
Z dZ b ✓ ◆
∂V2 ∂V1
Jacobir (u, v) du dv
c a ∂x ∂y
Z dZ b
(29-72)
= 2 · 12 du dv
c a
= 24(b a)(d c) .
Højre side i ligning (29.4.71) skal give samme værdi.
eNote 29 29.4 STOKES’ SÆTNING I PLANEN 24

Vi bestemmer højre sides værdi ved at opdele randen af Fr i 4 retlinede komponenter og


ved at beregne det tangentielle kurveintegral af V langs hver komponent, idet vi i hvert
tilfælde sørger for at orientere (parametrisere) komponenten korrekt efter den forskrift, som
er præciseret i Stokes’ sætning.

Vi begynder med at sætte T = 2(b a) + 2(d c), dvs. T er den totale omkreds af parame-
terområdet D. Randen af D kan vi så parametrisere på følgende måde:
d( q ) = ( a + q , 0) for q 2 [0 , b a]
d( q ) = ( b , c + q ) for q 2 [b a, b a+d c]
(29-73)
d( q ) = ( b q , d) for q 2 [b a+d c , 2( b a) + d c]
d( q ) = ( a , d q) for q 2 [2( b a) + d c , 2( b a ) + 2( d c)] .
Randen af Fr har vi dernæst på følgende form:
b( q ) = (3( a + q ) , 0) for q 2 [0 , b a]
b(q ) = (3b , 4(c + q )) for q 2 [b a, b a+d c]
(29-74)
b( q ) = (3( b q ) , 4d) for q 2 [b a+d c , 2( b a) + d c]
b(q ) = (3a , 4(d q )) for q 2 [2( b a) + d c , 2( b a ) + 2( d c)] ,
og dermed:
b0 ( q ) = ( 3 , 0 ) for q 2 [0 , b a]
0
b ( q ) = (0 , 4) for q 2 [b a, b a+d c]
0
(29-75)
b ( q ) = ( 3 , 0) for q 2 [b a+d c , 2( b a) + d c]
b0 ( q ) = ( 0 , 4) for q 2 [2( b a) + d c , 2( b a ) + 2( d c)] .

Vi kan nu beregne højresiden i ligning (29.4.71) som summen af de 4 led, der stammer fra
hver sin komponent af randkurven. For eksempel, for det frste linjestykke i randkurven,
som er parallel med x aksen og med konstant y = 4c har vi: q 2 [0, b a] har vi b10 (q ) = 3,
b20 (q ) = 0, V1 ( x, y) = y = b2 (u, v) = 4v = 4c og ligeledes for de andre 3 bidrag (se figurerne
29.12 og 29.13):
Z T
V1 b10 (q ) + V2 b20 (q ) dq =
0
Z b a
12c dq
0
Z b a+d c
+ 12b dq
b a
Z 2(b a)+d c
+ 12d dq
b a+d c
Z 2(b a)+2(d c)
+ 12a dq (29-76)
2(b a)+d c

=
12c(b a)
+ 12b(d c)
+ 12d(b a)
+ 12a(d c)
=
24(b a)(d c) ,
eNote 29 29.4 STOKES’ SÆTNING I PLANEN 25

i overensstemmelse med resultatet i ligning (29-72), sådan at den generelle ligning (29-71)
dermed er verificeret i dette tilfælde.

Figure 29.12: 3D versionering af eksempel 29.20. Vektorfeltet V( x, y) = ( y, x, 0) har


rotationsvektorfeltet (0, 0, 2). Her er valgt et kvadrat med parameterfremstilling r(u, v) =
(3u, 4v, 0) , u 2 [ a, b], v 2 [c, d], a = 1/3, b = 1/3, c = 1/4, og d = 1/4.

Figure 29.13: Opstilling af fluxen af rotationsvektorfeltet Rot(V( x, y, z) = (0, 0, 2) igennem


kvadrat i ( x, y)-planen og tilhørende cirkulation af vektorfeltet V( x, y, z) = ( y, x, 0) langs den
firkantede randkurve.
eNote 29 29.5 OPSUMMERING 26

29.5 Opsummering

Vi har set her, at fluxen af et rotationsvektorfelt Rot(V)( x, y, z) igennem en flade kan


beregnes som cirkulationen af V( x, y, z) langs randkurven til fladen – passende orien-
teret.

• Lad Fr betegne en glat parametriseret flade med randkurven ∂Fr og enheds-nor-


malvektorfelt nF og lad V være et glat vektorfelt i R3 . Så udtrykker Stokes’ sæt-
ning følgende identitet
Z Z
Rot(V) · nF dµ = V · e∂F dµ . (29-77)
F ∂F

Ved beregning af højresiden er det vigtigt (for at få det korrekte fortegn) at orien-
teringen af randen vælges sådan at krydsproduktet e∂F ⇥ nF peger væk fra fladen
langs med randen.

• Alternativt kan Stokes’ sætning udtrykkes således: Fluxen af rotationen af vektor-


feltet V igennem fladen Fr er lig med cirkulationen af vektorfeltet langs fladestykkets
lukkede randkurve ∂F:

Flux(Rot(V), Fr ) = Cirk(V, ∂F ) . (29-78)

• Den Totale rotation af et vektorfelt i et rumligt område kan tilsvarende beregnes


ved fladeintegral over den totale overflade af området: Lad W være et rumligt
område med randen ∂W og udadrettet enheds-normalvektorfelt n∂W på ∂W. Så
gælder for ethvert glat vektorfelt V( x, y, z):
Z Z
Rot(V) dµ = n∂W ⇥ V dµ = Vrid(V, ∂W) . (29-79)
W ∂W

You might also like