Professional Documents
Culture Documents
Numerical Analysis PDF
Numerical Analysis PDF
Πρόκειται για την πρώτη τους έκδοση και επομένως υπάρχουν ελλείψεις, κυρίως σε
παραδείγματα και σε αποδείξεις θεωρημάτων, ενώ απαιτούνται αρκετές βελτιώσεις. Σε
σχέση με το υλικό που διδάχτηκε στο μάθημα οι περισσότερες ελλείψεις
παρουσιάζονται στο 3ο κεφάλαιο, δηλαδή στην επίλυση των συστημάτων γραμμικών
εξισώσεων. Επομένως, οι σημειώσεις αυτές πρέπει να χρησιμοποιηθούν μόνο
συμπληρωματικά με το επίσημο σύγγραμμα του μαθήματος, δηλαδή την «Εισαγωγή
στην Αριθμητική Ανάλυση» των Γ.Δ. Ακρίβη και Β.Α. Δουγαλή, 5η αναθεωρημένη
έκδοση, Πανεπιστημιακές Εκδόσεις Κρήτης, 2006.
Η νέα έκδοση των παρόντων σημειώσεων θα ολοκληρωθεί κατά το εαρινό εξάμηνο του
ακαδημαϊκού έτους 2008-2009.
Αύγουστος 2008
Κώστας Χουσιάδας
1
Πίνακας περιεχομένων
Κεφάλαιο 0: Εισαγωγή
0.1. Κατηγορίες σφαλμάτων ή λαθών
0.2. Προσέγγιση αριθμών με αποκοπή και στρογγυλοποίηση. Σημαντικά ψηφία.
2
3.8.1. Η μέθοδος Jacobi
3.8.2. Η μέθοδος Gauss-Seidel
3.8.3. Η μέθοδος διαδοχικής υπερχαλάρωσης (SOR)
3.9. Κριτήρια σύγκλισης των επαναληπτικών μεθόδων.
Βιβλιογραφία
Παράρτημα
Π1. Στοιχεία γραμμικής άλγεβρας
Π2. Νόρμες συναρτήσεων, διανυσμάτων και πινάκων
3
Κεφάλαιο 0
Εισαγωγή
4
Κατασκευάζουμε το μαθηματικό πρόβλημα το οποίο περιγράφεται με συνεχείς
συναρτήσεις
↓
(Θεωρία) Κατασκευάζουμε το αντίστοιχο μαθηματικό πρόβλημα το οποίο περιγράφεται
με διακριτές συναρτήσεις (αριθμητική μέθοδος) και το οποίο προσεγγίζει το αρχικό
πρόβλημα
b
Παράδειγμα: I = ∫ f ( x )dx με f : [ a,b] →
a
5
I. Θεωρητικά μπορεί μια μέθοδος να είναι ακριβής/ευσταθής, πρακτικά όμως να
είναι μη-υλοποιήσιμη.
II. Πρακτικά ένας αλγόριθμος μπορεί να δίνει αποτελέσματα, αλλά χωρίς
θεωρητική μελέτη δεν ξέρουμε κατά πόσο μπορούμε να τα εμπιστευτούμε ή όχι.
III. Οι αριθμητικές μέθοδοι για την επίλυση ενός προβλήματος μπορεί να είναι
πολλές. Με βάση τα θεωρητικά και πρακτικά χαρακτηριστικά επιλέγουμε κάθε
φορά ποια από τις διαθέσιμες θα εφαρμόσουμε.
x − xπρ
(b) Το σχετικό σφάλμα: RE = , x≠0
x
x − xπρ
ως ποσοστό επί τις εκατό, δηλαδή: RE = 100 %, x ≠ 0
x
3.1 − 3.0
RE = = 0.032 = 3.2% .
3.1
Παράδειγμα ΙΙ: Έστω πληθυσμός x = 10100 και xπρ = 10000 . Τότε E = 100 και
100
RE = 0.01 1%
10100
Παράδειγμα ΙΙΙ: Έστω ποσότητα φαρμάκου που πρέπει να χορηγηθεί σε έναν ασθενή
x = 0.01 gr και xπρ = 0.015 gr η ποσότητα που πραγματικά χορηγείται. Τότε E = 0.005
0.005
και RE = = 0.5 = 50% .
0.01
6
Από τα παραπάνω είναι φανερό ότι το RE είναι καλύτερος δείκτης ακρίβειας, σε σχέση
με το E για την εκτίμηση μίας προσέγγισης.
x 2 x3
π.χ. ex = 1 + x + + + , δηλαδή όταν αντικαθιστούμε
2 ! 3 ! σφαλμα
αποκοπης
Στόχος στο πρώτο κεφάλαιο αυτών των σημειώσεων είναι η μελέτη των λαθών λόγω
προσέγγισης των αριθμών, ενώ στα επόμενα κεφάλαια εξετάζονται κυρίως τα λάθη
αποκοπής και η επίδρασή τους στα αποτελέσματα των αλγορίθμων.
Έστω ότι θέλουμε να κάνουμε πράξεις με αριθμούς που έχουν είτε άπειρα ψηφία (π.χ.
7
x − xπρ
≤ 0.5 ×10− k +1 , x ≠ 0 (*)
x
( 5)
¾ Στρογγυλοποίηση: π = 3.1415 9ο 265 ⇒ π στρ . = 3.1416
'6 '
-Το απόλυτο και το σχετικό σφάλμα στην αποκοπή είναι Eαπ . = 0.926536 × 10−4 και
προκύπτει k = 6 .
Παρατήρηση: γενικά ισχύει ότι το απόλυτο σφάλμα στην στρογγυλοποίηση είναι
μικρότερο ή ίσο του απολύτου σφάλματος στην αποκοπή, Eστρ . ≤ Eαπ . και το ίδιο ισχύει
8
Kεφάλαιο 1ο
Αριθμητική του ηλεκτρονικού υπολογιστή
αριθμών. Η βάση είναι το «10» και τα ψηφία τα 0,1,2,...,9. Κάθε αριθμός όμως μπορεί,
⎛ ⎞
± ⎜ a N a N −1a N −2 … a1a0 . a−1a−2a3 … ⎟ όπου 0 ≤ ai ≤ β − 1 , i = −∞ ,… ,N
προσημο ⎜ ⎟
⎝ ακεραιο μερος κλασματικο μερος ⎠ β
N
Ακεραιο μερος= ∑ ak β k = a0 + a1β + a2 β 2 + … + a N β N
k =0
∞
1 1 1
Κλασματικο μερος= ∑ a− k β − k = a−1 + a−2 + a−3 +…
k =1 β β 2
β3
N
± ( a N a N −1 … a1a0 .a−1a−2a3 …) = ± ∑ ak β k όπου 0 ≤ ak ≤ β − 1 , k = −∞ ,… N
k =−∞
Συνήθως ισχύει 2 ≤ β ≤ 16 (αν και β > 16 είναι εφικτό, αλλά δεν προσφέρει κάποια
9
• Άμεσος τρόπος
• Σχήμα Horner
II. Μετατροπή κλασματικού x αριθμού ( 0 < x < 1 ) από βάση β σε βάση 10
n
x = ( 0.a−1a−2 a−3 … a− n ) β = ∑ a− k β − k
k =1
III. Μετατροπή ακεραίου από βάση 10 σε βάση β σύμφωνα με τον αλγόριθμο της
διαίρεσης (δείτε και σχήμα Horner)
IV. Μετατροπή κλασματικού x από βάση 10 σε βάση β
Παρατηρήσεις σχετικά με την μετατροπή αριθμών από το ένα σύστημα αριθμών σε ένα
άλλο.
1η Παρατήρηση:
δυσκολία.
Παράδειγμα: Ο αριθμός
( 53473)8 = 3 + 7 ⋅ 81 + 4 ⋅ 82 + 3 ⋅ 83 + 5 ⋅ 84 = ( 22331)10
N
Ο υπολογισμός της ποσότητας A ( β ) = ∑a β
k =0
k
k
, μπορεί να γίνει με δύο τρόπους
a. Άμεσος τρόπος:
A ( β ) = a0 + a1β + a2 β 2 + + aN β N
έχουμε N όρους
10
• ο 2ος όρος απαιτεί 1 πολλαπλασιασμό
• ο 1ος όρος απαιτεί 0 πολλαπλασιασμούς
Άρα
N
N ( N + 1)
N + ( N − 1) + ( N − 2 ) + +1 = ∑k =
k =1 2
N ( N + 1) N2 N N 2 3N
+ N = + +N = +
2 προσθεσεις 2 2 2 2
λιγοτερο
πιο σημαντικος ορος σημαντικος
οι πολλαπλασιασμοι
b. Σχήμα Horner:
(
A ( β ) = a0 + β a1 + β ( a2 + + β ( a N −1 + a N β ) ) )
συνολο πολλαπλασιασμων: N
( )
Επομένως ο τρόπος (a) είναι O N 2 , ενώ ο (b) είναι O ( N ) και άρα το σχήμα Horner
Ερώτηση: έχει πραγματικά αξία το γεγονός ότι η μία μέθοδος είναι τάξης O ( N ) και η
άλλη O N 2 ? ( )
Αλγόριθμος:
p ← aN
για i = N − 1, 0 , −1
p ← ai + p × β (a)
Κώδικας Fortran:
11
p = a(N )
Do i = N − 1, 0 , −1
(b)
p = a ( i ) + p* β
End do
(a), (b) → 1 flop (floating point operation)
1flop: η πιο συχνή πράξη που χρησιμοποιούμε/συναντούμε στα υπολογιστικά
μαθηματικά και στους υπολογιστές. Για τον λόγο αυτό το flop έχει καθιερωθεί ως
μονάδα μέτρησης των πράξεων στους αλγορίθμους. Η ταχύτητα ενός επεξεργαστή στους
Η/Υ αλλά και των μεγάλων υπερυπολογιστικών συστημάτων μετράται σε αριθμό
flops/μονάδα χρόνου.
2η Παρατήρηση:
1 1
Παράδειγμα: ( 0.11) 2 = 1 ⋅ 1
+ 1 ⋅ 2 = ( 0.5)10 + ( 0.25)10 = ( 0.75)10
2 2
3η Παρατήρηση:
με τον αλγόριθμο της διαίρεσης. Πρώτα εκφράζουμε τον αριθμό στο νέο σύστημα:
x = ( an ...a2a1a0 ) β = ∑a β
i =0
i
i
= an β n + an −1β n −1 + ... + a1β 1 + a0
( )
x = β ... β ( β ( an β + an −1 ) + an −2 ) + an −3 + ... + a0
12
Αν διαιρέσουμε τον παραπάνω αριθμό με «β», το υπόλοιπο είναι το a0 . Αν τον νέο
αυτό είναι το τελευταίο ψηφίο του αριθμού στο νέο σύστημα, δηλαδή a3 = 3 .
4η Παρατήρηση:
∑a
a −1 a −2 a −3 a− n
x = (.a−1a−2 ...a− n ) β = −i β −i = + + + ... +
i =1
β β 2
β 3
βn
Πολλαπλασιάζοντας και τα δύο μέλη με «β», έχουμε:
a−2 a−3 a− n
β x = ( a−1.a−2 ...a− n ) β = a−1 + + + ... + όπου είναι προφανές ότι το a−1 είναι το
β 1
β 2
β n −1
ακέραιο μέρος του β x και (.a−2 ...a− n ) β το κλασματικό μέρος του. Πολλαπλασιάζουμε
13
β n x = ( a−1a−2 ...a− n +1a− n .) β = a−1β n −1 + a−2 β n − 2 + ... + a− n +1β 1 + a− n οπότε τελικά το κλασματικό
Συνολικά έχουμε: 0.9062510 = (.a−1a−2 a−3 ...a− n )2 = .111012 . Εδώ θα πρέπει να σημειωθεί
14
Επειδή η μνήμη του υπολογιστή αποτελείται από εκατομμύρια διακόπτες οι
οποίοι μπορούν (ο καθένας από αυτούς) να είναι σε δύο μόνο καταστάσεις, «κλειστός»
ή «ανοιχτός», δηλαδή, σε «0» ή «1» κατάσταση και οι οποίοι ονομάζονται bits για αυτό ο
Ελάχιστος αριθμός = 0
0 0 0 0 0 0 0 0
Μέγιστος αριθμός =
255 = 1 1 1 1 1 1 1 1 = 1 ⋅ 27 + 1 ⋅ 26 + 1 ⋅ 25 + 1 ⋅ 24 + 1 ⋅ 23 + 1 ⋅ 22 + 1 ⋅ 21 + 1 ⋅ 20
Εφόσον σε κάθε θέση έχουμε μόνο δύο δυνατότητες, αν έχω γενικά « n » θέσεις
2 ⋅ 2 ⋅ 2 ⋅ 2 ⋅ … ⋅ 2 = 2n αριθμοί
n
με την μορφή:
15
όπου
Στο σημείο αυτό να τονισθεί ότι η προσέγγιση αριθμών σε «k» ψηφία, είτε με αποκοπή
πρώτα «k» ψηφία του κλασματικού μέρους του αριθμού, να αγνοήσουμε τα υπόλοιπα
Παράδειγμα 1:
στρογγυλοποίηση αντίστοιχα είναι π αποκ = 0.31415 × 101 και π στρ = 0.31416 × 101 .
Παράδειγμα 2:
16
στρογγυλοποίηση αντίστοιχα είναι xαπ oκ = 0.13291×104 = 1329.1 και
xστρ = 0.13292 ×104 = 1329.2 . Σε 3 δεκαδικά ψηφία είναι xαπ oκ = 0.132 ×104 = 1320 και
Λόγω του γεγονότος ότι οι πραγματικοί αριθμοί μπορεί να απαιτούν άπειρα ψηφία για
Οι αριθμοί μηχανής ενός υπολογιστή είναι ένα σύνολο ρητών αριθμών, γραμμένων
17
⎛ 1 ⎞
c. Έχει μέγιστο, κατά απόλυτη τιμή, M ≡ max {Μ} , όπου M = ⎜ 1 − × βU
⎝ β t ⎟⎠
d. τα στοιχεία του συνόλου δεν είναι ισαπέχοντα
e. Κάθε πραγματικός αριθμός x , με m < x < M αναπαριστάται από την μηχανή με
σφάλμα.
⎧ 1 1−t
fl ( x ) − x ⎪ β , για στρογγυλοποιηση
Ισχύει ότι ≤ u , όπου, u = ⎨ 2
x ⎪⎩ β 1−t , για αποκοπη
Παράδειγμα 1:
Έστω σύνολο αριθμών κινητής υποδιαστολής Μ = Μ ( β = 10 ,t = 5,U = 10 ,L = −10 ) και
1ος τρόπος, (α + β ) + γ :
⎛ ⎞
z = fl ( fl (α ) + fl ( β ) ) = 0.1× 10+1 = fl ⎜ 0.10000 3 × 10+1 ⎟ ⇒ z = 0.10000 × 10+1
⎝ 5 ψηφια ⎠
18
fl ( z + fl (γ ) ) = fl ( 0.10000 × 10+1 + 0.30000 × 10−4 ) = 0.10000 × 10+1
2ος τρόπος, α + ( β + γ ) :
(
fl fl (α ) + fl ( fl ( β ) + fl (γ ) ) )
fl ( β ) + fl (γ ) = 0.00003 + 0.00003 = 0.00006 ⇒ fl ( fl ( β ) + fl (γ ) ) = 0.00006 = 0.6 × 10−4 = z
fl (α ) + z = 0.6 × 10−4 + 0.1× 101 = 1.0000 + 0.00006 = 1.00006 ⇒ fl ( fl (α ) + z ) = 0.10001×101
Άρα στον υπολογιστή η πρόσθεση δεν ικανοποιεί την προσεταιριστική ιδιότητα
(α + β ) + γ ≠ α + ( β + γ )
Επομένως η σειρά που γίνονται οι πράξεις στον υπολογιστή έχουν σημασία.
1 = 0.10000 ×101 . Ο αριθμός 10−5 ∈ Μ (10 ,5,L,U ) διότι 10−5 = 0.10000 ×10−4 . Άθροισμα:
⎛ 1 ⎞ U
I. Αν x > max {Μ} ≡ ⎜ 1 − β ⇒ overflow error (λάθος υπερχείλισης)
⎝ β t ⎟⎠
II. Αν x < min {Μ} ≡ 0.1× β L = β L −1 ⇒ underflow error (λάθος υπεκχείλισης)
19
Πιο σημαντικό είναι το overflow error γιατί έτσι οι υπολογισμοί σταματάνε και η ροή
του προγράμματος διακόπτεται. Στο underflow error, αν δηλαδή x < min {Μ} τότε,
προσέγγιση με στρογγυλοποίηση
z = fl ( f l ( x ) + f l ( y ) ) = 0.58914 × 104
Βρίσκουμε ότι:
x + y = 5891.3373414 , ακριβές άθροισμα
fl ( x ) + fl ( y ) = 0.5891373414 × 104
fl ( x + y ) = 0.58913 × 104
20
1 1−t
Προφανώς κάθε x ∈ με 0 ≤ x < β είναι λύση της εξίσωσης 1 + x = 1 . Η ποσότητα
2
1 1−t
β ονομάζεται έψιλον της μηχανής και είναι ο μικρότερος αριθμός ο οποίος αν
2
προστεθεί στην μονάδα δίνει αποτέλεσμα μεγαλύτερο του 1, δηλαδή είναι ο μικρότερος
ε ←1
εφόσον 1 + ε > 1
ε ←ε 2
eps = 1.d0
do
y = 1.d0 + eps
exit
endif
enddo
print*, 2.d0*eps
21
Άσκηση: βρείτε όλους τους αριθμούς του συνόλου αριθμών κινητής υποδιαστολής,
Υπόδειξη: Η μορφή των αριθμών που ανήκουν στο σύνολο αυτό είναι
αριθμούς (δηλαδή τους ( 0.ddd )2 ) και όλους τους αριθμούς της μορφής 2a και
συνδυάστε τα αποτελέσματα.
Έστω
= + , − ,×, ÷
και ότι ζητάμε το αποτέλεσμα της πράξης
x y
Έχουμε
fl ( fl ( x ) fl ( y ) ) = z
όπου z ∈ Μ , fl ( x ) ∈ Μ , fl ( y ) ∈ Μ .
Παρατήρηση
Έχουμε
⎧ 1 1−t
fl ( x ) − x ⎪ β , στρογγυλευση
≤u, u = ⎨2
x ⎪ β 1−t , αποκοπη
⎩
Η παραπάνω πρόταση είναι ισοδύναμη με την εξής:
22
fl ( x ) = x (1 + ε ) όπου ε = ε ( x ) με ε ≤ u
Απόδειξη:
fl ( x ) − x fl ( x ) − x
fl ( x ) = x (1 + ε ) ⇒ =ε ⇒ ε = ≤ u ⇒ ε ≤ u.
x x
Πολλαπλασιασμός:
Έστω x, y ∈ . Επιπλέον, ∃ ε1 ,ε 2 ,ε 3 με ε1 ≤ u , ε 2 ≤ u , και ε 3 ≤ u τέτοια ώστε:
z = fl ( fl ( x ) fl ( y ) ) = ⎡⎣ x (1 + ε1 ) y (1 + ε 2 ) ⎤⎦ (1 + ε 3 ) ή
z − xy xy (1 + ε1 + ε 2 + ε 3 ) − xy
σ= ≈ = ε1 + ε 2 + ε 3 ≤ ε1 + ε 2 + ε 3
xy xy
Άρα
z − xy
≤ ε1 + ε 2 + ε 3
xy
με
ε1 ≤ u ⎫
⎪ 3
ε 2 ≤ u ⎬ ⇒ ∑ ε i ≤ 3u
⎪ i =1
ε3 ≤ u ⎭
Συνεπώς
z − xy
≤ 3u → σ ≤ 3u
xy
Διαίρεση:
x ⎛ fl ( x ) ⎞ x (1 + ε1 ) x (1 + ε1 )(1 + ε 3 )
: z = fl ⎜⎜ ⎟⎟ = (1 + ε 3 ) =
y ⎝ fl ( x ) ⎠ y (1 + ε 2 ) y (1 + ε 2 )
Άρα
x (1 + ε1 )(1 + ε 3 ) ⎛ x ⎞ (1 + ε1 )(1 + ε 3 ) − 1
−⎜ ⎟
σ=
y (1 + ε 2 ) ⎝ y⎠ =
(1 + ε 2 ) ⇒
⎛x⎞ 1
⎜ y⎟
⎝ ⎠
(1 + ε1 )(1 + ε 3 ) − 1 = 1 + ε 1 + ε 1 − ε + ε 2 − ε 3 + … − 1 =
σ= ( 1 )( 3 ) ( 2 2 3 )
(1 + ε 2 )
23
1 + ε1 + ε 3 − ε 2 + Ο ( ε i2 ) − 1 ≈ ε1 + ε 3 − ε 2 ≤ ε1 + ε 2 + ε 3 ≤ 3u
1
Υπενθυμίζεται ότι: = 1 + x + x 2 + x3 + x 4 + ..., x <1
1− x
x + y : z = fl ( fl ( x ) + fl ( y ) ) = ⎣⎡ x (1 + ε1 ) + y (1 + ε 2 ) ⎦⎤ (1 + ε 3 )
z − ( x + y ) ⎡⎣ x (1 + ε1 ) + y (1 + ε 2 ) ⎤⎦ (1 + ε 3 ) − ( x + y )
σ= = ⇒
( x + y) ( x + y)
xε1 + yε 2 x ε1 + y ε 2 u( x + y )
σ ≈ ε3 + ≤ ε3 + ≤u+ (**)
x+ y x+ y x+ y
xε1 + yε 2
σ ≈ ε3 + ≤ 2u
x+ y
z − ( x + y)
Το σχετικό σφάλμα θα είναι σ = ≈ 88 ×10−4 ενώ το αντίστοιχο άνω φράγμα
( x + y)
1 1−t
αν οι αριθμοί ήταν ομόσημοι θα ήταν 2u = 2 β = 101−5 = 10−4 (!!) που δείχνει ότι το
2
σφάλμα στην αφαίρεση μπορεί να είναι πολύ μεγαλύτερο από το σφάλμα στην
πρόσθεση (Άσκηση: βρείτε πόσο ακριβώς είναι το σχετικό σφάλμα αν οι αριθμοί x και y
ήταν πράγματι ομόσημοι).
24
Παράδειγμα 2: Έστω x = 451852000 και y = −451851000 και έστω σύνολο αριθμών
Παράδειγμα 3: Έστω x = 7892 και y = 7891 και έστω σύνολο αριθμών κινητής
x
Επειδή lim = 1 θα αντιμετωπίσουμε το πρόβλημα της αφαίρεσης σχεδόν ίσων
x →0 sin ( x )
αριθμών. Έτσι κάνουμε ανάπτυγμα Taylor της συνάρτησης γύρω από το x=0 και
έχουμε:
⎛ x3 x5 x7 ⎞ x3 x5 x 7
f ( x ) = x − ⎜ x − + − + O ( x 9 ) ⎟ = − + + O ( x 9 ) . Άρα για πολύ μικρές τιμές
⎝ 3! 5 ! 7 ! ⎠ 3! 5 ! 7 !
του x μπορούμε να διατηρήσουμε μόνο τον 1ο ή και τον 2ο όρο της σειράς και να μην
έχουμε πρόβλημα με τους υπολογισμούς (γιατί?).
⎛ 1+ x ⎞
Άσκηση 1: Υπολογίστε την συνάρτηση f ( x ) = ln ⎜ ⎟ για πολύ μικρές τιμές του x ,
⎝ 1− x ⎠
ln (1 + x )
δηλαδή για x << 1 . Ομοίως για την συνάρτηση f ( x ) = .
x
25
1 1
Άσκηση 2: Αναδιαμορφώστε την έκφραση − για μεγάλες τιμές του x . Ποιο
x x +1
πρόβλημα θα παρουσιασθεί στον υπολογισμό της αρχικής έκφρασης? Διορθώνεται με την
εναλλακτική έκφραση και γιατί?
x3 x5 x 7
sin ( x ) = x − + − + O ( x9 )
3! 5 ! 7 !
x2 x4 x6
cos ( x ) = 1 − + − + O ( x8 )
2! 4! 6!
x3 2 x5 17 x 7
tan ( x ) = x + + + + O ( x9 )
3 15 315
x 2 x3 x 4
exp ( x ) = 1 + x + + + + O ( x5 )
2 ! 3! 4 !
x 2 x3 x 4 x5
ln (1 + x ) = x − + − + + O ( x6 )
2 3 4 5
n
1 n
1
Έστω ότι θέλουμε να υπολογίσουμε την σειρά S n = 1 + ∑k
k =1
2
+k
= 1+ ∑
k =1 k ( k + 1)
. Επειδή
1 1 1 ⎛ 1⎞ ⎛1 1⎞ ⎛1 1⎞ ⎛1 1 ⎞
ισχύει = − έχουμε ότι S n = 1 + ⎜1 − ⎟ + ⎜ − ⎟ + ⎜ − ⎟ + ... + ⎜ − ⎟,
k + k k k +1
2
⎝ 2⎠ ⎝ 2 3⎠ ⎝3 4⎠ ⎝ n n +1 ⎠
1
⇒ Sn = 2 − οπότε προκύπτει ότι S9 = 1.9 , S99 = 1.99 , S999 = 1.999 κτλ, και φυσικά
n +1
lim Sn = 2 . Ας αγνοήσουμε προς το παρόν ότι γνωρίζουμε τα παραπάνω και ας
n →∞
26
Αν όμως ο αλγόριθμος αυτός εφαρμοσθεί σε έναν υπολογιστή με β = 10 , t = 10 τότε θα
πάρουμε:
S9 = 1.900000000
S99 = 1.990000003
S999 = 1.999000003
S9999 = 1.999899972
Έστω τώρα ότι αλλάζουμε την σειρά με την οποία υπολογίζουμε τους όρους του
αθροίσματος. Δηλαδή:
1
T0 =
n ( n + 1)
1
Tk = Tk −1 + , k = 1, 2 ,3,...,n − 1 για k = 1, 2 ,3,...,N .
( n − k )( n − k + 1)
Tn = Tn −1 + 1
Ο αντίστοιχος αλγόριθμος είναι:
1
T←
n ( n + 1)
μηδενικό σφάλμα. Παρόλο που ξέρουμε ότι η πρόσθεση δεν έχει την προσεταιριστική
ιδιότητα στον υπολογιστή, για πιο λόγο ο δεύτερος αλγόριθμος δίνει καλύτερα
αποτελέσματα από τον πρώτο? Ας δούμε το πρόβλημα λίγο πιο γενικά και ας
υποθέσουμε ότι δίνονται «n» στο πλήθος αριθμοί των οποίων θέλουμε να βρούμε το
n
άθροισμά τους, sn = ∑a
k =1
k Για να απλοποιήσουμε την ανάλυση θα θεωρήσουμε ότι όλοι
καθώς επίσης ότι οι αριθμοί είναι διατεταγμένοι σε αύξουσα σειρά. Για λόγους
27
Για k = 2 έχουμε: s2 = fl ( s1 + a2 ) = fl ( a1 + a2 ) = ( a1 + a2 )(1 + ε1 )
Για k = 3 έχουμε:
(
Για k = 4 έχουμε: s4 = fl ( s3 + a4 ) = fl ⎡⎣( a1 + a2 )(1 + ε1 ) + a3 ⎤⎦ (1 + ε 2 ) + a4 = )
{ }
= ⎡⎣( a1 + a2 )(1 + ε1 ) + a3 ⎤⎦ (1 + ε 2 ) + a4 (1 + ε 3 )
Για λόγους ευκολίας θα σταματήσουμε στον 4ο όρο χωρίς βλάβη της γενικότητας.
Κάνοντας πράξεις στην τελευταία σχέση θα έχουμε:
{ }
s4 = ⎡⎣( a1 + a2 )(1 + ε1 ) + a3 ⎤⎦ (1 + ε 2 ) + a4 (1 + ε 3 ) = {a1 + a2 + a3 + a4 } + a1 ( ε1 + ε 2 + ε 3 ) +
+ a2 ( ε1 + ε 2 + ε 3 ) + a3 ( ε 2 + ε 3 ) + a4ε 4 + O.Y .T .
s4 = s4 + a1 ( ε1 + ε 2 + ε 3 ) + a2 ( ε1 + ε 2 + ε 3 ) + a3 ( ε 2 + ε 3 ) + a4ε 4 + O.Y .T . ⇒
s4 − s4 = a1 ( ε1 + ε 2 + ε 3 ) + a2 ( ε1 + ε 2 + ε 3 ) + a3 ( ε 2 + ε 3 ) + a4ε 4 + O.Y .T . ⇒
s4 − s4 ≤ a1 3u + a2 3u + a3 2u + a4 u
Η τελευταία σχέση δείχνει ότι το άνω φράγμα για το απόλυτο λάθος του αθροίσματος
ελαχιστοποιείται όταν οι αριθμοί είναι σε αύξουσα σειρά διότι σε αυτή την περίπτωση ο
μικρότερος αριθμός (κατά απόλυτη τιμή) θα πολλαπλασιάζεται με το μέγιστο
συντελεστή σφάλματος (στο συγκεκριμένο παράδειγμα με το 3u ).
Άσκηση: Υλοποιήστε τους αλγορίθμους (*) και (**) χρησιμοποιώντας αρχικά μεταβλητές
απλής ακρίβειας (real(4)) και στην συνέχεια μεταβλητές διπλής ακρίβειας (real(8)) και
διαπιστώστε την συμπεριφορά τους όσον αφορά τα αποτελέσματα που δίνουν.
28
διαπιστώνουμε αν ένας αλγόριθμος είναι ευσταθής είναι διαταράσσοντας κατά μικρές
ποσότητες τα δεδομένα του. Αν το αποτέλεσμα αλλάξει κατά πολύ τότε έχουμε
σημαντική ένδειξη ότι ο αλγόριθμος είναι ασταθής.
Η ευστάθεια και η ακρίβεια (θεωρητικό σφάλμα προσέγγισης) ενός αλγορίθμου είναι τα
κύρια ποιοτικά χαρακτηριστικά του.
Παράδειγμα 1ο: Ο υπολογισμός της ποσότητας e − x για μεγάλα θετικά x , με χρήση της
( −1) x n −1
n −1
x 2 x3 x 4
S n ( x ) = 1 − x + − + + ... + , n ≥1 για την οποία γνωρίζουμε ότι
2 6 24 ( n − 1) !
lim S n ( x ) = e − x . Έστω επίσης υπολογιστής με M = M ( β = 10 ,t = 5,U = 10 ,L = −10 ) και
n →∞
x = 5.5 . Τότε οι πρώτοι όροι της σειράς είναι οι 1.0000, -5.5000, 15.125, -27.730,
38.129, -41.942, 38.446, -30.208, , 20.768, -12.692, 6.9803, -3.4902, +1.5997 το
άθροισμα των οποίων δίνει 0.0026363. Όμως e −5.5 = 0.00408677 και επομένως το
προηγούμενο αποτέλεσμα δεν έχει κανένα σημαντικό ψηφίο σωστό! Το πρόβλημα
δημιουργείται διότι για όλους τους αριθμούς που είναι μεγαλύτεροι από το 10 το
αντίστοιχο απόλυτο σφάλμα προσέγγισης είναι της ίδιας τάξης (δηλαδή είναι του ίδιου
μεγέθους) με το αποτέλεσμα!
∫xe
n x −1
In = dx, n = 1, 2,3,... για μεγάλες τιμές του n. Ας δούμε πρώτα μερικά
x=0
0 ≤ x ≤ 1 ⇒ 0 ≤ xn ≤ 1 ⎫ 1 1
⎪
∫ ∫
n x −1 n x −1
(α) 1 ⎬ ⇒ 0 ≤ x e ≤ 1 ⇒ 0 ≤ x e dx ≤ 1dx ⇒ 0 ≤ I n ≤ 1
0 ≤ x ≤ 1 ⇒ ≤ e x −1 ≤ 1⎪
e ⎭ 0 0
1 1
0 ≤ x ≤ 1⎫
∫ ∫
n +1 n +1 x −1 n x −1
(β) ⎬ ⇒ x < x ⇒ x e dx < x e dx ⇒ I n +1 < I n
n
n>0 ⎭
0 0
1 1
1 1 1
e ∫
(γ) 0 ≤ x ≤ 1 ⇒ ≤ e x −1 ≤ 1 ⇒ x n e x −1 ≤ x n ⇒ x n e x −1dx ≤ x n dx =
0
n +1∫⇒ In ≤
0
n +1
1
από όπου συμπεραίνουμε ότι lim I n ≤ lim = 0 ⇒ lim I n = 0 .
n →∞ n →∞ n +1 n →∞
29
x =1 x =1 x =1
∫xe ∫xe ∫ x d (e )=
n x −1 n x −1 x −1
Εύρεση αναδρομικού τύπου: I n = dx = d ( x − 1) = n
x =0 x =0 x =0
x =1 x =1
e x −1d ( x n ) = 1 − n
∫ ∫e
x =1
= x n e x −1 − x −1 n −1
x dx = 1 − nI n −1 . Για n=1 έχουμε
x =0
x=0 x =0
x =1 x =1
⎛ 1⎞ 1
∫ ∫e
x =1 x =1
I1 = xe x −1dx = xe x −1 − x −1
dx = 1 − e x −1 = 1 − ⎜1 − ⎟ = , οπότε έχουμε τον τύπο:
x =0
x =0
x=0
x =0
⎝ e⎠ e
1
I n = 1 − nI n −1 , n > 1, I1 = (*)
e
1
I1 = = 0.367879441171442 ⇒ fl ( I1 ) = 0.367879 . Εκτελούμε τις πράξεις και βρίσκουμε:
e
fl ( I 2 ) = 0.264242 < 1 3
fl ( I 3 ) = 0.207274 < 1 4
fl ( I 4 ) = 0.170904 < 1 5
fl ( I 5 ) = 0.145480 < 1 6
fl ( I 6 ) = 0.127120 < 1 7
fl ( I 7 ) = 0.110160 < 1 8
fl ( I 8 ) = 0.118720 > 1 9??
fl ( I 9 ) = −0.068480 < 0??
Παρατηρούμε ότι ο 8ος όρος της ακολουθίας είναι μεγαλύτερος από τον 7ο, ενώ ο 9ος
είναι αρνητικός! Τι πήγε στραβά? Μία χοντροειδής ανάλυση σφάλματος θα μας δείξει
τι ακριβώς συνέβη. Θα υποθέσουμε ότι όλες οι πράξεις γίνονται χωρίς σφάλμα εκτός
από το σφάλμα που εισέρχεται στην τιμή του όρου I n . Έχουμε δηλαδή
1
I n = 1 − nI n −1 , n > 1, I1 = και
e
fl ( I n ) = 1 − n fl ( I n −1 ) , n > 1, I1 = 0.367879
ε n = − n ε n −1 , n > 1, ε1 = −4.412 × 10−7 με γενική λύση ε n = ( −1) n!ε1 που δείχνει ότι όσο
n
μικρό και αν είναι το αρχικό λάθος τελικά lim ε n = ∞ . Επομένως ο αλγόριθμος αυτός
n →∞
30
1 − In
I n = 1 − nI n −1 ⇒ I n −1 = οπότε ο αναδρομικός τύπος έχει ως εξής:
n
1
Ik = a < , k >> 1
k +1
1 − In
I n −1 = , n = k − 1, k − 2,..., 2
n
1
I1 =
e
όπου, προς το παρόν, παραβλέπουμε ότι δεν γνωρίζουμε το α ακριβώς. Ακολουθώντας
εk
αντίστοιχη διαδικασία όπως και προηγουμένως θα έχουμε ε 2 = ( −1)
k
που σημαίνει
k!
ότι όσο μεγάλο λάθος και αν είχαμε εισάγει στον αρχικό όρο I k αυτό το σφάλμα θα
1
εκμηδενιζόταν πολύ γρήγορα. Να σημειωθεί ότι αφού 0 < I k ≤ άρα το μέγιστο
k +1
1
αρχικό σφάλμα στο I k δεν ξεπερνά την ποσότητα . Ο αλγόριθμος αυτός έχει την
k +1
ιδιότητα ότι το αρχικό σφάλμα φθίνει, δηλαδή δεν συσσωρεύεται, και έτσι πρόκειται
για ευσταθή αλγόριθμο.
⎛ ⎛Π ⎞ ⎞
2
Αριθμητικά επιλύουμε μόνο προβλήματα που έχουν μοναδική λύση. Όμως λόγω των
σφαλμάτων προσέγγισης, κάθε μαθηματικό πρόβλημα λύνεται σε περιβάλλον
διαταραχών και επομένως μας ενδιαφέρει κατά πόσο ο αντίστοιχος αλγόριθμος είναι
ευαίσθητος σε αλλαγές των δεδομένων του προβλήματος. Έτσι, λέμε ότι ένα πρόβλημα
βρίσκεται σε καλή κατάσταση όταν μικρές αλλαγές στα δεδομένα του προβλήματος
προκαλούν μικρές αλλαγές στην λύση του, δηλαδή όταν το πρόβλημα δεν είναι
31
ευαίσθητο σε διαταραχές των δεδομένων του. Σε διαφορετική περίπτωση, όταν δηλαδή
μικρές αλλαγές στα δεδομένα προκαλούν μεγάλες αλλαγές στην λύση, λέμε ότι το
πρόβλημα βρίσκεται σε κακή κατάσταση.
( x − 2)
6
Παράδειγμα: Έστω η αλγεβρική εξίσωση = 0 ⇒ x = 2 με πολλαπλότητα 6. Έστω
πρόβλημα αν απλά αλλάξουμε τον σταθερό όρο κατά την ποσότητα 10−6 . Οι λύσεις
1
αυτού του προβλήματος είναι xδ = 2 + exp ( iπ k / 3) , k = 0,1, 2,3, 4,5 . Επομένως έχουμε
10
1 1 1
xδ − x = 2 + exp ( iπ k / 3) − 2 = exp ( iπ k / 3) = όπου φαίνεται ότι η αλλαγή του ενός
10 10 10
και μόνο συντελεστή (δεδομένο) του προβλήματος προκάλεσε αλλαγή στο μέτρο της
λύσης κατά 10−1 , δηλαδή 10000 φορές μεγαλύτερη από την αντίστοιχη αλλαγή του
συντελεστή! Προφανώς το πρόβλημα αυτό δεν βρίσκεται σε καλή κατάσταση.
32
Κεφάλαιο 2ο
Επίλυση μη-γραμμικών εξισώσεων
2.1. Εισαγωγή
συναρτήσεις μέχρι και 4ου βαθμού (τύποι Carnado). Στην γενική περίπτωση όμως
αναλυτικές λύσεις είτε δεν υπάρχουν είτε είναι εξαιρετικά δύσκολο να βρεθούν.
Συνήθως μία αριθμητική μέθοδος παράγει μία ακολουθία προσεγγίσεων της λύσης x* ,
x0 , x1 , x2 ,… η οποία ακολουθία υπό κάποιες προϋποθέσεις συγκλίνει, δηλαδή
lim xn = x∗
n →∞
C ( I ) = { f f : I → , f συνεχης}
C [ a, b ] αντί για C ([ a, b ])
και
C ( a, b ) αντί για C ( ( a, b ) )
ή αντίστοιχα
C n ( a, b ) αντί για C n ( ( a, b ) )
Είναι η απλούστερη μέθοδος εύρεσης ριζών και βασίζεται στο θεώρημα της ενδιάμεσης
τιμής:
33
Έστω g ∈ C [ a, b ] και ξ πραγματικός αριθμός που ανήκει στο διάστημα που ορίζουν τα
⎧+1, αν x > 0
⎪
sgn ( x ) = ⎨−1, αν x < 0
⎪0 , αν x = 0
⎩
Η ιδέα της μεθόδου της διχοτόμησης είναι η εξής: έστω f ∈ C [ a, b ] και ότι η f έχει
sgn ( f ( a ) ) ≠ sgn ( f ( b ) )
τότε, με βάση το θεώρημα της ενδιάμεσης τιμής, το σημείο ξ = 0 ανήκει στο διάστημα
την ποσότητα
a+b
x0 = .
2
Τότε για το μέσον του διαστήματος [ a, b ] , x0 υπάρχουν οι εξής δυνατότητες:
a. f ( x0 ) = 0 ή
⎧ f ( x0 ) < 0
⎪
b. f ( x0 ) ≠ 0 ⇒ ⎨ειτε
⎪f x >0
⎩ ( 0)
Αν ισχύει η περίπτωση (a), τότε προφανώς ρίζα της f ( x ) = 0 είναι το x0 .
Συγκεκριμένα:
• ( ) ( )
Αν sgn f ( a ) ≠ sgn f ( x0 ) , τότε η ρίζα βρίσκεται στο ( a, x0 ) ,
34
Γεωμετρική ερμηνεία:
f ( x)
f (b)
f ( x0 )
a b x
a+b
x0 =
2
f (a)
( )
Στο παραπάνω παράδειγμα βλέπουμε ότι sgn f ( a ) ≠ sgn f ( x0 ) και επομένως η ρίζα( )
θα βρίσκεται στο διάστημα ( a, x0 ) όπως είναι φανερό από το σχήμα.
όσο μικρό θέλουμε και όσο βέβαια είναι εφικτό αφού στον υλεκτρονικό υπολογιστή
πάντα περιοριζόμαστε από την ακρίβειά του.
35
Παράδειγμα: Να βρεθεί με την μέθοδο της διχοτόμησης μια ρίζα της
f ( x ) = x3 + x 2 − 3 x − 3 στο x ∈ [1, 2] κάνοντας τουλάχιστον 4 επαναλήψεις.
Λύση: Είναι:
f (1) = 1 + 1 − 3 − 3 = −4 < 0
και
f ( 2) = 8 + 4 − 6 − 3 = 1 > 0
άρα
f ′ ( x ) = 3 x 2 + 2 x − 3 = 3 ( x 2 − 1) + 2 x > 0, ∀x ∈ [1, 2]
άρα η f ( x ) είναι αύξουσα στο [1, 2] και επομένως η ρίζα που θα έχει θα είναι
μοναδική.
Υπολογίζουμε:
1+ 2
9 x0 = = 1.5 → f (1.5 ) = −1.875 < 0 , άρα η ρίζα ∈ [1.5, 2.0]
2
1.5 + 2
9 x1 = = 1.75 → f (1.75 ) = 0.171875 > 0 , άρα η ρίζα ∈ [1.5,1.75]
2
1.5 + 1.75
9 x2 = = 1.625 → f (1.625 ) = −0.94336 < 0 , άρα η ρίζα ∈ [1.625,1.75]
2
1.625 + 1.75
9 x3 = = 1.6875 → αυτή είναι η ζητούμενη ρίζα.
2
Επίσης, ισχύει
x1 − x0 = 0.25 , x2 − x1 = 0.125 , x3 − x2 = 0.0625
(
Πρόταση: Έστω f ∈ C [ a, b ] με sgn f ( a ) ≠ sgn f ( b ) ) ( ) και { xn }n∈ η ακολουθία των
προσεγγίσεων που προκύπτει από την μέθοδο της διχοτόμησης. Τότε, είτε xN = x∗ για
σφάλμα ισχύει:
b−a
x∗ − xn ≤ , n = 1, 2,3,…
2n
Απόδειξη: Θέτουμε a1 ≡ a και b1 ≡ b , οπότε συμβολίζουμε με I i ≡ [ ai , bi ] , άρα και
36
διχοτόμησης. Έστω, xi το μέσον κάθε διαστήματος I i , οπότε προφανώς ισχύει I i +1 ⊂ I i .
Έχουμε
bn − 2 − an − 2
bn −1 − an −1 2 b −a bn − k − an − k
bn − an = = = n − 2 2 n − 2 = … ⇒ bn − an =
21 2 2 2k
για k = n − 1 η παραπάνω ισότητα δίνει:
b1 − a1 b − a
bn − an = = n −1 (*)
2n −1 2
επιπλέον για την αντίστοιχη προσέγγιση της ρίζας ισχύει
an + bn
xn =
2
Επομένως στην «n» επανάληψη της μεθόδου έχουμε ότι η απόσταση του xn από το x∗
θα είναι κατά απόλυτη τιμή μικρότερη ή ίση του μισού μήκους του τρέχοντος
διαστήματος:
bn − an (*) b − a
xn − x∗ ≤ = n , n = 0,1, 2,...
2 2
H παραπάνω σχέση μας λέει ότι το τελικό σφάλμα της ρίζας είναι άνω φραγμένο από
b−a
την ποσότητα , η οποία τείνει στο μηδέν καθώς n → ∞ . Μπορεί να
2n
χρησιμοποιηθεί για να υπολογιστεί εκ’των προτέρων ο αριθμός των απαιτούμενων
επαναλήψεων της μεθόδου για την εύρεση της ρίζας με συγκεκριμένη ακρίβεια.
Πράγματι, αν θέλουμε να υπολογίσουμε την ρίζα μίας εξίσωσης με ακρίβεια μικρότερη
ή ίση με ε αυτό σημαίνει ότι:
b−a b−a
xn − x∗ ≤ ≤ ε ⇒ n ≤ ε ⇒ b − a ≤ ε 2n ⇒ ln ( b − a ) ≤ ln ε + n ln 2 ⇒
2 n
2
⎛b−a⎞
ln ⎜ ⎟
⎛b−a⎞ ⎝ ε ⎠
ln ( b − a ) − ln ε ≤ n ln 2 ⇒ ln ⎜ ⎟ ≤ n ln 2 ⇒ n ≥
⎝ ε ⎠ ln 2
ln ( ( b − a ) ε )
Επομένως αν πάρουμε τον κοντινότερο ακέραιο στην ποσότητα θα
ln 2
επιτύχουμε την επιθυμητή ακρίβεια.
Αλγόριθμος:
37
Δίνουμε δεδομένα b , a και πλάτος τελικού διαστήματος ε .
⎛ ⎛b−a⎞⎞
⎜ ln ⎜ ε ⎟ ⎟
i. Υπολογίζουμε το n = nint ⎜ ⎝ ⎠ ⎟ και τα f a και f b
( ) ( )
⎜ ln 2 ⎟
⎜ ⎟
⎝ ⎠
b−a
ii. Υπολογίζουμε το μέσον του διαστήματος x = a + και το f ( x ) .
2
iii. Έλεγχος: εάν f ( x ) = 0 τότε έξοδος. Διαφορετικά, (εάν f ( x ) ≠ 0 :
( ) ( )
Aν sgn f ( x ) = sgn f ( a ) , τότε
a←x
αλλιώς
b←x
iv. Επαναλαμβάνουμε τα βήματα (ii) και (iii) «n» φορές
v. Τυπώνουμε a , b , b − a , x , f ( x )
Στο πρώτο βήμα του αλγορίθμου η συνάρτηση nint(x) δίνει τον κοντινότερο ακέραιο
στην ποσότητα χ. Π.χ. nint(7.3)=7 και nint(1.52)=2.
(
Σχόλια: Η μέθοδος της διχοτόμησης, με την προϋπόθεση ότι sgn f ( a ) ≠ sgn f ( b ) , ) ( )
συγκλίνει εφόσον η f ( x ) είναι συνεχής στο [ a, b ] , αλλά συγκλίνει αργά.
f ( 2 ) = 8 − 4 − 5 = −1 < 0 ⎫⎪
⎬ ⇒ sgn ( f ( 2 ) ) ≠ sgn ( f ( 3) ) ⇒ x ∈ ( 2,3)
∗
f ( 3) = 27 − 6 − 5 = 16 > 0 ⎪⎭
Επιπλέον, ισχύει:
f ′ ( x ) = 3 x 2 − 2 > 0, ∀x ∈ ( 2,3) ⎪⎫
⎬ ⇒ η f ( x ) είναι αύξουσα στο ( 2,3)
f ′′ ( x ) = 6 x > 0 ⎪⎭
38
συνεπώς, η ρίζα x∗ ∈ ( 2,3) είναι η μοναδική ρίζα στο διάστημα αυτό. Έστω, ότι
Εφαρμόζοντας την σχέση (**) για τις ελάχιστες απαιτούμενες επαναλήψεις παίρνουμε
⎛b−a⎞
ln ⎜
ε ⎟⎠
n≥ ⎝ ≈ 17
ln 2
Λόγω του γεγονότος ότι η μέθοδος της διχοτόμησης συγκλίνει πολύ αργά έχουν
αναπτυχθεί άλλες μέθοδοι, οι οποίες ονομάζονται επαναληπτικές, για τις οποίες όμως
δεν γνωρίζουμε εκ’ των προτέρων πόσες επαναλήψεις απαιτούνται για να συγκλίνουν
με την εκάστοτε επιθυμητή ακρίβεια. Αρχικά, δίνουμε ορισμένους ορισμούς.
Έστω ϕ μία συνάρτηση και x∗ ένα σημείο του πεδίου ορισμού της. Αν ισχύει
μία ισοδύναμη μορφή της x = ϕ ( x ) . Ξεκινάμε από μία αρχική τιμή της λύσης x∗ , x0
και παράγουμε μία ακολουθία προσεγγίσεων της λύσης σύμφωνα με την σχέση
xn = ϕ ( xn −1 ) , n ∈ 0 ή xn +1 = ϕ ( xn ) , n ∈
Αν η { xn }n∈ συγκλίνει σε ένα σημείο x∗ και η ϕ ( x ) είναι συνεχής στο σημείο αυτό,
(
x∗ = lim xn = lim ϕ ( xn −1 ) = ϕ lim xn −1 = ϕ ( x∗ ))
συνεχεια
n →∞ n →∞ n →∞
39
Απόδειξη:
( )
Λόγω υπόθεσης ϕ [ a, b ] ⊂ [ a, b ] ισχύει ότι:
συναρτήσεων. Έχουμε:
Γεωμετρική ερμηνεία
y
y=x
b
ϕ (b )
y = ϕ ( x)
ϕ (a)
x
a x∗ b
Παρατήρηση: Η συνθήκη του θεωρήματος είναι ικανή, αλλά όχι αναγκαία συνθήκη.
40
Παράδειγμα: Έστω ϕ : [ −1, +1] → [ 0, 2] με ϕ ( x ) = 2 x 2 . Η ϕ ( x ) είναι συνεχής στο
⎛1⎞ 1 1
[ −1, +1] . Επιπλέον, ισχύει ϕ ( 0 ) = 0 και ϕ ⎜ ⎟ = όπου 0 , ∈ [ −1, +1] είναι σταθερά
⎝2⎠ 2 2
(
σημεία της ϕ , αλλά όμως δεν ισχύει ϕ [ −1, +1] ⊂ [ −1, +1] . )
συνεχής στο I ). H μικρότερη σταθερά για την οποία ισχύει η προηγούμενη ανισότητα
ονομάζεται σταθερά Lipschitz. Όταν L < 1 η ϕ είναι συστολή στο I .
ϕ ( x ) − ϕ ( y ) = x 2 − y 2 = ( x − y )( x + y ) = ( x − y ) ( x + y ) ⇒
ϕ ( x) −ϕ ( y) = ( x − y) ( x + y) ≤ ( x − y) ( x + y ) ⇒
ϕ ( x ) − ϕ ( y ) ≤ max ( x + y ) x − y = 2a x − y
x , y∈I
1
Αν επιπλέον ισχύει 2a < 1 ⇒ a < τότε είναι συστολή.
2
Σχόλιο: η συνθήκη Lipschitz είναι μια συνθήκη ομαλότητας για συναρτήσεις, η οποία
είναι πιο ισχυρή από την απλή συνέχεια και επομένως αν μία συνάρτηση ικανοποιεί
την συνθήκη Lipschitz είναι και συνεχής αλλά όχι το αντίθετο. Διαισθητικά σημαίνει
ότι η συνάρτηση είναι περιορισμένη στο πόσο γρήγορα αλλάζει. Έτσι, μια γραμμή που
συνδέει 2 σημεία της συνάρτησης ποτέ δεν θα έχει μεγαλύτερη κλίση από ένα
συγκεκριμένο αριθμό που λέγεται σταθερά Lipschitz.
ϕ ( x ) − ϕ ( y ) = ϕ ′ (ξ )( x − y ) ⇒ ϕ ( x ) − ϕ ( y ) = ϕ ′ (ξ ) x − y ≤ max ϕ ′ (ξ ) x − y =
ξ ∈I
41
max ϕ ′ ( x ) x − y ⇒ ϕ ( x ) − ϕ ( y ) ≤ L x − y
x∈I
όπου παραπάνω έχει χρησιμοποιηθεί το γεγονός ότι εφόσον η ϕ ′ ( x ) είναι συνεχής στο
[ a, b ] , άρα έχει μέγιστο στο διάστημα αυτό. Έτσι, στο προηγούμενο παράδειγμα
ϕ ′ ( x ) = 2 x ⇒ max ϕ ′ ( x ) = 2a < ∞
x∈[ a ,b ]
Παρατήρηση 2η: Αν ϕ ∈ C1 ( a, b ) , τότε δεν ικανοποιεί κατ’ ανάγκη την συνθήκη του
Lipschitz.
Παράδειγμα:
1
Έστω ϕ : ( 0,1) → με ϕ ( x ) = x και ϕ ′ ( x ) = στο ( 0,1) .
2 x
x− y
ϕ ( x) −ϕ ( y) = x− y = ⇒
x+ y
⎛ ⎞
1 1
ϕ ( x) −ϕ ( y) = x − y ≤ max ⎜ ⎟ x− y
x , y∈I ⎜
x+ y x + y ⎟
⎝ ⎠
⎛ ⎞ ⎛ ⎞
1 1
Ποιο είναι το max ⎜ ⎟ ? Παρατηρούμε ότι max ⎜ ⎟ = ∞ , αφού
x , y∈I ⎜
x + y ⎟ x , y∈I ⎜
x + y ⎟
⎝ ⎠ ⎝ ⎠
⎛ ⎞
1
lim+ ⎜ ⎟ = ∞ και επομένως δεν υπάρχει μέγιστο. Άρα η ϕ ( x ) δεν ικανοποιεί τη
x →0 ⎜
y → 0+ ⎝
x + y ⎟
⎠
συνθήκη Lipschitz. Συνεπώς, υπάρχουν συνεχείς συναρτήσεις που δεν ικανοποιούν τη
συνθήκη Lipschitz.
είναι Lipschitz.
⎧ x, αν x > 0 ⎧ 1, αν x > 0
Παράδειγμα 2ο: Έστω ϕ ( x ) = x ή ϕ ( x) = ⎨ με ϕ′( x) = ⎨
⎩− x, αν x ≤ 0 ⎩−1, αν x < 0
42
όμως
ϕ ′ ( x ) = 1 ⇒ max ϕ ′ ( x ) = 1
άρα η ϕ είναι Lipschitz. H ϕ ( x ) δεν είναι παραγωγίσιμη στο x=0 αλλά είναι
Lipschitz.
Εναλλακτικά:
ϕ ( x ) − ϕ ( y ) = x − y ≤ x − y , άρα Lipschitz με L = 1
( )
μοναδικό σημείο, δηλαδή ∃ x∗ ∈ [ a, b ] : ϕ x∗ = x∗ . Για κάθε x0 ∈ [ a, b ] η xn = ϕ ( xn −1 )
είναι
a) καλά ορισμένη ( ⇒ ∀n ∈ , xn ∈ [ a, b ] ),
i. xn − x∗ ≤ Ln x0 − x* ≤ Ln max ( x0 − a, b − x0 )
Ln
ii. xn − x∗ ≤ x1 − x0
1− L
L
iii. xn − x∗ ≤ xn − xn −1
1− L
Απόδειξη:
9 Ύπαρξη λύσης
∀x ∈ [ a, b ] ισχύει a ≤ ϕ ( x ) ≤ b
• Για x = a έχουμε ϕ ( a ) ≥ a ⇒ a − ϕ ( a ) ≤ 0
• Για x = b έχουμε ϕ ( b ) ≤ b ⇒ b − ϕ ( b ) ≥ 0
συνάρτηση
43
g ( x) = x −ϕ ( x)
g ( a ) = a − ϕ ( a ) ≤ 0 ⎪⎫
⎬ ⇒ ∃x ∈ [ a, b ] :: g ( x ) = 0 ⇒ x = ϕ ( x )
∗ ∗ ∗ ∗
g ( b ) = b − ϕ ( b ) ≥ 0 ⎪⎭
9 Μοναδικότητα λύσης
ϕ ( x∗ ) − ϕ ( y ∗ ) = x∗ − y ∗ ≤ L x∗ − y ∗ ⇒ L ≥ 1 άτοπο
9 Σύγκλιση
Από Lipschitz έχουμε:
xn − x∗ = ϕ ( xn −1 ) − ϕ ( x∗ ) ≤ L xn −1 − x∗ = L ϕ ( xn − 2 ) − ϕ ( x∗ ) ≤ L2 xn − 2 − x∗ = … ≤ Ln x0 − x∗
άρα
xn − x∗ ≤ Ln x0 − x∗
επομένως,
Συνεπώς, ισχύει
xn − x∗ ≤ Ln x0 − x* ≤ Ln max ( x0 − a, b − x0 )
x0 − a
x0 x∗
a b
b − x0
Ln
Εκτίμηση του (c.ii), δηλαδή του xn − x∗ ≤ x1 − x0 . Έχουμε
1− L
44
x2 − x1 = ϕ ( x1 ) − ϕ ( x0 ) ≤ L x1 − x0
x3 − x2 = ϕ ( x2 ) − ϕ ( x1 ) ≤ L x2 − x1 = L2 x1 − x0
xn +1 − xn ≤ Ln x1 − x0
Επίσης, έχουμε ∀k ∈
xn + k − xn = ( xn + k − xn + k −1 ) + ( xn + k −1 − xn + k − 2 ) + + ( xn +1 − xn ) ≤
xn + k − xn + k −1 + xn + k −1 − xn + k − 2 + + xn +1 − xn ≤ Ln + k −1 x1 − x0 + Ln + k − 2 x1 − x0 + + Ln x1 − x0 =
= Ln x1 − x0 ( Lk −1 + Lk − 2 + + 1)
α ν − β ν = (α − β ) (α ν −1 + α ν − 2 β + + αβ ν − 2 + β ν −1 )
1 − Lk = (1 − L ) (1 + L + + Lk − 2 + Lk −1 )
άρα
1 − Lk 1
xn + k − xn ≤ Ln x1 − x0 ⇒ lim xn + k − xn ≤ Ln x1 − x0 ⇒
1− L k →∞ 1− L
x1 − x0
x∗ − xn ≤ Ln
1− L
L L
x∗ − y1 ≤ y1 − y0 ⇒ x∗ − xn ≤ xn − xn −1
1− L 1− L
ϕ : [ −1, +1] → [ −1, +1] με x0 ∈ [ −1, +1] και ϕ ( x ) = − x , τότε παίρνουμε την ακολουθία
45
i. Η εκτίμηση xn − x∗ ≤ Ln x0 − x∗ δεν είναι πρακτικά χρήσιμη, γιατί το δεξί μέλος
L
ii. Η εκτίμηση xn − x∗ ≤ xn − xn −1 είναι καλύτερη της εκτίμησης
1− L
Ln
xn − x∗ ≤ x1 − x0 .
1− L
Πράγματι,
xn − xn −1 = ϕ ( xn −1 ) − ϕ ( xn − 2 ) ≤ L xn −1 − xn − 2 ⇒
xn − xn −1 ≤ L xn −1 − xn − 2 = L ϕ ( xn − 2 ) − ϕ ( xn −3 ) ≤ L2 xn − 2 − xn −3 ⇒
xn − xn −1 ≤ Ln −1 x1 − x0
Άρα,
L Ln
xn − x∗ ≤ xn − xn −1 ≤ x1 − x0
1− L 1− L
L
iii. Η εκτίμηση xn − x∗ ≤ xn − xn −1 (*) είναι εκτίμηση εκ των υστέρων, ενώ η
1− L
Ln
xn − x∗ ≤ x1 − x0 (**) είναι εκτίμηση εκ των προτέρων. Εκτίμηση εκ των
1− L
υστέρων σημαίνει ότι για να υπολογίσουμε το άνω φράγμα του σφάλματος,
δηλαδή το δεξί μέλος της ανισότητας (*), πρέπει να έχουμε υπολογίσει την
ποσότητα που μας ενδιαφέρει (δηλαδή το xn ). Αντίθετα το δεξί μέλος της (**)
μπορεί να υπολογιστεί από την αρχή για οποιαδήποτε τιμή του n (με δεδομένα
φυσικά τα L, x0 και αφού υπολογίσουμε το x1 ).
46
y y=x
ϕ ( x2 ) y = ϕ ( x)
ϕ ( x1 )
ϕ ( x0 )
x1 x2 x∗ x
x0
Σχήμα 1: Συγκλίνουσα ακολουθία xn = ϕ ( xn −1 )
y
y = ϕ ( x) y=x
x∗
x
x2 x0 x1 x3
47
δίνεται διαπιστώνουμε απλά κατά πόσο παραγματικά ισχύει
sgn ( f ( a ) ) ≠ sgn ( f ( b ) )
9 αποδεικνύουμε την μοναδικότητα της ρίζας εξετάζοντας αν η συνάρτηση είναι
μονότονη (αύξουσα ή φθίνουσα) στο διάστημα [ a, b ]
( )
(α) ϕ [ a, b ] ⊂ [ a, b ] , δηλαδή ότι ∀x ∈ [ a, b ] , ϕ ( x ) ∈ [ a, b ] και
συστολή.
Εναλλακτικά, αντί για το (β), διαπιστώνουμε αν ϕ ∈ C1 [ a, b ] και υπολογίζουμε
συγκλίνει στο μοναδικό σταθερό σημείο, x* , της ϕ στο διάστημα [ a, b ] για κάθε
αρχική τιμή x0 ∈ [ a, b ] .
a+b
9 Επιλέγουμε ως x0 το μέσο του διαστήματος, δηλαδή x0 = , όπως
2
δηλαδή θα κάναμε με την μέθοδο της διχοτόμησης, και στην συνέχεια
υπολογίζουμε τους όρους της ακολουθίας { xn }n∈ από την την αναδρομική
xn +1 − xn = ϕ ( xn ) − ϕ ( xn −1 ) ≤ L xn − xn −1
xN +1 − xN ≤ ε ( δ N +1 ≤ ε ), θα έχουμε ότι
L Lε Lε
xn +1 − x∗ ≤ xn +1 − xn ≤ ⇒ xn +1 − x∗ ≤ , ∀n ≥ N
1− L 1− L 1− L
ή
Lε
εn ≤
1− L
48
έχουμε δηλαδή ένα άνω φράγμα του σφάλματος της μορφής Cε . Έτσι αν σε κάποια
Lε
προσδιορισμό της ρίζας x∗ είναι . Αν, επιπλέον, ισχύει
1− L
L 1
< 1 ⇒ L < 1 − L ⇒ 2 L < 1 ⇒ L < , τότε το τελικό λάθος είναι < ε . Είναι προφανές
1− L 2
Lε
ότι πρόβλημα υπάρχει μόνο στην περίπτωση που L → 1 οπότε → ∞ οπότε και
1− L
δεν μπορούμε να αποφανθούμε για την σύγκλιση ή όχι της ακολουθίας, που σημαίνει
ότι η ακολουθία μπορεί να συγκλίνει αλλά μπορεί και όχι. Να τονισθεί επίσης ότι το ε
που θα επιλέξουμε σε καμιά περίπτωση δεν πρέπει να είναι μικρότερο από το
αντίστοιχο έψιλον της μηχανής ή, ακριβέστερα, μικρότερο από την απόσταση δύο
διαδοχικών αριθμών κινητής υποδιαστολής.
Σε περίπτωση που μας ζητείται να διευρενήσουμε για ποιες αρχικές τιμές του
x0 η ακολουθία { xn }n∈ συγκλίνει, και υπό την προϋπόθεση ότι ϕ ∈ C1 [ a, b ] , αρκεί να
λύσουμε την ανισότητα ϕ ′ ( x ) < 1 . Οπότε, για κάθε x0 το οποίο ανήκει στην τομή του
f ( 0 ) = 0 − 20 = −1 < 0 ⎫
⎪
⎬ ⇒ ∃x ∈ ( 0,1) :: f ( x ) = 0
∗ ∗
1
f (1) = 1 − 2 = > 0 ⎪
−1
2 ⎭
ln ( 2 )
Επίσης, f ′ ( x ) = 1 − ( −1) ln ( 2 ) 2− x = 1 + > 0 ∀x ∈ [0,1] , δηλαδή η f είναι γνησίως
2x
αύξουσα στο διάστημα αυτό και επομένως η ρίζα αυτή είναι μοναδική. Στην συνέχεια
στο διάστημα [0,1], έχει παράγωγο ϕ ' ( x ) = − ln ( 2 ) 2− x η οποία είναι επίσης συνεχής και
49
αρνητική στο [0,1]. Αρα η ϕ είναι φθίνουσα και επομένως
⎡1 ⎤
ϕ ([0,1]) = ⎡⎣ϕ ( 0 ) , ϕ (1) ⎤⎦ = ⎢ ,1⎥ ⊂ [ 0,1] . Επιπλέον
⎣2 ⎦
1
L ≡ max ϕ ' ( x ) = ln ( 2 ) max = ln ( 2 ) ≈ 0.693 < 1 .
x∈[0,1] x∈[0,1] 2x
Έτσι οι προϋποθέσεις του θεωρήματος της συστολής ικανοποιούνται και η ακολουθία
[0.4,0.7].
Λύση: Έχουμε
ϕ ( 0.4 ) ≈ 0.67
ϕ ( 0.7 ) ≈ 0.50
άρα
ϕ ′ ( x ) = −e− x ⇒ −e− x < 1 ⇒ e − x < 1 ⇒ −1 < e − x < 1 ⇒ 0 < e − x < 1 ⇒ − x < 0 ⇒ x > 0
Άρα ∀x > 0 , ϕ ′ ( x ) < 1 και επομένως η ϕ είναι συστολή. Στο διάστημα [ 0.4, 0.7 ] θα
1 1
έχουμε L ≡ max x
= 0.4 ≈ 0.67 . Επόμενως η xn +1 = ϕ ( xn ) συγκλίνει ∀x0 ∈ [0.4, 0.7] .
x∈[0.4,0.7] e e
50
f ( x = 1) = 1 − 2 − 3 = −4 < 0 ⎫⎪
⎬ ⇒ ∃x ∈ (1, 4 ) :: f ( x ) = 0
∗ ∗
f ( x = 4 ) = 16 − 8 − 3 = 5 > 0 ⎪⎭
Επιπλέον
f ′ ( x ) = 2 x − 2 ⇒ f ′ ( x ) = 2 ( x − 1) > 0 , ∀x ∈ (1, 4 )
άρα η f είναι αύξουσα ⇒ έχει μόνο μία ρίζα στο [1, 4] και επομένως η ρίζα είναι
a) x = 2 x + 3 , ϕ ( x ) = 2 x + 3 ,
x2 − 3 x2 − 3
b) x = , ϕ ( x) =
2 2
3 3
c) x= , ϕ ( x) = ,
x−2 x−2
Για την κάθε περίπτωση αρχικά πρέπει να εξετάσουμε κατά πόσο η συνάρτηση ϕ είναι
συστολή.
Άρα ∀x ∈ ( −1, ∞ ) ισχύει ϕ ′ ( x ) < 1 . Επομένως, η ϕ είναι συστολή στο [1, 4] ⊂ ( −1, ∞ )
( )
[1,4] άρα ϕ [1, 4] ≈ [ 2.23,3.31] ⊂ [1, 4] .
51
3
ϕ′( x) = −
( x − 2)
2
η οποία φυσικά δεν ορίζεται για x = 2 . Από την συνθήκη ϕ ′ ( x ) < 1 παίρνουμε
3 3
< 1 ⇒ 3 < ( x − 2) ⇒ ( x − 2) > 3 ⇒ x2 − 4x + 4 > 3 ⇒
2 2
−1 < <1⇒ 0 <
( x − 2) ( x − 2)
2 2
( ) ( )
x 2 − 4 x + 1 > 0 ⇒ x ∈ −∞, 2 − 3 ∪ 2 + 3, +∞ ≈ ( −∞, 0.27 ) ∪ ( 3.73, +∞ )
αυτής της περίπτωσης στον υπολογιστή δίνει ότι η ακολουθία για x0 = 4 θα συγκλίνει
στην ρίζα x* = −1 . Επίσης για x0 ∈ ( −∞, 0.27 ) η ακολουθία θα συγκλίνει στην ρίζα -1.
xn +1 − x∗ ≤ C xn − x∗ , ∀n ≥ N ( ή ε n +1 ≤ C ε n ) (Α)
• Αν p = 2 : τετραγωνική σύγκλιση
• Αν p = 3 : κυβική σύγκλιση
Προφανώς, όσο μεγαλύτερο είναι το p , τόσο πιο γρήγορα θα συγκλίνει η { xn }n∈ στο
52
ε n +1
σχέση (Β) σημαίνει ότι η ακολουθία είναι φραγμένη. Μία ικανή συνθήκη για αυτό
ε np
ε n +1
είναι η ακολουθία αυτή να συγκλίνει. Αν μάλιστα lim = μ ≠ 0 τότε η τάξη
n →∞ ε p
n
σύγκλισης είναι ακριβώς p . Πράγματι, έστω ότι η τάξη σύγκλισης ήταν p + a ( a > 0 ) ,
p+a ε n +1
άρα σύμφωνα με τον ορισμό θα είχαμε ε n +1 ≤ C ε n ⇒ ≤ C εn
a
και παίρνοντας
εn
p
ε n +1
όρια για n → ∞ προκύπτει lim ≤ C lim ε n ⇒ μ ≤ 0 το οποίο βέβαια είναι άτοπο
a
εn
n →∞ p n →∞
και επομένως ή τάξη της ακολουθίας δεν μπορεί να είναι p + a αλλά ακριβώς p . Η
xn +1 − x∗ = ϕ ( xn ) − ϕ ( x∗ ) ≤ L xn − x∗
xn +1 − x∗ ≤ L xn − x∗ , ∀n ≥ 0 ή ε n +1 ≤ L ε n
Η σχέση αυτή μας λέει ότι η { xn }n∈ συγκλίνει, τουλάχιστον, γραμμικά στο σταθερό
ε n +1 ε
συνεπάγεται ότι ≤ L < 1 . Ποιο όμως είναι το όριο της δ n ≡ n +1 , n → ∞ ? Ας
εn εn
53
δηλαδή η ϕ είναι συνεχώς παραγωγίσιμη στο [ a, b ] . Σύμφωνα με το Θ.Μ.Τ. υπάρχει
ϕ ( xn ) − ϕ ( x∗ )
ϕ ( xn ) − ϕ ( x ) = ϕ ′ (ξ n ) ( xn − x ) ⇒ ϕ ′ (ξ n ) =
∗ ∗
⇒
xn − x∗
ϕ ( xn ) − ϕ ( x∗ )
lim ϕ ′ (ξ n ) = lim
n →∞ n →∞ xn − x∗
(
⇒ ϕ ′ lim ξ n = lim
n →∞
) xn +1 − x∗
n →∞ x − x ∗
n
ε
⇒ ϕ ′ ( x∗ ) = lim n +1
n →∞ ε
n
( ) ( )
Αν, λοιπόν, ισχύει ϕ ′ x∗ ≠ 0 και επειδή ϕ ′ x∗ ≤ L < 1 ⇒ p = 1 , άρα η τάξη σύγκλισης
σχέση
xn = ϕ ( xn −1 ) , n > 0 (i)
Ορίζουμε επίσης την ποσότητα σφάλματος
ε n = xn − x∗ και ε n −1 = xn −1 − x∗ (ii)
(i )
1
⇒ ε n + x∗ = ϕ ( ε n −1 + x∗ ) ⇒ ε n + x∗ = ϕ ( x∗ ) + ε n −1ϕ ′ ( x∗ ) + ε n2−1ϕ ′′ ( x∗ ) + O ( ε n3−1 )
( ii ) 2
ή αν ϕ ∈ C k [ a, b ] , τότε
1 1 k (k )
ε n + x∗ = ϕ ( x∗ ) + ε n −1ϕ ′ ( x∗ ) + ε n2−1ϕ ′′ ( x∗ ) + + ε n −1ϕ (ξ n −1 )
2 k!
όπου ξ n −1 μεταξύ των x∗ και xn −1 . Επειδή x∗ = ϕ x∗ , άρα έχουμε την εξίσωση ( )
σφάλματος
1 1 k (k )
ε n = ε n −1ϕ ′ ( x∗ ) + ε n2−1ϕ ′′ ( x∗ ) + + ε n −1ϕ (ξ n −1 ) (*)
2 k!
⇒ lim
n →∞
εn 1
ε n −1 2
2 n
(→∞
1
2
)
= ϕ ′′ lim ξ n −1 = ϕ ′′ ( x* )
54
2
H τελευταία σχέση σημαίνει ότι υπάρχει N ∈ τέτοιος ώστε ε n ≤ C ε n −1 , ∀n ≥ N
1
όπου C > ϕ ′′ ( x* ) και επομένως η σύγκλιση της μεθόδου θα είναι τετραγωνική.
2
Απαραίτητη λοιπόν προϋπόθεση για να έχουμε τάξη σύγκλισης της ακολουθίας
⇒ lim
n →∞
εn 1
ε n −1 k !
k (n →∞
)1
= ϕ ( k ) lim ξ n −1 = ϕ ( k ) ( x* )
k!
και επομένως η μέθοδος που θα προκύψει σε αυτήν την περίπτωση είναι τάξης k με
1 (k ) *
ασυμπτωτική σταθερά σφάλματος C = ϕ ( x ) . Το να μπορέσουμε όμως να βρούμε
k!
κατάλληλη συνάρτηση ϕ η οποία να ικανοποιεί όλες τις συνθηκες της (**) είναι
εξαιρετικά δύσκολο. Για τον λόγο αυτό συνήθως περιοριζόμαστε σε μεθόδους που
έχουν τάξη το πολύ 2 ή 3. Θα προσπαθήσουμε στην συνέχεια να κατασκευάσουμε μία
μέθοδο με τάξη σύγκλισης μεγαλύτερης της μονάδας ( p > 1 ) .
ϕ ′ ( x ) = 1 + λ f ′ ( x ) ⎪⎫ 1
⎬⇒λ = −
ϕ′( x ) = 0
*
⎪⎭ f ′ ( x* )
55
f ( xn )
επαναληπτική μέθοδος που παράγεται είναι η xn +1 = xn − . Το πρόβλημα με την
f ′ ( x∗ )
μέθοδο αυτή όμως είναι ότι το δεξί μέλος περιέχει την ποσότητα που θέλουμε να
f ( xn )
έχουμε xn +1 = xn − , δηλαδή μία αναδρομική σχέση με αντίστοιχη συνάρτηση
f ′ ( xn )
f ( x)
επανάληψης ϕ ( x ) = x − . Κατά πόσο όμως συνεχίζει να ισχύει ϕ ′ ( x* ) = 0 ? Ας
f ′( x)
( )
εξετάσουμε κατά πόσο η συνθήκη ϕ ′ x* = 0 συνεχίζει να ισχύει.
⎣ ⎦
( )
διότι f x* = 0 . Άρα η τροποποιημένη μέθοδος ικανοποιεί την αναγκαία συνθήκη ώστε
Έστω, ( x , f ( x ))
n n ένα σημείο της y = f ( x ) . Η εφαπτομένη της καμπύλης στο σημείο
Φέρνουμε την ευθεία αυτή ώσπου να τμήσουμε τον άξονα x , οπότε στο σημείο τομής
xn +1 θα ισχύει y = 0 . Δηλαδή,
f ( xn )
0 = f ( xn ) + f ′ ( xn )( xn +1 − xn ) ⇒ − f ( xn ) = f ′ ( xn )( xn +1 − xn ) ⇒ xn +1 − xn = − ⇒
f ′ ( xn )
f ( xn )
xn +1 = xn −
f ′ ( xn )
ακρίβεια. Προϋπόθεση φυσικά για την εφαρμογή της μεθόδου είναι ότι f ( xn ) ≠ 0 ∀xn .
56
y y = f ( xn ) + f ′ ( xn )( x − xn )
f ( xn )
x∗
x
xn + 2 xn +1 xn
1
f ( x* ) = 0 ⇒ f ( xn − ε n ) = 0 ⇒ f ( xn ) − ε n f ′ ( xn ) + ε n2 f ′′ (ξ n ) = 0 ⇒
2
1 f ( xn ) 1 2 f ′′ (ξ n )
ε n f ′ ( xn ) = f ( xn ) + ε n2 f ′′ (ξ n ) = 0 ⇒ ε n ≡ xn − x∗ = + εn ⇒
2 f ′ ( xn ) 2 f ′ ( xn )
f ( xn ) 1 2 f ′′ (ξ n )
x∗ = xn − − εn ,
f ′ ( xn ) 2 f ′ ( xn )
όπου ξ n στο διάστημα των xn και x ∗ . Εάν ε n 1 , όταν δηλαδή βρισκόμαστε κοντά
1 f ′′ (ξ n )
στην ρίζα, τότε μπορούμε να αμελήσουμε τον όρο − ε n2 1 , οπότε
2 f ′ ( xn )
f ( xn ) f ( xn )
x∗ ≈ xn − ⇒ xn +1 = xn − .
f ′ ( xn ) f ′ ( xn )
57
2.7.2 Απόδειξη σύγκλισης της Newton-Raphson (τοπικής σύγκλισης)
Πρόταση: Έστω μια συνεχής συνάρτηση f: → και ότι ∃x* ∈ τέτοιο ώστε
παραγωγίσιμη σε ένα μικρό διάστημα κοντά στο x ∗ . Τότε υπάρχει κλειστό διάστημα I
ε f ′′ ( x ) ∗
f ( x ) f ′′ ( x )
Εφόσον η f ∈ C 2 ( I ) , άρα και η ϕ ′ ( x ) = είναι συνεχής, δηλαδή η ϕ είναι
⎡⎣ f ′ ( x ) ⎤⎦
2
ϕ ( x ) − x∗ = ϕ ( x ) − ϕ ( x∗ ) ≤ L x − x∗ ≤ x − x∗
και συνεπώς ϕ ( x ) ∈ I . Εφόσον η ϕ απεικονίζει το I στον εαυτό του και είναι συστολή,
οπότε ικανοποιεί τις προϋποθέσεις του θεωρήματος της συστολής και άρα ∀x0 ∈ I η
ακολουθία { xn }n∈ συγκλίνει στο x∗ , το οποίο είναι σταθερό σημείο της ϕ . Επιπλέον,
ισχύει
1
f ( xn ) = f ( x∗ + ε n ) = f ( x∗ ) + ε n f ′ ( xn ) + ε n2 f ′′ (ξ n1 )
2
f ′ ( xn ) = f ′ ( x∗ + ε n ) = f ′ ( x∗ ) + ε n f ′′ (ξ n 2 )
Έτσι από τον ορισμό της αναδρομικής σχέσης και τις παραπάνω δύο σχέσεις έχουμε
1
f ( xn ) f ( x ) f ( x∗ ) + ε n f ′ ( x∗ ) + ε n2 f ′′ (ξ n1 )
xn +1 = xn − ⇒ xn +1 − x* = xn − x* − n
⇒ ε n +1 = ε n − 2
f ′ ( xn )
ε ε
f ′ ( xn ) f ( x ) + ε n f (ξ n 2 )
′ ∗
′′
n +1 n
1 1
f ′′ (ξ n 2 ) − f ′′ (ξ n1 ) ε f ′′ ( x∗ ) − f ′′ ( x∗ ) f ′′ ( x∗ )
⇒ ε n +1 = ε 2 2 ⇒ lim 2 =
n +1 2 =
f ′ ( x∗ ) + ε n f ′′ (ξ n 2 ) n →∞ ε f ′ ( x∗ ) 2 f ′ ( x∗ )
n
n
58
( )
Αν επιπλέον f ′′ x* ≠ 0 , τότε η σύγκλιση της μεθόδου είναι ακριβώς 2. Στην παραπάνω
lim ξ n1 = lim ξ n 2 = x* .
n →∞ n →∞
Άρα,
f ′ ( x ) = m ( x − x∗ ) g ( x ) + ( x − x∗ ) g ′ ( x ) ⇒ f ′ ( x∗ ) = 0
m −1 m
f(
k)
( x ) = 0,
∗
k = 0,1, 2,… , m − 1
και
f(
m)
(x ) ≠ 0
∗
ε nm −1 ε nm ε nm
f ( xn ) = f ( x∗ + ε n ) = f ( x∗ ) + f ′ ( x∗ ) ε n + + f ( m −1) ( x∗ ) + f ( m ) (ξ n1 ) = f ( m ) (ξ n1 )
( m − 1)! m! m!
ε nm −1
f ′ ( xn ) = f ( (ξ n 2 )
m)
=0
( m − 1)!
όπου τα ξ n1 και ξ n 2 βρίσκονται στο διάστημα που ορίζουν τα xn και x* . Τα δύο
παραγωγίσιμη σε μία περιοχή κοντά στο x* . Έτσι από τον ορισμό της αναδρομικής
σχέσης και τις δύο τελευταίες εκφράσεις (δηλαδή τα αναπτύγματα Taylor) έχουμε:
59
ε nm
f ( m ) (ξ n1 ) ⎛ f ( ) (ξ ) ⎞ ε
m
f ( ) (ξ )
m
ε n +1 = ε n − m! = ε n ⎜1 − ( m ) n1 ⎟ ⇒ n +1 = 1 − ( m ) n1
ε nm−1 ⎜ mf (ξ ) ⎟ εn mf (ξ n 2 )
f ( m ) (ξ n 2 ) ⎝ n2 ⎠
( m − 1)!
Εφόσον η μέθοδος συγκλίνει έχουμε lim f (
n →∞
m)
(ξn1 ) = f(
m)
( lim ξ ) = f
n →∞
n1
( m)
(x )
*
και
lim f (
n →∞
m)
(ξ n 2 ) = f(
m)
( lim ξ ) = f
n →∞
n2
( m)
( x ) οπότε η παραπάνω σχέση δίνει:
*
ε n +1 1
lim = 1 − ≠ 0 αν m ≠ 1 !
n →∞ ε m
n
f ( xn )
xn +1 = xn − m
f ′ ( xn )
Έστω τώρα ότι δεν ξέρουμε την πολλαπλότητα της ρίζας. Ορίζουμε την συνάρτηση
f ( x)
ω ( x) = . Επειδή f ( x ) = ( x − x∗ ) g ( x ) , με g ( x* ) ≠ 0 και
m
f ′( x)
f ′ ( x ) = m ( x − x∗ ) g ( x ) + ( x − x∗ ) g ′ ( x ) άρα
m −1 m
ω ( x) =
( x − x ) g ( x) ∗ m
=
( x − x ) g ( x) ∗
m ( x − x ) g ( x) + ( x − x )
∗ m −1
g′ ( x ) m g ( x ) + ( x − x ) g′ ( x )
∗ m ∗
0
Παρατηρούμε ότι ω x* = ( ) m g (x )
∗
= 0 , δηλαδή το x* είναι ρίζα της συνάρτησης ω .
Δείχνουμε στην συνέχεια ότι το x∗ είναι απλή ρίζα της ω . Αρκεί να ισχύει ω ′ x∗ ≠ 0 . ( )
Πράγματι,
( x − x ) g ( x ) ⎡⎣m g ′ ( x ) + g ′ ( x ) + ( x − x ) g ′′ ( x )⎤⎦
g ( x ) + ( x − x∗ ) g ′ ( x )
∗ ∗
ω′ ( x ) = − ⇒
m g ( x) + ( x − x ) g′( x) ⎡m g ( x ) + ( x − x ) g ′ ( x )⎤
∗ 2
∗
⎣ ⎦
g ( x* ) 0 1
ω′ ( x ) =*
− = ≠0
m g (x ) ⎡ m g ( x* ) ⎤
* 2
m
⎣ ⎦
60
Αρα η πολλάπλότητα της ρίζας x* για την συνάρτηση ω είναι 1. Οπότε μπορούμε να
εφαρμόσουμε την μέθοδο Newton-Raphson στην συνάρτηση ω για την οποία έχουμε,
ω ( xn )
xn +1 = xn −
ω ′ ( xn )
⎛ f ( x ) ⎞′ f ′ ( x ) f ′′ ( x ) f ( x ) f ′′ ( x ) f ( x )
ω ′ ( x ) = ⎜⎜ ⎟⎟ = − = 1−
⎝ f ′( x) ⎠ f ′( x) ⎡⎣ f ′ ( x ) ⎤⎦ ⎡⎣ f ′ ( x ) ⎤⎦
2 2
άρα
f ( xn )
f ′ ( xn ) f ( xn ) f ′ ( xn )
xn +1 = xn − = xn −
f ′′ ( xn ) f ( xn ) ( f ′ ( x ) ) − f ( x ) f ′′ ( x
2
)
1− n n n
⎡⎣ f ′ ( xn ) ⎤⎦
2
f ( xn ) − f ( xn −1 )
f ′ ( xn ) ≈
xn − xn −1
Έτσι, παίρνουμε τη μέθοδο
f ( xn )( xn − xn −1 )
xn +1 = xn −
f ( xn ) − f ( xn −1 )
Προφανώς, η μέθοδος για να ξεκινήσει απαιτεί δύο σημεία, τα x0 και x1 , καθώς και τις
1+ 5
• Η τάξη σύγκλισης της μεθόδου είναι p = ≈ 1.62 < 2 , άρα η σύγκλιση είναι
2
πιο γρήγορη σε σχέση με την γενική επαναληπτική μέθοδο αλλά πιο αργή σε
σχέση μη την μέθοδο Newton-Raphon.
61
• Χρειάζεται δύο αρχικές τιμές για να ξεκινήσει.
• Δεν απαιτείται γνώση της παραγώγου της συνάρτησης
στην οποία τέμνει τον άξονα είναι μία προσέγγιση της λύσης της εξίσωσης f ( x ) = 0 . Η
( ) (
σημεία xn −1 , f ( xn −1 ) και xn , f ( xn ) είναι η )
f ( xn ) − f ( xn −1 )
p ( x ) = y = f ( xn ) + ( x − xn )
( xn − xn −1 )
Εύκολα διαπιστώνουμε ότι
• Για x = xn , y = f ( xn )
f ( xn ) − f ( xn −1 )
• Για x = xn −1 , y = f ( xn ) + ( xn −1 − xn ) = f ( xn −1 )
( xn − xn−1 )
Επιπλέον, το σημείο στο οποίο τέμνει τον άξονα η ευθεία αυτή είναι το σημείο
f ( xn ) − f ( xn −1 ) f ( x )( x − x )
f ( xn ) + ( xn+1 − xn ) = 0 ⇒ xn +1 − xn = − n n n−1 ⇒
( xn − xn−1 ) f ( xn ) − f ( xn −1 )
f ( xn )( xn − xn −1 )
xn +1 = xn − “Μέθοδος εφαπτομένης (ή τέμνουσας)”
f ( xn ) − f ( xn −1 )
62
y ( x)
y = f ( x)
f ( xn −1 )
f ( xn )
x∗ x
xn +1 xn xn −1
σχέση
f ( xn )( xn − xn −1 )
xn +1 = xn −
f ( xn ) − f ( xn −1 )
και για τις αρχικές τιμές x0 και x1 να είναι καλά ορισμένη και να συγκλίνει στο x ∗ . Η
1+ 5
τάξη σύγκλισης είναι p = ≈ 1.62 .
2
Αν η ρίζα την οποία ζητάμε έχει πολλαπλότητα άρτιου αριθμού, τότε η μέθοδος
διχοτόμησης και της εφαπτομένης (ή τέμνουσας) δεν μπορούν να εφαρμοσθούν. Όταν
μπορούμε να εφαρμόσουμε την μέθοδο της διχοτόμησης ή την μέθοδο της τέμνουσας
αυτές συγκλίνουν πάντα, έστω και αργά. Επίσης, η Newton-Raphson συγκλίνει
αρκετά γρήγορα, αλλά όχι πάντα, πρέπει η αρχική προσέγγιση να είναι κοντά στην
ρίζα.
63
Κεφάλαιο 3
Επίλυση συστημάτων γραμμικών εξισώσεων
3.1. Εισαγωγή
⎧ a1 x + b1 y + c1 z = d1
⎪
⎨ a2 x + b2 y + c2 z = d 2 (*)
⎪a x + b y + c z = d
⎩ 3 3 3 3
ένα σύστημα τριών γραμμικών εξισώσεων. Εφόσον το σύστημα των τριών εξισώσεων
περιέχει τρεις αγνώστους, αναμένεται ότι υπάρχει μοναδική λύση, δηλαδή ότι
υπάρχουν μοναδικές τιμές των x , y και z οι οποίες ικανοποιούν το σύστημα (*). Θα
αποδειχτεί ότι αυτό δεν είναι πάντα αληθές και ο σκοπός στο πρώτο μέρος του
κεφαλαίου είναι να επανεξεταστεί κατάλληλα η λύση των γραμμικών εξισώσεων
συμεριλαμβάνοντας συνθήκες για την ύπαρξη τέτοιων λύσεων. Για ευκολία οι
γραμμικές εξισώσεις αναπαρίστανται υπό μορφή πινάκων. Στην γενική του μορφή ένα
γραμμικό σύστημα εξισώσεων έχει την μορφή
64
(α) πυκνό ή αποθηκεύσιμο όταν περιέχει μη-μηδενικά σχεδόν παντού σε όλες τις
γραμμές και τις στήλες του και
(β) αραιό ή σποραδικό όταν έχει συγκεκριμένη δομή και τα περισσότερα στοιχεία του
είναι μηδενικά.
Οι αριθμητικές μέθοδοι για τους αραιούς πίνακες είναι συνήθως ειδικής μορφής ώστε
να εκμεταλλεύονται τα πολλά μηδενικά στοιχεία και την δομή του πίνακα. Αυτό έχει
σαν αποτέλεσμα οι αντίστοιχοι αλγόριθμοι να είναι πολύ πιο γρήγοροι σε σχέση με
τους αντίστοιχους αλγόριθμους για τους πυκνούς πίνακες.
τριγωνικός πίνακας, b ∈ n
είναι γνωστό διάνυσμα και x ∈ n
είναι το ζητούμενο
( ) ∏u
n
στοιχείων του, δηλαδή det U = i ,i το οποίο συνεπάγεται ότι όλα τα διαγώνια
i =1
65
Η εύρεση της λύσης του συστήματος αυτού βρίσκεται πολύ εύκολα αν ξεκινήσουμε
από την τελευταία εξίσωση και λύσουμε ως προς τον μοναδικό άγνωστο της εξίσωσης
xn = bn un,n
ο οποίος φυσικά είναι καλά ορισμένος διότι όλα τα διαγώνια στοιχεία του πίνακα είναι
μη-μηδενικά. Στην συνέχεια παρατηρούμε ότι η 2η από το τέλος εξίσωση έχει μοναδικό
xn −1 = ( bn −1 − un −1,n xn ) un −1,n −1
Όμοια η 3η από το τέλος εξίσωση έχει μοναδικό άγνωστο τον xn −2 και τον οποίο
ότι σε κάθε βήμα της διαδικασίας ο μοναδικός άγνωστος είναι αυτός που βρίσκεται
στην πιο αριστερά θέση της τρέχουσας εξίσωσης, ο οποίος μάλιστα είναι και διαγώνιος.
∑u
k =i
i ,k xk = bi , i = 1, 2,3,..., n
n
ui ,i xi + ∑u
k =i +1
i ,k xk = bi , i = 1, 2,3,..., n
και μπορεί να λυθεί ως προς τον άγνωστο xi , αρκεί να ξεκινήσουμε από το τέλος προς
66
xn = bn un ,n
⎛ n
⎞
xi = ⎜ bi − ∑ ui ,k xk ⎟ ui ,i , i = n − 1, n − 2,...,1
⎝ k = i +1 ⎠
L ⋅ x = b όπου L ∈ n ,n
είναι δεδομένος άνω τριγωνικός πίνακας, b ∈ n
είναι γνωστό
διάνυσμα και x ∈ n
είναι το ζητούμενο διάνυσμα. Αναλυτικά το σύστημα των
x
1,1 1 = b1
x +
2,1 1 x
2,2 2 = b2
.....................................................................
n −1,1 x1 + n −1,2 x2 +…+ n −1, n −1 xn −1 = bn −1
x
n ,1 1 + x
n ,2 2 +… + x
n , n −1 n −1 + n,n n x = bn
πίνακας είναι τριγωνικός η ορίζουσά του είναι ίση με το γινόμενο των διαγωνίων
( ) ∏
n
στοιχείων του, δηλαδή det L = i ,i το οποίο συνεπάγεται ότι όλα τα διαγώνια
i =1
Η εύρεση της λύσης του συστήματος αυτού βρίσκεται πολύ εύκολα αν ξεκινήσουμε
από την πρώτη εξίσωση και λύσουμε ως προς τον μοναδικό άγνωστο της εξίσωσης
67
x1 = b1 u1,1
ο οποίος φυσικά είναι καλά ορισμένος διότι όλα τα διαγώνια στοιχεία του πίνακα είναι
μη-μηδενικά. Στην συνέχεια παρατηρούμε ότι η 2η εξίσωση έχει μοναδικό άγνωστο τον
x2 = ( b2 − x
2,1 1 ) 2,2
Όμοια η 3η εξίσωση έχει μοναδικό άγνωστο τον x3 τον οποίο και μπορούμε να
ότι σε κάθε βήμα της διαδικασίας ο μοναδικός άγνωστος είναι αυτός που βρίσκεται
στην πιο δεξιά θέση της τρέχουσας εξίσωσης, ο οποίος μάλιστα είναι και διαγώνιος.
∑
k =1
i ,k xk = bi , i = 1, 2,3,..., n
i −1
∑
k =1
i ,k xk + x = bi , i = 1, 2,3,..., n
i ,i i
και μπορεί να λυθεί ως προς τον άγνωστο xi , αρκεί να ξεκινήσουμε από την αρχή προς
το τέλος, δηλαδή:
x1 = b1 1,1
⎛ n
⎞
xi = ⎜ bi − ∑ i ,k xk ⎟ i ,i , i = 2,3,..., n
⎝ k =i +1 ⎠
68
3.4. Απαλοιφή Gauss
και εναλλάσσουμε την πρώτη με την k εξίσωση του συστήματος. Ο νέος πίνακας που
(1)
προκύπτει είναι ο πίνακας A του συστήματος με στοιχεία ai(1)
,j , i, j = 1, 2,..., n .
⎡ a1,1
(1) (1)
a1,2 (1)
a1,3 ... a1,(1)n ⎤ ⎡ x1 ⎤ ⎡b1(1) ⎤
⎢ (1) (1) (1) (1)
⎥ ⎢ ⎥ ⎢ (1) ⎥
⎢ a2,1 a2,2 a2,3 ... a2,n ⎥ ⎢ x2 ⎥ ⎢b2 ⎥
⎢ ⎥ ⋅ ⎢... ⎥ = ⎢ ⎥
⎢....................................... ⎥ ⎢ ⎥ ⎢... ⎥
⎢ (1) (1) ⎥
⎣ a2,1 an ,2 an ,3 ... an ,n ⎦ ⎢⎣ n ⎥⎦ ⎣⎢bn ⎥⎦
(2) (1) x (1)
ai(1)
(β) Ορίζουμε τις ποσότητες mi ,1 = , i = 2,3,..., n .
,1
(1)
a1,1
«i» εξίσωση. Το νέο αποτέλεσμα το θέτω στην θέση της «i» εξίσωσης. Την διαδικασία
69
αυτή την εφαρμόζουμε για i = 2,3,..., n . Έτσι το νέο σύστημα που θα προκύψει θα είναι
το εξής:
⎡ a1,1
(1) (1)
a1,2 (1)
a1,3 ... a1,(1)n ⎤ ⎡ x1 ⎤ ⎡b1(1) ⎤
⎢ (2) (2)
⎥ ⎢ ⎥ ⎢ ⎥
⎢0 a2,2 a2,3 ... a2,(2)n ⎥ ⎢ x2 ⎥ ⎢b2(2) ⎥
⎢ ⎥ ⋅ ⎢... ⎥ = ⎢... ⎥
⎢....................................... ⎥ ⎢ ⎥ ⎢ ⎥
⎢0 (2) ⎥
⎢ x ⎥ ⎢⎣bn(2) ⎥⎦
n ,n ⎦ ⎣ n ⎦
(2) (2)
⎣ a n ,2 a n ,3 ... a
x
A( 2) b( 2)
Παρατηρούμε δηλαδή ότι με αυτόν τον τρόπο όλα τα στοιχεία της 1ης στήλης κάτω από
(1)
το στοιχείο a1,1 έχουν γίνει μηδέν, οπότε λέμε ότι το πρώτο βήμα της διαδικασίας της
, j = ai , j − mi ,1a1, j ,
ai(2) i, j = 2,3,..., n
(1) (1)
ai(2)
στο προηγούμενο βήμα. Έτσι έχουμε τις ποσότητες mi ,2 = ,2
(2)
, i = 3, 4,..., n . Αν
a2,2
(2)
a2,2 = 0 τότε εφαρμόζουμε την διαδικασία του (α) βήματος, δηλαδή ψάχνουμε όλες τις
εξισώσεις από την 3η έως και την τελευταία για να βρούμε ποια έχει
a (2)
k ,2 ≠ 0, k = 3, 4,..., n Στην συνέχεια παίρνουμε τον γραμμικό συνδυασμό των εξισώσεων
όπως προηγουμένως οπότε θα προκύψει το εξής σύστημα:
⎡ a1,1
(1) (1) (1)
... a1,(1)n ⎤ x
⎡ 1 ⎤ ⎡b1 ⎤
a1,2 a1,3 (1)
⎢ ⎥ ⎢ ⎥
⎢0
(2)
a2,2 (2)
a2,3 ... a2,(2)n ⎥ ⎢ x2 ⎥ ⎢b2(2) ⎥
⎢ ⎥ ⎢ ⎥
⎢0 0 (3)
a3,3 ... a3,(3)n ⎥ ⋅ ⎢ x3 ⎥ = ⎢⎢b3(3) ⎥⎥
⎢....................................... ⎥ ⎢... ⎥ ⎢... ⎥
⎢ ⎥ ⎢ ⎥ ⎢ (3) ⎥
⎢0 0 an,3 ... an ,n ⎥ ⎢⎣ xn ⎥⎦ ⎢⎣bn ⎥⎦
(3) (3)
⎣ ⎦ x
b(3)
A(3)
στο οποίο η πρώτη και η δεύτερη γραμμή είναι η ίδια με του προηγούμενου πίνακα,
(2)
τα στοιχεία της δεύτερης στήλης κάτω από το a2,2 έχουν γίνει μηδέν ενώ τα υπόλοιπα
70
, j = ai , j − mi ,2 a2, j ,
ai(3) i, j = 3, 4,..., n
(2) (2)
.
bi(3) = bi(2) − mi ,2b2(2) , i = 3, 4,..., n
(ε) Συνεχίζουμε την ίδια διαδικασία και στο τέλος του r-βήματος το σύστημα που
( r +1) ( r +1) ( r +1)
προκύπτει είναι A ⋅x =b , 1 ≤ r ≤ n − 1 όπου τα στοιχεία του A δίνονται από
τον τύπο
⎪ ( r +1) ⎪ (*)
⎩⎪bi = bi( r ) − mi ,r br( r ) , i = r + 1, r + 2,..., n ⎭⎪
mi ,r = ai(,rr) ar( ,rr) , i = r + 1, r + 2,..., n
Ο τύπος (*) αποτελεί ουσιαστικά την απαλοιφή Gauss. Να σημειωθεί ότι τα στοιχεία
ar( r,r) ονομάζονται οδηγοί και οι ποσότητες mi ,r ονομάζονται πολλαπλασιαστές.
Στο τέλος του n-2 βήματος θα έχουμε
⎡ a1,1
(1) (1)
a1,2 (1)
a1,3 ... a1,(1)n −1 a1,(1)n ⎤ ⎡ x ⎤ ⎡b1(1) ⎤
⎢ ⎥ 1
⎢ 0 (2) (2)
... (2) (2) ⎢ x ⎥ ⎢b (2) ⎥
a a a a 2, n ⎥ ⎢ 2 ⎥
⎥ ⎢
2,2 2,3 2, n −1 2 ⎥
⎢
⎢0 0 (3)
a3,3 ... a3,n −1 (3)
a3,n ⎥ ⎢ x3 ⎥ ⎢b3(3) ⎥
(3)
⋅ =⎢ ⎥
⎢.......................................................... ⎥ ⎢... ⎥ ⎢... ⎥
⎢ ⎥ ⎢ ⎥
⎢ ( 1) ⎥
⎢0 0 0 ... an( n−1,−1)n −1 an( n−1,−1)n ⎥ ⎢⎢ xn −1 ⎥⎥ ⎢bn n−1− ⎥
⎢ ⎥ ⎢ ( n −1) ⎥
⎢⎣ 0 0 0 ... an( n, n−−1)1 an( n, n−1) ⎥⎦ ⎢⎣ xn ⎥⎦ ⎢⎣bn ⎥⎦
x
A( n−1) b( n−1)
και τελικά, εφαρμόζοντας την διαδικασία για τις δύο μόνο τελευταίες εξισώσεις
παίρνουμε:
⎡ a1,1
(1) (1)
a1,2 (1)
a1,3 ... a1,(1)n −1 a1,(1)n ⎤ ⎡ x ⎤ ⎡b1(1) ⎤
⎢ ⎥ 1 ⎢ ⎥
⎢0
(2)
a2,2 (2)
a2,3 ... a2,(2)n −1 a2,(2)n ⎥ ⎢ x2 ⎥ ⎢b2(2) ⎥
⎢ ⎥ ⎢ ⎥
⎢ 0 0 a (3)
... a (3)
a (3)
⎥⋅ ⎢ x ⎥ ⎢b3(3) ⎥
3,3 3, −1 3, 3
=⎢ ⎥
⎢..........................................................⎥ ⎢... ⎥ ⎢... ⎥
n n
⎢ ⎥ ⎢ ⎥
⎢ ⎥
⎢0 0 0 ... an −1,n −1 an −1, n ⎥ ⎢ n −1 ⎥⎥ ⎢bn( n−1−1) ⎥
( n −1) ( n −1) ⎢ x
⎢ ⎥ ⎢ (n) ⎥
⎢⎣ 0 0 0 ... 0 an( n,n) ⎥⎦ ⎣⎢ xn ⎦⎥ ⎣⎢bn ⎦⎥
x
A( n ) b( n )
Επομένως στο τέλος της τριγωνοποίησης έχει προκύψει ένα ισοδύναμο σύστημα,
(n) (n) (n)
A ⋅ x = b , με το αρχικό σύστημα του οποίου όμως ο πίνακας A είναι άνω
U ⋅ x = bˆ, U ≡ A , b ≡ b
(n) (n)
τριγωνικός. Έτσι μπορούμε να γράψουμε και να
71
Παράδειγμα: (δείτε το παράδειγμα στις σελίδες 73 και 74 του βιβλίου των Ακρίβη και
Δουγαλή, Εισαγωγή στην Αριθμητική Ανάλυση, 5η αναθεωρημένη έκδοση).
ar( ,rr) , r = 1, 2,..., n − 1 , δηλαδή οι οδηγοί της απαλοιφής, που απαιτούνται για τον
72
υπολογιστικό κόστος αυξάνει σε μεγάλο βαθμό ενώ θα πρέπει να σημειωθεί ότι οι
περιπτώσεις που η μερική οδήγηση δεν είναι αρκετή για να κάνει τον αλγόριθμο
ευσταθή αλλά μπορεί να τον κάνει ευσταθή η ολική οδήγηση είναι ελάχιστες. Για τους
λόγους αυτούς η ολική οδήγηση σπάνια χρησιμοποιείται.
Παράδειγμα: (δείτε το παράδειγμα στις σελίδες 79 και 80 του βιβλίου των Ακρίβη και
Δουγαλή, Εισαγωγή στην Αριθμητική Ανάλυση, 5η αναθεωρημένη έκδοση).
3.5. Ανάλυση LU
αυτόν του τελευταίου βήματος της τριγωνοποίησης κατά την απαλοιφή Gauss και L
είναι ένας κάτω τριγωνικός πίνακας ο οποίος περιέχει μονάδες στην διαγώνιό του και
στις στήλες τους πολλαπλασιαστές που προκύπτουν κατά την διαδικασία της
τριγωνοποίησης της απαλοιφής Gauss. Ας υποθέσουμε προς στιγμή ότι δεν έχει γίνει
καμία εναλλαγή γραμμών κατά την τριγωνοποίηση (δηλαδή σαν να μην έχουμε
εφαρμόσει την διαδικασία της μερικής ή ολικής οδήγησης). Σύμφωνα με αυτήν την
ζητούμενο διάνυσμα x .
Στην περίπτωση που εφαρμόζουμε μερική οδήγηση κατά την απαλοιφή Guass η
διαδικασία είναι η ίδια που περιγράφηκε παραπάνω μόνο που η απαραίτητη
πληροφορία σχετικά με τις εναλλαγές γραμμών αποθηκεύεται σε ένα διάνυσμα και
λαμβάνεται υπόψη τόσο στην πίσω όσο και στην εμπρός αντικατάσταση.
73
Το πλεονέκτημα της ανάλυσης LU βρίσκεται στο γεγονός ότι μπορούμε να λύσουμε το
γραμμικό σύστημα για πολλαπλά δεξιά μέλη, δηλαδή A ⋅ x = b j , j = 1, 2,..., m οπότε
ουσιαστικά έχουμε να λύσουμε «m» στο πλήθος γραμμικά συστήματα στα οποία ο
πίνακας A είναι ο ίδιος. Με την απαλοιφή Gauss θα έπρεπε κάθε φορά να
επαναλάβουμε την διαδικασία της τριγωνοποίησης, η οποία υπενθυμίζεται ότι δεν
εξαρτάται από το δεξί μέλος του γραμμικού συστήματος παρά μόνο από τα στοιχεία
του πίνακα A . Ένα παράδειγμα στο οποίο απαιτείται πολλαπλή επίλυση γραμμικών
μηδενική ορίζουσα, x j είναι οι στήλες του αντίστροφου πίνακα και e j είναι ένα
διάνυσμα διάστασης n το οποίο έχει παντού μηδενικά εκτός από την θέση j στην οποία
υπάρχει η μονάδα (τα e j , j = 1, 2,..., n αποτελούν μία βάση του χώρου n
).
Στην παράγραφο αυτή θα μελετήσουμε την επίλυση γραμμικών συστημάτων στα οποία
ο πίνακας του συστήματος είναι συμμετρικός και θετικά ορισμένος. Ο ορισμός,
ιδιότητες και χαρακτηριστικά των θετικά ορισμένων πινάκων δίνονται στο παράρτημα
Π4.
(Η παράγραφος αυτή δεν είναι ολοκληρωμένη. Για τον λόγο αυτό, δείτε την παράγραφο
3.5., σελίδες 93-96, του βιβλίου των Ακρίβη και Δουγαλή, Εισαγωγή στην Αριθμητική
Ανάλυση, 5η αναθεωρημένη έκδοση).
Στην παράγραφο αυτή θα μελετήσουμε ένα παράδειγμα άμεσης μεθόδου για αραιούς
ή σποραδικούς πίνακες, δηλαδή για πίνακες που τα περισσότερα στοιχεία τους είναι
μηδέν και έχουν συγκεκριμένη δομή. Πιο συγκεκριμένα θα θεωρήσουμε ότι ο n × n
πίνακας A του γραμμικού προβλήματος έχει την μορφή:
74
⎡ a1 β1 ⎤
⎢γ a2 β2 0 ⎥
⎢ 2 ⎥
⎢ γ3 a3 β3 ⎥
A=⎢ ⎥
⎢ . . . ⎥
⎢ 0 γ n −1 an −1 β n −1 ⎥
⎢ ⎥
⎣⎢ γn an ⎦⎥
δηλαδή, πρόκειται για έναν πίνακα ο οποίος έχει τα στοιχεία ai , i = 1, 2,..., n στην κύρια
⎡ δ1 0 ⎤
⎢γ δ 0 0 ⎥
⎢ 2 2 ⎥
⎢ γ 3 δ3 0 ⎥
και μάλιστα ισχύει A = L ⋅U όπου L=⎢ ⎥ και
⎢ . . . ⎥
⎢ 0 γ n −1 δ n −1 0 ⎥
⎢ ⎥
⎣⎢ γ n δ n ⎦⎥
⎡1 ε1 ⎤
⎢0 1 ε 0 ⎥
⎢ 2 ⎥
⎢ 0 1 ε3 ⎥
U =⎢ ⎥.
⎢ . . . ⎥
⎢ 0 0 1 ε n −1 ⎥
⎢ ⎥
⎣⎢ 0 1 ⎦⎥
Όπως ήδη γνωρίζουμε από την ανάλυση LU αν ισχύει A = L ⋅ U όπου ο L είναι ένας
κάτω τριγωνικός πίνακα και ο U είναι ένας άνω τριγωνικός πίνακας τότε θα έχουμε
75
άγνωστο διάνυσμα y (εφόσον τα L, f είναι γνωστά). Στην συνέχεια επιλύουμε το
προκύπτουν από την φάση της τριγωνοποίησης. Βλέπουμε όμως ότι στην περίπτωση
του τριδιαγώνιου συστήματος η μορφή τους είναι εξαιρετικά απλή. Πιο συγκεκριμένα ο
L είναι ένας κάτω τριγωνικός πίνακας που έχει μη-μηδενικά στοιχεία μόνο στην κύρια
διαγώνιό του και ακριβώς αριστερά από αυτήν. Τα στοιχεία μάλιστα αριστερά της
διαγωνίου είναι τα ίδια με αυτά του πίνακα A . Ο πίνακας U είναι ένας άνω τριγωνικός
πίνακας με μονάδες στην κύρια διαγώνιό του και μη-μηδενικά στοιχεία ακριβώς δεξιά
της κυρίας διαγωνίου. Επομένως τα μόνα στοιχεία των πινάκων αυτήν είναι τα
ε i , i = 1, 2,..., n − 1 και δ i , i = 1, 2,..., n . Τα στοιχεία αυτά θα προσδιοριστούν από την
ισότητα A = L ⋅ U . Πράγματι αν εκτελέσουμε τον πολλαπλασιασμό των πινάκων L, U
¾ ....
¾ Από την n-γραμμή – n-στήλη θα έχουμε δ n = an − γ nε n −1
76
⎧δ1 = a1 , ε1 = β1 δ1 ⎫
⎪ για k = 2,3,..., n − 1:⎪
⎪ ⎪
⎪ δ k = ak − γ k ε k −1 ⎪
⎪ ⎪
⎨ ε k = βk δ k ⎬ (1)
⎪ και ⎪
⎪ ⎪
⎪δ n = an − γ nε n −1 ⎪
⎪ ⎪
⎩ ⎭
O παραπάνω αλγόριθμος είναι καλά ορισμένος εφόσον δ k ≠ 0, k = 1, 2,..., n . Επιπλέον
έχουμε ότι:
k =1 ⎪ k =1
det (U ) = 1 ⎪
⎭
Υπενθυμίζεται ότι η ορίζουσα ενός τριγωνικού πίνακα είναι ίση με το γινόμενο των
στοιχείων της κύριας διαγωνίου του. Όπως επίσης γνωρίζουμε για να είναι
αντιστρέψιμος ο A θα πρέπει η ορίζουσά του να είναι μη-μηδενική, δηλαδή
∏δ
k =1
k ≠ 0 ⇒ δ k ≠ 0, k = 1, 2,..., n . Άρα αναγκαία
ότι ισχύει για k − 1 , δηλαδή ότι δ k −1 ≠ 0, ε k −1 < 1 . Θα δείξουμε ότι ισχύει και για k .
(*)
Έχουμε δ k = ak − γ k ε k −1 ⇒ δ k = ak − γ k ε k −1 ≥ ak − γ k ε k −1 = ak − γ k ε k −1 . Άρα:
Επομένως δείξαμε ότι δ k > 0 και ε k < 1 γεγονός που ολοκληρώνει την απόδειξη. Άρα
1 3
σημειωθεί ότι αν είχαμε ακολουθήσει την ανάλυση LU θα χρειαζόμαστε περίπου n
3
77
πράξεις για την φάση της τριγωνοποίησης ενώ ο αλγόριθμος (1) απαιτεί μόνο 2n
πράξεις!
x = ( x − y) + y ≤ x − y + y ⇒ x − y ≥ x − y (*)
Στόχος εδώ είναι η μελέτη των επαναληπτικών μεθόδων για την αριθμητική επίλυση
συστημάτων γραμμικών εξισώσεων, δηλαδή του προβλήματος A ⋅ x = b , όπου
A∈ n ,n
, x, b ∈ n
. Η φιλοσοφία των επαναληπτικών μεθόδων είναι εντελώς διαφορετική
από αυτήν των άμεσων μεθόδων. Αρχικά πρέπει να σημειωθεί ότι οι μέθοδοι αυτοί δεν
αλλάζουν τον πίνακα, A , του γραμμικού συστήματος. Το κύριο χαρακτηριστικό τους
ακολουθία, υπό κάποιες προϋποθέσεις που θα δούμε παρακάτω, συγκλίνει στην λύση
*
του συστήματος, x . Πριν περάσουμε στην περιγραφή και μελέτη αυτών των μεθόδων
είναι χρήσιμος ο παρακάτω ορισμός.
διανυσμάτων x { }(i ) ∞
i =1
όπου x
(i )
∈ n
συγκλίνει στο διάνυσμα x ∈
* n
και γράφουμε
(i ) *
lim x =x όταν κάθε στοιχείο του διανύσματος, x (ji ) , j = 1, 2,3,..., n , συγκλίνει στο
i →∞
*
αντίστοιχο στοιχείο του διανύσματος x , δηλαδή στο x *j , ή όταν lim x (ji ) = x *j .
i →∞
(i ) * (i ) *
lim x = x ⇔ lim x − x = 0
i →∞ i →∞
(i ) *
Eδώ συνιστάται η προσοχή του αναγνώστη. Αν lim x = x τότε δεν συνεπάγεται
i →∞
78
( i +1) (i ) (0) ⎡ +1⎤
από την αναδρομική σχέση x = − x , i = 1, 2,..., n, x = ⎢ ⎥ η οποία προφανώς
⎣ −1⎦
δεν συγκλίνει σε κάποιο διάνυσμα. Όμως η μέγιστη νόρμα των διανυσμάτων αυτών
* ⎡1⎤
είναι ίση με 1, όπως ακριβώς και η αντίστοιχη νόρμα του διανύσματος x = ⎢ ⎥ .
1 ⎣ ⎦
i −1 n
∑ ai ,k xk + ai ,i xi +
k =1
∑a
k = i +1
i ,k xk = bi , i = 1, 2,3,..., n
1 ⎛ ⎛ i −1 n
⎞⎞
xi = ⎜ i ⎜ ∑ i ,k k ∑ ai , k xk ⎟ ⎟ , i = 1, 2,3,..., n
b − a x +
ai ,i ⎝ ⎝ k =1 k =i +1 ⎠⎠
Προφανώς για να είναι καλά ορισμένη η παραπάνω σχέση θα πρέπει τα διαγώνια
στοιχεία, ai ,i , του πίνακα A να είναι μη-μηδενικά. Η τελευταία αυτή σχέση μας
1 ⎛ i −1 n
⎞
xi( m+1) = ⎜ bi − ∑ ai ,k xk( m ) − ∑ ai , k xk( m ) ⎟ , i = 1, 2,3,..., n και m = 0,1, 2,...
ai ,i ⎝ k =1 k =i +1 ⎠
όπου ο εκθέτης m δηλώνει τον αριθμό επανάληψης της μεθόδου. Για την εκκίνηση της
(0)
μεθόδου απαιτείται μία αρχική προσέγγιση της λύσης, δηλαδή το διάνυσμα x . Σε
περίπτωση που καμία αρχική προσέγγιση δεν είναι διαθέσιμη μπορούμε να θέσουμε
( m +1)
< ε , όπου ε η
(0) (m)
x = 0 . Κριτήριο τερματισμού είναι συνήθως η συνθήκη x −x
∞
ζητούμενη ακρίβεια, η οποία εκφράζει την μέγιστη διαφορά των στοιχείων μεταξύ δύο
διαδοχικών προσεγγίσεων του διανύσματος της λύσης.
79
ο διαδοχικός υπολογισμός των xi επιτρέπει την χρήση των ήδη υπολογισμένων
xi( m +1) , i = 1, 2,..., i − 1 στο δεξί μέλος της μεθόδου Jacobi. Έτσι δημιουργείται η
παρακάτω επαναληπτική μέθοδος:
1 ⎛ i −1 n
⎞
xi( m +1) = ⎜ bi − ∑ ai , k xk( m +1) − ∑ ai ,k xk( m ) ⎟ , i = 1, 2,3,..., n και m = 0,1, 2,...
ai ,i ⎝ k =1 k = i +1 ⎠
Όπως και προηγουμένως για την εκκίνηση της μεθόδου απαιτείται μία αρχική
(0)
προσέγγιση της λύσης, x . Αν αυτή δεν είναι διαθέσιμη μπορούμε να θέσουμε
( m +1)
< ε , όπου ε η
(0) (m)
x = 0 . Κριτήριο τερματισμού, είναι συνήθως η συνθήκη x −x
∞
ω ⎛ i −1 n
⎞
xi( m +1) = ⎜
ai ,i ⎝
bi − ∑
k =1
a x
i ,k k
( m +1)
− ∑
k =i
ai ,k xk( m ) ⎟ + (1 − ω ) xi( m ) , i = 1, 2,...,3
⎠
Η παράμετρος ω επιλέγεται με σκοπό την τάχιστη σύγκλιση της μεθόδου. Μπορεί να
αποδειχτεί ότι για να μην αποκλίνει η μέθοδος θα πρέπει 0 < ω < 2 . Όταν 0 < ω < 1 η
μέθοδος ονομάζεται «μέθοδος διαδοχικής υποχαλάρωσης» και όταν 1 < ω < 2 «μέθοδος
διαδοχικής υπερχαλάρωσης». Για ω = 1 η μέθοδος ανάγεται στην μέθοδο Gauss-
Seidel, όπως πολύ εύκολα με απευθείας σύγκριση των αντίστοιχων τύπων.
Πρόταση: Κάθε τετραγωνικός πίνακας A που έχει αυστηρά κυριαρχική διαγώνιο είναι
80
Απόδειξη: Έστω ότι ο A δεν είναι αντιστρέψιμος. Επομένως το γραμμικό, ομογενές
σύστημα A ⋅ x = 0 έχει μη-μηδενική λύση. Έστω το μέγιστο των απολύτων τιμών των
στοιχείων του διανύσματος της λύσης το οποίο φυσικά είναι διάφορο του μηδενός,
1
m = max x j ≠ 0 . Επειδή το σύστημα είναι ομογενές, το διάνυσμα y = x αποτελεί
1≤ j ≤ n m
επίσης λύση του συστήματος και μάλιστα το μέγιστο κατά απόλυτη τιμή των στοιχείων
του είναι 1. Ας υποθέσουμε ότι το μέγιστο αυτό βρίσκεται στην θέση k , όπου
n
αναλύοντας το άθροισμα θα έχουμε ak ,k yk + ∑ ak , j y j = 0 ⇒
=1 j =1
j≠k
n n n n n
ak , k = −∑ ak , j y j ⇒ ak ,k = −∑ ak , j y j ⇒ ak ,k ≤ ∑ ak , j y j = ∑ ak , j y j ≤ ∑ ak , j όπου η
j =1 j =1 j =1 j =1 j =1
j ≠k j ≠i j ≠k j ≠k j≠k
n
ότι για την k-συνιστώσα του διανύσματος A ⋅ y ισχύει ak ,k ≤ ∑a
j =1
k, j το οποίο φυσικά
j ≠k
είναι άτοπο λόγω του γεγονότος ότι ο πίνακας έχει αυστηρά κυριαρχική διαγώνιο. ‘Άρα
ο πίνακας είναι αντιστρέψιμος.
πινάκων A = L + D + U όπου:
81
L είναι ένας κάτω τριγωνικός πίνακας που περιέχει τα στοιχεία του πίνακα A κάτω
⎡ 0 ... ⎤
⎢a 0 ... 0 ⎥
⎢ 2,1 ⎥
⎢ a3,1 a3,2 0 ... ⎥
από την κύρια διαγώνιό του, δηλαδή L = ⎢ ⎥.
⎢ ... ... ... ... ... ...⎥
⎢ an −1,1 an −1,2 an −1,3 ... 0 ⎥
⎢ ⎥
⎣⎢ an,1 an ,2 an ,3 ... an ,n −1 0 ⎦⎥
D είναι ένας διαγώνιος πίνακας που περιέχει τα στοιχεία της κύριας διαγωνίου του A ,
⎡ a1,1 ... ⎤
⎢ a2,2 ... 0 ⎥
⎢ ⎥
⎢ a3,3 ... ⎥
δηλαδή D = ⎢ ⎥.
⎢ ... ⎥
⎢ 0 an −1,n −1 ⎥
⎢ ⎥
⎢⎣ an ,n ⎥⎦
U είναι ένας άνω τριγωνικός πίνακας που περιέχει τα στοιχεία του πίνακα A πάνω
⎪
D ⋅ x + ( L + U ) ⋅ x = b ⎫⎪ D ⋅ x = − ( L + U ) ⋅ x + b ⎫⎪ GJ fJ
⎪
⎬⇒ ⎬⇒ ⎬⇒
( L + D ) ⋅ x + U ⋅ x = b ⎪⎭ ( L + D ) ⋅ x = −U ⋅ x + b ⎪⎭ x = − ( L + D )−1 ⋅U ⋅ x + ( L + D )−1 ⋅ b ⎪
⎪
G GS f GS ⎭
x = GJ ⋅ x + f J (1a )
x = G GS ⋅ x + f GS (1b)
82
( m +1)
(2γ ) , m=1,2,3…,
(m)
x = G SOR ⋅ x + f SOR
( ) f SOR = ( D + ω L ) ⋅ b
−1 −1
όπου G GS = D + ω L ⋅ ⎡⎣(1 − ω ) D − ωU ⎤⎦ ,
αντιστρέψιμοι. Επειδή και στις τρεις αυτές περιπτώσεις η ορίζουσα είναι ίση με το
n
γινόμενο των στοιχείων του D , δηλαδή ίση με ∏a
i =1
i ,i , θα πρέπει ai ,i ≠ 0 ∀i ∈ {1, 2,..., n} ,
x = G ⋅ x + bˆ
−1 −1
x = M ⋅ N ⋅ x + M ⋅b ⇒ από την οποία κατασκευάζουμε την γενική
G bˆ
+ bˆ,
( m +1) (m)
επαναληπτική μέθοδο x =G⋅x m = 0,1, 2,... όπου ο πίνακας G ονομάζεται
{ x}m=0
∞
πίνακας επανάληψης της μεθόδου. Είναι προφανές ότι αν η ακολουθία
*
συγκλίνει σε κάποιο διάνυσμα x τότε αυτό είναι η λύση του γραμμικού συστήματος
+ bˆ ⎫⎪
( m +1) (m)
=G⋅x
( )
x ( m +1) (m)
⎬⇒ x − x =G⋅ x − x .
x = G ⋅ x + bˆ ⎪⎭
x
(2)
( (
− x =G⋅ G⋅ x
(0)
−x ⇒x )) (2)
−x=G ⋅ x
2
( (0)
)
− x . Επαγωγικά μπορούμε να δείξουμε
ότι
x
(m)
−x=G ⋅ x
m
( (0)
−x )
83
Στην συνέχεια θεωρούμε μία οποιαδήποτε διανυσματική νόρμα στον n
και την
αντίστοιχη, παραγόμενη φυσική νόρμα πινάκων. Παίρνοντας νόρμες στην τελευταία
σχέση προκύπτει
x
(m)
−x = G ⋅ x
m
( (0)
−x ≤ G) m
(x (0)
−x )
Παίρνοντας το όριο καθώς m → ∞ έχουμε lim x
m →∞
(m)
− x ≤ lim G
m →∞
( m
(x (0)
−x )) και
lim x
m →∞
(m)
−x ≤ x ( (0)
)
− x lim G
m →∞
m
. Προφανώς έχουμε ότι αν lim G
m →∞
m
= 0 ⇔ lim G = 0
m →∞
m
(m)
(από την πρώτη ιδιότητα των νορμών πινάκων) τότε lim x − x ≤ 0 και επειδή η
m →∞
(m)
νόρμα είναι μη-αρνητικός αριθμός θα έχουμε lim x − x = 0 και επομένως η
m →∞
μέθοδος συγκλίνει στην λύση του γραμμικού συστήματος x για κάθε αρχικό διάνυσμα
(0)
x . Επίσης μπορεί να αποδειχτεί και το αντίστροφο οπότε συνολικά έχουμε το
παρακάτω θεώρημα:
(α) lim G = 0
m
m →∞
(β) G < 1
( )
(γ) ρ G < 1 όπου ρ G ( ) η φασματική ακτίνα του πίνακα G (για τον ορισμό της
84
Ειδικά για τις επαναληπτικές μεθόδους Jacobi και Gauss-Seidel οι οποίες αποτελούν
ειδική περίπτωση της γενικής επαναληπτικής μεθόδου με πίνακες επανάληψης
κριτήριο:
Έστω ότι ο πίνακας A έχει αυστηρά κυριαρχική διαγώνιο. Τότε για τις μεθόδους Jacobi και
Gauss-Seidel ισχύει G J < 1 και G GS < 1 και επομένως οι μέθοδοι αυτές συγκλίνουν.
∞ ∞
Να σημειωθεί ότι όσο μικρότερη είναι η φασματική ακτίνα του πίνακα επανάληψης,
τόσο πιο γρήγορα συγκλίνει η αντίστοιχη επαναληπτική μέθοδος. Με βάση το γεγονός
αυτό επιλέγεται (όταν φυσικά αυτό είναι δυνατόν) και η παράμετρος ω της μεθόδου
διαδοχικής υπερ χαλάρωσης.
85
Κεφάλαιο 4
Πολυωνυμική παρεμβολή και προσέγγιση συναρτήσεων
4.1. Εισαγωγή
Πρόταση: Έστω x0 , x1 , x2 ,..., xn ∈ n + 1 σημεία ανά δύο διαφορετικά μεταξύ τους καθώς
86
Απόδειξη: Έστω p ( x ) = a0 + a1 x + a2 x 2 + ... + an x n το ζητούμενο πολυώνυμο όπου
⎡1 x 0 x 02 x 30 .... x 0n ⎤ ⎡ a0 ⎤ ⎡ y0 ⎤
⎢ 2 3 n
⎥ ⎢ ⎥ ⎢ ⎥
⎢1 x1 x1 x1 .... x1 ⎥ ⋅ ⎢ a1 ⎥ = ⎢ y1 ⎥
⎢.................................... ⎥ ⎢... ⎥ ⎢... ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢⎣1 x n x 2n x 3n .... x nn ⎥⎦ ⎢⎣ an ⎥⎦ ⎢⎣ yn ⎥⎦
V a y
n +1, n +1 n +1 n +1
είτε V ⋅ a = y , V ∈ , a∈ , y∈ όπου ο πίνακας V και το διάνυσμα y
det (V ) ≠ 0 , εφόσον όλα τα σημεία x j , j = 0,1,.., n είναι όλα διαφορετικά μεταξύ τους. Σε
αυτή την περίπτωση, όπως γνωρίζουμε, το γραμμικό σύστημα έχει μία και μοναδική
−1
λύση, a = V ⋅y.
87
f ( n +1) (ξ )
n
f ( n +1) ⎛ n
⎞
f −p ∞
≤ max ⎜ ∞
( n + 1)! x∈[ a ,b ] ⎜⎝ ∏ ( x − xi ) ⎟⎟
i =0 ⎠
Απόδειξη: Αν x ∈ { x0 , x1 ,..., xn } τότε το αριστερό μέλος, f ( x ) − p ( x ) , της σχέσης που
θέλουμε να αποδείξουμε είναι μηδέν λόγω του τρόπου κατασκευής του πολυωνύμου
n
Έστω τώρα ότι x ∈ [a, b] και x ∉ { x0 , x1 ,..., xn } . Ορίζουμε την βοηθητική συνάρτηση
n n
Φ (t ) = ∏ i =0
( t − xi ) για την οποία προφανώς ισχύει Φ(xj ) = ∏( x − x ) = 0 ,
i =0
j i
f ( x) − p ( x)
συνάρτηση ϕ (t ) = f (t ) − p (t ) − Φ (t ) όπου t ∈ [ a, b] , x ∈ [ a, b] ,
Φ ( x)
f ( x) − p ( x)
Για t = x0 , ϕ ( x0 ) = f ( x0 ) − p ( x0 ) − Φ ( x0 ) = 0
Φ ( x)
=0 =0
f ( x) − p ( x)
Για t = x1 , ϕ ( x1 ) = f ( x1 ) − p ( x1 ) − Φ ( x1 ) = 0
Φ ( x)
=0 =0
...
f ( x) − p ( x)
Για t = xn , ϕ ( xn ) = f ( xn ) − p ( xn ) − Φ ( xn ) = 0
Φ ( x)
=0 =0
f ( x) − p ( x)
Για t = x , ϕ ( x ) = f ( x ) − p ( x ) − Φ ( x) = 0
Φ ( x)
88
το θεώρημα του Rolle, εφόσον η ϕ έχει τουλάχιστον n+2 διαφορετικές ρίζες, η ϕ ′ έχει
n+1 ρίζες, η ϕ ′′ έχει n ρίζες, ... , η ϕ ( n +1) έχει 1 ρίζα, έστω ξ , και επομένως
ϕ ( n +1) (ξ ) = 0 (1)
Από τον ορισμό της ϕ βρίσκουμε την ϕ ( n +1) :
f ( x ) − p ( x ) ( n +1)
ϕ ( n +1) ( t ) = f ( n +1) ( t ) − p ( n +1) ( t ) − Φ (t ) (2)
Φ ( x)
(προσέξτε ότι στον ορισμό της ϕ η ανεξάρτητη μεταβλητή είναι το t και όχι το x ).
Εφόσον το p είναι ένα πολυώνυμο το πολύ βαθμού n, άρα η n+1 παράγωγός του είναι
μηδέν:
p ( n +1) ( t ) = 0
(3)
Επιπλέον, από τον ορισμό της, η συνάρτηση Φ = Φ (t ) είναι πολυώνυμο βαθμού n+1
και επομένως:
Φ ( n +1) ( t ) = ( n + 1) !
(4)
Από τις (2),(3) και (4) έχουμε:
f ( x) − p ( x) (1) f ( x) − p ( x)
ϕ ( n +1) ( t ) = f ( n +1) ( t ) − ( n + 1)!⇒ ϕ ( n+1) (ξ ) = f ( n+1) (ξ ) − ( n + 1)! = 0
Φ ( x) Φ ( x)
f ( n +1) (ξ )
Λύνοντας την τελευταία ισότητα έχουμε Φ ( x) = f ( x) − p ( x) και
( n + 1)!
αντικαθιστώντας την Φ ( x) παίρνουμε την ζητούμενη σχέση. Στην συνέχεια,
παίρνοντας την μέγιστη νόρμα στην σχέση αυτή και εφαρμόζοντας την τριγωνική
ανισότητα καταλήγουμε στην δεύτερη σχέση.
89
Σύμφωνα με την μέθοδο αυτή, το πολυώνυμο παρεμβολής δίνεται από την σχέση:
∑ f ( x ) L ( x ) = f ( x ) L ( x ) + f ( x ) L ( x ) + ... + f ( x ) L ( x ) (*)
n
p ( x) = i i 0 0 1 1 n n
i =0
⎧0, i ≠ j
Li ( x j ) = δ ij = ⎨ (**)
⎩1, i = j
Ας δούμε κατ’ αρχήν κατά πόσο το πολυώνυμο παρεμβολής ικανοποιεί τις δοσμένες
συνθήκες, p ( xi ) = f ( xi ) , i = 0,1, 2,..., n . Από την σχέση (*) θα έχουμε:
Για x = x0 , p ( x0 ) = f ( x0 ) L0 ( x0 ) + f ( x1 ) L1 ( x0 ) + ... + f ( xn ) Ln ( x0 ) = f ( x0 )
=1 =0 =0
Για x = x1 , p ( x1 ) = f ( x0 ) L0 ( x1 ) + f ( x1 ) L1 ( x1 ) + ... + f ( xn ) Ln ( x1 ) = f ( x1 )
=0 =1 =0
....
Για x = xn , p ( xn ) = f ( x0 ) L0 ( xn ) + f ( x1 ) L1 ( xn ) + ... + f ( xn ) Ln ( xn ) = f ( xn )
=0 =0 =1
Πράγματι λοιπόν το πολυώνυμο στην μορφή (*) ικανοποιεί τις συνθήκες παρεμβολής
λόγω των ιδιοτήτων των πολυωνύμων Lagrange (σχέση (**)). Απομένει να
κατασκευάσουμε τα πολυώνυμα Lagrange. Λόγω της (**) το Li πρέπει να περνά από τα
n+1. Άρα θα είναι θα είναι βαθμού n και μάλιστα θα είναι μοναδικό. Τα σημεία αυτά
στην πραγματικότητα μας γνωστοποιούν και τις ρίζες του οι οποίες είναι
x0 , x1 ,..., xi −1 , xi +1 ,..., xn και επομένως μπορούμε να το εκφράσουμε στην μορφή
n ριζες
Li ( x ) = α ∏ ( x − x ) όπου το α
j =0
j είναι μία σταθερά η οποία θα προσδιοριστεί από την
i≠ j
Li ( xi ) = α ∏( x − x ) = 1⇒ α = 1
j =0
i j ∏ ( x − x ) . Έτσι η τελική μορφή των πολυωνύμων
j =0
i j
i≠ j i≠ j
n n n
x − xj
Lagrange δίνεται από την σχέση Li ( x ) = ∏( x − x ) ∏( x − x ) = ∏ x − x
j =0
j
j =0
i j
j =0 i j
i≠ j i≠ j
90
Επομένως το πολυώνυμο παρεμβολής με την μέθοδο Lagrange δίνεται από την σχέση:
n
x − xj
∑
n
p ( x) =
i =0
f ( xi ) Li ( x ), Li ( x ) = ∏x −x
j =0 i j
i≠ j
Η μέθοδος αυτή είναι άλλη μία προσέγγιση στο πολυώνυμο παρεμβολής και
εισήχθηκε από τον Ιsaac Newton. Έστω τα «n+1» σημεία ( xi , fi ) , i = 0,1, 2,..., n όπου
στην μορφή:
p ( x ) = a0 + a1 ( x − x0 ) + a2 ( x − x0 )( x − x1 ) + ... + an ( x − x0 )( x − x1 ) ... ( x − xn −1 )
Η παραπάνω έκφραση ονομάζεται πολυώνυμο Newton. Στο σημείο αυτό να πρέπει να
τονισθεί ότι εφόσον το πολυώνυμο παρεμβολής είναι μοναδικό δεν έχει σημασία με
ποιον τρόπο θα το εκφράσουμε. Έτσι, είτε εκφραστεί στην μορφή της άμεσης μεθόδου,
είτε στην μορφή κατά Lagrange, είτε στην μορφή κατά Newton πρόκειται ακριβώς για
το ίδιο πολυώνυμο. Οποιαδήποτε μέθοδος και αν χρησιμοποιηθεί θα πρέπει να δώσει
το ίδιο αποτέλεσμα.
Οι συνθήκες κατασκευής του πολυωνύμου p ( xi ) = f i , i = 0,1, 2,..., n , σύμφωνα με την
91
⎡1 0 0 0 .... 0 ⎤
⎢ ⎥ ⎡ a0 ⎤ ⎡ f 0 ⎤
⎢1 x1 -x 0 0 0 .... 0 ⎥ ⎢a ⎥ ⎢ f ⎥
⎢1 x 2 -x 0 (x 2 -x 0 )(x 2 -x1 ) 0 .... 0 ⎥⋅⎢ 1 ⎥ = ⎢ 1 ⎥
⎢ ⎥ ⎢... ⎥ ⎢... ⎥
⎢................................................. ⎥ ⎢ ⎥ ⎢ ⎥
⎢a ⎥ ⎢ f ⎥
⎢1 x -x (x -x )(x -x ) (x -x )(x -x )(x -x ) ....
⎣ n 0 n 0 n 1 n 0 n 1 n 2 U n,n ⎥⎦ ⎣ n ⎦ ⎣ n ⎦
a f
U
όπου U n,n = (x n -x 0 )(x n -x1 )(x n -x 2 ) ⋅ ... ⋅ (x n -x n-1 ) . Παρατηρούμε ότι πρόκειται για ένα
γραμμικό σύστημα, ο πίνακας, U , του οποίου είναι κάτω τριγωνικός και η ορίζουσά
n +1
i −2
U i ,i = ∏( x
j =0
i −1 − x j ), i ≥ 2 και επομένως, εφόσον τα xi , i = 0,1,..., n είναι διαφορετικά
( )
μεταξύ τους, άρα U i ,i ≠ 0 και συνεπώς det U ≠ 0 . Άρα το γραμμικό σύστημα U ⋅ a = f
έχει μοναδική λύση (όπως φυσικά ήταν αναμενόμενο). Όπως ήδη γνωρίζουμε, εφόσον
ο U είναι κάτω τριγωνικός το σύστημα αυτό μπορεί να λυθεί πολύ εύκολα με τον
a j = f ⎡⎣ x0 , x1 ,..., x j ⎤⎦ για να υποδηλώσουμε αυτήν την εξάρτηση από τους δείκτες και τις
92
a0 = f [ x0 ] = f 0
f0 f1
a1 = f [ x0 , x1 ] = −
x0 − x1 x0 − x1
f [ x0 , x1 ] − f [ x1 , x2 ] f0 f1 f2
a2 = f [ x0 , x1 , x2 ] = = + +
x0 − x2 ( x0 − x1 )( x0 − x2 ) ( x1 − x0 )( x1 − x2 ) ( x0 − x2 )( x2 − x1 )
κ.τ.λ. για τους υπόλοιπους συντελεστές. Κάνοντας σύγκριση με τους συντελεστές των
όρων xn πολυωνύμου Lagrange καταλήγουμε στην γενική περίπτωση ότι:
f [ x0 , x1 ,..., xn −1 ] − f [ x1 , x2 ,..., xn ]
f [ x0 , x1 ,..., xn ] =
x0 − xn
x0 f[x0]
f[x0,x1]
x1 f[x1] f[x0,x1,x2]
f[x1,x2] f[x0,x1,x2,x3]
x2 f[x2] f[x1,x2,x3]
f[x2,x3]
x3 f[x3]
93
διαφορών είναι ότι η προσθήκη επιπλέον σημείων στον πίνακα δεν αλλάζει τις ήδη
υπολογισμένες τιμές του πίνακα.
Παράδειγμα: Έστω τα σημεία (1, 0 ) , ( −1, −3) , ( 2, 4 ) και ότι ζητείται να βρεθεί το
+1 0
0 − (−3) 3
=
1 − (−1) 2
3 −7
-1 -3 2 3=5
1− 2 6
(−3) − 4 7
=
(−1) − 2 3
2 4
3 5 1
Επομένως έχουμε p2 ( x ) = 0 + ( x − 1) + ( x − 1)( x + 1) = ( 5 x 2 + 9 x − 14 ) .
2 6 6
94
xi 3.2 2.7 1.0 4.8 5.6
⎢ ⎥
⎢1 ( 2.7 ) ( 2.7 ) ( 2.7 ) ⎥ ⎢⎢ a1 ⎥⎥ ⎢⎢ f1 ⎥⎥
1 2 3
⎢ ⎥⋅ =
⎢1 (1.0 ) (1.0 ) (1.0 ) ⎥ ⎢⎢ a2 ⎥⎥ ⎢⎢ f 2 ⎥⎥
1 2 3
⎢ ⎥ a
( 4.8) ⎥⎦ ⎣⎢ 3 ⎦⎥ ⎣⎢ 3 ⎦⎥
f
( 4.8) ( 4.8)
1 2 3
⎢⎣1
Ωστόσο, θα πρέπει να σημειωθεί ότι το νέο σύστημα 5x5 που προέκυψε για το
πολυώνυμο τετάρτου βαθμού είναι σε ιδιαίτερα κακή κατάσταση, γεγονός που σημαίνει
ότι αν αλλαχτούν σε μικρό βαθμό οι τιμές της συνάρτησης θα προκληθούν μεγάλες
αλλαγές στους συντελεστές του πολυωνύμου.
95
Αν αντί για την άμεση μέθοδο χρησιμοποιήσουμε πολυώνυμα Lagrange, δηλαδή την
3 3 3
x − xj
σχέση p3 ( x ) = ∑ L ( x ) f ( x ) = ∑∏ x − x f ( x ) θα έχουμε:
i =0
i i
i =0 j =0 i j
i
i≠ j
p3 ( x ) =
( x − x1 )( x − x2 )( x − x3 ) f x + ( x − x0 )( x − x2 )( x − x3 ) f x +
( ) ( )
( x0 − x1 )( x0 − x2 )( x0 − x3 ) 0 ( x1 − x0 )( x1 − x2 )( x1 − x3 ) 1
( x − x0 )( x − x1 )( x − x3 ) f x + ( x − x0 )( x − x1 )( x − x2 ) f x
+ ( ) ( )
( x2 − x1 )( x2 − x1 )( x2 − x3 ) 2 ( x3 − x0 )( x3 − x1 )( x3 − x2 ) 3
Θέτοντας τιμές στην παραπάνω σχέση προκύπτει πολύ εύκολα
f ( x = 3.0 ) ≈ p3 ( x = 3.0 ) = 20.212 . Όμοια υπολογίζουμε και το
4 4 4
x − xj
p4 ( x ) = ∑ L ( x ) f ( x ) = ∑∏ x − x f ( x ) . Είναι προφανές ότι η ζητούμενη τιμή της
i =0
i i
i =0 j =0 i j
i
i≠ j
συνάρτησης προκύπτει πολύ πιο εύκολα με την μέθοδο Lagrange παρά με την άμεση
μέθοδο, η οποία απαιτεί την επίλυση ενός γραμμικού συστήματος γεγονός που την
κάνει μη-αποτελεσματική από πρακτική άποψη.
Στην συνέχεια θα γίνει εφαρμογή της κατασκευής πολυωνύμου με την μέθοδο του
Newton, με χρήση των διαιρεμένων διαφορών, όπως φαίνεται στον πίνακα που
ακολουθεί:
3.2 22.0
22 − 17.8
= 8.4
3.2 − 2.7
38.3 − 51.7
= 16.75
4.8 − 5.6
5.6 51.7 96
Οι αριθμοί με έντονα γράμματα είναι οι ζητούμενοι συντελεστές. Έτσι θα έχουμε
p3 ( x ) = 22 + 8.4 ( x − 3.2 ) + 2.85561( x − 3.2 )( x − 2.7 ) − 0.527475 ( x − 3.2 )( x − 2.7 )( x − 1.0 )
και
p4 ( x ) = p3 ( x ) + 0.255834 ( x − 3.2 )( x − 2.7 )( x − 1.0 )( x − 4.8 )
Τα δύο αυτά πολυώνυμα για x = 3.0 δίνουν p3 ( 3.0 ) 20.212 και p4 ( 3.0 ) 20.269 .
παρακάτω διάγραμμα:
65
60 data
55 p3(x)
50
p4(x)
45
40
f(x)
35
30
25
20
15
10
1 2 3 4 5 6
x
Εδώ θα πρέπει να σημειωθεί ότι έχει παρατηρηθεί ότι όσο μεγαλώνει ο βαθμός του
πολυωνύμου παρεμβολής τότε η παρεμβολή δεν είναι επιτυχής, δηλαδή οι εκτιμήσεις
για τις τιμές της συνάρτησης που μας ενδιαφέρουν είναι ιδιαίτερα μη-ακριβείς
(συνήθως παρατηρούνται γρήγορες ταλαντώσεις στις τιμές του πολυωνύμου). Ένα
κλασσικό παράδειγμα των κινδύνων της πολυωνυμικής παρεμβολής αναφέρεται από
1
τον C. Runge το 1901. Για την ιδιαίτερα απλή συνάρτηση f ( x ) = , x ∈ [ −1, +1]
1 + 25 x 2
97
η ακολουθία pn ( x ) καθώς το «n» μεγαλώνει, αποκλίνει στο διάστημα 0.726 < x < 1 .
1,00 2
f=1/(1+25x )
p2(x)
0,75
f,p2(x),p5(x)
0,50
0,25
0,00
-0,25 p5(x)
-0,50
-1,0 -0,5 0,0 0,5 1,0
1,00
0,75
2
f,p10(x),p20(x)
0,50 f=1/(1+25x )
0,25
0,00
p20(x)
-0,25
p10(x)
-0,50
-1,0 -0,5 0,0 0,5 1,0
98
⎛ n
⎞
Μπορεί να αποδειχτεί ότι για δεδομένο «n» η ποσότητα max ⎜
x∈[ a ,b ] ⎜
⎝
∏ ( x − xi ) ⎟⎟
i =0 ⎠
από την
⎛ π ⎛ 2 j +1⎞ ⎞
από την σχέση x j = cos ⎜ ⎜ ⎟ ⎟ , j = 0,1, 2,..., n (εδώ απαιτείται προσοχή: τα σημεία
⎝ 2 ⎝ n +1 ⎠ ⎠
Chebyshev δίνονται στο διάστημα [-1,1]. Επομένως αν το αρχικό διάστημα είναι το
[a,b] τότε πρέπει πρώτα να γίνει ένας γραμμικός μετασχηματισμός έτσι ώστε η
συνάρτηση που μας ενδιαφέρει να ορίζεται στο [-1,1]).
Στην περίπτωση που εκτός από δεδομένα για την τιμή της συνάρτησης σε ένα
συγκεκριμένο πλήθος σημείων έχουμε και δεδομένα για τις τιμές της παραγώγου της
συνάρτησης, τότε χρησιμοποιούμε την λεγόμενη παρεμβολή τύπου Hermite. Θα
παρουσιάσουμε στην συνέχεια την παρεμβολή αυτή για την περίπτωση όπου δεδομένα
είναι οι τιμές της συνάρτησης και της πρώτης παραγώγου της, δηλαδή τα
μπορεί να αποδειχτεί ότι υπάρχει ένα πολυώνυμο το πολύ βαθμού 2n+1 το οποίο να
διέρχεται από όλα αυτά τα δεδομένα. Το πολυώνυμο έχει την μορφή
∑{ f ( x ) H
n
p( x) = i i
(1)
( x ) + f ′( xi ) H i(2) ( x )} (1)
i =0
όπου H i(1) ( x ) , H i(2) ( x ) είναι μοναδικά πολυώνυμα το πολύ βαθμού 2n+1 τα οποία
⎧1, i = j
H i(1) ( x j ) = δ ij = ⎨
⎩0, i ≠ j (2)
dH i(1)
dx
( xj ) = 0
και
H i(2) ( x j ) = 0
dH i(2) ⎧1, i = j (3)
( x j ) = δ ij = ⎨
dx ⎩0, i ≠ j
99
Mε βάση τις ιδιότητες αυτές αποδεικνύεται ότι έχουν την μορφή:
dH i(1) ( x )
= −2 Li′ ( xi ) L2i ( x) + 2 ⎡1 − 2( x − xi ) Li′ ( xi ) ⎤ Li′ ( x) Li ( x)
dx ⎣ ⎦
επομένως για x = x j ,
dH i(1)
dx
( x j ) = −2 Li′ ( xi ) L2i ( x j ) + 2 ⎡⎣1 − 2( x j − xi ) Li′ ( xi ) ⎤⎦ Li′ ( x j ) Li ( x j ) = 0 αφού Li ( x j ) = 0 εκ’
κατασκευής.
( )
Ακόμα, H i(2) x j = ( x j − xi ) L2i ( x j ) = 0 αφού Li ( x j ) = 0 και
dH i(2) ( x )
= L2i ( x) + ( x − xi )2 Li′ ( x) Li ( x) οπότε
dx
dH i(2)
( xi ) = L2i ( xi ) + ( xi − xi )2 Li′ ( x) Li ( x) = 12 = 1
dx
dH i(2)
και
dx
( x j ) = L2i ( x j ) + ( x j − xi )2 Li′ ( x j ) Li ( x j ) = 0 αφού Li ( x j ) = 0 εκ’ κατασκευής.
τους. Τότε υπάρχει μοναδικό πολυώνυμο τύπου Hermite p ∈ P2 n +1 που ορίζεται από τις
100
Απόδειξη: Αν x ∈ { x0 , x1 ,..., xn } τότε το αριστερό μέλος της (*) είναι μηδέν λόγω των
συνθηκών κατασκευής p ( xi ) = f ( xi ), i = 0,1, 2,..., n . Το δεξί μέλος της (*) είναι επίσης
i =n
εργαζόμαστε ως εξής. Θεωρούμε, χωρίς βλάβη της γενικότητας ότι τα xi , i = 0,1, 2,..., n
είναι διατεταγμένα σε αύξουσα σειρά, δηλαδή x0 < x1 < x2 < ... < xn . Σε αυτήν την
και οι άλλες δύο αποδεικνύονται με όμοιο τρόπο. Πρώτα θέτουμε την βοηθητική
n n
∏ (t − x ) ∏( x − x )
2 2
συνάρτηση Ψ (t ) = i για την οποία παρατηρούμε ότι Ψ ( x ) = i =0
i =0 i =0
d⎛ ⎞
∏ (t − x ) ⎟⎟⎠ = dt ((t − x ) (t − x ) ....(t − x ) )
n
d
x ∈ { x0 , x1 ,..., xn } . Επίσης Ψ ′(t ) =
2 2 2 2
αν ⎜
dt ⎜⎝
i 0 1 n
i =0
οπότε
(
Ψ ′(t ) = 2 ( t − x0 )( t − x1 ) .... ( t − xn ) + ( t − x0 ) ( t − x1 ) ... ( t − xn ) + ... + ( t − x0 ) ( t − x1 ) .... ( t − xn )
2 2 2 2 2 2
)
και επομένως Ψ′( x) = 0 αν x ∈ { x0 , x1 ,..., xn } . Παρατηρούμε ότι η πολυωνυμική
f ( x) − p ( x)
θεωρούμε την συνάρτηση ϕ (t ) = f (t ) − p(t ) − Ψ (t ), t ∈ [a, b] και
Ψ ( x)
x ∈ [a, b], x ∉ { x0 , x1 ,..., xn } , η παράγωγος της οποίας είναι
f ( x) − p ( x)
ϕ ′(t ) = f ′(t ) − p′(t ) − Ψ ′(t ) . Εφόσον ισχύει f , Ψ, p ∈ C 2 n + 2 [a, b] άρα και η
Ψ ( x)
ϕ ∈ C 2 n + 2 [a, b] . Επίσης:
f ( x) − p ( x)
ϕ ( x0 ) = f ( x0 ) − p( x0 ) − Ψ ( x0 ) = 0
Ψ ( x)
=0
f ( x) − p ( x)
ϕ ( x1 ) = f ( x1 ) − p( x1 ) − Ψ ( x1 ) = 0
Ψ ( x) =0
=0
....
101
f ( x) − p ( x)
ϕ ( xn ) = f ( xn ) − p( xn ) − Ψ ( xn ) = 0
Ψ ( x) =0
=0
και
f ( x) − p ( x)
ϕ ( x) = f ( x) − p ( x) − Ψ ( x) = 0
Ψ ( x)
Άρα θα υπάρχουν σημεία ξ 0 , ξ1 ,..., ξ n με
x0 < ξ 0 < x1 < ξ1 < ... < x j < ξ j < x < ξ j +1 < x j +1 < ... < xn −1 < ξ n < xn τέτοια ώστε
f ( x) − p ( x)
ϕ ′( x0 ) = f ′( x0 ) − p′( x0 ) − Ψ′( x0 ) = 0
Ψ ( x)
=0 =0
f ( x) − p ( x)
ϕ ′( x1 ) = f ′( x1 ) − p′( x1 ) − Ψ ′( x1 ) = 0
Ψ ( x)
=0 =0
....
f ( x) − p ( x)
ϕ ′( xn ) = f ′( xn ) − p′( xn ) − Ψ ′( xn ) = 0
Ψ ( x)
=0 =0
Άρα ισχύει ϕ ′( xi ) = 0, i = 0,1, 2,..., n (“n+1” στο πλήθος ρίζες) και επομένως έχουμε
συνολικά τουλάχιστον «2n+2» διαφορετικές ρίζες για την συνάρτηση ϕ ′ στο διάστημα
ρίζες, η ϕ ′′′ τουλάχιστον «2n» ρίζες, ..., και η ϕ (2 n + 2) τουλάχιστον μία ρίζα ξ ∈ ( a, b ) ,
f ( x) − p ( x) (2 n + 2)
ϕ (2 n + 2) (t ) = f (2 n + 2) (t ) − p (2 n + 2) (t ) − Ψ (t ) ⇒
0
Ψ ( x) (2 n + 2)!
f ( x) − p ( x) t =ξ
f ( x) − p ( x)
ϕ (2 n + 2) (t ) = f (2 n + 2) (t ) − (2n + 2)!⇒ 0 = f (2 n + 2) (ξ ) − (2n + 2)! ⇒
Ψ ( x) Ψ ( x)
Ψ ( x)
f ( x) − p ( x) = f (2 n + 2) (ξ ) και αντικαθιστώντας την Ψ παίρνουμε την ζητούμενη
(2n + 2)!
σχέση. Αν στην συνέχεια πάρουμε την άπειρη νόρμα αυτής της σχέσης και
εφαρμόσουμε την τριγωνική ανισότητα καταλήγουμε στην δεύτερη ζητούμενη σχέση.
102
Παράδειγμα 1ο: Έστω η συνάρτηση f ( x) = 1 x . Χρησιμοποιείστε τις τιμές της
συνάρτησης και της παραγώγου της στα σημεία x0 = 1 , x1 = 2 για να προσδιορίσετε το
∑{ f ( x ) H
n
p( x) = i i
(1)
( x ) + f ′( xi ) H i(2) ( x )} ⇒
i =0
1
x − xj x − x1 x − 1
L0 ( x ) = ∏x −xj =0 0 j
= =
x0 − x1 1 − 2
= 1 − x και L0′ ( x) = −1 ενώ
j ≠0
1
x − xj x − x0 x − 2
L1 ( x ) = ∏x −x
j =0 1 j
= =
x1 − x0 2 − 1
= x − 2 και L1′ ( x) = 1 . Άρα
j ≠1
⎣ ⎦
⎣ ⎦
H1(2) ( x ) = ( x − x1 ) L12 ( x) = ( x − 2 )( x − 1)
2
103
φυσικά δεν γνωρίζαμε την ακριβή τιμή της συνάρτησης στο ζητούμενο σημείο θα
είχαμε:
f (4) ⎧⎪ n
⎫
f −p ∞
≤ ∞
max ⎨
(2n + 2)! x∈[ a ,b ] ⎪⎩ ∏ ( x − x ) ⎪⎬⎪⎭
i =0
i
2
και αντικαθιστώντας τα αριθμητικά δεδομένα
f (4)
μας θα είχαμε f ( x) − p ( x) ∞
≤
4!
∞
x∈[1,2]
{
max ( x − 1) ( x − 2 ) .
2 2
}
f ′ ( x ) = −2 x ( x 2 + 2 )
2
Εφόσον έχουμε, f ( x0 ) = f (−1) = 1 3 , f ( x1 ) = f (1) = 1 3 ,
1
x − xj x − x0 x − (−1) x + 1
∏x −x
1
L1 ( x ) = = = = και L1′ ( x) = . Άρα
j =0 1 j x1 − x0 1 − (−1) 2 2
j ≠1
( x − 1) 2 2
⎡ 1 ⎤ 1− x ⎞
H (1)
0 ( x ) = ⎡⎣1 − 2( x − x0 ) L0′ ( x0 ) ⎤⎦ L20 ( x) = ⎢1 − 2( x + 1) ⎛⎜ − ⎞⎟ ⎥ ⎛⎜ ⎟ = ( x + 2)
⎣ ⎝ 2 ⎠⎦ ⎝ 2 ⎠ 4
( x + 1) 2 2
⎡ ⎛ 1 ⎞⎤ ⎛ x + 1 ⎞
H1(1) ( x ) = ⎡1 − 2( x − x1 ) L1′ ( x1 ) ⎤ L12 ( x) = ⎢1 − 2( x − 1) ⎜ ⎟ ⎥ ⎜ ⎟ = (3 − 2x )
⎣ ⎦ ⎣ ⎝ 2 ⎠⎦ ⎝ 2 ⎠ 4
( x − 1)
2
H (2)
0 ( x ) = ( x − x0 ) L ( x) = ( x + 1)
2
0
4
( x + 1)
2
H (2)
1 ( x ) = ( x − x1 ) L ( x) = ( x − 1)
2
1
4
104
Αντικαθιστώντας όλα τα παραπάνω στην (*) και απλοποιώντας παίρνουμε
1 4 4 − x2 4
p ( x) = − x 2 + = . Για x=0 έχουμε p(0) = και το σφάλμα είναι
9 9 9 9
1 4 1
f (0) − p(0) = − = .
2 9 18
(Β) όταν ένα πολυώνυμο πρώτου βαθμού χρησιμοποιηθεί για να παρεμβάλει μία
a+b
συνάρτηση f ∈ C 3 [a, b] στα σημεία x0 = a , x1 = , x2 = b .
2
(Γ) όταν ένα πολυώνυμο τρίτου βαθμού χρησιμοποιηθεί για να παρεμβάλει μία
1 2
συνάρτηση f ∈ C 3 [a, b] στα σημεία x0 = a , x1 = a + ( b − a ) , x2 = a + ( b − a ) .
3 3
Ας δούμε τις περιπτώσεις αυτές
(Α) Στην περίπτωση αυτή το πολυώνυμο παρεμβολής είναι το εξής:
f (b) − f ( a )
p( x) = f ( a ) + ( x − a)
b−a
Για το σφάλμα θα ισχύει:
f ′′ ∞ 1
f ′′ ∞
x∈[ a ,b ] ∏
f −p ∞
≤ max ( x − xi ) = max ( x − a )( x − b )
2 i =0
2 x∈[ a ,b ]
Για να βρούμε μία καλύτερη έκφραση για το άνω φράγμα της παραπάνω ανισότητας,
ισχύει εφόσον x ∈ [ a, b ] , και ζητούμε να βρούμε σε ποιο σημείο εμφανίζει μέγιστο. Για
τον σκοπό αυτό πρέπει να βρούμε το σημείο μηδενισμού της πρώτης παραγώγου της,
105
a+b
g ′( y ) = 0 ⇒ −2 y + (a + b) = 0 ⇒ y = . Για την δεύτερη παράγωγο έχουμε
2
g ′′( x ) = −2 < 0 οπότε στο x = y η συνάρτηση g εμφανίζει μέγιστο, το οποίο είναι
a + b ⎞ (b − a )
2
⎛ a+b ⎞⎛
g ( y ) = ( y − a )( b − y ) = ⎜ − a ⎟⎜ b − ⎟= . Επομένως έχουμε
⎝ 2 ⎠⎝ 2 ⎠ 4
(b − a )
2
⎛ a+b⎞ ⎛ a+b⎞
f⎜ ⎟ − f (a) f (a) − 2 f ⎜ ⎟ + f (b) a+b⎞
p2 ( x) = f ( a ) + 2 ⎝ 2 ⎠
( x − a) + 2 ⎝ 2 ⎠
( x − a ) ⎛⎜ x − ⎟
b−a (b − a )
2
⎝ 2 ⎠
⎛ a+b⎞ ⎛ a+b⎞
(ελέγξτε ότι ισχύει p2 ( a ) = f ( a ) , p2 ⎜ ⎟= f ⎜ ⎟, p2 (b) = f ( b ) ). Για το σφάλμα
⎝ 2 ⎠ ⎝ 2 ⎠
θα έχουμε:
f ′′′ ∞ 2
f ′′ ∞ a+b⎞
f − p2 ∞
≤
6
max
x∈[ a ,b ] ∏( x − x ) =
i =0
i
6 x∈[ a ,b ]
⎛
max ( x − a ) ⎜ x −
⎝
⎟ ( x − b)
2 ⎠
⎧ ⎛ a+b⎞
⎪( x − a ) ⎜ x − 2 ⎟ ( x − b ) , x ∈ [a, ( a + b) / 2]
⎛ a+b⎞ ⎪ ⎝ ⎠
g ( x) = ( x − a ) ⎜ x − ⎟ ( x − b) = ⎨
⎝ 2 ⎠ ⎪( x − a ) ⎛ x − a + b ⎞ ( b − x ) , x ∈ [( a + b) / 2, b]
⎪⎩ ⎜ ⎟
⎝ 2 ⎠
της οποίας ζητούμε το μέγιστο. Θα έχουμε:
⎧⎛ a + b ⎞ ⎛ a+b ⎞
⎪⎜ 2 − x ⎟ ( b − x ) − ( x − a )( b − x ) − ( x − a ) ⎜ 2 − x ⎟ , x ∈ [a, ( a + b) / 2]
⎪⎝ ⎠ ⎝ ⎠
g ′( x) = ⎨
⎪⎛ x − a + b ⎞ ( b − x ) + ( x − a )( b − x ) − ( x − a ) ⎛ x − a + b ⎞ , x ∈ [( a + b) / 2, b]
⎪⎩⎜⎝ 2 ⎠
⎟ ⎜
⎝ 2 ⎠
⎟
106
⎧⎛ a + b ⎞⎛ a+b⎞
⎪⎜ x − 4 ⎟ ⎜ x + 3 4 ⎟ , x ∈ [a, ( a + b) / 2]
⎪⎝ ⎠⎝ ⎠
g ′( x) = ⎨
⎪⎛ x − a + b ⎞ ⎛ x + 3 a + b ⎞ , x ∈ [( a + b) / 2, b]
⎪⎩⎜⎝ 4 ⎠⎝
⎟⎜
4 ⎠
⎟
(b − a )
4
f − p3 ∞
≤ f (4)
1296 ∞
Δ : a ≡ x0 < x1 < x2 < ... < xn −1 < xn ≡ b καθώς και ένας φυσικός αριθμός m ∈ . Τα
splines βαθμού «m» ως προς Δ . Πρόκειται δηλαδή για πολυώνυμα βαθμού το πολύ
οποίου είναι 2 φορές συνεχώς παραγωγίσιμα στο κλειστό διάστημα [a,b], είναι
πολυώνυμα τρίτου βαθμού το πολύ και γενικά είναι τμηματικά ορισμένα στα
υποδιαστήματα [ xi −1 , xi ] , i = 1, 2,.., n . Θα ξεκινήσουμε με την κατασκευή των στοιχείων
αυτού του χώρου συμβολίζοντας με si κάθε τμήμα της συνάρτησης ορισμένης στο
[ xi −1 , xi ] , δηλαδή
107
⎧ s1 ( x), x0 ≤ x ≤ x1
⎪ s ( x), x1 ≤ x ≤ x2
⎪ 2
⎪⎪...
s=⎨ .
⎪ si ( x), xi −1 ≤ x ≤ xi
⎪...
⎪
⎪⎩ sn ( x), xn −1 ≤ x ≤ xn
Για την κατασκευή της συνάρτησης s θα χρησιμοποιήσουμε όλα τα δεδομένα συν τις
ιδιότητες που πρέπει να ικανοποιεί η s . Από τα δεδομένα θα έχουμε:
Εφόσον s ∈ C 2 [ a, b] άρα τόσο η συνάρτηση όσο και η πρώτη και δεύτερη παράγωγός
της θα πρέπει να είναι συνεχής σε όλα τα εσωτερικά σημεία του διαστήματος [a,b],
δηλαδή:
si ( xi +1 ) = si +1 ( xi ) , i = 1, 2,..., n − 1 (2)
Θεώρημα: Έστω f ∈ C 1[ a , b ] , n∈ και Δ : a ≡ x0 < x1 < x2 < ... < xn −1 < xn ≡ b ένας
διαμερισμός του [a, b] . Τότε υπάρχει ακριβώς μία συνάρτηση s ∈ S3 ( Δ ) τέτοια ώστε
{s ( x ) = f ( x ) , s ′ ( a ) = f ′ ( a ) , s′ ( b ) = f ′ ( b ) ,
i i i = 0,1, 2,..., n}
108
Απόδειξη: Εφόσον η s είναι κυβικό πολυώνυμο άρα η δεύτερη παράγωγός του θα είναι
s′′ ( x) =
hi
(
1 ′′
)
si ( xi ) ( x − xi −1 ) − si′′ ( xi −1 ) ( x − xi ) , xi −1 ≤ x ≤ xi , hi ≡ xi − xi −1 .
⎛ ⎞
1 ⎜ ′′
′′
s ( xi −1 ) = si ( xi ) ( xi −1 − xi −1 ) − si ( xi −1 ) ( xi −1 − xi ) ⎟ = s′′ ( xi −1 )
′′
hi ⎜ ⎟
⎝ − hi ⎠
⎛ ⎞
1 ⎜ ′′
και για x = xi έχουμε s′′ ( xi ) = s ( xi ) ( xi − xi −1 ) − s′′ ( xi −1 ) ( xi − xi ) ⎟ = s′′ ( xi ) . Με τον
hi ⎜ ⎟
⎝ hi ⎠
τρόπο αυτό έχουμε ικανοποιήσει την συνέχεια της δεύτερη παραγώγου της ζητούμενης
συνάρτησης spline, δηλαδή την συνθήκη (4). Πράγματι έχουμε:
s′′ ( x) =
hi
(
1 ′′
)
s ( xi ) ( x − xi −1 ) − s′′ ( xi −1 ) ( x − xi ) ≡ si′′ ( x), xi −1 ≤ x ≤ xi , hi ≡ xi − xi −1 (5)
s′′ ( x) =
1 ′′
hi +1
( )
s ( xi +1 ) ( x − xi ) − s′′ ( xi ) ( x − xi +1 ) ≡ si +1′′ ( x), xi ≤ x ≤ xi +1 , hi +1 ≡ xi +1 − xi (6)
Επομένως από τις δύο τελευταίες σχέσεις βλέπουμε ότι si′′ ( xi ) = si +1′′ ( xi ) .
Την παραγόμενη μορφή μπορούμε να την ολοκληρώσουμε δύο φορές και να πάρουμε:
s ( x) =
1
6hi
( 3 3
)
si′′ ( xi ) ( x − xi −1 ) − si′′ ( xi −1 ) ( x − xi ) + cˆ2 x + cˆ3
Στο σημείο αυτό μπορούμε να μειώσουμε τις απαιτούμενες πράξεις αν αντί για την
προηγούμενη μορφή εκφράσουμε διαφορετικά το γραμμικό κομμάτι της s :
s ( x) =
1
6hi
( 3 3
)
si′′ ( xi ) ( x − xi −1 ) − si′′ ( xi −1 ) ( x − xi ) + c2 ( x − xi −1 ) + c3 ( x − xi )
Στην συνέχεια ικανοποιούμε τα δεδομένα μας, δηλαδή τις συνθήκες (1) και έχουμε:
109
⎛ ⎞
1 ⎜ ′′
s ( xi ) ( xi − xi −1 ) − s ( xi −1 ) ( xi − xi ) ⎟ + c2 ( xi − xi −1 ) + c3 ( xi − xi ) = f ( xi ) ⇒
′′
3 3
s ( xi ) =
6hi ⎜ ⎟
⎝ hi ⎠ hi
⎛ ⎞
1 ⎜ ′′
s ( xi ) ( xi −1 − xi −1 ) − s′′ ( xi −1 ) ( xi −1 − xi ) ⎟ + c2 ( xi −1 − xi −1 ) + c3 ( xi −1 − xi ) ⇒
3 3
s ( xi −1 ) =
6hi ⎜ ⎟
⎝ − hi ⎠ − hi
⎛ f ( xi ) s′′ ( x )h ⎞
s ( x) =
1 ′′
6hi
( 3 3
)
s ( xi ) ( x − xi −1 ) − s′′ ( xi −1 ) ( x − xi ) + ⎜
⎜
⎝ hi
−
6
i i
⎟ ( x − xi −1 ) +
⎟
⎠
(Α)
⎛ f ( xi −1 ) s′′ ( x )h ⎞
−⎜ − i −1 i
⎟ ( x − xi ) , xi −1 ≤ x ≤ xi
⎜ hi 6 ⎟
⎝ ⎠
Τέλος απομένει να ικανοποιήσουμε την συνέχεια της s′( x) στους εσωτερικούς
⎛ f ( xi ) h s′′ ( x ) ⎞ ⎛ f ( xi −1 ) h s′′ ( x ) ⎞
s′ ( x ) =
1 ′′
2hi
(
s ( xi ) ( x − xi −1 ) − s′′ ( xi −1 ) ( x − xi ) + ⎜
2 2
)
⎜ hi
⎝
− i
6
i
⎟−⎜
⎟ ⎜ hi
⎠ ⎝
− i
6
i −1
⎟
⎟
⎠
η οποία ισχύει για xi −1 ≤ x ≤ xi (7)
⎛ f ( xi +1 ) h s′′ ( x ) ⎞ ⎛ f ( xi ) h s′′ ( x ) ⎞
1
s′ ( x ) =
2hi +1
(
s′′ ( xi +1 ) ( x − xi ) − s′′ ( xi ) ( x − xi +1 ) + ⎜
2 2
⎜
⎝ h
)
i +1
− i +1
6
i +1
⎟−⎜
⎟ ⎜
⎠ ⎝ hi +1
− i +1
6
i
⎟
⎟
⎠
η οποία ισχύει για xi ≤ x ≤ xi +1 (8)
⎛ f ( xi ) h s′′ ( x ) ⎞ ⎛ f ( xi −1 ) h s′′ ( x ) ⎞
s′( xi ) =
1 ′′
2hi
(
s ( xi ) ( xi − xi −1 ) − s′′ ( xi −1 ) ( xi − xi ) + ⎜
2 2
)⎜ hi
⎝
− i
6
i
⎟−⎜
⎟ ⎜ hi
⎠ ⎝
− i
6
i −1
⎟⇒
⎟
⎠
h s′′ ( xi ) f ( xi ) − f ( xi −1 ) hi s′′ ( xi −1 )
s′( xi ) = i + + ≡ si′ ( xi ) , xi −1 ≤ x ≤ xi (9)
3 hi 6
110
⎛ f ( xi +1 ) h s′′ ( x ) ⎞ ⎛ f ( xi ) h s′′ ( x ) ⎞
s′( xi ) =
1
2hi +1
(
s′′ ( xi +1 ) ( xi − xi ) − s′′ ( xi ) ( xi − xi +1 ) + ⎜
2 2
⎜ hi +1
⎝
) − i +1
6
i +1
⎟−⎜
⎟ ⎜ hi +1
⎠ ⎝
− i +1
6
i
⎟⇒
⎟
⎠
h s′′ ( xi ) f ( xi +1 ) − f ( xi ) hi +1s′′ ( xi +1 )
s′( xi ) = − i +1 + − ≡ si +1′ ( xi ) , xi ≤ x ≤ xi +1 (10)
3 hi +1 6
Aπό τις δύο τελευταίες σχέσεις και την συνθήκη si′′ ( xi ) = si +1′′ ( xi ) παίρνουμε:
Παρατηρούμε ότι έχουμε n-1 εξισώσεις με n+1 αγνώστους, τους s′′ ( xi ), i = 0,1, 2,..., n .
Όπως ήδη έχει αναφερθεί οι δύο εξισώσεις που λείπουν είναι οι συνοριακές συνθήκες
οι οποίες στην παρούσα περίπτωση είναι οι s′ ( a ) = f ′ ( a ) και s′ ( b ) = f ′ ( b ) . Η σχέση
h1s′′ ( x0 ) f ( x1 ) − f ( x0 ) h1s′′ ( x0 )
s′(a ) = − + + = f ′(a) ⇒
3 h1 6
6 ⎛ f ( x1 ) − f ( x0 ) ⎞
2 s′′ ( x0 ) + s′′ ( x1 ) = ⎜ − f ′ ( a ) ⎟ (11)
h1 ⎝ h1 ⎠
Η σχέση (8) για i = n − 1, x = xn = b δίνει
hn s′′ ( xn ) f ( xn ) − f ( xn −1 ) hn s′′ ( xn −1 )
s′(b) = + + = f ′ (b) ⇒
3 hn 6
6⎛ f ( xn ) − f ( xn −1 ) ⎞
s′′ ( xn −1 ) + 2 s′′ ( xn ) = ⎜ f ′ (b) − ⎟ (12)
hn ⎝ hn ⎠
Οι σχέσεις (Α1) μαζί με τις (11) και (12) είτε στην περίπτωση του ομοιόμορφου
διαμερισμού οι σχέσεις (Α2) μαζί με τις (11) και (12) αποτελούν ένα γραμμικό σύστημα
111
n+1 εξισώσεων με n+1 αγνώστους. Συγκεντρωτικά τα δύο αυτά συστήματα έχουν ως
εξής:
⎛ f ( xi +1 ) − f ( xi ) f ( xi ) − f ( xi −1 ) ⎞
hi s′′ ( xi −1 ) + 2 ( hi + hi +1 ) s′′ ( xi ) + hi +1s′′ ( xi +1 ) = 6 ⎜ − ⎟
⎝ hi +1 hi ⎠
hi = xi − xi −1 , hi +1 = xi +1 − xi , i = 1, 2,..., n − 1
6 ⎛ f ( x1 ) − f ( x0 ) ⎞ (Σ1)
2 s′′ ( x0 ) + s′′ ( x1 ) = ⎜ − f ′(a)⎟
h1 ⎝ h1 ⎠
6⎛ f ( xn ) − f ( xn −1 ) ⎞
s′′ ( xn −1 ) + 2 s′′ ( xn ) = ⎜ f ′ ( b ) − ⎟
hn ⎝ hn ⎠
ή για ομοιόμορφο διαμερισμό
f ( xi +1 ) − 2 f ( xi ) + f ( xi −1 ) b−a
s′′ ( xi −1 ) + 4 s′′ ( xi ) + s′′ ( xi +1 ) = 6 2
, h= , i = 1, 2,..., n − 1
h n
6⎛ f ( x1 ) − f ( x0 ) − f ′ a ⎞
2 s′′ ( x0 ) + s′′ ( x1 ) = ⎜ ( )⎟ (Σ2)
h⎝ h ⎠
6⎛ f ( xn ) − f ( xn −1 ) ⎞
s′′ ( xn −1 ) + 2 s′′ ( xn ) = ⎜ f ′ (b) − ⎟
h⎝ h ⎠
Απομένει να αποδείξουμε ότι τα συστήματα (Σ1), (Σ2) έχουν μοναδική λύση. Αυτό
μπορούμε να το δούμε αν γράψουμε τα συστήματα αυτά σε μορφή διανυσμάτων και
πινάκων ως εξής:
⎡2 1 0 0 0 .... 0 0 0 ⎤ ⎡ s′′( x0 ) ⎤ ⎡ y0 ⎤
⎢ ⎥
⎢ h1 2 ( h1 +h 2 ) h 2 0 0 .... 0 0 0 ⎥ ⎢ s′′( x1 ) ⎥ ⎢ y1 ⎥
⎢ ⎥ ⎢ ⎥
⎢0 h 2 ( h 2 +h 3 ) h 3 0 .... 0 0 0 ⎥ ⎢ s′′( x2 ) ⎥ ⎢ y2 ⎥
⎢ 2
⎥⋅⎢ ⎥=⎢ ⎥ (Σ1β)
⎢........................................................................ ⎥ ⎢... ⎥ ⎢... ⎥
⎢ ⎥
⎢0 0 0 0 0 .... h n-1 2 ( h n-1 + h n ) h n ⎥ ⎢ s′′( xn −1 ) ⎥ ⎢ yn −1 ⎥
⎢ ⎥ ⎢ ⎥
⎢0 0 0 0 0 .... 0 1 2 ⎦⎥ ⎣⎢ s′′( xn ) ⎦⎥ ⎣⎢ yn ⎦⎥
⎣
a y
J
πίνακες, J και Ĵ αντίστοιχα, ο καθένας από τους οποίους είναι αυστηρά διαγωνίως
112
υπερτερών. Όπως όμως έχει δειχτεί, κάθε αυστηρά διαγωνίως υπερτερών πίνακας είναι
−1
αντιστρέψιμος και επομένως τα (Σ1α) και (Σ1β) έχουν μοναδική λύση, a = J ⋅ y και
−1
a = Jˆ ⋅ yˆ , αντίστοιχα, γεγονός που ολοκληρώνει την απόδειξη.
Τέλος να τονισθεί ότι λόγω επίσης του γεγονότος ότι οι J και Ĵ είναι τριδιαγώνιοι, τα
συστήματα (Σ1α) και (Σ1β) μπορούν να επιλυθούν αποδοτικά με τον αλγόριθμο που
αναπτύχθηκε για τα τριδιαγώνια συστήματα στο κεφάλαιο 3 (απαιτούνται
προσεγγιστικά πράξεις 4(n+1)).
Θεώρημα: Έστω f ∈ C 1[ a , b ] , n∈ και Δ : a ≡ x0 < x1 < x2 < ... < xn −1 < xn ≡ b ένας
διαμερισμός του [a, b] . Τότε υπάρχει ακριβώς μία συνάρτηση s ∈ S3 ( Δ ) τέτοια ώστε
{s ( x ) = f ( x ) , s′′ ( a ) = f ′′ ( a ) , s′′ ( b ) = f ′′ ( b ) ,
i i i = 0,1, 2,..., n}
Απόδειξη: Η απόδειξη είναι ακριβώς ίδια με του προηγούμενου θεωρήματος μόνο που
αλλάζουν οι συνοριακές συνθήκες. Έτσι τα συστήματα που προκύπτουν είναι
Όμοια αποδεικνύεται και η περίπτωση της «φυσικής κυβικής spline», δηλαδή όταν
αναζητούμε s ∈ S3 ( Δ ) η οποία να ικανοποιεί τις συνθήκες
113
{s ( x ) = f ( x ) , s′′ ( a ) = s′′ ( b ) = 0,
i i i = 0,1, 2,..., n} . Η μόνη διαφορά με τα συστήματα
(Σ2α) και (Σ2β) είναι ότι το δεξί μέλος στην πρώτη και τελευταία εξίσωση είναι μηδέν,
δηλαδή στην θέση των f ′′( a ) και f ′′(b) έχουμε το μηδέν.
Να σημειωθεί ότι για την εφαρμογή των συναρτήσεων spline επιλύουμε κατευθείαν τα
συστήματα (Σ1α), (Σ1β), (Σ2α) ή (Σ2β), ανάλογα με την περίπτωση, χωρίς να
επαναλάβουμε από την αρχή την ανάλυση.
χρησιμοποιήστε και τις 3 δυνατές επιλογές που αναφέρονται παραπάνω. Σε όλες τις
περιπτώσεις βρείτε την πρόβλεψη για την τιμή της συνάρτησης στο x = 1.25 και στο
x = 1.75 καθώς και τα αντίστοιχα απόλυτα σφάλματα.
Λύση: Οι τιμές της συνάρτησης στα σημεία x0 , x1 , x2 είναι αντίστοιχα
είναι s′′ (1) = f ′′ (1) = 2, s′′ ( 2 ) = f ′′ ( 2 ) = 1 4 , και για το τρίτο είναι s′′ (1) = s′′ ( 2 ) = 0 .
Έτσι τα συστήματα που πρέπει να επιλυθούν έχουν ως εξής. Για την πρώτη περίπτωση:
⎡ 2 1 0 ⎤ ⎡ s′′( x0 ) ⎤ ⎡ yˆ 0 ⎤
⎢1 4 1 ⎥ ⋅ ⎢ s′′( x ) ⎥ = ⎢ yˆ ⎥ όπου yˆ = 6 ⎛ 2 3 − 1 − −1 ⎞ = 4 ,
⎢ ⎥ ⎢ 1 ⎥ ⎢ 1⎥ 0 ⎜ ( )⎟
1 2⎝ 1 2 ⎠
⎢⎣0 1 2 ⎥⎦ ⎢⎣ s′′( x2 ) ⎥⎦ ⎢⎣ yˆ 2 ⎥⎦
6 6 ⎛1 2 ⎞ 6 ⎛ 1 2−2 3⎞
2 ( 2
yˆ1 = f − 2 f1 + f 0 ) = 2 ⎜
− 2 + 1⎟ = 4 , yˆ 2 = ⎜ ( −1 4 ) − ⎟ = 1.
h (1 2 ) ⎝ 2 3 ⎠ 1 2⎝ 12 ⎠
7 1 1
Επιλύουμε το σύστημα και βρίσκουμε s′′( x0 ) = , s′′( x1 ) = , s′′( x2 ) = .
4 2 4
Αντικαθιστούμε τις τιμές αυτές στην σχέση (Α) και παίρνουμε την ζητούμενη
συνάρτηση:
sa ( x ) = ×⎨
24 ⎪⎩−2 x3 + 15 x 2 − 42 x + 52, 3 2 ≤ x ≤ 2
114
⎡1 0 0 ⎤ ⎡ s′′( x0 ) ⎤ ⎡ yˆ 0 ⎤
⎢1 4 1 ⎥ ⋅ ⎢ s′′( x ) ⎥ = ⎢ yˆ ⎥ όπου yˆ 0 = 2 , yˆ1 = 4 , yˆ 2 = 1 4 , οπότε θα προκύψει
⎢ ⎥ ⎢ 1 ⎥ ⎢ 1⎥
⎢⎣0 0 1⎥⎦ ⎢⎣ s′′( x2 ) ⎥⎦ ⎢⎣ yˆ 2 ⎥⎦
7 1
s′′( x0 ) = 2, s′′( x1 ) = , s′′( x2 ) = και η ζητούμενη συνάρτηση θα είναι:
16 4
sb ( x ) = ×⎨
192 ⎪⎩−12 x3 + 96 x 2 − 289 x + 386, 3 2≤ x≤2
⎡1 0 0 ⎤ ⎡ s′′( x0 ) ⎤ ⎡0 ⎤
⎢ ⎥ ⎢ ′′ ⎥ ⎢ˆ ⎥
⎢1 4 1 ⎥ ⋅ ⎢ s ( x1 ) ⎥ = ⎢ y1 ⎥
⎢⎣0 0 1⎥⎦ ⎢⎣ s′′( x2 ) ⎥⎦ ⎢⎣0 ⎥⎦
όπου yˆ1 = 4 (όπως και στις προηγούμενες δύο περιπτώσεις) οπότε θα προκύψει
1 ⎧⎪4 x − 12 x + 3 x + 17, 1≤ x ≤ 3 2
3 2
sc ( x ) = × ⎨
12 ⎪⎩−4 x + 24 x − 51x + 44, 3 2 ≤ x ≤ 2
3 2
115
1,0 1,2 1,4 1,6 1,8 2,0
1,0 1,0
1/x
0,9 sa 0,9
sb
sc
0,8 0,8
y
0,7 0,7
0,6 0,6
0,5 0,5
Επιπλέον για x = 1.25 έχουμε f = 0.8 ενώ από τις προκύπτουσες συναρτήσεις έχουμε,
116
Κεφάλαιο 5ο
Αριθμητική παραγώγιση
5.1. Εισαγωγή
Δύο πολύ απλές σχέσεις για τον αριθμητικό υπολογισμό της πρώτης παραγώγου μίας
συνάρτησης f σε ένα σημείο x δίνονται μέσω του ορισμού της παραγώγου μίας
συνάρτησης:
f ( x + h) − f ( x) f ( x) − f ( x − h)
f ′ ( x ) = lim , f ′ ( x ) = lim
h →0 h h →0 h
Λόγω όμως του γεγονότος ότι στον υπολογιστή το όριο δεν υφίσταται, είναι δηλαδή μία
θεωρητική έννοια, οι παραπάνω σχέσεις δίνουν προσεγγιστικά την τιμή της
παραγώγου:
f ( x + h) − f ( x) f ( x) − f ( x − h)
f ′( x) ≈ ≡ D+(1) f ( x), f ′( x) ≈ ≡ D−(1) f ( x), h << 1
h h
Είναι προφανές ότι όσο πιο μικρή η ποσότητα h τόσο πιο ακριβείς γίνονται οι δύο
αυτές σχέσεις, οι οποίες αποτελούν τις απλούστερες εκφράσεις πεπερασμένων
διαφορών, και οι οποίες αναλύονται παρακάτω. Το σφάλμα των εκφράσεων αυτών
βρίσκεται με την χρήση σειρών Taylor. Αν υποθέσουμε ότι η συνάρτηση f είναι δύο
φορές συνεχώς παραγωγίσιμη σε μία περιοχή του x , τότε θα έχουμε:
h2 f ( x + h) − f ( x) h
f ( x + h ) = f ( x ) + hf ′ ( x ) + f ′′ (ξ x ) ⇒ f ′ ( x ) = − f ′′ (ξ x ) , x < ξ x < x + h
2 h 2
D+(1) f ( x )
h2 f ( x) − f ( x − h) h
f ( x − h ) = f ( x ) − hf ′ ( x ) + f ′′ (ξ x ) ⇒ f ′ ( x ) = + f ′′ (ξ x ) , x − h < ξ x < x
2 h 2
D−(1) f ( x )
117
Η ποσότητα στο αριστερό μέλος των παραπάνω σχέσεων είναι το σφάλμα ε ( x )
(ακριβής τιμή μείον την προσεγγιστική τιμή) το οποίο μάλιστα, αν η f ′′ είναι συνεχής
h h
ε ( x) = f ′′ (ξ x ) ≤ M , M ≡ max f ′′ ( y ) . Η σχέση αυτή δείχνει ότι και στις δύο
2 2 yε [ x − h , x + h ]
περιπτώσεις το μέγιστο απόλυτο σφάλμα είναι ανάλογο του h το οποίο βέβαια θα τείνει
h
στο μηδέν καθώς h → 0 . Η ποσότητα M είναι το θεωρητικό σφάλμα της μεθόδου
2
γνωστό και ως σφάλμα αποκοπής.
συμβαίνει στην περίπτωση της πρώτης παραγώγου της f . Όπως δείξαμε για το σφάλμα
f ( n +1) (ξ x ) n
ισχύει f ( x) − p ( x) =
( n + 1)! ∏
( x − x j ) , ξ x ∈ ( a, b ) . Αν παραγωγίσουμε αυτή την
j =0
σχέση θα έχουμε:
d ⎛ f
( n +1)
(ξ x ) n x − x ⎞ ⇒
f ′ ( x ) − p′ ( x ) = ⎜ ∏ ( j ) ⎟⎟
dx ⎜⎝ ( n + 1) ! j =0 ⎠
1 ⎧d ⎛ n ⎞ ( n +1) ⎫
(ξ x ) + ∏ ( x − xi ) ( f ( n +1) (ξ x ) )⎬
n
d
f ′ ( x ) − p′ ( x ) = ⎨ ⎜ ∏ ( x − xi ) ⎟ f
( n + 1)! ⎩ dx ⎝ i =0 ⎠ i =0 dx ⎭
Δυστυχώς η παράγωγος
d
dx
( f ( n +1) (ξ x ) ) δεν μπορεί να εκτιμηθεί αφού δεν ξέρουμε τον
118
f ( n +1) (ξ x ) n
f ′ ( xi ) − p′ ( xi ) =
( n + 1)! ∏
( xi − x j ) (*)
j =0
j ≠i
∑ L ( x ) f ( x ) και επομένως η
n
Το πολυώνυμο Lagrange δίνεται από την σχέση p ( x ) = j j
j =0
d ⎛ n ⎞
( j )⎟ ( j ) ∑ L j′ ( xi ) f ( x j ) .
n
παράγωγός του είναι p′ ( x ) = ⎜∑ j L ( x ) f x ⇒ p ′ x =
dx ⎝ j =0 ⎠ j =0
f ( n +1) (ξ x ) n
f ′ ( xi ) = ∑ L j′ ( xi ) f ( x j ) + ( xi − x j )
n
j =0 ( n + 1)! ∏ j =0
i≠ j
Η παραπάνω σχέση ονομάζεται τύπος των «n+1» σημείων για την προσέγγιση της
f ′ ( xi ) αφού ουσιαστικά πρόκειται για έναν γραμμικό συνδυασμό των τιμών της
( )
συνάρτησης f x j , j = 0,1, 2,..., n . Η σχέση αυτή συνήθως χρησιμοποιείται για n = 2 .
D (2) f ( x) = af ( x − h ) + bf ( x ) + cf ( x + h ) (1)
119
όπου οι σταθερές a , b, c θα πρέπει να προσδιοριστούν με συνεπή τρόπο. Ορίζουμε το
σφάλμα, το οποίο δίνεται ως την διαφορά της πραγματικής τιμής της 2ης παραγώγου
της συνάρτησης στο σημείο x από την προσεγγιστική τιμή, δηλαδή,
⎛ h2 h2 ⎞
ε ( x ) ≡ − ( a + b + c ) f ( x ) + ( ah − ch ) f ′ ( x ) + ⎜1 − a − c ⎟ f (2) ( x ) +
⎝ 2 2⎠
⎛ h 3
h ⎞ 3
⎛ h h ⎞ 4 4 (6)
+ ⎜ a − c ⎟ f (3) ( x ) − ⎜ a + c ⎟ f (4) ( x ) + ...
⎝ 6 6⎠ ⎝ 24 24 ⎠
Η σχέση αυτή θα πρέπει να ισχύει για κάνε τιμή του x . Επιπλέον, είναι φανερό ότι
όσοι περισσότεροι όροι της σειράς απαλειφθούν τόσο το καλύτερο (με δεδομένο ότι η
συνάρτηση f συμπεριφέρεται ομαλά). Πράγματι, από την σχέση (6) βλέπουμε ότι
120
⎡ ⎤
a+b+c = 0 ⎢1 1 1 ⎥ ⎡ a ⎤ ⎡0⎤
⎢ ⎥
ah − ch = 0 είτε σε μορφή πίνακα: ⎢ h 0 -h ⎥ ⋅ ⎢⎢b ⎥⎥ = ⎢⎢0⎥⎥ . Έχουμε δηλαδή ένα
h2 h2 ⎢ h2 h 2 ⎥⎥ ⎢⎣c ⎥⎦ ⎢⎣1 ⎥⎦
a + c =1 ⎢ 0
2 2 ⎢⎣ 2 2 ⎥⎦
γραμμικό, μη-ομογενές γραμμικό σύστημα το οποίο θα έχει μοναδική λύση εφόσον η
ορίζουσα του πίνακα στο αριστερό μέλος είναι μη-μηδενική. Πράγματι η ορίζουσα
είναι ίση με h3 και επομένως το πρόβλημα έχει μοναδική λύση για κάθε h ≠ 0 . Η
1 2 1
λύση του είναι a = 2
, b = − 2 , c = 2 οπότε η (1) θα δώσει:
h h h
f ( x − h) − 2 f ( x) + f ( x + h)
D (2) f ( x ) =
h2
Για το σφάλμα η σχέση (6) θα δώσει:
h 2 (4)
ε ( x) ≡ − f (ξ x ) , x − h < ξ x < x + h
12
Λόγω του γεγονότος ότι το σφάλμα αποκοπής είναι ανάλογο του h 2 η αντίστοιχη σχέση
συνεχής στο [ x − h, x + h ] τότε εύκολα βρίσκουμε ένα άνω φράγμα του σφάλματος,
h 2 (4) h2
ε ( x) = f (ξ x ) ≤ M , M ≡ max f (4) ( y )
12 12 x −h≤ y ≤ x + h
h2
Είναι προφανές ότι M → 0 . Δυστυχώς όμως, στην πραγματικότητα δεν συμβαίνει
12 h→0
αυτό. Αυτό οφείλεται στο ότι οι πράξεις γίνονται πάντα με μία συγκεκριμένη ακρίβεια,
δηλαδή εκτός του σφάλματος αποκοπής θα υπάρχει και το σφάλμα στρογγυλοποίησης.
121
f ( x − h ) , f ( x ) , f ( x + h ) έχουμε τις ποσότητες f −1 ≡ fl ( f ( x − h ) ) , f 0 ≡ fl ( f ( x ) ) και
σ 0 ≡ f ( x ) − fl ( f ( x ) ) , σ 1 ≡ f ( x + h ) − fl ( f ( x + h ) ) . Άρα θα έχουμε
D (2) f ( x) =
(f −1 ) ( ) (
+ σ −1 − 2 f 0 + σ 0 + f +1 + σ +1 )=D (2)
f ( x) +
σ −1 − 2σ 0 + σ +1
⇒
2
h h2
σ − 2σ 0 + σ +1
D (2) f ( x) = D (2) f ( x) − −1
h2
και το πραγματικό σφάλμα θα είναι:
⎛ σ −1 − 2σ 0 + σ +1 ⎞
ε ( x ) ≡ f (2) ( x ) − D (2) f ( x) = f (2) ( x ) − ⎜ D (2) f ( x) − ⎟⇒
⎝ h2 ⎠
σ − 2σ 0 + σ +1 2
h (4) σ − 2σ 0 + σ +1
ε ( x ) = f (2) ( x ) − D (2) f ( x) + −1 2
⇒ ε ( x) = − f (ξ x ) + −1
h 12 h2
και επομένως
h 2 (4) σ − 2σ 0 + σ +1 h2 σ −1 − 2σ 0 + σ +1 h 2 σ + 2 σ 0 + σ +1
ε ( x) = − f (ξ x ) + −1 2
≤ M + 2
≤ M + −1 ⇒
12 h 12 h 12 h2
h2 4σ
ε ( x) ≤ M + 2 , M ≡ max f (4) ( y ) , σ ≡ max { σ −1 , σ 0 , σ +1 }
12 h x −h≤ y ≤ x + h
h2 4σ
Θεωρούμε την συνάρτηση g ( h) = M+ 2 για την οποία έχουμε ότι
12 h
h 8σ 1 24σ
g′ ( h) = M− 3 και g ′′ ( h ) = M + 4 > 0 για κάθε h > 0 . Η πρώτη παράγωγος
6 h 6 h
14
h* 8σ ⎛ 48σ ⎞
μηδενίζεται στο σημείο g ′ ( h* ) = M − *3 = 0 ⇒ h* = ⎜ ⎟ το οποίο βέβαια
6 h ⎝ M ⎠
αποτελεί το σημείο ελαχιστοποίησης της g = g ( h ) αφού η δεύτερη παράγωγος της
Θα συνεχίσουμε με ένα ακόμα παράδειγμα. Έστω ότι μας δίνεται ένας συγκεκριμένος
f ( x + h) − f ( x − h)
τύπος πεπερασμένων διαφορών, D f ( x ) =
(1)
, για τον οποίο θέλουμε
2h
να υπολογίσουμε το μέγιστο συνολικό σφάλμα, δηλαδή το άνω φράγμα του
αθροίσματος του σφάλματος αποκοπής και του σφάλματος στρογγύλευσης.
Λύση: Χρησιμοποιούμε τις σχέσεις (5α) και (5β) και αντικαθιστούμε παίρνουμε
122
⎧ h2 h3 ⎫ ⎧ h2 h3 ⎫
⎨ ( )
f x + hf ′ ( )
x + f ′′ ( )
x + f ′′′ ( ) ⎬ ⎨ ( )
x + ... − f x − hf ′ ( )
x + f ′′ ( )
x − f ′′′ ( x ) + ...⎬
2 6 2 6
D (1) f ( x ) = ⎩ ⎭ ⎩ ⎭
2h
ή
h3
2hf ′ ( x ) + 2 f ′′′ ( x ) + ...
6 h2
D (1) f ( x ) = ⇒ D (1) f ( x ) = f ′ ( x ) + f ′′′ ( x ) + ... ⇒
2h 6
h2 h2
f ′ ( x ) − D (1) f ( x ) = − f ′′′ ( x ) + ... ⇒ ε ( x) = − f ′′′ ( x ) + ... . Έτσι, αν η συνάρτηση είναι 3
6 6
ε ( x)
h2
ε ( x) = − f ′′′ (ξ x ) , x − h < ξ x < x + h που μας δείχνει ότι το θεωρητικό σφάλμα (δηλαδή
6
το σφάλμα αποκοπής) είναι δεύτερης τάξης. Λόγω όμως των σφαλμάτων στρογγύλευσης
h2 σ
ε ( x) ≤ M + , M ≡ max f (3) ( y ) , σ ≡ max { σ −1 , σ 1 }
6 h y∈[ x − h , x + h ]
όπου φυσικά ο πρώτος όρος στο δεξί μέλος της ανισότητας αντιστοιχεί στο λάθος
αποκοπής και ο δεύτερος στο λάθος στρογγύλευσης. Η ποσότητα στο δεξί μέλος της
ανισότητας είναι το μέγιστο απόλυτο συνολικό σφάλμα. Για να βρούμε το σημείο
h2 σ
ελαχιστοποίησης του σφάλματος αυτού θεωρούμε την συνάρτηση g ( h ) = M+ για
6 h
h σ 1 2σ
την οποία ισχύει g ′ ( h ) = M − 2 και g ′′ ( h ) = M + 3 > 0 για κάθε h > 0 αφού τα σ
3 h 3 h
και M είναι θετικοί αριθμοί. Το σημείο μηδενισμού της πρώτης παραγώγου είναι
13
h* σ ⎛ 3σ ⎞
g ′ ( h ) = M − *2 = 0 ⇒ h* = ⎜
*
⎟ το οποίο φυσικά αποτελεί ελάχιστο της g αφού η
3 h ⎝M ⎠
g ′′ είναι πάντα θετική.
Πριν το κλείσιμο αυτού του κεφαλαίου να σημειωθεί ότι οι τύποι των πεπερασμένων
διαφορών διακρίνονται σε:
(α) «προς τα εμπρός» αν οι τιμές της συνάρτησης που χρησιμοποιούνται βρίσκονται
όλες αριστερά από το σημείο xi στο οποίο ζητείται να υπολογισθούν οι παράγωγοί της
123
(β) «προς τα πίσω» αν οι τιμές της συνάρτησης που χρησιμοποιούνται βρίσκονται όλες
δεξιά από το σημείο xi
Ακολουθούν οι τύποι πεπερασμένων διαφορών για την πρώτη, δεύτερη και τρίτη
παράγωγο που προκύπτουν με την μέθοδο των προσδιοριστέων συντελεστών μαζί με
την τάξη ακρίβειας τους. Για το καθένα από τους τύπους αυτούς προσδιορίστε (α) το
σφάλμα αποκοπής, (β) το μέγιστο απόλυτο συνολικό σφάλμα (δηλαδή το άνω φράγμα
τους αθροίσματος του σφάλματος αποκοπής και του σφάλματος στρογγύλευσης) καθώς
και (γ) το βέλτιστο h* για την ελαχιστοποίηση του σφάλματος αυτού.
Δεύτερη παράγωγος.
f ( xi + 2 ) − 2 f ( xi +1 ) + f ( xi )
f ′′( xi ) = + O ( h)
h2
− f ( xi +3 ) + 4 f ( xi + 2 ) − 5 f ( xi +1 ) + 2 f ( xi )
f ′′( xi ) = 2
+ O(h 2 )
h
−10 f ( xi + 5 ) + 61 f ( xi + 4 ) − 156 f ( xi + 3 ) + 214 f ( xi + 2 ) − 154 f ( xi +1 ) + 45 f ( xi )
f ′′( xi ) = + O(h 4 )
12h 2
Τρίτη παράγωγος.
f ( xi +3 ) − 3 f ( xi + 2 ) + 3 f ( xi +1 ) − f ( xi )
f ′′′( xi ) = + O ( h)
h3
−3 f ( xi + 4 ) + 14 f ( xi + 3 ) − 24 f ( xi + 2 ) + 18 f ( xi +1 ) − 5 f ( xi )
f ′′′( xi ) = + O (h 2 )
2h 3
−15 f ( xi + 6 ) + 104 f ( xi + 5 ) − 307 f ( xi + 4 ) + 496 f ( xi + 3 ) − 461 f ( xi + 2 ) + 232 f ( xi +1 ) − 49 f ( xi )
f ′′′( xi ) = + O (h 4 )
8h 3
124
5.3.2. Τύποι πεπερασμένων διαφορών προς τα πίσω.
Πρώτη παράγωγος
f ( xi ) − f ( xi −1 )
f ′( xi ) = + O ( h)
h
3 f ( xi ) − 4 f ( xi −1 ) + f ( xi − 2 )
f ′( xi ) = + O(h 2 )
2h
25 16
f ( xi ) − 16 f ( xi −1 ) + 12 f ( xi − 2 ) − f ( xi −3 ) + f ( xi − 4 )
′
f ( xi ) = 3 3 + O (h 4 )
4h
Δεύτερη παράγωγος.
f ( xi ) − 2 f ( xi −1 ) + f ( xi − 2 )
f ′′( xi ) = + O ( h)
h2
2 f ( xi ) − 5 f ( xi −1 ) + 4 f ( xi − 2 ) − f ( xi −3 )
f ′′( xi ) = 2
+ O(h 2 )
h
45 f ( xi ) − 154 f ( xi −1 ) + 214 f ( xi − 2 ) − 156 f ( xi − 3 ) + 61 f ( xi − 4 ) − 10 f ( xi − 5 )
f ′′( xi ) = + O(h 4 )
12h 2
Τρίτη παράγωγος.
f ( xi ) − 3 f ( xi −1 ) + 3 f ( xi − 2 ) − f ( xi − 3 )
f ′′′( xi ) = + O (h)
h3
5 f ( xi ) − 18 f ( xi −1 ) + 24 f ( xi − 2 ) − 14 f ( xi − 3 ) + 3 f ( xi − 4 )
f ′′′( xi ) = + O(h 2 )
2h 3
49 f ( xi ) − 232 f ( xi −1 ) + 461 f ( xi − 2 ) − 496 f ( xi − 3 ) + 307 f ( xi − 4 ) − 104 f ( xi − 5 ) + 15 f ( xi − 6 )
f ′′′( xi ) = + O(h 4 )
8h3
Δεύτερη παράγωγος.
f ( xi +1 ) − 2 f ( xi ) + f ( xi −1 )
f ′′( xi ) = + O(h 2 )
h2
− f ( xi + 2 ) + 16 f ( xi +1 ) − 30 f ( xi ) + 16 f ( xi −1 ) − f ( xi − 2 )
f ′′( xi ) = 2
+ O(h 4 )
12h
125
Τρίτη παράγωγος.
f ( xi + 2 ) − 2 f ( xi +1 ) + 2 f ( xi −1 ) − f ( xi − 2 )
f ′′′( xi ) = 3
+ O (h 2 ).
2h
− f ( xi + 3 ) + 8 f ( xi + 2 ) − 13 f ( xi +1 ) + 13 f ( xi −1 ) − 8 f ( xi − 2 ) + f ( xi − 3 )
f ′′′( xi ) = 3
+ O(h 4 )
8h
126
Κεφάλαιο 6ο
Αριθμητική ολοκλήρωση
6.1 Εισαγωγή
Σκοπός στο παρόν κεφάλαιο είναι η ανάπτυξη μεθόδων για τον αριθμητικό υπολογισμό
b
διαμερισμό του διαστήματος ενδιαφέροντος [α,b], Δ : a ≡ x1 < x2 < ... < xn < xn +1 ≡ b , όχι
απαραίτητα ομοιόμορφο, δηλαδή χωρίζουμε το διάστημα [a,b] σε «n» στο πλήθος
υποδιαστήματα. Έχουμε:
b x2 x3 xn+1 n xi+1 n
I ( f ) = ∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx + ... + ∫ f ( x ) dx = ∑ ∫ f ( x ) dx = ∑ I i ( f )
a x1 x2 xn i =1 xi i =1
I1 ( f ) I2 ( f ) In ( f )
Η μέθοδος αυτή έχει τρεις εκδοχές. Θα περιοριστούμε όμως σε εκείνη που δίνει την
μεγαλύτερη ακρίβεια στο τελικό αποτελέσμα, η οποία αναφέρεται συνήθως και ως
μέθοδος του μέσου σημείου. Η ιδέα της μεθόδου αυτής είναι η εξής. Για το κάθε
xi +1 − xi xi + xi +1
υποδιάστημα [ xi , xi+1 ] ορίζουμε το μέσο του yi = xi + = και θεωρούμε
2 2
ότι το ολοκλήρωμα της συνάρτησης, το οποίο βέβαια είναι το εμβαδό του χωρίου κάτω
από την καμπύλη της συνάρτησης, είναι προσεγγιστικά ίσο με το εμβαδό του
ορθογωνίου που φαίνεται στο σχήμα 1, δηλαδή I i ( f ) ≈ ( xi +1 − xi ) f ( yi ) ⇒
R ( f ) , έχει ως εξής:
127
n n
R ( f ) = ∑ Ri ( f ) = ∑ hi f ( yi ) , hi = xi +1 − xi , yi = ( xi +1 + xi ) 2
i =1 i =1
είτε
n
⎛x +x ⎞
R ( f ) = ∑ ( xi +1 − xi ) f ⎜ i +1 i ⎟
i =1 ⎝ 2 ⎠
και για την περίπτωση του ομοιόμορφου διαμερισμού έχουμε:
n
⎛x +x ⎞
R ( f ) = h∑ f ⎜ i +1 i ⎟, h ≡ ( b − a ) n
i =1 ⎝ 2 ⎠
γύρω από το σημείο yi , υποθέτοντας φυσικά ότι όλες οι παράγωγοι της συνάρτησης
υπάρχουν:
( x − yi ) ( x − yi )
2 3
f ( x ) = f ( yi ) + ( x − yi ) f ′ ( yi ) + f ′′ ( yi ) + f ′′′ ( yi ) + ...
2 6
Το ανάπτυγμα αυτό το ολοκληρώνουμε μεταξύ xi και xi +1 για να πάρουμε:
( x − yi ) ( x − yi )
xi+1 xi+1 xi +1 xi+1 2 xi+1 3
∫ f ( x ) dx = ∫ f ( yi ) dx + ∫ ( x − yi ) f ′ ( yi ) dx + ∫ f ′′ ( yi ) dx + ∫ f ′′′ ( yi ) dx + ...
xi xi xi xi
2 xi
6
Ii ( f ) Ri ( f )
είτε
f ′′ ( yi ) f ′′′ ( yi )
xi+1 xi+1 xi+1
I i ( f ) − Ri ( f ) = f ′ ( yi ) ∫ ( x − yi ) dx + ∫ (x − y ) ∫ (x − y )
2 3
i dx + i dx + ...
xi
2 xi
6 xi
εi ( f )
όπου η ποσότητα στο αριστερό μέλος είναι το σφάλμα ε i ( f ) , δηλαδή η διαφορά της
προσεγγιστικής από την ακριβής τιμή του ολοκληρώματος. Τα ολοκληρώματα στο δεξί
μέλος της παραπάνω σχέσης υπολογίζονται εύκολα:
⎧0, p περιττος
( )
xi+1
1 p +1 xi+1 1 ⎪
∫ (x − y ) ( x − yi ) x = ( xi +1 − yi ) − ( xi − yi ) = ⎨ hi
p +1 p +1
dx =
p p +1
p +1 p +1 ⎪ 2 p ( p + 1) , p αρτιος
i
i
xi
⎩
και επομένως η σχέση για το σφάλμα διαμορφώνεται ως εξής:
f ′′ ( yi ) 3 f (4) ( yi ) 5
ε (f)=
i
R
hi + hi + O ( hi7 ) (*)
24 1920
Αν τώρα αθροίσουμε την παραπάνω σχέση σε όλα τα υποδιαστήματα θα πάρουμε το
συνολικό σφάλμα ε R ( f ) :
128
1 n 1 n (4)
f ( yi ) hi5 + O ( hi7 ) = E + F + O.Y .T .
n
ε R ( f ) ≡ ∑ ε iR ( f ) = ∑ i i 1920 ∑
f ′′ ( y ) h 3
+
i =1 24 i =1 i =1
E F
μέγεθος όροι. Αν όμως hi << 1 τότε hi3 << hi5 και επομένως η τελευταία σχέση δίνει:
1 n 1 1 n
( )
n
εR( f )≈ E ⇒ εR ≈ E = ∑
24 i =1
f ′′ ( yi ) hi3 =
24
∑
i =1
f ′′ ( yi ) hi3 ≤ ∑ f ′′ ( yi ) hi3 ⇒
24 i =1
M n 3
εR ≤ ∑ hi ,
24 i =1
M ≡ max f '' ( x )
a ≤ x ≤b
b−a n
Για ομοιόμορφο διαμερισμό ισχύει hi ≡ h =
n
και επομένως ∑h i =1
i
3
= nh3 και άρα
M ⎛ b − a ⎞ M (b − a ) ⎛ b − a ⎞
3 2
M
ε R
≤ n⎜ ⎟ = n ⎜ ⎟ ⇒ε ≤
R
( b − a ) h2 (**)
24 ⎝ n ⎠ 24 n ⎝ n ⎠ 24
Η σχέση (*) μας δείχνει ότι, τοπικά, η μέθοδος του ορθογωνίου είναι 3ης τάξης ενώ
ολικά (δηλαδή σε όλο το διάστημα ενδιαφέροντος) είναι 2ης τάξης. Η σχέση (**) μπορεί
να χρησιμοποιηθεί για να γίνει μία εκτίμηση του μήκους h , για ομοιόμορφο
διαμερισμό, που απαιτείται για να προσδιορισθεί το ζητούμενο ολοκλήρωμα με μέγιστο
M 24Σ
σφάλμα, Σ. Πράγματι από την (**) έχουμε ε max = ( b − a ) h2 ≤ Σ ⇒ h ≤ ⇒
24 M (b − a )
24Σ
hmax = . Όμως η σταθερά M είναι γενικά δύσκολο να προσδιορισθεί είτε
M (b − a )
είναι άγνωστη αν δεν ξέρουμε την f . Στην περίπτωση αυτή θεωρούμε ότι M = O(1) και
24Σ
επομένως παίρνουμε μία εκτίμηση του hmax , hmax ≈ . Συνήθης πρακτική είναι
b−a
να επαναλαμβάνουμε τους υπολογισμούς με 2hmax και hmax 2 και να συγκρίνουμε τα
Στην μέθοδο αυτή θεωρούμε ότι το ολοκλήρωμα της συνάρτησης είναι προσεγγιστικά
ίσο με το εμβαδόν του τραπεζίου που φαίνεται στο σχήμα 2, δηλαδή
129
xi +1 − xi
Ii ( f ) ≈
2
( f ( xi ) + f ( xi +1 ) ) = Ti ( f ) , i = 1, 2,..., n . Επομένως ο σύνθετος κανόνας του
τραπεζίου, T ( f ) , έχει ως εξής:
n n
⎧x − x ⎫
T ( f ) = ∑ Ti ( f ) = ∑ ⎨ i +1 i ( f ( xi ) + f ( xi +1 ) ) ⎬
i =1 i =1 ⎩ 2 ⎭
είτε στην περίπτωση του ομοιόμορφου διαμερισμού:
h⎛ n
⎞
T ( f ) = ⎜ f ( x1 ) + 2∑ f ( xi ) + f ( xn +1 ) ⎟ , h ≡ ( b − a ) n
2⎝ i=2 ⎠
( x − yi ) ( x − yi )
2 3
f ( x ) = f ( yi ) + ( x − yi ) f ′ ( yi ) + f ′′ ( yi ) + f ′′′ ( yi ) + ...
2 6
Για x = xi και x = xi +1 η παραπάνω σχέση δίνει, αντίστοιχα:
hi h2 h3 h4
f ( xi ) = f ( yi ) − f ′ ( yi ) + i f ′′ ( yi ) − i f ′′′ ( yi ) + i f (4) ( yi ) + ...
2 8 48 384
hi h2 h3 h4
f ( xi +1 ) = f ( yi ) + f ′ ( yi ) + i f ′′ ( yi ) + i f ′′′ ( yi ) + i f (4) ( yi ) + ...
2 8 48 384
όπου hi ≡ xi +1 − xi . Προσθέτουμε τις δύο τελευταίες σχέσεις και διαιρούμε δια δύο:
1 h2 h4
2
( f ( xi ) + f ( xi +1 ) ) = f ( yi ) + i f ′′ ( yi ) + i f (4) ( yi ) + ...
8 384
Ολοκληρώνουμε την σχέση αυτή στο διάστημα [ xi , xi +1 ] και παίρνουμε:
( xi +1 − xi ) 3
hi5 (4)
( f ( x ) + f ( x )) = h f ( y ) + 8
h
i i +1 i i
i
f ′′ ( yi ) + f ( yi ) + ...
2 384
Ri ( f )
Ti ( f )
f ′′ ( yi ) f (4) ( yi )
Όμως έχουμε δείξει παραπάνω ότι I i ( f ) − Ri ( f ) = h +
i
3
hi5 + O ( hi7 )
24 1920
και επομένως οι δύο αυτές τελευταίες σχέσεις δίνουν
⎪⎧ f ′′ ( yi ) 3 f ( yi ) 5 ⎪⎫ h
(4) 3
h5
Ti ( f ) = I i ( f ) − ⎨ hi + hi + O ( hi7 ) ⎬ + i f ′′ ( yi ) + i f (4) ( yi ) + ...
⎩⎪ 24 1920 ⎭⎪ 8 384
130
f ′′ ( yi ) 3 f (4) ( yi ) 5
ε iT ( f ) ≡ I i ( f ) − Ti ( f ) = − hi − hi + O ( hi7 ) ...
12 480
Αθροίζοντας την παραπάνω σχέση σε όλα τα υποδιαστήματα παίρνουμε
n
⎛ 1 n 3⎞ ⎛ 1 n (4) ⎞
ε T ( f ) ≡ ∑ ε iT ( f ) = −2 ⎜ ∑ f ′′ ( yi ) hi ⎟ − 4 ⎜ ∑ f ( yi )hi5 ⎟ + O.Y .T . = −2 E − 4 F + O.Y .T .
i =1 ⎝ 24 i =1 ⎠ ⎝ 1920 i =1 ⎠
M n 3
εT ( f ) ≤ ∑ hi , M ≡ xmax
12 i =1 ∈[ a ,b ]
f ′′ ( x )
b−a n
Για ομοιόμορφο διαμερισμό ισχύει hi ≡ h =
n
και επομένως ∑h
i =1
i
3
= nh3 και άρα
2
M M b−a⎛b−a⎞ M M
ε ( f ) ≤ nh3 = n ⎟ = ( b − a ) h ⇒ ε ≤ 12 ( b − a ) h .
T 2 T 2
⎜
12 12 n ⎝ n ⎠ 12
Όπως ήταν αναμενόμενο, δείχθηκε ότι το συνολικό σφάλμα της μεθόδου του τραπεζίου
είναι τάξης 2, ενώ το τοπικό είναι τάξης 3. Η τελευταία σχέση μπορεί να
χρησιμοποιηθεί για να βρεθεί το μέγιστο, θεωρητικό, h για ομοιόμορφο διαμερισμό
το οποίο πρέπει να χρησιμοποιηθεί για να βρεθεί το ζητούμενο ολοκλήρωμα με
12Σ
μέγιστο σφάλμα Σ . Έτσι προκύπτει hmax = και βέβαια επειδή η σταθερά
M (b − a )
12Σ
M ίσως να μην μπορεί να εκτιμηθεί παίρνουμε hmax ≈ .
b−a
λιγότερο σημαντικούς όρους) που σημαίνει ότι το σφάλμα του σύνθετου κανόνα του
τραπεζίου είναι περίπου δύο φορές μεγαλύτερο από το σφάλμα του σύνθετου κανόνα
του ορθογωνίου. Στην περίπτωση που hi << 1, F << E και επομένως από τις δύο αυτές
1
E≈ (T ( f ) − R( f ) ) . Επομένως αν υπολογίσουμε το ζητούμενο ολοκλήρωμα με τις
3
μεθόδους ορθογωνίου και τραπεζίου, μπορούμε να εκτιμήσουμε και την ποσότητα E .
131
6.4. Μέθοδος Simpson
Από τις προηγούμενες δύο μεθόδους μπορούμε να κατασκευάσουμε μία άλλη μέθοδο
υψηλότερης τάξης ακρίβειας. Έχουμε:
ε R ( f ) ≡ I ( f ) − R( f ) ≈ E + F ⇒ 2 I ( f ) − 2 R( f ) ≈ 2 E + 2 F ⎪⎫ +
⎬ ⇒ 3I ( f ) − 2 R ( f ) − T ( f ) ≈ −2 F
ε T ( f ) ≡ I ( f ) − T ( f ) ≈ −2 E − 4 F ⎪⎭
1 2
και επομένως από την τελευταία σχέση προκύπτει I( f ) ≈ ( 2 R( f ) + T ( f ) ) − F
3 3
δηλαδή προκύπτει ένας νέος σύνθετος κανόνας ολοκλήρωσης, ο οποίος ονομάζεται
1
κανόνας του Simpson, S( f ) = ( 2 R( f ) + T ( f ) ) , με σφάλμα προσεγγιστικά ίσο με
3
2
− F . Αντικαθιστώντας τους κανόνες του ορθογωνίου και τραπεζίου παίρνουμε την
3
εξής σχέση:
1 n ⎛ ⎛ xi + xi +1 ⎞ ⎞
S( f )= ∑ hi ⎜ f ( xi ) + 4 f
6 i =1 ⎝
⎜
⎝ 2 ⎠
⎟ + f ( xi +1 ) ⎟
⎠
Για το σφάλμα θα έχουμε
2 1 n 1 1
( f (4) ( yi ) hi5 ) ⇒ ε S ( f ) ≈ ∑ ( f ( y ) h ) ≤ 2280 ∑
n n
εS ( f ) ≈ − ∑
3 1920 i =1 2280 i =1
(4)
i i
5
i =1
f (4) ( yi ) hi5 ⇒
n
M
εS ( f ) ≤ ∑ hi5 , M ≡ xmax
2280 i =1 ∈[ a ,b ]
f (4) ( x ) .
h⎛ n ,2 n −1,2
⎞
S ( f ) = ⎜ f ( x0 ) + 2∑ f ( xi ) + 4 ∑ f ( xi ) + f ( xn ) ⎟ , n αρτιος
3⎝ i =2 i =1 ⎠
(έτσι αποφεύγουμε να ορίζουμε τα μέσα των υποδιαστημάτων) ενώ για το ολικό σφάλμα
M (b − a ) 4
της μεθόδου μπορεί να αποδειχτεί ότι ε ( f )≤
S
h . Επομένως ο κανόνας του
180
Simpson είναι 5ης τάξης ακρίβειας τοπικά και 4ης τάξης ακρίβειας συνολικά. Όπως και
στις δύο προηγούμενες μεθόδους, αν επιδιώκουμε το μέγιστο σφάλμα στον υπολογισμό
του ολοκληρώματος να είναι Σ τότε από την τελευταία σχέση παίρνουμε
14
⎛ 180Σ ⎞
hmax = ⎜⎜ ⎟⎟ . Αν η σταθερά M δεν μπορεί να υπολογισθεί ή να εκτιμηθεί
⎝ M (b − a ) ⎠
132
14
⎛ 180Σ ⎞
θεωρούμε hmax ≈⎜ ⎟ , υπολογίζουμε το ζητούμενο ολοκλήρωμα και
⎝ b−a ⎠
επαναλαμβάνουμε την διαδικασία με 2hmax και hmax 2 και ελέγχουμε κατά πόσο τα
Στο σημείο αυτό να σημειωθεί πως, συνήθως, αν μία μέθοδος ολοκλήρωσης έχει
τοπική τάξη ακρίβειας p + 1 τότε η ολική τάξη ακρίβειάς της σε όλο το διάστημα
M
ενδιαφέροντος είναι p . Τέλος, οι εκτιμήσεις της μορφής εR ≤ ( b − a ) h2 ,
24
M M
εT ≤ ( b − a ) h 2 , ε S ≤ ( b − a ) h4 δεν είναι χρήσιμες μόνο διότι μας δίνουν το
12 180
μέγιστο σφάλμα της μεθόδου αλλά και γιατί μας προσδιορίζουν τον ρυθμό σύγκλισης
της μεθόδου. Πράγματι, βλέπουμε ότι σε όλες τις περιπτώσεις που μελετήθηκαν το
μέγιστο συνολικό σφάλμα είναι της μορφής ε max,h = ch p όπου p είναι η ολική τάξη της
μεθόδου και c είναι μία σταθερά που εξαρτάται από τα a, b, M αλλά όχι από το h . Αν
τώρα υποδιπλασιάσουμε το μήκος των υποδιαστημάτων, δηλαδή θεωρήσουμε
ε max,h / 2 c ( h 2 )
p
είναι δεύτερης τάξης, p = 2 , θα έχουμε λόγο σφαλμάτων 2−2 = 1 4 που σημαίνει ότι ο
∫
Παράδειγμα 1ο: Υπολογίστε αριθμητικά το ολοκλήρωμα I = e −0.4 x dx με τους σύνθετους
0
κανόνες του ορθογωνίου, τραπεζίου και Simpson. Για τους υπολογισμούς θεωρείστε
μόνο δύο υποδιαστήματα, δηλαδή n = 2 . Βρείτε πόσο είναι προσεγγιστικά το σφάλμα
για τους κανόνες ορθογωνίου και τραπεζίου.
133
b − a 1− 0
Λύση: Εφόσον n = 2 άρα h = = = 0.5 . Έχουμε:
n 2
(α) κανόνας ορθογωνίου:
2
⎛x +x ⎞ 1 ⎧ ⎛ x2 + x1 ⎞ ⎛ x + x ⎞⎫ 1
R = h∑ f ⎜ i +1 i ⎟= ⎨f ⎜ ⎟+ f ⎜ 3 2 ⎟ ⎬ = { f ( 0.25 ) + f ( 0.75 )}
i =1 ⎝ 2 ⎠ 2⎩ ⎝ 2 ⎠ ⎝ 2 ⎠⎭ 2
όπου f ( 0.25 ) = e −0.4×0.25 ≈ 0.904837 και f ( 0.75 ) = e −0.4×0.75 ≈ 0.740818 οπότε προκύπτει
R = 0.822828
(β) κανόνας τραπεζίου:
h⎛ n
⎞ 12
T = ⎜ f ( x1 ) + 2∑ f ( xi ) + f ( xn +1 ) ⎟ =
2⎝
( f ( x1 ) + 2 f ( x2 ) + f ( x3 ) )
i=2 ⎠ 2
όπου f ( x1 ) = e −0.4 x 0.0 = 1 , f ( x2 ) = e −0.4 x 0.5 = 0.813731 και f ( x3 ) = e −0.4 x1.0 = 0.67032 οπότε
T = 0.826945
(γ) κανόνας Simpson:
1
S= ( 2 R + T ) = 0.8242
3
Για την εκτίμηση του σφάλματος έχουμε:
1 1
E≈ (T − R ) = ( 0.826945 − 0.822828) = 0.00137252
3 3
Επομένως ε R ≈ E = 0.00137252 και ε T ≈ −2 E = −0.00274504
Έλεγχος:
1
1 −0.4 x x =1
Η ακριβής τιμή του ολοκληρώματος είναι I = e −0.4 x dx = − ∫
0
0.4
e
x =0
= 0.8242
Παράδειγμα 2ο: Υπολογίστε εκ’ των προτέρων το ελάχιστο πλήθος των υποδιαστημάτων,
R
nmin , nmin
T
και nmin
S
, που απαιτείται για να επιτευχθεί ακρίβεια 5 δεκαδικών ψηφίων με
134
24Σ
( b − a ) ( h R ) < Σ ⇒ hmax
M 2
εR ≤ R
= , M ≡ max f ′′( x) (*)
24 (b − a ) M x∈[0,1]
12Σ
( b − a ) ( hT ) < Σ ⇒ hmax
M 2
εT ≤ T
= , M ≡ max f ′′( x) (**)
12 (b − a ) M x∈[0,1]
Mˆ 180Σ
( b − a ) ( h S ) < Σ ⇒ hmax
4
εS ≤ S
= 4 , Mˆ ≡ max f (4) ( x) (***)
180 (b − a ) M
ˆ x∈[0,1]
f ( x ) = e − x ⇒ f ′ ( x ) = −2 xe− x ⇒ f ′′ ( x ) = 2 ( 2 x 2 − 1) e− x
2 2 2
Επιπλέον έχουμε οπότε
βρίσκουμε ότι M = max f ′′( x) = 2 . Αντικαθιστώντας στην (*) και (**) προκύπτει
x∈[0,1]
b−a b−a
R
hmax = R
≈ 0.007746 ⇒ nmin
R
≈ 130 και hmax
T
= T ≈ 0.005477 ⇒ nmin
T
≈ 183 , αντίστοιχα.
nmin nmin
b−a
(***) βρίσκουμε hmax
S
= S
≈ 0.09306 ⇒ nmin
S
≈ 11 .
nmin
Συγκεντρωτικά απαιτούνται 183, 130 και 11 υποδιαστήματα τουλάχιστον για να
επιτευχθεί ακρίβεια πέντε δεκαδικών ψηφίων με τους σύνθετους κανόνες τραπεζίου,
ορθογωνίου και Simpson, αντίστοιχα.
f(x)
f(x)
x x
xi yi xi+1 xi xi+1
Σχήμα 1ο Σχήμα 2ο
135
Bιβλιογραφία
(1) Εισαγωγή στην Αριθμητική Ανάλυση, Γ.Δ. Ακρίβης & Β.Α. Δουγαλής,
Πανεπιστημιακές Εκδόσεις Κρήτης, 5η αναθεωρημένη έκδοση, 2006.
(4) Νumerical methods for scientists and engineers, R.W.Hamming, 2nd ed.,
Dover, 1962.
(5) Theory and applications of numerical analysis, G.M. Plilips & PJ Taylor,
2nd ed., 1996.
(7) A first course in numerical analysis, A. Ralston & P. Rabinowitz, 2nd ed.,
Dover, 1965.
136
Παράρτημα Π.1
Στοιχεία Γραμμικής Άλγεβρας
Πίνακες, διανύσματα
Ένας m × n πίνακας A , με συνολικό πλήθος στοιχείων m × n , πραγματικούς (ή
Το στοιχείο aij βρίσκεται στην i -γραμμή και j -στήλη του πίνακα A ο οποίος είναι
διαγώνια στοιχεία.. (Πολλές φορές, για ευκολία, θα χρησιμοποιούμε κόμμα μεταξύ των
δεικτών στα στοιχεία του πίνακα, για παράδειγμα ai ,i ή ai , j )
Διάνυσμα στήλη καλείται ο πίνακας που έχει μόνο μία στήλη. Για παράδειγμα,
⎡ x1 ⎤
⎢x ⎥
x=⎢ 2⎥
⎢ ⎥
⎢ ⎥
⎣⎢ xm ⎦⎥
είναι τάξεως m × 1 και καλείται διάνυσμα στήλη, διάστασης m . Συμβολίζουμε με m
Δύο πίνακες καλούνται ίσοι εάν έχουν την ίδια τάξη και τα αντίστοιχα στοιχεία τους
είναι ίσα, δηλαδή
A = B αν aij = bij ∀ i, j
137
Δύο πίνακες της ίδιας διάστασης προστίθενται ή αφαιρούνται εάν προστεθούν ή
αφαιρεθούν τα αντίστοιχα στοιχεία τους, δηλαδή
C = A ± B αν cij = aij ± bij ∀ i, j
Επίσης, ισχύει η αντιμεταθετική καθώς και η προσεταιριστική ιδιότητα της
πρόσθεσης και στους πίνακες, δηλαδή
A+ B = B + A
A + ( B + C ) = ( A + B) + C
− A = ( −1) A
A + ( − A) = 0
0A = 0
Το αποτέλεσμα της παραπάνω πράξης είναι ένας αριθμός και ορίζεται ως το εσωτερικό
γινόμενο των y και x .
138
⎡ x1 ⎤
zi = ∑ aij x j = ⎡⎣i − γραμμη του A⎤⎦ ⋅ ⎢⎢ ⎥⎥
n
j =1
⎣⎢ xn ⎦⎥
Εάν ο A είναι ένας m × n πίνακας και ο B ένας n × p , τότε ορίζεται το γινόμενο
⎡ j− ⎤
n
⎢ ⎥
cij = ∑ a ik bkj = ⎡⎣i − γραμμη του A⎤⎦ ⋅ ⎢στηλη⎥
k =1
⎢ του B ⎥
⎣ ⎦
Να σημειωθεί ότι ο αριθμός των στοιχείων σε μια γραμμή του πίνακα A θα πρέπει να
είναι ίδιος με τον αριθμό των στοιχείων σε μια στήλη του B (αριθμός στηλών A =
A⋅ B ≠ B ⋅ A
Για αυτό το λόγο η τάξη μεταξύ δύο πινάκων που πολλαπλασιάζονται είναι σημαντική.
A⋅ (B ⋅C ) = ( A⋅ B) ⋅C
Επιπρόσθετα, ισχύει και η επιμεριστική ιδιότητα υπό τις κατάλληλες συνθήκες. Έτσι,
A⋅ (B + C) = A⋅ B + A⋅C
και
( A + B) ⋅C = A⋅C + B ⋅C
Ορίζεται ο n × n μοναδιαίος πίνακας I ως
⎡1 0 0⎤
⎢0 1 0 ⎥⎥
I =⎢
⎢ ⎥
⎢ ⎥
⎣0 0 1⎦
139
A⋅ I = A
I⋅A= A
Κάτω από τις κατάλληλες συνθήκες ένας τετραγωνικός πίνακας A έχει και τον
−1
αντίστροφό του ο οποίος συμβολίζεται ως A και ο ικανοποιεί τις συνθήκες
−1 −1
A⋅ A = I και A ⋅A= I
−1
Εάν ένα τέτοιος αντίστροφος A υπάρχει, τότε ο πίνακας A είναι μη μηδενικός. Το
συνθήκη
( A⋅ B)
−1 −1 −1
=B ⋅A
⎡ A11 A12 ⎤
A=⎢ ⎥
⎣⎢ A21 A22 ⎦⎥
όπου ο A11 είναι ένας r × p πίνακας, ο A12 είναι r × ( n − p ) , ο A21 είναι ( m − r ) × p και
έτσι για παράδειγμα , οι πίνακες A11 και A21 έχουν τον ίδιο αριθμό στηλών. Οι
⎡ B11 B12 ⎤
B=⎢ ⎥
⎢⎣ B 21 B 22 ⎥⎦
Δεν είναι τόσο προφανές, ωστόσο, εάν ο πίνακας B και οι υποπίνακές του είναι
140
⎡ ( A11 ⋅ B11 + A12 ⋅ B 21 ) (A 11
⋅ B12 + A12 ⋅ B 22 ) ⎤
A⋅ B = ⎢ ⎥
⎢( A21 ⋅ B11 + A22 ⋅ B 21 ) (A ⋅ B + A ⋅ B ) ⎥
⎣ 21 12 22 22 ⎦
Για δύο πίνακες A και B των οποίων τα γινόμενα είναι ορισμένα, βρίσκεται ότι
( A⋅ B)
T
=B ⋅A
T T
Ένας n × n πίνακας A είναι συμμετρικός εάν A = A , έτσι ώστε aij = a ji για όλα τα i
T
και j .
Ορίζουσες
Ορισμός: Η ορίζουσα ενός n × n πίνακα A είναι ορισμένη αναδρομικά ως ακολούθως
i. Εάν A = ⎡⎣ a1,1 ⎤⎦ , ο οποίος είναι ένας 1×1 πίνακας, τότε η ορίζουσα του A
ή
n
det ( A) = ∑ ( −1) aij Aij ,
i+ j
∀i, 1≤ i ≤ n
j =1
141
O πολλαπλασιασμός ενός τετραγωνικού πίνακα n × n , A , με μία μη-μηδενική σταθερά
det ( L ) = ∏
n
ίση με το γινόμενο των διαγωνίων στοιχείων του, δηλαδή i ,i ή
i =1
i =1
( ) ∏d
n
το γινόμενο των στοιχείων του det D = i ,i .
i =1
x ≠ 0 τέτοια ώστε
A ⋅ x = λ x (*)
πίνακα A .
Η παραπάνω σχέση αποτελεί ένα ομογενές σύστημα «n» γραμμικών εξισώσεων με «n»
αγνώστους. Για να έχει μη-μηδενική λύση θα πρέπει η ορίζουσα του πίνακα που
πολλαπλασιάζει το άγνωστο διάνυσμα x να είναι μηδενική, δηλαδή:
det ( A − λ I ) = 0 (**)
είτε
142
⎡ a11 − λ a12 ... a1n ⎤
⎢a a22 − λ ... a2 n ⎥
⎢ 21 ⎥
⎢. ⎥
det ⎢ ⎥=0
⎢. ⎥
⎢. ⎥
⎢ ⎥
⎣⎢ an1 an 2 ... ann − λ ⎦⎥
Όπως είναι προφανές η παραπάνω εξίσωση είναι μία πολυωνυμική εξίσωση «n» βαθμού
και επομένως έχει «n» ρίζες, λi , i = 1, 2,3,..., n , οι οποίες είναι οι ιδιοτιμές του πίνακα.
Επειδή οι ρίζες ενός πολυωνύμου είναι μοναδικά καθορισμένες έτσι και οι ιδιοτιμές
του πίνακα είναι μοναδικές. Το πολυώνυμο που προκύπτει ονομάζεται χαρακτηριστικό
πολυώνυμο ενώ η εξίσωση (**) ονομάζεται χαρακτηριστική εξίσωση του πίνακα. Το
σύνολο όλων των ιδιοτιμών ενός πίνακα ονομάζεται φάσμα του πίνακα A και
συμβολίζεται ως:
σ ( A) = {λ ∈ || det ( A − λ I ) = 0}
Η μέγιστη κατά απόλυτη τιμή ιδιοτιμή του A ονομάζεται φασματική ακτίνα του
ρ ( A) = max { λi || λi ∈ σ ( A)}
1≤i ≤ n
Η φασματική ακτίνα ενός πίνακα παίζει σημαντικό ρόλο στην σύγκλιση των
αριθμητικών μεθόδων επίλυσης συστημάτων γραμμικών εξισώσεων.
Αντίθετα με τις ιδιοτιμές, τα ιδιοδιανύσματα δεν είναι μοναδικά καθορισμένα όπως
φαίνεται από την εξίσωση (*). Πράγματι, αν η (*) πολλαπλασιαστεί με μία μη-μηδενική
σταθερά μ , μ ≠ 0 , τότε προκύπτει
A⋅ (μ x) = λ (μ x)
Η σχέση αυτή δείχνει ότι η σταθερά λ είναι ιδιοτιμή του πίνακα A και το διάνυσμα
143
πίνακα και x i , i = 1, 2, 3,..., n είναι τα αντίστοιχα ορθοκανονικοποιημένα ιδιοδιανύσματα
τότε ισχύει:
⎧1 αν i = j
x i ⋅ x j = δ ij = ⎨
T
⎩0 αν i ≠ j
Σημειώνουμε, χωρίς απόδειξη, ότι κάθε πραγματικός και συμμετρικός πίνακας έχει
πραγματικές ιδιοτιμές.
n ,n
A = A . Από τον ορισμό των
T
Απόδειξη: Έστω A∈ για τον οποίο ισχύει
ιδιοτιμών/ιδιοδιανυσμάτων έχουμε A ⋅ x = λ x ⇒ ( A ⋅ x ) = ( λ x ) ⇒ A ⋅ x = λ x
T T T
∀x ∈ n
με x ≠ 0 τότε ο πίνακας A ονομάζεται θετικά ορισμένος.
144
n ,n
Πρόταση 3η: Τα διαγώνια στοιχεία ενός θετικά ορισμένου πίνακα A∈
( i )T (i )
έχουμε e ⋅ A⋅ e = aii > 0 .
του είναι αυστηρά θετικές. Πράγματι, εφόσον ο A είναι θετικά ορισμένος άρα ισχύει
{y }
n
(*) και λi > 0 λόγω της υπόθεσης, όπου i = 1, 2,..., n . Επομένως, αν i i =1
είναι το
σύνολο των ιδιοδιανυσμάτων του πίνακα, εξαιτίας του ότι είναι ορθοκανονικοποιημένα
n n n
( ) ∑c y = ∑c A⋅ y = ∑c λ y ⇒
(*)
A ⋅ x = A ⋅ c1 y1 + c2 y 2 + ... + cn y n = A ⋅ i i i i i i i
i =1 i =1 i =1
145
⎛ ⎞ ⎛ ⎞
∑∑(c c λ y ⋅ y ) .
n n n n
xT ⋅ A ⋅ x = ⎜
⎜
⎝
∑
i =1
ci y i ⎟ ⋅ ⎜
⎟ ⎜
⎠ ⎝
∑
j =1
c jλ j y j ⎟ =
⎟
⎠ i =1 j =1
i j j i j
∑∑(c c λ y ⋅ y ) =∑ c c λ = ∑ c λ > 0
n n n n
x ⋅ A⋅ x =
T
i j j i j i i i
2
i i αφού υπάρχει τουλάχιστον ένα
i =1 j =1 i =1 i =1
146
Παράρτημα Π.2
Νόρμες συναρτήσεων, διανυσμάτων, πινάκων
Νόρμες συναρτήσεων
Έστω οι συναρτήσεις f ∈ C [ a, b] , δηλαδή οι συνεχείς συναρτήσεις ορισμένες στο
(Ν2) λ f = λ f ∀f ∈ C [ a, b] και ∀λ ∈
(Ν3) f + g ≤ f + g ∀f , g ∈ C [ a, b]
Chebyshev.
Οι πιο συχνά χρησιμοποιούμενες νόρμες είναι οι:
b
f 1
:=
∫ f ( x) dx
a
:=
∫f
2
f 2
( x )dx (γνωστή ως Ευκλίδεια νόρμα)
a
f ∞
:= max f ( x )
a ≤ x ≤b
Νόρμες διανυσμάτων
Οι νόρμες διανυσμάτων είναι απεικονίσεις οι οποίες ορίζονται από έναν Κ-γραμμικό
χώρο (όπου K = ή ) στους θετικούς πραγματικούς αριθμούς. Για τις ανάγκες της
147
(Ν1) x > 0 ∀ x ∈ n
εκτός εάν x = 0 ⇔ x = 0
(Ν2) λ x = λ x ∀ x ∈ n
και ∀λ ∈
(Ν3) x + y ≤ x + y ∀ x, y ∈ n
Η (Ν3) όπως και προηγουμένως ονομάζεται τριγωνική ανισότητα. Επιπλέον της (Ν3)
μπορεί να αποδειχτεί και η λεγόμενη τριγωνική ανισότητα προς τα κάτω. Έχουμε:
x = (x − y) + y ≤ x − y + y ⇒ x − y ≥ x − y ⇒ x − y ≤ − x − y
y = ( y − x) + x ≤ x− y + x ⇒ x− y ≥ y − x ⇒ x − y ≥− x− y
x − y ≤− x− y
???
x − y ≤ x− y ⇒ x− y ≥ x − y
x p := ⎜ , 1≤ p < ∞
p
⎜ i ⎟⎟
⎝ i =1 ⎠
Επίσης lim x p
= x ∞
= max xi γνωστή και ως μέγιστη, άπειρη ή νόρμα Chebyshev.
p →∞ 1≤ i ≤ n
∑x
n
1 ≡ x 1 := i
i =1
∑x
n
2 ≡ x 2 := 2
i (γνωστή ως Ευκλίδεια νόρμα)
i =1
∞ ≡ x ∞
:= max ( xi )
1≤ i ≤ n
ώστε m x ≤ x ′ ≤ M x , ∀ x ∈ n
M m
148
(β) Έστω η ακολουθία διανυσμάτων {x } (i ) ∞
i =1
⊂ n
(που συνήθως προκύπτει από τις
(i ) * *
lim x − x = 0 . Το διάνυσμα x ονομάζεται όριο της ακολουθίας ως προς την νόρμα
i →∞
είναι ισοδύναμες μεταξύ τους. Το γεγονός αυτό έχει επίπτωση στην σύγκλιση
ακολουθίας διανυσμάτων {x } (i ) ∞
i =1
. Έτσι αν μία ακολουθία διανυσμάτων συγκλίνει ως
γεγονότος ότι όλες οι νόρμες είναι ισοδύναμες μεταξύ τους άρα υπάρχουν θετικές
(i ) * (i ) * ′ (i ) *
σταθερές m και M τέτοιες ώστε m x −x ≤ x −x ≤ M x − x . Παίρνοντας όρια
έχουμε
(i ) * (i ) * ′ (i ) * (i ) * ′ (i ) * ′
m lim x − x ≤ lim x − x ≤ M lim x − x ⇒ 0 ≤ lim x − x ≤ 0 ⇒ lim x − x =0
i →∞ i →∞ i →∞ i →∞ i →∞
και επομένως η ακολουθία συγκλίνει και ως προς οποιαδήποτε άλλη νόρμα του n
.
Νόρμες πινάκων
υπόκεινται σε 4 αξιώματα:
(Ν1) A > 0 ∀ A ∈ n,n
εκτός εάν A = 0 ⇔ A = 0
(Ν2) λ A = λ A ∀ A ∈ n ,n
και ∀λ ∈
(Ν3) A + B ≤ A + B ∀ A, B ∈ n ,n
(Ν4) A ⋅ B ≤ A B ∀ A, B ∈
n ,n
Η (Ν3) είναι γνωστή και ως τριγωνική ανισότητα για την πρόσθεση ενώ η (Ν4) ως
τριγωνική ανισότητα για τον πολλαπλασιασμό.
149
Φυσικές νόρμες πινάκων (ή νόρμες τελεστών)
Πρόκειται για ένα υποσύνολο των νορμών πινάκων το οποίο έχει μία επιπλέον ιδιότητα.
Για τον ορισμό των φυσικών νορμών είναι απαραίτητο αρχικά να ορίσουμε μία
A⋅ x
A := sup = sup A ⋅ x
x∈ n x x =1
x≠0
A⋅ x
Αρχικά θα πρέπει να δείξουμε ότι η ποσότητα , 0 ≠ x∈ n
είναι καλά ορισμένη.
x
Πράγματι από τον ορισμό των ισοδύναμων νορμών έχουμε ότι υπάρχουν θετικές
σταθερές m και M τέτοιες ώστε m x ∞
≤ x ≤ M x ∞ , ∀x ∈ n
επομένως θα έχουμε και
ότι m A⋅ x ∞
≤ A ⋅ x ≤ M A ⋅ x ∞ , ∀x ∈ n
και A∈ n ,n
. Άρα
⎛ ⎞
∑ ∑
n n
∑
n
max aij x j max aij x j max ⎜ x ∞ aij ⎟
M A⋅ x 1≤ i ≤ n ⎜ ⎟
A⋅ x M
1≤ i ≤ n
j =1 M 1≤i ≤ n j =1 M ⎝ j =1 ⎠⇒
≤ ∞
= ≤ ≤
x m x ∞
m x∞ m x∞ m x∞
A⋅ x ⎛ ⎞
∑
n
M
≤ max ⎜ aij ⎟ := C < ∞
x m 1≤i ≤ n ⎜⎝ j =1
⎟
⎠
Στην συνέχεια πρέπει να δείξουμε ότι μία φυσική νόρμα πινάκων ικανοποιεί τις
ιδιότητες (Ν1)-(Ν4) των νορμών πινάκων. Έχουμε ότι:
A⋅ x
(Ν1): Γιά κάθε τετραγωνικό πίνακα A∈ n ,n
, A = 0 ⇔ sup = 0 ⇔ sup A ⋅ x = 0 Η
x∈ n x x∈ n
x≠0 x≠0
δηλαδή A = 0
150
n ,n n ,n
(Ν2): Γιά κάθε τετραγωνικό πίνακα A∈ και κάθε πραγματικό αριθμό A∈
λ A⋅ x λ A⋅ x A⋅ x
οπότε έχουμε λ A = sup = sup = λ sup = λ A ⇒ λA = λ A
x∈ n x x∈ n x x∈ n x
x≠0 x≠0 x≠0
( A + B) ⋅ x A⋅ x + B⋅ x A⋅ x B⋅ x
A + B = sup ≤ sup = sup + sup = A + B οπότε
x∈ n x x∈ n x x∈ n x x∈ n x
x≠0 x≠0 x≠0 x≠0
έχουμε A + B ≤ A + B
A⋅( B ⋅ x) A B⋅ x B⋅ x
A ⋅ B = sup ≤ sup = A sup = A B οπότε έχουμε
x∈ n x x∈ n x x∈ n x
x≠0 x≠0 x≠0
A⋅ B ≤ A B
Τέλος, να σημειωθεί ότι λόγω του ορισμού θα ισχύει ότι A ⋅ x ≤ A x (για να γίνει
κατανοητό αυτό, αρκεί να θεωρήσουμε την απλή περίπτωση, του supremum μίας
(Ν2) λ A = λ A , ∀ A ∈ n ,n
και ∀λ ∈
(Ν3) A + B ≤ A + B , ∀ A, B ∈ n ,n
(Ν4) A ⋅ B ≤ A B , ∀ A, B ∈ n ,n
(Ν5) A ⋅ x ≤ A x , ∀ A ∈ και ∀ x ∈
n ,n n ,n
Να σημειωθεί ότι για κάθε φυσική νόρμα πινάκων ισχύει I = 1 αφού από τον ορισμό
151
Οι πιο γνωστές και συχνά χρησιμοποιούμενες νόρμες πινάκων είναι
(α) Η 1η νόρμα, γνωστή και ως το μέγιστο του αθροίσματος των στηλών,
⎧⎪ ⎫⎪
∑
n
A 1 = max ⎨ aij ⎬
1≤ j ≤ n
⎪⎩ i =1 ⎪⎭
(β) Η μέγιστη νόρμα ή νόρμα απείρου, γνωστή και ως το μέγιστο του αθροίσματος των
γραμμών,
⎧⎪ n
⎫⎪
A ∞ = max ⎨
1≤i ≤ n
⎪⎩
∑j =1
aij ⎬
⎪⎭
n,n
Στην συνέχεια δείχνουμε την παρακάτω πρόταση. Για κάθε πίνακα A∈ ισχύει:
(α) A 2 = (
ρ AT ⋅ A )
( )
(β) ρ A ≤ A
Απόδειξη:
(α) Ακόμα και όταν ο πίνακας A δεν είναι συμμετρικός, ο A ⋅ A είναι. Επομένως θα
T
∑c y .
n
μπορεί να γραφεί ως x= i i
Τότε έχουμε ότι:
i =1
⎛ ⎞ ⎛ ⎞
∑ ∑ ∑c
n n n
2
x 2 = x ⋅x =⎜ ci y i ⎟ ⋅ ⎜ ci y i ⎟ = 2
. Επιπλέον για το διάνυσμα A ⋅ x έχουμε ότι:
T T
⎜ ⎟ ⎜ ⎟ i
⎝ i =1 ⎠ ⎝ i =1 ⎠ i =1
⎛ ⎞ ⎛ ⎞
) ∑ ∑ ∑λ c
n n n
A⋅ x 2 = ( A⋅ x) ⋅( A⋅ x) = x ⋅ A ⋅ A⋅ x = ⎜ (
2 T T T
ci y i ⎟ ⋅ ⎜
T
λi ci y i ⎟ = 2
⎜ ⎟ ⎜ ⎟ i i
⎝ i =1 ⎠ ⎝ i =1 ⎠ i =1
∑λ c ∑c
n n
2
2
max ( λi ) 2
2
A⋅ x i i i
A⋅ x
( ) ( )
1≤i ≤ n
= i =1
≤ i =1
= max ( λi ) = ρ A ⋅ A ⇒ ≤ ρ A ⋅ A (*)
2 T 2 T
Άρα 2 2
∑ ∑
n n 1≤i ≤ n
x x
2 ci2 ci2 2
i =1 i =1
152
( ) ( ) ( )
2 2
A ⋅ yk = y k ⋅ A ⋅ A ⋅ y k = y k ⋅ λk y k = λk y k ⋅ y k = ρ A ⋅ A y k
T T T T T
και επομένως
2 2
2
A ⋅ yk
2
2
=ρ A ⋅A ( T
) (**) το οποίο ουσιαστικά σημαίνει ότι υπάρχει μη-μηδενικό
yk
2
διάνυσμα του n
για το οποίο η ισότητα ισχύει στην (*). Όμως από τον ορισμό της
φυσικής νόρμας έχουμε:
2
A⋅ x
( ) ( )
2 (*),(**)
A 2 = sup = ρ A ⋅A ⇒ A 2 = ρ A ⋅A
2 T T
2
x∈ n x 2
x≠0
Για προφανείς λόγους, η φυσική αυτή νόρμα ονομάζεται και φασματική νόρμα.
(β) Έστω λi , xi η ιδιοτιμή και το αντίστοιχο ιδιοδιάνυσμα του πίνακα A . Τότε από τον
A ⋅ xi = λi xi ⇒ λi xi = A ⋅ xi ⇒ λi xi = A ⋅ xi ≤ A xi ⇒ λi ≤ A το οποίο βέβαια θα
2
A ⋅A= A
T
ιδιοτιμή του και x το αντίστοιχο ιδιοδιάνυσμα. Άρα
( ) ( )
ρ AT ⋅ A = ρ A2 = λ 2 = ⎡⎣ ρ ( A) ⎤⎦ . Όμως A 2 = ρ AT ⋅ A = ⎡⎣ ρ ( A) ⎤⎦ = ρ ( A) ( )
2 2
n n
Eυκλίδεια νόρμα, A E : A E
= A F
= ∑∑ a j =1 i =1
2
ij
Η νόρμα αυτή δεν αποτελεί φυσική νόρμα πινάκων. Αυτό φαίνεται εύκολα απλά αν
θεωρήσουμε τον μοναδιαίο πίνακα I για τον οποίο γνωρίζουμε (δες παράδειγμα παραπάνω)
ότι για κάθε φυσική νόρμα πινάκων ισχύει I = 1 . Από τον ορισμό της Frobenius νόρμας
n n n
όμως προκύπτει I E
= I F
= ∑∑δ j =1 i =1
2
ij = ∑δ i =1
2
ii = n το οποίο φυσικά αποδεικνύει ότι
153