Chapter 1 - Linear Algebra

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 39

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HỒ CHÍ MINH

TOÁN CHUYÊN ĐỀ TRÍ TUỆ NHÂN TẠO


TS. Trần Minh Chính
GIỚI THIỆU MÔN HỌC

❑ Tên học phần: TOÁN CHUYÊN ĐỀ AI

(Dành cho sinh viên năm 2 – Đại học IOT)


❑ Mã học phần: 2102700

❑ Số tín chỉ: 3 (2,1,6)

❑ Kiểm tra – đánh giá:


❖ Thường kỳ: Bài tập ở nhà(E-Learning) – Kiểm
tra ở lớp
❖ Giữa kỳ: Tự luận
❖ Cuối kỳ: Tự luận
2
GIÁO TRÌNH VÀ TÀI LIỆU THAM KHẢO

Giáo trình chính:


1. Bài giảng “Toán chuyên đề trí tuệ nhân tạo”
2. M. P. Deisenroth, A. A. Faisal, and C. S. Ong, Mathematics for
Machine Learning, Cambridge University Press, 2019.
Giáo trình tham khảo:
1. Mathematical Foundation For Machine Learning and AI, Créé
par Eduonix Learning Solution, Eduonix-Tech, 2019.
2. J. V. Stone, Artificial Intelligence Engines: A Tutorial
Introduction to the Mathematics of Deep Learning, Sebtel Press,
2019.
3. J. C. Fournier, Graph Theory and Applications: With Exercises
and Problems, Wiley, 2009

3
CHUẨN ĐẦU RA MÔN HỌC

CLOs Chuẩn đầu ra của học phần PI


1 Giải thích và chứng minh được lý thuyết toán nâng b1
cao áp dụng trong lĩnh vực AI/ML
2 Vận dụng được lý thuyết toán để giải bài toán ứng b1
dụng thực tiễn về AI/ML

Ma trận tích hợp giữa chuẩn đầu ra môn học và chuẩn đầu ra của chương trình
đào tạo:

CLOs a b c d e f g h i j k
1 x
2 x

4
NỘI DUNG MÔN HỌC

Chương 1. Đại số tuyến tính

Chương 2. Hình học giải tích

Chương 3. Giải tích vecto

Chương 4. Phân phối xác suất và ứng dụng

Chương 5. Bài toán tối ưu

Chương 6. Hồi quy tuyến tính

Chương 7. Lý thuyết đồ thị


5
KIỂM TRA ĐÁNH GIÁ

1 Thường kỳ

➢ Điểm danh: trên 75%


➢ Bài tập ở nhà (E-Learning)
➢ Bài kiểm tra.

2 Giữa kỳ
➢ Tự luận (60 phút)

3 Cuối kỳ

➢ Tự luận (90 phút)


6
Chương 1:

ĐẠI SỐ TUYẾN TÍNH


NỘI DUNG CHƯƠNG 1

1.1 Không gian vecto

1.2 Ma trận

1.3 Tập cơ sở và hạng của ma trận

1.4 Chuẩn vecto và ma trận

1.5 Không gian Affine

8
1.1 KHÔNG GIAN VECTO

9
1.1. KHÔNG GIAN VECTO

1.1.1 Đại số tuyến tính:


➢ Đại số là việc nghiên cứu về ký hiệu toán học và các quy
tắc cho các thao tác các ký hiệu trên. Đại số tuyến tính là
nghiên cứu về vectơ và các quy tắc đại số nhất định để
thao tác với vectơ.
➢ Vecto là một đại lượng có thể cộng với nhau hoặc nhân vô
hướng để tạo ra 1 đại lượng khác cùng loại.

➢ Vecto hình học


➢ Đa thức cũng là 1 vecto
➢ Các tín hiệu âm thanh
➢ Các thành phần của Rn

10
1.1. KHÔNG GIAN VECTO

➢ Đại số tuyến tính đóng vai trò quan trọng trong học máy và
toán đại cương.
➢ Hệ phương trình tuyến tính là 1 phần của đại số tuyến tính.
Nhiều vấn đề có thể được xây dựng dưới dạng hệ phương
trình tuyến tính, đại số tuyến tính cung cấp các phương
pháp giải các hệ PTTT này.
a11 x1 + a12 x2 + ... +a1n xn = b1
a21 x1 + a22 x2 + ... +a2 n xn = b2
(1)
. . .
am1 x1 + am 2 x2 + ... +amn xn = bm

Dạng chung của hệ PTTT. x1 , x2 ,..., xn biến của hệ


Mọi n-giá trị ( x1 , x2 ,..., xn )  n
thỏa mãn (1) được gọi là nghiệm
của hệ PTTT. 11
1.1. KHÔNG GIAN VECTO

➢ Hệ PTTT (1) có thể viết dưới dạng ma trận.

 a11 a12 ... a1n   x1  b1 


a a22 ... a2 n   x2  b2 
 21 =
. . .  .  . 
    
 am1 am 2 ... amn   xm  bm 

A x b
Có nghiệm duy nhất
b=0 Hệ PTTT thuần nhất
Có vô số nghiệm

12
1.1. KHÔNG GIAN VECTO

1.1.2. Không gian vecto:


➢ Tập hơp V  0 gọi là không gian vecto, nếu trong V thỏa
mãn 2 phép toán:
1. Phép cộng x, y V  x + y V
2. Phép nhân với số thực k: x V  kx V (k  )
Tính chất:

1. x+ y = y+ x 5. k (x + y) = kx + ky

2. (x + y)+ z = x + (y + z) 6. ( h + k ) x = hx + kx

3.  phan tu 0: x + 0 = 0 + x = x 7. h(kx) = ( hk ) x

4.  phan tu - x: x + (-x) = 0 8. 1 x = x
13
1.2 MA TRẬN

14
1.2. MA TRẬN

1.2.1 Ma trận:
➢ Với m, n  , ta có định nghĩa ma trận A là một tập hợp gồm
có mxn phần tử được sắp xếp theo 1 hệ thống hình chữ
nhật gồm có m hàng và n cột.
 a11 a12 ... a1n 
a a22 ... a2 n 
A =  21 ; aij 
. . . 
 
 am1 am 2 ... amn 

mn
➢ Ký hiệu: A 

➢ Vecto hàng: là ma trận 1xn


➢ Vecto cột: là ma trận mx1 15
1.2. MA TRẬN

1.2.2 Các phép toán trên ma trận:


mn
Cho ma trận A
1. Chuyển vị của ma trận: B = AT  bij = a ji

 a11 a12 ... a1n   a11 a21 ... am1 


a a22 ... a2 n  a a22 ... am 2 
A =  21  AT =  12
. . .  . . . 
   
 am1 am 2 ... amn   a1n a2 n ... anm 

mn n m
➢ Nếu A   AT 

➢ Nếu A = AT thì A là ma trận đối xứng.

16
1.2. MA TRẬN

mn mn
➢ Cho ma trận A  ; B
2. Tổng đại số 2 ma trận:
 a11 +b11 a12 +b12 ... a1n +b1n 
 a +b a +b ... a +b 
C = A + B =  21 21 22 22 2n 2n ;
. . . 
 
 am1 +bm1 am 2 +bm 2 ... amn +bmn 
3. Nhân ma trận với thừa số   :
 a11  a12 ...  a1n 
 a  a ...  a 
 A =  21 22 2n 

. . . 
 

 m1a  a ...  amn 
17
m2
1.2. MA TRẬN

mn
➢ Cho ma trận A  ; B  n p
4. Phép nhân 2 ma trận: C = AB  m p
;
Trong đó phần tử ở hàng thứ i, cột thứ j của ma trận kết quả
được tính bởi: n
cij =  aik bkj ; 1  i  n; 1  j  p
k =1

Một vài tính chất của phép nhân 2 ma trận:


4.1 Phép nhân 2 ma trận không có tính chất giao hoán:
AB  BA
4.2 Phép nhân ma trận có tính chất kết hợp:
ABC = ( AB)C = A(BC)
18
1.2. MA TRẬN

4.3 Phép nhân ma trận có tính chất phân phối với phép cộng:
A(B + C) = AB + AC
4.4 Chuyển vị của một tích bằng tích các chuyển vị theo thứ tự
ngượi lại:
(AB) = B A
T T T

Ngoài ra 1 phép nhân khác được gọi là Hadamard (element-


wise) hay được sử dụng trong Machine Learning. Tích
Hadamard của 2 ma trận cùng kích thước A  mn ; B  mn
mn
C=A B
Trong đó:
cij = aij bij
19
1.2. MA TRẬN

1.2.4 Ma trận đơn vị và ma trận nghịch đảo


Đường chéo chính của 1 ma trận là tập hợp các phần tử có
chỉ số hang và cột giống nhau.
mn
➢ Nếu A  thì đường chéo chính của A bao gồm
a11 , a22 ,..., a pp  ; p = min(m, n)

Ma trận đơn vị bậc n là một ma trận đặc biệt trong nn trong đó các
phần tử trên đường chéo chính bằng 1, các phần tử còn lại bằng 0.
Ma trận đơn vị được ký hiệu là I hoặc E.
1 0 ... 0 
0 1 ... 0 
In =  
. . .
 
 0 0 ... 1  20
1.2. MA TRẬN

➢ Nếu A  mn
; B nm
thì AI = A; IB = B

➢ Với mọi vecto x  thì I n x = x


n

Ma trận nghịch đảo


nn
Cho một ma trận vuông A  nếu tồn tại ma trận vuông B  nn

sao cho AB = I n thì ta nói A là khả nghịch (invertible, nonsingular,


hoặc nondegenerate), và B được gọi là ma trận nghịch đảo của A.
Nếu A khả nghịch, ma trận nghịch đảo của nó được ký hiệu là A−1
A−1 A = AA−1 = I
Nếu A, B khả nghịch, thì tích của chúng cũng khả nghịch
(AB)−1 = B −1 A−1
21
1.2. MA TRẬN

1.2.5 Định thức


Định thức của 1 ma trận vuông A được ký hiệu là det(A) được tính
như sau:

 a11 a12 ... a1n 


a a22 ... a2 n  n
A =  21  det( A) =  (−1)i + j aij det( Aij )
. . .  j =1
 
 am1 am 2 ... amn 

Trong đó Aij là phần bù đại số của A ứng với phần tử ở hàng i, cột j.
Phần bù đại số này là ma trận con của A nhận được bằng cách xóa
hàng i và cột j tương ứng.

22
1.2. MA TRẬN

Một số tính chất của định thức


1. Định thức của ma trận chuyển vị bằng định thức của ma trận đó
det( A) = det( AT )
2. Định thức của ma trận đường chéo (và vuông) bằng tích các
phần tử trên đường chéo chính.
3. Định thức của ma trận đơn vị bằng 1.
4. Định thức của một tích bằng tích các định thức.

det( AB) = det( A) det( B)

Với A, B là 2 ma trận vuông cùng chiều.

23
1.2. MA TRẬN

Một số tính chất của định thức

5. Một ma trận có 1 hàng hoặc 1 cột bất kỳ bằng 0 thì định thức
của nó bằng 0.
6. Một ma trận là khả nghịch khi và chỉ khi định thức của nó khác 0.

7. Nếu một ma trận khả nghịch, định thức của ma trận nghịch đảo
của nó bằng nghịch đảo định thức của nó.
1
det( A−1 ) = vì det( A) det( A−1 ) = det( AA−1 ) = det( I ) = 1
det( A)
8. Định thức của ma trận tam giác (và vuông) bằng tích các phần
tử trên đường chéo chính.
24
1.2. MA TRẬN

1.2.6 Trị riêng và vecto riêng


Cho ma trận vuông A  nn , một vecto x  ( x  0 ) và một
n

số vô hướng  thỏa mãn: Ax =  x thì ta có:


 - trị riêng (eigenvalue) của ma trận A
x - vecto riêng (eigenvector) của ma trận A
Để tìm trị riêng ta giải phương trình: det( A -  I ) = 0
Đa thức đặc trưng của ma trận A (characteristic polynomial),
ký hiệu là pA(t)

Tập hợp tất cả các trị riêng của một ma trận vuông được gọi là
phổ (spectrum) của ma trận đó.

25
1.2. MA TRẬN

1.2.7 Vết của ma trận


Vết (trace) của 1 ma trận vuông A được ký hiệu là tr(A) được xác
định bằng tổng các phần tử trên đường chéo chính của A
 a11 a12 ... a1n 
a a22 ... a2 n  n
A =  21  tr ( A) =  aij
. . .  i =1
 
 am1 am 2 ... amn 

Vết của A bằng tổng các trị riêng của nó.


n
tr ( A) =  i
i =1

26
1.3 TẬP CƠ SỞ
VÀ HẠNG CỦA
MA TRẬN

27
1.3. TẬP CƠ SỞ VÀ HẠNG MA TRẬN

1.3.1 Độc lập tuyến tính, phụ thuộc thuyến tính:


Cho các vecto khác không a1 , a2 ,..., an  m và các số thực
x1 , x2 ,...,xn  Nếu một vecto b được biểu diễn dưới dạng:
b = x1a1 + x2 a2 + ... + xn an (1)
b được gọi là tổ hợp tuyến tính của a1 , a2 ,..., an
 a11 a12 ... a1n 
a a22 ... a2 n 
và x =  x1 , x2 ,...,xn  
T
➢ Nếu A =  a1 , a2 ,..., an  =  21 mn n

. . . 
 
 am1 am 2 ... amn 

Thì (1) có thể được viết lại là: b = Ax


Ta có thể nói b là 1 tổ hợp tuyến tính các cột của ma trận A.
28
1.3. TẬP CƠ SỞ VÀ HẠNG MA TRẬN

➢ Tập hợp tất cả các vecto b có thể biểu diễn dưới dạng một tổ hợp
tuyến tính của các cột của một ma trận được gọi là không gian
sinh (span space) các cột của ma trận đó. Ký hiệu: span(a1 , a2 ,..., an )

➢ Nếu phương trình thuần nhất 0 = x1a1 + x2 a2 + ... + xn an có nghiệm


duy nhất x1 = x2 =...=xn = 0 thì hệ a1 , a2 ,..., an  được gọi là độc
lập tuyến tính. Ngược lại, nếu tồn tại xi  0 thì hệ đó là hệ phụ
thuộc tuyến tính.
Tính chất:
1. Một hệ phụ thuộc tuyến tính nếu và chỉ nếu tồn tại 1 vecto trong
hệ đó là tổ hợp tuyến tính của các vecto còn lại.
2. Tập hợp con khác rỗng của 1 hệ động lập tuyến tính là 1 hệ độc
lập tuyến tính.
29
1.3. TẬP CƠ SỞ VÀ HẠNG MA TRẬN

3. Tập hợp các cột của một ma trận khả nghịch tạo thành 1 hệ độc
lập tuyến tính.
4. Nếu A là một ma trận cao (m>n) thì tồn tại vecto b sao cho
Ax=b vô nghiệm.
5. Nếu ma trận A có n>m thì n vecto bất kỳ trong không gian m
chiều tạo thành 1 hệ phụ thuộc tuyến tính.
1.3.2 Tập cơ sở của không gian vecto:
Hệ vecto a1 , a2 ,..., an  trong không gian V được gọi là một cơ sở
(basic) nếu thỏa mãn 2 điều kiện sau:
1. Hệ a1 , a2 ,..., an  là một hệ độc lập tuyến tính.
2. V  span(a1 , a2 ,..., an ) . Nghĩa là mọi vecto trong V đều có thể
biểu duy nhất dưới dạng một tổ hợp tuyến tính của a1 , a2 ,..., an  30
1.3. TẬP CƠ SỞ VÀ HẠNG MA TRẬN

1.3.3 Hạng của ma trận:


Cho ma trận A  mn , hạng (rank) của ma trận này được định
nghĩa là số lượng lớn nhất các cột của nó tạo thành 1 hệ độc lập
tuyến tính.
Tính chất:
1. Một ma trận có hạng bằng 0 khi và chỉ khi nó là ma trận 0.
T
2. rank (A) = rank (A )
3. Nếu A  mn thì rank (A)  min(m, n)
4. rank (AB)  min(rank ( A), rank ( B ))
5. rank (A + B)  rank ( A) + rank ( B )
6. Nếu A  mn , B  n p thì
rank ( A) + rank ( B ) − n  rank ( AB )
31
1.4 CHUẨN CỦA
VECTO VÀ MA
TRẬN

32
1.4. CHUẨN CỦA VECTO VÀ MA TRẬN

1.4.1 Chuẩn của vecto:

➢ Một hàm số f : n
→ được gọi là chuẩn (norm) của một
vecto nếu nó thỏa mãn 3 điều kiện sau đây:
1. f (x)  0 Dấu = xảy ra  x=0
2. f ( x ) =|  | f ( x ),  
3. f ( x1 ) + f ( x2 )  f ( x1 + x2 ) x1 , x2  n

33
1.4. CHUẨN CỦA VECTO VÀ MA TRẬN

Một số chuẩn của vecto thường dùng


Cho vecto x  n
1. Chuẩn l1 (l1 norm)

x 1 = x1 + x2 + ... + xn
2. Chuẩn Euclid (l2 norm): chính là độ dài Euclid của vecto

x 2 = x12 + x22 + ... + xn2

3. Chuẩn lp (lp norm)

( )
1

= x1 + x2 + ... + xn
p p p p
x p

34
1.4. CHUẨN CỦA VECTO VÀ MA TRẬN

1.4.2 Chuẩn của ma trận:

Cho ma trận A  mn , chuẩn thường được dùng nhất là chuẩn


Frobenius, là căn bậc hai của tổng bình phương tất cả các phần tử
của ma trận đó.
m n
A F
=  ij
a 2

i =1 i =1

35
1.5 KHÔNG GIAN AFFINE

36
1.5. KHÔNG GIAN AFFINE

1.5.1. Không gian con:


➢ Không gian vecto W được gọi là không gian con của V, nếu
W đóng kín với phép cộng và phép nhân. Nghĩa là:
1. Phép cộng x, y  W  x + y  W
2. Phép nhân với số thực k: x  W  kx  W (k  )
Hay: x, y  W , k , h  R  kx + hy  W
Ví dụ: Xét tập W sau đây có phải là không gian vecto con của
không gian M2x2 không?

1 x  
W =    , x, y  R
 y 2  
37
1.5. KHÔNG GIAN AFFINE

1.5.2 Ánh xạ:


Một ánh xạ từ không gian X vào không gian Y (ký hiệu f : X → Y ) là
một quy tắc cho mỗi phần tử x  X tương ứng với một phần tử y Y
Phần tử y được gọi là ảnh của phần tử x, ký hiệu là y = f ( x)
Ánh xạ tuyến tính:
Ánh xạ f : X → Y là ánh xạ tuyến tính nếu
1. f ( x + y ) = f ( x) + f ( y )
2. f (kx) = kf ( x)

x, y  X , k 

38
1.5. KHÔNG GIAN AFFINE

1.5.3 Không gian affine:


Cho V là 1 không gian vecto, x0 V và W là KGC của V (W  V)
Khi đó tập con:
L = x0 + W :=  x0 + w : w  W 
= v V | w  W : v = x0 + w  V
được gọi là không gian affine của V

Chú ý: Định nghĩa không gian affine loại trừ 0. Do đó khoogn


gian affine không phải là không gian con tuyến tính.

Ví dụ không gian affine là các điểm, đường thẳng, mặt phẳng


3
trong không gian
39

You might also like