Download as pdf or txt
Download as pdf or txt
You are on page 1of 122

CHƯƠNG 1

SAI SỐ TRONG ĐO ĐẾM BỨC XẠ


Phân rã phóng xạ là một quá trình ngẫu nhiên, do đó bất kỳ một phép đo nào dựa trên
việc đo đếm bức xạ phát ra từ phân rã hạt nhân đều bị chi phối bởi một độ thăng giáng
thống kê nào đó. Thăng giáng này gây nên một nguồn bất định trong tất cả phép đo hạt
nhân và thường là nguồn sai số chủ yếu trong các thí nghiệm. Thống kê học trong đo đếm
bức xạ bao gồm việc phân tích thống kê các kết quả đo hạt nhân và dự đoán độ chính xác
thống kê của đại lượng cần đo.
1.1. Định nghĩa sai số
Sai số là: “Sự khác nhau giữa giá trị quan sát hoặc giá trị tính toán được X so với giá
trị thật của nó µx”.
Dĩ nhiên ta không biết được chính xác giá trị thật của nó, mà chỉ có thể ước lượng từ
việc lấy thống kê các mẫu và đánh giá độ không ổn định của nó (sai số kèm theo). Nói cách
khác, sau khi đo đạc nhiều lần một đại lượng µX ta thu được một dãy các kết quả, mỗi kết
quả chứa một sai số nào đó. Vấn đề đặt ra là: ước lượng giá trị gần đúng của µX với sai số
bé nhất có thể được.
Có hai khái niệm cần phân biệt liên quan đến độ không ổn định của đại lượng mà ta
muốn đo:
- Độ chính xác (accuracy): độ chính xác của một thí nghiệm là độ đo mức tiến gần
của giá trị đo so với giá trị thật của nó.
- Độ lặp lại (precision): thể hiện khả năng lặp lại tốt của kết quả thí nghiệm.
1.2. Các loại sai số
- Sai số thô: Sai số thô sinh ra do sự vi phạm các điều kiện cơ bản của công việc đo
đạc, hoặc do sơ xuất của người làm thí nghiệm.
Sự khác nhau bất thường về giá trị của một kết quả đo đạc với các kết quả đo đạc
khác là tiêu chuẩn bề ngoài để xác định rằng kết quả đó có chứa sai số thô. Có một vài tiêu
chuẩn để khử sai số thô, tuy nhiên phương pháp tin cậy và hiệu quả nhất vẫn là việc loại bỏ
trực tiếp các kết quả đó trong quá trình đo đạc.

10
Trong giáo trình này, ta luôn xem rằng chỉ giữ lại để xử lý bằng toán học các kết quả
đo đạc không có chứa sai số thô.
- Sai số hệ thống: gây nên bởi lỗi về định cỡ của dụng cụ đo hay khuyết tật cố định
của người làm thí nghiệm.
Ví dụ sau khi đo đạc phát hiện ra rằng vì không điều khiển chính xác dụng cụ nên đã
dẫn tới việc dịch chuyển gốc tính. Khi đó tất cả số liệu sẽ bị lệch đi hoặc một đại lượng
không đổi nếu thang tỷ lệ của dụng cụ đều, hoặc một đại lượng thay đổi theo quy luật nào
đó nếu thang tỷ lệ của dụng cụ không đều. Một ví dụ khác là sự thay đổi của các điều kiện
bên ngoài, như nhiệt độ, nếu biết ảnh hưởng của sự thay đổi đó đối với kết quả đo, ta cũng
có thể xếp vào loại nguyên nhân nói trên.
Ta quy ước rằng mỗi một trong các nguyên nhân như thế gây nên sai số hệ thống.
Việc phát hiện sai số hệ thống gây nên bởi mỗi nhân tố riêng biệt đòi hỏi những khảo
sát riêng biệt. Nhưng mỗi khi các sai số hệ thống đã được phát hiện và các giá trị của
chúng đã tính được thì có thể dễ dàng trừ bỏ chúng bằng cách đưa vào các hiệu chính
tương ứng trong kết quả quan trắc.
Vì vậy trong giáo trình này ngay từ đầu của việc xử lý bằng toán học các kết quả đo
đạc, tất cả các sai số hệ thống đều phải được phát hiện và loại trừ. Sai số này ảnh hưởng
đến độ chính xác của kết quả thí nghiệm.
- Sai số ngẫu nhiên: sai số còn lại sau khi đã loại trừ tất cả sai số hệ thống gọi là
sai số ngẫu nhiên. Sai số ngẫu nhiên gây nên bởi một số rất lớn các nhân tố, mà tác dụng
của từng nhân tố thì nhỏ đến mức ta không thể tách riêng và tính toán riêng biệt được. Có
thể xem sai số ngẫu nhiên là tác dụng tổng hợp của các nhân tố trên. Bản chất thăng giáng
thống kê của quá trình vật lý liên quan đến đại lượng mà ta muốn đo cũng gây nên sai số
loại này. Sai số này ảnh hưởng đến độ lặp lại của kết quả thí nghiệm.
Nếu sai số ngẫu nhiên là kết quả từ sự không ổn định của hệ đo thì việc cải tiến độ tin
cậy và chính xác của hệ đo có thể làm giảm sai số này. Nếu sai số ngẫu nhiên bắt nguồn từ
bản chất thăng giáng thống kê liên quan đến việc đếm các số biến cố hữu hạn thì việc đếm
nhiều hơn hay lặp lại phép đếm nhiều lần có thể làm giảm sai số này.

11
Sai số ngẫu nhiên không thể loại trừ trong mỗi lần đo đạc, nhưng do ảnh hưởng bởi
rất nhiều nhân tố nên bằng phương pháp của lý thuyết xác suất thống kê có thể đánh giá
được ảnh hưởng của chúng đến việc ước lượng giá trị chân thực của đại lượng đo. Điều đó
cho phép xác định giá trị của đại lượng đo được với sai số bé hơn nhiều so với sai số của
từng phép đo riêng biệt. Việc ảnh hưởng của các sai số ngẫu nhiên dưạ trên sự hiểu biết về
các luật phân phối của chúng.
1.3. Chữ số có nghĩa và cách làm tròn
1.3.1. Chữ số có nghĩa
Số chữ số của một đại lượng hàm chứa ý nghĩa về độ chính xác của kết quả thí
nghiệm. Số chữ số có nghĩa được định nghĩa như sau:

1. Chữ số khác không cực trái là số có nghĩa lớn nhất.


2. Nếu không có dấu chấm thập phân, chữ số khác không cực phải là số chữ số nhỏ
nhất.
3. Nếu có dấu thập phân, chữ số cực phải là số chữ số nhỏ nhất ngay cả khi nó bằng
0.
4. Tất cả các chữ số từ chữ số có nghĩa lớn nhất đến chữ số có nghĩa nhỏ nhất đều
được gọi là chữ số có nghĩa.
Ví dụ: các số sau đây đều có 4 chữ số có nghĩa:
1234; 123.400; 123,4; 1001,; 1000,; 10,10; 0,00001010; 100,0
Chú ý:
- Cách ghi 1010 cho ta thấy số này chỉ có 3 chữ số có nghĩa, ngay cả khi chữ số
0 cuối cùng có ý nghĩa vật lý đáng kể. Để tránh nhầm lẫn, người ta thường ghi theo một
trong hai cách như sau: 1010, hoặc 1,010 × 103 nếu tất cả bốn chữ số đều có nghĩa.
- Khi trình bày kết quả thí nghiệm, sai số của kết quả đo thường có khuynh
hướng được trình bày với số chữ số có nghĩa gần bằng 1 hơn nếu có thể.
Ví dụ: Ta có L = 1,979 m, nếu sai số của L là 0,012 m thì ta trình bày kết quả dưới
dạng L = (1,979 ± 0,012) m. Nếu sai số của L là 0,082 m, có chữ số đầu tiên có nghĩa lớn,

12
khi đó ta nên trình bày L = (1,98 ± 0,08) m. Nói cách khác chúng ta hãy để sai số quyết
định độ chính xác của con số mà ta muốn trình bày kết quả.
- Giá trị bằng số của các đại lượng vật lý trong cùng tập hợp phải được ghi với
cùng mức độ tin cậy như nhau, tức là có số chữ số có nghĩa giống nhau. Ví dụ khối lượng
của mẫu thử được cân chính xác đến 2 mg thì các kết quả sau đây được viết:
1,814 g 1,850 g 2,000 g (đúng)
1,814 g 1,85 g 2g (sai)
- Có thể biểu diễn dưới các hình thức khác nhau nhưng phải có cùng số chữ số
có nghĩa.
Ví dụ: 39,6 g hay 0,0396 kg hay 396 × 10-4 kg.
1.3.2. Cách làm tròn số
Do quá trình tính toán, số chữ số có nghĩa của kết quả cuối cùng thường nhiều quá
mức cần thiết. Ta cần làm tròn nó đến số chữ số có nghĩa quy định. Cái quy định nên số
chữ số có nghĩa trong kết quả đo của một đại lượng vật lý tuỳ thuộc vào ý nghĩa vật lý mà
yêu cầu của bài toán đặt ra.

Ví dụ: hai số 2,4 và 2,40 tuy giống nhau về giá trị nhưng khác nhau về mức độ chính
xác. Số thứ hai được tính toán chi ly đến đơn vị phần trăm trong lúc số thứ nhất chỉ đến
đơn vị phần mười. Giả sử hai số đó là khối lượng tính bằng gam thì để có số thứ hai, phải
dùng cân chính xác đến centigam, còn số thứ nhất chỉ cần cân chính xác đến decigam.

Khi muốn bỏ các chữ số không có nghĩa từ một con số, chữ số cuối cùng còn được
giữ lại phải được làm tròn với độ chính xác tốt nhất. Để làm tròn một con số thành số có số
chữ số có nghĩa ít hơn, ta chặt cụt số đó tại vị trí theo yêu cầu và xử lý các chữ số thừa còn
lại như phần thập phân. Khi đó:

1. Nếu phần thập phân đó lớn hơn ½, tăng số chữ số có nghĩa thấp nhất của con số
mới chặt cụt.
2. Nếu phần thập phân nhỏ hơn ½, không tăng.
3. Nếu phần thập phân bằng ½, chỉ tăng chữ số có nghĩa thấp nhất khi nó lẽ.

13
1.3.3. Số chữ số có nghĩa của kết quả tính
Quy tắc lấy số chữ số có nghĩa cho kết quả tính như sau:
Cộng, trừ: lấy đến số chữ số có nghĩa của số hạng có độ chính xác thấp nhất.
Ví dụ: 113,2 + 1,43 = 114,63 phải ghi là 114,6 (tức làm tròn thành 114,6),
113,2 – 1,43 = 111,77 phải ghi là 111,8 (tức làm tròn thành 111,8).
Nhân chia: theo quy tắc của cộng trừ đồng thời theo số chữ số có nghĩa ít nhất mà các
số hạng có.
Ví dụ: 113,2×1,43 = 161,876 phải ghi là 162 (tức làm tròn thành 162),
113,2:1,43 = 79,16 phải ghi là 79,2 (tức làm tròn thành 79,2).
Khai căn: lấy số chữ số có nghĩa của kết quả tính tương tự trị số dưới dấu căn.
Ví dụ: 113,2 = 10,63954 phải ghi là 10,64 (tức làm tròn thành 10,64 ).

1.3.4. Kết quả báo cáo ghi kèm với sai số tương ứng
Khi trình bày kết quả thực nghiệm của một đại lượng đo phải kèm theo sai số và thứ
nguyên của nó.
Ví dụ:
(162,9 ± 0,5) kg hoặc 162,9 ± 0,5 [kg] hoặc 162,9 (5) (thứ nguyên để ở tiêu đề cột).
Giá trị sai số không nên trình bày quá hai chữ số có nghĩa, và theo đó, kết quả báo
cáo sẽ giữ số chữ số có nghĩa đến bậc cao nhất của giá trị sai số.
Ví dụ:
(162,8720 ± 0,5241) kg có thể ghi thành (162,87 ± 0,53) kg hoặc (162,9 ± 0,5) kg.
Thứ nguyên có thể để ở tiêu đề cột nếu đang trình bày dạng bảng.
1.4. Sai số tương đối và sai số tuyệt đối
1.4.1. Sai số tuyệt đối
Độ lệch giữa giá trị đo được (hay tính toán được) X so với giá trị thật µx, ký hiệu ∆

được gọi là sai số tuyệt đối. Sai số dạng tuyệt đối có cùng thứ nguyên với đại lượng X cần
đánh giá.
Δ = X - μx

14
Trong thực tế giá trị ∆ chỉ được ước lượng thông qua giá trị giới hạn mà ∆ không
thể vượt qua, ký hiệu ∆max. Ví dụ đo kích thước của một cái hộp bằng cây thước có giai đo
nhỏ nhất là 1mm, thì ∆max = 0,5 mm (vì mắt nhìn không thể phân biệt quá bán giữa hai
vạch chia 1mm).
1.4.2. Sai số tương đối
Để đánh giá độ chính xác cao hay thấp của một kết quả đo người ta dùng sai số dạng
tương đối:
Δ
δ=
μx
Sai số tương đối không có thứ nguyên và thường trình bày dưới dạng phần trăm.
1.4.3. Chất lượng của một phép đo
Do ∆ và μ x không thể đánh giá được, nên người ta sử dụng ∆max và X để tính như
sau:
Δ max
δ max = ×100
X
Chất lượng được gọi là:
cao khi δ max <= 2%
trung bình khi 2% < δ max <= 5%
thấp khi 5% < δ max <= 10%
rất thấp khi δ max > 10%
1.4.4. Độ chính xác của phép đo
Độ chính xác của phép đo phản ánh chất lượng đo, là độ tiệm cận với giá trị thực của
đai lượng đo, được biểu thị bởi nghịch đảo của sai số tương đối:
1
ε=
δ
1.4.5. Cấp chính xác của thiết bị đo
Đối với dụng cụ đo có giá trị lớn nhất Xmax, cấp chính xác của nó được quy ước theo:
Δ max
ccx = × 100
X max

15
Những dụng cụ đo lường trong phòng thí nghiệm nên chọn các cấp chính xác:
0,02; 0,05; 0,1
Và những dụng cụ đo lường trong kiểm tra quá trình công nghệ nên có cấp chính xác
0,5; 1,0; 1,5
Dụng cụ có ccx càng nhỏ thì cấp chính xác càng cao. Các phép đo nên được thực hiện trong
phạm vi từ 25% đến 75% giá trị lớn nhất của thang đo, khi đó sai số tương đối của phép đo
không vượt quá 4 lần giá trị ccx của dụng cụ đo. Những số đo tốt nhất khi được đo ở giữa
thang đo (xấp xỉ 50% giá trị lớn nhất của thang đo). Khi đó sai số tương đối của mỗi phép
đo xấp xỉ hai lần giá trị ccx. Như vậy dựa vào sai số tương đối ấn định của mỗi phép đo của
một bài toán cụ thể có thể trang bị dụng cụ đo hoặc máy đo có cấp chính xác phù hợp.
Bài tập Chương 1

1.1. Đếm số chữ số có nghĩa của các số sau đây, tìm chữ số có nghĩa lớn nhất và nhỏ nhất,
và làm tròn chúng thành số có hai chữ số có nghĩa:
a) 976,45 b) 84.000 c) 0,0094 d) 301,07
e) 4,000 f) 10 g) 5280 h) 400
-2 -4
i) 4,00 × 10 j) 3,010 × 10
1.2. Một mẫu thử cân nặng hai phẩy năm gam trên cân chính xác đến đơn vị miligam sẽ
được trình bày kết quả khối lượng với bao nhiêu chữ số có nghĩa.
1.3. Hãy làm tròn các kết quả tính sau đây:
1) 12,65 + 232,2 + 78 = 322,85
2) 12,675 + 23,12 × 1,20 = 40,419
3) 12,675 /(23,12 × 1,20) = 0,128323
1.4. Đo chiều dài của một quyển sách cẩn thận bằng thước đo. Ước lượng các loại sai số
trong phép đo. Trình bày kết quả.
1.5. Những kết quả đo được quy định viết với 3 chữ số có nghĩa thì hy vọng sai số tương
đối của chúng lớn nhất và nhỏ nhất là bao nhiêu?
1.6. Các số 0,025; 0,250; 2,05; 2,500 lần lượt có bao nhiêu chữ số có nghĩa.
1.7. Hãy tính số trung bình của ba kết quả đo 1,23; 1,32; 1,28 và viết ra với số chữ số có
nghĩa hợp lý.
1.8. Hãy làm tròn X = 12,284 lần lượt với các đơn vị u = 0,1; 0,2; 0,25 và 0,5.

16
1.9. Hãy làm tròn X = 2128,5 lần lượt với các đơn vị u = 1; 10; 100 và ghi đúng với số
chữ số có nghĩa của nó.

CHƯƠNG 2
ĐẶC TRƯNG THỐNG KÊ CỦA DỮ LIỆU ĐO ĐẠC

2.1. Trị trung bình


Giả sử ta có n phép đo độc lập của cùng một đại lượng vật lý X. Kết quả đo được của
n lần đo là x1, x2, . . ., xn. Giả sử các giá trị này là nguyên, ví dụ số đếm bức xạ phát ra
trong khoảng thời gian như nhau. Khi đó trị trung bình thực nghiệm của tập hợp các giá trị
xi này là
n

∑x i
x= i =1
(2.1)
n
Trị trung bình đám đông µ được đánh giá thông qua trung bình thực nghiệm x .
Để ý rằng mỗi giá trị thực nghiệm có thể xuất hiện nhiều lần. Gọi số lần xuất hiện giá
trị xi là ri. Công thức (2.1) được viết lại
m

∑r x i i
i =1
x= (2.2)
n
Tần suất xuất hiện giá trị xi được tính bởi
ri
f (x i ) = (2.3)
n
Khi sử dụng dữ liệu theo phân bố tần suất, trị trung bình thực nghiệm có thể được viết
lại
m
x = ∑ x i f (x i ) (2.4)
i =1

17
Chú ý rằng công thức (2.1) là trường hợp riêng của (2.4) khi phân bố tần suất đồng
1
đều: f (x i ) = (2.5)
n

Sau khi phân lớp dữ liệu xi tương ứng với tần suất f(xi) ta có được hàm phân bố tần
suất. Hàm phân bố tần suất đối với dãy dữ liệu khảo sát trong một loạt đo n lần thường
được chuẩn hóa như sau:
m

∑ f (x ) = 1 , với m là số lớp.
i =1
i (2.6)

Hàm phân bố này được gọi là hàm phân bố tần suất thực nghiệm hay phân bố tần suất
từ mẫu. Khi n → ∞ ta sẽ có hàm phân bố tần suất lý thuyết hay phân bố tần suất đám đông
hay còn gọi là hàm phân bố xác suất.
Ví dụ 2.1. Giả sử ta có n = 20 lần đo đại lượng x, kết quả được cho trong bảng 2.1 dưới
đây. Chú ý rằng x nằm trong khoảng từ 3 đến 14. Phân lớp dữ liệu trong khoảng từ 3 đến
14 và xác định tần suất xuất hiện giá trị xi trong từng lớp. Kết quả được cho trong bảng 2.2.
Bảng 2.1. Số liệu đo x
i 1 2 3 4 5 6 7 8 9 10
xi 8 5 12 10 13 7 9 10 6 11
i 11 12 13 14 15 16 17 18 19 20
xi 14 8 8 3 9 12 6 10 8 7

Bảng 2.2. Tần suất trong từng phân lớp dữ liệu với số lớp m =12
xi f(xi)
3 1/20
4 0/20
5 1/20
6 2/20
7 2/20

18
8 4/20
9 2/20
10 3/20
11 1/20
12 2/20
13 1/20
14 1/20
r
1
∑ f (x ) =
i =1
i

Hình 2.1 trình bày biểu đồ phân bố tần suất của dữ liệu cho trong bảng 2.2.

Hình 2.1. Biểu đồ phân bố tần suất của dữ liệu trong bảng 2.2.
2.2. Phương sai
Để đánh giá mức độ thăng giáng nội tại của kết quả đo người ta làm như sau. Đầu
tiên xác định độ lệch của từng giá trị xi so với trị trung bình
di = xi − µ (2.7)
và đánh giá giá trị trung bình của di. Kết quả cho thấy:
n

∑d i
d= i =1
=0 (2.8)
n

19
Với kết quả này ta nhận thấy trị trung bình của độ lệch của từng giá trị xi so với trị
trung bình không đặc trưng được sự thăng giáng nội tại của dữ liệu đo. Có thể giải thích
điều này là do tính chất ngẫu nhiên của nó mà nó có thể có thăng giáng âm (độ lệch di <0)
hay thăng giáng dương (độ lệch di >0) quanh trị trung bình. Để loại trừ dấu của độ lệch
người ta bình phương giá trị độ lệch di và lấy trung bình. Đó chính là định nghĩa của
phương sai.
Theo định nghĩa này, phương sai thực nghiệm hay phương sai mẫu được tính bởi:
1 n
S' 2 = d i2 = ∑
n i =1
(x i − x) 2 (2.9)

Tuy nhiên khi n → ∞ đại lượng này tiến chậm về phương sai của đám đông dưới dạng
n −1 2
σ . Vì vậy khi số dữ liệu ít, n < 30, đại lượng
n
1 n
S2 = ∑
n − 1 i =1
(x i − x) 2 (2.10)

sẽ là một đánh giá tốt phương sai thực nghiệm.


Điều này được giải thích do khi tính phương sai thực nghiệm, ta cần sử dụng một lần
bộ dữ liệu thực nghiệm để tính trung bình mẫu, khi đó độ tự do của dữ liệu giảm đi 1,
ν = n − 1.
Khi dữ liệu cho theo phân bố tần suất, ta có thể tính phương sai thực nghiệm như sau:
n m
S2 = ∑
n − 1 i =1
(x i − x) 2 f (x i ) (2.11)

Khi n lớn (n>30), phương sai mẫu có thể xấp xỉ phương sai của đám đông:

σ 2 = ∑ ( x i − µ) 2 P( x i ) (2.12)
i =1

2.3. Các phân bố thống kê thường dùng


Tùy theo mỗi loại bài toán cần đánh giá, chúng ta có thể dự đoán hàm phân bố tần
suất để mô tả dữ liệu của nhiều lần lặp lại phép đo. Phép đo được định nghĩa như là phép
đếm số thành công xảy ra trong một số phép thử nghiệm cho trước. Mỗi phép thử nghiệm
là một quá trình nhị phân có một trong hai kết quả: phép thử thành công (x = 1) hoặc phép
thử không thành công (x = 0).
20
Trong phép thử mà ta đang khảo sát, thông thường xác suất thành công là một hằng
số đối với mọi phép thử. Ví dụ phép thử tung đồng xu, đồng xu có hai mặt, xác suất xuất
hiện một mặt là p = 1/2. Nếu ta gieo con xúc sắc có sáu mặt thì xác suất xuất hiện một mặt
là 1/6. Trong bài toán khảo sát một hạt nhân phóng xạ trong khoảng thời gian t, số phép
thử chính là số hạt nhân trong mẫu khảo sát, còn phép đo là việc đếm số nhân phân rã. Xác
−λt
suất thành công của một phép thử trong trường hợp này là (1 − e ) với λ là hằng số phân
rã phóng xạ của mẫu khảo sát.
Sau đây trình bày năm dạng phân bố thống kê cơ bản đặc trưng cho việc khảo sát các
bài toán liên quan đến đo đếm bức xạ hạt nhân như: phân bố nhị thức, phân bố Poisson,
phân bố Gauss, phân bố Lorentz, phân bố khoảng. Giáo trình cũng sử dụng nhiều phân bố
xác suất khác trong việc ước lượng và kiểm định thống kê như phân bố Student, phân bố
chi bình phương và phân bố F nhưng chỉ trình bày cách sử dụng còn chi tiết liên quan đến
mô tả đặc trưng của phân bố sinh viên có thể tham khảo thêm ở các giáo trình xác suất
thống kê.
2.3.1. Phân bố nhị thức
1. Giới thiệu
Đây là mô hình tổng quát nhất và được áp dụng cho các quá trình có xác suất p là
hằng số. Gọi n là số phép thử, có xác suất thành công trong mỗi lần thử là p không đổi. Khi
đó xác suất được dự đoán để đếm chính xác x lần thành công biến cố mà ta quan tâm trong
n lần thử được tính bởi:
n!
f (x) = p x (1 − p) n − x (2.13)
(n − x )!x!
với x có thể nhận giá trị từ 0 đến n.
- Hàm f(x) định nghĩa ở (2.13) là hàm mật độ xác suất của phân bố nhị thức được
định nghĩa đối với x và n nguyên.
- Hàm phân bố tích luỹ (hay còn gọi là xác suất tích luỹ) tới giá trị x được xác định
bởi:
x
P(X ≤ x ) ≡ F( x ) = ∑ f ( x ) (2.14)
x =0

21
chính là xác suất để X nhận được các giá trị không vượt quá giá trị x nào đó đã ấn định
trước.
Trong Excel, có thể dùng hàm BINOMDIST(x, n, p, 0) để tính cho hàm mật độ xác
suất (2.13) và BINOMDIST(x, n, p, 1) để tính cho hàm xác suất tích lũy (2.14).
Ví dụ 2.2: Trong phép thử gieo con xúc sắc hình lập phương với 6 mặt được đánh số từ 1
đến 6, xác suất xuất hiện mỗi mặt là 1/6. Giả sử biến cố quan tâm ω là sự xuất hiện của
một trong các mặt 3, 4, 5 hoặc 6. Vậy p = p( ω ) = 4/6 = 2/3.
Bây giờ ta gieo con xúc sắc 10 lần và gọi x là số lần thành công trong 10 lần gieo.
Vậy x tuân theo phân bố nhị thức. Ở đây x nhận giá trị từ 0 đến 10.
Bàng 2.3 trình bày các giá trị xác suất dự đoán tính từ phân bố nhị thức (2.13) với các
tham số p = 2/3 và n = 10. Trong đó x = 7 là giá trị có xác suất lớn nhất.
Hình 2.2. trình bày biểu đồ phân bố nhị thức với p = 2/3 và n = 10.
Bảng 2.3. Giá trị f(x) với p = 2/3, n = 10 của phép thử tung con xúc sắc
x f(x)
0 0,00002
1 0,00034
2 0,00305
3 0,01626
4 0,05696
5 0,13656
6 0,22761
7 0,26012
8 0,19509
9 0,08671
10 0,01734
10

∑ f (x) = 1
x =0

2. Các tính chất của phân bố nhị thức


Hàm mật độ xác suất được chuẩn hoá:

22
n

∑ f (x) = 1
x =0

Trị trung bình của x đối với phân bố nhị thức:


n
µ = ∑ xf ( x ) = pn (2.15)
x =0

Hình 2.2. Biểu đồ phân bố nhị thức với p = 2/3 và n = 10.


Phương sai của x theo phân bố nhị thức:
n
σ 2 = ∑ ( x − µ) 2 f ( x ) = pn (1 − p) = µ(1 − p) (2.16)
x =0

Độ lệch chuẩn của x theo phân bố nhị thức:


σ = µ(1 − p) (2.17)
Trong ví dụ trên
µ = pn = (2 / 3)(10) = 6,67

σ=
2
np(1 − p)
= 10(0,667)(0,333)
= 2, 22

σ= σ2 = 2, 22 = 1, 49 .

23
Chú ý rằng dạng phân bố nhị thức đối xứng quanh trị trung bình khi xác suất p = 0,5.
Còn những trường hợp khác thì phân bố không có dạng đối xứng.
3. Ý nghĩa của phân bố nhị thức
Phân bố nhị thức là phân bố tổng số biến cố mà ta quan tâm xuất hiện trong n dãy
phép thử Bernoulli. Điều kiện quan trọng là các phép thử phải độc lập. Nếu phép thử là lấy
từ một tập hợp ra thì lấy có hoàn lại sẽ đảm bảo tính độc lập. Hoặc lấy một ít từ tập rất lớn
thì cũng coi như là độc lập.
2.3.2. Phân bố Poisson
1. Giới thiệu
Nhiều quá trình nhị phân có xác suất thành công bé đối với mỗi phép thử riêng biệt,
tức là p << 1 và tích n.p vừa phải (nhỏ hơn 20). Ví dụ trong thí nghiệm đếm hạt nhân, ở đó
số hạt nhân trong mẫu là lớn, còn thời gian quan sát ngắn so với chu ký bán rã của mẫu
phóng xạ. Tương tự trong thí nghiệm trên máy gia tốc, chùm hạt bắn vào bia lớn nhưng xác
suất gây ra phản ứng thường rất nhỏ. Khi đó về mặt toán học có thể xấp xỉ phân bố nhị
thức thành dạng:
(pn ) x e − pn
f (x) = (2.18)
x!
Vì trong phân bố nhị thức, kỳ vọng µ = pn ≡ λ nên biểu thức trên có thể viết lại:

(λ ) x e − λ
f (x) = (2.19)
x!
Biểu thức trong (2.19) được gọi là hàm mật độ xác suất của phân bố Poisson.
- Đó là xác suất để một biến cố xảy ra đúng X = x lần trong một khoảng thời gian
[0, t] mà số lần xảy ra trung bình là λ .
- Xác suất tích luỹ tới giá trị x là:
x
F( x ) = ∑ f ( x ) (2.20)
x =0

Trong Excel có thể dùng hàm POISSON(x, λ, 0) để tính cho hàm mật độ xác suất
(2.19) và POISSON(x, λ,1) để tính cho hàm xác suất tích lũy tới x (2.20).
2. Các đặc trưng của phân bố Poisson

24
Phân bố Poisson giống như phân bố nhị thức là phân bố của biến ngẫu nhiên rời rạc,
tức là nó được định nghĩa ở những giá trị x nguyên dù rằng tham số µ là số thực dương.
Phân bố Poisson có các tính chất sau:
- Hàm phân bố được chuẩn hóa:
n

∑ f (x) = 1
x =0

- Giá trị trung bình của x theo phân bố Poisson:


n
µ = ∑ xf ( x ) = pn ≡ λ (2.21)
x =0

- Phương sai của x theo phân bố Poisson:


n
σ 2 = ∑ ( x − µ) 2 f ( x ) = µ ≡ λ ≈ x (2.22)
x =0

- Độ lệch chuẩn của x theo phân bố Poisson:


σ= µ ≈ x (2.23)
Vậy phương sai bằng trị trung bình. Phân bố Poisson chỉ có một tham số là µ = λ .Tuỳ
theo độ lớn của λ , phân bố Poisson có dạng khác nhau. Giá trị của λ càng lớn ( λ ≥ 20 ),
đường cong càng có khuynh hướng đối xứng hơn.
Ví dụ 2.3. Chọn ngẫu nhiên 1000 người và thực hiện phép thử hỏi từng người hôm nay có
phải là sinh nhật của họ không? Phép thử là thành công nếu hôm nay là sinh nhật của
1
người được hỏi. Xác suất thành công p = = 0,00274 << 1 . Trong khi đó số phép thử n
365
đủ lớn và tích n.p = 2,74 vừa phải. Như vậy có thể áp dụng phân bố Poisson để tính xác
suất với các giá trị x từ 0 đến 1000. Bảng 2.4 trình bày xác suất của phân bố Poisson với x
từ 0 đến 7. Hình 2.3 mô tả đồ thị phân bố Poisson tương ứng với bảng 2.4.
Bảng 2.4. Xác suất của phân bố Poisson với x = 2,74
x f(x)
0 0,064
1 0,177

25
2 0,242
3 0,221
4 0,152
5 0,083
6 0,038
7 0,014
Hình 2.3. Biểu đồ phân bố Poisson với x = 2,74 .
2.3.3. Phân bố Gauss
1. Giới thiệu
- Phân bố Poisson là sự đơn giản toán học của phân bố nhị thức khi p << 1 , n lớn và
tích n.p vừa phải. Khi trị trung bình (n.p) của phân bố lớn (lớn hơn 20), chúng có thể được
xấp xỉ phân bố dạng Gauss:

1  1  x − µ 2 
f (x) = exp −    (2.24)
σ 2π  2  σ  
- Xác suất tích luỹ tới giá trị x là:
x
P(X ≤ x ) ≡ F( x ) = ∫ f (t )dt
−∞
(2.25)

Trong Excel, sử dụng hàm NORMDIST(x,µ,σ,0) để tính hàm mật độ xác suất (2.24)
và NORMDIST(x,µ,σ,1) để tính hàm xác suất tích lũy (2.25).
2. Các đặc trưng của phân bố Gauss
- Chuẩn hóa hàm mật độ xác suất:

∑ f (x) = 1
x =0

- Trị trung bình dự đoán của phân bố Gauss được tính bởi μ = np , trị trung bình
mẫu được tính từ công thức (2.1) hoặc (2.4).
- Phương sai dự đoán của phân bố σ 2 được ước lượng từ định nghĩa tổng quát (2.11)
hoặc tương đương tùy theo trường hợp: cụ thể là công thức (2.16) nếu từ xấp xỉ phân bố

26
nhị thức hoặc công thức (2.22) khi xấp xỉ từ phân bố Poisson, phương sai mẫu được tính từ
công thức (2.9) hoặc (2.10).
Trong ví dụ 2.3 về việc đếm số người có ngày sinh nhật hôm nay, khi số mẫu ngẫu
nhiên lên đến 10.000 người, giá trị trung bình dự đoán của phân bố là:
1
µ = n.p = 10000. ≈ 27,4
365
Bởi vì trị trung bình lớn hơn 20 ta có thể áp dụng phân bố Gauss để dự đoán kết quả
của phép đo. Hình 2.4 minh họa phân bố Gauss với trị trung bình và phương sai tính được.

Hình 2.4. Phân bố Gauss rời rạc với trị trung bình x = 27,4 .
Trong đó độ lệch chuẩn dự đoán dựa trên xấp xỉ từ phân bố Poisson (do p << 1) là:
σ = x = 27,4 = 5,23

Xác suất dự đoán để quan sát số đếm x được cho bởi:


1 ( x − 27,4) 2
f (x) = exp(− ) (2.25)
2π × 27,4 2 × 27,4

3. Phân bố Gauss chuẩn


(x - μ)
Bằng cách đổi biến u = , dạng (2.24) được viết thành:
σ

27
u2 1
f (u ) =
) exp(- (2.27)
2π 2
và được gọi là phân bố Gauss chuẩn. Phân bố này có đặc trưng kỳ vọng là zero và phương
sai bằng 1.
Trong Excel, sử dụng hàm NORMSDIST(u) để tính xác suất tại u.
2.3.4. Phân bố Lorentz
Phân bố Lorentz là phân bố gần đúng của việc mô tả dữ liệu có liên quan tới tính
cộng hưởng. Thí dụ tiết diện phản ứng bức xạ hay hấp thu theo năng lượng trong hiệu ứng
Mossbauer, các đỉnh phổ năng lượng đo từ hệ phổ kế gamma đầu dò nhấp nháy cũng được
mô tả bởi dạng này.
1. Dạng phân bố Lorentz
Biến ngẫu nhiên X được gọi là tuân theo phân bố Lorentz khi hàm mật độ xác suất có
dạng
Γ
1 2
f (x) = (2.28)
π Γ
( x − µ) + ( ) 2
2

2
- Phân bố Lorentz đối xứng quanh trị trung bình µ và bề rộng phân bố được đặc trưng
bởi bề rộng một nửa Γ.
- Sự khác nhau rõ ràng nhất giữa phân bố Gauss và Lorentz là phân bố Lorentz không
triệt tiêu về zero nhanh (vì nó tỷ lệ nghịch với bình phương độ lệch, còn phân bố Gauss thì
giảm theo dạng exponential của bình phương độ lệch).
- Cũng như phân bố Gauss, phân bố Lorentz là phân bố của các biến ngẫu nhiên liên
tục.
- Chuẩn hoá xác suất:
+∞ +∞
1 1 ( x − µ)
∫ f (x )dx =
−∞

π −∞1 + z 2
dz = 1 , với z =
Γ/2
(2.29)

2. Trung bình và bề rộng một nửa


- Trung bình µ là một tham số của hàm phân bố Lorentz.

28
+∞
1 Γ2 z2
- Do đại lượng σ 2 = Var ( x ) =
π 4 ∫ 2 dz
− ∞1 + z
(2.30)

không hội tụ khi độ lệch lớn, hay khi cỡ mẫu tăng, nên thay vào đó người ta dùng độ rộng
Γ Γ
của phân bố Lorentz được đặc trưng bởi Γ với: x − µ = ± . Thay x = µ ± vào (2.28) để
2 2
tính Γ, ta có Γ = 2,354 σ. Hình 2.5 so sánh phân bố Gauss và Lorentz với các tham số đặc
trưng µ = 10 và Γ = 2,354 σ (tương ứng với σ = 11 của phân bố Gauss) sau khi chuẩn hóa.

0.45

0.4

0.35

0.3

0.25
Gauss
P(x)

Lorentz
0.2

0.15

0.1

0.05

0
-8 -6 -4 -2 0 2 4 6 8

Hình 2.5. So sánh phân bố Lorentz và Gauss chuẩn.

2.3.5. Phân bố hàm mũ (Phân bố khoảng)


1. Giới thiệu
Phân bố hàm mũ là phân bố của khoảng thời gian giữa 2 biến cố xảy ra liên tiếp. Ví
dụ khoảng thời gian giữa hai biến cố phân rã phóng xạ của một loại hạt nhân, khoảng thời

29
gian giữa 2 lần có sự cố của một cái máy, khoảng thời gian giữa 2 lần nhận được điện
thoại, …
2. Định nghĩa: các đại lượng ngẫu nhiên X như thế được gọi là tuân theo phân bố hàm mũ
khi hàm mật độ xác suất có dạng:
−x
µ
e
f (x) = (2.31)
µ
Trong đó x ≥ 0 ; µ > 0 và e = 2,71828....

Hình 2.6. Phân bố hàm mũ.


3. Hàm phân phối tích luỹ: là xác suất tích luỹ cho tới giá trị x
−t
x

x x −
F( x ) = ∫ f ( t )dt = ∫ dt = 1 − e µ với x ≥ 0 (2.32)
0 0
µ
Trong Excel, để dùng hàm EXPONDIST(t,1/µ,0) để tính hàm mật độ xác suất
(2.31) và EXPONDIST(t,1/µ,1) để tính hàm xác suất tích lũy (2.32).
4. Các đặc trưng của phân bố
a. Kỳ vọng:
x

∞ ∞ µ
e
E(X) = ∫ xf ( x )dx = ∫ x dx = µ (2.33)
0 0
µ
b. Phương sai:
30
−x
∞ ∞ µ
e
Var (X) = ∫ ( x − µ) 2 f ( x )dx = ∫ ( x − µ) 2 dx = µ 2 (2.34)
0 0
µ
c. Độ lệch chuẩn:
σ=μ (2.35)

Ví dụ 2.4. Thời gian để người cho mượn sách ở thư viện phục vụ một sinh viên theo phân
phối hàm mũ có trung bình 5 phút. Tìm xác suất để thời gian phục vụ một sinh viên lâu
hơn 10 phút.
Cho X là thời gian phục vụ tính theo phút thì X tuân theo phân bố khoảng.
Do đó xác suất để X > 10 là:
x
10 −
5
e
P(X > 10) = 1 − P(X ≤ 10) = 1 − F (10) = 1 − ∫ dx = e − 2 = 0,135335
0
5
5. Mối liên hệ giữa phân bố mũ và phân bố Poisson
Phân bố mũ bắt nguồn từ phân bố Poisson. Người ta chứng minh được rằng nếu số
lần xuất hiện của một biến cố trong một khoảng thời gian cho trước tuân theo phân bố
Poisson với trung bình là λ thì khoảng thời gian giữa hai lần xuất hiện liên tiếp của biến cố
1
ấy tuân theo phân phối hàm mũ với trung bình µ = .
λ
Ví dụ 2.5. Tại trung tâm cấp cứu, số bệnh nhân đến trong một ngày tuân theo phân bố
Poisson có trung bình là 2 người thì khoảng thời gian X giữa hai bệnh nhân đến liên tiếp sẽ
1 1
có phân bố mũ với trung bình µ = = = 0,5 ngày.
λ 2
2
Do đó xác suất để khoảng thời gian giữa hai bệnh nhân đến ít hơn ngày là:
3
2/3
2 2 −
P(X < ) = F( ) = 1 − e 5
= 0,73611
3 3
Ví dụ 2.6. Số đếm của một nguồn phân rã phát α trung bình được ghi nhận là 5 cpm (số
đếm trong 1 phút). Do đó thời gian trung bình giữa hai phân rã alpha là:
1 1
µ= = = 0,2 phút
λ 5
.

31
Bài tập chương 2
2.1. Tính toán và vẽ đồ thị phân bố Gauss với µ = 11,48 và σ = 3,39. Vẽ đồ thị của phân
bố Poisson trên cùng một đồ thị với phân bố Gauss trên với cùng giá trị µ = 11,48.
2.2. Xác suất một electron ở khoảng cách r từ nhân Hydro được cho bởi:
P(r) = C×r2×exp(-r/R)
Tìm giá trị hằng số C. Tính bán kính trung bình rtb và độ lệch chuẩn của r.
Ghi chú: R là bán kính của nhân Hydro.
2.3. Giả sử một đám đông có tỷ lệ nam là 75%. Rút ngẫu nhiên từ đám đông đó ra 15
người và quan tâm đến số người là nam. Dự đoán số nam trung bình, phương sai và độ lệch
chuẩn của kết quả kỳ vọng.
2.4. Một ống đếm dòng cho tốc độ phông trung bình là 2,87 xung /phút. Hỏi xác suất để
trong 2 phút cho trước có (a) chính xác 5 số đếm (b) ít nhất 1 số đếm? Xác định thời gian
đếm cần thiết để đảm bảo khả năng có ít nhất 1 số đếm được ghi là > 99%.
2.5. Cho biết một dây chuyền sản xuất đưa ra có q = 0,2 sản phẩm bị lỗi. Nếu có 5 sản
phẩm được sản xuất, kỳ vọng của số sản phẩm không bị lỗi là bao nhiêu? Tính xác xuất để
thu được 3 sản phẩm không bị lỗi.
2.6. Tính xác xuất để có ít nhất 6 lần mặt hình trong 15 lần tung đồng xu, biết rằng khi
tung đồng xu sẽ xuất hiện hoặc mặt hình hoặc mặt số.
2.7. Khi gieo 1 con xúc xắc, tính xác suất để mặt số 1 không hiện lên trong 10 lần quay.
2.8. Giả sử số cây của một loại (mà ta quan tâm) trong một khu vườn trên 1 m2 diện tích
là tuân theo phân bố Poisson λ = 5 . Tính xác xuất để có tìm được đúng 7 cây. Tính xác
xuất để tìm được đúng hoặc ít hơn 3 cây.
2.9. Cho phân bố Poisson với kỳ vọng là λ. Biết xác xuất để tìm được giá trị 0 là
0,000553. Tính λ.

32
2.10. Cho biết khoảng thời gian giữa 2 lần liên tiếp có khách hàng trong một cửa hiệu tuân
theo phân bố hàm mũ có kỳ vọng là 15 phút (cho biết sự xuất hiện của khách hàng tiếp
theo là hoàn toàn độc lập với khách hàng trước đó). Hỏi xác xuất để có hơn 6 khách hàng
đến cửa hiệu trong một giờ là bao nhiêu?
2.11. Một thiết bị ghi bức xạ vũ trụ ghi nhận (trong khoảng năng lượng cho trước) 414 tia
bức xạ trong 3 phút. Tính số đếm trung bình trong 1 giây và xác xuất để quan sát được 1
bức xạ trong 1 giây.
2.12. Thí nghiệm đếm tia gamma phát ra từ nguồn trong khoảng thời gian 1s cho kết quả
5212 số đếm. Hãy xác định độ lệch chuẩn tuyệt đối và độ lệch chuẩn tương đối của số đếm
ghi nhận được. Để có được độ lệch chuẩn tương đối 1% thì cần phải đo trong khoảng thời
gian bao lâu.
2.13. Phòng thí nghiệm ở quặng muối gần Clevaland, Ohio thực hiện hoạt động đo neutrino
bằng đầu dò proton phát hiện một vụ nổ 8 neutrinos bằng hệ đo trùng phùng với sự quan
sát quang học vụ nổ Supernova 1987A. Hỏi:
a. Nếu số neutrino trung bình được phát hiện trong thiết bị này là 2 hạt/ngày. Hãy
xác định xác suất để có số đếm từ 8 hạt trở đi trong một ngày.
b. Trong thực tế, 8 hạt neutrino được phát hiện trong khoảng thời gian 10 phút. Hỏi
xác suất phát hiện từ 8 hạt neutrino trở đi trong 10 phút nếu tốc độ trung bình là 2
hạt/24 giờ.
2.14. Hãy chứng minh trong phân bố Gauss, bề rộng toàn phần ở một nữa chiều cao cực đại
có liên hệ với độ lệch chuẩn theo hệ thức: FWHM = 2,354σ.
2.15. Phân bố xác suất của tổng số điểm hiển thị trên cặp xúc sắc được cho bởi:
x -1
2≤ x≤7
36
f (x) =
13 - x 7 ≤ x ≤ 12
36
2.16. Vào giờ cao điểm của một ngày bình thường, 25% xe đến ngã ba đường rẽ trái và
75% rẽ phải. Vào một ngày cụ thể, người ta quan sát thấy có 283 xe rẽ trái và 752 xe rẽ

33
phải. Hãy đánh giá độ bất định (sai số) của hai dữ liệu này và xác suất để có được giá trị
khác xa hoặc xa hơn trị trung bình so với kết quả được đo vào một ngày cụ thể.
2.17. Số xe ca x đến tại giao lộ trong một đơn vị thời gian quy định thuộc phân bố Poisson.
Nếu biết số xe ca trung bình đến đúng giao lộ trong thời gian đó là λ, người kỹ sư giao
thông có thể thiết kế hệ thống kiểm soát đường. Giả sử λ trong 1 phút bằng 1. Hãy xác
định:1) Xác suất để trong 1 phút số xe bằng hoặc lớn hơn 3; 2) Có chắc là số xe đến giao lộ
vượt quá 3 trong 1 phút ít khi xảy ra?
2.18. Trong một xí nghiệp có một loại máy mà thời gian trung bình giữa hai lần dừng do sự
cố là 2 giờ. Thời gian giữa hai lần dừng máy thuộc phân bố mũ. Hãy xác định xác suất để
thời gian này lâu hơn 2 giờ.
2.19. Tốc độ gió (km/s) thuộc phân bố hàm mũ. Ở một vùng cao nguyên có tốc độ gió
trung bình trong năm là 5 km/s. Hãy tính: 1) Xác suất để tốc độ gió dưới 5 km/s; 2) Xác
suất để tốc độ gió lớn hơn 10 km/s.

34
CHƯƠNG 3
SỰ TRUYỀN SAI SỐ VÀ CÁC PHƯƠNG PHÁP
TỐI ƯU HÓA ĐỂ GIẢM SAI SỐ THỐNG KÊ
3.1. Sự truyền sai số
Các phân bố đã trình bày ở chương 2 mô tả đặc trưng thăng giáng thống kê của các
đại lượng đo đếm trực tiếp. Trong thực tế, đại lượng mà ta quan tâm là một hàm của các
đại lượng đo đếm trực tiếp. Ví dụ ta cần quan tâm đến tốc độ đếm (số đếm trên một đơn vị
thời gian), tốc độ đếm thực của nguồn, hoạt độ phóng xạ của mẫu cần đo,… Khi đó chúng
ta cần đánh giá độ lệch chuẩn của các đại lượng này thông qua các đại lượng đo được trực
tiếp.
Gọi x, y, z,... là các biến ngẫu nhiên độc lập được đo đếm trực tiếp, có độ lệch chuẩn
( sai số 1-sigma) ký hiệu là σ x , σ y và σ z ,... Giả sử f (x, y, z,...) là một hàm của các biến

ngẫu nhiên độc lập x, y, z,...Khi đó độ lệch chuẩn của f, ký hiệu σ f được tính bởi
2
 ∂f 
2
 ∂f 
2
 ∂f 
σ f =   σ 2x +   σ 2y +   σ 2z + ...
2
(3.1)
 ∂x   ∂y   ∂z 
Công thức (3.1) được gọi là công thức truyền sai số.
Ta thử áp dụng tính sai số cho một số hàm đơn giản sau đây.
3.1.1. Các hàm cộng hoặc trừ đơn giản
Giả sử ta có hàm f = x + y hoặc f = x – y (3.2)
∂f ∂f
Khi đó = 1 và = ±1
∂x ∂y
Áp dụng (3.1) cho ta
σ f2 = (1) 2 σ 2x + (±1) 2 σ 2y

35
Vậy σ f2 = σ 2x + σ 2y hay σ f = σ 2x + σ 2y (3.3)

Hay độ lệch chuẩn tương đối

σf σ 2x + σ 2y
δf = = (3.4)
f x±y

Phép tính sai số này được áp dụng trong việc xác định sai số của số đếm thật của
nguồn phóng xạ sau khi trừ số đếm tổng x cho phông y, f = x – y.
Giả sử x = 1071 và y = 521 thì σ x = x = 1071 và σ y = y = 521 . Còn số đếm f

=1071-521=550 với độ lệch chuẩn σ f = σ 2x + σ 2y = 1071 + 521 = 39,9 ≈ 40 . Hay độ lệch

σ f 39,9
tương đối δ f = = = 0,07 = 7%
f 550
Vậy số đếm f = 550 ± 40.
Hay f = 550 với độ lệch tương đối 7%.
3.1.2. Các hàm nhân và chia
1. Hàm f là tích của hằng số k với biến số x.
Giả sử f = kx , (3.5)
với k là hằng số và x là biến ngẫu nhiên có độ lệch chuẩn σ x .
Vậy theo (3.1) ta có:
Độ lệch chuẩn của f là σ f = kσ x (3.6)
σ f kσ x σ x
Và độ lệch tương đối của f là δ f = = = = δx (3.7)
f kx x
2. Hàm f là thương của hằng số k với biến số x
x
Giả sử f = , (3.8)
k
với k là hằng số và x là biến ngẫu nhiên có độ lệch chuẩn σ x . Vậy theo (3.1):
σx
Độ lệch chuẩn của f là σ f = (3.9)
k
σf k σx σx
Và độ lệch tương đối của f là δ f = = = = δx (3.10)
f x k x

36
N
Phép tính sai số này được áp dụng trong việc xác định sai số của tốc độ đếm R = ,
t

với N số đếm trong thời gian đo t. Giả sử N = 1120 và t = 5 s thì σ N = N = 1120 = 33,47 .

N 1120 σ 33,47
Tốc độ đếm bằng R = = = 224 , sai số của tốc độ đếm là σ R = N = = 6,7s −1 .
t 5 t 5
6,7
Sai số tương đối là δ R = = 3% . Vậy:
224

R = (224 ± 7)s −1 hay R = 224 với sai số tương đối 3%.


3. Hàm f là tích của hai biến số x và y
f = xy thì (3.11)
σ f2 = y 2 σ 2x + x 2 σ 2y (3.12)

 σ   σy
2
σ  
2 2

δ f =  f  =  x  + 
2
 = δ 2x + δ 2y (3.13)
 f   x   y 
4. Hàm f là thương của hai biến số x và y
x
f= thì (3.14)
y

1 2 x2 2
σ f2 = σx + 4 σy (3.15)
y2 y

 σx   σy 
2
 σf 
2 2

δf =   =   +   = δ x + δ y
2 2 2
(3.16)
 f   x   y 

Phép tính sai số này được áp dụng trong việc xác định sai số của tỉ số giữa hai số đếm
N1 và N2 từ hai nguồn phóng xạ trong cùng một khoảng thời gian.
N1
Giả sử N1=16265 và N2 = 8192, tỉ số R = = 1,985 và
N2

σ N1 σ N2
2 2
σR
2
N1 N 2 1 1
= + = 2 + 2 = + = 1,835 ×10 4 suy ra
R N1 N2 N1 N 2 N1 N 2

σR
= 0,0135 và σ R = 0,027 .
R
Vậy R = 1,985 ± 0,027 .

37
3.1.3. Độ lệch chuẩn của trị trung bình
Giả sử ta có k lần lặp lại số đếm (x1, x2, x3,…xk) của cùng một nguồn phóng xạ với
thời gian đếm như nhau. Tổng của các số đếm này là:
∑ = x 1 + x 2 + x 3 + ... + x k (3.17)

Nếu các số đếm độc lập x1, x2, x3,..., xk có các độ lệch chuẩn tương ứng là σ x = x 1 ,
1

σ x 2 = x 2 , σ x 3 = x 3 , . . . σ x k = x k thì độ lệch chuẩn của tổng ∑ là:

σ ∑2 = σ 2x1 + σ 2x 2 + ... + σ 2N = x 1 + x 2 + ... + x k = ∑

Hay σ ∑ = ∑ (3.18)
Sau khi có tổng ∑ ta tính số đếm trung bình:

x= (3.19)
k
Độ lệch chuẩn của trị trung bình:
σ∑ ∑ kx x
σx = = = =
k k k k

x
σx = (3.20)
k
Do các phép đo độc lập xi không khác xa lắm giá trị trung bình x nên độ lệch chuẩn
của chúng gần bằng nhau và bằng σ x . Khi đó σ 2 = kσ 2x và σ = kσ x . Như vậy:
∑ ∑

σ∑ σx
σx = = (3.21)
k k
Như vậy độ lệch chuẩn của trị trung bình nhỏ hơn độ lệch chuẩn của từng phép đo
thành phần k lần. Vậy để giảm sai số thống kê của một phép đo xuống k lần ta phải tăng
thời gian đo lên k2 lần.
3.1.4. Độ lệch chuẩn của tốc độ đếm thực
Đại lượng thường được dùng trong vật lý hạt nhân thực nghiệm để tính các đại lượng
khác, không phải là số đếm tổng mà là tốc độ đếm, tức là số đếm mà detector ghi nhận
được trong một đơn vị thời gian. Ta gọi G là số đếm tổng cộng mà detector ghi nhận được
trong thời gian tG, B là số đếm mà detector ghi nhận khi không có mẫu trong thời gian tB

38
(số đếm phông). Như vậy tốc độ đếm của cả mẫu lẫn phông là g = G/tG và tốc độ đếm của
chỉ riêng phông là b = B/tB. Khi đó tốc độ đếm của chỉ riêng mẫu sẽ là:
G B
r= − =g−b (3.22)
tG tB

Cần chú ý rằng trong công thức trên ta chưa tính đến hiệu chỉnh thời gian chết. Nếu
tốc độ đếm đủ lớn thì hiệu ứng làm mất số đếm do thời gian chết sẽ xuất hiện và khi đó giá
trị của r cần được hiệu chỉnh thời gian chết.
Dùng công thức truyền sai số ta có thể đánh giá được độ lệch chuẩn chuẩn của tốc độ
đếm thực nếu giả thiết các đại lượng G, tG, B và tB là những đại lượng ngẫu nhiên độc lập:
2 2
 ∂r  2  ∂r  2  ∂r  2  ∂r  2
2 2

σr =   σG +   σ t G +   σ B +   σ t B (3.23)
 ∂G   ∂t G   ∂B   ∂t B 
Ngày nay, các thiết bị điện tử dùng trong vật lý là khá hoàn hảo đến mức có thể xem
sai số của thời gian đo rất nhỏ so với sai số thống kê số đếm. Khi đó công thức của độ lệch
chuẩn của tốc độ đếm thực sẽ trở nên đơn giản hơn:

 ∂r  2  ∂r  2
2 2

σr =   σG +   σB (3.24)
 ∂G   ∂B 

Vì độ lệch chuẩn của G và B tương ứng là σ G = G và σ B = B nên cuối cùng ta có:

G B
σr = + (3.25)
t G2 t 2B

Cần chú ý rằng chỉ có các đại lượng G, B, tG và tB là các đại lượng độc lập, còn hai
đại lượng g và b không phải là độc lập với nhau. Độ lệch chuẩn của r được tính qua G, B,
tG và tB.
Ví dụ 3.1. Khi đo một mẫu phóng xạ ta được kết quả sau: G = 1000, tG = 2 phút, B = 500,
tB = 10 phút. Hãy xác định tốc độ đếm và độ lệch chuẩn của nó.
Giải:
G B 1000 500
r= − = − = 500 − 50 = 450 số đếm/phút
tG tB 2 10

39
G B
σ r = σ g2 + σ 2b = + = 16 số đếm/phút
t G2 t 2B

Vậy r = ( 450 ± 16) số đếm/phút.


Ví dụ 3.2. Khi đo một mẫu phóng xạ trong thời gian 2 phút, hệ đo ghi được 1000 số đếm.
Người ta đã biết trước rằng tốc độ đếm của phông là b = 100 ± 6 số đếm/phút. Hãy xác
định số đếm và độ lệch chuẩn của nó.
Giải:
G
r= − b = 1000 / 2 − 100 = 400 số đếm/phút.
tG

 ∂r  2  ∂r  2
2 2
G
σr =   σ G +   σ b = 2 + σ b = 286 = 17 số đếm/phút.
2

 ∂G   ∂b  tG

Chú ý rằng trong ví dụ này ta chỉ biết thông tin về G, b và σ b . Do đó khi áp dụng
công thức truyền sai số các biến ngẫu nhiên gây sai số là G và b.
3.2. Các phương pháp tối ưu hóa nhằm giảm sai số thống kê trong phép đo bức xạ
Khi thực hiện thí nghiệm đo bức xạ, cần phải vạch ra phương án thí nghiệm sao cho
kết quả nhận được có sai số nhỏ nhất. Việc đầu tiên cần nghĩ đến là phải tối ưu hóa hệ đo
sao cho số đếm phông càng nhỏ càng tốt. Điều này có nghĩa là cần phải giảm tỉ số b/g (số
đếm phông/số đếm tổng). Giả sử rằng hệ đo đã được tối ưu theo mục tiêu trên thì việc tiếp
theo là tối ưu hóa quy trình đo theo một số tham số quan trọng nhất. Loại tham số nào cần
phải tối ưu tùy thuộc vào cấu hình và điều kiện cụ thể của từng thí nghiệm. Dưới đây
chúng ta xem xét một vài tham số quan trọng cần phải tối ưu trong bài toán ghi đo bức xạ
thường gặp.
3.2.1. Đối với phép đo hiệu hai cường độ
1. Trường hợp phông không đổi và không thể kéo dài thời gian đo
Trong trường hợp này, cần phải tăng tối đa thời gian đo phông để giảm sai số của số
đếm phông. Nếu thời gian đo phông đủ lớn thì:
G B G
σr = + ≈ (3.26)
t G2 t 2B t G2

Ví dụ 3.3. Giả sử số liệu của phép đo là:


40
G = 400 số đếm trong tG = 5 phút,
B = 100 số đếm trong tB = 2,5 phút.
Khi đó
r = 400/5-100/2,5 = 40 số đếm/phút.
G B 400 100
σr = + = + = 5,65 số đếm/phút.
t G2 t 2B 52 2,5 2

σ r 5,65
Vậy = = 0,14 = 14% .
r 40
Nếu phông không thay đổi thì có thể giảm sai số của kết quả đo bằng cách tăng thời
gian đo phông lên càng lâu càng tốt. Giả sử thời gian đo phông bây giờ là 250 phút. Lúc
này ta có:
100
B= 250 = 10000 số đếm.
2,5
Khi đó r = 400/5 -10000/250 = 40 số đếm/phút, và độ lệch chuẩn của r là:
400 10000
σr = + = 16 + 0,16 ≈ 4
52 250 2
σr 4
Và sai số tương đối chỉ còn = = 10% .
r 40
2. Trường hợp tổng thời gian đo của cả phông lẫn mẫu cố định là T
Trong thực nghiệm, để đo số đếm thực R của nguồn phóng xạ cần tiến hành hai phép
đo: đo số đếm tổng G với thời gian đo tG và số đếm phông B với thời gian đo tB. Giả sử
thời gian đo toàn bộ là T = tG + tB = const. Bài toán đặt ra ở đây là chọn lựa tG và tB sao cho
sai số phép đo số đếm thực R là nhỏ nhất.
Gọi g là tốc độ đếm tổng, r là tốc độ đếm của nguồn và b là tốc độ đếm phông. Như
vậy ta có:
G B B
r= − và b = (3.27)
tG tB tB

Theo công thức truyền sai số (3.1) phương sai của r được xác định như sau:

41
2 2
σ   σB  G B  g b
σ =  G
2
r
 +   =  2 + 2  =  +  (3.28)
 tG   tB   tG tB   tG tB 
Đại lượng σ 2r nhỏ nhất khi đạo hàm riêng của nó theo các biến thời gian tG và tB
bằng không, ta được:
g b
2σ r dσ r = − 2
dt G − 2 dt B = 0
tG tB
Vì T = const nên dT = 0 suy ra dtG = -dtB và do đó:
tG g
= (3.29)
tB opt
b

Biểu thức (3.29) cho ta sự phân chia tối ưu giữa thời gian đo tổng tG và thời gian đo
phông tB với điều kiện T= tG + tB = const. Như vậy việc xác định tốc độ đếm thực (hiệu số
giữa hai tốc độ đếm) tốt nhất khi thời gian trong phép đo có tốc độ đếm lớn của mẫu g thì
lớn hơn thời gian trong phép đo tốc độ đếm thấp b. Thời gian tối ưu được chọn tỉ lệ với căn
bậc hai của tốc độ.
Từ (3.28) và (3.29) suy ra:
g+ b
(σ r ) min = (3.30)
T
Để phân chia thời gian thích hợp cho phép đo theo (3.29) cần phải biết ít nhất các giá
trị thô của tốc độ đếm. Nếu chúng ta không biết trước chúng thì để ước đoán ta có thể thực
hiện vài phép đo sơ bộ với khoảng thời gian tương đối ngắn. Từ đó các giá trị g và b có thể
được đánh giá xấp xỉ và việc chọn thời gian tối ưu được ước lượng thô. Sau đó dùng thời
gian tối ưu của ước lượng thô này trong đo đạc thật để có được giá trị (σ r ) min .
Chú ý rằng (σ r ) min chỉ có được khi xác định từ (3.30) với thời gian phân bố tối ưu
theo (3.29) một cách chính xác.
3. Tìm thời gian đo tối ưu sao cho tốc độ đếm thực đạt độ chính xác thống kê mong
muốn
- Bây giờ ta xét bài toán tìm thời gian đo T tối ưu sao cho sai số của tốc độ đo số
đếm thực đạt được giá trị δ nào đó đã thiết lập trước.
Từ (3.28) ta có:

42
1/ 2
σ  g b
δ = r =  +  (g − b ) (3.31)
r  tG tB 

Kết hợp với (3.29) suy ra:


( g + b )2
T= (3.32)
(g − b) 2 .δ 2

Từ (3.32) suy ra thời gian đo T tỉ lệ nghịch với bình phương của sai số tương đối của
tốc độ đếm nguồn r.
- Trên thực tế thường tốc độ đếm phông b không đổi, gọi độ lệch chuẩn của b là σ b .
Bài toán thường đặt ra là cần phải đo mẫu với thời gian đo tG bao lâu để đạt được độ sai số
tương đối mong muốn δ .
G G
Ta có r = − b và σ r = 2
+ σ 2b
tG tG

σr G / t G2 + σ 2b g / t G + σ 2b
Suy ra =δ= = . Nghiệm của phương trình này là:
r G / tG − b g−b

g
tG = (3.33)
(g − b) δ 2 − σ 2b
2

Ở đây giả thiết rằng đã biết giá trị gần đúng của tốc độ đếm tổng g.
Ví dụ 3.4. Giả sử tốc độ đếm phông của hệ đo là 100 ± 2 số đếm/phút. Hãy tính thời gian đo
sao cho sai số tương đối của tốc độ đếm của mẫu đo là 1%.
Giải: Đầu tiên ta cần đo sơ bộ để xác định tốc độ đếm tổng (mẫu+phông). Giả sử
phép đo sơ bộ này được thực hiện trong 2 phút và hệ đo ghi nhận được 800 số đếm. Khi đó
g = 800/2 = 400 số đếm/phút. Tiếp theo ta có:
400
tG = = 80 phút.
(400 − 100) 2 (0,01) 2 − 2 2

Thật vậy, nếu ta đo mẫu trong thời gian 80 phút thì sai số của tốc độ đếm r là

σr g / t G − σ 2b 400 / 80 + 2 2
= = = 1% .
r g−b 400 − 100

3.2.2. Phép đo tỉ số tốc độ đếm


1. Đánh giá tỉ số
43
Sự phân chia thời gian đo theo (3.29) có ưu điểm khi chúng ta muốn xác định hiệu
giữa hai tốc độ đếm. Trong bài toán xác định hệ số hấp thụ, người ta quan tâm đến tỉ số
hoạt độ giữa hai nguồn, thì việc phân chia thời gian đo sẽ khác đi.
n1
Định nghĩa R = , với n1, n2 là tốc độ đếm của nguồn 1 và 2. (3.34)
n2

Gọi N1, N2 là số đếm đo được đối với nguồn 1 và 2 trong khoảng thời gian đo tương
ứng t1, t2.
N1 N
Ta có n 1 = và n 2 = 2
t1 t2

N1 t 2
Vậy R =
N 2 t1

Áp dụng công thức truyền sai số của các N1 và N2 vào R ta có độ lệch tương đối của
R được cho bởi:
σR 1 1
= + (3.35)
R n1t1 n 2 t 2

Đặt T = t1+t2, khi đó t1 và t2 được xác định tối ưu khi σ R cực tiểu. Kết quả cho:

t2 n1
= (3.36)
t1 n2

σ R  1 1 
Suy ra = + T (3.37)
R  n 1 n 2 

Như vậy trong việc xác định tỉ số hai tốc độ đếm, khác với trường hợp hiệu hai tốc độ
đếm ta thấy thời gian trong phép đo cường độ nhỏ thì lớn hơn thời gian trong phép đo
cường độ lớn. Sự phân bố tối ưu là thời gian tỉ lệ nghịch với căn bậc hai của cường độ.
Cũng như trên, trong trường hợp xác định tỉ số, sự phân bố thời gian chỉ được ước
lượng khi ta biết ít nhất giá trị thô của tỉ số tốc độ đếm. Do đó trong thực tế phải thực hiện
một vài đánh giá sơ bộ các số đếm trong khoảng thời gian tương đối ngắn.
2. Xác định hệ số hấp thụ từ hai số liệu đo được
Tỉ số hai cường độ được sử dụng khi ước lượng hệ số hấp thụ.
Cường độ bức xạ sau khi qua chất hấp thu bề dày x là:
44
n ( x ) = n (0) exp(−µx ) (3.38)
N1 N
Với n (0) = ; n(x) = 2
t1 t2

1  n ( 0)  1   N 1  t 
Suy ra µ = ln   = ln  + ln 2  (3.39)
x  n(x)  x   N 2   t1 

1 1 1
Và σ µ = + (3.40)
x N1 N 2

Theo trên sự phân chia thời gian tối ưu là:


t2 n1 n ( 0) µx
= = = exp( ) (3.41)
t1 n2 n(x) 2

Ở trên ta đã đưa ra phương pháp tốt nhất để xác định hệ số hấp thụ bằng cách đo tốc
độ đếm theo bề dày x cho trước. Bây giờ vấn đề đặt ra là chọn bề dày chất hấp thu tối ưu.
Xét công thức (3.40) khi x → 0 và x → ∞ thì σ µ → ∞ . Vậy tồn tại x = x 0 để σ µ cực tiểu.

Đó là:
µx 0 = 2,56 (3.42)
n (0)
Hay = 12,9
n(x)

t2
Do đó = 3,6 . (3.43)
t1

Từ kết quả trên ta có thể kết luận ở bề dày tối ưu cường độ giảm theo tỉ số 1/13 còn
thời gian đo phân bố theo tỉ lệ 1/3,6. Ở đây thời gian đo dài dành cho phép đo ở bề dày x0.
Độ lệch σ µ khi được xác định trong những điều kiện tối ưu là

0,95
σµ = với N là số đếm toàn phần. (3.44)
N
Chú ý rằng bề dày tối ưu x0 được biết khi đã biết µ . Trong thực tế ta phải đo sơ bộ
các giá trị µ của chất hấp thụ một cách tùy ý rồi từ đó mới suy ra x0 và µ của chất hấp thụ
mà ta muốn đo.
3.3. Vai trò của các thành phần sai số

45
Như đã nói ở trên, một trong những mục tiêu quan trọng khi đo bức xạ là phải giảm
sai số xuống mức thấp nhất. Nếu kết quả đo có đóng góp của nhiều thành phần sai số thì ưu
tiên trước hết là thiết kế thí nghiệm sao cho sai số của các thành phần có đóng góp nhiều
nhất vào kết quả cuối cùng. Giả sử kết quả cuối cùng Q = x+y-z và giả sử x = 3,0; y = 2,00
và z = 1,00 với các sai số tương ứng là σ x = 0,1 ; σ y = 0,23 và σ z = 0,05 . Sai số chuẩn của Q

sẽ là

σ Q = σ 2x + σ 2y + σ 2z = 0,12 + 0,232 + 0,052 = 0,3 (3.45)

Để giảm sai số của Q thì cần giảm sai số của y đầu tiên, tiếp theo là sai số của x và
cuối cùng mới là sai số của z. Thực tế ta cũng không cần giảm sai số của z vì sai số của z
vốn đã quá nhỏ so với sai số của x và y.

Bài tập chương 3


3.1. Chứng minh công thức truyền sai số (3.1). Nếu các biến x, y …không độc lập thì cần
bổ sung như thế nào trong công thức (3.1)?
3.2. Trong thí nghiệm tán xạ để đo sự phân cực của một hạt cơ bản người ta thấy có N =
1000 hạt được tán xạ từ bia, người ta thấy có 670 hạt được quan sát tán xạ từ bên phải và
330 hạt tán xạ về bên trái. Giả sử rằng không có sai số trong N = NR + NL
a. Dựa vào giá trị xác suất thực nghiệm đo được tính sai số tương ứng của NR và NL.
b. Tham số bất đối xứng được định nghĩa:
A = (NR – NL)/(NR+NL)
Tính độ bất đối xứng thực nghiệm và sai số tương ứng.
3.3. Một nguồn phóng xạ được đo trong 1 phút cho số đếm 561. Sau đó cất nguồn đo
phông trong 1 phút được số đếm 410. Xác định số đếm thực của nguồn và độ lệch chuẩn
của nó tương ứng.
3.4. Đo số đếm từ nguồn phóng xạ trong 10 phút được số đếm tổng là 846. Sau đó cất
nguồn đo phông trong 10 phút được số đếm 73. Xác định tốc độ đếm thực của nguồn và độ
lệch chuẩn của nó tương ứng.

46
3.5. Tìm sự phân bố thời gian đo tối ưu (để sai số chuẩn của tốc độ đếm thực của nguồn
cực tiểu) cho phép đo phông và nguồn ở bài toán 3.3 khi lặp lại phép đo với tổng thời gian
cho phép là 20 phút. Với sự phân bố thời gian đo tối ưu xác định được hãy đánh giá xem
sai số thống kê sẽ giảm bao nhiêu so với sai số chuẩn đã tính ở bài toán 3.3.
3.6. Một phép đo nguồn phóng xạ trong 10 phút cho kết quả sai số thống kê là 2,8%. Hỏi
cần phải tăng thời gian đo lên bao nhiêu để giảm sai số thống kê còn 1,0%.
3.7. Số liệu đo nguồn A và nguồn B của cùng một đồng vị được cho trong bảng dưới đây:
Số đếm Thời gian đo (phút)
Nguồn A+phông 251 5
Nguồn B+phông 717 2
Phông 51 10
Hãy xác định tỉ số của hoạt độ nguồn B so với hoạt độ của nguồn A và độ lệch chuẩn
tương đối của tỉ số này?
3.8. Số đếm phông của một detector được đo trong 30 phút là 845. Sau đó đo nguồn
phóng xạ, kết quả làm tăng tốc độ đếm tổng lên 80 số đếm/ phút. Hãy ước lượng thời gian
đo tổng cần thiết để tốc độ đếm nguồn có độ lệch chuẩn tương đối là 3%.
3.9. Một hệ thống đếm có tốc độ đếm phông trung bình ổn định là 50 số đếm/phút. Dùng
hệ này để đo nguồn phóng xạ được số đếm toàn phần trong 10 phút là 1683. Sau khi để
khoảng 24 giờ, đo lại nguồn trên và được số đếm tổng cộng là 914 trong 10 phút. Xác định:
a) Thời gian bán rã của nguồn này.
b) Độ lệch chuẩn của thời gian bán rã do bởi thăng giáng thống kê số đếm.
3.10. Một phép kiểm tra sự ăn mòn của một động cơ được thực hiện ở đó cần xác định
khối lượng hạt phóng xạ từ vòng piston rơi vào mẫu dầu. Việc đếm phóng xạ từ mẫu dầu
sử dụng trong khoảng thời gian 3 phút cho kết quả là 13834. Một mẫu chuẩn được chế tạo
có độ chính xác 100 µg của cùng chất liệu phóng xạ cho số đếm 91396 trong 10 phút.
Phông từ detector này là 282 số đếm/phút được đo trong thời gian dài. Tìm khối lượng hạt
phóng xạ trong mẫu và độ lệch chuẩn tương đối của nó.
3.11. Diện tích của một tam giác được tính bởi: A = (b × h)/2. Với b là cạnh đáy, h là
chiều cao. Với dữ liệu đo được b = (5,0 ± 0,1) cm và h = (10,0 ± 0,3) cm. Hãy xác định sai

47
số tương đối của b và h; tính toán diện tích A và sai số tuyệt đối và tương đối của A. Nhận
xét về độ lớn của các giá trị sai số tuyệt đối, tương đối của b và h cũng như đóng góp của
chúng vào sai số tương đối của A.
3.12. Diện tích của hình tròn tỉ lệ với bình phương bán kính: A = πr2. Giả sử giá trị đo
được của bán kính là r = 10,0 ± 0,3 cm. Hãy xác định sai số tương đối của r, xác định A và
sai số tương đối của A. Nhận xét.
3.13. Diện tích của hình chữ nhật được xác định bởi tích của chiều dài L và chiều rộng W
của hình chữ nhật: A = L × W. Cho biết L = (22,1 ± 0,1) cm và W = (7,3 ± 0,1) cm. Hãy
xác định sai số tương đối của L và W; xác định A và sai số tương đối của A. Cho biết đóng
góp thăng giáng thống kê của đại lượng nào (L, W) là quan trọng trong sai số của A.
3.14. Cho x là một hàm của u và v dưới dạng sau đây. Tìm độ bất định của x khi biết độ
bất định của u, v.
a. x =1/2(u+v)
b. x =1/2(u-v)
c. x = 1/u2
d. x = uv2
e. x = u2+ v2.
3.15. Nếu đường kính của cái bàn tròn được xác định với sai số tương đối 1%, hỏi diện
tích của nó được xác định tốt đến mức nào? Nó có tốt hơn giá trị được xác định từ bán kính
với sai số tương đối 1%?
3.16. Điện trở của một vật dẫn hình trụ tỉ lệ với chiều dài L và tỉ lệ nghịch với diện tích A
= πr2. Hãy cho biết đại lượng nào (L hay r) cần được xác định với độ chính xác cao, và cao
hơn bao nhiêu để tối ưu việc xác định R.
3.17. Hoạt độ ban đầu N0 và thời gian sống trung bình τ của một nguồn phóng xạ được
biết với độ bất định 1% cho mỗi loại. Hoạt độ ở thời điểm t được xác định bởi:
Nt= N0 exp(-t/τ)

48
Biết rằng độ bất định của N0 chi phối nhiều ở thời gian t nhỏ, độ bất định của τ chi phối
mạnh ở thời gian t lớn (t>> τ). Hỏi giá trị t/τ nào là cần thiết để độ bất định của N0 và
τ đóng góp bằng với độ bất định trong Nt.
3.18. Định luật Snell nêu mối liên hệ giữa góc khúc xạ θ2 của tia sáng đi qua môi trường
có chiết suất khúc xạ n2 với góc tới θ1 của tia tới đi từ trong môi trường có chiết suất n1
như sau: n2 sin θ2 = n1 sin θ1. Tính toán n2 và độ bất định của nó, khi biết được: θ1 = (22,03
± 0,20)o; θ2 = (14,45 ± 0,20)o; n1 = 1,0000.
3.19. Sự thay đổi tần số do bởi hiệu ứng Doppler khi nguồn âm có tần số f di chuyển với
vận tốc v so với người quan sát đứng yên được cho bởi: ∆f = f v/(u-v). Với u là vận tốc
âm. Cho giá trị của f, u, v và độ bất định của chúng, hãy tính toán ∆f và độ bất định của
∆f.
u = (332 ± 8) m/s f = (1000 ± 1) Hz v = (0,123 ± 0,003) m/s
3.20. Bán kính R của vòng tròn được xác định từ phép đo chiều dài dây cung và khoảng
cách h từ dây cung tới chu vi đường tròn: R = L2/2h + h/2. Hãy tính giá trị của R và độ bất
định của nó từ các giá trị đo được của L và h sau đây:
a. L = (125,0 ± 5,0) cm ; h = (0,51 ± 0,22) cm
b. L = (125,0 ± 5,0) cm ; h = (57,4 ± 1,2) cm
Cho biết có cần thiết sử dụng số hạng thứ hai trong tính toán của R ở cả hai câu a và b
không? Tại sao?
3.21. Các sinh viên đo vận tốc âm trong phòng thí nghiệm bằng cách tạo ra xung âm đi
xuống một ống dài 1 m và phản xạ ngược lại sao cho cả xung đầu và xung phản xạ được
ghi nhận bởi cùng một microphone.Tín hiệu được ghi bởi máy tính và biên độ xung theo
thời gian được hiển thị trên màn hình. Sinh viên đo khoảng thời gian của 10 cặp xung như
thế trên màn hình theo milliseconds:
i 1 2 3 4 5 6 7 8 9 10
t (ms) 5,77 5,78 5,74 5,80 5,78 5,83 5,76 5,78 5.76 5,78

a. Hãy kiểm tra dữ liệu và đánh giá độ phân tán của dữ liệu (độ lệch chuẩn).

49
b. Hãy xác định thời gian t trung bình, độ lệch chuẩn của mẫu và độ lệch chuẩn của
trị trung bình.
c. Một trong các giá trị thời gian đo được lớn hơn 2 độ lệch chuẩn. Hỏi trong 10
biến cố khảo sát, có bao nhiêu phép đo được dự đoán từ thống kê Gauss lệch khỏi
trị trung bình bằng hoặc lớn hơn 2 lần độ lệch chuẩn.
d. Tính toán vận tốc âm và độ bất định của nó từ dữ liệu đo được.
3.22. Sinh viên đo số đếm của nguồn phóng xạ trong thời gian 1 phút. Cho biết tốc độ
phân rã danh định của nguồn là 3,7 phân rã/ phút (dpm). Hãy xác định:
a. Tốc độ phân rã trung bình và độ lệch chuẩn của nó. So sánh độ lệch chuẩn tính
toán được với giá trị kỳ vọng từ phân bố Poisson với trị trung bình có được.
b. Vẽ biểu đồ của dữ liệu đo và trình bày đường cong Poisson của phân bố lý
thuyết và phân bố thực nghiệm.
dpm 0 1 2 3 4 5 6 7 8 9 10
r 1 9 20 24 19 11 11 0 3 1 1
Ghi chú: r là tần số xuất hiện.

50
CHƯƠNG 4
ƯỚC LƯỢNG TRỊ TRUNG BÌNH VÀ PHƯƠNG SAI

4.1. Giới thiệu


Khi tính toán thống kê cần biết giá trị các tham số θ của đám đông như trị trung bình
µ , phương sai σ 2 , xác suất p của biến cố ω mà ta quan tâm. Giá trị thực của θ khó mà biết

được vì ta không quan sát hết được tất cả các phần tử của đám đông. Ta chỉ có một cách là
ước lượng nó.
Con đường để tìm θ của đám đông là lấy mẫu ngẫu nhiên từ đám đông đó. Chú ý đối
với mẫu ta cũng có hàm phân phối mẫu, trung bình và phương sai của mẫu,… tương ứng
với những tham số của đám đông mà ta muốn tìm. Giữa đám đông và mẫu có mối liên hệ
với nhau. Vậy để ước lượng tham số θ của đám đông ta dùng thống kê tương ứng.
4.2. Phương pháp ước lượng - Nguyên lý cơ hội cực đại (maximum likelihood)
Theo nguyên lý này, phán đoán điều chưa biết θ bằng ước trị θ̂ từ mẫu được chọn
sao cho chính θ̂ có cơ hội cực đại xảy ra.
Hàm cơ hội
Cho biến ngẫu nhiên x tuân theo phân bố f ( x, θ) với dạng của f đã biết còn θ là tham
số. Để ước lượng θ , ta lấy mẫu ( x 1 , x 2 ,..., x n ) . Từng biến x i có được với xác suất f ( x i , θ) .
Xác suất để mẫu ( x 1 , x 2 ,..., x n ) này xảy ra chính là tích của các f ( x i , θ) và ta gọi đó là hàm
cơ hội
n
L(θ) = f ( x 1 , θ).f ( x 2 , θ)....f ( x n , θ) = ∏ f ( x i , θ) (4.1)
i =1

51
Nếu mẫu đã được thực hiện, các giá trị của x i sẽ được biết, còn lại biến là θ̂ .

Theo nguyên lý cơ hội cực đại, ước trị θ̂ được chọn sao cho L(θ) đạt cực đại, tức là
mẫu có nhiều cơ hội xảy ra nhất.
∂L(θ)
=0
∂θ (4.2)
Giải phương trình (4.2) ta tìm được θ̂ .
Thường để tiện việc tính toán ta chuyển sang dạng
∂Ln[L(θ)]
=0
∂θ (4.3)
Ví dụ 4.1: Cho đám đông có phân phối Gauss PG (µ, σ) . Hãy ước lượng µ, σ từ mẫu cỡ n. 2

Lấy mẫu cỡ n, ( x 1 , x 2 ,..., x n ) ta có hàm cơ hội


n
1  ( x − µ) 2 
L(µ, σ 2 ) = ∏ exp−  i 2  (4.4)
i =1 σ 2π  2σ 
n
 1   1 n 
=   exp − 2 ∑ ( x i − µ) 2 
 σ 2π   2σ i =1 
n
n 1
L (µ, σ 2 ) = Ln(L(µ, σ 2 )) = −nLnσ − Ln(2π) − 2
2 2σ
∑ (x
i =1
i − µ) 2
n

∂L (µ, σ 2 ) 1 n ∑x i

∂µ
= 2
σ
∑ (x i − µ) = 0 ⇒ µˆ =
i =1
i =1

n (4.5)
∂L (µ, σ )
2
1 1 n
1 n

∂σ 2
= −n + 3
σ σ
∑ (x i − µ) 2 = 0 ⇒ σˆ 2 = ∑ (x i − µˆ ) 2
n i =1
i =1 (4.6)
Tức là theo nguyên lý cơ hội cực đại, ước trị µ̂ là trung bình mẫu, ước trị σ̂ 2 là
phương sai mẫu S' 2 , tuy nhiên người ta chứng minh ước trị này bị chệch. Vì vậy thay vào
đó người ta dùng thống kê S2 được tính từ công thức (2.10) hoặc (2.11).
Ước lượng điểm
4.3. Ước lượng khoảng
4.3.1. Giới thiệu
Thông báo θ bằng ước trị θ̂ mà không kèm theo một độ chính xác (khả năng θ̂ gần
bằng θ ) thì thông báo đó ít có giá trị. Vì rằng θ̂ cũng là một trị ngẫu nhiên được tính từ

52
một mẫu ngẫu nhiên. Thay vào đó người ta dùng ước lượng khoảng. Khoảng (θˆ 1 , θˆ 2 ) chứa

θ gọi là khoảng ước lượng θ . Trong đó θˆ 1 , θˆ 2 là những hàm theo mẫu:

(θˆ 1 ≤ θ ≤ θˆ 2 )

với quy ước θˆ 1 < θˆ 2 .

( )
Khi đó γ = P θˆ 1 , θˆ 2 là xác suất để θ có giá trị trong khoảng (θˆ 1 , θˆ 2 ) - và gọi là độ tin
cậy của việc ước lượng.
Chẳng hạn γ = 95% , tức với mẫu cỡ n, khi ta thực hiện 100 mẫu, ta có 100 khoảng
ước lượng thì trong đó có 95 khoảng ước lượng có chứa θ .
4.3.2. Ước lượng khoảng của µ trong phân phối Gauss - P(µ,σ2)
a. Biết phương sai σ2 hoặc cỡ mẫu lớn n ≥ 30
Khi cỡ mẫu lớn (n ≥ 30) thì phương sai mẫu S2 gần bằng σ2 của đám đông.
Vấn đề là coi một biến ngẫu nhiên x có phân bố Gauss bình thường với σ đã biết, ta
muốn ước lượng µ.
Rút cỡ mẫu n, ta có trị trung bình mẫu x và phương sai mẫu S 2
Ta biết rằng đại lượng tuân theo phân bố Gauss chuẩn:
x −µ
~ PGauss (0,1)
σ
n
Với độ tin cậy γ, ta có:
x −µ
P(− U γ ≤ ≤ +U γ ) = γ
σ
n
Biết γ dựa theo phân phối chuẩn ta tìm thấy Uγ, do đó:
x −µ
− Uγ ≤ ≤ U γ với độ tin cậy γ.
σ
n
σ
Hay: µ = x ± U γ . với độ tin cậy γ (4.7)
n

Trong trường hợp mẫu lớn và không biết σ, ta có thể thay σ bằng S của mẫu.
1− γ
Chú ý trong Excel, U γ = NORMSINV( γ + ).
2

53
b. Phương sai σ2 chưa biết và cỡ mẫu nhỏ
x −µ
Ta dùng thống kê T tuân theo phân bố Student bậc tự do (n-1): T = ~ St (n − 1)
S
n
Với độ tin cậy là γ ta có:
P(−Tγ ≤ T ≤ Tγ ) = γ hay
x −µ
P(−Tγ ≤ ≤ Tγ ) = γ
S
n
S
Suy ra: µ = x ± Tγ . với độ tin cậy γ. (4.8)
n

Biết γ và độ tự do (n-1) ta tìm Tγ nơi bảng phân phối Student.


Trong Excel, Tγ = TINV(1 − γ, n − 1) .

4.3.3. Ước lượng khoảng của σ2 trong phân bố Gauss P(µ,σ2)


a. Biết µ = µo
Rút mẫu cỡ n (x1, x2,…, xn ) từ đám đông có phân phối Gauss P(µo,σ2). Biết µo hãy
ước lượng σ2.
Người ta chứng minh được rằng nếu x ~ P(μ, σ 2 ) thì đại lượng Y sau đây sẽ tuân theo
phân phối chi bình phương với độ tự do n.

 x − µo 
n 2

Y = ∑ i  ~ χ 2 (n ) .
i =1  σ 
Với độ tin cậy γ, ta chọn 2 trị a, và b sao cho:
P (a ≤ Y ≤ b ) = γ

Người ta thường chọn a, b như sau:


1− γ
P ( Y ≤ a ) = P ( Y ≥ b) =
2
Ta tra tìm a, b ở bảng phân bố chi bình phương độ tự do n.
Biết a và b ta suy ra được khoảng ước lượng của σ2.

P(a ≤ Y ≤ b) = γ hay
n

∑ (x i − µ0 )2
a≤ i =1
≤ b , suy ra:
σ2

54
n n

∑ (x i − µ 0 ) 2 ∑ (x i − µ0 )2
i =1
≤ σ2 ≤ i =1
(4.9)
b a
với độ tin cậy γ.
Ví du 4.2. Để khảo sát tính chính xác của một cái cân, người ta đặt quả cân đã biết trước
chính xác khối lượng là 100 g lên cái cân đó và đo nhiều lần. Kết quả như sau:

xi(g) 102 101 97 102 99 103 102 99 98

Qua mẫu trên ta đi ước lượng phương sai của cái cân:
Ta có: µ0=100 g
9

∑ (x
i =1
i − µ 0 ) 2 = 34

Y ~ χ 2 (9) với γ = 95%,ta có:


1− γ (1 - γ)
P(Y ≤ a ) = = 0,025 ⇒ a = 2,7 (Hàm trong Excel là =CHIINV( γ + ;n))
2 2
1− γ (1 - γ)
P ( Y ≥ b) = = 0,025 ⇒ b = 19 (Hàm trong Excel là = CHIINV( ;n)
2 2
Vậy: 1,84 ≤ σ 2 ≤ 12,58
b. Chưa biết µ
Ta thay µ bằng trung bình của mẫu, từ đó tính phương sai mẫu:
1 n
S2 = ∑ (x - x) 2
n - 1 i =1 i
Ta có:
S2
Y = (n - 1) 2 ~ χ 2 (n - 1)
σ
n
(x i − x) 2
Hay: Y = ∑ ~ χ 2 (n − 1)
i =1 σ 2

Với độ tin cậy γ ta cũng tìm được a, b như trên từ phân phối chi bình phương với độ
tự do (n-1).
Ta suy ra khoảng ước lượng của σ2
n n

∑ (x i − x) 2 ∑ (x i − x) 2
i =1
≤ σ2 ≤ i =1
(4.10)
b a

55
với độ tin cậy γ.
4.3.4. Ấn định cỡ mẫu
Trong ước lượng khoảng ta có công thức tổng quát
θ = θˆ ± ε (4.11)

ε gọi là sai số do lấy mẫu.

Vậy sự chênh lệch giữa θ và θ̂ là θ − θˆ = ε


ε nói lên mức độ chính xác của ước lượng khoảng. ε càng nhỏ, θ̂ càng gần θ , bề
rộng khoảng tin cậy 2ε càng hẹp, ước lượng khoảng càng chính xác.
Với độ chính xác yêu cầu ε cho trước, ta có thể suy ra cỡ mẫu cần thiết.
σ
Trong ước lượng khoảng của µ ta có µ = x ± U γ .
n
Vậy
σ
ε = Uγ.
n
Suy ra
S2
n = Uγ
2
(4.13)
ε2
4.4. Ước lượng trị trung bình và phương sai của trị trung bình khi sai số không đồng
nhất
Trong ví dụ 4.1 ta đã giả sử rằng các x i có độ lệch chuẩn σ như nhau. Khi σi thay đổi
khác nhau trong từng lần đo i (thường xảy ra khi đo số đếm phóng xạ của nguồn) thì ta
phải đưa vào trong biểu thức hàm cơ hội (4.6) tham số σi thay vì σ.
n
1 ( x i − µ' ) 2
L(µ, σ 2 ) = ∏ exp− (4.14)
σ i 2π 2σ i
2
i =1

Với µ’ là trị trung bình lý thuyết cần ước lượng.

56
Sử dụng phương pháp cơ hội cực đại ta có:

∂ ln P(µ, σ )2
 x − µ'  ∑ (x i
σi
2 )
= ∑  i 2  = 0 ⇒ µ' = (4.15)
∂µ  σi  ∑( 1
σi
2 )

 
∂µ' ∂
∑  x i
σi 
 2
1
σi
2

= = (4.16)
∂x i ∂x i 
∑  1 2  ∑ ( 1σ i 2 )
σ i 

∂µ' 2
Áp dụng định luật truyền sai số cho µ' ta được: σ µ = ∑ σ i (
2 2
)
∂x i
1
σi
2
1
σµ = ∑ =
2
Suy ra: (4.17)
(∑ ( 1 2 )) 2 ∑( 1 2)
σi σi

Bài tập chương 4


4.1. Sau khi đo vận tốc v nhiều lần, nhóm thực hiện kết luận rằng độ lệch chuẩn của phép
đo của họ là σ =12 m/s. Giả sử rằng sai số nầy là ngẫu nhiên, còn sai số hệ thống đã được
loại trừ, hãy xác định xem cần lặp lại phép đo bao nhiêu lần để có được độ chính xác là
ε = 2,0 m/s với độ tin cậy là 95% (giả sử dữ liệu tuân theo phân bố chuẩn).
4.2. Người ta đo số đếm x của nguồn phóng xạ trong thời gian t =1 phút. Kết quả là như
sau:

xi 0 1 2 3 4 5 6 7 8 9 10

ri 1 9 20 24 19 11 11 0 3 1 1

ri là tần số xuất hiện biến cố xi tương ứng.


a) Hãy ước lượng số đếm trung bình của nguồn phóng xạ và độ lệch chuẩn của nó.
So sánh độ lệch chuẩn này với độ lệch chuẩn tính từ phân bố Poisson với trị trung bình tính
được.
b) Vẽ đồ thị phân bố thực nghiệm và đồ thị phân bố Poisson tính được ở trên.
c) Xác định ước lượng khoảng của trị trung bình với độ tin cậy 95%.
d) Tính xác suất để trị trung bình rơi vào trong khoảng ( x ±1 σ x ).

57
e) Tính xác suất để trị trung bình rơi ngoài khoảng ( x ±3 σ x ).
f) Tính xác suất để trị trung bình rơi ngoài khoảng (3,3 đến 4,0).
4.3. Một sinh viên đo chu kỳ T của con lắc và có được những giá trị sau:

Phép thử i 1 2 3 4 5 6 7 8
Ti (s) 1,35 1,34 1,32 1,36 1,33 1,34 1,37 1,35

a. Ước lượng trị trung bình T , độ lệch chuẩn σ của các phép đo và độ lệch chuẩn σ T
của trị trung bình.
b. Ước lượng khoảng của T với độ tin cậy 98%.
c. Tính xác suất để có được trong một lần đo nào đó T≤1,32 s.

4.4. Cho dữ liệu trong bảng dưới đây:


a. Tìm trị trung bình và độ lệch chuẩn của trị trung bình của dữ liệu dưới đây khi giả
thuyết rằng chúng được rút từ cùng một đám đông.
b. Bây giờ giả sử dữ liệu từ 1 đến 20 được đo với sai số như nhau σ, trong khi dảy dữ
liệu từ 21 đến 30 được đo cẩn thận hơn với độ chính xác chỉ còn σ/2. Hãy tìm trị
trung bình và độ lệch chuẩn của trị trung bình theo điều kiện trên.

i X i X i X
1 2,40 11 1,94 21 2,59
2 2,45 12 1,55 22 2,65
3 2,47 13 2,12 23 2,55
4 3,13 14 2,17 24 2,07
5 2,92 15 3,06 25 2,61
6 2,85 16 1,97 26 2,61
7 2,05 17 2,23 27 2,54
8 2,52 18 3,20 28 2,76
9 2,94 19 2,24 29 2,37
10 1,89 20 2,60 30 2,57

4.5. Một hệ đếm được thiết lập để đo tia gamma của một nguồn phóng xạ. Số đếm toàn
phần đo được bao gồm cả phông, được ghi trong thời khoảng 1 phút được cho trong bảng
dưới đây. Sau đó đo phông ta được 58 số đếm trong 5 phút. Từ dữ liệu trên hãy tính:
Lần đo 1 2 3 4 5 6 7 8 9 10

58
Số đếm N 125 130 105 126 128 119 137 131 115 110

a. Phông trung bình trong 1 phút và độ lệch chuẩn tương ứng.


b. Tốc độ đếm trung bình từ nguồn và độ lệch chuẩn tương ứng.
c. Với độ tin cậy 98%, xác định khoảng ước lượng của tốc độ đếm trung bình trong
câu b.
4.6. Thí nghiệm đo thời gian sống τ (s) của Kso meson năm 1990 được cho trong bảng
dưới đây.
a. Tìm trị trung bình có trọng số τ của dữ liệu và độ lệch chuẩn của trị trung bình.
b. Với độ tin cậy 95%, xác định khoảng ước lượng tương ứng của τ .

i 1 2 3 4 5
τi 0,8920±0,0044 0,8812±0,0096 0,8913±0,0032 0,9837±0,0048 0,8958±0,0045

4.7. Mười một sinh viên kết hợp các phép đo về thời gian sống kích thích của một trạng
thái. Kết quả được cho trong bảng sau:
Sviên 1 2 3 4 5 6 7 8 9 10 11
τ(s) 34,3 32,2 35,4 33,5 34,7 33,5 27,9 32,0 32,4 21,0 19,8
στ 1,6 1,2 1,5 1,4 1,6 1,5 1,9 1,2 1,4 1,8 1,3

a. Tìm ước lượng của trị trung bình và độ lệch chuẩn của trị trung bình tương ứng.
b. Với độ tin cậy 98%, xác định khoảng ước lượng trị trung bình tương ứng.

4.8. Hoạt độ phóng xạ tự nhiên của Th-232 trong mẫu đất được đánh giá sử dụng hệ phổ
kế gamma HPGe dựa trên phổ tia gamma đặc trưng của các đồng vị con cháu của nó trong
sự cân bằng thế kỷ. Kết quả được cho trong bảng sau:
Đồng vị Năng lượng gamma Hoạt độ Độ lệch chuẩn của hoạt độ
con (keV) (Bq/kg) (Bq/kg)
Pb-212 238,63 44,87 0,39
Bi-212 727,30 51,80 0,11
Ac-228 338,32 47,43 0,94
911,20 45,72 0,81
Tl-208 2614,53 47,21 2,95
583,19 41,26 0,51

59
a. Hãy ước lượng trị trung bình hoạt độ của 232Th và độ lệch chuẩn của trị trung bình.
b. Với độ tin cậy 95%, xác định khoảng ước lượng trị trung bình tương ứng.

CHƯƠNG 5
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

Trong chương này, trình bày phương pháp kiểm định sự phù hợp lẫn nhau của các giả
thiết thống kê liên quan đến trị trung bình, phương sai, hay phân bố tần suất. Điều này xuất
phát từ nhu cầu cần so sánh các đại lượng thống kê từ mẫu lẫn nhau. Ví dụ so sánh kết quả
đánh giá hoạt độ riêng của U-238 trong mẫu đất bằng hệ phổ kế gamma phông thấp với
hoạt độ riêng của nó bằng hệ phổ kế alpha; xác định hàm lượng của Cs-137 trong mẫu
chuẩn Soil IAEA 375 với kết quả đã công bố của IAEA; kiểm định xem phân bố tần suất
của dữ liệu thực nghiệm đo được có tuân theo phân bố Poisson hay không?
Để làm điều đó trước tiên ta phải thiết lập giả thiết thống kê H0 về điều mà ta cần
kiểm định. Đối thiết H1 sẽ là giả thiết đối nghịch lại điều mà H0 đã đưa ra.
Để kiểm định xem có thể chấp nhận hay bác bỏ giả thiết H0, cần thu thập số liệu từ
mẫu, từ đó đánh giá đại lượng thống kê liên quan đến giả thiết cần kiểm định thông qua
phân bố thống kê mà đại lượng này tuân theo. Đại lượng thống kê phù hợp được chọn lựa
tùy theo đại lượng mà ta cần kiểm định cũng như cách mà giả thiết H0 được thiết lập.
Dưới đây giới thiệu một số khái niệm, cũng như trình bày các loại kiểm định thường
sử dụng trong đánh giá sự phù hợp của trị trung bình, của phương sai, và phân bố tần suất
của dữ liệu đo đạc. Các loại kiểm định sự phù hợp của việc làm khớp, kiểm định hệ số
tương quan thực nghiệm được trình bày trong các chương 6 và 7 tương ứng.
5.1. Các khái niệm
5.1.1. Các giả thiết
a. Giả thiết H 0 : là giả thiết mà ta muốn kiểm định

60
Chẳng hạn ta muốn kiểm định giả thiết trung bình của số đếm của 1g mẫu chuẩn K-
40 là 2500 cph thì ta nói:“Giả thiết H 0 là trung bình của số đếm 1g mẫu chuẩn K-40 là
2500 cph”, và ta viết:
H 0 : µ = 2500

Con số 2500 là giá trị giả thiết của trung bình số đếm 1g mẫu chuẩn K-40 và được ký
hiệu là µ H0 hay µ 0

Lưu ý là giả thiết H 0 được lập nên và đang được cho là đúng cho đến khi có đủ bằng
chứng trái ngược lại.
b. Giả thiết H1 : khi các thông tin từ mẫu không giúp ta ủng hộ giả thiết H 0 , thì ta phải
bác bỏ nó tức là phải chấp nhận một giả thiết khác đối ngược với H 0 và được gọi là đối
thiết H1 .
Ví dụ: đối thiết của giả thiết H 0 : µ = 2500 có thể là:
H 1 : µ > 2500 hay

H 1 : µ < 2500 hay

H 1 : µ ≠ 2500

tuỳ theo bối cảnh trong đó phép kiểm định được thực hiện.
c. Giả thiết đơn, kép, một đuôi, hai đuôi
Giả thiết H 0 hay H1 được gọi là đơn nếu nó chỉ liên quan tới một giá trị duy nhất. Ví
dụ: H 0 : µ = 2500
Giả thiết H 0 hay H1 được gọi là kép nếu nó liên quan tới một vùng giá trị.Ví dụ:
H 1 : µ > 2500

H 1 : µ < 2500

H 1 : µ ≠ 2500

nghĩa là nó được đúng với nhiều giá trị của µ


 Các giả thiết như:
H 1 : µ ≥ 2500

61
H 1 : µ < 2500

H 1 : µ > 2500

H 1 : µ ≤ 2500

được gọi là một đuôi (một bên).


 Các giả thiết như:
H 1 : µ ≠ 2500 được gọi là hai đuôi vì nó tương đương tới 2 hai giả thiết:

H 1 : µ > 2500 và H 1 : µ < 2500

5.1.2. Sai lầm loại 1, sai lầm loại 2


Có hai loại sai lầm có thể được tạo ra:
Sai lầm loại 1: Bác bỏ giả thiết H 0 khi thật ra nó đúng.
Sai lầm loại 2: Chấp nhận H 0 khi thật ra nó sai.
Xác suất để phạm phải sai lầm loại 1, α được gọi là mức ý nghĩa của phép kiểm định.
Nó chính là xác suất để bác bỏ H 0 khi thật ra nó đúng. Như vậy xác suất để chấp nhận H 0
khi nó đúng là (1 − α) .
Xác suất để phạm phải sai lầm loại 2- chấp nhận H 0 khi nó sai là β . Vậy xác suất để
bác bỏ H 0 khi nó sai là (1 − β) . Và (1 − β) được gọi là năng lực của phép kiểm định.
5.1.3. Mức ý nghĩa nhỏ nhất (p – value)
Thay vì kiểm định một giả thiết với mức ý nghĩa α cho trước (như sẽ trình bày dưới
đây), các nhà nghiên cứu thường xác định mức ý nghĩa nhỏ nhất tại đó một giả thiết H 0 có
thể bị bác bỏ được gọi là p-value của phép kiểm. Với ý nghĩa này, p-value được định nghĩa
là xác suất để có z lớn hơn giá trị thống kê Z của phép kiểm tương ứng. Khi đó p-value tốt
khi nó có giá trị lớn hơn mức ý nghĩa α, đặc biệt nếu p-value trong khoảng 0,5 là an toàn
về mặt thống kê để kết luận về việc chấp nhận hay loại bỏ giả thiết cần kiểm định.
5.2. Các bước của việc kiểm định
Giả sử ta cần so sánh thống kê θ với kỳ vọng θ0 của đám đông
Bước 1: Thiết lập giả thiết H0 muốn kiểm định và đối thiết H1
a. Bài toán kiểm định một đuôi phải

62
H0: θ≤θ0 và H1: θ>θ0.
b. Bài toán kiểm định một đuôi trái
H0: θ≥θ0 và H1: θ<θ0.
c. Bài toán kiểm định hai đuôi
H0: θ = θ0 và H1: θ ≠ θ0
Bước 2: Xác định thống kê θ̂ dùng trong kiểm định và phân bố f( θ̂ ): thống kê θ̂ khác
nhau tùy theo đối tượng muốn kiểm định là gì cũng như các điều kiện kèm theo.
Bước 3: Ấn định mức ý nghĩa α (0,01 ;0,02; 0,05). Xác định các ngưỡng quyết định
tương ứng với bài toán cần kiểm định.
Bước 4: So sánh θ̂ với các ngưỡng quyết định để quyết định chấp nhận hay bác bỏ
H0 với mức ý nghĩa α.
5.3. Các phép kiểm định thường dùng
5.3.1. Kiểm định trị trung bình của phân bố chuẩn với phương sai đã biết hoặc chưa
biết nhưng cỡ mẫu lớn – Phép kiểm U
Bài toán này thường dùng để kiểm định việc so sánh trị trung bình thực nghiệm với
giá trị kỳ vọng đã biết trước của đám đông.
Trong bài toán này thống kê θ̂ chính là Z được tính bởi:
x − µ0
Z= (5.1)
σ/ n
Trong đó Z tuân theo phân bố chuẩn P(0,1). Hình 5.1, hình 5.2 và hình 5.3 trình bày mô
hình phép kiểm trị trung bình một đuôi phải, một đuôi trái và hai đuôi. Ấn định mức ý
nghĩa α. Dựa trên các mô hình này để xác định các ngưỡng quyết định Z α (hoặc p-value).

Trong Excel có thể tính giá trị Z α bởi hàm Z α = NORMSINV(1 − α) .


Dựa vào giá trị Z nằm trong vùng nào của mô hình phân bố để ra quyết định chấp
nhận hay bác bỏ H0 với mức ý nghĩa α.
Ví dụ 5.1. Sinh viên A thực hiện phép phân tích hàm lượng nguyên tố nhôm trong mẫu
chuẩn địa chất bằng phân tích kích hoạt neutron. Kết quả tính giá trị hàm lượng nhôm
trung bình trong 30 mẫu phân tích là 46,6 µg/g với độ lệch chuẩn tính được từ mẫu là σ = 2

63
µg/g. Kiểm định giả thiết rằng hàm lượng nhôm phân tích được thì không khác với giá trị
nhà sản xuất cung cấp (46 µg/g) với mức ý nghĩa 5%.

Hình 5.1. Mô hình phép kiểm một đuôi phải.


Chú ý: nếu phương sai σ 2 chưa biết mà cỡ mẫu lớn (n ≥ 30) thì dùng phương sai mẫu
S2 thay cho phương sai đám đông σ 2 .

Hình 5.2. Mô hình phép kiểm một đuôi trái.


Giải:
- Đặt giả thiết H0: µ=46 µg/g, đối thiết H1: µ≠46 µg/g (phép kiểm định 2 đuôi).
- Đây là bài toán trị trung bình với cỡ mẫu lớn n=30 nên thống kê liên quan đến kiểm
định là:

64
x − µ0
Z=
σ/ n
46,6 − 46
Thế số vào ta có: Z = = 1,64
2 / 30
- Đặt mức ý nghĩa 5%, ngưỡng quyết định tương ứng cho bài toán hai đuôi là: -Zα/2 và
Zα/2. Với Zα/2=NORMSINV(1-α/2) = NORMSINV(1-0,025)=1,96. Vậy khoảng cho
phép là: -1,96 đến 1,96.
- Thống kê Z tính được từ mẫu nằm trong vùng giá trị cho phép. Vậy chấp nhận giả
thiết H0 với mức ý nghĩa 5%.

Hình 5.3. Mô hình phép kiểm hai đuôi.


5.3.2. Kiểm định trị trung bình của phân bố chuẩn với phương sai chưa biết và cỡ
mẫu nhỏ - Phép kiểm T
x − µ0
Khi cỡ mẫu n nhỏ (n < 30). Khi đó Z = không tuân theo phân bố chuẩn. Thay
S/ n
vào đó ta sử dụng thống kê:
x − µ0
t n −1 = (5.2)
S/ n
tuân theo phân bố Student với ν = n − 1 bậc tự do. Lý luận tương tự như trên trong đó thay
Z bằng t n −1 .

65
Đối với phép kiểm dùng phân bố Student, ngưỡng quyết định được tính trong Excel
chính là t n 1, α = TINV(2α, n 1) . Tùy theo mô hình kiểm định một đuôi phải, một đuôi trái,

hai đuôi mà ngưỡng quyết định sẽ thay đổi tương ứng.


Ví dụ 5.2. Giả sử giới hạn phát hiện hệ đo GMX ở năng lượng 63 keV với mẫu đất chuẩn
Soil – IAEA 375 hình học mẫu 3pi là: 0,03 Bq/kg. Đo 5 mẫu phóng xạ môi trường đất và
phân tích hoạt độ U-238 trên hệ phổ kế GMX này sử dụng năng lượng 63 keV được kết
quả phân tích hoạt độ là 0,04 Bq/kg với độ lệch chuẩn mẫu S = 0,01 Bq/kg. Hỏi như vậy
lượng U-238 ghi nhận được có ý nghĩa hay không, với mức ý nghĩa 5%?
Giải:
- Đặt giả thiết H0: µ ≤ 0,03 Bq/kg, đối thiết H1: µ > 0,03 Bq/kg (phép kiểm định một
đuôi phải).
- Đây là bài toán trị trung bình, số mẫu nhỏ n = 5, nên thống kê liên quan đến kiểm
định là:
x − µ0
t n −1 =
S/ n
0,04 0,03
Thế số vào ta có: t n 1 = = 2,236
0,01 / 5
- Đặt mức ý nghĩa 5%, ngưỡng quyết định tương ứng cho bài toán một đuôi phải là:
tn 1,α = TINV(2α, n 1) = 2,13 .

66
Hình 5.4. Mô hình phép kiểm một đuôi phải.

Hình 5.5. Mô hình phép kiểm một đuôi trái.

67
Hình 5.6. Mô hình phép kiểm hai đuôi.
- Thống kê t tính được từ mẫu nằm trong vùng giá trị cho phép. Vậy chấp nhận giả
thiết H1 với mức ý nghĩa 5%.
5.3.3. Kiểm định phương sai của phân bố chuẩn - Phép kiểm chi bình phương
Bài toán kiểm định phương sai sử dụng thống kê
(n − 1)S 2
χ 2n −1 = (5.3)
σ2
0

Đại lượng này tuân theo phân phối chi bình phương với ν = n − 1 bậc tự do.

Hàm mật độ xác suất của biến ngẫu nhiên chi bình phương χ n 2− 1 có dạng hình 5.4.

Ngưỡng quyết định được tính bởi hàm trong Excel: χ 2n −1,α = CHIINV(α, n − 1) .

Tùy theo mô hình kiểm định một đuôi phải, một đuôi trái, hai đuôi mà ngưỡng quyết
định sẽ thay đổi tương ứng (xem hình 5.7, 5.8, 5.9).

68
Hình 5.7. Minh họa phép kiểm Chi bình phương một đuôi trái.

Hình 5.8. Minh họa phép kiểm Chi bình phương một đuôi phải.

69
\
Hình 5.9. Minh họa phép kiểm Chi bình phương hai đuôi.
Ví dụ 5.3. Giả sử độ chính xác của quy trình phân tích huỳnh quang tia X được cho là
không lớn hơn 3%. Một mẫu ngẫu nhiên gồm 20 mẫu phân tích được chọn ra và tìm thấy
độ chính xác là 4,2%. Hãy kiểm định giả thiết H 0 rằng phương sai tổng thể sẽ không lớn
hơn 3% ở mức ý nghĩa 10%.
Giải:
Ở đây giả thiết không là: H 0 : σ 2 ≤ 9%

đối lập với giả thiết: H1 : σ 2 > 9%


Vì phân phối của tổng thể là chuẩn nên quy luật quyết định ở đây là
(n − 1)S 2
Bác bỏ H 0 nếu χ 2n −1 = > χ 2n −1,α
σ2
0

Trong đó: n = 20; S2 = (4,2%) 2 ; σ 2 = 9% ; α = 10%


0

Ta tìm được:
(n - 1)S2 19(4,2%) 2
χ 19
2
= = = 37,24
σ0
2 (3%) 2

Tra bảng phân phối chi bình phương với độ tự do n - 1= 19, ta có:
χ19
2
,α = 27,2

Tức là χ n −1 > χ n −1, α .


2 2

70
Vậy giả thiết H 0 bị bác bỏ ở mức ý nghĩa 10%.
5.3.4. Kiểm định tính phù hợp của một phân bố - Phép kiểm chi bình phương
1. Tần số lý thuyết và tần số thực nghiệm
Cho một đám đông đa thức gồm k lớp, với các tỷ lệ (p1 , p 2 ,..., p k ) tương ứng cho mỗi
lớp. Ta lấy mẫu cỡ n từ đám đông này. Gọi (r1 , r2, ..., rk ) là số lần xảy ra biến cố lớp ω i tương

ứng. (r1 , r2, ..., rk ) là các biến ngẫu nhiên, và gọi là tần số thực nghiệm.

Còn về lý thuyết khi lấy mẫu cỡ n thì số lần xảy ra biến cố lớp ω i phải là np i = ri ' .

Các số r1 ' = np1 , r2 ' = np 2 ,..., rk ' = np k là không đổi khi cỡ mẫu n không đổi và được gọi là tần
số lý thuyết.
Tất nhiên giữa tần số thực nghiệm và tần số lý thuyết có sự sai biệt do lấy mẫu ngẫu
nhiên.
2. Định lý K. Pearson
Để đánh giá mức sai biệt giữa tần số lý thuyết ri ' = np i và tần số thực nghiệm ri
trong mẫu cỡ n rút từ đám đông đa thức, Pearson đưa ra thống kê:
k
(ri − np i ) 2
Q 2n = ∑ (5.4)
i =1 np i

và chứng minh được rằng Q n2 tuân theo phân bố χ 2 (ν) khi cỡ mẫu n lớn.
Như vậy lập luận tương tự, với bài toán kiểm định giả thiết:
H 0 : Phân bố mẫu phù hợp với phân bố lý thuyết (xác suất để các phần tử rơi vào các

lớp là p i , i = 1,2,...k tương ứng)


đối lập với giả thiết:
H 1 : xác suất để một phần tử rơi vào một lớp không đúng là p i , i = 1,2,...k

thì quyết định là:

a. Bài toán 1: Nếu phân bố lý thuyết đã cho trước (tức đã biết trước tham số của nó):
2
Bác bỏ H 0 nếu Q > χ k 2− 1 (5.5)
n ,α

71
với mức ý nghĩa α .

Trong Excel, ngưỡng quyết định được xác định bởi hàm χ ν2, = CHIINV(α, ν) với
α

ν = k − 1 là độ tự do của hệ.
b. Bài toán 2: Nếu phân bố lý thuyết chưa biết (tức chưa biết trước tham số của nó) thì ta
dùng số liệu từ mẫu để ước lượng các tham số đó. Sau đó ta đi kiểm định tương tự như trên
nhưng bậc tự do của biến chi bình phương sẽ bị giảm đi một cấp cho từng tham số. Tức là
nếu gọi m là số tham số cần ước tính thì độ tự do của hệ sẽ là ν = k − m − 1 . Do đó ta sẽ:

Bác bỏ H 0 nếu Q n2 > χ k − m


2
−1
(5.6)

với mức ý nghĩa α .


Ví dụ 5.4. Để khảo sát tính ngẫu nhiên của số đếm từ ống đếm GM, Curtiss thực hiện 3455
phép đo sự phân rã của nguồn polonium trong khoảng thời gian như nhau. Số liệu đo được,
được xếp theo bảng 5.1. Sau đó ông đi kiểm định phân bố tần suất có được của dữ liệu với
phân bố giả thiết Poisson.
Bảng 5.1. Số liệu đã phân lớp của số đếm từ ống đếm GM thực hiện bởi Curtiss
xi ri n × pi ri − np i (ri − np i ) 2 /(np i )

0 8 9,7 -1,7 0,298


1 59 56,9 2,1 0,078
2 177 167,3 9,2 0,562
3 311 322,2 -16,2 0,853
4 492 481,4 10,6 0,253
5 528 565,8 -32,8 2,525
6 601 554,3 46,2 3,930
7 467 465,3 1,2 0,006
8 331 341,8 -10,8 0,342
9 220 223,2 -3,2 0,046
10 121 131,2 -10,2 0,293
11 85 20,1 14,9 3,120

72
12 24 34,3 -10,3 3,095
13 22 15,5 6,5 2,223
14 6 6,5 -0,5 0,038
15 3 2,6 0,4 0,255
≥16 0 1,4 -1,4
Tổng n = 3455 Q n = 18,942
2

Ở đây ri là tần số quan sát được ở mỗi lớp xi; n.Pi là tần số lý thuyết tính từ giả thuyết
phân bố Poisson theo công thức:
λx i λ
nPi = n e
x i!

với λ ≈ x = 5,88

Với α = 0,05 , độ tự do của hệ ν =16 - 1 - 1=14, ta có χ 142, = 23,68


α

So sánh ta thấy: Q 2n ≤ 23,68 .


Vậy ống đếm GM ổn định (chấp nhận giả thuyết H 0 rằng dữ liệu đo từ ống đếm GM
tuân theo phân bố Poisson).
3. Kiểm định tính phù hợp của phân bố Poisson
Để so sánh định lượng tính phù hợp với phân bố Poisson, có thể dùng phép kiểm chi
bình phương với thống kê chi bình phương đặc biệt như sau
1 n
χ2 = ∑ (x i − x) 2
x i =1
(5.7)

Với x là trị trung bình mẫu x e , biểu thức trên xấp xỉ


n
1
χ2 =
xe
∑ (x
i =1
i − x e )2 (5.8)

Ta có mối liên hệ giữa thống kê chi bình phương với phương sai mẫu (2.10) như sau
(n − 1)S 2
χ2 = (5.9)
xe

73
Chú ý rằng nếu thăng giáng của dữ liệu tuân theo đúng mô hình thống kê Poisson dự
đoán thì S 2 = σ 2 . Mặt khác đối với phân bố Poisson thì σ 2 = x và chúng ta chọn x = x e .

S2
Như vậy mức độ sai khác của tỷ số so với 1 sẽ phản ánh mức độ sai khác của phương
xe

S2 χ2
sai mẫu S 2 so với phương sai dự đoán σ 2 . Theo công thức (5.9) thì = nên mức độ
xe n −1

sai khác của χ 2 so với (n - 1) sẽ phản ảnh mức độ sai khác của dữ liệu thực nghiệm so với
mô hình phân bố thống kê Poisson dự đoán. Ta có thống kê χ 2 tuân theo phân bố chi bình
phương với độ tự do ν = n - 1. Xác suất p để tìm thấy χ 2 bằng hay lớn hơn giá trị ngưỡng
chấp nhận χ 02 được đánh giá bằng cách tính tích phân hàm mật độ xác suất chi bình phương

trong khoảng từ χ 02 đến ∞ . Dễ dàng nhận thấy khi chọn p quá nhỏ vào cỡ 0,02 sẽ cho phép
có sự thăng giáng quá lớn trong dữ liệu thực nghiệm, còn p quá lớn cho thấy sự thăng
giáng quá nhỏ của dữ liệu thực nghiệm. Giá trị p = 0,5 cho thấy mức độ chênh lệch vừa
phải của dữ liệu thực nghiệm so với mô hình dự đoán. Chú ý rằng với mỗi giá trị ν ta có
một hàm mật độ xác suất khác nhau, nên giá trị χ 02 vừa phụ thuộc xác suất p vừa phụ thuộc
độ tự do ν .
Ví dụ 5.5. Xét các số liệu thực nghiệm ở bảng 2.1 (chương 2). Ta có giá trị trung bình thực
nghiệm x e = 8,8 nên x = 8,8 . Giả sử dữ liệu trên được dự đoán tuân theo phân bố thống kê

Poisson. Phương sai thực nghiệm tính từ công thức (2.10) là S 2 = 7,36 , còn phương sai dự
đoán khi đó là σ 2 = x = 8,8 . Như vậy dữ liệu thực nghiệm có mức thăng giáng nhỏ hơn
thăng giáng theo phân bố thống kê Poisson dự đoán với cùng một giá trị trung bình.
Hình 5.10 mô tả việc so sánh phân bố dữ liệu thực nghiệm từ bảng 2.2 và phân bố dữ
liệu theo thống kê Poisson với trị trung bình x = 8,8 .

74
0.25

0.2

0.15 Thực nghiệm


Poisson
P(x)

0.1

0.05

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Hình 5.10. So sánh phân bố dữ liệu thực nghiệm từ bảng 2.2 và phân bố dữ liệu theo thống
kê Poisson với trị trung bình x = 8,8 .
Đối với ví dụ nêu trên thì χ 2 =15,89 theo công thức (5.8). Giá trị p –value của phép
kiểm được tính bằng hàm CHIDIST( χ 2 , n-1). Giá trị này bằng 0,664 nên có thể kết luận dữ
liệu thực nghiệm không có thăng giáng bất thường mà phản ánh tốt bản chất của quá trình
phân rã phóng xạ tuân theo phân bố thống kê Poisson. Từ đó kết luận hệ đo ổn định về mặt
thống kê.
5.4. Áp dụng các mô hình thống kê
5.4.1. Kiểm tra độ ổn định thống kê của hệ thống ghi nhận bức xạ hạt nhân
Như chúng ta đã biết quá trình phân rã hạt nhân mang bản chất thống kê. Việc chúng
tuân theo mô hình thống kê nào tùy thuộc vào bản chất vấn đề mà nó phát sinh cũng như
đại lượng vật lý mà chúng ta quan tâm. Các hệ thống đo đếm hạt nhân được gọi là ở trạng
thái ổn định khi việc đo đếm quá trình phân rã phóng xạ đó cho kết quả thăng giáng theo
đúng mô hình thống kê như bản chất quá trình vật lý đã diễn ra. Việc kiểm tra tính ổn định
thống kê của hệ đo mà nó liên quan đến độ tin cậy của kết quả đo thường được kiểm tra
định kỳ (hằng tháng) bằng cách ghi nhận một loạt 20 đến 50 số đếm từ hệ thống ghi nhận
với điều kiện đo không đổi. Sau đó khảo sát phân bố tần suất của dữ liệu có được và kiểm
75
định xem chúng có tuân theo mô hình thống kê dự đoán. Nếu phép kiểm là phù hợp, tức
thăng giáng nội tại của dữ liệu đo được duy nhất bắt nguồn từ phân bố gốc, hệ đo khi đó
được nói là ổn định về mặt thống kê. Ngược lại, sẽ có những yếu tố bất thường làm sự
thăng giáng của dữ liệu lệch khỏi quy luật thăng giáng thống kê của quá trình vật lý diễn
ra. Khi đó hệ đo được gọi là không ổn định.
Chúng ta bắt đầu với việc thu thập n phép đo độc lập của cùng một đại lượng vật lý.
Ví dụ thực hiện một loạt n lần đo liên tiếp từ detector với thời gian đo cho mỗi phép đo là
t=1 phút. Từ n số đếm có được xác định phân bố tần suất f(x) của dữ liệu như đã định
nghĩa trong công thức (2.2). Từ phân bố này xác định trị trung bình mẫu x e theo công thức

(2.1) hoặc (2.4) và phương sai mẫu S 2 theo công thức (2.10).
Tiếp theo chúng ta xác định mô hình thống kê kỳ vọng P(x) mà từ đó chúng ta hy
vọng hệ đo cho kết quả thăng giáng thống kê theo mô hình này. Đối với các quá trình phân
rã hạt nhân, mô hình thống kê Poisson hay Gauss (tùy thuộc vào độ lớn của giá trị trung
bình) đã mô tả ở trên là sự chọn lựa phù hợp. Chú ý rằng để xây dựng các hàm phân bố
thống kê này, đặc trưng quan trọng cần biết là trị trung bình x và phương sai σ 2 .
Việc cuối cùng là kiểm định xem phân bố của các dữ liệu đo đạc thực nghiệm (có
được từ N lần đo độc lập các số đếm hạt nhân) có trùng với mô hình phân bố thống kê dự
đoán. Các đặc trưng của phân bố khi đó được xác định và so sánh thông qua các phép kiểm
thống kê (xem chương 5, mục 5.2.8). Các đặc trưng thường dùng là trị trung bình, phương
sai và chính hàm phân bố xác suất. Nếu dữ liệu thực nghiệm phù hợp với phân bố kỳ vọng
P(x) ta nói hệ đo ổn định về mặt thống kê.
5.4.2. Đánh giá độ không ổn định thống kê của một phép đo đơn lẻ
Một ứng dụng có giá trị hơn của thống kê học số đếm là trường hợp chúng ta chỉ có
duy nhất một phép đo của một đại lượng vật lý nào đó và cần đánh giá độ không ổn định
của phép đo này. Như đã phân tích ở trên, để ước lượng phương sai từ mẫu, ta thực hiện
phép đo nhiều lần và lấy trung bình bình phương độ lệch của từng giá trị xi so với trị trung
bình. Căn bậc hai của phương sai mẫu chính là độ đo độ lệch chuẩn của một giá trị đo bất
kỳ so với trị trung bình và do đó nó được xem như chỉ số để đánh giá mức độ phân tán của
giá trị đo từ tập hợp của nó. Nhưng khi chúng ta chỉ có một phép đo duy nhất, phương sai
76
mẫu không được tính một cách trực tiếp mà được đánh giá bằng cách tương đồng với mô
hình thống kê thích hợp.
Chúng ta bắt đầu với x là giá trị đo được duy nhất của một lần đo. Kế tiếp giả sử
rằng x được rút từ đám đông có phân bố dự đoán là Poisson hay Gauss, khi đó chúng ta
xây dựng mô hình thống kê tương ứng để từ đó có thể đánh giá được dữ liệu x dựa mô hình
thống kê dự đoán này.
Để xây dựng một mô hình thống kê, Poisson hay Gauss, trước tiên chúng ta cần xác
định giá trị trung bình của phân bố x . Nhưng chúng ta chỉ có một phép đo đơn với kết quả
là x, nên trị trung bình của phân bố được xấp xỉ là x =x. Từ đó xác định phương sai dự
đoán của phân bố Poisson hay Gauss là σ 2 = x = x . Khi đó phương sai mẫu được xấp xỉ
S 2 ≈ σ 2 và suy ra độ lệch chuẩn

S2 = σ = x (5.10)
Đây chính là cách tốt nhất để đánh giá độ lệch so với trị trung bình trong trường hợp
chỉ có một số liệu đo đạc. Khi x lớn mô hình phân bố thống kê Gauss là phù hợp. Khi đó
xác suất để x rơi vào miền giá trị x ± σ hay x ± x là 68%. Ví dụ, x=100 ta có x = 10 và
có khả năng 68% giá trị x sẽ rơi vào miền giá trị [90,110] (xem bảng 5.3).
Bảng 5.3. Khoảng tin cậy của một phép đo đơn có x = 100.
Khoảng tin cậy Xác suất để x rơi vào khoảng
x ± 0,67σ 93,3-106,7 50%
x±σ 90-110 68%
x ± 1,64σ 83,6-116,4 90%
x ± 2,58σ 74,2-125,8 99%

σ x 1
Độ lệch chuẩn tương đối trong một phép đo đơn được định nghĩa δ = = = .
x x x
Công thức này cho thấy sai số tương đối giảm nếu số đếm x ghi được tăng (tương đương
1
với thời gian đo tăng). Trong ví dụ trên thì δ = = 10% . Để đạt được sai số 1% thì số
100

77
1
đo x phải thỏa mãn điều kiện δ = = 1% hay x=10000. Bảng 5.4 liệt kê sự tương quan
x
giữa số đếm x mà detector ghi nhận được và sai số tương đối của phép đo.
Từ đây ta thấy rằng để giảm sai số ta cần phải hoặc tăng thời gian đo trong mỗi phép
đo hoặc tăng số lần đo. Nếu như phải lựa chọn một trong hai cách này để giảm sai số thì ta
nên chọn cách lặp lại phép đo nhiều lần hơn là chỉ đo một lần nhưng kéo dài thời gian đo.
Vì với việc lặp lại phép đo nhiều lần ta có cơ hội để kiểm tra độ tin cậy của số liệu nhận
được trong mỗi lần đo và nếu số liệu đó không tốt thì ta có thể loại nó.
Bảng 5.4. Tương quan giữa số đếm x và sai số tương đối
x Sai số tương đối %
100 10
1000 3,16
10000 1
100000 0,316
1000000 0,10

Chú ý rằng đại lượng σ = x chỉ áp dụng khi x là một số liệu đo đạc trực tiếp trong
khoảng thời gian nào đó, và không được áp dụng cho các số liệu nào khác gián tiếp suy ra
từ số liệu đo đạc trực tiếp. Ví dụ không thể tính σ = x khi x là tốc độ đếm (bằng số đo
được chia cho thời gian đo), hoặc x là tổng, hiệu hay là một hàm của các số đo trực tiếp.
5.4.3. Loại bỏ số lạc
Khi làm thí nghiệm, ta luôn mong muốn kiểm tra xem số liệu mà hệ đo ghi nhận
được có tốt hay không để quyết định có lưu trữ hay không số liệu đó. Trước hết, người làm
thí nghiệm không được phép tin vào kết quả thu được chỉ một lần thí nghiệm duy nhất vì
khó phát hiện được các sai số phạm phải. Như thế nhất thiết phải lặp lại phép đo một số lần
càng nhiều càng tốt. Tiếp theo cần kiểm tra sự sai khác của số liệu đó so với trị trung bình.
Cần lưu ý đến các sự sai khác quá nhiều hoặc quá ít so với trị trung bình thể hiện tính
không ổn định thống kê. Các bước như sau:

78
1. Kiểm tra tính ổn định thống kê của dữ liệu
Nếu số liệu không đạt yêu cầu của phép kiểm χ 2 thì người làm thí nghiệm cần phân
tích để tìm hiểu nguyên nhân. Một trong các khả năng có thể là:
- Thiết bị thí nghiệm bị trục trặc.
- Có thể có tín hiệu lạ từ nguồn khác với đối tượng ta nghiên cứu.
- Nếu thí nghiệm trên nhiều mẫu thì có khả năng mẫu không đồng nhất.
2. Sử dụng nguyên lý Chauvenet để loại bỏ các giá trị lạc
Nội dung của nguyên lý này là giá trị xi nào lệch khỏi trị trung bình lớn hơn khoảng
1
tin cậy (sai khác so với trị trung bình) ứng với xác suất γ = (1 − ) thì có thể loại. Với n là
2n
số lần lặp lại phép đo.
Khoảng tin cậy được xác định bởi sai khác của giá trị xi quan tâm so với trị trung bình
 1− γ 
tính theo đơn vị σ được tính bởi hàm NORMSINV  γ +  trong Excel. Nếu
 2 

/ xi − µ /  1− γ 
z= > NORMSINV γ +  thì xi là số lạc.
σ  2 
Ví dụ 5.6: Sử dụng dữ liệu của bảng 2.1 hãy khảo sát xem trong một lần đo bất kỳ x
= 19 có được chấp nhận không?
Giải: Từ dữ liệu của bảng 2.1 ta tính được trị trung bình là µ ≈ x = 8,8 , độ lệch chuẩn
1
là σ ≈ S = 4,09 . Với n = 20 ta có độ tin cậy khảo sát là γ = (1 − ) = 0,975 . Ngưỡng quyết
2n
 1− γ  /x −µ/
định NORMSINV γ +  = 2,24 .Giá trị x = 19 tương ứng với z = i = 2,49 .
 2  σ

Vì z > 2,24 nên có thể kết luận x = 19 là số lạc.


5.4.4. Giới hạn phát hiện hoạt độ
1. Mức tới hạn LC
Mức tới hạn LC liên quan đến việc có khẳng định được rằng mẫu khảo sát thực sự
có phóng xạ sau khi hoàn thành phép đo hay không? Tuy nhiên về mặt thống kê, quyết
định đó có thể phạm phải hai loại sai lầm. Sai lầm loại 1 hay sai lầm dương tính trong
trường hợp khi nói rằng mẫu khảo sát là có phóng xạ trong khi thực tế không có phóng xạ,
79
xác suất sai lầm loại 1 được gọi là α . Sai lầm loại 2 hay sai lầm âm tính khi nói rằng mẫu
khảo sát không có phóng xạ trong khi thực sự nó có, xác suất sai lầm loại 2 gọi là β .

Giả sử số đếm phông RB có giá trị trung bình µ B và độ lệch chuẩn σ B = µ B , số đếm

tổng RT có giá trị trung bình µ T và độ lệch chuẩn σ T = µ T . Số đếm thực RS khi đó được

xác định bởi giá trị trung bình µ S = µ T − µ B và độ lệch chuẩn σ S = µ B + µ T . Mức tới hạn
LC được xác định khi RS=0, tức RT=RB. Với phân bố số đếm tuân theo phân bố Gauss thì
mức tới hạn được chọn tương ứng với độ tin cậy γ = 95% hay mức ý nghĩa α = 1 − γ = 5% .
Trong trường hợp tổng quát khi thời gian đo phông tB và thời gian đo tổng tT khác nhau thì
Lc được xác định như sau:
tB
L C = 1,645σ B 1 + (5.11)
tT

Khi tB=tT thì


L C = 2,33σ B (5.12)
2. Giới hạn đo
Nếu chỉ sử dụng mức độ tới hạn LC để quyết định có hay không nguồn phóng xạ thì
xác suất để số đếm thuần lớn hơn LC do nguồn phóng xạ gây ra bằng 50%, còn lại xác suất
50% dành cho số đếm thuần bé hơn LC do phông gây ra. Như vậy trong trường hợp số đếm
thuần có giá trị trung bình µ S = L C thì sai lầm loại 2 lên đến 50%. Để giảm sai lầm này cần
chọn một giới hạn đo LD lớn hơn LC sao cho xác suất sai lầm có giá trị nhỏ cỡ 5%. Đây
chính là xác suất sai lầm loại 2, β hay độ tin cậy bằng 1- β =95%.
Điều kiện này đạt được khi:
tB
L D = 2L C = 2 × 1,645σ B 1 + (5.13)
tT

Khi tB = tT thì
L D = 4,66σ B (5.14)
Tuy nhiên giá trị của LD này chưa chính xác vì ta chưa tính đến bản chất thống kê
Poisson của số đếm phông. Để khi RB = 0 ta có xác suất 5% thì µ B = 3 . Thật vậy:

80
30 e −3
P(0) = = 0,05
0!
Như vậy công thức tính LD trở thành
tB
L D = 2Lc + µ B = 3,29σ B 1 + +3 (5.15)
tT

Khi tB = tT thì L D = 4,66σ B + 3


3. Giới hạn hoạt độ LA
Mức tới hạn Lc cũng như giới hạn đo LD tương ứng với số đếm, trong thực tế cần
chuyển thông tin sang hoạt độ và ta có tương ứng với giới hạn đo LD là giới hạn hoạt độ
LA. Đó chính là hoạt độ thấp nhất mà hệ có thể đo được với một mức độ tin cậy cho trước:
CL D
LA = (5.16)
εp∆t
λ∆t
Trong đó C = là thừa số hiệu chỉnh khi khoảng thời gian đo ∆t không thể bỏ
1 − e λ∆t
0,693
qua so với thời gian bán rã T1 / 2 = ; ε là hiệu suất ghi đối với tia γ đo được; p là xác
λ
suất phát tia γ đó. Khi ∆t << T1 / 2 thì C = 1.

81
Hình 5.11. Xác định mức tới hạn LC và giới hạn đo LD.
Bài tập chương 5.
5.1. Người ta đo số đếm N của nguồn phóng xạ trong thời gian t = 1 phút. Kết quả là như
sau:

Ni 0 1 2 3 4 5 6 7 8 9 10

ri 1 9 20 24 19 11 11 0 3 1 1

ri là tần số xuất hiện biến cố Ni tương ứng.


a. Tính số đếm trung bình Ntb và độ lệch chuẩn của nó.
b. Kiểm định giả thiết trị trung bình tính được Ntb sai khác so với giá trị 3,8 với mức
ý nghĩa 5%.

82
c. Kiểm tra sự phù hợp của phân bố thực nghiệm với giả thiết thống kê Poisson với
mức ý nghĩa 5%.
d. Kiểm tra sự phù hợp của của phân bố thực nghiệm với giả thiết thống kê Gauss với
mức ý nghĩa 5%.
5.2. Một sinh viên đo chu kỳ T của con lắc và có được những giá trị sau:

Phép thử 1 2 3 4 5 6 7 8
T (s) 1,35 1,34 1,32 1,36 1,33 1,34 1,37 1,35

a. Tìm trị trung bình Ttb và độ lệch chuẩn σ của các phép đo và độ lệch chuẩn σtb của
trị trung bình.
b. Kiểm định giả thiết trị trung bình tính được Ttb sai khác so với giá trị 1,37 s với
mức ý nghĩa 5%.
c. Hỏi nếu có một lần đo được giá trị 2 s thì có chấp nhận giá trị này không?
5.3. Mười một sinh viên kết hợp các phép đo về thời gian sống kích thích của một trạng
thái. Kết quả được cho trong bảng sau:

Sviên 1 2 3 4 5 6 7 8 9 10 11
τ(s) 34,3 32,2 35,4 33,5 34,7 33,5 27,9 32,0 32,4 21,0 19,8
στ 1,6 1,2 1,5 1,4 1,6 1,5 1,9 1,2 1,4 1,8 1,3

a. Tìm ước lượng của trị trung bình và độ lệch chuẩn của trị trung bình tương ứng.
b. Kiểm định giả thiết trị trung bình tính được Ttb sai khác so với giá trị 32 với mức ý
nghĩa 5%.
c. Hỏi nếu có một lần đo được giá trị 35 s thì có chấp nhận giá trị này không?
5.4. Bảng dưới đây trình bày phân bố số đếm N (của Co-57 tại vạch năng lượng 122,1 keV)
theo kênh K. Hãy kiểm tra phân bố số đếm N có tuân theo thống kê Lorentz hay không với
mức ý nghĩa 5%.

83
K N K N K N
481 257 489 2554 497 187
482 258 490 9438 498 85
483 237 491 22023 499 71
484 268 492 31303 500 62
485 278 493 27864 501 52
486 278 494 14380 502 72
487 301 495 4683 503 75
488 654 496 953

5.5. Bảng dưới đây trình bày phân bố dân số chịu các suất liều trong từng khoảng 10nGy/h
đối với Việt Nam
Suất liều hấp thu Dân số Việt Nam Suất liều hấp thu Dân số Việt Nam
(10nGy/h) (Triệu người) (10nGy/h) (Triệu người)
0-9,9 0 70-79,9 17
10-19,9 1 80-89,9 10
20-29,9 10 90-99,9 6
30-39,9 2 100-109,9 4
40-49,9 3 110-119,9 2
50-59,9 9 120-129,9 0
60-69,9 12 130-139,9 1

a. Hãy xác định suất liều trung bình và độ lệch chuẩn của nó.
b. Hãy kiểm định giả thiết phân bố suất liều trên có dạng Poisson với mức ý nghĩa
5%.
5.6. Để định mức thời gian gia công một chi tiết máy, người ta theo dõi ngẫu nhiên quá
trình gia công ngẫu nhiên 25 chi tiết và thu được số liệu :
Thời gian gia công (min) Số chi tiết tương ứng
15-17 1
17-19 3
19-21 4
21-23 12
23-25 3
25-27 2

84
a. Kiểm tra thời gian gia công có tuân theo phân bố Gauss hay không với mức ý
nghĩa 5%?
b. Ước lượng thời gian trung bình gia công một chi tiết máy với độ tin cậy 95%.
5.7. Khối lượng qui định của 1 quả cân là 250 g. Giả sử trong lượng tuân theo qui luật phân
bố Gauss với µ và σ = 5. Người ta lấy mẫu n=16 và tính được x = 244. Hỏi kết quả thu
được có phù hợp với giả thiết H: µ = 250 với mức ý nghĩa 5% không?
5.8. Một cái cân nếu hoạt động tốt khối lượng đo được tuân theo phân bố Gauss với độ lệch
chuẩn là 1 kg. Sau 30 lần cân, ta thấy độ lệch chuẩn điều chỉnh mẫu là 1,1 kg. Hỏi cái cân
đó có hoạt động tốt không với mức ý nghĩa 1%?
5.9. Kết quả thực nghiệm của 8 phép đo thời gian sống trung bình của meson KS với sai số,
trong thời gian 10-10s, được quan sát như sau:

0,8971 ± 0,0021 0,8941 ± 0,0014 0,8929 ± 0,0016 0,8920 ± 0,0044


0,8924 ± 0,0032 0,8937 ± 0,0048 0,8958 ± 0,0045 0,871 ± 0,009
Hỏi với độ tin cậy 95% từ số liệu trên, kết quả của phép đo thứ 8: 0,871 ± 0,009 có thể
chấp nhận được không?

85
CHƯƠNG 6
LÀM KHỚP BÌNH PHƯƠNG TỐI THIỂU TUYẾN TÍNH
CÁC DỮ LIỆU THỰC NGHIỆM
6.1. Phương pháp bình phương tối thiểu
6.1.1. Khái niệm về biến độc lập và biến phụ thuộc
Biến độc lập x: có giá trị nhận được từ phép đo trực tiếp lên đại lượng đo x một cách
độc lập
Biến phụ thuộc y: có giá trị nhận được từ phép đo trực tiếp hoặc gián tiếp lên đại
lượng đo y đó theo các biến độc lập theo quan hệ phụ thuộc hàm.
Ví dụ: - Với phép đo khảo sát hiệu thế V theo khoảng cách x, thì x là biến độc lập,
còn V là biến phụ thuộc
- Với phép đo quy luật giảm của cường độ phóng xạ A theo khoảng cách x,
thì x là biến độc lập, còn A là biến phụ thuộc.
6.1.2. Bài toán làm khớp dạng đường thẳng
Giả sử ta có hai đại lượng độc lập x, và phụ thuộc y, và ta dự đoán hoặc biết trước
mối liên hệ giữa x và y theo dạng tuyến tính:
y = a + bx (6.1)
Từ thực nghiệm ta có được dãy trị đo của {y1,y2,…,yn} theo dãy trị đo {x1,x2,…,xn},
Dựa trên các số liệu thực nghiệm đó ta đi xác định các hệ số a, b sao cho độ lệch giữa trị đo
yi và trị khớp y(xi) ,
∆y i = y i − y( x i ) = y i − a − bx i , (6.2)
là nhỏ nhất.
Tuy nhiên, tổng của các độ lệch về trung bình thì không diễn tả được độ lệch của toàn
bộ dữ liệu. Thay vào đó ta nên dùng tổng bình phương độ lệch và phương pháp để xác định
a, b đơn giản và có hiệu quả là phương pháp bình phương tối thiểu dựa trên nguyên lý cơ
hội cực đại.

86
Nguyên lý cơ hội cực đại
Gọi a0 và b0 là tham số mà ta cần ước lượng thông qua các giá trị tính từ mẫu a, b.
Giả sử mẫu được rút từ đám đông có liên hệ tuyến tính:
Ta có: y0(x) = a0+b0x (6.3)
Giả sử yi đo được, được rút từ phân bố Gauss có trị trung bình y0(xi) và độ lệch chuẩn
σi. Chúng ta cần hiểu giả thuyết Gauss không luôn đúng. Trong ví dụ 6.2, ta sẽ thấy trị đo
yi = Ci tuân theo phân bố Poisson. Tuy nhiên, khi số đếm đủ lớn yi có thể được xem tuân
theo phân bố Gauss.
Với giả thuyết Gauss, xác suất Pi để có giá trị đo yi với độ lệch chuẩn σi quanh giá trị
thật y0(xi) là:

1  1  y − y ( x )  2 
Pi = exp−  i 0 i
  (6.4)
σi 2π  2  σi  

Vậy xác suất để có một tập hợp N các giá trị yi, sẽ là tích của từng xác suất trên.

 1  y i − y 0 ( x i )  
2
1
P(a 0 , b 0 ) = ∏ Pi = ∏ ( ) exp− ∑    (6.5)
σi 2π  2  σi  

Một cách tương đồng:


 1  y i − y( x i )  
2
1
P (a , b ) = ∏ ( ) exp− ∑    (6.6)
σi 2π  2  σi  

Với y(x) được định nghĩa theo phương trình (6.1).


a, b được đánh giá sao cho (6.6) có cơ hội cực đại xảy ra. Điều đó tương đương với:
2 2
 y − y( x i )  1 
χ ≡ ∑  i
2
 = ∑  ( y i − a − bx i ) (6.7)
 σi   σi 
cực tiểu. Và được gọi là khớp bình phương tối thiểu.
6.2. Cực tiểu hoá χ2
Để xác định a,b ta cực tiểu χ2 theo a, b. Tức là:
∂χ 2 ∂ 1 2 1 
= ∑  2 (y i − a − bx i )  = −2∑  2 (y i − a − bx i ) = 0
∂a ∂a  σ i   σi 

87
∂χ 2 ∂ 1 2  xi 
= ∑  2 (y i − a − bx i )  = −2∑  2 (y i − a − bx i ) = 0 (6.8)
∂b ∂b  σ i   σi 
Suy ra:
yi 1 x
∑σ 2
= a∑
σi
2
+ b∑ 2i
σi
i

x i yi xi x i2
∑ σ2 ∑ σ2 ∑ σ2
= a + b (6.9)
i i i

Giải hệ phương trình trên theo phương pháp định thức:

yi xi
1
∑σ 2 ∑σ 2
1  x i2 yi xi x i yi 
a= i i
=  ∑ 2 ∑σ −∑ ∑  (6.10.a)
∆ ∆  σi σ i2 σ i2
2 2
xy x
∑ σi 2 i ∑σ i
2
i 
i i

1 yi
1
∑σ 2 ∑σ 2
1 1 x i yi x yi 
b= i i
= ∑ 2
 ∑ − ∑ 2i ∑σ 
2 
(6.10.b)
∆ x xy ∆  σi σi 2
σi
∑ σ 2i ∑ σi 2 i i 

i i

1 xi
∑σ 2 ∑σ 2
 1 x i2 x 
∆= i i
=  ∑ 2 ∑ σ 2 − (∑ σ 2i ) 2  (6.10.c)
 σi
2
x x
∑ σ 2i ∑σ i
2
i i 
i i

Trong trường hợp đặc biệt, σ = σi, thì:

a=
1 ∑y ∑x i i
=
1
(∑ x ∑ y − ∑ x ∑ x y )
2
(6.11.a)
∆' ∑x y ∑x i i
2
i ∆'
i i i i i

b=
1 N ∑y i
=
1 
 N∑ x i y i − ∑ x i ∑ y i  (6.11.b)
∆' ∑ xi ∑x y i i ∆'  

∆' =
N ∑x i
= N ∑ x i2 − (∑ x i )
2
(6.11.c)
∑x i ∑x 2
i

88
6.3. Đánh giá sai số
6.3.1. Sai số đo đạc
Khi thực hiện việc đo y theo x, ta giả sử x có sai số là σ x , thì sai số toàn phần của y
là:
σ 2y = σ 2yI + σ 2yD (6.12)

Với σ yD là sai số đo trực tiếp của y. Còn σ yI là sai số gián tiếp của x ảnh hưởng đến y:
dy
σ yI = σ x (6.13)
dx
dy dy
Khi: σ x << σ y thì ta có thể bỏ qua sai số của x ảnh hưởng lên y, ở đây là độ
dx dx
dốc của hàm y = y( x ) .
6.3.2. Sai số của việc làm khớp
Nếu σ i của các dữ liệu y i chưa biết và nếu ta giả sử σ i 2 = σ 2 , khi đó ta đánh giá

σ 2 thông qua S2 .
1 n
σ 2 ≈ S2 = ∑
n − m i =1
( y i − y) 2 , (6.14)

Ở đây f = n − m gọi là độ tự do của hệ, n là số phép đo, m là số tham số cần fit, y = y( x ) là


hàm cần fit.
Nếu đường fit có dạng bậc 1, ta có 2 tham số a, b, nên m = 2 . Do đó:
1 n
σ 2 = S2 = ∑
n − 2 i =1
( y i − a − bx i ) 2 (6.15)

Ta thấy đây cũng chính là sai số của trị đo y i so với trị fit.
6.3.3. Sai số thống kê
Trên thực tế σ i không giống nhau. Và nếu y i là số đếm từ nguồn phóng xạ thì:
σi = yi
2
(6.16)
6.3.4. Sai số của các tham số
Áp dụng công thức truyền sai số ở chương 3, để tính sai số cho các tham số a,b. Từ
công thức (6.10) tính a, b ta suy ra:

89
∂a 1 1 x i2 x j x i 
=  2
∂y i ∆  σ j
∑ σ2 − σ2 ∑σ 2 
i j i 

∂b 1  x j 1 1 x i 
=
∂y i ∆  σ 2j
∑σ 2

σ 2j
∑σ 2 
(6.17)
i i 

1 x i2
Và ta tính được: σ = ∑ 2 2
(6.18)
∆ σi
a

1 1
σ 2b = ∑ 2 (6.19)
∆ σi
Trong trường hợp đặc biệt: σ i = σ , phương trình trên có dạng:

σ2 σ2
σ a2 =
∆'
∑ x i2 và σ 2b = n ∆'
(6.20)
6.4. Kiểm định tính phù hợp của việc làm khớp
Để kiểm định tính phù hợp của việc làm khớp ta đặt giả thiết:
H 0 : Dạng khớp là phù hợp

H 1 : Dạng khớp là không phù hợp

Áp dụng phép kiểm định phân bố, ta đi tính thống kê χ 2 từ phương trình (6.7).
Chọn mức ý nghĩa α , tính p-value = CHIDIST( χ 2 , ν ), với ν =n-m là độ tự do của hệ.
Ra quyết định: nếu p-value lớn hơn α thì việc làm khớp là phù hợp.
Có thể dùng ngưỡng quyết định χ ν2 ,α = CHIINV(α, ν) thay cho việc kiểm định dùng p-

value.
6.5. Các ví dụ
Ví dụ 6.1. Khảo sát hiệu thế của V theo vị trí x, kết quả cho trong bảng 6.1 dưới đây. Hãy
khớp số liệu theo dạng tuyến tính: V=a+bx. Cho σ i = σ =0,05Volt, σx <1mm ≈ 0.
Bảng 6.1. Số liệu của hiệu thế V theo vị trí x
Lần đo i xi Vi xi2 xiVi Vfit=a+bxi
1 10,0 0,37 100 3,70 0,33
2 20,0 0,58 400 11,60 0,60
3 30,0 0,83 900 24,90 0,86
4 40,0 1,15 1600 46,00 1,12
5 50,0 1,36 2500 68,00 1,38
6 60,0 1,62 3600 97,20 1,64

90
7 70,0 1,90 4900 133,00 1,91
8 80,0 2,18 6400 174,40 2,17
9 90,0 2,45 8100 220,50 2,43
Tổng 450,0 12,44 28500 779,30

∆' = N ∑ x i − (∑ x i ) = (9 x 28.500) 2 = 54.000


2 2

a=
1
∆'
(∑ x ∑ V − ∑ x ∑ x V ) = (28.500x12,44 − 450,0x779,30) / 54.000 = 0,0714
i
2
i i i i

1 
b=  N ∑ x i y i − ∑ x i ∑ y i  = (9 x 779,30 − 450,0 x12,44) / 54.000 = 0,0262

∆'  

∑x
2

σa ≈ σV = 0,05 2 x 28.500 / 54.000 = 0,001319 ⇒ σ a ≈ 0,036


2 2 i

∆'
2 1
σ b ≈ Nσ V = 9 x 0,05 2 / 54.000 = 0,417 x10 −6 ⇒ σ b ≈ 0,00065
2

∆'
Vậy a = 0,07 ± 0,04volt và b = 0,0262 ± 0,0006volt / cm .
Kiểm định tính phù hợp của việc làm khớp: χ 2 = 1,95 với
ν = 7 ⇒ p - value = P(χ 2 > 1,95) ≈ 96% (dùng hàm CHIDIST(χ 2 , f ) để tra tìm xác suất).

Ví dụ 6.2. Để khảo sát quy luật giảm cường độ phóng xạ N theo khoảng cách d dạng
N  1 d 2 , người ta đo với nguồn đường kính 8mm, đặt cách detector GM với khoảng cách

thay đổi từ 20 cm đến 100 cm. Thời gian đo t =15 s. Ta được kết quả cho trong bảng 6.2
sau:
Bảng 6.2. Quy luật giảm cường độ phóng xạ Ni theo khoảng cách d
i di xi = Ni σi2 wi wixi wiNi wixi2 wixiNi Nfit
(cm) (1/d2)×
104
1 20 25,00 901 901 0,00111 0,0278 1 0,694 25,00 887
2 25 16,00 652 652 0,00153 0,0254 1 0,393 16,00 610
3 30 11,11 443 443 0,00226 0,0251 1 0,279 11,11 461
4 35 8,16 339 339 0,00295 0,0241 1 0,197 8,16 370
5 40 6,25 283 283 0,00353 0,0221 1 0,138 6,25 311
6 45 4,94 281 281 0,00356 0,0176 1 0,087 4,94 271
7 50 4,00 240 240 0,00417 0,0167 1 0,067 4,00 242
8 60 2,78 220 220 0,00455 0,0126 1 0,035 2,78 205
9 75 1,78 180 180 0,00556 0,0099 1 0,018 1,78 174
10 100 1,00 154 154 0,00649 0,0065 1 0,007 1,00 150
Σ 0,03570 0,1868 10 1,912 81,0

91
σi = yi , w = 1 = 1
σ i2 yi
∆ = ∑ w i ∑ w i x i2 − (∑ w i x i ) = 0,03570 x1,912 − (0,1868) 2 = 0,0334
2

a=
(∑ w N ∑ w x − ∑ w x ∑ w x N ) = (10x1,912 − 0.,868x81,0) = 119,5
i i i
2
i i i i i i

∆ 0,0334
(∑ w i ∑ w i x i N i − ∑ w i x i ∑ w i N i ) (0,03570x81 − 0,1868x10) = 30,7
b= =
∆ 0,0334
2
wix 1,912
σ a2 = ∑ = i
= 57,3 ⇒ σ a = 7,6
∆ 0,0334

σ 2b =
∑ w i = 0,03570 = 1,07 ⇒ σ = 1,1

b
0,0334

6.6. Phương pháp ma trận


Dạng đa thức cần khớp:
y( x ) = a 1 + a 2 x + a 3 x 2 + ... + a m x m −1 (6.21)
m
Hay: y( x ) = ∑ a k x k −1 (6.22)
k =1

Hay tổng quát hoá:


m
y( x ) = ∑ a k f k ( x ) (6.23)
k =1

Ở đây f(x) có thể là luỹ thừa của x như phương trình (6.22), khi đó:
f 1 ( x ) = 1; f 2 ( x ) = x; f 3 ( x ) = x 2 ;...
hoặc có thể là một hàm khác của x với điều kiện chúng không chứa các tham số
a 1 , a 2 , a 3 ,.... cần xác định.

Với định nghĩa này hàm xác suất cơ hội cực đại của phương trình (6.6) có thể được
viết lại như sau:
 2
n
1  1 n 1  m
 
P(a 1 , a 2 ,..., a m ) = ∏ ( ). exp− ∑  y i − ∑ a k f k ( x i )  (6.24)
i =1 σi 2π  2 i =1 σ 2  k =1  
 i 
Và đặt:
2
 m
1 n

y χ = ∑
 i ∑ a k f k ( x i ) 
− 2
(6.25)
 k =1i =1  σ i 
Cực tiểu hoá χ theo các tham số cần tìm a 1 , a 2 , a 3 ,....
2

92
2
∂χ 2 ∂ n
1  m

=
∂a l ∂a l
∑ 
i =1  σ i


y i − ∑
k =1
a k f k ( x i ) 


 
 f l (x i ) 
n m

= −2∑   y i − ∑ a k f k ( x i )  = 0 (6.26)
i =1  σ 2  k =1 
 i 
với l, k = 1,2,..., m với m là số tham số; i = 1,2,..., n với n là số cặp dữ liệu ( x i , y i ) .
Ta được tập hợp m phương trình tuyến tính đối với m tham số a l .
  
n
f l (x i )  n 1
m

∑y i = ∑ a k ∑  f l ( x i )f k ( x i ) 
k =1 
i =1 σ2 i =1 σ 2
 
i   i 
Hoặc
 
n n
 f1 ( x i ) 
∑y i
f1 ( x i )
= ∑ [a 1f 1 ( x i ) + a 2 f 2 ( x i ) + ...]
i =1 σ2 i =1  σ 2 
i  i 

 
n n
 f 2 (x i ) 
∑y i
f 2 (x i )
= ∑ [a 1f 1 ( x i ) + a 2 f 2 ( x i ) + ...]
i =1 σ2 i =1  σ 2 
i  i 
.............
.............

 
n n
 f m (x i ) 
∑y i
f m (x i )
= ∑ [a 1f 1 ( x i ) + a 2 f 2 ( x i ) + ...] (6.27)
i =1 σ2 i =1  σ 2 
i  i 
Phương trình (6.27) có thể được viết dưới dạng ma trận sau:
β = a×α (6.28)
Trong đó yếu tố ma trận của β và α là
 
1 n

β k ≡ ∑  y i f k ( x i )
i =1 σ 2
 i 
  (6.29)

93
 
n
1 
α l,k ≡ ∑  f l ( x i )f k ( x i )  (6.30)
i =1 σ 2
 i 
 
Còn a là ma trận dòng chứa các yếu tố là tham số cần làm khớp.
Ví dụ: với m = 3 , ta có các ma trận tương ứng là
β = [β1 β2 β3 ] (6.31)
a = [a 1 a2 a3] (6.32)
 α11 α12 α 13 
α = α 21 α 22 α 23 
α 31 α 32 α 33 
(6.33)
Để giải ma trận tham số a, ta nhân hai vế của phương trình (6.28) cho ma trận nghịch đảo
ε = α −1 .

βε = aαε = aαα −1 = a (6.34)


Vậy
a = βε = βα −1 (6.35)
Phương trình (6.35) cũng có thể được diễn đạt như sau
  
m
 n 1
m

a l = ∑ (β k ε kl ) =∑ ε kl ∑  y i .f k ( x i )  (6.36)
k =1 
k =1 i =1 σ 2
 
  i 
6.7. Đánh giá sai số theo phương pháp ma trận
Phương sai của a l được xác định theo phương trình truyền sai số
n
 ∂a 
σ a = ∑ σ 2 .( l ) 2 
2
i ∂y
l i =1  i 
Hiệp phương sai của hai tham số a j và a l được cho bởi
n
 ∂a j ∂a l 
σ a a = ∑ σ 2
2
i ∂y ∂y 
(6.37)
j l i =1  i i 

Từ (6.36) ta suy ra:


 
∂a l m
 1 
= ∑ ε lk f k ( x i ) (6.38)
∂y i k =1
 σi
2

 
Suy ra

94
n 
 m  1 m  1  
= ∑ σ i2 ∑ ε jk 2 f k ( x i ) ∑ ε lp 2 f p ( x i ) 
2
σa
ja l
 k =1  σ i
i =1   p −1  σ i  
  
m
 m
 n
1 
= ∑ ε jk ∑ ε lp ∑ f p ( x i )f k ( x i ) 
k =1 
 i =1 σ i 
p =1 2
  
m  
[ ]
m
= ∑ ε jk ∑ ε lp α pk 
k =1  p =1 
= ∑ {ε kj1lk } = ε jl
m

k =1

Tóm lại
2
σa = ε jl (6.39)
ja l

Biểu thức (6.39) cho ta thấy ε chính là ma trận hiệp phương sai của các tham số.
Ví dụ 6.3: Khảo sát sự thay đổi của thế V theo nhiệt độ, kết quả cho trong bảng 6.3. Cho
biết σ V = 0,05V . Hãy làm khớp dữ liệu trên dạng đa thức bậc 1 bằng phương pháp ma trận.
Bảng 6.3. Số liệu của thế V theo nhiệt độ T
i T V
1 0 -0,849
2 20 -0,196
3 40 0,734
4 60 1,541
5 80 2,456
6 100 3,318

Ta thực hiện các phép tính trên bảng sau:


i Ti Vi f1i f2i β’1i β’2i α’11i α’12i α’22i Vfiti
1 0 -0,849 1 0 - 339,6 0 400 0 0 -0,947
2 20 -0,196 1 20 - 78,4 - 1.568 400 8.000 160.000 -0,101
3 40 0,734 1 40 293,6 11.744 400 16.000 640.000 0,745
4 60 1,541 1 60 616,4 36.984 400 24.000 1.440.000 1,590
5 80 2,456 1 80 982,4 78.592 400 32.000 2.560.000 2,436
6 100 3,318 1 100 1327,6 132.720 400 40.000 4.000.000 3,281
Σ 2802,0 258.472 2.400 120.000 8.800.000
Với:
1 1
β1i = Vi f 1i ; β 2i = Vf
2 2 i 2i
σ σ
i i

95
1 1 1
α 11i = f 1f 1 ; α 12i = f 1f 2 ; α 22i = f f
2 2 2 2 2
σ σ σ
i i i
σ i = σ V = 0,05mV
Vậy
 2.400 120.000   1,310x10−3 −1, 786x10−5 
α=  ε= −5 
120.000 8.800.000  −1, 786x10 3,571x10−7 

β = [2.802 258.472] a = [− 0,947 0,0423]

Chú ý: Trong Excel:


Phần tử ε ij của ma trận ε được tính bởi hàm INDEX(MINVERSE(ma trận α ),i,j).

Phần tử a j của ma trận a được tính bởi hàm INDEX(MMULT(ma trận beta, ma trận

epsi),1,j).
* Kiểm định tính phù hợp của việc làm khớp:
Để kiểm định tính phù hợp của việc làm khớp ta đặt giả thiết:
H 0 : Dạng khớp bậc 1 là phù hợp

H 1 : Dạng khớp bậc 1 là không phù hợp

Áp dụng phép kiểm định phân bố, ta đi tính thống kê χ 2 từ phương trình (6.7) và được kết
quả:
6 2

χ2 = ∑
1
[Vi − Vfit ] = 9,133
i =1 (0,05) 2

Với mức ý nghĩa α = 5% , độ tự do của hệ là ν = 6 − 2 = 4 ta suy ra ngưỡng quyết định:

χ 2
= 9,487 . Vậy việc khớp phù hợp.
4;0.05

Ví dụ 6.4: Khảo sát sự thay đổi của hiệu thế V theo nhiệt độ T ta có được dữ liệu ở bảng
6.4. Hãy làm khớp dữ liệu này theo dạng bậc 2 bằng phương pháp ma trận.
V = a 1 + a 2 T + a 3T 2 (6.40)
Và tính sai số của việc khớp (sai số của V). Kiểm định tính phù hợp của việc khớp.
Bảng 6.4. Số liệu của hiệu thế V theo nhiệt độ T, σ = 0.05Volt

96
i Nhiệt độ T(oC) V(Volt)
1 0 -0,849
2 5 -0,738
3 10 -0,537
4 15 -0,354
5 20 -0,196
6 25 -0,019
7 30 0,262
8 35 0,413
9 40 0,734
10 45 0,882
11 50 1,258
12 55 1,305
13 60 1,541
14 65 1,768
15 70 1,935
16 75 2,147
17 80 2,456
18 85 2,676
19 90 2,994
20 95 3,200
21 100 3,318

 ε11 ε12 ε13 


Hướng dẫn: Giả sử đã tính xong ma trận phương sai của các tham số. ε = ε 21 ε 22 ε 23 
ε 31 ε 32 ε 33 

và xác định được mối quan hệ của V theo (6.40). Khi đó sai số của V được tính bởi:

∂V 2 2 ∂V 2 2 ∂V 2 2 ∂V ∂V 2 ∂V ∂V 2 ∂V ∂V 2
S2 = ( ) σ +( ) σ +( ) σ + 2( )σ + 2( )σ + 2( )σ
∂a 1 1 ∂a 2 2 ∂a 3 3 ∂a 1 ∂a 2 12 ∂a 1 ∂a 3 13 ∂a 2 ∂a 3 23
= 1.ε11 + T 2 ε 22 + T 4 ε 33 + 2(T.ε12 + T 2 ε13 + T 3 ε 23 ) (6.41)

= 0,02 với T = 80 o C

Nếu bỏ qua số hạng ngoài đường chéo thì S = 0,14Volt.


6.8. Làm khớp dạng đa thức Legendre
Người ta cũng thường dùng các tập hợp đa thức trực giao được định nghĩa trước để
áp dụng cho việc khớp dữ liệu. Một trong các loại đó là đa thức Legendre.

97
m −1
y( x ) = a o Po ( x ) + a 1 P1 ( x ) + .... = ∑ a l Pl ( x ) (6.42)
l=0

với x = cos θ và Pl ( x ) được định nghĩa:


P0 ( x ) = 1

P1 ( x ) = x
1
P2 ( x ) = (3x 2 − 1)
2
1
=
P3 (x) (5x 3 − 3x)
2
1
P4 (x)= (35x 4 − 30x 2 + 3)
8
.
.

1
= (2 − 1).x.P −1 (x) − ( − 1)P − 2 (x)  (6.43)

Pl (x)

Chú ý: Đa thức Legendre là đa thức trực giao:


 2
+1
 =m
∫−1 P (x)Pm (x)dx =  (2 + 1) (6.44)
 0 ≠m

Ví dụ 6.5: Khảo sát thí nghiệm bắn hạt proton năng lượng 6,5 MeV vào 13C tạo ra 14N phát
γ năng lượng lên đến 11 MeV. Đo sự phân bố góc của tia γ phát ra ta sẽ có thông tin về

trạng thái momen góc của các mức năng lượng kích thích của 14*N.
Bảng 6.5 liệt kê số đếm của tia γ được đo ở 17 góc từ 0o đến 160o thăng giáng trong sai số
được coi là thuần tuý thống kê.
Bảng 6.5. Số liệu tia γ theo góc
θ (0C) x = cos θ Số đếm Ci σ Ci
0 1,000 1400 37,4
10 0,985 1386 37,2
20 0,940 1130 33,6
30 0,866 1045 32,3
40 0,766 971 31,2
50 0,643 862 29,4
60 0,500 819 28,6
70 0,342 808 28,4

98
80 0,174 862 29,4
90 0,000 829 28,2
100 -0,174 824 28,7
110 -0,342 839 29,0
120 -0,500 819 28,6
130 -0,643 901 30,0
140 -0,766 925 30,4
150 -0,866 1044 32,3
160 -0,940 1224 35,0

Hình 6.1 cho thấy đồ thị đối xứng quanh θ = 90 0 .

Hình 6.1. Phân bố dữ liệu tia γ theo góc.


Khảo sát dạng đồ thị ta dự đoán dữ liệu có dạng đa thức Legendre bậc 4 với các số
hạng chẵn:
C = a 0 P0 ( x ) + a 2 P2 ( x ) + a 4 P4 ( x ) với x = cos θ (6.45)
Tuy nhiên đầu tiên ta khớp dữ liệu theo dạng đa thức bậc 4 với đầy đủ số hạng chẵn
và lẻ
C = a 0 P0 ( x ) + a 1 P1 ( x ) + a 2 P2 ( x ) + ... + a m Pm ( x ) (6.46)
6.9. Hàm không tuyến tính dạng hàm mũ
Ví dụ 6.6: Phân bố thời gian phân rã của các đồng vị phóng xạ
t
1 −
P( t ) = ( )e τ , τ là thời gian sống trung bình
τ

99
Vấn đề: có thể tìm được τ bằng phương pháp bình phương tối thiểu không?
Trả lời: phương pháp bình phương tối thiểu tuyến tính không tính được trực tiếp cho dạng
này, nhưng ta có thể áp dụng nó khi tuyến tính hoá dạng trên.
6.9.1. Dạng hàm mũ tổng quát
y = ae − bx (6.47)
a, b là những tham số chưa biết.
Lấy logarit nepe hai vế của (6.47) ta được:
ln y = ln a − bx (6.48)
Cực tiểu hoá chi bình phương theo các tham số (lna) và b ta được:
 
n
 1 2
χ = ∑  [ln y i + ln a − bx i ] 
2
(6.49)
i =1  σ ' 2 
 i 
' d(ln yi )
Với σ = σi (6.50)
i dyi
Nói chung nếu ta khớp hàm f(y) thay vì y, sai số σ i được thay bằng:
' df ( y)
σ = σ (6.51)
i dyi i
Một cách tổng quát, nếu ta thay vì khớp các dữ liệu y i với các hệ số a, b,… ta khớp
'
y = f ( y) với các hệ số a ' , b' ,... thì việc tính sai số cho các tham số a, b được đưa về việc
i

tính sai số cho các tham số a ' và b' :


a ' = f a (a ) ; b ' = f b ( b )

' df (a ) ' df (a )
σ = a σa ; σ = b σb (6.52)
a da b db
' d(ln a ) σ
Ở đây trong ví dụ nầy: a ' = ln a ⇒ σ = σa = a (6.53)
a da a

Còn việc tính chi bình phương cho việc kiểm định tính phù hợp của việc làm khớp thì
cần được xác định từ sai số ban đầu σ i và phương trình chưa tuyến tính hoá (6.47), mặc dù
'
phương trình (6.48) sẽ cho giá trị xấp xỉ tương đương khi dùng σ .
i

100
6.9.2. Dạng luỹ thừa
Trong ví dụ 6.2 khi khảo sát sự suy giảm của số đếm C như một hàm theo khoảng
cách r của nguồn phóng xạ. Ta biết
b
C( r ) = (6.54)
r2
1
Đặt x = ta được dạng tuyến tính C( x ) = bx
r2
Một cách tổng quát:
C(r ) = br − a (6.55)
Lấy loga hai vế, ta có:
ln C = ln b − a ln r
Hoặc: C' = b'−ar '
Với: C' = ln C , r ' = ln r , b' = ln b .

Bài tập chương 6

6.1. Khớp dữ liệu của ví dụ 6.2 nếu tất cả dữ liệu có cùng sai số σI = σtb = 18,5 với σtb là
trung bình của các giá trị σi.
6.2. Khớp dữ liệu sau đây với dạng y = bx. Giả sử sai số của yi giống nhau và bằng σi =1,5.
Tìm χ2 của việc khớp và tính sai số của b, σb.

xi 2 4 6 8 10 12 14 16 18 20 22 24
yi 5,3 14,4 20,7 30,1 35,0 41,3 52,7 55,7 63,0 72,1 80,5 87,9

6.3. Một sinh viên treo vật A có khối lượng m khác nhau vào sợi dây và đo chiều dài L
của sợi dây.Kết quả như sau:

m (kg) 200 300 400 500 600 700 800 900


L(cm) 5,1 5,5 5,9 6,8 7,4 7,5 8,6 9,4

Ta có mối quan hệ: F = k ∆L, với F = mg là trọng lực. ∆L = L - Lovới Lo là độ dài của sợi
dây khi chưa có treo vật A. Sử dụng dữ liệu trên để khớp bình phương tối thiểu của L theo
m. Từ đó tìm k và Lo và sai số tương ứng. Kiểm định sự phù hợp của việc làm khớp χ2 với
việc dùng p-value tương ứng. Cho sai số của L là 0,2 cm

101
6.4. Khớp số liệu được cho trong ví dụ 6.4 theo dạng đa thức bậc 2 bằng phương pháp ma
trận:
V = a 1 + a 2 T + a 3 T2
Tính ma trận sai số
Và dự đoán giá trị của V tại T = 80oC với sai số kèm theo.
6.5. Bảng dữ liệu dưới đây mô tả quan hệ giữa x, là phông dưới chân đỉnh phổ và y là số
đếm phổ tương ứng của hai đỉnh phổ.

Sử dụng phương pháp bình phương tối thiểu để tìm a1 và a2 và sai số của chúng với
hàm làm khớp có dạng:
y(x) = a1L(x ; µ1 ; Γ1) + a2L(x ; µ2 ; Γ2)
với µ1 = 102,1, Γ1= 30, µ2 =177,9 và Γ2 = 20, Hàm L(x ; µ ; Γ) là hàm Lorentz .
Giả sử số liệu tuân theo thống kê Poisson. Tìm χ2 của việc khớp và ma trận sai số toàn
phần.
i 1 2 3 4 5 6 7 8 9 10
xi 50 60 70 80 90 100 110 120 130 140
yi 5 7 11 13 21 43 30 16 15 10
i 11 12 13 14 15 16 17 18 19 20
xi 150 160 170 180 190 200 210 220 230 240
yi 13 42 90 75 29 13 8 4 6 3

6.6. Trong thí nghiệm đo phân bố góc của tán xạ hạt cổ điển, một chùm hạt được bắn vào
bia nhân Hydrogen lỏng, số đếm được ghi ở một góc lệch so với phương chùm tới khi bia
có nhân H và khi không có nhân H (đo phông). Kết quả được cho trong bảng sau đây:
a. Xác định số đếm thật sự tương tác lên nhân Hydro, yi và sai số của nó.
b. Dựa vào dữ liệu về số đếm thật yi có được ở câu a), làm khớp chúng theo dạng
hàm y(x) = a1P0(x) + a2P1(x) + a3P2(x). Với PL(x) là đa thức Legendre.
cosθ -0,8 -0,6 -0,4 -0,2 0,0 0,2 0,4 0,6 0,8 1,0
Số đếm khi bia có H 184 128 99 49 53 55 70 81 136 216
Số đếm khi bia không 5 4 4 1 3 1 4 9 8 7
có H

102
6.7. Để xác định gia tốc trọng trường g, người ta làm thí nghiệm ở một phòng thí nghiệm
dưới mặt đất khi cho một cây thước plastic dài 1m rơi xuống một khe quang và ghi nhận
khoảng thời gian rơi theo vị trí rơi của vạch trên cây thước kể từ lúc ban đầu t=0 khi vạch 0
của cây thước đi qua khe. Kết quả cho như sau:

Vạch y 0 1 2 3 4 5 6 7 8 9 10
(dm)
t (s) 0 0,079 0,132 0,174 0,212 0,244 0,271 0,301 0,325 0,349 0,373

Biết quy luật rơi có dạng y = yo+vot+gt2/2, sai số của việc đo y, σy = 0,1 dm
a. Hãy làm khớp y theo t theo dạng trên
b. Từ đó tính g và sai số tương ứng
6.8. Người ta đo hoạt độ mẫu phóng xạ theo thời gian như sau:

t (phút) 4 36 68 100 132 164 196 218


Hoạt độ (cpm) 392,2 161,4 65,5 26,8 10,9 4,56 1,86 1,06

a. Vẽ đường cong hoành độ với trục tung là logarith neper


b. Xác định hằng số phân rã và bán sinh của hạt nhân nguyên tử phóng xạ trong
mẫu và sai số của hai đại lượng trên bằng phương pháp làm khớp bình
phương tối thiểu phù hợp.

103
CHƯƠNG 7
ĐÁNH GIÁ SỰ TƯƠNG QUAN TUYẾN TÍNH CỦA
CÁC CẶP DỮ LIỆUTHỰC NGHIỆM

7.1. Hệ số tương quan tuyến tính


Mục đích của phần này là khảo sát sự tương quan giữa hai đại lượng x và y thông qua
n cặp dữ liệu thực nghiệm (xi, yi).
7.1.1. Hệ số tương quan tuyến tính thực nghiệm
Dữ liệu của chúng ta bao gồm các cặp giá trị đo (xi, yi). Trong đó, y là biến phụ
thuộc, khi đó ta muốn biết xem dữ liệu có tương ứng với đường thẳng dạng
y = a + bx (7.1)
Trước đây, ta đã có nghiệm giải tích của b là:
NΣx i Σy i − Σx i Σy i
b= (7.2)
NΣx i − (Σx i ) 2
2

Ở đây, ta đã bỏ qua hệ số trọng hàm để cho đơn giản. Nếu không có sự tương quan
giữa y và x thì độ dốc b phải bằng 0. Tuy nhiên, b không phải là đại lượng đo tốt để xác
định mức độ tương quan giữa y và x, bởi vì vẫn còn tồn tại mối liên hệ giữa x và y khi b
nhỏ.
Do đó, ta đi khảo sát: x = a' + b'y (7.3)
Tương tự ta có:
NΣx i y i − Σx i Σy i
b' = (7.4)
NΣy i − (Σy i ) 2
2

Nếu không có sự tương quan giữa x và y thì b'=0.


Nếu có sự tương quan đầy đủ giữa x và y thì khi đó tồn tại mối liên hệ giữa a và b của
phương trình (7.1) và a', b' của phương trình (7.3).
Thật vậy, từ (7.3) ta viết lại:
a' 1
y=− + x = a + bx (7.5)
b' b'
a' 1
trong đó: a = − và b = (7.6)
b' b'

104
Từ (7.6) ta có:
* b.b' = 1 cho trường hợp có sự tương quan đầy đủ.
* Nếu không có sự tương quan thì b = b' = 0 và phương trình (7.6) không áp dụng
được. Do đo, chúng ta định nghĩa một đại lượng đặc trưng cho sự hồi quy tuyến tính, gọi là
hệ số hồi quy tuyến tính thực nghiệm hay hệ số tương quan:
r = b.b'
NΣx i y i − Σx i Σy i
r≡
[NΣx ] [NΣy ]
Hay: 1/ 2 1/ 2
(7.7)
− ( Σx i ) 2 − ( Σy i ) 2
2 2
i i

• Giá trị của r thay đổi từ 0 khi không có tương quan tức x và y độc lập nhau đến
± 1 khi có sự tương quan hoàn chỉnh.
• Dấu của r để chỉ chiều tương quan, nhưng chỉ có xác suất của nó mới quan
trọng. Nếu biểu diễn các cặp số (xi,yi) là các điểm trên mặt phẳng tọa độ Đề các, ta có một
đám mây các điểm sẽ tập trung trên một đường thẳng.
+ Nếu r > 0: đa số các giá trị lớn của yi ứng với các giá trị lớn của xi và
ngược lại, tức là y tỉ lệ thuận với x. Ta nói tương quan dương hay tương quan tỉ lệ thuận.
+ Nếu r < 0: ta có tương quan âm hay tương quan tỉ lệ nghịch.
+ Nếu r = 0: không có sự tương quan, tức hai biến độc lập nhau
• Hệ số tương quan thường được dùng trong việc đánh giá mức độ liên quan:
Giá trị r Mức độ
< 0,70 kém
0,70 - 0,80 khá
0,80 - 0,90 tốt
> 0,9 xuất sắc
• Trong thực tế, do sai số quan sát, đo đạc hoặc tính toán mà r rất khó bằng
± 1 (hoặc 0). Vì vậy, nếu trong thực tế đo đạc ta được mà r > 0,8 thì đã có thể coi là có

mối quan hệ dạng tuyến tính (xấp xỉ tuyến tính) giữa hai biến đang xét.

105
7.1.2. Kiểm định hệ số tương quan

Hệ số tương quan r không thể được dùng trực tiếp để kiểm định sự tương quan, mà ta
cần biết phân bố của r để kiểm định. Muốn như vậy phải biết phân bố đám đông của r.
Thông thường, người ta dùng phân bố đám đông tương ứng với dữ liệu hoàn toàn không
tương quan, tức là giả thiết:

H0 : ρ = 0

Người ta chứng minh khi H0 thỏa và các biến x, y có phân phối kết hợp là chuẩn, thì
biến ngẫu nhiên

r
t= (7.8)
(1 − r ) /(n − 2)
2

tuân theo phân phối Student với độ tự do (n-2) (xem các bước kiểm định ở chương 5).

7.1.3. Một số ví dụ

Ví dụ 7.1. Khảo sát hiệu thế V theo vị trí x, kết quả cho trong bảng 7.1 dưới đây. Cho
σ v =0,05 volt, σ x <1mm ≈ 0, mức ý nghĩa 0,05.

Bảng 7.1. Số liệu hiệu thế V theo vị trí x và kết quả làm khớp

2
STT xi yi = Vi x i x i yi Vfit =a+b x i

1 10,0 0,37 100 3,70 0,33

2 20,0 0,58 400 11,60 0,60

3 30,0 0,83 900 24,90 0,86

4 40,0 1,15 1600 46,00 1,12

5 50,0 1,36 2500 68,00 1,38

6 60,0 1,62 3600 97,20 1,64

7 70,0 1,90 4900 133,00 1,91

106
8 80,0 2,18 6400 174,40 2,17

9 90,0 2,45 8100 220,50 2,43

Tổng 450,0 12,44 28500 779,30

Dùng công thức (7.7), ta tính hệ số tương quan tuyến tính r cho dữ liệu của ví dụ 7.1:

NΣx i y i − Σx i Σy i
r≡
[NΣx ] [NΣy ]
1/ 2 1/ 2
(7.9)
− ( Σx i ) 2 − ( Σy i ) 2
2 2
i i

Thay số vào, ta được:

9 x 779,3 − 450,0 x12,44


r= = 0,9994
(9 x 28500 − 450,0 2 ) x (9 x 21,32 − 12,44 2 )

Trong Excel, ta có thể dùng hàm CORREL(Array;Array2) để tính r trong (7.9).

Bây giờ ta kiểm tra xem dữ liệu x và V có tương quan nhau hay không? Từ (7.8) suy
ra: t = 76,3.

Trong khi đó với mức ý nghĩa α = 5%, ngưỡng quyết định được tính bởi hàm trong
Excel t n − 2,α / 2 = TINV(α, n − 2) = 2,36 .

Do đó t > t n − 2,α / 2 = 2,36

Vậy bác bỏ giả thiết không tương quan.

Kết luận: dữ liệu x và V tương quan nhau, với mức ý nghĩa 5%.

1
Ví dụ 7.2. Để khảo sát quy luật giảm cường độ phóng xạ theo khoảng cách dạng N~ ,
r2
người ta đo với nguồn đường kính 8 mm, đặt cách detector GM với khoảng cách thay đổi
từ 20 cm đếm 100 cm. Thời gian đo t = 15s. Ta được kết quả cho trong bảng 7.2 sau đây:

107
Bảng 7.2. Số liệu số đếm nguồn theo khoảng cách và kết quả làm khớp.

i di xi= Ni σ i2 = wi= wixi wiNi wix i2 wixiNi Nfit =


(cm)
(1/d i2 ) × 1 a+bxi
Ni
104 σ i2

1 20 25,00 901 901 0,00111 0,0278 1 0,694 25,00 887

2 25 16,00 652 652 0,00153 0,0254 1 0,393 16,00 610

3 30 11,11 443 443 0,00226 0,0251 1 0,279 11,11 461

4 35 8,16 339 339 0,00295 0,0241 1 0,197 8,16 370

5 40 6,25 283 283 0,00353 0,0221 1 0,138 6,25 311

6 45 4,94 281 281 0,00356 0,0176 1 0,087 4,94 271

7 50 4,00 240 240 0,00417 0,0167 1 0,067 4,00 242

8 60 2,78 220 220 0,00455 0,0126 1 0,035 2,78 205

9 75 1,78 180 180 0,00556 0,0099 1 0,018 1,78 174

10 100 1,00 154 154 0,00649 0,0065 1 0,007 1,00 150

Tổng 0,03570 0,1868 10 1,912 81,0

Tương tự, hệ số hồi quy tuyến tính cho dữ liệu của ví dụ 7.2 được tính dựa vào
phương trình (7.7):

NΣx i y i − Σx i Σy i
r≡
[NΣx i
2
− ( Σx i ) 2 ] [NΣy
1/ 2
i
2
− ( Σy i ) 2 ]1/ 2

nhưng có hiệu chỉnh thêm trọng số σ2i = yi. Tức là N được thay bằng Σwi và Σxi được thay
bằng Σwixi.

Do đó:

108
(∑ w i ∑ w i x i y i − ∑ w i x i ∑ w i y i )
r= (7.10)
[∑ w ∑ w x
i i
2
i − (∑ w i x i ) 2 ]
1/ 2
[∑ w ∑ w y
i i
2
i − (∑ w i y i ) 2 ]
1/ 2

Suy ra:

0,03570 × 81,02 - 0,1868 × 10


r= = 0,9938
(0,03570 × 1,912 - 0,1868 2 ) × (0,03570 × 3693 × 3693 - 10 2 )

với mức ý nghĩa 5%, t = 25,3 > t n − 2,α / 2 = TINV(α, n − 2) = 2,75

Kết luận: có sự tương quan giữa tốc độ đếm N với nghịch đảo bình phương khoảng
cách x = 1/d2.

7.2. Sự tương quan nhiều biến


Nếu biến phụ thuộc y i là một hàm của nhiều biến xij:
y i = a + b 1 x i1 + b 2 x i 2 + b 3 x i 3 +… (7.11)
i: lần quan sát thứ i,
j = 1, 2,…: là chỉ số chỉ tên biến độc lập.
Biến xij có thể là các biến khác nhau hay là một hàm của xi.
Ta định nghĩa hiệp phương sai mẫu như sau:

∑[( x ij − x j )( x ik − x k )]
1
s 2jk ≡ (7.12)
N −1

Với x j và x k là trị trung bình.

1 1
xj ≡ ∑ x ij và x k = ∑ x ik (7.13)
N N

Tổng lấy tất cả từ i =1 tới N. Trong đó ta đã bỏ qua trọng số của mỗi xij, x ik cho đơn
giản.
Phương sai mẫu của một biến xj, ký hiệu s 2j là

1
s 2j ≡ s 2jj = ∑( x ij − x j ) 2 (7.14)
N −1

109
giống với phương sai mẫu S 2 được định nghĩa trong chương 1:

1
s2 = ∑( x ij − x j ) 2 (7.15)
N −1

Thay x j , x k bằng (7.13) vào phương trình (7.12), ta có:

∑[( x ij − x j )( x ik − x k )]
1
s 2jk = (7.16)
N −1
Nếu ta thay x ij cho x i và x ik cho y i trong (7.7), ta có thể định nghĩa hệ số hồi quy

tuyến tính mẫu giữa hai biến xj và x k là:


s 2jk
r jk = (7.17)
s j .s k
và hệ số tương quan tuyến tính giữa biến xj và y:
s 2jy
r jy = (7.18)
s j .s y

Tương tự, hệ số tương quan tuyến tính đám đông tương ứng là:

σ 2jk
ρ jk =
σ j .σ k

7.3. Hàm tương quan dạng đa thức

Trong chương 4, chúng ta đã khảo sát mối liên hệ giữa x và y với dạng đa thức:
y= a 0 + a1x+ a 2 x 2 + a 3 x 3 +… (7.19)
Ta xem x j = x j , suy ra:

s 2my
rmy =
s m .s y

1  1 
s 2m =  ∑ x i2 m − (∑ x im ) 2  (7.20)
N −1  N 

1  1 
s 2y =  ∑ y 2
− (∑ y i ) 2 
N −1 
i
N 

110
1  1 
s 2my =  ∑ x im y i − ∑ x im ∑ y i 
N −1  N 

7.4. Làm khớp có trọng hàm

Nếu sai số của dữ liệu không giống nhau ( σ i ≠ σ ), chúng ta phải đưa vào trong công
thức tính phương sai, hiệp phương sai và hệ số tương quan một thừa số gọi là trọng số
1/ σ i2 (như đã nói đến ở chương 6).
Như vậy, hệ số tương quan được tính bởi phương trình (7.17) và (7.18) nhưng
phương trình (7.12) và (7.14) dùng để tính phương sai và hiệp phương sai phải được bổ
sung thêm trọng số 1/ σ i2 :

1  
∑ (1 / σ i2 )( x ij − x j )( x jk − x k )
N −1  
s 2jk ≡
1
( ) ∑(1 / σ i2 )
N

N
1
− 1
( [
) ∑ (1 / σ i2 )( x ij − x j ) 2 ]
s j ≡ s jj =
2 2
(7.21)
1
( ) ∑(1 / σ i2 )
N

Ở đây, trị trung bình x j và x k cũng được bổ sung thêm trọng số 1/ σ i2 :

∑ x ij .k i ∑( x ij / σ i2 )
xj= =
N ∑(1 / σ i2 )

1 / σ i2
với ki = (7.22)
(1 / N) ∑(1 / σ i2 )

7.5. Hệ số tương quan bội


Chúng ta có thể ngoại suy khái niệm hệ số tương quan tuyến tính, đặc trưng cho sự
tương quan giữa hai biến ở một thời khoảng nào đó thành hệ số tương quan bội giữa các
nhóm biến tương ứng

111
Phương trình (7.7) có thể viết lại:

2
s 4xy s 2xy
r = = b. (7.23)
s 2x .s 2y s 2y
với s xy và s x ,s y được tính từ (7.21).

Tương tự, ta định nghĩa hệ số tương quan bội R cho phụ thuộc hàm kiểu (7.11) là:
s 2jy m

∑ (b
m sj
R ≡ ∑ (b j
2
) = j rjy ) (7.24)
j=1 s 2y j =1 sy
7.6. Phép kiểm F
7.6.1. Phân bố F
Giả sử ta có hai thống kê χ12 và χ 22 tuân theo phân bố χ 2 đã được xác định rồi thì tỉ

số của χ ν12 và χ ν2 2 sẽ tuân theo phân bố F:

χ12 / ν1
p f (f; ν1 ; ν 2 ) = 2 (7.25)
χ2 / ν2
có dạng:
1
f.
r[( ν1 + ν 2 ) / 2] ν 2( ν 1 - 2)
p f (f; ν1 ; ν 2 ) = × ( 1 ) ν1 / 2 × (7.26)
r ( ν1 / 2)r ( ν 2 / 2) ν2 (1 + fν1 / ν 2 )1 / 2 ( ν1 + ν 2 )

Ở đây: ν1 và ν 2 là số bậc tự do tương ứng với χ12 ,χ 22 .

Người ta chứng minh được tỉ số:

χ 2ν1 s12 / σ12


= (7.27)
χ 2ν 2 s 22 / σ 22

cũng tuân theo phân bố F, với s 12 , s 22 là phương sai mẫu của σ1 ,σ 2 .

7.6.2. Ý nghĩa của phân bố F


Phân bố F được dùng trong kiểm định thống kê được gọi là F-test.
Có hai loại F- test: một để kiểm định việc làm khớp toàn phần liên quan với hệ số
tương quan bội R và một dùng để kiểm định số hạng phụ được đưa vào trong hàm làm
khớp để cải tiến sự phù hợp hơn của việc làm khớp.

112
a. Kiểm định hệ số hồi quy bội

Từ phương trình (7.21) ta định nghĩa tỉ số F R :


R 2 /(m − 1) R2 ( N − m)
FR= = x (7.28)
(1 − R ) /( N − m) (1 − R )
2 2
(m − 1)
Việc khớp phù hợp tốt khi R = 1 ⇒ F R lớn.
Phép kiểm F với thống kê F R này là một phép kiểm cho trường hợp các hệ số a j = 0.

Khi F R vượt qua ngưỡng F, ta có thể kết luận các hệ số của chúng ta là ≠ 0.
Trong Excel, ta có thể dùng hàm FINV(α, m − 1, N − m) với m là số tham số của đa
thức (7.11).
b. Kiểm định số hạng phụ trong hàm làm khớp

Khi có nhu cầu cải tiến hàm khớp bằng cách đưa thêm một số hạng tương ứng với
tham số a m+1 , ta cần phải kiểm định xem việc đưa thêm vào có cải tiến sự phù hợp của việc
khớp hay không. Ta cũng đã biết để kiểm định sự phù hợp của việc khớp, ta dùng hệ số χ 2
Gọi : χ 2 (m) là hệ số kiểm định phù hợp cho việc khớp cho hàm khớp m tham số,

χ 2 (m+1) là hệ số kiểm định phù hợp của việc khớp cho hàm khớp (m+1) tham

số.
Để kiểm định sự cải tiến việc khớp do việc đưa thêm vào số hạng (m+1), ta dùng
thống kê:
χ 2 (m) − χ 2 (m + 1) ∆χ 2
Fχ= = 2 (7.29)
χ 2 (m) /( N − m − 1) χν

°Khi F χ nhỏ hơn ngưỡng quyết định F: hàm khớp với (m+1) số hạng không cải tiến
đáng kể so với khớp m tham số (coi như số hạng m+1 ≈ 0).
° Khi F χ > F: số hạng thứ (m+1) ≠ 0 và có thể tin cậy để bổ sung với hàm khớp.

Trong Excel, ta có thể dùng hàm FINV( α,1, N − m − 1) để tính giá trị F này.

Bài tập chương 7

113
7.1. Tính hệ số hồi quy tuyến tính của các dữ liệu ở ví dụ 6.4 chương 6 giữa biến độc lập Ti
và biến phụ thuộc Vi. Kiểm định các hệ số hồi quy r trên với α = 0,001 .
7.2. Tính hệ số hồi quy giữa Ti2 và Vi của ví dụ 6.4. chương 6. Kiểm định hệ số hồi quy r
trên với α = 0,001 . Có phải ta cần sử dụng số hạng bậc 2.
7.3. Đánh giá hệ số hồi quy bội R của các dữ liệu V theo Ti và Ti2 trong ví dụ 6.4. chương
6. Kiểm định hệ số hồi quy bội R trên với α = 0,001 .
239+240 137
7.4. Baûng döôùi ñaây trình baøy boä soá lieäu tham chieáu hoaït ñoä Pu vaø Cs
ôû lôùp ñaát beà maët taïi nhieàu ñòa ñieåm ôû Vieät Nam cuøng vôùi caùc thoâng soá
löôïng möa haèng naêm.
Địa điểm Mưa 239+240
137
Cs
Pu
Bq kg-1
mm/năm Bq kg-1
Hà Giang 1 2933 0.084 ± 0.006 3.87 ± 0.48
Hà Giang 2 3707 0.282 ± 0.019 14.9 ± 0.48
Hà Giang 3 4484 0.365 ± 0.042 12.4 ± 0.46
Lào Cai 1758 0.086 ± 0.007 4.70 ± 0.35
Yên Bái 1 2056 0.109 ± 0.008 5.44 ± 0.30
Yên Bái 2 1968 0.184 ± 0.015 3.07 ± 0.26
Yên Bái 3 1566 0.126 ± 0.024 6.44 ± 0.40
Vĩnh Phúc 1 2377 0.204 ± 0.012 7.58 ± 0.38
Yên Bái 4 1574 0.089 ± 0.011 2.19 ± 0.29
Vĩnh Phúc 2 2230 0.068 ± 0.008 2.91 ± 0.51
Vĩnh Phúc 3 1604 0.038 ± 0.008 1.10 ± 0.21
Thanh Hoá 1805 0.016 ± 0.005 0.97 ± 0.20
Nghệ An 1993 0.029 ± 0.008 1.82 ± 0.33
Hà Tĩnh 1 2720 0.094 ± 0.008 4.64 ± 0.39
Hà Tĩnh 2 2444 0.178 ± 0.055 7.03 ± 1.14
Quảng Bình 2068 0.013 ± 0.012 0.94 ± 0.30
Quảng Trị 1 2353 0.078 ± 0.007 3.78 ± 0.34
Quảng Trị 2 2393 0.083 ± 0.010 3.41 ± 0.25
Hãy đánh giá sự tương quan với mức ý nghĩa 5% giữa
o Hoạt độ 239+240Pu theo Hoạt độ 137Cs
o Hoạt độ 239+240Pu theo Lượng mưa.
7.5. Bảng số liệu đo độ dãn của lò xo theo khối lượng mắc vào lo xo như sau:

Khối lượng (kg) Độ dãn (cm)

114
200 5,1
300 5,5
400 5,9
500 6,8
600 7,4
700 7,5
800 8,6
900 9,4
Kiểm định hệ số hồi quy r với mức ý nghĩa 1%. Sau đó xác định hệ số đàn hồi của lò xo.

7.6. Người ta làm 1 thống kê số công nhân làm việc cho một nông trại trong một số năm
như sau:
Năm 1962 1964 1966 1967 1968 1969 1970 1971 1972 1973
Số 3307 3002 2790 1639 2523 2395 2262 2101 1953 1812
người

Kiểm định hệ số hồi quy tuyến tính cho bảng dữ liệu trên với mức ý nghĩa 5%. Từ đó dự
đoán số công nhân làm việc cho nông trại làm trong năm 1980 với độ tin cậy 95%.

115
CHƯƠNG 8
PHƯƠNG PHÁP MÔ PHỎNG MONTE-CARLO

8.1. Giới thiệu


Mô phỏng bằng phương pháp Monte Carlo là phương pháp mô phỏng trên máy tính
dựa vào sự phát sinh các số ngẫu nhiên. Phương pháp này thường được sử dụng để nghiên
cứu các quá trình ngẫu nhiên của hệ thống. Phương pháp này không liên quan đến thang đo
thời gian nên không thể dùng phương pháp này để mô phỏng các đại lượng phụ thuộc thời
gian.
Vì phương pháp Monte Carlo sử dụng các số ngẫu nhiên nên phương pháp này có
thành công hay không còn tùy thuộc rất nhiều vào tập hợp các số ngẫu nhiên có đáng tin
cậy hay không. Nhưng việc lấy số ngẫu nhiên thật sự là khó thực hiện. Đa phần các số
ngẫu nhiên được phát sinh từ các ngôn ngữ lập trình trên máy tính có giá trị trong khoảng
từ 0 đến 1, thường được gọi là các giả ngẫu nhiên, trong khi đó các đại lượng cần mô
phỏng lại biến thiên trong một phạm vi rộng hơn. Vì thế ta cần có những thủ thuật cần thiết
để sử dụng các giả ngẫu nhiên này để mô phỏng các đại lượng ngẫu nhiên của hệ thống.
Phương pháp Monte Carlo được ứng dụng rộng rãi trong vật lý thống kê, mô phỏng
cấu trúc và tính chất của vật liệu, mô phỏng các bài toán lượng tử nhiều hạt. Ngoài những
ứng dụng trong các ngành kỹ thuật, thì phương pháp còn được ứng dụng trong các bài toán
kinh tế…
Sau đây chúng ta xét một bài toán cụ thể để hiểu rõ hơn về phương pháp Monte-
Carlo:
Ví dụ 8.1: Bằng cách sử dụng phương pháp Monte Carlo ta hãy tính diện tích hình tròn
bán kính rc.
Đầu tiên chúng ta vẽ hình tròn trong một hình vuông có diện tích As đã biết, sau đó
phủ lên bề mặt hình vuông những điểm chấm nhỏ. Và tìm tỉ số số hạt rơi trong hình tròn so
với số hạt rơi trong hình vuông, từ đó xác định diện tích hình tròn theo hệ thức sau:

116
Nc
Ac = As (8.1)
Ns

Với Nc, Ns tương ứng là số hạt trong hình tròn và số hạt trong hình vuông.
Với cách xác định như vậy, độ chính xác của kết quả tùy thuộc vào số hạt, kích thước
của hạt so với kích thước hình vuông, và tùy vào tính đồng đều của hạt và sự phân bố của
chúng khắp hình vuông. Thay vì ta cố gắng chấm điểm đều đặn trên hình vuông, thì ta nên
lấy mẫu ngẫu nhiên sao cho phân bố hạt đồng đều ở mọi vị trí và mật độ số hạt thì không
quá lớn để sự tồn tại của hạt này không ảnh hưởng đến hạt kia. Khi đó, với số hạt rơi trong
hình vuông cố định, độ lệch chuẩn của phép đo trong hình tròn được tính theo phân bố nhị
thức:
σ = N s p(1 − p) = N c (1 − p) (8.2)

Do đó nếu chúng ta tăng số hạt Nc lên 4 lần thì sai số tương đối trong việc xác định diện
tích hình tròn sẽ giảm đi hai lần.
Thay vì gieo hạt ngẫu nhiên, trong máy tính chúng ta có hàm phát sinh số ngẫu nhiên. Bây
giờ chúng ta khảo sát diện tích của hình tròn bán kính 0,5 đơn vị, trong hình vuông có độ
dài cạnh là 1 đơn vị. Tạo 100 cặp số ngẫu nhiên giữa 0 và 1. Khi đó xác suất của việc tìm
thấy hạt trong hình tròn là tỉ số giữa diện tích hình tròn và hình vuông, tức là:
π × (0,5) 2
p = = 0,25π ,
12
vì vậy trong 100 phép thử, số hạt trung bình rơi vào hình tròn sẽ là
µ = 100p = 78,5 ,
độ lệch chuẩn là
σ = N s p(1 − p) = 100 × (0,25π) × (1 − 0,25π) = 4,1 .

Và diện tích hình tròn là


Nc 12 × (78,5 ± 4,1)
Ac = As = = 0,785 ± 0,041 .
Ns 100

Theo hình 8.1, ta thấy có 71 hạt rơi trong hình tròn, vậy ta có xác suất thực nghiệm số hạt
rơi vào hình tròn là p = 71100 = 0,71 , và độ lệch chuẩn của số hạt rơi vào trong hình tròn:

117
σ = N s p(1 − p) = 100 × (0,71) × (1 − 0,71) = 4,54

Vậy diện tích hình tròn và độ lệch chuẩn của nó là:


Nc 12 × (71 ± 4,54)
Ac = As = = 0,71 ± 0,0454
Ns 100

Hình 8.1. Phân bố 100 hạt phát sinh ngẫu nhiên rơi trong hình tròn và hình vuông
Sau đây chúng ta sẽ xét một vài phương pháp Monte Carlo cụ thể.
8.2. Phương pháp tạo số ngẫu nhiên theo phân bố xác suất
8.2.1. Phương pháp biến đổi ngược
Xét bài toán phát sinh giá trị biến ngẫu nhiên x theo hàm mật độ xác suất f(x).
Thường các ngôn ngữ lập trình trên máy tính chỉ phát sinh các số ngẫu nhiên đồng nhất
trong phạm vi (0,1) với hàm mật độ xác suất sau:
 1 0 ≤ r ≤1

p( r ) =  (8.3)

 0 khac

p(r) được gọi làm hàm mật độ xác suất đơn vị.
Bây giờ ta sẽ tìm cách phát sinh biến ngẫu nhiên x theo hàm f(x) từ hàm mật độ xác
suất p(r).

118
+∞
Đầu tiên ta chuẩn hoá hàm f(x) sao cho: ∫ f (x )dx
−∞
= 1

r x
Theo định luật bảo toàn xác suất ta có: ∫ p(r)dr =
−∞
∫ f (x )dx
−∞

r x
⇔ ∫ p(r)dr
0
= ∫ f (x )dx
−∞

x
⇒ r = ∫ f (x )dx
−∞
(8.4)

Từ đó ta tìm x theo r thỏa công thức (8.4).


Tiến trình tìm x theo r như vậy được gọi là phép biến đổi ngược từ việc phát sinh số
ngẫu nhiên r. Trình tự gồm các bước sau:
Bước 1: Phát sinh giá trị biến ngẫu nhiên r từ hàm mật độ xác suất đồng nhất U(0,1).
x
Bước 2: Chuẩn hoá hàm f(x), tính tích phân F( x ) = ∫ f ( x )dx
−∞

x
Bước 3: Đặt r = ∫ f ( x )dx = F( x ) , sau đó tìm x = F −1 (r )
−∞

Khi đó các giá trị x thu được tuân theo hàm mật độ f(x).
Phương pháp biến đổi ngược thường được sử dụng nhiều nhất vì đa phần các biến
ngẫu nhiên cần tìm đều có một hàm phân bố nào đó, từ đó ta cũng có thể xác định được độ
lệch chuẩn ngẫu nhiên rút ra từ phân bố đó, nhưng đôi khi việc tìm x gặp một số khó khăn
vì không có lời giải cho phương trình giải tích, vì thế ta tìm x thông qua phương pháp số.
Ví dụ 8.2: Phát sinh tập giá trị x tuân theo hàm phân bố exponent:
 1 −x A
 e x≥0
f ( x, A) =  A
0 x<0
x
Ta có: F( x ) = ∫ f ( x )dx = 1 − e − x A
0

⇒ e −x A = 1 − F

119
F có giá trị trong khoảng (0,1) do đó 1-F có giá trị trong khoảng (0,1), ta đặt:
1 − F = r = e −x A

x được tính từ công thức trên bằng cách lấy logarit cơ số e theo 2 vế, ta được phương
trình sau:
x
ln r = ln e − x A = −
A
⇒ x = −A ln r (8.5)
Như vậy để có tập giá trị xi tuân theo phân bố exponent, trước tiên ta phải phát sinh
tập giá trị ri theo phân bố đồng nhất U(0,1), sau đó tính các giá trị xi tương ứng theo công
thức (8.5).
Ví dụ 8.3: Tìm tập giá trị x phát sinh theo hàm phân bố sau:
A(1 + ax 2 ) 1≤ x ≤1
f (x) = (8.6)
0 khac

f ( x ) ≥ 0 với mọi x, A được tìm từ việc chuẩn hoá hàm:


+1

∫ f (x )dx
−1
= 1
x x
Đặt r = F( x ) = ∫ f (x )dx = ∫ A(1 + ax
2
)dx
−∞ −1
1 a
r = A( x + ax 3 + 1 + )
3 3
Phát sinh tập giá trị r tuân theo hàm phân bố đồng nhất U(0,1), sau đó tìm tập giá trị x
theo công thức x = F −1 (r ) , khi đó tập giá trị x tìm được sẽ tuân theo hàm phân bố f(x).
8.2.2. Phương pháp chấp nhận - loại bỏ
Phương pháp này thường được dùng để thay thế cho phương pháp biến đổi ngược ở
trên vì phương pháp chấp nhận - loại bỏ dễ sử dụng hơn, có tính đơn giản. Tuy nhiên
nhược điểm của phương pháp này là hiệu suất thấp. Trong những bài toán phức tạp, chỉ có
phần nhỏ các biến cố rơi vào vùng quan tâm, phần lớn còn lại rơi ngoài miền giới hạn làm
cho thời gian tính toán tăng lên. Để giải quyết vấn đề này ta phải đặt những giới hạn chính
xác cho những toạ độ ngẫu nhiên được dùng để vẽ hàm phân bố khi dùng phương pháp
chấp nhận - loại bỏ.
120
Xét bài toán phát sinh tập giá trị biến ngẫu nhiên x theo hàm phân bố f(x) trong
khoảng (a,b), f(x) ≤ f0 với mọi giá trị của x trong khoảng (a,b), đặc biệt hàm f(x) phải dương
và không dị hướng trong vùng xác định của x.
Chúng ta đồng thời phát sinh hai biến ngẫu nhiên x, y đồng nhất trong hai khoảng
tương ứng (a,b) và (0,f0) bằng cách phát sinh hai biến ngẫu nhiên r, t đồng nhất trong
khoảng (0,1) và đặt:
x = t (b − a ) + a
với r, t ~ U(0,1) (8.7)
y = rf 0

f0

loaïi x
rf0 f(x)

Vuøng loaïi x Vuøng chaáp nhaän x Vuøng loaïi x


rf0
chaáp nhaän x

a x b x

Hình 8.2. Minh họa phương pháp chấp nhận - loại bỏ, phát sinh tập giá trị biến ngẫu nhiên
x tuân theo phân bố f(x) trong khoảng (a,b)
Khi đó, nếu:
y = rf 0 ≤ f ( x ) chấp nhận x (8.8)
y = rf 0 > f ( x ) loại bỏ x (8.9)
Tập các giá trị x được giữ lại sẽ tuân theo hàm phân bố f(x).
Để hạn chế sự phát sinh biến ngẫu nhiên x ngoài vùng quan tâm, tăng hiệu quả của
phương pháp, người ta đề nghị một phương pháp mới, gọi là phương pháp chấp nhận - loại
bỏ cải tiến (xem hình 8.3).

121
t(x)

f(x) Vuøng loaïi x

Vuøng chaáp nhaän x

t(x0) loaïi x0
rt(x0)
Vuøng loaïi x
rt(x0) chaáp nhaän x0
0 x0 1 x
Hình 8.3. Phương pháp chấp nhận - loại bỏ cải tiến
Thay cho giá trị f 0 ≥ f ( x ) trong phạm vi của biến ngẫu nhiên x, người ta tìm một hàm
t(x) phụ thuộc vào x, sao cho t ( x ) ≥ f ( x ) trong phạm vi biến ngẫu nhiên x. Tương tự như
trên, ta phát sinh biến ngẫu nhiên x đồng nhất trong phạm vi của nó, và một biến ngẫu
nhiên r đồng nhất trong khoảng (0,1), và nếu: rt ( x ) ≤ f ( x ) thì chấp nhận x, ngược lại thì
loại x.
Ví dụ 8.4: Phát sinh tập các biến ngẫu nhiên x từ hàm phân bố sau:

60x 3 (1 x ) 2 0 ≤ x ≤1
f (x) = (8.10)
0 x khac
Đầu tiên ta đi xác định f0 sao cho f0 ≥ f trong khoảng xác định của x. Khảo sát hàm
f(x) ta có giá trị cực đại của hàm là f(0,6) = 2,0736
Suy ra:
2,0736 0 ≤ x ≤1
f0 =
0 x khac
Ta phát sinh 2 biến ngẫu nhiên r, x đồng nhất trong khoảng (0,1). Và so sánh:
Nếu r × f0>f(x) : loại x
Ngược lại r × f0 ≤ f(x) : chấp nhận x.

122
Tập các giá trị x thỏa điều kiện trên sẽ theo hàm phân bố f(x). Hình 8.5 mô tả 50000
phát sinh biến ngẫu nhiên x, trong đó có 24007 biến ngẫu nhiên x tuân theo hàm phân bố
f(x).

Hình 8.4. Đồ thị hàm số f ( x ) = 60x 3 (1 − x ) 2

Hình 8.5. Đồ thị phân bố của 24007 biến ngẫu nhiên x theo hàm phân bố f(x), trong 50000
phát sinh biến ngẫu nhiên x

123
8.2.3. Phương pháp tổng hợp
Phương pháp này cũng thường hay được sử dụng trong quá trình mô phỏng, chúng ta
sẽ xét các bài toán sau:
Ví dụ 8.5: Phát sinh biến ngẫu nhiên từ theo phân phối sau:

f (x) =
5
12
[
1 + (x − 1)
4
] 0≤x≤2 (8.11.a)

Ta phân tích f(x) thành tổng của 2 hàm số fa và fb:


1 5
fa = và f b = ( x − 1) 4
2 2
5 1
⇒ f (x) = fa + fb
6 6
Ta sẽ phát sinh hai số ngẫu nhiên r1 và r2. Trong đó r1 được dùng để xác định sẽ sử
dụng fa hay fb. Nếu r1<5/6 ta sẽ chọn fa, ngược lại thì chọn fb. Sau đó phát sinh r2 để tìm x.
Nếu dùng fa: ⇒ x = 2r2
Nếu dùng fb: ⇒ x = 1 + (2r2 ) 0, 2
Xét một bài toán khác:

Ví dụ 8.6: Xét hàm phân bố: f ( x ) = n ∫ y − n e − xy dy n ≥ 1 và x ≥ 0 (8.11.b)
1

1
Ta viết lại: f (x) = ∫ g(x y)dF( y)
0

ở đây: F là trọng số biến thiên, g( x y) là xác suất để tìm x từ y cố định.

Đặt g( x y) = ye yx

ndy
dF( y) = 1< y < ∞
y n +1
∞ 0 1

Lưu ý: f ( x ) = n ∫ y e dy = n xy
∫ ye xy n
d( y ) = ∫ ye xy
dF
1 n 0
y =1

Tương tự như trên, ta phát sinh số ngẫu nhiên r1 để tìm y:


r1 = F( y) ⇒ y = F −1 (r1 )

Từ dạng của dF ở trên, ta có F( y) = y − n

124
−1 / n
r1 = y − n ⇒ y = r1

Ta lại phát sinh ngẫu nhiên r2 để tìm x với g( x y) bằng giá trị y cố định vừa tìm được:
x x

∫ g(x y)dx ∫ ye
−x
= dx = − e − yx 1
0 = 1 − e − yx
0 0

r2 = 1 − r ' = e − yx với r ' = 1 − e − yx


1
⇒ x = − log r2
y
Với x có được, vẽ phân bố tần suất xuất hiện của x. Khi đó phân bố của x tuân theo
(8.11.b).
8.3. Độ chính xác của phương pháp Monte Carlo
8.3.1. Bài toán về ước lượng trị trung bình
Ta khảo sát bài toán tổng quát được xây dựng mô hình trên n phép thử độc lập, ξ i là
giá trị có được ứng với mỗi phép thử. Giả sử nó có kỳ vọng toán học là E(ξ i ) = µ , và
phương sai V(ξ i ) = σ 2 .
Khi đó µ được xấp xỉ bởi trung bình số học:
n

L ∑ξ i
ξ= = i =1
(8.12)
n n
ξ có được từ n phép thử của phương pháp Monte Carlo. Và / ξ − µ / được gọi là sai số của

phương pháp. Sai số này có thể được ước lượng như trên với độ tin cậy γ .
Theo định luật giới hạn trung tâm, đặt rγ là đại lượng sao cho:
/ ξ − µ / = rγ = k γ σ 0 (8.13)
với xác suất γ .
Ở đó σ 0 là độ lệch chuẩn của ξ .Ta cũng đã biết,
σ
σ0 = (8.14)
n
với σ 2 là phương sai của từng biến ξ i . Phương sai σ 2 trong các biểu thức trên thường
được đánh giá thông qua phương sai mẫu
n

∑ (ξ i − ξ) 2
S2 = i =1
(8.15)
n −1

125
Và k γ tuỳ vào cỡ mẫu n. Nếu n lớn, ξ tuân theo phân bố xấp xỉ Gauss. Chọn mức

tin cậy để đánh giá sai số ví dụ là γ = 0,997 , khi đó k γ = 3 .

8.3.2. Bài toán xác suất


a. Ước lượng xác suất
Gọi A là biến cố mà ta quan tâm có xác suất xảy ra p .
Gọi ξ i là biến ngẫu nhiên có giá trị bằng 1 nếu biến cố A xảy ra ở phép thử thứ i và
bằng không nếu ngược lại.
Vậy tổng số phép thử ở đó biến cố A xảy ra là:
n
L = ∑ ξi (8.16)
i =1

Ơ đây n là tổng số phép thử. Giả sử các phép thử là độc lập nhau.
Tần suất xảy ra biến cố A là L n , có kỳ vọng toán học là:
L
E( ) = p (8.17)
n
Và phương sai:
 L  p(1 − p)
V  = (8.18)
n n
Theo định luật số lớn, tần suất xảy ra biến cố A , L n sẽ xấp xỉ bằng p .
Do p là đại lượng cần xác định, và L n là giá trị gần đúng có được từ phương pháp Monte
Carlo, nên sai khác giữa (L n ) − p là sai số của phương pháp đo.
Tương tự như trên ta cũng đánh giá sai số nầy với dạng:

L
δ= − p = rγ = k γ σ 0 (8.19)
n
V ( ξ) p(1 − p)
Trong đó σ 0 = = là độ lệch chuẩn của L n và k γ tùy vào cỡ mẫu n và xác
n n
suất p.
Nếu p.n >> 1 , ta có k γ được tra trong phân bố chuẩn với độ tin cậy γ tương ứng.

Ví dụ với γ = 99,7% như theo ví dụ trên k γ = 3 .

8.4. Giải bài toán vật lý đơn giản với số ngẫu nhiên

126
8.4.1. Tính tích phân, diện tích hình tròn, số pi
Xây dựng bài toán:
Để tính diện tích của hình tròn đơn vị A c = R 2 .π = π , áp dụng các phương pháp sau:

Xét hình vuông ngoại tiếp đường tròn đơn vị. Do tính đối xứng, ta chỉ cần xét 1 4 đầu
tiên.
Phát sinh 2 số ngẫu nhiên x,y trong khoảng (0,1). Và vẽ điểm (x,y) thuộc hình vuông
1x1 này.
Gọi m là số điểm phát sinh ra trong hình vuông (1x1)
Gọi n là số điểm (x,y) thuộc đường tròn, tức thoả điều kiện x 2 + y 2 ≤ 1 .
AC n
Tính tỉ số:≡ 4 . Ơ đây A C là diện tích hình tròn, A S là diện tích hình vuông. Vì
AS m
n
hình vuông cạnh (1x1), nên A S = 1 suy ra: A C = 4
m

Hình 8.6. Mô phỏng cách tính diện tích hình tròn


Ngoài ra theo cách tính thông thường, diện tích đường tròn được tính bởi tích phân
dưới đường cong. Ơ đây ta có 1/4 đường tròn đơn vị:
x 2 + y2 = 1 ⇒ y2 = 1− x 2 ⇒ y = 1− x 2
1
A C = 4 ∫ 1 − x 2 dx
0

1
n
Suy ra: ∫
0
1 − x 2 dx ≡
m

127
n
Và: π = 4.
m
Thuật toán
Bước 1: Khởi tạo gieo số ngẫu nhiên x, y trong khoảng (0,1)
Bước 2: Lặp m lần ở đó m là số ngẫu nhiên muốn dùng
Bước 3: Chọn số ngẫu nhiên x,y thoả 0 ≤ x < 1 và 0 ≤ y < 1
Bước 4: Nếu x2+y2≤1 tăng n.
Bước 5: Kết thúc lặp ở bước 2
Bước 6: In ra tỷ số π=4. n/m
Đánh giá độ chính xác của việc tính diện tích
Mỗi lần thực hiện một loạt m số cặp ngẫu nhiên trong hình vuông, ta tính được diện
tích hình tròn A C .
Tức là giống như ta thực hiện được một phép đo.
Vậy để tăng độ chính xác của phép đo, có hai cách:
- Tăng số điểm m trong 1 phép đo hoặc
- Tăng số lần lặp lại phép đo, n.
Cách sau cho ta đánh giá được độ ổn định hay độ chính xác của phép đo thông qua
đại lượng gọi là độ lệch chuẩn σ .

∑ (x − x)
2
i
Khi n≥25, σ được tính bởi: σ = i =1

n
Ở đây xi là giá trị đo được của diện tích trong lần đo thứ i. Và x là trung bình cộng
của diện tích trong n lần đo, n là số lần lặp lại phép đo.

8.4.2. Tìm diện tích ellipse


a. Bài toán: cho phương trình ellipse
x 2 y2
+ =1
a 2 b2
Với a là bán kính trục lớn, b là bán kính trục nhỏ.
Tìm diện tích của ¼ đầu tiên. Sau đó suy ra diện tích toàn phần. So sánh diện tích có
được với giá trị thật πab

128
b. Giải quyết:
Xét hình chữ nhật ngoại tiếp ¼ ellipse đầu tiên, có kích thước (axb).
Phát sinh 2 số ngẫu nhiên x ∈ (0, a ), y ∈ (0, b) . Vẽ điểm ( x, y) thuộc hình chữ nhật
(axb).
Gọi m là số điểm phát sinh trong hình chữ nhật (axb).
Gọi n là số điểm trong ellipse, khi đó toạ độ của điểm phải thoả mãn:
x 2 y2
+ ≤1
a 2 b2
Lập tỉ số
Ae n
= 4. .
Ar m
Với: Ae diện tích hình ellipse,
Ar diện tích hình chữ nhật.
Suy ra:
n n
A e = 4. A r = 4. .a.b
m m
1
8.4.3. Tính tích phân ∫ e x dx
2

a. Bài toán trên tương đương với việc tìm diện tích dưới đường cong y = e x như trong
2

hình 8.7.
b. Thuật toán
- Xây dựng hình chữ nhật kích thước (1xe) chứa đường y = e x
2

- Phát sinh số ngẫu nhiên 0≤x≤1 và 0≤y≤e. Để phát sinh số ngẫu nhiên trong khoảng
[0, e) ta dùng hàm y=e.rand() trong C.

- Gọi m là số cặp điểm (x,y) trên, nó cũng chính là số cặp điểm nằm trong hình chữ
nhật (1.e).

- Và n là số điểm (x,y) nằm trong vùng diện tích dưới đường y = e x . Khi đó (x,y)
2

của nó phải thỏa y ≤ e x


2
.

129
Af n
- Lập tỉ số =
Ar m

với Af là diện tích dưới đường y = e x và Ar là diện tích chữ nhật (1.e).
2

Suy ra:
n n
Af = Ar =e
m m

1
Hình 8.7. Mô phỏng tính tích phân ∫ e x dx
2

8.5. Mô phỏng quy luật suy giảm của γ qua vật chất
Ta đã biết chùm γ có năng lượng E hẹp truyền qua một bản vật chất có bề dày d sẽ
suy giảm theo quy luật N( x ) = N(0)e −µx . Từ đó suy ra xác suất để tia γ đi qua được quảng
đường x không va chạm và va chạm trong dx là

p( x )dx = µe − µx dx (8.20)
Quảng đường tự do trung bình

1
R = ∫ xp( x )dx =
µ
0 (8.21)
Từ đó suy ra thuật toán mô phỏng như sau:
- Gieo số ngẫu nhiên γ trong khoảng từ [0,1] đặc trưng cho xác suất

130
R

∫ p(x )dx = γ
0
(8.22)

- Tính R theo γ từ công thức trên


R
1 1
∫ p(x )dx = γ ⇔ λ = − µ ln(1 − γ) = − µ ln γ
0
(8.23)

- Nếu λ < d : bỏ
- Nếu λ > d : số hạt đi qua được tăng lên 1.

Bài tập chương 8


8.1. Viết chương trình gieo số ngẫu nhiên đồng đều.

8.2. Viết chương trình tính số pi bằng phương pháp Monte Carlo.
8.3. Viết chương trình phát sinh tập giá trị x tuân theo hàm phân bố exponent bằng phương
pháp Monte Carlo. Vẽ đồ thị phân bố tần suất xuất hiện của x này. Kiểm định giả thiết dữ
liệu x có được phù hợp với phân bố exponent.

8.4. Viết chương trình tính diện tích elippse bằng phương pháp Monte Carlo.
1
8.5. Viết chương trình tính tích phân ∫e dx bằng phương pháp Monte Carlo.
x2

8.6. Viết chương trình tính khối lượng, thể tích và momen quán tính của một vật thể hình
cầu bằng phương pháp Monte Carlo.

8.7. Viết chương trình mô phỏng sự truyền của tia gamma qua bản mỏng vật chất bằng
phương pháp Monte Carlo.

131

You might also like