Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 43

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA


KHOA KT ĐỊA CHẤT VÀ DẦU KHÍ
_______________

ĐỒ ÁN MÔN HỌC
PHÂN TÍCH DỮ LIỆU TRONG TÌM KIẾM
KHAI THÁC DẦU KHÍ

GVHD: TS. Tạ Quốc Dũng


SVTH: Cũng Hồng Minh ( MSSV: 1914135)
Nguyễn Thanh Bình (MSSV: 1912730)

TP HỒ CHÍ MINH, tháng 12 năm 2020

1
LỜI CẢM ƠN

Để làm được đồ án môn học này thì đầu tiên nhóm em xin gửi lời cảm ơn sâu
sắc và chân thành đến Thầy TS. Tạ Quốc Dũng đã hướng dẫn tụi em tận tình,
góp ý trong suốt quá trình tụi em thực hiện đồ án môn học. Nếu không nhờ có
sự giúp đỡ, những lời chỉ dẫn, góp ý thẳng thắn của Thầy thì có lẽ tụi em khó
có thể hoàn thành tốt đồ án lần này.

Lời cảm ơn chân thành và sâu sắc của em cũng xin được gửi đến tập thể giảng
viên giảng dạy tại khoa Kĩ Thuật Địa Chất& Dầu Khí, Trường Đại học Bách
Khoa TP. HCM, truyền đạt những kiến thức chuyên ngành, đóng góp những ý
kiến mang tính chuyên môn cao, quí giá từ đó giúp nhóm em hoàn thiện hơn
về kiến thức của mình. Cũng là nguồn kiến thức cơ sở để em thực hiện đồ án.

Với sự giúp đỡ và cũng đồng hành với nhau trong khi thực hiện đồ án, em cũng
xin gửi lời cảm ơn sâu sắc đến tất cả mọi người đã không quản khó khăn để
cùng nhau hoàn thiện đồ án.

Nội dung và hình thức của bài đồ án này được thực hiện dựa trên nền tảng
kiến thức cơ sở của nhóm chúng em. Ngoài ra còn có sự tìm hiểu và học hỏi
thêm nên không thể tránh khỏi việc gặp những thiếu sót, mong rằng nhóm em
sẽ nhận được những sự góp ý và phê bình đậm chuyên môn của mọi người.
Thật sự em xin chân thành cảm ơn và kính chúc tất cả quí thầy cô cùng các bạn
luôn dồi dào sức khỏe, và gặt được nhiều thành công hơn nữa trong công việc
cũng như là trong cuộc sống.

Cũng Hồng Minh

Nguyễn Thanh Bình

2
MỤC LỤC

Lời cảm ơn

Tình hình nghiên cứu 4

1. Tình hình nghiên cứu trong nước 4


2. Tình hình nghiên cứu ở nước ngoài 5

Giới thiệu 8

Cơ sở lý thuyết 9

I. Phân tích dữ liệu (khái niệm) 9


1. Phân tích dữ liệu đơn biến 9
2. Phân tích dữ liệu đa biến 12
2.1. Giới thiệu về phân tích thống kê đa biến 12
2.2. Mô hình hồi qui tuyến tính hai biến của y theo x 13
II. Phân tích dữ liệu 18
1. Phân tích đơn biến 18
1.1. Thực hiện phương pháp phân tổ dữ liệu 18
1.2. Bảng phân phối tần số và biểu đồ Histogram 21
1.3. Biểu đồ phân phối tích lũy tần số 22
1.4. Tìm các đặc trưng từ mẫu dữ liệu 23
2. Phân tích đa biến 29
2.1. Phương trình, đường hồi qui tuyến tính 31
2.2. Tính phần sai lệch và vẽ biểu đồ theo độ rỗng 33
2.3. Biểu đồ dữ liệu độ thấm dự đoán và thực tế 34
2.4. Tính toán và so sánh phương sai của 2 bộ Data 35

3
DANH MỤC HÌNH ẢNH VÀ BẢNG BIỂU
Hình 1.1. Giá trị làm liên tục ngẫu nhiên 10

Hình 2.1. Dữ liệu về độ rỗng của các vỉa khoan dầu khí 20

Hình 2.2. Bảng chọn Histogram 22

Hình 2.3. Bảng phân phối tần số 23

Hình 2.4. Biểu đồ Histogram 23

Hình 2.5. Bảng phân phối tích lũy tần số 24

Hình 2.6. Bản đồ phân phối tích lũy 24

Hình 2.7. Hộp thoại Descriptive Statistics 25

Hình 2.8. Bảng kết quả về các đặt trưng của mẫu 26

Hình 2.9. Dữ liệu về độ thấm của đá ở vỉa khoan dầu khí 28

Hình 2.10. Biểu đồ phân phối tích lũy 29

Hình 2.11. Biểu đồ tần số Histogram 29

Hình 2.12. Bảng thống kê sô liệu về độ rỗng của giếng khoan 30

Hình 2.13. Bảng kết quả giữa độ lỗ rỗng và độ thấm của dữ liệu 31

Hình 2.14. Hộp thoại Regressiom 32

Hình 2.15. Bảng Anova và sự tương quan giữa độ rỗng & độ thấm 33

Hình 2.16. Đường hồi quy giữa độ thấm và độ rỗng 33

Hình 2.17. Biểu đồ phân tác các cặp dữ liệu độ thấm và độ rỗng 34

Hình 2.18. Biểu đồ theo độ rỗng 34

Hình 2.19. Biểu đồ dữ liệu độ thấm dự đoán và thực tế 35

DANH MỤC BẢNG BIỂU


4
Bảng 1.1. Bảng phân phối xác xuất cho biến rời rạc 10

Bảng 2.1. Bảng phân phối xác suất biến ngẫu nhiên rời rạc 2 chiều 14

Bảng Data – 1. 17

Bảng Data – 2. 18

Bảng 2.2. Bảng ý nghĩa của các giá trị đặc trưng mẫu 27

5
TÌNH HÌNH NGHIÊN CỨU
1. Tình hình nghiên cứu trong nước

Trong đề tài nghiên cứu” Xác định phân bố độ rỗng và độ thấm vủa thân
dầu trong đá móng mỏ Bạch Hổ theo tài liệu mẫu lõi và địa vật lý giếng khoan”
của Nguyễn Xuân Khá, Trương Quốc Thanh, Trần Văn Xuân (Đại học Bách
Khoa tp. HCM), Phạm Xuân Sơn, Hoàng Văn Quý (Viện nghiên cứu Khoa học và
Thiết kế Dầu Khí Biển) – 2015. Luận văn đã nghiên cứu độ thấm theo tài liệu
địa vật lý giếng khoan, đó là phân tích các đường cong địa vật lý – giếng khoan
kết hợp các mô hình thạch học, xây dựng đường cong lý thuyết, phần mềm
BASROC 3.0 tiến hành xác định hàng loạt các tham số vỉa như độ rỗng tổng, độ
rỗng thứ sinh. [1]
Luận văn thạc sĩ “ Xây dựng mô hình phân bố độ rỗng – thấm cho tầng
móng nứt nẻ thuộc mỏ X, lô 15 – Y, bồn Trũng Cửu Long”; của chị Phạm Huỳnh
Kiều Trinh – Trường đại học Bách Khoa tp. HCM – 2018 đã nghiên cứu độ rỗng
và độ thấm cho tầng đá móng nứt nẻ thuộc mỏ X, Lô 15-Y, bồn Trũng Cửu Long
bằng việc sử dụng các phương pháp mô hình hóa phân bố rỗng riêng biệt:
phương pháp mô hình khối liên tục tương đương mà bản chất là sự giảm độ
rỗng theo chiều sâu từ bề mặt nóc móng bên cạnh đó là phương pháp mạng
nơron nhân tạo ANN với cơ sở cốt lõi là sự liên kết thuộc tính địa chấn với tài
liệu địa vật lý giếng khoan, ngoài ra còn phương pháp theo mô hình Halo và
Halo cải tiến với bản chất là sự giảm độ rỗng theo chiều sâu từ mặt nóc móng
và giảm độ rỗng theo chiều ngang khi ra xa đới đứt gãy – nứt nẻ và các phương
pháp mô hình hóa phân bố độ thấm bằng phương pháp mạng noron nhân tạo
ANN áp dụng cho mô hình độ rỗng theo ANN và phương pháp quan hệ rỗng –
thấm áp dụng cho mô hình đổ ỗng Halo và Halo cải tiến. Và những khó khăn
trong quá trình làm đề tài này là chất lượng minh giải tài liệu địa cấn chưa cao,

6
thiếu sót trong phân tích các thuộc tính địa chất, gây khó khăn trong việc luyện
mang nơron khi tính tương quan giữa một số thuộc tính địa chấn và tài liệu
địa vật lý giếng khoan chưa cao.[2]
Luận văn thạc sĩ “ Xây dựng mô hình độ rỗng trên cơ sở phân tích tướng
địa chấn và giải thuật luyện mạng nơron nhân tạo” của anh Trương Khắc Hòa
– Trường đại học Bách Khoa tp. HCM – 2018. Trong luận văn này, tác giả tập
trung vào việc ứng dụng phương pháp huấn luyện mạng nơron nhân tạo có
giám sát để phân tích tài liệu địa chấn, kết hợp phân tích các thuộc tính địa
chấn với dữ liệu có được từ tài liệu tướng thạch học và log độ rỗng để xây
dựng mô hình độ rỗng cho khu vực nghiên cứu. Tác giả đã tổng hợp nền tảng
lý thuyết xây dựng mô hình đã được ứng dụng trên phần mềm Petrel, luận văn
đưa ra phương pháp xây dựng mô hình bằng cách sử dụng mạng nơron nhân
tạo và triển khai áp dụng tính toán giải thuật luyện mạng có giám sát theo mô
hình Self-Organizing Map (SOM Supervised – được phát triển từ giải thuật
luyện mạng không giám sát SOM) trên môi trường tính toán Matlab để xây
dựng mối quan hệ phức tạp, không tường minh giữa các thuộc tính địa chấn
với tướng thạch học, từ đó xây dựng mô hình tướng và mô hình rỗng của toàn
khu vực khảo sát trên Matlab[3]
2. Tình hình nghiên cứu ở nước ngoài
Trong bài nghiên cứu “Estimating porosity and permeability using
Digital Image Analysis (DIA) technique for highly porous sandstones” của
Bassem S. Nabawy đã sử dụng phân tích hình ảnh kỹ thuật số DIA ( digital
image analysis) để mô tả kích thước, hình dạng hạt và thể tích không gian lỗ.
Tác giả đã chia ra 5 loại độ rỗng của các mẫu đất đá như sau: isolated pore
spaces (là độ rỗng cô lập tách biệt khỏi chất lỏng), effective porosity(là độ
rỗng có thể tiếp cận được chất lỏng), connected porosity (độ rỗng liên kết: các

7
lỗ rỗng liên kết với nhau qua các lỗ thông hơi ), dead end pores (là lỗ rỗng đã
tiếp cận được chất lỏng nhưng nó bị cô lập lại không còn tiếp cận chất lỏng
nữa ), total porosity(bao gồm các lỗ rỗng cô lập hay liên kết). Tác giả tính toán
độ rỗng ( ∅ ¿¿ He)¿ kết nối và độ thấm k bằng các công thức:
78,899 v −v
{v g =34,989+ ∅ He =100 × b g ;
( )
P vb
1− 1
P2

Q×μ× L
k= ;
A× ΔP
Trong đó:
Q: tốc độ dòng chảy
μ: độ nhớt
A: Diện tích mặt cắt ngang
L: chiều dài
ΔP: Độ lệch áp suất
Và tác giả đã kết luận rằng kích thước hạt không ảnh hưởng về độ rỗng
giữa các hạt nhưng hạt càng lớn đường kính lỗ kẽ càng lớn [4]
Báo cáo khoa học “Confnement Efect on Porosity and Permeability of
Shales” của JanGoral, Palash Panja, Milind Deo, MatthewAndrew, Sven Linden,
Jens-Oliver Schwarz & Andreas Wiegmann đã nói rằng độ rỗng và độ thấm là
những yếu tố chính để đánh giá năng suất hydrocacbon của các hồ chứa độc
đáo ( đá phiến sét), có bản chất phức tạp do tính chất khoáng không đồng nhất
của chúng. Ngoài ra các mô phỏng số có thể được thực hiện trong các mô hình
3D kỹ thuật số được tái tạo từ các tập dữ liệu hình ảnh thu được thông qua ví
dụ, quét chùm tia ion hội tụ có độ phân giải cỡ nano chụp lớp nano kính hiển
vi điện tử (FIB-SEM). Trong nghiên cứu này phương pháp ZEISS crossbeam
522 FIB-SEM được sử dụng để thu nhập bộ dữ liệu hình ảnh với độ phân giải

8
siêu cao (5nm/voxel) của hai cùng quan tâm giàu chất hữu cơ (ROI) của một
mẫu đá phiến Marcellus. Cả hai tín hiệu điện tử thứ cấp (SE) và điện tử tán xạ
ngược (BSE) đều được thu nhận tại thời điểm chụp 3D. hình ảnh các tia SE và
BSE sau đó được trộn thành một tập dữ liệu hình ảnh duy nhất để tối ưu hóa
độ sáng và độ tương phản giữa các pha hữu cơ, và khoáng chất [5]

9
GIỚI THIỆU

Thống kê toán là bộ môn toán học nghiên cứu qui luật của các hiện tượng ngẫu
nhiên có tính chất số lớn trên cơ sở thu nhập và xử lí các số liệu thống kê ( các
kết quả quan sát). Nội dung chủ yếu của thống kê toán là xây dựng các phương
pháp thu nhập và xử lí các số liệu thống kê nhằm rút ra các kết luận khoa học
và thực tiễn, dựa trên những thành tựu của lí thuyết xác suất.

Việc thu thập, sắp xếp, trình bày các số liệu của tổng thể hay của một mẫu
được gọi là thống kê mô tả. Còn việc sử dụng các thông tin của mẫu để tiến
hành các suy đoán, kết luận về tổng thể gọi là thống kê suy diễn.

Thống kê được ứng dụng vào mọi lĩnh vực. Một số ngành đã phát triển thống
kê ứng dụng chuyên sâu trong ngành như thống kê trong xã hội học, trong y
khoa, trong giáo dục học, trong tâm lý học, trong kỹ thuật, trong sinh học,
trong phân tích hóa học, trong thể thao, trong hệ thống thông tin địa lí, trong
xử lí hình ảnh…

Trong quá trình tìm kiếm, thăm dò và khai thác Dầu khí thì việc nghiên cứu các
thông số của vỉa chứa và sự tác động qua lại giữa chúng là rất quan trọng.
Chúng có tác động trực tiếp đến quá trình di chuyển và tích tụ dầu khí, đồng
thời nó là một phần không thể thiếu trong quá trình khai thác.

10
CƠ SỞ LÝ THUYẾT

I. Phân tích dữ liệu:


1. Phân tích dữ liệu đơn biến (Univariate Analysis):

Thống kê một biến hay còn gọi biến ngẫu nhiên là đại lượng nhận các giá trị
nào đó phụ thuộc vào các yếu tố ngẫu nhiên và có hai dạng biến ngẫu nhiên là
rời rạc và liên tục.
Biến ngẫu nhiên rời rạc nếu nó chỉ nhận một số hữu hạn hoặc vô hạn đếm
được các giá trị

Bảng 1-1: Bảng phân phối xác suất cho biến rời rạc
X X1 X2 ...
P p1 p2 ...

Biến ngẫu nhiên liên tục nếu các giá trị của nó có thể lấp đầy một hoặc một số
các khoảng hữu hạn hoặc vô hạn và xác suất P{ X= a } bằng không với mọi a.
Biến ngẫu nhiên liên tục được biễu diễn bằng hàm phân bố mật độ xác suất

của biến ngẫu nhiên F(x) (Probability Density Function – PDF):

11
Hình 1-2 Giá trị hàm liên tục ngẫu nhiên[6]

- Thường dùng khoảng thang đo của biến để mô tả giá trị trung bình, cũng như
phương sai; dùng thứ tự để mô tả trung vị, khoảng hay phần trăm.

- Từ đó suy đoán ra kiểm định Z (Z-test) và kiểm định T (T-test). Trong đó


kiểm định Z là giả thuyết thống kê được sử dụng để xác định xem liệu hai mẫu
được tính có khác nhau hay không trong trường hợp có độ lệch chuẩn và mẫu
lớn trong khi kiểm định T được sử dụng để xác định mức độ trung bình của
các tập dữ liệu khác nhau trong trường hợp độ lệch chuẩn và phương sai đều
không biết trước.

+ Z-test sẽ cho biết, về độ lệch chuẩn, một điểm dữ liệu cách điểm trung bình
của tập dữ liệu bao xa. Nó so sánh một mẫu với một tập hợp xác định thường
được sử dụng để giải quyết các vấn đề liên quan đến mẫu lớn (n> 30).

+ T-test xác định sự so sánh có ý nghĩa thống kê giữa 2 nhóm mẫu độc lập hay
không. Nói cách khác, T-test hỏi liệu sự so sánh giữa giá trị trung bình của 2
nhóm có chắc chắn xảy ra do ngẫu nhiên hay không. Thông thường, T-test
thích hợp cho việc giải quyết các vấn đề với cỡ mẫu hạn chế (n<30).

-Thông qua những số liệu cũng như biểu đồ tần suất xuất hiện của độ rỗng
cũng như độ thấm ta có thể đưa ra được những số liệu về mode, mean, hay
median về đặc tính của đất đá trong các giếng khoan.

Cách xác định các đặc trưng từ mẫu dữ liệu:

_ Trung bình mẫu: Cho X là một biến ngẫu nhiên.


Giả sử X là biến ngẫu nhiên rời rạc có n quan sát x 1 , x 2 , x 3 , … x n. Trung bình mẫu
được định nghĩa bởi:

12
1
n
x + x + x +…+ x n
x= ∑ x i= 1 2 3 [1.1]
n i=1 n

Giả sử X là biến ngẫu nhiên liên tục có n quan sát x 1 , x 2 , x 3 , … x n. Trung bình mẫu
được định nghĩa bởi:
+∞
E ( x )= ∫ xF ( x ) dx [1.2]
−∞

Trung bình mẫu được dùng để xấp xỉ trung bình tổng thể. Trong đó: trung
bình của tổng thể, được gọi tắt là kỳ vọng và được ký hiệu là a hay μ, là trung
bình của tất cả giá trị có thể có của X trong quần thể.
_ Phương sai – độ lệch mẫu : Cho X là một biến ngẫu nhiên.
Giả sử X có n quan sát x 1 , x 2 , x 3 , … x n. Phương sai mẫu σ 2 hay s^ 2là trung bình của
bình phương độ lệch mẫu so với kỳ vọng:

❑ ∑ 2
x i −n . x
2

∑ (xi −x)= ❑
[1.3]
2 ❑ ❑
^s =

_ Các đặc trưng khác

+ Yếu vị (mode): là giá trị của phần tử có số lần xuất hiện lớn nhất trong mẫu.
+ Hệ số biến thiên (Coefficient of variation – CV): Hệ số biến thiên đo lường
mức độ biến động tương đối của mẫu dữ liệu, được dùng khi người ta muốn so
sánh mức độ biến động của các mẫu không cùng đơn vị đo.
σ s
CV (của tổng thể )= 100 % CV (của mẫu)= 100 % [1.4]
a x

+ Sai số chuẩn: là giá trị đại diện cho độ lệch chuẩn của giá trị trung bình trong
tập dữ liệu. Nó phục vụ như một thước đo biến động cho các biến ngẫu nhiên
hay đo lường độ phân tán. Độ phân tán càng nhỏ, dữ liệu càng chính xác.
s
SE= [1.5]
√❑
+ Trung vị mẫu:

13
Giả sử X có n quan sát x 1 , x 2 , x 3 , … x n. Xếp các quan sát này theo thứ tự tăng dần.
Trung vị mẫu (Median) là giá trị nằm chính giữa dãy số này và chia nó thành 2
phần bằng nhau. Cụ thể, nếu mẫu có dạng x 1<…<x2k+1 thì trung vị mẫu là x k+1;
nếu mẫu có dạng x1<…<x2k thì trung vị mẫu là trung bình cộng (xk + xk+1)/2
….
Phương pháp: Tại phần mềm Excel, chức năng Descriptive Statistics hỗ trợ
trong việc tính toán các giá trị đặc trưng của mẫu. Để mở chức năng này trong
Excel, thực hiện các bước: Data → Data Analysis → Hộp option xuất hiện, chọn
Descriptive Statistics rồi nhấn OK.

2. Phân tích dữ liệu đa biến ( Từ 2 biến trở lên):


2.1. Giới thiệu về phân tích thống kê đa biến:

Dữ liệu đa biến (Multivariate data) là thuật ngữ được sử dụng trong thống
kê để mô tả loại dữ liệu mà dữ liệu này có từ hai thuộc tính trở lên.

Phân tích thống kê đa biến (MSA - Multivariate Statistics Analysis) bao gồm
các kỹ thuật thống kê khác nhau. Trong đó, PCA (Principal Component
Analysis) và CA (Cluster Analysis) là 2 phương pháp được sử dụng phổ biến
nhất. Trong những năm gần đây, các phương pháp PCA và CA đã được sử dụng
khá rộng rãi trong các ứng dụng môi trường, bao gồm các đánh giá quan trắc
diễn biến chất lượng nước ngầm, nước mặt, kiểm tra kết quả các mô hình mô
phỏng chất lượng nước theo không gian và thời gian, xác định các yếu tố hóa
học liên quan đến các điều kiện thủy văn, và đánh giá các chỉ thị chất lượng
môi trường. Ở Mỹ và các nước Châu Âu như Pháp, Thổ Nhĩ Kỳ và các quốc gia
ở Châu Á như Malaysia, Trung Quốc, Nhật Bản, Ấn Độ, các nghiên cứu này đã
ứng dụng các phương pháp MSA đánh giá chất lượng nước mặt, nước dưới đất
ở các lưu vực sông dựa vào mối quan hệ giữa các thông số quan trắc với các

14
đặc điểm các tầng chứa nước, từ đó đề xuất được các thông số đặc trưng chất
lượng nước để giám sát và quản lí hiệu quả. Ở Việt Nam, các kĩ thuật thống kê
đa biến cũng được sử dụng rộng rãi trong nhiều lĩnh vực khác nhau như tâm
lý, kinh tế, xã hội, kỹ thuật trong đó có lĩnh vực môi trường (chủ yếu là sử
dụng phương pháp phân tích hồi quy tuyến tính để xử lí các số Ứng dụng phân
tích thống kê đa biến trong đánh giá chất lượng nước dưới đất huyện Tân
Thành, tỉnh Bà Rịa – Vũng Tàu).

Y
y1 y2 ... yj ... ym Σj
X
p(x1,y1 p(x1,y2 p(x1,ym
x1 ... p(x1,yj) ... p(x1)
) ) )
p(x2,y1 p(x2,y2 p(x2,ym
x2 ... p(x2,yj) ... p(x2)
) ) )
... ... ... ... ... ... ... ...
xi p(xi,y1) p(xi,y2) ... p(xi,yj) ... p(xi,ym) p(xi)
... ... ... ... ... ... ... ...
p(xn,y1 p(xn,y2 p(x1,y1 p(xn,ym
xn ... ... p(xn)
) ) ) )
Σi p(y1) p(y2) ... p(yj) ... p(ym) 1
Bảng 2-1: Bảng phân phối xác suất biến ngẫu nhiên rời rạc hai chiều[6]
2.2. Mô hình 8 quy tuyến tính đa biến:
Phương trình hồi quy tuyến tính hai biến của y theo x:[7]
Y =a0 +a 1 × X
Trong đó:
❑ ❑ ❑ ❑


Y × ∑ X −∑ X × ∑ XY
❑ ❑
2

❑ [2.1]
a 0=

15
❑ ❑ ❑
N ∑ XY −∑ X × ∑ Y
❑ ❑ ❑ [2.2]
a 1=

Phương trình hồi quy tuyến tính hai biến của y theo x:[7]
X =b0 +b 1 × Y
❑ ❑ ❑ ❑

Trong đó: ∑

X × ∑ Y 2−∑ Y × ∑ XY
❑ ❑ ❑ [2.3]
b 0=

❑ ❑ ❑
N ∑ XY −∑ X × ∑ Y
❑ ❑ ❑ [2.4]
b 1=

❖ Hệ số tương quan[6]

[2.5]

❖ Các giá trị đặc trưng[6]

+ Kỳ vọng:

Cho biến ngẫu nhiên hai chiều Z = (X,Y) thì ta có kỳ vọng của Z là:
[2.6]
Trường hợp rời rạc, ta giả sử Z có phân phối đồng thời (X = xi, Y = yi) = pij thì
ta có E(X) và E(Y) như sau:

[2.7]

Khi có điều kiện thì các kỳ vọng trong biến ngẫu nhiên rời rạc trở thành:

16
[2.8]

Trong trường hợp liên tục, Z = φ(X,Y) và có hàm mật độ đồng thời f(x,y) thì kỳ
vọng cho biến ngẫu nhiên liên tục là:

[2.9]

Kỳ vọng có điều kiện trong biến ngẫu nhiên liên tục:

[2.10]

a. Phương sai

[2.11]

b. Covariance (ma trận tương quan hay hiệp phương sai)


Hiệp phương sai được sử dụng như phương sai (variance) nhưng hiệp
phương sai sử dụng thêm một biến để đánh giá tương quan. Với hai biến X và
Y ta có hiệp phương sai như sau:

[2.12]

Nếu Y, X rời rạc thì ta có thể viết phương trình Cov(X,Y) lại như sau:

[2.13]

Ma trận tương quan (X,Y):

17
[2.14]

2. Bộ dữ liệu phân tích

Data – 1:

Data Data
Well X Y Por Per Well X Y Por Per
70 9856 5652 9.474761905 15.47880952 740 6953 7876 9.665357143 2.244821429
75 9767 4271 10.09682927 16.02170732 741 9918 8115 9.928947368 8.32245614
101 8062 9321 9.816727273 3.380181818 750 4325 6682 9.17 6.967735849
1010
499 6760 9.288545455 2.065272727 751 5782 6681 10.55241935 14.11274194
2
536 5763 5382 9.9938 9.932 752 7240 6686 9.814576271 2.583050847
537 7149 5336 9.904 6.57375 493 1553 9977 5.842586207 0.100689655
538 7172 4079 11.12609756 13.44292683 539 5558 4019 7.399 1.1904
540 4598 4151 10.3292 12.575 543 244 4024 6.189090909 0.136818182
541 3132 4061 7.12106383 1.675319149 545 421 2680 5.947538462 0.119230769
547 3100 2728 9.144285714 10.9325 546 1899 2799 6.490338983 0.242711864
548 5730 2810 10.0675 7.493409091 550 7175 1383 7.103142857 1.170571429
549 7247 2910 9.192666667 4.922888889 554 1778 1401 4.025192308 0.273653846
551 5797 1389 9.601707317 4.654878049 555 443 1470 5.242903226 1.605806452
552 4634 1369 7.891395349 7.267906977 556 635 85 5.607413793 1.286724138
558 3223 100 11.2145614 26.80912281 557 1788 86 7.327457627 4.646101695

18
561 7159 92 9.719661017 8.64220339 586 8651 4063 8.421428571 4.109761905
585 8555 5365 8.23 4.088333333 587 8577 2678 7.851219512 3.953414634
589 8577 126 8.923111111 6.812666667 717 72 9383 6.637704918 0.739672131
596 8398 9506 11.1162 10.2562 718 1723 9309 5.273965517 0.075344828
597 7871 9517 11.05385965 9.953333333 719 3238 9429 7.164237288 0.79559322
598 7609 9769 9.659454545 2.507636364 720 4327 9313 7.826086957 1.772608696
599 8124 9773 10.85363636 6.980363636 736 299 7955 6.373333333 0.167142857
600 8652 9771 10.73240741 14.90314815 737 1683 8085 4.985084746 0.077118644
601 7622 9256 10.45763636 6.464545455 738 3100 7966 6.714912281 0.54122807
602 8133 9256 10.31722222 4.267037037 747 76 6571 5.535645161 0.093870968
603 8649 9255 8.935892857 1.441428571 748 1771 6699 6.341636364 0.146727273
620 5862 9383 9.849821429 2.999107143 749 3124 6663 6.98627451 0.50745098
621 5808 8048 11.38366667 14.78533333 757 377 5360 6.003709677 0.135806452
623 8430 6688 10.116 4.433636364 758 1765 5379 6.475192308 0.153269231
624 9806 6580 9.115555556 11.53796296 759 3118 5357 7.423888889 3.247592593
739 4331 7986 9.021272727 6.290363636 760 4327 5357 6.853636364 0.288

19
Data – 2:

Data Data
X(Easting) X(Easting)
Well Z(m) Por Per Seis Well Z(m) Por Per Seis
(m) (m)
621 8000 223 9.36 1.09 52034 751 7000 255 15.2 39.65 53957
621 8000 227 13.65 8.12 52034 751 7000 259 7.53 0.23 53957
621 8000 231 16.42 45.75 52034 751 7000 263 5.67 0.05 53957
621 8000 235 17.29 78.99 52034 751 7000 267 12.53 10.71 53957
621 8000 239 16.58 50.52 52034 751 7000 271 8.9 1.14 53957
621 8000 243 10.97 2.47 52034 751 7000 275 7.68 0.28 53957
621 8000 247 16.02 35.69 52034 751 7000 279 6.26 0.05 53957
621 8000 251 12.68 4.43 52034 751 7000 283 6.02 0.05 53957
621 8000 255 7.69 0.4 52034 751 7000 287 7.76 0.3 53957
621 8000 259 9.36 1.09 52034 536 6000 223 3.83 0.05 48644
621 8000 263 11.61 2.28 52034 536 6000 227 4.39 0.05 48644
621 8000 267 6.27 0.14 52034 536 6000 231 8.09 0.89 48644
621 8000 271 10.68 2.17 52034 536 6000 235 11.78 8.15 48644
621 8000 275 6.53 0.19 52034 536 6000 239 15.09 33.73 48644
621 8000 279 4.6 0.05 52034 536 6000 243 14.26 23.65 48644
751 7000 227 7.16 0.15 53957 536 6000 247 10.2 4.15 48644
751 7000 231 12.22 9.21 53957 536 6000 251 13.87 20.04 48644
751 7000 235 14.05 22.56 53957 536 6000 255 13.82 19.57 48644
751 7000 239 15.36 43 53957 536 6000 259 13.21 15.09 48644
751 7000 243 15.29 41.54 53957 536 6000 263 4.96 0.05 48644
751 7000 247 9.21 1.64 53957 536 6000 267 6.98 0.1 48644
751 7000 251 15.26 40.82 53957 536 6000 271 11.45 7.07 48644

Mô tả về các khái niệm và vài công thức liên quan đến dữ liệu:

+ Độ rỗng của đất đá (Porosity): được biểu thị bằng tỉ số phần trăm giữa thể
tích của các chỗ trống đó với tổng thể tích đá. Độ rỗng thường được tính theo
công thức:

Vv
∅= [2.15]
VT

Trong đó: Vv là phần thể tích không gian lỗ rỗng và VT là tổng thể tích của đá

20
+ Độ thấm (Permeability): là thông số đo mức độ dễ dàng mà chất lưu (lỏng
hay khí) thấm qua môi trường ấy dưới tác động của Gradient áp suất.

- Độ thấm tuyệt đối: biểu thị dòng chất lưu đồng nhất không có những tác
động hóa học với đá ở pha cứng được biểu thị theo định luật Darcy như
sau:
A .∆P
Q= k. μ . L [2.16]

Trong đó:

k: Hệ số thấm;

A: Thiết diện dòng chảy

Q: Lưu lượng dòng chảy;

μ: Độ nhớt v

L: chiều d8ài

II. Phân tích dữ liệu:


1. Phân tích đơn biến

1.1. Thực hiện phương pháp phân tổ dữ liệu:


Bước 1: Nhập dữ liệu vào excel:

21
2.1 Dữ liệu về độ rỗng của các vỉa khoan dầu khí

1
Bước 2: Xác định số tổ cần chia: k =( 2 ×n ) 3

+ Chọn ô F2 nhập vào biểu thức: =2*(COUNT(B2:B62))^(1/3)

+ Kết quả: k= 7.782994

+ Chọn k=8

X MAX −X MIN
Bước 3: Xác định trị số khoảng cách h theo công thức: h=
k

22
+ Chọn ô F4 nhập vào biểu thức: =( MAX(B2:B62)-MIN(B2:B62))/k

+ Kết quả: h= 0.93

Bước 4: Xác định cận trên và cận dưới của các tổ:

Tổ 1: 4.03- 4.96 Tổ 5: 7.75- 8.68

Tổ 2: 4.96- 5.89 Tổ 6: 8.68- 9.61

Tổ 3: 5.89- 6.82 Tổ 7: 9.61- 10.54

Tổ 4: 6.82- 7.75 Tổ 8: 10.54- 11.47

Bước 5: Sử dụng công cụ ‘ Histogram’ trong Data Analysis

⮚ Chọn chức năng Data→ Data Analysis → Histogram

● Input Range: địa chỉ tuyệt đối chứa dữ liệu

● Bin Range: địa chỉ chứa bảng phân nhóm

● Output Range: Vị trí xuất kết quả

23
● Chọn Cumulative Percentage để tính tần suất tích lũy nếu không Excel

chỉ tính tần suất

(2.2)

Kết quả:

→ Ta nhận thấy độ rỗng của giếng khoan nằm chủ yếu ở mức độ rỗng từ

6.82- 7.75 (với tần số là 12 lần) và nhiều nhất ở mức từ 9.61- 10.54 (fr)
(với tần số xuất hiện là 16 lần).

24
1.2. Bảng phân phối tần số và biểu đồ Histogram
Bước 1: Quét chọn 2 cột ‘Khoảng’ (Bin) và cột ‘Tần số’ (Frequency)

(2.3)

Bước 2: Dùng chức năng Insert Column Chart trên menu Insert

Kết quả:

(2.4)

1.3. Biểu đồ phân phối tích lũy tần số:


Bước 1: Quét chọn 2 cột ‘ Khoảng’ (Bin) và cột ‘ Tần số tích lũy%’
(Cumulative %)
25
(2.5)

Bước 2: Dùng chức năng Insert Line trên menu Insert.

Kết quả:

(2.6)

1.4. Tìm các đặc trưng từ mẫu dữ liệu:


Tại phần mềm Excel, chức năng Descriptive Statistics hỗ trợ trong việc tính
toán các giá trị đặc trưng của mẫu. Để mở chức năng này trong Excel, thực
hiện các bước: Data → Data Analysis → Hộp option xuất hiện, chọn
Descriptive Statistics rồi nhấn OK.

26
(2.7)

⮚ Qúa trình xử lí: Chọn biến trong bảng dữ liệu để thực hiện tính toán các

giá trị đặc trưng (Độ rỗng của đá ở các vỉa khoan dầu khí).

Tại Input Range trong Descriptive Statistics ta nhập độ rộng của column dữ
liệu.

27
Tại Option: chọn Summary statistics và Confidence Level for Mean (Mức ý
nghĩa).

Kết quả : Sau khi nhập giá trị tại Input Range và nhấn OK, kết quả cho được
như sau:

(2.8)

Với ý nghĩa của các giá trị như sau:

Statistic Describe
Mean Gía trị trung bình của mẫu dữ liệu x

X =∑
i=1
Xi

Standard Gía trị sai số tiêu chuẩn của mẫu S
SEM= SD ( X )= SX = √ N
Error
Median Trung vị của mẫu dữ liệu N +1
Nếu N lẻ: 2

28
Nếu N chẵn: TB 2 số ở
giữa
Mode Mốt của mẫu dữ liệu Gía trị có tần số cao nhất

Standard Độ lệch chuẩn N

SD= ∑
i=1
( Xi− X )²
Deviation ❑
Sample Phương sai SD2
Variance
Kurtosis Gía trị KURT N/A

Skewness Gía trị SKEW N/A

Range Khoảng khảo sát XMAX -XMIN


Minimum Gía trị nhỏ nhất XMIN
Maximum Gía trị lớn nhất XMAX
Sum Tổng giá trị các phân tử của mẫu N

∑ Xi
i=1
dữ liệu
Count Tổng số lượng các phân tử của N
mẫu

29
2.9 Dữ liệu về độ thấm của đá ở vỉa khoan dầu khí

30
(2.10)

(2.11)

→ Từ 2 biểu đồ phân phối tích lũy và biểu đồ Histogram cho ta thấy số liệu về

độ thấm sẽ được chia làm 8 tổ. Trong đó ta nhận thấy rằng độ thấm của đất đá
trong giếng khoan chủ yếu ở mức từ 3.471- 6.867 md ( xuất hiện nhiều nhất
với tần số là 29 lần) và ở mức liền kề từ 6.867- 10.263 md ( với tần số xuất
hiện là 16 lần).

31
→ Điều này cho chúng ta thấy độ rỗng của đất đá không đều theo độ sâu của

giếng khoan.

(2.12)

→ Đây là bảng thống kê số liệu về độ rỗng của giếng khoan bao gồm giá trị

trung binh, trung vị, yếu vị, giá trị lớn nhất, nhỏ nhất với mức tin cậy 95%.
Ngoài ra còn đánh giá thêm về các điểm tứ phân vị để khảo sát được các giá trị
ngoại lai (Outliers) từ đó có cách xử lí những giá trị đó một cách hợp lí nhất.

2.Phân tích đa biến


32
+ Xác định độ không lệch giữa độ lỗ rỗng và độ thấm của dữ liệu:

Phương pháp: Ta dùng hàm STDEVP

Công thức nhập: =STDEV.P([dữ liệu])

Hiển thị kết quả:

33
(2.13)
2.1. Phương trình và đường hồi quy tuyến tính:
34
Phương pháp:Ta sử dụng Data Analysis / Regression

(2.14)

Ta thu được bảng kết quả:

35
(2.15)
Đây là phương trình hồi quy giữa mối liên hệ của độ thấm từ độ rỗng thì độ
thấm sẽ đóng vai trò là biến phụ thuộc còn độ rỗng từ sẽ đóng vai trò là biến
độc lập.
Dựa vào bảng kết quả trên, phương trình hồi quy sẽ là:
Y =2.1106 X −12.5495
Đường hồi quy giữa độ thấm và độ rỗng:

Por Line Fit Plot


30
25
20
15
Per
Per

10 Predicted Per
5
0
3 4 5 6 7 8 9 10 11 12
-5
-10
Por
(2.
16)
2.17 Biểu đồ phân tán của các cặp dữ liệu Độ thấm và Độ rỗng:

36
Per
30

25

20

Per
15

10

0
3 4 5 6 7 8 9 10 11 12

2.2. Tính phần sai lệch và vẽ biểu đồ theo độ rỗng:

❖ Độ sai lệch (Standard Error) = 3.7184 (theo bảng kết quả trên)

❖ Biểu đồ theo độ rỗng (2.18)

37
Por Residual Plot
20

15

10
Residuals

0
3 4 5 6 7 8 9 10 11 12
-5

-10
Por

❖ Phân tích tương quan: hàm CORREL

Nhận xét: Giá trị tương quan giữa Độ rỗng và Độ thấm của đá là 0.7393 > 0.5
⇒ Giá trị Độ rỗng và Độ thấm có mối liên hệ tích cực nghĩa là lỗ rỗng càng
nhiều thì độ thấm càng tăng.

2.3. Biểu đồ dữ liệu độ thấm dự đoán và thực tế: (2.19)

38
12

10

6 Predicted Per
Per

0
0 2 4 6 8 10 12

❖ Tính toán phương sai của mỗi bộ dữ liệu: ta sử dụng Data

Analysis/Descriptive Statistics
Bộ Data 1:

39
Kết quả:

- Giá trị phương sai mẫu của độ rỗng: 3.6793


- Giá trị phương sai mẫu của độ thấm: 29.9898

2.4.Tính toán và so sánh giá trị phương sai của 2 bộ dữ liệu Data – 1 và Data –
2:

Ở bộ Data – 1 ta có kết quả như trên


Ở bộ Data – 2, ta tính giá trị phương sai cũng bằng hàm Data
Analysis/Descriptive Statistics
Và thu được kết quả như sau:

40
- Giá trị phương sai mẫu của độ rỗng: 15.1921
- Giá trị phương sai mẫu của độ thấm: 350.1488
Nhận xét: Ở 2 bộ dữ liệu, các giá trị phương sai mẫu của độ rỗng và độ thấm có
sự chênh lệch lớn, nó thể hiện sự phân tán thống kê của độ rỗng và độ thấm.
Đối với bộ data1, độ rỗng thấp dẫn tới độ thấm cũng ít thì có thể dự đoán rằng
ở vùng này tiềm năng dầu khí sẽ thấp hơn so với ở bộ Data 2.

41
KẾT LUẬN VÀ KIẾN NGHỊ

Thông qua quá trình thực hiện đồ án này nhóm em đã phân tích được các giá
trị đặc trưng của mẫu số liệu, tạo ra được các biểu đồ về các giá trị của độ rỗng
và độ thấm, phân tích mối quan hệ tương quan giữa độ rỗng và độ thấm bằng
phần mềm Excel 2010.

Độ rỗng và độ thấm là hai đặc điểm vật lý quan trọng của bể khi đã xác định
được bể có khả năng chứa hydrocacbon, nhìn chung các đá có độ rỗng thông
nối (độ rỗng mở) càng lớn thì có độ thấm càng cao, Vì vậy, để nhận biết và
phát hiện tầng đá chứa trong giếng khoan thì trước hết phải đánh giá độ rỗng
và độ thấm của đá, nhờ vào việc phân tích độ rỗng và độ thấm trên, chúng em
đã kết luận sơ bộ về tiềm năng chứa dầu ở cả 2 giếng khoan. Trong khoảng
không gian rỗng của đá chứa sẽ được lấp kín (bảo hòa) bởi nước hoặc dầu khí,
gọi chung là chất lưu. Theo quy luật tự nhiên, các thành phần chất lưu bảo hòa
trong đá, nước xuất hiện sớm nhất, thậm chí là ngay trong giai đoạn tích tụ
ban đầu; dầu khí sinh ra từ các tầng đá giàu vật chất hữu cơ, có khi phân bố
cách đó rất xa, sau đó qua các biến cố địa chất được chiết tách ra và di cư vào
vỉa đá chứa. Dầu đẩy nước ra ngoài theo quy luật cân bằng áp suất và theo tỷ
trọng. Vì nước là chất dính ướt nên không dễ bị đẩy ra khỏi vỉa đá chứa. Một
vỉa đá chứa mà gọi là vỉa nước thì chỉ có nước là thành phần chất lưu bảo hòa
100%, vỉa đá được gọi là vỉa dầu khí thì độ bão hòa dầu khí bao giờ cũng lớn
nhưng ngoài ra còn có một tỷ lệ nước nhất định. Đá chứa càng chứa nhiều dầu
khí, càng ít nước thì càng có giá trị cao. Nhờ vào những đặc điểm đó mà cũng
có thể dự đoán khả năng di chuyển của dầu và sẽ tính được thể tích được vỉa
dầu mà chúng ta đang nghiên cứu.

Bên cạnh đó trong quá trình tính toán cũng như đưa ra những kết luận còn
hạn chế và sai sót, việc sử dụng excel để tính toán chỉ mang tính tương đối và
chưa đưa lại thực nghiệm thực tế. Mặt khác trong tính toán phần mềm, có rất
nhiều ràng buộc nhỏ bị chú tâm nên thời gian thực hiện bài toán thiết kế tối
ưu hóa chưa nhanh và độ tin cậy chưa cao.

42
TÀI LIỆU THAM KHẢO
[1] https://tailieuxanh.com/vn/tlID2037503_xac-dinh-phan-bo-do-rong-va-
do-tham-cua-than-dau-trong-da-mong-mo-bach-ho-theo-tai-lieu-mau-loi-va-
dia-vat-ly-gieng-khoan.html
[2] https://opac.vnulib.edu.vn/search~S1*vie?/X{u0111}{u00F4}
{u0323}+r{u00F4}{u0303}ng&searchscope=1&SORT=D/X{u0111}{u00F4}
{u0323}+r{u00F4}
{u0303}ng&searchscope=1&SORT=D&SUBKEY=độ+rỗng/
1%2C755%2C755%2CB/frameset&FF=X{u0111}{u00F4}{u0323}+r{u00F4}
{u0303}ng&searchscope=1&SORT=D&4%2C4%2C
[3] https://opac.vnulib.edu.vn/search~S1*vie?/X{u0111}{u00F4}
{u0323}+r{u00F4}{u0303}ng&searchscope=1&SORT=D/X{u0111}{u00F4}
{u0323}+r{u00F4}
{u0303}ng&searchscope=1&SORT=D&SUBKEY=độ+rỗng/
1%2C755%2C755%2CB/frameset&FF=X{u0111}{u00F4}{u0323}+r{u00F4}
{u0303}ng&searchscope=1&SORT=D&2%2C2%2C
[4]
https://www.researchgate.net/publication/257786117_Estimating_porosity_
and_permeability_using_Digital_Image_Analysis_DIA_technique_for_highly_por
ous_sandstones
[5] https://www.longdom.org/open-access/porosity-and-permeability-
analysis-from-well-logs-and-core-in-fracturevugy-and-intercrystalline-
carbonate-reservoirs-2155-9546-1000371.pdf
[6] Giáo trình địa thống kê - TẠ QUỐC DŨNG - NGUYỄN NHƯ Ý
[7] Slide bài giảng “ Univariate and Multivariate Statistical Methods” – Geopet–
trường đại học Bách Khoa tpHCM

43

You might also like