Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Bài quiz cho buổi học chiều thứ 6

Nhóm (điền số nhóm) *


Số thứ tự nhóm

Họ và tên *
Nguyễn Tiền Phương

1. Cho tập ví dụ như bảng. Entropy của kết luận C=Play Ball là? *
10 điểm

10/10

Bảng dữ liệu
a. Entropy(C) = 0.5
b. Entropy(C) = 3
c. Entropy (C) = 6
d. Entropy (C) = 1

2. Tiến trình Khai phá tri thức – KDD gồm các bước như sau? *
10 điểm

10/10
a. Lựa chọn dữ liệu, khai phá dữ liệu, trình diễn dữ liệu
b. Lựa chọn dữ liệu, khai phá dữ liệu, trình diễn dữ liệu, tiền xử lý dữ liệu
c. Lựa chọn dữ liệu, tiền xử dữ liệu, chuyển đổi dữ liệu, khai phá dữ liệu, trình diễn dữ liệu

d. Lựa chọn dữ liệu, chuyển dạng, khai phá dữ liệu, tiền xử lý dữ liệu, trình diễn dữ liệu
3. Sự bùng nổ của dữ liệu trong những năm gần đây có nhiều nguyên nhân, trong đó
có những nguyên nhân sau (chọn đáp án đúng nhất:) *
10 điểm

10/10
a. Dữ liệu quảng cáo ngày càng nhiều, bùng nổ các mạng xã hội,…
b. Thông tin thu thập từ việc nghiên cứu các hành tinh, thông tin chống khủng bố, thông tin
quảng cáo ngày càng nhiều,…
c. Khoa học kỹ thuật ngày càng tiến bộ, nguồn nhân lực ngành Công nghệ thông tin ngày càng
đông, nhu cầu khai thác thông tin ngày càng nhiều …
d. Công nghệ phần cứng phát triền mạnh, năng lực số hóa của con người ngày càng cao, bùng
nổ công nghệ mạng, tác nhân tạo mới dữ liệu ngày càng nhiều …

4. Câu lệnh nào sau đây trong ngôn ngữ R dùng để tìm mối quan hệ giữa 2 trong
thuật toán Linear Regression? *
10 điểm

0/10
a. hàm ln()
b. hàm glm()
c. hàm lm()

d. Cả 3 đáp án trên đều sai

Correct answer
a. hàm ln()

5. Những yếu tố nào ảnh hưởng đến sự thành công trong quá trình xây dựng mô hình
hồi quy? *
10 điểm

10/10
a. Chọn các biến quan trọng và dạng mô hình, tập hợp dữ liệu tốt
b. Mô hình đúng vấn đề, sử dụng các thủ tục hợp lý cho việc ước lượng thông số
c. Tập hợp dữ liệu tốt
d. Cả A, B và C đúng

6. Các giải thuật sử dụng để xây dựng cây quyết định? *


10 điểm

10/10
a. ID3, C4.5, CART

b. ID3, C4.6, CART


c. C4.5, J48, ID4
d. ID4, C4.5, J48

7. Để xây dựng cây quyết định từ cơ sở dữ liệu huấn luyện ta sử dụng? *


10 điểm

10/10
a. Độ đo Information Gain
b. Độ đo Gain Ratio
c. Độ đo Gini Index
d. Cả 3 độ đo trên

8. Các tiêu chí đánh giá mô hình phân lớp? *


10 điểm

10/10
a. Độ chính xác, Tốc độ, Tính mạnh mẽ, Khả năng lý giải được
b. Độ chính xác, Tính mạnh mẽ, Khả năng mở rộng, Khả năng lý giải được
c. Độ chính xác, Tính mạnh mẽ, Khả năng mở rộng, Tốc độ
d. Độ chính xác, Tốc độ, Tính mạnh mẽ, Khả năng mở rộng, Khả năng lý giải được

9. Cho tập dữ liệu gồm 30 Nam, 20 Nữ. Sử dụng mô hình phân lớp để dự đoán là
Nam hay Nữ. Mô hình dự đoán lấy ngẫu nhiên 22 mẫu dữ liệu và dự đoán đúng 18
Nam, hãy tính Precision (P) và Recall (R) của mô hình dự đoán? *
10 điểm

10/10
a. P = 82%, R = 60%

b. P = 60%, R = 60%
c. P = 60%, R = 82%
d. P = 82%, R = 75%

10. Những thuật toán nào sau đây được sử dụng để giải quyết bài toán phân lớp dữ
liệu? *
10 điểm

10/10
a. Hồi quy logistic, K-mean, Naïve Bayes
b. Hồi quy logistic, Association Rules, Decision Tree
c. Hồi quy logistic, Naïve Bayes, Decision Tree

d. Hồi quy tuyến tính, Naïve Bayes, Decision Tree

You might also like