Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 16

1.

Thông tin về bộ dữ liệu trong Weka như sau:


2. Thông tin về bộ dữ liệu Airline trong Weka như sau :
3. Thông tin về bộ dữ liệu Airline trong Weka như sau :
4. Thông tin về bộ dữ liệu Airline trong Weka như sau :
5. Thông tin về bộ dữ liệu Airline trong Weka như sau :
6. Thông tin về bộ dữ liệu Airline trong Weka như sau :
7. Thông tin về bộ dữ liệu Airline trong Weka như sau :
8. Thông tin về bộ dữ liệu Airline trong Weka như sau :
9. Thông tin về bộ dữ liệu Hypothyroid trong Weka như sau :
- Attributes: Phần này mô tả từng thuộc tính (cột) trong dữ liệu. Tổng cộng có 30
thuộc tính, bao gồm:
 Age: Số nguyên thể hiện tuổi của bệnh nhân.
 Sex: Biến phân loại (nominal) - 'M' hoặc 'F' cho nam hoặc nữ.
 Một số thuộc tính boolean: Chúng chỉ ra sự có mặt của một điều kiện (ví
dụ: 'on thyroxine') hoặc một câu trả lời 'true' hoặc 'false' đối với một câu hỏi
(ví dụ: 'query hypothyroid').
 TSH measured: Biến phân loại - 't' hoặc 'f' chỉ ra xem TSH có được đo hay
không.
 TSH, T3, TT4, T4U, FTI, TBG: Các thuộc tính có giá trị thực biểu thị mức
độ hormone.
 Referral source: Biến phân loại - chỉ ra bệnh viện/phòng khám đã giới thiệu
bệnh nhân.
 Class: Biến phân loại - nhãn lớp cho tình trạng của bệnh nhân. Các giá trị
có thể là 'negative', 'compensated_hypothyroid', 'primary_hypothyroid', và
'secondary_hypothyroid'.
10. Thông tin về bộ dữ liệu Ionosphere trong Weka như sau :
- Số lượng trường hợp: 351
- Số lượng thuộc tính: 34 + thuộc tính lớp
- Các thuộc tính dự đoán đều là liên tục.
Thuộc tính lớp có thể là "tốt" hoặc "xấu". Đây là một nhiệm vụ phân loại nhị phân.
Giá trị thiếu: Không có
- Định dạng dữ liệu:
Dữ liệu có thể được cung cấp dưới dạng ARFF (Attribute Relation File Format),
được sử dụng bởi phần mềm học máy. Một ví dụ về một số mục dữ liệu được bao
gồm, trong đó mỗi dòng đại diện cho một trường hợp:
34 giá trị đầu tiên đại diện cho 34 thuộc tính liên tục.Giá trị cuối cùng là nhãn lớp
("g" cho tốt và "b" cho xấu).
11. Thông tin về bộ dữ liệu iris.2D trong Weka như sau :
- Số lượng mẫu: 150
- Số lượng thuộc tính: 4
- Tên thuộc tính:
 petallength (chiều dài cánh hoa): giá trị số thực
 petalwidth (chiều rộng cánh hoa): giá trị số thực
 class (loại hoa): giá trị danh nghĩa với 3 giá trị: Iris-setosa, Iris-versicolor, và
Iris-virginica
12. Thông tin về bộ dữ liệu iris trong Weka như sau :
- Số lượng mẫu tin: Bộ dữ liệu Iris bao gồm tổng cộng 150 mẫu tin (hàng) dữ
liệu.
- Số lượng thuộc tính: Bộ dữ liệu Iris bao gồm 5 thuộc tính đặc trưng, gồm:
 Sepal length (Chiều dài đài hoa)
 Sepal width (Chiều rộng đài hoa)
 Petal length (Chiều dài cánh hoa)
 Petal width (Chiều rộng cánh hoa)
 Class (lớp) được sử dụng để đại diện cho nhãn của mỗi mẫu hoa Iris. Nhãn
này xác định loài hoa Iris tương ứng với mỗi mẫu.Cụ thể, thuộc tính "class"
trong bộ dữ liệu Iris có ba giá trị nhãn khác nhau, tương ứng với ba loài hoa
Iris:
o Iris setosa
o Iris versicolor
o Iris virginica
- Loại dữ liệu: 4 thuộc tính đầu đều là dữ liệu số (numerical), thuộc tính cuối là
thuộc tính phân lớp (class attributes).
- Thuật toán áp dụng: Bộ dữ liệu Iris có thể được sử dụng cho cả việc phân cụm
(clustering) và phân lớp (classification), không có luật kết hợp.

13. Thông tin về bộ dữ liệu labor trong Weka như sau :


- Số lượng bản ghi: 57
- Số lượng thuộc tính: 16
- Các thuộc tính bao gồm:
 Thời hạn thỏa thuận (duration)
 Tăng lương năm đầu, hai, ba (wage-increase-first-year, wage-increase-
second-year, wage-increase-third-year)
 Điều chỉnh chi phí sinh hoạt (cost-of-living-adjustment)
 Số giờ làm việc mỗi tuần (working-hours)
 Chương trình trợ cấp hưu trí (pension)
 Phụ cấp trực chiến (standby-pay)
 Phần differential cho ca làm việc thứ II và III (shift-differential)
 Trợ cấp giáo dục (education-allowance)
 Số ngày lễ theo quy định (statutory-holidays)
 Kỳ nghỉ phép có lương (vacation)
 Trợ cấp tàn tật dài hạn (longterm-disability-assistance)
 Góp phần vào nha khoa (contribution-to-dental-plan)
 Trợ cấp tang chế (bereavement-assistance)
 Góp phần vào bảo hiểm y tế (contribution-to-health-plan)
- Mỗi thuộc tính có một tập hợp các giá trị hợp lệ. Ví dụ, thuộc tính "cost-of-
living-adjustment" có thể nhận các giá trị "none" (không), "tcf" (theo yếu tố),
hoặc "tc" (toàn bộ). Không có giá trị bị thiếu trong bộ dữ liệu.
- Phân loại:
 Mỗi bản ghi được phân loại là "good" (tốt) hoặc "bad" (xấu) dựa trên chất
lượng của thỏa thuận cho người lao động.
14. Thông tin về bộ dữ liệu ReutersCorn-test trong Weka như sau :
- Thuộc tính (Attribute):
 Text: Văn bản của bài báo (chuỗi)
 class-att: Chủ đề của bài báo (phân loại, 0 hoặc 1)
- Các giá trị (Value):
 0: Không liên quan đến thương mại quốc tế
 1: Liên quan đến thương mại quốc tế
- Dữ liệu (Data):
 Mỗi dòng đại diện cho một bài báo, với văn bản và chủ đề được phân cách
bởi dấu phẩy.
 Dòng cuối cùng chứa thông tin bản quyền của Reuters.
15. Thông tin về bộ dữ liệu ReutersCorn-train trong Weka như sau :
- Thuộc tính (Attribute):
 Text: Văn bản của bài báo (chuỗi)
 class-att: Chủ đề của bài báo (phân loại, 0 hoặc 1)
- Các giá trị (Value):
 0: Không liên quan đến thương mại quốc tế
 1: Liên quan đến thương mại quốc tế
- Dữ liệu (Data):
 Mỗi dòng đại diện cho một bài báo, với văn bản và chủ đề được phân cách
bởi dấu phẩy.
 Dòng cuối cùng chứa thông tin bản quyền của Reuters.
16. Thông tin về bộ dữ liệu ReutersGrain-test trong Weka như sau :
- Thuộc tính (Attribute):
 Text: Nội dung văn bản của bài báo.
 class-att: Nhãn phân loại bài báo (0: không liên quan thương mại, 1: liên quan
thương mại).
- Dữ liệu mẫu (Sample Data):
 Bài báo về tranh chấp thương mại giữa Mỹ và Nhật Bản được phân loại là liên
quan thương mại (class-att = 1).
 Bài báo về Trung Quốc hao hụt sản phẩm nông nghiệp do bảo quản kém được
phân loại là không liên quan thương mại (class-att = 0).
17. Thông tin về bộ dữ liệu Airline trong Weka như sau :
18. Thông tin về bộ dữ liệu Airline trong Weka như sau :
19. Thông tin về bộ dữ liệu Airline trong Weka như sau :
20. Thông tin về bộ dữ liệu Airline trong Weka như sau :
21. Thông tin về bộ dữ liệu Airline trong Weka như sau :
22. Thông tin về bộ dữ liệu Airline trong Weka như sau :
23. Thông tin về bộ dữ liệu Airline trong Weka như sau :
24. Thông tin về bộ dữ liệu Airline trong Weka như sau :
25. Thông tin về bộ dữ liệu Airline trong Weka như sau :
- Hình ảnh thuật toán các bộ dữ liệu :
1. airline.arff
 Phương pháp phân lớp :

 Phương pháp gom cụm :

 Phương pháp luật kết hợp


2. breast-cancer.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

3. contact-lenses.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

4. cpu.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

5. cpu.with.vendor.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

6. credit-g.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

7. diabetes.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

8. glass.arff
 Phương pháp phân lớp :

 Phương pháp gom cụm :


 Phương pháp luật kết hợp :

9. hypothyroid.arff
 Phương pháp phân lớp :

 Phương pháp gom cụm :


 Phương pháp luật kết hợp :

10. ionosphere.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp (không).

11. iris.2D.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :

 Phương pháp luật kết hợp :

12. iris.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :

 Phương pháp luật kết hợp :

13. labor.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :

 Phương pháp luật kết hợp :

14. ReutersCorn-test.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

15. ReutersCorn-train.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

16. ReutersGrain-test.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

17. ReutersGrain-test.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

18. segment-challenge.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

19. segment-test.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :
20. soybean.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

21. supermarket.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

22. unbalanced.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

23. vote.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

24. weather.nominal.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

25. weather.numeric.arff
 Phương pháp phân lớp :
 Phương pháp gom cụm :
 Phương pháp luật kết hợp :

You might also like