Weka

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 56

1.

Tên bộ dữ liệu: Airline

Thông tin về tổng số hành khách của hãng hàng không quốc tế hàng tháng (tính bằng
nghìn) trong khoảng năm từ 1949-1960.

 Thông tin chi tiết về dữ liệu


 Số mẫu tin: 144
 Thuộc tín: 2
- Passenger_numbers ( Số hành khách)
- Date (Ngày)
 Thuật toán:

Phân lớp: không

Gom cụm: không

Kết hợp: không

2. Tên bộ dữ liệu: breast-cancer


Thông tin về bệnh ung thư vú của phụ nữ trong từng độ tuổi khác nhau và khả
năng tái phát của nó.
 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 286
 Thuộc tín: 20
- Class (kết quả phân lớp): no-recurrence-events (ko tái phát), recurrence-
events (tái phát)
- Age (tuổi): 10-19, 20-29, 30-39, 40-49, 50-59, 60-69, 70-79, 80-89, 90-99.
- Menopause (thời kì mãn kinh): lt40, ge40, premeno.
- tumor-size (kích thước khối u): 0-4, 5-9, 10-14, 15-19, 20-24, 25-29, 30-34,
35-39, 40-44, 45-49, 50-54, 55-59.
- inv-nodes: 0-2, 3-5, 6-8, 9-11, 12-14, 15-17, 18-20, 21-23, 24-26, 27-29,
30-32, 33-35, 36-39.
- node-caps: yes, no.
- deg-malig: 1, 2, 3.
- Breast (vú): left, right.
- breast-quad: left-up, left-low, right-up, right-low, central.
- irradiat: yes, no.
 Thuật toán:
Phân lớp: có

Gom cụm: có
Kết hợp: có

3. Tên bộ dữ liệu: contact-lenses


Thông tin về kính áp tròng phù hợp với độ tuổi
 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 24
 Thuộc tín: 5
- age (tuổi): young(trẻ), pre-presbyopic (tiền lão), presbyopic (lão)
- spectacle prescription (hiển thị đơn thuốc): myope (cận thị), hypermetrope
(viễn thị)
- astigmatic (loạn thị): no (không), yes (có)
- tear production rate (tỉ lệ sản xuất nước mắt): reduced (giảm), normal (bth)
- contact-lenses: hard (nặng), soft (mềm), none (không)
 Thuật toán:

Phân lớp: có

Gom cụm: có
Kết hợp: có

4. Tên bộ dữ liệu: cpu

Thông tin dự đoán số liệu sử dụng phương pháp học tập dựa trên phiên bản với lựa
chọn độ dài mã hóa.

 Thông tin chi tiết về dữ liệu


 Số mẫu tin: 209
 Thuộc tín: 7
- MYCT
- MMIN
- MMAX
- CACH
- CHMIN
- CHMAX
- Class
 Thuật toán:

Phân lớp: có

Gom cụm: có
Kết hợp: không

5. Tên bộ dữ liệu: cpu.with.vendor


Thông tin dự đoán số bằng cách học dựa trên cá thể với lựa chọn độ dài mã hóa
 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 209
 Thuộc tín: 7
- vendor (nhà cung cấp)
- MYCT
- MMIN
- MMAX
- CACH
- CHMIN
- CHMAX
- class
 Thuật toán:

Phân lớp: không

Gom cụm: có

Kết hợp: không

6. Tên bộ dữ liệu: credit-g


Thông tin về dữ liệu của thẻ tín dụng Đức
 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 1000
 Thuộc tín: 21
- checking_status { '<0', '0<=X<200', '>=200', 'no checking'}
- duration
- credit_history { 'no credits/all paid', 'all paid', 'existing paid', 'delayed
previously', 'critical/other existing credit'}
- purpose { 'new car', 'used car', furniture/equipment, radio/tv, 'domestic
appliance', repairs, education, vacation, retraining, business, other}
- credit_amount
- savings_status { '<100', '100<=X<500', '500<=X<1000', '>=1000', 'no known
savings'}
- employment { unemployed, '<1', '1<=X<4', '4<=X<7', '>=7'}
- installment_commitment
- personal_status { 'male div/sep', 'female div/dep/mar', 'male single', 'male
mar/wid', 'female single'}
- other_parties { none, 'co applicant', guarantor}
- residence_since
- property_magnitude { 'real estate', 'life insurance', car, 'no known property'}
- age
- other_payment_plans { bank, stores, none}
- housing { rent, own, 'for free'}
- existing_credits
- job { 'unemp/unskilled non res', 'unskilled resident', skilled, 'high qualif/self
emp/mgmt'}
- num_dependents
- own_telephone { none, yes}
- foreign_worker { yes, no}
- class { good, bad}
 Thuật toán:

Phân lớp: có
Gom cụm: có

Kết hợp: không

7. Tên bộ dữ liệu: diabetes


Thông tin về bệnh tiểu đường của người da đỏ Pima
 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 768
 Thuộc tín: 9
- 'preg' : Số lần mang thai
- 'plas' : Nồng độ glucose huyết tương
- 'pres' : Huyết áp tâm trương
- 'skin' : Độ dày nếp gấp da cơ tam đầu
- 'insu' : Insulin huyết thanh
- 'mass' : Chỉ số khối cơ thể
- 'pedi' : Chức năng phả hệ bệnh đái tháo đường
- 'age' : tuổi
- 'class' { tested_negative (âm tính), tested_positive (dương tính)}
 Thuật toán:

Phân lớp: có

Gom cụm: có
Kết hợp: không

8. Tên bộ dữ liệu: glass

Cơ sở dữ liệu nhận dạng kính

 Thông tin chi tiết về dữ liệu:


 Số mẫu tin: 214
 Thuộc tính (Attibutes): 10

+ RI : chỉ số khúc xạ

+ Na

+ Mg

+ Al

+ Si

+K

+ Ca
+ Ba

+ Fe

+ Type of glass: loại

-- 1 building_windows_float_processed

-- 2 building_windows_non_float_processed

-- 3 vehicle_windows_float_processed

-- 4 vehicle_windows_non_float_processed (none in this database)

-- 5 containers

-- 6 tableware

-- 7 headlamps

 Thuật toán:

Phân lớp: có

Gom cụm: có
Kết hợp: không

9. Tên dữ liệu: hypothyroid

Hồ sơ bệnh tuyến giáp do Viện Garavan và J. Ross cung cấp

Quinlan, Viện New South Wales, Syndney, Australia.

 Thông tin chi tiết về dữ liệu:


 Mẫu tin: 3772
 Thuộc tính (Attibutes): 30
- 'age' : tuổi
- 'sex' : giới tính
- 'on thyroxine'
- 'query on thyroxine'
- 'on antithyroid medicati Enum
- 'sick'
- 'pregnant'
- 'thyroid surgery'
- 'I131 treatment'
- 'query hypothyroid'
- 'query hyperthyroid'
- 'lithium'
- 'goitre'
- 'tumor'
- 'hypopituitary'
- 'psych'
- 'TSH measured'
- 'TSH'
- 'T3 measured'
- 'T3'
- 'TT4 measured'
- 'TT4'
- 'T4U measured'
- 'T4U'
- 'FTI measured'
- 'FTI'
- 'TBG measured'
- 'TBG'
- 'referral source'
- 'Class'
 Thuật toán:

Phân lớp: có

Gom cụm: có
Phân lớp: không
10. Tên bộ dữ liệu: ionosphere

Cơ sở dữ liệu tầng điện ly của Đại học Johns Hopkins

 Thông tin chi tiết về dữ liệu:


 Mẫu tin: 351
 Thuộc tính (Attibutes): 35

a01

a02

a03 numeric

a04 numeric

a05 numeric

a06 numeric

a07 numeric

a08 numeric

a09 numeric

a10 numeric

a11 numeric

a12 numeric

a13 numeric

a14 numeric

a15 numeric

a16 numeric
a17 numeric

a18 numeric

a19 numeric

a20 numeric

a21 numeric

a22 numeric

a23 numeric

a24 numeric

a25 numeric

a26 numeric

a27 numeric

a28 numeric

a29 numeric

a30 numeric

a31 numeric

a32 numeric

a33 numeric

a34 numeric

class {b, g}

 Thuật toán:

Phân lớp: có
Gom cụm: có
Kết hợp: không

11. Tên bộ dữ liệu: iris.2D


 Thông tin chi tiết về dữ liệu
 Mẫu tin: 150
 Thuộc tính: 3
- petallength numeric
- petalwidth numeric
- class {Iris-setosa,Iris-versicolor,Iris-virginica}
 Thuật toán

Phân lớp: có

Gom cụm: có
Kết hợp: không

12. Tên bộ dữ liệu: iris

Cơ sở dữ liệu thực vật Iris

 Thông tin chi tiết về dữ liệu


 Mẫu tin: 57
 Thuộc tính: 5
- sepal length: chiều dài đài
- sepal width: chiều rộng đài
- petal length: chiều dài cánh
- petal width: chiều rộng cánh
- class: -- Iris Setosa -- Iris Versicolour -- Iris Virginica (thuộc lớp)
 Thuật toán
Phân lớp: có

Gom cụm: có

Kết hợp: không


13. Tên bộ dữ liệu: labor

Những giải pháp cuối cùng trong đàm phán lao động trong ngành công nghiệp Canada

 Thông tin chi tiết về dữ liệu:


 Mẫu tin: 57
 Thuộc tính: 17
- Dur: thời gian thỏa thuận
- wage-increase-first-year: tăng lương đầu tiên
- wage-increase-second-year: tăng lương lần thứ 2
- wage-increase-third-year: tăng lương lần 3
- cost-of-living-adjustment: điều chỉnh chi phí sinh hạot
- working-hours: giờ làm việc
- pension: lương hưu
- standby-pay: khoản trả chờ
- shift-differential: chênh lệc dịch chuyển
- education-allowance: trợ cấp giáo dục
- statutory-holidays: ngày lễ
- vacation: kỳ nghỉ
- longterm-disability-assistance: hỗ trợ khuyết tật dài hạn
- contribution-to-dental-plan: đóng góp cho kế hoạch nha khoa
- bereavement-assistance: hỗ trợ tang chế
- class: lớp
 Thuật toán

Phân lớp: có
Gom cụm: có

Kết hợp: không


14. Tên bộ dữ liệu: ReutersCorn-test
 Thông tin chi tiết về dữ liệu:
 Mẫu tin: 604
 Thuộc tính: 2
- Text
- Class-att
 Thuật toán

Phân lớp: không

Gom cụm: không

Kết hợp: không

15. Tên bộ dữ liệu: ReutersCorn-train


 Thông tin chi tiết về dữ liệu:
 Mẫu tin: 1554
 Thuộc tính: 2
- Text
- Class-att
 Thuật toán

Phân lớp: không

Gom cụm: không

Kết hợp: không

16. Tên bộ dữ liệu: ReutersGrain-test


 Thông tin chi tiết về dữ liệu:
 Mẫu tin: 604
 Thuộc tính: 2
- Text
- Class-att
 Thuật toán

Phân lớp: không

Gom cụm: không

Kết hợp: không

17. Tên bộ dữ liệu: ReutersGrain-train


 Thông tin chi tiết về dữ liệu:
 Mẫu tin: 1554
 Thuộc tính: 2
- Text
- Class-att
 Thuật toán

Phân lớp: không

Gom cụm: không

Kết hợp: không

18. Tên bộ dữ liệu: segment-challenge


- Đây là tập con của tập dữ liệu gốc, không được phân tầng (nghĩa là phân phối lớp
không cân bằng). Tập dữ liệu gốc có tập huấn luyện riêng (210 ví dụ) và tập kiểm
tra (2100 ví dụ).
 Thông tin chi tiết về dữ liệu
Tên: Dữ liệu phân đoạn hình ảnh
Nguồn: Nhóm Thị giác, Đại học Massachusetts
Ngày: Tháng 11 năm 1990
Số lượng ví dụ: 1500 (tập con, bản gốc có 2310)
Số lượng thuộc tính: 19
Lớp: 7 (loại vùng ảnh: mặt gạch, bầu trời, tán lá, cửa sổ, đường đi, cỏ)
- Mô tả dữ liệu
Dữ liệu đến từ 7 hình ảnh ngoài trời được phân đoạn thủ công, nghĩa là mỗi
pixel được gán nhãn lớp.
Mỗi ví dụ trong tập con này là một vùng nhỏ 3x3 từ hình ảnh gốc.

Mẫu tin:

Thuộc tính:

o Vị trí (tọa độ pixel trung tâm)


o Thuộc tính cạnh (mật độ đường và độ tương phản)
o Thuộc tính màu (trung bình và độ lệch chuẩn của giá trị đỏ, lục và
lam, và các thước đo màu khác được dẫn xuất)
1. Region-centroid-col: cột pixel trung tâm của vùng.

2. Region-centroid-row: hàng của pixel trung tâm của vùng.

3. Region-pixel-count: số pixel trong một vùng = 9.

4. short-line-dense-5: kết quả của thuật toán extractoin dòng đếm có bao nhiêu dòng
có độ dài 5 (bất kỳ hướng nào) với độ tương phản thấp, nhỏ hơn hoặc bằng 5, đi qua
vùng.

5. short-line-mật độ-2: giống như short-line-mật độ-5 nhưng tính số dòng độ tương
phản cao, lớn hơn 5.

6. vedge-mean: đo độ tương phản theo chiều ngang pixel liền kề trong vùng. Có 6, giá
trị trung bình và độ lệch chuẩn được đưa ra. Thuộc tính này được sử dụng như một máy
dò cạnh dọc.

7. vegde-sd: (xem 6)

8. hàng rào-trung bình: đo độ tương phản của liền kề theo chiều dọc điểm ảnh. Được
sử dụng để phát hiện đường ngang.
9. hedge-sd: (xem 8).

10. intensity-mean: trung bình trên vùng (R + G + B)/3

11. rawred-mean: giá trị trung bình trên vùng giá trị R.

12. rawblue-mean: giá trị trung bình trên vùng của giá trị B.

13. rawgreen-mean: giá trị trung bình trên vùng của giá trị G.

14. exred-mean: đo lượng màu đỏ dư: (2R - (G + B))

15. exblue-mean: đo phần xanh thừa: (2B - (G + R))

16. exgreen-mean: đo phần xanh dư thừa: (2G - (R + B))

17. value-mean: phép biến đổi phi tuyến 3-d của RGB. (Thuật toán có thể được tìm
thấy trong Foley và VanDam, Nguyên tắc cơ bản của đồ họa máy tính tương tác)

18. saturatoin-mean: (xem 17)

19. hue-mean: (xem 17)

 Thuật toán

Phân lớp: có
Gom cụm: có

Phân lớp: không

19. Tên bộ dữ liệu: segment-test

Đây là tập con của tập dữ liệu gốc, không được phân tầng (nghĩa là phân phối lớp không
cân bằng). Tập dữ liệu gốc có tập huấn luyện riêng (210 ví dụ) và tập kiểm tra (2100 ví
dụ).

Mẫu tin: 810

Thuộc tính: 19

o Dữ liệu đến từ 7 hình ảnh ngoài trời được phân đoạn thủ công, nghĩa là mỗi pixel
được gán nhãn lớp.
o Mỗi ví dụ trong tập con này là một vùng nhỏ 3x3 từ hình ảnh gốc.

o 19 thuộc tính mô tả các đặc điểm khác nhau của các vùng này, bao gồm:

o Vị trí (tọa độ pixel trung tâm)

o Thuộc tính cạnh (mật độ đường và độ tương phản)

o Thuộc tính màu (trung bình và độ lệch chuẩn của giá trị đỏ, lục và lam, và các
thước đo màu khác được dẫn xuất)

1. Region-centroid-col: cột pixel trung tâm của vùng.

2. Region-centroid-row: hàng của pixel trung tâm của vùng.

3. Region-pixel-count: số pixel trong một vùng = 9.

4. short-line-dense-5: kết quả của thuật toán extractoin dòng đếm có bao nhiêu dòng có
độ dài 5 (bất kỳ hướng nào) với độ tương phản thấp, nhỏ hơn hoặc bằng 5, đi qua vùng.

5. short-line-mật độ-2: giống như short-line-mật độ-5 nhưng tính số dòng độ tương phản
cao, lớn hơn 5.

6. vedge-mean: đo độ tương phản theo chiều ngang pixel liền kề trong vùng. Có 6, giá trị
trung bình và độ lệch chuẩn được đưa ra. Thuộc tính này được sử dụng như một máy dò
cạnh dọc.

7. vegde-sd: (xem 6)

8. hàng rào-trung bình: đo độ tương phản của liền kề theo chiều dọc điểm ảnh. Được sử
dụng để phát hiện đường ngang.

9. hedge-sd: (xem 8).

10. intensity-mean: trung bình trên vùng (R + G + B)/3

11. rawred-mean: giá trị trung bình trên vùng giá trị R.

12. rawblue-mean: giá trị trung bình trên vùng của giá trị B.
13. rawgreen-mean: giá trị trung bình trên vùng của giá trị G.

14. exred-mean: đo lượng màu đỏ dư: (2R - (G + B))

15. exblue-mean: đo phần xanh thừa: (2B - (G + R))

16. exgreen-mean: đo phần xanh dư thừa: (2G - (R + B))

17. value-mean: phép biến đổi phi tuyến 3-d của RGB. (Thuật toán có thể được tìm thấy
trong Foley và VanDam, Nguyên tắc cơ bản của đồ họa máy tính tương tác)

18. saturatoin-mean: (xem 17)

19. hue-mean: (xem 17)

 Thuật toán

Phân lớp: có

Gom cụm: có
Kết hợp: không

20. Tên bộ dữ liệu: soybean

Dữ liệu Phân đoạn Hình ảnh

 Thông tin chi tiết về dữ liệu :


Đây là một phần của dữ liệu phân đoạn (tức là một phần của tập dữ liệu đào tạo và
kiểm thử gốc được kết hợp). Mô tả dưới đây áp dụng cho tập dữ liệu gốc. Phần
con này có 810 trường hợp. Phân phối của các lớp KHÔNG được phân loại theo
lớp trong phần con này.
 Mẫu tin: 683
 Thuộc tính: 36
- date: april,may,june,july,august,september,october,?.
- plant-stand: normal,lt-normal,?.
- precip: lt-norm,norm,gt-norm,?.
- temp: lt-norm,norm,gt-norm,?.
- hail: yes,no,?.
- crop-hist: diff-lst-year,same-lst-yr,same-lst-two-yrs,same-lst-sev-yrs,?.
- area-damaged: scattered,low-areas,upper-areas,whole-field,?.
- severity: minor,pot-severe,severe,?.
- seed-tmt: none,fungicide,other,?.
- germination: '90-100%','80-89%','lt-80%',?.
- plant-growth:norm,abnorm,?.
- leaves: norm,abnorm.
- leafspots-halo: absent,yellow-halos,no-yellow-halos,?.
- leafspots-marg: w-s-marg,no-w-s-marg,dna,?.
- leafspot-size: lt-1/8,gt-1/8,dna,?.
- leaf-shread: absent,present,?.
- leaf-malf: absent,present,?.
- leaf-mild: absent,upper-surf,lower-surf,?.
- stem: norm,abnorm,?.
- lodging: yes,no,?.
- stem-cankers: absent,below-soil,above-soil,above-sec-nde,?.
- canker-lesion: dna,brown,dk-brown-blk,tan,?.
- fruiting-bodies: absent,present,?.
- external decay: absent,firm-and-dry,watery,?.
- mycelium: absent,present,?.
- int-discolor: none,brown,black,?.
- sclerotia: absent,present,?.
- fruit-pods: norm,diseased,few-present,dna,?.
- fruit spots: absent,colored,brown-w/blk-specks,distort,dna,?.
- seed: norm,abnorm,?.
- mold-growth:absent,present,?.
- seed-discolor: absent,present,?.
- seed-size: norm,lt-norm,?.
- shriveling: absent,present,?.
- roots: norm,rotted,galls-cysts,?.
- class {diaporthe-stem-canker, charcoal-rot, rhizoctonia-root-rot,
phytophthora-rot, brown-stem-rot, powdery-mildew, downy-mildew, brown-spot,
bacterial-blight, bacterial-pustule, purple-seed-stain, anthracnose, phyllosticta-
leaf-spot, alternarialeaf-spot, frog-eye-leaf-spot, diaporthe-pod-&-stem-blight,
cyst-nematode, 2-4-d-injury, herbicide-injury}
 Thuật toán

Phân lớp: có

Gom cụm: có
Kết hợp: có
21. Tên bộ dữ liệu: supermarket

Dữ liệu hàng hóa trong sưu thị

 Thông tin chi tiết về dữ liệu


 Mẫu tin: 4627
 Thuộc tính: 217
- 'department1'
- 'department2'
- 'department3'
- 'department4'
- 'department5'
- 'department6'
- 'department7'
- 'department8'
- 'department9'
- 'grocery misc'
- 'department11'
- 'baby needs'
- 'bread and cake'
- 'baking needs'
- 'coupons'
- 'juice-sat-cord-ms'
- 'tea'
- 'biscuits'
- 'canned fish-meat'
- 'canned fruit'
- 'canned vegetables'
- 'breakfast food'
- 'cigs-tobacco pkts'
- 'cigarette cartons'
- 'cleaners-polishers'
- 'coffee'
- 'sauces-gravy-pkle'
- 'confectionary'
- 'puddings-deserts'
- 'dishcloths-scour'
- 'deod-disinfectant'
- 'frozen foods'
- 'razor blades'
- 'fuels-garden aids'
- 'spices'
- 'jams-spreads'
- 'insecticides'
- 'pet foods'
- 'laundry needs'
- 'party snack foods'
- 'tissues-paper prd'
- 'wrapping'
- 'dried vegetables'
- 'pkt-canned soup'
- 'soft drinks'
- 'health food other'
- 'beverages hot'
- 'health&beauty misc'
- 'deodorants-soap'
- 'mens toiletries'
- 'medicines'
- 'haircare'
- 'dental needs'
- 'lotions-creams'
- 'sanitary pads'
- 'cough-cold-pain'
- 'department57'
- 'meat misc'
- 'cheese'
- 'chickens'
- 'milk-cream'
- 'cold-meats'
- 'deli gourmet'
- 'margarine'
- 'salads'
- 'small goods'
- 'dairy foods'
- 'fruit drinks'
- 'delicatessen misc'
- 'department70'
- 'beef'
- 'hogget'
- 'lamb'
- 'pet food'
- 'pork'
- 'poultry'
- 'veal'
- 'gourmet meat'
- 'department79'
- 'department80'
- 'department81'
- 'produce misc'
- 'fruit'
- 'plants'
- 'potatoes'
- 'vegetables'
- 'flowers'
- 'department88'
- 'department89'
- 'variety misc'
- 'brushware'
- 'electrical'
- 'haberdashery'
- 'kitchen'
- 'manchester'
- 'pantyhose'
- 'plasticware'
- 'department98'
- 'stationary'
- 'department100'
- 'department101'
- 'department102'
- 'prepared meals'
- 'preserving needs'
- 'condiments'
- 'cooking oils'
- 'department107'
- 'department108'
- 'department109'
- 'department110'
- 'department111'
- 'department112'
- 'department113'
- 'department114'
- 'health food bulk'
- 'department116'
- 'department117'
- 'department118'
- 'department119'
- 'department120'
- 'bake off products'
- 'department122'
- 'department123'
- 'department124'
- 'department125'
- 'department126'
- 'department127'
- 'department128'
- 'department129'
- 'department130'
- 'small goods2'
- 'offal'
- 'mutton'
- 'trim pork'
- 'trim lamb'
- 'imported cheese'
- 'department137'
- 'department138'
- 'department139'
- 'department140'
- 'department141'
- 'department142'
- 'department143'
- 'department144'
- 'department145'
- 'department146'
- 'department147'
- 'department148'
- 'department149'
- 'department150'
- 'department151'
- 'department152'
- 'department153'
- 'department154'
- 'department155'
- 'department156'
- 'department157'
- 'department158'
- 'department159'
- 'department160'
- 'department161'
- 'department162'
- 'department163'
- 'department164'
- 'department165'
- 'department166'
- 'department167'
- 'department168'
- 'department169'
- 'department170'
- 'department171'
- 'department172'
- 'department173'
- 'department174'
- 'department175'
- 'department176'
- 'department177'
- 'department178'
- 'department179'
- 'casks white wine'
- 'casks red wine'
- '750ml white nz'
- '750ml red nz'
- '750ml white imp'
- '750ml red imp'
- 'sparkling nz'
- 'sparkling imp'
- 'brew kits/accesry'
- 'department189'
- 'port and sherry'
- 'ctrled label wine'
- 'department192'
- 'department193'
- 'department194'
- 'department195'
- 'department196'
- 'department197'
- 'department198'
- 'department199'
- 'non host support'
- 'department201'
- 'department202'
- 'department203'
- 'department204'
- 'department205'
- 'department206'
- 'department207'
- 'department208'
- 'department209'
- 'department210'
- 'department211'
- 'department212'
- 'department213'
- 'department214'
- 'department215'
- 'department216'
- 'total' { low, high} % low < 100
 Thuật toán

Phân lớp: không

Gom cụm: có

Kết hợp: có
22. Tên bộ dữ liệu: unbalanced
 Thông tin chi tiết về bộ dữ liệu:
 Mẫu tin: 856
 Thuộc tính: 33
- WBN_GC_L_0.25
- WBN_GC_H_0.25
- WBN_GC_L_0.50
- WBN_GC_H_0.50
- WBN_GC_L_0.75
- WBN_GC_H_0.75
- WBN_GC_L_0.100
- WBN_GC_H_0.100
- WBN_EN_L_0.25
- WBN_ EN_H_0.25
- WBN_ EN_L_0.50
- WBN_ EN_H_0.50
- WBN_ EN_L_0.75
- WBN_ EN_H_0.75
- WBN_ EN_L_0.100
- WBN_ EN_H_0.100
- WBN_LP_L_0.25
- WBN_ LP _H_0.25
- WBN_ LP _L_0.50
- WBN_ LP _H_0.50
- WBN_ LP _L_0.75
- WBN_ LP _H_0.75
- WBN_ LP _L_0.100
- WBN_ LP _H_0.100
- XLogP
- PSA
- NumRot
- NumHBA
- NumHBD
- MW
- BBB
- BadGroup
- Outcome
 Thuật toán

Phân lớp: không

Gom cụm: có
Kết hợp: không

23. Tên bộ dữ liệu: vote

Cơ Sở Dữ Liệu Bỏ Phiếu Quốc Hội Hoa Kỳ Năm

 Thông tin chi tiết về dữ liệu :


Bộ dữ liệu này bao gồm phiếu bầu của từng Nghị sĩ Hạ viện Hoa Kỳ trên 16 phiếu quan
trọng được xác định bởi CQA. CQA liệt kê chín loại phiếu bầu khác nhau: bỏ phiếu cho,
ghép cặp cho, và thông báo cho (cả ba đơn giản hóa thành "yea"), bỏ phiếu chống, ghép
cặp chống, và thông báo chống (cả ba đơn giản hóa thành "nay"), bỏ phiếu hiện diện, bỏ
phiếu hiện diện để tránh xung đột lợi ích, và không bỏ phiếu hoặc không công bố tư duy
(cả ba đơn giản hóa thành một tư duy không rõ).

 Mẫu tin: 435


 Thuộc tín: 17
- Handicapped-infants
- Water-project-cost-resolution
- Physician-fee-freeze
- El-salvado-aid
- Religious-groups-in-schools
- Anti-satelite-test-ban
- Aid-to-nicaraguan-contras
- Mx-missile
- Immigration
- Synfuels-corporation-cutback
- Education-spending
- Superfund-right-to-sue
- Crime
- Duty-free-exports
- Export-administration-act-south-africa
- Class
 Thuật toán

Phân lớp: có
Gom cụm: có
Kết hợp: có

24. Tên bộ dữ liệu: weather.nominal


 Thông tin chi tiết về dữ liệu:
 Mẫu tin: 14
 Thuộc tính: 5
- Outlook
- Temperature
- Humidity
- Windy
- Play
 Thuật toán

Phân lớp: có

Gom cụm: có
Kết hợp: có

25. Tên bộ dữ liệu: weather.numeric


 Thông tin chi tiết về dữ liệu
 Số mẫu tin: 14
 Thuộc tín: 5
- Outlook
- Temperature
- Humidity
- Windy
- Play
 Thuật toán:

Phân lớp: có

Gom cụm: có
Kết hợp: không

You might also like