Các Bư C CH y RF

Uploaded by

Giáp Tài

0% found this document useful (0 votes)

9 views2 pages

Original Title

Các bước chạy RF

Copyright

Available Formats

DOCX, PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

0% found this document useful (0 votes)

9 views2 pages

Các Bư C CH y RF

Uploaded by

Giáp Tài

Copyright:

Available Formats

Download as DOCX, PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as docx, pdf, or txt

Jump to Page

You are on page 1of 2

Search inside document

Cách bước chạy của thuật toán Random Forest

Bước 1: Xóa các cột dữ liệu không cần thiết

Chúng tôi sẽ loại bỏ các cột / tính năng không cần thiết như ‘StartTime’, ‘SrcAddr’,
‘Sport’, ‘DstAddr’, ‘Dport’, ‘State’.
Bước 2: Giải quyết các cột có giá trị bị rỗng
Các giá trị rỗng tồn tại trong 2 cột / tính năng là ‘sTos’ và ‘dTos’. Cách đơn giản để
giải quyết vấn đề này là xoá chúng. Nhưng điều này có thể làm giảm hiệu suất của
mô hình máy học vì ngoài các giá trị rỗng ra nó còn chứa những giá trị khác vì
vậygiải pháp thay thế các giá trị rỗng bằng giá trị khác
Bước 3: Giải quyết các dữ liệu nhãn thô
Cột / tính năng ‘Label’ (cột lớp mục tiêu) trong bộ dữ liệu CTU-13 chứa các nhãn
được gán dưới dạng dữ liệu thô mô tả đặc tính của từng luồng tương ứng. Để các
mô hình máy học có thể sử dụng được cột / tính năng này thì chúng ta phải chuyển
đổi các giá trị thô trên thành các giá trị số nguyên.
Bước 4.1: Sử dụng kỹ thuật mã hoá Bước 4.2: Sử dụng kỹ thuật mã hoá One-
với giá trị số hot Encoding
Với cột / tính năng ‘Dir’ có chứa tổng Cụ thể là chúng tôi vẫn sử dụng mã hoá
cộng 7 biến giá trị phân loại nhưng do One-hot Encoding cho cột ‘Proto’ thành 4
2 biến ‘<->’ và ‘->’ nó sẽ được mã cột ‘Proto_udp’, ‘Proto_tcp’, ‘Proto_icmp’
hoá riêng là 1 cho giá trị ‘<->’ và 2 và ‘Proto_others’,cột ‘Dir’ thành 3 cột
cho giá trị ‘->’ còn lại được mã hoá là ‘Dir_ <->’, ‘Dir_ ->’ và ‘Dir_others’.Đều
0. Với cột / tính năng ‘Proto’ có chứa dựa vào bài báo [19] mà nhóm tham khảo
tổng cộng 15 biến giá trị phân loại được để thực hiện lại. Chi tiết thì chúng tôi
nhưng mã hóa riêng cho các giá trị đã trình bày ở phần 3.3.1.4 ở trường hợp 2.
‘udp’ = 17, giá trị ‘tcp’ = 6, giá trị
‘icmp’= 1 còn lại sẽ được mã hoá = 0
vì các giá trị trên chiếm tỷ lệ lớn
trong cột.
Bước 5.1: Cân bằng dữ liệu bằng với Bước 5.2: Cân bằng dữ liệu với NearMiss-
RandomUnderSampler. 1.
Lớp RandomUnderSampler từ thư Kỹ thuật NearMiss lấy mẫu dựa theo thuật
viện imblearn.under_sampling cho toán nearest neighbors và có
phép ta lấy mẫu ngẫu nhiên từ các lớp 3 phiên bản riêng. Ở đây chúng tôi sử dụng
đa số hay lớp thiểu số theo một chiến kỹ thuật NearMiss-1 để lấy mẫu
lược tuỳ chọn bất kì. với số lượng mẫu như trường hợp sử dụng
kỹ thuật RandomUnderSampler.
Bước 6: Sử dụng thuật toán Random Forest
Sử dụng lớp RandomForestClassifier(n_estimators=100, *,
criterion='gini', max_depth=None, min_samples_split=2,
min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto',
max_leaf_nodes=None, min_impurity_decrease=0.0, bootstrap=True,
oob_score=False, n_jobs=None, random_state=0, verbose=0,
warm_start=False, class_weight=None, ccp_alpha=0.0,
max_samples=None)
Công thức sử dụng trong thuật toán Random Forest với Gini Impurity
G=∑ p k ( 1− p k )2=1−∑ ( p k )2
¿

k
Trong đó:
G là giá trị Gini Impurity
k số các lớp có trong tập data
pk là xác suất mà một phần tử ngẫu nhiên thuộc lớp k
¿

Vận Trù Học
From Everand
Vận Trù Học
Phong Nguyễn Như
No ratings yet
BÀI TẬP 10.1 - PhamMinhLong - 19521796
Document5 pages
BÀI TẬP 10.1 - PhamMinhLong - 19521796
Long Phạm
No ratings yet
Giới thiệu khái quát về bộ lọc
Document14 pages
Giới thiệu khái quát về bộ lọc
Trần Linh
No ratings yet
Các Bư C CH y DT
Document2 pages
Các Bư C CH y DT
Giáp Tài
No ratings yet
1.cac Buoc Pre Processing Big
Document21 pages
1.cac Buoc Pre Processing Big
Vinh Pham
No ratings yet
1. Mô tả dữ liệu 1.1 Mô tả dữ liệu
Document10 pages
1. Mô tả dữ liệu 1.1 Mô tả dữ liệu
Khánh Linh
No ratings yet
Bai Thuc Hanh 2 (Updated)
Document6 pages
Bai Thuc Hanh 2 (Updated)
Cơ Đinh Văn
No ratings yet
Project Nhom5
Document15 pages
Project Nhom5
TRỌNG NGÔ PHÚ
No ratings yet
Machine Learning - Các PP Đánh Giá Classifier
Document13 pages
Machine Learning - Các PP Đánh Giá Classifier
Haodtt
No ratings yet
NG D NG Convolutional Neural Network Trong Bài Toán Phân Lo I NH
Document7 pages
NG D NG Convolutional Neural Network Trong Bài Toán Phân Lo I NH
learnit learnit
No ratings yet
2 Phuong Phap Thong Ke 1
Document71 pages
2 Phuong Phap Thong Ke 1
Nguyệt Minh
No ratings yet
BTLXLA nhóm 06 B20DCCN367 Trần Đình Khải
Document28 pages
BTLXLA nhóm 06 B20DCCN367 Trần Đình Khải
Khải Trần
No ratings yet
Project Nhom5
Document15 pages
Project Nhom5
Quan Trần
No ratings yet
TRẦN MINH THƯƠNG - N21DCVT101 - D21CQVT01-N - BUỔI 2
Document27 pages
TRẦN MINH THƯƠNG - N21DCVT101 - D21CQVT01-N - BUỔI 2
thuongtran20199
No ratings yet
Simple Code Demo Function
Document67 pages
Simple Code Demo Function
quanghieu.inamed
No ratings yet
Đề cương học máy
Document8 pages
Đề cương học máy
phamquyet12052002
No ratings yet
02 LePhuongAnh N19DCCN006 BT - TH.22102022
Document8 pages
02 LePhuongAnh N19DCCN006 BT - TH.22102022
TIKTOK HOT
No ratings yet
Report
Document14 pages
Report
Linh Trúc
No ratings yet
PL04 A BiaThuyetMinh
Document8 pages
PL04 A BiaThuyetMinh
Thiện Quý Hồ
No ratings yet
17. Giảm chiều dữ liệu - Deep AI KhanhBlog
Document2 pages
17. Giảm chiều dữ liệu - Deep AI KhanhBlog
phanthikieuvy0612
No ratings yet
RPL Collect
Document15 pages
RPL Collect
Mac Hieu
No ratings yet
Xây Dựng Chương Trình Gợi ý Phim Dựa Vào Tập Dữ Liệu Movie Len
Document9 pages
Xây Dựng Chương Trình Gợi ý Phim Dựa Vào Tập Dữ Liệu Movie Len
learnit learnit
No ratings yet
HW13 14
Document5 pages
HW13 14
Quang An
No ratings yet
Bài Tập Matlab Matlab Programming: Câu 1: Tính giá trị của biến y = >> exp (1) ^3/14+8*sqrt
Document22 pages
Bài Tập Matlab Matlab Programming: Câu 1: Tính giá trị của biến y = >> exp (1) ^3/14+8*sqrt
mitulam123trung
No ratings yet
Chapter 4.1-ID3
Document29 pages
Chapter 4.1-ID3
ha quan
No ratings yet
Thuyet Trinh
Document4 pages
Thuyet Trinh
Thọ Vũ
No ratings yet
04 - Nhận dạng đối tượng
Document15 pages
04 - Nhận dạng đối tượng
Tài Huỳnh Văn
No ratings yet
Lưu ý: Sinh viên làm bài trực tiếp trên đề, không được sử dụng tài liệu
Document8 pages
Lưu ý: Sinh viên làm bài trực tiếp trên đề, không được sử dụng tài liệu
Anh Quoc
No ratings yet
LẬP TRÌNH CSDL
Document6 pages
LẬP TRÌNH CSDL
Nguyên Công
No ratings yet
2 - Phuong Phap Thong Ke
Document69 pages
2 - Phuong Phap Thong Ke
Trương Minh Tiến
No ratings yet
Assignments 2021
Document3 pages
Assignments 2021
Trần Thị Tuyết Mai - B18DCVT278
No ratings yet
Phan4 - C14 - Thong Ke Va Tong Hop Du Lieu
Document31 pages
Phan4 - C14 - Thong Ke Va Tong Hop Du Lieu
Thành Tâm Trần Hoàng
No ratings yet
Phan4 - C14 - Thong Ke Va Tong Hop Du Lieu
Document22 pages
Phan4 - C14 - Thong Ke Va Tong Hop Du Lieu
phamthikimthuongb1
No ratings yet
2 - Phuong Phap Thong Ke
Document66 pages
2 - Phuong Phap Thong Ke
Chúc Phương
No ratings yet
Giải thuật di truyền GA
Document5 pages
Giải thuật di truyền GA
Quang Thien Bùi
No ratings yet
Machine Learning
Document29 pages
Machine Learning
Nguyễn Hoàng
No ratings yet
2 - Phuong Phap Thong Ke
Document69 pages
2 - Phuong Phap Thong Ke
nguyengiabaomtp4444
No ratings yet
KHDL 2 Orange
Document15 pages
KHDL 2 Orange
Vương Lam
No ratings yet
668 - Fulltext - 4.ĐTVT - Phuoc - Vuong Quang Phuoc
Document12 pages
668 - Fulltext - 4.ĐTVT - Phuoc - Vuong Quang Phuoc
tung pham
No ratings yet
Hoi Quy Tuyen Tinh Da Bien
Document9 pages
Hoi Quy Tuyen Tinh Da Bien
baothai1905
No ratings yet
Khdl Phần Lý Thuyết
Document21 pages
Khdl Phần Lý Thuyết
tinhle.31221023009
No ratings yet
Powpoint
Document29 pages
Powpoint
EDM NCS
No ratings yet
Analog s7 300
Document10 pages
Analog s7 300
Nghinh Phong Vũ
No ratings yet
2023.Bài tập Xử lý ảnh - GỬI SV
Document5 pages
2023.Bài tập Xử lý ảnh - GỬI SV
Nhóm 2-Nguyễn Đình Trung
No ratings yet
Bai 9
Document5 pages
Bai 9
Vu Nguyen Manh Hung
No ratings yet
Bai Thuc Hanh PDF
Document3 pages
Bai Thuc Hanh PDF
Thanh Mon
No ratings yet
Bai Thuc Hanh 4
Document6 pages
Bai Thuc Hanh 4
Tong Huynh
No ratings yet
Bài Kiểm Tra Matlab 15 - 11
Document15 pages
Bài Kiểm Tra Matlab 15 - 11
nguyenthanhngoc31102003
No ratings yet
Baitap 20521658
Document5 pages
Baitap 20521658
Nghĩa Trương Đăng
No ratings yet
Hihiajdsjag Tex
Document5 pages
Hihiajdsjag Tex
Lê Thư
No ratings yet
Canny Edge Detector
Document35 pages
Canny Edge Detector
Ngọc Anh Nguyễn Thị
No ratings yet
Co So Lap Trinh
Document53 pages
Co So Lap Trinh
Huy Tâm Ng
No ratings yet
Nhóm Hi
Document31 pages
Nhóm Hi
hoangcuongimtt
No ratings yet
MLP301x 1
Document8 pages
MLP301x 1
đức ngọc trần
No ratings yet
Khoá học deep learning
Document78 pages
Khoá học deep learning
Sơn Vũ
No ratings yet
Chuong4 NeuralNetwork
Document50 pages
Chuong4 NeuralNetwork
nguyen nam
No ratings yet
Bao Cao Thuc Hanh 2
Document18 pages
Bao Cao Thuc Hanh 2
Vũ An
No ratings yet
How To Use Iterative Imputation
Document3 pages
How To Use Iterative Imputation
Vĩnh Hưng
No ratings yet
Huong Dan Hinh Thuc Lam Bai Tap Ket Thuc Hoc Phan hk2 Nam Hoc 2020 2021
Document16 pages
Huong Dan Hinh Thuc Lam Bai Tap Ket Thuc Hoc Phan hk2 Nam Hoc 2020 2021
Giáp Tài
No ratings yet
Cách lấy nhiễm
Document4 pages
Cách lấy nhiễm
Giáp Tài
No ratings yet
Các Bư C CH y DT
Document2 pages
Các Bư C CH y DT
Giáp Tài
No ratings yet
Văn bản của bài báo-25-1-10-20200715
Document7 pages
Văn bản của bài báo-25-1-10-20200715
Giáp Tài
No ratings yet