Professional Documents
Culture Documents
CRM - Chapter 6 - SV
CRM - Chapter 6 - SV
CRM - Chapter 6 - SV
1
07/04/2024
2
07/04/2024
3
07/04/2024
2. Chọn mẫu:
Việc lấy mẫu ngẫu nhiên từ cơ sở dữ liệu trước khi phân tích
giúp đảm bảo tính đại diện của dữ liệu cho toàn bộ tập dữ liệu
4. Phân tích đặc điểm cụ thể: nhấn mạnh sự quan trọng của việc
xác định các phương pháp đo lường thích hợp cho từng tình huống
cụ thể
5. Lựa chọn biến quan trọng trong phân tích:
việc lựa chọn các biến quan trọng là một bước quan trọng để xây dựng
mô hình phân loại hoặc dự đoán chính xác.
Điều này có thể bao gồm chọn các biến có khả năng phân biệt tốt nhất
giữa các nhóm hoặc biến có khả năng dự đoán mạnh mẽ nhất trong mô
hình xác suất. Vd: Độ tuổi, giới tính, hoặc vị trí địa lý có thể ảnh
hưởng đến hành vi mua sắm
4
07/04/2024
VD: Một công ty bán lẻ muốn hiểu hơn về mối quan hệ giữa các
chiến lược tiếp thị và tỷ lệ chuyển đổi khách hàng. Họ sử dụng phân
tích hồi quy tuyến tính để đánh giá mức độ ảnh hưởng của các yếu tố
như quảng cáo truyền thông, chiết khấu và chương trình khuyến
mãi đến việc khách hàng hoàn thành giao dịch. Kỹ thuật thống kê
này giúp họ xác định được những yếu tố quan trọng nhất ảnh hưởng
đến việc chuyển đổi khách hàng và từ đó tối ưu hóa chiến lược tiếp
thị của mình.
5
07/04/2024
Khuyết điểm: kỹ thuật thống kê thường dựa vào các giả định về
phân phối dữ liệu và mối quan hệ giữa các biến. Nếu các giả định
này không được đáp ứng, kết quả của phân tích có thể không chính
xác
Ví dụ, khi sử dụng phân tích t-Test, giả định về phân phối chuẩn có
thể không đúng nếu dữ liệu không tuân theo phân phối chuẩn, dẫn
đến kết quả không chính xác.
Nguy cơ overfitting: Khi áp dụng các thuật toán phức tạp và khai
phá dữ liệu mà không có sự kiểm soát, có nguy cơ mô hình hoặc
mẫu phát hiện được có thể không tổng quát hoá được cho dữ liệu
mới, gây ra hiện tượng overfitting.
6
07/04/2024
Một ngân hàng muốn sử dụng học máy để xây dựng một mô hình
dự đoán rủi ro tín dụng, nhằm đánh giá khả năng một khách hàng
không thanh toán nợ. Họ thu thập dữ liệu từ lịch sử giao dịch, lịch
sử tín dụng, thu nhập và nhiều biến khác để huấn luyện mô hình.
Tuy nhiên, trong quá trình huấn luyện mô hình, ngân hàng sử
dụng một thuật toán học máy phức tạp và điều chỉnh các siêu
tham số mô hình một cách không kiểm soát. Kết quả là mô hình
được huấn luyện có thể hoạt động rất tốt trên tập dữ liệu huấn
luyện, nhưng không tổng quát hóa được cho dữ liệu mới. Mô hình
này đã bị overfitting vào dữ liệu huấn luyện, tức là nó đã học được
các chi tiết và nhiễu trong dữ liệu huấn luyện thay vì học được các
mẫu tổng quát và quy luật phổ biến
Tạo ra báo cáo và trực quan hóa kết quả được coi là đáng giá, bởi
vì nó là cách hiệu quả để truyền đạt thông tin từ dữ liệu đã phân
tích cho những người khác, bao gồm quản lý và các bên liên quan
khá
Yêu cầu trực quan hóa kết quả: Đoạn văn gợi ý rằng việc trực
quan hóa dữ liệu là bước quan trọng để làm cho thông tin dễ hiểu
hơn. Điều này bao gồm việc tạo ra biểu đồ, biểu đồ và hình ảnh
khác để minh họa các phân tích và kết quả
7
07/04/2024
•Ví dụ minh họa: Một doanh nghiệp bán lẻ có thể sử dụng khai
thác cấu trúc web để hiểu cách các trang sản phẩm, trang
thông tin và trang thanh toán được kết nối với nhau.
•Mục đích của họ có thể là để tối ưu hóa cấu trúc trang web, cải
thiện trải nghiệm người dùng và tăng cường hiệu suất bán hàng
trực tuyến.
•Mô tả: Khai thác sử dụng web tập trung vào việc phân tích hành
vi của người dùng khi họ tương tác trên trang web. Điều này bao
gồm việc thu thập dữ liệu về lịch sử truy cập, thời gian trên
trang, lối đi click qua trang và các hành động khác của người
dùng.
•Ví dụ minh họa: Một trang web bán hàng có thể sử dụng khai
thác sử dụng web để xác định tỷ lệ chuyển đổi từ trang xem sản
phẩm sang trang thanh toán, thời gian mà người dùng dành trên
trang thanh toán và các sản phẩm mà họ thường xem trước khi
mua hàng.
8
07/04/2024
•Mô tả: Khai thác nội dung web nhằm tìm kiếm và phân tích nội
dung hữu ích trên internet. Các công cụ tìm kiếm được sử dụng
để quét và thu thập dữ liệu từ các trang web, blog, diễn đàn và
các nguồn thông tin khác.
•Ví dụ minh họa: Một công ty sửa chữa điện tử có thể sử dụng
khai thác nội dung web để tìm kiếm các bài viết hướng dẫn sửa
chữa từ các diễn đàn công nghệ. Họ có thể phân tích các ý kiến
và phản hồi từ cộng đồng để cải thiện dịch vụ của mình và tạo ra
nội dung hữu ích cho trang web của họ.
Ví dụ, nếu một người đặt tay lên một lò nóng, anh ta sẽ nhận
được nhiều kích thích vượt quá các ngưỡng này và gửi kích thích
đến các tế bào thần kinh liên quan. Sự đau đớn được cảm nhận,
tay được rút ra, một tiếng kêu đau được bày tỏ, và cứ thế.
9
07/04/2024
Giả sử một công ty dịch vụ tài chính sử dụng mạng thần kinh
nhân tạo để cải thiện quản lý quan hệ khách hàng của họ.
10
07/04/2024
Biến đầu tiên là "số lượng thành viên trong một hộ gia đình," là
một biến rời rạc với các giá trị như 1, 2, 3, 4, v.v.
Biến thứ hai là "khoảng cách từ cửa hàng," được đo bằng thời
gian đi bộ.
Biến thứ ba là "ngày trong tuần,"
11
07/04/2024
12