CRM - Chapter 6 - SV

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 12

07/04/2024

Chương 6: Phân tích dữ liệu và


khai phá dữ liệu

1
07/04/2024

Mục tiêu môn học


• Những trải nghiệm phân tích khách hàng?
• Phân trình quy trình phân tích dữ liệu khách hàng
• Dữ liệu internet và quá trình phân tích
• Kỹ thuật khai phá dữ liệu

I. Những trải nghiệm với phân tích dữ liệu


1. Nhiều tổ chức tập trung vào việc triển khai hệ thống mà không
quan tâm đến chất lượng của phân tích dữ liệu.
2. Việc phân tích dữ liệu đòi hỏi nhiều hơn là chỉ dự đoán phản hồi
từ các chiến dịch tiếp thị cá nhân
3. Không phải lúc nào cũng dễ dàng và đòi hỏi quản lý dữ liệu cẩn
thận và chuẩn bị phân tích kỹ lưỡng

2
07/04/2024

II. Quy trình phân tích dữ liệu khách hàng

1. Xác định vấn đề


a. việc đặt ra câu hỏi nghiên cứu

Câu hỏi nghiên Mục tiêu


cứu
1. Phân khúc - Phân chia cơ sở dữ liệu khách hàng thành các nhóm
và lựa chọn khách hàng đồng nhất
- Lập danh sách thông tin tên–địa chỉ–thành phố cho
các cá nhân và tổ chức cần tiếp cận để thực hiện chiến
dịch tiếp thị
2. Phân tích a. Giữ chân khách hàng
giữ chân - Phân tích tỷ lệ giữ chân, tập trung vào việc xác định
khách hàng sớm những khách hàng có khả năng chấm dứt mối
quan hệ cao hơn
b. Phát triển mối quan hệ
Phân tích bán kèm, hướng tới việc cung cấp (các) sản
phẩm từ danh mục sản phẩm mà khách hàng chưa mua
hàng

3
07/04/2024

Câu hỏi phân Bản chất


tích
Phân tích và - Phân tích hiểu biết bán hàng sâu với mục tiêu là tăng
mua lại của doanh số bán hàng ở một danh mục sản phẩm nhất
khách hàng định
- Phân tích bán thêm theo đó nhiều sản phẩm cao cấp
hơn được bán
Phân tích để - Phân tích phản hồi của các chiến dịch tiếp thị, cơ sở
xác định tính dữ liệu/danh sách: chiến dịch hoặc cơ sở dữ liệu/danh
hiệu quả của sách nào đạt điểm cao nhất?
việc tiếp cận
khách hàng

2. Chọn mẫu:
Việc lấy mẫu ngẫu nhiên từ cơ sở dữ liệu trước khi phân tích
giúp đảm bảo tính đại diện của dữ liệu cho toàn bộ tập dữ liệu

3. Làm sạch dữ liệu:


là quá trình loại bỏ dữ liệu không hợp lệ, như dữ liệu sai lệch hoặc
bản sao, để đảm bảo tính chính xác và nhất quán của dữ liệu

4. Phân tích đặc điểm cụ thể: nhấn mạnh sự quan trọng của việc
xác định các phương pháp đo lường thích hợp cho từng tình huống
cụ thể
5. Lựa chọn biến quan trọng trong phân tích:
việc lựa chọn các biến quan trọng là một bước quan trọng để xây dựng
mô hình phân loại hoặc dự đoán chính xác.
Điều này có thể bao gồm chọn các biến có khả năng phân biệt tốt nhất
giữa các nhóm hoặc biến có khả năng dự đoán mạnh mẽ nhất trong mô
hình xác suất. Vd: Độ tuổi, giới tính, hoặc vị trí địa lý có thể ảnh
hưởng đến hành vi mua sắm

4
07/04/2024

6. Tách dữ liệu:


Tách một cơ sở dữ liệu phân tích thành hai phần, tức là một tập
huấn luyện và một tập xác thực, là một phương pháp phổ biến để
phát triển và kiểm tra mô hình dự đoán
a. Tập Huấn Luyện (Training Set): Đây là một phần của dữ
liệu được sử dụng để huấn luyện mô hình dự đoán. Trong quá
trình này, mô hình học từ dữ liệu để tìm ra mối quan hệ giữa
các biến đầu vào và biến mục tiêu
b.Tập Xác Thực (Validation Set): Được sử dụng để kiểm tra
tính đáng tin cậy của mô hình đã được huấn luyện.
c.Kiểm Tra Mô Hình: Dữ liệu từ tập xác thực được sử dụng
để đánh giá hiệu suất của mô hình

7. Chọn kỹ thuật phân tích:


Chọn kỹ thuật thống kê và khai phá dữ liệu (data-mining techniques)
a. Các kỹ thuật thống kê thường được ưa chuộng hơn trong các tình
huống mà các điều kiện nhất định có thể được đáp ứng

VD: Một công ty bán lẻ muốn hiểu hơn về mối quan hệ giữa các
chiến lược tiếp thị và tỷ lệ chuyển đổi khách hàng. Họ sử dụng phân
tích hồi quy tuyến tính để đánh giá mức độ ảnh hưởng của các yếu tố
như quảng cáo truyền thông, chiết khấu và chương trình khuyến
mãi đến việc khách hàng hoàn thành giao dịch. Kỹ thuật thống kê
này giúp họ xác định được những yếu tố quan trọng nhất ảnh hưởng
đến việc chuyển đổi khách hàng và từ đó tối ưu hóa chiến lược tiếp
thị của mình.

5
07/04/2024

Khuyết điểm: kỹ thuật thống kê thường dựa vào các giả định về
phân phối dữ liệu và mối quan hệ giữa các biến. Nếu các giả định
này không được đáp ứng, kết quả của phân tích có thể không chính
xác
Ví dụ, khi sử dụng phân tích t-Test, giả định về phân phối chuẩn có
thể không đúng nếu dữ liệu không tuân theo phân phối chuẩn, dẫn
đến kết quả không chính xác.

b. Khai phá dữ liệu


Các kỹ thuật khai phá dữ liệu có thể có giá trị trong các tình huống
mà không biết trước các mối quan hệ tồn tại giữa các biến hoặc khi
các mối quan hệ phi tuyến tồn tại
VD: Một ngân hàng muốn tăng cường việc phát hiện gian lận
trong giao dịch của khách hàng. Họ sử dụng kỹ thuật học máy và
khai phá dữ liệu để phân tích hành vi giao dịch của các tài khoản
và xác định các mẫu không bình thường có thể là dấu hiệu của
hoạt động gian lận.

Nguy cơ overfitting: Khi áp dụng các thuật toán phức tạp và khai
phá dữ liệu mà không có sự kiểm soát, có nguy cơ mô hình hoặc
mẫu phát hiện được có thể không tổng quát hoá được cho dữ liệu
mới, gây ra hiện tượng overfitting.

6
07/04/2024

Một ngân hàng muốn sử dụng học máy để xây dựng một mô hình
dự đoán rủi ro tín dụng, nhằm đánh giá khả năng một khách hàng
không thanh toán nợ. Họ thu thập dữ liệu từ lịch sử giao dịch, lịch
sử tín dụng, thu nhập và nhiều biến khác để huấn luyện mô hình.
Tuy nhiên, trong quá trình huấn luyện mô hình, ngân hàng sử
dụng một thuật toán học máy phức tạp và điều chỉnh các siêu
tham số mô hình một cách không kiểm soát. Kết quả là mô hình
được huấn luyện có thể hoạt động rất tốt trên tập dữ liệu huấn
luyện, nhưng không tổng quát hóa được cho dữ liệu mới. Mô hình
này đã bị overfitting vào dữ liệu huấn luyện, tức là nó đã học được
các chi tiết và nhiễu trong dữ liệu huấn luyện thay vì học được các
mẫu tổng quát và quy luật phổ biến

8. Trình bày các báo cáo

Tạo ra báo cáo và trực quan hóa kết quả được coi là đáng giá, bởi
vì nó là cách hiệu quả để truyền đạt thông tin từ dữ liệu đã phân
tích cho những người khác, bao gồm quản lý và các bên liên quan
khá
Yêu cầu trực quan hóa kết quả: Đoạn văn gợi ý rằng việc trực
quan hóa dữ liệu là bước quan trọng để làm cho thông tin dễ hiểu
hơn. Điều này bao gồm việc tạo ra biểu đồ, biểu đồ và hình ảnh
khác để minh họa các phân tích và kết quả

7
07/04/2024

III. Dữ liệu internet và quá trình phân tích


Việc sử dụng dữ liệu hành vi trực tuyến không chỉ giúp cải thiện
trang web mà còn có thể tạo ra những hiểu biết quan trọng về
khách hàng và mở ra những cơ hội mới cho tổ chức

1. Khai thác cấu trúc web:


•Mô tả: Khai thác cấu trúc web nhằm xác định cấu trúc tổ chức
của các trang web và mối quan hệ giữa chúng. Cấu trúc này
thường được thể hiện dưới dạng một biểu đồ hoặc một mạng lưới
các trang web và liên kết giữa chúng.

•Ví dụ minh họa: Một doanh nghiệp bán lẻ có thể sử dụng khai
thác cấu trúc web để hiểu cách các trang sản phẩm, trang
thông tin và trang thanh toán được kết nối với nhau.
•Mục đích của họ có thể là để tối ưu hóa cấu trúc trang web, cải
thiện trải nghiệm người dùng và tăng cường hiệu suất bán hàng
trực tuyến.

III. Dữ liệu internet và quá trình phân tích

2. Khai thác sử dụng web:

•Mô tả: Khai thác sử dụng web tập trung vào việc phân tích hành
vi của người dùng khi họ tương tác trên trang web. Điều này bao
gồm việc thu thập dữ liệu về lịch sử truy cập, thời gian trên
trang, lối đi click qua trang và các hành động khác của người
dùng.

•Ví dụ minh họa: Một trang web bán hàng có thể sử dụng khai
thác sử dụng web để xác định tỷ lệ chuyển đổi từ trang xem sản
phẩm sang trang thanh toán, thời gian mà người dùng dành trên
trang thanh toán và các sản phẩm mà họ thường xem trước khi
mua hàng.

8
07/04/2024

III. Dữ liệu internet và quá trình phân tích

3. Khai thác nội dung web:

•Mô tả: Khai thác nội dung web nhằm tìm kiếm và phân tích nội
dung hữu ích trên internet. Các công cụ tìm kiếm được sử dụng
để quét và thu thập dữ liệu từ các trang web, blog, diễn đàn và
các nguồn thông tin khác.

•Ví dụ minh họa: Một công ty sửa chữa điện tử có thể sử dụng
khai thác nội dung web để tìm kiếm các bài viết hướng dẫn sửa
chữa từ các diễn đàn công nghệ. Họ có thể phân tích các ý kiến
và phản hồi từ cộng đồng để cải thiện dịch vụ của mình và tạo ra
nội dung hữu ích cho trang web của họ.

IV. Kỹ thuật khai phá dữ liệu

1. Mạng thần kinh:


Mạng thần kinh nhân tạo cố gắng mô phỏng các hệ thống thần
kinh sinh học. Các hệ thống sinh học này bao gồm các tế bào
thần kinh được liên kết đơn giản với nhau. Nếu một tế bào thần
kinh nhận được một số kích thích và tổng của những kích thích
này vượt quá một ngưỡng nhất định, tế bào thần kinh sẽ phát đi
một kích thích đến các tế bào thần kinh kết nối. Các tế bào thần
kinh này sau đó sẽ cung cấp đầu vào cho các tế bào thần kinh
khác để tạo ra một mạng lưới bao gồm nhiều lớp tế bào thần kinh
được kết nối với nhau.

Ví dụ, nếu một người đặt tay lên một lò nóng, anh ta sẽ nhận
được nhiều kích thích vượt quá các ngưỡng này và gửi kích thích
đến các tế bào thần kinh liên quan. Sự đau đớn được cảm nhận,
tay được rút ra, một tiếng kêu đau được bày tỏ, và cứ thế.

9
07/04/2024

Giả sử một công ty dịch vụ tài chính sử dụng mạng thần kinh
nhân tạo để cải thiện quản lý quan hệ khách hàng của họ.

1.Thu thập dữ liệu:


- Hệ thống CRM tự động thu thập dữ liệu từ nhiều nguồn khác
nhau như email, cuộc gọi điện thoại, trang web và mạng xã hội.
- Dữ liệu bao gồm thông tin về lịch sử giao dịch, hành vi trực
tuyến, phản hồi từ khách hàng và thông tin cá nhân.

2. Tiền xử lý dữ liệu:


- Dữ liệu được tiền xử lý để loại bỏ dữ liệu không chính xác hoặc
thiếu sót và chuẩn hóa dữ liệu từ các nguồn khác nhau.
- Các biến cốt lõi như mẫu chi tiêu, tần suất giao dịch và sở thích
sản phẩm được xác định.

3. Huấn luyện mạng thần kinh:


- Một mạng thần kinh nhân tạo được lập trình và huấn luyện sử dụng
dữ liệu đã được tiền xử lý.
- Mạng thần kinh được huấn luyện để dự đoán hành vi mua hàng của
từng khách hàng cụ thể dựa trên các biến quan trọng.
4. Phát triển các mô hình dự đoán:
- Mạng thần kinh nhân tạo tạo ra các mô hình dự đoán về hành vi mua
hàng của khách hàng.
- Các mô hình dự đoán cung cấp thông tin về sản phẩm hoặc dịch vụ
mà khách hàng có thể quan tâm.
5. Tạo ra đề xuất cá nhân hóa:
- Khi khách hàng truy cập vào trang web hoặc ứng dụng di động của
công ty, mạng thần kinh nhân tạo tự động tạo ra các đề xuất cá nhân
hóa dựa trên lịch sử giao dịch và hành vi trực tuyến của họ.
- Các đề xuất cá nhân hóa có thể gợi ý các sản phẩm hoặc dịch vụ mà
khách hàng có thể quan tâm.

10
07/04/2024

6. Dự đoán nguy cơ rời bỏ và giữ chân:


1. Mạng thần kinh nhân tạo cũng được sử dụng để dự đoán nguy
cơ khách hàng rời bỏ (churn) và đề xuất các biện pháp giữ chân
phù hợp.
2. Bằng cách phân tích lịch sử giao dịch và các mẫu hành vi,
mạng thần kinh nhận diện các khách hàng có nguy cơ rời bỏ và
gợi ý các chiến lược giữ chân.
7. Tối ưu hóa chiến lược tiếp thị và dịch vụ khách hàng:
1. Dựa trên các thông tin từ mạng thần kinh nhân tạo, công ty tối
ưu hóa chiến lược tiếp thị và dịch vụ khách hàng để tăng cường
tương tác và trung thành của khách hàng.

IV. Kỹ thuật khai phá dữ liệu

2. Quy tắc kết hợp :


quy tắc kết hợp để phân tích mối quan hệ giữa các đặc điểm của
một nhóm cá nhân và hành vi của họ -> để tìm ra các mẫu quan
hệ giữa các biến trong dữ liệu

VD: (BT 5 phút)


Bạn là nhà bán lẻ, phát hiện điều này ảnh hưởng đến tần suất
mua sắm của khách hàng

Biến đầu tiên là "số lượng thành viên trong một hộ gia đình," là
một biến rời rạc với các giá trị như 1, 2, 3, 4, v.v.
Biến thứ hai là "khoảng cách từ cửa hàng," được đo bằng thời
gian đi bộ.
Biến thứ ba là "ngày trong tuần,"

11
07/04/2024

IV. Kỹ thuật khai phá dữ liệu

2. Cây quyết định:


Một công cụ phân tích dữ liệu phổ biến được sử dụng trong nhiều
lĩnh vực của tiếp thị và cũng có thể được áp dụng để phân tích dữ
liệu trên web. Các ưu điểm của cây quyết định bao gồm khả năng
sinh ra các quy tắc kinh doanh có thể được hiểu, khả năng chia cơ
sở dữ liệu thành các loại khác nhau và khả năng dự đoán một sự
kiện dựa trên các đặc điểm dữ liệu

12

You might also like