Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 70

Business Intelligence Systems

Ths. Bùi Xuân Huy


Khoa CNTT kinh doanh – ĐH Kinh tế TPHCM
huybx@ueh.edu.vn

2020
Tài liệu tham khảo
Kroenke D. & Boyle R.-J., Using MIS, 9th Edition, Pearson, 2017.

Slide BIS, Dr. Nguyễn An Tế, 2019

Havey M., Essential Business Process Modeling, O’Reilly Media, 2005.

Jeston J. & Nelis J., Business Process Management: Practical Guidelines to Successful
Implementations, 3rd Edition, Routledge, 2013.

Monk E. F. & Wagner B. J., Concepts in Enterprise Resource Planning, 4th Edition,
Course Technology, 2012.

Turban E., Sharda R., Delen D. & King D., Business Intelligence: A Managerial
Approach, 3rd Editon. Prentice Hall, 2013.

Vercellis C., Business Intelligence: Data Mining and Optimization for Decision Making,
5th Edition, John Wiley & Sons, 2009.

2
06/25/2024 HTTTQL Business Intelligence Systems
Mục tiêu (tt.)

 Hiểu khái niệm trí tuệ kinh doanh (Business Intelligence – BI)
kinh doanh thông minh, …

 Hiểu vai trò của BIS

 Hiểu các thành phần và các chức năng của BIS

3
06/25/2024 HTTTQL Business Intelligence Systems
Nội dung

1. Trí tuệ kinh doanh (Business Intelligence – BI)

2. Business Intelligence System (BIS)

3. Triển khai BIS

4
06/25/2024 HTTTQL Business Intelligence Systems
1.2 Trí tuệ kinh doanh

Nguồn: http://bizcubic.com/tag/business-intelligence-tools/
5
06/25/2024 HTTTQL Business Intelligence Systems
Nội dung

1. Trí tuệ kinh doanh (Business Intelligence – BI)

2. Business Intelligence System (BIS)


● Các chức năng và đặc trưng

3. Triển khai BIS

6
06/25/2024 HTTTQL Business Intelligence Systems
2.1 Các chức năng và đặc tính

 Quan niệm cũ (BIS 1.0) : khai thác dữ liệu một cách “thông
minh” trong việc hỗ trợ ra quyết định
System: chỉ là hệ thống máy tính ?

Khai thác dữ liệu

Dữ liệu dưới dạng bảng biểu,

Phân tích dữ liệu ( dạng thô)


Biểu hiện trạng thái dữ liệu

Nguồn: TalkWise Consulting

7
06/25/2024 HTTTQL Business Intelligence Systems
2.1 Các chức năng và đặc tính (tt.)

 Quan niệm cũ (BIS 1.0) : dữ liệu “thông minh”  hỗ trợ ra


quyết định

Nguồn: http://etl-tools.info/en/bi/datawarehouse_concepts.htm

8
06/25/2024 HTTTQL Business Intelligence Systems
2.1 Các chức năng và đặc tính (tt.)
 Đặc trưng của BIS 2.0: các chức năng hướng QTKD, hướng
dịch vụ
● dữ liệu đa dạng: text, multimedia, yếu tố thời gian/không gian
NG CÓ ● truy cập thông tin: real time, mobile, ubiquitous.
● phân tích chuyên sâu
● dự đoán, cảnh báo
● giao diện đa dạng, phong phú; thể hiện thông tin một cách linh
hoạt, hiệu quả

9
06/25/2024 HTTTQL Business Intelligence Systems
Digital Transformation

Thế giới các thực Không gian số


thể

Digital Transformation

10
2.1 Các chức năng và đặc tính (tt.)

● Faster: tự động hóa


● Better: có tổ chức (dễ kiểm soát, đánh giá)
● Smarter: phân tích, dự đoán, định hướng

11
06/25/2024 HTTTQL Business Intelligence Systems
Nội dung

1. Trí tuệ kinh doanh (Business Intelligence – BI)

2. Business Intelligence System (BIS)

3. Triển khai BIS


● Ứng dụng công nghệ
● OLAP
● Data mining

12
06/25/2024 HTTTQL Business Intelligence Systems
Nội dung

1. Trí tuệ kinh doanh (Business Intelligence – BI)

2. Business Intelligence System (BIS)

3. Triển khai BIS


● Ứng dụng công nghệ
● OLAP
● Data mining
● Các bước triển khai

13
06/25/2024 HTTTQL Business Intelligence Systems
3.1 Ứng dụng công nghệ

Các quy trình KD


(ISO)
Góc nhìn quản trị KD

Góc nhìn CNTT


ERP
Enterprise Resource Planning

Phần mềm

Thông tin

14
06/25/2024 HTTTQL Business Intelligence Systems
 Hệ thống thông tin là cái mà doanh nghiệp muốn

 ERP là giải pháp công nghệ


● Hiện thực hóa : Oracel, SAP, MS Dyanmic…

 Top of ERP:
● Không phải là tự động hóa quy trình nghiệp vụ
● Quản lý, hoạch định nguồn lực
● Tích hợp-quản lý-khai thác dữ liệu  hỗ trợ nhà quản lý ra
quyết định

15
06/25/2024 HTTTQL Business Intelligence Systems
3.1 Ứng dụng công nghệ (tt.)

 Khai thác dữ liệu


● OLAP (OnLine Analysis Processing)
● Data mining

16
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP

 TPS: Khai thác số liệu thô, báo cáo liệt kê


NV nghiệp vụ
Hóa đơn Mặt hàng Ngày mua SL Đơn giá Thành tiền
HD001 Pepsi 6/12/2010 10 8.000 80.000

Bánh ngọt 6/12/2010 2 12.000 24.000



HD002 Trà xanh O2 7/12/2010 1 9.000 9.000

Chocolate 7/12/2010 2 32.000 64.000

Sữa tươi 7/12/2010 5 7.000 35.000


HD003 Bia 333 8/12/2010 6 11.000 66.000

Dầu ăn 8/12/2010 1 75.000 75.000

….

17
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Khai thác số liệu tổng hợp


Ngày Tổng số hóa đơn Doanh thu (triệu) Trưởng quầy
01/02/2012 1.260 4.349
02/02/2012 2.343 7.563
...
28/02/2012 1.948 3.134
29/02/2012 3.217 9.398
...
Cộng 98.467

18
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.) : mô tả đc trạng thái dữ lieu, thể hiện dưới
các góc nhìn khác nhau để dễ dàng đưa qdinh

 Phân tích số liệu: ra quyết định

Quý 1 Quý 2 Tổng doanh thu Phụ trách KD


Chủng loại Hàng hóa
(triệu) (triệu) (triệu)
Nước Pepsi 30 90 120
Coca Cola 34 123 157
Cộng 64 213 277
Bánh ngọt AFC 50 24 74
Choco Pie 30 60 90
Cộng 80 84 164
...

● nhiều (nhóm) tiêu chuẩn khác nhau: mặt hàng, nhóm hàng,
cửa hàng, tỉnh-thành, khu vực, nhà SX, …

19
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Phân tích số liệu: ra quyết định


Phụ trách KD

Pepsi Coca Cola ...


Thời
gian Miền Nam Miền Trung Miền Bắc Miền Nam Miền Trung Miền Bắc

Quý 1 653 289 345 769 396 478


Quý 2 342 134 237 546 312 321
Quý 3 429 274 206 689 426 411
Quý 4 567 256 198 568 368 389
Cộng 1.991 953 986 2.572 1.502 1.599

20
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Phân tích số liệu: ra quyết định

Phụ trách KD

Quý 1 Quý 2 ...


Thời
gian Miền Nam Miền Trung Miền Bắc Miền Nam Miền Trung Miền Bắc

Pepsi 653 289 345 342 134 237


Coca
769 396 478 546 312 321
Cola
...
Cộng

21
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Giả định tình huống: ra quyết định


● giảm giá mặt hàng nước giải khát 20%: doanh số ?
Phụ trách KD

● tăng giá dầu gội đầu 10%: doanh số ?


● ...

Là phần mềm
xử lý, ???
Khác với Excel

22
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Yêu cầu
● công cụ hỗ trợ phân tích số liệu hiệu quả Phụ trách KD

● thể hiện kết quả trực quan

Operational Systems Decision-Oriented Systems


Hoạt động thường xuyên, Hoạt động không thường xuyên (bất kì
lúc nào…)
Truy vấn đơn giản trên dữ liệu thô Truy vấn trên dữ liệu tổng hợp, thống kê

Truy vấn từng phần “nhỏ” của Cơ sở Truy vấn trên CSDL tích hợp
dữ liệu (CSDL)
Nguồn dữ liệu ít phức tạp Nhiều nguồn dữ liệu đa dạng, phức tạp

Khai thác chủ yếu số liệu hiện hành Khai thác số liệu hiện hành và quá khứ
(cập nhật) (quá trình)

23
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 OLAP: công cụ hỗ trợ phân tích số liệu trực tuyến


● khai thác số liệu tổng hợp: phân tích hoạt động kinh doanh, lập
kế hoạch, ra quyết định, …
● thể hiện kết quả trực quan: thuận lợi cho người không chuyên
CNTT

24
06/25/2024 HTTTQL Business Intelligence Systems
Cho người qly nhìn đc nhiều góc độ khác
3.2 OLAP (tt.) nhau, các bộ khác đều có thể theo dõi
chung database

Pepsi Coca Cola

Miền Miền Trung Miền Bắc Miền Nam Miền Trung Miền Bắc
Nam
Quý 1 653 289 345 769 396 478
Quý 2 342 134 237 546 312 321
Quý 3 429 274 206 689 426 411
Quý 4 567 256 198 568 368 389
Miền Nam Miền Trung Miền Bắc
Quý 1 769 396 478
Coca Cola
Quý 2 546 312 321
Quý 3 689 426 411
Quý 4 568 368 389

Miền Nam Miền Trung Miền Bắc


Quý 1 653 289 345
Quý 2 342 134 237
Pepsi
Quý 3 429 274 206
Quý 4 567 256 198

25
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

Quý 1 Quý 2 Quý 3

M. Nam M.Trung M.Bắc M.Nam M.Trung M.Bắc M.Nam M.Trung M.Bắc


Pepsi 653 289 345 342 134 237 429 274 206

Coca Cola 769 396 478 546 312 321 689 426 411

M.Nam M.Trung M.Bắc


Quý 3
Pepsi 429 274 206

Coca cola M.Nam689M.Trung426 M.Bắc 411


Quý 2
Pepsi 342 134 237

Coca colaM.Nam546M.Trung312 M.Bắc321


Pepsi 653 289 345
Quý 1
Coca Cola 769 396 478

26
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Những yêu cầu đối với một hệ thống hỗ trợ OLAP


● tốc độ xử lý, tính toán
● công cụ mạnh hỗ trợ phân tích số liệu
● linh hoạt
● multi-user

27
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Khối dữ liệu (data cube): thể hiện dữ liệu đa chiều (n-chiều)

an
Q4

gi
ời Q3
Q2
Th

Q1
Dầu ăn 89
Chủng loại

Sữa tắm

Bánh kẹo

Nước

HCM CT Huế ĐN HN

Khu vực

28
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Ô dữ liệu (cell): liên kết giữa các chiều

89 89 89 (Dầu ăn, Q1, CT)


an

Q4
gi

Q3
ời

Q2
Th

Q1
Dầu ăn 89
Chủng loại

Sữa tắm

Bánh kẹo

Nước

HCM CT Huế ĐN HN

Khu vực
29
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Dimensions
● các thuộc tính dùng làm tiêu chí (chiều) để phân tích
● giá trị định lượng và định danh

 Hierarchies of levels
● phân cấp trên 1 chiều
Thời gian
Q4
an

Q3
gi

Q2
ời
Th

Q1 dimensions Khu vực


Dầu ăn
Chủng loại

Sữa tắm

Bánh kẹo Chủng loại


Nước
HCM CT Huế ĐN HN
Khu vực
30
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Measures
● các thuộc tính thể hiện yếu tố phân tích/tổng hợp

 Aggregations
● tổng hợp trên measures: SUM, AVERAGE, MIN, MAX, COUNT
● marginals: tổng hợp trên toàn bộ một hay nhiều chiều
Q4
Q3
Q2
Q1
Dầu ăn
measure: CTHD.sotien
Chủng loại

Sữa tắm
aggregation: SUM
Bánh kẹo
Nước
HCM CT Huế ĐN HN
Khu vực
31
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

Pivot

Slicin
g Dicing

Roll Drill
up down

32
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Slicing: cắt lát khối DL


an

Q4
gi

Q3 Chủng loại bánh kẹo


ời

Q2
Th

Q1
Dầu ăn
Chủng loại

Sữa tắm

Bánh kẹo 156 120

Nước

HCM CT Huế ĐN HN
Khu vực

33
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Slicing: cắt lát khối DL

an

Q4
gi

Q3
ời

Q2
Th

Q1
Dầu ăn 234
234
Chủng loại

Sữa tắm 123


123

Bánh kẹo 585


585

Nước 432
432

HCM CT Huế ĐN HN Khu vực Đà Nẵng


Khu vực

34
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Dicing: trích khối con

(Thời gian IN { Q1, Q2 }) AND


an

Q4
gi

(Khu vực IN { “Huế”, “ĐN”, “HN” }) AND


Q3
ời
Th

Q2 (Chủng loại IN { “Dầu ăn”, “Sữa tắm” })


Q1
Chủng loại

Dầu ăn

n
Sữa tắm

a
gi
ời
Bánh kẹo Q2

Th
Chủng loại
Q1
Nước Dầu ăn
HCM CT Huế ĐN HN
Sữa tắm
Khu vực
Huế ĐN HN
Khu vực

35
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Dicing: trích khối con

an
(Thời gian IN { Q1, Q2 }) AND
gi
Q4
ời

Q3 (Khu vực IN { “Huế”, “ĐN”, “HN” }) AND


Th

Q2
Q1
Chủng loại

Dầu ăn
Sữa tắm

an
gi
Bánh kẹo Q2

ời
Th
Q1
Nước
Dầu ăn
HCM CT Huế ĐN HN

Chủng loại
Khu vực Sữa tắm

Bánh kẹo

Nước

Huế ĐN HN
Khu vực 36
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Pivot: xoay khối


an

ại
gi

lo
ời

g
Th

ủn
Ch
Chủng loại

Thời gian
Khu vực Khu vực

37
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Roll up và drill down: phân cấp trên 1 trục

Thời gian

... 2010 2011 ...

Q1/2011 Q2/2011 Q3/2011 Q4/2011

T7/2011 T8/2011 T9/2011

T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12


Thời gian

38
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Roll up và drill down: phân cấp trên 1 trục

Khu vực

Miền Bắc Miền Trung Miền Nam


... ...

... HCM ... ...

Q1 Q2 ...

39
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Roll up: tổng hợp số liệu dần lên mức cao


an
gi

Q4
ời

Q3 Thời gian
Th

Q2 Quý 
Q1
Năm
Chủng loại

Dầu ăn 605 825 145 400 312


i an
Bánh 608 956 453 312 567
i g
h ờ
Kẹo 812 159 343 311 682 T
2010
Nước

Chủng loại
927 324 298 278 580
Dầu ăn
HCM HN HP ĐN CT
Bánh
Khu vực
Kẹo
Nước
HCM HN HP ĐN CT
Khu vực
40
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Roll up: tổng hợp số liệu dần lên mức cao


an
gi

Q4
Q3
ời
Th

Q2
Q1
Chủng loại

Dầu ăn 605 825 145 400 312

an
608 956 453 312 567

gi
Bánh Q4
Q3

ời
Kẹo 812 159 343 311 682

Th
Q2
Q1
Nước

Chủng loại
927 324 298 278 580
Dầu ăn
HCM CT Huế ĐN HN
Bánh
Khu vực
Kẹo
Nước
MN MT MB
Khu vực
TP  Miền Khu vực

41
06/25/2024 HTTTQL Business Intelligence Systems
3.2 OLAP (tt.)

 Drill down: phân tích số liệu xuống mức chi tiết

Thời gian
Quý  Tháng
an
gi
ời
Th

Q2
Q1

an
T6
Chủng loại

Dầu ăn T5

gi
T4

ời
Bánh T3

Th
T2
T1
Kẹo

Chủng loại
Dầu ăn
Nước
Bánh
MN MT MB
Kẹo
Khu vực
Nước
MN MT MB
Khu vực
42
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining
“We’re drowning in information and starving for knowledge”
Rutherford D. Rogers, Yale University librarian (NY Times 25/02/85)

Hiện trạng: “We are drowning in data, but starving for knowledge”

“Data Flood”

Data (các đối tượng rời rạc) Information (các đối tượng có mối Knowledge (quy luật chung / khuôn mẫu
liên hệ với nhau) của các đối tượng)

43
06/25/2024 HTTTQL Business Intelligence Systems
Thế giới các thực Không gian số
thể

Digital Transformation

44
Data, Information, Knowledge
▪ Data is often seen as a string of bits, or numbers and
symbols, or “objects” which we collect daily (by
observation, measurements, collection, etc.).
▪ Information is data stripped of redundancy, and reduced
to the minimum necessary to characterize the data.
▪ Knowledge is integrated information, including facts and
their relations, which have been perceived, discovered, or
learned as our “mental pictures” (“justified true belief”).
▪ Knowledge can be considered data at a high level of
abstraction

huybx@ueh.edu.vn
Data, Information, Knowledge

integrated information,
Metaphor:
including facts and their
Data: rock; relations (“justified true
knowledge: belief)
ore. Miner? Is this road appropriate for
such amount of cars?
Obtaining by
- Perceiving data equipped
- Discovering with meaning
- Learning Average of number
of cars
Obtaining by each hour, each day, each
- Processing week, each year on the road.
Un-interpreted signal
Obtaining by Number of cars
- Observing counted on a road by
- Measuring hours, by days of the
- Collecting week, by
huybx@ueh.edu.vn
months.
3.3 Data mining (tt.)

 Nguồn dữ liệu
● giao dịch kinh doanh, ngân hàng
● viễn thông
● Web
● …

Công nghệ phát triển, giá thành rẻ Dữ liệu 

Phân tích số liệu: OLAP


Nhu cầu Knowledge
quản lý Data Information
Dự đoán xu hướng/
Mining
Data
Phân loại

47
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Các loại thông tin


● không tường minh / tiềm ẩn (implicit)
● chưa được phát hiện trước từ dữ liệu (previously unknown)
● không tầm thường (non-trivial)
● hữu ích (potentially useful) TÌM – KIẾM

48
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)
“Data mining indicates the process of exploration and analysis of a dataset, usually
of large size, in order to find regular patterns to extract relevant knowledge …”
[Vercellis]

“Datamining refers to extracting or “mining” knowledge from large amounts of data”


[Han & Kamber]

“The process of extracting valid, previously unknown, comprehensible and


actionable information from large database and using that information to make
crucial business decisions.” [Simoudis]

Một số thuật ngữ khác:


 Knowledge Discovery in Databases (KDD), Data Driven Discovery
 Knowledge Extraction
 Exploratory Data Analysis
 Deductive Learning WHAT ?
49
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)
Data Mining & Business Intelligence

Khả năng hỗ trợ


ra quyết định End User

Making
Decisions

Data Presentation Business Analyst

Visualization Techniques

Áp dụng cho các DN: y Data Mining Data Analyst


khoa, nhân sự,.. Information Discovery

Data Exploration
Statistical Analysis, Querying and Reporting

Data Warehouses / Data Marts DBA


OLAP
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
50
06/25/2024 HTTTQL Business Intelligence Systems
Áp dụng vào doanh nghiệp

Nhân Phân tích


sự khuyến
cáo
Khách
hàng

Bán Phân tích Phân


hàng
kinh doanh tích dự
báo
Thị
trường

Tài
Phân
chính
tích mô
tả
Sản
xuất
3.3 Data mining (tt.)

 Chức năng

Dự đoán (Prediction)

Data Mining

Mô tả (Description)

52
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Chức năng dự đoán


● suy luận từ dữ liệu “lịch sử” (học từ quá khứ)
● những kỹ thuật cơ bản
- classification
- regression
- time series analysis
- neural network
- …

Khách hàng sẽ có xu hướng mua hàng gì ? Giá vàng ngày mai tăng hay giảm ?
53
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Chức năng mô tả
● thể hiện các đặc trưng, mối liên hệ của các đối tượng/sự kiện
● những kỹ thuật cơ bản
- summarization, characterization, discrimination
- clustering
- association rules
- …

Khách hàng thân thiết của công ty thuộc độ tuổi nào ? tầng lớp xã
hội ?
Những đặc điểm của khách hàng khu vực Tp.HCM ?
54
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 So sánh OLAP, và Data Mining

OLAP Data Mining

Chức Phân tích DL theo nhiều yếu Khám phá tri thức tiềm
năng tố, tiêu chuẩn ẩn trong các mẩu DL

Phương Thông kê DL đa chiều (thời Quy nạp (Induction)


pháp gian, vùng, chủng loại, …) Xây dựng mô hình, huấn
luyện DL  kết quả
Kết quả Thông tin Tri thức

Ví dụ Thu nhập bình quân của KH Ai sẽ là KH thân thiết


thân thiết theo vùng và thành trong năm tiếp theo và
phần XH ? tại sao ?

55
06/25/2024 HTTTQL Business Intelligence Systems
Olap: phân tích tỷ lệ ngày cao,..
3.3 Data mining (tt.) Data mining: tìm kiếm quy luật,
có thể chơi thể thao hay ko?

 Ví dụ so sánh OLAP, và Data Mining


Ngày Thời tiết Nhiệt độ (F) Độ ẩm Gió ? Chơi thể thao ?
1 nắng 85 Cao không không
2 nắng 80 Cao có không
3 âm u 83 Cao không có
4 mưa 70 Cao không có
5 mưa 68 Cao không có
6 mưa 65 Trung bình có không
7 âm u 64 Trung bình có có
8 nắng 72 Cao không không
9 nắng 69 Trung bình không có
10 mưa 75 Cao không có
11 nắng 75 Trung bình có có
12 âm u 72 Cao có có
13 âm u 81 Cao không có
14 mưa 71 Cao có không

56
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 OLAP
● Tuần 1, tuần 2 có thời tiết thế nào, có chơi thể thao không ?

Có: 9 ngày
Nắng Mưa Âm u
Không: 5 ngày
3 ngày
2 ngày 2 ngày
Tuần 1 Có: 2 ngày
Không: 2 ngày Có: 2 ngày
Không:1 ngày
3 ngày 2 ngày
2 ngày
Tuần 2 Có: 2 ngày Có: 1 ngày
Có: 2 ngày
Không:1 ngày Không: 1 ngày

57
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Data Mining
● Quy luật chơi thể thao  dự đoán
- Nếu thời tiết = nắng
– Độ ẩm cao: KHÔNG Thời tiết
– Độ ẩm trung bình: CÓ âm u
nắng
mưa
- Nếu thời tiết = âm u: CÓ


- Nếu thời tiết = mưa Gió Độ ẩm
– Có gió: KHÔNG
– Không có gió: CÓ không có trung
cao
bình

Không

Có Không

58
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Kinh doanh: dự đoán nguồn KH thân thiết


● Nhu cầu: dự đoán loại KH thân thiết trong tương lai (tiềm tàng)

và loại KH nào có nguy cơ chuyển sang sử dụng sản phẩm


của đối thủ
● Phương pháp: tìm đặc trưng, phân lớp

59
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Kinh doanh: tư vấn sản phẩm có liên quan


● Nhu cầu: tư vấn, xác định các nhóm mặt hàng mà thường
được mua kèm với nhau
● Phương pháp: luật kết hợp

60
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Tài chính: chính sách cho vay / tín dụng
● Nhu cầu: dự đoán khả năng trả nợ và tín dụng của KH trước
khi cho vay, xác định những yếu tố ảnh hưởng “nhiều” đến việc
thể hiện khả năng chi trả của KH như mức thu nhập, quá trình
chi trả nợ (payment history),…
● Phương pháp: tìm đặc trưng, phân lớp

61
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Tài chính: phân nhóm, khoanh vùng thị trường
● Nhu cầu: phân chia thị trường thành các cụm nhỏ để có thể
xác định thị trường mục tiêu (target market)
● Phương pháp: phân lớp, gom cụm

62
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Tài chính: phát hiện gian lận


● Nhu cầu: dự đoán các trường hợp có ý định gian lận trong giao
dịch ngân hàng, trốn thuế
● Phương pháp: tìm đặc trưng, phân lớp

63
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng - Viễn thông


● Nhu cầu: chiến lược cung cấp dịch vụ viễn thông (xác định
dạng mẫu, tối ưu hóa tài nguyên, chống gian lận)
● Phương pháp: tìm đặc trưng, phân lớp

64
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Ứng dụng – Y tế: tìm phương pháp điều trị hiệu quả
● Mục tiêu: xây dựng phương pháp/phác đồ điều trị các loại
bệnh
● Phương pháp: phân lớp, time-series

65
06/25/2024 HTTTQL Business Intelligence Systems
3.3 Data mining (tt.)

 Thể hiện trực quan (Visualization): công cụ / kỹ thuật biểu diễn


tri thức dưới dạng ngôn ngữ mức cao (high level languages)
● Ưu điểm: trực quan, dễ hiểu, dễ sử dụng

 Một số dạng biểu diễn


● bảng biểu
● đồ thị, biểu đồ, …
● cây
● luật
● ma trận

66
06/25/2024 HTTTQL Business Intelligence Systems
How Are Business Intelligence
Applications Delivered?

Chuyển giao đến KH


thông qua các thiết bị

Source: textbook[1], pg 312


BI Server - Management Functions

 the authorized allocation of BI results to users

 BI servers can be:


● Website from which users can download, or pull, BI
application results
● Portal server with customizable user interface.

● A BI application server: to support user subscriptions


to particular BI application results. (e.g. alerts via
email or phone whenever a particular event occurs)
BI Server – Delivery Functions

 use metadata to determine what results to send to


which users and, on which schedule.

 BI results can be delivered to “any” device. .

 exception alert
● a dramatic fall in a stock price or exceptionally high
sales volume.
Thảo luận

70
06/25/2024 HTTTQL Business Intelligence Systems

You might also like