Download as pdf or txt
Download as pdf or txt
You are on page 1of 25

PHÂN TÍCH DỮ LIỆU

SQL & POWER BI


BECOME AN EXPERT IN DATA ANALYTICS
THÔNG TIN GIẢNG VIÊN

Mr. Nguyễn Phương Nam

Hơn 5 năm kinh nghiệm trong lĩnh vực


Data Analytics

Senior Data Analyst - Techcombank

Chứng chỉ: Microsoft Certified: Data


Analyst Associate

phuongnam506@gmail.com
4

Theo bạn Data Warehouse là gì?

Bài 3: Giới thiệu về Data Model trong


Power BI
MỤC LỤC

Khái niệm về Data Model và lược đồ dữ


1 liệu

Data Model trong Power BI


2

Thực hành liên kết dữ liệu trong Power BI


3 Desktop

4 Case Study AW2017 Database


KHÁI NIỆM VỀ DATA MODEL VÀ
LƯỢC ĐỒ DỮ LIỆU
Một số khái niệm cần biết

Fact vs Dimensions:
• Bảng sự kiện (Fact): theo dõi biến động dữ liệu, lưu trữ các thông tin giá cả,
doanh số, số lượng, thời gian, tốc độ ...
• Các bảng chiều (Dimension): mô tả các đặc trưng các chiều như thời gian,
hàng hoá,…
• Ví dụ trong DB BikeStores:
➢ Bảng nào là bảng Fact, bảng nào là bảng Dimensions?
Một số khái niệm cần biết

Data Mart:
• Một Data mart là một cơ sở dữ liệu hoặc tập hợp các cơ sở dữ liệu riêng biệt, mỗi nhóm
có một trọng tâm cụ thể. Trọng tâm đó có thể là một lĩnh vực chủ đề (như hình trên),
hoặc có thể là nhu cầu hỗ trợ quyết định (ví dụ như kiểm toán, phòng ngừa rủi ro, hoặc
dự toán khả năng sinh lợi).
• Một Data mart được tạo ra khi Kho dữ liệu doanh nghiệp (Enteprise DW – EDW) không
thể cung cấp dữ liệu theo cách mà khách hàng yêu cầu hoặc đơn giản vì chi phí xây
dựng Data mart rẻ hơn

Ví dụ:
Một số khái niệm cần biết

Sự cần thiết phải xây dựng Data mart:


- Nhu cầu dữ liệu đầu vào từ khu vực kinh doanh:
➢ Thông thường, dữ liệu đầu vào cho phép phân tích “nếu như”: Nếu tỷ lệ thuế thay đổi thì
sao? Nếu năng suất thay đổi?
>> Rõ ràng, dữ liệu đầu vào không phải là dữ liệu doanh nghiệp mà là phát sinh trong
quá trình kinh doanh

- Phân tách dữ liệu:


➢ Khu vực kinh doanh cần bảo mật dữ liệu nhạy cảm (ví dụ: tài sản, tài chính, y tế, v.v)
không thể cung cấp cho bất kỳ ai ở ngoài khu vực kinh doanh.
➢ Khu vực kinh doanh cần tương tác với một doanh nghiệp bên ngoài hoặc cơ quan chính
phủ mà không cho phép họ truy cập vào tất cả các dữ liệu khác. Vì thế mỗi Data
mart có thể phục vụ cho các đối tượng khác nhau với yêu cầu khác nhau.
Khái niệm về Data Modeling

❑ Data model (mô hình dữ liệu) là một mô hình trừu tượng tổ chức các phần tử
của dữ liệu và chuẩn hóa cách chúng liên quan với nhau và với các thuộc tính
của các thực thể trong thế giới thực.
❑ Mô hình hóa dữ liệu (data modelling) là quá trình tạo ra một mô hình dữ liệu
để dữ liệu được lưu trữ trong cơ sở dữ liệu. Mô hình dữ liệu này là một biểu
diễn khái niệm của các đối tượng dữ liệu, sự liên kết giữa các đối tượng dữ
liệu khác nhau và các quy tắc.
❑ Mô hình hóa dữ liệu giúp thể hiện trực quan dữ liệu và thực thi các quy tắc
kinh doanh, tuân thủ quy định và chính sách của chính phủ về dữ liệu. Mô hình
dữ liệu đảm bảo tính nhất quán trong quy ước đặt tên, giá trị mặc định, ngữ
nghĩa, bảo mật đồng thời đảm bảo chất lượng của dữ liệu.
Lược đồ dữ liệu hình bông tuyết

Lược đồ dữ liệu hình bông tuyết (Snowflake Schema)


• Sử dụng Snowflake Schema khi có nhiều mối quan hệ giữa các bảng và bạn muốn tạo
quan hệ với bảng này thì bắt buộc phải thông qua 1 bảng khác
• Các bảng Dimension có thể không nối trực tiếp với bảng Fact mà phải thông qua một
bảng khác
Lược đồ dữ liệu hình sao

Lược đồ dữ liệu hình sao (Star schema):


● Bảng Fact và các bảng Dimesion có mối quan hệ trực tiếp với nhau. Bảng Fact là trái tim
của ngôi sao, và các quan hệ trực tiếp với các bảng Dimesion xung quanh là các cánh sao
● Đặc điểm của mô hình là rõ ràng và dễ hiểu
● Các kĩ thuật tính toán hiện đại được tối ưu cho lược đồ dữ liệu hình sao
Lược đồ dữ liệu hình sao

Lược đồ dữ liệu hình sao (Star schema)


● Star Schema có thể bao gồm nhiều bảng Fact như hình bên
Tầm quan trọng của Star Schema
• Là cách tốt nhất để thiết kế 1 mô hình dữ liệu cho việc tạo các báo cáo BI
• Có chất lượng tốt nhất đồng thời cũng rất linh hoat
DATA MODEL TRONG
POWER BI
Relationship trong Data Model của Power BI

● Các loại liên kết (relationship) trong Data Model của Power BI
Relationship trong Data Model của Power BI

Các loại liên kết (relationship) trong Data Model


❖ One To One (1-1): Cột trong 1 bảng chỉ chứa 1 giá trị
duy nhất và bảng còn lại cũng chỉ chứa 1 giá trị duy
nhất.
❖ One To Many (1-*) hay Many to One (*-1): Cột trong 1
bảng chỉ chứa 1 giá trị duy nhất và Bảng liên quan có
thể chứa nhiều hơn 1 giá trị.
❖ Many To Many

Cross Filter Direction (hướng của bộ lọc chéo):


❖ Both
❖ Single
Data Model trong Power BI

Data model trong Power BI là một tập hợp của:


❑ Các bảng dữ liệu: bảng dữ liệu bao gồm một hoặc nhiều cột được load vào
trong Power BI (thông qua Power Query)
❑ Các mối quan hệ giữa các bảng được load vào cùng data model
❑ Các công thức (measures) được viết ra để tính toán business logic, các chỉ
số trong doanh nghiệp (ví dụ: margin, cost) bao gồm:
• Công thức và các định dạng áp dụng cho kết quả của công thức
• Tên chỉ số kinh doanh được gán cho công thức (Measure Name)

Tất cả những thành phần trên có thể được gọi là “Mô hình dữ liệu trong Power
BI” (Điều này cũng đúng cho Analysis Service Tabular, Power Pivot trong Excel,
và nhiều công cụ BI khác)
Model View trong Power BI
Tại sao cần Data Model trong Power BI

Những lỗi thường gặp khi tạo model trong Power BI:
• công thức (measures) đưa ra kết quả không như mong muốn,
• chưa nhận ra được “Intelligence” từ dữ liệu,
• báo cáo bị chậm.
 nhiều khả năng vấn đề nằm ở data model.

Lợi ích của việc có 1 Data Model tốt:


• Làm cho báo cáo nhanh hơn
• Code DAX đơn giản hơn
• Dễ bảo trì, nâng cấp hơn
THỰC HÀNH LIÊN KẾT DỮ LIỆU
TRONG POWER BI
Thực hành

● Sử dụng dữ liệu từ DB BikeStores

● Tạo bảng Date để liên kết với các bảng Fact

❑ Import bảng Date có sẵn

❑ Dùng hàm Dax để tạo bảng Date:


Date = ADDCOLUMNS ( CALENDAR (DATE(2014,1,1), DATE(2017,12,31)),

"DateAsInteger", FORMAT ( [Date], "YYYYMMDD" ),

"Year", YEAR ( [Date] ),

"Month", MONTH( [Date] ))

● Tạo liên kết với các bảng khác


Case Study AW 2017 Database

● Sử dụng dữ liệu từ file AdventureWorksDW2017.xlsx

● Import dữ liệu vào Power BI Desktop

● Tạo các liên kết trong Data Model

➢ Liên kết hoạt động (active relationship)

➢ Liên kết ẩn (inactive relationship)


Case Study AW Database
Q&A

You might also like