Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

Business Statistics and Intelligence for Data Analysis

Business Statistics :

Statistics là thống kê , mà thống kê là cốt lõi của phân tích dữ liệu. Thống kê là 1 bức tranh tổng quát của
các phương pháp phương pháp tổng hợp data , sau đó phân tích và trình bày , mà qua đó chúng ta có
thể hiểu được và extract được thông tin từ dữ liệu.

Nói cho vui : Data Science = Statistic + Computer Science

Data Scientists are those know more statistics than a computer scientist and more programming than a
statistician.

Thống kê có nhiều loại, từ đơn giản đến phức tạp.


Ví dụ đơn giản : Báo cáo tài chính , balance sheet của kế toán . Con người đã bắt đầu làm thống kê từ
các balance sheet về tình hình mua bán , nhập hàng hóa gần 3000 năm trước ( khảo cổ từ người
Sumerian ~ Lường Hà ). Thống kê có thể làm hoàn toàn bằng tay , từ giấy và bút , kết hợp tính nhẩm.

Ví dụ phức tạp : Thống kê chỉ số thiên văn từ vài triệu hành tinh mà kính viễn vọng hubble và james web
thu thập được, qua đó tính ra xác suất các hành tinh trong vòng bán kính X năm ánh sáng có thể tồn tại
sự sống. ( => Vấn đề phức tạp , nhiều data => phải sử dụng máy móc và công cụ lập trình mới analyze
được chứ analyze bằng tay sao nổi , chưa kể performance của tính tay với máy tính thì sao bằng)

Tóm tắt lại : Thống kê là phương pháp phân tích , dựa trên sự thu thập dữ liệu và 1 vài phép toán thống
kê , xác suất , ... để tìm ra insights từ dữ liệu.

 Các phép tính thống kê cơ bản : Min , Max , Median , Mean.


 Các phép tính thống kê nâng cao : Standard deviation , Variance , Coefficient , Rsquare
 Các phương pháp trực quan hóa cơ bản : Bar , Plot , Box plot
 Các phương pháp trực quan hóa nâng cao : Scatter Plot, Histogram , dendrogram
Business Intelligence :

Intelligence là thông tin . Dựa trên các thông tin để xác định vấn đề , sau đó tìm giải pháp với sự giúp đỡ
của insights từ data.

 Vấn đề đang gặp là gì , phải có insights , phải có domain knowledge => các possible outcomes /
possible causations , làm hypothesis testing để xác định có phải không , nếu không thì ... , nếu có
thì làm tiếp analysis vào hypothesis tìm được, sau đó trả lời với sự giúp đỡ của data.

Ví dụ : 1 chuỗi cửa hàng thời trang đang chứng kiến doanh số sụt giảm => BOD và các business
department đã tiến hành investigate các lý do dẫn đến doanh số sụt giảm, sau khi họp , rút ra có 3 giả
thuyết chính.

Lý do 1 : Lý do nằm ở sản phẩm , sản phẩm không còn sức hút , không bắt kịp trend

Lý do 2 : Lý do nằm ở marketing , marketing chưa tốt , đánh không đúng tập khách hàng, chiến dịch
không hiệu quả. Thương hiệu càng ngày càng chìm , được ít người biết tới .

Lý do 3 : Lý do nằm ở việc định giá , giá quá cao so với đối thủ , branding chưa tốt , chưa phải sản phẩm
high end nên khách hàng không willing trả giá cao hơn.

 Nếu bạn là 1 Data Analyst của công ty này , bạn sẽ làm 1 báo cáo lên BOD như thế nào ?

Quantitative Research approach : Phương pháp tiếp cận vấn đề bằng cách phân tích dữ liệu dạng
quantitative ( định lượng )

- Descriptive Research
- Survey Research
- Correlational Research
- ...

Quant làm việc với data dạng số , có thể cân đo đong đếm measure được

Qualitative Research approach : Phương pháp tiếp cận vấn đề bằng cách phân tích dữ liệu dạng
qualitative ( định tính )

Qualitative Research focus vào quality hoặc characteristics , những yếu tố không phải dạng số ( giới tính,
tính cách , chất lượng thực phẩm , bình luận )

Anyway, Qualitative có thể được biến đổi thành Quantitative qua việc transform.
Như vậy , Intelligence chính là cái khung sườn , cái framework , cái tổng quan , và statistics chứng là cái
kỹ năng để hoàn thiện chi tiết được cái tổng quan đó.

You might also like