Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 17

CHƯƠNG 2: TỔNG QUAN VỀ CHƯƠNG TRÌNH SỬ DỤNG VÀ CÁC

PHƯƠNG PHÁP SỬ DỤNG


2.1 Giới thiệu về phần mềm excel
Excel là chương trình xử lý bảng tính nằm trong bộ Microsoft Office. Đây là một ứng
dụng vô cùng quen thuộc trên toàn thế giới. Phần mềm này cho phép người dùng quản
lý và phân tích dữ liệu, tính toán, thống kê, báo cáo dữ liệu… Bên cạnh đó nó còn có
khả năng xử lý nhanh chóng và chính xác các tệp dữ liệu lớn và được sử dụng rộng rãi
trong nhiều lĩnh vực khác nhau như: kinh doanh, tài chính, khoa học dữ liệu và trong
nhiều lĩnh vực khác. Và trong Khoa học dữ liệu, Excel được dùng để lưu trữ dữ liệu,
thống kê mô tả, phân tích dự báo và phân tích tối ưu.
2.1.1 Phương pháp thống kê mô tả
Thống kê mô tả là quá trình sử dụng các phương pháp để tóm tắt hoặc mô tả một tập
dữ liệu hoặc một mẫu nghiên cứu bằng cách sử dụng số liệu hoặc biểu đồ trực quan.
Các công cụ số hóa thường được sử dụng nhất là trung bình và độ lệch chuẩn, còn các
công cụ trực quan thường dùng nhất là các biểu đồ.
2.1.1.1 Thống kê bằng công cụ Descriptive Statistics
Cách thực hiện:
Bước 1: Chuẩn bị bảng số liệu cần thống kê
Bước 2: Chọn lệnh Data → Data Analysis → Descriptive Statistics, xuất hiện hộp
thoại Descriptive Statistic
Bước 3: Khai báo các thông số Input và lựa chọn các thông số Output Options
Ví dụ: Thống kê mô tả cho số lượng thịt Bò theo (kg) mà siêu thị ABC bán được
trong tháng 3 bằng công cụ Descrtiptive Statistics

Hình 2.1: Số liệu bán hàng trong tháng 03 tại siêu thị ABC
Khi hộp thoại Descriptive Statistic được hiển thị, ở ô Input Range ta nhập cột dữ liệu
thịt Bò, ô Output Range là ô chứa dữ liệu được xuất ra, tick vào ô Sumary statistics và
Confidence Level for Mean ( độ tin cây) là 95%. Sau đó nhấn OK và hiển thị kết quả
như bảng sau

Hình 2.2: Bảng kết quả thống kê mô tả lượng thịt Bò (kg)


Trong đó:
● Mean: Giá trị trung bình
● Standard Error: Sai số chuẩn
● Median: Trung vị
● Mode: Yếu vị
● Standard Deviation: Độ lệch chuẩn
● Sample Variance: Phương sai mẫu
● Kurtosis: Độ nhọn
● Skewness: Độ bất đối xứng (độ nghiêng)
● Range: Khoảng biến thiên (Max-Min)
● Minimum: Số nhỏ nhất
● Maximum: Số lớn nhất
● Sum: Tổng
● Count: Số lượng phần tử
● Confidence Level (95%): Độ tin cậy
2.1.1.2 Báo cáo tổng hợp nhóm với công cụ Subtotal
Chức năng của Subtotal:
● Cho phép tổng hợp từng nhóm dữ liệu của các cột kiểu số trong cơ sở dữ liệu
như: tìm tổng, số lớn nhất, số nhỏ nhất, số trung bình,..
● Kết quả tổng hợp được đặt trên hay dưới mỗi nhóm
Cách thực hiện:
Bước 1: Sắp xếp dữ liệu theo cột muốn gom nhóm
Bước 2: Chọn toàn bộ cơ sở dữ liệu hay click chuột vào một ô bất kỳ trên dữ liệu
Bước 3: Chọn Data → Outline → Subtotal, xuất hiện hộp thoại Subtotal
Ví dụ: Thống kê số tiền mà mỗi nhân viên thực hiện

Hình 2.3: Bảng dữ liệu của nhân viên


Hình 2.4: Hộp thoại Subtotal
Trong hộp thoại Subtotal:
● At each change in: chọn cột gom nhóm ( Saleperson)
● Use function: chọn hàn thống kê dùng để tổng hợp dữ liệu
● Add subtotal to: chọn cột thống kê giá trị ( Order Amount)
● Replace current subtotals: chọn để thay thế kết quả thống kê trước đó
● Page break between group: chọn để ngắt trang giữa các nhóm, khi in ra giấy
thì mỗi nhóm một trang giấy
● Summary below data: chọn để kết quả tổng hợp ở dưới mỗi nhóm
● Remove All: để xóa bỏ các kết quả tổng hợp
Hiển thị hộp thoại Subtotal, chọn cột cần gom nhóm (At each change in) là
Salesperson, chọn hàm thống kê Use function là Sum, chon cột thống kê giá trị
Add Subtotal to là Order Amount. Sau đó ta được kết quả bảng tổng hợp số tiền mà
mỗi nhân viên thực hiện:
Hình 2.5: Bảng tổng hợp số tiền mà mỗi nhân viên thực hiện
2.1.1.3 Hợp nhất dữ liệu với Consolidate
Chức năng của Consolidate
● Cho phép hợp nhất dữ liệu từ những bảng dữ liệu khác nhau
● Consolidate có thể hợp nhất dữ liệu theo hai hình thức
○ Tổng hợp theo vị trí: các bảng dữ liệu giống nhau về cấu trúc
○ Tổng hợp theo hạng mục ( theo hàng và cột): các bảng dữ liệu khác
nhau về cấu trúc
Cách thực hiện:
Bước 1: Chọn vùng sẽ chứa dữ liệu được hợp nhất
Bước 2: Chọn Data→ Data Tools → Consolidate, xuất hiện hộp thoại Consolidate
Ví dụ: Hợp nhất doanh thu của ba của hàng

Hình 2.6: Doanh thu của 3 cửa hàng


Hình 2.7:Hộp thoại Consolidate
● Function: chọn hàm tổng hợp
● Reference: để tham chiếu lần lượt các bảng dữ liệu nguồn
● All references: chứa tất cả các vùng dữ liệu nguồn cần thiết cho việc hợp nhất
● Top row: chọn nếu muốn dùng tên cột của vùng nguồn
● Left column: chọn nếu muốn dùng các giá trị của cột đầu tiên của vùng nguồn
● Create links to source data: chọn nếu muốn dữ liệu hợp nhất được cập nhất
mỗi khi có thay đổi ở vùng dữ liệu nguồn.
Ở mục Function ta chọn Sum, sau đó tham chiếu lần lượt các bảng dữ liệu nguồn:
thêm dữ liệu cần hợp nhất ở vùng dữ liệu của bảng cửa hàng 1, cửa hàng 2 và cửa
hàng 3. Sau đó ta thu được kết quả như sau:

Hình 2.8: Bảng hợp nhất doanh thu của 3 cửa hàng

2.1.1.4 Tổng hợp dữ liệu đa chiều với PivotTable


Chức năng của PivotTable:
● Gom nhóm dữ liệu theo theo một số tiêu chí nào đó để dễ dàng quản lý.
● Tổng hợp và phân tích dữ liệu với nhiều góc độ và nhiều cấp khác nhau.
Cách thực hiện:
Bước 1: Click vào ô bất kì trên cơ sở dữ liệu
Bước 2: Chọn lệnh Insert → PivotTable
Bước 3: Xuất hiện hộp thoại Create PivotTable, chọn dữ liệu nguồn và nơi chứa
Pivotable, click nút OK
Bước 4: Drag các tên field từ PivotTable Fields vào bốn khu vực: FILTERS, ROWS,
COLUMN và VALUES
Ví dụ:

Hình 2.9: Tổng hợp dữ liệu đa chiều với PivotTable


Hình 2.10: Hộp thoại Create PivotTable
Trong hộp thoại Create PivotTable, ở mục Select a Table or Range ta chọn dữ liệu cần
thống kê, nháy chọn New Worksheet thì PivotTable sẽ xuất hiện một bảng tính mới,
sau đó nháy nút OK. Màn hình hiển thị hộp thoại PivotTable Fields, ta Drag các tên
fields vào các khu vực: Country vào Columns, Salesperson vào Rows và Order
Amount vào Values. Xong các thao tác như trên, ta được bảng kết quả sau

Hình 2.11: Kết quả tổng hợp đa chiều với PivotTable


Trong hộp thoại Create PivotTable và PivotTable Fields gồm có:
● Table/Range: dữ liệu muốn thống kê.
● Use an external data source: sử dụng các dữ liệu bên ngoài (thường ít sử dụng do
việc thống kê thường lấy dữ liệu chủ yếu trong trang tính Excel).
● New Worksheet: xuất hiện trang tính mới.
● Existing Worksheet: sẽ xuất hiện dữ liệu ở trang tính đang sử dụng.
● Filters: là bộ lọc báo cáo.
● Columns: dữ liệu hiển thị theo cột.
● Rows: dữ liệu hiển thị theo dòng.
● Values: Giá trị chủ yếu là số.
2.1.2 Phương pháp về phân tích dự báo
Trong Excel, phương pháp phân tích dự báo đề cập đến việc sử dụng các công cụ và
kỹ thuật tích hợp trong phần mềm để dự đoán giá trị tương lai dựa trên dữ liệu lịch sử.
Cụ thể, phương pháp này tập trung vào việc áp dụng các mô hình và kỹ thuật thống kê
để dự báo xu hướng, mẫu, và giá trị tiềm năng của dữ liệu.
2.1.2.1 Phương pháp Trung bình trượt ( Moving Average)
Cách thực hiện:
Bước 1: Chuẩn bị bảng số liệu cần dự báo
Bước 2: Chọn lệnh Data → Data Analysis → Moving Average, xuất hiện hộp thoại
Moving Average
Bước 3: Khai báo các thông số Input và Output Options
Ví dụ: Dự báo về số lượng thịt bò sẽ bán ra vào ngày 17 của siêu thị ABC

Hình 2.12: Số liệu bán hàng và hộp thoại Moving Average


Trong hộp thoại Moving Average:
● Input range: tham chiếu đến vùng dữ liệu thực tế
● Labels in First Row: Khai báo hàng đầu tiên của input range có chứa tiêu đề
cột hay không
● Interval: số lượng các kỳ trước đó muốn tính
● Output Range: tham chiếu đến vùng xuất kết quả. Những ô không đủ số lượng
giá trị trước đó để tính toán sẽ nhận giá trị N/A
● Chart Output: tùy chọn dùng tạo biểu đồ nhúng cùng với vùng xuất kết quả
● Standard Errors: tùy chọn dùng tạo thêm 1 cột chứa các sai số chuẩn
2.1.2.2 Phương pháp San bằng mũ ( Exponential Smoothing)
Cách thực hiện:
Bước 1: Chuẩn bị bảng số liệu cần dự báo
Bước 2: Chọn lệnh Data → Data Analysis → Exponential Smoothing, xuất hiện
hộp thoại Exponential Smoothing
Bước 3: Khai báo các thông số Input và Output Options
Ví dụ: Dự báo về số lượng thịt bò sẽ bán ra vào ngày 17 của siêu thị ABC

Hình 2.13: Số liệu bán hàng và hộp thoại Exponential Smoothing


Trong hộp thoại Exponential Smoothing, ta có:
● Input Range: tham chiếu đến vùng dữ liệu thực tế
● Damping factor: giá trị dùng làm hệ số san bằng. Đó là giá trị điều chỉnh sự
bất ổn của dữ liệu, giá trị mặc định là Damping factor (1-a)=0.7
● Labels: tùy chọn cho biết hàng/cột đầu tiên của Input Range có chưa tiêu đề
hay không
Kết quả trong hình 2.13 là dự báo lượng thịt bò bán (kg) được tại siêu thị ABC vào
ngày 17/3 với hệ số điều chỉnh a=0.3 ( Damping factor =0.7). Như vậy lượng thịt bò
dự báo cho ngày 17/03 là 29.88kg
2.1.2.3 Phương pháp hồi quy ( Regression)
● Phân tích hồi quy là nghiên cứu sự phụ thuộc của một biến ( biến phụ thuộc
hay còn gọi là biến được giải thích) vào một hay nhiều biến khác ( biến độc lập
hay còn gọi là biến giải thích)
● Phương trình hồi quy có dang tổng quát: Y=f(X₁, X₂,...,Xₙ)
● Hồi quy đơn biến: Y=aX+b
● Trong đó:
○ Y: là biến phụ thuộc ( dependent variable)
○ Xi: là các biến độc lập ( independent variable)
Cách thực hiện bằng đồ thị:
Bước 1: Chuẩn bị bảng số liệu cần dự báo
Bước 2: Chọn lần lượt vùng địa chỉ chứa biến phụ thuộc Y,và vùng chứa biến độc lập
X
Bước 3: Vẽ đồ thị dạng Scatter
Bước 4: Click chuột phải vào data series, chọn Add Trendline
Bước 5: Tùy chọn hiển thị trong Trendline Options
● Linear: dạng đường thẳng
● Display Equation on chart
● Display R-squared value on chart
Ví dụ: Phân tích Doanh thu- Chi phí 2016

Hình 2.14: Doanh thu và chi phí năm 2016 và biểu đồ Scatter
Hình 2.15: Biểu đồ dạng Scatter

Cách thực hiện bằng công cụ Regression


Bước 1: Chuẩn bị bảng số dữ liệu cần dự báo
Bước 2: Chọn lệnh Data → Data Analysis → Regression, xuất hiện hộp thoại
Regression

Hình 2.16: Hộp thoại Regression


● Input Y Range: Vùng địa chỉ chứa biến phụ thuộc Y
● Input X Range: Vùng địa chỉ chứa các biến độc lập X (có thể chọn nhiều biến
X trong trường hợp hồi quy đa biến)
● Labels: Tích vào mục này để khẳng định ô (các ô) đầu tiên không chứa dữ liệu
hồi quy
● Constant is Zero: Tích vào mục này để khẳng định hệ số tự do của hàm hồi
quy tuyến tính a=0
● Confidence Level: Độ tin cậy của hồi quy là 95%
● Output Range: Vùng hoặc ô phía trên bên trái của vùng chứa kết quả
● New Worksheet Ply: in kết quả ra một sheet khác
● New Workbook: In kết quả ra một file Excel mới
● Residuals: sai số do ngẫu nhiên
● Standardized Residuals: chuẩn hóa sai số
● Residual Plots: đồ thị sai số
● Line Fit Plots: đồ thị hàm hồi quy tuyến tính
● Normal Probability Plots: đồ thị xác suất phân phối chuẩn”
Hình 2.17: Kết quả bảng hồi quy
Input Y Range là cột Doanh thu , Input Y Range là cột Chi phí. Độ tin cậy hồi quy
Confidence Level là 95%. Kết quả a= 1.791, b=3.813
2.1.3. Phương pháp phân tối ưu
Phương pháp phân tích tối ưu trong Excel đề cập đến việc sử dụng các công cụ và kỹ
thuật tích hợp trong phần mềm để tìm ra giải pháp tối ưu cho các vấn đề quyết định và
tối ưu hóa trong kinh doanh, kỹ thuật, hoặc các lĩnh vực khác. Cụ thể, phương pháp
này tập trung vào việc sử dụng các mô hình toán học và kỹ thuật tối ưu hóa để tối
thiểu hóa hoặc tối đa hóa một hàm mục tiêu trong các điều kiện ràng buộc

Ví dụ: Một nhà quản lý Dự án nông nghiệp muốn lựa chọn phương án trồng trọt
bao nhiêu tấn lúa mì và lúa gạo để tối đa hóa lợi nhuận của dự án trên các số liệu sau:

Số liệu đầu vào đối với Loại sản phẩm Khả năng lớn nhất của
một đơn vị sản phẩm nguồn tài nguyên sẵn có
Lúa gạo Lúa mì
Diện tích đất (ha/tấn) 2 3 50 ha
Lượng nước (m³/ tấn) 6 4 90m³
Nhân công ( người/ tấn) 15 12 250 người
Lợi nhuận ( USD/ tấn) 18 21

Bảng 2.1: Bảng số liệu của dự án


Các bước lập mô hình:
Bước 1: Xác định biến quyết định
Gọi X₁ là lượng lúa gạo, X₂ là lượng lúa mì ( tấn) cần sản xuất
Bước 2: Xác định hàm mục tiêu
Mục tiêu bài toán là tối đa hóa lợi nhuận ta có
P=P ( lúa gạo)+ P ( lúa mì)=18x₁ + 21x₂ → max
Bước 3: Xác định hệ ràng buộc
Ràng buộc tài nguyên sử dụng:
● Về diện tích đất: 2x₁ + 3x₂ ≤ 50
● Về nước tưới: 6x₁ + 4x₂ ≤ 90
● Về lao động: 15x₁+12x₂ ≤ 250
● Ràng buộc tự nhiên: x₁, x₂ ≥ 0
Cách thực hiện:
Bước 1: Thiết lập bảng tính

Hình 2.19: Thiết lập bảng tính


Giả định như biến x1 và x2 sẽ bằng 1, sau đó ta nhập các hệ ràng buộc tài nguyên về
diện tích, nước tưới và nhân công, rồi dùng hàm Sumproduct nhằm tính các giá trị vế
trái theo như biến đã khởi tạo.
Bước 2: Chọn lệnh Data ➝ Analysis ➝ Solver
Hình 2.20: Hộp thoại Solver Parameter
Nhập ô chứa mục tiêu Set Objective là ô sẽ chứa lợi nhuận tối đa E5. Đến Max vì
đây là bài toán tối đa hóa lợi nhuận. By Changing Variable Cells, nhập ô chứa các
biên quyết định, trong trường hợp này là C4 và D4. Nhập các ràng buộc buộc cách
nhập Add in Subject to the Constraints.
Bước 3: Nhấn nút Solver để giải mô hình
Khai báo các lựa chọn trong hộp thoại Solver Results
● Keep Solver Solution: Giữ kết quả và in ra bảng tính.
● Restore Original Values: Huỷ kết quả vừa tìm được và trả các biến về tình
trạng ban đầu.
● Save Scenario: Lưu kết quả vừa tìm được thành một tình huống để có thể xem
lại sau này.
● Có thể xuất hiện thêm các dạng báo cáo trong kết quả: Answer, Sensitivity
và Limits
Hình 2.21: Hộp thoại Solver Results
Bước 4: Nhấn nút OK để xem kết quả:

Hình 2.23: Bảng kết quả phương án sản xuất


Kết quả cuối cùng, ta được lợi nhuận tối ta là $378 để thỏa mãn các ràng buộc

You might also like