Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 18

4.

Thống kê mô tả:
4.1 Tính thông kê mô tả cho các biện trong bộ dữ liệu:
Câu lệnh thực hiện: summary(dat)
Kết quả thu được như sau:

Có 2 biến phân loại trong bộ dữ liệu: infill_pattern và material.


Lập biểu đồ thể hiện số lượng cho 2 biến trên bằng :
Thu được kết quả:

Qua biểu đồ trên, có thể thấy:


- Với biến “material”: số lượng ABS = số lượng PLA = 25.
- Với biến “infill_pattern”: số lượng kiểu grid = số lượng kiểu honeycomb = 50.
4.2 Biểu đồ phân phối của các biến:
Biểu đồ Histogram của các biến “tension_strenght” (màu xanh lá), “elongation”
(màu đỏ) , “roughness” (màu vàng) như sau:
Câu lệnh:

Kết quả:
Phân phối của biến “roughness” thể hiện bằng biểu đồ boxplot:
Câu lệnh:

Kết quả:

Phân phối của biến “tension_strenght” thể hiện bằng biểu đồ boxplot:
Câu lệnh:
Kết quả:

Phân phối của biến “elongation” thể hiện bằng biểu đồ boxplot:
Câu lệnh:

Kết quả:

Biểu đồ phân tán của biến “tension_strenght”:


Câu lệnh:

Kết quả:

Nhận xét: Dựa vào những đồ thị phân tán của biến “tension_strenght” như trên, có
thể thấy “tension_strenght” không có quan hệ với tất cả các biến được so sánh.

Biểu đồ phân tán của biến “roughness”:


Câu lệnh:

Kết quả:
Nhận xét: Dựa vào những đồ thị phân tán của biến “roughness” như trên, có thể
thấy “roughness” có quan hệ tuyến tính khá mạnh với biến “layer_height”.

Biểu đồ phân tán của biến “elongation”:

Kết quả:
Nhận xét: Dựa vào những đồ thị phân tán của biến “elongation” như trên, có thể
thấy “elongation” không có quan hệ với tất cả các biến được so sánh.
5. Thống kê suy luận:
5.1 Mức độ ảnh hưởng của các thông số điều chỉnh đến độ nhám (roughness)
trong máy in 3D:
Các biến dự báo (độc lập) bao gồm: “layer_height”, “wall_thickness”,
“infill_desity”, “nozzel_temperature”, “bed_temperature”, “print_speed”,
“infill_pattern”, “material”.
Sử dụng mô hình hồi quy tuyến tính đa biến:
roughness= β0 + β1.layer_height + β2.wall_thickness + β3.infill_pattern + β4. nozzel_temperature +
β5.bed_temperature + β6.print_speed + β7.infill_desity +ε

Nhập câu lệnh:

Ta thu được kết quả:


Nhận xét: Giá trị p-value tương ứng với thống kê F là 3.834e-16 < 2.2e-16, có ý
nghĩa rất cao. Do vậy, có ít nhất 1 biến trong dự báo trong mô hình có ý nghĩa giải
thích rất cao cho biến “roughness”.
- Hệ số ứng với các biến dự báo “wall_thickness”, “infill_density”,
“infill_patternhoneycomb” lớn hơn mức ý nghĩa 5%, do vậy, các biến này không
có ý nghĩa đối với mô hình vừa được xây dựng, có thể loại bỏ các biến này ra mô
hình hồi quy.
Loại bỏ biến “wall_thickness”, “infill_density”, “infill_patternhoneycomb”, ra
khỏi mô hình 1, ta thu được mô hình 2:
Nhập câu lệnh:

Ta thu được kết quả:


Phân tích Anova cho mô hình 1 và 2:
+ Xây dựng giả thuyết H0: Hai mô hình có hiệu quả bằng nhau.
+ Xây dựng giả thuyết H1: Hai mô hình có hiệu quả không bằng nhau.
- Nhập câu lệnh: “anova(model_1_1, model_1_2)”.
Kết quả:

Nhận xét:
- Vì giá trị p-value = 0.7627 > 5%, do vậy chưa thể bác bỏ giả thuyết H 0. Như vậy
hai mô hình được đánh giá có hiệu quả như nhau. Nhưng trong mô hình 2, giá trị
R2 = 0.8544 > 0.8509 là giá trị R2 của mô hình 1, nghĩa là mức độ giải thích của
các biến dự báo thuộc mô hình 2 cao hơn, do đó ta chọn mô hình 2 là mô hình hồi
quy tuyến tính cho biến “roughness”.
Roughness=-2310.7356+1246,5353.layer_height+14,7774.nozzle_temperature-
15,8078.bed_temperature+0,5538.print_speed+294,1610.materialpla

Vẽ đồ thị kiểm tra các giả định của mô hình 2:

Nhận xét mô hình:


- Trong đồ thị Residual vs Fitted: đường màu đỏ nằm gần đường thẳng
residuals=0, do vậy giả định sai số có kỳ vọng bằng 0 thỏa mãn. Các điểm sai số
phân tán ngẫu nhiên dọc theo đường màu đỏ, vì vậy giả định phương sai các sai số
là hằng số thoả mãn.
- Trong đồ thị Q-Q Residuals: các điểm sai số nằm khá sát với đường thẳng kỳ
vọng phân phối chuẩn, vì vậy giả định sai số có phân phối chuẩn thỏa mãn.
- Trong đồ thị Scale-Location: đường màu đỏ tương đối nằm ngang và các điểm
sai số phân bố ngẫu nhiên theo đường màu đỏ, do đó giả định phương sai các sai
số là hằng số thỏa mãn.
- Trong đồ thị Residuals vs Leverage: các điểm 5, 23, 24 khả năng cao ảnh hưởng
cho bộ dữ liệu, nhưng chưa cần phải loại bỏ vì vẫn nằm dưới đường Cook’s
distance.
5.2 Mức độ ảnh hưởng của các thông số điều chỉnh đến độ căng
(tension_strenght) trong máy in 3D:
Các biến dự báo (độc lập) bao gồm: “layer_height”,”wall_thickness”,
“infill_desity”, “nozzel_temperature”, “bed_temperature”, “print_speed”,
“infill_pattern”, “material”.
Sử dụng mô hình hồi quy tuyến tính đa biến:
tension_strenght= β0 + β1.layer_height + β2.wall_thickness + β3.infill_pattern + β4.
nozzel_temperature + β5.bed_temperature + β6.print_speed + β7.infill_desity +ε

Ta ước lượng các hệ số βi:

Thu được kết qủa như sau:


Nhận xét:
Giá trị p-value tương ứng với thống kê F là 6.19e-08 <0.05, có ý nghĩa rất cao. Do
vậy, có ít nhất 1 biến trong dự báo trong mô hình có ý nghĩa giải thích rất cao cho
biến “tension_strenght”.
Hệ số ứng với các biến dự báo “print_speed”, “infill_patternhoneycomb” lớn hơn
mức ý nghĩa 5%, do vậy, các biến này không có ý nghĩa đối với mô hình vừa được
xây dựng, có thể loại bỏ các biến này ra mô hình hồi quy.

Loại bỏ biến “print_speed” và “infill_patternhoneycomb” ra khỏi mô hình 1, ta


thu được mô hình 2:

Phân tích Anova cho mô hình 1 và 2:


+ Xây dựng giả thuyết H0: Hai mô hình có hiệu quả bằng nhau.
+ Xây dựng giả thuyết H1: Hai mô hình có hiệu quả không bằng nhau.
- Nhập câu lệnh: “anova(model_2_1, model_2_2)”.
Kết quả:
Nhận xét:
- Vì giá trị p-value = 0.6745 > 5%, do vậy chưa thể bác bỏ giả thuyết H 0. Như vậy
hai mô hình được đánh giá có hiệu quả như nhau. Nhưng trong mô hình 2, giá trị
R2 = 0.6201 > 0.6092 là giá trị R2 của mô hình 1, nghĩa là mức độ giải thích của
các biến dự báo thuộc mô hình 2 cao hơn, do đó ta chọn mô hình 2 là mô hình hồi
quy tuyến tính cho biến “tension_strenght”.
tension_strenght=167,02463+56,36695.layer_height+1,11169.wall_thickness+0,
16643.infill_density-1,02890.nozzel_temperature+0,98346.bed_temperature-
17,10365.materialpla.

Đồ thị kiểm tra các giả định cho mô hình 2:


- Trong đồ thị Residual vs Fitted: đường màu đỏ nằm gần đường thẳng
residuals=0, do vậy giả định sai số có kỳ vọng bằng 0 thỏa mãn. Các điểm sai số
phân tán ngẫu nhiên dọc theo đường màu đỏ, vì vậy giả định phương sai các sai số
là hằng số thoả mãn.
- Trong đồ thị Q-Q Residuals: các điểm sai số nằm khá sát với đường thẳng kỳ
vọng phân phối chuẩn, vì vậy giả định sai số có phân phối chuẩn thỏa mãn.
- Trong đồ thị Scale-Location: đường màu đỏ tương đối nằm ngang và các điểm
sai số phân bố ngẫu nhiên theo đường màu đỏ, do đó giả định phương sai các sai
số là hằng số thỏa mãn.
- Trong đồ thị Residuals vs Leverage: đường Cook’s distance không được hiển
thị, do vậy không tồn tại giá trị nào ảnh hưởng đến bộ dữ liệu cần được loại bỏ.
5.3 Mức độ ảnh hưởng của các thông số điều chỉnh đến độ giãn dài
(elongation) trong máy in 3D:
Các biến dự báo (độc lập) bao gồm: “layer_height”,”wall_thickness”,
“infill_desity”, “nozzel_temperature”, “bed_temperature”, “print_speed”,
“infill_pattern”, “material”.
Sử dụng mô hình hồi quy tuyến tính đa biến:
elongation= β0 + β1.layer_height + β2.wall_thickness + β3.infill_pattern + β4. nozzel_temperature +
β5.bed_temperature + β6.print_speed + β7.infill_desity +ε

Ta ước lượng các hệ số βi:

Thu được kết quả:


Nhận xét:
Giá trị p-value tương ứng với thống kê F là 4.765e-09 < 0.05. Do vậy, có ít nhất 1
biến trong dự báo trong mô hình có ý nghĩa giải thích rất cao cho biến
“elongation”.
Hệ số ứng với các biến dự báo “wall_thickness”, “print_speed”,
“infill_patternhoneycomb” lớn hơn mức ý nghĩa 5%, nên chưa thể phủ định H 0.
Do vậy, các biến này không có ý nghĩa đối với mô hình vừa được xây dựng, có
thể loại bỏ các biến này ra mô hình hồi quy.
Loại bỏ biến “wall_thickness”, “print_speed”, “infill_patternhoneycomb” khỏi mô
hình 1:

Thu được kết quả:


Phân tích Anova cho mô hình 1 và 2:
+ Xây dựng giả thuyết H0: Hai mô hình có hiệu quả bằng nhau.
+ Xây dựng giả thuyết H1: Hai mô hình có hiệu quả không bằng nhau.
- Nhập câu lệnh: “anova(model_3_1, model_3_2)”.
Kết quả:

Nhận xét:
- Vì giá trị p-value = 0.4898 > 5%, do vậy chưa thể bác bỏ giả thuyết H 0. Như vậy
hai mô hình được đánh giá có hiệu quả như nhau. Nhưng trong mô hình 2, giá trị
R2 = 0.6642 > 0.6598 là giá trị R2 của mô hình 1, nghĩa là mức độ giải thích của
các biến dự báo thuộc mô hình 2 cao hơn, do đó ta chọn mô hình 2 là mô hình hồi
quy tuyến tính cho biến “elongation”.
elongation=19,023+6,079.layer_height+0,01.infill_density-
0,112.nozzel_temperature+0,107.bed_temperature-0,005.print_speed-
1,824.materialpla.
Vẽ đồ thị kiểm tra các giả định của mô hình 2:
Nhận xét:
- Trong đồ thị Residual vs Fitted: đường màu đỏ nằm gần đường thẳng
residuals=0, do vậy giả định sai số có kỳ vọng bằng 0 thỏa mãn. Các điểm sai số
phân tán ngẫu nhiên dọc theo đường màu đỏ, vì vậy giả định phương sai các sai số
là hằng số thoả mãn.
- Trong đồ thị Q-Q Residuals: các điểm sai số nằm khá sát với đường thẳng kỳ
vọng phân phối chuẩn, vì vậy giả định sai số có phân phối chuẩn thỏa mãn.
- Trong đồ thị Scale-Location: đường màu đỏ tương đối nằm ngang và các điểm
sai số phân bố ngẫu nhiên theo đường màu đỏ, do đó giả định phương sai các sai
số là hằng số thỏa mãn.
- Trong đồ thị Residuals vs Leverage: đường Cook’s distance không được hiển
thị, do vậy không tồn tại giá trị nào ảnh hưởng đến bộ dữ liệu cần được loại bỏ.

You might also like