Professional Documents
Culture Documents
R
R
R
- Length
- Min và Max
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of variation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
2. Purchase Orders
-Đọc file
- Length(po) và Length(Cost.per.order): Số lượng cột dữ liệu và số lượng
dòng dữ liệu theo thuộc tính Cost.per.order
- Min và Max
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of variation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
3. Computer Repair Times
- Đọc file
- Min và Max
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of Deviation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
III. Ngôn ngữ Python
1. GDP:
-Đọc file
- Min và Max
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of Deviation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
2. Purchase Orders
-Đọc file
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of Deviation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
3. Computer Repair Times
- Đọc file
- Mean
- Median
- Mode
- Range
- Variance
- Standard Deviation
- Coefficient of Deviation
- Skewness
- Kurtosis
- Quantile
- Box Plot
- Histogram
III. Excel
1. GDP
Count 30 COUNT(B4:B253)
Min 14 MIN(B4:B253)
- Histogram
- Box plot
2. Purchase Order
CÁC GIÁ TRỊ KẾT QUẢ HÀM EXCEL
Count 94 COUNT(B2:B95)
- Histogram
- Box plot
3. Computer Repair Times:
Min 5 MIN(B4:B253)
Max 40 MAX(B4:B253)
Median 14 MEDIAN(B4:B253)
Mode 15 MODE(B4:B253)
Range 35 MAX(B4:B253)-MIN((B4:B253))
Mode 15 MODE.SNGL(B4:B253)
- Histogram
- Box plot
IV. 1C
a) Null hypothesis và Alternative hypothesis
- Null hypothesis: Giả thuyết rỗng là giả thuyết có giá trị nhất
đối với phương pháp khoa học vì nó là giả thuyết dễ kiểm tra
nhất bằng cách sử dụng phân tích thống kê.
- Alternative hypothesis: Một giả thuyết thay thế chỉ đơn giản là
nghịch đảo, hoặc ngược lại của giả thuyết rỗng.
- Ví dụ:
+ Giả thuyết rỗng: Nếu một cây được tưới bằng nước ngọt
có ga trong một tháng và cây khác được tưới nước bình thường,
sẽ không có sự khác biệt về tốc độ phát triển giữa hai cây.
+ Giả thuyết thay thế: Nếu một cây được tưới bằng nước
ngọt có ga trong một tháng và cây khác được tưới nước thường,
cây được tưới bằng nước ngọt sẽ phát triển tốt hơn cây được
tưới nước thường.
b) Type I error và Type II error
- Type I error: Trong thống kê, lỗi loại I được định nghĩa là lỗi xảy ra
khi kết quả mẫu gây ra việc bác bỏ giả thuyết rỗng, mặc dù thực tế là
đúng. Nói một cách dễ hiểu, lỗi khi đồng ý với giả thuyết thay thế, khi
kết quả có thể được coi là may rủi.
- Type II error: Lỗi loại II là sự thất bại của nhà nghiên cứu trong việc
đồng ý với một giả thuyết thay thế, mặc dù nó đúng. Nó xác nhận một
mệnh đề; điều đó nên bị từ chối. Nhà nghiên cứu kết luận rằng hai
quan sát là giống hệt nhau trong khi thực tế không phải vậy.
- Sự khác biệt:
1. Lỗi loại I là lỗi xảy ra khi kết quả là sự bác bỏ giả thuyết vô hiệu,
trên thực tế, là đúng. Lỗi loại II xảy ra khi kết quả mẫu chấp nhận
giả thuyết rỗng, giả thuyết này thực tế là sai.
2. Về bản chất, kết quả dương tính tương đương với việc bác bỏ giả
thuyết vô hiệu. Ngược lại, lỗi Loại II còn được gọi là âm tính giả,
tức là kết quả âm tính, dẫn đến việc chấp nhận giả thuyết không.
3. Khi giả thuyết vô hiệu là đúng nhưng bị bác bỏ một cách nhầm lẫn
thì đó là lỗi loại I. Ngược lại, khi giả thuyết vô hiệu là sai nhưng
được chấp nhận một cách sai lầm, thì đó là lỗi loại II.
4. Lỗi loại I có xu hướng khẳng định điều gì đó không thực sự hiện
diện, tức là đó là một lần truy cập sai. Ngược lại, lỗi loại II không
xác định được thứ gì đó đang tồn tại, tức là lỗi bị bỏ sót.
5. Xác suất phạm lỗi loại I là mẫu là mức ý nghĩa. Ngược lại, khả
năng mắc lỗi loại II giống như khả năng của phép thử.
6. Chữ cái Hy Lạp ‘α’ chỉ ra lỗi loại I. Không giống như, lỗi loại II
được ký hiệu bằng chữ cái Hy Lạp ‘β’.
hay không, chúng tôi so sánh giá trị của alpha và giá trị p.
+ Giá trị p nhỏ hơn hoặc bằng alpha. Trong trường hợp này,
chúng tôi bác bỏ giả thuyết không. Khi điều này xảy ra, chúng
tôi nói rằng kết quả có ý nghĩa thống kê. Nói cách khác, chúng
tôi chắc chắn một cách hợp lý rằng có điều gì đó ngoài cơ hội
đơn thuần đã cho chúng tôi một mẫu quan sát.
+ Giá trị p lớn hơn alpha. Trong trường hợp này, chúng tôi không
thể bác bỏ giả thuyết vô hiệu . Khi điều này xảy ra, chúng tôi
nói rằng kết quả không có ý nghĩa thống kê. Nói cách khác,
chúng tôi chắc chắn một cách hợp lý rằng dữ liệu quan sát của
chúng tôi có thể được giải thích một cách tình cờ.