Professional Documents
Culture Documents
Stat and Intro Exp Chapter 1 - 2
Stat and Intro Exp Chapter 1 - 2
พื้นฐานความรูทางสถิติ
040503014 สถิติและการวางแผนการทดลองเบื้องตน
Printed copy for personal use only. Please do not distribute any parts outside of this class. 2
ขอบขายของสถิติ
สถิติในความหมายที่เปนศาสตรจําแนกออกไดเปน 2 สาขาใหญ ไดแก
1. สถิติพรรณนา (Descriptive statistics)
2. สถิติอนุมาน (Inferential statistics)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 3
ระเบียบวิธีการทางสถิติ (Statistical Methods)
• การวางแผน
• การเก็บรวบรวมขอมูล
• การวิเคราะหขอมูล
• การอธิบายผลการวิเคราะหขอมูล
• การนําเสนอขอมูล เพื่อนําไปสูการสรุปผล
Printed copy for personal use only. Please do not distribute any parts outside of this class. 4
คาสังเกต
หมายถึง คาที่ไดจากการสังเกต การวัด การนับ หรือ การสัมภาษณ จาก
หนวยประชากร หรือหนวยตัวอยางหนึ่งหนวย
ขอมูล (Data)
หมายถึง กลุมของคาสังเกตที่เก็บรวบรวมเพื่อศึกษาเรื่องใดเรื่องหนึ่งซึ่ง
อาจเปนตัวเลขหรือไมก็ได (คาสังเกตมากกวาหนึ่งคาจึงจะถือเปนขอมูลสถิต)ิ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 5
ขอมูล (Data)
จําแนกตามแหลงที่มาได 2 ประเภท คือ
1. ขอมูลปฐมภูมิ (Primary data) หมายถึง ขอมูลที่ผูใชตองเก็บรวบรวม
จากแหลงที่มาของขอมูลโดยตรง เชน การสัมภาษณโดยตรง การตอบ
แบบสอบถาม
2. ขอมูลทุติยภูมิ (Secondary data) หมายถึง ขอมูลที่ผูใชไมตองเก็บ
รวบรวมขอมูลตัวตนเอง
Printed copy for personal use only. Please do not distribute any parts outside of this class. 6
ขอมูล (Data)
จําแนกตามลักษณะขอมูลได 2 ประเภท คือ
1. ขอมูลเชิงปริมาณ (Quantitative data) เปนขอเท็จจริงที่เปนตัวเลข
เชน จํานวน ปริมาณ ระยะทาง ราคา เปนตน
2. ขอมูลเชิงคุณภาพ (Qualitative data) หมายถึง ขอเท็จจริงที่ไมเปน
ตัวเลข เชน เพศ ศาสนา อาชีพ สถานภาพการสมรส ระดับการศึกษา
Printed copy for personal use only. Please do not distribute any parts outside of this class. 7
ขอมูล (Data)
จําแนกตามลักษณะการเก็บรวบรวมขอมูล แยกไดเปน 2 ชนิดคือ
1. ขอมูลที่ไดจากการสํารวจ (Survey Data) ไดแก ขอมูลที่มีอยูแลวเมื่อ
ตองการทําก็ทําการเก็บรวบรวมมาดวยวิธีใดวิธีหนึ่ง
2. ขอมูลที่ไดจากการทดลอง (Experimental data) ไดแก ขอมูลที่ไมได
เกิดขึ้นตามธรรมชาติ เมื่อตองการใชจะตองทําการทดลองกอนจึงจะไดขอมูลนั้นมา
Printed copy for personal use only. Please do not distribute any parts outside of this class. 8
ตัวแปร (Variable)
หมายถึง ลักษณะเฉพาะที่เราสนใจศึกษาจากหนวยของตัวอยางหรือ
ประชากรซึ่งจะมีคาแตกตางกันไป โดยมีขอสมมติวาคาที่แตกตางกันไดจากหนวย
ตัวอยางที่แตกตางกัน
Printed copy for personal use only. Please do not distribute any parts outside of this class. 9
ตัวแปร (Variable)
ประเภทของตัวแปร จําแนกเปน 2 ประเภท คือ
ตัวแปรเชิงปริมาณ (Quantitative variable)
ตัวแปรที่มีลักษณะเปนตัวเลขที่สามารถบอกขนาด ปริมาณ หรือจํานวนได
Printed copy for personal use only. Please do not distribute any parts outside of this class. 10
ตัวแปร (Variable)
ประเภทของตัวแปร จําแนกเปน 2 ประเภท คือ
2. ตัวแปรเชิงคุณภาพหรือตัวแปรเชิงกลุม (Qualitative or categorical
variable) ตัวแปรที่มีลักษณะของความแตกตางกันเปนกลุมๆ ไมสามารถวัดคา
ออกมาเปนตัวเลขได
Printed copy for personal use only. Please do not distribute any parts outside of this class. 11
ตัวแปร (Variable)
จําแนกตามความเปนเหตุเปนผลได 2 ประเภท คือ
1. ตัวแปรอิสระ (Independent variable) คือ ตัวแปรซึ่งเมื่อคาของตัว
แปรเปลี่ยนจะสงผลกระทบกระเทือนตอคาของตัวแปรอื่น
2. ตัวแปรตาม (Dependent variable) คือ ตัวแปรซึ่งคาของตัวแปร
ขึ้นอยูกับคาของตัวแปรอิสระ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 12
ระดับของการวัด หรือ มาตราการวัด
ขอมูล (Data)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 18
บทที่ 2
การจัดและอธิบายขอมูล
40503014 สถิติและการวางแผนการทดลองเบื้องตน
Printed copy for personal use only. Please do not distribute any parts outside of this class. 20
แผนภาพจุด (Dot diagram)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 21
ฮิสโตแกรม รูปหลายเหลี่ยมแหงความถี่ โคงความถี่
15
ฮีสโตแกรม
F requenc y
10
0
24 28 32 36 40 44
Age
15
รูปหลายเหลี่ยมแหงความถี่
F requenc y
10
0
24 28 32 36 40 44
Age
Printed copy for personal use only. Please do not distribute any parts outside of this class. 22
การวัดแนวโนมเขาสูสวนกลาง (Central tendency)
ฐานนิยม (Mode)
คาวัดแนวโนม
เขาสูสวนกลาง มัธยฐาน (Median)
คาเฉลี่ยเลขคณิต (Mean)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 23
ฐานนิยม (Mode)
หมายถึง คาของขอมูลที่มีจํานวนซ้ํากันมากที่สุด โดยขอมูลชุดหนึ่งอาจมี
คาฐานนิยมเพียงหนึ่งคา หรือมากกวา 1 คา หรือไมมีฐานนิยมก็ได
Printed copy for personal use only. Please do not distribute any parts outside of this class. 24
มัธยฐาน (Median)
กําหนดใหคาของขอมูลที่นํามาเรียงตามลําดับจากนอยไปมากแลวแตละ
คาแทนดวย
1. เมื่อ N เปนจํานวนคี่ x x x 1 2 N
xN 1
Med
2
2. เมื่อ N เปนจํานวนคู
xN xN
1
Med 2 2
2
Printed copy for personal use only. Please do not distribute any parts outside of this class. 25
คาเฉลี่ยเลขคณิต (Arithmetic Mean, Mean)
คาเฉลี่ยของประชากร
N
x i
i 1
N
คาเฉลี่ยของตัวอยาง
n
x i
x i 1
n
เมื่อ xiคือ คาของขอมูลตัวที่ i
N คือ ขนาดของประชากร
n คือ ขนาดของตัวอยาง
Printed copy for personal use only. Please do not distribute any parts outside of this class. 26
ตัวอยาง
จงหาคาเฉลี่ย มัธยฐาน และฐานนิยมของขอมูลตอไปนี้
1. 1, 2, 5, 5, 8, 10
2. 1, 2, 5, 5, 8, 100
คาวัด
แนวโนมเขา คาเฉลี่ย มัธยฐาน ฐานนิยม
สูสวนกลาง
• ใชในการเปรียบเทียบ • คามัธยฐานจะไมถูก • คาฐานนิยมจะไมถูก
ขอมูลเชิงปริมาณได กระทบกระเทือน กระทบกระเทือนเมือ่ มีขอมูล
ขอดี หลายชุด เมื่อมีขอมูลที่มคี า ที่ผิดปกติ
• สะดวกในการคํานวน ผิดปกติ • เหมาะสําหรับวัดคากลางทั้ง
ถึงแมจะเก็บขอมูลได ขอมูลเชิงคุณภาพและเชิง
ไมครบ ปริมาณ
• ใชไดกับขอมูลเชิง • ใชไดกับขอมูลเชิง • กรณีที่ไมมีคาของขอมูลซ้ํา
ปริมาณเทานั้น ปริมาณเทากัน กันจะไมมีฐานนิยม
ขอเสีย
• คาเฉลี่ยจะไมใชคา • ฐานนิยมอาจมีมากกวา 1 คา
กลางที่ดี ถามีคา
ผิดปกติ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 28
ความสัมพันธระหวางคาเฉลี่ย คามัธยฐาน และฐานนิยม
กราฟเสนโคงความถี่ของขอมูลจะแบงเสนโคงได 3 ลักษณะ คือ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 29
Descriptive Statistics and the Normal Distribution
Heights of men and women
The graph shows two distributions, one for men and one for women
(each roughly following the classic bell-curve shape of a statistical normal
distribution).
30
IQ Score Distribution
31
การกระจายตัวของรายไดครัวเรือนในประเทศไทย
TDRI, 2553
32
33
การวัดการกระจาย (Measure of Variation)
ขอมูลชุดที่ 1 : 20 , 30 , 40 , 50 , 60 , 70
ขอมูลชุดที่ 2 : 40 , 43 , 44 , 46 , 47 , 50
คาเฉลี่ยของขอมูลชุดที่ 1 =
คาเฉลี่ยของขอมูลชุดที่ 2 =
Printed copy for personal use only. Please do not distribute any parts outside of this class. 34
การวัดการกระจาย (Measure of Variation)
• พิสัย (Range: R)
• พิสัยควอไทล (Interquartile Range: IQR)
• ความแปรปรวน (Variance)
• สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 35
การวัดการกระจาย
พิสัยควอไทล
IQR Q3 Q1
(Interquartile Range: IQR)
n
( xi ) 2
ความแปรปรวนของตัวอยาง 1 n
s 2
( xi2 i 1
)
(Sample Variance: s2) n 1 i 1 n
n
สวนเบี่ยงเบนมาตรฐานของตัวอยาง n
( xi ) 2
1
(Sample Standard Deviation: s) s ( xi2 i 1
)
n 1 i 1 n
Printed copy for personal use only. Please do not distribute any parts outside of this class. 36
การวัดการกระจาย
ประชากร ตัวอยาง
N n
ความแปรปรวน (x ) i
2
(x x )
i
2
2 i 1
S2 i 1
N n 1
N n
สวนเบี่ยงเบนมาตรฐาน ( xi )2 (x x ) i
2
i 1 S i 1
N n 1
Printed copy for personal use only. Please do not distribute any parts outside of this class. 37
การวัดการกระจาย
การกระจายตํา
การกระจายสูง
ลักษณะการกระจายของขอมูลที่มีโคงความถี่เปนแบบปกติ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 38
การวัดสัมประสิทธิ์การกระจายหรือการกระจายสัมพัทธ
สัมประสิทธิ์ของพิสัย (Coefficient of range)
max min
สัมประสิทธิ์ของพิสัย =
max min
ถาขอมูลชุดใดมีคาสัมประสิทธการกระจายสูงกวา แสดงวาขอมูลชุดนั้นมีการกระจายสูงกวา
Printed copy for personal use only. Please do not distribute any parts outside of this class. 39
แผนภูมิลําตนและใบ(Stem and Leaf)
• เปนการนําเสนอขอมูลโดยใชคาของขอมูลจริงทุกคา ทําใหสามารถเห็นลักษณะที่
แทจริงของขอมูลได
• หลักการคือคาขอมูลจะตองแบงออกเปนสองสวนได สวนหนึ่งเปนลําตน อีกสวนหนึ่ง
เปนใบ
• การนําเสนอขอมูลดวยแผนภาพลําตนและใบ คาของขอมูลเปนตัวเลขอยางนอย 2
หลัก
Printed copy for personal use only. Please do not distribute any parts outside of this class. 40
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :
Printed copy for personal use only. Please do not distribute any parts outside of this class. 41
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :
2 :9
3 :26
4 :1256778
5 :01223345555889
6 :01236678
7 :0247
8 :02
9 :8
10 : 0
Printed copy for personal use only. Please do not distribute any parts outside of this class. 42
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :
2 :9
3 :26
4 :1256778
5 :01223345555889
6 :01236678
7 :0247
8 :02
Leaf (หลักหนวย)
9 :8
10 : 0
Stem (หลักสิบและหลักรอย)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 43
ตัวอยางแผนภูมิลําตนและใบ การคํานวณ leave unit
นําตัวเลขที่เขียนในแผนภาพคูณดวย
leave unit จะตองมีคาตรงกับขอมูล
2 :9
5 :01223345555889
3 :26
4 :1256778
5 :01223345555889
6 :01236678
6 :01236678
4 :1256778
7 :0247
8 :02
7 :0247
9 :8
3 :26
8 :02
2 :9
9 :8
10 : 0
10 : 0
leave unit มีคาเทากับ 1.0
Printed copy for personal use only. Please do not distribute any parts outside of this class. 44
Box Plot or Box and Whiskers Plot
เปนแผนภูมิที่ใชคาสถิติ 5 คา ดังนี้
ตัวอยาง
Printed copy for personal use only. Please do not distribute any parts outside of this class. 45
ขั้นตอนการสราง Box-Plot เปนการแบงขอมูล
ออกเปน 4 สวนเทาๆ
ขั้นที่ 1 หาคา min และ max ควอรไทล (Quartile)
ขั้นที่ 2 คํานวณหาคามัธยฐาน Q1 Q3 และ IQR Qr X r ; r 1, 2,...,3
( n 1)
4
ขั้นที่ 3 คํานวณหาขอบเขตลาง (fL ) และขอบเขตบน (fu ) ของขอมูล ดังนี้
fL = Q1 - (1.5*IQR)
fU = Q3 + (1.5*IQR)
ขั้นที่ 4 สรางแกนนอนใหครอบคลุมคาสูงสุดและคาต่ําสุดของขอมูล
สรางกลองโดยใหเสนซายมือเปนตําแหนงของ Q1 และเสนทางขวามือเปน
ตําแหนงของ Q3 และลากเสนตั้งภายในที่ตําแหนงมัธยฐาน
ขั้นที่ 5 ลากเสนตรงในแนวนอนออกจากกรอบสี่เหลี่ยมทั้งสองดาน
Printed copy for personal use only. Please do not distribute any parts outside of this class. 46
ขั้นตอนการสราง Box-Plot
ขั้นที่ 5
- กรณีที่ไมมีขอมูลผิดปกติ ทุกคาของขอมูลอยูภายใน fL และ fu ใหลากเสนตรงออก
จากกรอบทางดานซายไปจนถึงตําแหนงของขอมูลที่มีคาต่ําสุด และลากเสนตรงออก
จากกรอบทางดานขวาไปจนถึงตําแหนงของขอมูลที่มีคาสูงสุด เรียกเสนทั้งสองนี้วา
“หนวด” (Whisker)
ค่าตําสุ ด ค่าสูงสุ ด
fL Q1 Q2 Q3 fU
ขอบเขตล่าง ขอบเขตบน
Printed copy for personal use only. Please do not distribute any parts outside of this class. 47
ขั้นตอนการสราง Box-Plot
- กรณีที่มีขอมูลผิดปกติ นั่นคือ มีบางคาของขอมูลอยูนอก fL และ fu ใหลากเสนตรงออก
จากกรอบทั้งสองดานไปจนถึงคาต่ําสุดและคาสูงสุดของขอมูลที่มีคาอยูภายใน fL และ fu
สวนขอมูลที่มีคาอยูนอกขอบเขตบนและขอบเขตลางจะถือเปนขอมูลผิดปกติ และแทน
ขอมูลผิดปกตินี้ดวยเครื่องหมายดอกจัน (*)
ค่าข้อมูลทีผิดปกติ ค่าข้อมูลทีผิดปกติ
(ตํากว่าปกติ) (สูงกว่าปกติ)
* *
fL Q1 Q2 Q3 fU
Printed copy for personal use only. Please do not distribute any parts outside of this class. 48
ความหมายของ Box-Plot
1. การแจกแจงของขอมูล จะพิจารณาจากคามัธยฐาน
2. การวัดการกระจายของขอมูล จะพิจารณาจากความกวางของกรอบสี่เหลี่ยม
- ถากรอบสี่เหลี่ยมมีความกวางมาก แสดงวาขอมูลมีการกระจายมาก
- ถากรอบสี่เหลี่ยมมีความกวางนอย แสดงวาขอมูลมีการกระจายนอย
Printed copy for personal use only. Please do not distribute any parts outside of this class. 49