Download as pdf or txt
Download as pdf or txt
You are on page 1of 49

บทที่ 1

พื้นฐานความรูทางสถิติ
040503014 สถิติและการวางแผนการทดลองเบื้องตน

อาจารย ดร.มูรตี สมบูรณ


ความหมายของสถิติ (Statistics)
สถิติ หมายถึง ศาสตรที่วาดวยการเก็บรวบรวมขอมูล นําเสนอ
ขอมูลและการวิเคราะหขอมูล เพื่อหาขอสรุปเกี่ยวกับลักษณะของสิ่งที่
สนใจศึกษา

Printed copy for personal use only. Please do not distribute any parts outside of this class. 2
ขอบขายของสถิติ
สถิติในความหมายที่เปนศาสตรจําแนกออกไดเปน 2 สาขาใหญ ไดแก
1. สถิติพรรณนา (Descriptive statistics)
2. สถิติอนุมาน (Inferential statistics)

Printed copy for personal use only. Please do not distribute any parts outside of this class. 3
ระเบียบวิธีการทางสถิติ (Statistical Methods)
• การวางแผน
• การเก็บรวบรวมขอมูล
• การวิเคราะหขอมูล
• การอธิบายผลการวิเคราะหขอมูล
• การนําเสนอขอมูล เพื่อนําไปสูการสรุปผล

Printed copy for personal use only. Please do not distribute any parts outside of this class. 4
คาสังเกต
หมายถึง คาที่ไดจากการสังเกต การวัด การนับ หรือ การสัมภาษณ จาก
หนวยประชากร หรือหนวยตัวอยางหนึ่งหนวย

ขอมูล (Data)
หมายถึง กลุมของคาสังเกตที่เก็บรวบรวมเพื่อศึกษาเรื่องใดเรื่องหนึ่งซึ่ง
อาจเปนตัวเลขหรือไมก็ได (คาสังเกตมากกวาหนึ่งคาจึงจะถือเปนขอมูลสถิต)ิ

Printed copy for personal use only. Please do not distribute any parts outside of this class. 5
ขอมูล (Data)
จําแนกตามแหลงที่มาได 2 ประเภท คือ
1. ขอมูลปฐมภูมิ (Primary data) หมายถึง ขอมูลที่ผูใชตองเก็บรวบรวม
จากแหลงที่มาของขอมูลโดยตรง เชน การสัมภาษณโดยตรง การตอบ
แบบสอบถาม
2. ขอมูลทุติยภูมิ (Secondary data) หมายถึง ขอมูลที่ผูใชไมตองเก็บ
รวบรวมขอมูลตัวตนเอง

Printed copy for personal use only. Please do not distribute any parts outside of this class. 6
ขอมูล (Data)
จําแนกตามลักษณะขอมูลได 2 ประเภท คือ
1. ขอมูลเชิงปริมาณ (Quantitative data) เปนขอเท็จจริงที่เปนตัวเลข
เชน จํานวน ปริมาณ ระยะทาง ราคา เปนตน
2. ขอมูลเชิงคุณภาพ (Qualitative data) หมายถึง ขอเท็จจริงที่ไมเปน
ตัวเลข เชน เพศ ศาสนา อาชีพ สถานภาพการสมรส ระดับการศึกษา

Printed copy for personal use only. Please do not distribute any parts outside of this class. 7
ขอมูล (Data)
จําแนกตามลักษณะการเก็บรวบรวมขอมูล แยกไดเปน 2 ชนิดคือ
1. ขอมูลที่ไดจากการสํารวจ (Survey Data) ไดแก ขอมูลที่มีอยูแลวเมื่อ
ตองการทําก็ทําการเก็บรวบรวมมาดวยวิธีใดวิธีหนึ่ง
2. ขอมูลที่ไดจากการทดลอง (Experimental data) ไดแก ขอมูลที่ไมได
เกิดขึ้นตามธรรมชาติ เมื่อตองการใชจะตองทําการทดลองกอนจึงจะไดขอมูลนั้นมา

Printed copy for personal use only. Please do not distribute any parts outside of this class. 8
ตัวแปร (Variable)
หมายถึง ลักษณะเฉพาะที่เราสนใจศึกษาจากหนวยของตัวอยางหรือ
ประชากรซึ่งจะมีคาแตกตางกันไป โดยมีขอสมมติวาคาที่แตกตางกันไดจากหนวย
ตัวอยางที่แตกตางกัน

Printed copy for personal use only. Please do not distribute any parts outside of this class. 9
ตัวแปร (Variable)
ประเภทของตัวแปร จําแนกเปน 2 ประเภท คือ
ตัวแปรเชิงปริมาณ (Quantitative variable)
ตัวแปรที่มีลักษณะเปนตัวเลขที่สามารถบอกขนาด ปริมาณ หรือจํานวนได

1.1 ตัวแปรไมตอเนื่อง เปน ตัวแปรที่มีคาเปนจํานวนที่สามารถนับได เชน 1, 2

1.2 ตัวแปรตอเนื่อง เปนตัวแปรที่มีคาเปนจํานวนจริงใดๆ ที่อยูในชวงที่


ตอเนื่องกัน โดยคาของตัวแปรที่อยูในชวงนั้นจะมีเปนจํานวนอนันตหรือนับไมถวน
เชน 1 < อายุ < 59 และ 12 < น้ําหนัก < 90

Printed copy for personal use only. Please do not distribute any parts outside of this class. 10
ตัวแปร (Variable)
ประเภทของตัวแปร จําแนกเปน 2 ประเภท คือ
2. ตัวแปรเชิงคุณภาพหรือตัวแปรเชิงกลุม (Qualitative or categorical
variable) ตัวแปรที่มีลักษณะของความแตกตางกันเปนกลุมๆ ไมสามารถวัดคา
ออกมาเปนตัวเลขได

Printed copy for personal use only. Please do not distribute any parts outside of this class. 11
ตัวแปร (Variable)
จําแนกตามความเปนเหตุเปนผลได 2 ประเภท คือ
1. ตัวแปรอิสระ (Independent variable) คือ ตัวแปรซึ่งเมื่อคาของตัว
แปรเปลี่ยนจะสงผลกระทบกระเทือนตอคาของตัวแปรอื่น
2. ตัวแปรตาม (Dependent variable) คือ ตัวแปรซึ่งคาของตัวแปร
ขึ้นอยูกับคาของตัวแปรอิสระ

Printed copy for personal use only. Please do not distribute any parts outside of this class. 12
ระดับของการวัด หรือ มาตราการวัด

มาตรานามบัญญัติ (Nominal scale)

มาตราอันดับ (Ordinal scale)

มาตราอันตรภาค (Interval scale)

มาตราอัตราสวน (Ratio scale)


มาตรานามบัญญัติ (Nominal scale)
ขอมูลมาตราวัดนี้ เปนขอมูล
• เชิงลักษณะ หรือ ขอมูลเชิงคุณภาพ
• จัดกลุมตามคุณสมบัติที่กําหนด
• บอกความแตกตางได
• ไมสามารถเรียงลําดับความแตกตางได

วิธีการทางสถิติที่ใชกับขอมูลระดับนี้ ไดแก การแจกแจงความถี่ ฐานนิยม


Printed copy for personal use only. Please do not distribute any parts outside of this class. 14
มาตราอันดับ (Ordinal scale)
ขอมูลมาตราวัดนี้ เปนขอมูล
• เชิงลักษณะ หรือ ขอมูลเชิงคุณภาพ
• จัดกลุมตามคุณสมบัติที่กําหนด
• บอกความแตกตางได
• สามารถเรียงลําดับความแตกตางได

วิธีการทางสถิติที่ใชกับขอมูลระดับนี้ ไดแก มัธยฐาน เปอรเซ็นตไทล สวนเบี่ยงเบนควอไทล


Printed copy for personal use only. Please do not distribute any parts outside of this class. 15
มาตราอันตรภาค (Interval scale)
ขอมูลมาตราวัดนี้ เปนขอมูล
• ขอมูลเชิงปริมาณ
• บอกความแตกตางได เรียงลําดับได
• มีขนาดความตางที่ชวงวัดแตละหนวยมีระยะหางเทากัน
• ขอมูลอยูในรูปของตัวเลขที่มีความหมายเชิงคํานวณ
• สามารถเปรียบเทียบระหวางขอมูลไดวามีความมากนอยตางกันอยางไร
• คา 0 ในระดับนี้ เปน “ศูนยสมมติ” จึงไมสามารถบอกความแตกตางเปนจํานวน
เทาได

วิธีการทางสถิติที่ใชกับขอมูลระดับนี้ ไดแก มัธยฐาน ฐานนิยม คาเฉลี่ย


Printed copy for personal use only. Please do not distribute any parts outside of this class. 16
มาตราอัตราสวน (Ratio scale)
ขอมูลมาตราวัดนี้ เปนขอมูล
• มีลักษณะขอมูลเหมือนมาตราอันตรภาค
• แตกตางจากมาตราอันตรภาค ตรงที่ คา 0 ในระดับนี้
เปน “ศูนยแท” กลาวคือ ไมมีอะไรเลย

วิธีการทางสถิติที่ใชกับขอมูลระดับนี้ ไดแก มัธยฐาน ฐานนิยม คาเฉลี่ย


Printed copy for personal use only. Please do not distribute any parts outside of this class. 17
ประเภทของขอมูลและระดับการวัด

ขอมูล (Data)

แบงกลุม (Categorical) ตัวเลข (Numerical)


คุณลักษณะ (Qualitative) ปริมาณ (Quantitative)

นามบัญญัติ อันดับ อันตรภาค อัตราสวน


Nominal Ordinal Interval Ratio

Printed copy for personal use only. Please do not distribute any parts outside of this class. 18
บทที่ 2
การจัดและอธิบายขอมูล
40503014 สถิติและการวางแผนการทดลองเบื้องตน

อาจารย ดร.มูรตี สมบูรณ


การวิเคราะหขอมูลเชิงปริมาณ
1. แผนภาพจุด (Dot diagram)
2. ตารางการแจกแจงความถี่ (Frequency distribution)
3. ฮิสโตแกรม
4. โพลิกอน
5. เสนโคงความถี่
6. การวัดแนวโนมเขาสูสวนกลาง
7. การวัดการกระจาย

Printed copy for personal use only. Please do not distribute any parts outside of this class. 20
แผนภาพจุด (Dot diagram)

Printed copy for personal use only. Please do not distribute any parts outside of this class. 21
ฮิสโตแกรม รูปหลายเหลี่ยมแหงความถี่ โคงความถี่

His togram of age


20

15

ฮีสโตแกรม
F requenc y

10

0
24 28 32 36 40 44
Age

His togram of age


20

15

รูปหลายเหลี่ยมแหงความถี่
F requenc y

10

0
24 28 32 36 40 44
Age

Printed copy for personal use only. Please do not distribute any parts outside of this class. 22
การวัดแนวโนมเขาสูสวนกลาง (Central tendency)

ฐานนิยม (Mode)

คาวัดแนวโนม
เขาสูสวนกลาง มัธยฐาน (Median)

คาเฉลี่ยเลขคณิต (Mean)

Printed copy for personal use only. Please do not distribute any parts outside of this class. 23
ฐานนิยม (Mode)
หมายถึง คาของขอมูลที่มีจํานวนซ้ํากันมากที่สุด โดยขอมูลชุดหนึ่งอาจมี
คาฐานนิยมเพียงหนึ่งคา หรือมากกวา 1 คา หรือไมมีฐานนิยมก็ได

Printed copy for personal use only. Please do not distribute any parts outside of this class. 24
มัธยฐาน (Median)
กําหนดใหคาของขอมูลที่นํามาเรียงตามลําดับจากนอยไปมากแลวแตละ
คาแทนดวย
1. เมื่อ N เปนจํานวนคี่ x  x   x 1 2 N

xN 1
Med 
2

2. เมื่อ N เปนจํานวนคู
xN  xN
1
Med  2 2
2

Printed copy for personal use only. Please do not distribute any parts outside of this class. 25
คาเฉลี่ยเลขคณิต (Arithmetic Mean, Mean)
คาเฉลี่ยของประชากร
N

x i
 i 1
N

คาเฉลี่ยของตัวอยาง
n

x i
x i 1
n
เมื่อ xiคือ คาของขอมูลตัวที่ i
N คือ ขนาดของประชากร
n คือ ขนาดของตัวอยาง

Printed copy for personal use only. Please do not distribute any parts outside of this class. 26
ตัวอยาง
จงหาคาเฉลี่ย มัธยฐาน และฐานนิยมของขอมูลตอไปนี้
1. 1, 2, 5, 5, 8, 10

2. 1, 2, 5, 5, 8, 100
คาวัด
แนวโนมเขา คาเฉลี่ย มัธยฐาน ฐานนิยม
สูสวนกลาง
• ใชในการเปรียบเทียบ • คามัธยฐานจะไมถูก • คาฐานนิยมจะไมถูก
ขอมูลเชิงปริมาณได กระทบกระเทือน กระทบกระเทือนเมือ่ มีขอมูล
ขอดี หลายชุด เมื่อมีขอมูลที่มคี า ที่ผิดปกติ
• สะดวกในการคํานวน ผิดปกติ • เหมาะสําหรับวัดคากลางทั้ง
ถึงแมจะเก็บขอมูลได ขอมูลเชิงคุณภาพและเชิง
ไมครบ ปริมาณ
• ใชไดกับขอมูลเชิง • ใชไดกับขอมูลเชิง • กรณีที่ไมมีคาของขอมูลซ้ํา
ปริมาณเทานั้น ปริมาณเทากัน กันจะไมมีฐานนิยม
ขอเสีย
• คาเฉลี่ยจะไมใชคา • ฐานนิยมอาจมีมากกวา 1 คา
กลางที่ดี ถามีคา
ผิดปกติ
Printed copy for personal use only. Please do not distribute any parts outside of this class. 28
ความสัมพันธระหวางคาเฉลี่ย คามัธยฐาน และฐานนิยม
กราฟเสนโคงความถี่ของขอมูลจะแบงเสนโคงได 3 ลักษณะ คือ

เสนโคงปกติหรือรูประฆังคว่ํา เสนโคงเบขวาหรือทางบวก เสนโคงเบทางซายหรือทางลบ


(Normal or bell curve) (Positively skewed curve) (Negative skewed curve)

ค่าเฉลีย ฐานนิยม ค่าเฉลีย ค่าเฉลีย ฐานนิยม


มัธยฐาน มัธยฐาน มัธยฐาน
ฐานนิยม

Printed copy for personal use only. Please do not distribute any parts outside of this class. 29
Descriptive Statistics and the Normal Distribution
Heights of men and women

The graph shows two distributions, one for men and one for women
(each roughly following the classic bell-curve shape of a statistical normal
distribution).
30
IQ Score Distribution

31
การกระจายตัวของรายไดครัวเรือนในประเทศไทย

TDRI, 2553
32
33
การวัดการกระจาย (Measure of Variation)
ขอมูลชุดที่ 1 : 20 , 30 , 40 , 50 , 60 , 70
ขอมูลชุดที่ 2 : 40 , 43 , 44 , 46 , 47 , 50

คาเฉลี่ยของขอมูลชุดที่ 1 =
คาเฉลี่ยของขอมูลชุดที่ 2 =

Printed copy for personal use only. Please do not distribute any parts outside of this class. 34
การวัดการกระจาย (Measure of Variation)
• พิสัย (Range: R)
• พิสัยควอไทล (Interquartile Range: IQR)
• ความแปรปรวน (Variance)
• สวนเบี่ยงเบนมาตรฐาน (Standard Deviation)

Printed copy for personal use only. Please do not distribute any parts outside of this class. 35
การวัดการกระจาย

พิสัย (Range: R) R  xmax  xmin

พิสัยควอไทล
IQR  Q3  Q1
(Interquartile Range: IQR)
n
( xi ) 2
ความแปรปรวนของตัวอยาง 1 n
s 2
( xi2  i 1
)
(Sample Variance: s2) n  1 i 1 n

n
สวนเบี่ยงเบนมาตรฐานของตัวอยาง n
( xi ) 2
1
(Sample Standard Deviation: s) s ( xi2  i 1
)
n  1 i 1 n

Printed copy for personal use only. Please do not distribute any parts outside of this class. 36
การวัดการกระจาย
ประชากร ตัวอยาง
N n

ความแปรปรวน  (x  ) i
2
 (x  x )
i
2

2  i 1
S2  i 1
N n 1
N n

สวนเบี่ยงเบนมาตรฐาน  ( xi   )2  (x  x ) i
2

 i 1 S i 1

N n 1

Printed copy for personal use only. Please do not distribute any parts outside of this class. 37
การวัดการกระจาย

การกระจายตํา

การกระจายสูง

ลักษณะการกระจายของขอมูลที่มีโคงความถี่เปนแบบปกติ

Printed copy for personal use only. Please do not distribute any parts outside of this class. 38
การวัดสัมประสิทธิ์การกระจายหรือการกระจายสัมพัทธ
สัมประสิทธิ์ของพิสัย (Coefficient of range)

max  min
สัมประสิทธิ์ของพิสัย =
max  min

สัมประสิทธิ์ความแปรผัน (Coefficient of variation: C.V.)


s
C.V . 
x

ถาขอมูลชุดใดมีคาสัมประสิทธการกระจายสูงกวา แสดงวาขอมูลชุดนั้นมีการกระจายสูงกวา
Printed copy for personal use only. Please do not distribute any parts outside of this class. 39
แผนภูมิลําตนและใบ(Stem and Leaf)
• เปนการนําเสนอขอมูลโดยใชคาของขอมูลจริงทุกคา ทําใหสามารถเห็นลักษณะที่
แทจริงของขอมูลได
• หลักการคือคาขอมูลจะตองแบงออกเปนสองสวนได สวนหนึ่งเปนลําตน อีกสวนหนึ่ง
เปนใบ
• การนําเสนอขอมูลดวยแผนภาพลําตนและใบ คาของขอมูลเปนตัวเลขอยางนอย 2
หลัก

Printed copy for personal use only. Please do not distribute any parts outside of this class. 40
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :

Printed copy for personal use only. Please do not distribute any parts outside of this class. 41
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :
2 :9
3 :26
4 :1256778
5 :01223345555889
6 :01236678
7 :0247
8 :02
9 :8
10 : 0

Printed copy for personal use only. Please do not distribute any parts outside of this class. 42
ตัวอยางแผนภูมิลําตนและใบ
อายุผูหญิงที่เปนตัวอยาง :
2 :9
3 :26
4 :1256778
5 :01223345555889
6 :01236678
7 :0247
8 :02
Leaf (หลักหนวย)
9 :8
10 : 0
Stem (หลักสิบและหลักรอย)
Printed copy for personal use only. Please do not distribute any parts outside of this class. 43
ตัวอยางแผนภูมิลําตนและใบ การคํานวณ leave unit
นําตัวเลขที่เขียนในแผนภาพคูณดวย
leave unit จะตองมีคาตรงกับขอมูล
2 :9

5 :01223345555889
3 :26
4 :1256778
5 :01223345555889

6 :01236678
6 :01236678

4 :1256778
7 :0247
8 :02

7 :0247
9 :8
3 :26

8 :02
2 :9

9 :8
10 : 0
10 : 0
leave unit มีคาเทากับ 1.0
Printed copy for personal use only. Please do not distribute any parts outside of this class. 44
Box Plot or Box and Whiskers Plot
เปนแผนภูมิที่ใชคาสถิติ 5 คา ดังนี้

Minimum – Q1 – Median – Q3 - Maximum

ตัวอยาง

25% 25% 25% 25%


Minimum Q1 Median Q3 Maximum

Printed copy for personal use only. Please do not distribute any parts outside of this class. 45
ขั้นตอนการสราง Box-Plot เปนการแบงขอมูล
ออกเปน 4 สวนเทาๆ
ขั้นที่ 1 หาคา min และ max ควอรไทล (Quartile)
ขั้นที่ 2 คํานวณหาคามัธยฐาน Q1 Q3 และ IQR Qr  X r ; r  1, 2,...,3
( n 1)
4
ขั้นที่ 3 คํานวณหาขอบเขตลาง (fL ) และขอบเขตบน (fu ) ของขอมูล ดังนี้
fL = Q1 - (1.5*IQR)
fU = Q3 + (1.5*IQR)
ขั้นที่ 4 สรางแกนนอนใหครอบคลุมคาสูงสุดและคาต่ําสุดของขอมูล
สรางกลองโดยใหเสนซายมือเปนตําแหนงของ Q1 และเสนทางขวามือเปน
ตําแหนงของ Q3 และลากเสนตั้งภายในที่ตําแหนงมัธยฐาน
ขั้นที่ 5 ลากเสนตรงในแนวนอนออกจากกรอบสี่เหลี่ยมทั้งสองดาน

Printed copy for personal use only. Please do not distribute any parts outside of this class. 46
ขั้นตอนการสราง Box-Plot
ขั้นที่ 5
- กรณีที่ไมมีขอมูลผิดปกติ ทุกคาของขอมูลอยูภายใน fL และ fu ใหลากเสนตรงออก
จากกรอบทางดานซายไปจนถึงตําแหนงของขอมูลที่มีคาต่ําสุด และลากเสนตรงออก
จากกรอบทางดานขวาไปจนถึงตําแหนงของขอมูลที่มีคาสูงสุด เรียกเสนทั้งสองนี้วา
“หนวด” (Whisker)
ค่าตําสุ ด ค่าสูงสุ ด

fL Q1 Q2 Q3 fU
ขอบเขตล่าง ขอบเขตบน

Printed copy for personal use only. Please do not distribute any parts outside of this class. 47
ขั้นตอนการสราง Box-Plot
- กรณีที่มีขอมูลผิดปกติ นั่นคือ มีบางคาของขอมูลอยูนอก fL และ fu ใหลากเสนตรงออก
จากกรอบทั้งสองดานไปจนถึงคาต่ําสุดและคาสูงสุดของขอมูลที่มีคาอยูภายใน fL และ fu
สวนขอมูลที่มีคาอยูนอกขอบเขตบนและขอบเขตลางจะถือเปนขอมูลผิดปกติ และแทน
ขอมูลผิดปกตินี้ดวยเครื่องหมายดอกจัน (*)

ค่าข้อมูลทีผิดปกติ ค่าข้อมูลทีผิดปกติ
(ตํากว่าปกติ) (สูงกว่าปกติ)

* *

fL Q1 Q2 Q3 fU
Printed copy for personal use only. Please do not distribute any parts outside of this class. 48
ความหมายของ Box-Plot
1. การแจกแจงของขอมูล จะพิจารณาจากคามัธยฐาน

2. การวัดการกระจายของขอมูล จะพิจารณาจากความกวางของกรอบสี่เหลี่ยม
- ถากรอบสี่เหลี่ยมมีความกวางมาก แสดงวาขอมูลมีการกระจายมาก
- ถากรอบสี่เหลี่ยมมีความกวางนอย แสดงวาขอมูลมีการกระจายนอย

Printed copy for personal use only. Please do not distribute any parts outside of this class. 49

You might also like