Download as pdf or txt
Download as pdf or txt
You are on page 1of 64

สถิตเิ พื่อการวิเคราะห์ข้อมูล

(Statistics for Data Analysis)


รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
Assoc.Prof. Dr. Laddawan Petchroj
laptec@rpu.ac.th
ข้อมูล(Data)
ข้อมูลเชิงปริมาณ(Quatitative
Data)
ข้อมูลเชิงคุณลักษณะหรือเชิงคุณภาพ
(Qualitative Data)
2
ข้อมูล(Data)
 Data - facts, observations, and information that
come from investigations.
– Measurement data sometimes called quantitative data --
the result of using some instrument to measure something
(e.g., test score, weight);
– Categorical data also referred to as frequency or
qualitative data. Things are grouped according to some
common property(ies) and the number of members of the
group are recorded (e.g., males/females, vehicle type).
3
สถิต(ิ Statistics)
 Statistics - a set of concepts, rules, and
procedures that help us to:
– organize numerical information in the form of
tables, graphs, and charts;
– understand statistical techniques underlying
decisions that affect our lives and well-being;
and
- make informed decisions
4
Statisticคืออะไร

Statistic ( ค่าสถิต)ิ ค่าที่ได้จาก


กลุ่มตัวอย่าง(Sample)
Parameter(ค่าพารามิเตอร์) ค่าที่
ได้จากประชากร(Population)
5
สถิติพื้นฐาน(Basic Statistics)
สถิติพรรณนา(Descriptive Statistics)
 Statistics - a set of concepts, rules, and procedures
that help us to:
– organize numerical information in the form of tables,
graphs, and charts;
– understand statistical techniques underlying decisions
that affect our lives and well-being; and
- make informed decisions

6
สถิติอ้างอิง(Inferential Statistics)
Sample Population
ตัวอย่าง ประชากร

7
ค่าสถิติ และค่าพารามิเตอร์

มิว

ซิกม่า

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การวิเคราะห์ข้อมูล

9
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
Variable(ตัวแปร)
 Continuous Variable (ต่อเนื่อง)
 Discrete Variable (ไม่ต่อเนื่อง)
 Independent Variable (อิสระ/ต้น)
 Dependent Variable (ตาม)
 Qualitative Variable (คุณภาพ)
 Quantitative Variable (ปริมาณ)
สถิติพรรณนา(Descriptive Statistics)
Measures of Center =การ
วัดแนวโน้มเข้าสู่ส่วนกลาง
 Mode= ฐานนิยม ตัวที่ซ้ากันUnimodal,(ซ้้ากัน 1
ตัวป Bimodal(ซ้้ากัน 2 ตัว), Multimodal(ซ้้ากัน3 ตัว
ขึ้นไป)
 Median =มัธยฐานreferred to as the
score at the 50th percentile in
the distribution 11
สถิติพรรณนา
Measures of Center =การ
วัดแนวโน้มเข้าสู่ส่วนกลาง
Mean= ค่าเฉลี่ยหรือมัชฌิมเลขคณิต
(the average of a
distribution)
12
สถิติพรรณนา
Measures of Spread (การวัดการ
กระจาย)
Range (พิสัย)
Inter quartile Range (IQR)
Standard deviation (ส่วนเบี่ยงเบน
มาตรฐาน)
Variance (ความแปรปรวน) 13
ตัวอย่าง
3 1 5 4,4 9 9 8,8 Mode=…9 เรียกว่า unimodal
หรือ 9,8 เรียกว่าbimodalหรือ
4,9,8 เรียกว่าmultimodal…
3 1 5 4 9 9 8 Mode= 9
1 3 4 5 8 9 9 Median=…5…
3154998
Mean=(3+1+5+4+9+9+8)/7=39/7=5.57
คือค่าเฉลี่ย(average)เท่ากับ 5.57
พิสยั (Range)= 9-1=8
14
Mean Deviation
 15

15
Mean Deviation (MD)
 15

16
Standard Deviation (SD)
 15

3
การหาค่าเฉลี่ยโดยมีข้อมูลซ้้ากัน
(frequency=f)
อายุ(X) จ้านวนคน(f) fiXi
20 2 2(20) = 40
21 1 1(21) = 21
22 3 3(22) = 66
24 2 2(24) = 48
25 2 2 (25) = 50

รวม 10 ƩfiXi=225

X= 225
10
=22.5 ปี รศ.ดร.ลัดดาวัลย์ เพชรโรจ
การหาค่าเฉลี่ยโดยมีข้อมูลซ้้ากัน
(frequency=f)
อายุ(X) จ้านวนคน(f) fiXi
20 5 5(20) =100
21 3 3(21) = 63
22 2 2(22) = 44
24 7 7(24) = 168
25 2 2 (25) =50

รวม 19
ƩfiXi=425

X= 425
19
=22.368 ปี รศ.ดร.ลัดดาวัลย์ เพชรโรจ
11. การจัดการกระจาย

ั = สูงสุด – ตา่ สุด


11.1 พิสย

11.2 ความโด่ง คือ ความสูงของของการแจกแจงข ้อมูล


Kur = Q.D___ Q.D.= ( Q3-Q1)/2
P90 – P10

11.3 ความเบ ้ (Skewness) คือข ้อมูลไม่ปกติ

1. เบ ้ขวา (+)
้ (-)
2. เบ ้ซาย

สูตร Sk = 3 (X – Mdn)
SD รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
11.5 สว่ นเบีย
่ งเบนเฉลีย

N
MD = Σ fi xi - x
i=1
________________
N

11.6 สว่ นเบีย


่ งเบนมาตรฐาน
k
 = Σ f (x i – x) 2
i=1 i
_______________
N
SD = Σfx 2 Σfx 2
Σf (x - x) 2
=
n-1 (n – 1) n(n – 1)
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การหาค่าส่วนเบี่ยงเบนมาตรฐาน
มีความถี่(frequency=f)
อายุ(X) จ้านวนคน(f) fiXi fx2= fx(x
20 2 2(20) = 40 =40( 20)=8
21 1 1(21) = 21 =21(21)=4
22 3 3(22) = 66 =66(22)=1
24 2 2(24) = 48 =48(24)=11
25 2 2 (25) = 50 =50(25)=12

รวม 10 ƩfiXi=225 = 509

=1.802
รศ.ดร.ลัดดาวัลย์ เพชรโรจ
การวิเคราะห์ข้อมูล
 1. สถิติบรรยาย(Descriptive Statistics)
ร้อยละ สัดส่วน อัตราส่วน ค่าเฉลี่ย ฐาน
นิยม มัธยฐาน พิสัย ส่วนเบี่ยงเบนมาตร
ฐาน ความแปรปรวน
 2. สถิติอ้างอิง(Inferential Statistics)
One-way ANOVA
2
t-test, Z-test,  -test, F-test
Two-way ANOVA 23
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
อ้างอิงจากhttp://www.statisticshowto.com/wp-content/uploads/2013/09/iq-
score-bell-curve.gif วันที่สืบค้น30/08/2017
24
โค้งปกติ(Normal Distribution)
ความเบ้(Skewness)
ความโด่ง(Kurtosis)

25
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
เบ้ซ้าย(Left Skew)

X Mdn Mo

26
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
เบ้ขวา(Right Skew)

Mode Mdn

Mode<Median<Mean
27
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
28
การคานวณค่าเฉลี่ยจากการสุ่มกลุ่มตัวอย่าง

 ข้อมูล 1 2 3 4 5
 เลือกกลุ่มละ 3 ได้อะไรบ้าง
 123 124 125 134 135 145
 234 235
 345

29
การคานวณค่าเฉลี่ยจากการสุ่มกลุ่มตัวอย่าง

30
2 3 4
การคานวณค่าเฉลี่ยจากการสุ่มกลุ่มตัวอย่าง

31
2 3 4

ตัวอย่าง
 เปรียบเทียบความสามารถผู้ตอบ 2กลุ่ม กลุ่มA เก่งกว่ากลุ่ม B
หรือไม่ กลุ่มที่A มี X =15 S2=3 n=10
 กลุ่มที่B มี X =12 S2=2 n=10
 ใช้ Z และ t

33
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
สูตร
Χ μ
Ζ i
σ

การเปรียบเทียบคะแนนจากการแปลงคะแนน
มาตรฐาน
 การแปลงคะแนน หมายถึง การท้าคะแนนดิบ(Raw Data)
ให้เป็นคะแนนมาตรฐาน(Standard Data) เพื่อแปลง
คะแนนให้เป็นหน่วยเดียวกัน โดยแปลงเป็นซี (Z)

X- X -X
 Z= Z=
 SD


34
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ลักษณะการแจกแจง t กับ Z
Z
t

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
พื้นที่ใต้โค้งปกติ

. .
3413 3413

-3S -2S -1S X 1S 2S 3S


-3 -2 -1
Z=-3 Z=-2 Z=-1
 1 2
Z=1 Z=2 Z=3
3
Z=0
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
พื้นที่ใต้โค้งปกติ

Z=-3 Z=-2 Z=-1 Z=1 Z=2 Z=3


Z=0= x-

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
พื้นที่ใต้โค้ง t

t=-3 t=-2 t=-1 t=1 t=2 t=3


t=0

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบสมมติฐาน
1. สมมติฐานว่าง (null hypothesis)
ใช้สัญลักษณ์ H0

H0 ‫ ׃‬µ = 100

H 0 ‫ ׃‬µ1 = µ2

H0 ‫׃‬ σ1 = σ2
การทดสอบสมมติฐาน
2สมมติฐานเลือก (Alternative Hypothesis)
ใช้สัญลักษณ์ H1

H1 ‫ ׃‬µ > 100 ทดสอบทางขวา


H1 ‫ ׃‬µ < 100 ทดสอบทางซ้าย
H1 ‫ ׃‬µ ≠ 100 ทดสอบทั้งสองทาง
ทั้งซ้ายและขวา
H1 ‫ ׃‬µ1 ≠ µ2 กรณีประชากร 2 กลุ่ม
และทดสอบทั้งสองทางซ้ายและขวา
ระดับนัยส้าคัญทางสถิติ (α=alpha)
(Level of statistical significant)
1.กรณีทดสอบสองทาง (two-tailed test)
α/2 α/2=.05/2=.025
บริเวณวิกฤต บริเวณวิกฤต
)Critical region ช่วงความเชื่อมั่น (Critical region)

Level of confident
95%
จุดวิกฤต จุดวิกฤต
(Critical point) (Critical point)
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ระดับนัยส้าคัญ (α)
2.กรณีทดสอบทางเดียวทางขวา
α
บริเวณวิกฤต
ช่วงความเชื่อมั่น

จุดวิกฤต

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ระดับนัยส้าคัญ (α)
3.กรณีทดสอบทางเดียวทางซ้าย
α
บริเวณวิกฤต
ช่วงความเชื่อมั่น

จุดวิกฤต

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ขั้นทดสอบสมมติฐาน
(Step for Testing Hypothesis )
ขั้นที่1. การก้าหนดสมมติฐาน H0 และ H1
ขั้นที่ 2. การก้าหนดระดับนัยส้าคัญ ( α)
ขั้นที่ 3. การเลือกใช้สถิติ (choose
statistics)
ขั้นที่ 4. การก้าหนดบริเวณวิกฤติ(critical
region= table value)

ขั้นที่ 5. การค้านวณ(compute)
ขั้นที่ 6. การเปรียบเทียบ (compare) ค่าจากการ
ค้านวณ(compute)กับค่าจากการเปิดตาราง(table
value)
(compute)>table value =reject H0
= accept H
การทดสอบสมมติฐานของ t
1. ตั้งสมมติฐาน
H0: 1=2
H1: 1≠2
2. ก้าหนดระดับนัยส้าคัญ α
3. หาค่าวิกฤต tเปิดตาราง
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบสมมติฐานของ t

-2 รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ตัวอย่าง

48
พื้นที่ใต้โค้ง t
Accept H0
Reject H0
Critical
region

t=1 t=1.734 t=4.24


t=0
Critical point=1.734
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบสมมติฐานของ t
4. สถิติที่ใช้ t –test กรณี 21≠22
X1 - X2
5. ค้านวณ t=-------------
S21 S22

n1 n2
6. เปรียบเทียบผลการค้านวณกับการเปิดตาราง
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การบ้าน

51
การทดสอบตั้งแต่ 3กลุ่มใช้ F
1. ตั้งสมมติฐาน
H0: 1=2=3=…nหรือ
H0: 12 = 22 = 32=… 42
H1: มีอย่างน้อย 1 คู่ ไม่เท่ากัน
2. ก้าหนดระดับนัยส้าคัญ α
3. หาค่าวิกฤต Fเปิดตาราง= Fα, ,รศ.ดร.ลัดดาวัลย์ เพชรโร
1 2
การทดสอบสมมติฐานของ F
(One-way ANOVA)
4. สถิติที่ใช้ F –test
MSb SSb/dfb
5. ค้านวณ F=------- =----------
MSw SSw/dfw
6. เปรียบเทียบผลการค้านวณกับการเปิดตาราง
F รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบสมมติฐานของ  2
Chi-squareส้าหรับข้อมูลกลุ่ม ไม่ต่อเนื่อง
1. ตั้งสมมติฐาน
H0: ตัวแปร Aและตัวแปร Bไม่สัมพันธ์กัน
H1: ตัวแปร Aและตัวแปร Bสัมพันธ์กัน
หรือ
H0: ตัวแปร Aและตัวแปร Bเป็นอิสระกัน
H1: ตัวแปร Aและตัวแปร Bสัมพันธ์กัน
2. ก้าหนดระดับนัยส้าคัญ α
3. หาค่าวิกฤต 2 เปิดตาราง
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบสมมติฐานของ
4. สถิติที่ใช้ 2 –test
r c

  (O-E) 2
5. ค้านวณ 2 = i=1 j=1 E

6. เปรียบเทียบผลการค้านวณกับการเปิดตาราง

รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การทดสอบข้อมูลกลุ่มใช้
Chi-square (  ) 2

1. ตั้งสมมติฐาน
H0: ตัวแปร Aและตัวแปร Bไม่สัมพันธ์กัน
H1: ตัวแปร Aและตัวแปร Bสัมพันธ์กัน
หรือ
H0: ตัวแปร Aและตัวแปร Bเป็นอิสระกัน
H1: ตัวแปร Aและตัวแปร Bสัมพันธ์กัน
2. ก้าหนดระดับนัยส้าคัญ α
3. หาค่าวิกฤต 2 เปิดตาราง
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
การวิเคราะห์ความสัมพันธ์
Phi (ฟาย)ใช้หาความสัมพันธ์ Correlation ที่ข้อมูลแบ่งเป็น 2
กลุ่ม ทั้งตัวแปรต้นและตัวแปรตาม
Cramer’s(V) ใช้หาความสัมพันธ์ที่ตัวแปรตัวหนึ่งแบ่งเป็น 2
กลุ่ม อีกตัวหนึ่งแบ่งมากกว่า2 กลุ่ม
Spearman Rank Correlation ใช้หาความสัมพันธ์ที่
ข้อมูล 2 กลุ่มที่มีมาตรวัดแบบเรียงลาดับ
Pearson Product Moment ใช้หาความสัมพันธ์ที่ข้อมูล 2
กลุ่มที่มีมาตรแบบอันตรภาคชั้นและอัตราส่วน
57
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
X

Regression

 r = 1.00 r = .80 r = .30

Y
2
1

12 x
Xเพิ่ม Yเพิ่ม
58
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
X

Regression
 r = -1.00 r = -.80 r = - .30

3
2 x

3 4 xเพิม่ Yลด
59
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
สูตรหาความสัมพันธ์ Pearson Product Moสู
ment

N∑XY- (∑X)(∑Y)

Rxy =
√[N ∑X - (∑X) ][N ∑Y - (∑Y) ]
2 2 2 2

60
Regression
 Y= a+b1x1
a= ค่าคงที่ที่สมการตัดแกนY
 b1 =ค่าความชัน ( slope)หรือค่าสัมประสิทธิ์ที่
ก้ากับการเปลี่ยนแปลงกี่เท่าของค่า x เช่น .8X
คือ.8เท่าของX
x=ตัวแปรต้น Y=ตัวแปรตาม
61
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
Multiple Regression

สมการทั่วไป
Y= a+b1x1+b2x2+b3x3+…bkxk

สมการมาตรฐาน
Z= 1x1+ 2x2+ 3x3+… kxk

62
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
 ค่าสัมประสิทธิ์สหสัมพันธ์
 1.00 =มีความสัมพันธ์ระดับมากที่สุด
 0.80-0.99 =มีความสัมพันธ์ระดับมาก
 0.40-0.79 =มีความสัมพันธ์ระดับปานกลาง
 0.20-0.39 =มีความสัมพันธ์ระดับน้อย
 0.00 =ไม่มีความสัมพันธ์

63
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
ติดต่อสอบถาม
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์
มือถือ 086-0526256, 02-3477636
ladrojch@gmail.com

64
รศ.ดร.ลัดดาวัลย์ เพชรโรจน์

You might also like