Professional Documents
Culture Documents
Live สถิติหลักสูตรใหม่ (+การแจกแจงความน่าจะเป็น)
Live สถิติหลักสูตรใหม่ (+การแจกแจงความน่าจะเป็น)
Live สถิติหลักสูตรใหม่ (+การแจกแจงความน่าจะเป็น)
com
❖ สถิ ติ !! [ปูพืน
้ ฐานบทนี้ ทงั ้ หมด]
** พาร์ทแรก จะบรรยายเยอะหน่ อยน้ า > < **
➢ ความหมายของสถิ ติศาสตร์และข้อมูล
สถิ ติศาสตร์ (statistics) หมายถึง วิชาทีว่ า่ ด้วยการเก็บรวบรวมข้อมูล วิเคราะห์ขอ้ มูล
และสรุปผลจากข้อมูลทีเ่ กีย่ วข้อง เพือ่ นามาตอบคาถาม อธิบายปรากฎการณ์หรือประเด็นทีน่ ่าสนใจ
➢ คาสาคัญในสถิ ติศาสตร์
ประชากร (population) หมายถึง กลุ่มของหน่วยทัง้ หมดในเรือ่ งทีส่ นใจศึกษา หน่วยในทีน่ ้อี าจเป็ นสัตว์หรือสิง่ ของ
ข้อมูล (data) หมายถึง ข้อความจริงเกีย่ วกับเรือ่ งใดเรือ่ งหนึ่งทีส่ ามารถใช้ในการสรุปผลในเรื่องทีส่ นใจศึกษา อาจเป็ นได้
ทัง้ ตัวเลขหรือไม่ใช่ตวั เลข หรืออาจหมายถึงค่าของตัวแปรทีส่ นใจศึกษา
เช่น อายุของนักเรียนทีเ่ รียนกับพีป่ ั น้ (17 19 18) คือค่าของข้อมูลแต่ละตัวทีเ่ ก็บได้นนเอง
ั่
พารามิ เตอร์ (parameter) หมายถึง ค่าวัดทีแ่ สดงลักษณะของประชากร ซึง่ เป็ นค่าคงตัวทีค่ านวณหรือประมวลจากข้อมูล
ทัง้ หมดของประชากร
เช่น อายุเฉลีย่ ของผูป้ ่ วยโรคมะเร็งในประเทศไทยในปี 2562
ฐานนิยมของจังหวัดของผูป้ ่ วยมะเร็งในประเทศไทยในปี 2562
1|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
• ประเภทของข้อมูล
1. การแบ่งประเภทของข้อมูลตามแหล่งทีม่ าของข้อมูล
ข้อมูลปฐมภูมิ (primary data) คือข้อมูลทีผ่ ใู้ ช้ดาเนินการเก็บรวบรวมจากเจ้าของข้อมูลหรือต้นกาเนิดของข้อมูล
โดยตรง
2. การแบ่งประเภทของข้อมูลตามระยะเวลาทีจ่ ดั เก็บ
ข้อมูลอนุกรมเวลา (time series data) คือชุดข้อมูลทีเ่ กิดขึน้ และจัดเก็บตามลาดับเวลา
ทีต่ ่อเนื่องกันไปตลอดช่วงๆหนึ่ง (เช่น เก็บข้อมูลรายเดือน รายปี เป็ นข้อมูลเดียวกันเพือ่ เทียบกัน)
3. การแบ่งประเภทของข้อมูลตามลักษณะของข้อมูล
ข้อมูลเชิ งปริ มาณ (quantitative data) คือข้อมูลทีไ่ ด้จากการวัดหรือนับค่า โดยแสดงเป็ นตัวเลขหรือปริมาณที่
สามารถนาไปบวก ลบ คูณ หรือหาร และเปรียบเทียบกันได้
(เช่น อายุ ส่วนสูง คะแนนสอบคณิตศาสตร์ ยอดขายร้านซูชริ ายวัน)
ข้อมูลเชิ งคุณภาพ (qualitative data) คือข้อมูลทีแ่ สดงลักษณะ ประเภท สมบัตใิ นเชิงคุณภาพ และอื่นๆ
ทีไ่ ม่สามารถวัดค่าเป็ นตัวเลขทีน่ ามาบวก ลบ คูณ หรือ หารกันได้
(เช่น หมายเลขโทรศัพท์ สายรถเมล์ จังหวัดภูมลิ าเนา)
2|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
สถิ ติศาสตร์เชิ งอนุมาน (inferential statistics) เป็ นการวิเคราะห์ขอ้ มูลทีใ่ ช้ทฤษฎีทเ่ี กีย่ วกับความน่าจะเป็ น
ในการหาข้อสรุปเกีย่ วกับลักษณะของประชากรโดยใช้ขอ้ มูลจากตัวอย่างทีไ่ ด้มาจากประชากรนัน้
(เช่น สานักโพลแห่งหนึ่งสารวจเกีย่ วกับอาชีพในฝั นของเยาวชนไทย ปี พ.ศ. 2562 โดยสารวจเยาวชนไทยทีอ่ ายุ 12 ปี ขน้ึ
ไป รวม 15,000 คน ซึง่ สรุปผลได้วา่ อาชีพในฝั นของเยาวชนไทยทัง้ ประเทศ 5 อันดับแรก ได้แก่ อันดับที่ 1 ธุรกิจส่วนตัว
ร้อยละ 16.40 อันดับที่ 2 อาชีพครู ร้อยละ 13.65 อันดับที่ 3 อาชีพรับราชการ ร้อยละ 13.36 อันดับที่ 4 อาชีพแพทย์
ร้อยละ 10.80 อันดับที่ 5 อาชีพวิศวกร ร้อยละ 7.53
• การนาเสนอข้อมูลเชิ งคุณภาพด้วยตารางความถี่
ตารางความถี่จาแนกทางเดียว
เช่น สอบถามกีฬานักเรียนชายห้อง 6/1 ในปี การศึกษา 2562 จานวน 20 คน เกีย่ วกับกีฬาทีช่ อบทีส่ ุด ดังตาราง
กีฬาทีช่ อบ ฟุตบอล เทนนิส บาสเกตบอล อื่นๆ รวม
ความถี่ 10 3 2 5 20
3|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ตารางความถี่จาแนกสองทาง
เป็ นตารางทีม่ ตี วั แปรทีส่ นใจศึกษา 2 ตัว เช่น ตารางแสดงความถีข่ องบอร์ดเกมส์ทช่ี อบของนักเรียนรอบสดทีเ่ รียนกับพีป่ ั น้
โดยจาแนกตามเพศ
บอร์ดเกมส์ที่ชอบ Avalon Werewolf สามก๊ก รวม
ชาย 15 5 2 22
หญิง 18 12 8 38
รวม 33 17 10 60
แผนภูมิรปู วงกลม (pie chart of circular chart) เป็ นการนาเสนอข้อมูลโดยใช้พน้ื ทีภ่ ายในของรูปวงกลมแทนความถี่
ของข้อมูลทัง้ หมด และแสดงสัดส่วนของความถีข่ องแต่ละข้อมูลด้วยพืน้ ทีแ่ ต่ละส่วนภายในรูปวงกลมซึง่ แบ่งด้วยรัศมี โดย
สัดส่วนของความถีข่ องแต่ละข้อมูลเท่ากับสัดส่วนของขนาดของมุมทีจ่ ุดศูนย์กลางของรูปวงกลม โดยทัวไปจะแสดงสั
่ ดส่วน
ของความถีข่ องข้อมูลด้วยความถีส่ มั พัทธ์ในรูปร้อยละ
เทนนิส 3 เทนนิส
50%
บาสเกตบอล
บาสเกตบอล 2 10%
อื่นๆ
อื่นๆ 5 15%
รวม 20
4|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
❖ การวิเคราะห์และนาเสนอข้อมูลเชิ งปริมาณ
• การวิ เคราะห์และนาเสนอข้อมูลเชิ งปริ มาณด้วยตารางความถี่
1. ตารางความถี่แบบไม่ได้แบ่งข้อมูลเป็ นช่วง (เหมาะกับข้อมูลจานวนน้อย)
เช่น คะแนนสอบย่อยวิชาคณิตศาสตร์ของนักเรียนกลุ่มหนึ่งจานวน 10 คน โดยคะแนนเต็ม 5 คะแนน มีดงั นี้
คะแนนสอบ 1 2 3 4 5
ความถี่ 1 1 3 4 1
ข้อที่ 2. จานวนอีเมลทีก่ นกวรรณได้รบั ในแต่ละวันตัง้ แต่วนั ที่ 1 – 31 กรกฎาคม พ.ศ. 2561 แสดงได้ดงั นี้
28 18 15 23 26 17 9 27 16 24
23 24 11 43 20 17 17 25 18 32
18 15 20 22 18 30 17 13 25 26 20 ตามลาดับ (Cr.หนังสือ สสวท.)
1) จงเขียนตารางแจกแจงความถีข่ องข้อมูลชุดนี้ โดยกาหนดให้จานวนอันตรภาคชัน้ เท่ากับ 6 ชัน้ ค่าเริม่ ต้นเท่ากับ
8 ฉบับ และค่าสุดท้ายเท่ากับ 44 ฉบับ
2) อันตรภาคชัน้ ใดมีความถีส่ งู สุด
3) อันตรภาคชัน้ ที่ 5 มีความถีส่ มั พัทธ์ในรูปร้อยละเป็ นเท่าใด
4) จานวนวันทีก่ นกวรรณได้รบั อีเมลน้อยกว่า 32 ฉบับ คิดเป็ นร้อยละเท่าใดของจานวนวันทัง้ หมดในเดือนกรกฎาคม
พ.ศ. 2561
5|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ขอบล่างของชัน้ (lower class boundary) คือ ค่ากึง่ กลางระหว่างค่าของข้อมูลทีม่ ากทีส่ ุดในชัน้ ก่อนหน้ากับค่าของข้อมูล
ทีน่ ้อยทีส่ ุดในชัน้ นัน้
ขอบบนของชัน้ (upper class boundary) คือ ค่ากึง่ กลางระหว่างค่าของข้อมูลทีม่ ากทีส่ ุดในชัน้ นัน้ กับค่าของข้อมูลที่
น้อยทีส่ ุดในชัน้ ถัดไป
6|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
7|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ข้อที่ 4. วันจันทร์ถงึ ศุกร์ แม่บอกว่าพลอยจะได้คา่ ขนมเฉลีย่ วันละ 100 บาท ปรากฏว่าจันทร์ ถึง พฤหัส พลอยได้คา่ ขนม
เท่ากับ 80 60 120 50 ตามลาดับ อยากทราบว่าวันศุกร์พลอยจะได้คา่ ขนมกีบ่ าท
8|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
• ค่าวัดการกระจาย
1. การวัดการกระจายสัมบูรณ์ (absolute variation) คือ การวัดการกระจายของข้อมูลด้วยค่าวัดทางสถิตทิ ม่ี ี
หน่วยเช่นเดียวกับข้อมูลหรือเป็ นกาลังสองของหน่วยของข้อมูล
มี 4 ชนิด คือ
• พิ สยั (range)
• ความแปรปรวน (variance)
9|Page
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
• ค่าวัดตาแหน่ งที่ของข้อมูล
ควอไทล์ (Quartile)
𝑖(𝑛+1)
𝑄𝑖 =
4
เปอร์เซ็นไทล์ (Percentile)
𝑖(𝑛+1)
𝑃𝑖 =
4
*หลักสูตรใหม่ไม่มเี ดไซล์แล้ว
10 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
2) เปอร์เซ็นไทล์ท่ี 63
ข้อที่ 12. ชมรมหมากรุก มีสมาชิกทีอ่ ายุดงั ต่อไปนี้ 45 46 40 48 42 50 และ 6 ขวบ จงหาค่าเฉลีย่ เลขคณิตของอายุ
สมาชิกในชมรมหมากรุก โดยไม่รวมค่านอกเกณฑ์
ตัวแปรสุ่มและการแจกแจงความน่ าจะเป็ น
ข้อที่ 13. พิจารณาการทดลองสุม่ ซึง่ ได้จากการโยนเหรียญเทีย่ งตรง 1 เหรียญ 3 ครัง้ กาหนดให้ 𝐻 คือหัว 𝑇 คือก้อย
จงหา
1) ปริภมู ติ วั อย่างของการทดลองสุ่มนี้
2) 𝑛(𝑆) = _____
11 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
โดยทัวไปตั
่ วแปรสุ่มสามารถแบ่งออกได้เป็ น 2 ชนิด ตามลักษณะทีเ่ ป็ นไปได้ของค่าตัวแปรสุ่ม ดังนี้
1. ตัวแปรสุ่มไม่ต่อเนื่ อง (discreate random variable) คือตัวแปรสุม่ ทีค่ า่ ทีเ่ ป็ นไปได้ทงั ้ หมดอยู่ในเซตทีส่ ามารถ
นับจานวนสมาชิกได้ หรือค่าทีเ่ ป็ นไปได้ทงั ้ หมดของตัวแปรสุ่มสามารถเขียนเรียงลาดับจากน้อยไปมากได้ ทัง้ นี้
เซตของค่าทีเ่ ป็ นไปได้ทงั ้ หมดของตัวแปรสุ่มไม่ต่อเนื่องอาจเป็ นเซตจากัดหรือเซ็ตอนันต์กไ็ ด้
เช่น ผลบวกของแต้มบนหน้าลูกเต๋าทีถ่ ูกทอย 2 ลูก จานวนครัง้ ทีโ่ ยนเหรียญแล้วออกหัว
จานวนครัง้ ทีอ่ อกหัว เมือ่ โยนเหรียญ 3 เหรียญ
2. ตัวแปรสุ่มต่อเนื่ อง (continuous random variable) คือตัวแปรสุม่ ทีเ่ ซตของค่าทีเ่ ป็ นไปได้ทงั ้ หมดเป็ นช่วงที่
เป็ นสับเซตของ 𝑅
เช่น ส่วนสูงของนักเรียนในห้อง น้าหนักของนักเรียนทีเ่ รียนกับพีป่ ั น้
12 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ข้อที่ 16. ให้ตวั แปรสุม่ 𝑌 คือผลบวกของแต้มบนหน้าลูกเต๋า จากการทอดลูกเต๋าเทีย่ งตรง 2 ลูก พร้อมกัน 1 ครัง้ จงเขียน
แสดงการแจกแจงความน่าจะเป็ นของตัวแปรสุ่ม 𝑌 ในรูปตารางและกราฟ (โจทย์จากหนังสือ สสวท.)
• ค่าคาดหมายและส่วนเบี่ยงเบนมาตรฐานของตัวแปรสุ่มไม่ต่อเนื่ อง
ค่าคาดหมาย (expected value) ของตัวแปรสุ่มไม่ต่อเนื่อง 𝑋 เขียนแทนด้วย 𝜇𝑋 นิยามโดย
𝜇𝑋 = ∑𝑛𝑖=1 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 )
เมือ่ 𝑛 แทนจานวนค่าทีเ่ ป็ นไปได้ทงั ้ หมดของตัวแปรสุ่ม 𝑋 และ 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛
แทนค่าทีเ่ ป็ นไปได้ทงั ้ หมดของตัวแปรสุม่ 𝑋
13 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ข้อที่ 18. ให้ตวั แปรสุม่ 𝑋 คือแต้มทีเ่ ด็กชายป๋ องลูกดอกใส่กระดานปาเป้ า 10 ครัง้ ซึง่ คะแนนทีไ่ ด้เป็ นดังตาราง
คะแนน ความถี่
0 5
1 2
2 0
3 2
4 1
5 0
จงหาค่าคาดหมาย ความแปรปรวน และส่วนเบีย่ งเบนมาตรฐานของตัวแปรสุ่ม 𝑋
• การแจกแจงเอกรูปไม่ต่อเนื่ อง
ให้ 𝑋 เป็ นตัวแปรสุม่ ไม่ต่อเนื่อง ถ้าค่าทีเ่ ป็ นไปได้ทงั ้ หมดของ 𝑋 คือ 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 แล้ว
การแจกแจงความน่าจะเป็ นของตัวแปรสุม่ 𝑋 เป็ น การแจกแจงเอกรูปไม่ต่อเนื่ อง
1
(discrete uniform distribution) เมือ่ 𝑃(𝑋 = 𝑥𝑖 ) = สาหรับทุก 𝑖 ∈ {1,2,3, … , 𝑛}
𝑛
[ค่าแต่ละค่าทีเ่ ป็ นไปได้ มีโอกาสเกิดขึน้ เท่าๆกัน]
เช่น แต้มของลูกเต๋าทีท่ อด การโยนเหรียญเทีย่ งตรง 1 เหรียญ
14 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ทฤษฎีบทที่ 1
ถ้าการแจกแจงความน่าจะเป็ นของตัวแปรสุ่ม 𝑋 เป็ นการแจกแจงทวินาม จะได้วา่
1. 𝑃(𝑋 = 𝑥 ) = (𝑛𝑥)𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 สาหรับทุก 𝑥 ∈ {0,1,2, … , 𝑛}
2. 𝜇𝑋 = 𝑛𝑝
3. 𝜎𝑋 = √𝑛𝑝(1 − 𝑝)
เมือ่ 𝑛 แทนจานวนครัง้ ของการทดลองสุม่ และ 𝑝 แทนความน่าจะเป็ นทีจ่ ะเกิดผลสาเร็จในการทดลองสุ่มแต่ละครัง้
ข้อสังเกต จากทฤษฎีบทที่ 1
𝑛
จะได้วา่ ∑𝑛𝑥=0 𝑃(𝑋 = 𝑥 ) = ∑𝑛𝑥=0(𝑛𝑥)𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 = (𝑝 + (1 − 𝑝)) = 1
ข้อที่ 20. นันซื้อส้มมาจากร้านค้าในตลาด เมือ่ ดูภายนอกจะดูปกติมาก แต่เมือ่ แกะมาทาน พบว่าจะมีสม้ ประมาณ 20% ที่
เน่าและจะทานไม่ได้ หากนันซือ้ ส้มมาทาน 4 ลูก จงหา …
3) ส่วนเบีย่ งเบนมาตรฐาน
2) 𝑃(𝑋 < 3)
3) 𝑃(𝑋 = 4)
15 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
• กราฟเบ้ซ้าย
• กราฟเบ้ขวา
2) 𝜇 = 2 , 𝜎 = 2
3) 𝜇 = 4 , 𝜎 = 2
16 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
• การแจกแจงปกติ มาตรฐาน
การแจกแจงปกติมาตรฐาน (standard normal distribution) คือ การแจกแจงปกติทม่ี คี า่ เฉลีย่ เท่ากับ 0
(𝜇 = 0) และส่วนเบีย่ งเบนมาตรฐานเท่ากับ 1 (𝜎 = 1)
จะได้วา่ ฟั งก์ชนั ความหนาแน่นความน่าจะเป็ นของตัวแปรสุ่ม 𝑍 ทีม่ กี ารแจกแจงปกติมาตรฐาน คือ
1 −𝑧 2
𝑓 (𝑧 ) = 𝑒 2 เมือ่ − ∞ < 𝑧 < ∞
√2𝜋
เรียกเส้นโค้งปกติซง่ึ ได้จากตัวแปรสุม่ ปกติทม่ี คี า่ เฉลีย่ เป็ น 0 และส่วนเบีย่ งเบนมาตรฐานเป็ น 1 ว่า
เส้นโค้งปกติ มาตรฐาน (standard normal curve)
ข้อที่ 23. เด็กทีด่ ู Youtube พีป่ ัน้ มีคะแนนเฉลีย่ คณิต 1 เท่ากับ 60 คะแนน และมีส่วนเบีย่ งเบนมาตรฐานเท่ากับ 20
หากคะแนนเด็กทีด่ ู Youtube พีป่ ั น้ มีการแจกแจงแบบปกติ จงหาค่าตัวแปรสุม่ ปกติมาตรฐาน (𝑧) เมือ่ น้องได้คะแนน
ดังต่อไปนี้
1) 50 คะแนน
2) 72 คะแนน
3) 80 คะแนน
17 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
2) 𝑃(−0.4 ≤ 𝑍 ≤ 0.5)
ตารางแสดงพื้นฐานใต้เส้นโค้งปกติ มาตรฐาน
18 | P a g e
By P’ปั้น บัญชี มธ. Line : @pan_smartmathpro www.smartmathpro.com
ข้อที่ 26. เด็กนักเรียนทีเ่ รียนกับพีป่ ั น้ มีคะแนนกระจายตัวแบบปกติ และมีคะแนนเฉลีย่ PAT1 เท่ากับ 150 คะแนน และมี
ส่วนเบีย่ งเบนมาตรฐานเท่ากับ 20 จงหาความน่าจะเป็ นทีจ่ ะสุ่มได้นกั เรียนทีม่ คี ะแนนสอบในช่วง …
19 | P a g e