ภูวษา แซ่อุ้ย 5614402063

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 14

เปรียบเทียบการประมาณค่าพารามิเตอร์ด้วยวิธีเบส์ วิธีลำดับชัน


ของเบส์

และวิธีวิเคราะห์ความถดถอยแบบกำลังสองน้อยสุดสองขัน

A COMPARISION BAYS HIERARCHICAL BAYESIAN


AND

TWO-STAGE LEAST SQUARES METHODS IN


ESTIMATING PARAMETERS

คำนำ

ในปั จจุบันการวิจัยด้านต่างๆ จำเป็ นต้องใช้วิธีการทางสถิติเข้ามาช่วย


ในการวิเคราะห์หาคำตอบและการพยากรณ์ วิธีที่ผู้วิจัยส่วนใหญ่นิยมใช้ คือ
การวิเคราะห์การถดถอย (Regression Analysis) และสร้างตัวแบบการ
ถดถอยโดยใช้วิธีกำลังสองน้อยสุด (Ordinary Least Square : OLS) ซึ่งวิธี
กำลังสองน้อยสุด (Ordinary Least Square : OLS) ใช้เพียงข้อมูลใน
ปั จจุบันประมาณค่าพารามิเตอร์ ความคลาดเคลื่อนที่เกิดขึน
้ ค่อนข้างสูง จึง
จำเป็ นที่ต้องทำให้ความคลาดเคลื่อนลดต่ำลง เพื่อให้ค่าประมาณที่ได้มีความ
ถูกต้องและเหมาะสมมากขึน
้ ดังนัน
้ จึงนำวิธีเบส์ (Bays) เข้ามาช่วยในการ
ประมาณค่าข้อมูล ซึ่งวิธีนอ
ี ้ าศัยหลักการที่ว่า ข้อมูลที่ศึกษาประกอบด้วย
ข้อมูลในปั จจุบันซึ่งเป็ นข้อมูลที่ได้จาการทดลอง เรียกว่าฟั งก์ชันควรจะเป็ น
(Likelihood Function) ข้อมูลในอดีต เรียกว่า การแจกแจงก่อน (Prior
Distribution) และข้อมูลในอนาคต เรียกว่า การแจกแจงภายหลัง
(Posterior Distribution) ซึง่ ความสัมพันธ์ของวิธีนม
ี ้ ีว่า ข้อมูลใน
อนาคต(การแจกแจงภายหลัง Posterior Distribution) แปรผันกับผลคูณ
ของข้อมูลในปั จจุบัน (ฟั งก์ชันควรจะเป็ น Likelihood Function) กับข้อมูล
ในอดีต (การแจกแจงก่อน Prior Distribution)

ผู้วิจัยได้ศึกษาการเปรียบเทียบการประมาณค่าพารามิเตอร์ของการ
ถดถอยในระบบสมการถดถอยต่อเนื่อง(Simultaneous Equation) และ
สนใจสมการเชิงเส้นพหุคูณ โดยที่ตัวแปรอิสระและตัวแปรที่ใช้อธิบายค่า
สังเกต y i เป็ นอิสระกัน ซึ่งค่าประมาณที่ได้จากวิธีกำลังสองน้อยสุด
(Ordinary Least Square : OLS) เป็ นตัวประมาณที่เอนเอียง (Bias) และ
ไม่คงเส้นคงวา (Inconsistancy) จึงมีการประมาณค่าโดยคำนวณทีละ
สมการ ตัวประมาณที่ได้จะมีความคงเส้นคงวา (Consistancy) และถ้า
ตัวอย่างขนาดใหญ่ขน
ึ ้ จะเป็ นตัวประมาณที่ไม่เอนเอียง (Unbias) ซึ่งวิธีนี ้
เรียกว่า วิธีกำลังสองน้อยสุดสองขัน
้ (Two-Stage Least Squares
Regression) นอกจากนีย
้ ังมีการคำนวณในลักษณะคล้ายกับวิธีกำลังสอง
น้อยสุดสองขัน
้ (Two-Stage Least Squares Regression) คือ วิธีลำดับ
ชัน
้ ของเบส์ (Hierarchical Bays) โดยการประมาณข้อมูลในอดีต (การ
แจกแจงก่อน Prior Distribution) และพารามิเตอร์ขน
ึ ้ มา จากนัน
้ นำข้อมูล
ดังกล่าวที่ประมาณได้มาประมาณข้อมูลในอดีต (การแจกแจงก่อน Prior
Distribution) และพารามิเตอร์ซ้ำอีกครัง้ เพื่อให้ได้ตัวประมาณที่มีความถูก
ต้องมากขึน

ดังนัน
้ ผู้วิจัยสนใจศึกษาการเปรียบเทียบการประมาณค่าพารามิเตอร์
ในระบบสมการถดถอยต่อเนื่อง (Simultaneous Equation) โดยที่ตัวแปร
อิสระและตัวแปรที่ใช้อธิบายค่าสังเกต yi เป็ นอิสระกัน ซึ่งวิธีที่ผู้วิจัยได้ศึกษา
ในครัง้ นี ้ ได้แก่วิธีการเบส์ (Bays) วิธีลำดับชัน
้ ของเบส์ (Hierarchical Bays)
และวิธีวิเคราะห์ความถดถอยแบบกำลังสองน้อยสุดสองขัน
้ (Two-Stage
Least Squares Regression) ถ้าผลจากการวิจัยพบว่าใน 3 วิธีที่ได้ศึกษา
์ าพในการประมาณค่าดีที่สุด และในการวิเคราะห์
ในครัง้ นี ้ วิธีใดมีประสิทธิภ
ครัง้ ต่อไปจะเลือกใช้วิธีนน
ั้

วัตถุประสงค์

1. เพื่อศึกษาการประมาณค่าพารามิเตอร์ทงั ้ 3 วิธี ได้แก่ วิธีเบส์ (Bays)


วิธีลำดับชัน
้ ของเบส์ (Hierarchical Bays) และวิธีวิเคราะห์ความถดถอย
แบบกำลังสองน้อยสุดสองขัน
้ (Two-Stage Least Squares Regression)
2. เพื่อเปรียบเทียบประสิทธิภาพการประมาณค่าพารามิเตอร์ที่ได้จากทัง้
3 วิธี

ขอบเขตการวิจัย

1. ตัวแบบที่ใช้ในการวิจัย คือตัวแบบถดถอยต่อเนื่อง โดยที่ตัวแปรอิสระ


หรือตัวแปรที่ใช้อธิบายค่าสังเกต yi เป็ นอิสระซึ่งกันและกัน
2. จำนวนตัวแปรอิสระที่ศึกษา คือ 2,3, 4 และ 6 ตัวแปร
3. ขนาดตัวอย่างที่ใช้ในการศึกษา(n) 3, 8, 13, 18, 23 และ 28 เท่า
ของตัวแปรอิสระ
4. ตัวแปรอิสระ z ij มีการแจกแจงปกติมาตรฐาน ( ค่าเฉลี่ยเท่ากับ 0 และ
ความแปรปรวนมีค่าเท่ากับ 1 )
5. ความคลาดเคลื่อนสุ่มของ ε ij มีการแจกแจงแบบปกติด้วยค่าเฉลี่ย
เท่ากับ 0 ความแปรปรวนเท่ากับ 0.15, 0.45, 0.50, 0.75, 1, 3 และ 6
6. ความคลาดเคลื่อนสุ่มของ vij มีการแจกแจงแบบปกติด้วยค่าเฉลี่ย
เท่ากับ 0 ความแปรปรวนเท่ากับ 0.15, 0.45, 0.50, 0.75, 1, 3 และ 6
7. ค่า β prior ~ N ( μ β, σ 2β ) โดยที่ μβ เท่ากับ 1 และ σ 2β เท่ากับ 0.1, 03, 0.6,
0.9, 1 และ 3
์ วามถดถอย
8. ค่าพารามิเตอร์ของสัมประสิทธิค
βi = I ; i=0,1,2,…,6 γ0 j = -1 ; j=1,2,…,6
γ1j = j ; j = 1, 3, 5 γ 1 j = - (j-1) ; j = 2, 4, 6

ประโยชน์ที่คาดว่าจะได้รับ

1. ได้ทราบถึงประสิทธิภาพของวิธีการประมาณค่าพารามิเตอร์ ด้วยวิธี
เบส์ (Bays) วิธีลำดับชัน
้ ของเบส์ (Hierarchical Bays) และวิธีวิเคราะห์
ความถดถอยแบบกำลังสองน้อยสุดสองขัน
้ (Two-Stage Least Squares
Regression)

2. เป็ นแนวทางการสำหรับการวิเคราะห์ระบบสมการถดถอยต่อเนื่อง
(Simultaneous Equation)
การตรวจเอกสาร

งานวิจัยที่เกี่ยวข้อง

วีรพา (2542) ได้ศึกษาการวิเคราะห์เชิงเบส์สำหรับตัวแบบการถดถอย


เชิงเส้นเชิงเดี่ยว โดยศึกษาการเปรียบเทียบค่าประมาณสัมประสิทธิก์ าร
ถดถอยจากตัวแบบจากทัง้ 4 วิธี คือ วิธีกำลังสองน้อยสุด (OLS) วิธีเชิงเบส์
เมื่อใช้การแจกแจงก่อนที่ไม่ให้ข้อมูล (UNI) วิธีเบส์เมื่อใช้การแจกแจงก่อนที่
ให้ข้อมูล (NOR) และวิธีเบส์เมื่อใช้การแจกแจงก่อนของเจฟฟรีส์ (JEF) โดย
เกณฑ์ที่ใช้ในการตัดสินใจ คือ ค่าเฉลี่ยความคลาดเคลื่อนกำลังสอง (AMSE)
พบว่า วิธีกำลังสองน้อยสุด (OLS) มีประสิทธิภาพดีเมื่อสัมประสิทธิข์ องการ
แปรผัน CV(X) มีค่าสูง ส่วนเบี่ยงเบนมาตรฐานของตัวแปรตามมีค่าต่ำ และ
ขนาดตัวอย่างขนาดใหญ่ ส่วนวิธีวิธีเบส์เมื่อใช้การแจกแจงก่อนที่ให้ข้อมูล
(NOR) มีประสิทธิภาพดีเมื่อสัมประสิทธิข์ องการแปรผัน CV(X) มีค่าต่ำ ส่วน
เบี่ยงเบนมาตรฐานของตัวแปรตามมีค่าสูง และขนาดตัวอย่างขนาดเล็ก และ
ได้ศึกษาวิธีวิธีเบส์เมื่อใช้การแจกแจงก่อนที่ให้ข้อมูล (NOR) ในกรณีการหา
ค่า Z ที่เหมาะสมโดยใช้ วิธีวิธีเบส์เมื่อใช้การแจกแจงก่อนที่ให้ข้อมูล (NOR)
์ าพใกล้เคียงกับวิธีกำลังสองน้อยสุด (OLS) และวิธีเชิงเบส์เมื่อใช้
มีประสิทธิภ
การแจกแจงก่อนที่ไม่ให้ข้อมูล (UNI) พบว่า ค่า Z ที่เหมาะสมแปรผันตาม
ส่วนเบี่ยงเบนมาตรฐานของตัวแปรตาม แต่แปรผกผันกับ สัมประสิทธิข์ อง
การแปรผัน CV(X) และขนาดตัวอย่าง โดยที่ขนาดตัวอย่างที่ใช้ศึกษามีค่า
เท่ากับ 10, 30, 50 และ 100 และความคลาดเคลื่อนมีการแจกแจงแบบ
ปกติซึ่งมีค่าเฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.1, 0.3,
0.5, 0.7 และ 0.9 ส่วนตัวแปรอิสระเป็ นค่าคงที่สุ่มมีการแจกแจงแบบปกติ
ด้วยค่าเฉลี่ยเท่ากับ 1 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.1, 0.15, 0.2,
0.25, 0.3, 0.5, 0.7 และ 0.9

จิตติมา (2546) ได้ศึกษาการเปรียบเทียบวิธีการคัดเลือกสมการ


ถดถอยที่ดีที่สุดเชิงเบส์เมื่อใช้การแจกแจงก่อนแบบคู่สังยุคปกติ โดยเปรียบ
เทียบวิธีการคัดเลือกสมการถดถอย 3 วิธี ได้แก่ วิธีการเฉลี่ยตัวแบบของเบส์
( BMA SVT ) วิธีการคัดเลือกตัวแบบที่เหมาะสมที่สุด (OPM) และวิธีถดถอยแบบ
ขัน
้ บันได (SR) โดยเกณฑ์ที่ใช้ในการตัดสินใจ คือ เกณฑ์ค่าเฉลี่ยของค่าคลาด
เคลื่อนกำลังสองเฉลี่ย (AMSE) และเกณฑ์ค่าอัตราส่วนผลต่างของค่าเฉลี่ย
ค่าคาดเคลื่อนกำลังสองเฉลี่ย (RDAMSE) และศึกษาการแจกแจงปกติ มีค่า
เฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐาน (σ ) เท่ากับ 0.25, 0.50 และ
2.50 ตามลำดับ ขนาดตัวอย่างที่ใช้ (n) คือ 15, 30, 50 และ 100 จำนวน
ตัวแปรอิสระที่ศึกษา 3, 5, 8, 10, 12 และ 15 และค่าคงที่สำหรับวิธีการ
เฉลี่ยตัวแบบของเบส์( BMA SVT ) และวิธีการคัดเลือกตัวแบบที่เหมาะสมที่สุด
(OPM) มี 4 ระดับ (1,5) (1,10) (10,100) (10,500) ซึ่งปั จจัยที่มีผลต่อ
เกณฑ์ค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (AMSE) จะแปรผันตามค่า
ส่วนเบี่ยงเบนมาตรฐานของค่าคาดเคลื่อนและจำนวนตัวแปรอิสระ แต่จะ
แปรผกผันกับขนาดตัวอย่าง พบว่า วิธีการคัดเลือกตัวแบบที่เหมาะสม
ที่สุด(OPM) มีประสิทธิภาพดีกว่าวิธีการเฉลี่ยตัวแบบของเบส์ ( BMA SVT ) เพียง
เล็กน้อย ส่วนวิธีวิธีถดถอยแบบขัน
้ บันได (SR) มีค่าเฉลี่ยของค่าคลาดเคลื่อน
กำลังสองเฉลี่ย (AMSE) แตกต่างจากสองวิธีข้างต้น อย่างชัดเจนในทุก
สถานการณ์

เกียรติเทพ (2548) ได้ศึกษาการเปรียบเทียบการประมาณค่า


พารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์ความถดถอยพหุคูณแบบสองขัน
้ กำลัง
สองน้อยสุด โดยเกณฑ์ที่ใช้ในการตัดสินใจ คือ ค่าร้อยละของความผิดพลาด
ของค่าประมาณที่ได้กับค่าพารามิเตอร์จริง และค่าความแปรปรวน โดยค่า
ความคลาดเคลื่อนสุ่มที่ใช้ในการศึกษามีการแจกแจงแบบปกติ โดยที่ค่า
เฉลี่ยเท่ากับ 0 ส่วนเบี่ยงเบนมาตรฐานเท่ากับ 0.15, 0.25, 0.5, 0.6, 1 และ
1.5 ตามลำดับ และขนาดตัวอย่างที่ใช้ศึกษามีค่าเท่ากับ 10, 30, 50, 75
และ 100 ในการศึกษามีการกำหนดค่า β 0, β 1, γ 0, γ 1 ให้เท่ากับ 0, 2, 0, 3 ตาม

ลำดับ และ β prior N ( μ β=1.5, σ β ) เมื่อ σ β เท่ากับ 0.1, 0.25, 1, 10 พบว่าค่าร้อย


2 2
~

ละของความผิดพลาด และค่าความแปรปรวน จะแปรผันตามค่าส่วนเบี่ยง


เบนมาตรฐานของความคลาดเคลื่อนสุ่ม และจะแปรผันกับขนาดตัวอย่าง
จะได้ว่า เมื่อขนาดตัวอย่างขนาดเล็กถึงขนาดกลาง หรือถ้าส่วนเบี่ยงเบน
มาตรฐานของความคลาดเคลื่อนสุ่มเพิ่มขึน
้ ตัวประมาณที่ได้จากวิธีเบส์มี
์ าพดีที่สุด
ประสิทธิภ

ปรางค์ทิพย์ (2550) ได้ศึกษาการเปรียบเทียบการประมาณค่า


พารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์การถดถอยพหุคูณแบบกำลังสองน้อย
้ โดยเปรียบเทียบประสิทธิภาพวิธีการประมาณค่าสัมประสิทธิ ์
สุดสองขัน
ความถดถอยระหว่างวิธีเบส์แบบการแจกแจงก่อนที่ไม่ให้ข้อมูล วิธีเบส์แบบ
การแจกแจงก่อนที่ให้ข้อมูล และวิธีวิเคราะห์ความถดถอยกำลังสองน้อยสุด
สองขัน
้ โดยเกณฑ์ที่ใช้เปรียบเทียบ คือ ความผิดพลาดโดยเฉลี่ยของค่า
์ ี่ประมาณได้กับพารามิเตอร์จริง(MAPE) กำหนดให้ตัวแปร
สัมประสิทธิท
อิสระมี 2, 3 และ 5 ตัวแปร และขนาดตัวอย่างที่ใช้ศึกษามีค่าเท่ากับ 5, 10,
15, 20, 25 และ 30 เท่าของจำนวนตัวแปรอิสระ และความคลาดเคลื่อนสุ่ม
ของสมการเกี่ยวเนื่องจากสมการหลักมีค่าเฉลี่ยเป็ น 0 ความแปรปรวนเป็ น
0.25, 0.5, 1, 2, และ 5 ความคลาดเคลื่อนสุ่มจากสมการหลักมีค่าเฉลี่ยเป็ น
0 ความแปรปรวนเป็ น 0.25, 0.5, 1, 2 และ 5 เท่าของสมการเกี่ยว
เนื่องจากสมการหลัก พบว่า

กรณีที่ใช้จำนวนตัวแปรอิสระ 2 ตัวแปร ถ้าตัวอย่างขนาดเล็กถึงปาน


กลาง และค่าความแปรปรวนของความคลาดเคลื่อนสุ่มในสมการหลักมีค่า
น้อยกว่าค่าความแปรปรวนของความคลาดเคลื่อนสุ่มในสมการเกี่ยว
เนื่องจากสมการหลัก จะได้ว่า วิธีการเบส์แบบการแจกแจงก่อนที่ให้ข้อมูลมี
์ าพดีที่สุด แต่เมื่อค่าความแปรปรวนของความคลาดเคลื่อนสุ่มใน
ประสิทธิภ
สมการหลักมีค่ามากกว่าค่าความแปรปรวนของความคลาดเคลื่อนสุ่มใน
สมการเกี่ยวเนื่องจากสมการหลัก จะได้ว่าวิธีการเบส์แบบการแจกแจงก่อนที่
์ าพดีที่สุด แต่ถ้าตัวอย่างขนาดใหญ่ ค่าความ
ไม่ให้ข้อมูลมีประสิทธิภ
แปรปรวนของความคลาดเคลื่อนสุ่มในสมการเกี่ยวเนื่องจากสมการหลักมีค่า
น้อยกว่าหนึ่ง จะได้ว่า วิธีวิเคราะห์ความถดถอยกำลังสองน้อยสุดสองขัน
้ มี
์ าพดีที่สุด และค่าความแปรปรวนของความคลาดเคลื่อนสุ่มใน
ประสิทธิภ
สมการเกี่ยวเนื่องจากสมการหลักมีค่ามากกว่าหนึ่ง จะได้ว่า วิธีการเบส์แบบ
์ าพดีที่สุด
การแจกแจงก่อนที่ให้ข้อมูลมีประสิทธิภ
กรณีที่ใช้จำนวนตัวแปรอิสระ 3 ตัวแปรและ 5 ตัวแปร พบว่า วิธีการ
์ าพดีที่สุด ยกเว้นกรณีที่
เบส์แบบการแจกแจงก่อนที่ให้ข้อมูลมีประสิทธิภ
ตัวอย่างขนาดเล็กและค่าความแปรปรวนของความคลาดเคลื่อนสุ่มใน
สมการหลักมีค่ามากกว่าค่าความแปรปรวนของความคลาดเคลื่อนสุ่มใน
สมการเกี่ยวเนื่องจากสมการหลัก จะได้ว่า วิธีการเบส์แบบการแจกแจงก่อน
์ าพดีที่สุด
ที่ไม่ให้ข้อมูลมีประสิทธิภ
เอกสารและสิ่งอ้างอิง

ธีระพร วีระถาวร. 2536. การอนุมานเชิงสถิติขน


ั ้ กลาง : โครงสร้างและ
ความหมาย. พิมพ์ครัง้ ที่ 2. โรงพิมพ์จุฬาลงกรณ์มหาวิทยาลัย.

ธีระพร วีระถาวร. 2541. ตัวแบบเชิงทฤษฎีและการประยุกต์. กรุงเทพฯ:


บริษัท วิทยพัฒน์ จำกัด.

วีรพา ฐานะปรัชญ์. 2542. การวิเคราะห์เชิงเบส์สำหรับตัวแบบการถดถอย


เชิงเส้นเชิงเดี่ยว. วิทยานิพนธ์ปริญญามหาบัณฑิต, จุฬาลงกรณ์
มหาวิทยาลัย.
จิตติมา ผสมญาติ. 2546. การเปรียบเทียบวิธีการคัดเลือกสมการถดถอยที่
ดีที่สุดเชิงเบส์ เมื่อใช้การแจกแจงก่อนแบบคู่สังยุคปกติ.
วิทยานิพนธ์ปริญญามหาบัณฑิต, จุฬาลงกรณ์มหาวิทยาลัย.

เกียรติเทพ ตัง้ สันติถาวร. 2548. การเปรียบเทียบการประมาณค่า


พารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์ความ ถดถอยแบบสองขัน

กำลังสองน้อยสุด. วิทยานิพนธ์ปริญญามหาบัณฑิต, จุฬาลงกรณ์
มหาวิทยาลัย.

ปรางค์ทิพย์ รัชตะปี ติ. 2550. การเปรียบเทียบการประมาณค่า


พารามิเตอร์ด้วยวิธีเบส์กับวิธีวิเคราะห์ความถดถอยพหุคูณแบบ
กำลังสองน้อยสุดสองขัน
้ . วิทยานิพนธ์ปริญญามหาบัณฑิต,
จุฬาลงกรณ์มหาวิทยาลัย.

Koop G. (2003). Baysian Econometrics. England: John Wiley.


Asikgil B. and Erar A.( 2013). Polynomail tapered two-stage
least squares method in nonlinear regression. Applied
Mathematics and computation,219(2013) 9743-9754.

Mudgal A., et al. (2014). Driving Behavior at a roundabout: A


hierarchical Baysian regression analysis. Transportaion
Research Part D,26(2014)20-26

You might also like