การเปรียบเทียบวิธีการเติมข้อมูลสูญหายในตัวแปรตามที่เกิดการสูญหายแบบสุ่ม สำหรับการถดถอยเชิงเส้นพหุคูณ

Main Article Content

สุปรียา สระโสม
ธิดาเดียว มยุรีสวรรค์

บทคัดย่อ

งานวิจัยนี้ได้พัฒนาวิธีการเติมข้อมูลสูญหายในตัวแปรตามสำหรับการถดถอยเชิงเส้นพหุคูณ เมื่อตัวแปรตามมีการสูญหายแบบสุ่ม (Missing at random) โดยวิธีที่พัฒนาได้แก่ วิธี Mean Regression Imputation (MRI) วิธี Expectation Maximization with Multiple Imputation (EMMI) และวิธี Nearest Average Regression Imputation (NARI) โดยเปรียบเทียบประสิทธิภาพวิธีที่พัฒนาขึ้นกับอีก 6 วิธี ได้แก่ วิธี Regression Imputation (RI) วิธี Stochastic Regression Imputation (SRI) วิธี K Nearest Neighbor Imputation (KNN) วิธี Expectation Maximization Algorithm (EM) วิธี Multiple Imputation (MI) และวิธี Proportioned Residual Draw Imputation (PRD) การศึกษาจากการจำลองข้อมูลด้วยโปรแกรม R กำหนดส่วนเบี่ยงเบนมาตรฐานของค่าความคลาดเคลื่อน (gif.latex?\sigma) เท่ากับ 5, 10 และ 15 และขนาดตัวอย่าง (n) เท่ากับ 30, 50, 100 และ 200 และร้อยละการสูญหายเท่ากับ 5, 10, 15 และ 20 เกณฑ์เปรียบเทียบประสิทธิภาพคือค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (Average Mean Square Error: AMSE) ผลการวิจัยพบว่า วิธี EMMI มีประสิทธิภาพดีที่สุดสำหรับทุกระดับขนาดตัวอย่างที่มีค่าเท่ากับ 5 และร้อยละการสูญหายเท่ากับ 5 วิธี MRI มีประสิทธิภาพดีกว่าวิธีอื่นที่ทุกระดับขนาดตัวอย่างเมื่อ gif.latex?\sigma มีค่าเท่ากับ 10 และร้อยละการสูญหายเท่ากับ 5 และวิธี MRI ยังคงมีประสิทธิภาพดีที่สุดเมื่อ gif.latex?\sigma มีค่าเท่ากับ 15 ในทุกระดับร้อยละการสูญหายและเกือบทุกระดับขนาดตัวอย่าง ส่วนผลการศึกษาจากข้อมูลจริงที่ n เท่ากับ 50 พบว่าวิธี MRI มีประสิทธิภาพดีที่สุดในทุกระดับร้อยละการสูญหาย

Article Details

How to Cite
สระโสม ส., & มยุรีสวรรค์ ธ. . (2019). การเปรียบเทียบวิธีการเติมข้อมูลสูญหายในตัวแปรตามที่เกิดการสูญหายแบบสุ่ม สำหรับการถดถอยเชิงเส้นพหุคูณ. วารสารวิทยาศาสตร์ มข., 47(4), 737–748. สืบค้น จาก https://ph01.tci-thaijo.org/index.php/KKUSciJ/article/view/250058
บท
บทความวิจัย