ประสิทธิภาพการจัดกลุ่มของวิธีซัพพอร์ตเวกเตอร์แมทชีน และวิธีเคเนียเรสเนเบอร์ เมื่อข้อมูลมีการแจกแจงเบ้
Keywords:
การจัดกลุ่ม, ซัพพอร์ตเวกเตอร์แมทชีน, เคเนียเรสเนเบอร์, การแจกแจงเบ้Abstract
งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพการจัดกลุ่มของวิธีซัพพอร์ตเวกเตอร์แมทชีน (SVM) และวิธีเคเนียเรสเนเบอร์ (K-NN) กรณีข้อมูลมีการแจกแจงใกล้เคียงปกติ (near Normal) การแจกแจงไม่สมมาตรแบบหางสั้น (asymmetric short-tailed) และการแจกแจงไม่สมมาตรแบบหางยาว (asymmetric long-tailed) โดยข้อมูลแบ่งออกเป็น 2 ชุด คือ ชุดข้อมูลเรียนรู้และชุดข้อมูลทดสอบ ที่มีขนาดตัวอย่างเป็น 100 200 และ 500 โดยจัดข้อมูลออกเป็น 2 กลุ่ม ซึ่งกำหนดอัตราส่วนระหว่างชุดข้อมูลเรียนรู้: ชุดข้อมูลทดสอบมีค่าเป็น 90:10 80:20 70:30 60:40 และ 50:50 ทำการจำลองข้อมูลโดยเทคนิคมอนติคาร์โลและกระทำซ้ำ 5,000 ครั้งในแต่ละสถานการณ์ที่กำหนด และใช้ค่าเฉลี่ยของการจัดกลุ่มผิดพลาดเป็นเกณฑ์ในการเปรียบเทียบ โดยผลการวิจัยพบว่า เมื่อข้อมูลมีการแจกแจงใกล้เคียงปกติ วิธี K-NN ให้อัตราการจัดกลุ่มข้อมูลผิดพลาดต่ำกว่าวิธี SVM แต่เมื่อข้อมูลมีการแจกแจงไม่สมมาตรแบบหางยาวและไม่สมมาตรแบบหางสั้น วิธี SVM ให้อัตราการจัดกลุ่มข้อมูลผิดพลาดต่ำกว่าวิธี K-NN
Downloads
How to Cite
Issue
Section
License
Each article is copyrighted © by its author(s) and is published under license from the author(s).