การเลือกคุณลักษณะด้วยวิธีสมาชิกที่ใกล้ที่สุดสำหรับการแทนที่ค่าข้อมูลที่ขาดหายด้วยวิธีที่ใกล้ที่สุด
Main Article Content
Abstract
ข้อมูลไมโครอาร์เรย์นิยมใช้ในการศึกษารูปแบบของสิ่งมีชีวิตในระดับโมเลกุล ประกอบด้วยตัวอย่างการทดลองน้อยแต่มีมิติสูง ข้อมูลส่วนใหญ่ที่ได้จะมีค่าข้อมูลที่ขาดหายเป็นจำนวนมาก ทำให้ประสิทธิภาพในการวิเคราะห์ข้อมูลลดลงโดยอัลกอริธึมสำหรับการวิเคราะห์ข้อมูลส่วนใหญ่อัลกอริธึมต้องการข้อมูลที่สมบูรณ์เพื่อให้การวิเคราะห์ข้อมูลมีประสิทธิภาพที่ดีจึงทำให้ต้องการวิธีการแทนค่าข้อมูลที่ขาดหายที่มีประสิทธิภาพ ในงานวิจัยนี้วัตถุประสงค์เพื่อต้องการนำเสนอวิธีการเลือก Feature ที่เหมาะสมในการ Estimate Missing Values สำหรับข้อมูลไมโครอาร์เรย์ด้วยวิธีการ K-Nearest Neighbor ที่ประกอบด้วยสองขั้นตอน คือ การเลือกคุณลักษณะของข้อมูลด้วยวิธีการ K-Nearest Neighbor และการแทนที่ค่าข้อมูลที่ขาดหายด้วยวิธีการ K-Nearest Neighbor จากนั้นทำการเปรียบเทียบประสิทธิภาพกับวิธีการ K-Nearest Neighbor แบบปกติ และ Row Average โดยทำการทดลองกับ 3 Data Set ได้แก่ Lung Tumor, Colon Cancer และ ALL-AML Leukemia dataset จากผลการทดลองพบว่าวิธีการ KNNFS Impute ที่นำเสนอให้ประสิทธิภาพที่ดีกว่าเมื่อเทียบกับวิธีการ K-Nearest Neighbor แบบปกติ และ ROW Average