การเลือกคุณลักษณะด้วยวิธีสมาชิกที่ใกล้ที่สุดสำหรับการแทนที่ค่าข้อมูลที่ขาดหายด้วยวิธีที่ใกล้ที่สุด

ไก้รุ่ง เฮงพระพรหม; พยุง มีสัจ

PDF

Published: Jan 1, 2008

Keywords:

ไมโครอาร์เรย์ การแทนที่ข้อมูล ค่าข้อมูลที่ขาดหาย วิธีสมาชิกที่ใกล้ที่สุด K-Nearest Neighbor Estimate Missing Values

ไก้รุ่ง เฮงพระพรหม

พยุง มีสัจ

Abstract

ข้อมูลไมโครอาร์เรย์นิยมใช้ในการศึกษารูปแบบของสิ่งมีชีวิตในระดับโมเลกุล ประกอบด้วยตัวอย่างการทดลองน้อยแต่มีมิติสูง ข้อมูลส่วนใหญ่ที่ได้จะมีค่าข้อมูลที่ขาดหายเป็นจำนวนมาก ทำให้ประสิทธิภาพในการวิเคราะห์ข้อมูลลดลงโดยอัลกอริธึมสำหรับการวิเคราะห์ข้อมูลส่วนใหญ่อัลกอริธึมต้องการข้อมูลที่สมบูรณ์เพื่อให้การวิเคราะห์ข้อมูลมีประสิทธิภาพที่ดีจึงทำให้ต้องการวิธีการแทนค่าข้อมูลที่ขาดหายที่มีประสิทธิภาพ ในงานวิจัยนี้วัตถุประสงค์เพื่อต้องการนำเสนอวิธีการเลือก Feature ที่เหมาะสมในการ Estimate Missing Values สำหรับข้อมูลไมโครอาร์เรย์ด้วยวิธีการ K-Nearest Neighbor ที่ประกอบด้วยสองขั้นตอน คือ การเลือกคุณลักษณะของข้อมูลด้วยวิธีการ K-Nearest Neighbor และการแทนที่ค่าข้อมูลที่ขาดหายด้วยวิธีการ K-Nearest Neighbor จากนั้นทำการเปรียบเทียบประสิทธิภาพกับวิธีการ K-Nearest Neighbor แบบปกติ และ Row Average โดยทำการทดลองกับ 3 Data Set ได้แก่ Lung Tumor, Colon Cancer และ ALL-AML Leukemia dataset จากผลการทดลองพบว่าวิธีการ KNNFS Impute ที่นำเสนอให้ประสิทธิภาพที่ดีกว่าเมื่อเทียบกับวิธีการ K-Nearest Neighbor แบบปกติ และ ROW Average

Issue

Vol. 4 No. 1 (2008): มกราคม-มิถุนายน 2551

Section

บทความวิจัย

Article Sidebar

Main Article Content

Abstract

Article Details