การเปรียบเทียบประสิทธิภาพการจัดกลุ่มข้อมูล โดยวิธีการเลือกลักษณะสำคัญแบบพลวัตเพื่อเพิ่มประสิทธิภาพของอัลกอริทึม การจัดกลุ่มบนปริภูมิย่อย
Main Article Content
Abstract
งานวิจัยชิ้นนี้เป็นการนำเสนอผลการเปรียบเทียบ ประสิทธิภาพระหว่างกระบวนการจัดกลุ่มข้อมูลโดยวิธี การเลือกลักษณะสำคัญแบบพลวัต (Dynamic Feature Selection: DFS) เพื่อเพิ่มประสิทธิภาพของอัลกอริทึม การจำแนกกลุ่มบนปริภูมิย่อย (Subspace Clustering Algorithms) กับเทคนิคการจัดกลุ่มข้อมูลที่มีอยู่เดิม
ผลการวิจัยให้ผลการเปรียบเทียบประสิทธิภาพในด้าน ความถูกต้องของการจัดกลุ่ม อัลกอริทึมการจัดกลุ่มบน ปริภูมิย่อยที่ทำงานร่วมกับ Hierarchical Clustering ให้ ค่าความถูกต้องในภาพรวมสูงที่สุดที่ระดับร้อยละ 94% คิดเป็นการจำแนกข้อมูลตามกลุ่มได้ถูกต้อง 1,503 ข้อมูล จาก 1,605 ข้อมูล โดยกลุ่มจำแนกได้ดีที่สุดคือ A มี ค่าความถูกต้องที่ร้อยละ 100% ลองลงมาได้แก่ อัลกอริทึม การจัดกลุ่มบนปริภูมิย่อยที่ทำงานร่วมกับ K-Means Clustering ให้ค่าความถูกต้องในภาพรวมที่ระดับร้อยละ 83% คิดเป็นการจำแนกข้อมูลตามกลุ่มได้ถูกต้อง 1,331 ข้อมูล จาก 1,605 ข้อมูล โดยกลุ่มจำแนกได้ดีที่สุดคือ A มี ค่าความถูกต้องที่ร้อยละ 100% ทั้งนี้ทั้ง 2 อัลกอริทึม ผ่านกระบวนการสร้างชุดของลักษณะสำคัญ (Feature Set) ด้วยอัลกอริทึมการเลือกลักษณะสำคัญแบบพลวัต (Dynamic Feature Selection)
A Comparative Efficiency of Clustering Using Dynamic Feature Selection Optimization of Subspace Clustering Algorithms
Werayut Pimpaporn and Phayung Meesad
This research presented the result of the comparative efficiency between the Clustering Using Dynamic Feature Selection (DFS) for increasing efficiency of Subspace Clustering Algorithms and the existing Clustering techniques.
The result showed that the comparative efficiency in accuracy of the Subspace Clustering Algorithms worked with the Hierarchical Clustering had the overall accuracy highest rate at the level of 94%. It was classified the 1,503 accurate data from 1,605. The best group is classified as a 100% accuracy was the grade A group. Next, the Subspace Clustering Algorithms that works with K-Means Clustering had the overall accuracy level of 83%. It was classified the 1,331 accurate data from 1,605. The best group is classified as a 100% accuracy was the grade A group. However, both of algorithms through the Feature Set with the Dynamic Feature Selection (DFS).