การจำแนกข้อมูลด้วยวิธีแบบร่วมกันตัดสินใจจากพื้นฐานของเทคนิคต้นไม้ตัดสินใจ เทคนิคโครงข่ายประสาทเทียม และเทคนิคซัพพอร์ตเวกเตอร์แมชชีน ร่วมกับการเลือกตัวแทนที่เหมาะสมด้วยขั้นตอนวิธีเชิงพันธุกรรม

Main Article Content

เดช ธรรมศิริ
พยุง มีสัจ

บทคัดย่อ

บทคัดย่อ

งานวิจัยครั้งนี้ เป็นการนำเสนอวิธีการจำแนกข้อมูลด้วยวิธีร่วมกันตัดสินใจแบบการโหวตเสียงข้างมากจากเทคนิคต้นไม้ตัดสินใจ เทคนิคโครงข่ายประสาทเทียม และเทคนิคซัพพอร์ตเวกเตอร์แมชชีน โดยเลือกตัวแทนที่เหมาะสมด้วยขั้นตอนเชิงพันธุกรรมเพื่อให้ความถูกต้องในการจำแนกข้อมูลที่สูงขึ้น จากการทดสอบความถูกต้องในการจำแนกข้อมูล Australian Credit, German Credit และ BankrubtcyData พบว่า เทคนิคการร่วมกันตัดสินใจจากหลายโมเดลที่ผ่านการเลือกแทนที่เหมาะสมด้วยขั้นตอนวิธีเชิงพันธุกรรมมีผลลัพธ์ที่ดีกว่าการใช้เทคนิคแบบโมเดลเดี่ยว โดยผลการวิจัยพบว่า สำหรับข้อมูล Australian Credit หลังจากใช้วิธีขั้นตอนเชิงพันธุกรรมช่วยในการเลือกตัวจำแนกข้อมูลพบว่าการเลือกใช้ตัวจำแนกที่ให้ประสิทธิภาพสูงสุดได้แก่ การใช้ตัวจำแนกข้อมูล 9 โมเดลร่วมกัน ประกอบด้วยเทคนิคซัพพอร์ตเวกเตอร์แมชชีน 4 โมเดล เทคนิคต้นไม้ตัดสินใจ 3 โมเดล และเทคนิคโครงข่ายประสาทเทียม2 โมเดล ให้ผลลัพธ์ความถูกต้องสูงสุดที่ 89.01% ข้อมูลGerman Credit หลังจากใช้วิธีขั้นตอนเชิงพันธุกรรมช่วยในการเลือกตัวจำแนกข้อมูลพบว่าการเลือกใช้ตัวจำแนกที่ให้ประสิทธิภาพสูงสุดได้แก่ การใช้ตัวจำแนกข้อมูล 18 โมเดล ซึ่งประกอบด้วยเทคนิคซัพพอร์ตเวกเตอร์แมชชีน 7 โมเดลร่วมกัน ประกอบด้วย เทคนิคต้นไม้ตัดสินใจ 6 โมเดล และเทคนิคโครงข่ายประสาทเทียม5 โมเดล ให้ผลลัพธ์ความถูกต้องสูงสุดที่ 71.50% ข้อมูลBankruptcy Data หลังจากใช้วิธีขั้นตอนเชิงพันธุกรรมช่วยในการเลือกตัวจำแนกข้อมูลพบว่าการเลือกใช้ตัวจำแนกที่ให้ประสิทธิภาพสูงสุดได้แก่ การใช้ตัวจำแนกข้อมูล 10 โมเดลร่วมกัน ประกอบด้วยเทคนิคซัพพอร์ตเวกเตอร์แมชชีน 4 โมเดล เทคนิคต้นไม้ตัดสินใจ 4โมเดล และเทคนิคโครงข่ายประสาทเทียม 2 โมเดล ให้ผลลัพธ์ความถูกต้องสูงสุดที่ 71.50%

คำสำคัญ: เทคนิคต้นไม้ตัดสินใจ เทคนิคโครงข่ายประสาทเทียม เทคนิคซัพพอร์ตเวกเตอร์แมชชีน เทคนิคการร่วมกันตัดสินใจ ขั้นตอนวิธีเชิงพันธุกรรม

 

Abstract

In this research we propose an ensembleclassification technique based on majority vote fromdecision tree, artificial neural network, and supportvector machine models selected by genetic algorithmin order to increase classification accuracy. Fromclassification accuracy test on Australian Credit, GermanCredit and Bankruptcy Data, we found that the proposedensemble classification models selected by geneticalgorithm yields better performance than that ofsingle model. The results show as follows. For AustralianCredit after using genetic algorithm find the bestclassifier namely using 9 classifier models including4 support vector models, 3 decision tree modes and 2artificial neural network models achieved bestperformance with 89.01% accuracy on classification.For German Credit data after using genetic algorithmfind the best classifier namely using 18 classifiermodels including 7 support vector machine models,6 decision tree models, and 5 artificial neural networkmodels achieved best performance with 71.50% accuracyon classification. For Bankruptcy Data after usinggenetic algorithm find the best classifier namelyusing 10 classifier models composed of 4 supportvector machine models, 4 decision tree models, and2 artificial neural network models achieved bestperformance with 71.50%.

Keyword: Decision Tree, Artificial Neuron Network,Support Vector Machine, Ensemble,Genetic Algorithm

Article Details

บท
บทความวิจัย