Solving Imbalanced Problem of Muticlass Data Set with Class Balancer and Synthetic Minority Over-sampling Technique

Main Article Content

Pumitara Ruangthong
Pradit Songsangyos
Soontaree Kankaew

Abstract

Classifying multiclass data set frequently leads to poor results. Therefore, this research tends to solve imbalanced multiclass data set. We compare the data undergone class imbalance problem solving process with the unsolved data to look for predictive modelling most suitable for imbalanced multiclass data set. As it contains multiple classes, we treat each class equitably. Dispersion of accurate prediction for each class is of result consideration.

 

ปัญหาการจำแนกประเภทของข้อมูลที่มีลักษณะแบบหลายคลาสในข้อมูลชุดเดียวกัน มักให้ผลลัพธ์ที่ไม่ดีเท่าที่ควร ดังนั้นในงานวิจัยนี้ได้มุ่งเน้นประเด็นการแก้ปัญหาความไม่สมดุลของข้อมูลที่มีลักษณะแบบหลายคลาส จึงได้ทำการเปรียบเทียบข้อมูลที่ผ่านการแก้ปัญหาความไม่สมดุลของคลาสกับข้อมูลปกติที่ยังไม่ผ่านการแก้ปัญหาความไม่สมดุล เพื่อหารูปแบบการทำนายผลที่เหมาะสมกับข้อมูลแบบหลายคลาสที่มีลักษณะความไม่สมดุลของข้อมูล เนื่องจากข้อมูลเป็นแบบหลายคลาส ดังนั้นงานวิจัยนี้จึงได้ให้ความสำคัญกับผลลัพธ์ของแต่ละคลาสอย่างเท่าเทียมกัน การพิจารณาผลลัพธ์ จะดูจากการกระจายของความถูกต้องของการทำนายในแต่ละคลาส

Article Details

Section
ACTIS Article