การใช้เทคนิคเหมืองข้อมูล เพื่อพยากรณ์การสำเร็จการศึกษา

Main Article Content

กันต์ ศิระพรธนารัชต์
ชุติพนธ์ ศรีสวัสดิ์

บทคัดย่อ

งานวิจัยนี้มีวัตุประสงค์เพื่อ 1) เพื่อศึกษาการคัดเลือกคุณลักษณะที่สำคัญใช้ในการวิเคราะห์ข้อมูล 2) เพื่อพัฒนาแบบจำลองพยากรณ์การสำเร็จการศึกษาของนักศึกษาคณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏพิบูลสงคราม และ 3) เพื่อหาประสิทธิภาพจากแบบจำลอง โดยใช้เทคนิคเหมืองข้อมูล (Data Mining) ข้อมูลที่นำมาวิเคราะห์รวบรวมจากกองบริการการศึกษา มหาวิทยาลัยราชภัฏพิบูลสงคราม ปีการศึกษา 2560-2562 จำนวน 1,082 ระเบียน 30 แอตทริบิวต์ ในการวิเคราะห์หาปัจจัยที่มีผลต่อการสำเร็จการศึกษาใช้วิธีการคัดเลือกคุณลักษณะ (Feature Selection) ใช้ค่า Information Gain และChi Squared โดยแต่ละเทคนิคจะมีการลดลิมิตปัจจัยที่มีค่าน้ำหนักน้อยออกตามเงื่อนไข มีข้อมูลทั้งหมด 15 ชุดข้อมูล ในการสร้างโมเดลจะแบ่งข้อมูลออกเป็น 2 ส่วน Training Data 80% และ Test Data 20% โดยใช้เทคนิคเหมืองข้อมูล 3 เทคนิค คือ ต้นไม้ตัดสินใจ (Decision Tree) ป่าไม้สุ่ม (Random Forest) และการเรียนรู้แบบเบย์ (Naive Bayes) ในการทดสอบประสิทธิภาพของโมเดลใช้ 10-Fold Cross Validation ซึ่งวัดประสิทธิภาพแบบจำลองด้วยค่าความถูกต้อง (Accuracy) และค่า F1-Score ผลการทดลองพบว่าการลดลิมิตเมื่อพิจารณาจากค่า Information Gain จากชุดข้อมูล IG5 คู่กับตัวแบบจำลองป่าไม้สุ่ม (Random Forest) ให้ประสิทธิภาพความถูกต้องโดยรวมเหมาะสมที่สุดซึ่งค่าความถูกต้อง (Accuracy) เท่ากับ 96.03% ค่าเฉลี่ย F1-score เท่ากับ 88.65%

Article Details

บท
บทความวิจัย

References

SC., Vision Mission Philosophy. Available Online at http://202.29.80.54/vision/, accessed on 05 April 2023.

Office of Educational Quality Assurance, Educational quality assurance system. Available Online at https://qa.chandra.ac.th/index.php, accessed on 15 June 2023.

T. Thongthammachart. "The Feature Selection to Creating Models for Predicting Learning Achievement using Data Mining Techniques." Report following the 4th national academic conference Kamphaeng Phet Rajabhat University, pp. 338-347, 2017.

J. Jareanying. The Prediction of Student Performance Using Data Mining Techniques with RapidMiner. Master's Thesis, Information Technology Program Faculty of Science Srinakharinwirot University, 2020.

S. Sinsomboon. Data Mining. 1st ed., Bangkok: Jamjuree Product, 2015.

P. N. wichian, P. Manair, Y. Chuchuen, and S. Mak-on. "Optimization Feature Selection for Classification of Manuscript Grouping." Journal of Science and Technology Songkla University, Vol. 1, No. 1, January-June, 2020.

S. Euawatthanamongkol. Data Mining. 2nd ed., Bangkok: National Institute of Development Administration, (n.d.), 2019.

N. Hongboonmee and P. Trepanichkul. "Comparison of Data Classification Efficiency to Analyze Risk Factors that Affect the Occurrence of Hyperthyroidusing Data Mining Techniques." Journal of Information Science and Technology, Vol. 9, No. 1, pp. 41-51, January-June, 2019.

K. Satangmongkol, K-Fold Cross Validation. Available Online at https://datarockie.com/blog/k-fold-cross-validation/, accessed on 10 June 2023.

P. Rawengwan and P. Seresangtakul. "A model for forecasting educational status of students." Proceedings of the Graduate Research Presentation Conference National and International Levels Khon Kaen University, Vol. 10, pp. 273-283, March, 2017.

T. Klaythong and C. Srisawat. "Forecasting Dropout of Undergraduates Pibulsongkram Rajabhat University with Data Mining Technique." Journal of Applied Informatics and Technology, Vol. 5, No. 1, pp. 1-17, January-June, 2023.

S. Sittichat. "Study of Educational Attributes Using Data Mining Technique." Information Technology Journal, Vol. 13, No. 2, pp. 20-28, July-December, 2017.

N. Janchum and C. Cheewaviriyanon. "Using Data Mining Techniques to Develop a Model for Scratch Programming Assessment." Information Technology Journal, Vol. 18, No. 1, pp. 96-105, January-June, 2022.

S. Vanont, T. Areerat, and C. Saenrat. "A Study of Techniques in Predicting Career Counseling for Undergraduate Students of the Computer Program by Using Data Mining Technique." Journal of Technology Management Rajabhat Maha Sarakham University, Vol. 5, No. 1, January-June, 2018.

REG PSRU, Measurement of educational evaluation. Available Online at https://reg.psru.ac.th/reg2018/student.php, accessed on 20 June 2023.

W. Jaidee and N. Wannapee. "The Study of Factors Affecting for On-time Graduation of Ungraduated Student Using Feature Selection Technique on Imbalanced Datasets." Journal of Information Science and Technology, Vol. 10, No. 1, pp. 75-84, January-June, 2020.

A. Montaphan. "Comparison of Feature Selection Methods to Improve Breast Cancer Prediction." Royal Thai Air Force Medical Gazette, Vol. 65, No. 2, pp. 49-56, May-August, 2019.

A. Phutthala and S. Saensri. "The Searching Relationship of Results High School and Bachelor in Case Study: The Graduate Student in Year 2017 at KU.CSC." The 8th Asia Undergraduate Conference on Computing (AUCC 2020), pp. 277-285, 2023.

D. Hunthong, T. Ngernwilai, and S. Sinsomboonthong. "Efficiency Comparison inReplace Missing Value Using Regression Imputation, Multiple Imputation and Expectation Maximizationfor Classification in Data Mining." Thai Journal of Science and Technology, Vol. 9, No. 5, pp. 575-588, September-October, 2020.