การพยากรณ์โอกาสสำเร็จการศึกษาของนักศึกษาโดยใช้ซัพพอร์ตเวกเตอร์แมชชีน
Main Article Content
Abstract
บทคัดย่อ
งานวิจัยนี้มีวัตถุประสงค์เพื่อพยากรณ์โอกาสสำเร็จการศึกษาของนักศึกษาโดยใช้ซัพพอร์ตเวกเตอร์แมชชีน ชุดข้อมูลกลุ่มตัวอย่างที่นำมาใช้ทดสอบเป็นข้อมูลของนักศึกษาระดับปริญญาตรีหลักสูตร 4 ปี สาขาวิชาวิทยาการคอมพิวเตอร์ คณะเทคโนโลยีสารสนเทศ มหาวิทยาลัยนอร์ทกรุงเทพ ระหว่างปีการศึกษา 2547-2551 จำนวนทั้งสิ้น 138 ระเบียน 18 คุณลักษณะ ชุดข้อมูลที่ได้จะนำส่งเข้าตัวแบบพยากรณ์โอกาสสำเร็จการศึกษาของนักศึกษา ซึ่งจะใช้เทคนิคซัพพอร์ตเวกเตอร์แมชชีน (SVM) เทคนิคต้นไม้ตัดสินใจ (Decision Tree) และเทคนิคโครงข่ายประสาทเทียมแบบย้อนกลับ (BP-ANN) มาทำการสร้างตัวแบบพยากรณ์และเปรียบเทียบเพื่อคัดเลือกตัวแบบพยากรณ์ที่มีประสิทธิภาพสูงสุด โดยการทดสอบประสิทธิภาพตัวแบบจะใช้วิธีไขว้ทบ 15 ส่วน ผลการทดสอบ พบว่า ตัวแบบการพยากรณ์ที่ใช้เทคนิค SVM-PK ให้ความแม่นยำในการพยากรณ์สูงที่สุดที่ร้อยละ 89.13 โดยมีผลการประเมินค่าความแม่นตรงเท่ากับ 0.878 ค่าความระลึกเท่ากับ 0.891 และค่าประสิทธิภาพโดยรวมเท่ากับ 0.860 นอกจากนี้ยังให้ค่า RMSE น้อยที่สุดเท่ากับ 0.3297 โดยที่ตัวแบบพยากรณ์ซัพพอร์ตเวกเตอร์แมชชีนที่ใช้เคอร์เนลฟังก์ชั่นแบบ SVM-NP SVM-RBF และ SVM-PUK ให้ค่าความแม่นยำในการพยากรณ์เท่ากันที่ร้อยละ 87.68 ส่วนตัวแบบพยากรณ์ C4.5 และ BP-ANN ให้ค่าความแม่นยำร้อยละ 83.33 และ 84.36 ตามลำดับ สรุปได้ว่าตัวแบบพยากรณ์ SVM-PK เป็นตัวแบบที่เหมาะสมที่สุดสำหรับการพยากรณ์โอกาสสำเร็จการศึกษาของนักศึกษา
Abstract
The purpose of this paper is to present Support Vector Machine techniques for graduation forecasting. This dataset is composed of 4-year undergraduate in computer science course, Faculty of Information Technology, North Bangkok University, during an academic year 2547-2551, a total of 138 records, 18 features. The dataset will be transferred to a forecast model of graduation by using Support Vector Machine (SVM), Decision Tree (C4.5), and Multi-Layer Perceptron (BP-ANN) techniques. These models are chosen once with high performance of forecast. In performance tests the model will use 15 Fold Cross-Validation. A result of comparison forecast model using the SVM-PK techniques had the highest accuracy in forecasting: 89.13 percent by the Precision equaled 0.878, Recall equaled and 0.891 and F-Measure equaled 0.860 and RMSE got the smallest value equaled 0.3297. The models for SVM-NP, SVM-RBF, and SVM-PUK had an accuracy in forecast equaled 87.68 percent, for C4.5 and BP-ANN forecast had an accuracy of 83.33 percent and 84.36, respectively. Concluded that the forecasting model using SVM-PK is most appropriate for graduation forecasting of graduating students.