การวิเคราะห์ปัจจัยที่มีผลต่อการพ้นสภาพของนักศึกษาโดยใช้เทคนิคเหมืองข้อมูล กรณีศึกษา หลักสูตรวิทยาการคอมพิวเตอร์และหลักสูตรเทคโนโลยีสารสนเทศ มหาวิทยาลัยราชภัฏยะลา (Analysis of Factors Influencing the Dismissal of Students Using Data Mining Techniques Case Study: Computer Science Program and Information Technology Program of Yala Rajabhat University)
Main Article Content
Abstract
การวิจัยนี้มีวัตถุประสงค์เพื่อวิเคราะห์ปัจจัยที่มีผลต่อการพ้นสภาพของนักศึกษา หลักสูตรวิทยาการคอมพิวเตอร์และหลักสูตรเทคโนโลยีสารสนเทศ มหาวิทยาลัยราชภัฏยะลา ซึ่งใช้ข้อมูลของนักศึกษาที่กำลังศึกษาและสำเร็จการ ศึกษาแล้วระหว่างปีการศึกษา 2555 – 2558 เป็นข้อมูลจากหลักสูตรวิทยาการคอมพิวเตอร์ จำนวน 97 ระเบียน และหลักสูตรเทคโนโลยีสารสนเทศ จำนวน 202 ระเบียน ประกอบด้วย 26 คุณลักษณะ โดยใช้เทคนิคเหมืองข้อมูล ประกอบด้วยเทคนิคต้นไม้ตัดสินใจ (Decision Tree) เทคนิคโครงข่ายประสาทเทียมแบบย้อนกลับ (Back Propagation Neural Network : BP-NN ) และเทคนิคซัพพอร์ตเวกเตอร์แมชชีน (Support Vector Machine : SVM) มาสร้างตัวแบบพยากรณ์และเปรียบเทียบตัวแบบด้วยการทดสอบประสิทธิภาพแบบ 10-fold Cross Validation ผลการทดสอบ พบว่า ข้อมูลภูมิหลังไม่ใช่ปัจจัยในการทำนายการพ้นสภาพของนักศึกษาทั้งสองหลักสูตร นอกจากนี้ทั้งสองหลักสูตรยังมีปัจจัยที่แตกต่างกัน โดยปัจจัยที่ส่งผลต่อการพ้นสภาพของนักศึกษาหลักสูตรเทคโนโลยีสารสนเทศ มี 3 ปัจจัย ได้แก่ ผลการเรียนรายวิชาพื้นฐานทางฟิสิกส์ ผลการเรียนรายวิชาแพลตฟอร์มเทคโนโลยี และ ผลการเรียนเฉลี่ยปีที่ 2 ภาคการศึกษาที่ 1 สำหรับหลักสูตรวิทยาการคอมพิวเตอร์มีเพียง 1 ปัจจัย ได้แก่ ผลการเรียนรายวิชาโครงสร้างข้อมูล สำหรับตัวแบบพยากรณ์ที่ใช้เทคนิค SVM ให้ความแม่นยำในการพยากรณ์สูงสุดที่ร้อยละ 97.75 โดยมีการประเมินค่าความแม่นตรงเท่ากับ 0.920 ค่าความระลึกเท่ากับ 0.993 และประสิทธิภาพโดยรวม เท่ากับ 0.926 ตัวแบบพยากรณ์ที่ใช้เทคนิค BP-NN ให้ความแม่นยำในการพยากรณ์ที่ร้อยละ 97.50 โดยมีการประเมินค่าความแม่นตรงเท่ากับ 0.905 ค่าความระลึกเท่ากับ 0.986 และประสิทธิภาพโดยรวมเท่ากับ 0.941 และตัวแบบพยากรณ์ที่ใช้เทคนิคต้นไม้ตัดสินใจให้ความแม่นยำในการพยากรณ์ที่ร้อยละ 97.00 โดยมีการประเมินค่าความแม่นตรงเท่ากับ 0.975 ค่าความระลึกเท่ากับ 0.986 และประสิทธิภาพโดยรวมเท่ากับ 0.980 ทั้งนี้ค่า RMSE ของเทคนิคต้นไม้ตัดสินใจมีค่าน้อยสุด ตามด้วยเทคนิค SVM และ BP-NN เท่ากับ 0.0383 0.0512 และ 0.0785 ตามลำดับ ผลของงานวิจัยนี้จะช่วยเป็นแนวทางให้นักศึกษาสามารถวางแผนการเรียนได้ เช่น การเพิ่มถอนรายวิชาให้เหมาะสมกับศักยภาพตนเอง และ การพัฒนาตนเองในการเรียนวิชาต่างๆ ที่มีความสำคัญ
The objective of this research was to analyze the factors influencing the dismissal of students from Computer Science program and Information Technology program of Yala Rajabhat University using students and graduates’ data during academic year 2012 – 2015. There were 97 records from Computer Science program and 202 records from Information Technology program those consisted of 26 features. Data mining techniques like Decision tree technique, Back Propagation Neural Network (BP-NN), and Support Vector Machine (SVM) were employed to propose forecasting models. The models were tested and compared using a 10-fold Cross Validation. The results revealed that biography was not an influencing factor on the students of both programs. Furthermore, the influencing factors of each program were different. For Information Technology program, the factors influencing the dismissal of the students were Physics grade points, Platform Technology grade points, and the first semester grade point average of the second academic year while the Data Structure grade points was the only one factor influencing the dismissal of Computer Science program students. The forecast model using the SVM technique had the highest forecasting accuracy at 97.75 percent while the value of precision, recall and F-Measure were 0.920, 0.993, and 0.926. The forecast model using the BP-NN technique had the highest forecasting accuracy at 97.50 percent while the value of precision, recall and F-Measure were 0.905, 0.986, and 0.941. The forecast model using the Decision tree technique had the highest forecasting accuracy at 97.00 percent with the precision value at 0.975, recall at 0.986 and F-Measure at 0.980. The RMSE value of Decision tree technique was the smallest, following by SVM and BPNN were at 0.0383, 0.0512, and 0.0785, respectively. The results of this research will guide the students to manage their academic plan for example, proper registration adjustment and self-development in important subjects learning.