ปัจจัยที่ส่งผลต่อการตัดสินใจเข้าศึกษาต่อในระดับปริญญาตรี คณะบริหารธุรกิจและศิลปศาสตร์ โดยใช้เทคนิคการคัดเลือกคุณลักษณะและเทคนิคการทำเหมืองข้อมูล
Main Article Content
บทคัดย่อ
การวิจัยนี้มีวัตถุประสงค์เพื่อศึกษาปัจจัยที่ส่งผลต่อการตัดสินใจเข้าศึกษาต่อในระดับปริญญาตรี คณะบริหารธุรกิจและศิลปศาสตร์ และเพื่อเปรียบเทียบประสิทธิภาพเทคนิคการทำเหมืองข้อมูล จากข้อมูลพื้นฐานการรับสมัครนักศึกษาของงานส่งเสริมวิชาการและงานทะเบียน มหาวิทยาลัยเทคโนโลยีราชมงคลล้านนา เชียงใหม่ ในช่วงปีการศึกษา 2563 – 2565 มีจำนวนข้อมูลผู้สมัครทั้งหมด 2,509 รายการ โดยคณะผู้วิจัยได้นำข้อมูลมาทำการวิเคราะห์ปัจจัยโดยใช้เทคนิคการคัดเลือกคุณลักษณะและเทคนิคการทำเหมืองข้อมูล โดยเทคนิคการคัดเลือกคุณลักษณะที่ใช้ประกอบไปด้วย 3 เทคนิค ได้แก่ 1) เทคนิคการหาค่าสถิติไคสแควร์ 2) เทคนิคการหาค่าสัมประสิทธิ์สหสัมพันธ์ และ 3) เทคนิคการหาค่าเกนความรู้ และเทคนิคการทำเหมืองข้อมูลที่ใช้ประกอบไปด้วย 6 เทคนิค ได้แก่ 1) เทคนิคต้นไม้ตัดสินใจ 2) เทคนิคป่าสุ่ม 3) เทคนิคเกรเดียนท์บูตทรีส์ 4) เทคนิคนาอีฟเบย์ 5) เทคนิคการถดถอยโลจีสติก และ 6) เทคนิคการโหวต ผลการศึกษาพบว่า ปัจจัยที่ส่งผลต่อการตัดสินใจเข้าศึกษาต่อในระดับปริญญาตรีมากที่สุด 3 อันดับแรกจากทุกเทคนิคของการคัดเลือกคุณลักษณะได้แก่ สาขาวิชาหรือหลักสูตรที่เลือก สายการเรียนเดิม และวุฒิการศึกษาเดิม ส่วนเทคนิคการทำเหมืองข้อมูลที่มีค่าความถูกต้องสูงสุดในการพยากรณ์คือเทคนิคการโหวต มีค่าความถูกต้องเท่ากับ 73.44% โดยมีค่าความถูกต้องสูงกว่าการใช้เทคนิคป่าสุ่ม เทคนิคการถดถอยโลจีสติก เทคนิคต้นไม้ตัดสินใจ เทคนิคนาอีฟเบย์ และเทคนิคเกรเดียนท์บูตทรีส์ ซึ่งมีค่าความถูกต้องเท่ากับ 71.45% 71.05% 68.26% 65.60% 64.81% ตามลำดับ
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
References
กาญจน์เขจร ชูชีพ. (2561). การถดถอยโลจีสติก (Logistic Regression): Remote Sensing Technical Note. คณะวน-ศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ (5): 1 - 10.
จิราภา เลาหะวรนันท์, รชต ลิ้มสุทธิวันภูมิ และบัณฑิต ฐานะโสภณ. (2558). การใช้เทคนิคการทำเหมืองข้อมูลในการจำแนกและคัดเลือกแขนงวิชาสำหรับนักศึกษาคณะเทคโนโลยีสารสนเทศ. วารสารเทคโนโลยีสารสนเทศลาดกระบัง 4(2): 1 - 9.
ธีระ สินเดชารักษ์. (2565). ชำแหละผลกระทบ ‘วิกฤตเด็กไทยเกิดน้อย’ เขย่าสังคมไทย. แหล่งข้อมูล: https://tu.ac.th/thammasat-310165- crisis-thai-children-born-less. ค้นเมื่อวันที่ 15 มีนาคม 2566.
ปพิชญา กลางนอก. (2561). การประยุกต์ใช้เทคนิคแบบรวมเพื่อเพิ่มประสิทธิภาพของแบบจำลองตามกฎ. วิทยานิพนธ์วิทยาศาสตร์มหาบัณฑิต, มหาวิทยาลัยมหาสารคาม. มหาสารคาม. 53 หน้า.
รัชฎา เทพประสิทธิ์ และจรัญ แสนราช. (2563). การวิเคราะห์ปัจจัยที่มีผลต่อการเลือกสาขาวิชาของนักศึกษาระดับปริญญาตรี คณะครุศาสตร์ โดยใช้เทคนิคการทำเหมืองข้อมูล. วารสารบัณฑิตศึกษา มหาวิทยาลัยราชภัฏวไลยอลงกรณ์ ในพระบรมราชูปถัมภ์ 14(1): 134 - 146.
อัศวิน สุรวัชโยธิน และวรภัทร ไพรีเกรง. (2564). การสร้างตัวแบบการทำนายในการเลือกศึกษาต่อในระดับอุดมศึกษา โดยการใช้เทคนิคแบบบูรณาการในการแก้ปัญหาการจำแนกข้อมูลไม่สมดุลของกลุ่มผู้เรียน. วารสารวิทยาการและเทคโนโลยีสารสนเทศ 11(1): 65 – 79.
Bauer, E. and Kohavi, R. (1999). An Empirical Comparison of Voting Classification Algorithms: Bagging, Boosting, and Variants. Machine Learning 36: 105 – 139.
Breiman, L. (2001). Random Forest. Machine Learning 45: 5 - 32.
Chawla, V.N., Bowyer, W.K., Hall, O.L. and Kegelmeyer, P.W. (2002). SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Research 16(1): 321 - 357.
Hall, A.M. (1999). Correlation-based Feature Selection for Machine Learning. Thesis for the degree of Doctor of Philosophy, The University of Waikato. Hamilton, NewZealand. 198 pages.
Jin, X., Xu, A., Bie, R. and Guo, P. (2006). Machine Learning Techniques and Chi-Square Feature Selection for Cancer Classification Using SAGE Gene Expression Profiles. Data Mining for Biomedical Applications 3916: 106 - 115.
Lee, C. and Lee, G.G. (2006). Information gain and divergence-based feature selection for machine learning-based text categorization. Information Processing & Management 42(1): 155 - 165.
Natekin, A. and Knoll, A. (2013). Gradient boosting machines, a tutorial. Frontiers in Neurorobotics 7: 1 - 21.
Peng, J.Y.C., Lee, L.K., and Ingersoll, M.G. (2002). An Introduction to Logistic Regression Analysis and Reporting. The Journal of Educational Research 96(1): 3 - 14.
Quinlan, J.R. (1986). Induction of Decision Trees. Machine Learning 1: 81 - 106.
Rish, I. (2001). An Empirical Study of the Naïve Bayes Classifier. ResearchGate 3: 41 - 46.
Shearer, C. (2000). The CRISP-DM model: the new blueprint for data mining. Journal of Data Warehouse 5(4): 13 – 22.
Sripaoray, S. and Sinsomboonthong, S. (2017). Efficiency Comparison of Data Mining Classification Methods for Chronic Kidney Disease: A Case Study of a Hospital in India. Thai Science and Technology Journal 5(25): 839 - 853.
Vrigazova, B. (2021). The Proportion for Splitting Data into Training and Test Set for the Bootstrap in Classification Problems. Business Systems Research Journal 1(12): 228 - 242.