การออกแบบและพัฒนากระบวนการจำแนกข้อร้องเรียนรถโดยสารสาธารณะเพื่อติดแท็กปัญหาการให้บริการ

Main Article Content

จักรินทร์ สันติรัตนภักดี
ศุภกฤษฏิ์ นิวัฒนากูล

บทคัดย่อ

   องค์การขนส่งมวลชนกรุงเทพ (ขสมก.) มีช่องทางในการร้องเรียนรถโดยสารสาธารณะผ่านเว็บบอร์ด ที่ผู้ใช้งานสามารถแสดงความคิดเห็นได้อย่างอิสระ ดังนั้นข้อมูลบนเว็บบอร์ดจึงนับว่ามีประโยชน์ และมีบทบาทในการเพิ่มประสิทธิภาพการให้บริการ เนื่องจากมาจากผู้ใช้บริการจริง แต่จำนวนข้อร้องเรียนที่เพิ่มมากขึ้น และความหลากหลายของข้อความ ตลอดจนความผิดพลาดในการใช้ภาษาของผู้ใช้ส่งผลต่อความถูกต้องในการจำแนกประเภทข้อร้องเรียน เนื่องจากผู้รับผิดชอบต้องวิเคราะห์ข้อมูลด้วยตนเอง ดังนั้นหากมีกระบวนการจำแนกข้อร้องเรียนแบบอัตโนมัติจะเป็นแนวทางหนึ่งในการแก้ไขปัญหาดังกล่าว งานวิจัยชิ้นนี้มีวัตถุประสงค์เพื่อ 1) ออกแบบและพัฒนากระบวนการจำแนกข้อร้องเรียนรถโดยสารสาธารณะ จากข้อร้องเรียนผ่านเว็บบอร์ดขององค์การขนส่งมวลชนกรุงเทพด้วยกระบวนการตัดคำภาษาไทยโดยใช้พจนานุกรม แล้วคัดเลือกคำศัพท์ด้วยการวิเคราะห์น้ำหนักของคำ มาสร้างเป็นคลังคำศัพท์ แบ่งเป็น 4 คลาส ได้แก่ คลาสการขับขี่ คลาสผู้ขับขี่และพนักงานผู้ให้บริการ คลาสยานพาหนะและอุปกรณ์ให้บริการ และคลาสเวลาและการเดินรถ วัดผลด้วยการเรียนรู้ของเครื่องเพื่อจำแนกข้อความ พบว่า อยู่ในระดับดีมาก 2) ประเมินความถูกต้องของผลการจำแนกข้อร้องเรียนรถโดยสารสาธารณะ จากการจับคู่กับคำศัพท์ในคลังคำศัพท์กับข้อร้องเรียนจากผู้ใช้เพิ่มความถูกต้องของผลลัพธ์ด้วยการเปรียบเทียบความคล้ายคลึงของคำด้วยเทคนิคการวัดระยะทางเลเวนชเตย์น ในกรณีที่พบคำศัพท์ที่เขียนไม่ถูกต้องตามที่กำหนดไว้ในคลังคำศัพท์ เพื่อติดแท็กจำแนกปัญหาในการให้บริการของรถโดยสารสาธารณะ ประเมินความถูกต้องโดยผู้เชี่ยวชาญ ผลการประเมินอยู่ในระดับดีมาก โดยเฉพาะข้อร้องเรียนประเด็นเดียว แสดงถึงการตัดคำภาษาไทยแบบอิงพจนานุกรม เหมาะกับคลังคำศัพท์ที่กำหนดขอบเขตได้แน่นอน ความถูกต้องและครอบคลุมของคำศัพท์ส่งผลโดยตรงต่อผลลัพธ์ในการจำแนก อย่างไรก็ดี พบปัญหาคำศัพท์ที่ซ้ำซ้อนกันในบางคลาส เช่น เสียงดัง อาจมีที่มาจากคลาสผู้ขับขี่และพนักงานผู้ให้บริการ หรือจากคลาสยานพาหนะและอุปกรณ์ให้บริการก็ได้ตามต้นกำเนิดการเกิดเสียง ตลอดจนปัญหาการประสมคำในภาษาไทยที่มีลักษณะเฉพาะตัวส่งผลต่อความถูกต้องของผลการตัดคำ ผลลัพธ์จากงานวิจัยจะนำเสนอแนวทางการจำแนกข้อมูล ก่อนจะนำเสนอสารสนเทศเป็นภาพข้อมูลต่อไป และเป็นประโยชน์แก่ผู้รับผิดชอบ เพื่อนำไปปรับปรุงการให้บริการให้เหมาะสมกับความต้องการของผู้ใช้บริการต่อไป

Article Details

ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

Bangkok Mass Transit Authority, “Annual Report 2019,” (in Thai), Bangkok Mass Transit Authority, Bangkok, Thailand, 2019.

Mahidol University, “Final Report: User Satisfaction Survey 2018,” (in Thai), Bangkok Mass Transit Authority, Bangkok, Thailand, 2018.

Office of Transport and Traffic Policy and Planning. “The number of passengers on the BMTA bus.” MISTRAN.otp.go.th. http://mistran.otp.go.th/mis/Interview_HIPubilcBus.aspx (accessed Aug. 20, 2021).

The Office of the Permanent Secretary, The Prime Minister's Office, “Complaint/Opinion Processing Results Quarter 1 Fiscal Year 2021,” (in Thai), The Office of the Permanent Secretary, The Prime Minister's Office, Bangkok, Thailand, 2021.

Department of Land Transport, “Transport Statistics report 2020,” (in Thai), Transp. Statist. Group, Planning Div., Dep. Land Transp., Bangkok, Thailand, 2020.

C. C. Aggarwal, Data Classification Algorithm and Applications. Boca Raton, FL, USA: CRC Press, 2015.

M. Wozniak, Hybrid Classifiers Methods of Data, Knowledge, and Classifier Combination. Heidelberg, Germany: Springer-Verlag, 2014.

S. McConnell, Rapid Development: Taming Wild Software Schedules. Washington, DC, USA: Microsoft Press, 1996.

R. Mitchell, Web Scraping with Python: Collecting Data from the Modern Web. Sebastopol, CA, USA: O'Reilly Media, 2015.

C. Tapsai, H. Unger and P. Meesad, Thai Natural Language Processing Word Segmentation, Semantic Analysis, and Application. Cham, Switzerland: Springer International Publishing, 2021.

C. D. Manning, P. Raghavan and H. Schütze, Introduction to Information Retrieval. Cambridge, UK: Cambridge University Press, 2018.

T. Jo, Text Mining Concepts, Implementation, and Big Data Challenge. Cham, Switzerland: Springer International Publishing, 2019.

T. Kwantler, Text mining in practice with R. West Sussex, UK: John Wiley & Sons, 2017.

J. Zizka, F. Darena and A. Svoboda, Text Mining with Machine Learning Principles and Techniques. Boca Raton, FL, USA: CRC Press, 2020.

F. J. Damerau, “A technique for computer detection and correction of spelling,” Commun. ACM, vol. 7, no. 3, pp. 171–176, Mar. 1964.

J. Grudin, “Non-hierarchic specification of components in transcription typewriting,” Acta Psychol., vol. 54, no. 1-3, pp. 249–262, Oct. 1983.

K. Kukich, “Techniques for automatically correcting words in text,” ACM Comput. Surv., vol. 24, no. 4, pp. 377–439, Dec. 1992.

V. I. Levenshtein, “Binary codes capable of correcting deletions insertions, and reversals,” Dokl. Phys., vol. 10, no. 8, pp. 707–710, Feb. 1966.

F. P. Miller, A. F. Vandome and J. McBrewster, Levenshtein Distance Information theory, Computer science, String (computer science), String metric, Damerau-Levenshtein distance, Spell checker, Hamming distance. Gladbach, Germany: Alphascript Publishing, 2009.

J. Martinez, Google Charts for Institutional Research Websites. Houston, TX, USA: University of Houston, 2018.

C. O. Wilke, Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures. Sebastopol, CA, USA: O’Reilly Media, 2019.