การวัดความคล้ายคลึงของคำในระบบถามตอบภาษาไทยสำหรับโรคเบาหวาน
Main Article Content
บทคัดย่อ
โรคเบาหวานเป็นโรคเรื้อรังที่ไม่สามารถรักษาให้หายขาดได้และเป็นปัญหาสำคัญต่อการสาธารณสุขของประเทศไทยจากปัญหาดังกล่าว กรมควบคุมโรคคาดการณ์ว่าในปี 2568 คนไทยเป็นเบาหวานกว่า 7.41 ล้านคน ดังนั้น ผู้ป่วยโรคเบาหวานจึงต้องดูแลตนเองอย่างต่อเนื่องซึ่งเป็นวิธีการหนึ่งที่ช่วยลดอุบัติการณ์ของภาวะแทรกซ้อนที่เกิดขึ้นกับระบบต่าง ๆ ของร่างกายซึ่งส่งผลกระทบต่อชีวิตของผู้ป่วยได้ งานวิจัยฉบับนี้จึงนำเสนอการวัดความคล้ายคลึงของคำในระบบถาม-ตอบภาษาไทยสำหรับผู้เป็นโรคเบาหวานด้วยวิธี Cosine, Dice และ Jackcard โดยมีวัตถุประสงค์เพื่อศึกษาเปรียบเทียบประสิทธิภาพในการหาคำตอบเพื่อประโยชน์ของประชาชนที่ต้องการทราบอาการเบื้องต้นของโรคเบาหวานและการดูแลตนเองของผู้ป่วยเบาหวาน ผลการวิจัยเบื้องต้นจากการเปรียบเทียบประสิทธิภาพการหาคำตอบด้วยวิธีการวัดความคล้ายคลึงของคำถาม-คำตอบ พบว่าวิธี Cosine มีประสิทธิภาพสูงสุดในการหาคำตอบด้วยค่าความแม่นยำ 92.50% รองลงมาคือ วิธี Jaccard และวิธี Dice ซึ่งมีค่าความแม่นยำ 80.28% และ 52.50 % ตามลำดับ
Article Details

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
ผู้แต่งจะต้องกรอกข้อมูลเพื่อโอนลิขสิทธิ์ (copyright) ให้กับวารสารวิทยาการสารสนเทศและเทคโนโลยีประยุกต์ ก่อนเผยแพร่บทความ โดยดูรายละเอียดเพิ่มเติมได้ที่ https://ph01.tci-thaijo.org/index.php/jait/copyrightlicense
References
Ditcharoen, N. & Techawiwatthanaboon, S. (2018). An alternative approach to course description comparison for university credit transfer using word similarity measurement and vector space model. Journal of Science and Technology Mahasarakham University, 37(4), 580-586. [In Thai]
Frankes, W. B. & Baeza-Yates, R. (1992). Information retrieval: Data structure & algorithms. NJ, United State : Prentice-Hall.
Jaccard, P. (1901). Étude comparative de la distribution florale dans une portion des Alpes et des Jura. Bulletin de la Societe Vaudoise des Sciences Naturelles, 37(142), 547-579. https://www.researchgate.net/publication/225035806_Etude_de_la_distribution_florale_dans_une_portion_des_Alpes_et_du_Jura
Kitreerawutiwong, N. & Tejativaddhana, P. (2013). Validity and reliability of the Thai version of the experienced continuity of care for diabetes Mellitus (ECC-DM) questionnaire. The Public Health Journal of Burapha University, 8(1), 13-25. https://he02.tci-thaijo.org/index.php/phjbuu/article/view/45580 [In Thai]
Kondrak, G, Marcu, D., & Knight, K. (2003). Cognates can improve statistical translation models. In Companion Volume of the Proceedings of HLT-NAACL 2003 - Short Papers (pp. 46–48).
Mutabazi, E., Ni, J., Tang, G., & Cao, W. (2021). A review on medical textual question answering systems based on deep learning approaches. Applied Sciences, 11(12), 5456. https://doi.org/10.3390/app11125456
Phetkrachang, K., Sathiwantanah, S., & Kongwan, A. (2022). A development of online question answering system for student registration web service of university using ontology technology. KKU Science Journal, 50(1), 24-34. https://ph01.tci-thaijo.org/index.php/KKUSciJ/article/view/250295 [In Thai]
Radev, D.R., Qi, H., Zheng, Z., Blair-Goldensohn, S., Zhang, Z., Fan, W., & Prager, J. (2001). Mining the web for answers to natural language questions. International Conference on Information and Knowledge Management, Atlanta, Georgia, USA., (pp.143-150). https://doi.org/10.1145/502585.502610
Richard, J. F., Godbout, P., & Grèhaigne, J. F. (2000). Students' precision and interobserver reliability of performance assessment in teamsports. Research Quarterly for Exercise and Sport, 71(1), 85-91. https://doi.org/10.1080/02701367.2000.10608885
Salton, G & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. https://doi.org/10.1016/0306-4573(88)90021-0
Senoussaoui, M., Kenny, P., Stafylakis, T., & Dumouchel, P. (2014). A study of the cosine distance-based mean shift for telephone speech diarization. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 22(1), 217-227. https://doi.org/10.1109/TASLP.2013.2285474
Sornlertlamvanich, V. (1993). Word segmentation for Thai in machine translation system. Bangkok : NECTEC. [In Thai]
Wongsara, R., Homjun, K, & Ketui, N. (2021). Development of Thai subjective scoring system based on cosine-similarity. Journal of Applied Information Technology, 7(2), 7-16. https://ph02.tci-thaijo.org/index.php/project-journal/article/view/245037 [In Thai]
Xie, W., Ding, R., Yan, J., & Qu, Y. (2018). A mobile-based question-answering and early warning system for assisting diabetes management. Wireless Communications and Mobile Computing, 2018, 1-14. https://doi.org/10.1155/2018/9163160