การวัดความคล้ายคลึงของคำในระบบถามตอบภาษาไทยสำหรับโรคเบาหวาน

Main Article Content

ธนพล ชำนาญหาญ
เกสรา เพชรกระจ่าง
สันติ สถิตวรรธนะ
พงศกร เจริญเนตรกุล
ชัยสิทธิ์ ชูสงค์

บทคัดย่อ

โรคเบาหวานเป็นโรคเรื้อรังที่ไม่สามารถรักษาให้หายขาดได้และเป็นปัญหาสำคัญต่อการสาธารณสุขของประเทศไทยจากปัญหาดังกล่าว กรมควบคุมโรคคาดการณ์ว่าในปี 2568 คนไทยเป็นเบาหวานกว่า 7.41 ล้านคน ดังนั้น ผู้ป่วยโรคเบาหวานจึงต้องดูแลตนเองอย่างต่อเนื่องซึ่งเป็นวิธีการหนึ่งที่ช่วยลดอุบัติการณ์ของภาวะแทรกซ้อนที่เกิดขึ้นกับระบบต่าง ๆ ของร่างกายซึ่งส่งผลกระทบต่อชีวิตของผู้ป่วยได้ งานวิจัยฉบับนี้จึงนำเสนอการวัดความคล้ายคลึงของคำในระบบถาม-ตอบภาษาไทยสำหรับผู้เป็นโรคเบาหวานด้วยวิธี Cosine, Dice และ Jackcard โดยมีวัตถุประสงค์เพื่อศึกษาเปรียบเทียบประสิทธิภาพในการหาคำตอบเพื่อประโยชน์ของประชาชนที่ต้องการทราบอาการเบื้องต้นของโรคเบาหวานและการดูแลตนเองของผู้ป่วยเบาหวาน ผลการวิจัยเบื้องต้นจากการเปรียบเทียบประสิทธิภาพการหาคำตอบด้วยวิธีการวัดความคล้ายคลึงของคำถาม-คำตอบ พบว่าวิธี Cosine มีประสิทธิภาพสูงสุดในการหาคำตอบด้วยค่าความแม่นยำ 92.50% รองลงมาคือ วิธี Jaccard และวิธี Dice ซึ่งมีค่าความแม่นยำ 80.28% และ 52.50 % ตามลำดับ

Article Details

How to Cite
ชำนาญหาญ ธ., เพชรกระจ่าง เ., สถิตวรรธนะ ส., เจริญเนตรกุล พ., & ชูสงค์ ช. . (2023). การวัดความคล้ายคลึงของคำในระบบถามตอบภาษาไทยสำหรับโรคเบาหวาน. วารสารวิทยาการสารสนเทศและเทคโนโลยีประยุกต์, 5(2), 86–99. https://doi.org/10.14456/jait.2023.7
บท
บทความวิจัย

References

Ditcharoen, N. & Techawiwatthanaboon, S. (2018). An alternative approach to course description comparison for university credit transfer using word similarity measurement and vector space model. Journal of Science and Technology Mahasarakham University, 37(4), 580-586. [In Thai]

Frankes, W. B. & Baeza-Yates, R. (1992). Information retrieval: Data structure & algorithms. NJ, United State : Prentice-Hall.

Jaccard, P. (1901). Étude comparative de la distribution florale dans une portion des Alpes et des Jura. Bulletin de la Societe Vaudoise des Sciences Naturelles, 37(142), 547-579. https://www.researchgate.net/publication/225035806_Etude_de_la_distribution_florale_dans_une_portion_des_Alpes_et_du_Jura

Kitreerawutiwong, N. & Tejativaddhana, P. (2013). Validity and reliability of the Thai version of the experienced continuity of care for diabetes Mellitus (ECC-DM) questionnaire. The Public Health Journal of Burapha University, 8(1), 13-25. https://he02.tci-thaijo.org/index.php/phjbuu/article/view/45580 [In Thai]

Kondrak, G, Marcu, D., & Knight, K. (2003). Cognates can improve statistical translation models. In Companion Volume of the Proceedings of HLT-NAACL 2003 - Short Papers (pp. 46–48).

Mutabazi, E., Ni, J., Tang, G., & Cao, W. (2021). A review on medical textual question answering systems based on deep learning approaches. Applied Sciences, 11(12), 5456. https://doi.org/10.3390/app11125456

Phetkrachang, K., Sathiwantanah, S., & Kongwan, A. (2022). A development of online question answering system for student registration web service of university using ontology technology. KKU Science Journal, 50(1), 24-34. https://ph01.tci-thaijo.org/index.php/KKUSciJ/article/view/250295 [In Thai]

Radev, D.R., Qi, H., Zheng, Z., Blair-Goldensohn, S., Zhang, Z., Fan, W., & Prager, J. (2001). Mining the web for answers to natural language questions. International Conference on Information and Knowledge Management, Atlanta, Georgia, USA., (pp.143-150). https://doi.org/10.1145/502585.502610

Richard, J. F., Godbout, P., & Grèhaigne, J. F. (2000). Students' precision and interobserver reliability of performance assessment in teamsports. Research Quarterly for Exercise and Sport, 71(1), 85-91. https://doi.org/10.1080/02701367.2000.10608885

Salton, G & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. https://doi.org/10.1016/0306-4573(88)90021-0

Senoussaoui, M., Kenny, P., Stafylakis, T., & Dumouchel, P. (2014). A study of the cosine distance-based mean shift for telephone speech diarization. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 22(1), 217-227. https://doi.org/10.1109/TASLP.2013.2285474

Sornlertlamvanich, V. (1993). Word segmentation for Thai in machine translation system. Bangkok : NECTEC. [In Thai]

Wongsara, R., Homjun, K, & Ketui, N. (2021). Development of Thai subjective scoring system based on cosine-similarity. Journal of Applied Information Technology, 7(2), 7-16. https://ph02.tci-thaijo.org/index.php/project-journal/article/view/245037 [In Thai]

Xie, W., Ding, R., Yan, J., & Qu, Y. (2018). A mobile-based question-answering and early warning system for assisting diabetes management. Wireless Communications and Mobile Computing, 2018, 1-14. https://doi.org/10.1155/2018/9163160