Developing a lexicon for computerized transformation of the transliterated words of Thai Noi characters into Isan language pronunciations

Authors

  • Jintana Polsri Institute of Digital Arts and Science, Suranaree University of Technology, Thailand
  • Nisachol Chamnongsri Institute of Digital Arts and Science, Suranaree University of Technology, Thailand
  • Jeerayut Chaijaruvanit Department of Computer Science, Faculty of Science, Chiang Mai University, Thailand

Keywords:

Lexicon, Transliteration, machine transliteration of ancient language, Machine transliteration

Abstract

งานวิจัยนี้มีวัตถุประสงค์เพื่อออกแบบและพัฒนาคลังศัพท์สำหรับแปลงคำปริวรรตของอักษรไทยน้อยเป็นคำอ่านภาษาไทยถิ่นอีสานด้วยคอมพิวเตอร์ และประเมินประสิทธิภาพของคลังศัพท์ที่พัฒนาขึ้น วิธีการวิจัยแบ่งเป็น 3 ขั้นตอนหลัก ได้แก่ (1) การศึกษาลักษณะคลังศัพท์ภาษาไทยถิ่นอีสาน 7 เล่ม และพจนานุกรมภาษาไทยมาตรฐาน 1 เล่ม (2) การออกแบบและพัฒนาคลังศัพท์ และ (3) การประเมินประสิทธิภาพของคลังศัพท์ในด้านการนำไปใช้แปลงคำปริวรรตของอักษรไทยน้อยเป็นคำอ่านภาษาไทยถิ่นอีสาน โดยใช้คำปริวรรตของตำรับยาโบราณอีสาน 7,928 คำ เป็นข้อมูลชุดทดสอบ และการประเมินประสิทธิภาพด้านความเหมาะสมในการออกแบบและพัฒนาคลังศัพท์ โดยผู้เชี่ยวชาญอักษรโบราณ 12 คน และผู้ใช้ประโยชน์จากตำรายาโบราณอีสาน 27 คน ผลการวิจัยพบว่า คลังศัพท์ภาษาไทยถิ่นอีสานมีข้อจำกัดในการนำไปใช้แปลงคำปริวรรตของอักษรไทยน้อยเป็นคำอ่านภาษาไทยถิ่นอีสานด้วยคอมพิวเตอร์ เนื่องจากรูปแบบการจัดเก็บคำศัพท์ในแบบเล่มหนังสือ คำศัพท์ส่วนใหญ่เป็นหมวดวรรณกรรมทั่วไป คำศัพท์หลักไม่เป็นแบบคำปริวรรต และมีเกณฑ์การสะกดคำอ่านที่หลากหลาย ผลการออกแบบและพัฒนาคลังศัพท์ได้ฐานข้อมูลคลังศัพท์ที่มีคำศัพท์หลักแบบคำปริวรรต 4,645 คำ ชนิดของคำ 36 ชนิด และได้เกณฑ์การสะกดคำอ่านภาษาไทยถิ่นอีสาน ผลการประเมินประสิทธิภาพของคลังศัพท์ในการแปลงคำปริวรรตของตำรับยาโบราณอีสานเป็นคำอ่านภาษาไทยถิ่นอีสานมีความถูกต้องร้อยละ 71.02 และความเหมาะสมในการออกแบบและพัฒนาฐานข้อมูลคลังศัพท์มีค่าเฉลี่ยทุกด้านอยู่ในระดับดี ( gif.latex?\bar{x}= 3.89, SD = 0.71)

Downloads

Published

2023-04-26