การแปลงข้อความภาษาบาลีอักษรไทยเป็นสัทอักษร
Main Article Content
บทคัดย่อ
บทความนี้นำเสนอการแปลงภาษาบาลีอักษรไทยเป็นสัทอักษร โดยใช้พจนานุกรม (dictionary) ร่วมกับกฎบาลีไวยากรณ์ (Pali grammar) และกฎภาษาศาสตร์ (linguistic) และได้ใช้วิธีการตัดคำแบบเลือกคำที่ยาวที่สุด (longest matching algorithm) เพื่อใช้ในการค้นหาความหมายของคำศัพท์ ในงานวิจัยนี้ผู้วิจัยได้สร้างพจนานุกรมภาษาบาลี-ไทย ประกอบด้วยคําศัพท์บาลี 14,323 คํา โดยอ้างอิงคําศัพท์บาลีจากหนังสือพจนานุกรมภาษาบาลี-ไทยของพระมหาไพโรจน์พจนานุกรมที่สร้างขึ้นประกอบด้วยคําศัพท์ภาษาบาลีอักษรไทย ความหมาย ประเภทของคําศัพท์ คําในรูปภาษาไทย คําในรูปอักษรโรมันและคําในรูปสัทอักษร โดยจัดเก็บไว้ในระบบฐานข้อมูลและในงานวิจัยนี้ได้นำเสนอกฎในการแปลงภาษาบาลีเป็นสัทอักษรเพื่อใช้ในการแปลงคำที่ไม่ปรากฏในพจนานุกรม เพื่อทดสอบความถูกต้องของระบบ ผู้วิจัยได้ทำการทดสอบระบบที่พัฒนาโดยการแปลงเอกสารที่เขียนด้วยภาษาบาลีอักษรไทย ซึ่งประกอบด้วย บทสวดมนต์ 99 บท พุทธศาสนสุภาษิต 181 สุภาษิต และวินย. มหาวิภงฺโค 1 จากพระวินัยปิฎก เล่มที่ 1 ของพระไตรปิฎกภาษาบาลีฉบับสยามรัฐ ผลการทดสอบความถูกต้องของการแปลงคิดเป็นร้อยละ 98.75
Article Details

อนุญาตภายใต้เงื่อนไข Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.