ขั้นตอนวิธีสรุปข้อคิดเห็นภาษาไทยโดยใช้ออนโทโลยี

Main Article Content

กิตย์ศิริ ช่อเจี้ยง
นวลวรรณ สุนทรภิษัช

Abstract

งานวิจัยฉบับนี้มีวัตถุประสงค์เพื่อศึกษาวิจัยและเปรียบเทียบประสิทธิภาพของการสรุปข้อคิดเห็นจากเว็บบอร์ดโดยมีขั้นตอนการจำแนกประโยคที่มีออนโทโลยีและโครงข่ายคำ ซึ่งแสดงความสัมพันธ์ของข้อมูลทั้งหมด เพื่อใช้ในการแบ่งหมวดหมู่ และขั้นตอนการสรุปใจความสำคัญซึ่งได้ทำการเปรียบเทียบรูปแบบระหว่างวิธีการนับความถี่และวิธีการคิดค่าความคล้ายคลึงระหว่างประโยค โดยการสรุปใจความสำคัญจะใช้หลักการทางสถิตประยุกต์ร่วมกับหลักการทางฐานความรู้ข้อมูลที่ใช้ในการทดลอง คือข้อคิดเห็นเป็นภาษาไทยของผู้ใช้งานและเจ้าของคอมพิวเตอร์พกพาจาก www.notebookspec.com จำนวน 9 ชุดข้อมูล มีจำนวนประโยครวมทั้งสิ้น377 ประโยค หรือคิดเป็น 41.89 ประโยคต่อ ชุดข้อมูลผลการทดลองพบว่าขั้นตอนการจำแนกประโยคสามารถคัดกรองประโยคที่ไม่เกี่ยวข้องได้ด้วยค่าความแม่นยำและค่าความระลึก 87% ส่วนขั้นตอนการสรุปใจความสำคัญแบบคิดค่าความคล้ายคลึงกันระหว่างประโยคจะมีค่าความแม่นยำ 83% และค่าความระลึก 93% ซึ่งขั้นตอนรูปแบบนี้จะมีค่าความแม่นยำและค่าความระลึกที่มีค่าสูงกว่ารูปแบบการนับจำนวนความถี่ อีกทั้งยังสามารถตัดประโยคที่ไม่เกี่ยวข้องได้ถึง 14.33 ประโยคต่อชุดข้อมูล หรือคิดเป็นร้อยละ 34.21 ซึ่งมากกว่ารูปแบบการนับจำนวนความถี่ที่ตัดประโยคที่ไม่เกี่ยวข้องได้เพียงร้อยละ 31.50

Article Details

Section
บทความวิจัย