แบบจำลองการจำแนกเอกสารภาษาไทยอัตโนมัติ

Authors

  • นิเวศ จิระวิชิตชัย

Abstract

บทความนี้เป็นการนำเสนอวิธีการสร้างแบบจำลองการจำแนกเอกสารภาษาไทยอัตโนมัติ เพื่อประโยชน์ในการแก้ปัญหาการจำแนกเอกสารที่มีปริมาณมากและช่วยประหยัดแรงงานมนุษย์เพราะไม่ต้องใช้มนุษย์ในการจำแนกเอกสาร ซึ่งขั้นตอนการสร้างแบบจำลองเอกสารประกอบด้วย 1) การสกัดคุณลักษณะด้วยการตัดคำ 2) การกำจัดคำหยุดและทำรากศัพท์ 3) การกำหนดค่าน้ำหนัก ดัชนี คำและการลดคุณลักษณะ และ 4) การเรียนรู้ด้วยเครื่องจักรการเรียนรู้แบบมีผู้สอนและทำการทดสอบประสิทธิภาพด้านความถูกต้องของแบบจำลองในจำแนกเอกสาร

Downloads

Published

2014-02-25

Issue

Section

บทความวิชาการ (Academic article)