การรู้จำการแสดงอารมณ์ออกทางใบหน้าด้วยวิธีโครงข่ายประสาทเทียมแบบคอนโวลูชั่นร่วมกับการประมวลผลภาพ 18 รูปแบบ
Main Article Content
บทคัดย่อ
งานวิจัยนี้นำเสนอการรู้จำการแสดงอารมณ์ออกทางใบหน้าด้วยวิธีโครงข่ายประสาทเทียมแบบคอนโวลูชั่นร่วมกับการประมวลผลภาพ 18 รูปแบบ เริ่มจากการนำชุดข้อมูลภาพถ่ายใบหน้า Fer2013 มาจำแนกออกเป็น
3 ประเภทอารมณ์ ได้แก่ อารมณ์เชิงลบ อารมณ์ปกติ และอารมณ์เชิงบวก ชุดข้อมูลภาพถูกแบ่งเป็นชุดสำหรับฝึกสอน และชุดสำหรับทดสอบ โดยชุดข้อมูลภาพดังกล่าวได้ผ่านวิธีการประมวลผลภาพเบื้องต้น 18 รูปแบบ ได้แก่ Original, Alignment, Crop20-80,Crop30-70, Crop40-60, Crop50-50, Crop60-40, Crop70-30, Crop80-20, Original with Flip, Alignment with Flip, Crop20-80 with Flip, Crop30-70 with Flip, Crop40-60-with Flip, Crop50-50 with Flip, Crop60-40 with Flip, Crop70-30 with Flip และCrop80-20 with Flip จากนั้นนำชุดข้อมูลภาพทั้งหมดมาสร้างเป็นแบบจำลองโครงข่ายประสาทเทียมแบบคอนโวลูชั่นจำนวน
8 แบบจำลอง ได้แก่แบบจำลอง 3CNNs, Mememoji- CNNs, DenseNet121, DenseNet169, DenseNet 201, InceptionResNetV2, MobileNet, และMobileNetV2 รวมการเปรียบเทียบแบบจำลองกับชุดข้อมูลภาพจำนวนทั้งสิ้น 144 แบบจำลอง ผลลัพธ์จากการเปรียบเทียบค่าความถูกต้องของแบบจำลองพบว่าแบบจำลอง 3CNNs ที่ถูกสร้างขึ้นด้วยชุดข้อมูลภาพ Alignment with Flip มีค่าความถูกต้องสูงที่สุดอยู่ที่ ร้อยละ 82.41 ซึ่งเหมาะสมกับการนำไปปรับใช้สำหรับการเรียนการสอนแบบออนไลน์