ระบบบริการการจำแนกเพศและประเมินอายุบุคคลจากภาพใบหน้าด้วยวิธีการเรียนรู้เชิงลึก

DOI: 10.14416/j.ind.tech.2022.08.003

ผู้แต่ง

  • ชูพันธุ์ รัตนโภคา ภาควิชาเทคโนโลยีวิศวกรรมอิเล็กทรอนิกส์, วิทยาลัยเทคโนโลยีอุตสาหกรรม, มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
  • ภาณุพงศ์ จันเนตร ภาควิชาเทคโนโลยีวิศวกรรมอิเล็กทรอนิกส์, วิทยาลัยเทคโนโลยีอุตสาหกรรม, มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ
  • ธีราทร มูลปัญโญ ภาควิชาเทคโนโลยีวิศวกรรมอิเล็กทรอนิกส์, วิทยาลัยเทคโนโลยีอุตสาหกรรม, มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าพระนครเหนือ

คำสำคัญ:

เว็บ API, การประมวลผลภาพ, การเรียนรู้เชิงลึก, โครงข่ายประสาทคอนโวลูชัน

บทคัดย่อ

บทความนี้เสนอการออกแบบและพัฒนาแบบจำลองการเรียนรู้เชิงลึกสำหรับทำนายอายุและเพศ รวมถึงออกแบบและพัฒนาเว็บ API สำหรับให้บริการเชื่อมต่อและใช้งานแบบจำลองที่พัฒนาขึ้น อีกทั้งยังพัฒนาเว็บแอปพลิเคชันและโมบายแอปพลิเคชันตัวอย่างที่ใช้บริการแบบจำลองการเรียนรู้ผ่านทางเว็บ API แบบจำลองที่พัฒนาขึ้นนั้นมีสถาปัตยกรรมที่ผสมผสานระหว่างสถาปัตยกรรมแบบจำลองการเรียนรู้เชิงลึก VGG16 และ ResNet โดยได้สร้างแบบจำลองขึ้นมา 3 แบบจำลอง ได้แก่ (1) แบบจำลองที่ทำนายอายุ (2) แบบจำลองที่ทำนายเพศ และ (3) แบบจำลองที่ทำนายทั้งอายุและเพศ ทั้ง 3 แบบจำลองถูกฝึกด้วยชุดข้อมูลภาพ IMDB จำนวน 154,667 ภาพ จากการทดสอบแบบจำลองโดยใช้ชุดข้อมูลภาพ WIKI จำนวน 38,138 ภาพ พบว่าแบบจำลองทำนายอายุมีค่าความผิดพลาดสัมบูรณ์เฉลี่ยเท่ากับ 5.949 ใช้เวลาในการประมวลผล 0.167 วินาที ในขณะที่แบบจำลองทำนายเพศมีถูกต้องเท่ากับ 96.58% ใช้เวลาในการประมวลผล 0.169 วินาที และสุดท้ายคือแบบจำลองที่ทำนายทั้งอายุและเพศ มีความถูกต้องในการทำนายเพศเท่ากับ 95.82% และมีค่าความผิดพลาดสัมบูรณ์เฉลี่ยในการทำนายอายุเท่ากับ 6.347 โดยใช้เวลาในการทำนายต่อภาพเท่ากับ 0.171 วินาที

เอกสารอ้างอิง

Y. LeCun, Y. Bengio, and G. Hinton, Deep learning, Nature, 2015, 521, 436-444.

J. Liu and X. Wang, Tomato diseases and pests detection based on improved Yolo V3 convolutional neural network, Frontiers in Plant Science, 2020, 11, 898.

Y. Ji, S. Kim, Y.J. Kim, and K.B. Lee, Human-like sign-language learning method using deep learning, ETRI Journal, 2018, 40(4), 435 - 445.

S.E. Bekhouche, A. Ouafi, A. Benlamoudi, A. Taleb-Ahmed, and A. Hadid, Facial age estimation and gender classification using multi level local phase quantization, The 3rd International Conference on Control, Engineering Information Technology (CEIT- 2015), Proceeding, 2015, 1-4.

S. H. Lee, S. Hosseini, H. J. Kwon, J. Moon, H. I. Koo, and N. I. Cho, Age and gender estimation using deep residual learning network, International Workshop on Advanced Image Technology (IWAIT-2018), Proceeding, 2018, 1 - 3.

https://github.com/yu4u/age-gender-estimation. (Accessed on 15 February 2022)

M. Tan and Q.V. Le, EfficientNet: Rethinking model scaling for convolutional neural networks, arXiv, 2019, 1905.11946.

K. Simonyan and A. Zisserman, Very deep convolutional networks for large-scale image recognition, arXiv, 2014, 1409.1556.

https://github.com/rcmalli/keras-vggface. (Accessed on 10 February 2022)

K. He, X. Zhang, S. Ren, and J. Sun, Deep residual learning for image recognition, arXiv, 2015, 1512.03385.

S. Loffe and C. Szegedy, Batch normalization: accelerating deep network training by reducing internal covariate shift, arXiv, 2015, 1502.03167.

R. Rothe, R. Timofte, and L.V. Gool, Deep expectation of real and apparent age from a single image without facial landmarks, International Journal of Computer Vision, 2018, 126, 144-157.

M. Jones, J. Bradley, and N. Sakimura, JSON Web Token (JWT), Internet Engineering Task Force, RFC 7519, 2015.

D.E. King, Dlib-ml: A machine learning toolkit, Journal of Machine Learning Research, 2009, 10, 1755-1758.

E. Bisong, Google colaboratory, In: Building machine learning and deep learning models on google cloud platform: A comprehensive guide for beginners, Apress Berkeley, CA, USA, 2019, 59-64.

ดาวน์โหลด

เผยแพร่แล้ว

2022-08-15

ฉบับ

ประเภทบทความ

บทความวิจัย (Research article)