การจัดกลุ่มเพลงโดยอาศัยความคล้ายคลึงของลายนิ้วมือทางเสียง

Main Article Content

สุนันท์ ธาติ
พงศ์พันธ์ กิจสนาโยธิน
วรลักษณ์ คงเด่นฟ้า

บทคัดย่อ

วิธีการทั่วไปในการตรวจสอบการละเมิดลิขสิทธิ์ หรือการระบุข้อมูลเพลงคือการฟังโดยคน แต่การฟังมีข้อจำกัดในกรณีที่ต้องวิเคราะห์ข้อมูลเพลงจำนวนมากๆ อีกทั้งความถูกต้องแม่นยำยังขึ้นอยู่กับความเชี่ยวชาญของผู้ฟังแต่ละคน ด้วยข้อจำกัดดังกล่าว จึงมีการประยุกต์ใช้หลักการการรู้จำดนตรี (Music recognition) ในการแก้ไขปัญหานี้แทนและคุณลักษณะของข้อมูลที่ถูกนำมาใช้ในการวิเคราะห์อย่างกว้างขวาง คือลายนิ้วมือทางเสียง (Audio fingerprint)  การวิเคราะห์ลายนิ้วมือทางเสียงมีประสิทธิภาพมากในการตรวจสอบว่าข้อมูลเสียงใดเป็นเพลงเดียวกัน ในกรณีที่มีเนื้อหาตรงกัน (Exactly match) แต่ยังไม่สามารถตรวจสอบได้ในกรณีที่เนื้อหาคล้ายคลึงกัน (Similar) งานวิจัยฉบับนี้นำเสนอวิธีการหาความคล้ายคลึงกันของเพลงโดยใช้ฟังก์ชันความสัมพันธ์ (Relation function) สำหรับการเปรียบเทียบลายนิ้วมือทางเสียงแทนการเปรียบเทียบข้อมูลเสียงขนาดใหญ่ทีละคู่ และทดลองใช้วิธีการที่นำเสนอเพื่อระบุเพลงต้นฉบับจากเพลงคัฟเวอร์ ผลการทดลองพบว่าวิธีการดังกล่าวสามารถระบุเพลงต้นฉบับได้อย่างมีประสิทธิภาพครอบคลุมกลุ่มเพลงทุกประเภท (Genre) โดยมีพื้นที่ใต้กราฟเฉลี่ย (Average AUC) เป็น 0.790

Article Details

ประเภทบทความ
บทความวิจัย

เอกสารอ้างอิง

J. S. Downie, "Music information retrieval," Annual Review of Information Science and Technology, vol. 37, pp. 295-340, 2003.

L. Tao and M. Ogihara, "Toward intelligent music information retrieval," IEEE Transactions on Multimedia, vol. 8, no. 3, pp. 564-574, 2006.

C. Ouali, P. Dumouchel, and V. Gupta, " A spectrogram-based audio fingerprinting system for content-based copy detection," Multimedia Tools and Application, vol. 75, no. 15, pp. 9145-9165, 2016.

D. Perrott and R. Gjerdingen, “Scanning the dial: An exploration of factors in the identification of musical style.,” in The 8th international conference on music perception & cognition, Evanston, Illinois, USA, 2004.

G. Tzanetakis and P. Cook, "Musical genre classification of audio signals," IEEE Transactions on Speech and Audio Processing, vol. 10, no. 15, pp. 293-302, 2002.

D. C. Correa and F. A. Rodrigues, "A survey on symbolic data-based music genre classification," Expert Systems with Applications, vol. 60, pp. 190-210, 2016.

V. Chandrasekhar, M. Sharifi, and D. A. Ross, “Survey and Evaluation of Audio Fingerprinting Schemes for Mobile Query-by-Example Applications.,” in the 12th International Society for Music Information Retrieval Conference, Miami, Florida, USA, 2011, pp. 801–806.

C. Ouali, P. Dumouchel, and V. Gupta, "Efficient spectrogram-based binary image feature for audio copy detection," in 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane Convention & Exhibition Centre Brisbane, Queensland, Australia, 2015, pp. 1792-1796.

“VOICEBOX: Speech Processing Toolbox for MATLAB.” [Online]. Available: https://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html. [Accessed: 24-Feb-2017].

“MATLAB,” MathWorks. [Online]. Available: https://www.mathworks.com/products/matlab.html. [Accessed: 24-Jan-2017].

W. B. Snow, "Audible Frequency Ranges of Music, Speech and Noise," The Journal of the Acoustical Society of America, vol. 3, no. 10, pp. 10-10, 1931.