การจัดกลุ่มเพลงโดยอาศัยความคล้ายคลึงของลายนิ้วมือทางเสียง

สุนันท์ ธาติ; พงศ์พันธ์ กิจสนาโยธิน; วรลักษณ์ คงเด่นฟ้า

PDF

เผยแพร่แล้ว: มิ.ย. 1, 2018

คำสำคัญ:

การทําเหมืองข้อมูล การจัดกลุ่มข้อมูล การรู้จำข้อมูลดนตรี สเปคโตแกรม ลายนิ้วมือทางเสียง

สุนันท์ ธาติ

คณะวิศวกรรมศาสตร์ มหาวิทยาลัยนเรศวร พิษณุโลก

พงศ์พันธ์ กิจสนาโยธิน

คณะวิศวกรรมศาสตร์ มหาวิทยาลัยนเรศวร พิษณุโลก

วรลักษณ์ คงเด่นฟ้า

คณะวิศวกรรมศาสตร์ มหาวิทยาลัยนเรศวร พิษณุโลก

บทคัดย่อ

วิธีการทั่วไปในการตรวจสอบการละเมิดลิขสิทธิ์ หรือการระบุข้อมูลเพลงคือการฟังโดยคน แต่การฟังมีข้อจำกัดในกรณีที่ต้องวิเคราะห์ข้อมูลเพลงจำนวนมากๆ อีกทั้งความถูกต้องแม่นยำยังขึ้นอยู่กับความเชี่ยวชาญของผู้ฟังแต่ละคน ด้วยข้อจำกัดดังกล่าว จึงมีการประยุกต์ใช้หลักการการรู้จำดนตรี (Music recognition) ในการแก้ไขปัญหานี้แทนและคุณลักษณะของข้อมูลที่ถูกนำมาใช้ในการวิเคราะห์อย่างกว้างขวาง คือลายนิ้วมือทางเสียง (Audio fingerprint) การวิเคราะห์ลายนิ้วมือทางเสียงมีประสิทธิภาพมากในการตรวจสอบว่าข้อมูลเสียงใดเป็นเพลงเดียวกัน ในกรณีที่มีเนื้อหาตรงกัน (Exactly match) แต่ยังไม่สามารถตรวจสอบได้ในกรณีที่เนื้อหาคล้ายคลึงกัน (Similar) งานวิจัยฉบับนี้นำเสนอวิธีการหาความคล้ายคลึงกันของเพลงโดยใช้ฟังก์ชันความสัมพันธ์ (Relation function) สำหรับการเปรียบเทียบลายนิ้วมือทางเสียงแทนการเปรียบเทียบข้อมูลเสียงขนาดใหญ่ทีละคู่ และทดลองใช้วิธีการที่นำเสนอเพื่อระบุเพลงต้นฉบับจากเพลงคัฟเวอร์ ผลการทดลองพบว่าวิธีการดังกล่าวสามารถระบุเพลงต้นฉบับได้อย่างมีประสิทธิภาพครอบคลุมกลุ่มเพลงทุกประเภท (Genre) โดยมีพื้นที่ใต้กราฟเฉลี่ย (Average AUC) เป็น 0.790

ฉบับ

ปีที่ 6 ฉบับที่ 1 (2018): มกราคม - มิถุนายน 2561

ประเภทบทความ

บทความวิจัย

นโยบายการรับบทความ

      กองบรรณาธิการวารสารสถาบันเทคโนโลยีไทย-ญี่ปุ่น มีความยินดีรับบทความจากอาจารย์ประจำ และผู้ทรงคุณวุฒิในสาขาวิศวกรรมศาสตร์และเทคโนโลยี ที่เขียนเป็นภาษาไทยหรือภาษาอังกฤษ ซึ่งผลงานวิชาการที่ส่งมาขอตีพิมพ์ต้องไม่เคยเผยแพร่ในสิ่งพิมพ์อื่นใดมาก่อน และต้องไม่อยู่ในระหว่างการพิจารณาของวารสารอื่นที่นำส่ง ดังนั้นผู้สนใจที่จะร่วมเผยแพร่ผลงานและความรู้ที่ศึกษามาสามารถนำส่งบทความได้ที่กองบรรณาธิการเพื่อเสนอต่อคณะกรรมการกลั่นกรองบทความพิจารณาจัดพิมพ์ในวารสารต่อไป ทั้งนี้บทความที่สามารถเผยแพร่ได้ประกอบด้วยบทความวิจัย ผู้สนใจสามารถศึกษาและจัดเตรียมบทความจากคำแนะนำสำหรับผู้เขียนบทความ
      การละเมิดลิขสิทธิ์ถือเป็นความรับผิดชอบของผู้ส่งบทความโดยตรง บทความที่ได้รับการตีพิมพ์ต้องผ่านการพิจารณากลั่นกรองคุณภาพจากผู้ทรงคุณวุฒิและได้รับความเห็นชอบจากกองบรรณาธิการ
      ข้อความที่ปรากฏภายในบทความของแต่ละบทความที่ตีพิมพ์ในวารสารวิชาการเล่มนี้ เป็น ความคิดเห็นส่วนตัวของผู้เขียนแต่ละท่าน ไม่เกี่ยวข้องกับสถาบันเทคโนโลยีไทย-ญี่ปุ่น และคณาจารย์ท่านอื่น ๆ ในสถาบัน แต่อย่างใด ความรับผิดชอบด้านเนื้อหาและการตรวจร่างบทความแต่ละบทความเป็นของผู้เขียนแต่ละท่าน หากมีความผิดพลาดใด ๆ ผู้เขียนแต่ละท่านจะต้องรับผิดชอบบทความของตนเองแต่ผู้เดียว
      กองบรรณาธิการขอสงวนสิทธิ์มิให้นำเนื้อหา ทัศนะ หรือข้อคิดเห็นใด ๆ ของบทความในวารสารสถาบันเทคโนโลยีไทย-ญี่ปุ่น ไปเผยแพร่ก่อนได้รับอนุญาตจากผู้นิพนธ์ อย่างเป็นลายลักษณ์อักษร ผลงานที่ได้รับการตีพิมพ์ถือเป็นลิขสิทธิ์ของวารสารสถาบันเทคโนโลยีไทย-ญี่ปุ่น
      ผู้ประสงค์จะส่งบทความเพื่อตีพิมพ์ในวารสารวิชาการ สถาบันเทคโนโลยีไทย-ญี่ปุ่น สามารถส่ง Online ที่ https://www.tci-thaijo.org/index.php/TNIJournal/ โปรดสมัครสมาชิก (Register) โดยกรอกรายละเอียดให้ครบถ้วนหากต้องการสอบถามข้อมูลเพิ่มเติมที่
     - กองบรรณาธิการ วารสารสถาบันเทคโนโลยีไทย-ญี่ปุ่น
     - ฝ่ายวิจัยและนวัตกรรม สถาบันเทคโนโลยีไทย-ญี่ปุ่น
      เลขที่ 1771/1 สถาบันเทคโนโลยีไทย-ญี่ปุ่น ซอยพัฒนาการ 37-39 ถนนพัฒนาการ แขวงสวนหลวง เขตสวนหลวง กรุงเทพมหานคร 10250 ติดต่อกับคุณพิมพ์รต พิพัฒนกุล (02) 763-2752 , คุณจุฑามาศ ประสพสันติ์ (02) 763-2600 Ext. 2402 Fax. (02) 763-2754 หรือ E-mail: JEDT@tni.ac.th

เอกสารอ้างอิง

J. S. Downie, "Music information retrieval," Annual Review of Information Science and Technology, vol. 37, pp. 295-340, 2003.

L. Tao and M. Ogihara, "Toward intelligent music information retrieval," IEEE Transactions on Multimedia, vol. 8, no. 3, pp. 564-574, 2006.

C. Ouali, P. Dumouchel, and V. Gupta, " A spectrogram-based audio fingerprinting system for content-based copy detection," Multimedia Tools and Application, vol. 75, no. 15, pp. 9145-9165, 2016.

D. Perrott and R. Gjerdingen, “Scanning the dial: An exploration of factors in the identification of musical style.,” in The 8th international conference on music perception & cognition, Evanston, Illinois, USA, 2004.

G. Tzanetakis and P. Cook, "Musical genre classification of audio signals," IEEE Transactions on Speech and Audio Processing, vol. 10, no. 15, pp. 293-302, 2002.

D. C. Correa and F. A. Rodrigues, "A survey on symbolic data-based music genre classification," Expert Systems with Applications, vol. 60, pp. 190-210, 2016.

V. Chandrasekhar, M. Sharifi, and D. A. Ross, “Survey and Evaluation of Audio Fingerprinting Schemes for Mobile Query-by-Example Applications.,” in the 12th International Society for Music Information Retrieval Conference, Miami, Florida, USA, 2011, pp. 801–806.

C. Ouali, P. Dumouchel, and V. Gupta, "Efficient spectrogram-based binary image feature for audio copy detection," in 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane Convention & Exhibition Centre Brisbane, Queensland, Australia, 2015, pp. 1792-1796.

“VOICEBOX: Speech Processing Toolbox for MATLAB.” [Online]. Available: https://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html. [Accessed: 24-Feb-2017].

“MATLAB,” MathWorks. [Online]. Available: https://www.mathworks.com/products/matlab.html. [Accessed: 24-Jan-2017].

W. B. Snow, "Audible Frequency Ranges of Music, Speech and Noise," The Journal of the Acoustical Society of America, vol. 3, no. 10, pp. 10-10, 1931.

Article Sidebar

Main Article Content

บทคัดย่อ

Article Details

เอกสารอ้างอิง