โครงข่ายประสาทเทียมสำหรับการจำลองผลตอบสนองอิมพัลส์ของตู้ลำโพงกีตาร์แบบเวลาจริง

Main Article Content

ธัญเทพ สิญจนาคม
ศรวัฒน์ ชิวปรีชา

บทคัดย่อ

งานวิจัยนี้นำเทคโนโลยีการประมวลผลสัญญาณดิจิทัลแบบเวลาจริง และโครงข่ายประสาทเทียมมาพัฒนาระบบที่สร้างผลตอบสนองอิมพัสส์ของลำโพงตู้กีตาร์ MarshalL 1960A ตามลักษณะการติดตั้งไมโครโฟนตามที่ผู้ใช้กำหนด โดยโมเดลจะรับค่าเป็นประเภทไมโครโฟน ตำแหน่งของลำโพงที่ติดตั้งไมโครโฟน ระยะห่างระหว่างไมโครโฟนกับตู้ และมุมเอียง โมเดลโครงข่ายประสาทเทียมที่ผ่านการฝึกสอนสามารถสร้างผลตอยสนองอิมพัสส์สำหรับตู้ลำพงได้ทั้งเสียงที่มีอยู่ในชุดข้อมูล และเสียงของการตั้งค่าที่ไม่มีอยู่ในชุดข้อมูลซึ่งเกิดจากการเรียนรู้ความสัมพันธ์ของข้อมูล เกณฑ์ที่ใช้ประเมินผลลัพธ์ที่ได้จากโมเดล คือ Cross-correlation, Error-to-signal Ratio, Power Spectral Density Error และ Magnitude-squared Coherence นอกจากนี้ มีการทดสอบการฟังคะแนนความคิดเห็นเฉลี่ยเพื่อพิจารณาความคล้ายคลึงของสัญญาณกีตาร์ที่ผ่านการจำลองเสียงลำโพง ผลการทดสอบชี้ว่าเสียงที่ผ่านการจำลองด้วยเอาต์พุตของโครงข่ายประสาทเทียมนั้นมีความใกล้เคียงกับเสียงที่จำลองด้วย IR จริงอย่างมาก เมื่อนำโมเดลนี้ไปสร้างเป็นดิจิทัลปลั๊กอินแล้วพบว่า มีประสิทธิภาพในการคำนวณที่รวดเร็วพอกับการทำงานแบบเวลาจริง การนำโมเดลนี้มาใช้งานนั้นไม่จำเป็นที่จะต้องเก็บข้อมูล IRไว้ในคอมพิวเตอร์โดยตรงเหมือนกับการทำงานรูปแบบเดิม โมเดลนี้สามารถสร้าง I ขึ้นมาทุกครั้งที่ผู้ใช้กำหนดค่พารามิเตอร์ต่าง ๆ และการใช้ระบบดังกล่าวในงานผลิตเพลงจะทำให้ผู้ใช้สามารถปรับแต่งเสียงได้สะดวกเพราะจะได้ฟังเสียงความแตกต่างของการตั้งค่าต่าง ๆ ทันที โดยไม่ต้องโหลดไฟล์ R ของการตั้งค่าแต่ละแบบไปมาเหมือนการทำงานแบบเดิม

Article Details

บท
บทความวิจัยจาก ECTI

References

A. Ratnarajah, Z. Tang, and D. Manocha, “IRGAN: Room impulse response generator for far-field speech recognition,” in Interspeech 2021, 2021.

N. J. Bryan, “Impulse response data augmentation and deep neural networks for blind room acoustic parameter estimation,” in ICASSP 2020–2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020.

C. Steinmetz. (2021, October). NeuralRever berator [Online]. Available: https://www. christiansteinmetz.com/projects-blog/neural reverberator

A. Wright, E.-P. Damskägg, L. Juvela, and V. Välimäki, “Real-time guitar amplifier emulation with deep learning,” Applied Sciences (Basel), vol. 10, no. 3, pp. 766, 2020.

M. A. Martinez Ramirez and J. D. Reiss, “Modeling nonlinear audio effects with endto- end deep neural networks,” in ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019.

M. A. Martínez Ramírez, E. Benetos, and J. D. Reiss, “Deep learning for black-box modeling of audio effects,” Applied Sciences (Basel), vol. 10, no. 2, pp. 638, 2020.

G. Stan, J. Embrechts, and D. Archambeau, “Comparison of different impulse response measurement techniques,” Journal of the Audio Engineering Society, vol. 50, no. 4, pp. 249–262, 2002.

S. W. Smith, The scientist and engineer’s guide to digital signal processing. California Technical Pub, 1997.

A. Ratnarajah, S.-X. Zhang, M. Yu, Z. Tang, D. Manocha, and D. Yu, “FAST-RIR: Fast neural diffuse room impulse response generator,” arXiv [cs.SD], 2021.

A. Wright and V. Valimaki, “Perceptual loss function for neural modeling of audio systems,” in ICASSP 2020–2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2020.

Redwirez (2021, October). FREE Marshall 1960 IRs [Online]. Available: https://redwirez.com/ pages/the-marshall-1960a-ir-pack.

Suhr.com. (2021, October). PT 15 IR User Guide [Online]. Available: https://www.suhr.com/ wp-content/uploads/2020/10/PT-15-IR-User- Guide-100120.pdf.

D. P. Kingma and J. Ba, “Adam: A method for stochastic optimization,” arXiv [cs.LG], 2014.

C. J. Steinmetz and J. D. Reiss, “Efficient neural networks for real-time analog audio effect modeling,” arXiv [eess.AS], 2021.