Publications

カンファレンス (国内) 拡散過程と敵対的学習の併用による普遍音声強調

シャイブラー ロビン, 藤田 雄介, 橘 健太郎

日本音響学会 2024年春季研究発表会 (ASJ 2024 spring)

2024.3.6

本研究では,拡散過程に基づく普遍音声強調手法で ある UNIVERSEに着目する.我々の予備実験に よれば,UNIVERSE は訓練時における検証指標の改 善が遅く不安定であることが確認されている.また, UNIVERSE で利用されている混合密度ネットワーク (mixture density network; MDN)損失関数は, クリーン音声の分布を十分に考慮できていないため, 自然性の評価指標が低い. そこで,これらの課題を解 消する手法を提案する.まず,ネットワーク構造を改 善し,学習の効率と安定性を向上させる.次に,ク リーン音声の分布を予測する敵対的学習に基づく損 失関数を加え,自然性の評価指標を向上させる.

PDF : 拡散過程と敵対的学習の併用による普遍音声強調