Publications

CONFERENCE (DOMESTIC) 所望音源の方向アトラクターに基づく時変の空間フィルタを用いた DNN 音声抽出

中込 優 (早稲田大学), 戸上 真人, 小川 哲司 (早稲田大学), 小林 哲則 (早稲田大学)

日本音響学会 2020年春季研究発表会 (ASJ 2020 spring)

March 16, 2020

本研究は、所望音源の方向情報を用いてDNNと時変の空間フィルタを結合学習し、音質を向上させる音声抽出法を提案する。複数者の同時発話から特定の話者の音声を抽出する技術は、ロボット対話やテレビ会議などで重要。音声抽出手法は、ブラインド音源分離と後段の話者選択、または音源方向や話者性を用いた方法に大別される。本研究は、マイクの目的音源方向を補助情報として利用し、空間モデリングとDNN学習を組み合わせる。このアプローチは、未知の音環境への頑健性が期待され、音環境の変動に対しても高い精度で音源を抽出できる可能性がある。特に、時変の空間フィルタを微分可能な形でDNNと結合学習することで、所望方向の音源のみを高精度に抽出することを目指す。