Publications
カンファレンス (国内) ニューラルネットワークによる音源方向推定に基づく目的音源抽出のための適応ビームフォーマ
中込 優 (早稲田大学), 戸上 真人
日本音響学会 2019年春季研究発表会 (ASJ 2019 spring)
2019.3.5
本研究では、ニューラルネットワークを用いた音源方向の補正に基づく時間周波数マスクを活用したマルチチャネル適応ビームフォーマを提案する。従来のマイク間位相差を用いた音源方向推定は、マイクの配置ズレや反響の影響で信頼性が低下するが、提案手法では音声の特徴的な周波数構造を活用して誤った音源方向を補正する。この時間周波数マスクは、所望の方向からの音声のみを通過させる。提案されたニューラルネットワークは特定のマイクロホンアレイで学習されるが、マイク配置に依存しない特徴量を入力として、異なるマイクロホンアレイにも適用可能である。実験結果から、提案手法は時間周波数マスクの推定がより正確で、目的音の歪みが少ないことが確認された。特に、従来の音源方向推定が困難だった直線アレイの端方向での音声強調性能が大幅に向上したことが示された。