Publications

カンファレンス (国内) ペアデータを必要としない敵対的学習に基づく多チャンネル音源分離

中込 優 (早稲田大学), 戸上 真人, 小川 哲司 (早稲田大学), 小林 哲則 (早稲田大学)

日本音響学会 2021年春季研究発表会 (ASJ 2021 spring)

2021.3.10

本研究は、ペアデータ(観測音と正解音のペア)を必要としない、敵対的学習に基づく多チャンネル音源分離法を提案する。近年、DNNを用いた教師あり音源分離法が注目されているが、これらの手法は大量の教師データが必要であり、実環境では混合信号のみが観測されるため、教師データの取得が困難である。提案手法では、非ペアのクリーン音声データを使用して、敵対的学習を行い、クリーン音声らしい分離音を出力するモデルの学習を目指す。従来の敵対的学習に基づく音源分離法はペアデータを必要とするが、本研究ではBEGANを利用してペアデータを用いずに音源分離を実現する。さらに、学習の安定化のために、非ペアのクリーン音声に特有の歪みを付与し、DNNの学習を音源の分離に特化させるアプローチと、Generatorの教師なし事前学習を検討する。