Publications

カンファレンス (国内) 離散トークン音声認識におけるドメイン適応の検討

石井 敬章, 小松 達也, 藤田 雄介, 藤田 悠哉

日本音響学会 2024年秋季研究発表会 (ASJ 2024 autumn)

2024.9.4

SSL モデルの適応を行わず,離散トークン ASR 自体をドメイン適応する手法を提案する。 提案法は,ドメインに応じて異なる離散トークンの出現パターンを離散トークン系列自身から予測する新たなタスクを学習時に加える。 マスキング処理などにより欠損させた離散トークン系列からもとの離散トークン系列自身を予測するタスクを付加することで,ドメインの変化に伴う離散トークンの系列パターンを ASR モデル自身に学習させる。 LibriSpeech データセットをソースドメイン,TED-LIUM 3 をターゲットドメインとした実験により,提案法の有効性を確認した。