Publications
CONFERENCE (DOMESTIC) 離散トークン音声認識におけるドメイン適応の検討
日本音響学会 2024年秋季研究発表会 (ASJ 2024 autumn)
September 04, 2024
SSL モデルの適応を行わず,離散トークン ASR 自体をドメイン適応する手法を提案する。 提案法は,ドメインに応じて異なる離散トークンの出現パターンを離散トークン系列自身から予測する新たなタスクを学習時に加える。 マスキング処理などにより欠損させた離散トークン系列からもとの離散トークン系列自身を予測するタスクを付加することで,ドメインの変化に伴う離散トークンの系列パターンを ASR モデル自身に学習させる。 LibriSpeech データセットをソースドメイン,TED-LIUM 3 をターゲットドメインとした実験により,提案法の有効性を確認した。