Publications
CONFERENCE (DOMESTIC) Conformer CPCとDeep Cluster を用いたゼロリソース言語のための表現学習
前角 高史, Xuankai Chang (カーネギーメロン大学), 藤田 悠哉, Li-Wei Chen (カーネギーメロン大学), 渡部 晋治(カーネギーメロン大学), Alexander Rudnicky (カーネギーメロン大学)
日本音響学会2021年秋季研究発表会
September 08, 2021
本研究では,The Zero Resource Speech Challenge 2021において我々が提案したシステムについて報告する.本チャレンジのタスクは,音声データ及び話者ラベルのみを用いて構築した言語モデルの性能を評価することである.ベースラインとして,Contrastive Predictive Coding (CPC)の特徴量をクラスタリングすることによって得られた離散系列を言語モデルで学習するシステムが設定されている.我々はベースラインにDeep ClusterとConformerを組み合わせることを提案する.DeepCluster はクラスタリング結果から得られる疑似ラベルを教師とみなして学習を行う手法であり,CPCの出力が音響識別的な特徴を獲得する効果が期待される.またCPCの系列予測向けネットワークをTransformerからConformer に置き換えることにより,より局所的な音響特徴の変化を捉えることが可能となる.本稿では,本コンペティション及び提案法の詳細と,提案法の有効性を検証するための実験について報告する.