Publications

その他 (国内) 日本語版GLUE構築に向けて

栗原 健太郎 (早大), 河原 大輔 (早大), 柴田 知秀

NLP若手の会 (YANS) 第16回シンポジウム (YANS2021)

2021.8.31

計算機による言語理解を目指して、複数種類の言語理解タスクを包括的に解くことによってモデルを評価、分析することが盛んに行われている。英語の言語理解ベンチマークであるGLUEを先駆けとして、中国語版のCLUEやフランス語版のFLUEなどの英語以外の言語でもベンチマークの公開が進んでいる一方で、日本語においてはこのようなベンチマークは存在しない。本研究では日本語版GLUE(JGLUE)を構築することで、日本語自然言語処理における言語理解研究の促進を図る。本発表では、その第一歩として常識推論データセットCommonsenseQAの日本語版(JCommonsenseQA)構築の詳細とJGLUE構築の展望を紹介する。