Publications

カンファレンス (国内) 語彙と品質を考慮したデータ水増しの言語教育支援への適用

中町 礼文, 西内 沙恵 (北海道教育大学), 浅原 正幸 (国立国語研究所), 佐藤 敏紀

言語処理学会第29回年次大会 (NLP 2023)

2023.3.13

本研究では, テキスト生成のための基盤モデルを用いて, 語彙と品質を考慮したデータ水増しのシス テムを提案した. 提案手法によるコーパス構築の応用可能性の検証として, 言語教育支援に向けたコー パス構築を行った. 本研究では, 提案手法を用いて, 語彙, 難易度, テキストの組からなる約 500 件程度の元データを, 4 倍以上に拡充した. また, 生成したデータのみによる文難易度推定器が, 人手により作成した推定器構築用の学習データを用いた推定器と同等以上の性能を持つことを確認し, 提案手法によるコーパスの自動構築の応用可能性を示した.

Paper : 語彙と品質を考慮したデータ水増しの言語教育支援への適用新しいタブまたはウィンドウで開く (外部サイト)