Publications

カンファレンス (国内) LLMを用いたクロールデータからの人物略歴文抽出

中野 佑哉, 猪野 麻巳子, 二葉 知泰, 丸山 翼, 岸本 耀平, 永井 隆広

言語処理学会第31回年次大会 (NLP2025)

2025.3.3

複数Webサイトに点在する人物の略歴文を収集し,Web検索結果に表示することで,検索サービスのユーザ体験向上が期待できる.しかし,略歴文収集に係る作業は,人間が行った場合においても難易度が高く,大規模な略歴文収集には大きなコストがかかる.そこで,本研究では,LLMを用いて,クロールデータから人物の略歴情報と関連するWebサイトを自動的に紐付け,引用形式を保ったまま略歴文を抽出するタスクを提案し,手法の有効性について検討する.

Paper : LLMを用いたクロールデータからの人物略歴文抽出新しいタブまたはウィンドウで開く (外部サイト)

PDF : LLMを用いたクロールデータからの人物略歴文抽出