Publications
カンファレンス (国内) 文書拡張プロンプト最適化に基づく同時更新文書検索
伊藤 拓誠 (筑波大学), 黒川 悠馬 (筑波大学), 加藤 誠 (筑波大学/国立情報学研究所), 藤田 澄男
第18回データ工学と情報マネジメントに関するフォーラム(第24回日本データベース学会年次大会) (DEIM 2026)
2026.2.28
本論文は,文書の更新内容から同時に更新すべき文書を検索する新たなタスクと手法を提案する.本タスク向けに,日本およびEU の法文書改正データから同時更新される文書の情報を抽出しデータセットを構築した.構築したデータセットを分析した結果,(1)既存の検索モデルやクエリ拡張手法の効果が限定的である一方で文書拡張が比較的有効であること,(2)本タスク向けにモデルを学習するにはデータ量が不十分であることが判明した.これらを踏まえ,文書拡張に用いる大規模言語モデルのプロンプトを最適化することで,学習データが限られた状況でも効果的に同時更新文書を検索する手法を提案する.文書拡張プロンプトをナイーブに評価すると,候補ごとにコーパス全体の再拡張・再索引が必要となり計算コストが大きい.そこで,コーパス全体を再処理せずに計算できる目的関数を設計し,最適化に用いる.構築したデータセットで実験を行った結果,提案手法により同時更新文書検索の効果が向上することを確認した.
Paper :
文書拡張プロンプト最適化に基づく同時更新文書検索
(外部サイト)