Publications
CONFERENCE (DOMESTIC) 文書への追加情報に対するニューラル検索モデルの挙動分析
薄羽 皐太 (筑波大学), 加藤 誠 (筑波大学), 藤田 澄男
第16回データ工学と情報マネジメントに関するフォーラム(第22回日本データベース学会年次大会) (DEIM 2024)
April 01, 2024
我々は大規模言語モデルに基づく情報検索モデルの振る舞いに関する分析を行った.追加情報に対するス コア付けに焦点を当て,文書に一文を加えることが文書のランクを不当に低下させる現象を発見した.この現象を OPEX とし,複数の大規模言語モデルに基づく情報検索モデルを評価した.その結果,ほとんどの大規模言語モデル に基づく情報検索モデルでOPEX が観察され,特に追加された文が長く,文書の始めの方にあり,文書の他の文と類 似している場合に多く発生することが判明した.OPEX を軽減するために,文書をセグメントに分割し,そのセグメ ントのスコアを集計して全体の文書スコアを計算するウィンドウベースのスコアリングアプローチを適応し,効果を 検証した.検証したウィンドウベースのスコアリングアプローチはOPEX を軽減し,場合によっては検索性能を向上 させることが判明した.
Paper : 文書への追加情報に対するニューラル検索モデルの挙動分析 (external link)