Publications

CONFERENCE (DOMESTIC) Webページからの人物画像抽出への文書分類モデルの導入と顔類似度によるDistant Supervision

中野 佑哉, 芦原 和樹, 池田 純, 西 賢太郎, 永井 隆広

2023年度 人工知能学会全国大会(第37回) (JSAI2023)

June 09, 2023

検索サービスにおいて,人物の画像や概要文といった情報を表示する直接回答が広くユーザに認知されている.人物画像の紐付けは,Webコンテンツに含まれる画像キャプションと人名とのマッチングにより行われる.しかし,人名が画像のキャプションに部分一致する場合,キャプションが意味的曖昧性を含む可能性があり,画像に写る人物が対象の人物であるかどうかを判定する点で課題がある.本研究では,人名が部分一致する画像キャプションが対象の人物を表すかどうかを判定するために,大規模汎用言語モデルをベースとした分類モデルを作成し,曖昧性解消と精度改善を目指す.また,人物の顔画像を比較することによるデータセット作成手法を提案する.提案するデータセット作成手法では人物の顔領域をベクトル化し,正解画像と候補画像との類似度を基準としてアノテーションを自動化する.作成したデータセットを用いて,画像キャプションが対象の人物を表す文字列かどうかを判定する分類モデルを学習し,既存のルールベースフィルタとの比較評価を行った.評価の結果,マッチングの精度が改善することを確認した.

Paper : Webページからの人物画像抽出への文書分類モデルの導入と顔類似度によるDistant Supervisionopen into new tab or window (external link)