Publications
ワークショップ (国内) ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得
小町 守(奈良先端科学技術大学院大学), 牧本 慎平, 内海 慶, 颯々野 学
情報処理学会第191回自然言語処理研究会 (NL-IPSJ)
2009.1.1
近年ウェブ検索が一般的になり,ウェブを用いた知識獲得の研究が盛んになってきている.検索ログはユーザのユーザの関心を反映した情報源であり,ターゲット広告や検索支援のための情報抽出源として注目を集めている.しかしながら,既存の検索クエリログを用いた意味カテゴリ学習の研究ではユーザが入力したクエリを用いることによるリソースの問題,ブートストラップに代表される手法の可搬性の問題,そしてウェブを対象にした大規模データに対する拡張性の問題,の 3 つの問題点があった.そこで,本研究では検索クリックスルーログを用いた高精度な意味カテゴリ獲得,そしてラベル伝播によるグラフ理論に基づく手法の提案,最後に MapReduce を用いた並列分散計算により,これらの問題を解決する.意味カテゴリ学習タスクにおいて検索クリックスルーログを用いた研究はこれまでになく,本研究では既存手法に比べ高精度・高再現率で意味カテゴリを獲得できることを示した.