Publications

カンファレンス (国内) 動画クラスタリングのためのDINOの動画への拡張の検討

中嶋 直也, 石川 裕地, 近藤 雅芳

第27回 画像の認識・理解シンポジウム MIRU2024 (MIRU2024)

2024.8.6

本研究では,類似した動画同士を同一のクラスタに割り当てる動画のクラスタリングというタスクに取り組む. 既存研究では,メタデータや音声データなどを用いたクラスタリングが提案されているが, 全ての動画にそのようなデータが付与されているとは限らない. 本研究では,ラベルのない動画だけから動画のクラスタリングを学習するために, 画像認識の分野で提案されているDINOに着目し,これを動画に拡張することを検討する. 行動認識のベンチマークを用いて, (1) multi-crop, (2) 動画のためのdata augmentation の2点に関して,それらが及ぼす影響について網羅的に分析し, 動画クラスタリングにおけるDINOの有効性やその特性について議論する.

PDF : 動画クラスタリングのためのDINOの動画への拡張の検討