Abstract:
人は画像の印象を「美しい」「楽しい」などの単語で表現するが,画像とその印象を表す語との関係には明らかでない点が多い.本研究では,ある単語で表される画像集合のばらつき度合い,つまり単語の視覚的な多様性の観点から単語と画像の関係を調査した.形容詞を対象にして,様々な視覚特徴の多様性の分析を通じ,視覚的な多様性を定量化する方法を検討した.118個の形容詞に対し,それぞれ500枚の画像集合をVisual Genomeデータセットから抽出し,各形容詞の視覚的な多様性を分析した.画像集合に対する画像クラスタリング結果のエントロピーを用いて,視覚特徴に対する多様性のスコアを算出した.その結果,各視覚特徴に対する多様性スコアは,形容詞ごとに異なる傾向がみられた.これらのスコアは,各形容詞の性質を反映していると考えられる.
Type: 電子情報通信学会 2025年総合大会
Publication date: To be published in Mar 2025