藤岡 靖久 (9851094)


計算機技術の進歩により,ニュース映像や会議映像などの様々な映 像をデジタル化して映像データベースを構築することが可能となりつつある.デ ジタル化される映像は膨大な数になることが予想され,利用者がその内容を効率 良く知るには,利用者に映像メディアの概観を示すことが効果的である.本稿で は,映像メディアに対して画像処理技術と音声認識技術を適用することにより, カットやシーンといった映像が持つ階層構造の自動検出を行い,その階層構造に 基づいて映像データのカタログを自動生成する手法を提案する.特に具体例とし てSCS会議映像を取り上げ,研究発表と質疑応答のシーンの自動認識を試みる. 生成されたカタログには各カット固有の代表フレームおよび話者に関する情報が 含まれるため,効率の良い映像の閲覧が可能となる.