京都市内のランドマークを対象としたWeb情報を用いた印象音の推定

竹内 瞭 (1751065)


近年,インターネットサービスの普及により,さまざまな場所に関する情報にアクセスできるようになっている.

しかし,アクセスできる情報は視覚的な情報が主である.場所の雰囲気を知りたい場合,視覚的な情報以外の聴覚,嗅覚などに関する情報も必要である.このような情報は観光や引っ越しの際など,事前に場所の環境を知りたい場合などに有用である.そこで,本研究ではWebデータを用いて環境音(特定の場所空間で聞こえる音)を推定することを目的とする.

本研究で用いるWebデータはソーシャルネットワーキングサイト (SNS) のTwitter における発言,位置ベースSNSのFoursquareにおける施設への訪問ログ,写真共有サイトFlickrにおける画像タグ,そして国土地理院における航空写真である.

本研究では,水や風の自然物の発する音(Nature),虫や鳥など生物の発する音(Animal),交通機関の発する音(Vehicle),人間の発する音(People)の4種類の環境音を設定し,これらの環境音について2種類の音量からなる環境音を推定する.任意の場所でどの程度環境音が聞こえるか(実音量),どの程度気になるか(印象音量)をクラウドソーシングよりアンケートを実施し,環境音データセットを構築した.

データセットからステップワイズ法により選択した変数を用いて回帰モデルを構築し,各地点における各環境音の実音量と印象音量を推定した.

京都市を対象に推定した結果を10分割交差検定し,決定係数を求めて評価したところ,Vehicle,Peopleについては実音量,印象音量共に決定係数が約0.7と高い値となり,推定可能性が示唆された一方,NatureおよびAnimalについては実音量,印象音量共に決定係数が約0.3と低い値となり,手法の改善の必要性も確認された.