飲食店向け不動産物件の賃料は,ベテランの営業職員が長年で培ってきた経験や勘などの暗黙知により決定されている.この手法では,賃料を決定する要因が明らかではなく,人によって価格が異なるといった課題や,新人営業職員への知識継承が難しいといった課題がある.
これらの課題を解決するため,先行研究では,ベテラン営業職員にインタビューを行い,飲食店向け不動産物件の賃料を決定している要因を抽出し,それらをベースとした飲食店向けの賃料推定モデルを提案している.先行研究により抽出された要因としては,ベテラン営業職員による言語化が可能である顕在的情報と,ベテラン営業職員による言語化が困難である潜在的情報があり,顕在的情報の具体的な指標としては,坪数,居抜き,階数,駅徒歩時間,通行量,視認性,平均坪単価が得られている.また,具体的な指標が抽出されなかった潜在的情報としては,物件に付与されているキャッチコピーを用いており,キャッチコピー中の名詞および形容詞を抽出し,それらの単語が賃料に対し正負どちらにはたらくかを算出する手法を提案している.これらの特徴量を用いて構築した推定モデルは,決定係数が0.738となる結果が得られている.しかし,先行研究にて構築したモデルでは,データ数や特徴量が少ないといった課題や,キャッチコピーの解析に関しては同一の単語でのみ検出が可能であり,曖昧さに欠けるといった課題がある.また,賃料推定モデルを実際の現場で用いるためには,より高い推定精度が求められている.
本研究では,先行研究のモデルの課題を解決すること,および推定精度を向上させることを目的とし,新たな飲食店向け不動産物件の賃料推定モデルを構築する.本研究では,賃料推定モデルの精度向上に関する以下の4つの仮説をたて,これらの検証を行う.
仮説1:データ数を追加することにより推定精度は向上する
仮説2:新たな特徴量を追加することにより推定精度は向上する
仮説3:特徴量の掛け合わせを考慮することにより推定精度は向上する
仮説4:キャッチコピーの曖昧さを考慮することにより推定精度は向上する
仮説1の検証の結果,データ数が100件の場合の解析結果とデータ数が483件の場合の解析結果を比較すると,決定係数が最大で11.5%上昇する結果が得られた.仮説2の検証の結果,仮説1の推定結果と比較すると,決定係数が最大で1.8%上昇する結果が得られた.仮説3の検証の結果,仮説1の推定結果と比較すると,決定係数が最大で1.2%上昇する結果が得られた.仮説4では,キャッチコピーの曖昧さを考慮する手法として,Doc2Vecを用いる手法,およびWord2Vecを用いる手法の二種類の解析方法を用い,モデルの構築を行った.その結果,仮説1の推定結果と比較すると,Doc2Vecの場合で決定係数が最大1.1%,Word2Vecの場合で決定係数が最大1.8%上昇する結果が得られた.
本研究では,これらの仮説を組み合わせることにより,さらなる推定精度の向上を図った.その結果,仮説1,仮説2,仮説4のWord2Vecの手法を組み合わせた場合に最も推定精度が高くなり,決定係数が最大で0.752となる結果が得られた.