統合失調症は知覚, 思考, 感情, 意欲など多くの精神機能領域の障害が現れる精神疾患である. 患者の30%から50%に病識の欠如が見られ, 医療機関受診のきっかけ作りが課題となっている. もし, 医療機関以外でも統合失調症罹患の可能性を検出できれば, 行政などからも治療の働きかけを行うことが可能となり, 早期治療実現に貢献できる.
患者の多くは17歳から25歳の間に発病するとされ, これはソーシャルメディアユーザーの主な年齢層と合致する. 統合失調症の診断基準やこれまでの研究において, 語彙の貧困さや特徴的な語彙の使用傾向など, 様々な統合失調症の言語的特徴が指摘されているが, ソーシャルメディアを用いた研究においては, 統合失調症の診断基準における言語的特徴がまだ十分反映されているとは言えない.
そこで本研究では, 主要なソーシャルメディアの一つであるTwitterを用いて健常者と統合失調症患者の投稿を集めたデータセットを構築し, 先行研究で用いられた手法に加え, 統合失調症の診断基準における言語的特徴に着目して両者の比較と識別を行った. 本発表では統合失調症における言語的特徴について述べ, また今回新たに構築した健常者と統合失調症データセットの比較, 識別を目的とした実験結果について述べる.