非可聴つぶやきを用いた個人認証

小島 摩里子 (0551049)


近年の情報化社会の発展に伴い,バイオメトリクス認証の需要が増加
している.従来のIDやパスワードなどを用いた方法に比べて,指紋,
虹彩,静脈,音声などの生体情報を鍵とするバイオメトリクス認証は
基本的になりすましされにくく,今後も需要は高まると考えられる.
その中で,音声による個人認証は手軽に利用できる生体認証法の1つと
してこれまで研究が進められてきたが,指紋や虹彩などに比べると性能
はまだ十分ではない.

そこで,非可聴つぶやき(Non-Audible Murmur : NAM)を認証に利用する
ことを考える.NAMとは他人に聞かれる事がないほどの小さなつぶやき
声を指すもので,音声認識や声質変換などの分野での研究が進められ
ている,新しいタイプの音声入力インターフェースである.
集音には専用の小さな体表型マイクロフォンを用いるため,外部の騒音
に強い.そのため,キーワードを利用したテキスト依存型話者照合を安
全に適用する事が出来る.

本発表では,非可聴つぶやきを用いた個人認証法を提案する.
まずNAMを用いた認証を行う事が可能であるかどうかを確認するため,1
時期のデータを用いた初期検討を行い,その有効性を確認した.
次に,複数の時期に収録されたデータを学習に用いることにより, 時間
の経過による音声の変動に対処する.音声の特徴量を複数つなげたセグ
メントを入力とすることで,発声内容固有の音響特徴を積極的に活用する.
その結果,男性18名,女性10名の異なる3時期に収録したNAMによる
実験で,13フレーム(145ms長)を連結して入力とした場合に,男性 0.04% ,
女性 1.1% の等誤り率が得られ,従来の1フレーム(25ms長)を用いた場
合と比べて誤り率は半分以下になった.
また,なりすましや発声間違いに対応したテストセットを用いてそれぞ
れの場合の誤り率を比較し,最後に,使用する学習データについて,
データ数の効果,複数時期のデータの効果について調査した結果を述べる.