ゼミナール発表

日時: 10/2(火)1限(9:20-10:50)


L1: 松本(裕)研,進行係: Edson Miyamoto

0051011  内田賢志   鹿野清宏,松本裕治,猿渡洋
発表題目:音声認識エンジンJuliusによる自然対話音声の認識
発表概要:本発表では、自然な発声である人間対人間の対話音声のディクテーションを行った結果を報告する。認識実験のテストセットには、店員と客との車の購入に関する対話セットを用いる。言語モデルについては、対象タスクの話題に依存したコーパスを収集するとともに、対話コーパスを組み合わせた言語モデルを作成する。また音響モデルについては、MLLRに基づく話者適応、および十分統計量をもちいて学習したのちMLLRに基づき話者適応した音響モデルを用いる。これらの手法を組み合わせた認識性能を比較する。
0051101  松浪加奈子  鹿野清宏,松本裕治,猿渡洋
発表題目:十分統計量を用いた話者適応における話者選択法の検討
発表概要:音声認識において音声の個人性により認識性能が劣化する。このため、各テスト話者に適応したモデルを作成する話者適応技術が用いられる。 十分統計量を用いた話者適応はテスト話者に音響的特徴が近い話者を選択し、選択された話者の十分統計量を用いてテスト話者に適した音韻モデルを作成する手法である。ここで重要となることはいかに音響的特徴が近い話者を選択するかである。本発表では、十分統計量を用いた話者適応における話者選択法について検討する。
0051109  米良祐一郎  鹿野清宏,松本裕治,Nick Campbell,猿渡洋
発表題目:<題目> Juliusを用いた自由発話の自動ラべリングにおけるラベル尤度の統計的分析
発表概要:<概要> 音響モデルの構築には、大量の音声データとそれに対応するラベルや書き起こしなどが必要である。ラベルとは音声波形を音素ごとに区分化した時間と音素の情報のことであり、これを付与する区分化作業は、これまで人間の目により手動で行なわれてきた。近年のHMMを用いた統計的手法を用いた音声認識技術の高まりとともに、音声発話と対応する書き起こし(認識における正解文)を用いて、Viterbi処理により強制区分化を行なう自動ラベリングが提案されている。これによって、大規模な音声データベースのラベル付けが容易になるとともに、そこから得られる音素単位の尤度や継続時間などの統計的情報は、音響モデルの改善への指標となりうると考えられる。 そこで、まず音声認識エンジンJuliusを利用した自動ラベリングの精度を、手動で付与されたラベル(以降手動ラベルと呼ぶ)と比較することで評価する。また話者適応した音響モデルによる自動ラベリングの精度の改善についても評価する。 そしてラベルの音響尤度を読み上げと対話のデータベースで統計的に比較し、自由発話の問題点を検討する。

L2: 杉本研,進行係: 安達直世

0051024  上柳田英和  鹿野清宏,杉本謙二,猿渡洋
発表題目: 非線形マイクロホンアレーへの空間平均法の適用
発表概要: 非線形マイクロホンアレーを用いた音源方位推定に空間平均法を適 用した.実環境下における音源方位推定実験の結果より,空間平均 法を適用したものが,従来の方法よりも方位推定の精度が優れてい ることがわかった.
0051046  芝山敏満   伊藤実,石井信,杉本謙二
発表題目:サポートベクターマシンによる価値関数の獲得における 誤差抑制の試み
発表概要:今までにサポートベクターマシンを用いて, Tic-Tac-Toeの価値関数を,盤面を表すベクトルの線形関数として近似する 手法が提案されている. この手法で得られる価値関数の近似式の誤差を抑えるための 本研究の試みについて紹介する.
0051069  豊田篤史   小笠原司,杉本謙二
発表題目:ゲーム用高速動力学演算パッケージを用いたロボットシミュレーション 環境の構築
発表概要:ロボットのソフトウェア開発にはシミュレーションが不可欠であるが、 複数の関節をもつ構造の場合、独自に作成するには効率が悪く、シミュレータの 開発そのものが目的でない場合には、本来の開発目標の妨げになってしまう。そ こで本研究では、ゲーム用動力学演算パッケージを用いることで、高速の動力学 計算を実現し、制御アルゴリズムの開発などで利用できるようなソフトウェア開 発環境の構築する。

L3: 植村研,進行係: 天笠俊之

0051023  影山良之        植村俊亮,Nick Campbell
発表題目:<題目>P-BIラベルを用いた単位選択
発表概要:<概要>現在の波形接続型合成音声システムでは韻葎予測を元に単位選択を行なっている。しかし、この方法では韻葎予測時に誤差が生じ、その結果単位選択に影響してしまう。本研究ではP-BIラベルを付与したテキストから直接音声単位選択を行なう方法を提案する。
0051029  木下敦史        関浩之,植村俊亮,楫勇一
発表題目:対話的に文書ランキングを調整できるWWW検索支援手法
発表概要:従来のキーワード型検索システムでは、ユーザはシステムから出力された文書ランキングに対して不満があったとしても、クエリーの変更をしない限り、不満に感じているその文書ランキングを受け入れ、上位から順番に必要な文書を探していくしかない。 そこで、ユーザが現在の文書ランキングに対して調整操作をすることにより、ユーザ独自の基準でスコアリングを可能にする検索支援手法を提案する。
0051124  Ongart Supackchookul  松本裕治,植村俊亮
発表題目:質問応答システムにおける数値的問題解決方法に関する研究
発表概要:現在では自然言語で書かれている情報が多くなってきている。ユーザにとって必要な情報を抽出することが重要な課題になって、近年では質問応答システムが注目されている。質問応答システムの目的はユーザの質問の答えとなる文字列を出力することである。本研究では数値的の質問(Quantification)を注目し、解決方法を提案する。
0051205  孟文麗         松本裕治,植村俊亮
発表題目:日本語/中国語対訳コーパスと情報検索
発表概要:本l発表では、GSDL(Greentone Digital library system)利用して、中日対訳コーパスを検索するシステムの構築と問題点について発表し、またこれからの研究方向について発表する。

S1/S2: 横矢研,進行係: 山澤一誠

0051038  後藤健志   小笠原司,横矢直和
発表題目:レーザレンジファインダを用いた電動車椅子の操縦補助システム
発表概要:電動車椅子をジョイスティックで操縦するにおいて、狭い通路を通るなどの細かい動作は困難である。この問題に対し本研究では、レーザレンジファインダを用いることで車椅子の周囲の環境を認識し、自動に車椅子の姿勢の補整を行う操縦補助システムの構築を目指す。
0051006  怡土順一   小笠原司,横矢直和
発表題目:顔情報計測に基づく運転手の心理状態推定
発表概要:人間の顔は,心理状態を反映した情報を提示していると考えられる. よって,もしコンピュータシステムが同様にユーザの心理状態を推定す ることが出来れば,ユーザを適切にサポートする,より知的なインタフェース が構築出来ると考えられる. 本研究では,まず,非接触型でリアルタイムの顔情報計測手法を構築する. そして,そのシステムを用いて実際に特定状況下での人間の顔を観察し, 心理状態を推定する実験を行う.
0051013  江川洋平   木戸出正繼,横矢直和,河野恭之
発表題目:赤外線カメラを用いた指先の動き認識に関する研究
発表概要:機械と人間(ユーザ)との間により自然なインターフェースが望まれている。本研究では、赤外線カメラを用いて人間の自然な指先の動きをとらえ、その指先の動きの性質を利用して、空間上に書かれた文字をリアルタイムに認識することを目指す。そのために必要な予備実験を行ない、次に具体的な指先の抽出方法、文字の判別手法について述べる。
0051080  野間啓介   鹿野清宏,横矢直和,猿渡洋
発表題目:<題目> 使用環境に頑健なバイモーダル音声認識
発表概要:<概要> 音声認識技術が発達し,音声認識をインターフェースで用いようとする動きが活発化している。この場合に認識率を低下させる様な環境がある。バイモーダル音声認識システムが有用である。本発表ではまずオフィス環境やPDAなど,ユーザが大きな声を出しにくい環境を想定したささやき声の音声認識について,音響モデルのMLLRを用いた話者適応の効果を認識実験により評価,検討し,次に周囲の環境に対して頑健な唇領域の特徴を用いたバイモーダル音声認識システムについて述べる。