ゼミナール発表

日時: 9月29日(金)2限 (11:00-12:30)


会場: L1

司会:上田(悦) 助手
柴田 傑 M2 木戸出 正繼 小笠原 司 河野 恭之
発表題目:動作学習支援システムのためのロバストDPマッチング
発表概要:近年、人の動き情報を用いたサービスの実現が期待されている。 本研究ではこのようなサービスとして、動作学習支援システムを考える。 このシステムでは学習者の動きを観測し、ミスを指摘する。 提案システム実現のため、学習者の連続動作に対し、 教師が定義する動作単位での認識を行う。そのため、まず、 教師の動作を用いて辞書を作成する。次の学習者の動作を分節化、 認識段階において、作成した辞書を用いたDPマッチングを行う。 本研究では、少ない学習パターンで連続動作の認識を実現するために DPマッチングの新たな手法としてパス重み付きDPマッチングを提案する。 これは、フレーム毎にDPパスの重みを設定し、ノイズを吸収する手法である。 本発表では、この手法の概要と簡単な動作認識実験の結果について述べる。
 
高木 惠世 M2 鹿野 清宏 小笠原 司 猿渡 洋
発表題目:空間的サブトラクションアレーのための実環境を考慮した音響モデルの検討
発表概要:接話マイクロホンを用いた音声認識に比べ,実環境下においてハンズフリー音声認識を行う際,周囲の雑音や部屋の残響に影響され,認識精度が劣化する問題が報告されている.この問題を解決するための一手法として,空間的サブトラクションアレー(SSA)が提案されている.この手法を用いることにより,高精度な雑音抑圧能力が期待できるが,高残響下においては認識率の劣化を避けることができない.そこで本発表では,音声認識器に用いる音響モデルに着目し,SSAに特化した音響モデルの検討を行い,その結果を報告する.
 
高橋 祐 M2 鹿野 清宏 小笠原 司 猿渡 洋
発表題目:ブラインド空間的サブトラクションアレーによるハンズフリー音声認識
発表概要: 本研究では,雑音に頑健なハンズフリー音声認識を実現するため, 独立成分分析 (ICA)に基づく高精度な雑音推定部を備えた,ブライ ンド空間的サブトラクションアレー (BSSA)を提案する.実環境に おいては,ターゲットの音声は点音源で近似できるものの,雑音 は点音源でないことも多い.予備実験の結果,従来の ICA はこの ような環境下において直接音声を推定するよりも,雑音を推定す る方が性能が優れていることが確認された.そこで本研究では, 雑音を含んだ観測信号のパワースペクトルから ICA によって推定 した雑音のパワースペクトルを減算する,スペクトル減算 (SS)型 の新たな雑音抑圧手法を提案する.また,提案法は SS 型アレー であるため雑音推定誤差にロバストであり,音声認識に特化した 手法になっている.本稿では音声認識実験により提案法の有効性 を確認する.
 
田中 直哉 M2 鹿野 清宏 小笠原 司 猿渡 洋
発表題目:空間的サブトラクションアレーにおけるNAMマイクロホンを用いたロボット内部雑音抑圧に関する検討
発表概要:人とロボットとの高精度な音声対話システムを実現するため,空間的サブトラクションアレー (SSA)を導入する.SSAの導入により,外部雑音に対しては,高精度な音声認識が可能になる.しかしながら,ロボットには自身が発する内部雑音が存在する.SSAは,このような内部雑音を考慮していないため,高精度な音声認識を行うことが困難である.本稿では,この問題点を解決するために,NAMマイクロホンを用いたロボット内部雑音抑圧手法を提案し,実環境に即した実験を行い提案方の有効性の検討を行った.
 

会場: L2

司会: 中島 助手
藤本 知之 M2 湊 小太郎 植村 俊亮 杉浦 忠男
発表題目:一分子DNAのGCコンテント分布計測における長さ補正
発表概要:現在,エバネッセント顕微鏡などの光学技術の進展に伴い一分子を対象とした 高感度な計測が行われるようになっている.光学顕微鏡により一分子計測したDNAの塩基 配列情報とゲノム配列データベースを比較することで高速なDNAの同定が行える.本研究 では,局所的なGCコンテントの偏りに着目し,DNAの塩基配列情報の取得を試みた.これ までに,ガラス基板上にDNAを伸張固定してGC特異的及びDNA一様に蛍光染色し,エバネッ セント顕微鏡を用いて一分子イメージングすることでDNAのGCコンテントの一次元分布を 計測した.しかし,固定したDNAは一様に伸張しておらず,単位長さあたりの塩基数が異 なり,データベース予測による理論値と必ずしも一致しない.そこで,一様に蛍光染色し たDNAの画素値情報を用いることで,単位長さあたりの塩基数を補正するためのモデルと その適用結果について報告する.
 
新井 美紗子 M2 比較ゲノム学 金谷 重彦 植村 俊亮 黒川 顕
発表題目: マルチドメインを考慮したオーソログ遺伝子対の可視化アルゴリズムの開発
発表概要: 様々な生物のゲノム全配列が解析されてきている。そのため、異なる生物種間で全遺伝子を比較解析することで、オーソログ遺伝子対を検出することが可能となった。しかし、遺伝子は進化の過程でドメインが融合したマルチドメイン構造を形成する場合があるため、ホモロジー解析で得られた遺伝子の類似箇所の情報を考慮していない単純なクラスタリングに基づく解析手法では、遺伝子のホモロジー関係が一対多や多対多になってしまい、オーソログ遺伝子を決定する際に問題が生じる。この問題を解消するため、本研究では、遺伝子のホモロジー関係をドメイン単位で検出し、マルチドメイン構造を可視化するソフトウェアの開発を行った。また、本ソフトウェアを用いた、植物と細菌の遺伝子のゲノムレベルでの進化解析を行う。
 
辻 尚 M2 金谷 重彦 植村 俊亮 有田 正規(東大) 黒川 顕
発表題目:生体ネットワーククラスターの可視化に関する研究
発表概要:大規模ネットワークの可視化は、ネットワークの詳細を理解するための重要な課題である。本研究では、タンパク質相互作用ネットワークに代表される生体ネットワークの可視化手法の提案および実装を行う。ネットワーク可視化における重要な概念がクラスタリングである。クラスタリングとは、クラスタと呼ばれるネットワーク内でリンクが互いに密に張られた領域を列挙することを指す。現在、大規模ネットワークの可視化を実現し、複数のクラスタリングアルゴリズムによる結果の相違を検討した。これらの結果を踏まえて、クラスタリングアルゴリズムの長所を補完しあった合成アルゴリズムを提案することを検討している。
 
夏原 一彰 M2 金谷 重彦 植村 俊亮 黒川 顕
発表題目:メタボリックプロファイリングに向けた機器分析におけるピーク対応づけアルゴリズムの開発
発表概要:通常の分析化学では、精製したサンプルでの機器分析がなされてきた。このような解析を通常ターゲット分析と言っているがターゲット分析についてのソフトウェアの開発はすでになされている。ところが、組織あるいは細胞全体を測定し、代謝の動的変化を検出するためのメタボローム解析では、通常、数千の代謝物を同一の分析チャート上にクロマトグラムとして検出するため多くのピークが重なり、ターゲット分析法では可能であったピーク分離技術では分析が不十分となっている。そこで、本研究では生体サンプルに代表される混合ピークを比較するアルゴリズムを開発を試みた。このアルゴリズムは、(1)サンプル内に添加した内部標準による精密質量の補完、(2)許容範囲をもとにしたピーク対応付け、の二つのステップからなる。実際に、FT-ICR-MSによる混合サンプルに適用したところ、同一サンプルを複数回測定した場合、約70%のピークについては正しく対応づけることができた。
 

会場: L3

司会:大羽 助手
CAMPBELL HORE D2 松本 裕治 石井 信 乾 健太郎
発表題目:Multiword expressions: automatic extraction from a large text collection
発表概要:Multiword expressions are sequences of words which from a linguistic perspective can be thought of as a single lexical item e.g. by and large, take off, make a mistake. The grammatical properties or meaning of a multiword expression are often unpredictable even if we know the constituent words. As a result, multiword expressions are often the cause of errors in natural language processing tasks such as machine translation. Dictionaries of multiword expressions are therefore a necessity in order to improve natural language processing. I will describe experiments in the automatic extraction of multiword expressions; estimation of the parts of speech of MWEs; and distinguishing between multiword expressions and normal sequences of words.
 
鄭 育昌 D2 松本 裕治 石井 信 乾 健太郎
発表題目: 中国語の時間情報処理及びタグつきコーパスの整備 発表概要: 時間に関する表現や情報は言語表現を理解する不可欠な情報である。時間情報の抽出及び理解の手法の整備と伴い、質問応答、機械翻訳、文書要約など様々な応用分野に時間情報の処理は有益な技術である。しかし、時間情報について十分な言語資源はありません。特に、中国語の時間情報のタグ付きコーパスは依然として欠けている。 中国語の時間情報を研究するため、時間情報のタグ付きコーパスは有益な言語資源である。本発表では、タグ付きコーパスを整備するため、必須な準備研究と自動化のコーパス整備システムの構築について説明して、現在の進捗及び今後の予定について述べる。中国語の時間情報が言語表現に表現される形と規則を究明するため、人手で小規模タグ付きコーパスの作成作業が必要である。作成作業とともに、機械による自動抽出と解析方法も開発されている。現在は小規模コーパスの作成作業を行われている。年内機械による自動抽出システムの整備が完成する予定である。
 
渡邊 陽太郎 M2 松本 裕治 石井 信 乾 健太郎
発表題目:電子番組表を対象とした固有表現間の関係抽出
発表概要:「富士山の高さは何メートルですか?」といった固有表現を答えるような質問文に対して,「富士山」と「3776メートル」との間に「高さ」という関係の同定ができていることで,正しく回答することができる.このような関係の抽出は,質問応答をはじめ、情報検索や自動要約などの応用で重要な技術である。 本研究では特に質問応答システムの知識として関係を利用するため、知識として利用可能な関係を文書から抽出することを目指す。本発表では、特定のドメインにおいて関係がどの程度抽出できるか、その予備実験として行なった電子番組表からの関係抽出について述べる。また、現在進めている、広範な関係の抽出のために必要な固有表現辞書の構築について、概要と現在の進捗状況について述べる。