ゼミナール発表

日時: 11月1日(月) 3限


会場:L1

司会:川波 弘道
雨宮 尚範 M2 松本 裕治 鹿野 清宏 新保 仁 小町 守
発表題目:節単位翻訳のための表現パターン利用
発表概要:統計的機械翻訳において,文の複雑さは性能低下をもたらす要因の一つである.日本語と英語のように文の構造が大きく異なる場合,さらにその影響は大きい.これに関連して,近年では文を節単位に分割して翻訳する手法が提案されている.他方,文型パターンを用いるテンプレート翻訳においても,重文と複文の文型を作成する試みがなされている.本発表では複雑な文の処理にパターンを用いる手法について提案し,今後の研究方針を述べる.
 
井手 厚 M2 松本 裕治 鹿野 清宏 新保 仁 浅原 正幸
発表題目:Webフィルタリング処理時における表記ゆれの動的解決
発表概要:Web上の文章には,意図的に誤変換された漢字などを含む,多くの表記ゆれ表現が存在しており,Webフィルタリングを行う上では表記ゆれに対応したシステムを構築することが有効である.本発表では表記ゆれ表現を同定する方法として,KAKASIによる漢字かな変換機能とMeCabの分かち書き機能という2つの技術を利用した手法について提案し,その効果についての実験結果を示す.
 
大木 環美 M2 松本 裕治 鹿野 清宏 新保 仁
発表題目:文間の弱対立関係の認識
発表概要: 現在Web上にはユーザが知りたい情報に関しての 肯定的な情報や否定的な情報が散在しており, これらの情報を分類して提示する 研究は数多く行われている. しかしながら,Web上の情報を提示する文の中には 条件を提示した上での肯定・否定を表す文や 肯定・否定となる程度や範囲を制限する ような文も存在している. これらの部分的な肯定や否定を捉える文は これまでの研究では単なる肯定や否定の情報を提示する文と 同等として 扱われてしまっている. 条件を提示するような文は ユーザにとっても肯定・否定とは 異なる観点から情報を提供しているため, これらの文を区別して分類することは 重要である. 本研究ではこれらの文を分類するために, 部分的な肯定や否定となる文間の関係を 弱対立の関係として定義し, 弱対立を認識するための手がかりによって 弱対立の関係を認識する実験を行った. 弱対立の定義と実験結果について述べる. 本発表ではルールベースによる自動認識器の 精度について述べ,今後は手がかりの学習を 行う自動認識器の開発に取り組む予定である.
 
叶 佳巍 M2 松本 裕治 鹿野 清宏 新保 仁 浅原 正幸
発表題目:Chinese Short Text oriented Named Entity Recognition Combining CRFs Model with Human Knowledge
発表概要:Named Entity Recognition (NER) is a fundamental task and the core of natural language processing (NLP) system. Now, one of its new applications is in Chinese short-text classification, which is a hot spot and a challenge of research at present. Chinese short-text is mainly refer to the texts in message of mobile, QQ, MSN etc. We propose a method that combining expert knowledge with CRFs model to solve the Problem in Chinese short-text orientated Named Entity Recognition.
 

会場:L2

司会:森崎 修司
木下 正喬 M2 飯田 元 松本 健一 安本 慶一
発表題目:凝集度を用いたソースコードからの機能候補抽出
発表概要:ソフトウェアの大規模・複雑化に伴い,ソースコードの理解はより難しくなっている.本研究では,コード片(ソースコードの断片)を機能別に分類することで,ソースコードの理解を支援する.単一の機能に対応するコード片集合は互いに協調して動作するため,機能候補の抽出にはコード片集合の協調度合いを表す「凝集度」を用いる.また,抽出された機能候補が,手作業で抽出した結果とどの程度一致しているかを実験的に評価する.
 
KOUAKOU NANAN MARC THIERRY M2 伊藤 実 岡田 実 安本 慶一
発表題目:Planning Cost-Efficient Indoor WSNs Deployment
発表概要:In the deployment of indoor WSNs, it is important to be able to determine the positions of the sensor nodes that achieve the full-coverage of the target space and the connectivity between the sensor nodes with the minimum deployment cost. The sensor node deployment problem for 3D coverage and connectivity is NP-hard even without obstacles in the target field. In this presentation, we propose a heuristic algorithm for computing a minimal cost deployment pattern achieving the full coverage and wireless connectivity in arbitrary 3D target space with obstacles. We have developed a tool by implementing our proposed algorithm in the UbiREAL smartspace simulator so that WSN designers can interactively determine the near-optimal sensor node positions thorough visualization of the achievable coverage and the sensor positions on a 3D virtual space.
 
松田 かおり D2 金谷 重彦 湊 小太郎 Md.Altaf-Ul-Amin 中村 建介 高橋 弘喜
発表題目:代謝物質と合成物質の識別のための発見的手法
発表概要:あらゆる化学物質がとりうる構造や性質の多様性を表現する特徴空間をchemical spaceと呼ぶ。従来の医薬品開発では、機械的に創り出した化学物質をスクリーニングし、有用な化学物質を見出してきた。しかし、機械的に化学物質を創り出すコンビナトリアルケミストリーは、近年その多様性において薬物設計のライブラリーとして十分でないと言われており、化学物質の重要な性質を捉えた様々な指標値を用いて主成分分析を行った結果、その特徴空間上で薬物や生命活動に依って生じる代謝物質、有機合成物質などの分布を比較した結果、薬物が利用しているchemical spaceが限定的であるとも述べられている。化学物質の結合には様々な制約があり、化学構造の組み上がり方を左右するため、構造的特徴を捉えたchemical spaceの比較により、構造的表現の可能性を探ることができると考えられる。本研究では薬物・代謝物質・低分子化合物の公的データを2種類ずつ用い、グラフ理論を適用した構造的指標や組成比などを化学物質の性質を捉える記述子として定義した。化学物質のグラフ構造では点と辺はほぼ1対1の線形増加が見られるが、低分子化合物のデータセットではそのばらつきが大きい。代謝物質の信頼区間を基に、低分子化合物のデータセットから全体の1.9%と3.2%に当たる外れ値を抽出し、記述子から得た主成分分析による特徴空間上で検証したところ、代謝物質・薬物とは全く異なるクラスターが得られた。