Abstracts of Doctor Thesis 2001

平成13年度 情報科学研究科 博士学位論文内容梗概


Last Update : 2002.1.24 
9661019 市野眞己

「遺跡の立体再構成」

 考古学における遺跡・遺構の測量方法として、平板測量や写真測量が挙げられる。一般にこれらの方法から得られるのは投影図や等高線図など、 平面的な図であり、遺跡の立体モデルなどを復元するための情報は不充分である。また、膨大な手作業が不可欠であり、測量作業、図化作業共に熟 練した技術者が必要である。本研究では、このような欠点を克服し、考古学的な解析、可視化が可能な立体情報を得るために、コンピュータによる 画像処理を応用した立体計測手法を提案する。
 まず、少数の画像マーカを遺跡に貼り付ける。それらを含み、遺跡全体を覆うのに充分な数のステレオ写真を、35mmカメラを用いて任意の方向か ら撮影する。次に画像マーカを含む遺跡表面上の点群を、トータルステーションという光波測距を利用した装置を用いて測量する。これら二種の データをコンピュータ処理により重ね合わせ、遺跡表面を覆う密な点の集合として立体を表現する。
 このようにして得られた情報はディスプレイ上で立体的に表示でき、更に断面図などへの図化が自動的に行えるなど、考古学的な利用価値は高 い。
 本発表では、従来の計測手法における問題点を整理し、提案した手法との比較を行い、その利点を述べる。また、手法の詳細について述べ、得ら れる立体情報の利用例を提示する。更に実際の遺構の計測実験について述べ、本手法の有効性を示す。


9661033 渡邉正裕

「ベクトル空間モデルを用いた構造化文書検索と利用者支援」

ネットワーク技術の発達に伴い誰もが氾濫する情報資源にアクセス可能になり, より的確に情報を絞り込みたいという要求が大きくなっている.特にSGMLやXML などの構造化文書が増加するにしたがって,文書の構造や文書に付加された情 報を手がかりにした新しい検索システムの需要はますます高くなっている. 本研究では,高度に多様化する文書検索への要求に応えるためのシステムを 提案する.

本論文の前半では,ベクトル空間モデルに文字列検索を統合して利用するための枠 組みについて検討する. XML などの構造化文書が増加するにしたがって,文書の構造や文書に付加され た情報を手がかりにした新しい検索システムの需要が大きくなっている.これ らの要求に応じるべく,本研究では XML を対象としてベクトル空間モデルに文 字列検索を統合して利用する手法を提案する.XQuery のような問合せ言語は, 文書中の指定された要素の中にある文字列が含まれるかどうかを検査することが できる.しかし,このような文字列一致だけでは文書の内容検索としては不十分 である.本論文では,XPath 式で指定された部分文書を対象とし,文字列検索に よる厳密なパターンマッチのみならず,結果としてランキングを返すベクトル空 間モデルによる類似検索も統合的に利用可能な手法を提案する.これによって, 「検索結果には必ずある文字列を含んでおり,かつある内容に関連する文書 または部分文書を検索せよ」などといった,これまでに提案されているような 文字列検索とベクトル空間モデルの長所を両方生かすような検索が実現できる. また,W3C の Technical Reports and Publications の Web ページから17個の HTML 文書を選択し,XML 文書に変換したものを利用し,問合せ/模範解答のセッ トを作成して検索実験を行い,本提案の有効性を検証した.

論文の後半では,ベクトル空間モデルに基づいた情報検索システムの利用者イン タフェースについて,視覚的な入出力の導入を検討する. 利用者と検索システムとのやりとりは,以前はキーワードの組合せで行われ ていた.しかし,キーワードのブール結合ではシステム利用者の検索意図を 十分容易に表現できる手段であるとは言いがたい.とくに,対話的に検索を 行いながら検索結果を絞り込んでゆくような状況のときには,一回のやりと りが直感的で短い方が望ましい.そこで,本研究では検索の入出力に,二次 元の視覚的インタフェースを利用する手法を提案する.本手法では,利用者 が検索目標オブジェクトとともに,いくつかの目安となるオブジェクトを 2次元の問合せ入力インタフェースで指定する.システムは目安オブジェクト をもとに,相対位置関係から検索目標オブジェクトのベクトル成分を近似的 に計算する.その過程で,特異値分解を利用し,直交基底を合成して得られ る2次元の結果インタフェース平面にオブジェクトの2次元射影が出力される. 本手法を用いると, キーワードのブール結合だけでは表現が困難であったり,複雑であったりする 検索要求を簡単に記述できる可能性を持っている.

(英文)
The information retrieval systems have attracted a great deal of attention. Progress in network technology has made everyone come up against a flood of information. Their attention to information retrieval systems then has produced higher request for retrieval performance. Especially many researches focused on structured document such as SGML or XML has been running. In this research, the method to meet to the demand for advanced document retrieval is proposed.

In the former part of the thesis, the framework for using character sequence and vector search in integration is examined. It is by this research to satisfy these demands. The technique of carrying out integrated use of character sequence search and the vector search for XML is proposed. A query language like XQuery can inspect whether the character sequence in the element with which it was specified in the document is contained. However, such character sequence coincidence is inadequate as contents search of a document. This technique can realize reference which employs efficiently both merits of the character sequence search which is proposed until now of ``a certain character sequence surely being included in the reference result'', and of the vector search whose target is the document or part of a document relevant to a certain contents and so on. >From the World Wide Web consortium Technical Reports and Publications Web page, 17 HTML documents was chosen, and converted into XML documents, the set of an queries / model answers were prepared, the reference experiment was conducted, and the validity of this proposal was verified.

In the latter part of the thises, introduction of visual input and output is examined about the user interface of an information retrieval system.
The exchange with a user and a retrieval system is currently performed in the combination of keywords before. However, in the Boole combination of keywords, it is hard to say that it is means which can sufficiently express retrieval intention of a user.
Then, in this research, the tequnique of using a 2-dimensional visual interface for input and output of retrieval system is proposed. By this method, the document information is visualized on a 2-dimensional space using the result of SVD of document-term matrix. At the time of the situation that a reference result is narrowed down and it dies while searching interactively especially, the one intuitive and shorter is desirable. Then, in this research, the method of using 2-dimensional visual interface for input and output of retrieval is proposed. By the method, the 2-dimensional space is specified by the user in terms of yardstick objects which are documents familiar to the user. In this way, the user can visualize documents from his/her own point of view. Also, the user easily specify retrieval conditions by indicating a position on the plane. Such retrieval conditions will be very complex or almost impossible to express in boolean combination of keywords. The algorithms to achieve the user interface are presented and a prototype system is built to perform experiments using a small set of documents.


9861020 増田 泰

「時空間構造に基づいた誘発脳磁場データからの神経活動パターン推定手法の開発」

本論文では,多チャネルMEG(Magnetoencepharography,脳磁計測)によって 計測されたデータから,特定の神経活動の寄与を推定する手法を提案する.

知覚可能な刺激には,脳内で特定の位置と時刻における神経活動を引き起こす 単一または複数の要因が含まれる.そのような刺激によって誘発された脳磁場 には,それぞれの神経活動についての空間的な情報と,時間的な情報が埋もれ ている.
刺激に含まれる要因と誘発脳磁場データに現れる寄与の関係を調べることは, 脳の情報処理メカニズムを知る上で重要であるが,個々の神経活動の位置や 時刻を推定する信号源推定のような手法はこうした寄与推定の用途には不十分 であった.

そこで本研究では,多チャネルMEG計測による誘発脳磁場データの持つ,神経 活動に関する空間的な情報と時間的な情報に同時に注目して,特定の神経活動 が及ぼす寄与の時間分布を推定する手法の開発を行った.

本論文では,まず単耳で知覚可能な刺激要素と,単耳では知覚不能だが両耳 では知覚可能な刺激要素を持った両耳聴覚刺激をそれぞれ擬似白色雑音を用いて 作成し,この刺激によって誘発された脳磁場を比較する.

次に,刺激に含まれる知覚要素が異なるときの誘発脳磁場データの時間的, 空間的な広がりを主成分分析を用いて評価し,誘発脳磁場データ の広がりが刺激に含まれる知覚要素数によって影響されることを示す.

最後に,上記の結果を踏まえ,特定の神経活動を含む誘発脳磁場データの 時間的,空間的な構造を用いて,解析対象となる誘発脳磁場データ中に 特定の神経活動がどのように寄与しているかを推定する手法として Virtual Beamformer を提案する.

Virtual Beamformer はターゲットデータを固有値分解して得られる雑音成分 からなる部分空間を構成し,解析対象データとの直交性を二次形式のインバー ジョンフィルタによって評価する.Virtual Beamformer を両耳聴覚誘発 脳磁場データの比較に適用し,その有効性を確認した.


9861029 Panikos Heracleous

「Simultaneous Recognition of Distant-talking Speech of Multiple Sound Sources」

This thesis deals with the recognition of distant-talking speech and, particularly with the simultaneous recognition of multiple talkers. The recognition of distant-talking speech plays an important role in any practical speech recognition system. Factors that should be considered include, noisy and reverberant environments, the presence of multiple talkers, moving talkers, etc. Most of the hands-free speech recognition systems are microphone array-based, since the microphone can take advantage of the spatial and acoustical information of a sound source. More specifically, a microphone array can form multiple beams and therefore can be electronically steered simultaneously to multiple directions at the same time. In contrast, the use of a single microphone provides limited directional sensitivity and cannot be applied for the localization of multiple sound sources without physical steering. A serious problem that must me solved in the recognition of distant-talking speech is the talker localization. Some approaches localize the talker using the power information. However, in highly reverberant environments and, under low SNR conditions the talker localization appear to be difficult. The 3-D Viterbi search method integrates talker localization and speech recognition. Although this method performs efficiently, even in the case of a moving talker, its applications are restricted to the presence of one talker. In order to deal with multiple sound sources we are proposing the 3-D N-best search method able to recognize simultaneously multiple sound sources. Our proposed method is one-pass search algorithm, which performs search in all directions and keeps N-best hypotheses for each word and direction hypothesis. Although our method integrates two existing technologies - 3-D Viterbi search and N-best search - into one complete system, the results obtained in the first evaluation were very poor. Implementing two additional techniques - a clustering and a likelihood normalization technique - into the baseline system drastically increased the performance of our system. The performance of our system was evaluated through experiments fo Implementing two additional techniques - a clustering and a likelihood normalization technique - into the baseline system drastically increased the performance of our system. The performance of our system was evaluated through experiments for the recognition of the distant-talking speech of two talkers and using several microphone array geometries. The obtained results are very promising and, especially in the case of 32 channels microphone array the achieved Simultaneous Word Accuracy in Top 1 hypothesis was 72.49% and in Top 3 hypothesis was 86.25%.


9961002 池田瑞穂

「形式的手法を用いたインタラクティブシステム設計法」

 アプリケーション開発工程において,ユーザインタフェース(UI)部分の開 発の占める割合が大きくなっている.その信頼性の向上はもとより,コスト削 減,開発時間の短縮が要求されている.UI設計は,従来のソフトウェア設計と 異なり,設計対象の振る舞いや入出力関係に関する設計(機能設計)に加えて, 画面上のレイアウトなどプレゼンテーションレベルでの詳細設計(プレゼンテー ション設計)が必要である.しかし,視覚面に重点を置いた設計となりがちで あり,機能設計とプレゼンテーション設計間の整合性が取れないことが多い.
 本研究では,設計の初期段階から適用できる,機能設計とプレゼンテーショ ン設計の一貫性を考慮した,インタラクティブシステム設計法を提案する.ま ず,タスク図という図的言語を用いてタスクモデルを記述する手法を提案する. そして,タスク図の意味を,プロセス代数に基づく記述法であるLOTOSを用い て形式的に定義する.次に,LOTOS仕様に対するモデル検査法を用いて,タス ク図で記述されたタスクモデルを形式的に検証する方法を述べる.また,タス クモデルからHTML,CGIを実装アーキテクチャとしたプロトタイプを自動生成 する方法を説明する.本論文では,書籍の販売システムを例題として本設計法 の説明を行う.この例題に対して形式的検証,プロトタイプ自動生成を行った 結果について述べ,その有効性について議論する.
 次に,代数的仕様記述の部分クラスである抽象的順序機械型仕様(ASM仕様) を用いてユーザインタフェースの仕様を形式的に記述し,その記述に従ってプ ロトタイプ自動生成を行う手法を提案する.タスクモデルからプロトタイプを 作成する際,代数的仕様記述を行うことにより,より厳密にUI設計情報を取り 扱うことができる.まず,個々のUIモジュールがメッセージ送受信によって非 同期に動作するような,簡潔な多プロセスモデルである抽象的ウィンドウシス テム(AWS)モデルを導入する.そして,AWSに基づいてUIのASM仕様を記述す る方法について述べる.また,Javaを実装アーキテクチャと仮定し,UIのASM 仕様からプロトタイプを自動生成するための枠組を提案する.この枠組に従っ てASM仕様をJavaプログラムに変換するコンパイラを作成した.本論文では, コンパイラを用いて仕様記述例をコンパイルした結果についても述べる.


9961003 石橋伸之

「「はがきサイズ」簡素化情報端末と顔色計測による独居老人の健康・安全管理」
(A Recommendation of Simplified “Postcard Size” Information Device for “Checking Daily Health and Safety” on the Internet by Measuring the Face Color of Single Living Elderly)

 1995年頃から、急速な電子化・デジタル化が普及した。その反面では、IT化の流れに乗っていない人々は、将来の電子化政府・行政政策の方向も知らずに、取り残される懸念がある。
 いわゆる、デジタルデバイドと言われる社会問題が予測されている。国内だけではなく、発展途上国を含めた課題でもあると考えている。アナログ時代に現役を退いたことから、今日の技術革新に無縁であったことが気懸かりで、いずれは自分も仲間入りする高齢者に何か役立ちたいと思い立った。お蔭様で入学の機会が与えられ、自己をモデルに勉強をし始めた次第である。
 機能を簡素にしたり、操作を容易化することは、機能の増加・拡張とは異なる困難さがある。
あらゆることが分かって初めて、茶道や学芸一般の様に、無駄を省き簡素化が可能に出来る。しかし、時間がないので、日常生活で最低限の連絡などが出来ることを、研究したので報告させていただく。
 古来、手紙は長文な巻物であったり、最近までは、便箋一枚では失礼だと言はれ、わざわざ白紙の一枚を附けたりして来たが、国際化してからは、ビジネス文書は1枚に纏めることが主流になった。
 電子メールが普及、通信回線が自由化し、通信価格も逓減して来たことにより、常時接続が当たり前になりつつある。そのために、つい交信内容が冗長になってしまう。
 そこで、「はがき」の便利さと、「国際的な標準サイズ」に着目し、「最簡素な電子情報端末」を提案する次第である。その利用例として、「独居老人の健康と安全管理」に応用を提案するものである。
 「はがきサイズ」簡素化情報端末をZALANDと名付け、「電子鏡」と「双方向通信」機能を応用し、継続した「顔色計測」による独居老人の健康と安全確認の手段を「LIFEMIRROR」と呼称した。
一般のパソコン操作を必要としない「高齢者にやさしい」仕組みを提案、基本的な実験をしてみた。まだまだ、緒に就いたばかりであり、課題は山積しているが、概念と初歩的段階を報告させて頂く。

(英文)
 Almost all businessperson since 1995 has had to learn and use PCs and IT technology to be effective on the job. Since then market share of PCs has jumped up over 50% in Japan.
 Electronics information technology development has made steady progress for high processing speed, large memory capacities, advanced software and etc. The word IT (Information Technology) has been a most popular keyword recently all over the world. Everyone should have easy access to the Internet and electric information databases. However many elderly people are not able to follow the recent digital technology. Therefore, the author hopes to develop useful technology to be good for elderly people and to resolve digital divide problems. Number of households including elderly people older than 65 years old has increased more than 34.5% of all households in Japan at the end of June 2000. Moreover, numbers of the household including children of less than 18 years old has decreased less than 28.7%, and the ratio of a household including children has drop down to half from the same value at 25 years ago. These facts show that Japan has already been aging society with full of nuclear families.
 Recently number of cellular phones in Japan has increased to more than 60,000,000 over the number of the fixed type telephones at the end of March 1996. One out of every two people owns a cellular phone now in Japan. Many types of PDAs have been marketed from many companies in autumn 2000 to promote Japanese government IT policy to popularize information terminals among general public of Japan.
 The picture size of PDAs and cellular phones would not be enough. To hand over laptops (PCs) is uncomfortable because of the size and weight. These sizes of the display limit the character size and are almost unreadable, just as in cellular phones.
 How the size of simplified information terminal should be?
 The author would like to recommend “Postcard Size” information terminal. Contents of the “Postcard Letter” have been analyzed to determine the engineering requirements for a “Postcard Size” information terminal to usual households. The research clears that the pictures shown on the terminal shall be bigger than ordinal PDAs (Personal Digital Assistant) and number of characters shall be smaller than 25x30 characters.
 This report shows an example prototype of “Postcard Size” information terminal device, named “ZALAND”. The prototype appears to be good for elderly people and may resolve digital divide problems.
 Number of elderly and single living persons are increasing recently depending on the extension span of our human life. The author would like to recommend a system and simplified electronic information terminal device for “Checking Daily Health and Safety” on the Internet by measuring the face color using “LIFEMIRROR”.


9961016 竹内 和広

「A Study of Text Summarization based on Text Structure Analysis
(テキスト解析に基づく自動要約の基礎研究)」

自動要約に関する研究は1950年代からなされ、長い歴史を持っているが、依然と して、人間が作成する要約と機械が作成する要約の間には品質の面において大き く異なることが多い。それは、自動要約システムの多くが、要約を重要な文を情 報として抽出する操作の側面ばかりをとらえ、人間が要約を作成する際に行って いる操作をテキスト処理の要素技術としてうまく整理されてこなかったことに原 因があると我々は考える。
そこで、本論文では、人間の作成した要約を分析し、人間が要約する際に行って いる言語的処理を計算機で実現するためには何が必要であるかを調査・研究した。 本論文の構成は大きくわけて3つの話題からなる。 第一に、人間が行っている要約を要約の元となった文章のテキスト構造との比較 をもとに分析する予備実験を行った。テキスト構造とは文のつながりを観点にテ キストを分析するための道具立てである。具体的には、新聞の報道記事のテキス ト構造を人手で分析し、人間の分析が一致する部分とゆれがある部分を考察した。 次に、人間の分析に一致が見られる文間のつながりの良さに対してどのような言 語的手がかりが貢献するかを機械学習の手法を用いて検討した。さらに、テキス ト構造解析を行った記事に対しての要約を作成し、人間の分析に一致が見られる 文のつながりの良さは、文の抽出よりもむしろ、要約文を生成するための操作の ひとつ、文の結合操作と相関していることを指摘した。
第二に、予備実験で得られた知見にもとづき、人間が要約を作成する操作を詳細 に分析した。分析対象は新聞の社説にひろげ、3人の要約作成者が作成した要約 を対象としたテキスト分析を行った。分析には、要約文で使われている表現が要 約元文章のどの部分から生成されたかを自動的に対応付ける手法を提案した。そ の結果、要約の大部分の表現は元文章中で統語的関係を持つ表現に基づいて生成 されていることが分かった。要約と元文章で表現が異なる場合の言い換え操作に ついても、それらがどのような特質を持つかを分類することができた。さらに、 予備実験で仮定した文結合操作が、社説の要約に対しても重要な働きを示すこと を確認した。
第三として、要約作成の操作として頻繁に行われる、文を簡略にする操作を計算 機上に実装する実験を行った。実装は、人間が作成した要約とその元文の対応付 けを行い、その結果に基づいて生成されたものを教示データとして機械学習を行 う手法を用いた。その結果、言語情報を複合的に用いることにより、人間が行う 要約操作に関する知識を表現可能なことを示した。 結論として、本論文では、人間が作成した要約文生成に関わる操作を、テキスト 分析で用いられる概念に基づき、その操作を分類し、特徴を分析した。さらに、 そのような要約操作の一つを計算機上で実装し、その有効性を確認した。


9961028 山田 寛康

「Partial Language Analysis for Document Processing
(文書処理のための部分言語解析)」

インターネットの爆発的な普及により, 電子化された文書が日に日にその量を 増している. これらの大量の文書に対し, キーワードマッチを基本とした情報 検索が多く行われている. しかし, ユーザのニーズにあった情報を提供するた めには, 自然言語の解析技術を用いて文書処理を行う必要がある.

一般に自然言語は多くの曖昧性を含んでおり, それらすべてを解消することは 非常に困難である. 情報検索をはじめとする文書処理の応用分野では, 大量の 文書に対して, 現実的な時間で処理を行う必要がある. よって名詞句や動詞句 など, 文の部分的な構文情報を, 高精度で抽出する部分解析が必要とされてい る. そこで, 本研究では「固有表現抽出」と「部分構文解析」と呼ばれる2つ の部分解析に焦点をあてる.

固有表現抽出は, 固有名詞, 数量表現などに注目した名詞句同定のひとつで, 人名, 地名, 組織名, 日付表現などを自動的に抽出し分類する技術である. 固 有表現抽出は情報検索や, 質問応答システムの前処理として使用される. と くに質問応答システムでは, ユーザの「いつ」,「だれ」,「どこ」などの質問 に的確に答えるため, 必須の技術とされている.

部分構文解析は, 文の名詞句, 動詞句などの統語構造を解析する自然言語処理 の基礎技術の一つであり, また情報検索や情報抽出だけでなく, 機械翻訳など 幅広い応用に使用される.

これら2つの技術は, 近年機械学習を用いた研究が多く行われている. これは, 様々な種類の文書に柔軟に対応するために, 人手によって作成された解析結果 から, 機械学習を用いて解析規則を自動学習する方法である.

部分解析を含め自然言語処理の解析規則の学習には, 出現した単語や品詞など を素性として使用する必要がある. そのため, 素性空間は非常に高次元となり, 過学習に陥る危険性がある. SVM は高次元空間においても過学習を軽減する理 論的な裏付けがあり, 近年, 多くの自然言語処理において高い解析精度が報告 されている.

本研究では, 機械学習アルゴリズム Support Vector Machine を使用し, 部分 解析に必要な規則を自動学習する手法を提案する. 提案手法を大規模のテキス トコーパスに対して適用し, その有効性を検証する.


情報科学研究科 専攻長