本論文では、 大規模言語コーパスに関して、 言語情報、特に形態素情報のアノテート技術と そのアノテートされたコーパスを解析や検索に利用する技術を提案し 有効性を示す。
言語情報がアノテートされた大規模なコーパス、
いわゆるタグ付きコーパスは、近年の自然言語処理において、
不可欠なものとなっている。
例えば、
大量のタグ付きコーパスから統計的な手法によりパラメータを学習し、
それを用いた形態素解析器やパーザが開発されており、
それらは意味などの深い言語処理の研究に役立っているだけでなく、
表層的な言語情報を用いて最大限の効果を得ることを目的に
情報検索などで利用されている。
タグ付きコーパスを大量に作成していくということは、
自然言語処理の基礎データの蓄積を意味し、
自然言語処理研究に欠かせない重要な課題である。
本研究では、
まず、
アノテート対象の言語に着目し、
特定の言語や同系統の数言語の解析のみを念頭に置いて
開発されている現状の言語技術を打破すべく、
言語非依存の形態素解析の枠組を提案し有効性を示す。
そして、次にタグ付きコーパスを作成する人間に着目し、タグ付きコーパスを効
率的に蓄積する支援環境 (グラフィカル・ユーザ・インターフェース) を提案し
有効性を示す。
タグ付きコーパス作成作業の効率化への寄与という視点に基づき、
これまでの
コーパスから統計的な手法で学習されたパラメータを用いる解析手法ではなく、
人手作成ルールとの融合や事例ベースによる解析手法といった
利用法を提案し有効性を示す。
さらに、
解析処理以外のでのコーパスの利用法として、
人間によるタグ付きコーパス蓄積作業の際の「参照」に着目し、
そのための、
大規模なタグ付きコーパスからの類似文字列検索を高速、高精度で行なう
手法を提案し有効性を示す。
このように、タグ付きコーパスに関して、 蓄積・利用に関する技術を一連の流れとしてとらえることは、 自然言語処理技術の基盤を整備することであり、 その重要性ははかり知れない。
約20年前からコンピュータでの漢字利用が普及し,標準プログラム言語で日本語データ処理が可能となった.日本語処理は,国際化(internationalization)と一般化されて国際規格化され,いくつかの言語では識別名にも漢字などマルチオクテット文字が使用可能となっている.予約語まで日本語にした本格的な日本語プログラム言語も,分かち書きのレベルで実用化されているが,非分かち書きレベルはまだ研究段階であり,複数のグループで研究が進行している.
本論文では,プログラム言語の国際化について,まず過去40年間の研究と商用化状況に関する文献を網羅的に紹介し,本研究がどこに位置付けられるかを述べる.つづいて,筆者が携わった次の三つについて,その研究内容と成果を論じる.
(1) COBOL日本語機能の言語仕様を開発し,これをマルチオクテット文字機能さらには国際化機能として一般化した.その成果を国際規格として提案し,採用されることが決定している.標準化にあたっての課題は,日本という地域性を排除して,国際的に通用する技術とすること,および日本語機能を用いた既存資産の移行性を確保することの二つだった.次の方針を策定実行して,将来にわたって使用可能な汎用的な国際化機能の言語仕様を制定することに成功した.
(a) 対象とする文字をアルファベット26文字以外の世界各国の文字に拡張するとともに,多くの符号系に対応可能な普遍的な枠組を設定する.
(b) 既存の文字型に加えて,漢字などの文字型を新設する.それらの型を処理する文は同等とし,同じ業務プログラムを各国ごとに適用するときには,データ定義だけを修正しロジックの変更は不要になるような仕様とする.
(c) 国内で普及している日本語処理機能を,国際化機能の核として採用する.
(2) 10年ほど前に,第4世代言語(4GL)はメインフレームの業務アプリケーションを効率よくを構築する手段として注目を浴びていた.我々が開発したEAGLE/4GLは,その構文に日本語(分かち書き)を採用したことにより,プログラム作成が楽になるとともに保守性を大幅に向上させることができ,万を超えるユーザに利用された.また,メインフレームのオンライン環境と対話環境の両方で動作可能なアプリケーションを作るため,環境独立なオンライン業務プログラム処理方式を採用した.現在,4GLはアプリケーション開発の主流ではないが,そのテクノロジは現代のオープン環境にも有効に適用できる.
(3) 分かち書きをしないより日本語に近い日本語プログラム言語“まほろば”の言語仕様を設計した.この言語の設計方針は次の四つとし,記述実験を行い,いずれの項目もほぼ達成していることを実証するとともに,今後の課題を指摘できた.
(a) 日本語として違和感のない仕様とする.
(b) 標準プログラム言語で記述できる“データ構造とアルゴリズム”を記述可能とする.
(c) 言語普及を目指すために,市場が大きい事務処理分野で適用可能とする.
(d) プログラム品質に悪影響のあろGOTO文とポインタ変数は支援しない.
これらの研究は,プログラム言語の国際化の三つの発展段階に対応し,それぞれの段階で代表的なものの一つとみなすことができ,今後のこの分野の研究に寄与するものである.
キーワード プログラム言語,日本語機能,マルチオクテット文字機能,国際化,COBOL,第4世代言語,日本語プログラム言語,環境独立処理方式,オンライン業務プログラム
XML(Extensible Markup Language)は,ネットワーク上のマルチメディアデー
タや文書の交換手段として利用されるだけではなく,ワープロ文書,電子新聞記
事や電子政府の各種文書などその利用範囲は急速に拡大している.XML の利用
範囲の拡大は,XML文書を対象とした情報検索の研究にも波及してきており,文
書内容による従来の情報検索の枠を超え,多様な文書構造をも考慮したXML 文
書の検索技術への要求へと拡大してきている.XML文書は,文書の論理構造を宣言的に定義するDTD は必須で
はない.
あらかじめその論理構造を
設計せずに,必要に応じて構造を柔軟に変化させるXML文書が多数出現してき
た.DTD を持たない整形式のXML 文書に加え,特定分野のプロトコルと
してXML の応用マーク付け言語(XHTML,SMIL,VoiceXML,SOAP,SVG な
ど)がW3C(World wide Web Consortium)等から多数提案されている.これら
の応用マーク付け言語は,XML 文書全体の構造を定義するのではなく,特定の
用途に限ったタグについて標準化したもので,XML 文書中で必要に応じてとり
いれ,応用プログラムが理解し,処理ができるように設計されている.これらの
XML文書の出現により,XML文書コレクションに対する新たな管理
技術への要求が拡大してきている.
本研究では,利用者の問合せに関連する部分文書を検索するXML部分文書検索に焦点を当てる.新たなXML 文書コレクションに対
する検索要求を分析し,(1 )検索対象の文書構造が固定されているXML 文書コ
レクション,(2 )応用マーク付け言語などによるモジュールをXML 名前空間を
使って文書中の一部にとりいれ,他のXML 文書と共通のタグを持つXML 文書
コレクション,(3 )検索対象の文書構造が全く固定されていないXML 文書コレ
クションに分けて,各々の場合について各XML文書中に記述されている文書構
造を検索結果に反映させる新たな部分文書検索手法を提案する.
本研究で求める部分文書は,元文書の論理木構造を保持した形の文書とする.
元文書の根ノードと部分文書の根ノード間の経路中のノード名の並び(経路式)は,元文書における
部分文書の構造上の文脈を表している.部分文書検索において,部分文書の文書
内容と同様にこの部分文書までの経路式が表す文脈情報を得ることが重要と考え
る.本研究では,提案する部分文書検索を「文脈検索」と呼ぶ.本研究では,(1 )
〜(3 )のXML 文書コレクションに対しての文脈検索の手法を提案し,その有用
性を確認した.
項書換え系は, 木構造 (項) を扱う代表的な計算モデルである. 近年, 項書換え系の部分クラスである, 構成的正則保存項書換え系が注目されている. 木言語 (項の集合) L が正則であるとは, L を受理する木オートマトン が存在することである. 項書換え系 R が構成的正則保存であるとは, 任意の正則木言語 L に対して, R による書換えより L から得られる項全体の集合 を受理する木オートマトンを構成できることをいう. 構成的正則保存項書換え系に対しては, 項書換え系に関するいくつかの重要な性質, 例えば, 局所合流性や到達可能性などが決定可能になることが知られている. 与えられた項書換え系が構成的正則保存であるかどうかは決定不能であるため, 多くの決定可能な部分クラスが提案されてきた. しかし, それらのクラスはいくつかの簡単な構成的正則保存項書換え系 を含んでおらず, 十分広い部分クラスとはいえない.
本論文では, 決定可能な項書換え系の部分クラス, 有界重なり項書換え系を 提案し, 任意の右線形有界重なり項書換え系が構成的正則保存であることを示す. また, 右線形有界重なり項書換え系は, 今までに知られている, 他の決定可能な構成的正則保存の部分クラスを真に含むことも示す.
強正規化性 (停止性) は, 項書換え系の重要な性質の一つである. しかし, 強正規化性は決定不能であるため, 強正規化性が決定可能になるような 部分クラスがいくつか提案されてきた. 長谷と外山は, 成長的項書換え系を提案し, 木オートマトンを用いて, 準直交成長的項書換え系に対しては, 強正規化性が決定可能になることを示した.
本論文の後半では, 有界重なり項書換え系の左辺と右辺を入れ換えて得られる 逆有界重なり項書換え系について察する. 長谷と外山の方法を利用し, 与えられた準直交逆有界重なり項書換え系に対して, 強正規化性が決定可能になることを示す.
歴史的に見て、最良の技術が必ずしも市場に受け入れられていないことが多く散見される。コンピュータの世界もその例外でない。それどころか、他の業界の事例以上に、技術よりビジネスの視点が重視されている。ソフトウェア・アーキテクチャは、特に厳しい覇権争いが情報技術の進歩を先取りしながら続けられている。
本論文では、まず、ビジネスの視点では日の目を見ていないが、1980年代前半に活発に研究し、技術の視点では強い印象を研究者に与えた、論理型言語による事務処理問題のアプリケーション・モデリングを提案する。
次に、1980年代後半から始まったネットワーク・レイヤーからオペレーティング・システムそしてアプリケーション・システムの実行基盤であるミドルウェア・レイヤーに至るソフトウェア・アーキテクチャの覇権争いを概観しながら、筆者が参画したアプリケーション・システムの実行基盤のソフトウェア・アーキテクチャであるUA(Unisys Architecture)の歴史的位置付け、筆者達が開発したフレームワークであるオープン・ソリューション・フレームワークの開発背景と概要を概観する。クライアント/サーバ型のアプリケーション・システムの開発時に使用するクライアント/サーバ・ソリューション・モデルとソフトウェア・プロダクトを推奨するプロダクトセットの考え方及びプロダクトセットを提案する。この適用例の一つとして、新財務システムの情報基盤を決定するためのコンサルティング・ビジネスでのお客様での適用事例を解説する。
次に、オープン・ソリューション・フレームワークで導入したクライアント/サーバ・ソリューション・モデルを、ドック・イヤーと言われる情報技術の進展に対応させて、分散処理システムのアーキテクチャ・スタイルとして提案する。アーキテクチャ・スタイルは、分散処理システムをデータ領域の場所とクライアントとサーバ間の処理の形態をベースにして9種類に分類している。この9種類のアーキテクチャ・スタイルより、分散処理型のアプリケーション・システムを開発するときに適切なアーキテクチャ・スタイルを選択する簡単であるが実践的な方法を提案する。選択方法は、技術の視点からだけでなくビジネスの視点から、アーキテクチャ・スタイルを特性化し、「サイズ」と「距離」の尺度を導入し、アプリケーション・システムの要件を表現した特性図とアーキテクチャ・スタイルの特性図間の類似性を選択する方法を提案する。この選択手法の適用性を評価するために実稼働中のお客様のアプリケーション・システムに適用した。
複数の自律計算ユニット「プロセス」が通信リンクによって相互接続さ れたネットワークシステムを分散システムという. 分散システム上で同時並行的なサービスを提供するためにはプロセス同 士の協調動作が必要である.この協調動作に関する問題を分散問題とい い,分散問題を効率良く解く通信計算手順「分散プロトコル(分散アル ゴリズム)」が盛んに研究されている.
自己安定プロトコルとは,任意のシステム状況から実行を開始しても, 問題の解を求めて安定するプロトコルである. システムの初期化が不要であるだけでなく,メモリ内容が破壊されるな ど,システムが一時故障によりどのような大域状況に陥っても,その後 プロセスが正常に動作していれば再び解状況に復旧する.そのため,自 己安定プロトコルを用いることで,長期間稼働するシステムを安定に保 ち,一時故障に柔軟に対応することができる. 本研究では,このように優れた故障耐性を有する自己安定プロトコルに 着目し,効率のよい自己安定プロトコル,および,さらに高度な 故障耐性を有する分散プロトコルの設計を目指している.
本研究では,まずはじめに,木ネットワークにおいてプロセス間の同期 を実現する自己安定プロトコルを利用して,ヒープ順序づき木を構成す る自己安定プロトコルを提案する. ヒープは逐次アルゴリズムにおいて重要なデータ構造であり,分散型デー タ構造として実現することは,分散システムを設計・利用する上で有用 である. 様々なデータ構造について分散システム上に実現する分散プロトコル (アルゴリズム)が研究されているが,自己安定分散データ構造について は,まだあまり研究が行われていない.提案プロトコルは,既知の結果 と比べ安定時間,領域計算量ともに改善されている.
次に,一時故障だけでなく,永久故障に対する故障耐性も有する自己安 定プロトコルについて考察する. 自己安定プロトコルは一時故障に耐性を有する優れた設計パラダイムで あるが,実システムへの適用のためには,永久故障に対する耐性も必要 である. まず,永久故障の新たなクラスとして,非停止永久故障を定義する.非 停止永久故障は,故障プロセスが無限にしばしば故障動作により状態変 化する故障であり,停止を許さない故障モデルである. そして,ネットワークの生成木を構成する問題に対し,非停止永久故障 プロセスが存在しても問題を解く自己安定プロトコルを提案する.
現実世界に仮想世界の情報をシームレスに重畳表示する技術は拡張現実感と呼ばれ,
現実環境に情報を付加することが可能であることから
新たな情報提示手法の1つとして注目され
ている.拡張現実環境をユーザに提示するには,現実環境と仮想環境の3次元
的な位置合わせ問題である幾何学的整合性問題を実時間で解決する必要がある.
本研究では,
ビデオシースルー方式のヘッドマウントディスプレイに
取り付けられたステレオカメラを利用し,
拡張現実感における幾何学的整合性問題の解決を目的とする.
まず1章では,拡張現実感における技術課題と従来研究を概観し,
本研究の目的と意義を明確にする.
2章では,現実環境に配置したマーカをステレオカメラにより撮影した
映像からユーザの視点位置を推定することで
現実環境と仮想環境の位置合わせを行う手法について述べる.
また,提案手法を利用して構築した
拡張現実感システムを用いた実験により提案手法の有効性を確認する.
3章では,特徴点追跡のロバスト性を向上させるために,
3軸角度センサの併用による視点の移動予測に基づく位置合わせ手法を提案する.
4章では,マーカに加え自然特徴点を切替え追跡することによる
位置合わせ範囲の拡大手法を提案する.
5章では,撮影されたステレオ画像からの現実環境の奥行き推定による
現実物体と仮想物体の正確な奥行き隠蔽関係の表現手法について述べる.
最後に,6章で本研究を総括する.
本論文は,オンラインコミュニティにおける擬人化メディアの利用に関する研究をまとめたものである.擬人化メディアとは,インタフェースエージェントやアバターのように擬人的な外観を持ち,身体的な振る舞いが可能なプログラムモジュール(擬人化インタフェース)を利用したコミュニケーションのメディアである.擬人化メディアは人間と単に計算機を結びつけるインタフェースとして役割を果たすだけでなく,複数の人間を結びつける役割を持っている.このため,擬人化メディアは認知的側面だけでなく社会的側面をもつものとして考察していく必要がある.
本論文では,オンラインコミュニティと擬人化メディアについて,心理学的側面とシステム的側面から研究を行い,その役割と可能性について論じる.最初に本論文では,擬人化メディアによる認知的・社会的影響を2つの心理実験的手法を用いて検証する.
まず擬人化メディアによるユーザの認知的・社会的側面への影響について知見を得るため,擬人化メディアを実装した展示ガイドシステムに対するユーザの行動分析を行った.個人向けのガイドエージェントとして擬人化メディアの振る舞いを設計し,ユーザの社会的行動の誘導を試みた.その結果,擬人化メディアに対するユーザの社会的な振る舞いを示す傾向を観察することができた.このことは,ユーザは擬人化メディアを無意識的に社会的な存在と見なして対応しているということを示唆している.
このような特性をもつ擬人化メディアをオンラインコミュニティシステムに導入することを考える.アバターのように擬人化メディアをオンラインコミュニティにおける会話インタフェースとして用いる時,擬人化メディアがユーザの認知的側面や社会的側面にどのような影響を与えるかを検証する.テキストインタフェースとの比較による心理実験の結果,擬人化メディアによる会話を見たユーザは,各々の発言を発言者と連結させて記憶した割合が多いことがわかった.このことは,擬人化メディアを用いることで,オンラインコミュニティの参加者が互いに個人の識別することが容易になるということを示している.さらに発言を重ねることで,各々の参加者の性格や意見,そして周りの参加者との人間関係も理解しやすくなる.その結果,各々の参加者の新たな発言に対しても個性や立場を前提として理解しやすくなり,コミュニティ内の発言全体に対する文脈アウェアネスが高まることとなる.
次に擬人化メディアを非同期型のコミュニティシステムに導入したシステムの実装を行った.非同期コミュニティシステムでは,参加者は発言に際して考えをまとめたり,資料を調べたり,文章を推敲したりするための時間的な余裕がある.そのため非同期コミュニティシステムに擬人化メディアを導入した場合,参加者はその時間を使い,擬人化メディアの身体的なマルチモーダル表現や,マルチメディアによって作成されたWebページの資料としての引用,他の擬人化メディアとの距離の調節など,多様で社会的な表現を組み合わせた発言を作成することができる.実装したシステムの試験運用を行って実際にシステムを利用してもらった結果,全員のユーザからシステムに対する肯定的な回答を得られた.
最後にコミュニティの持つ自発的な情報編集機能を促進するためのシステムモデルとして知識コミュニティシステムを提案する.コミュニティの形成する場とその上でのコミュニケーションをシステムが積極的に支援することで,コミュニティの情報の蓄積と編集を可能にする.情報の蓄積と再利用のために社会的文脈によって構造化した会話の言語が必要となる.そこでこのような社会的文脈を記述可能とするスクリプト言語を提案する.この言語における社会的文脈のためのタグ構造は,本論文でのこれまでの知見を元に,言語,身体,移動,メディア,存在感の5つに分類して定義する.また発言者の意図をスクリプト内に反映させられるエディタを試作して,この言語による情報蓄積と再利用の可能性を示す.
本論文では,派遣労働においてソフトウェア技術者が効果的な学習を行える教育支
援体
制の整備と,プログラミング言語の理解を基にした教育支援のためのプログラミン
グ教育
の体系化を目的としている.
本論文では派遣労働の形態を分析し,ソフトウェア技術者が派遣先の開発環境を効
率的
に学習するための教育支援体制をソフトウェア工学教育の観点から提案する.
次に,学習過程の進行にともなう学習者の理解状態の変化に対応した学習形態を構
築す
るため,学習過程における理解状態を解析する.プログラム言語の関連知識をもと
にして
実際にプログラミング演習を行った後では,理解状態に変化が生じることは経験的
に知ら
れている.このこのような理解状態の変化に注目し,Java言語の学習に関する因子
の変化
とJava言語固有の概念との関連を解析した.
更にJava言語の効果的な学習と体系的な教育を実現させるための一つとして,Java
言
語の知識間の順序関係(ある知識の理解に他の知識の理解を必要とする関係)を導
出する
ための解析手法を提案する.知識間の順序関係の導出においては,P.W.Airasianら
の
Ordering
Theory(順序理論)のモデルを適用し,テストで生じるいわゆる「まぐれ当たり」
と「うっかりミス」の回答を,二項分布の分布関数を用いて統計的に補正する統計
的分析
手法を提案する.順序関係の全体の構造を表した関連構造から理解順序を把握する
ため,
因子分析を適用して関連構造を簡単化する手法も提案する.Java言語の講義・演習
とテス
トによる実験を行い,提案した統計的分析手法を用いてJava言語の理解順序を導出
した.
実験で用いた25個の知識項目から104個の順序関係を導出し,その知識項目が9つの
クラ
スタに集約された関連構造を構築してJava言語の理解順序を解明した.関連構造か
ら3つ
の学習プロセスを設定し,効果的なJava言語の学習プロセスを導出した.
本研究は,触覚を必要とする代表的な動作であり,かつ日常生活の基本的な動 作でもある物体の把持運動に焦点を当てる.そして,人が ``把持'' を遂行す る上で,どのような触覚入力が本質的に重要であるのかをモデル化する.具体 的には,弾性力学より導出された接触モデルを議論し,独自に開発した触覚計 測装置を用いた心理物理実験を行う.
はじめに,弾性体接触理論に基づく議論を行い,指先の接触をモデル化する. 接線方向力を加えられた弾性球の接触面には,局所的な滑り (初期滑り) が周 辺から生じる.そして,これが把持力制御と密接な関係を持つことが示唆され ている.本研究では,接触領域に対する固着領域 (滑りが生じていない領域) の割合を固着率と定義する.これは,弾性球の一般的な接触状態を表すスカラ パラメータである.つまり,等しい固着率を持つ弾性体は,接触力と摩擦係数 に関らず,等しい滑り余裕を持つという特徴がある.
次に,人の固着率知覚可能性を検証するため,その変化に伴う弾性体内歪みエ ネルギ密度とその速度場変化のシミュレーションを行う.これは,人の触覚受 容器の応答と皮膚内歪みエネルギ密度との間に高い相関が示唆されているから である.その結果,歪みエネルギ密度の空間微分が滑り領域を,歪みエネルギ 密度速度の空間微分が滑り領域の伝搬を特徴的に表すことが確認された.
そして,指先固着率に基づく把持力制御仮説を提案する.人の把持力は,把持 物体に関わらず同程度の安全率を持つことが示唆されているが,本研究では把 持力制御を行うための触覚入力として指先固着率に着目する.固着率が一般化 された滑り余裕を表すため,それが同程度の値に収束するように把持力を制御 すれば,いかなる物体に対しても適切な把持力が実現できるからである.この 仮説は,人の把持に関する従来の知見と矛盾しないだけでなく,ロバストな人 の把持運動を合理的に説明する.
最後に,この仮説を検証するため,把持運動中の指先固着率計測実験を行う. 実験では,被験者に質量と摩擦係数がランダムに変化する計測装置の持ち上げ 運動を繰り返し行うように指示する.つまり,装置条件に不慣れな状態から習 熟するまでの固着率と把持/負荷力の推移が計測できる.その結果,どの条件 でも数回の試行で固着率が似たような値に落ち着くことが確認された.また, それに伴い把持力の安全率も同程度の値に落ち着く.
以上の結果は,固着率と等価な情報が触覚受容器で知覚可能であり,かつ実際 の把持においても固着率が似たような値に収束することを示唆している.つま り,提案する把持力制御仮説を強く支持する.また,これらは,ロボティクス や VR において,リアルな遠隔操作を実現するためにセンシング/呈示すべき 触覚情報を特定する上で有効な指針となる.
WWW(World Wide Web)サービスの普及と流通する文書の増加に伴い,膨大な 情報に誰もが自由にアクセスできる環境が実現された一方で,WWW上の情報検 索システムがきわめて重要な役割を担うようになった.現在数多くのWWW検索 サービスが提供されているが,未だ問題点も多く,専門的な知識や技術に乏し くても必要な情報を簡単に探し出せるような,使いやすい検索手法の必要性が 高まっている.
従来の検索支援に関する研究が主に検索の効率や精度(再現率・適合率)の改
善を目的としているのに対し,本研究では特に情報検索作業に対するユーザの
メンタルモデルに着目し,それに沿ったユーザにとって無理のない検索手法の
考案を目的としている.上記の目的に沿って,本研究では,既存の検索手法に
対する改良の一手法として,互いに独立した2種類のWWW検索支援手法
(可変なカテゴリ構造を用いる支援手法,対話的
に調整可能な文書ランキングを用いる支援手法)を提案した.
可変なカテゴリ構造を用いる検索支援手法では,検索のたびに,ユーザの検索
目的を反映した小規模なディレクトリを提供することで検索作業を支援する.
一方,対話的に調整可能な文書ランキングを用いる検索支援手法では,キーワー
ド検索手法の出力である文書のランキングをユーザが直観的な方法で調整でき
る手段を提供することで,検索作業中に生じる心理的な負担の軽減を図る.
本発表では上記2種類の検索支援手法に関する詳細および評価実験の結果を報 告し,さらに今後の展望として,2つの提案手法の統合や,従来の各検索支援 技術と提案手法との統合などの可能性についても簡単に紹介する.
「陰関数曲面とパーティクルシステムを用いた仮想粘土細工による自由形状モデリングに関する研究」
本論文では,粘土細工を行うような感覚で自由形状のモデリングが行える仮想粘土細
工システムについて述べる.まず1章では,本研究の背景と目的について述べる.
2章では,仮想現実感技術と陰関数曲面を用いることにより,手を用いて直接的に仮想
粘土へ凹凸を加えるという形状の変形を実現する手法について述べる.形状変形に際
しては,陰関数曲面表現の特徴を利用して,形状の衝突判定や変形処理に複雑な処理
を必要とせず,その定義から自然に変形を表現している.
次に,3章では,パーティクルシステムと陰関数曲面を用いた仮想粘土モデルに対し,
手を用いて変形を加える手法について述べる.現実の粘土の変形挙動を少ないパーテ
ィクルで表現するとともに,粘土の表面形状を陰関数曲面を用いて表現する.
4章では,上記の2つの手法を組み合わせることで,粘土へらと手を用いた,より表現
力の高い粘土細工を行える仮想粘土細工システムについて述べる.
対話的に変形操作を行うためには,一連の処理を高速に行う必要がある.そこで,上
記のそれぞれの手法に対して,陰関数曲面を効率良くポリゴン表現に変換する手法お
よび,対称型マルチプロセッサシステムを用いた並列処理について述べる.また,そ
れぞれの手法を実装した試作システムによる形状変形例を示し,対話的な仮想粘土細
工が行えることを実験的に示す.最後に5章で本研究を総括する.
本論文では,MS--Windowsなどの一般的なGUI上でのアイコン選択やスクロール などの操作の効率を上げることを目的として,従来から用いられているキーボー ドやマウスなどの入力デバイスに加え,計算機画面を見るユーザの視線の動き を用いた視線追加型インタフェースを提案する.視線の移動速度は極めて速い ため,マウスと比較して高速にポインティング操作を行うことができるなど視 線は計算機の入力手段として有望である.
本論文では
(1)ウィンドウ,アイコン,メニューの選択(ターゲット選択),
(2)特定の場所へのターゲットの移動(ドラッグ&ドロップ),
(3)ウィンドウのスクロール
の3種類の操作に対して,視線の動きを入力として追加する方式を提案する.
ターゲット選択では,ポインティング操作に視線を,確定操作には従来通りマ ウスボタンを用いる.さらに一般的なGUIで用いられる1cm四方程度の細かなター ゲットを選択できるよう,カーソル位置微調整方式としてAuto方式,Manual方 式,SemiAuto方式の3つを提案する.ドラッグ&ドロップでは,操作をドラッ グアイコンとドロップアイコンに対する2回の連続したターゲット選択である と見なし,ターゲット選択方式として最も性能の優れていたSemiAuto方式を適 用する.スクロールでは,ウィンドウ中央からユーザの画面上の注目箇所(注 視点)までの垂直方向の距離をスクロール速度に比例させる.ユーザはウィン ドウ内で視線を移動させるだけで,表示したいテキスト部分をウィンドウ中央 部に移動させ,表示させた状態でスクロールを停止させることができる.
一般的なGUIを模した環境上で,キーボードあるいはマウスのみを用いた操作と の比較実験を行なった結果,提案する視線追加型インタフェースにより操作時間 が短縮することがわかった.
This thesis focuses on extracting English-Japanese {\it translation knowledge} from linguistic corpora. The translation knowledge can take many forms: paragraphs, sentences, phrases, and words. Here, we are interested in translation knowledge expressed in phrase-equivalent units, i.e. units that are smaller than a sentence but are large enough to encompass contexual information required for translation.
We employ different strategies to obtain translation knowledge for content words (e.g. nouns, verbs, adjectives) and for functional words (e.g. prepositions, case markers, articles). Since there are many content words in a given language, it is sensible to extract translation correspondences of content words automatically. However, there is much less magnitude of order for functional words compared with content words. Furthermore, it is hard to make a generalization for functional words. For example, in a bilingual dictionary, precise translations are provided for content words, while circumstantial descriptions are given for functional words.
First, we address the problem of syntactic ambiguity while retaining robustness. We propose ways to extract phrase-level translation correspondences using statistically probable dependency structures. A statistical parser allows multiple dependency relations between phrases that are syntactically ambiguous. The extraction algorithm takes care of such ambiguities and finds the most likely phrase correspondences. The method also improves robustness from previous approaches in that a statistical parser has a broader coverage and does not fail easily unlike rule-based parsers.
Second, we compare three models based on translation units, namely plain n-gram, chunk-bound n-gram, and dependency-linked n-gram. We show that linguistic information obtainable from NLP tools is effective in the task. Detailed analysis reveals that chunk boundaries are useful for compound noun phrases and that idiomatic expressions are better handled with word dependencies.
Finally, we investigate translation knowledge that can aid human translators or language learners. We shed light on the use of functional words in complex noun phrases with which non-native speakers have difficulity. A case study on writing English titles for academic papers is presented.
システムの出力を恒等的に零に保つように入力および初期状態を選んだ場合の システムの挙動を零ダイナミクスという. 零ダイナミクスの平衡点が局所漸近安定のとき, システムは非線形最小位相系であるといい, それ以外の系を非線形非最小位相系という. 非最小位相系には, 相対次数が定義できない点が存在するシステムが含まれる. このような非最小位相系に対しては, 非線形制御の代表的手法である 入出力線形化法を適用することができない. これは, システムの内部状態を表す零ダイナミクスの非漸近安定性によって システムが不安定になるため, あるいは, 相対次数に関して特異性を持つシステムに対しては, 相対次数が定義できない点において入出力線形化法による制御入力が 無限大となるためである. 本論文では,このような非最小位相系に対する 出力レギュレーションを実現する方法を提案する. 出力レギュレーションとは, 外部システムと呼ばれる自律システムによって生成される信号に対して, 漸近的追従制御あるいは漸近的外乱除去を達成する制御である.
本論文では,まず,相対次数に関して特異性を持つシステムに対して, システムの出力が外部システムによって生成される参照信号に漸近するような 不変多様体を求めるために, システムを特異摂動系に変換し制御系を段階的に設計する方法を提案する. つぎに,最小位相系とは限らない非線形システムに対して, バックステッピングを拡張することによって, 零誤差多様体にシステムの状態を漸近させる制御法を示す. また,数値例を用いて本論文で提案する手法の有効性を示す.
近年コンピュータネットワーク環境の急速な発展に伴い, 適切なアクセス制御法の確立が, ますます必要となってきている. Java development kit 1.2は, プログラム実行時に制御スタックを 検査することでアクセス制御を行うプログラム環境である. Jensenらは, このようなスタック検査機能を持つプログラムP および時相論理式を用いて記述された検証条件ψを与えたときに, Pの到達可能な状態全てがψを満たすかどうかを決定する問題として 検証問題を定義し, 相互再帰を含まないプログラムのクラスに対して 検証問題が決定可能となることを示した.
本論文では, 時相論理式よりも真に表現能力の大きい正規言語を用いて検証問題 を定義する. そして, プログラムの実行系列の集合がインデックス言語となること を示し, その系としてプログラムが相互再帰を含む場合も含めて検証問題が 一般に決定可能となることを示す.
また検証問題の計算複雑さについて解析を行ない, 一般に検証問題が 計算量的に手におえない問題のクラスに属することを示す.
現実的な計算時間で検証問題を解くには, 問題のクラスを制限する必要がある. そこで, Java development kit 1.2のスタック検査機構をモデル化した プログラムからなる部分クラスを考え, そのクラスに対して検証問題を プログラムサイズの線形時間で解く効率のよい検証アルゴリズムを提案する. さらに, 同アルゴリズムを実装した検証システムについて実験を行ない, その結果を基に本検証法の実用性について議論する.
装置プロセス産業におけるプラント運転に関する技術や技能は、プラントが誕生し、成長していく過程で培われたものが多い。プラント運転による生産が効率的、安全に行われるためには、これらの技術や技能を次世代の人間に確実に伝達していく必要がある。本来、技術や技能の伝達は、その職場が中心になってOJTを基本に実行すべきことである。しかし、プラントの自動化が進み、定常運転が続けられ、若手オペレータが非定常操作や異常時の操作を実際に体験する機会が少なくなっている。このため、ベテランオペレータの持つ運転技術や技能が十分伝わらず、若手オペレータの運転技術や技能が低化する傾向にあると言われている。
本来、経験に基づいたプラント運転の技術や技能の内容を言葉だけで表現することは容易なことではない。また、本人が意識していない要領やこつも存在する。さらに言葉だけで表わされた内容を正確に理解し、正しく実行することにも限界がある。これらの弱点を補うために、模範操作や訓練の様子を収録したビデオ映像や音声を有効に利用することが考えられる。すなわち、現場で実物を前にして対象機器の取り扱い方や注意すべき点を教える際のやりとりを、ビデオ映像を媒体として行うことができれば、技術や技能を表現する能力が増えて、それらの伝達に役立つ。このためには、ビデオ映像に対する注釈やコメントを自由に入力できる機能と、これらのデータを整理したり分析することによって知識として取り出すための機能をもつ支援システムを構築する必要がある。このシステムは、ビデオ映像・静止画像・文書データ・音声データを扱うため、マルチメディア管理システムとしての機能が必要である。本研究では、マルチメディアを利用して、技術や技能を伝達可能なものとして取り出すためのインタラクティブ・コンピュータシステムを構築し、その有効性を調べる。
本研究は、著者らが開発した統計解析システムのためのプログラミング言語について述べたものである。統計解 析システムは、観測データを様々な視点で眺め、いろいろな種類の統計量を計算し、図表を描き、対象の本質を 捉えるための環境である。このような問題解決型の作業は、単純ではなく、様々な命令を統計解析システムに与 える必要がある。したがって、このようなシステムには、統計解析者の思考を支援するようなプログラミング環 境が要求される。
開発したプログラミング言語は、知的支援機構を持つ重回帰分析支援のための統計解析システム(RASS)とJava 言語ベースの汎用型統計解析システム(Jasp)のためのものである。これらの言語をどのように設計・実装した のか、これらを使用することでどのような効果があるのかを述べるとともに、これらを実際に実現するために必 要であった関連技術に関する研究成果についても紹介する。
RASSのプログラミング言語では、利用者が容易にアルゴリズムを記述できることだけでなく、支援機構の枠組み を壊さないように論理型プログラミングと手続き型プログラミングが混在させている。また、支援に必要なルー ルをオブジェクトに内包させたことでシステムとして柔軟性を高めることができた。
Jaspのプログラミング言語では、プログラム開発の要求や規模に応じて段階的にプログラミングができる形式を 採用している。さらに、Javaクラスを直接参照できる機能やスクリプトに基づく命令形態を導入したことで、従 来の汎用統計解析システムにはないいくつかのメリットを実現させることができたので、これらについて報告す る。
本研究では、従来困難であった高齢者の日常行動中における転倒事故の状況を無拘束 で解析可能なシステムを提案する。
本発表では、まず従来行われていた転倒解析の研究についてのべ、問題点について検 討する。さらに、加速度センサを用いた転倒検出の手法を検討し、転倒時に発生する 衝撃加速度と身体の傾斜角度から転倒を検出する手法を提案する。
開発したシステムは、高齢者に装着する転倒検出モニタ、通信インターフェース、PC より構成されている。モニタは転倒を検出すると転倒時刻と転倒前後の加速度波形を 記録する。モニタは転倒の危険性の低い睡眠中などはCPUの動作を停止させる省電力型 の設計としている。これにより最大7日間の計測が可能である。さらに計測終了後、通 信インターフェースにより保存したデータをPCに転送し、衝撃加速度、転倒方向、転 倒前の歩行状態の解析を行うことが可能である。
次に開発したシステムの評価について述べる。若年健常者を擬似転倒させた評価で は、すべての被験者で転倒を検出可能であった。高齢外来患者を対象に行った臨床評 価では、1ヶ月間の日常行動中において22回の転倒が発生し、このうち19回の転倒を記 録可能であった。本論ではこれらの結果について検討を行い、記録したデータを解析 することで転倒の発生原因の考察を行う。
以上述べた結果より、本研究において開発した手法を用いることで、従来不可能であ った日常行動中に発生する転倒の衝撃加速度、方向、時刻、転倒前の歩行状態の情報 が詳細に解析可能であることを述べる。
1990年代以降,大量のテキストデータが利用可能になったことや,コン
ピュータの性能が大幅に向上したことから,機械学習的アプローチ,すなわち
人手によりカテゴリラベルを付与したテキストデータから自動的に分類器を作
成する方法が,分類精度・省力性・保守性に優れているために主流となっている.
本発表では,機械学習を用いたテキスト分類に関する以下の3点について議論を行なう.
・大量の単語属性を用いて高精度の分類を行う方法
・分類ラベル有り訓練データが少ないときにラベルなしデータの分布を利用する方法
・下位カテゴリの存在を仮定し,能動的ラベル付けを用いて効率よく高精度の分類を実現する方法
1点目で,サポートベクタマシンを用いたテキスト分類について述べる.
サポートベクタマシンは比較的新しい学習手法で,過学習しにくいことで
知られている.機械学習を用いて高精度のテキスト分類を行うためには,
一般に沢山の単語属性が必要であるが,従来の学習手法では沢山の単語属性を
入力として使用すると訓練データに対して必要以上に適合して、未知のデータに
対する分類精度は落ちるという過学習が起きる問題があった。そこで様々な情報
量で属性選択を行い、学習に使用する属性の次元を数百程度まで減らして
学習を行っていた。しかし、数百程度の属性では、十分に高い分類精度を持つ
分類器を学習することは困難であった。そこで、過学習しにくいとされる
新しい機械学習手法であるサポートベクタマシンを用いてテキスト分類を
おこなった。さらに、サポートベクタマシンを用いる場合にも属性選択は
有効であるかどうかを評価した。
2点目では,トランスダクティブ・ブースティングを用いたテキスト分類につい
て述べる。訓練データが十分に得られる場合には、サポートベクタマシンや
ブースティングなどのマージン最大化分類は高い分類精度を持つ分類器を
生成するために有効な手法であるが、訓練データの作成は人手で行うため、
コストが高く、学習に十分な訓練データが得られないことも多い。そこで、
分類ラベルが付与されていない未知のデータの分布も考慮に入れて、
学習を行う、トランスダクションの手法をテキスト分類の学習に取り入れた。
サポートベクタマシンと同じマージン最大化分類器の一つであるブースティング、
特にアダブーストアルゴリズムにトランスダクションを組み入れる方法を
提案する。
3点目では,拡張結合混合分布モデルを用いたテキスト分類について述べる.
与えられたカテゴリの中に潜在的に下位カテゴリを仮定したときの分類について
述べる。さらに,訓練データが少ないときに,未知データに対して,分類に重要
だと思われる少数のデータを機械的に選択,提示し,少数のデータに人手でカテ
ゴリ付与を行うことで,効率よく高精度の分類器を得る「能動的ラベル付け」
手法について述べる.
最後に,まとめと今後の課題・方向性について述べる.
本研究は,メタデータを利用した電子化された膨大な量の情報資源の管理と, その管理技術を応用した情報流通制御を実現することを目的とする.
情報の電子化技術とネットワークの発展と普及により,膨大な情報資源が電子 化され,ネットワーク上で流通されるようになってきている. 本研究では,図書館など情報資源の作成に携わる側で用いられる情報管理技術, メタデータに注目し, その応用によって情報資源管理と流通管理に関する新 しい仕組みの提案と実装を行った.まず,動画データを中心とした教育環境を 次世代インターネット技術の上に構築し,実験と実証を行った.講義の画像を 電子化して蓄積し,提供するサーバを構築すると共に,他大学とのデータ交換, また日本と米国とで中継授業の実験も行った.
次に,サーバ間で連携して検索を行う情報資源管理を実現するために, メタデータを利用したシステムを設計し構築した.情報資源としては,静止画 データを中心とする考古遺跡写真を利用した.本研究では,電子化情報に関す るメタデータの国際標準であるDublin Core Metadataを考古遺跡写真に適する よう拡張し,検索と表示を行うシステムを実装した.
さらに,情報資源の流通に関する課題に関し考察を行った.本研究では,メタ データを利用してQoSを制御する方法を提案し,アプリケーションによらず情 報の内容に応じてQoSを差別化することを可能とした.地震などの非常事態に 流通する情報を扱うシステムを実装し,評価を行って本方式の有効性を証明し た.
以上により,メタデータが情報資源管理だけでなく,情報流通の制御にも有効 であることを示した.