Abstracts of Doctor Thesis 2002

平成14年度 情報科学研究科 博士学位論文内容梗概


米田友和

「連続透明性および連続可検査性に基づくシステムオンチップのテスト容易化設計に関する研究」


近年における半導体技術の向上に伴って,シリコンチップ上に搭載することのできる トランジスタ数は増加の一途をたどっている.これにより従来は複数の LSI チップ で構成していたシステムを,各 LSI チップをコアと呼ばれる機能ブロックとして再 利用し,システム全体をひとつの LSI チップで実現するシステムオンチップ (System-on-a-Chip,以下 SoC)が注目されている.複数の LSI の機能を1チップに 集積した場合,ボードへ搭載するチップ数の低減による実装面積の縮小化,実装コス トの低減,さらに高速化といった効果を持つ.また,設計済みの IP (Intellectual Property) コアを利用することで短期間で大規模な回路の設計が可能となる.現在, この SoC に対するテスト技術の開発が課題となっている.
 与えられた SoC のテスト容易性を向上する目的で SoC の設計を変更するさまざま なテスト容易化設計が提案されている.SoCでは縮退故障などのような論理故障のみ ならず,遅延故障などのようなタイミング故障のテストも重要となる.したがって, SoCのコアに対してはタイミング故障を対象としたテスト系列が供給される場合も想 定される.このように,コアにはさまざまな故障モデルを対象とした さまざまなテスト系列が供給され,そのコアがSoCに組込まれた後でも,その系列を 用いて想定した故障を完全にテストすることが必要となる.そのためには,各コアへ 任意のテスト系列を実動作速度で連続して印加し,その応答を観測 (連続テストアク セス) できる必要がある.しかし,これまでにコアへの連続テストアクセスとコア間 の信号線に対するテストを実現するテスト容易化設計は提案されていない.
 そこで本論文では,コアへの連続テストアクセスを可能とし,かつコア間の信号線 のテストを可能とする性質として,コアに対して連続透明性,SoCに対して連続可検 査性なる新しい概念を提案する.また,連続透明なコアを実現する方法および連続可 検査なSoCを実現するためのテスト容易化設計法を示す.連続可検査なSoCは,すべて のコアとすべての信号線に対して連続テストアクセスが可能であり,任意のテスト系 列を実動作速度で連続してコアや信号線に印加し,観測することができるので,コア 単体に対してテスト可能なすべての故障は,SoCに組込まれた後でもすべてテスト可 能であることを保証する.


吉本潤一郎

「統計的手法による関数近似法と強化学習への応用に関する研究」


人間の情報処理過程を考える上で,その最も重要な性質は未知の環境でも経験 に基づいて学習・適応する能力を有することである.このような情報処理を計 算機により実現しようとするのが機械学習である.
機械学習は,問題の定式化により教師あり学習,教師なし学習,強化学習に分 類することができる.
教師あり学習は,入力データと各入力に対応する理想的な出力データからその 入出力関係を良く再現するための学習であり,関数近似問題が対応する.教師 なし学習は,入力データのみからその特性を自己組織的に獲得する学習であり, 主成分分析法や因子分析法などの特徴抽出問題やラベルなしデータからのクラ スタリング問題が対応する.強化学習は,試行錯誤を通して報酬を最大化する 制御を獲得する問題であり,最適制御問題が対応する.いずれの学習スキーム も工学における重要な問題を含んでおり,その研究意義は大きい. これらの学習スキームは,データの生成過程を確率分布として記述することに より,統計的推定問題として統合して扱うことができる.
本研究では,統計的推定問題の観点から,関数近似問題と最適制御問題への応 用を目的とした新たな機械学習法を提案する.
本研究では,関数近似モデルとして正規化ガウス関数ネットワーク (Normalized Gaussian network, NGnet)が用いられる. NGnetは,正規化されたガウス関数を用いて入力空間を滑らかに分割し,分割 された部分空間ごとに線形回帰を行うモデルである.NGnetは入出力変数の同 時分布に対して確率的生成モデルを定義することにより,統計的推定法の一種 であるExpectation-Maximization(EM)アルゴリズムを用いて効率良く学習す ることができる.一方で,EMアルゴリズムはバッチ学習法であるために,実時 間でのモデル同定問題や入出力分布が時間とともに変化する動的な関数近似問 題への応用が困難である.この点を改善するために,オンライン学習が可能な EMアルゴリズムが導出される.
 次に,オンラインEMアルゴリズムを用いた連続力学システムの自動制御のた めの強化学習法が提案される.強化学習では,試行錯誤を通して各状態および 行動に対する良さを評価するための価値関数が学習され,それに基づいて方策 と呼ばれる制御関数の学習が行われる.これらの2つの関数は相互依存の関係 にあり,並行して学習が行われるために動的な関数近似問題と対応している. したがって,オンラインEMアルゴリズムが有効に働くと期待できる.提案され た強化学習法は,倒立振子とacrobotの自動制御問題に応用され,その性能が 評価される.
 NGnetのような非線形混合モデルの学習において,最適な混合数をどのよう に決定するか,すなわち,モデル構造の決定は重要な問題の一つである.この 点を解決する手法として,ベイズ推定法に基づく学習法が提案される.また, 効率良くモデル構造選択を行うための階層的モデル選択手法が提案される.提 案された学習法は,関数近似問題と非線形力学システムの同定問題に適用され, その性能が評価される.


大羽成征

「ベイズ推定に基づく高次元データに対する特徴抽出に関する研究」


高次元データを取り扱う際には、計算量爆発の問題、ノイズを含む学習データ への過適応の問題などがあり、高次元ベクトルデータから比較的低次元の特徴 ベクトルを抽出する特徴抽出の手法が必要である。また過適応の問題に対して は、モデル選択やモデルの正則化もまた必要となる。ベイズ推定は、近年にな って応用の進んだパラメータ推定の方法であるが、モデル選択とモデル正則化 とが自然な形で定式化できる。本研究では、特徴抽出において重要ないくつか のモデルに関するベイズ推定の計算方法を導き、応用を行う。

まず、主成分分析とクラスタリングの考え方を発展させた確率モデルである確 率的主成分分析モデル、混合主成分分析モデルを用いて高次元データを解析す る方法について述べる。これにより、欠測を含むデータを直接用いてクラスタ リングを行うことが可能となり、また同時に欠測予測も行うことができる。 最尤推定とベイズ推定のそれぞれに基づく定式化を比較することで、ベイズ推 定のメリットを示す。手書き文字の分類・認識問題に応用し、手法の有効性を 議論する。さらに、提案手法をバイオインフォマティクス分野におけるDNAマ イクロアレイ解析に関して応用した結果についても述べる。DNAマイクロアレ イ解析ではデータに含まれる欠測値の取り扱いが大きな問題となるが、ベイズ 推定に基く欠測予測法が、これまでに提案されている代表的な手法であるK平 均法や特異値分解法に比べて高い性能を示すことが示される。

次に、カーネル法の一種であるガウス過程回帰モデルを取り上げる。ロボット 制御等のリアルタイムな実問題への応用を考えるときに、関数近似器にはオン ライン的に変動する環境への追従性能が必要になる。ガウス過程回帰モデルに 対してデータの重みを時間に沿って減衰させていく方法、時間軸を入力空間に 含める方法の二つを提案し、この両者が、カーネル共分散行列の自然な拡張に よって得られることを示す。


平尾 努

「A Study on Generic and User-Focused Automatic Summarization」
(一般的な要約と視点を考慮した要約に関する研究)


インターネットの急速な発展や大容量の磁気記憶装置の低価格化などによって 電子化テキストが氾濫している.情報の洪水といわれる状況下では,我々が本 当に欲している情報を手にいれることが困難である.こうした状況を背景とし て,情報の取捨選択を容易にするための研究が行われている.例えば,「情報 検索」,「情報抽出」,「質問応答」などがそうである.近年,こうした研究 の中でも特に「自動要約」に対する関心が高まってきている.文書が要約され ることによって,概要把握にかかる時間は削減でき,欲する情報か否かの判断 も迅速にできるようになる.

本研究では,自動要約に関する以下の3つのトピックに関して述べる.

(1)多数の素性を用いた高性能な単一文書要約手法
(2)(1)の拡張としての高性能な複数文書要約手法
(3)質問応答システムの解答の根拠を示すための要約手法

(1)に関しては,Support Vector Machine を用いた単一文書要約手法について 述べる.従来より,文書要約では多数の素性を統合することが効果的であると いわれている.しかし,素性の数が多い場合には,スコア関数手法では人手に よりパラメータの重みの最適値を決定することが困難である.また,機械学習 手法の一種である決定木学習も多数の素性を用いた場合には成績が悪いことが 知られている.そこで,多数の素性を用いても過学習しにくいとされる Support Vector Machine を用いた.さらに,学習した素性の重みを解析する ことによって,要約のために有効な素性を明らかにした.

(2)に関しては,(1)の拡張として Support Vector Machine を用いた複数文書 要約手法について述べる.複数文書要約も単一文書要約と同様に多数の素性を 統合することが効果的である.さらに,文書集合に特徴的な素性を導入する必 要があり,素性の数は単一文書の場合よりも多くなる.よって,単一文書要約 において多数の素性を効果的に扱えた Support Vector Machine を用いた. また,複数の文書から作成した要約には,冗長な表現が多いということが言わ れている.そこで,冗長性を削減する手法としてよく用いられる Maximum Marginal Relevance を用いて冗長性削減の有効性を調べた.

(3)に関しては,質問応答システムの解答の根拠を提示する Question-Biased Text Summarization について述べる.質問応答システムは質問に対して解答 となる文字列(単語や句など)を返すシステムである.いわゆる文書検索に代る 技術として注目されている.しかし,システムの出力が常に正しいとは限らな いので利用者はシステムの解答の正誤判断を行わなければならない.そこで, 解答候補となる単語と質問に含まれる単語に着目し,それらが近接するパッセー ジを抽出することで解答の正誤判断に必要な文脈を保持した要約を作成する.


平井俊男

「音声合成システムにおける音声基本周波数制御のモデリングとその応用」


本論文では,音声基本周波数 (F0) 制御モデルの一つである藤崎モデルを用い た F0 制御規則の自動抽出およびその応用について述べる.

音声合成システムにおいて,適切な F0 制御は合成音声の自然性向上に重要で ある.従来は,合成システムに用いられる F0 制御メカニズムの構築は,多数 の音声データの F0 パターンを調べることにより経験的に行われていた.従っ て,音声データベースに含まれる F0 制御のメカニズムを自動的に抽出する手 法が確立できれば,より客観的な F0 の制御ができるようになり,ひいては F0 制御を要素技術とする音声合成システムの自動構築に有効である.音声デー タベースから得られた F0 制御のメカニズムは,発話内容の言語的情報を F0 制御パラメータに変換するための「規則」と捉えることができる.F0 制御規 則を抽出するためには,まず,何らかの F0 制御モデルを用いて F0 の時系列 (F0 パターン) をパラメータ化し,それらと発話内容の言語情報との関係を統 計的に調べることが考えられる.制御規則を効率良く抽出するためには,少な いモデル・パラメータ数で F0 パターンを数値化できる F0 制御モデルを選択 することが重要である.そのようなモデルとしては,F0 パターンを 2 種類の 成分,すなわち文末にかけてなだらかに単調減少する成分と,アクセント句ご との局所的な F0 の変化の重畳と捉える重畳型 F0 制御モデルが挙げられる. このモデルの代表的なものとして,藤崎モデルがある.藤崎モデルは,英語, 日本語,ドイツ語など様々な言語に適用され,その有効性が広く知られている. 本論文では,藤崎モデルを用いた F0 制御規則の自動抽出方法を提案する.な お,藤崎モデルのパラメータ値と言語情報との統計分析には,回帰分析と決定 木分析を統合した空間多重分割型数量化法 (MSR) を用いた.

ところで,F0 パターンをもとに藤崎モデル・パラメータを抽出する際には, 全てのパラメータ値を徐々に変えて F0 推定値の誤差が小さくなるパラメータ の組合せを逐次求めるという,多大な計算時間を要する方法が一般的に用いら れてきた.パラメータを効率良く抽出する手法の確立は F0 制御規則を自動的 に抽出するための重要な要素の一つであると言える.また,藤崎モデル・パラ メータの初期値の「適切さ」もパラメータ抽出に要する時間に大きく影響する. パラメータには時間情報に関するものがあり,もしこれらのパラメータ値が J_ToBI (Japanese Tone and Break Indices) などの汎用的なラベル情報から 導出できるようになれば,制御規則抽出のさらなる効率化が図れることとなる. 本論文では,これらの要素技術,すなわち藤崎モデル・パラメータの効率的な 抽出,J_ToBI ラベルからの藤崎モデル・パラメータの初期値の導出のための 新たな手法を提案する.

F0 制御規則の自動抽出手法が確立されれば,大量の音声データを含むデータ ベースからの F0 制御規則も比較的容易に抽出できるため,新たな研究分野へ の道も開かれる.例えば,複数の音声データベース (例えば複数の話者や複数 の発話様式ごとのデータ) 個々の F0 制御規則を抽出してそれらを比較すれば, それらの共通部分や異なる部分に関する知見が得られることとなる.本論文で は,4 つのデータベースから得られた F0 制御規則を比較し,いくつかの定量 的な比較の結果について述べる.このような研究を進めることにより,これら の F0 制御規則を内挿あるいは外挿した新たな規則を安定的に求めることも期 待できる.

上でも述べた通り,F0 制御規則の自動抽出には,発声に関する様々な情報が 必要である.それらの情報全てが自動的に得られるようになれば,制御規則の 完全自動抽出も可能となる.発話に関する情報として,アクセント句境界など, 韻律的な境界位置の情報が挙げられる.韻律境界の自動付与は,F0 制御規則 抽出の自動化を進めるためだけではなく,人為的な判断による付与位置のばら つきを抑制する意味でも重要である.このような要求に基づき,本論文では韻 律境界の自動付与手法を提案している.提案手法では,不必要な韻律境界の付 与を抑制するため,赤池情報量基準 (AIC) が用いられている.


情報科学研究科 専攻長