Cross-Language Information Retrieval via Dictionary-based and Statistics-based Methods

SADAT FATIHA  (9851207)

As Internet resources become accessible to more and more countries, there is a need to develop methods for Cross Language Information Retrieval for different languages. Most Cross-Language Information Retrieval researches have focused on dictionary-based method with a combination to statistics approach to avoid the problem of ambiguity. Query expansion is used to improve the effectiveness of information retrieval and to dramatically reduce the errors such an approach normally makes. In this research, the approach of using a bilingual dictionary, by including an interactive feedback loop in the task of query expansion before translation, is aimed. A second query expansion is used after the disambiguation of translation candidates. We apply this method to an English-French module, in the Cross-language Information Retrieval.
This method achieved 91.95% of the monolingual counterpart, in term of average precision.
Finally, a combination of French-English and English-Japanese modules via a transitive translation is discussed.
 



 

辞書ベースと統計ベースの手法による言語横断情報検索

サダト ファテイア (9851207)


インターネットがより多くの国々で利用可能になるのに伴い,ヨーロッパ言語とアジア言語との間の言語横断情報検索手法の開発が必要になってきている.言語横断情報検索の研究の多くは,cベースの手法に曖昧性を解消するための統計的アプローチを組み合わせるものである.また,適合率および再現率の向上のためと,このような手法によって起きる誤訳を減少させるために,問合せ拡張が用いられる.本研究では,翻訳前の問合せ拡張のために対話的適合性フィードバックを用いる対訳辞書ベースのアプローチを目標とする。また,訳語の曖昧性解消の後に,二回目の問合せ拡張が行われる。この手法は,言語横断情報検索の英語―フランス語モジュールとして用いられる。本手法は平均適合率に関して単言語の91.95%を得た。
最後に,中継ぎ翻訳によるフランス語-英語と英語-日本語モジュールの結合について議論する。