言語横断検索における問合せ中の
文化要素の動的変換

井原 大助 (9851011)


近年のWWWの発展により、様々な言語で書かれた文書が数多く提供されるようになってきている。 今現在、WWW上で提供されている文書の約20\%が英語以外で書かれた文書であり、2003年までには、 50\%を越えると予想されている。 このことからWWW上に存在する文書群は、多言語からなる文書が混在する一つの巨大なデータベース と考えることができる。

これらの多言語文書群を統一的に扱う検索手法の一つに、言語横断情報検索がある。 言語横断情報検索とは、ある言語もしくは複数の言語で書かれた文書群をそれとは 異なる言語による問合せで検索する手法のことである。 しかし、この手法にも様々な問題が考えられる。 例えば、言語間における文化要素の翻訳の問題が挙げられる。 文化要素とは、ある一つの事象に対して、文化固有の表現、表記単位を持っているもののことである。 そのため、問合せ中に文化要素があるとうまく検索できない場合がある。

本研究では、言語横断情報検索における問合せの要素を対象とし、これらの文化要素を自動的に変換し、 効果的な検索を行うことを目的とする。 このシステムの実験により、文化要素を含んだ問合せを用いて言語横断情報検索が可能なことがわかった。 また、数値を伴う文化要素の変換について、端数を考慮し変換後の数値に幅を持たせることによって、 検索性能が向上することを実証した。