大規模XMLデータの分散配置及び問合せ処理に関する研究

栗田 裕人 (0451053)


本論文では,大規模なXMLデータを効率良く処理するために,XMLデータを分割 し,複数の計算機へ分散させて,問合せ処理する手法を提案する.この手法は, 最適なデータの分割,分割されたデータの各計算機への配置,並びに複数の計 算機を利用した分散問合せに関する部分からなる.データの分割では,データ量 とデータ構造を考慮した分割を行い,各計算機へ分割したデータの分散配置を行う. その際問合せによるデータへのアクセス頻度も考慮する.また,特定の計算機へ 問合せが集中した場合,データの再配置を行うことで負荷分散を実現する. 最終的には各計算機での問合せ処理の負荷を均一にすることで, 効率のよい分散問合せ処理を実現できる. 実験では,複数の計算機を用いて分散環境を構築し,サイズの異なるXMark ベンチマークデータを生成し,そのデータを分散配置して,問合せ処理を行う ことで提案手法の有効性を確かめた.