滝沢 寛之 講師が第5回船井情報科学奨励賞を受賞
|
|
■受賞業績: 階層的並列化による大規模データクラスタリングに関する研究 |
|
■受賞にあたってのコメント
このたび、栄誉ある船井情報科学奨励賞を受賞することができ、大変光栄に思っております。今回の受賞対象となった研究を遂行するにあたって、諸先生方の有益なるご指導ご鞭撻、また共に研究を進めてきた共同研究者の方々には多大なるご支援ご協力を賜わりました。これまでの研究をこのような形で評価していただいたことを大変嬉しく思うと同時に、本研究に直接的、間接的に携わっていただいた全ての方々に心より感謝いたします。今回の受賞を励みとし、引続きこの研究を発展させると共に、今後は得られた知見を他分野の科学技術計算にも応用していきたいと考えております。 |
|
 |
滝沢 寛之 先生 |
■受賞の経緯
受賞対象となった研究は、昨今のデータベースの肥大化によって大規模化、高速化が強く求められているデータマイニングを、比較的安価かつ容易に入手可能な普及型の計算資源のみを用いて効率良く実行することを目指すものです。本研究では、主要なデータマイニング手法の一つであるデータクラスタリング処理に特に着目し、アルゴリズム自体の改良と実装・並列化手法の両面から高性能化を検討してまいりました。
現在盛んに行われているグリッドコンピューティングやPCクラスタシステムの研究では、大規模な問題を小さな問題に分割して各計算機に割り当てることにより並列分散処理を実現しています。この場合、計算機間の通信のオーバヘッドを考慮すると、かなり粗い粒度で問題を分割しなければ効率的な並列処理を期待できません。しかし、データクラスタリングの処理時間の大半を占める最近傍探索処理は細粒度の並列性を多く含んでいるため、その処理の効率化のためには細粒度並列処理が効果的です。
本研究では、Zバッファ方式に基づく3次元CG処理の高速実行を目的としてパーソナルコンピュータ(PC)に標準的に搭載されている描画処理装置(Graphics Processing Unit, GPU)を積極的に活用することによって、特別なハードウェアを別途追加することなくPCの細粒度並列処理能力を増強することを考えました。一般向けのPCに搭載されるGPUの機能と性能は近年急速に向上しており、特にその理論的な浮動小数点演算性能は、従前より計算に専ら用いられてきた中央演算処理装置(Central Processing Unit, CPU)を上回る速度で向上しています。また、汎用のCPUと比較して、GPUは3次元CG処理に多く含まれる細粒度並列処理を効率良く実行できるように設計されています。しかし、3次元CG処理に特化した設計になっているために、GPUの演算能力を利用するためには様々な厳しい制約もあります。本研究では、データクラスタリングにおける最近傍探索処理と3次元CG処理との間に類似性を見出し、その類似性を利用することによってGPUの優れた細粒度並列処理能力を最近傍探索にも効果的に活用しています。
図1に示すとおり、粗粒度の並列性に基づいて大規模データクラスタリング処理を分割して各計算機に分配し、さらにCPUとGPUとで分担して並列実行します。ここでGPUを利用することによって、従来では利用困難であった細粒度データ並列性に基づいて最近傍探索処理を高速化しています。一方、最近傍探索以外の処理はGPUでの効率的な実行が困難であるため、従来どおりCPUで処理する実装方法を提案しました。CPUとGPUとで適切に役割分担して協調動作させることによって、GPUの高い演算能力による処理時間の大幅な削減と、CPUのプログラミングの柔軟性による高度で複雑なアルゴリズムへの対応との両立を可能にしています。 |
 |
図1 階層的並列処理 |
|