ギガリングクラスタ

ギガリングクラスタ上での常時転送型分散共有メモリシステム

最終更新：2004/3/11

概要

本研究室では，高速な通信速度をもつネットワークカードを利用したリング結合型計算機クラスタ(ギガリングクラスタ)上での新しい分散共有メモリモデルの研究を行っています。
我々が提案する分散共有メモリモデルでは，共有メモリ空間をギガリングクラスタ内で常時転送状態とします。共有メモリ空間が高速にギガリングクラスタ内を移動しつづけることで，あたかも各計算機がすべての共有変数を保持しているかのように共有変数を使用することが可能となります。

ギガリングクラスタ

提案モデルでは共有メモリ空間全体の転送を行うため，高速なネットワークが必要となります。そのため，本研究では図１に示すギガリングクラスタ上に提案モデルを実装しています。ギガリングクラスタとは，高速な通信速度を持つ Giga Ethernetを用いて複数の計算機をリング状に接続した計算機クラスタです。１つの計算機が２つのGiga Ethernetインターフェースを使用し，それぞれのインタフェースが異なる計算機と接続されています。なお，通信時のコリジョン(衝突)を防ぐため，スイッチングハブ等を介さず直接接続しています。また，Giga Ethernetを用いた接続とは別に，FastEthernetを用いたネットワーク接続も保持し，共有メモリ空間のような大きなデータ転送はGiga Ethernetを利用し，制御信号などの小さなデータの転送はFast Ethernet を利用します。
また，共有変数の通信部には，計算ＣＰＵに負荷をかけることなく高速な転送が可能なハードウェアアーキテクチャを用いることを想定しています。

図１：ギガリングクラスタ　

常時転送型分散共有メモリ

プログラムで必要となった時点(オンデマンド)で他計算機の持つメモリ領域へのアクセスを行う場合，通信の初期遅延によるオーバーヘッドが問題となります。そこで，通信の初期遅延の問題を解消するために，我々の研究室では常時転送型分散共有メモリを提案しています。常時転送型分散共有メモリは，従来のようにオンデマンドに他計算機のデータを要求するのではなく，

高速な通信速度をもつネットワークを利用し，共有メモリ空間全体をクラスタ内で常時転送状態とする。
各計算機は，その時刻に保持している共有メモリ領域を用いて実行することが可能なタスクを行う。
必要な共有変数を得られず，参照または代入処理を実行できないタスクは，一時キューに格納し，実行可能時まで処理を遅らせる。
という概念に基づく分散共有メモリモデルです。このモデルでは，他計算機に対してオンデマンドにメモリ参照要求を行わないため，通信の初期遅延の問題を受けません。また，共有変数の転送と計算は独立に行われるため，通信と計算をオーバーラップさせることが容易という特徴があります。

評価

提案モデルを実行するランタイムライブラリを，C++のクラスライブラリとして実装して性能評価を行いました。実験には，以下の計算機を用いたギガリングクラスタ環境を用いました。なお，提案手法では共有変数の通信部に計算CPUに負荷をかけることなく，高速な転送ができるハードウエアアーキテクチャを想定していますが、本実験ではそのかわりに２ＣＰＵのＳＭＰ計算機を用い，１ＣＰＵを通信専用プロセッサとして使用しました。

CPU:Pentium III 866MHz x 2
Memory:512Mbyte
OS:Solaris 8
性能評価には，行列積の計算とFDTD法を用いた電磁界シミュレーションを用いました。それぞれの結果を図２，図３に示します。横軸は使用計算機台数，縦軸は速度向上率です。速度向上率は，「Cプログラムで作成した逐次プログラムでの実行時間 / 提案手法での実行時間」です。この結果，行列積演算で約７．７倍，ＦＤＴＤ法による電磁界シミュレーションで約４倍の速度向上が得られることが確認されました。

図１：行列積演算の速度向上率　

図１：ＦＤＴＤ法による電磁界シミュレーションの速度向上率