原子力基盤技術データベースのメインページへ

作成: 2000/05/20 関口 智嗣

データ番号   :190027
ネットワーク数値情報ライブラリ(Ninf)-性能評価
目的      :計算科学のためのネットワーク利用基盤技術の性能評価
研究実施機関名 :通商産業省電子技術総合研究所情報アーキテクチャ部
応用分野    :計算科学研究、高性能計算、計算機利用技術

概要      :
 Ninfはクライアント/サーバモデルのシステムである。Ninfシステムの性能を調査した結果、Ninfシステムの有効性、既存の高性能計算機が広域計算システムにおいて十分有用であること、既存の高性能ライブラリの再利用性があること、計算主体の計算では現状の広域計算システムで十分に運用できること、通信主体の計算では通信性能と設置条件がNinfの性能に影響を与えることがわかった。
 

詳細説明    :
 ネットワーク数値情報ライブラリNinf(Network enabled Information Services for the Global Computing Infrastructure) を科学技術計算におけるGlobal Computingを実現する基盤システムとして提供している。Ninfはクライアント/サーバモデルに基づく計算システムであるが、実際の広域環境での実用化に向けて、その性能特性や指標を明らかにした。
 
 通信/計算の特性の異なるベンチマークプログラムにより、性能やアーキテクチャの異なるクライアント/サーバマシンを用いて図1に示すLAN(Local Area Network)環境および図2に示すWAN(Wide Area Network)環境において、Ninfシステムを利用した場合の計算性能を測定し、次のような結果が得られた。


図1 実験に用いたLAN環境(原論文1より引用)



図2 実験に用いたWAN環境(原論文1より引用)

 
(1) 手元にある計算機(ワークステーション等)で計算するより、Ninfを用いて遠隔地にある高性能計算機(並列計算機)を使って実行した方が高速に実行されることより、高性能広域計算の有効性が示された。
 
(2) 計算サーバはネットワークを通じて任意の複数のクライアントに共有されるため、広域計算システムと現状の超高性能計算機OSの組み合わせで集中した計算要求をロバストに処理する必要がある。
 
 サーバにベクトル機や対称型マルチプロセッサシステム(SMPシステム)を用い、複数クライアントが並行にアクセスする環境での実験結果から、並列計算機用OSとNinfシステムの組み合わせで堅牢なネットワークサービスが提供できることを確認した。
 
(3) 超高性能並列機でNinfサーバを運用する際、順次到着する計算要求に対して計算資源を分割して複数タスクを並列に処理するか、全資源を1つのタスクに割り当てて直列に処理するかという処理指針があるが、どちらを選択するかを検討する必要がある。これは提供するライブラリの設計段階と再利用性の有無にかかわる。
 
 並列計算機ではピーク性能を実現するように最適化されたライブラリでNinfサービスを提供することで、LAN/WANの両環境において十分効率良く運用できることが判明した。つまり、既存の高性能ライブラリの再利用性がある。SMPシステムでは、複数のクライアントから要求がある状況では高スレッド化による性能低下が見られ、クライアント数(サーバの稼働率)に対して適切なスレッド数で計算する必要がある。
 
(4) 通信バンド幅の増大は見込めるが、それが十分か判断するための定量的尺度は提供されていない。また、レイテンシの短縮は難しいため、大きいレイテンシが性能向上の妨げとならないかどうを明らかにする必要がある。
 
 計算主体の計算においてはLAN/WAN環境の差はなく、計算サーバの稼働率が向上した。このような計算(並列レンダリング/イメージング、パラメータ感度解析など)では高性能広域計算システムで十分に運用できることがわかった。
 
 通信主体の計算では、LAN環境ではサーバの性能(サーバの稼働率)が性能を支配していたのに対して、WAN環境では通信スループットと設置条件に大きく依存し、サーバの負荷や稼働率による影響はほとんど見られない。特に単一サイトに複数のクライアントが集中していた場合、通信主体の計算ではすぐにネットワークが飽和し、一方、クライアントが複数サイトに分散している場合では、性能は広域ネットワークのトポロジに依存する。
 

コメント    :
 ある程度Ninfの実用性が示される結果が得られたが、今後クライアント・サーバの通信を2フェーズ化した枠組みの実現など通信プロトコルの改良や、計算サーバでのタスクスケジューリングや高性能広域計算における負荷分散について様々な手法の検討が必要である。
 

原論文1 Data source 1:
複数クライアントによるLAN/WANでのNinfの性能
竹房 あつ子、合田 憲人、小川 宏高、中田 秀基、松岡 聡、高木 浩光、佐藤 三久、関口 智嗣、長嶋 雲兵
お茶の水女子大学、東京工業大学、電子技術総合研究所、新情報処理開発機構、物質工学工業技術研究所
情報処理学会論文誌 vol.39, no.6, 1998

原論文2 Data source 2:
Multi-client LAN/WAN Performance Analysis of Ninf: a High-Performance Global Computing System
A. Takefusa, S. Matsuoka, H. Ogawa, H. Nakada, H. Takagi, M. Sato, S. Sekiguchi, U. Nagashima
Ochanomizu University, Tokyo Institute of Technology, Electrotechnical Laboratory, Real World Computing Partnership
Supercomputing '97

原論文3 Data source 3:
広域計算システムのシミュレーションによる評価―Ninfシステムの広域分散環境でのジョブスケジューリング実現に向けて
竹房 あつ子、合田 憲人、小川 宏高、中田 秀基、松岡 聡、高木 浩光、佐藤 三久、関口 智嗣、長嶋 雲兵
お茶の水女子大学、東京工業大学、電子技術総合研究所、新情報処理開発機構、物質工学工業技術研究所
JSPP '98論文集

キーワード:科学技術計算、ハイパフォーマンスコンピューティング、情報サービス、高速ネットワーク、広域分散、リモートライブラリ、ワールドワイドコンピューティング
Computational Science and Engineering, High Performance Computing, Information Services, High Speed Network, Globally Distributed Computing, Remote Library, World-Wide Computing
分類コード:190101, 190302, 190303

原子力基盤技術データベースのメインページへ