PCクラスタを利用した解析例
昨今、開発工期の短縮、試作コストの削減など、シミュレーションへの要求がますます高まってきております。CPUのマルチコア化、ネットワークの高速化など、実行環境も大きな転換期を迎えており、並列計算による業務の効率化が注目を集めています。
本ベンチマーク計算では、非線形動的構造解析ソフトウェアLS−DYNAを用 いて、最新CPU(インテル Nehalem)、高速ネットワーク(Infiniband)などから構成されるPCクラスタ環境において、並列計算の効率を評価しております。
計算環境(計算ノード)
各ノードはクアッドコアCPU(Nehalem)を2個搭載
ノード間は高速ネットワークであるInfiniBandで接続
4ノード全てのコアを使用した場合、32コアの並列計算が可能
【クラスタノードのハードウェアスペック】
- O S
- : Red Hat Enterprise Linux 5.2
- CPU
- : Intel Xeon W5580 (Nehalem) 3.2GHz
4コア× 2CPU / ノード
- メモリ
- : 24GB /ノード
- ハードディス
- : 500GB /ノード
- ネットワーク
- : InfiniBand(20Gbps)
PCクラスタ計算解析例
解析モデル
【自動車の衝突・破壊解析】
静止している2台の自動車に、60km/hで最後尾のワゴン車が衝突
解析対象時間 : 0.1秒
要素数 : 794,776要素
使用ソルバ : LS-DYNA 971 R3.2.1
SMPの効果

SMP(1ノード)におけるコア数の効果を見ています。
縦軸は1コアに対する速度比で、高い方が高速です。
2コアで約1.9倍、4コアで約3.5倍、8コアで約4.8倍、
高速化されています。
MPPの効果

各ノードは8コアずつ使用しています。
(1ノード:8コア、2ノード:16コア、3ノード:24コア、
4ノード:32コア)
縦軸は1ノードに対する速度比で、高い方が高速です。
2ノードでは約2倍、4ノードでは約3.5倍、高速化されて
います。
MPPとSMPの比較

MPP:4コア=1コア×4ノード、8コア=2コア×4ノード
SMP:4コア=4コア×1ノード、8コア=8コア×1ノード
縦軸はMPPに対する速さ比で、高い方が高速です。
4コアではMPPとSMPは同等の結果ですが、8コアでは
SMPはMPPの約72%のパフォーマンスしか出ていませ
ん。
まとめ
SMPのテストでは、1ノードあたり4コアまでは高い並列効果を得ることができました。以前のCPUではメモリバスがネックとなり、4コア程度でも伸び悩みが見て取れましたが、Nehalemでは大きく改善されています。
高速ネットワーク化によりコア数、ノード数を効率的に利用できるため、計算時間の大幅な短縮が可能です。従来から問題であったノード数の増加に伴うネット ワーク間のデータ通信遅延が解消できております。
SMPとMPPの比較では、4コアではほぼ同等の高速化を確認できました。ただし、8コアになるとMPPの方が高速という結果になりました。一般的には、コア数が多いほどMPPの優位性が生じます。
LS-DYNAはSMP、MPPともに並列化への対応が進んでおり、最新のPCクラスタ環境において高速な並列計算が可能であることが確認できました。
Copyright © 2009 Terrabyte Co.,Ltd.





