非線形有限要素法の領域分割法による並列化

原子力基盤技術データベースのメインページへ
作成： 1999/03/08 牧野内　昭武データ番号　　　：190007 非線形有限要素法の領域分割法による並列化目的　　　　　　：非線形問題の数値シミュレーションの並列計算手法の開発研究実施機関名　：理化学研究所素形材工学研究室応用分野　　　　：板成形,原子力構造解析,接触加工問題概要　　　　　　：　非線形問題の有限要素解析においては、反復法を用いて解の収束を得ようと試みても解が収束しない事態に陥ることが少なくない。また非線形問題では反復回数や解の精度が問題になることが多い.その際,筆者らは着実な計算進行手段の候補としてRmin法による計算を提案しているが、この場合、直接法による計算が必須となる。本件では直接法を用いた演算に領域分割法を適用することにより、並列計算機上での直接法計算を高速化するとともに、定量的な高速化・効率化の度合い及び演算規模と計算プロセッサ数の関係を明らかにしている。　詳細説明　　　　：　弾塑性大変形問題等の有限要素法を用いた数値解析では、ステップ当たりの増分量を一定とすると材料や形状に起因する問題の非線形性により反復法による求解では解の収束が得られない事態が頻繁に生じる。特に領域分割法を用いた場合、仮想境界・領域内部の双方で残差のチェックをする必要があるため反復計算回数等が問題視される.そこで筆者らは着実な計算進行手段の候補としてRmin法による計算を提案している。この手法では、塑性ひずみ増分等をパラメータとしてステップ当たりの増分量を制限している。　　そこで、本研究では直接法を用いた計算並列化手法を構築した。直接法に基づく領域分割では、まず解析対象を表した有限要素モデルを計算プロセッサ数の計算領域に分割することから始まる。分割された各領域内部では各々の領域を受け持つ計算プロセッサが独立して有限要素方程式を完成させる。ここで各節点は領域境界上に位置するものとそれ以外のものに分類できる。そこで次に境界上の節点に関する自由度のみを未知変数とする縮約した方程式を組み上げる。この縮約された方程式のデータを計算プロセッサ間で転送し、各式を重ねあわせることにより、境界上の自由度のみを未知変数とする全体有限要素方程式を得ることができる。この式を解き、各境界上の自由度の解を得た後、各々の領域内部の節点に関する未知変数を計算する(図1参照)。図1　Domain decomposition method with direct equation solver. 　この直接法に基づく領域分割法では「各領域内に含まれる節点番号の最適化」「各領域に含まれる節点数と領域間境界に位置する節点数」「領域境界上の節点番号の最適化」が各プロセッサ内の計算負荷の最適化、データ転送量の最適化、縮約後の連立式計算負荷の最適化、を左右する。そこで各演算負荷を近似評価し、これより演算負荷を最小にする収束条件式を導き「」内の項目を決定、領域分割を実行するアルゴリズムを提案した。この最適化領域分割と内部要素数を均等化した領域分割について並列化有限要素法を実行した際の演算効率を示したグラフを図2に示す。図2　Parallel efficiency of subdomain assembly and condensation for equal and optimized 16-subdomain partitions. （原論文2より引用。　Reprinted with permission from Data source 2 below. Copyright 1999, MCB University Press, 0264-4401.）　同図では収束計算を1ないし2回行った最適化領域分割と内部要素数を均等化した領域分割を比較しているが、この収束計算回数でも演算効率が1.0前後つまり均等となり演算負荷の偏りが大幅に改善されていることが分かる。また本並列手法では領域境界上の自由度に縮約した方程式をつくることから、総計算自由度と使用した計算プロセッサの数に依存して並列化効率が変化する。低自由度の演算で多くのプロセッサを使用すると演算効率がよくないことはアルゴリズムからもわかる。その傾向を定量的に調べるため演算自由度を変えて計算を行い、並列化効率の推移を調べた結果を図3に示す。図3　Speedup values of the parallel DDM code in comparison to the sequential code with bandsolver for 4, 8 and 16-processor SP2 computer. （原論文1より引用。　Reprinted with permission from Data source 1 below. Copyright 1996, Springer-Verlag.）　本計算手法は4,8プロセッサ程度では数千自由度のオーダーから良好な演算効率が示されており、それ以上に計算自由度が大きくなると使用プロセッサ数に応じた効率が完全に引き出され効率は一定値に修練していることがわかる。使用プロセッサ数を多くした際、その数に応じた演算効率を引き出すには相応の大きさの計算自由度が必要であり、16プロセッサを使用した計算が良好効果を示すには少なくとも数十万自由度のオーダーの計算である必要があると考えられる。　コメント　　　　：　本件では有限要素法における連立方程式直接解法を領域分割法を用いた並列計算により大幅に高速化することに成功している。特に構造物の領域分割時の留意点についても考察を加えて各計算プロセッサの演算負荷の均等化を図ることを試みている。直接法を用いる必要のある数値解析分野においては本手法が並列計算機利用の有力な一手法となると考えられる。　原論文１ Data source 1： Performance study of the domain decomposition method with direct equation solver for parallel finite element analysis G. P. Nikishkov, A. Makinouchi, G. Yagawa and S. Yoshimura The Institute of Physical and Chemical Research, 2-1 Hirosawa, Wakou, 351-0198 Japan Computational Mechanics 19, 84-93 (1996). 原論文２ Data source 2： An algorithm for domain partitioning with load balancing G. P. Nikishkov, A. Makinouchi, G. Yagawa and S. Yoshimura The Institute of Physical and Chemical Research, 2-1 Hirosawa, Wakou, 351-0198 Japan Engineering Computations 16, 120-135 (1999). 原論文３ Data source 3： Porting an industrial sheet metal forming code to a distributed memory parallel computer G. P. Nikishkov, M. Kawka, A. Makinouchi, G. Yagawa and S. Yoshimura The Institute of Physical and Chemical Research, 2-1 Hirosawa, Wakou, 351-0198 Japan Computers and Structures 67, 439-449 (1998). キーワード：有限要素法、大変形、非線形問題、並列計算、領域分割法、 finite element method, large deformation, nonlinear problem, parallel calculation, domain decomposition method 分類コード：190203, 190205, 190302
原子力基盤技術データベースのメインページへ