前のトピック: CA Process Automation のインストールに失敗する次のトピック: Oracle バグ 9347941 番


E1000 ネットワーク インターフェースを使用して VMWare サーバで CA Process Automation を実行する場合の潜在的な問題

症状:

この問題の根本原因は、散発的で発生確率のきわめて低いソケット I/O 障害です。この障害により、呼び出し側のソフトウェアが読み取りの完了を待ち続けることがあります。

ユーザが気づく最も典型的な症状は、通常は問題なく完了するプロセスが思いがけなくハングすることです。これらのプロセスは、CA Process Automation オーケストレータを再起動すると、再開され予想通りに完了します。 この問題の影響は、プロセスのごく一部に限られることも、実行中のすべてのプロセスに広がることもあります。 この問題は、オーケストレータのアップタイムとの相関関係はなく、再起動の直後に現れる場合も、この問題以外にはまったく問題がないオーケストレータ機能の実行の数日後、数週間後、数か月後に現れる場合もあります。

この問題は、大量の CA Process Automation プロセスを実行する環境でのみ、確認されています。 E1000 NIC がインストールされているほとんどの環境では、その問題は一度も発生していません。または、発生の頻度が低く、検出されていない場合もあります。

解決方法:

この問題の確認はきわめて困難です。 この問題が発生すると、多くの場合、CA Process Automation スレッドがソケット上の読み取りで停止します。また、ログ ファイルには、関連エラーは書き込まれません。さらに、問題の検証には、ソケット上の読み取りでオペレータが停止したことを確認するために、この問題が発生している間に取得した一連の Java スレッド ダンプの検討が必要です。

この問題に関してエラーが観察される場合、それらは他の正当で無関係な原因を含む可能性がある一般的な接続エラーを示す傾向があります。 以下はその一例です。

2013-07-24 18:55:23,219 WARN  [org.hibernate.jdbc.AbstractBatcher] [nPool Worker-23] exception clearing maxRows/queryTimeout
com.microsoft.sqlserver.jdbc.SQLServerException: The connection is closed.
                at com.microsoft.sqlserver.jdbc.SQLServerException.makeFromDriverError(Unknown Source)
                at com.microsoft.sqlserver.jdbc.SQLServerConnection.checkClosed(Unknown Source)
                at com.microsoft.sqlserver.jdbc.SQLServerStatement.checkClosed(Unknown Source)
                at com.microsoft.sqlserver.jdbc.SQLServerStatement.getMaxRows(Unknown Source)
                at org.jboss.resource.adapter.jdbc.CachedPreparedStatement.getMaxRows(CachedPreparedStatement.java:367)
                at org.jboss.resource.adapter.jdbc.WrappedStatement.getMaxRows(WrappedStatement.java:378)
                at org.hibernate.jdbc.AbstractBatcher.closeQueryStatement(AbstractBatcher.java:272)
                at org.hibernate.jdbc.AbstractBatcher.closeQueryStatement(AbstractBatcher.java:209)

. . . この後に同様の記述が続きます。

これらのケースでは、その問題の識別は暫定的です。また、通信障害の他の原因を除外する必要があります。   

頻繁なプロセス障害、または個別のオペレータまたは複数のオペレータの繰り返し発生する可能性がある障害は、おそらく、プロセス設計またはオーケストレータ機能内部の他の無関係な問題を示します。

この問題が確認されたサイトでは、VMWare サーバを構成しなおして、E1000ネットワーク インターフェース カード ドライバから VMXnet-3 NIC ドライバに切り替えるのが、きわめて効果的な対応策であると考えられます。 

CA Technologies はこの問題の発生率が非常に低く、E1000 NIC を備える場合でも発生間隔がきわめて長いため、これを完全な解決策と明言するのを躊躇しています。    

この変更を行う前に問題の確認が必要な場合は、サポートに問い合わせて、この特別な問題のトラブルシューティングと確認に必要なログ記録と Java スレッド ダンプのセットアップについての支援を求めてください。