電源障害のerrpt

<<< QUESTION >>> 2006/07/11 19:11:48

errptについて質問させていただきます。

環境:

筐体 p5 570
ドロワー 7311-D20
AIX5.3 ML4



本体とドロワーの電源障害の試験を以下の流れで行っていました(作業間隔は5分)
errptの出力を毎回取っていましたが、errptにエラーが出力されないケースがありました。
ただし、その後、試したらerrptに出力されました。

 流れ:
  本体1系電源抜線(errpt 出力あり) → 本体2系(あり) → ドロワー1系( なし ) → ドロワー2系(あり) → ドロワー1系(あり)

 電源障害時のerrpt:

BFE4C025 0711111606 P H sysplanar0 UNDETERMINED ERROR



そこで質問門なのですが、

1. errptによるエラーイベントのDROPということは考えられますでしょうか?
2. そもそもドロワーの電源障害が検知できないということは考えられますでしょうか?
3. そのほかに、errptに出力されないケースとして、どのようなケースが考えられるでしょうか?<<< ANSWER >>> 2006/07/13 21:47:34

A1.
通常は考えがたいと思いますが、比較的連続して電源障害のテストを実施されているようですので、通常のエラーハンドリングが行われなかったのかもしれません。
もちろん、5分間隔が短いというつもりはないのですが、エラーとしては、特異な発生のしかたになると想定されます。

A2.
電源の障害は検知されます。

A3.
電源を抜く順番や、間隔に依存するとは考えがたいですが、残念ながら明確は情報は持ち合わせておりません。
この事象が再現性の高いものであるなら、H/W障害として対応いただく必要はあると考えます。<<< QUESTION >>> 2006/07/24 21:08:12
追加で質問させてください。
Q4. 電源抜線のあと、電源ケーブルが抜けているかどうかをerrpt以外のコマンドで確認することは可能でしょうか?
   7311-D20は電源ランプがないため、目視による確認ができません。<<< ANSWER >>> 2006/07/26 14:46:23

A4.
残念ながら、AIXからerrpt以外のコマンドで、7311-D20の電源障害を確認するのは難しいようです。
もし、HMCをご使用の環境であれば、エラーのイベントとして報告されますので、サービス・フォーカル・ポイントからご確認いただけます。
HMCがない場合は、あまり現実的な対応ではないかもしれませんが、 Advanced System Management Interface ( ASMI) からもご確認いただけます。
ASMIにログインしていただき、[System Service Aids] => [Error/Event Logs] と辿ると、ご確認いただけます。
Information Center ( ASMI へのアクセス):
http://publib.boulder.ibm.com/infocenter/eserver/v1r3s/index.jsp?topic=/iphby/accessasmi.htm

<<< QUESTION >>> 2006/07/27 16:56:15
追加で質問させていただきたいのですが、
7311-D20において、電源回復(抜線した電源ケーブルを戻したなど)の確認方法はありますでしょうか?<<< ANSWER >>> 2006/07/27 21:34:38

電源回復というのは、現実的には電源障害からの復旧というタイミングになるかと思います。(もちろん、今、貴職がテストをされている状況とは異なると思われますが)
その場合、通常はdiagコマンドにて、sysplanar0 に対してProblem Determinationを実施し、エラーがない事を確認します。
但し、明確に7311-D20の電源ケーブルが戻ったという検知は難しく、エラーが無くなっていれば、電源は回復しているという意味になります。

diagコマンドも含めて、ハードウェア障害の回復確認に関しての詳細は、担当の技術員にご確認ください。
diagコマンド

引用元:IBM FAQ
http://www-01.ibm.com/support/docview.wss?uid=std3e83f25972e18ec0b492571cc00070847