調査/解析ツールの理想ってどんなでしょう?

2008年12月15日 00:15

今日はTips とか技術情報じゃなくてちょっと障害解析で思うことでも話してみようかな・・・と。

 IBM では昔Autonomic Computing の具現化の一つとして、 Project eLiza と言うのを推進していましたよね。自己修復機能って言うのでしょうか。障害情報を勝手に特定して勝手に直す、Software・・・
サポートにとっても理想の形態の一つです。 
 この手の話をすると、Serviceability とか First Problem Data Capture (FFDC)とか色々なキーワードが出てきますが、「実環境に負担をかけず、問題解析の上で十分な情報を解析するための情報を自動的に収集する」と言うような意味で様々な実装が考えられている事が多いように思えます。
 この点で今最も理想に近い実装を行っているものはどこなのでしょうか? 個人的にも参考にすべき見本としてHW/SWやベンダーを問わずそういう製品は勉強してみたいです。Tivoliなどの運用管理ツールも製品固有の問題解析まで行うと言うよりは一元管理を容易に実現する、と言う意味のほうが強いのではないかと思います。

 僕が考えるFFDC を実現する理想の解析ツールは「問題を再生できる」ログを取るものです。コアダンプやプロセスダンプ、NSDログはどれだけ詳しくとってもスナップショットでしかありません。
そのログがあれば、別の端末上でも問題を「再生」出来て、直したらその再生ツールで修正確認まで行える・・・そんなツールがあればサポート・お客様・開発の負担もどれだけ減るか分からないのに・・・てよく思います。 実際問題解析で一番厄介なのは再現性が無い複雑な問題を調査するときなので。。これは多くのソフトウェア・ハードウェア・ミドルウェア共通の悩みなのではないでしょうか?

 実は私が調査した件で昔、お客様側からOS側のインシデントもオープンされたために私もOS側と連携して調査をした事があるのですが、似たようなツールが提供されたことがありました。
 広く配布しているようなツールではないようなので名前や詳細は控えさせて頂きたいのですが、そのツールを導入して、アタッチした状態で問題を再現させると、別の端末ではその録画情報のようなものを使ってデバッグ出来るようなのです。(ただこの辺の再生技術までは確立していないようで、非常に多くのマニュアル作業を伴う再生作業になるようですが。)

 解析作業などは見れたわけではないので、実際にこのログが僕が前述した「理想の解析ツール」にどれだけ近づいたものなのかは分かりません。ただ、自分と同じような事を考えて本当に実現を考えている、と言う話は頼もしく思えました。リリースされる事があったら、お小遣いでその製品を買ってでもいいので勉強してみたいと思っています。

 お客様のITインフラも複雑になってきて、問題がいかに容易に解決するか、と言うのは製品の品質向上の上でも重要性が増してきています。このような技術がもっともっと台頭してくることを1エンジニアとして心から楽しみにしています。。。



コメント

    コメントの投稿

    (コメント編集・削除に必要)
    (管理者にだけ表示を許可する)

    トラックバック

    この記事のトラックバックURL
    http://hnagasim.blog8.fc2.com/tb.php/42-7c845f46
    この記事へのトラックバック


    最新記事