OS/400(i5/OS、i/OS)を運用する上で定期的なヘルスチェックはかかせません。
2005年にi Magazine 誌に掲載いただいた記事の転載です(許可取得済み)。内容的には今もあまり変わらないと思いますので、運用管理に携わる方には役に立つかも。なお、一部リンク切れしてますがご容赦を。
.
------------------ 以下転載 ------------------
OS/400のヘルス・チェック
OS/400は自らを自律的に最適化するように設計されており、OSそのものの運用においてユーザーの関与が必要な部分は他のプラットフォームと比較して非常に少ない。ここではより安全かつ効率的にシステムを運用するために、日常運用の中で一度はチェックすべきものについていくつかピックアップして解説する。
V5におけるパフォーマンス・データの収集と評価
OS/400のパフォーマンスの良し悪しを判断する際、対話型ジョブの場合は平均対話型応答時間(通常2~3秒以内)、バッチジョブの場合はジョブの実行時間(例えば夜間バッチが朝までに完了するか)が基準とされることが多い。
パフォーマンスに問題がある(目標値を満たさない)と判断された場合、次のステップはシステム資源の使用率を測定することである。OS/400の主要なシステム資源としてCPU、メモリー、ディスクがあり、これらがバランスよく構成されている必要がある。いずれかの資源にボトルネックが発生していると、他の資源に余裕があってもパフォーマンス(スループット:仕事量)が低下する。システム資源の使用状況を判断する際にもっとも良く利用されるのはWRKSYSSTSコマンドおよびWRKDSKSTSコマンドであるが、より詳細かつ継続的なパフォーマンス分析には収集サービスと、マネージメント・セントラルの「モニター」またはパフォーマンス・ツールが使用される。
システム資源の充足度を判断する最も簡便な方法は、IBMより提供されている各種ガイドライン(推奨値)と、評価対象システムのシステム資源使用率を比較することである。V5R3における性能調整を行う上でのハイレベルのガイドラインは例えば「iSeries パフォーマンス バージョン5リリース3」のページ24などに記載されている。以下のガイドラインはOS/400 V5を使用している場合の一般的な環境における推奨値であり、将来の能力計画立案やより詳細な分析を行う前段階における、あくまでも「目安」としてご理解いただきたい。
より詳細なレベルのガイドラインが必要であれば「iSeries Technical Overviews」の「Performance Update」に下記項目についての評価手順が記載されている。
さらに、包括的なOS/400のパフォーマンス関連情報は「Performance Management」にまとめられているので、必要に応じて参照すると良いであろう。
長期にわたるパフォーマンスの傾向分析や、アプリケーション/ジョブレベルでの詳細な分析にはPM iSeries、iDoctor for iSeriesなどのツールの検討をお勧めする。また、SQLのパフォーマンス評価にはiSeriesナビゲーターの標準機能であるSQLパフォーマンス・モニターとVisual Explainが使用できる。パフォーマンス評価の目的に合わせて適切なツールを選択されたい。
システムの制限値
OS/400には各種の「最大値」(あるいは制限値)が存在する。ほとんどの場合、ユーザーがこれらを考慮する必要は無いが、大規模システムや特殊なアプリケーションにおいて、これらの上限に抵触するケースが散見される。システムを設計・運用する際に、これら制限値を一読することをお勧めする。各バージョン/リリースごとの制限値の記載先を下記に示す。
リリース毎に制限は緩和されているが、ここではV5R3を前提としていくつかの項目について解説する。
対話型あるいは通信サブシステムに一時点で割り振られる装置数は250~300台が推奨(「制限」ではない)されている。サブシステムはシリアル(順次)に装置を割り振ろうとするため、推奨装置数を越えると装置の接続に長時間を要し、最悪の場合タイムアウトと回復処理が多発するという状況が発生する。多数の対話型端末、あるいは通信装置を単一のOS/400に接続する場合はサブシステムの分割を検討すべきである。なお、推奨装置数とマシン(区画)の能力との間に関連はないとされている。
OS/400上に存在できるジョブの上限は485,000である。この数はV5R1で追加されたシステム値QMAXJOBで変更可能であり、デフォルトでは163,520(V4R5までの最大値)に設定される。現在どれだけのジョブがシステム上に存在するかはDSPJOBTBLコマンドで確認できる。OS/400ではジョブは完了した後でも、これと関連付けられた印刷出力(ジョブログなどのスプールファイル)が残っていると、ジョブの情報はシステムに保持される。大量のジョブを生成するシステムでは、こまめにジョブログや不要な印刷出力を削除するか、V5R2で追加されたジョブ属性である「SPLFACN」に*DETACHを指定し、ジョブとスプールファイルとの紐付けを除去するのが望ましい。
単一のユーザー・プロフィールが所有あるいは私用権限を有するエントリーの最大数は10,000,000、単一の権限リストで管理できるオブジェクトのエントリー(1オブジェクトが複数のエントリーを消費)の最大数は2,097,070である。大規模なシステムで大量のオブジェクトを少数のユーザー・プロフィール、もしくは権限リストで管理している場合、これらの分割によって制限を回避する必要がある。ユーザー・プロフィールのエントリー使用率はPRTPRFINTコマンドで、権限リストのエントリーはDSPAUTLOBJ(権限リストで保護されるオブジェクト)あるいはV5R2/3にPTFとして提供されるAPI QSYRTVAI(エントリー数)で確認できる。
SMAPPの回復時間設定と保護対象の選定
SMAPP (System-managed access-path protection:システム管理によるアクセス・パスの保護)はV3R1で追加された機能であり、自動的にバックグラウンドでシステム上のアクセス・パスをジャーナルすることによって異常終了後のIPL時間を大幅に短縮する。EDTRCYAPコマンドで動作を制御可能であり、デフォルトで有効とされている。「システム・アクセス・パス回復時間」は当初150分に設定されていたが、より高い可用性を提供するために図2のようにリリースごとに設定値が小さくされている。
図2


------------------------------
(囲み記事)
ADDPFRCOL、CHGPFRCOL、STRPFRCOL、WRKPFRCOL、ENDPFRCOL、STRPFRMON、ENDPFRMON
V5R3におけるパフォーマンス・データの取得方法
CLコマンドでパフォーマンス・データの収集を可能とするため、V5R3では次のコマンドが追加された。
> PRTCPTRPT MBR(Q292160237) LIB(QMPGDATA)
ジョブ 629780/QSECOFR/PRTCPTRPT がライブラリー QGPL のジョブ待ち行列
QBATCH に投入された。
なお、パフォーマンス・ツールが利用できない場合は「Calculating Performance Metrics」に記載されている方法で、パフォーマンス・データベースから各種使用率を求める事ができる。
ここに書かれている内容は私の所属する会社、組織とは関係ありません。 内容を誰かが保証する物ではありません。
この記事にはトラックバック・コメントがありません。
コメントは投稿者の責任においてなされるものであり,サイト管理者は責任を負いません。
hyahagi さん、お久しぶりです。最近の調子はいかがですか??
相当なシステム情報がリアルタイムで、しかもほとんど負荷なしに取得することができる、というのは IBM i の他プラットフォームに対する間違いなく大きなアドバンテージです。
しかも大半は特別なツールを購入せずに実施できるので、この記事を参考にして、ぜひこうした管理を(お試し的にでよいので)始めてみて、システム資源の有効利用に役立ててほしいところですよね。
基本的にデータの収集はシステムの基本機能のみでできますし、リアルタイムでデータを見るのはシステム付属のコマンドや System i ナビゲーター(マネージメント・セントラル)などで可能です。
有料のツールについてですが、そういった基本的なデータの蓄積からさらに分析を行いたい場合に必要なものですね。
ある一定時間毎のパフォーマンス状況を見る、とか、その中でシステム資源をよく使っているものはどれか、などは一般的に言って見たいものでしょうから、購入しておいて損はないと思います。
いくつかのリンクについて V6R1版と V5R4版のリンクを挙げておきます。
「V5におけるパフォーマンス・データの収集と評価」に"性能調整を行う上でのハイレベルのガイドライン"として挙げられている「iSeries パフォーマンス バージョン5リリース3」についてはそれぞれ↓のとおりです。
また、その後に"より詳細なレベルのガイドラインが必要であれば"と挙げられている「Performance Update」についてはそれぞれ↓のとおりです。
本文中でふれられている「Performance Capabilities Reference」などが載っている、"パフォーマンス関連情報"についてはそれぞれ↓のとおりです。
「システムの制限値」については↓のとおりです。
「システム資源使用率の把握」での"詳細については"で挙げられている参照先については↓のとおりです。
最新情報のフォロー、ありがとうございます。m(_ _)m
> しかも大半は特別なツールを購入せずに実施できるので、...
そうですね。パフォーマンス関連のツールが充実しているのもIBM i の良さだと思います。
ホストもこのあたりは強いと想像します。それ以外は良く知りません。(^-^;;;;;
DBあってのi/OSなので、hidehiさんの最近の記事も興味深く読ませてもらっています。
楽しみにしていますね。(^-^)/
---
ここに書かれている内容は私の所属する会社、組織とは関係ありません。
内容を誰かが保証する物ではありません。
V6R1 のリンクが変わっていました。
「V5におけるパフォーマンス・データの収集と評価」
http://publib.boulder.ibm.com/infocenter/iseries/v6r1m0/topic/rzahx/rzahx.pdf
「システムの制限値」
http://publib.boulder.ibm.com/infocenter/iseries/v6r1m0/topic/rzamp/rzampoverview.htm
「システム資源使用率の把握」
http://publib.boulder.ibm.com/infocenter/iseries/v6r1m0/topic/rzahx/rzahxcollectdatacs.htm