多くの企業がVMware vCenter (以下、vCenter )を利用して仮想基盤を運用管理していますが、より効果的な方法があります。VMware vCenterに加えてVMware vRealize Operations (以下、vRealize Operations)を活用することで、障害や異常が起こる前に仮想基盤に起きている様々な予兆を察知し、対処することが可能となるのです。vRealize Operations のトラブルシューティング機能を使って、仮想基盤のサービス品質を高める方法を紹介します。
仮想基盤の安定稼働をいかに実現するか
障害が起きる前にその芽を摘み取る
業務で必要な様々なアプリケーションが仮想基盤の上で運用されています。これらのアプリケーションを快適かつ安定した稼働を実現するためにも、仮想基盤のサービス品質を維持することが非常に重要な要件となります。
そこでの肝となるのは、障害につながる要因をできるだけ早い段階で発見し、障害が起きる前にその芽を摘み取っておくことにあります。
障害には何らかの外的要因(変更作業等)によりすぐに障害になるケースと、徐々に悪化してゆき症状として現れるケースがあります。前者は原因が明確にわかるケースが多く対処方法もわかり易い傾向にあります。後者の場合は何らかのメトリックに兆候があらわれ、早期に発見し対処することで重大な障害を回避することが可能です。対処が遅れた場合は症状として現れる場所と根本原因が一致しないケースが多いため、根本原因追求にはノウハウが必要となります。
仮想基盤に起こっている異常を一目で発見
vRealize Operations は、仮想基盤から数多くのメトリックデータを収集し、仮想化基盤全体を俯瞰的に監視し、健全性を維持します。仮想基盤の稼働状況を分析評価し、その結果をダッシュボードやレポートを通じて視認性を高めて提供します。
こうしたvRealize Operations が提供する様々な機能の中で、特に仮想基盤のサービス品質の維持に役立つのがトラブルシューティングの機能です。これにより仮想基盤に起こっている異常やボトルネックの根本原因を短時間で発見できるようになります。
VMware vCenterだけでは不十分
ところでなぜVMware vCenterだけでは不十分なのでしょうか。VMware vCenterからも様々なアラートが上がってきますが、それらはすでに仮想基盤で発生している障害や設定ミスなどを示すものです。
仮想基盤のサービス品質を維持する上でより重要なのは、前述したように障害が起きる前にその予兆を察知することであり、そのためにはCPU使用率やディスク使用率などのメトリック(収集された各要素の観測値)を継続的に監視することが必要です。
例えばディスク使用率が90%以上に達したことがアラートとして上がってくれば、ディスクがあふれてI/O処理のエラーが起こる前に、不要データを削除して空き容量を増やすなど、適切な対処を行うことができます。
vRealize Operations を導入すれば、仮想基盤のサービス品質を左右する様々なメトリックを一元的かつ容易に監視することができます。
また、API経由でしか取れないメトリックの収集、様々なしきい値の設定がvRealize Operations では可能となります。