いまでは仮想化はすっかり当たり前の技術として広く普及し、どんな企業もその恩恵が受けられるようになりました。ただし、仮想環境ならでは考慮しなければならないポイントが増えていくのも事実です。 ホストサーバの台数やその上で稼働させるVM(仮想マシン)の数など、規模が大きくなればなるほど、SLA(運用品質保証)を確保するためのハードルが上がっていきます。
仮想化におけるパフォーマンス監視の落とし穴
ある企業は、仮想化を一部の業務でテスト的に使ってみたところ、トラブルはなく、非常に快適なパフーマンスを得ることができました。そこで仮想化を本格的に導入し、すべての業務に適用することにしました。
ところが、一部のアプリケーションについて、どういうわけか急にパフォーマンスが低下してしまいました。以前から利用してきた運用監視ツールで確認しても、ハードウェアに障害やリソース不足は起こっていません。また、そのアプリケーションを運用しているゲストOSのモニターを見てもCPU使用率には余裕があります……
これが仮想インフラにおける運用管理の“落とし穴”です。ゲストOS上のモニターは、仮想インフラではパフォーマンス管理には利用できません。
仮想インフラの運用監視における問題点
- 既存の運用監視ツールは、物理サーバ全体としての挙動しか把握できない。
- ゲストOSのモニターは、そのVMのみの挙動しか把握できない。
- 複数のVM間で相互環境を把握する手段がない。
仮想インフラ上で起こるリソース競合
仮想インフラ上では、複数のVMが相互にリソースを共有し、融通し合いながら稼働しています。しかし、リソースには限りがあるため、例えば優先度が付けられていない環境でCPUパワーを大量に使用したいVMがあるが、リソースに余裕がなくフルに割り当てが出来ないような場合、そのVMはパフォーマンスが低下し本来のサービスレベルを維持できない場合があります。
仮想インフラの運用監視では、どのホストサーバ上で、VM同士がどのようにリソースを使いあい、どこに影響が出てきているのか関連づけながら“見える化”する仕組みが必要となります。
仮想インフラ上で起こるリソース競合
- 仮想インフラ上で起こるリソース競合。
- 同じホストサーバ上で稼働している複数のVMは、タイムシェア(時間分割)で順番にリソースが割り当てられる。
- あるVMが重い処理を実行すると、別のVMがリソースを使えるようになるまでに長時間の“待ち”が発生する場合がある。
- 仮想インフラのパフォーマンス分析には、リソースの使用率だけでなくリソース競合の解析が必要。