リスクレベルを分かりやすく可視化

数千台規模のサーバー運用をどうリモートで効率化する?フロア単位での“電気代見える化”なども実現へ

 前編で紹介したように、PowerEdgeなどのデル・テクノロジーズ(Dell Technologies)のサーバー製品に搭載されている統合リモートアクセス管理用デバイス「iDRAC」を活用すれば、サーバーハードウェアの管理をリモートから容易に行える。各種センサーデータなどを用いることで、電力消費量などの最適化も可能だ。数台程度であれば運用の大幅な効率化を容易に図れる一方で、数十台、数百台、さらにより多くのサーバーがある状況では、iDRACだけでの効率的な管理は難しい。そこでデル・テクノロジーズでは、多くのサーバーが複数拠点で運用されていても、それらを一元的かつ効率的に管理し、担当者の負担を大きく削減するソリューションを提供している。

数千台規模のサーバー、自動運用をどう実現できる?

iDRACはサーバーごとに運用管理を効率化するための管理用デバイスだが、数百、数千台規模となると手が追いつかない。そこで、iDRACと組み合わせることで数千台規模のサーバーやストレージ、ネットワークスイッチ、OSなどを一元管理し、効率化するための統合管理コンソールが「OpenManage Enterprise」だ。iDRACを介してさまざまな情報を収集することで、リモート管理や監視を実現している。加えて、サーバー以外のストレージやネットワーク機器もあわせて管理可能だ。

複数のサーバーの電源制御をはじめ、システムリソースの監視、ファームウェア・アップデート、OSインストールなどをリモートで複数台まとめて実行できる。「OpenManage Enterpriseは、多くのサーバーを運用する環境、データセンターなどの運用管理・監視を自動化するためのソリューションです」とデル・テクノロジーズ カスタマーソリューションセンター センター長の相場宏二氏は説明する。

「OpenManage Enterprise」で複数デバイスを管理する様子

[画像クリックで拡大]

OpenManage Enterpriseを利用することで、多数のサーバーに同じBIOS設定、RAID構成を適用するなどの変更が一括で可能。また、稼働状況を一元的に監視し、異常なアクティビティを検出した場合には、管理者にアラートを送信できる。アラートを受け取った管理者は、OpenManage EnterpriseのGUI画面から問題のあるサーバーにリモートアクセスし、現地に赴かずとも問題を解決できるという。

さらにセキュリティの設定も可能だ。たとえば、各サーバーで統一のルールを適用することで、不正アクセス対策を講じることができる。CPUやメモリなどシステムリソースのモニタリング、イベントログ監視、システムパフォーマンス分析などもOpenManage EnterpriseのGUI画面から管理可能だ。ファームウェアのアップデートなどは、日付やOSリブート時など任意のスケジュール設定で更新できるだけでなく、アップデートマネージャーを使えば、あえて枯れた古いバージョンのファームウェアを適用することも可能だ。

他にも、障害状況や電力消費量、CO2排出量、電気代なども可視化できる。これらの情報はサーバー単位ではもちろん、データセンターあるいはフロアやラック単位などで監視・管理できる。「管理対象を任意に階層化してグループを作り、必要な単位で管理できます。たとえば、特定のラックの電力使用量の監視、フロア単位での電気代の見える化が実現できるようになるため、グループ単位でアラートを通知することもできます」と相場氏は言う。

OpenManage Enterpriseでは、デル・テクノロジーズ製のサーバー、ストレージ、ネットワーク、UPS、PDUなどのハードウェアだけでなく、データセンターにある他社の機器も管理対象にできる。「最新版では、HPEとレノボのサーバーを統合管理することもできます。たとえば、HPEのサーバー管理機能『iLO』と連携して監視対象にすることが可能です」と相場氏。

そして各種ハードウェアだけでなく、その上で動くOSについてもOpenManage Enterpriseでは対象だ。複数サーバーのOSインストールを1つのコンソールから一元的に行えるだけでなく、VMware vCenterやMicrosoft System Centerの管理なども統合化されている。「OpenManage Enterpriseは、データセンターにあるものはほぼすべて、監視・運用を効率化できます」と相場氏は自信を見せる。

グローバル規模での管理にも対応、進化した「CloudIQ」

OpenManage Enterpriseを利用したリモート管理・監視には、そもそも管理コンソールにアクセスするために、VPNなどで社内ネットワークに接続する必要がある。つまり、遠隔地にある複数拠点にわたって多くのサーバーを運用しているような場合では、多少の手間が発生するだろう。そこで便利なのがクラウドベースの「CloudIQ」だ。「ブラウザやスマホアプリから利用できるCloudIQは、世界中に散らばるデータセンターの情報を集め、リアルタイムでサーバーの状態をモニタリング、そしてAIを用いた予測分析が可能です」と相場氏は説明する。

デル・テクノロジーズ カスタマーソリューションセンター センター長 相場宏二氏

世界中に点在するデータセンターの状況が、CloudIQの画面から一元管理できる。「各地のデータセンターにあるサーバー、ストレージ、ネットワーク、仮想マシンといった、さまざまなシステムの健康状態をリアルタイムに確認できます。もし異常があれば詳細を取得できるだけでなく、問題解決の方法まで提示してくれます。プロアクティブなモニタリング、機械学習、予測分析を組み合わせることで、オンプレミスだけでなくAPEXなどのクラウド内のシステムを監視することが可能です」とも言う。

CloudIQ は、AI技術を活用した予兆検知や将来予測などを実現している。将来のパフォーマンス動向の予測もその一つだ。パフォーマンスの推移などを時系列で可視化し、CPUやメモリの使用率が急激に上昇した際に何があったのかなどを随時確認できる。特定の時間や曜日における平均値から異常を検知し、アラートを通知。「このまま利用を続けると、何日後にメモリやストレージの利用率が100%に達する」なども予測可能だ。

CloudIQにおけるパフォーマンスの将来予測(赤枠部分)

[画像クリックで拡大]

これらはiDRACの膨大なテレメトリデータをOpenManage Enterprise経由でCloudIQに送り、クラウド上でのAI分析によって実現されている。また、サイバーセキュリティに関する機能も見逃せない。すべてのシステムを横断的に見て、リスクの高い順に表示できるとして「GUI上でワンクリックするだけで、具体的にどのサーバーリスクが高いのかを理由とともにリストアップします。たとえば、セキュアブートや仮想コンソールの暗号化が無効になっているなど、理由とあわせてリストアップしてくれます」と相場氏。どのサーバーやストレージにリスクがあるのか容易に把握できる。

リスクレベルを分かりやすく可視化

[画像クリックで拡大]

なお、今回紹介してくれた相場氏は、デル・テクノロジーズのカスタマーソリューションセンター(CSC)でセンター長を勤めているという。そこでは同社の幅広い製品をデモンストレーションを通じ、多くのユーザーに紹介している。CSCは70ラック超の豊富な機材を備えており、性能や機能検証などをユーザーやパートナーと一緒に実施できるという。「現在は、パブリッククラウドを使用したマルチクラウドの検証も多数実施しております」と相場氏は説明する。

2022年には、500件以上の検証やデモを実施しており、コロナ禍以降はリモートでの検証も増えている。もちろん、前後編にわたって紹介してきたiDRACやOpenManage Enterprise、CloudIQについても検証可能だ。

カスタマーソリューションセンターには、豊富な機材が取り揃えられている

リモート検証に対応しているため、日本各地のユーザーニーズにも柔軟に応えられるだけでなく、現地での実機検証をあわせることで性能や機能をリアルに体感できる。これは製品選定や導入後の運用の安定化、効率化を図る上で、大いなるメリットとなるはずだ。運用効率化のためにiDRACやOpenManage Enterpriseなどに興味を持ったならば、カスタマーソリューションセンターを活用し、「その良さをぜひ実感してみて欲しい」と相場氏は言う。

Original Post>