Zabbix Conference Japan 2023から、トヨタの事例を解説するセッションを紹介



Zabbix Conference Japan 2023から、トヨタのリサーチ部門のエンジニアが車載器のデータをクラウドで最適化する研究を発表したセッションを紹介する。このセッションは車輛からのデータを複数のデータセンターで構成される大規模構成のインフラストラクチャーを使って分析し、その際、電力需要に最適化するようにワークロードを再配置するという実験的な試みの監視とトリガー処理をZabbixで行ったという事例だ。

トヨタの事例については、2023年12月に公開された以下の記事でも短く紹介しているので参考にして欲しい。

●参考:Zabbix Summit 2023に日本から参加したスピーカーにインタビュー

セッションを行ったのはトヨタ自動車のE2Eコンピューティンググループのグループ長である阿部博氏だ。

タイトルは「リガのZabbix Summit発表への道」という内容

セッションのタイトル「Zabbix Summit 2023発表への道」にはいくらかの説明が必要だろう。リガのサミット当日の発表の際に阿部氏が更新した最新の内容が、登壇のためのスライドには更新されておいないという。そのため阿部氏のプレゼンテーションは動画としては残されていない。その状況をここで巻き返すという意気込みがこのタイトルに表れているのだろう。

阿部氏が担当した研究の内容を表したスライド

阿部氏のグループは実装実験を主に行っているとして、本番ではなくあくまでも研究の一環としてセルラー回線とWi-Fiの併用、遅延計測/広域分散処理、リアルタイムのエッジへのオフローディングなどを行っていると解説した。

クルマから発生するデータは加速度的に増加している

このスライドではクルマから発生するデータが加速度的に増加しており、それをどこでどうやって処理するのか? というのが大きなテーマになっていることを説明した。その際にデータを処理するデータセンターにおいて、最も電力効率の良いリージョンにワークロードを移動させたとしてどのくらい遅延が発生するのか? を検証するというのが今回の発表の根幹である。

大手町と石狩でKafkaのデータを同期して遅延を計測する実験を実施

その研究の一環として広域(この場合、大手町と北海道の石狩)で同じ構成のKafkaクラスターを用意して、データ同期の遅延がどのくらい発生するのかを検証したことを解説。大手町と石狩という地図上のルートで計測すると約1,100kmという距離を隔てた2つのデータセンターで、メッセージの同期をKafkaで行うという実験だ。

広域データ同期をZabbix Proxyを使って計測

この実装実験ではエッジ側のコンテナ基盤にOpenShiftを使っていることがわかる。車載データの処理にコンテナを使うのは定石と言った所だが、Red Hatが強力に推進するKubernetesのインフラストラクチャーであるOpenShiftが、トヨタのリサーチグループにおいて標準で使われているというのは筆者には軽い驚きであった。またこの実証実験には日照時間の増減を予想して、より太陽光発電によってグリーンなエネルギーが使える場所にワークロードを移動するという内容も含まれているようだ。

太陽光発電の偏移に応じてワークロードを移動させる。判断をどこでやるのかはこれからの課題

このスライドでは太陽光発電が天候の変化によって増減する状況に対応して、ワークロードを柔軟に移動するという実験も兼ねていることが示されているが、その判断をZabbixが実装するのか他の仕組みで行うのかについてはまだ検討中ということだろう。さまざまな要因が関連する電力需要とコストの最適化はこれからの課題だろうが、それをトヨタがデータ処理に関して行っているという点が注目ポイントだろう。

広域データ同期と監視は地球レベルで実装予定か

またこの実装実験は単に日本という規模を超えて、地球レベルで太陽が今どこの地面を照らしているのかを見極めるレベルに到達するであろうことがこのスライドに示されている。これは世界規模で車輛やモビリティというサービスを販売しているグローバル企業であるトヨタならではの発想だろう。日中と夜間で最も電力コストが安い場所で計算を行えば、コストの最適化にも繋がるというわけだ。

太陽と月を追いかけて電力需要を最適化するプロジェクトのPoC

このスライドでは太陽光によって日中に低下する電力コストと夜間や原発、揚水発電などによって変化するコストを最適化することが最終的な目的であることがわかる。

トヨタの進めるグローバル規模の実験のトリガーとしてZabbix、特に新しいProxyが使われているということが示されたというのが、このセッションの重要なポイントと言えるだろう。

阿部氏のスライドはここで参照できる。

●参考(PDF):Zabbix Summit 2023発表への道

この実験はトヨタレベルのグローバル企業でなくても、需要に応じてワークロードを処理するデータセンターを移動するというユースケースには応用可能だろう。Kafkaだけではなくさまざまな実行基盤、そしてネットワーク構成でその研究結果が共有されることで、データセンター事業者だけではなく一般企業においても有効な知見が得られるのではないだろうか。トヨタが最終的にこの研究結果をオープンソースで公開することを願いたい。

Original Post>

Enjoyed this article? Sign up for our newsletter to receive regular insights and stay connected.