Informatica CEOが語る 生成AI技術による新しいデータ管理のあり方とは?

 ETL(Extract Transform Load)ツール製品から始まり、現在はデータクレンジングなどのデータ品質管理、マスターデータマネジメントやデータカタログなどのデータにまつわる多岐に亘るソリューションを展開し、データマネジメント・ソリューションのベンダーとなっているのがInformaticaだ。同社は2023年に30周年を迎え、日本での活動も来年で20年となる。これまでInformaticaが携わってきたデータ管理の市場を振り返り、生成AI技術などを活用する新しいデータ管理のあり方について、Informatica CEOのアミット・ワリア氏に話を訊いた。

AIで価値を生むには正しいデータ投入が必要

20年を迎えようとしているInformaticaの日本のビジネスは、順調に推移している。「これまでに10倍の成長を遂げ、業界のリーダーポジションにあります」とワリア氏。ETLツールの提供から始まったビジネスは、現在はクラウドデータマネジメント・プラットフォームのベンダーへと進化しており、これを提供する唯一の企業だと言う。

クラウドデータマネジメント・プラットフォームのために、Informaticaでは「Intelligent Data Management Cloud(IDMC)」を開発した。「7年前にゼロから新たなDXのモデルとして作ったのが、IDMCです」とワリア氏。IDMCはグローバルで既に5000社以上に採用されており、日本でもNTTコミュニケーションズ、商船三井、オムロンなど幅広い業種の企業で採用されている。Informaticaの売り上げ規模は約16億ドル、クラウドのビジネスが堅調に伸び35%の成長がある。「今年度上半期は市場の期待値を超える成長があり、通年の予測も上方修正しています」と言う。

Informaticaはこれまで、ETLツールのリーダーとして長く市場を牽引してきた。そんな中、7、8年ほど前からデジタルの世界では極めて多様なデータ管理のユースケースが登場する。それら多様なデータ管理のユースケースに対応できるようにするため、IDMCをゼロから開発することを決め大きな投資を行った。「ETLだけでなく、データをクラウドで管理するためのプラットフォームを作ることにしたのです」とワリア氏。IDMCは7年前にゼロからスタートし、2023年6月時点で月間61テラバイトのトランザクションを扱うに至っている。

さらにInformaticaでは、IDMCにいち早く生成AI技術を取り込んでいる。とはいえAIへの投資は、今回の生成AIが初めてではない。「2017年の段階で既にAIエンジンであるCLAIREを提供しています」とワリア氏。AI技術を搭載したCLAIREが登場してから既に5年ほどが経過し、顧客からの評価も上々だ。たとえば米国のヘルスケア企業であるCVS Healthは顧客に医療費の返金業務を行っているが、その際に必要となるデータ分析のための手作業を、CLAIREの活用で95%削減している。

具体的に生成AI技術を加えて提供するのが「CLAIRE Copilot」と「CLAIRE GPT」の2つの機能だ。Copilotは、さまざまなデータ管理のタスクを自動化し、効率性と生産性を向上させる。CLAIRE GPTは、生成AIを搭載したことで自然言語に基づくインターフェイスを実現し、それを用いて企業がデータを処理し管理、分析するのを大幅に簡素化、高速化する。「2つの機能で生産性は5倍、10倍と向上されます。さらに生成AIのインテリジェンスにより、人ではできなかったことをCLAIREで行えるようになります」とも言う。

また「そもそもデータ管理がしっかりなされていなければ、AIの価値は発揮されません」とも言う。AIで価値を得るには、包括的なデータが必要であり、多様なデータがどこにあってもモデルの学習などに適切に反映できなければならない。それには、長きに亘りデータ管理に注力してきたInformaticaの強みが発揮できることとなる。

データの品質を高めることも、AIの活用では重要だ。「AIが正しい答えを返すには、正しいデータが必要です」とワリア氏。さらに企業が安心して生成AIを使うにはデータのガバナンスも重要であり「正しい人が正しいアクセスをすることが欠かせません」とも言う。またデータの民主化が実現されることで、一部の専門家だけでなく大勢のユーザーがAIのメリットを享受できる。

ところでAIを活用する際に、学習データに偏りが出て回答にバイアスがかかるとの懸念がある。AIのバイアスを軽減するには「できるだけ包括的な、たくさんのデータで学習する必要があります。その大量なデータの品質も、担保しなければなりません」とワリア氏。CLAIREを使えば、極めて多くの種類のデータを用いたAIモデルの学習が容易に実現できる。InformaticaのIDMCを経由すれば、バイアスのないデータでAIのモデル構築ができる、そんな世界を新しいCLAIREを使い実現していきたいとワリア氏は考えている。「100%バイアスを減らすのは難しいかもしれませんが、なるべくそれに近づけるようにしたい」と言う。

クラウドデータマネジメント・プラットフォームでは競合なし

Informatica CEO アミット・ワリア氏

Informaticaは、クラウドデータマネジメント・プラットフォームを提供する唯一のベンダーであり、CLAIREは業界初の生成AI搭載データ管理プラットフォームだと、ワリア氏は主張する。これらでデータ管理の市場をリードするInformaticaには、競合はいないのか。ワリア氏はクラウドデータマネジメント・プラットフォーム全体では競合はいないと言う。とはいえIDMCには多様な機能があり、それらの一部は他のベンダーと競合するものもある。しかし「AI駆動型のデータ管理プラットフォームは、Informaticaだけのものです」と自信を見せる。

昨今クラウドベンダーもデータ管理機能を提供しているが、それらも競合とはならないと言う。「確かにクラウドベンダーはデータ管理のサービスも提供していますが、クラウドベンダーはそれにフォーカスしていません。彼らはどちらかと言えばデータベースやアプリケーション、インフラの提供に力を入れています。そこがデータ管理専業ベンダーである我々と違うところです」と言う。

さらにクラウドベンダーはコネクタなど外部との接続機能などにも限界があると指摘する。たとえばクラウドベンダーが外部サービスなどとのコネクタを数100用意しているのに対し、独立した立場のInformaticaは数万のコネクタを提供する。ここも大きな違いになる。また大規模な顧客はハイブリッドクラウド、マルチクラウドを指向しており、Informaticaはそれにも応えられる。しかしクラウドベンダーは自社サービスを中心とした提案となり、マルチクラウドなどに対応するのは難しい。

Informaticaのデータ管理プラットフォームには、大きく3つの特長がある。1つ目が簡単かつローコストですぐに使えるプラットフォームだ。「全てのデータ管理に必要な機能を1箇所で1つのIDMCで実現できるのは、ユーザーには大きなメリットです」と言う。2つ目の特長がCLAIREへのAIへの大きな投資がある。その結果得られるAIからのインテリジェンスの活用で、ユーザーの生産性が大きく向上する。3つ目の特長は、さまざまなパートナー企業との深い関係性だ。AWS、Microsoft Azure、Google Cloud、Oracle Cloud、さらにはSnowflakeやDatabricks、Salesforceなど多様なクラウドベンダーと協業しており、顧客に多様な選択肢を提示できる。その上で、パートナーと一緒に、顧客に価値提供が可能になるのだ。

今後日本でさらにビジネスを拡大する上では、SI企業などのパートナーとの協業を重視している。既に20年に亘り日本でビジネスを展開してきたこともあり、Informaticaでは日本のIT市場の特殊性も十分に理解している。日本企業が求める対応のきめ細かさや高い品質などにも慣れており、日本のパートナーや顧客からの高い要求はむしろInformatica製品の品質を向上につながるとも言う。

ETLツールのベンダー時代は、情報システム部門におけるInformaticaの認知度は高かった。そこからクラウドデータマネジメント・プラットフォームに進化し、情報システム部門が窓口となるだけでなく、最近はチーフ・デジタル・オフィサーやチーフ・データ・オフィサー、さらにはチーフアナリティクス・オフィサーなどのデータを活用し企業を変革する立場の人たちと仕事をするケースが増えている。今後はさらにAI技術を活用し、企業がさらなる変革を起こすのをサポートする。

その際には、ゴミデータを入れても結果はゴミにしかならない。だからこそデータを包括的に管理できるInformaticaへの期待は一層高まるはずだ。データ品質が良くなく、ガバナンスが確保できていなければ、AIの活用でトラブルが起きるはずだ。AIを使いこなしたければ、データを整備するためにまずはInformaticaに相談する。これからは、Informaticaはそういう存在でありたいとワリア氏は言うのだった。

Original Post>