7月17日から18日の2日間にかけ、SAS Institute Japanは「SAS Innovate on Tour 2024」を開催した。この記事では2日目の「テクノロジー・キーノート」の内容からSASの新製品、そして中核製品であるSAS Viyaの強化ポイントを紹介する。
合成データが生成できるSAS Data Maker
冒頭に登壇したジャレッド・ピーターソン氏は、「生成AIで今抱えている問題が全て解決されると思うべきではない。戦略的に対応しなければ混乱の原因にもなりうる。適切なプロセス、ツール、ガバナンスが不可欠であり、だからこそSAS Viyaで良い状態を維持し、ビジネスの生産性向上に取り組んでほしい」と訴えた。
現在のSASのAI戦略は、「LLM」「合成データ」「デジタルツイン」の3つのテーマに焦点を当てている。最初に紹介のあったSAS Data Makerは2つ目の合成データに関係している。合成データとは、統計的に本物のデータに劣らない品質のデータを生成するもので、SAS Data Makerを利用することで、簡単に早く必要な合成データを得ることができる。なぜ合成データが必要かと言えば、可能な限り多くのデータを収集しても、そのデータを全て利用できるとは限らないためだ。
2番目に登壇したマリネラ・プロフィ氏も、「現実世界のデータにはお客様の個人情報が含まれることもあれば、偏見が含まれている可能性もある。その場合、分析やAIのトレーニングには使うことはできない。集めたデータのうち、90%のデータが問題なく利用できるものだとしても、10%がそうでなかったとしたらどうするか。現場はこの問題に苦しんでいる。合成データは理想と現実のギャップを埋める方法を提供してくれる」と説明していた。
AIは多くのデータを必要としている。ましてやLLMが参照するデータが出力結果の質を決めるともなれば、これまで以上に信頼できるデータを大量に収集しなくてはならない。生成AI活用の進展に伴うニーズに応えて、SASがプライベートプレビューで提供しているのがSAS Data Makerになる。SAS Data Makerを使うと、データセットを指定し、合成データを作るように指示するだけで、数分程度で分析に利用できるデータが揃う。データエンジニアは、できた合成データの質の確認や、元のデータセットと合成データの類似性を確認もできる。
すでにある大規模金融機関がSAS Data Makerを使い、個人向け融資の焦げ付き確率を93%の精度で予測することに成功した。モデルのパフォーマンスも50%の向上が認められたという。合成データは、企業がより速く正確に意思決定を行うことを支援してくれる。2024年7月には、Snowflake MarketplaceでData Makerが利用できるようにもなった。このパートナーシップで、2社の製品を利用している場合の利便性が向上したことになる。SAS Data Makerの一般提供開始は2024年末を予定している。
生産性向上のために提供するSAS Viya Workbench
次にピーターソン氏が紹介したのが、2024年4月に一般利用が始まったSAS Viya Workbenchである。SAS Viya WorkbenchはAIモデル構築に特化した開発環境で、主力製品であるSAS Viyaを拡張機能として提供するものになる。データが増えれば、モデルを実装するためのコードも増える。ピーターソン氏は、SAS Viya Workbenchをコードの増加に開発者が対応できるようにするためのものと位置付け、クラウドネイティブでスケーラブルな環境の提供を重視していることを強調した。プロフィ氏も、「Viya Workbenchの良いところはSAS言語にもPython言語にも対応すること」と評する。現時点では、SASとPythonが利用できるのみだが、2024年末に向けてRへの対応も進めているところだ。
SAS Viya Workbenchはほんの数秒で、開発環境を立ち上げることができ、Jupyter Notebook/JupyterLabおよびVisual Studio Codeの2つの開発環境に対応している。また、セルフプロビジョニング機能やセルフターミネイト機能を備え、AI開発者は最小限のITサポートで柔軟性の高い開発環境を利用できる。プロフィ氏は、「データ量が増えてくれば、コンピュートサイズを大きくするだけで、SAS Viya Workbenchをスケーリングできる。スケーラビリティニーズに環境が適応してくれる」と説明した。
また、分析専用の環境には、カスタマイズ可能なCPU/GPUが搭載され、プロジェクトニーズに応じた演算能力が得られるようにもしている。さらに、モデルなどの成果物はSAS Viyaでデータ管理やガバナンスで活用し、オペレーションに展開できる。AI開発者が自身の使い慣れた言語や開発環境を選べるようにすることで、AIモデル構築に伴う作業が効率化すると同時に、より創造性の高いことに集中できるようにもなる。
開発者にもビジネスユーザーにも役に立つSAS Viya Copilot
開発生産性の向上という意味では、AIプラットフォームSAS Viyaを拡張したSAS Viya Copilotも有用だ。「Copilot」と名前にある通り、会話型アシスタントとしてコードの提案やアイデア出しのサポートで開発者を支援し、ビジネスユーザーが行う分析をより効果的なものにしてくれる。生成AIと聞くと、真っ先にLLMをイメージする傾向があるが、LLMだけでは企業のビジネス課題を解決することはできない。LLMはビジネスプロセスに統合され、AIライフサイクルの統制を行えるような状態を作って初めて価値を発揮できるようになると、SASは考えている。
プロフィ氏は、「企業がビジネス価値を実現するには、AIライフサイクルの加速が不可欠になる。全ての時間のかかるタスクを、会話ベースで実行できるようにするため、SAS Viya Copilotを提供することにした」と述べ、SASユーザーらしい使い方を紹介した。例えば、大気の質のデータを分析して知見を得たいと考えたとする。SAS Viya Copilotに「大気の質に関するデータセットを表で示して。それから、それぞれの表にどんなデータが入っているのかを教えて」と頼む。数秒程度で2つの表を提示してくれた。次に、この表の1つをクリックすると、SAS Viya Copilotはそのデータセットに適用できる分析テクニックの候補を示してくれる。国ごとの分布を知りたいと思ったら、その結果を出してくれる。
また、「開発者にはコードへのアクセスを可能」とプロフィ氏は続けた。SAS Viya Copilotを開発者が使うと、SASコードの生成、コードの説明ができるほか、分析のアイデアが出ないとき「この後、どうしたらいいか」と聞いてみれば、次に何ができるのか、分析の改善で何ができるのかを教えてくれる。SAS Viya Copilotの特徴は、LLMの種類を選ばないこと、企業のセキュリティ要件に配慮し、Viya環境の中のデータだけで利用を完結できるようにしたことだ。
会話ベースでViyaの環境を利用するように変われば、ビジネス課題解決のスピードも早くなる。これはAIライフサイクルの加速が実現することに他ならない。開発者はAIの力でその能力を拡張して発揮できるようになるだろう。今後に向けては、「銀行、保険、ヘルスケアなど、業界特有の業務に対応する独自のCopilotを作れるようにしたい。あるいは、同じ企業でも部門固有のCopilotを作れるようにしたい」とプロフィ氏は語った。
AIモデルをスタンドアロン製品として提供「Models as a Product」
生成AI時代にはデータが増加する。コードが増加する。さらにモデルも増加する。意思決定の質とスピードを上げようとすると、企業がより多くのモデルにアクセスできることが望ましい。そこでSASは業界特化型モデルや業務特化型モデルをパッケージにして、単体の製品として出すことにした。これは2023年5月にSASがAIに10億ドルを投資すると表明してから、取り組んできたことの成果の1つになる。ウド・スグラヴォ氏は「Models as a Product」と呼び、モデルを提供することがどういうことかを解説した。
「現在のAI市場の顧客は大きく3つに分類できる。第一にAI開発者、第二にビジネスユーザー、そしてモデルの消費者である。今回スタンドアロンパッケージとして提供するModels as a Productのターゲットユーザーは3番目のモデルの消費者になる」とスグラヴォ氏は説明した。SASは世界中の企業のビジネス課題の解決をサポートしてきた。その知見を活かし、リアルなユースケースを基にSAS Viyaで軽量型モデルパッケージ製品に仕立てた。スグラヴォ氏は、「市場のデータサイエンティスト不足の問題に対するSASからの回答。モデルを利用することで、人材不足に悩む企業はこの問題から解放される。データサイエンティストが揃っている企業はより重要な問題に注力できる」と述べ、大きなビジネス価値創出を実現する機会を提供するとした。
「Models as a Product」で提供するモデルは、銀行、保険、公共機関、ライフサイエンスの4つの業態に焦点を当てて開発を進めている。具体的には、「Computer Vision」「AI Digital Assistants」がある。まず、Computer Visionはデータエンジニアリングのためのモデルで、PDF形式のファイルの要素を分解し、構造化データ要素に抽出し、分析用途に利用できるようにするものになる。一方、AI Digital Assistantsは、SASシステムの中のアルゴリズムにLLMを組み合わせ、専門家でなくても高度なアナリティクスにアクセスできるようにするものだ。例えば、物流の配送ルート最適化アルゴリズムにLLMを組み合わせれば、管理者はトラックドライバーに何時にどこに行くかを指示できる。
また、スグラヴォ氏は、2024年第4四半期に出てくる予定のモデルとして「Payment Fraud Detection(金融取引の不正検知)」「Welfare Fraud Detection(福祉の不正受給の検知)」を挙げた。制度の違いがあるので、米国で利用できるモデルが日本にそのまま適用できるとは限らない。この点について、スグラヴォ氏は「SASコンサルタントが関与し、地域ごとに役に立つモデルを作っていく」と説明した。また、これらのモデルはSAS Viyaと統合されることで価値を発揮できる。
「モデルを市場にリリースするとは、ディープラーニングのアルゴリズムを提供して終わりにはできない。長年にわたり、SASは多くの企業と仕事をしてきた。スタートアップには同じことができない。
Enjoyed this article? Sign up for our newsletter to receive regular insights and stay connected.
