AWS、「Amazon Bedrock」の基盤モデルを評価する新機能を提供

Amazon Web Services(AWS)は、Amazon Bedrockの新機能を発表しました。これにより、顧客は最適なモデルを迅速に評価、採用できるようになります。また、カスタムモデルを追加し、個人情報や有害コンテンツをブロックする機能も提供されます。AWSは「Guardrails for Amazon Bedrock」を一般提供しました。

Continue reading

失敗事例から学ぶ!生成AI 実践の成功への道筋──回答精度を90%向上したRAG構築のポイント

企業での生成AIの実用化には、システム開発チームとユーザーチームの協働と継続的な改善が不可欠。RAGの理解とチーム連携の重要性を説き、検索と生成の精度向上に成功。思考発話法を通じて業務の理解を深め、地道な努力が成功につながった。

Continue reading

生成AIの未来は「企業内データ」活用にあり、Cohesityはバックアップデータ利用で先を行けるか?

生成AIブームはまだまだ続いており、企業は生成AIを活用するためにデータを連携する方法を模索している。Cohesity Gaiaはバックアップデータを活用し、LLMに渡すことで知見を得られるサービスであり、このようなサービスが今後ますます需要が高まると予測される。

Continue reading

ファインチューニングの課題を解決する「RAG」と「エンべディング」

前回の記事では、企業データの追加学習方法であるファインチューニングを解説しました。今回は、「RAG」と「エンべティング」というもう1つの方法について詳しく説明します。RAGは、生成AIに情報検索機能を組み合わせたモデルであり、LLM Orchestration Frameworkがその主役です。LangChainはこのフレームワークで、プロンプト処理や言語モデル統合、情報検索、アプリケーション統合、エージェント、監視・ログなどを行います。ベクトルデータベースは、高次元ベクトルデータを格納するデータベースであり、類似度に強みがあります。

Continue reading

生成AIで多種多様な「社内データ」を活用するには?データサイエンティストの手を煩わせない手法を解説

最近の進化している生成AIや大規模言語モデルの普及について説明し、自社でのAI活用を進めるためのデータ運用視点とインフラについても述べる。企業で生成AIの活用や投資が増える中、自社のユースケースに活用するためには社内データの運用が重要。さらに、AI活用に関する3つのパターンやデータ運用の重要性にも触れる。 DataOpsの手法やデータパイプラインについても紹介し、データの運用に向けた戦略を立てるための考え方や具体的な手段を提案。

Continue reading

なぜ、GoogleはノートPCでも実行可能なAIモデル「Gemma」を発表したのか

Googleは2024年2月21日に最新の人工知能(AI)モデル「Gemma」を発表しました。このオープンソースのAIモデルは、処理性能に応じて2つのサイズ、「Gemma 2B」と「Gemma 7B」があります。Googleの「Gemma」開発の背景には、小規模言語モデルの需要が増加していることがあります。これにより、ユーザー企業は精度の高い処理を期待できます。

Continue reading

GoogleはマルチモーダルAI「Gemini」で“シェア拡大”となるか?

 2023年、AIベンダーOpenAIのLLM(大規模言語モデル)「GPT」に世界中の注目が集まり、各ITベンダーによるAI(人工知能)関連サービスの開発が進んだ。2024年も引き続きAI市場の動向に熱い視線が注がれる。 Googleは2023年12月、汎用(はんよう)的なAIモデル「Gemini」を発表し、同社のアプリケーション群に組み込む姿勢を明らかにした。あるアナリストは「Geminiは、Googleの市場シェア拡大の布石となる」と話す。GoogleがGeminiにかける戦略とは。同社が発表したAI関連のニュースと併せて解説する。 「Gemini」で市場シェア拡大となるか? Googleの戦略とは 「Googleは『マルチモーダルAI』をAI戦略の鍵として捉えている」。こう話すのは、調査会社Gartnerでアナリストを務めるチラグ・デカテ氏だ。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。 Geminiは、画像かテキストどちらかのみを出力するシングルタスク型のAIモデルと異なり、質問に対して画像とテキストの両方を生成できる。テキストや画像、動画など、複数種類のデータソースから学習することも可能だ。GeminiがGoogleの製品群に組み込まれることで、企業は自社ワークフローにマルチモーダルAIを適用することが容易になる。デカテ氏は、「Geminiを企業にとって使いやすい形で提供できれば、Googleは市場におけるシェアを大きく拡大できる可能性がある」と話す。 Geminiには処理性能や用途に応じた3つのモデルがある。その中でも高性能で複雑なタスクを処理できる最大のモデルが「Gemini Ultra」だ。 「Gemini Nano」はモバイルデバイス向けの最小モデルだ。Gemini Nanoの中でも低メモリデバイス用の「Nano-1」の学習に使われるパラメーター数は18億個と、Microsoftが2023年12月に発表した小規模言語モデル「Phi-2」の27億個よりも少ない。高メモリデバイス用の「Nano-2」のパラメーター数は32億5000万個だ。 一方で、AIモデルの性能はパラメーター数が大きいほど高くなるわけではない。Microsoftの主張によると、Phi-2の性能はNano-2や「Mistral」「Llama 2」といったオープンソースのAIモデルを上回るという。 Vertex AIにおけるImagen 2の提供 Googleは、機械学習モデル構築支援ツール「Vertex AI」における画像生成モデル「Imagen 2」の一般提供を発表した。開発者はImagen 2を使用することで、従来よりも高品質な画像やロゴの生成、多言語テキストレンダリング(テキストの描画)が可能となる。 Vertex AIの補償制度はImagen 2も適用範囲としている。例えば、著作権侵害の訴訟に関する費用の弁済も補償範囲だ。 Mistral AIとの提携 2023年12月に3億8500万ユーロを調達したことで知られるフランスのAIスタートアップMistral

Continue reading

生成AIの回答を「指示の出し方」で洗練させるプロンプトエンジニアリングとは

生成AIの効果的な使用には適切なプロンプトが必要です。このためプロンプトエンジニアリングが重要で、AgentaやPromptPerfectなどのツールがプロンプト作成をサポートします。これらのツールを利用することで、AIモデルのテストや評価、プロンプトの品質向上が可能となります。

Continue reading

Google最新鋭の生成AI「Gemini」は何が違うのか Microsoftと異なる発想

2024年2月8日、GoogleはAIチャットbot “Google Bard”の名称を “Gemini”に変更し、Gemini Advancedを発表。Geminiは処理性能に応じた3つのモデルを持ち、Gemini Advancedは最も複雑なタスクを処理できる基盤モデル「Ultra 1.0」を採用。MicrosoftのCopilotに対抗し、Google WorkspaceやGoogle Cloudでの利用を推進。__JETPACK_AI_ERROR__

Continue reading

Google、Microsoft、AWSの主要クラウド3社「生成AI戦略」の違いとは?

主要なクラウドベンダーであるAWS、Microsoft、Googleは、AI技術を活用した様々なサービスを競い合っている。それぞれの優位性はクラウドインフラ、先行者利益、オフィススイートなどにあり、さらに開発者の信頼性やデータ保護規制においても競争が続いている。

Continue reading

マッキンゼーが語る「生成AI」にはオンプレミスより「クラウド」を使うべき理由

生成AIとクラウドコンピューティングは相互補完的な関係にあり、両者の普及にクラウドサービスが鍵を握る。生成AIを使う際には、クラウドサービスを活用することが重要であり、クラウドベンダーはそのためのツールを提供している。これにより、生成AIの活用は容易になったとスリバスサン氏は述べている。

Continue reading

「OpenAI GPTs」と「画像生成AI」

「ChatGPT Plus」は、カスタム指示で応答をカスタマイズ可能。GPT Builderで特定用途のGPTを作成可能。また、Made by OpenAI GPTsでは多様な専用GPTが提供されており、学習データは2023年4月までに拡張された。さらに、画像生成AIについて解説されている。

Continue reading

Google Cloud「Gemini」の全貌:マルチモーダル基盤モデルが企業クラウドにもたらす可能性

Google Cloudの「Gemini」は、マルチモーダル基盤モデルの新境地として発表されました。テキスト、画像、音声、動画、コードなど多様な情報を扱い、幅広いタスクに対応できるこのモデルは、複雑な推論まで可能です。寳野氏と下田氏は、2023年のGoogle Cloud Applied AI Summitにて、Geminiのネイティブなマルチモーダル機能やNano、Pro、Ultraのサイズバリエーションを紹介。また、Vertex AIとAI Studioを用いてGeminiがどのように活用されるか、その開発環境やTPU v5pの革新性、コスト効率についても説明しました。Geminiのプレビュー開始やModel Gardenへの統合、さらには法的リスクへの対応など、企業が安心して利用できるような対策も強調されました。

Continue reading

医学に関するチャットGPTの回答、正答率は文献数と関連

横浜市立大学の研究チームは、米オープンAI(OpenAI)のチャットボット「チャットGPT(ChatGPT)」が医学に関する質問に対して回答する際の正誤を左右する要因を明らかにした。 研究チームは、日本の医師国家試験3年分をチャットGPTに出題し、その正答率と回答の一貫性を集計した。その結果、大規模言語モデル「GPT-3.5」を使った場合(正答率56.4%、回答の一貫性56.5%)よりも、「GPT-4」を使った場合(正答率81.0%、回答の一貫性88.8%)の方が、正答率、回答の一貫性ともに優れていた。 続いて試験問題を出題形式(単肢選択問題/多肢選択問題/計算問題)と出題内容(循環器学、小児科学などの分野)に応じて分類し、正答率に関係する因子を探索した。チャットGPTが、インターネット上の膨大なテキストデータで学習していることから、インターネット上の情報量の指針の一つとして、世界的な学術文献・引用情報データベースであるウェブ・オブ・サイエンス・コア・コレクション(Web of Science Core Collection)に収蔵されたすべての文献数を集計した。その結果、出題内容と正答率は、出題分野における総文献数と有意に関連することが明らかになった。また、出題形式や回答の一貫性も正答率に関連することが分かった。 研究成果は11月3日、インターナショナル・ジャーナル・オブ・メディカル・インフォマティクス(International Journal of Medical Informatics)誌にオンライン掲載された。 (笹田)

Continue reading

1 2 3 4 5