中国テック事情:GPT-4oだけじゃない中国語の訓練データ問題

オープンAI(OpenAI)の新しい人工知能(AI)オムニモデル、GPT-4oのリリースについての記事です。中国語トークンの訓練データがスパムに汚染されており、問題が浮上しています。中国での高品質な訓練データの入手の難しさにも触れられています。

Continue reading

日本マイクロソフト、「Copilot」の社内活用を披露–広まる“BYOAI”

 日本マイクロソフトは6月6日、「Microsoft Copilot for Microsoft 365」(Copilot for Microsoft 365)に関する記者向けセミナーを開催した。併せて国内外のAI活用動向も披露している。 同社 業務執行役員 モダンワークビジネス本部 本部長の山田恭平氏はAIについて「AIの筋トレがとても重要。AIは意識せずに使えるインフラではなく、既にスキルに分類されている。仕事に役に立つプロンプトもほかの人が同様に役立つとは限らない。だからこそAIスキルを磨くため、(Copilot for Microsoft 365を)使えば使うほど、組織の変化を感じられる」と述べた。 Copilot for Microsoft 365は改めて述べるまでもなく、「Microsoft 365」や「Bing Chat」のCopilot機能を使用する有償サービスである。2023年11月から開始したアーリーアクセスプログラムには、国内企業も約40社が参加。2024年1月には「Business Standard」「Business Premium」をはじめとするライセンス要件の拡張や、1ライセンスから契約可能にするなど、着々と存在感を高めている。 Microsoftが開催した開発者向けカンファレンスの「Build 2024」でも、「Microsoft

Continue reading

Anthropic、「Claude」のiOSアプリと企業向け「Team」プランを発表

Anthropicは、大規模言語モデル(LLM)「Claude」のiOSアプリとTeamプランを発表しました。Teamプランでは対話型インターフェースを使用して共同作業が可能であり、月額料金は1ユーザーあたり30ドルで、契約には5ユーザー以上が必要です。PfizerやBridgewater AssociatesなどがClaudeを活用し、それぞれの業務で成功を収めています。

Continue reading

「Gemini Advanced」に3つの新機能が追加–LLMも「Gemini 1.5 Pro」へ

 Googleが手がける最新の人工知能(AI)プロジェクトの1つである「Gemini Advanced」は、文章の作成、コードの生成、クリエイティブな共同作業で最新の技術を提供するために開発されたAIアシスタントだ。このGemini Advancedで利用できるAIモデルが、「Gemini 1.0 Ultra」から「Gemini 1.5 Pro」へと変わる。Gemini 1.5 ProはGoogleの最も強力なAIモデルで、100万トークンという長いコンテキストウィンドウを有している。35以上の言語に対応するほか、さらに多くの「Google」アプリに組み込まれる予定だ。 Googleは年次開発者会議「Google I/O」で、数カ月以内に追加されるGemini Advancedの最新アップデートについて発表した。この高度なAIボットは、月額20ドル(日本では2900円)の有料プランで利用できるが、今なら2カ月間無料で試用できる。 提供:Google Gemini 1.5 Proはコンテキスト長が100万トークンもあるため、Gemini Advancedのユーザーはより長く会話を続けたり、より長い文章をこのAIチャットボットで処理したりできる。また、有料プランのユーザーは、要約を作成したいファイルや答えを知りたい疑問が含まれるファイルをアップロードできるようになった。これには、長文のPDFも含まれる。 ファイルは、Gemini Advancedから直接アップロードすることも、「Googleドライブ」拡張機能を通じてアップロードすることも可能だ。100万トークンのコンテストウィンドウにより、ユーザーは最大1500ページのPDFをアップロードしたり、100件のメールの要約を作成したりできる。Gemini Advancedに高性能なGemini Pro 1.5モデルが搭載されたことで、画像認識能力が向上するなど、より高度なデータ解析が実現した。Googleの説明によれば、この高性能チャットボットが画像を処理し、ユーザーが撮影した料理のレシピを作成したり、写真から方程式を解いたりできるという。なお、アップロードされたファイルが公開されることはなく、AIモデルのトレーニングに使われることもないと、同社は述べている。 Googleはまた、年内にGemini Advancedのコンテキスト長を200万トークンにまで増やすことを明らかにした。これにより、3万行以上のコードや最大1時間の動画など、さらに大きなファイルを扱えるようになるという。 提供:Google

Continue reading

グーグルが「Astra」発表、AIアシスタントからエージェントへ

グーグルは最新のAIシステム「Astra(アストラ)」を発表しました。Astraは、情報取得だけでなく、推論や計画、記憶のスキルを持ち、タスク実行にも対応します。これはAIエージェントとしての機能を備え、ユーザーに最適なサポートを提供します。同時に、グーグルはAI検索とプランニング機能を強化し、新しいAIシステム「Veo(ベオ)」も導入します。

Continue reading

【加速する進化】「生成AI」の今と未来-「Nolang」で体験する次世代テクノロジー

生成AIに関するニュースがまとめられた記事です。記事は、Open AIのGPT-4の活用状況や企業内での生成AIに対する認識の違い、生成AIを活用したパートナープログラムや提携関係などについて紹介しています。また、実際の生成AIの活用シーンや最新の情報も紹介されています。

Continue reading

AWS、「Amazon Bedrock」の基盤モデルを評価する新機能を提供

Amazon Web Services(AWS)は、Amazon Bedrockの新機能を発表しました。これにより、顧客は最適なモデルを迅速に評価、採用できるようになります。また、カスタムモデルを追加し、個人情報や有害コンテンツをブロックする機能も提供されます。AWSは「Guardrails for Amazon Bedrock」を一般提供しました。

Continue reading

失敗事例から学ぶ!生成AI 実践の成功への道筋──回答精度を90%向上したRAG構築のポイント

企業での生成AIの実用化には、システム開発チームとユーザーチームの協働と継続的な改善が不可欠。RAGの理解とチーム連携の重要性を説き、検索と生成の精度向上に成功。思考発話法を通じて業務の理解を深め、地道な努力が成功につながった。

Continue reading

生成AIの未来は「企業内データ」活用にあり、Cohesityはバックアップデータ利用で先を行けるか?

生成AIブームはまだまだ続いており、企業は生成AIを活用するためにデータを連携する方法を模索している。Cohesity Gaiaはバックアップデータを活用し、LLMに渡すことで知見を得られるサービスであり、このようなサービスが今後ますます需要が高まると予測される。

Continue reading

ファインチューニングの課題を解決する「RAG」と「エンべディング」

前回の記事では、企業データの追加学習方法であるファインチューニングを解説しました。今回は、「RAG」と「エンべティング」というもう1つの方法について詳しく説明します。RAGは、生成AIに情報検索機能を組み合わせたモデルであり、LLM Orchestration Frameworkがその主役です。LangChainはこのフレームワークで、プロンプト処理や言語モデル統合、情報検索、アプリケーション統合、エージェント、監視・ログなどを行います。ベクトルデータベースは、高次元ベクトルデータを格納するデータベースであり、類似度に強みがあります。

Continue reading

生成AIで多種多様な「社内データ」を活用するには?データサイエンティストの手を煩わせない手法を解説

最近の進化している生成AIや大規模言語モデルの普及について説明し、自社でのAI活用を進めるためのデータ運用視点とインフラについても述べる。企業で生成AIの活用や投資が増える中、自社のユースケースに活用するためには社内データの運用が重要。さらに、AI活用に関する3つのパターンやデータ運用の重要性にも触れる。 DataOpsの手法やデータパイプラインについても紹介し、データの運用に向けた戦略を立てるための考え方や具体的な手段を提案。

Continue reading

なぜ、GoogleはノートPCでも実行可能なAIモデル「Gemma」を発表したのか

Googleは2024年2月21日に最新の人工知能(AI)モデル「Gemma」を発表しました。このオープンソースのAIモデルは、処理性能に応じて2つのサイズ、「Gemma 2B」と「Gemma 7B」があります。Googleの「Gemma」開発の背景には、小規模言語モデルの需要が増加していることがあります。これにより、ユーザー企業は精度の高い処理を期待できます。

Continue reading

GoogleはマルチモーダルAI「Gemini」で“シェア拡大”となるか?

 2023年、AIベンダーOpenAIのLLM(大規模言語モデル)「GPT」に世界中の注目が集まり、各ITベンダーによるAI(人工知能)関連サービスの開発が進んだ。2024年も引き続きAI市場の動向に熱い視線が注がれる。 Googleは2023年12月、汎用(はんよう)的なAIモデル「Gemini」を発表し、同社のアプリケーション群に組み込む姿勢を明らかにした。あるアナリストは「Geminiは、Googleの市場シェア拡大の布石となる」と話す。GoogleがGeminiにかける戦略とは。同社が発表したAI関連のニュースと併せて解説する。 「Gemini」で市場シェア拡大となるか? Googleの戦略とは 「Googleは『マルチモーダルAI』をAI戦略の鍵として捉えている」。こう話すのは、調査会社Gartnerでアナリストを務めるチラグ・デカテ氏だ。マルチモーダルとは、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できることを意味する。 Geminiは、画像かテキストどちらかのみを出力するシングルタスク型のAIモデルと異なり、質問に対して画像とテキストの両方を生成できる。テキストや画像、動画など、複数種類のデータソースから学習することも可能だ。GeminiがGoogleの製品群に組み込まれることで、企業は自社ワークフローにマルチモーダルAIを適用することが容易になる。デカテ氏は、「Geminiを企業にとって使いやすい形で提供できれば、Googleは市場におけるシェアを大きく拡大できる可能性がある」と話す。 Geminiには処理性能や用途に応じた3つのモデルがある。その中でも高性能で複雑なタスクを処理できる最大のモデルが「Gemini Ultra」だ。 「Gemini Nano」はモバイルデバイス向けの最小モデルだ。Gemini Nanoの中でも低メモリデバイス用の「Nano-1」の学習に使われるパラメーター数は18億個と、Microsoftが2023年12月に発表した小規模言語モデル「Phi-2」の27億個よりも少ない。高メモリデバイス用の「Nano-2」のパラメーター数は32億5000万個だ。 一方で、AIモデルの性能はパラメーター数が大きいほど高くなるわけではない。Microsoftの主張によると、Phi-2の性能はNano-2や「Mistral」「Llama 2」といったオープンソースのAIモデルを上回るという。 Vertex AIにおけるImagen 2の提供 Googleは、機械学習モデル構築支援ツール「Vertex AI」における画像生成モデル「Imagen 2」の一般提供を発表した。開発者はImagen 2を使用することで、従来よりも高品質な画像やロゴの生成、多言語テキストレンダリング(テキストの描画)が可能となる。 Vertex AIの補償制度はImagen 2も適用範囲としている。例えば、著作権侵害の訴訟に関する費用の弁済も補償範囲だ。 Mistral AIとの提携 2023年12月に3億8500万ユーロを調達したことで知られるフランスのAIスタートアップMistral

Continue reading

生成AIの回答を「指示の出し方」で洗練させるプロンプトエンジニアリングとは

生成AIの効果的な使用には適切なプロンプトが必要です。このためプロンプトエンジニアリングが重要で、AgentaやPromptPerfectなどのツールがプロンプト作成をサポートします。これらのツールを利用することで、AIモデルのテストや評価、プロンプトの品質向上が可能となります。

Continue reading

1 2 3