Google最新鋭の生成AI「Gemini」は何が違うのか Microsoftと異なる発想

2024年2月8日、GoogleはAIチャットbot “Google Bard”の名称を “Gemini”に変更し、Gemini Advancedを発表。Geminiは処理性能に応じた3つのモデルを持ち、Gemini Advancedは最も複雑なタスクを処理できる基盤モデル「Ultra 1.0」を採用。MicrosoftのCopilotに対抗し、Google WorkspaceやGoogle Cloudでの利用を推進。__JETPACK_AI_ERROR__

Continue reading

Google、Microsoft、AWSの主要クラウド3社「生成AI戦略」の違いとは?

主要なクラウドベンダーであるAWS、Microsoft、Googleは、AI技術を活用した様々なサービスを競い合っている。それぞれの優位性はクラウドインフラ、先行者利益、オフィススイートなどにあり、さらに開発者の信頼性やデータ保護規制においても競争が続いている。

Continue reading

マッキンゼーが語る「生成AI」にはオンプレミスより「クラウド」を使うべき理由

生成AIとクラウドコンピューティングは相互補完的な関係にあり、両者の普及にクラウドサービスが鍵を握る。生成AIを使う際には、クラウドサービスを活用することが重要であり、クラウドベンダーはそのためのツールを提供している。これにより、生成AIの活用は容易になったとスリバスサン氏は述べている。

Continue reading

「OpenAI GPTs」と「画像生成AI」

「ChatGPT Plus」は、カスタム指示で応答をカスタマイズ可能。GPT Builderで特定用途のGPTを作成可能。また、Made by OpenAI GPTsでは多様な専用GPTが提供されており、学習データは2023年4月までに拡張された。さらに、画像生成AIについて解説されている。

Continue reading

Google Cloud「Gemini」の全貌:マルチモーダル基盤モデルが企業クラウドにもたらす可能性

Google Cloudの「Gemini」は、マルチモーダル基盤モデルの新境地として発表されました。テキスト、画像、音声、動画、コードなど多様な情報を扱い、幅広いタスクに対応できるこのモデルは、複雑な推論まで可能です。寳野氏と下田氏は、2023年のGoogle Cloud Applied AI Summitにて、Geminiのネイティブなマルチモーダル機能やNano、Pro、Ultraのサイズバリエーションを紹介。また、Vertex AIとAI Studioを用いてGeminiがどのように活用されるか、その開発環境やTPU v5pの革新性、コスト効率についても説明しました。Geminiのプレビュー開始やModel Gardenへの統合、さらには法的リスクへの対応など、企業が安心して利用できるような対策も強調されました。

Continue reading

医学に関するチャットGPTの回答、正答率は文献数と関連

横浜市立大学の研究チームは、米オープンAI(OpenAI)のチャットボット「チャットGPT(ChatGPT)」が医学に関する質問に対して回答する際の正誤を左右する要因を明らかにした。 研究チームは、日本の医師国家試験3年分をチャットGPTに出題し、その正答率と回答の一貫性を集計した。その結果、大規模言語モデル「GPT-3.5」を使った場合(正答率56.4%、回答の一貫性56.5%)よりも、「GPT-4」を使った場合(正答率81.0%、回答の一貫性88.8%)の方が、正答率、回答の一貫性ともに優れていた。 続いて試験問題を出題形式(単肢選択問題/多肢選択問題/計算問題)と出題内容(循環器学、小児科学などの分野)に応じて分類し、正答率に関係する因子を探索した。チャットGPTが、インターネット上の膨大なテキストデータで学習していることから、インターネット上の情報量の指針の一つとして、世界的な学術文献・引用情報データベースであるウェブ・オブ・サイエンス・コア・コレクション(Web of Science Core Collection)に収蔵されたすべての文献数を集計した。その結果、出題内容と正答率は、出題分野における総文献数と有意に関連することが明らかになった。また、出題形式や回答の一貫性も正答率に関連することが分かった。 研究成果は11月3日、インターナショナル・ジャーナル・オブ・メディカル・インフォマティクス(International Journal of Medical Informatics)誌にオンライン掲載された。 (笹田)

Continue reading

マイクロソフトのAI研究者、独自開発の軽量型言語モデルや医療のAI活用を語る

「AIフォーラム2023」が東京大学とMicrosoft Research Asiaにより開催された。両者はAIと社会・科学のシナジーを追求し、研究成果を共有した。グリーントランスフォーメーションやダイバーシティ&インクルージョン、AI研究の推進などが議論された。特に、Microsoftは新型AI「phi-1」、「phi-1.5」を開発し、これらはより小型ながら大型言語モデルと同等の性能を有することが明らかにされた。

Continue reading

AIチャットへの質問、1割近くが「性的な内容」–安全なAIを目指す研究者らの取り組み

研究者らは25言語の大型言語モデルを使い、100万件の会話を収集しデータベース化、10万件をランダムに抽出した。この内容から「安全ではない」トピックも存在していることが明らかになった。さらにOpenAIの技術を部分的に使用してタグ付けを行ったが、失敗もあった。この研究は既存のAIモデルの安全性を改善するための重要なステップとなる可能性が示された。

Continue reading

イーロン・マスクのBCIで「脳の高速通信」は実現できる?

イーロン・マスク所有のニューラリンク社が、脳に直接電極を取り付けることで人間のデータ転送速度を上昇させる技術の実験を開始しました。既存の技術の2倍の電極を有する「N1」のインプラントをボランティアのALS患者や脊髄損傷者に装着し、思考による外部機器の制御を試みます。マスクは長期的な目標として、通信速度を1000倍に引き上げることも提唱しています。

Continue reading

AIの次なる波「マルチビュー」–対象物を複数の視点から捉えて関連付ける利点と課題

いわゆるマルチビューとは、2つの異なる信号が、同じ対象物について違いはあっても共通して持っている情報を考慮することで、それらの信号を関連付ける方法のことだ。マルチビューは、世界の構造をより豊かに認識できるマシンへの道を開く可能性があり、「推論」と「計画」が可能なマシンという目標の達成に貢献するかもしれない。

Continue reading

大規模言語モデルの終焉と“小さなモデル”の台頭──GPU不足を打破する、複合モデルやOSSの発展へ

今、私たちの生活は前例のないペースで進化しています。その推進力となっているのが「AI」。中でも、LLM(大規模言語モデル)の出現は単なる技術の向上や効率化に留まらず、人々のコミュニケーション、考え方、社会全体の運営にまで影響を及ぼし始めています。このテクノロジーの背後にある課題と解決策に焦点を当てることで、私たちは未来への理解を深め、より良い世界を築くための道筋を見通すことができるのではないでしょうか。

Continue reading

1 2 3