Google Cloud「Gemini」の全貌:マルチモーダル基盤モデルが企業クラウドにもたらす可能性

Google Cloudの「Gemini」は、マルチモーダル基盤モデルの新境地として発表されました。テキスト、画像、音声、動画、コードなど多様な情報を扱い、幅広いタスクに対応できるこのモデルは、複雑な推論まで可能です。寳野氏と下田氏は、2023年のGoogle Cloud Applied AI Summitにて、Geminiのネイティブなマルチモーダル機能やNano、Pro、Ultraのサイズバリエーションを紹介。また、Vertex AIとAI Studioを用いてGeminiがどのように活用されるか、その開発環境やTPU v5pの革新性、コスト効率についても説明しました。Geminiのプレビュー開始やModel Gardenへの統合、さらには法的リスクへの対応など、企業が安心して利用できるような対策も強調されました。

Continue reading

医学に関するチャットGPTの回答、正答率は文献数と関連

横浜市立大学の研究チームは、米オープンAI(OpenAI)のチャットボット「チャットGPT(ChatGPT)」が医学に関する質問に対して回答する際の正誤を左右する要因を明らかにした。 研究チームは、日本の医師国家試験3年分をチャットGPTに出題し、その正答率と回答の一貫性を集計した。その結果、大規模言語モデル「GPT-3.5」を使った場合(正答率56.4%、回答の一貫性56.5%)よりも、「GPT-4」を使った場合(正答率81.0%、回答の一貫性88.8%)の方が、正答率、回答の一貫性ともに優れていた。 続いて試験問題を出題形式(単肢選択問題/多肢選択問題/計算問題)と出題内容(循環器学、小児科学などの分野)に応じて分類し、正答率に関係する因子を探索した。チャットGPTが、インターネット上の膨大なテキストデータで学習していることから、インターネット上の情報量の指針の一つとして、世界的な学術文献・引用情報データベースであるウェブ・オブ・サイエンス・コア・コレクション(Web of Science Core Collection)に収蔵されたすべての文献数を集計した。その結果、出題内容と正答率は、出題分野における総文献数と有意に関連することが明らかになった。また、出題形式や回答の一貫性も正答率に関連することが分かった。 研究成果は11月3日、インターナショナル・ジャーナル・オブ・メディカル・インフォマティクス(International Journal of Medical Informatics)誌にオンライン掲載された。 (笹田)

Continue reading

マイクロソフトのAI研究者、独自開発の軽量型言語モデルや医療のAI活用を語る

「AIフォーラム2023」が東京大学とMicrosoft Research Asiaにより開催された。両者はAIと社会・科学のシナジーを追求し、研究成果を共有した。グリーントランスフォーメーションやダイバーシティ&インクルージョン、AI研究の推進などが議論された。特に、Microsoftは新型AI「phi-1」、「phi-1.5」を開発し、これらはより小型ながら大型言語モデルと同等の性能を有することが明らかにされた。

Continue reading

AIチャットへの質問、1割近くが「性的な内容」–安全なAIを目指す研究者らの取り組み

研究者らは25言語の大型言語モデルを使い、100万件の会話を収集しデータベース化、10万件をランダムに抽出した。この内容から「安全ではない」トピックも存在していることが明らかになった。さらにOpenAIの技術を部分的に使用してタグ付けを行ったが、失敗もあった。この研究は既存のAIモデルの安全性を改善するための重要なステップとなる可能性が示された。

Continue reading

イーロン・マスクのBCIで「脳の高速通信」は実現できる?

イーロン・マスク所有のニューラリンク社が、脳に直接電極を取り付けることで人間のデータ転送速度を上昇させる技術の実験を開始しました。既存の技術の2倍の電極を有する「N1」のインプラントをボランティアのALS患者や脊髄損傷者に装着し、思考による外部機器の制御を試みます。マスクは長期的な目標として、通信速度を1000倍に引き上げることも提唱しています。

Continue reading

AIの次なる波「マルチビュー」–対象物を複数の視点から捉えて関連付ける利点と課題

いわゆるマルチビューとは、2つの異なる信号が、同じ対象物について違いはあっても共通して持っている情報を考慮することで、それらの信号を関連付ける方法のことだ。マルチビューは、世界の構造をより豊かに認識できるマシンへの道を開く可能性があり、「推論」と「計画」が可能なマシンという目標の達成に貢献するかもしれない。

Continue reading

大規模言語モデルの終焉と“小さなモデル”の台頭──GPU不足を打破する、複合モデルやOSSの発展へ

今、私たちの生活は前例のないペースで進化しています。その推進力となっているのが「AI」。中でも、LLM(大規模言語モデル)の出現は単なる技術の向上や効率化に留まらず、人々のコミュニケーション、考え方、社会全体の運営にまで影響を及ぼし始めています。このテクノロジーの背後にある課題と解決策に焦点を当てることで、私たちは未来への理解を深め、より良い世界を築くための道筋を見通すことができるのではないでしょうか。

Continue reading

ChatGPTのプラグイン【前半】

今回はChatGPT Plugin storeにある16個の人気プラグインのうち、主にコンテンツへのアクセスをサポートするものを7つ紹介します。また、ChatGPTとプラグインがどのような関係にあるかも理解しましょう

Continue reading

チャットGPTはどのように質の高い文章をつくっているのか

大規模言語モデル(LLM)は、まだ予測マシンの域を出ていない部分もあるが、人工知能(AI)が人間の意思決定を支援する方法を様変わりさせつつある。LLMの出現により、人間が判断を下す方法が大きく変わろうとしていからだ。では、LLMを使った対話型AIのチャットGPTはどのようにして、平均的な人間の書き手よりも質の高い文章をつくり出しているのか。

Continue reading

グーグル、「Duet AI」をクラウドセキュリティに統合

Googleは米国時間8月29日、サンフランシスコのモスコーニセンターで開催中の年次カンファレンス「Google Cloud Next」で、同社のクラウドおよびセキュリティソリューションの能力強化に重点を置く人工知能(AI)ベースの新たなソリューションを発表した。

Continue reading

1 2 3 4 5