Google、AI技術の大幅アップデートを発表
グーグルは、AI製品の一連のアップデートを発表した。その中には、Gemini 1.5 Flashの導入、Gemini 1.5 Proの機能強化、そしてAIアシスタントの未来像であるProject Astraの進捗が含まれている。
Gemini 1.5 Flashは、グーグルのモデルファミリーに新たに加わったもので、大規模に提供するためのより高速で効率的なモデルとして設計されている。1.5 Proよりも軽量ではあるが、膨大な情報にわたるマルチモーダル推論の能力を維持しており、100万トークンという画期的な長いコンテキストウィンドウを備えている。
グーグルDeepMindのCEOであるデミス・ハサビス氏は、「1.5 Flashは、要約、チャットアプリケーション、画像や動画のキャプション付け、長文書やテーブルからのデータ抽出などに優れています。これは、1.5 Proによって『蒸留』と呼ばれるプロセスを通じてトレーニングされているためです。より大きなモデルから最も重要な知識とスキルを、より小さく効率的なモデルに転送するのです」と説明した。
一方、グーグルはGemini 1.5 Proモデルの機能を大幅に向上させ、そのコンテキストウィンドウを画期的な200万トークンに拡張した。コード生成、論理的推論、複数ターンの会話、音声と画像の理解能力が向上している。
同社はまた、Gemini 1.5 ProをGemini AdvancedやWorkspaceアプリなどのグーグル製品に統合した。さらに、Gemini Nanoがマルチモーダル入力を理解するようになり、テキストのみから画像を含むように拡張された。
グーグルは、画期的なパフォーマンスと効率性を実現するために設計された次世代のオープンモデルであるGemma 2を発表した。Gemmaファミリーは、PaLI-3にインスパイアされた同社初のビジョン言語モデルであるPaliGemmaでも拡大している。
最後に、グーグルは、AIアシスタントの未来像であるProject Astra(高度な視覚と会話の応答エージェント)の進捗状況を共有した。同社は、情報をより速く処理し、文脈をよりよく理解し、会話で素早く応答できるプロトタイプエージェントを開発した。
グーグルCEOのスンダー・ピチャイ氏は、「私たちは常に、日常生活で役立つ汎用エージェントを構築したいと考えてきました。Project Astraは、マルチモーダルな理解とリアルタイムの会話能力を示しています」と説明した。
「このような技術があれば、人々が電話やメガネを通して専門家のAIアシスタントを身近に置ける未来を容易に想像できます」
グーグルは、これらの機能の一部が今年後半に同社の製品に登場すると述べている。開発者は、Geminiに関連するすべてのアナウンスをここで見つけることができる。
グリームハブ合同会社は、AIメンバーで価値創出に挑戦する会社です。人材不足が加速する中、AI活用で最前線を走ります。