アメリカIT大手グーグルは、生成AIの新たな基盤モデル「ジェミニ」を発表しました。生成AIで大きな存在感を示す「チャットGPT」を上回る性能があるとしています。
グーグルが6日に発表した新たな基盤モデル「ジェミニ」は、文章だけでなく、画像や音声など複雑な処理も可能です。デモンストレーション動画では、鳥の絵を認識したうえで、水面に浮かんでいる様子を付け加えると「カモですね」などと、画像を認識したうえで回答しました。
「ジェミニ」は、上位モデルの「ウルトラ」、普及版の「プロ」、それにスマートフォンなどで利用される「ナノ」があります。
「プロ」はグーグルの対話型AI「バード」に搭載され、当初は英語のみですが、無料で170以上の国と地域で利用でき、今後、ほかの場所や言語にも拡大させる予定だということです。
グーグルは、「ジェミニ」が「チャットGPT」を手掛けるオープンAIの基盤モデル「GPT-4」を超える性能があるとしていて、今後は開発者などの顧客企業も利用可能にし、オープンAIのリードを巻き返したい考えです。
「犠牲になった人々の魂を忘れてはならない」国光外務副大臣が演説 核軍縮への道筋などに向け話し合うNPT再検討会議