アメリカIT大手グーグルは、生成AIの新たな基盤モデル「ジェミニ」を発表しました。生成AIで大きな存在感を示す「チャットGPT」を上回る性能があるとしています。

グーグルが6日に発表した新たな基盤モデル「ジェミニ」は、文章だけでなく、画像や音声など複雑な処理も可能です。デモンストレーション動画では、鳥の絵を認識したうえで、水面に浮かんでいる様子を付け加えると「カモですね」などと、画像を認識したうえで回答しました。

「ジェミニ」は、上位モデルの「ウルトラ」、普及版の「プロ」、それにスマートフォンなどで利用される「ナノ」があります。

「プロ」はグーグルの対話型AI「バード」に搭載され、当初は英語のみですが、無料で170以上の国と地域で利用でき、今後、ほかの場所や言語にも拡大させる予定だということです。

グーグルは、「ジェミニ」が「チャットGPT」を手掛けるオープンAIの基盤モデル「GPT-4」を超える性能があるとしていて、今後は開発者などの顧客企業も利用可能にし、オープンAIのリードを巻き返したい考えです。