アメリカのIT大手グーグルは、動画やテキストなどを組み合わせて入力し動画を生成できる新たなAIモデル「Gemini Omni」など新たなサービスを発表しました。
鏡越しに自身を撮影する男性。鏡を触ると、突然、男性の姿がぬいぐるみのように。
グーグルは19日、開発者向けイベントの「グーグルI/O」を開き、様々な新サービスを発表しました。
「Gemini Omni」は、動画や画像、テキストなどを自由に組み合わせて入力し、動画を生成することができます。現実世界の物理法則を理解し、撮影された動画から物体を消したり、画角を変えたりすることもできます。
また、AIエージェントサービス「Gemini Spark」ではメールやスケジュールなど複数のアプリを横断し、利用者の指示に基づいて作業を代行してくれます。
クラウド上で動くため、パソコンを閉じた状態でも24時間作業を進めることができます。
ブラウザのクロームとも連携する予定で、メールやカレンダーなども含めた個人利用が多い強みをいかし、エージェント分野での存在感を高めたい狙いもあるとみられます。
「台湾海峡の平和と安定を破壊しているのは中国」台湾・頼清徳総統 就任から2年で記者会見 改めてアメリカからの武器売却の継続求める