中国の電子商取引大手アリババグループが、新たな人工知能(AI)モデル「Qwen2.5-Omni-7B」を公開した。テキストや画像、音声、映像の処理が可能で、携帯電話やノートパソコン上で直接動作する効率性を備えているという。

アリババは新モデルについて、人に代わり自律的に作業を行う「AIエージェント」構築への活用を見込んでいると説明。例えば、こうしたエージェントがリアルタイムの音声描写で周辺環境をナビゲートし、視覚障害者を支援することなどを想定する。

同社は今年に入りAI製品を急ピッチでリリースしている。1月には中国の人工知能(AI)スタートアップ、DeepSeek(ディープシーク)のAIモデルが話題になった直後にQwenの別バージョンを発表。今月も既にAIアシスタント「Quark」の新バージョンを公開していた。

さまざまなデータに対応した「マルチモーダル」モデルを手掛けているのは、アリババだけではない。オープンAIやアルファベット傘下のグーグルはともに、テキストや音声など異なる入力を処理する生成AIツールを提供している。

新モデルについてアリババは、音声の理解や生成で特に高い性能を発揮したと文章で説明している。

同社はAIとクラウドコンピューティングネットワークの分野で、過去10年の実績を上回る規模を投資する計画だ。

ディープシークがわずか数百万ドルで構築したとされる強力なAIモデルで米オープンAIに対抗して以降、中国のテクノロジー大手は低コストのAIサービスを次々と市場に投入。オープンAIやグーグルなどのプレミアムサービスと比べた安さを売りに攻勢をかけている。

中国AIモデルが、欧米勢の先端システムをしのぐのか結論はまだ先だが、新たな選択肢で米大手のビジネスモデルへの圧力は強まっている。

原題:Alibaba Debuts AI Model That Can Process Video, Audio on Phones(抜粋)

もっと読むにはこちら bloomberg.co.jp

©2025 Bloomberg L.P.