ChatGPTやClaude(クロード)といった高性能チャットボットに注目が集まるなか、人工知能(AI)の別の分野である「世界モデル」の成長は見過ごされがちだ。これらのシステムは3次元(3D)空間や物理法則を把握し、ロボットからスマートグラス、自動運転車に至るまで幅広い用途の基盤となるものであり、現在のチャットボットに欠けている能力を備えている。

過去2週間で、エヌビディアやアリババグループ、テンセント・ホールディングス(騰訊)がそれぞれ独自の世界モデルを公開し、新たなプレーヤーが次のAI革命を主導する可能性を示した。最前線に立つ企業は異なる戦略を追求しており、テンセントの「HY-World 2.0」はオープンソースである一方、エヌビディアのモデルはリサーチャー向けに限定されている。中国は、大規模言語モデル(LLM)の分野で見られたような後れを取る存在では、もはやないことを示しつつある。

ChatGPTのようなボットは、物理世界の仕組みを理解しているように見えるが、実際には、物質的な体験や物の永続性には基づかない巧妙な模倣者に過ぎない。物の永続性とは、例えばコップや椅子が視界から消えても、存在し続けていると理解・認識できる能力で、人間は乳幼児期に成立する。言語モデルは洗練された文章で部屋を描写できるが、ソファがドアを通るか、壁に当たって跳ね返ったボールがどこに落ちるかといった問いには、物理的な力の働きを理解しているのではなく、学習データのパターンに基づいて答えるため、誤る可能性がある。世界モデルはこのギャップを埋めることを目的としている。

この取り組みは静かに勢いを増しており、現実世界のデータを活用する多様なアプローチやビジネスモデルが生まれている。その中には、10年前に登場し大きな話題を呼んだゲームも含まれる。数百万人がポケモンを捕まえるため、街角でスマートフォンをかざしたアプリ「ポケモンGO」を覚えているだろうか。同アプリはその後、世界規模の地図データを蓄積し、ココ・ロボティクスのような企業と共有している。同社の配送ロボットは米国や欧州の複数都市で食料品を運搬している。

一方、ドアダッシュはギグワーカーに報酬を支払い、洗濯物を畳んだり皿を洗ったりする様子を撮影してもらい、訓練用としてロボット企業に販売できるようなデータを蓄積している。また、インスタカートはエヌビディアと共同で、センサーやカメラを備えたショッピングカートを開発した。その目的はロボットの訓練ではなく、広告や在庫管理向けのデータ収集にある。

一部の科学者は、AIに対するこのアプローチこそが、人間に近い知能を機械に埋め込むための次の重要な一歩だと主張する。これはOpenAIやアンソロピック、アルファベット傘下のグーグルが長年追い求めてきた目標でもある。

そうした未来像を描く企業の一つが、スタンフォード大学発のスタートアップ企業のWorld Labsだ。同社は視覚認識分野の先駆的研究で「AIのゴッドマザー」と称されるフェイフェイ・リー氏が設立した。同社は2月、初期の資金調達ラウンドで10億ドルを獲得したと発表した。

World Labsは、「Marble」と呼ばれるモデルを用いて独自の仮想世界を生成し、将来的にはゲームや仮想現実(VR)、ロボット訓練の分野で顧客獲得を目指している。ただし、エヌビディア、アドバンスト・マイクロ・デバイセズ(AMD)、オートデスクなどの出資を受けた後も、収益化への道筋は明確ではない。「ウォール街、特に後期段階の投資家は、この技術が実際の用途へと成熟するのをなお見極めている段階だ」とリー氏は最近のインタビューで語った。それでも「これは言語知能と同じくらい深いインパクトを持つと確信している」と続けた。

さらに、リー氏によれば、言語とは異なりオンライン上には3Dデータがあまり存在しないことから、合成データが世界モデルにとって「不可欠」になると見込む。言い換えれば、次世代のAIはドアダッシュの配達員が服を畳む動画だけでなく、他のAIが生成した映像を主に学習して構築される可能性がある。これは、それ自体が新たなビジネスモデルとなる可能性を秘めている。

現在の言語モデルの時代は、資金力のある少数の米研究機関が閉鎖的で独自仕様のモデルを武器に主導する見通しだ。一方、世界モデルはライセンスも比較的オープンで、収益化の手法についてはまだ共通認識が形成されておらず、より多様なアプローチと地域にまたがって発展しつつあるように見える。

世界モデルの分野では中国がより大きな役割を果たすと言えよう。バークレイズの研究者によると、ハードウエアと製造分野での強みを背景に、中国は昨年、世界の人型ロボットの約85%から90%を出荷した。中国の世界モデルがロボット訓練の標準となり始めれば、今後10年のフィジカルAIを形作る企業は、現在ニュースで取り上げられているような企業ではなく、シリコンバレーからも遠く離れた場所にある企業なのかもしれない。

(パーミー・オルソン氏はブルームバーグ・オピニオンのテクノロジー担当コラムニストです。ウォールストリート・ジャーナル(WSJ)やフォーブスで記者経験があり、著書は「Supremacy: AI, ChatGPT and the Race That Will Change the World」など。このコラムの内容は個人の意見で、必ずしも編集部やブルームバーグ・エル・ピー、オーナーらの意見を反映するものではありません)

原題:ChatGPT and Claude? The Real AI Action Is Elsewhere: Parmy Olson(抜粋)

もっと読むにはこちら bloomberg.com/jp

©2026 Bloomberg L.P.