記事のサマリー(TL;DR)
- Decart が Oasis 3 を API 公開。1秒あたり $0.02 で無限に走行シミュレーションを生成可能
- Toyota・Adobe・eBay・Nvidia が出資する3億ドル調達後、評価額は約 40億ドル(約6,000億円)に到達
- 長時間生成でのテーマ整合性劣化・物理衝突判定の欠如など、技術的課題も現状は残る
自動運転・ロボティクス開発に携わる国内 AI 活用企業が注目すべき点
Oasis 3 は自律走行車(AV)の開発現場が最初のターゲットですが、Decart はロボティクスや「フィジカル AI」全般への展開も明言しています。日本は Toyota が戦略投資家として参画しており、国内の自動運転・物流ロボット領域における採用検討が現実的な射程に入っています。
価格面では、競合他社比で「1桁以上安い」とされる $0.02/秒という料金設定が導入ハードルを下げています。ただし、長時間走行時の環境崩壊(テーマ整合性の劣化)や車両同士の物理衝突が未対応という現状の制約は、本番データ収集ではなくエッジケースの洗い出しや初期プロトタイプ検証向けの用途に限定する判断が現状は妥当です。
生成 AI の業務活用を進める企業にとっては、「LLM の API 登場時と同じ構造変化がフィジカル AI の世界モデルでも始まった」という Decart CEO のフレーミング自体が、次の投資領域を見極める上で重要なシグナルになります。
詳細
Oasis 3 とは何か
AI スタートアップ Decart は 2025年6月10日、最新インタラクティブ世界モデル 「Oasis 3」 を TechCrunch に独占公開しました。同モデルは、テキストプロンプト1つからフォトリアルな走行環境をリアルタイムで生成し、ユーザーが実際にその世界の中を何時間でも走行できるという特徴を持ちます。現時点では API 経由で利用可能です。
Decart の共同創業者兼 CEO である Dean Leitersdorf 氏は「実際に人々がプログラムできる、初めて実用的な世界モデルになる」と述べ、OpenAI が言語モデルで API を開放した際と同様の開発者エコシステムが生まれると予測しています。
主なターゲットと拡張計画
当初のターゲットは、レアな走行シナリオを大規模にシミュレーションしたい自律走行車(AV)企業です。その後、ロボティクスや他のフィジカル AI 用途への展開を計画しています。
同社はすでに 10万人以上の開発者コミュニティを持ち、そのほとんどはリアルタイム動画生成モデル 「Lucy」 の上に EC やライブストリーミング向けのプロダクトを構築しています。Oasis 3 は Lucy のファウンデーションモデルを土台にしており、同社のフィジカル AI への本格参入を示す製品です。
価格・資金・評価額
利用料金は $0.02/秒。エンタープライズ向けはユースケース別の個別料金となります。
Oasis 3 の公開は、Decart が 3億ドルの資金調達を完了してから数週間後のことです。この調達により評価額は 約40億ドル(約6,000億円)に達しました。戦略的投資家には Toyota・Adobe・eBay が名を連ね、既存投資家の Nvidia も参加しました。Leitersdorf 氏は、これらの企業全てが潜在顧客になり得ると説明しています。
調達の背景には、EC・ライブストリーミング・フィジカル AI における「モデルへの需要の大幅増加」があったとのことです。
競合環境
世界モデル市場は競争が激化しています。
- Google:研究プレビューとして「Genie 3」を公開
- Fei-Fei Li 氏の World Labs:商用向けに「Marble」を発表
- Luma・Runway などの動画生成スタートアップ:物理考慮型の動画モデルを世界モデルに転用
Decart の差別化ポイントは、フォトリアリズムの品質と無制限生成の2点です。
技術的な優位性:DOS スタック
Oasis 3 の効率性を支えるのが、Decart のもう一つの主力製品 DOS(Decart Optimization Stack) です。このソフトウェアは Nvidia・Amazon・Google のハードウェア上でモデルを効率的に動作させ、競合他社と比べて「1桁以上安く」モデルを実行できます。
Leitersdorf 氏は「ハードウェアレベルまで垂直統合しているから、業界の誰よりも1桁以上コストを削減できる」と語り、同社がこれまでに費やした計算コストは「大幅に1億ドル未満」だと明かしました。
Oasis 3 は3カメラ構成(前方1台・側面2台)で物理的に正確なマルチカメラ環境を生成し、自動運転システムのトレーニングとテストに対応します。
実際に触れてみた:強みと現状の限界
TechCrunch の記者が実際にテストした結果、初期シーンの品質は高いと評価しました。「ニューヨークの朝の街並み」というプロンプトに対して美しい描写を生成しましたが、走行を続けるにつれて次第に「一般的な西洋の都市」へと変質していきました。最初の交差点に戻ろうとすると、そこには全く別の環境が生成されていたといいます。
現状では以下の課題が指摘されています。
- テーマ整合性の急速な劣化:長時間走行するほどプロンプトとの乖離が拡大
- 操作応答性の低さ:車の進行方向のコントロールが難しい
- 物理衝突判定の欠如:他の車をすり抜けてしまい、物理シミュレーションが正確でない
- 夢のような断片的な体験:一貫したシミュレーションというより、非連続なシーンの連続に近い感覚
Leitersdorf 氏は物理衝突の問題を「現在取り組んでいる重要な研究課題」と認めつつ、「良い運転のデータが事故のデータと比べて圧倒的に多い」ことが根本原因だと説明しました。
アーキテクチャ:自己回帰モデルとコンテキスト窓の課題
Oasis 3 は自己回帰型(auto-regressive)モデルです。1フレームずつ生成し、直前の生成内容を参照しながら次のフレームを決定します。この方式は多くの世界モデルで採用されている一方、計算コストが高く、整合性の維持が難しいという特性があります。
Leitersdorf 氏は技術的詳細をこう説明します。「1フレームの生成に約8,000トークンを使います。毎秒数十フレームを生成すると、1秒あたり数十万トークンになります。コンテキスト窓はすぐに埋まってしまう。何百万トークンもの長いコンテキストをどう扱うか、またメモリを少ないトークンに圧縮する方法を研究しています。」
整合性の問題については、次バージョンで部分的に解決できると見込んでいます。次バージョンでは、画像ではなく動画を起点として世界を生成できるようになる予定です。
開発者エコシステムへの賭け
Leitersdorf 氏が繰り返し強調するのは、「技術の現状の限界」よりも「開発者がAPIを手にしたときに何が起きるか」です。
「OpenAI がモデルの API を発明した LLM の黎明期を思い出す。3ヶ月後に話すとき、『100人の開発者が Oasis の上に100種類の異なるアプリを作って、私たちを驚かせてくれた』と言えるはずだ」と語っています。
世界モデルという分野はまだ初期段階にあるとしつつも、API を軸に開発者コミュニティを形成することで、LLM が歩んだのと同様の進化曲線を描こうとする戦略が明確です。