AI 快讯3.2亿美元,这家公司要用游戏数据训练通用AI
行业快讯

3.2亿美元,这家公司要用游戏数据训练通用AI

2026-06-25T18:05:14.369Z
3.2亿美元,这家公司要用游戏数据训练通用AI

General Intuition 完成 3.2 亿美元融资,估值达 23 亿美元。这家从游戏视频平台 Medal 分拆出来的 AI 实验室,押注用数十亿条游戏视频训练具身 AI,试图让机器学会人类的「物理直觉」。

3.2亿美元,这家公司要用游戏数据训练通用AI

General Intuition 今天宣布完成 3.2 亿美元融资,估值 23 亿美元。贝佐斯和施密特都投了钱。

这是一个相当激进的赌注:用游戏视频训练能在现实世界行动的 AI 智能体。不是训练打游戏的 AI,而是训练理解物理世界的 AI。

核心逻辑:为什么是游戏数据?

当前大语言模型有一个根本性的局限——它们是从文本中学习世界的。

GPT-4、Claude、Gemini,这些模型能写出关于「如何骑自行车」的完美说明文,但它们对「保持平衡」这件事没有任何直觉。它们知道「苹果会落地」是因为读过牛顿的故事,而不是因为「感受」过重力。

General Intuition 的创始团队认为,这是 AI 通往通用智能的关键瓶颈。他们在官网上写得很直白:

主要在人类语言档案上训练的机器智能,继承了语言的辉煌与局限:没有具身体验的平面抽象,没有参与的预测。

翻译成人话就是:光读书不实践,永远学不会游泳。

游戏数据的价值恰恰在这里。

General Intuition 的时空推理引擎示意图,展示 AI 如何从游戏视频中学习物体运动规律

每一段游戏视频都是一个微型物理实验室。玩家操控角色跳跃,AI 能看到:跳跃的起始姿态、空中的抛物线轨迹、落地的缓冲动作。玩家开车撞墙,AI 能看到:碰撞前的速度、撞击时的形变、反弹后的运动方向。

这些信息在传统数据集里几乎找不到。ImageNet 是静态图片,YouTube 视频大多是固定机位,自动驾驶数据集的视角单一。只有游戏视频同时具备三个特性:

  • 第一人称视角:玩家的操作直接对应视觉变化
  • 物理交互密集:每秒都在发生碰撞、移动、变形
  • 场景多样性极高:从写实赛车到科幻射击,物理规则的变体应有尽有

更关键的是数据量。General Intuition 的母公司 Medal 是一个游戏短视频平台,每年产生超过 20 亿条 游戏剪辑。这个规模远超任何现有的具身 AI 数据集。

技术路径:时空推理引擎

General Intuition 的目标不是做一个「游戏 AI」,而是构建他们所说的「时空预测引擎」(spatiotemporal prediction engine)。

简单说,就是让 AI 学会回答这类问题:

  • 这个物体下一秒会在哪里?
  • 如果我推它一下,会发生什么?
  • 这个形状的东西能不能穿过那个洞?

这类能力在学术上叫「空间-时间推理」(spatial-temporal reasoning),是具身智能的核心能力。人类婴儿在 3-4 个月大时就开始发展这种能力,但对 AI 来说一直是难题。

传统方法是用强化学习在模拟器里从零训练,但效率极低。OpenAI 训练 Dota 2 AI 用了相当于 45000 年的游戏时长;DeepMind 的 AlphaStar 训练 200 年的星际争霸。这种方法对单一任务有效,但无法迁移。会打 Dota 的 AI 对端咖啡毫无帮助。

General Intuition 走的是另一条路:先用海量游戏视频预训练通用的物理直觉,再针对具体任务微调

这和 LLM 的范式类似。GPT 先读完互联网上的文本,学会「语言是怎么回事」,然后才能被微调成写代码、做客服、当律师助手。General Intuition 想让 AI 先「看」完几十亿小时的游戏视频,学会「物理世界是怎么回事」,然后才能被微调成控制机械臂、开车、做家务。

团队在这个方向上有深厚积累。他们的研究成果包括:

| 项目 | 发表 | 核心贡献 | |------|------|----------| | IRIS | ICLR 2023 Oral | 用 Transformer 实现样本高效的世界模型 | | Δ-IRIS | ICML 2024 | 上下文感知的高效 tokenization | | DIAMOND | NeurIPS 2024 Spotlight | 用扩散模型做世界建模 |

这些论文的共同主题是「世界模型」(World Models)——让 AI 在脑子里模拟物理世界,而不是靠穷举试错。

竞争格局:为什么 OpenAI 愿意出 5 亿美元?

今年早些时候,The Information 报道称 OpenAI 曾出价 5 亿美元收购 General Intuition,但被拒绝了。

这个价格说明几件事:

第一,数据护城河真实存在。 OpenAI 有钱、有算力、有人才,但它没有 20 亿条游戏视频。Medal 花了近十年积累这个数据集,这不是砸钱能快速复制的。

第二,巨头们认可这条路径。 OpenAI 自己在推 Sora 和具身智能项目,DeepMind 有机器人团队,Meta 在做 Habitat 模拟器。大家都在找突破具身智能的方法,游戏数据被认为是一个重要选项。

第三,估值逻辑已经变了。 去年 10 月 General Intuition 从 Medal 分拆时的种子轮是 1.337 亿美元,8 个月后估值翻了一倍。资本市场对「预训练物理直觉」这件事的信心在快速上升。

当然,拒绝 OpenAI 也有风险。

具身智能赛道的竞争正在加剧。Figure、1X、Agility 等机器人公司都在融大钱。Wayve(General Intuition 团队的校友参与创立)刚拿了 10 亿美元做端到端自动驾驶。Google DeepMind 的 Gemini 团队也在探索多模态物理推理。

General Intuition 的独特优势是数据资产,但护城河能守多久是个问号。如果 Google 决定用 YouTube Gaming 的视频做类似的事情,数据量差距会迅速缩小。

应用场景:从游戏到现实

General Intuition 目前披露的合作伙伴横跨多个领域:

游戏行业是显然的第一落地场景。Riot Games、Ubisoft、Epic Games 都出现在他们的合作名单里。用 AI 生成更智能的 NPC、更真实的物理效果、更高效的游戏测试——这些需求真实且付费意愿强。

机器人和自动驾驶是更长远的目标。团队和 Wayve 有渊源,后者用端到端学习做自动驾驶。General Intuition 的世界模型技术如果足够通用,理论上可以让机器人在虚拟环境中训练,然后迁移到真实世界(sim-to-real)。

科研机构也在合作名单中,包括剑桥大学、斯坦福商学院、CERN 等。学术界对「如何让 AI 理解物理」这个基础问题一直有浓厚兴趣。

但说实话,目前公开的实际产品还很少。这家公司更像是在做基础研究,商业化路径尚不清晰。这也是 23 亿美元估值的风险所在——如果两三年内拿不出杀手级应用,投资人的耐心会被消耗。

技术挑战:从游戏到现实的鸿沟

游戏数据训练 AI 的想法很诱人,但有几个硬核挑战需要解决:

1. 游戏物理 ≠ 真实物理

游戏引擎为了性能和游戏性,会大幅简化物理模拟。《GTA》里的车祸和真实车祸完全不同;《堡垒之夜》里的建筑不符合结构力学。AI 如果学到的是「游戏物理」,在真实世界可能会做出离谱的判断。

General Intuition 的解法可能是:让 AI 学会「物理直觉的抽象模式」而不是「具体的物理参数」。就像人类看完动画片也能理解「重的东西落得快」,即使动画里的物理不准确。

2. 视角和控制的差异

游戏里玩家用键盘鼠标控制角色,获得的是屏幕上的视觉反馈。机器人用电机控制关节,获得的是传感器数据。这两种「控制-反馈」回路差异巨大。

这可能是为什么 General Intuition 强调「第一人称视角」的重要性。第一人称游戏的视觉输入和机器人的摄像头输入更接近,比第三人称视角更容易迁移。

3. 长尾场景覆盖

游戏场景再丰富,也是设计师设计出来的。真实世界的混乱程度远超任何游戏。一个在《赛博朋克》里训练过的 AI,看到一只真猫从车底窜出来时,可能完全不知道该怎么办。

这是所有 sim-to-real 方法的共同难题,没有完美解法,只能靠更大规模的数据和更多的域随机化(domain randomization)来缓解。

行业影响:一条被低估的技术路线?

过去两年,AI 行业的注意力几乎全部集中在语言模型和图像生成上。具身智能虽然一直被提,但进展缓慢,投资也相对冷清。

General Intuition 的融资可能标志着一个转折点。

23 亿美元的估值意味着顶级投资人开始认真对待「物理智能」这件事。贝佐斯投了 Amazon 的机器人业务,对物流自动化的需求了然于胸。施密特一直关注 AI 的前沿方向,投过 Anthropic、Aleph Alpha 等公司。他们的背书会吸引更多资本进入这个赛道。

从技术路线看,General Intuition 代表了一种「数据驱动」的具身智能路径,和传统的「物理仿真」路径形成对比:

| 路径 | 代表方法 | 优势 | 劣势 | |------|----------|------|------| | 物理仿真 | Isaac Gym, MuJoCo | 物理准确 | 场景多样性差 | | 数据驱动 | General Intuition | 数据丰富多样 | 物理不准确 |

长期来看,两条路径可能会融合。用真实游戏数据学习粗粒度的物理直觉,再用精确仿真器微调具体任务。这种混合方法可能是通往通用具身智能的实际路径。

投资人名单:谁在押注这个赛道?

本轮 3.2 亿美元融资的投资阵容相当豪华:

  • Jeff Bezos(亚马逊创始人,个人投资)
  • Eric Schmidt(谷歌前 CEO,通过 Schmidt Ventures)
  • Khosla Ventures(领投方,硅谷顶级 VC)
  • General Catalyst(现有投资者,跟投)
  • Raine Group(现有投资者,跟投)

几点观察:

Khosla Ventures 的信号意义很强。 这家 VC 以押注早期深科技著称,投过 OpenAI(早期)、Impossible Foods、Oklo 等公司。它领投 General Intuition 说明认可团队和方向。

贝佐斯和施密特同时出现值得注意。 两人都不是撒网型投资人,而是有明确判断才出手。他们同时看好游戏数据训练 AI 这条路,至少说明业内对这个方向有共识。

估值跃迁非常快。 去年 10 月种子轮 1.337 亿美元,8 个月后 A 轮 3.2 亿美元估值 23 亿。即使考虑到 AI 赛道的泡沫成分,这个增速也说明资本对「物理直觉」故事的认可度在快速上升。

创始团队背景

General Intuition 从 Medal 分拆而来,核心团队有几个关键特点:

学术功底扎实。 团队成员发表过 ICLR Oral、ICML、NeurIPS Spotlight 等顶会论文,在世界模型和强化学习方向有持续产出。这在 AI 创业公司里是加分项,但不是决定性因素。

有独特数据资产。 Medal 平台积累的 20 亿条游戏视频是真正的护城河。这个数据集的规模和质量在业内独一无二。

团队规模小而精。 作为一个刚分拆的研究实验室,General Intuition 的人数应该还在两位数。这意味着执行效率可能高,但也意味着如果要大规模工程化,需要快速扩张团队。

总结:一个值得关注的新方向

看多的理由:

  • 数据资产独特,短期内难以复制
  • 技术方向被顶级投资人认可
  • 具身智能是 AI 下一阶段的重要方向
  • 团队学术积累深厚

看空的理由:

  • 从游戏到现实的迁移难度被低估
  • 商业化路径不清晰
  • 估值偏高,期望值已经打满
  • 巨头如果认真做,数据优势可能被追上

对开发者来说,General Intuition 的工作值得关注但不需要立即行动。如果你在做机器人、自动驾驶、游戏 AI 相关的项目,可以跟踪他们的开源论文和代码(IRIS、DIAMOND 等项目都有 GitHub 仓库)。如果只是做常规的应用开发,这个方向暂时和你关系不大。

具身智能的突破不会在一夜之间发生。但 General Intuition 的融资说明,资本已经开始为这个方向布局了。这可能是下一波 AI 浪潮的早期信号。


参考来源:

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: