影眸科技数亿融资落袋,3D生成进入可编辑时代

影眸科技完成凯辉基金、上海国投先导领投的数亿元融资,同步发布千万面级3D生成模型Rodin Gen-2.5。更值得关注的是其今年Q1发布的Rodin Gen-2 Edit——这是行业首个让AI生成的3D模型真正可编辑的技术突破。
影眸科技数亿融资落袋,3D生成进入可编辑时代
影眸科技刚刚宣布完成新一轮数亿元融资,由凯辉基金、上海国投先导领投,老股东持续跟投。字节跳动、美团龙珠、红杉、蓝驰此前已相继押注这家公司。
这不是一笔普通的融资。2026年的3D生成赛道正在经历一场混战——6月VAST官宣新融资,Meshy紧随其后发布所谓「全球首款3D AI Agent」。影眸选择在这个节点出手,带来的是真正的技术代差:千万面级生成能力,以及让AI 3D模型第一次可编辑的Rodin Gen-2 Edit。
3D生成的「不可编辑」困局
过去两年,3D生成模型的进展肉眼可见。从最早只能生成模糊轮廓,到现在能输出看起来像模像样的角色和物件。但有一个问题始终横亘在商业化面前:生成的东西改不了。
这听起来可能有点反直觉。图像生成不是早就能局部重绘了吗?
3D和2D的复杂度完全不在一个量级。一张图片是像素的二维排列,改一块区域就是改那些像素。但3D模型是几何结构、拓扑关系、UV映射、材质贴图的复合体。你想把一个角色的手臂改粗一点,涉及的是网格顶点的移动、面片的重新划分、贴图坐标的重映射、法线的重新计算——牵一发而动全身。
更麻烦的是,大多数3D生成模型输出的是某种中间表示——NeRF、3D Gaussian Splatting、或者SDF场。这些表示形式对渲染友好,但对编辑极度不友好。你没法像在Maya或Blender里那样选中一个顶点拖动它,因为根本就没有传统意义上的顶点。
这导致了一个尴尬的局面:AI能在几秒钟内生成一个3D模型,但如果这个模型有任何不满意的地方,专业美术师要么重新生成碰运气,要么干脆从头手工建模。AI生成变成了一个「要么全盘接受,要么全部推翻」的赌博。
对于电商场景的产品展示、或者对精度要求不高的应用,这或许还能接受。但对于游戏、影视、工业设计这些真正高价值的市场,不可编辑就意味着不可用。
Rodin Gen-2 Edit:首个原生可编辑的3D生成
影眸在今年一季度发布的Rodin Gen-2 Edit,第一次让AI生成的3D模型具备了真正的可编辑性。
这不是在现有模型上加一个编辑模块那么简单。影眸的做法是从底层架构重新设计——他们提出的CLAY架构,是业内定义主流AI 3D生成范式的原生3D方案。简单说,CLAY让模型在生成过程中就考虑到了后续编辑的需求,输出的是结构化的、可操作的3D资产,而不是一团需要后处理的隐式表示。
具体能做什么?
局部修改不崩全局
你可以选中模型的某个部分,用文字描述你想要的修改。比如「把这把椅子的靠背改成镂空设计」或者「给这个角色加上翅膀」。模型会理解空间关系和结构约束,只修改相关部分,保持其他区域的完整性。
这背后的技术挑战在于语义理解和几何约束的统一。模型需要同时理解「靠背」是什么、「镂空」意味着什么几何操作、以及这个操作如何在不破坏椅子整体结构的前提下实现。
风格迁移与材质编辑
生成一个基础模型后,可以指定风格方向进行全局调整——从写实到卡通,从低多边形到精细雕刻。材质层面的编辑同样支持:换个木纹、加点做旧效果、调整金属质感的粗糙度。
保持生产管线兼容性
编辑后的模型输出的是标准格式(FBX、OBJ、GLTF等),可以直接导入主流DCC软件继续加工。UV映射、材质通道、骨骼绑定(如果有的话)都保持正确。这一点看起来是基本功,但在3D生成领域,能做到这点的屈指可数。
Rodin Gen-2.5:千万面级生成与「思考」范式
伴随这轮融资,影眸同步发布了Rodin Gen-2.5。如果说Gen-2 Edit解决的是「能不能改」的问题,Gen-2.5解决的是「能生成多精细」的问题。
千万面级:精度的数量级跃迁
此前市面上的3D生成模型,输出精度通常在几万到几十万面的级别。这对于游戏里的远景物件或者低保真原型够用,但对于近景角色、产品级渲染、3D打印,远远不够。
Rodin Gen-2.5是全球首个千万面级3D生成模型。最快4秒可以生成百万面模型,完整精度输出则需要更长时间。影眸提供了可调节的精度模式,让用户在速度和质量之间按需选择。
举个具体的例子:一个百万面的角色模型,面部细节可以清晰到毛孔级别,手指关节的褶皱、衣物的缝线都能表现出来。这种精度已经可以直接用于次世代游戏的角色制作,或者高端产品的营销渲染。
12K原生贴图:告别模糊纹理
几何精度上去了,贴图精度也得跟上。Gen-2.5同步推出全球首个12K精度的原生3D贴图模型。
「原生」两个字很关键。很多3D生成方案的贴图是后处理阶段用2D超分模型拉上去的,这会导致贴图和几何不匹配——比如一个角色的纽扣在几何上是凸起的,但贴图上的高光位置对不上。原生贴图意味着几何和贴图在生成过程中就是耦合的,物理正确性有保障。

「先思考再生成」:推理时Scaling的3D版本
影眸把这一代模型的范式总结为「让3D生成进入思考时代」。这个说法借用了大语言模型领域的概念,但在3D生成里有具体的技术含义。
传统的3D生成是一个「直接映射」的过程:输入prompt,经过一系列神经网络层,直接输出3D表示。这个过程是快的,但也是「不过脑子」的——模型没有显式的推理步骤,不会在多个可能的解释之间权衡,不会检查自己的输出是否满足约束。
Gen-2.5引入了推理时计算的机制。模型在生成过程中会进行多步推理:先理解输入的语义,然后规划几何结构,接着逐步细化,期间持续检验生成结果是否符合预期。这有点像人类美术师的工作流程——先画草图确定大关系,再逐步深入细节,而不是一笔画完。
这种范式带来的好处是更强的可控性和一致性。复杂prompt的理解更准确,多视角的一致性更好,结构上的错误(比如穿模、断裂)更少。代价是推理时间更长,但影眸通过精度模式让用户自己做trade-off。
一家「反套路」的AI创业公司
影眸的团队构成在AI创业公司里相当另类。
创始人兼CEO吴迪、联合创始人兼CTO张启煊、以及另外两位联合创始人张龙文、曾初啸,全部来自上海科技大学。公司2020年成立,团队约60人,平均年龄不到25岁。这是一支极其年轻的团队,但学术履历相当硬核:
- 连续数年获得SIGGRAPH最佳论文及提名(SIGGRAPH是计算机图形学的顶级会议,最佳论文的含金量极高)
- 提出了CLAY架构,定义了主流AI 3D生成的技术范式
- 算法团队每2人中就有1人获得或提名过最佳论文
学术成果能转化成商业成功吗?影眸的数据给出了肯定的答案。
B端:客户数和收入都是行业第一
影眸的B端客户包括字节跳动、Unity、Figma、Canva等。据36氪报道,其B端客户数及收入比行业内其他公司加起来还要多。海外收入占总收入约80%——这是一家从一开始就全球化的公司。
主要的B端场景包括:
- 电商:产品3D展示、AR试穿试戴
- 游戏:角色和场景资产批量生成
- 工业设计:快速原型、概念验证
- 3D打印:可直接打印的高精度模型
- 具身智能:机器人训练用的3D场景合成
商业模式包括平台订阅、API售卖、私有化部署、以及直接交付最终资产。灵活度很高,能适配不同体量客户的需求。
C端:Gen-2.5上线后反超B端
有意思的是,Rodin Gen-2.5上线后,C端收入正在反超B端。这说明专业个人用户——独立游戏开发者、自由3D艺术家、设计工作室——对高质量3D生成的付费意愿比预想的强。
影眸的C端定位是「专业用户」而非大众消费者。他们没有去做那种「一键生成3D头像」的to C应用,而是把工具的专业度和可控性放在第一位。这个策略在当前阶段是对的——3D生成的大众化还需要时间,但专业用户已经能从现有能力中获得实打实的生产力提升。
行业格局:技术代差正在拉开
3D生成赛道在2026年进入了洗牌期。
第一梯队和第二梯队的差距正在显性化。判断标准很简单:生成的东西能不能直接进生产管线。
能做到这点的公司,客户会持续付费,因为AI在实实在在地降低成本、提升效率。做不到这点的公司,产品停留在「玩具」阶段,好玩但不实用,最终会面临获客成本高于LTV的困境。
影眸的可编辑能力是一个关键的分水岭。它意味着AI生成可以真正嵌入专业工作流,而不是游离在工作流之外的一个独立环节。美术师可以用AI生成一个80分的底稿,然后用专业软件调整到100分——这才是人机协作该有的样子。
Meshy、VAST等竞争对手也在快速迭代,但目前公开的信息显示,它们在可编辑性和输出精度上还有差距。当然,这个领域的技术进展很快,领先优势能保持多久是个问号。影眸的护城河在于学术积累和工程化能力的结合——CLAY架构不是一朝一夕能复刻的。
技术细节:为什么原生3D架构重要
稍微深入一点技术层面。
当前3D生成的主流路线有几条:
-
2D lifting:用多视角图像生成,然后通过MVS或NeRF重建3D。问题是多视角一致性难以保证,重建出来的几何常常有错误。
-
Triplane + 解码器:用三个正交平面的特征图表示3D,再解码成网格。效率高,但表达能力有限,细节容易丢失。
-
3D Gaussian Splatting:渲染质量好,但输出的是点云而非网格,编辑性差,导出到传统管线麻烦。
-
原生3D生成(如CLAY):直接在3D空间中进行生成,输出结构化的网格。
影眸走的是第四条路。CLAY的核心思想是让生成过程感知3D结构,而不是把3D当作2D的附属品。具体实现涉及3D位置编码、结构化的Attention机制、以及针对网格拓扑的损失函数。
这条路的难度更高——3D数据的稀缺性、计算复杂度、以及网格表示的离散性都是挑战。但收益也更大:输出直接可用,编辑性有保障,物理正确性更好。
接下来看什么
影眸没有披露这轮融资的具体金额,只说是「数亿元」。凯辉基金和上海国投先导领投,老股东跟投,说明一二级市场对3D生成赛道的信心还在。
接下来几个值得关注的点:
-
C端收入能否持续超过B端。如果能,说明专业个人用户市场比预想的大,影眸可能会调整产品策略,加大C端投入。
-
可编辑能力的深化。Gen-2 Edit是第一步,但目前公开的信息还比较有限。更复杂的编辑操作(比如拓扑结构的修改、动画绑定的调整)能否支持,决定了这个能力的天花板。
-
具身智能场景的落地。3D场景合成是机器人训练的刚需,这个市场正在爆发。影眸有没有在这个方向布局,值得观察。
-
模型开放程度。目前影眸的模型主要通过API和平台提供,没有开源。如果未来选择开放部分能力,对行业格局会有很大影响。
3D生成正在从「能生成」走向「能用」的阶段。影眸这轮融资和新模型发布,标志着这个赛道进入了下半场。
本文无参考链接



