影眸科技完成凯辉基金、上海国投先导领投的数亿元融资，同步发布千万面级3D生成模型Rodin Gen-2.5。更值得关注的是其今年Q1发布的Rodin Gen-2 Edit——这是行业首个让AI生成的3D模型真正可编辑的技术突破。

影眸科技数亿融资落袋，3D生成进入可编辑时代

影眸科技刚刚宣布完成新一轮数亿元融资，由凯辉基金、上海国投先导领投，老股东持续跟投。字节跳动、美团龙珠、红杉、蓝驰此前已相继押注这家公司。

这不是一笔普通的融资。2026年的3D生成赛道正在经历一场混战——6月VAST官宣新融资，Meshy紧随其后发布所谓「全球首款3D AI Agent」。影眸选择在这个节点出手，带来的是真正的技术代差：千万面级生成能力，以及让AI 3D模型第一次可编辑的Rodin Gen-2 Edit。

3D生成的「不可编辑」困局

过去两年，3D生成模型的进展肉眼可见。从最早只能生成模糊轮廓，到现在能输出看起来像模像样的角色和物件。但有一个问题始终横亘在商业化面前：生成的东西改不了。

这听起来可能有点反直觉。图像生成不是早就能局部重绘了吗？

3D和2D的复杂度完全不在一个量级。一张图片是像素的二维排列，改一块区域就是改那些像素。但3D模型是几何结构、拓扑关系、UV映射、材质贴图的复合体。你想把一个角色的手臂改粗一点，涉及的是网格顶点的移动、面片的重新划分、贴图坐标的重映射、法线的重新计算——牵一发而动全身。

更麻烦的是，大多数3D生成模型输出的是某种中间表示——NeRF、3D Gaussian Splatting、或者SDF场。这些表示形式对渲染友好，但对编辑极度不友好。你没法像在Maya或Blender里那样选中一个顶点拖动它，因为根本就没有传统意义上的顶点。

这导致了一个尴尬的局面：AI能在几秒钟内生成一个3D模型，但如果这个模型有任何不满意的地方，专业美术师要么重新生成碰运气，要么干脆从头手工建模。AI生成变成了一个「要么全盘接受，要么全部推翻」的赌博。

对于电商场景的产品展示、或者对精度要求不高的应用，这或许还能接受。但对于游戏、影视、工业设计这些真正高价值的市场，不可编辑就意味着不可用。

Rodin Gen-2 Edit：首个原生可编辑的3D生成

影眸在今年一季度发布的Rodin Gen-2 Edit，第一次让AI生成的3D模型具备了真正的可编辑性。

这不是在现有模型上加一个编辑模块那么简单。影眸的做法是从底层架构重新设计——他们提出的CLAY架构，是业内定义主流AI 3D生成范式的原生3D方案。简单说，CLAY让模型在生成过程中就考虑到了后续编辑的需求，输出的是结构化的、可操作的3D资产，而不是一团需要后处理的隐式表示。

具体能做什么？

局部修改不崩全局

你可以选中模型的某个部分，用文字描述你想要的修改。比如「把这把椅子的靠背改成镂空设计」或者「给这个角色加上翅膀」。模型会理解空间关系和结构约束，只修改相关部分，保持其他区域的完整性。

这背后的技术挑战在于语义理解和几何约束的统一。模型需要同时理解「靠背」是什么、「镂空」意味着什么几何操作、以及这个操作如何在不破坏椅子整体结构的前提下实现。

风格迁移与材质编辑

生成一个基础模型后，可以指定风格方向进行全局调整——从写实到卡通，从低多边形到精细雕刻。材质层面的编辑同样支持：换个木纹、加点做旧效果、调整金属质感的粗糙度。

保持生产管线兼容性

编辑后的模型输出的是标准格式（FBX、OBJ、GLTF等），可以直接导入主流DCC软件继续加工。UV映射、材质通道、骨骼绑定（如果有的话）都保持正确。这一点看起来是基本功，但在3D生成领域，能做到这点的屈指可数。

Rodin Gen-2.5：千万面级生成与「思考」范式

伴随这轮融资，影眸同步发布了Rodin Gen-2.5。如果说Gen-2 Edit解决的是「能不能改」的问题，Gen-2.5解决的是「能生成多精细」的问题。

千万面级：精度的数量级跃迁

此前市面上的3D生成模型，输出精度通常在几万到几十万面的级别。这对于游戏里的远景物件或者低保真原型够用，但对于近景角色、产品级渲染、3D打印，远远不够。

Rodin Gen-2.5是全球首个千万面级3D生成模型。最快4秒可以生成百万面模型，完整精度输出则需要更长时间。影眸提供了可调节的精度模式，让用户在速度和质量之间按需选择。

举个具体的例子：一个百万面的角色模型，面部细节可以清晰到毛孔级别，手指关节的褶皱、衣物的缝线都能表现出来。这种精度已经可以直接用于次世代游戏的角色制作，或者高端产品的营销渲染。

12K原生贴图：告别模糊纹理

几何精度上去了，贴图精度也得跟上。Gen-2.5同步推出全球首个12K精度的原生3D贴图模型。

「原生」两个字很关键。很多3D生成方案的贴图是后处理阶段用2D超分模型拉上去的，这会导致贴图和几何不匹配——比如一个角色的纽扣在几何上是凸起的，但贴图上的高光位置对不上。原生贴图意味着几何和贴图在生成过程中就是耦合的，物理正确性有保障。

Rodin Gen-2.5生成的高精度3D模型展示，对比展示不同精度模式的效果差异

「先思考再生成」：推理时Scaling的3D版本

影眸把这一代模型的范式总结为「让3D生成进入思考时代」。这个说法借用了大语言模型领域的概念，但在3D生成里有具体的技术含义。

传统的3D生成是一个「直接映射」的过程：输入prompt，经过一系列神经网络层，直接输出3D表示。这个过程是快的，但也是「不过脑子」的——模型没有显式的推理步骤，不会在多个可能的解释之间权衡，不会检查自己的输出是否满足约束。

Gen-2.5引入了推理时计算的机制。模型在生成过程中会进行多步推理：先理解输入的语义，然后规划几何结构，接着逐步细化，期间持续检验生成结果是否符合预期。这有点像人类美术师的工作流程——先画草图确定大关系，再逐步深入细节，而不是一笔画完。

这种范式带来的好处是更强的可控性和一致性。复杂prompt的理解更准确，多视角的一致性更好，结构上的错误（比如穿模、断裂）更少。代价是推理时间更长，但影眸通过精度模式让用户自己做trade-off。

一家「反套路」的AI创业公司

影眸的团队构成在AI创业公司里相当另类。

创始人兼CEO吴迪、联合创始人兼CTO张启煊、以及另外两位联合创始人张龙文、曾初啸，全部来自上海科技大学。公司2020年成立，团队约60人，平均年龄不到25岁。这是一支极其年轻的团队，但学术履历相当硬核：

连续数年获得SIGGRAPH最佳论文及提名（SIGGRAPH是计算机图形学的顶级会议，最佳论文的含金量极高）
提出了CLAY架构，定义了主流AI 3D生成的技术范式
算法团队每2人中就有1人获得或提名过最佳论文

学术成果能转化成商业成功吗？影眸的数据给出了肯定的答案。

B端：客户数和收入都是行业第一

影眸的B端客户包括字节跳动、Unity、Figma、Canva等。据36氪报道，其B端客户数及收入比行业内其他公司加起来还要多。海外收入占总收入约80%——这是一家从一开始就全球化的公司。

主要的B端场景包括：

电商：产品3D展示、AR试穿试戴
游戏：角色和场景资产批量生成
工业设计：快速原型、概念验证
3D打印：可直接打印的高精度模型
具身智能：机器人训练用的3D场景合成

商业模式包括平台订阅、API售卖、私有化部署、以及直接交付最终资产。灵活度很高，能适配不同体量客户的需求。

C端：Gen-2.5上线后反超B端

有意思的是，Rodin Gen-2.5上线后，C端收入正在反超B端。这说明专业个人用户——独立游戏开发者、自由3D艺术家、设计工作室——对高质量3D生成的付费意愿比预想的强。

影眸的C端定位是「专业用户」而非大众消费者。他们没有去做那种「一键生成3D头像」的to C应用，而是把工具的专业度和可控性放在第一位。这个策略在当前阶段是对的——3D生成的大众化还需要时间，但专业用户已经能从现有能力中获得实打实的生产力提升。

行业格局：技术代差正在拉开

3D生成赛道在2026年进入了洗牌期。

第一梯队和第二梯队的差距正在显性化。判断标准很简单：生成的东西能不能直接进生产管线。

能做到这点的公司，客户会持续付费，因为AI在实实在在地降低成本、提升效率。做不到这点的公司，产品停留在「玩具」阶段，好玩但不实用，最终会面临获客成本高于LTV的困境。

影眸的可编辑能力是一个关键的分水岭。它意味着AI生成可以真正嵌入专业工作流，而不是游离在工作流之外的一个独立环节。美术师可以用AI生成一个80分的底稿，然后用专业软件调整到100分——这才是人机协作该有的样子。

Meshy、VAST等竞争对手也在快速迭代，但目前公开的信息显示，它们在可编辑性和输出精度上还有差距。当然，这个领域的技术进展很快，领先优势能保持多久是个问号。影眸的护城河在于学术积累和工程化能力的结合——CLAY架构不是一朝一夕能复刻的。

技术细节：为什么原生3D架构重要

稍微深入一点技术层面。

当前3D生成的主流路线有几条：

2D lifting：用多视角图像生成，然后通过MVS或NeRF重建3D。问题是多视角一致性难以保证，重建出来的几何常常有错误。
Triplane + 解码器：用三个正交平面的特征图表示3D，再解码成网格。效率高，但表达能力有限，细节容易丢失。
3D Gaussian Splatting：渲染质量好，但输出的是点云而非网格，编辑性差，导出到传统管线麻烦。
原生3D生成（如CLAY）：直接在3D空间中进行生成，输出结构化的网格。

影眸走的是第四条路。CLAY的核心思想是让生成过程感知3D结构，而不是把3D当作2D的附属品。具体实现涉及3D位置编码、结构化的Attention机制、以及针对网格拓扑的损失函数。

这条路的难度更高——3D数据的稀缺性、计算复杂度、以及网格表示的离散性都是挑战。但收益也更大：输出直接可用，编辑性有保障，物理正确性更好。

接下来看什么

影眸没有披露这轮融资的具体金额，只说是「数亿元」。凯辉基金和上海国投先导领投，老股东跟投，说明一二级市场对3D生成赛道的信心还在。

接下来几个值得关注的点：

C端收入能否持续超过B端。如果能，说明专业个人用户市场比预想的大，影眸可能会调整产品策略，加大C端投入。
可编辑能力的深化。Gen-2 Edit是第一步，但目前公开的信息还比较有限。更复杂的编辑操作（比如拓扑结构的修改、动画绑定的调整）能否支持，决定了这个能力的天花板。
具身智能场景的落地。3D场景合成是机器人训练的刚需，这个市场正在爆发。影眸有没有在这个方向布局，值得观察。
模型开放程度。目前影眸的模型主要通过API和平台提供，没有开源。如果未来选择开放部分能力，对行业格局会有很大影响。

3D生成正在从「能生成」走向「能用」的阶段。影眸这轮融资和新模型发布，标志着这个赛道进入了下半场。

本文无参考链接

影眸科技数亿融资落袋，3D生成进入可编辑时代

影眸科技数亿融资落袋，3D生成进入可编辑时代

3D生成的「不可编辑」困局

Rodin Gen-2 Edit：首个原生可编辑的3D生成

局部修改不崩全局

风格迁移与材质编辑

保持生产管线兼容性

Rodin Gen-2.5：千万面级生成与「思考」范式

千万面级：精度的数量级跃迁

12K原生贴图：告别模糊纹理

「先思考再生成」：推理时Scaling的3D版本

一家「反套路」的AI创业公司

B端：客户数和收入都是行业第一

C端：Gen-2.5上线后反超B端

行业格局：技术代差正在拉开

技术细节：为什么原生3D架构重要

接下来看什么

相关推荐

欧盟押注意大利，400B参数要抢AI主权

抖音"造世界"亮相：多Agent驱动的3D UGC能玩出什么花样？

马斯克把数据中心搬上天：百万颗卫星组成的AI算力网络

联系我们