Cursor 自研模型 Composer 2.5 曝光:Kimi K2.5 底座 + Colossus2 算力
估值 293 亿美元的 AI 编程工具 Cursor 刚发布新模型 Composer 2.5,这次直接用上了月之暗面的 Kimi K2.5 做底座,训练算力来自 SpaceX 旗下 xAI 的 Colossus2 集群——百万级 H100 规模。从官方透露的信息看,性能已经接近 Claude Opus 4.7 的水平。
但这事儿有点意思:这已经是 Cursor 五个月内第二次因为用中国开源模型当基座引发争议了。上次是 Composer 2 用了 Kimi K2.5,被开发者从 API 请求里扒出来,月之暗面一度公开质疑侵权,几小时后又改口说是授权合作。这次 Composer 2.5 发布,Cursor 学乖了,直接在官方推文里承认了底座来源。

技术路线:Kimi K2.5 + 继续预训练 + 强化学习
Composer 2.5 的训练路径其实挺清晰:先拿 Kimi K2.5 做基座,然后进行继续预训练(Continued Pre-training),最后叠加 4 倍规模的强化学习(RL)。Cursor 联合创始人 Aman Sanger 在回应中提到,团队对多个基座模型做了困惑度(perplexity)评测,Kimi K2.5 "证明是最强的"。
这个选择不意外。Kimi K2.5 本身就是月之暗面在 2026 年 3 月推出的旗舰模型,采用修改版 MIT 协议开源。从技术指标看,它在长文本理解、代码生成、推理能力上都处于第一梯队。Cursor 选它做基座,等于直接站在了一个高起点上。
算力层面更夸张。Colossus2 是 xAI 在 2025 年底建成的超算集群,部署了超过 100 万颗 H100 GPU,是目前全球规模最大的单体 AI 训练设施。Cursor 能用上这个级别的算力,说明和 xAI 的合作关系不浅——毕竟 Elon Musk 本人在上次 Composer 2 争议时就直接回复过 "Yeah, it's Kimi 2.5",这次 Cursor 用 Colossus2 训练新模型,某种程度上也算是 Musk 对中国开源模型的又一次背书。
根据 Cursor 开发者教育副总裁 Lee Robinson 的说法,最终模型中来自基座的算力约占 1/4,其余 3/4 来自 Cursor 自身的继续预训练和强化学习。这个比例意味着 Cursor 在 Kimi K2.5 的基础上投入了三倍的算力做定制化训练,针对代码生成、多文件编辑、长程任务等编程场景做了深度优化。
性能如何?接近 Opus 4.7 但长程任务待验证
Cursor 官方宣称 Composer 2.5 的性能已经接近 Claude Opus 4.7。从技术路线看,这个说法有一定可信度:Kimi K2.5 本身就是对标 GPT-4 级别的模型,再叠加 Cursor 针对编程场景的继续预训练和强化学习,理论上确实能逼近甚至超越 Opus 4.7 在代码生成任务上的表现。
但实际水平还得看社区反馈。目前开发者最关心的是两个问题:一是长程任务的稳定性,二是多文件编辑的准确性。Cursor 的核心场景是 AI 辅助编程,用户经常需要让模型同时修改十几个文件、跨越几千行代码进行重构。这种长程任务对模型的上下文理解、指令遵循、错误恢复能力要求极高,稍有不慎就会出现逻辑断裂或者引入新 bug。
Kimi K2.5 的长文本能力是它的强项之一,支持 200K token 的上下文窗口,理论上能覆盖大部分编程场景。但经过继续预训练和强化学习后,这个能力是否还能保持,甚至进一步增强,需要实际使用才能验证。社区里已经有人在测试 Composer 2.5 处理大型代码库的表现,接下来几周应该会有更多评测数据出来。

第二次争议:从 DeepSeek 到 Kimi,中国开源成全球 AI 底座
这已经是 Cursor 第二次因为用中国开源模型引发争议了。2025 年 11 月,Cursor 发布 Composer 1 时,开发者发现它的 tokenizer 和 DeepSeek 一模一样,模型推理时偶尔还会输出中文。当时 Cursor 没做任何说明,直到社区扒出来才承认。
2026 年 3 月,Composer 2 发布,这次用的是 Kimi K2.5。开发者 @fynnso 在调试 API 请求时截获了模型 ID:kimi-k2p5-rl-0317-s515-fast,字面意思就是 "Kimi K2.5 + RL"。月之暗面预训练负责人杜羽倫随即发推,确认 tokenizer 一致,直接质问 Cursor 联合创始人 Michael Truell:"为什么不尊重我们的许可证,也没有支付任何费用"。
几小时后风向反转。月之暗面官方账号改口,从指控变成祝贺,确认 Cursor 通过 Fireworks AI 的托管平台访问 Kimi K2.5,属于授权商业合作。Cursor 联合创始人 Aman Sanger 和 Lee Robinson 也先后回应,承认博客发布时未提及 Kimi 基座 "是一个失误",表示下一个模型会在第一时间注明。
这次 Composer 2.5 发布,Cursor 学乖了,直接在官方推文里承认了 Kimi K2.5 底座。但问题是,为什么一家估值 293 亿美元、年营收超过 10 亿美元的公司,会连续两次在模型发布时 "忘记" 提及基座来源?
答案可能很简单:市场营销。"自研模型" 听起来比 "基于开源模型微调" 更有技术含量,更容易吸引投资人和用户。但这种做法的代价是信任成本。开发者社区对透明度的要求极高,藏着掖着只会让问题越滚越大。
更大的背景是,中国开源模型正在成为全球 AI 技术栈的底座。Hugging Face 联合创始人兼 CEO Clément Delangue 在 Composer 2 争议时评论:"中国开源是塑造全球 AI 技术棧的最大力量。" 这不是客套话。过去五个月,至少三家头部公司被曝用中国开源模型:Cursor 用 DeepSeek 和 Kimi,Windsurf 用智谱,乐天用 DeepSeek V3。
这背后的逻辑很清楚:中国开源模型在性能、成本、许可证灵活度上都有优势。DeepSeek、Kimi、智谱的模型质量已经接近甚至超越 GPT-4,训练成本却低一个数量级,开源协议又相对宽松。对于需要快速迭代、控制成本的创业公司来说,用中国开源模型做基座是最理性的选择。
许可证合规:月营收超 2000 万美元要标注来源
Kimi K2.5 采用修改版 MIT 协议,核心条款是:月活超 1 亿或月营收超 2000 万美元的商业产品,必须在用户界面显著标注 "Kimi K2.5"。以 Cursor 的估值和付费用户规模,月营收门槛几乎必然触发。
但 Composer 2 发布时,Cursor 的界面上只写了 "Composer 2",没有任何关于 Kimi K2.5 的标注。这直接违反了许可证要求。月之暗面的公开质疑也是基于这一点。后来月之暗面改口,确认 Cursor 通过 Fireworks AI 的商业协议获得了授权,许可证合规性由 Fireworks AI 保障。
这个解释有点绕。简单说就是:Cursor 没有直接使用 Kimi K2.5 的开源版本,而是通过 Fireworks AI 这个中间商访问模型。Fireworks AI 和月之暗面有商业合作协议,协议里可能包含了更灵活的授权条款,允许下游客户不在界面标注来源。这种模式在 AI 行业很常见,类似于云服务商提供的托管模型服务。
但这不代表 Cursor 可以完全不提基座来源。开源社区的共识是:即使通过商业授权使用开源模型,也应该在技术文档或博客中说明基座来源,这是对原始开发者的尊重,也是对用户的透明。Cursor 在 Composer 2 和 Composer 2.5 的发布中都没做到这一点,直到被社区扒出来才承认,这是最大的问题。
市场信号:月之暗面估值可能被低估
一个值得关注的时间巧合:2026 年 3 月 15 日,彭博社报道月之暗面正在寻求至多 10 亿美元的新一轮融资,估值约 180 亿美元,较三个月前翻了四倍多,阿里巴巴和腾讯均参与押注。仅五天后,全球估值最高的 AI 编程工具就被发现以 Kimi K2.5 为基座。
这是一个强烈的市场信号。Cursor 在评测中认定 Kimi K2.5 是 "最强基座",在此之上构建了其最核心的产品。这等于用真金白银(293 亿美元估值的公司选择)给月之暗面的技术能力做了背书。
从投资逻辑看,180 亿美元的估值可能还是低估了月之暗面。对比一下:Cursor 估值 293 亿美元,但它的核心技术是基于月之暗面的模型构建的。OpenAI 估值超过 1500 亿美元,Anthropic 估值 600 亿美元,这些公司的估值很大程度上来自其基础模型的能力。月之暗面的 Kimi K2.5 已经被证明可以作为头部产品的底座,180 亿美元的估值相比之下显得保守。
当然,估值不只看技术能力,还要看商业化进展、市场份额、团队执行力等因素。但 Cursor 事件至少说明,月之暗面的技术能力已经得到了全球顶级 AI 公司的认可。接下来的问题是,月之暗面能否把这种技术优势转化为商业优势,在 API 服务、企业解决方案、开发者生态等方向上建立护城河。
Colossus2 算力:xAI 的开放策略
Composer 2.5 用上 Colossus2 算力,也透露了 xAI 的一些战略意图。Colossus2 是 xAI 在 2025 年底建成的超算集群,部署了超过 100 万颗 H100 GPU,总算力超过 100 exaFLOPS。这是目前全球规模最大的单体 AI 训练设施,投资规模超过 100 亿美元。
xAI 建这么大的集群,显然不只是为了训练自家的 Grok 模型。从 Cursor 的案例看,xAI 正在把 Colossus2 作为一个开放的算力平台,向外部客户提供训练服务。这和 OpenAI、Anthropic 的封闭策略形成鲜明对比。
这种开放策略有几个好处:一是提高算力利用率,Colossus2 这么大的集群不可能 24 小时满负荷训练 Grok,把闲置算力租出去可以分摊成本;二是建立生态,通过提供算力服务吸引更多开发者和公司使用 xAI 的技术栈;三是获取数据和反馈,外部客户的训练任务可以帮助 xAI 优化集群性能、发现新的应用场景。
对 Cursor 这样的公司来说,能用上 Colossus2 级别的算力是巨大的优势。训练一个接近 Opus 4.7 水平的模型,如果用常规的云服务商(AWS、GCP、Azure),成本可能高达几千万美元,训练周期也要几个月。用 Colossus2,成本和时间都能大幅压缩。
这也解释了为什么 Cursor 能在五个月内连续发布三个版本的 Composer 模型(Composer 1、Composer 2、Composer 2.5)。有了 Kimi K2.5 这样的强基座,再加上 Colossus2 的算力支持,Cursor 可以快速迭代,不断优化模型在编程场景下的表现。
对开发者的影响:工具链加速进化
Composer 2.5 的发布,对开发者来说最直接的影响是工具链的进化速度在加快。过去一年,AI 编程工具经历了爆发式增长:GitHub Copilot、Cursor、Windsurf、Cline、Continue 等工具层出不穷,每个工具都在尝试不同的交互模式和技术路线。
Cursor 的策略是自研模型 + 深度集成。通过训练专门针对编程场景优化的模型,Cursor 可以提供更精准的代码补全、更智能的多文件编辑、更可靠的长程任务执行。这和 GitHub Copilot 依赖通用模型(GPT-4、Claude)的策略不同。
从用户体验看,专用模型确实有优势。通用模型在代码生成任务上表现不错,但在处理大型代码库、理解项目上下文、遵循特定编码规范等方面还有提升空间。Cursor 通过继续预训练和强化学习,可以让模型更好地适应这些场景。
但专用模型也有代价:训练成本高、迭代周期长、需要持续投入算力。Cursor 能做到这一点,一方面是因为有足够的融资支持(293 亿美元估值),另一方面是因为找到了合适的技术路线(用开源模型做基座 + 借助 xAI 的算力)。
对其他 AI 编程工具来说,Cursor 的路线是一个重要参考。用中国开源模型做基座、借助头部算力平台训练、针对特定场景深度优化,这套组合拳已经被验证可行。接下来可能会有更多工具跟进,AI 编程工具的竞争会从 "谁接入的模型多" 转向 "谁的专用模型更强"。
透明度问题:开源社区的底线
回到最核心的问题:为什么 Cursor 连续两次在模型发布时不提基座来源?
从商业角度看,这是一个市场营销决策。"自研模型" 比 "基于开源模型微调" 更有卖点,更容易获得媒体关注和用户信任。但这种做法忽略了开源社区的文化和价值观。
开源社区的核心价值之一是透明度。开发者愿意把自己的代码、模型、数据开源出来,前提是相信其他人会尊重他们的贡献、遵守许可证、给予适当的署名。如果下游用户拿了开源成果却不承认来源,这会破坏整个开源生态的信任基础。
Cursor 的做法已经触碰到了这条底线。虽然最后确认是通过商业授权合规使用,但在发布时不提基座来源,等于是在利用开源成果的同时试图独占声誉。这对月之暗面、DeepSeek 这些开源模型的开发者不公平,对关注技术细节的开发者也不尊重。
好消息是,Cursor 在经历两次争议后似乎意识到了问题。Aman Sanger 和 Lee Robinson 都公开承认 "是一个失误",承诺下一个模型会在第一时间注明基座来源。这次 Composer 2.5 发布,虽然还是先发推文后补充细节,但至少在官方渠道承认了 Kimi K2.5 底座和 Colossus2 算力。
对整个行业来说,这是一个重要的教训:用开源模型做基座完全合理,但必须透明。不管是出于许可证要求、商业合作协议,还是对开源社区的尊重,都应该在技术文档、博客、发布公告中明确说明基座来源、训练方法、算力来源等关键信息。这不仅是法律和道德义务,也是建立长期信任的基础。
写在最后
Composer 2.5 的发布,表面上是 Cursor 的一次产品迭代,实际上折射出 AI 行业的几个重要趋势:
中国开源模型正在成为全球 AI 底座。DeepSeek、Kimi、智谱的模型已经被多家头部公司采用,性能、成本、许可证灵活度都有优势。
算力平台化。xAI 的 Colossus2 向外部客户开放,提供训练服务,这和 OpenAI、Anthropic 的封闭策略形成对比。算力正在从竞争壁垒变成基础设施。
专用模型 vs 通用模型。AI 编程工具的竞争正在从 "谁接入的模型多" 转向 "谁的专用模型更强"。针对特定场景深度优化的模型,在用户体验上有明显优势。
透明度是底线。用开源模型做基座完全合理,但必须透明。藏着掖着只会破坏信任,长期来看得不偿失。
Cursor 能否凭借 Composer 2.5 巩固在 AI 编程工具领域的领先地位,还要看实际表现。但至少在技术路线上,它已经找到了一条可行的道路:用最强的开源基座 + 最大的算力平台 + 针对场景的深度优化。接下来就看执行了。