Anthropic 今天发布 Claude Science，一个面向计算科研的统一工作台，整合数据库、流水线和 Agent 工具。这次不是发新模型，而是赌科学家真正需要的是少切几次窗口。

Anthropic 推出 Claude Science：这次不是新模型，是给科学家的工作台

Anthropic 今天（6 月 30 日）发布了 Claude Science，一个专门面向计算科研场景的统一研究环境。和过去几次大动作不同，这次没有新模型、没有跑分图、没有 Opus 4.x 的命名升级——产品页通篇在讲一件事：科学家不用再在数据库、分析流水线、文献工具和 Chatbot 之间来回切换了。

这是一个值得玩味的产品选择。在所有人都在卷模型能力的 2026 年，Anthropic 把赌注压在了"工作流"上。

它到底是什么

Claude Science 的官方定位是 "a workbench for computational research"——一个计算科研的工作台。具体来说，它把以下几类东西塞进了同一个界面：

文献检索与综述：复用了 Claude Research 的 Multi-Agent 架构，Lead Researcher 规划方向、多个 Subagent 并行扫文献库；
数据接入：直接连 PubMed、UniProt、PDB、GEO、arXiv 这类科研数据库，不再需要手动下载 CSV 再喂给模型；
代码与分析环境：内置 Notebook 风格的执行环境，Claude 写完分析代码可以直接跑，结果回灌进对话上下文；
流水线编排：把生信、化学计算这类多步骤任务封装成可复用的 Agent 工作流；
协作与引用追溯：每个结论都带回链，团队成员可以审计 Agent 的每一步推理和数据来源。

说人话——以前一个计算生物学家做一次 RNA-seq 差异分析，要在 NCBI 查数据、Galaxy 跑流程、Jupyter 写脚本、ChatGPT 问问题、Zotero 管文献、Slack 跟同事讨论。Claude Science 试图把这六个窗口收成一个。

Claude Science 工作台界面示意，左侧为数据源和文献库导航，中间为对话+Notebook 混合视图，右侧为 Agent 执行进度面板

为什么是工作流，而不是新模型

TechCrunch 在报道里把这个选择讲得很直白：Anthropic bets on workflow, not a new model。这背后其实有两层逻辑。

第一层是模型能力的边际收益问题。 从 Opus 4 到 Opus 4.7，再到现在传闻中的 Opus 4.8 和 Fable 5，前沿模型在通用基准上的提升已经很难让科学家"哇"出来了。一个能多解 3% Math Olympiad 题目的模型，对一个想找 CRISPR 脱靶位点的研究员来说没什么意义。真正的瓶颈早就不在模型，而在数据接入、可复现性、引用可信度这些工程问题上。

第二层是科研用户的客单价和粘性。 学术机构和制药公司的预算是按席位走的，但他们对工具切换的容忍度极低——一个生物学家学会了某套流水线，几年内不会换。谁先把工作台做成默认环境，谁就锁住了未来十年的科研 AI 入口。这盘账 Anthropic 算得很清楚，OpenAI 的 Deep Research、Google 的 Co-Scientist 都在抢这块地。

Multi-Agent 架构在科研场景的复用

Claude Science 底层延续了 Anthropic 早就跑通的 Orchestrator-Worker 架构。一个 Lead Agent（通常是 Opus 级别模型）负责拆解研究任务、规划路径；多个 Subagent（Sonnet 级别）并行去抓数据、读文献、跑代码；最后由 Lead 汇总成带引用的报告。

Anthropic 之前公开过这套架构在通用研究任务上比单 Opus 模式提升 90.2% 的内部数据。在科研场景里，这种 breadth-first 的并行展开特别契合——比如"找出过去五年所有报道过 KRAS G12C 抑制剂耐药机制的论文，并按机制聚类"这种问题，单线程模型会卡在某条线索上钻牛角尖，多 Agent 并行才能真正铺开。

但科研场景比通用研究苛刻得多。一个常见痛点是幻觉引用——通用 Research 模式偶尔会编造看起来很真的 DOI。Claude Science 在这块做了硬约束：所有引用必须来自接入的真实数据库 API 返回结果，模型不能凭记忆生成 PMID 或 arXiv 编号。这是工程上的小决策，但对科研用户是生死线。

跟谁抢饭碗

直接对位的产品有几个：

OpenAI Deep Research：通用研究 Agent，强在 Web 搜索深度，但没有科研数据库的原生接入，也没有代码执行环境的深度整合；
Google Co-Scientist：去年 Google 放出的科研 Agent，强在假设生成，但工程上更像 demo，没有形成完整工作台；
Elicit、Consensus：垂直科研搜索工具，做得早但模型能力跟不上，现在更像是 Claude Science 要吃掉的对象；
Galaxy、Nextflow + Copilot 类组合：传统生信流水线 + AI 助手的拼接方案，灵活但割裂。

Claude Science 的差异化很明确：把 Agent 能力、数据接入、执行环境三件事做进一个 surface。这事说起来简单，工程上其实非常重——每接一个科研数据库都要谈授权、对接 API、做引用规范化。Anthropic 愿意投这个力气，说明他们认真把科研当一个垂直市场在打。

几个值得开发者关注的细节

第一，可编程性。 Claude Science 不只是一个 Web 产品，配套放出了 Science API，可以把整套科研 Agent 工作流嵌进自己的实验室管理系统（LIMS）或电子实验记录本（ELN）。这意味着大型药企的 IT 部门可以把它接进现有的 Benchling、LabArchives 流程里，而不是逼着研究员换工具。

第二，本地数据。 Anthropic 这次明确支持私有数据集挂载——你可以把自家的化合物库、临床数据、实验结果挂上去，Claude 在 Agent 推理时会把这些作为 first-class 数据源。这对制药行业来说几乎是合规底线，没有这条根本进不了大客户采购。

第三，可审计性。 每个 Agent 的每一步操作（调用了哪个 API、用了什么参数、返回了什么、模型怎么解读）都会落到一个可回溯的执行树里。研究员可以像看 Git 历史一样审查 Agent 的推理过程。这是科研场景区别于通用 Chatbot 的关键——结论必须可复现、可质疑。

我的判断

Claude Science 这个产品做得克制。它没有炫技、没有 demo 级别的酷炫功能，整体设计就是一句"让科学家少切几次窗口"。但这种克制恰恰是对的。

科研工具市场的历史告诉我们，赢家从来不是最聪明的那个，而是最不打扰工作流的那个——Jupyter 赢了不是因为它技术最好，是因为它无缝嵌进了科学家的思考节奏。Claude Science 的产品哲学跟这条线很像。

短期看，这东西在生命科学、化学、材料这几个高度依赖文献和数据库的领域会跑得最快。物理、数学这种更依赖符号推理和长链证明的领域，工作台模式的价值会弱一些，那块还是 GPT 和 Gemini 的主场。

长期看，真正的悬念是：当模型能力进入平台期之后，AI 公司的护城河到底是模型还是产品？Anthropic 这次给出的答案是后者。这个判断对不对，要看接下来半年制药和学术机构的采购数据。

顺带一提，OpenAI Hub 已经同步支持了 Claude Opus 4.8、Sonnet 4.6、Haiku 4.5 等 Claude Science 底层用到的模型——如果你想用同一个 API Key 把 Claude 的科研 Agent 能力接进自己的工具链，不用再单独申请 Anthropic 账号，国内直连可用。