AI 快讯Anthropic 推出 Claude Science:押注科研工作流
产品更新

Anthropic 推出 Claude Science:押注科研工作流

2026-06-30T19:03:57.740Z
Anthropic 推出 Claude Science:押注科研工作流

Anthropic 今天发布 Claude Science,一个面向计算科研的统一工作台,整合数据库、流水线和 Agent 工具。这次不是发新模型,而是赌科学家真正需要的是少切几次窗口。

Anthropic 推出 Claude Science:这次不是新模型,是给科学家的工作台

Anthropic 今天(6 月 30 日)发布了 Claude Science,一个专门面向计算科研场景的统一研究环境。和过去几次大动作不同,这次没有新模型、没有跑分图、没有 Opus 4.x 的命名升级——产品页通篇在讲一件事:科学家不用再在数据库、分析流水线、文献工具和 Chatbot 之间来回切换了。

这是一个值得玩味的产品选择。在所有人都在卷模型能力的 2026 年,Anthropic 把赌注压在了"工作流"上。

它到底是什么

Claude Science 的官方定位是 "a workbench for computational research"——一个计算科研的工作台。具体来说,它把以下几类东西塞进了同一个界面:

  • 文献检索与综述:复用了 Claude Research 的 Multi-Agent 架构,Lead Researcher 规划方向、多个 Subagent 并行扫文献库;
  • 数据接入:直接连 PubMed、UniProt、PDB、GEO、arXiv 这类科研数据库,不再需要手动下载 CSV 再喂给模型;
  • 代码与分析环境:内置 Notebook 风格的执行环境,Claude 写完分析代码可以直接跑,结果回灌进对话上下文;
  • 流水线编排:把生信、化学计算这类多步骤任务封装成可复用的 Agent 工作流;
  • 协作与引用追溯:每个结论都带回链,团队成员可以审计 Agent 的每一步推理和数据来源。

说人话——以前一个计算生物学家做一次 RNA-seq 差异分析,要在 NCBI 查数据、Galaxy 跑流程、Jupyter 写脚本、ChatGPT 问问题、Zotero 管文献、Slack 跟同事讨论。Claude Science 试图把这六个窗口收成一个。

Claude Science 工作台界面示意,左侧为数据源和文献库导航,中间为对话+Notebook 混合视图,右侧为 Agent 执行进度面板

为什么是工作流,而不是新模型

TechCrunch 在报道里把这个选择讲得很直白:Anthropic bets on workflow, not a new model。这背后其实有两层逻辑。

第一层是模型能力的边际收益问题。 从 Opus 4 到 Opus 4.7,再到现在传闻中的 Opus 4.8 和 Fable 5,前沿模型在通用基准上的提升已经很难让科学家"哇"出来了。一个能多解 3% Math Olympiad 题目的模型,对一个想找 CRISPR 脱靶位点的研究员来说没什么意义。真正的瓶颈早就不在模型,而在数据接入、可复现性、引用可信度这些工程问题上。

第二层是科研用户的客单价和粘性。 学术机构和制药公司的预算是按席位走的,但他们对工具切换的容忍度极低——一个生物学家学会了某套流水线,几年内不会换。谁先把工作台做成默认环境,谁就锁住了未来十年的科研 AI 入口。这盘账 Anthropic 算得很清楚,OpenAI 的 Deep Research、Google 的 Co-Scientist 都在抢这块地。

Multi-Agent 架构在科研场景的复用

Claude Science 底层延续了 Anthropic 早就跑通的 Orchestrator-Worker 架构。一个 Lead Agent(通常是 Opus 级别模型)负责拆解研究任务、规划路径;多个 Subagent(Sonnet 级别)并行去抓数据、读文献、跑代码;最后由 Lead 汇总成带引用的报告。

Anthropic 之前公开过这套架构在通用研究任务上比单 Opus 模式提升 90.2% 的内部数据。在科研场景里,这种 breadth-first 的并行展开特别契合——比如"找出过去五年所有报道过 KRAS G12C 抑制剂耐药机制的论文,并按机制聚类"这种问题,单线程模型会卡在某条线索上钻牛角尖,多 Agent 并行才能真正铺开。

但科研场景比通用研究苛刻得多。一个常见痛点是幻觉引用——通用 Research 模式偶尔会编造看起来很真的 DOI。Claude Science 在这块做了硬约束:所有引用必须来自接入的真实数据库 API 返回结果,模型不能凭记忆生成 PMID 或 arXiv 编号。这是工程上的小决策,但对科研用户是生死线。

跟谁抢饭碗

直接对位的产品有几个:

  • OpenAI Deep Research:通用研究 Agent,强在 Web 搜索深度,但没有科研数据库的原生接入,也没有代码执行环境的深度整合;
  • Google Co-Scientist:去年 Google 放出的科研 Agent,强在假设生成,但工程上更像 demo,没有形成完整工作台;
  • Elicit、Consensus:垂直科研搜索工具,做得早但模型能力跟不上,现在更像是 Claude Science 要吃掉的对象;
  • Galaxy、Nextflow + Copilot 类组合:传统生信流水线 + AI 助手的拼接方案,灵活但割裂。

Claude Science 的差异化很明确:把 Agent 能力、数据接入、执行环境三件事做进一个 surface。这事说起来简单,工程上其实非常重——每接一个科研数据库都要谈授权、对接 API、做引用规范化。Anthropic 愿意投这个力气,说明他们认真把科研当一个垂直市场在打。

几个值得开发者关注的细节

第一,可编程性。 Claude Science 不只是一个 Web 产品,配套放出了 Science API,可以把整套科研 Agent 工作流嵌进自己的实验室管理系统(LIMS)或电子实验记录本(ELN)。这意味着大型药企的 IT 部门可以把它接进现有的 Benchling、LabArchives 流程里,而不是逼着研究员换工具。

第二,本地数据。 Anthropic 这次明确支持私有数据集挂载——你可以把自家的化合物库、临床数据、实验结果挂上去,Claude 在 Agent 推理时会把这些作为 first-class 数据源。这对制药行业来说几乎是合规底线,没有这条根本进不了大客户采购。

第三,可审计性。 每个 Agent 的每一步操作(调用了哪个 API、用了什么参数、返回了什么、模型怎么解读)都会落到一个可回溯的执行树里。研究员可以像看 Git 历史一样审查 Agent 的推理过程。这是科研场景区别于通用 Chatbot 的关键——结论必须可复现、可质疑。

我的判断

Claude Science 这个产品做得克制。它没有炫技、没有 demo 级别的酷炫功能,整体设计就是一句"让科学家少切几次窗口"。但这种克制恰恰是对的。

科研工具市场的历史告诉我们,赢家从来不是最聪明的那个,而是最不打扰工作流的那个——Jupyter 赢了不是因为它技术最好,是因为它无缝嵌进了科学家的思考节奏。Claude Science 的产品哲学跟这条线很像。

短期看,这东西在生命科学、化学、材料这几个高度依赖文献和数据库的领域会跑得最快。物理、数学这种更依赖符号推理和长链证明的领域,工作台模式的价值会弱一些,那块还是 GPT 和 Gemini 的主场。

长期看,真正的悬念是:当模型能力进入平台期之后,AI 公司的护城河到底是模型还是产品?Anthropic 这次给出的答案是后者。这个判断对不对,要看接下来半年制药和学术机构的采购数据。

顺带一提,OpenAI Hub 已经同步支持了 Claude Opus 4.8、Sonnet 4.6、Haiku 4.5 等 Claude Science 底层用到的模型——如果你想用同一个 API Key 把 Claude 的科研 Agent 能力接进自己的工具链,不用再单独申请 Anthropic 账号,国内直连可用。

参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: