OpenAI 发布 GPT-Rosalind 生命科学推理模型：聚焦药物发现与转化医学

OpenAI 于 4 月 16 日发布专注生命科学推理的新模型 GPT-Rosalind，覆盖生物化学、基因组学和转化医学，以已故科学家罗莎琳德·富兰克林命名，标志着大模型从通用智能向垂直科研领域的关键一步。

不是 GPT-6，是一个你可能更该关注的东西

社区等了半年的 GPT-6 没来，GPT-5.5 也没来。4 月 16 日，OpenAI 丢出来的是一个谁都没猜到的名字——GPT-Rosalind。

一个专门为生命科学打造的推理模型。

名字取自罗莎琳德·富兰克林（Rosalind Franklin），那位拍出 DNA 双螺旋结构关键 X 射线衍射照片、却长期被诺奖叙事忽略的英国科学家。OpenAI 选这个名字，意图很明显：这不是一次常规的模型迭代，而是一次方向性的宣言。

据 OpenAI 生命科学研究负责人 Joy Jiao 对媒体透露，GPT-Rosalind 的设计目标是在生物化学、基因组学和药物发现等领域实现更强的基础推理能力。注意关键词——基础推理，不是简单的文献检索或摘要生成，而是真正理解分子机制、蛋白质交互、通路分析这些硬核问题。

这件事值得认真聊聊。

GPT-Rosalind 模型定位示意图，展示其在生物化学、基因组学、药物发现和转化医学四个领域的覆盖范围

为什么是生命科学？

先说一个背景数字：一款新药从靶点发现到上市，平均耗时 10-15 年，花费超过 20 亿美元。其中，临床前阶段的失败率高达 90% 以上。大量时间和资金消耗在反复试错上——筛选化合物、验证靶点、预测毒性、优化分子结构。

这些环节有一个共同特征：它们本质上都是推理密集型任务。

你需要从海量的基因组数据中找到疾病关联靶点，需要理解蛋白质折叠后的三维构象如何影响药物结合，需要判断一个候选分子在人体内的代谢路径和潜在副作用。这些不是靠检索就能解决的问题，它们需要跨学科的深度推理。

过去两年，AI 在生命科学领域已经有了一些标志性突破。AlphaFold 解决了蛋白质结构预测，但那是一个相对封闭的问题——输入序列，输出结构。药物发现的真实场景远比这复杂：它是开放式的，需要在不确定性中做判断，需要整合文献、实验数据、临床知识等多源异构信息。

这恰恰是大语言模型擅长的事。

OpenAI 显然看到了这个机会。与其在通用模型的基准测试上和 Anthropic、Google 继续卷分数，不如在一个真正有商业价值和社会价值的垂直领域建立壁垒。生命科学，就是那个领域。

GPT-Rosalind 到底能做什么？

从目前公开的信息来看，GPT-Rosalind 覆盖三大核心场景：

生物化学推理

这是最基础的能力层。理解氨基酸序列与蛋白质功能的关系，分析酶促反应机制，预测分子间的相互作用。打个比方，如果说通用模型对生物化学的理解像一个读过几本教科书的本科生，GPT-Rosalind 的目标是达到一个有多年实验室经验的博士后水平——不仅知道是什么，还能推理为什么，以及接下来可能会怎样。

药物发现支持

这是商业价值最直接的部分。药物发现流程中，有几个关键瓶颈特别适合 AI 介入：

靶点识别与验证：从基因组学和蛋白质组学数据中筛选潜在药物靶点，评估其可成药性
先导化合物优化：在确定候选分子后，预测其药代动力学特性（吸收、分布、代谢、排泄），指导结构修改方向
毒性预测：在进入动物实验之前，通过计算方法预判候选分子的潜在毒性风险
适应症拓展：分析已有药物的作用机制，发现其在其他疾病上的潜在应用（即"老药新用"）

每一个环节，如果能把准确率提升哪怕几个百分点，对应的都是数以亿计的研发成本节省。

转化医学

这是连接基础研究和临床应用的桥梁。一个实验室里发现的生物标志物，如何转化为可用的诊断工具？一个动物模型上有效的治疗方案，如何设计合理的临床试验来验证其在人体上的效果？这些问题需要同时理解基础科学和临床实践，GPT-Rosalind 的定位正是在这个交叉地带提供推理支持。

技术路线的猜测

OpenAI 没有公开 GPT-Rosalind 的技术细节，但我们可以做一些合理推测。

首先，这大概率不是从零训练的全新模型。更可能的路线是：以 GPT 系列的最新基座模型为底座，在大规模生命科学语料上做领域适配训练（domain adaptation），然后通过专门的推理强化（可能类似 o1/o3 系列的思维链训练方式）来提升在科学推理任务上的表现。

训练数据方面，可以想象的来源包括：

PubMed 上数千万篇生物医学文献
UniProt、PDB 等蛋白质数据库
ChEMBL、DrugBank 等药物化学数据库
ClinicalTrials.gov 上的临床试验数据
各类基因组学和转录组学公开数据集

更关键的是推理能力的训练。生命科学推理和数学推理有本质区别——数学推理的正确性可以形式化验证，但生物学推理往往是概率性的、多因素的、充满例外的。如何让模型在这种不确定性中做出可靠的判断，是真正的技术难点。

OpenAI 可能采用了专家标注的方式：让生物学家、药物化学家、临床医生等领域专家对模型的推理过程进行评估和反馈，通过 RLHF 或类似机制来校准模型的科学判断力。这也解释了为什么 Joy Jiao 强调的是"基础推理"——他们想解决的不是表面的问答，而是深层的科学思维。

竞争格局：谁在做类似的事？

生命科学 AI 不是一个新赛道，但大模型玩家的入场方式正在改变游戏规则。

Google DeepMind 是这个领域最早也最成功的玩家。AlphaFold 系列已经成为结构生物学的基础设施，AlphaFold 3 更是将预测范围扩展到了蛋白质与小分子、核酸、离子的复合物结构。但 DeepMind 的路线偏向专用模型——每个问题一个模型，而不是一个通用的科学推理引擎。

Anthropic 的 Claude 系列在科学推理上一直表现不错，尤其是长文本理解和多步推理能力。但 Anthropic 目前没有推出专门的生命科学模型，更多是在通用能力上做提升。社区里有人提到 Anthropic 的 Mythos 系列，但那更偏向通用推理增强，而非领域特化。

专业玩家方面，Insilico Medicine（英矽智能）、Recursion Pharmaceuticals、Isomorphic Labs（DeepMind 的子公司）等公司已经在用 AI 做药物发现，有的候选药物已经进入临床试验。但它们的模型通常是针对特定任务的（比如分子生成、靶点预测），而不是通用的科学推理模型。

GPT-Rosalind 的差异化在于：它试图做一个通用的生命科学推理层。不是替代具体的计算化学工具或分子动力学模拟，而是在更高的抽象层次上，帮助研究者理解问题、形成假设、设计实验、解读结果。

这个定位聪明吗？我觉得是的。因为它避开了和专业工具的直接竞争，同时切入了一个现有工具覆盖不好的空白地带——科学思维的辅助。

社区反应：期待与失望并存

从社区的反馈来看，反应很分裂。

一部分开发者明显失望。他们等的是 GPT-5.5 或 GPT-6，是通用能力的大幅跃升，结果等来了一个垂直领域模型。"我要的是这个吗？"——这句话代表了相当一部分人的心声。在 Anthropic 持续迭代 Claude、Google 不断更新 Gemini 的背景下，OpenAI 在通用模型上的沉默确实让人焦虑。

另一部分人，尤其是有生命科学背景的开发者和研究者，则相当兴奋。"科研佬要快乐了"——虽然说得轻松，但背后的期待是真实的。如果 GPT-Rosalind 真的能在分子生物学推理上达到专家水平，它对科研效率的提升将是革命性的。

还有一个实际问题：谁能用？ 目前 OpenAI 没有明确说明 GPT-Rosalind 的访问方式——是面向所有 ChatGPT Plus 用户，还是仅限 API 调用，还是需要特殊的企业合作才能使用。考虑到生命科学的专业性和潜在的合规要求（比如涉及患者数据的场景），限制访问范围是合理的，但这也意味着大多数普通开发者短期内可能无法直接体验。

对开发者意味着什么？

即使你不做生命科学，GPT-Rosalind 的发布也传递了一个重要信号：垂直领域模型正在成为主流趋势。

过去两年，大模型竞争的主旋律是"通用能力越强越好"。但现在，头部玩家开始意识到，在很多高价值场景中，通用模型的能力天花板已经不够用了。你需要领域知识、领域推理、领域评估标准。这不是简单地写个 system prompt 就能解决的。

对于做 AI 应用的开发者来说，这意味着：

模型选择变得更复杂了。以前可能一个 GPT-4 打天下，现在你需要根据任务类型选择不同的模型——通用对话用一个，代码生成用一个，科学推理用一个。模型路由（model routing）会成为越来越重要的基础设施。
垂直领域的 AI 应用机会在增加。当底层模型开始提供领域级的推理能力时，上层应用的可能性空间就打开了。生物信息学工具、临床决策支持系统、药物研发平台——这些方向的 AI 应用会迎来新一波机会。
API 聚合的价值更明显了。当你需要在一个应用中调用多个不同定位的模型时，统一的 API 接口和管理方式就变得很重要。

说到 API 调用，如果 GPT-Rosalind 后续开放 API 访问，通过 OpenAI Hub 这类兼容 OpenAI 格式的聚合平台，开发者可以用统一的方式接入，省去单独对接的麻烦。以下是一个可能的调用示例（基于 OpenAI 兼容格式，具体模型名称以实际发布为准）：

from openai import OpenAI

client = OpenAI(
    api_key=\"your-openai-hub-key\",
    base_url=\"https://api.openai-hub.com/v1\"
)

response = client.chat.completions.create(
    model=\"gpt-rosalind\",  # 模型名称以实际上线为准
    messages=[
        {
            \"role\": \"system\",
            \"content\": \"You are a life sciences research assistant with expertise in biochemistry, genomics, and drug discovery.\"
        },
        {
            \"role\": \"user\",
            \"content\": (
                \"分析 KRAS G12C 突变在非小细胞肺癌中的致癌机制，\"
                \"并评估共价抑制剂（如 Sotorasib）的作用原理及潜在耐药机制。\"
            )
        }
    ],
    temperature=0.2  # 科学推理场景建议低温度
)

print(response.choices[0].message.content)

// Node.js 示例
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'your-openai-hub-key',
  baseURL: 'https://api.openai-hub.com/v1',
});

const response = await client.chat.completions.create({
  model: 'gpt-rosalind',
  messages: [
    {
      role: 'system',
      content:
        'You are a life sciences research assistant specialized in drug target identification and validation.',
    },
    {
      role: 'user',
      content:
        '基于现有的转录组学数据，帮我分析 PD-L1/PD-1 通路在三阴性乳腺癌中的表达模式，以及联合用药的潜在策略。',
    },
  ],
  temperature: 0.2,
});

console.log(response.choices[0].message.content);

注意 temperature 设得比较低。科学推理场景下，你希望模型的输出尽可能严谨和确定性，而不是天马行空地"创造"。这和写营销文案时把温度调高是完全相反的策略。

更大的图景

把视角拉远一点看，GPT-Rosalind 的发布是 OpenAI 战略调整的一个缩影。

过去一年，OpenAI 的产品线明显在分化：o 系列做深度推理，GPT 系列做通用对话，现在又开辟了垂直领域模型线。这不是随意为之，而是对市场需求的回应——企业客户需要的不是一个什么都能做但什么都不够精的通用模型，而是在自己的业务场景中真正好用的专业工具。

生命科学是第一个，但大概率不是最后一个。金融、法律、材料科学、气候建模……每一个知识密集型领域都有类似的需求。如果 GPT-Rosalind 在生命科学领域验证了"通用基座 + 领域特化"的路线可行，我们很可能会看到更多的 GPT-[科学家名字] 系列模型出现。

当然，这一切的前提是 GPT-Rosalind 真的好用。目前我们看到的还只是发布公告和媒体报道，没有基准测试数据，没有用户实测反馈，没有和现有工具的对比评估。在生命科学这种容错率极低的领域，模型的幻觉问题（hallucination）尤其致命——如果模型自信满满地给出一个错误的靶点预测或毒性判断，后果可能是数百万美元的研发投入打水漂。

所以，谨慎乐观是合适的态度。方向是对的，但路还很长。

OpenAI 模型产品线演进时间线，从 GPT-4 到 o 系列到 GPT-Rosalind，展示从通用到垂直的战略分化

写在最后

社区里那句"哥们我 GPT-6 呢"的吐槽，其实反映了一个有趣的认知差异。

对普通用户和大多数开发者来说，模型的价值体现在版本号上——数字越大越好，通用能力越强越好。但对 OpenAI 来说，下一个十亿美元的收入增长点，可能不在 GPT-6 的通用能力提升上，而在像 GPT-Rosalind 这样的垂直领域模型上。

制药行业每年的研发支出超过 2000 亿美元。哪怕只切下 1% 的市场，那也是 20 亿美元的生意。

GPT-6 会来的。但在那之前，OpenAI 选择先去赚聪明的钱。

参考来源

Linux.do 社区讨论：GPT 新模型 GPT-Rosalind — 社区用户对 GPT-Rosalind 发布的讨论与反馈

OpenAI 发布 GPT-Rosalind，AI 正式杀入药物发现

不是 GPT-6，是一个你可能更该关注的东西

为什么是生命科学？

GPT-Rosalind 到底能做什么？

技术路线的猜测

竞争格局：谁在做类似的事？

社区反应：期待与失望并存

对开发者意味着什么？

更大的图景

写在最后

参考来源

相关推荐

大晓开源端侧具身世界模型Kairos 3.0，4B参数干翻Cosmos 2.5

OpenRouter 推出 Fusion API：拼好模打平 Claude Fable 5

QoderWork 给 AI 助理装了个"意识"：会记忆、会反思、会自己长技能

联系我们