OpenAI 发布 GPT-Rosalind,AI 正式杀入药物发现

模型上新

OpenAI 于 4 月 16 日发布专注生命科学推理的新模型 GPT-Rosalind,覆盖生物化学、基因组学和转化医学,以已故科学家罗莎琳德·富兰克林命名,标志着大模型从通用智能向垂直科研领域的关键一步。

不是 GPT-6,是一个你可能更该关注的东西

社区等了半年的 GPT-6 没来,GPT-5.5 也没来。4 月 16 日,OpenAI 丢出来的是一个谁都没猜到的名字——GPT-Rosalind

一个专门为生命科学打造的推理模型。

名字取自罗莎琳德·富兰克林(Rosalind Franklin),那位拍出 DNA 双螺旋结构关键 X 射线衍射照片、却长期被诺奖叙事忽略的英国科学家。OpenAI 选这个名字,意图很明显:这不是一次常规的模型迭代,而是一次方向性的宣言。

据 OpenAI 生命科学研究负责人 Joy Jiao 对媒体透露,GPT-Rosalind 的设计目标是在生物化学、基因组学和药物发现等领域实现更强的基础推理能力。注意关键词——基础推理,不是简单的文献检索或摘要生成,而是真正理解分子机制、蛋白质交互、通路分析这些硬核问题。

这件事值得认真聊聊。

GPT-Rosalind 模型定位示意图,展示其在生物化学、基因组学、药物发现和转化医学四个领域的覆盖范围

为什么是生命科学?

先说一个背景数字:一款新药从靶点发现到上市,平均耗时 10-15 年,花费超过 20 亿美元。其中,临床前阶段的失败率高达 90% 以上。大量时间和资金消耗在反复试错上——筛选化合物、验证靶点、预测毒性、优化分子结构。

这些环节有一个共同特征:它们本质上都是推理密集型任务。

你需要从海量的基因组数据中找到疾病关联靶点,需要理解蛋白质折叠后的三维构象如何影响药物结合,需要判断一个候选分子在人体内的代谢路径和潜在副作用。这些不是靠检索就能解决的问题,它们需要跨学科的深度推理。

过去两年,AI 在生命科学领域已经有了一些标志性突破。AlphaFold 解决了蛋白质结构预测,但那是一个相对封闭的问题——输入序列,输出结构。药物发现的真实场景远比这复杂:它是开放式的,需要在不确定性中做判断,需要整合文献、实验数据、临床知识等多源异构信息。

这恰恰是大语言模型擅长的事。

OpenAI 显然看到了这个机会。与其在通用模型的基准测试上和 Anthropic、Google 继续卷分数,不如在一个真正有商业价值和社会价值的垂直领域建立壁垒。生命科学,就是那个领域。

GPT-Rosalind 到底能做什么?

从目前公开的信息来看,GPT-Rosalind 覆盖三大核心场景:

生物化学推理

这是最基础的能力层。理解氨基酸序列与蛋白质功能的关系,分析酶促反应机制,预测分子间的相互作用。打个比方,如果说通用模型对生物化学的理解像一个读过几本教科书的本科生,GPT-Rosalind 的目标是达到一个有多年实验室经验的博士后水平——不仅知道是什么,还能推理为什么,以及接下来可能会怎样。

药物发现支持

这是商业价值最直接的部分。药物发现流程中,有几个关键瓶颈特别适合 AI 介入:

  • 靶点识别与验证:从基因组学和蛋白质组学数据中筛选潜在药物靶点,评估其可成药性
  • 先导化合物优化:在确定候选分子后,预测其药代动力学特性(吸收、分布、代谢、排泄),指导结构修改方向
  • 毒性预测:在进入动物实验之前,通过计算方法预判候选分子的潜在毒性风险
  • 适应症拓展:分析已有药物的作用机制,发现其在其他疾病上的潜在应用(即"老药新用")

每一个环节,如果能把准确率提升哪怕几个百分点,对应的都是数以亿计的研发成本节省。

转化医学

这是连接基础研究和临床应用的桥梁。一个实验室里发现的生物标志物,如何转化为可用的诊断工具?一个动物模型上有效的治疗方案,如何设计合理的临床试验来验证其在人体上的效果?这些问题需要同时理解基础科学和临床实践,GPT-Rosalind 的定位正是在这个交叉地带提供推理支持。

技术路线的猜测

OpenAI 没有公开 GPT-Rosalind 的技术细节,但我们可以做一些合理推测。

首先,这大概率不是从零训练的全新模型。更可能的路线是:以 GPT 系列的最新基座模型为底座,在大规模生命科学语料上做领域适配训练(domain adaptation),然后通过专门的推理强化(可能类似 o1/o3 系列的思维链训练方式)来提升在科学推理任务上的表现。

训练数据方面,可以想象的来源包括:

  • PubMed 上数千万篇生物医学文献
  • UniProt、PDB 等蛋白质数据库
  • ChEMBL、DrugBank 等药物化学数据库
  • ClinicalTrials.gov 上的临床试验数据
  • 各类基因组学和转录组学公开数据集

更关键的是推理能力的训练。生命科学推理和数学推理有本质区别——数学推理的正确性可以形式化验证,但生物学推理往往是概率性的、多因素的、充满例外的。如何让模型在这种不确定性中做出可靠的判断,是真正的技术难点。

OpenAI 可能采用了专家标注的方式:让生物学家、药物化学家、临床医生等领域专家对模型的推理过程进行评估和反馈,通过 RLHF 或类似机制来校准模型的科学判断力。这也解释了为什么 Joy Jiao 强调的是"基础推理"——他们想解决的不是表面的问答,而是深层的科学思维。

竞争格局:谁在做类似的事?

生命科学 AI 不是一个新赛道,但大模型玩家的入场方式正在改变游戏规则。

Google DeepMind 是这个领域最早也最成功的玩家。AlphaFold 系列已经成为结构生物学的基础设施,AlphaFold 3 更是将预测范围扩展到了蛋白质与小分子、核酸、离子的复合物结构。但 DeepMind 的路线偏向专用模型——每个问题一个模型,而不是一个通用的科学推理引擎。

Anthropic 的 Claude 系列在科学推理上一直表现不错,尤其是长文本理解和多步推理能力。但 Anthropic 目前没有推出专门的生命科学模型,更多是在通用能力上做提升。社区里有人提到 Anthropic 的 Mythos 系列,但那更偏向通用推理增强,而非领域特化。

专业玩家方面,Insilico Medicine(英矽智能)、Recursion Pharmaceuticals、Isomorphic Labs(DeepMind 的子公司)等公司已经在用 AI 做药物发现,有的候选药物已经进入临床试验。但它们的模型通常是针对特定任务的(比如分子生成、靶点预测),而不是通用的科学推理模型。

GPT-Rosalind 的差异化在于:它试图做一个通用的生命科学推理层。不是替代具体的计算化学工具或分子动力学模拟,而是在更高的抽象层次上,帮助研究者理解问题、形成假设、设计实验、解读结果。

这个定位聪明吗?我觉得是的。因为它避开了和专业工具的直接竞争,同时切入了一个现有工具覆盖不好的空白地带——科学思维的辅助。

社区反应:期待与失望并存

从社区的反馈来看,反应很分裂。

一部分开发者明显失望。他们等的是 GPT-5.5 或 GPT-6,是通用能力的大幅跃升,结果等来了一个垂直领域模型。"我要的是这个吗?"——这句话代表了相当一部分人的心声。在 Anthropic 持续迭代 Claude、Google 不断更新 Gemini 的背景下,OpenAI 在通用模型上的沉默确实让人焦虑。

另一部分人,尤其是有生命科学背景的开发者和研究者,则相当兴奋。"科研佬要快乐了"——虽然说得轻松,但背后的期待是真实的。如果 GPT-Rosalind 真的能在分子生物学推理上达到专家水平,它对科研效率的提升将是革命性的。

还有一个实际问题:谁能用? 目前 OpenAI 没有明确说明 GPT-Rosalind 的访问方式——是面向所有 ChatGPT Plus 用户,还是仅限 API 调用,还是需要特殊的企业合作才能使用。考虑到生命科学的专业性和潜在的合规要求(比如涉及患者数据的场景),限制访问范围是合理的,但这也意味着大多数普通开发者短期内可能无法直接体验。

对开发者意味着什么?

即使你不做生命科学,GPT-Rosalind 的发布也传递了一个重要信号:垂直领域模型正在成为主流趋势

过去两年,大模型竞争的主旋律是"通用能力越强越好"。但现在,头部玩家开始意识到,在很多高价值场景中,通用模型的能力天花板已经不够用了。你需要领域知识、领域推理、领域评估标准。这不是简单地写个 system prompt 就能解决的。

对于做 AI 应用的开发者来说,这意味着:

  1. 模型选择变得更复杂了。以前可能一个 GPT-4 打天下,现在你需要根据任务类型选择不同的模型——通用对话用一个,代码生成用一个,科学推理用一个。模型路由(model routing)会成为越来越重要的基础设施。

  2. 垂直领域的 AI 应用机会在增加。当底层模型开始提供领域级的推理能力时,上层应用的可能性空间就打开了。生物信息学工具、临床决策支持系统、药物研发平台——这些方向的 AI 应用会迎来新一波机会。

  3. API 聚合的价值更明显了。当你需要在一个应用中调用多个不同定位的模型时,统一的 API 接口和管理方式就变得很重要。

说到 API 调用,如果 GPT-Rosalind 后续开放 API 访问,通过 OpenAI Hub 这类兼容 OpenAI 格式的聚合平台,开发者可以用统一的方式接入,省去单独对接的麻烦。以下是一个可能的调用示例(基于 OpenAI 兼容格式,具体模型名称以实际发布为准):

from openai import OpenAI

client = OpenAI(
    api_key=\"your-openai-hub-key\",
    base_url=\"https://api.openai-hub.com/v1\"
)

response = client.chat.completions.create(
    model=\"gpt-rosalind\",  # 模型名称以实际上线为准
    messages=[
        {
            \"role\": \"system\",
            \"content\": \"You are a life sciences research assistant with expertise in biochemistry, genomics, and drug discovery.\"
        },
        {
            \"role\": \"user\",
            \"content\": (
                \"分析 KRAS G12C 突变在非小细胞肺癌中的致癌机制,\"
                \"并评估共价抑制剂(如 Sotorasib)的作用原理及潜在耐药机制。\"
            )
        }
    ],
    temperature=0.2  # 科学推理场景建议低温度
)

print(response.choices[0].message.content)
// Node.js 示例
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'your-openai-hub-key',
  baseURL: 'https://api.openai-hub.com/v1',
});

const response = await client.chat.completions.create({
  model: 'gpt-rosalind',
  messages: [
    {
      role: 'system',
      content:
        'You are a life sciences research assistant specialized in drug target identification and validation.',
    },
    {
      role: 'user',
      content:
        '基于现有的转录组学数据,帮我分析 PD-L1/PD-1 通路在三阴性乳腺癌中的表达模式,以及联合用药的潜在策略。',
    },
  ],
  temperature: 0.2,
});

console.log(response.choices[0].message.content);

注意 temperature 设得比较低。科学推理场景下,你希望模型的输出尽可能严谨和确定性,而不是天马行空地"创造"。这和写营销文案时把温度调高是完全相反的策略。

更大的图景

把视角拉远一点看,GPT-Rosalind 的发布是 OpenAI 战略调整的一个缩影。

过去一年,OpenAI 的产品线明显在分化:o 系列做深度推理,GPT 系列做通用对话,现在又开辟了垂直领域模型线。这不是随意为之,而是对市场需求的回应——企业客户需要的不是一个什么都能做但什么都不够精的通用模型,而是在自己的业务场景中真正好用的专业工具。

生命科学是第一个,但大概率不是最后一个。金融、法律、材料科学、气候建模……每一个知识密集型领域都有类似的需求。如果 GPT-Rosalind 在生命科学领域验证了"通用基座 + 领域特化"的路线可行,我们很可能会看到更多的 GPT-[科学家名字] 系列模型出现。

当然,这一切的前提是 GPT-Rosalind 真的好用。目前我们看到的还只是发布公告和媒体报道,没有基准测试数据,没有用户实测反馈,没有和现有工具的对比评估。在生命科学这种容错率极低的领域,模型的幻觉问题(hallucination)尤其致命——如果模型自信满满地给出一个错误的靶点预测或毒性判断,后果可能是数百万美元的研发投入打水漂。

所以,谨慎乐观是合适的态度。方向是对的,但路还很长。

OpenAI 模型产品线演进时间线,从 GPT-4 到 o 系列到 GPT-Rosalind,展示从通用到垂直的战略分化

写在最后

社区里那句"哥们我 GPT-6 呢"的吐槽,其实反映了一个有趣的认知差异。

对普通用户和大多数开发者来说,模型的价值体现在版本号上——数字越大越好,通用能力越强越好。但对 OpenAI 来说,下一个十亿美元的收入增长点,可能不在 GPT-6 的通用能力提升上,而在像 GPT-Rosalind 这样的垂直领域模型上。

制药行业每年的研发支出超过 2000 亿美元。哪怕只切下 1% 的市场,那也是 20 亿美元的生意。

GPT-6 会来的。但在那之前,OpenAI 选择先去赚聪明的钱。


参考来源