巴西里约热内卢市政信息公司 IplanRIO 在 Hugging Face 悄悄放出 Rio 3.5 Open 397B，底子是阿里 Qwen 3.5-Plus，参数 3970 亿、激活 170 亿，宣称跑分反超 Qwen 3.7 Plus。一个市政府 IT 部门做前沿大模型，怎么看都透着一股魔幻现实主义。

里约市政府开源 397B 大模型：基于 Qwen 3.5 微调，自称跑分超 Qwen 3.7 Plus

这两天 Hugging Face 上冒出来一个挺离谱的模型：Rio-3.5-Open-397B。发布方不是哪家熟悉的实验室，而是 IplanRIO——巴西里约热内卢市政府下属的市政信息技术公司。模型卡上一本正经地写着"前沿通用人工智能模型"，底子却是阿里今年除夕开源的 Qwen 3.5-Plus 397B，跑分页面赫然挂着"超越 Qwen 3.7 Plus"。

一个负责市政信息化的国企，跨界搞 4000 亿参数大模型，还说反超了模型原作者最新一代旗舰？这件事怎么看都得拆开聊聊。

Rio-3.5-Open-397B 在 Hugging Face 的模型主页截图

先说事实：这是个什么模型

按 Hugging Face 仓库 prefeitura-rio/Rio-3.5-Open-397B（prefeitura 是葡语"市政府"）的描述，Rio 3.5 Open 397B 的关键参数和 Qwen 3.5-Plus 高度一致：

总参数 3970 亿，MoE 架构，单次推理激活约 170 亿
走的是 Qwen 3.5 同款混合注意力 + 多 Token 联合预测 + 注意力门控那套架构
原生多模态，文本和视觉混合预训练
支持 250k 词表、200+ 语言
Apache 2.0 协议（继承自 Qwen 3.5）

说白了，这不是从零训的模型，是基于 Qwen 3.5-Plus 的二次训练（continual pretraining + post-training）成果。IplanRIO 没有藏着掖着，模型卡里也提了 base model 是 Qwen 3.5-Plus。所以"自研前沿模型"这个表述，跟我们常理解的意思不太一样——它更像是一个经过领域适配和巴西葡萄牙语强化的 Qwen 衍生版本。

跑分"超越 Qwen 3.7 Plus"，要怎么看

这是争议最大的部分。Qwen 3.7-Plus 是阿里今年最新一代旗舰，多模态智能体能力业界第一梯队。一个市政府 IT 公司的微调模型，凭什么反超？

看了 IplanRIO 放出来的评测细节，事情就清楚了：

测试集偏向葡萄牙语任务和拉美区域知识，比如巴西法律文书、市政公文、葡语 MMLU 子集等
通用英语和中文基准上，并没有声称超越，主要是和 Qwen 3.5-Plus 拉开差距
在 IFBench 葡语子集、本地化 GPQA 翻译版等"小赛道"上，确实跑出了对 Qwen 3.7-Plus 的优势

这种"我在自己的主场赢了"的故事，AI 圈见得不少。但放在工程视角下，这套打法其实挺务实的：里约市政府的实际业务场景就是处理葡语公文、市民咨询、本地法规问答，全球通用能力对他们意义不大，把一个开源底座调到自己的语料上反而是最优解。

问题出在传播口径——"超越 Qwen 3.7 Plus"这种说法在中文社区被掐头去尾传一圈，自然就变味了。

为什么市政府要自己做大模型

这事得放在拉美的政治语境里看。

过去两年，巴西、阿根廷、墨西哥这些拉美国家对"AI 主权"的讨论密度肉眼可见地涨起来。主权 AI 这个词去年 WAIC 上被反复提及，核心矛盾就是：政府数据不愿意走美国闭源 API，本地训练又没那个钱和算力。

开源模型给了他们一条中间路。Llama、Qwen、DeepSeek 这种级别的开源基座放出来，中等体量的政府机构和高校只要肯花几十到几百万美金的算力账，就能做出一个"看上去像那么回事"的本地模型。IplanRIO 这次的操作，本质就是这条路线的样本：

不重复造轮子：基座直接用 Qwen 3.5-Plus，省下数亿训练成本
聚焦本地场景：葡语优化、市政公文处理、巴西法律推理
政治正确：模型权重开源，符合"公共数据训出来的模型应当公共所有"的叙事

从这个角度，Rio 3.5 Open 397B 不是技术突破，它是一个公共部门 AI 落地的政治产品。技术圈的人看着觉得别扭，因为它强行套用了"前沿模型"的话术；但站在里约市政府的预算汇报视角，这套包装是必要的。

顺带聊聊 Qwen 3.5-Plus 这个底座

既然 Rio 3.5 是 Qwen 3.5-Plus 的二创，那真正值得复盘的还是 Qwen 3.5-Plus 本身。这个模型今年除夕开源，到现在差不多四个月，已经成为开源社区微调和衍生模型的第一基座，地位类似一年前的 Llama 3.1 405B。

它的几个设计选择，现在回头看都挺有先见之明：

1. MoE 把激活比压到 5% 以下

3970 亿总参数，单次推理只激活 170 亿。这个比例比 DeepSeek V3 还激进。对二次训练方来说是巨大的福利——继续训练时只需要更新被激活的那部分专家，硬件门槛从 8 台 H100 起步直接降到 2 台就能跑通微调。IplanRIO 这种预算有限的机构能下场，本质就是吃了这个红利。

2. 多 Token 联合预测

训练阶段就让模型学会一次预测多个未来 token，推理速度接近翻倍。这个特性在政府类问答场景下特别实用——市民咨询要求响应快，传统逐 token 生成在 397B 这种体量下根本压不住延迟。

3. 原生多模态

预训练第一天就是文本+视觉混合 token，没有走"先训语言模型再贴视觉模块"的取巧路线。Rio 3.5 直接继承了这个能力，在巴西证件 OCR、城市道路图像识别这类场景里能省去额外的视觉模型部署。

4. 注意力门控（NeurIPS 2025 最佳论文那套）

这是 Qwen 3.5-Plus 训练稳定性的关键，也让下游微调者敢于在大规模数据上继续训练而不担心模型崩掉。Rio 3.5 据说在 1.2T tokens 的葡语和市政数据上做了 continual pretraining，能跑稳跟这个机制脱不开关系。

这个模型实际能用吗

抛开"超越 Qwen 3.7 Plus"的营销话术不谈，从工程角度评估，Rio 3.5 Open 397B 在以下场景有真实价值：

葡萄牙语 NLP 应用：尤其是巴西葡语，跟欧洲葡语有不少差异，市面上专门优化的开源大模型不多
拉美法律、政务相关应用：训练语料显然吃了大量这块数据
作为 Qwen 3.5-Plus 的小语种增强版：如果你的业务需要葡语 + 中文 + 英文同时在线，这个模型可能比裸的 Qwen 3.5-Plus 更省事

但如果你做的是通用对话、代码、Agent，那直接用 Qwen 3.5-Plus 甚至 Qwen 3.7-Plus 才是正解。Rio 3.5 在通用任务上不太可能比官方版本更强，毕竟 IplanRIO 的训练资源和数据多样性跟阿里完全不在一个量级。

部署成本：别被 397B 吓到

看到 397B 参数很多人下意识就觉得"我跑不起"。其实激活只有 170 亿，FP8 量化后单机 8 卡 H100/H200 就能推理，社区已经有人把它跑在 4 卡 A100 80G 上（带量化和 offload）。这是 MoE 架构的红利。

如果只是想试试效果，更现实的路径是：

Hugging Face Inference Endpoint 拉起来跑几次
用 vLLM + AWQ 量化在自己机器上部署
直接走云端聚合平台调 Qwen 3.5-Plus 原版（Rio 3.5 还没看到主流平台接入，但 Qwen 3.5/3.7 系列在 OpenAI Hub 上是直接可用的，国内也能直连，对于做对比测试方便不少）

这事释放了什么信号

往更大的层面说，Rio 3.5 这种"地方政府 IT 部门发大模型"的现象会越来越多。原因有三：

开源基座足够强：Qwen 3.5、DeepSeek V3.5、Llama 4 这一档模型已经能满足 90% 的下游需求，剩下 10% 微调就够了
算力价格在跌：H100 现货价格今年比去年降了 30%+，租赁市场更便宜
政治诉求强烈：每个国家、每个大城市都想有"自己的 AI"

所以未来一两年，我们大概率会看到"圣保罗大模型""开普敦大模型""雅加达大模型"陆续冒出来。它们不会真正改变前沿模型的竞争格局，但会让开源生态更分散、更本地化。

对开发者来说，这意味着两件事：

基座选型变得更重要：选对一个被广泛二创的基座（比如 Qwen 3.5-Plus），你能蹭到全球的微调成果
本地化模型有真实需求：如果你做小语种或区域市场，关注这些"市政府版"模型可能比死磕 GPT 更划算

最后一句

回到 Rio 3.5 Open 397B 这件事本身。它不是技术奇迹，但它是开源大模型平民化的一个标志性事件——当一个城市政府的信息公司都能用别人的基座做出一个看起来体面的"前沿模型"，意味着这个时代真的来了：你不需要是 OpenAI、Anthropic、阿里、DeepSeek，也能在 Hugging Face 上挂出自己的 397B。

至于"超越 Qwen 3.7 Plus"——就当是市政预算汇报里的一句修辞吧。

参考来源

linux.do - 里约热内卢市政信息公司发布 Rio 3.5 Open 397B 模型：原始话题讨论帖，包含模型发布和社区初步反应
Hugging Face - prefeitura-rio/Rio-3.5-Open-397B：模型仓库主页，包含模型卡、权重下载和评测细节
知乎 - WAIC 2025 大模型论坛：主权高墙还是开源洪流：关于全球 AI 主权与开源生态趋势的深度分析，可作为 Rio 3.5 现象的背景参考

里约市政府开源 397B 大模型：基于 Qwen 3.5 微调，自称跑分超 Qwen 3.7 Plus

里约市政府开源 397B 大模型：基于 Qwen 3.5 微调，自称跑分超 Qwen 3.7 Plus

先说事实：这是个什么模型

跑分"超越 Qwen 3.7 Plus"，要怎么看

为什么市政府要自己做大模型

顺带聊聊 Qwen 3.5-Plus 这个底座

1. MoE 把激活比压到 5% 以下

2. 多 Token 联合预测

3. 原生多模态

4. 注意力门控（NeurIPS 2025 最佳论文那套）

这个模型实际能用吗

部署成本：别被 397B 吓到

这事释放了什么信号

最后一句

参考来源

相关推荐

1500美元训出1B模型，HRM-Text凭什么让Bengio团队下注？

智谱 ZCode 3.0 押注自研 Agent，把第三方内核扫地出门

英特尔砍掉BigDL：开源AI框架6月底归档

联系我们