Gemini 3.1 Flash-Lite 转正:速度翻 2.5 倍,价格只要 Pro 的八分之一
产品更新Google 今天将 Gemini 3.1 Flash-Lite 推向 GA,定价为每百万 token 输入 0.25 美元、输出 1.5 美元,瞄准高并发、低成本的规模化推理场景。Preview 版将于 5 月 25 日下线。
关注 OpenAI Hub,获取大模型领域的最新动态、平台能力更新以及开发者最关心的技术实践内容。
Google 今天将 Gemini 3.1 Flash-Lite 推向 GA,定价为每百万 token 输入 0.25 美元、输出 1.5 美元,瞄准高并发、低成本的规模化推理场景。Preview 版将于 5 月 25 日下线。
OpenAI 深夜更新语音家族:GPT-Realtime-2 主打 GPT-5 级推理、低延迟双工对话,另两款分别补齐转录与 TTS 短板,语音 Agent 这条线被重新拉了一档。
Anthropic 新推出的安全审计模型 Mythos 在 Firefox 150 发布前帮 Mozilla 揪出 271 个安全漏洞,比上一代 Opus 4.6 的 22 个高出一个数量级,浏览器安全审计的玩法正在被改写。
Linux.do 用户实测开源框架 GenericAgent,发现它没有 WebUI、没有 Onboarding、没有 Gateway,所有基础设施都得自己搭。这究竟是设计哲学还是工程缺位?
5月7日,中国信通院联合中国电信、联通、移动、腾讯、华为、中兴、港中深等八家单位发起智能体可信握手协议(ATH)1.0,并同步成立智能体开源社区,意在补齐MCP、A2A之外的跨主体身份互验与权限管控短板。
OpenAI 官方披露与德国 AI 客服公司 Parloa 的合作细节。这家估值已达 30 亿美元的初创公司,正用 GPT-realtime 和 GPT-5.1 重构企业语音客服的底层逻辑——从脚本式 IVR 转向可模拟、可演练、可上线的 AI Agent。
小米 AI 实验室 Next-gen Kaldi 团队开源零样本语音克隆 TTS 模型 OmniVoice,覆盖 600 多种语言,中文 WER 低至 0.84%,合成速度比实时快 40 倍,多语言评测超过 ElevenLabs v2 和 MiniMax。
5月7日,阿里千问在PC端上线AI语音输入,快捷键即可在任意桌面应用唤起。长按转写、双击下指令,千问想做的不是一个语音打字工具,而是跨应用的AI任务调度入口。
腾讯混元联合 UCLA、港中文发布 OpenSearch-VL,从数据管道到训练算法全链路开源,30B 模型基线从 47.8 拉到 61.6,直指商业闭源系统的复现难题。
有开发者在 linux.do 公开分享了一个小米 MiMo Standard 套餐的额度 Key,原始额度 2 亿,自述还剩一亿多。更值得关注的是这个 Key 背后暴露的信息:小米 MiMo 的 API 服务同时兼容 OpenAI 和 Anthropic 两套协议。
Sub2API 最新更新补上了审计能力,默认挂的是 OpenAI 的 omni-moderation-latest——免费,但要绑卡。这道隐形门槛让一批用户被挡在外面,也暴露了国内工具链生态里一个长期存在的小毛病。
法律 AI 独角兽 Harvey 发布开源基准 LAB,覆盖 24 个法律执业领域、1200+ 智能体任务,用 7.5 万条专家评分标准衡量长程法律 Agent 的真实交付能力。首版暂不设排行榜。
Anthropic拿下SpaceX旗下Colossus 1超算的全部算力,超过22万张英伟达GPU即日起支援Claude,Pro/Max/Team/Enterprise方案的Claude Code五小时额度直接翻倍,Opus API速率限制也大幅上调。
Adobe 于 5 月 6 日在 Acrobat 中推出 PDF Spaces,支持将 PDF、文档、链接一键整合成可对话的交互空间,附带 AI 摘要、音频概览和定制聊天机器人。这是 Acrobat 从阅读器向 AI 生产力平台转型的关键一步。
谷歌于 5 月 4 日正式关停实验项目 Project Mariner,其跨网页自动化能力已被拆解并入 Gemini Agent Mode、搜索 AI Mode 以及 Chrome 的 auto-browse。这是谷歌把 Agent 从实验室推向主线产品的标志性一步。
Anthropic 为 Claude Managed Agents 推出 Dreaming 功能,让模型在空闲时自主生成思维场景、预演任务路径。同时 Pro 和 Max 用户的 Claude Code 速率限制翻倍。
Anthropic 宣布与 SpaceX 达成算力合作,即日起 Claude Code 五小时速率限制翻倍,取消 Pro/Max 账户高峰时段降额,Opus API 速率限制同步大幅上调。开发者直接受益,行业信号更值得玩味。
OpenAI 拉上 AMD、英伟达、英特尔、博通、微软共同发布 MRC(多径可靠连接)协议,专攻万卡训练集群的 GPU 网络瓶颈,通过 OCP 开放给全行业使用。
字节跳动今天升级 Doubao-Seed-2.0-lite,成为豆包家族首款全模态理解模型,视频、图像、音频、文本原生统一理解,部分高阶学科推理评测超越 2 月发布的 2.0-pro,已在火山方舟上线。
微软正式发布 Microsoft 365 E7 企业版,在 E5 基础上捆绑 Copilot、Entra 套件与 Agent 365,每用户每月 99 美元起。超出基础额度后按 Token 和资源消耗计费,这是微软第一次把"订阅+计量"模式塞进 Office 家族。