小米开源 Xiaomi Miloco 2.0：基于 MiMo 大模型的全屋智能 AI 方案

小米今天发布并开源全屋智能 AI 方案 Miloco 2.0，基于自研 MiMo 大模型以 Agent 形式接入米家生态，从规则触发升级为能记忆、会识人、懂执行的家庭主动智能。

今天（6 月 18 日），小米把 Xiaomi Miloco 推到了 2.0。

距离去年 11 月那次首发刚好过了七个月。彼时小米抛出的 Miloco 1.0（Xiaomi Local Copilot），更多还是个"概念证明"——基于 MiMo-VL-Miloco-7B 端侧视觉语言大模型，把米家摄像头变成"会看画面的眼睛"，配合自然语言定义规则，让你能对着家说"读书时打开台灯"。但说实话，1.0 跑起来门槛不低，要装 30 系以上 N 卡、要懂 Docker、要手动配 MCP，真正能玩转的还是开发者圈层。

这次 2.0 的变化，可以一句话概括：从"能用大模型写规则的智能家居"，变成了"自己有脑子的管家"。

不再是"if-then"，而是"它自己琢磨着办"

传统智能家居最让人疲惫的，是你得替系统想清楚一切——什么时候开灯、什么条件触发、哪个设备联动哪个。米家、HA（Home Assistant）、Apple Home 都一样，本质都是一套精细化的"条件触发器"。规则越多越乱，最后大多数人家里那一堆自动化场景，半年后基本没人维护。

Miloco 2.0 想干掉的就是这件事。

小米给它定义了五个关键能力：通用常识、身份识别、家庭记忆、家庭任务、主动智能。前四个是地基，最后一个"主动智能"才是这次升级真正的卖点——让系统在用户开口之前，就把事情办了。

官方放出的演示视频里有个细节：男主人比平常到家晚，小爱音箱不再是冷冰冰地播个"欢迎回家"，而是会推断"可能加班了"，主动说一句"加班辛苦了，要早点休息哦"。再比如检测到家里多了一台新米家设备，系统会自动推荐互联场景，而不是等你打开 App 一个个加。

这套逻辑听起来很玄，但拆开看就三件事：有常识、记得住、能推理。

四大底层能力：把"管家"这个角色做实

先看官方列出的核心特性，逐条拆一下背后的含义：

通用常识：不再依赖预设规则识别危险。孩子拿了刀具、老人摔倒，系统能直接判断并分级预警。这部分背后吃的是 MiMo 多模态模型的视觉理解和世界知识——传统智能家居要做这事，得专门训一个跌倒检测算法、再训一个危险物品识别模型，现在直接交给一个 VLM 就完事了。
身份识别：人脸 + 体态融合，由大模型完成家庭成员识别，还支持主动注册新成员。这意味着系统能区分"是爸爸回家了"还是"是孩子回家了"，进而触发不同的个性化操作。这个能力的重要性在于：它把"家"从一个空间概念，变成了"一群有身份的人"的集合。
家庭记忆：长期沉淀偏好和习惯。比如系统观察到你每天睡前都会调暗灯光、关电视、把空调设到 26 度，过段时间它会主动提醒你"要不要直接把这套流程升级成自动任务？"。这其实就是给智能体加了个"长期记忆"模块，对应到大模型领域，类似 Memory 系统在 Agent 框架里的角色。
家庭任务：从单条规则升级成可长期运转的复杂任务。"每天提醒吃药""每天运动半小时统计"这种过去得依赖单独 App 的事，现在被统一抽象成 Agent 的长期任务。

这四块加起来，才能撑起所谓"主动智能"——系统像个管家一样观察、判断、干预。

部署门槛大降，Mac mini 就能跑

1.0 时代真正劝退人的是硬件。当时要 x64 + 30 系以上 N 卡 + 16GB 显存起步，大多数家庭根本没这玩意儿常驻。

2.0 直接把推荐配置改成了 Mac mini：

内存 ≥ 4GB
存储 ≥ 256GB
7×24 常驻运行
macOS / Linux（Windows 需要在 WSL 里跑）
一个小米账号 + 已接入米家的设备
多模态大模型 API Key（感知用 MiMo-v2.5，Agent 用 MiMo-v2.5-pro）

这套配置基本意味着：一台 4000 块的 Mac mini 就能把全屋智能盘活。这是 1.0 到 2.0 之间最大的工程进步——不是模型本身有多惊艳，而是终于做到了"普通爱好者拿得动"。

另一个被低调放出来的信号是：Miloco 2.0 是以 Agent 插件的形式接入的。这意味着它不再是个独立的封闭系统，而是个能被嵌入到更大 Agent 生态里的组件。如果你已经在用 Home Assistant、或者搭了自己的 LLM 工作流，理论上可以把 Miloco 当成一个能力模块挂上去。

MiMo v2.5：小米的牌面终于打出来了

要理解 Miloco 2.0 为什么能从规则触发升级到 Agent 推理，得回过头看 MiMo 这条线。

2025 年 4 月，小米开源了首个推理大模型 MiMo，7B 参数量在 AIME 24-25 和 LiveCodeBench v5 上超过了 o1-mini 和 QwQ-32B-Preview——这是当时整个圈子很意外的一件事，小米第一次让外界看到它在大模型上不是玩票。11 月罗福莉加盟 MiMo 团队，更是把这条线的人才厚度推上一个台阶。

现在 Miloco 2.0 推荐使用的是 MiMo-v2.5 做感知、MiMo-v2.5-pro 做 Agent。这套搭配的逻辑很清晰：感知层处理高频的视觉信号流，需要轻量低延迟；Agent 层处理意图理解、任务规划、工具调用，需要更强的推理能力。这种"两段式"分工，是过去一年开源 Agent 框架的主流做法。

值得一提的是，整个推理链路在隐私上做了进一步收紧：支持数据隔离、支持本地数据一键清空。视觉数据原则上不出端。这事在国内做智能家居的语境下挺关键——别忘了米家摄像头是装在卧室客厅的。

它真正想干什么：把 10 亿台 IoT 设备装上大脑

小米 AIoT 平台连接的 IoT 设备数（不含手机平板笔电）截至去年 6 月就已经接近 10 亿台。这是个吓人的数字。Miloco 2.0 真正的野心，不是做出多牛的 Demo，而是给这 10 亿台设备装上一个统一的大脑。

这是小米和 Google、Apple 路线最大的不同：

Google Home 走的是"中心化云端 Gemini + 设备执行"
Apple 押的是"端侧小模型 + 严格生态准入"
小米选的是"自研模型 + 开源 + 边缘部署 + 兼容三方"

开源这件事在这个场景里尤其重要。智能家居的痛点从来不是单点设备不够智能，而是跨品牌联动太难。小米通过 MCP 协议把米家和 Home Assistant 打通过，这次 2.0 进一步降低部署门槛、提供 Web 面板，本质是在拉拢极客社区——让大家愿意把它装在自己家里，反过来贡献场景、规则、数据。

这条路如果真跑通了，长期看会比 Apple HomeKit 那种封闭模式更有生命力。

一些值得泼的冷水

说了这么多优点，也得讲点冷静的判断。

第一，"主动智能"的体验上限取决于推理质量。演示视频里的"加班关心你"很温暖，但真要在每个用户家里都做对，需要模型对当下情境的判断极其准确。判断错一次，就是用户卸载的开始。这一块在真实场景里有多少误判率，还得等开源社区跑一段时间才能看出来。

第二，Mac mini 当主机这件事，国内用户接受度有限。推荐配置写着 Mac mini，但相当一部分米家用户家里没有 Mac。Linux 部署虽然支持，但对普通用户依然是门槛。短期内 Miloco 2.0 还是极客玩具，要进入主流家庭，得等小米出一台专门的家庭 AI 主机硬件——这件事大概率在路上。

第三，云端 Agent 调用的成本和延迟。MiMo-v2.5-pro 走 API，意味着每次复杂决策都要调用云端。如果系统真按"主动观察"的设计 7×24 在跑，每天产生的调用量不是个小数字。这部分如果不能做到大幅度的端侧化，长期使用成本会是个问题。

写在最后

Miloco 1.0 是个"演示"，2.0 才是个"产品"。

它把过去七年大家喊了无数遍的"全屋智能"，第一次和 Agent、记忆、主动智能这些概念串到了一起，并且把工程门槛打到了一个普通技术爱好者能折腾的位置。模型在小米自己手里，框架开源在 GitHub 上，硬件生态有近 10 亿台设备做底盘——这三件事凑齐，国内做智能家居的厂商，今年下半年大概率都要被迫拿出回应。

对开发者来说，现在最值得做的事，是去 GitHub 把代码拉下来跑一遍，看看这套 Agent 框架到底能撑住多复杂的场景。智能家居这个赛道沉寂太久了，是时候有人重新定义一下了。

参考来源

小米发布全屋智能 AI 开源方案 Xiaomi Miloco 2.0：号称能记忆、会识人、懂执行 - IT之家：IT之家对 Miloco 2.0 发布的核心特性报道
xiaomi-miloco GitHub 仓库：Miloco 项目官方开源代码与部署文档
Miloco 使用文档（中文）：Miloco 的规则配置、MCP 接入、模型选择详细说明
小米开源智能家居未来探索方案 Xiaomi Miloco：大模型走进千家万户 - 知乎：Miloco 1.0 时代的方案解读，可对比 2.0 升级幅度

小米开源 Miloco 2.0：智能家居开始有"记性"了

不再是"if-then"，而是"它自己琢磨着办"

四大底层能力：把"管家"这个角色做实

部署门槛大降，Mac mini 就能跑

MiMo v2.5：小米的牌面终于打出来了

它真正想干什么：把 10 亿台 IoT 设备装上大脑

一些值得泼的冷水

写在最后

参考来源

相关推荐

OpenAI 砸 60 万美元入局 Rust 基金会，成白金会员

DeepSeek 识图模式上线:补齐多模态最后一块拼图

英伟达把 AI 队友塞进虚幻5，8G 显存就能跑

联系我们