小米开源 Miloco 2.0:智能家居开始有"记性"了
小米今天发布并开源全屋智能 AI 方案 Miloco 2.0,基于自研 MiMo 大模型以 Agent 形式接入米家生态,从规则触发升级为能记忆、会识人、懂执行的家庭主动智能。
今天(6 月 18 日),小米把 Xiaomi Miloco 推到了 2.0。
距离去年 11 月那次首发刚好过了七个月。彼时小米抛出的 Miloco 1.0(Xiaomi Local Copilot),更多还是个"概念证明"——基于 MiMo-VL-Miloco-7B 端侧视觉语言大模型,把米家摄像头变成"会看画面的眼睛",配合自然语言定义规则,让你能对着家说"读书时打开台灯"。但说实话,1.0 跑起来门槛不低,要装 30 系以上 N 卡、要懂 Docker、要手动配 MCP,真正能玩转的还是开发者圈层。
这次 2.0 的变化,可以一句话概括:从"能用大模型写规则的智能家居",变成了"自己有脑子的管家"。
不再是"if-then",而是"它自己琢磨着办"
传统智能家居最让人疲惫的,是你得替系统想清楚一切——什么时候开灯、什么条件触发、哪个设备联动哪个。米家、HA(Home Assistant)、Apple Home 都一样,本质都是一套精细化的"条件触发器"。规则越多越乱,最后大多数人家里那一堆自动化场景,半年后基本没人维护。
Miloco 2.0 想干掉的就是这件事。
小米给它定义了五个关键能力:通用常识、身份识别、家庭记忆、家庭任务、主动智能。前四个是地基,最后一个"主动智能"才是这次升级真正的卖点——让系统在用户开口之前,就把事情办了。
官方放出的演示视频里有个细节:男主人比平常到家晚,小爱音箱不再是冷冰冰地播个"欢迎回家",而是会推断"可能加班了",主动说一句"加班辛苦了,要早点休息哦"。再比如检测到家里多了一台新米家设备,系统会自动推荐互联场景,而不是等你打开 App 一个个加。
这套逻辑听起来很玄,但拆开看就三件事:有常识、记得住、能推理。
四大底层能力:把"管家"这个角色做实
先看官方列出的核心特性,逐条拆一下背后的含义:
-
通用常识:不再依赖预设规则识别危险。孩子拿了刀具、老人摔倒,系统能直接判断并分级预警。这部分背后吃的是 MiMo 多模态模型的视觉理解和世界知识——传统智能家居要做这事,得专门训一个跌倒检测算法、再训一个危险物品识别模型,现在直接交给一个 VLM 就完事了。
-
身份识别:人脸 + 体态融合,由大模型完成家庭成员识别,还支持主动注册新成员。这意味着系统能区分"是爸爸回家了"还是"是孩子回家了",进而触发不同的个性化操作。这个能力的重要性在于:它把"家"从一个空间概念,变成了"一群有身份的人"的集合。
-
家庭记忆:长期沉淀偏好和习惯。比如系统观察到你每天睡前都会调暗灯光、关电视、把空调设到 26 度,过段时间它会主动提醒你"要不要直接把这套流程升级成自动任务?"。这其实就是给智能体加了个"长期记忆"模块,对应到大模型领域,类似 Memory 系统在 Agent 框架里的角色。
-
家庭任务:从单条规则升级成可长期运转的复杂任务。"每天提醒吃药""每天运动半小时统计"这种过去得依赖单独 App 的事,现在被统一抽象成 Agent 的长期任务。
这四块加起来,才能撑起所谓"主动智能"——系统像个管家一样观察、判断、干预。
部署门槛大降,Mac mini 就能跑
1.0 时代真正劝退人的是硬件。当时要 x64 + 30 系以上 N 卡 + 16GB 显存起步,大多数家庭根本没这玩意儿常驻。
2.0 直接把推荐配置改成了 Mac mini:
- 内存 ≥ 4GB
- 存储 ≥ 256GB
- 7×24 常驻运行
- macOS / Linux(Windows 需要在 WSL 里跑)
- 一个小米账号 + 已接入米家的设备
- 多模态大模型 API Key(感知用 MiMo-v2.5,Agent 用 MiMo-v2.5-pro)
这套配置基本意味着:一台 4000 块的 Mac mini 就能把全屋智能盘活。这是 1.0 到 2.0 之间最大的工程进步——不是模型本身有多惊艳,而是终于做到了"普通爱好者拿得动"。
另一个被低调放出来的信号是:Miloco 2.0 是以 Agent 插件的形式接入的。这意味着它不再是个独立的封闭系统,而是个能被嵌入到更大 Agent 生态里的组件。如果你已经在用 Home Assistant、或者搭了自己的 LLM 工作流,理论上可以把 Miloco 当成一个能力模块挂上去。
MiMo v2.5:小米的牌面终于打出来了
要理解 Miloco 2.0 为什么能从规则触发升级到 Agent 推理,得回过头看 MiMo 这条线。
2025 年 4 月,小米开源了首个推理大模型 MiMo,7B 参数量在 AIME 24-25 和 LiveCodeBench v5 上超过了 o1-mini 和 QwQ-32B-Preview——这是当时整个圈子很意外的一件事,小米第一次让外界看到它在大模型上不是玩票。11 月罗福莉加盟 MiMo 团队,更是把这条线的人才厚度推上一个台阶。
现在 Miloco 2.0 推荐使用的是 MiMo-v2.5 做感知、MiMo-v2.5-pro 做 Agent。这套搭配的逻辑很清晰:感知层处理高频的视觉信号流,需要轻量低延迟;Agent 层处理意图理解、任务规划、工具调用,需要更强的推理能力。这种"两段式"分工,是过去一年开源 Agent 框架的主流做法。
值得一提的是,整个推理链路在隐私上做了进一步收紧:支持数据隔离、支持本地数据一键清空。视觉数据原则上不出端。这事在国内做智能家居的语境下挺关键——别忘了米家摄像头是装在卧室客厅的。
它真正想干什么:把 10 亿台 IoT 设备装上大脑
小米 AIoT 平台连接的 IoT 设备数(不含手机平板笔电)截至去年 6 月就已经接近 10 亿台。这是个吓人的数字。Miloco 2.0 真正的野心,不是做出多牛的 Demo,而是给这 10 亿台设备装上一个统一的大脑。
这是小米和 Google、Apple 路线最大的不同:
- Google Home 走的是"中心化云端 Gemini + 设备执行"
- Apple 押的是"端侧小模型 + 严格生态准入"
- 小米选的是"自研模型 + 开源 + 边缘部署 + 兼容三方"
开源这件事在这个场景里尤其重要。智能家居的痛点从来不是单点设备不够智能,而是跨品牌联动太难。小米通过 MCP 协议把米家和 Home Assistant 打通过,这次 2.0 进一步降低部署门槛、提供 Web 面板,本质是在拉拢极客社区——让大家愿意把它装在自己家里,反过来贡献场景、规则、数据。
这条路如果真跑通了,长期看会比 Apple HomeKit 那种封闭模式更有生命力。
一些值得泼的冷水
说了这么多优点,也得讲点冷静的判断。
第一,"主动智能"的体验上限取决于推理质量。演示视频里的"加班关心你"很温暖,但真要在每个用户家里都做对,需要模型对当下情境的判断极其准确。判断错一次,就是用户卸载的开始。这一块在真实场景里有多少误判率,还得等开源社区跑一段时间才能看出来。
第二,Mac mini 当主机这件事,国内用户接受度有限。推荐配置写着 Mac mini,但相当一部分米家用户家里没有 Mac。Linux 部署虽然支持,但对普通用户依然是门槛。短期内 Miloco 2.0 还是极客玩具,要进入主流家庭,得等小米出一台专门的家庭 AI 主机硬件——这件事大概率在路上。
第三,云端 Agent 调用的成本和延迟。MiMo-v2.5-pro 走 API,意味着每次复杂决策都要调用云端。如果系统真按"主动观察"的设计 7×24 在跑,每天产生的调用量不是个小数字。这部分如果不能做到大幅度的端侧化,长期使用成本会是个问题。
写在最后
Miloco 1.0 是个"演示",2.0 才是个"产品"。
它把过去七年大家喊了无数遍的"全屋智能",第一次和 Agent、记忆、主动智能这些概念串到了一起,并且把工程门槛打到了一个普通技术爱好者能折腾的位置。模型在小米自己手里,框架开源在 GitHub 上,硬件生态有近 10 亿台设备做底盘——这三件事凑齐,国内做智能家居的厂商,今年下半年大概率都要被迫拿出回应。
对开发者来说,现在最值得做的事,是去 GitHub 把代码拉下来跑一遍,看看这套 Agent 框架到底能撑住多复杂的场景。智能家居这个赛道沉寂太久了,是时候有人重新定义一下了。
参考来源
- 小米发布全屋智能 AI 开源方案 Xiaomi Miloco 2.0:号称能记忆、会识人、懂执行 - IT之家:IT之家对 Miloco 2.0 发布的核心特性报道
- xiaomi-miloco GitHub 仓库:Miloco 项目官方开源代码与部署文档
- Miloco 使用文档(中文):Miloco 的规则配置、MCP 接入、模型选择详细说明
- 小米开源智能家居未来探索方案 Xiaomi Miloco:大模型走进千家万户 - 知乎:Miloco 1.0 时代的方案解读,可对比 2.0 升级幅度
