iOS 27 写实生图独立上线,苹果终于不靠 ChatGPT 了

WWDC 2026 上苹果给 Image Playground 加了原生写实风格生成,不再需要绕道 ChatGPT。这是苹果自研图像模型一年来最值得说的一次升级。
iOS 27 写实生图独立上线,苹果终于不靠 ChatGPT 了
6 月 9 日凌晨的 WWDC 2026 上,苹果在 iOS 27 里给 Image Playground(图乐园)补上了一块缺了一年的拼图——原生写实风格的 AI 图像生成。从此用户在图乐园里输入一段文字描述,可以直接拿到一张接近照片质感的图像,整个过程不再需要跳转到 ChatGPT。
这件事听起来不大,但对那些用过 iOS 18.2 首发版图乐园的人来说,含义不太一样。一年半前那个只能生成「动画」「插画」「素描」三种风格的工具,被外界形容为「只能做表情包」;TechCrunch 这回的标题更直白——Apple's Image Playground doesn't suck anymore(苹果的图乐园终于不烂了)。

从「Any Style」绕道,到原生支持
回顾一下时间线会更清楚苹果这一步走得有多别扭。
2024 年 12 月,iOS 18.2 首次推出 Image Playground 和 Genmoji,那是苹果第一次把端侧扩散模型塞进 iPhone。模型跑在本地,隐私保护无可挑剔,但代价是画质:人脸塑料感重、细节糊、构图保守。和当时已经能跑 SDXL、Midjourney v6 的同行比,差距肉眼可见。
2025 年 iOS 26 时代,苹果选择了一条折中路线——在图乐园里加了个「Any Style」选项,本质是把请求转发给 ChatGPT 的图像生成接口,让用户能跳出苹果预设的几种视觉模板。这相当于承认:写实图像我自己搞不定,借 OpenAI 一下。
到了 iOS 27,苹果决定把这条腿收回来。WWDC 2026 上展示的新版图乐园里,「写实」(Photorealistic)和原有的动画、插画、素描并列,成为一个原生风格选项。不需要 ChatGPT 账号,不需要联网跳转,调用的是苹果自己(或合作伙伴)的图像模型。
自有模型升级,加上第三方接入
这次升级其实在 5 月底就被彭博社的马克・古尔曼提前剧透了。古尔曼当时披露了两个关键信息:
- 苹果自有图像模型经过了一轮明显的优化,Genmoji 和 Image Playground 的画质都会大幅提升;
- 图乐园会接入除 ChatGPT 之外的第三方模型,外界点名的候选包括 Google 的 Nano Banana 等。
从今天的发布看,第一条已经兑现——写实生成是自研模型能力跨过门槛的直接体现。第二条苹果没有在主题演讲里大说特说,但开发者文档和会后简报里有暗示:图乐园的后端是一个可插拔的模型路由层,未来不同风格、不同用途可能对应不同的底层模型,ChatGPT 不再是唯一外援。
这套设计逻辑跟苹果在 Apple Intelligence 整体架构上的思路一致:
- 设备本地小模型处理隐私敏感、低延迟的请求;
- **私有云计算(Private Cloud Compute)**承载更大参数量的任务;
- 第三方模型作为可选「外部专家」,用户授权后调用。
图乐园只是把这套三层结构在一个具体产品里展开了一遍。
写实风格意味着什么
这里要把「写实」这件事单独拎出来说。在 AI 图像生成里,写实风格是最考验模型基本功的——它要求模型同时把控光照、材质、人体结构、景深、皮肤纹理等大量物理细节,任何一项出错都会立即被人眼识破。这也是为什么早期 Stable Diffusion、DALL·E 2 在卡通风格上效果不错,但一切到写实就翻车。
苹果之前回避写实,一方面是模型能力跟不上,另一方面也是合规考量——写实人脸生成涉及深度伪造、肖像权等一连串问题。苹果一向对这种灰色地带敏感。
这次 iOS 27 敢上写实,说明几件事:
- 模型质量已经过得了 Craig Federighi 那一关,至少在演示选用的「演示文稿配图、邀请函、模型草图、壁纸」这些低风险场景下表现可用;
- 苹果应该在人脸生成上做了相当严格的安全约束,预计会沿用 Genmoji 时代的策略——对真实人物(包括用户相册里识别出的家人朋友)的处理走单独的管线,普通文本提示难以诱导出特定真人;
- 写实输出默认带有 C2PA 之类的内容溯源签名(苹果之前的隐私设计风格基本可以预判这一点)。
Appleinsider 的评价是,写实功能把图乐园从一个「玩具」推到了「轻量生产力工具」的位置——做个产品概念图、给会议邀请函配张背景、做一张锁屏壁纸,都不再需要打开 Midjourney 或者付费 ChatGPT Plus。

对普通用户和开发者各意味着什么
对普通用户,这次更新最直接的好处是:iPhone 自带的 AI 作图工具,第一次有了「能用」的水平。之前那些为了生成一张像样的图,要么去 ChatGPT 充会员、要么去 Midjourney 折腾命令的用户,现在可以在系统输入框直接出图。
对开发者,更值得关注的是 Image Playground 背后的系统级 API。苹果一贯的玩法是先把能力做进自家 App,下一步开放给第三方调用。iOS 18 时代的 ImagePlayground framework 已经提供了基础的视图组件:
import ImagePlayground
struct ContentView: View {
@State private var isPresented = false
@State private var imageURL: URL?
var body: some View {
Button("生成图像") { isPresented = true }
.imagePlaygroundSheet(
isPresented: $isPresented,
concepts: [.text("赛博朋克风格的东京街头")],
style: .photorealistic // iOS 27 新增
) { url in
imageURL = url
}
}
}
iOS 27 在 ImagePlaygroundStyle 枚举里新增了 .photorealistic,第三方 App 可以直接调用,不需要额外集成 OpenAI SDK。对于做笔记、日程、邀请函、电商商品图这一类场景的应用,这是个零成本接入写实生图能力的入口。
苹果 AI 路线的一个小转折
把这次更新放在更长的时间线里看,会发现苹果的 AI 策略正在悄悄调整。
Apple Intelligence 推出之初,外界普遍批评苹果**「自己做不出大模型,只能找 OpenAI 兜底」**。这种印象一部分来自 Siri 改造迟迟没完成(古尔曼前几周还在说全新 Siri 又跳票到 2027),一部分来自图乐园那种「Any Style 走 ChatGPT」的尴尬设计。
iOS 27 这次至少在图像生成这条线上,苹果把主动权拿回来了一部分:
- 自有模型补齐了写实风格的能力缺口;
- ChatGPT 从「唯一外援」变成「外援之一」;
- 系统级 API 留给了第三方模型接入的空间。
这不代表苹果在大模型竞赛里追上来了——文本侧的 Siri 短板还在,多模态推理上苹果几乎没有公开成果。但至少在「端侧 + 私有云 + 外部模型」这个混合架构里,苹果开始有自己的话语权,而不是只能做一个调用别人 API 的壳子。
一个顺带的事
图像模型多供应商共存的趋势,最近一年其实在开发者侧已经很明显。GPT、Claude、Gemini、DeepSeek、各家国产模型各有所长,没有哪个能一统江湖。开发者要做的越来越像是「路由」——根据任务类型、价格、延迟,把请求分发到不同模型。
这也是 OpenAI Hub 这类聚合平台存在的意义:一个 Key 接入主流闭源模型,OpenAI 兼容格式,国内直连,省去了挨个申请账号、绕代理、对接不同 SDK 的工夫。苹果自己在系统层做的事,开发者在自己的服务端也会做。
写在最后
苹果做 AI 的节奏一向慢半拍,但慢有慢的好处——他们不太会发一个明显不达标的产品就上线,然后期待 OTA 救场。iOS 18.2 那版图乐园算是一个例外,估计也是被时间表推着走。这次 iOS 27 把写实风格补上、把 ChatGPT 依赖去掉,相当于把那个例外擦掉了。
剩下的问题就一个:等正式版到了用户手上,这套自研模型的实际画质,能不能扛得住和 Midjourney、Imagen 4、GPT Image 这些同行的横向对比。这个答案得等今年秋天 iOS 27 正式发布后才有。
参考来源
- 无需调用 ChatGPT,苹果 iOS 27 版图乐园首次实现写实 AI 生图 - IT之家:WWDC 2026 上图乐园写实生图功能的首发报道
- 古尔曼:苹果 iOS 27 将大幅提升 AI 图像模型画质 - IT之家:彭博社记者古尔曼对苹果自有图像模型升级和第三方模型接入的提前披露



