本地iPhone AI图像生成正变得实用 - 每张图片仅需3秒

Reddit r/ArtificialInteligence 新闻

摘要

基准测试显示,在iPhone上本地运行Stable Diffusion 1.5,使用Realistic Vision V5.1 Hyper等优化模型,生成512x512图像最快仅需3.1秒,使得设备端AI图像生成变得切实可行。

我一直在iPhone上测试本地Stable Diffusion 1.5生成,并希望分享这些数据,因为大多数SD基准测试仍然侧重于桌面/GPU。 **设置:** - 设备:iPhone 17 - 输出:512x512 - 计算:CPU + 神经引擎 - 3个模型 × 3个提示词 × 3次运行 = 总共27次生成 - 最终表格显示每个提示词/模型对的最佳生成结果 - 计时为热启动运行,模型包已安装/准备就绪 **测试的模型/设置:** CyberRealistic | DPM Solver Multistep / Karras | 30步 / CFG 7 | 13.6秒 DreamShaper 8 LCM | LCM / Leading | 10步 / CFG 2 | 4.5秒 Realistic Vision V5.1 Hyper | DPM Solver Singlestep / Karras | 6步 / CFG 1.5 | 3.1秒 这怎么还没引起关注?🤯🤯🤯 我相当确信,通过进一步优化模型或运行时,以及硬件升级,我们将实现几乎即时的图像生成,很快视频生成也将成为可能。完整基准测试及所有详情请见:[https://medium.com/@rokbozi/iphone-stable-diffusion-1-5-benchmark-local-ai-image-generation-is-fast-3462f58491e9](https://medium.com/@rokbozi/iphone-stable-diffusion-1-5-benchmark-local-ai-image-generation-is-fast-3462f58491e9)
查看原文

相似文章

最强本地AI图像生成器来了!

YouTube AI Channels

Ernie Image,全新开源扩散模型,文字渲染与提示词忠实度全面超越Zage,可在ComfyUI本地运行,仅需约20 GB显存。

本地 AI 应成为常态

Hacker News Top

本文指出,出于隐私和可靠性方面的顾虑,不应依赖云端托管的 AI API,并倡导采用设备端 AI 处理模式,文中以一款利用 Apple 本地模型 API 的原生 iOS 应用为例进行了说明。

1-Bit Bonsai Image 4B 本地设备图像生成

Hacker News Top

PrismML 发布 Bonsai Image 4B,这是一系列紧凑型图像生成模型,使用 1-bit 和三进制权重,能够在笔记本电脑和 iPhone 等本地设备上实现高质量扩散推理,同时显著减少内存占用。