model-deployment

标签

Cards List
#model-deployment

Empromptu AI

Product Hunt · 4天前

Empromptu AI 是一款产品,能够利用您正在构建的应用程序来训练微调后的AI模型,从而简化微调工作流程。

0 人收藏 0 人点赞
#model-deployment

@danveloper: 简直不敢相信,我竟然在树莓派 5(8GB 版)上以超过1 tok/s的速度运行了 DeepSeek-V4-Flash(284B 参数)……

X AI KOLs Timeline · 4天前 缓存

一位开发者经过大量实验,成功在树莓派 5 上以超过1 tok/s的速度运行了284B参数的DeepSeek-V4-Flash模型,使用的是来自 antirez 的未经修改的 GGUF 文件。

0 人收藏 0 人点赞
#model-deployment

@Teknium:在你的手表上运行Hermes?不错啊

X AI KOLs Following · 2026-05-22 缓存

讨论在智能手表上运行Hermes AI模型,并考虑添加实时通知流以在锁屏上显示回复。

0 人收藏 0 人点赞
#model-deployment

Cerebras 现已运行 Kimi K2.6(一分钟阅读)

TLDR AI · 2026-05-20 缓存

Cerebras 宣布,其硬件现已运行来自 Moonshot AI 的 AI 模型 Kimi K2.6。

0 人收藏 0 人点赞
#model-deployment

@ycombinator:General Instinct (@gen_instinct) 将前沿AI模型部署到受限边缘硬件上,助力机器人技术和物理…

X AI KOLs Following · 2026-05-19

General Instinct 推出一个部署层,使前沿AI模型能够在如 Jetson 和移动 NPU 等受限边缘硬件上运行,帮助机器人技术和物理AI团队实现低延迟离线推理。

0 人收藏 0 人点赞
#model-deployment

如何应对部署在无可靠连接区域的设备上AI模型的固件更新?是等待技术人员上门,还是接受模型过时?

Reddit r/AI_Agents · 2026-05-19

深入剖析在偏远或无网络连接环境中部署边缘设备时更新AI模型所面临的真实挑战,涵盖连接窗口、技术人员上门、网格传播以及接受模型过时等策略。

0 人收藏 0 人点赞
#model-deployment

@jeffboudier: "我们提供模型选择,无须基础设施混乱" — @MichaelDell,来自#DellTechWorld现场 Kimi K2.6、DeepSeek V…

X AI KOLs Following · 2026-05-18 缓存

Dell和Hugging Face宣布,包括Kimi K2.6、DeepSeek V4 Pro、GLM 5.1、MiniMax M2.7和DeepSeek V4 Flash在内的多款AI模型现可通过Dell Enterprise Hub获取,并针对配备NVIDIA B300的PowerEdge XE9780进行了优化,简化了模型选择和基础设施。

0 人收藏 0 人点赞
#model-deployment

在24GB显存环境中运行Qwen 3.6 27B的配置:后端对比、量化选择与设置(llama.cpp, ik_llama.cpp, BeeLlama, vllm)

Reddit r/LocalLLaMA · 2026-05-18

本文对比了在RTX 3090 24GB上运行Qwen 3.6 27B使用的llama.cpp后端,发现搭配IQ4_KS量化的ik_llama.cpp性能最佳(预填充1261 tok/s,解码72.9 tok/s)。

0 人收藏 0 人点赞
#model-deployment

感觉AI正在进入其“基础设施问题”阶段

Reddit r/artificial · 2026-05-07

文章强调了AI行业的一个转变,焦点正从单纯的模型基准性能转向延迟、编排和成本效率等基础设施挑战。这表明AI正成熟为一个系统问题,实际体验变得比原始模型能力更重要。

0 人收藏 0 人点赞
#model-deployment

关于我们安全和安保实践的更新

OpenAI Blog · 2024-09-16 缓存

OpenAI 宣布成立由 Zico Kolter 担任主席的独立董事会安全和安保委员会,该委员会有权监督并根据安全顾虑延迟模型发布。公司还为模型开发和部署引入了集成的安全和安保框架,重组团队以加强研究、安全和政策功能之间的协作。

0 人收藏 0 人点赞
#model-deployment

adirik/grounding-dino

Replicate Explore · 2026-05-08 缓存

Grounding DINO 是一个开放词汇的目标检测模型,能够根据文本描述检测任意对象,现已在 Replicate 上可用。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈