@abshekha: 在Large Scale Production Engineer上畅谈 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴…
摘要
作者在Google的AI Agent Harness Engineering演讲中,展示了一个使用Gemma 4本地大语言模型的金融智能体,该智能体在15 GB RAM下运行,性能与前沿模型相当。
查看缓存全文
缓存时间: 2026/06/28 10:05
在谷歌大规模生产工程中,畅聊AI Agent Harness Engineering,十分尽兴。
我举了个例子:用Gemma 4系列本地大模型构建了一个金融Agent,用来分析我的信用卡消费情况。
一切都在我的笔记本电脑上运行,占用内存不到15 GB!
这个Agent表现相当不错,某些情况下甚至与前沿模型不相上下。
这清晰地证明了Harness Engineering对于构建高效Agent的重要性。
YouTube演讲链接放在下一条推文中。代码仓库很快也会附上。
相似文章
@analogalok:我刚刚在8GB RTX 4060上完全本地运行了Gemma 4 26B A4B MoE模型,搭配Hermes智能体,现在它正在回测交易策略……
一位开发者展示了在8GB RTX 4060上本地运行Gemma 4 26B MoE模型,结合Hermes智能体,完全自动化回测交易策略,凸显了本地LLM作为自主智能体的日益增强的能力。
@KanikaBK: Google刚刚投下了一颗AI重磅炸弹!一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存,那就是……
Google发布了Gemma 4 12B,这是一个采用Apache 2.0许可证的开源多模态AI模型,可在拥有16GB内存的笔记本电脑上本地运行,面向企业边缘部署。
@rachpradhan: 天哪 @ivanleomk 我在飞往日本的航班上使用了 @GoogleDeepMind 的 gemma4(搭配 codegraff)阅读了几篇感兴趣的论文…
一位用户分享了在航班上使用 Google DeepMind 的 Gemma 4 模型配合开源工具 codegraff 阅读和分析论文的积极体验。Codegraff 是一个轻量级 AI 代理,可运行代码、自动化任务并支持多种模型,声称在成本和性能上相比 Claude Code 和 Codex 具有显著优势。
@LyalinDotCom:和同事吃完晚饭后回来工作,抽空学习一下……尝试更熟悉我们的……
Google 在 Gemini API 中推出了Managed Agents,允许开发者通过单一 API 调用在隔离的 Linux 环境中创建具备推理、工具使用和代码执行能力的 AI 智能体。
@googledevs: Most agent demos are stateless. Ask → answer → context gone. Production agents need to run for days — pausing, resuming…
Google Devs introduces Agent Factory series with ADK 2.0 and Gemini 3.5 Flash, demonstrating how to build production-grade stateful agents that can run for days, featuring insights on skills, MCP, and code review strategies from engineers like Rohde Davis.