@abshekha: 在Large Scale Production Engineer上畅谈 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴…

X AI KOLs Timeline 2026/06/28 07:46 新闻

ai-agents harness-engineering gemma-4 local-llms google financial-agent

摘要

作者在Google的AI Agent Harness Engineering演讲中，展示了一个使用Gemma 4本地大语言模型的金融智能体，该智能体在15 GB RAM下运行，性能与前沿模型相当。

在Google的Large Scale Production Engineering活动上，我愉快地讨论了关于 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗛𝗮𝗿𝗻𝗲𝘀𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗶𝗻𝗴 的话题。我举了一个例子：构建一个金融智能体来分析我的信用卡支出，使用了Gemma 4系列的本地大语言模型。一切都在我笔记本电脑的15 GB RAM下运行！该智能体表现相当不错，在某些情况下甚至与前沿模型不相上下。这清楚地证明了工程化对于构建高效智能体的重要性。后续推文将附上YouTube演讲链接。代码仓库也将很快公布。

查看原文

查看缓存全文

缓存时间: 2026/06/28 10:05

在谷歌大规模生产工程中，畅聊AI Agent Harness Engineering，十分尽兴。

我举了个例子：用Gemma 4系列本地大模型构建了一个金融Agent，用来分析我的信用卡消费情况。

一切都在我的笔记本电脑上运行，占用内存不到15 GB！

这个Agent表现相当不错，某些情况下甚至与前沿模型不相上下。

这清晰地证明了Harness Engineering对于构建高效Agent的重要性。

YouTube演讲链接放在下一条推文中。代码仓库很快也会附上。

相似文章

@analogalok：我刚刚在8GB RTX 4060上完全本地运行了Gemma 4 26B A4B MoE模型，搭配Hermes智能体，现在它正在回测交易策略……

X AI KOLs Following

一位开发者展示了在8GB RTX 4060上本地运行Gemma 4 26B MoE模型，结合Hermes智能体，完全自动化回测交易策略，凸显了本地LLM作为自主智能体的日益增强的能力。

@KanikaBK: Google刚刚投下了一颗AI重磅炸弹！一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存，那就是……

X AI KOLs Timeline

Google发布了Gemma 4 12B，这是一个采用Apache 2.0许可证的开源多模态AI模型，可在拥有16GB内存的笔记本电脑上本地运行，面向企业边缘部署。

@rachpradhan: 天哪 @ivanleomk 我在飞往日本的航班上使用了 @GoogleDeepMind 的 gemma4（搭配 codegraff）阅读了几篇感兴趣的论文…

X AI KOLs Timeline

一位用户分享了在航班上使用 Google DeepMind 的 Gemma 4 模型配合开源工具 codegraff 阅读和分析论文的积极体验。Codegraff 是一个轻量级 AI 代理，可运行代码、自动化任务并支持多种模型，声称在成本和性能上相比 Claude Code 和 Codex 具有显著优势。

@LyalinDotCom：和同事吃完晚饭后回来工作，抽空学习一下……尝试更熟悉我们的……

X AI KOLs Following

Google 在 Gemini API 中推出了Managed Agents，允许开发者通过单一 API 调用在隔离的 Linux 环境中创建具备推理、工具使用和代码执行能力的 AI 智能体。

@googledevs: Most agent demos are stateless. Ask → answer → context gone. Production agents need to run for days — pausing, resuming…

X AI KOLs Following

Google Devs introduces Agent Factory series with ADK 2.0 and Gemini 3.5 Flash, demonstrating how to build production-grade stateful agents that can run for days, featuring insights on skills, MCP, and code review strategies from engineers like Rohde Davis.

相似文章

@analogalok：我刚刚在8GB RTX 4060上完全本地运行了Gemma 4 26B A4B MoE模型，搭配Hermes智能体，现在它正在回测交易策略……

@KanikaBK: Google刚刚投下了一颗AI重磅炸弹！一场十亿美元的游戏开始了。Gemma 4 12B在你的笔记本电脑上运行。16GB内存，那就是……

@rachpradhan: 天哪 @ivanleomk 我在飞往日本的航班上使用了 @GoogleDeepMind 的 gemma4（搭配 codegraff）阅读了几篇感兴趣的论文…

@LyalinDotCom：和同事吃完晚饭后回来工作，抽空学习一下……尝试更熟悉我们的……

@googledevs: Most agent demos are stateless. Ask → answer → context gone. Production agents need to run for days — pausing, resuming…

提交意见反馈