agents

#agents

Openclaw vs Hyperagent：云原生代理是否构成巨大的安全风险？

Reddit r/AI_Agents ↗ · 3天前

一场比较Hyperagent等云原生代理平台与OpenClaw等本地优先方法安全风险的讨论，突显了便利性与控制权之间的权衡。

0 人收藏 0 人点赞

#agents

Zapier 擅长处理不变的工作流，但每次运行都变化的工作流才是我想用智能体的地方

Reddit r/AI_Agents ↗ · 3天前

作者观察到，Zapier 能很好地处理固定工作流，但可变工作流才是他们想使用 AI 智能体的场景。

0 人收藏 0 人点赞

#agents

@hanakoxbt: 麻省理工学院团队刚刚发布了一份24页的PDF，关于Claude Code代理的"自我进化技能"。Anthropic自己的技能创造者…

X AI KOLs Timeline ↗ · 3天前缓存

MIT团队发布了一篇关于Claude Code代理自我进化技能的论文，通过生成-测试-验证-协同进化框架，实现了71.1%的通过率，比Anthropic的技能创造者高出37个百分点。

0 人收藏 0 人点赞

#agents

贵公司如何衡量智能体和技能在实际生产中的影响，而不仅仅是基准测试？

Reddit r/AI_Agents ↗ · 3天前

关于公司应如何衡量AI智能体和技能在生产环境中的实际影响，而不是仅仅依赖基准测试结果的讨论。

0 人收藏 0 人点赞

#agents

摘要：Gemini 联合负责人谈世界模型、强化学习的下一个领域与持续学习

Reddit r/artificial ↗ · 4天前缓存

奥里奥尔·维尼亚尔斯（Oriol Vinyals）关于 Google Gemini 模型、世界模型、多模态 AI、智能体以及持续学习和真正创新等挑战的讨论摘要。

1 人收藏 1 人点赞

#agents

超越函数调用：在工具环境不可靠性下对工具使用代理进行基准测试

arXiv cs.CL ↗ · 4天前缓存

介绍ToolBench-X，这是一个基准测试，用于评估各种工具环境可靠性隐患下的大语言模型代理，揭示了与干净环境相比性能上的显著差距。

0 人收藏 0 人点赞

#agents

DeepSeek Flash 刚刚颠覆了智能体市场：成本降低 100 倍的智能体

Reddit r/AI_Agents ↗ · 4天前

DeepSeek Flash 是一款新的人工智能模型，能够将构建 AI 智能体的成本大幅降低 100 倍，可能彻底改变智能体市场。

0 人收藏 0 人点赞

#agents

智能代理如何改变工作

OpenAI Blog ↗ · 4天前缓存

OpenAI报告称，智能代理AI，特别是其Codex产品，正在改变工作方式，通过支持更长期的任务并成为跨部门（包括非技术部门）的主要AI工具，且在非开发者中迅速普及。

0 人收藏 0 人点赞

#agents

@jianxliao: 如何让代理具有确定性？

X AI KOLs Following ↗ · 4天前

@jianxliao 的一条推文提出了如何让AI代理具有确定性的问题，引发了关于可靠性和安全性的讨论。

0 人收藏 0 人点赞

#agents

@kentcdodds: 更多关于原型和功能产品市场契合度：

X AI KOLs Following ↗ · 4天前缓存

本文讨论了在AI时代构建原型和使用演示来实现功能产品市场契合度的重要性，并包含了Ruben Casas关于将高层次产品思维与动手实践相结合的观点。

0 人收藏 0 人点赞

#agents

@NousResearch: 有时你只是需要一点新鲜灵感，但你的智能体却无法领会这种氛围。创意构思技能…

X AI KOLs Following ↗ · 4天前缓存

NousResearch 介绍了一种创意构思技能，该技能将提示词路由到来自艺术家和思想家的22种创造性方法中，以平衡可行性和创造力。

0 人收藏 0 人点赞

#agents

@DanKornas: 通过结构化的MIT课程学习深度学习。你将学到：- 在深入学习高级内容之前打好基础…

X AI KOLs Timeline ↗ · 4天前缓存

推广一门结构化的MIT深度学习课程，内容涵盖基础、生成模型、智能体和序列问题。该课程旨在先建立实践理解，再进入高级主题。

0 人收藏 0 人点赞

#agents

“演进”带来的风险（OpenAI）

Reddit r/ArtificialInteligence ↗ · 4天前

OpenAI 2026年6月的更新将ChatGPT转变为一个主动代理，深度集成Gmail、Outlook和Slack，同时配合Dreaming V3内存大修，引发严重的隐私和安全问题，因为AI会持续监控并对用户的数字生活进行画像分析。

0 人收藏 0 人点赞

#agents

Haystack: 面向生产级Agent与RAG的开源AI框架

Hacker News Top ↗ · 4天前缓存

Haystack是一个开源AI框架，用于构建生产级的Agent和RAG流水线，支持多模态、对话式和内容生成应用。

0 人收藏 0 人点赞

#agents

智能体遍历记忆而非查询？

Reddit r/AI_Agents ↗ · 4天前

探讨了一种方法，让AI智能体遍历其记忆以替代传统查询，可能带来效率或推理方面的优势。

0 人收藏 0 人点赞

#agents

当检索指标误导时：衡量长期工具使用代理中的政策信号

arXiv cs.CL ↗ · 5天前缓存

本文考察了精确匹配检索召回率作为长期工具使用代理下游政策分类性能代理指标的可靠性。在τ-bench上使用Qwen2.5分类器进行的实验表明，低条款召回率并不会显著降低分类器的准确率，这表明单独使用检索指标在评估政策信号时可能会产生误导。

0 人收藏 0 人点赞

#agents

@levie: 另一个关于无头软件与代理结合威力的例子。通过Claude Tag，你可以让Claude访问任何企…

X AI KOLs Timeline ↗ · 5天前缓存

Claude Tag 为团队在Slack中使用Claude提供了一种新方式，让AI能够访问Box文件及其他企业内容，将企业内容转化为便携知识库。

0 人收藏 0 人点赞

#agents

你愿意付费让别人来运行你的智能体的MCP服务器吗？

Reddit r/AI_Agents ↗ · 5天前

本文探讨了一种付费服务选项，供希望将AI智能体的MCP服务器管理外包出去的用户使用。

0 人收藏 0 人点赞

#agents

@charles_irl: 掌控你的推理，掌控你的代理平台，掌控你的命运。在 @modal Endpoints 上使用 OpenInspect。

X AI KOLs Following ↗ · 5天前缓存

OpenInspect 支持完全自托管的背景代理系统，在 Modal Endpoints 上使用 GLM-5.2，强调对推理基础设施的所有权。

0 人收藏 0 人点赞

#agents

@tli104: 新论文："Self-Compacting Language Model Agents" 语言模型代理会构建冗长的推理和工具调用轨迹。随着轨…

X AI KOLs Timeline ↗ · 5天前缓存

新论文提出自压缩语言模型代理，该类代理可自行决定何时清理其推理和工具调用轨迹，以避免积累错误和过时信息。

0 人收藏 0 人点赞

agents

提交意见反馈