summarization

标签

Cards List
#summarization

你的智能体在长时间会话中表现会下降

Reddit r/AI_Agents · 2小时前

本文讨论了AI智能体在长会话中性能下降的问题,原因是上下文窗口被原始历史、工具输出和重复推理所充斥,并提出了通过总结旧轮次和修剪工具输出来延长有效运行长度的解决方案。

0 人收藏 0 人点赞
#summarization

@Jolyne_AI: 一个能自动读懂 PDF 书籍的 Python 脚本:AI Reads Books。 把 PDF 丢进去,运行即可按页解析内容,抓取关键知识点,自动生成结构清晰的 Markdown 摘要。 GitHub:https://github.com…

X AI KOLs Timeline · 昨天 缓存

一个 Python 脚本,能自动解析 PDF 书籍内容,提取关键知识点并生成 Markdown 格式的摘要,旨在提升阅读和知识整理效率。

0 人收藏 0 人点赞
#summarization

Show HN: Recall – 为 Claude Code 提供完全本地项目记忆

Hacker News Top · 2026-06-21 缓存

Recall 是一个开源工具,为 Claude Code 提供完全本地、零成本的项目记忆功能。它自动捕获会话历史并将其总结为紧凑的上下文文件,全程不向任何外部 API 发送数据。

0 人收藏 0 人点赞
#summarization

检测、重新掩码、修复:面向演变上下文的忠实摘要的扩散编辑

arXiv cs.CL · 2026-06-12 缓存

本文提出了Detect–Remask–Repair,一种基于扩散的框架,用于在上下文演变时进行摘要中的局部忠实性修复,并引入了StreamSum基准来评估此类设置。实验表明,它在忠实性、速度和内容保留之间提供了可控的权衡。

0 人收藏 0 人点赞
#summarization

更少上下文,更智能代理:面向长周期工具使用的LLM代理的高效上下文工程

arXiv cs.AI · 2026-06-10 缓存

本文评估了企业工具使用工作流中LLM代理的上下文工程配置,表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率,同时将令牌使用量减少了60%以上。

0 人收藏 0 人点赞
#summarization

更新的Qwen模型在摘要生成方面表现更差?

Reddit r/LocalLLaMA · 2026-06-09

LLM摘要性能对比显示,Qwen 3在30B参数范围内领先,其次是Gemma 4,而更新的Qwen模型可能针对代理任务进行了优化。

0 人收藏 0 人点赞
#summarization

ColibotAI

Product Hunt · 2026-06-09

ColibotAI 是一款设备端AI工具,可在无需联网的情况下翻译、总结和解释任何文本。

0 人收藏 0 人点赞
#summarization

我用教科书式的方法构建了智能体记忆(智能体按需检索)。但在观察其运行后,我彻底推翻了整个设计。架构 + 让我放弃写回机制的失败模式。

Reddit r/AI_Agents · 2026-06-03

作者描述了将教科书式的智能体记忆设计从按需检索反转为优先注入,以避免延迟和空上下文的自信错误,并详细介绍了架构以及写回机制中危险的自我毒化失败模式。

0 人收藏 0 人点赞
#summarization

不让任何读者掉队:人人都能理解的多智能体摘要

arXiv cs.CL · 2026-05-29 缓存

本文提出了NRLB,一个面向平实语言摘要的多智能体框架,通过模拟不同读者群体(小学生、非母语者、注意力缺陷者)来提高可读性,同时保持事实准确性,该框架在多个数据集和人工评估中得到了验证。

0 人收藏 0 人点赞
#summarization

连续运行六小时后,你的上下文窗口究竟会发生什么

Reddit r/AI_Agents · 2026-05-29

一位实践者分享了AI代理连续运行6小时以上时,上下文窗口管理策略(摘要、RAG、截断)的真实失败模式,指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。

0 人收藏 0 人点赞
#summarization

通过偏好学习从多个不完美指标优化摘要的事实一致性

arXiv cs.CL · 2026-05-27 缓存

本文介绍了一种通过偏好学习聚合多个弱指标的分数来提高文本摘要事实一致性的方法,在各种语言模型上实现了一致的事实性提升。

0 人收藏 0 人点赞
#summarization

MemFail:对LLM记忆系统故障模式的压力测试

arXiv cs.AI · 2026-05-27 缓存

MemFail是一个诊断基准,通过形式化总结、存储和检索操作,并用对抗性设计的数据集进行评估,来隔离LLM记忆系统的故障模式。

0 人收藏 0 人点赞
#summarization

向量并非中性:从导出的大语言模型表征中推断敏感信息——以摘要生成为例

arXiv cs.CL · 2026-05-27 缓存

本文探讨了在临床摘要生成中从导出的大语言模型表征推断敏感信息的风险,表明减少一个向量工件的泄露并不能保证其他工件的隐私。提出了SurfaceLoRA,一种微调方法,可在保持效用的同时减少从目标向量中恢复种族信息的能力。

0 人收藏 0 人点赞
#summarization

长时段LLM智能体服务的并行上下文压缩

arXiv cs.AI · 2026-05-25 缓存

介绍了用于长时间范围LLM智能体的并行上下文压缩,实现了对摘要量的细粒度控制,并相比多个骨干模型上的顺序同步压缩,降低了端到端延迟。

0 人收藏 0 人点赞
#summarization

@rohanpaul_ai: Meta 论文显示,当编程代理重复使用过去尝试的简短摘要而不是原始日志时,其性能会显著提升……

X AI KOLs Following · 2026-05-23 缓存

一篇 Meta 论文显示,编程代理在重复使用过去尝试的简短摘要而非原始日志时性能显著提升,使用 Claude 4.5 Opus 在 SWE-Bench 和 Terminal-Bench 上取得了显著改进。

0 人收藏 0 人点赞
#summarization

@tom_doerr:完全在本地捕获、转录和总结会议 https://github.com/Zackriya-Solutions/meeting-minutes…

X AI KOLs Timeline · 2026-05-10 缓存

Meetily 是一款以隐私为先、开源的 AI 会议助手,能够完全在用户的基础设施上本地捕获、转录和总结会议。

0 人收藏 0 人点赞
#summarization

从无查询摘要数据集生成查询聚焦摘要数据集

arXiv cs.CL · 2026-05-08 缓存

本文提出了一种基于证据的模型,可从无查询摘要数据集中自动生成查询关键词,从而创建查询聚焦摘要数据集。实验结果表明,使用基于证据的查询生成的摘要与原始查询生成的摘要相比,获得了具有竞争力的ROUGE分数。

0 人收藏 0 人点赞
#summarization

SCURank:利用摘要内容单元对多个候选摘要进行排序,提升摘要质量

arXiv cs.CL · 2026-04-22 缓存

SCURank 引入“摘要内容单元”对候选摘要打分,使从多个大模型蒸馏出的小模型超越传统指标与单一模型蒸馏效果。

0 人收藏 0 人点赞
#summarization

适合 <2000 token 的轻量级摘要小模型

Reddit r/LocalLLaMA · 2026-04-21

一位新手在尝试用 Qwen2.5-7B-Instruct 给员工笔记做摘要时遭遇幻觉,现求助适用于 2000 token 以内、能合并同类标签的小模型及提示策略。

0 人收藏 0 人点赞
#summarization

字里行间:单向对话问题

arXiv cs.CL · 2026-04-20 缓存

本文介绍了单向对话问题(1SC),针对在远程医疗和呼叫中心等现实场景中,仅有一方发言转录的情况下,如何重建缺失的对话内容和生成摘要。作者在多个数据集上评估了提示和微调模型,发现访问未来上下文和话语长度信息能改进重建效果,同时无需完整对话重建即可生成高质量摘要。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈