标签
一个 Python 脚本,能自动解析 PDF 书籍内容,提取关键知识点并生成 Markdown 格式的摘要,旨在提升阅读和知识整理效率。
Recall 是一个开源工具,为 Claude Code 提供完全本地、零成本的项目记忆功能。它自动捕获会话历史并将其总结为紧凑的上下文文件,全程不向任何外部 API 发送数据。
本文提出了Detect–Remask–Repair,一种基于扩散的框架,用于在上下文演变时进行摘要中的局部忠实性修复,并引入了StreamSum基准来评估此类设置。实验表明,它在忠实性、速度和内容保留之间提供了可控的权衡。
本文评估了企业工具使用工作流中LLM代理的上下文工程配置,表明选择性修剪的摘要化相比全上下文基线实现了91.6%的准确率,同时将令牌使用量减少了60%以上。
LLM摘要性能对比显示,Qwen 3在30B参数范围内领先,其次是Gemma 4,而更新的Qwen模型可能针对代理任务进行了优化。
作者描述了将教科书式的智能体记忆设计从按需检索反转为优先注入,以避免延迟和空上下文的自信错误,并详细介绍了架构以及写回机制中危险的自我毒化失败模式。
本文提出了NRLB,一个面向平实语言摘要的多智能体框架,通过模拟不同读者群体(小学生、非母语者、注意力缺陷者)来提高可读性,同时保持事实准确性,该框架在多个数据集和人工评估中得到了验证。
一位实践者分享了AI代理连续运行6小时以上时,上下文窗口管理策略(摘要、RAG、截断)的真实失败模式,指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。
本文介绍了一种通过偏好学习聚合多个弱指标的分数来提高文本摘要事实一致性的方法,在各种语言模型上实现了一致的事实性提升。
MemFail是一个诊断基准,通过形式化总结、存储和检索操作,并用对抗性设计的数据集进行评估,来隔离LLM记忆系统的故障模式。
本文探讨了在临床摘要生成中从导出的大语言模型表征推断敏感信息的风险,表明减少一个向量工件的泄露并不能保证其他工件的隐私。提出了SurfaceLoRA,一种微调方法,可在保持效用的同时减少从目标向量中恢复种族信息的能力。
介绍了用于长时间范围LLM智能体的并行上下文压缩,实现了对摘要量的细粒度控制,并相比多个骨干模型上的顺序同步压缩,降低了端到端延迟。
一篇 Meta 论文显示,编程代理在重复使用过去尝试的简短摘要而非原始日志时性能显著提升,使用 Claude 4.5 Opus 在 SWE-Bench 和 Terminal-Bench 上取得了显著改进。
Meetily 是一款以隐私为先、开源的 AI 会议助手,能够完全在用户的基础设施上本地捕获、转录和总结会议。
本文提出了一种基于证据的模型,可从无查询摘要数据集中自动生成查询关键词,从而创建查询聚焦摘要数据集。实验结果表明,使用基于证据的查询生成的摘要与原始查询生成的摘要相比,获得了具有竞争力的ROUGE分数。
SCURank 引入“摘要内容单元”对候选摘要打分,使从多个大模型蒸馏出的小模型超越传统指标与单一模型蒸馏效果。
一位新手在尝试用 Qwen2.5-7B-Instruct 给员工笔记做摘要时遭遇幻觉,现求助适用于 2000 token 以内、能合并同类标签的小模型及提示策略。
本文介绍了单向对话问题(1SC),针对在远程医疗和呼叫中心等现实场景中,仅有一方发言转录的情况下,如何重建缺失的对话内容和生成摘要。作者在多个数据集上评估了提示和微调模型,发现访问未来上下文和话语长度信息能改进重建效果,同时无需完整对话重建即可生成高质量摘要。
<p>让用户使用他们喜欢的 AI 来总结您的网站</p><p><a href="https://www.producthunt.com/products/aicw-summarize-widget?utm_campaign=producthunt-atom-posts-feed&amp;medium=rss-feed&amp;source=producthunt-atom-posts-feed">讨论区</a> | <a href="https://www.producthunt.com/r/p/1125443?app_id=339">链接</a></p>