适合 <2000 token 的轻量级摘要小模型

Reddit r/LocalLLaMA 新闻

摘要

一位新手在尝试用 Qwen2.5-7B-Instruct 给员工笔记做摘要时遭遇幻觉,现求助适用于 2000 token 以内、能合并同类标签的小模型及提示策略。

新手求助:我想给员工笔记做自动摘要。每次有 10–50 条笔记(约 3000–15000 token),已打好标签,需要汇总成 200–1000 token 的通用报告。模型要能判断“过于细节”的内容,并把同一标签下的多条笔记归纳成一类。 我试过 [Qwen/Qwen2.5-7B-Instruct](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct) 加提示词,结果幻觉严重,降 temperature 也没用。针对这种任务,有什么模型和提示策略推荐?
查看原文

相似文章

超小型LLM真的有用吗?

Reddit r/singularity

探讨了非常小的语言模型是否能妥善处理日常对话,以及哪些训练因素使它们表现更佳。

通过人类反馈学习总结

OpenAI Blog

OpenAI展示了一种通过在人类偏好上训练奖励模型并使用强化学习微调模型来改进语言模型总结的技术,实现了在数据集间具有良好泛化性能的显著质量提升。这项工作通过大规模人类反馈推进了模型对齐,并具有超越总结任务的应用前景。