llm-failures

标签

Cards List
#llm-failures

Heuristic Parasites: 大型语言模型中重复扭曲模式的行为分类 (完整系统) V2

Reddit r/ArtificialInteligence · 2026-05-29

本文提出了一个包含33个类别的全面分类法,用于描述大型语言模型输出中的重复扭曲模式(heuristic parasites),并提供了操作定义、识别标准以及一个可复现的测量协议(PPE),用于量化跨对话的行为退化。

0 人收藏 0 人点赞
#llm-failures

我花了40%的开发时间阻止LLM引证出错,总结出了7种失效模式

Reddit r/artificial · 2026-04-23

一位为德国律所构建AI法律助手的开发者,详细列出了7种具体的LLM引证失效模式,以及为满足严格法律引证标准而采用的提示工程修复方案。

0 人收藏 0 人点赞
#llm-failures

真实场景下的对比归因:针对现实基准中大模型失效的可解释性分析

Hugging Face Daily Papers · 2026-04-20 缓存

研究者采用基于LRP的对比归因方法,分析大模型在现实基准中失败的原因,发现该方法在某些场景下能提供有用信号,但并非始终可靠。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈