llm-reliability

#llm-reliability

大型语言模型中的置信度校准

arXiv cs.AI ↗ · 2026-05-26 缓存

本文分析了11个主流大型语言模型的置信度校准情况，发现它们普遍过于自信，尤其在困难任务上，而在简单任务上则信心不足。文章引入了LifeEval，这是一个用于评估不同难度级别下校准效果的测试。

0 人收藏 0 人点赞

#llm-reliability

我们能信任AI推断的用户状态吗？一个用于验证LLM在操作环境中用户状态分类可靠性的心理测量学框架

arXiv cs.AI ↗ · 2026-05-18 缓存

本文实证检验了基于LLM的用户状态分类的心理测量学可靠性，发现213项指标中仅有31项满足可靠性标准，对实时自适应系统中的信任提出了质疑。

0 人收藏 0 人点赞

#llm-reliability

PRISM：面向企业对话式AI的基于迭代模拟与监控的提示可靠性框架

arXiv cs.AI ↗ · 2026-05-18 缓存

PRISM是一个闭环框架，将提示工程视为企业对话式AI的持续可靠性问题。它自动执行测试生成、模拟、评估和修复，实现了99%的可靠性，并将编写时间从几天缩短到几分钟。

0 人收藏 0 人点赞

#llm-reliability

AI 自动研究：路线图与用户指南

Hugging Face Daily Papers ↗ · 2026-05-18 缓存

本文调研了AI在整个研究生命周期中的能力与局限，从创意生成到成果发布，识别出可靠辅助与不可靠自主之间的明确界限。它提供了一个分类体系、基准测试套件、工具清单以及人类主导的AI协作研究设计原则。

0 人收藏 0 人点赞

#llm-reliability

AgentForesight：多智能体系统中用于早期故障预测的在线审计

arXiv cs.CL ↗ · 2026-05-12 缓存

本文介绍了 AgentForesight，这是一个用于基于大语言模型（LLM）的多智能体系统的在线审计和早期故障预测框架。文章提出了一个新数据集 AFTraj-22K，以及一个专用模型 AgentForesight-7B，该模型在检测轨迹执行过程中的决定性错误方面优于领先的专有模型。

0 人收藏 0 人点赞

#llm-reliability

我曾是人工智能的忠实信徒。现在我认为整个行业正在从内部腐烂。

Reddit r/ArtificialInteligence ↗ · 2026-05-08

一位前AI倡导者详细阐述了对大语言模型的幻灭，指出可靠性问题、版本间退化、企业工作流崩溃，以及部署在关键行业的AI系统缺乏问责制。

0 人收藏 0 人点赞

#llm-reliability

我对当前模型的免费版本体验感到沮丧，想知道付费版本好多少。

Reddit r/singularity ↗ · 2026-05-08

一位用户讨论了将免费AI模型用作教育辅导时在可靠性和一致性上的挫败感，质疑付费版本在学习技术概念方面是否表现显著更好。

0 人收藏 0 人点赞

#llm-reliability

关注未见质量：通过软混合字母估计揭示 LLM 幻觉

arXiv cs.CL ↗ · 2026-04-22 缓存

研究者提出 SHADE，一种混合估计器，在仅能获取少量黑盒样本时，融合 Good-Turing 覆盖率与图谱线索，量化语义不确定性并检测大模型幻觉。

0 人收藏 0 人点赞

#llm-reliability

超越表面统计：通过内部表示实现LLM鲁棒共形预测

arXiv cs.CL ↗ · 2026-04-20 缓存

本论文提出了一个利用内部表示而非输出层统计的LLM共形预测框架，引入层级信息（LI）评分作为非一致性度量，在分布偏移下改进有效性-效率权衡。该方法在QA基准上相比文本级基线展现出更强的对校准-部署不匹配的鲁棒性。

0 人收藏 0 人点赞

#llm-reliability

Gemini 在 $2.8 亿加密资产攻击事件上热搜前就已捕获该信息，却因我无法核实（新闻尚未公开）而将其回退判定为“幻觉”

Reddit r/artificial ↗ · 2026-04-18

这件事发生在几小时前，我感觉自己确实偶然发现了一个值得为关注 AI 行为的人记录下来的案例。我会尽量精确地还原整个时间线，因为事件的先后顺序在此处至关重要。如果你想自己阅读完整聊天记录：https://g.co/gemini/share/0cb9f054ca58 --- **背景** 我当时正在使用付费版 Gemini 最先进的模型来分析 AAVE 上的实时加密交易。该代币在过去一小时内毫无征兆地下跌了 7–9%，没有任何新闻能够解释，而...

0 人收藏 0 人点赞

#llm-reliability

一种更优的识别大语言模型过度自信的方法

MIT News — Artificial Intelligence ↗ · 2026-03-19 缓存

MIT研究人员开发了一种新方法，通过衡量相似模型间的跨模型分歧来识别过度自信的LLM，而非仅依赖自洽性指标。该方法能更好地捕捉认知不确定性，并在高风险应用中更准确地识别出不可靠的预测。

0 人收藏 0 人点赞

llm-reliability

提交意见反馈