log-probabilities

标签

Cards List
#log-probabilities

早期令牌置信度预测多智能体LLM辩论中的推理质量

arXiv cs.CL · 2天前 缓存

本文研究了LLM解码过程中的早期令牌置信度信号是否能预测多智能体辩论系统中的推理质量,发现前几个生成令牌的置信度是基于评分标准的论文分数的最强预测因子。

0 人收藏 0 人点赞
#log-probabilities

自信的撒谎者:利用对数概率和LLM-as-Judge诊断多智能体辩论

arXiv cs.CL · 2天前 缓存

本文研究了多智能体辩论系统中令牌级对数概率分布、LLM-as-judge评分标准分数和最终任务准确性之间的关系。它发现了一致的四阶段置信度轨迹以及Constructor与Auditor智能体之间的角色不对称性。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈