behavioral-reliability

标签

Cards List
#behavioral-reliability

当更好的编码手册仍不足:LLM政治事件编码中的预测性能与行为可靠性

arXiv cs.CL · 4天前 缓存

本文研究了为政治事件编码的专家手册在被转化为LLM友好形式后是否更有效,并发现尽管性能提升,但在受控扰动下的行为可靠性并未完全转化。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈