BitTide
首页
最新
模型
工具
新闻
产品
论文
事件
今日日报
搜索
订阅
English
登录
diagnostic-dialogue
标签
Cards
List
#diagnostic-dialogue
DiagFlowBench: 评估语言模型在基于流程的诊断对话中如何处理非程序输入
arXiv cs.AI
↗
· 2026-06-17
缓存
本文介绍了DiagFlowBench,这是一个包含1,676个多轮诊断对话的基准数据集,这些对话源自工业流程图,旨在评估语言模型处理非程序输入及避免给出不恰当建议的能力。
0 人收藏
0 人点赞
← 返回首页
意见反馈
×
提交意见反馈
感谢您的反馈!
提交