performance-evaluation

标签

Cards List
#performance-evaluation

ASTRA: 可扩展的下一代ATCO训练模拟器,配备自主Simpilots

arXiv cs.LG · 昨天 缓存

ASTRA 是一款用于空中交通管制操作员的端到端训练模拟器,通过本地化适配的语音模型自动执行模拟飞行员(sim pilot)角色,在新加坡口音的航空语音中大幅降低了词错误率,并整合了AI辅助性能评估。

0 人收藏 0 人点赞
#performance-evaluation

Deepseek V4的百万上下文窗口:临界点

Reddit r/LocalLLaMA · 2026-05-17

对Deepseek V4在多个生产代码库上的百万token上下文窗口的详细评估显示,在150-250k token时性能最佳,超过300k后性能下降,推理模式下延迟显著。该模型在未知任务上表现出较高的幻觉率,生产环境中需要验证层。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈