标签
介绍了以状态为中心的决策过程(SDP),这是一种运行时框架,使得语言代理能够从原始文本环境中构建由任务引发的状态空间、观测到状态的映射、认证的转移以及终止条件。在五个基准测试中实现了最先进的无训练结果。