标签
本文认为,智能体应帮助用户构建偏好,而非假设用户已有完善偏好,并提出了CoPref模型和CoShop基准。评估显示,即使是前沿模型,由于偏好扩展不足,准确率也仅为56%。
反思早期AI聊天界面如何类似于命令行交互模式,并推测何时会出现类似GUI的范式转变,使AI能够直接观察并作用于用户的上下文环境。