标签
讨论如何通过结构化信息而非将所有内容都输入语言模型的上下文来降低 token 成本,并以一个 RLM 代理处理大量日志行但只使用少量活跃 token 为例。
一位开发者的RLM agent高效处理了大约8万行CloudWatch日志,推断出服务架构并发现了一些问题,并计划很快将其开源。