标签
一个行李箱机器人使用真实气体传感器,根据检测到的烟雾实时调整LLM采样器参数(temperature, top_p, top_k),导致机器人的说话变得更为不可预测且无重复。
从 MSA 论文内核设计部分实现了 top-k 内核,使用免指数比较和通过 CUDA shuffle 进行的 warp 级树合并。代码已发布于 GitHub。