skill-distillation

标签

Cards List
#skill-distillation

EmoDistill: 对抗性谈判中语言模型智能体的离线情感技能蒸馏

arXiv cs.CL · 2026-05-27 缓存

EmoDistill是一个离线框架,通过隐式Q学习进行情感选择,并基于LoRA的监督微调和评判策略优化进行情感表达,从而将情感谈判技能蒸馏到语言模型智能体中,在对抗性谈判中实现更高的效用。

0 人收藏 0 人点赞
#skill-distillation

PANDO:通过在线技能蒸馏实现高效多模态AI代理

Hugging Face Daily Papers · 2026-05-26 缓存

PANDO 是一个网络代理框架,通过在线技能蒸馏提高效率,在 VisualWebArena 任务上减少 58-61% 的令牌使用量,同时优于基线。

0 人收藏 0 人点赞
#skill-distillation

@Voxyz_ai:刚看了 GitHub Trending,本周第一是一个 CLAUDE.md 文件,一周新增 44,465 star。把 Andrej Karpathy 的 LLM 编程忠告蒸馏成 4 条原则……

X AI KOLs Timeline · 2026-04-19 缓存

仅凭一份 CLAUDE.md 文件,本周斩获 44k star 登顶 GitHub Trending,将 Andrej Karpathy 的 LLM 编程避坑指南浓缩为四大原则。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈