model-adaptation

标签

Cards List
#model-adaptation

MiCA 现已加入 Hugging Face PEFT

Reddit r/LocalLLaMA · 4天前

MiCA(Minor Component Adaptation,微成分适配)是一种全新的微调方法,它在次要奇异子空间中初始化适配器,从而更好地吸收知识并减少遗忘。该方法现已合并到 Hugging Face PEFT 库中,可通过 PEFT 主分支获取,并通过现有的 LoRA 接口集成,使用 init_lora_weights='mica'。

0 人收藏 0 人点赞
#model-adaptation

@techNmak: 每个人都在微调LLM,但几乎没人真正理解模型内部到底在更新什么。以下是5种技术…

X AI KOLs Timeline · 2026-05-21

介绍了五种参数高效微调技术:LoRA、LoRA-FA、VeRA、Delta-LoRA和LoRA+,详细说明了每种技术在适配过程中如何修改模型权重。

0 人收藏 0 人点赞
#model-adaptation

EMA: 面向学习型系统的高效模型自适应方法

arXiv cs.LG · 2026-05-15 缓存

本文介绍了EMA,一种面向学习型系统的模型自适应系统,能够在降低训练和标注成本的同时,提升系统在不断演化环境中的性能。

0 人收藏 0 人点赞
#model-adaptation

T5Gemma:一种新的编码器-解码器 Gemma 模型集合

Google DeepMind Blog · 2025-10-25 缓存

Google 推出 T5Gemma,这是一组新的编码器-解码器模型,基于 Gemma 2 纯解码器架构改进而来,在摘要和翻译等任务上提供了更好的质量-效率权衡。

0 人收藏 0 人点赞
#model-adaptation

GPT-3.5 Turbo 微调和 API 更新

OpenAI Blog · 2023-08-22 缓存

OpenAI 推出了 GPT-3.5 Turbo 的微调功能,允许开发者为特定用例定制模型,以获得更好的性能、可控性和输出格式。该更新使得经过微调的 GPT-3.5 Turbo 能够在某些任务上匹配 GPT-4 的性能,同时可将提示词大小减少 90%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈