model-adaptation

#model-adaptation

MiCA 现已加入 Hugging Face PEFT

Reddit r/LocalLLaMA ↗ · 5天前

MiCA（Minor Component Adaptation，微成分适配）是一种全新的微调方法，它在次要奇异子空间中初始化适配器，从而更好地吸收知识并减少遗忘。该方法现已合并到 Hugging Face PEFT 库中，可通过 PEFT 主分支获取，并通过现有的 LoRA 接口集成，使用 init_lora_weights='mica'。

0 人收藏 0 人点赞

#model-adaptation

@techNmak: 每个人都在微调LLM，但几乎没人真正理解模型内部到底在更新什么。以下是5种技术…

X AI KOLs Timeline ↗ · 2026-05-21

介绍了五种参数高效微调技术：LoRA、LoRA-FA、VeRA、Delta-LoRA和LoRA+，详细说明了每种技术在适配过程中如何修改模型权重。

0 人收藏 0 人点赞

#model-adaptation

EMA: 面向学习型系统的高效模型自适应方法

arXiv cs.LG ↗ · 2026-05-15 缓存

本文介绍了EMA，一种面向学习型系统的模型自适应系统，能够在降低训练和标注成本的同时，提升系统在不断演化环境中的性能。

0 人收藏 0 人点赞

#model-adaptation

T5Gemma：一种新的编码器-解码器 Gemma 模型集合

Google DeepMind Blog ↗ · 2025-10-25 缓存

Google 推出 T5Gemma，这是一组新的编码器-解码器模型，基于 Gemma 2 纯解码器架构改进而来，在摘要和翻译等任务上提供了更好的质量-效率权衡。

0 人收藏 0 人点赞

#model-adaptation

GPT-3.5 Turbo 微调和 API 更新

OpenAI Blog ↗ · 2023-08-22 缓存

OpenAI 推出了 GPT-3.5 Turbo 的微调功能，允许开发者为特定用例定制模型，以获得更好的性能、可控性和输出格式。该更新使得经过微调的 GPT-3.5 Turbo 能够在某些任务上匹配 GPT-4 的性能，同时可将提示词大小减少 90%。

0 人收藏 0 人点赞

model-adaptation

MiCA 现已加入 Hugging Face PEFT

@techNmak: 每个人都在微调LLM，但几乎没人真正理解模型内部到底在更新什么。以下是5种技术…

EMA: 面向学习型系统的高效模型自适应方法

T5Gemma：一种新的编码器-解码器 Gemma 模型集合

GPT-3.5 Turbo 微调和 API 更新

提交意见反馈