instruction-tuned

#instruction-tuned

OpenLLM-France/Luciole-23B-Instruct-1.1（Apache 2.0许可，另有8B和1B版本可用）

Reddit r/LocalLLaMA ↗ · 2026-07-16 缓存

OpenLLM-France发布了Luciole-23B-Instruct-1.1，这是一个基于Apache 2.0许可的开源多语言指令调优语言模型，同时提供较小的8B和1B变体。

0 人收藏 0 人点赞

#instruction-tuned

arXiv cs.CL ↗ · 2026-07-08 缓存

本文研究了LLM评估中提示鲁棒性在客观问题和主观问题之间的差异，发现对提示变化的敏感性取决于问题类型、提示变化和模型。

0 人收藏 0 人点赞

#instruction-tuned

Hugging Face Models Trending ↗ · 2026-07-03 缓存

fable-traces 是一个基于 Qwen3-4B-Instruct-2507 的紧凑型指令微调语言模型，专为简短对话回复而调优，可在单块中端GPU上运行。基于 Apache 2.0 许可发布。

0 人收藏 0 人点赞

#instruction-tuned

X AI KOLs Timeline ↗ · 2026-06-25 缓存

NousResearch 预告了一个新模型发布，主题为‘选择你自己的’，很可能是一个开源指令微调模型。

0 人收藏 0 人点赞

#instruction-tuned

Reddit r/LocalLLaMA ↗ · 2026-06-17 缓存

LoopCoder-V2 是一个基于 Parallel Loop Transformer (PLT) 构建的 7B 参数指令调优代码模型，展示了非单调测试时扩展特性，其中两个循环提供了最佳的收益-成本权衡，并在代码生成和推理基准测试上显著优于基线模型。

0 人收藏 0 人点赞

#instruction-tuned

Hugging Face Models Trending ↗ · 2026-06-05 缓存

Google DeepMind 发布了 Gemma 4 模型，这些模型通过量化感知训练（QAT）进行了优化，并提供包括 GGUF 在内的多种格式，在降低内存需求的同时实现了高质量。

0 人收藏 0 人点赞

#instruction-tuned

arXiv cs.LG ↗ · 2026-05-20

本文通过稀疏自编码器刻画了指令调优大语言模型中的构成性文学原语，发现了自我、风格与情感的特征类别，这些特征能够在两种架构间实现情感引导。

0 人收藏 0 人点赞

#instruction-tuned

Reddit r/LocalLLaMA ↗ · 2026-04-22 缓存

ServiceNow 推出 SuperApriel-15B-Instruct：仅 15B 参数的单一 checkpoint，内置 8 组 mixer 预设，可在 1× 到 10.7× 解码吞吐之间切换，在 32K 上下文下仍保持高达 96% 的质量。

0 人收藏 0 人点赞

#instruction-tuned

Hugging Face Models Trending ↗ · 2026-03-11 缓存

Google DeepMind 发布 Gemma 4，一系列开放权重的多模态模型，参数量从2.3B到31B，支持文本、图像、视频和音频输入。模型具有256K上下文窗口，MoE和密集架构，增强的推理能力，并针对从移动设备到服务器的部署进行优化。

0 人收藏 0 人点赞