talkie-lm/talkie-1930-13b-it
摘要
Talkie-1930-13b-it 是一个拥有 130 亿参数的指令微调语言模型,基于 1931 年前的文本进行训练,并使用 DPO 强化学习进行微调。
查看缓存全文
缓存时间: 2026/05/08 09:06
talkie-lm/talkie-1930-13b-it · Hugging Face
来源:https://huggingface.co/talkie-lm/talkie-1930-13b-it
talkie-1930-13b-it 是一款 130 亿参数的复古风格语言模型。它是 talkie-1930-13b-base 的指令微调版本,后者基于 2600 亿 token 的 1931 年前英语文本进行训练。
talkie-1930-13b-it 使用了一种新颖的指令-回复数据集进行微调,该数据集提取自 1931 年前的参考书籍,包括礼仪手册、百科全书和书信写作指南等。随后,模型通过强化学习(在线 DPO,使用 LLM 作为评判)进一步提升了指令遵循能力。
了解更多关于 talkie 的信息,请阅读我们的报告(https://talkie-lm.com/)。
运行 talkie 的参考代码可在 GitHub 上获取(https://github.com/talkie-lm/talkie)。
相似文章
基于历史文本的预训练语言模型
本文介绍了 TypewriterLM,一个参数规模为 7.24B 的语言模型,仅基于 1913 年之前的英文文本进行训练;同时介绍了 TypewriterCorpus(一个包含 540 亿 token 的清洗后历史语料库)以及指令微调数据集,以避免时间泄露和前瞻偏差。此外,还提出了一个基准测试套件 History-Event,用于评估时间定位能力和泄露情况。
Higgs Audio v3 TTS 4B。专为语音聊天打造。支持100种语言和内联控制。
Higgs Audio v3 是一个 4B 参数的 TTS 模型,专为语音聊天应用设计,支持 100 种语言并具备内联控制能力。
分解大语言模型的基本能力:在多任务指令微调中缓解跨任务干扰
本文提出Badit方法,将大语言模型参数分解为正交的高奇异值LoRA专家,以在多任务指令微调中缓解跨任务干扰。
dots.tts 2B🎙️ 来自RedNote的SOTA文本转语音模型
RedNote发布了dots.tts,一个2B参数的开源文本转语音模型,支持零样本语音克隆和48kHz合成。
dots.tts 技术报告
dots.tts 提出了一个拥有 2B 参数的连续自回归文本转语音 (TTS) 模型,基于多语言数据进行训练,在 Seed-TTS-Eval 等基准测试上取得了最先进的性能,并通过 CFG-aware MeanFlow 蒸馏实现了低延迟流式生成。该模型、代码和检查点均以 Apache 2.0 许可证发布。