talkie-lm/talkie-1930-13b-it

Hugging Face Models Trending 模型

摘要

Talkie-1930-13b-it 是一个拥有 130 亿参数的指令微调语言模型,基于 1931 年前的文本进行训练,并使用 DPO 强化学习进行微调。

Tags: en, base_model:talkie-lm/talkie-1930-13b-base, base_model:finetune:talkie-lm/talkie-1930-13b-base, license:apache-2.0, region:us
查看原文
查看缓存全文

缓存时间: 2026/05/08 09:06

talkie-lm/talkie-1930-13b-it · Hugging Face

来源:https://huggingface.co/talkie-lm/talkie-1930-13b-it

talkie-1930-13b-it 是一款 130 亿参数的复古风格语言模型。它是 talkie-1930-13b-base 的指令微调版本,后者基于 2600 亿 token 的 1931 年前英语文本进行训练。

talkie-1930-13b-it 使用了一种新颖的指令-回复数据集进行微调,该数据集提取自 1931 年前的参考书籍,包括礼仪手册、百科全书和书信写作指南等。随后,模型通过强化学习(在线 DPO,使用 LLM 作为评判)进一步提升了指令遵循能力。

了解更多关于 talkie 的信息,请阅读我们的报告(https://talkie-lm.com/)。

运行 talkie 的参考代码可在 GitHub 上获取(https://github.com/talkie-lm/talkie)。

相似文章

基于历史文本的预训练语言模型

arXiv cs.CL

本文介绍了 TypewriterLM,一个参数规模为 7.24B 的语言模型,仅基于 1913 年之前的英文文本进行训练;同时介绍了 TypewriterCorpus(一个包含 540 亿 token 的清洗后历史语料库)以及指令微调数据集,以避免时间泄露和前瞻偏差。此外,还提出了一个基准测试套件 History-Event,用于评估时间定位能力和泄露情况。

dots.tts 技术报告

Hugging Face Daily Papers

dots.tts 提出了一个拥有 2B 参数的连续自回归文本转语音 (TTS) 模型,基于多语言数据进行训练,在 Seed-TTS-Eval 等基准测试上取得了最先进的性能,并通过 CFG-aware MeanFlow 蒸馏实现了低延迟流式生成。该模型、代码和检查点均以 Apache 2.0 许可证发布。