text-generation

#text-generation

@Michaelzsguo: 这是关于DeepSeek最新创新DSpark的最佳解读：可以把DSpark想象成：主模型快速构思句子，然后一个小型“编辑器”迅速修正连贯性...

X AI KOLs Timeline ↗ · 15小时前缓存

DeepSeek发布了DSpark，该系统让主模型快速生成一个句子，同时一个小型编辑器在验证前修正连贯性，将大语言模型系统工程推向新架构之外。

0 人收藏 0 人点赞

#text-generation

基于提示学习的学术论文亮点自动生成

arXiv cs.CL ↗ · 4天前缓存

本文研究了基于提示学习的方法来自动生成学术论文的亮点，使用了GPT-2、T5和ChatGPT等模型，并表明使用少量样本提示的ChatGPT在无需任务特定训练数据的情况下，其表现可与监督方法相媲美甚至更优。

0 人收藏 0 人点赞

#text-generation

我渴望在我的Strix Halo上获得15倍加速

Reddit r/LocalLLaMA ↗ · 5天前

Nvidia声称使用扩散模型在文本生成上实现15倍加速，一次性生成整个文本块。

0 人收藏 0 人点赞

#text-generation

GLM-5.2 是最佳开放权重创意写作模型

Reddit r/LocalLLaMA ↗ · 2026-06-18

GLM-5.2 是一个针对创意写作任务优化的开放权重AI模型，据称是其类别中最好的。

0 人收藏 0 人点赞

#text-generation

VoidPadding: 让[VOID]处理掩码扩散语言模型中的填充，使[EOS]专注于语义终止

arXiv cs.CL ↗ · 2026-06-17 缓存

VoidPadding引入了一个[VOID]标记来处理掩码扩散语言模型中的填充，使[EOS]能够仅专注于语义终止。该方法显著提升了推理和编码基准测试的性能，同时减少了解码步骤。

0 人收藏 0 人点赞

#text-generation

gzip能成为语言模型吗？

Lobsters Hottest ↗ · 2026-06-16 缓存

本文探讨了将gzip压缩算法用作语言模型的可行性，展示了压缩算法可以通过基于压缩长度对候选续文进行评分并利用束搜索来生成文本。

0 人收藏 0 人点赞

#text-generation

@nathanrs：我前几天发现，任何压缩工具都可以被扭曲用于语言建模。结果发现 gzip 可以生成…

X AI KOLs Following ↗ · 2026-06-16 缓存

该推文说明了任何压缩工具（包括 gzip）都能被改装用于语言建模，而且 gzip 可以生成颇为类似莎士比亚风格的文本。并附有相关文章链接。

0 人收藏 0 人点赞

#text-generation

@volokuleshov: 恭喜谷歌开源Gemma Diffusion！我想特别感谢一组非常有才华的康奈尔大学学生，他们在实验室开发了这个模型中许多新想法：

X AI KOLs Timeline ↗ · 2026-06-11 缓存

谷歌已开源DiffusionGemma，这是一种基于扩散的新型文本生成模型，采用块扩散和高效的编解码器技术，康奈尔大学的研究人员也做出了贡献。

0 人收藏 0 人点赞

#text-generation

DiffusionGemma

Simon Willison's Blog ↗ · 2026-06-10 缓存

Google 发布了 DiffusionGemma，这是一个采用 Apache 2 许可证的开源权重文本生成模型（总参数量 26B，活跃参数量 4B），通过 NVIDIA 的 NIM 云 API 展示了极高的推理速度。

0 人收藏 0 人点赞

#text-generation

谷歌最新DiffusionGemma开源AI模型速度提升4倍

Ars Technica ↗ · 2026-06-10 缓存

谷歌发布了DiffusionGemma，这是一个实验性的开源文本生成扩散模型，相比自回归模型实现了4倍速度提升，并针对本地处理进行了优化。

0 人收藏 0 人点赞

#text-generation

@_philschmid: Gemma 迎来扩散模型！DiffusionGemma 每秒可处理高达1000+个token！ - 基于Gemma 4构建，为26B MoE模型。 - 3.8B…

X AI KOLs Following ↗ · 2026-06-10 缓存

DiffusionGemma 是一个基于 Gemma 4 的 26B MoE 模型，通过扩散模型以256个token的块进行文本生成，每秒可处理超过1000个token，经量化后可在18GB显存内运行，已根据 Apache 2.0 许可发布。

0 人收藏 0 人点赞

#text-generation

DiffusionGemma：开发者指南 - Google Developers Blog

Reddit r/LocalLLaMA ↗ · 2026-06-10 缓存

DiffusionGemma 是 Google DeepMind 推出的全新实验模型，可在 256 令牌画布上实现并行生成，在 GPU 上令牌生成速度提升高达 4 倍。本开发者指南阐述了其架构、双向上下文，并提供了用于解决数独的微调配方。

0 人收藏 0 人点赞

#text-generation

DiffusionGemma: 文本生成速度提升4倍

Hacker News Top ↗ · 2026-06-10 缓存

Google推出DiffusionGemma，这是一个实验性的26B MoE开源模型，通过文本扩散技术，在GPU上实现高达4倍的文本生成速度提升，针对速度要求高的交互式本地工作流。

0 人收藏 0 人点赞

#text-generation

google/diffusiongemma-26B-A4B-it

Hugging Face Models Trending ↗ · 2026-06-09 缓存

Google DeepMind 发布了 DiffusionGemma，这是一个 26B 参数的 Mixture-of-Experts 模型，使用离散扩散实现更快的文本生成，支持多模态输入和 256K token 上下文。

0 人收藏 0 人点赞

#text-generation

# 支持性令牌揭示：用于快速扩散语言模型解码

arXiv cs.CL ↗ · 2026-06-04 缓存

本文提出了 AXON，一种无需训练的模块，通过智能选择"锚点"（anchor）token 优先揭示，并利用注意力、不确定性和置信度信号来辅助后续去噪步骤，从而改善离散扩散语言模型解码的质量-延迟权衡。在推理和代码生成基准测试上的实验表明，AXON 在保持或提升准确率的同时减少了函数评估次数。

0 人收藏 0 人点赞

#text-generation

基于强化学习的经验驱动式LLM动态退出策略

arXiv cs.CL ↗ · 2026-06-03 缓存

介绍了LEDE，一个利用离线强化学习动态选择退出层和推测长度的框架，用于LLM的自推测解码，相较于自回归解码实现了高达2.7倍的加速。

0 人收藏 0 人点赞

#text-generation

迈向光速文本生成：Nemotron-Labs扩散语言模型

Hugging Face Blog ↗ · 2026-05-23 缓存

NVIDIA推出Nemotron-Labs Diffusion，这是一系列扩散语言模型，可并行生成文本并迭代优化，从而提供更快的生成速度并支持修订之前的令牌。

0 人收藏 0 人点赞

#text-generation

用于优化离散扩散语言模型的漂移目标

arXiv cs.CL ↗ · 2026-05-20 缓存

本文提出TokenDrift，一种漂移目标方法，通过将分类预测提升至连续语义空间进行反对称漂移，从而优化离散扩散语言模型。在固定去噪步数下，该方法显著提升了生成质量。

0 人收藏 0 人点赞

#text-generation

MiniGPT: 从第一性原理重建GPT

arXiv cs.CL ↗ · 2026-05-19 缓存

本文介绍了MiniGPT，这是一个基于PyTorch从头实现的紧凑型GPT风格自回归语言模型，其构建参考了nanoGPT的研究。该模型在Tiny Shakespeare数据集上使用字符级分词进行评估，在10.77M参数配置下达到了1.4780的验证损失。

0 人收藏 0 人点赞

#text-generation

扩散语言模型的动态分块

arXiv cs.CL ↗ · 2026-05-18 缓存

本文介绍了扩散语言模型的动态分块（DCDM），该方法使用可微分的Chunking Attention机制，用内容定义的语义块替换块离散扩散中的固定位置块，在高达1.5B参数规模上实现了一致的改进。

0 人收藏 0 人点赞

text-generation

提交意见反馈