HuggingFace

MiA-Signature：近似全局激活以增强长上下文理解

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了 MiA-Signature，这是一种大语言模型（LLM）中全局激活模式的压缩表示，旨在提升长上下文理解能力。该方法提出使用基于次模性的选择策略来近似完整的激活状态，从而在检索增强生成（RAG）和智能体系统中带来性能提升。

0 人收藏 0 人点赞

乱码也有效：提示空间扰动拓宽推理探索

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了 LoPE，这是一种利用提示空间扰动来解决可验证奖励强化学习中“零优势问题”的训练框架，从而增强大语言模型的推理探索能力。

0 人收藏 0 人点赞

SwiftI2V：一种通过条件分段生成实现高效高分辨率图像到视频生成的框架

Hugging Face Daily Papers ↗ · 2天前缓存

SwiftI2V 是一个新颖的高效框架，用于高分辨率图像到视频的生成，它采用条件分段生成技术，在显著降低计算成本的同时实现了 2K 分辨率的合成。该框架使得在单个消费级或数据中心 GPU 上进行实用的生成成为可能，同时保持了输入的保真度。

0 人收藏 0 人点赞

A^2TGPO：具有自适应回合级裁剪的代理回合组策略优化

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了 A^2TGPO，这是一种针对代理式大语言模型（LLMs）的强化学习方法，它利用自适应回合级裁剪和信息增益归一化来改善多轮交互中的过程信用分配。

0 人收藏 0 人点赞

用于少步扩散蒸馏的连续时间分布匹配

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了连续时间分布匹配（CDM），这是一种用于少步扩散蒸馏的方法，它通过将优化过程从离散迁移到连续，提高了视觉保真度并保留了精细细节。

0 人收藏 0 人点赞

我们在多模态域泛化领域是否取得了进展？一项全面的基准研究

Hugging Face Daily Papers ↗ · 2天前缓存

本文提出了 MMDG-Bench，这是一个针对多模态域泛化的统一基准，揭示了当前方法进展有限，并且在不同任务中存在显著的鲁棒性挑战。

0 人收藏 0 人点赞

何时信任想象：世界行动模型的自适应动作执行

Hugging Face Daily Papers ↗ · 2天前缓存

本文介绍了 FFDC，一种用于世界行动模型的轻量级验证器，它通过检查预测观察与实际观察之间的一致性，实现了自适应动作块大小，从而提高了机器人操作的效率和鲁棒性。

0 人收藏 0 人点赞

vLLM V0 到 V1：在 RL 中先保正确性，再谈修正

Hugging Face Blog ↗ · 2天前缓存

ServiceNow 工程师详细介绍了他们从 vLLM V0 迁移到 V1 的过程，重点解决了后端正确性问题，包括 logprob 语义和运行时默认值，以确保强化学习训练动态的稳定。

0 人收藏 0 人点赞

Jackrong/Qwopus3.6-35B-A3B-v1-GGUF

Hugging Face Models Trending ↗ · 3天前缓存

Jackrong 发布 Qwopus3.6-35B-A3B-v1，基于阿里巴巴 Qwen3.6 MoE 模型的推理增强微调版本，针对逻辑推理和智能体编程优化，拥有 350 亿总参数和 30 亿激活参数。

0 人收藏 0 人点赞

生成式量子启发柯尔莫哥洛夫-阿诺德本征求解器

Hugging Face Daily Papers ↗ · 3天前缓存

本文介绍生成式量子启发柯尔莫哥洛夫-阿诺德本征求解器（GQKAE），一种参数高效架构，用柯尔莫哥洛夫-阿诺德模块替代传统神经网络组件，显著降低内存使用并改善量子化学模拟中的收敛性。

0 人收藏 0 人点赞

KernelBench-X：评估LLM生成GPU内核的综合基准测试

Hugging Face Daily Papers ↗ · 3天前缓存

KernelBench-X是一个用于评估LLM生成GPU内核的新基准，揭示了任务结构对正确性的影响大于方法设计，且正确性并不保证硬件效率。

0 人收藏 0 人点赞

向 Open ASR Leaderboard 添加反 Benchmaxxing 机制

Hugging Face Blog ↗ · 3天前缓存

Hugging Face 宣布向 Open ASR Leaderboard 引入来自 Appen 和 DataoceanAI 的私有高质量数据集，以防止 benchmaxxing 和测试集污染，同时保留公开数据用于默认的平均 WER 计算。

0 人收藏 0 人点赞

StableI2I：识别图像到图像转换中的非预期变化

Hugging Face Daily Papers ↗ · 3天前缓存

本文介绍了 StableI2I，这是一种无需参考图像的评估框架，用于评估图像到图像生成任务中的内容保真度和一致性。此外，本文还提出了 StableI2I-Bench，一个用于评估多模态语言模型在这些评估任务上表现的基准。

0 人收藏 0 人点赞

D-OPSD：面向连续微调步骤蒸馏扩散模型的在线策略自蒸馏

Hugging Face Daily Papers ↗ · 3天前缓存

本文介绍了 D-OPSD，一种用于步骤蒸馏扩散模型的新型训练范式，能够在监督微调过程中实现在线策略自蒸馏。该方法使模型能够在不损害其高效少步推理能力的前提下，学习新概念或新风格。

0 人收藏 0 人点赞

PhysForge：为交互式虚拟世界生成具备物理基础的 3D 资产

Hugging Face Daily Papers ↗ · 3天前缓存

PhysForge 是一个两阶段框架，能够生成具备物理基础和运动学参数的交互式 3D 资产，解决了虚拟世界中静态几何模型带来的瓶颈问题。

0 人收藏 0 人点赞

通过上下文稀疏注意力实现闪电般的统一视频编辑

Hugging Face Daily Papers ↗ · 3天前缓存

本文介绍了上下文稀疏注意力（ISA），这是一种通过裁剪冗余上下文和使用动态查询分组来显著降低视频编辑计算成本的框架。作者通过 LIVEditor 证明了该方法的有效性，在多个视频编辑基准测试中实现了近乎无损的加速和最新的技术结果。

0 人收藏 0 人点赞

Stream-T1：用于流式视频生成的测试时扩展

Hugging Face Daily Papers ↗ · 3天前缓存

Stream-T1 是一种针对流式视频生成提出的测试时扩展（TTS）框架，通过噪声传播和奖励剪枝等机制，提升了时间一致性和生成质量。该论文通过利用块级合成技术，解决了现有基于扩散模型的方法计算成本过高的问题。

0 人收藏 0 人点赞

OpenSearch-VL：一种用于前沿多模态搜索智能体的开源训练配方

Hugging Face Daily Papers ↗ · 3天前缓存

OpenSearch-VL 是一个开源框架及论文，介绍了一种利用强化学习训练前沿多模态搜索智能体的方法，其中包含专用的数据筛选流程以及一种新颖的训练算法。

0 人收藏 0 人点赞

何时思考，何时表达：学习大型语言模型推理中的披露策略

Hugging Face Daily Papers ↗ · 3天前缓存

本文提出了“并行交错推理（Side-by-Side Interleaved Reasoning）”方法，通过控制自回归模型中的信息揭示时机，以提高准确性和效率。实验表明，在使用 Qwen3 模型的基准测试中，通过将私密推理与部分信息披露相结合，模型性能得到了提升。

0 人收藏 0 人点赞

首个Token已知：用于幻觉检测的单次解码置信度

Hugging Face Daily Papers ↗ · 3天前缓存

本文介绍了一种利用大语言模型生成首Token的置信度来检测幻觉的方法，该方法仅需执行单次解码步骤。

0 人收藏 0 人点赞

HuggingFace

提交意见反馈