training-free

标签

Cards List
#training-free

通过速度编辑实现安全的少步生成

Hugging Face Daily Papers · 2天前 缓存

VESFlow 是一种无需训练的安全方法,用于基于流匹配的文本到图像生成,通过编辑速度场来确保安全输出,同时保持提示的完整性。

0 人收藏 0 人点赞
#training-free

大多数多跳RAG在数据变化时就会变得过时,那么有没有一种无需训练的方法可以跳过图重建?

Reddit r/artificial · 2天前

提出了一种无需训练的多跳检索增强生成方法,避免在底层数据变化时进行昂贵的图重建,解决了动态环境中的过时问题。

0 人收藏 0 人点赞
#training-free

更深并不总是更好:通过置信层解码缓解对齐损失

Hugging Face Daily Papers · 4天前 缓存

本文介绍了一种无需训练的编码策略——Confident Decoding,它利用熵引导搜索动态选择LLM中最可靠的中间层,从而缓解对齐损失,并在GPQA-Diamond、Omni-MATH等基准测试中提升了推理性能,且开销可忽略不计。

0 人收藏 0 人点赞
#training-free

迷失于单一向量:通过分块证据聚合改进长文档检索

arXiv cs.CL · 5天前 缓存

本文识别出长文档稠密检索中的文档侧早期压缩这一失败模式,并引入证据稀释指数(EDI)来衡量该问题。作者提出DICE,一种无需训练的方法,将文档分割成块,独立编码,然后聚合为单一向量,显著改进了长文档的检索效果。

0 人收藏 0 人点赞
#training-free

JanusMesh: 快速零样本3D视觉幻觉生成——基于跨空间去噪

Hugging Face Daily Papers · 6天前 缓存

JanusMesh 是一个快速、免训练的框架,通过将生成过程解耦为跨空间双分支去噪和视图条件纹理合成,生成文本驱动的3D视觉错觉——单个网格从不同视角展示不同语义——在仅3-5分钟内实现高真实感。

0 人收藏 0 人点赞
#training-free

超越并行采样:面向智能体搜索的多样化查询初始化

arXiv cs.AI · 6天前 缓存

本文识别了智能体搜索中的锚点坍塌现象,即并行轨迹因相似的初始查询而收敛,并提出了 DivInit,一种无需训练的方法,通过采样多样的初始查询来提升多跳问答的性能。

0 人收藏 0 人点赞
#training-free

Bag of Dims: 基于维度级符号模式的无需训练机制可解释性

Hugging Face Daily Papers · 2026-06-17 缓存

提出了Bag of Dims框架,表明Transformer隐藏状态的标准基提供了一种无需训练、架构通用的特征表示,其中维度通过符号模式编码语义内容;在语言、视觉和音频模型上得到验证,无需学习旋转即可实现高精度。

0 人收藏 0 人点赞
#training-free

@sheriyuo: 本文提出ASAG, Attention-State Adaptive Generation, 一个无需训练、即插即用的推理停止框架,用于推理…

X AI KOLs Timeline · 2026-06-16 缓存

ASAG利用注意力熵来检测推理何时无效益,提前停止以提高准确率并减少token生成。在Qwen3-8B上的实验显示,准确率提升4.4%,生成的token减少超过40%。

0 人收藏 0 人点赞
#training-free

DiRecT: 基于滚动时域去噪的安全扩散规划

arXiv cs.LG · 2026-06-16 缓存

DiRecT提出了一种免训练的安全扩散规划算法,通过滚动时域去噪仅在最终干净轨迹上施加约束,相比于现有方法提升了安全性和性能。

0 人收藏 0 人点赞
#training-free

面向语言模型激活引导的高维随机投影

arXiv cs.LG · 2026-06-16 缓存

HiDRA 是一种无需训练的方法,利用高维随机投影在大型语言模型中进行激活引导,能够捕捉超越线性方法的判别信号,并在多种模型系列和基准测试中持续优于现有基线。

0 人收藏 0 人点赞
#training-free

数字已经自带嵌入

arXiv cs.LG · 2026-06-15 缓存

介绍了Adelic保运算嵌入(AOE),一种无需训练的表示方法,通过结合实数值与p-adic展开来编码数字,保留加法和乘法结构。在Weaving Pattern基准上实现了完美准确率。

0 人收藏 0 人点赞
#training-free

多变量时间序列无训练时滞谱嵌入的平稳性与耦合判据

arXiv cs.LG · 2026-06-15 缓存

本文提出了一种可证伪的适用性判据,用于基于时滞谱嵌入的多变量时间序列的无训练固定长度描述符,展示了该描述符在何种情况下有望有效,并在多个基准上进行了验证。

0 人收藏 0 人点赞
#training-free

@HuggingPapers: SpatialClaw NVIDIA 发布一个无需训练的空间推理智能体,以代码作为交互接口。VLM 编写 P…

X AI KOLs Following · 2026-06-12 缓存

NVIDIA 推出 SpatialClaw,一个无需训练的空间推理智能体,利用 VLM 在持久化内核中编写 Python 代码,组合感知工具,并修订计划,在20项基准测试中超越先前智能体 +11.2 分。

0 人收藏 0 人点赞
#training-free

SkillCAT:对比性评估与拓扑感知的LLM智能体技能自我进化

arXiv cs.CL · 2026-06-12 缓存

SkillCAT是一个无需训练的LLM智能体技能自我进化框架,通过三个阶段解决单轨迹偏差、未经验证的合并和全语料库加载等问题:对比因果提取、评估增强进化和拓扑感知任务执行,在基准测试上实现高达40.40%的提升。

0 人收藏 0 人点赞
#training-free

RKSC: 面向多步LLM推理的推理感知KV缓存共享与自信提前退出

arXiv cs.LG · 2026-06-10 缓存

介绍了RKSC,一个无需训练的推理框架,用于多分支LLM推理,通过基于相似度的共享和提前退出减少KV缓存冗余,实现最高3倍加速且错误率极低。

0 人收藏 0 人点赞
#training-free

在困难处采样:通过熵引导的幂采样增强基础模型推理

arXiv cs.LG · 2026-06-10 缓存

本文提出熵引导幂采样(EGPS),一种无需训练和验证器的采样方法,提高了幂采样在增强基础语言模型推理中的效率。与标准Metropolis-Hastings采样相比,EGPS在MATH500、HumanEval和GPQA等基准测试上达到最佳或并列最佳准确率,同时实现高达12.6倍的加速。

0 人收藏 0 人点赞
#training-free

缓解流形偏离:面向可信MLLM解码的不确定性感知子空间矫正

arXiv cs.LG · 2026-06-10 缓存

本文介绍了MGAP,一种无需训练的解码方法,通过自适应地仅抑制语言先验中的有害部分,同时保留模型的语义流形,从而减少多模态大语言模型中的幻觉。该方法在POPE和CHAIR基准测试上优于先前的基线方法。

0 人收藏 0 人点赞
#training-free

Dep-LLM:基于证据引导的结构化多因素与可靠LLM推理的无需训练抑郁症诊断

arXiv cs.CL · 2026-06-10 缓存

Dep-LLM是一个无需训练的框架,利用冻结的大型语言模型,通过将对话分解为五个临床对齐的主题,并采用基于证据的推理和置信度调制,从临床访谈中诊断抑郁症。在DAIC-WOZ和E-DAIC数据集上,其性能优于零样本和一些监督方法。

0 人收藏 0 人点赞
#training-free

Prefilling-dLLM:扩散语言模型中长上下文推理的预测性预填充

arXiv cs.CL · 2026-06-10 缓存

本文提出Prefilling-dLLM,一种无需训练的框架,它将前缀分割成块并缓存KV表示,在扩散语言模型的长上下文推理中实现了最先进的质量和高达28倍的加速。

0 人收藏 0 人点赞
#training-free

推理,然后重新推理:跨视角回顾提升空间推理

Hugging Face Daily Papers · 2026-06-10 缓存

一种无需训练的空间推理框架,它利用由预测3D几何生成的合成新视角视频,实现对自我中心视频中结论的重新审视。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈