diffusion-model

#diffusion-model

CoDiffGRN: 通过BEELINE-KGC基准和共进化离散扩散重新思考基因调控网络推断

arXiv cs.LG ↗ · 4天前缓存

本文介绍了CoDiffGRN，一个用于基因调控网络推断的共进化离散扩散框架，以及一个新的归纳评估基准BEELINE-KGC。它在新型调控发现中取得了最先进的性能。

0 人收藏 0 人点赞

#diffusion-model

WanSong v1.0 技术报告

Hugging Face Daily Papers ↗ · 4天前缓存

WanSong是一个纯扩散式音乐生成模型，能够一次性直接生成长达5分钟的高保真多语种歌曲，并输出双音轨（人声和背景音乐），解决了高效生成、长音频和可控性方面的挑战。

0 人收藏 0 人点赞

#diffusion-model

层次化去噪用于多步视觉推理

Hugging Face Daily Papers ↗ · 4天前缓存

HDR 是一个统一框架，将层次化潜变量集成到因果视频生成中，用于多步视觉推理。与基线方法相比，它实现了更好的推理一致性、更低的延迟和强大的数据效率。

0 人收藏 0 人点赞

#diffusion-model

通过口袋条件扩散和属性感知优化生成可开发的3D分子

arXiv cs.LG ↗ · 5天前缓存

本文介绍了一种新颖的基于扩散的生成模型，用于基于结构的药物设计。该模型解耦了口袋和配体的表示学习，并融入了多尺度相互作用信号和属性感知优化，以生成具有更强结合亲和力和更优ADMET属性的可开发3D分子。

0 人收藏 0 人点赞

#diffusion-model

基于广义泊松流的变长生成式蛋白质设计

arXiv cs.LG ↗ · 2026-07-13 缓存

介绍广义泊松流（GPFlow），一种用于蛋白质设计的变长生成式框架，它学习非齐次广义泊松过程，实现灵活的序列长度探索，并在结构、序列和肽协同设计任务中提升可设计性。

0 人收藏 0 人点赞

#diffusion-model

MobiDiff：面向人类移动数据生成的多通道语义感知离散扩散框架

arXiv cs.AI ↗ · 2026-07-10 缓存

介绍MobiDiff，一种端到端的离散扩散框架，通过对多通道语义骨架进行去噪来生成人类移动数据，在实际数据集上实现了更快的推理速度和具有竞争力的保真度。

0 人收藏 0 人点赞

#diffusion-model

CineMobile：用于电影级摄像机运动生成的设备端图像到视频扩散

Hugging Face Daily Papers ↗ · 2026-07-04 缓存

本文介绍了CineMobile，一种高效的设备端图像到视频生成方法，通过蒸馏引导剪枝、扩散蒸馏和混合量化，相较于教师模型实现了40倍加速，使得在移动设备上实现电影级摄影机运动效果成为可能。

0 人收藏 0 人点赞

#diffusion-model

有没有人尝试过使用（较新的）Gemma扩散模型作为推测模型？

Reddit r/LocalLLaMA ↗ · 2026-07-03

探讨了使用Google的Gemma扩散模型作为推测模型，以实现高效的大语言模型推理。

0 人收藏 0 人点赞

#diffusion-model

Micro-World - 动作控制的交互世界模型 - AMD

Reddit r/LocalLLaMA ↗ · 2026-07-03 缓存

AMD 发布了 Micro-World，这是一个基于 Wan2.1 系列构建的动作控制交互世界模型，并提供了开源权重、代码和精心整理的数据集，用于可控世界建模。

0 人收藏 0 人点赞

#diffusion-model

测试了4个全新的前沿模型（2个中国模型、1个扩散模型、1个智能体模型），使用一个没有逻辑捷径的谜题。其中一个模型连续四次编造来源。

Reddit r/artificial ↗ · 2026-07-03

一项对四个全新前沿AI模型（MiMo-V2.5-Pro、MiniMax M3、Mercury 2、LongCat-2.0）的测试，采用需要真正推理而非模式匹配的谜题，结果显示大多数模型表现尚可，但LongCat-2.0反复生成虚假信息并表现出虚假的自信。

0 人收藏 0 人点赞

#diffusion-model

CONFLUX：一种用于3D胸部CT合成的潜在扩散模型，采用强化学习后训练

Hugging Face Daily Papers ↗ · 2026-07-03 缓存

CONFLUX是一种用于胸部CT合成的3D潜在扩散模型，能够实现高保真的体积生成，并具有可控的临床属性。通过强化学习后训练阶段增强了条件生成的可靠性。该模型及一个包含约20万胸部CT体积的合成数据集已发布。

0 人收藏 0 人点赞

#diffusion-model

CoIn：基于Gaussian Splatting引导的全面2D-3D修复

arXiv cs.AI ↗ · 2026-06-29 缓存

本文介绍CoIn，一种新颖的3D场景修复框架，通过多阶段一致性流水线连接2D扩散模型与3D Gaussian Splatting，支持灵活遮罩下的物体移除与插入。

0 人收藏 0 人点赞

#diffusion-model

RS-Diffuser: 风险敏感的扩散规划与分布值引导

arXiv cs.LG ↗ · 2026-06-29 缓存

RS-Diffuser 提出了一种风险敏感的离线扩散规划框架，结合扩散轨迹生成和分布值批评器，通过尾部感知目标在推理时灵活调整风险偏好，在安全关键任务中提升了回报和鲁棒性。

0 人收藏 0 人点赞

#diffusion-model

从动作到世界建模的可迁移动态先验学习

Hugging Face Daily Papers ↗ · 2026-06-28 缓存

本文介绍了A2World，一种基于扩散的世界模型，在大规模机器人操作数据上预训练，以学习可迁移的动态先验。该模型可适配为真实世界模拟器（A2World-sim）用于策略评估，或视频-动作联合预测模型（A2World-policy）用于动作预测，展示了在模拟器中心和策略中心的机器人学习中的优势。

0 人收藏 0 人点赞

#diffusion-model

PhysisForcing：面向机器人操作的物理增强世界模拟器

Hugging Face Daily Papers ↗ · 2026-06-26 缓存

PhysisForcing 是一种训练框架，通过基于 DiT 架构的像素级轨迹对齐和语义级关系对齐损失来强制物理一致性，从而增强机器人操作的具身视频生成，在基准测试上取得了显著改进。

0 人收藏 0 人点赞

#diffusion-model

基于CKM的通信感知无人机城市巡检智能轨迹优化

arXiv cs.LG ↗ · 2026-06-25 缓存

本文提出了一种基于信道知识地图（CKM）的多无人机巡检轨迹规划框架，利用扩散模型重建高保真信道质量图，并结合图注意力网络与软演员-评论家算法实现通信感知路径规划。

0 人收藏 0 人点赞

#diffusion-model

Qwen-Image-2.0-RL 技术报告

Hugging Face Daily Papers ↗ · 2026-06-25 缓存

本技术报告介绍了 Qwen-Image-2.0-RL，这是一个基于强化学习与人类反馈及在策略蒸馏的后训练流程，旨在提升图像生成与编辑任务中的视觉质量和指令遵循能力。

0 人收藏 0 人点赞

#diffusion-model

Prob-BBDM：一种用于MRI序列图像到图像翻译的概率性布朗桥扩散模型

arXiv cs.AI ↗ · 2026-06-24 缓存

本文介绍了Prob-BBDM，一种概率性布朗桥扩散模型，能够从2D轴向切片高效高质量地合成MRI序列，仅需4步扩散即可达到88.46% SSIM和26.09 dB PSNR，并在肿瘤分割中展现出临床实用性。

0 人收藏 0 人点赞

#diffusion-model

@charles_irl: dflash 高速运转

X AI KOLs Timeline ↗ · 2026-06-24 缓存

NVIDIA 宣布推出 DFlash，一种用于推测解码的开源块扩散模型，在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升，同时保持交互性。

0 人收藏 0 人点赞

#diffusion-model

TryOnCrafter: 通过可渲染的4D试穿代理释放相机轨迹实现逼真的视频虚拟试穿

Hugging Face Daily Papers ↗ · 2026-06-24 缓存

本文提出了TryOnCrafter，一个用于相机可控视频虚拟试穿的新框架，利用可渲染的4D试穿代理和基于DiT的视频生成实现全方位视角探索，克服了现有方法依赖固定源相机轨迹的局限性。

0 人收藏 0 人点赞

diffusion-model

提交意见反馈