vq-vae

#vq-vae

[新模型] SupraLabs 推出了 Any2Any 模型系列！

Reddit r/LocalLLaMA ↗ · 3天前缓存

SupraLabs 发布了 Supra-A2A-Nano-Exp，这是一个小型任意到任意自回归模型，将文本和图像标记化统一到单个 Transformer 中，作为教育原型而非生产就绪系统。

0 人收藏 0 人点赞

#vq-vae

SimPersona：从原始点击流学习离散买家画像以构建接地气的电商代理

arXiv cs.AI ↗ · 2026-05-15 缓存

SimPersona 使用 VQ-VAE 从原始点击流中学习离散的买家画像，并将其映射为 LLM 驱动的网络代理的画像令牌，在多个在线商店中实现了高转化率对齐。

0 人收藏 0 人点赞

#vq-vae

先连续后离散：解决维度坍塌问题的VQ-VAE

arXiv cs.LG ↗ · 2026-05-11 缓存

本文探讨了VQ-VAE中常见的维度坍塌问题，指出模型表示通常局限于低维子空间。研究提出了一种“自编码器预热（AE Warm-Up）”策略，即首先将模型作为未量化的自编码器进行训练，从而提升重建质量并增加潜在空间的有效维度。

0 人收藏 0 人点赞

#vq-vae

理解 VQ-VAE（DALL-E 原理解析第一部分）

ML at Berkeley ↗ · 2021-02-09 缓存

一篇教育性博客文章，讲解向量量化变分自编码器（VQ-VAE）架构——OpenAI DALL-E 图像生成模型的关键组成部分。

0 人收藏 0 人点赞

#vq-vae

# Jukebox 来源：[https://openai.com/index/jukebox/](https://openai.com/index/jukebox/) 自动音乐生成的历史已有半个多世纪\.[1](https://openai.com/index/jukebox/#citation-bottom-1),[2](https://openai.com/index/jukebox/#citation-bottom-2),[3](https://openai.com/index/jukebox/#citation-bottom-3),[4](https://openai.com/index/jukebox/#citation-bottom-4)一个主要的方法是以钢琴卷的形式生成符号音乐，它指定了时序和音高

0 人收藏 0 人点赞

vq-vae

[新模型] SupraLabs 推出了 Any2Any 模型系列！

SimPersona：从原始点击流学习离散买家画像以构建接地气的电商代理

先连续后离散：解决维度坍塌问题的VQ-VAE

理解 VQ-VAE（DALL-E 原理解析 第一部分）

Jukebox

提交意见反馈

理解 VQ-VAE（DALL-E 原理解析第一部分）