generative-ai

#generative-ai

探索生成式人工智能中欺骗的“平庸性”

Reddit r/ArtificialInteligence ↗ · 8小时前缓存

这篇立场论文探讨了生成式人工智能中的“平庸性欺骗”，认为在聊天机器人交互中，细微的操纵正变得常态化，需要新的保障措施。

0 人收藏 0 人点赞

#generative-ai

@FinanceYF5: 有人说这是他这几年来看过的最好的短片之一。影片名称是《Zombie Scavenger》，作者为 MX-Shell 很快，我们就不会再称它为‘AI影片’，而只是称它为‘影片’。

X AI KOLs Following ↗ · 12小时前缓存

介绍由 MX-Shell 制作的短片《Zombie Scavenger》，被认为是近年来最好的短片之一，并指出 AI 视频正逐渐被接纳为常规影视作品。

0 人收藏 0 人点赞

#generative-ai

基于超球面流的语言建模

arXiv cs.LG ↗ · 14小时前缓存

本文介绍了 S-FLM，一种新颖的基于流的语言模型。该模型在超球面潜在空间中运行，旨在解决现有离散扩散模型和连续流模型的计算成本高昂及语义表达受限等问题。

0 人收藏 0 人点赞

#generative-ai

TMPO：用于多样且高效扩散模型对齐的轨迹匹配策略优化

arXiv cs.LG ↗ · 14小时前缓存

本文介绍了轨迹匹配策略优化（TMPO），这是一种扩散模型对齐方法。它通过匹配轨迹级奖励分布而非最大化标量奖励，解决了奖励黑客攻击和视觉模态崩溃问题。

0 人收藏 0 人点赞

#generative-ai

采样更多，获得更少：校准是大语言模型多样性的瓶颈

arXiv cs.CL ↗ · 14小时前缓存

本文引入了一种有效性-多样性框架，将大语言模型中的多样性崩溃归因于解码过程中的排序和形状校准偏差，并在 14 种语言模型上进行了验证。

0 人收藏 0 人点赞

#generative-ai

@GoogleDeepMind: 我们正在利用 AI 重新构想一个拥有 50 年历史的人机交互界面——鼠标指针。这些实验性演示展示了人们如…

X AI KOLs ↗ · 昨天缓存

Google DeepMind 正在尝试利用 Gemini AI 重新构想鼠标指针界面，让用户能够通过手势动作、语音输入以及自然简写来控制屏幕。

0 人收藏 0 人点赞

#generative-ai

@wsl8297: 学 AI 最怕停在“懂原理”，一到写代码就卡壳：不知道从哪下手，也找不到像样的练手项目。我在 GitHub 挖到一个实战向宝藏库：AI-Project-Gallery。它收录了 30+ 高质量 AI 项目，覆盖从房价预测、疾病分类等经…

X AI KOLs Timeline ↗ · 昨天缓存

This post shares a curated GitHub repository containing over 30 practical AI projects, covering domains from regression to generative AI, with many end-to-end examples, suitable for learners and developers.

0 人收藏 0 人点赞

#generative-ai

教 Claude 像穴居人一样说话，Token 用量减少 75%

Reddit r/ArtificialInteligence ↗ · 昨天

一名用户尝试通过提示让 Claude 简洁交流，使 Token 用量降低了 75%，同时监测此举对模型智能的潜在影响。

0 人收藏 0 人点赞

#generative-ai

AI 正在把激进的通才变成他妈的机构

Reddit r/ArtificialInteligence ↗ · 昨天

作者讲述了如何利用 AI 编码工具独自搭建复杂的网页基础设施，认为 AI 能让个人操盘手在没有大型团队的情况下，达成机构级的产出。

0 人收藏 0 人点赞

#generative-ai

NoiseRater：用于扩散模型训练的元学习噪声评估

arXiv cs.LG ↗ · 昨天缓存

本文介绍了 NoiseRater，这是一种元学习框架，在扩散模型训练期间为各个噪声样本分配重要性评分，以提高训练效率和生成质量。

0 人收藏 0 人点赞

#generative-ai

迈向定制化的多模态角色扮演

arXiv cs.LG ↗ · 昨天缓存

本文介绍了 UniCharacter，这是一个用于定制化多模态角色扮演（CMRP）的两阶段训练框架，能够对人设、对话风格和视觉身份进行统一的定制。该研究提出了 RoleScape-20 数据集，并证明了该模型仅需极少数据即可实现连贯的跨模态生成。

0 人收藏 0 人点赞

#generative-ai

基于强化学习的折纸超材料逆向结构设计与快速激光切割原型制作

arXiv cs.LG ↗ · 昨天缓存

本文介绍了 RL-Kirigami，这是一个结合最优传输条件流匹配和强化学习的框架，用于解决折纸超材料的逆向设计问题，实现了高精度并支持快速的激光切割原型制造。

0 人收藏 0 人点赞

#generative-ai

MoCam：通过结构化去噪动态实现统一的新视角合成

Hugging Face Daily Papers ↗ · 昨天缓存

MoCam 是一篇研究论文，介绍了一种基于扩散的统一新视角合成框架，该框架通过动态协调几何和外观先验，提高了对几何误差的鲁棒性。

0 人收藏 0 人点赞

#generative-ai

VidSplat：利用几何引导的视频扩散先验进行高斯泼溅重建

Hugging Face Daily Papers ↗ · 昨天缓存

VidSplat 是一种无需训练的生成式重建框架，它利用视频扩散先验，通过合成新视角，从稀疏输入中恢复完整的 3D 场景。

0 人收藏 0 人点赞

#generative-ai

@karpathy: 顺便说一下，这个方法效果非常好。在查询的最后，让你的大语言模型“将回复组织为HTML格式”，然后查看生成的…

X AI KOLs Following ↗ · 2天前

Andrej Karpathy 建议通过提示词引导大语言模型将回复组织为 HTML，以实现更好的可视化效果，并预测 AI 的输出将从文本演变为交互式神经视频。

0 人收藏 0 人点赞

#generative-ai

两万罗马人进入条顿堡森林——我用AI制作了一部15分钟的暗黑战争视频

Reddit r/singularity ↗ · 2天前

创作者展示了一段关于条顿堡森林战役的15分钟AI生成电影级视频，介绍了利用AI进行视频、配音和音效设计的60小时工作流。

0 人收藏 0 人点赞

#generative-ai

Microsoft Copilot 或悄然赢得企业 AI 竞争

Reddit r/ArtificialInteligence ↗ · 2天前缓存

该分析认为，Microsoft Copilot 获胜的关键在于其深度集成了现有 Microsoft 工具的工作流，而非单纯的模型优越性。文章指出，在技术采纳过程中，组织习惯与路径依赖往往比技术能力更具决定性。

0 人收藏 0 人点赞

#generative-ai

谁将解开人工智能生产力之谜？

Reddit r/ArtificialInteligence ↗ · 2天前缓存

尽管生成式人工智能已被广泛采用，但仍未带来持续的生产力增长，这使得 OpenAI 和 Anthropic 推出了由私募股权支持的咨询业务，以帮助企业整合。

0 人收藏 0 人点赞

#generative-ai

ChatGPT 现已开始为教科书生成内容。

Reddit r/singularity ↗ · 2天前

本文报道，AI 工具 ChatGPT 目前正被用于编写教育教科书的内容。这标志着大语言模型在出版行业的一个新应用领域。

0 人收藏 0 人点赞

#generative-ai

为什么没有顶级 LLM 提供商投资扩散型 LLM？

Reddit r/singularity ↗ · 2天前

本文探讨了为何在 Mercury 2 等近期技术取得进展的背景下，主流 LLM 提供商仍未大力投资扩散型 LLM。文章分析了阻碍该技术更广泛采用的潜在底层缺陷或硬件瓶颈。

0 人收藏 0 人点赞

generative-ai

提交意见反馈