标签
字节跳动在4月内部AI战略复盘会上砍掉30%的AI应用项目,包括猫箱、星绘及Dreamina部分业务线,豆包之外无一产品达到预期DAU目标,公司将聚焦豆包、硬件押注及收缩纯应用投入。
Bumble将在今年晚些时候进行重大改版,取消滑动手势并引入AI驱动的配对功能,同时终止其女性优先发消息的政策。
谷歌推出《小简报》项目,邀请四位广告界偶像为其喜爱的小企业使用AI创意工作室Flow制作工作室级广告,展示AI的故事讲述能力。
索尼互动娱乐宣布计划将生成式AI整合到游戏开发中,以提升内容数量与多样性,同时自动化3D建模和动画等重复性任务。公司强调,AI将增强人类创造力而非取代开发者,并提到已在旗下工作室部署了内部工具。
该帖文热情分享了某位创作者利用AI技术实现特定角色生成的创意玩法,认为该功能极具启发性。
本文介绍了 SDFlow,这是一种用于时间序列生成的相似性驱动流匹配框架,旨在解决自回归模型中的暴露偏差问题。通过在冻结的 VQ 潜在空间中进行低秩流形分解,SDFlow 实现了最先进的性能并显著提升了推理速度。
本文提出了一个条件生成压缩感知框架,证明了基于提示词条件化模型在稳定恢复方面的界限,并通过在 Stable Diffusion 上的实验展示了提示词匹配如何影响采样分布。
本研究探讨在教育情境下,学生针对AI生成内容撰写反论证以培养批判性思维,并发现前沿大语言模型能够以与人类评估者中等一致性的方式评估此类写作。
用户询问ChatGPT生成文章的内部过程,特别是它是像人类一样综合信息并构建论点,还是简单复制现有文本。
来自罗维拉-威尔吉利大学的研究人员在《自然-机器智能》上发表论文,介绍了CoCoGraph,这是一种利用约束离散扩散过程生成化学有效的新型分子的AI工具。
llm-gemini 0.31 是插件的一个新版本,用于在 LLM 命令行工具中使用 Google 的 Gemini 模型。
LikeTony.ai 是一款让用户能够以埃隆·马斯克(Elon Musk)或史蒂夫·乔布斯(Steve Jobs)等名人的风格生成配音的产品。
SwiftI2V 是一个新颖的高效框架,用于高分辨率图像到视频的生成,它采用条件分段生成技术,在显著降低计算成本的同时实现了 2K 分辨率的合成。该框架使得在单个消费级或数据中心 GPU 上进行实用的生成成为可能,同时保持了输入的保真度。
本文介绍了上下文稀疏注意力(ISA),这是一种通过裁剪冗余上下文和使用动态查询分组来显著降低视频编辑计算成本的框架。作者通过 LIVEditor 证明了该方法的有效性,在多个视频编辑基准测试中实现了近乎无损的加速和最新的技术结果。
本综述论文全面回顾了大型基础模型中的视听智能,建立了统一的分类体系,综合了核心方法论,并概述了关键数据集、基准和开放性研究挑战。
本文介绍了 FD-loss,一种通过将总体规模与批次规模解耦,从而将 Fréchet 距离作为视觉生成的训练目标进行优化的方法。研究证明该方法能提高生成器的质量,并指出 FID 可能无法始终准确反映视觉质量。
Google 分享了八条使用 Gemini AI 进行家居整理任务的技巧,例如生成清洁清单、排查维修故障,以及通过 Gemini Live 和 Ask Maps 管理差事。
OpenAI 发布了 GPT-5.5,这是其前沿 AI 模型的重大升级,在保持高效与速度的同时,在智能体编码、研究以及多步骤任务执行等方面具备更强的能力。
OpenAI 发布 GPT-5.5 系统卡,这是一款专为复杂真实世界任务设计的新模型,具备增强的工具使用能力、自我纠错能力以及稳健的安全保障措施。
精选开源模型清单,涵盖代码、对话、视觉、音频、语音合成、声音克隆、音乐、图像与视频生成,附链接与性能简评。