标签
讨论了字节跳动丰富的产品体系和涌现的新产品,链接到Coze、火山引擎和飞书的开发文档。
斯坦福和字节跳动推出 W-Flow,一种单步生成模型,利用 Wasserstein 梯度流实现了最先进的单步 ImageNet 256x256 生成(FID 1.29),采样速度比多步扩散模型快 100 倍。
一部名为《TikTok Never Dies》的新纪录片将在翠贝卡电影节首映,记录了围绕在美封禁 TikTok 长达六年的法律拉锯战,跟随三位深陷诉讼的创作者展开叙述。文章认为,TikTok 禁令归根结底更多关乎美国国内政治博弈与中美贸易摩擦,而非 TikTok 本身。
文章讲述了字节跳动创始人张一鸣当年高考报考生物系未被录取、阴差阳错转入软件工程专业的经历,以及《普通生物学》这本书对他的影响,感慨历史的吊诡与个人命运的偶然性。
字节Seed开源了TaskMem checkpoint,基于Qwen3-VL-30B-A3B训练,通过两阶段强化学习让多模态Agent在视频流中学会生成长期记忆,在VideoMME、EgoLife等基准上获得显著提升。
字节跳动开源了 Bernini-R,一种视频扩散渲染器,结合了基于 MLLM 的语义规划器和基于 DiT 的渲染器,用于统一的视频生成和编辑,在视频编辑上达到顶尖性能。
字节跳动正在基于Arm和RISC-V架构开发定制CPU,以支持其AI基础设施,并减少对英特尔和AMD的依赖,原因是处理器交货时间过长。
字节跳动开源了 UI-TARS-desktop 项目,包含通用多模态 Agent 框架 Agent TARS 和本地 GUI Agent UI-TARS Desktop,支持在终端/浏览器执行真实任务,基于 UI-TARS 视觉模型和 Seed-1.5-VL,采用 Apache 2.0 许可。
作者作为seedance模型的下游开发者,分享了对该模型潜力的看法,已基于seedance token开发了四个产品线,并认为字节跳动凭借红果短剧+seedance闭环将在视频生成赛道胜出。
字节跳动近日推出开发专家内测活动,邀请不同编程语言领域的资深研发人员试用其尚未公开的AI产品,引发对新产品可能性的期待。
开发者尝试将字节跳动的 Seedance 2.0 视频模型集成到自动化智能体管道中,但遇到字节跳动火山引擎 API 的企业限制;寻求社区对 Fal 等替代 API 提供商的反馈,重点关注每秒定价、API 兼容性和延迟基准。
字节跳动发布Cola-DLM,一种层次化连续潜在空间扩散语言模型,结合了文本VAE和块因果扩散Transformer,在Hugging Face上提供模型权重、代码和论文。
字节跳动 TRAE 团队发布了《2026 企业级 AI 编程实践手册》,并公布了内部总结的 Agent Skills Top 10 推荐清单。该清单强调了前端设计、代码审查和自动化测试的重要性,展示了大厂在 AI 辅助编程方面的最佳实践。
ByteDance has open-sourced UI-TARS, an AI model capable of directly controlling computer interfaces via mouse and keyboard for tasks like booking flights or configuring software. Available in 2B, 7B, and 72B parameter sizes, it runs locally and offers a free alternative to paid services like Anthropic's Computer Use.
文章盘点 GitHub 上近期星标增长最快的五个 AI Agent 项目,重点介绍了 Anthropic 的金融服务智能体框架、字节跳动的 UI-TARS 桌面端以及各类编码 Agent 工具。
ByteDance open-sourced UI-TARS-desktop, a native desktop GUI agent with 31.4k GitHub stars that uses vision models to control local or remote applications via natural language. The tool runs locally for privacy, supports Windows and macOS, and includes a CLI with streaming output for developers.
UI-TARS-desktop is a highly popular open-source tool by ByteDance that enables 100% local multimodal desktop automation, allowing users to control apps and browsers via natural language without cloud data leaks.
字节跳动在4月内部AI战略复盘会上砍掉30%的AI应用项目,包括猫箱、星绘及Dreamina部分业务线,豆包之外无一产品达到预期DAU目标,公司将聚焦豆包、硬件押注及收缩纯应用投入。
字节 Seed 内部人士张弛称,尽管豆包是中国使用最多的聊天机器人,中美 AI 能力差距仍在拉大