Claude Opus 4.7、Qwen 3.6、Happy Oyster、实时3D世界、全新Google TTS:AI新闻
摘要
Anthropic、阿里巴巴、谷歌等巨头集中发布重磅模型——Claude Opus 4.7、Qwen 3.6、情感丰富的Google TTS,还有仅1.58-bit的手机LLM与实时3D世界生成器,同时开放视频、VR及角色创作工具。
Opus 4.7、HY World 2.0、Qwen 3.6、Happy Oyster、GPT Rosalind、Lyra 2 #ai #ainews #aitools #aivideo #agi
感谢赞助商Hubspot。免费使用“你的AI内容团队” https://clickhubsp...
查看缓存全文
缓存时间:
2026/04/21 16:45
TL;DR:Anthropic 发布 Claude Opus 4.7,阿里开源 Qwen 3.6 并带来实时 3D 世界生成器,谷歌推出情绪饱满的 TTS,还有一批小而强的开源模型涌进手机、实验室和 VR 管线。
## Prompt Relay:零训练搞定多场景无缝视频
即插即用的 **Prompt Relay** 叠加在阿里 Wan 模型之上,可把风格迥异的镜头串成一条丝滑片段。
示例时间线
- 0–2 秒:雄鹰翱翔
- 瞬间切到赛博朋克街头飙车
- 拉远到客厅电视
方法不再“糊提示”,而是给 Wan 一份带起止帧的提示列表。在交叉注意力层里,当前提示占主导,下一条提示在短暂重叠期内“接棒”,保持动作与风格一致。代码已上传,完整仓库几天内公开(链接见视频描述)。
## Turnary Bonsai:1.58-bit 大模型跑在手机上
**Turnary Bonsai** 系列把权重压到 -1、0、1 再加共享缩放,磁盘体积比 16-bit 小 9 倍。1.7 B、4 B、8 B 三个尺寸全部开源权重。
- 8 B 模型:1.7 GB 文件,MMLU、BBH、HumanEval 全面超越 Llama-3.1-8B、GLM-4-9B、Ministral-8B
- 消费级 GPU 与旗舰手机 SoC 上 ≥100 tokens/s
GitHub + Hugging Face 链接见描述。
## GPT-Rosalind:OpenAI 的生命科学推理模型
**GPT-Rosalind** 瞄准 10–15 年新药发现流程,一键串联文献综述、假设生成、实验设计与数据分析。基准测试在分子性质预测与方案规划任务上比 GPT-5.4 高两位数。Code Interpreter 插件把 Rosalind 接入 50+ 生物数据库(UniProt、PDB、PubChem 等)。目前仅对湿实验研究员开放邀请,申请链接见下方。
## WildDebt-3D:iPhone 级开放词汇 3D 检测
**WildDebt-3D** 在 iPhone 实时视频流里输出带尺度的 3D 框。输入“monitor”或“paper”即可分割、深度估计并跟踪物体;图片也行(“animal”框出所有生物)。权重与 Swift 演示代码 MIT 开源。
## Motif-Video-2B:小身材大能量的视频扩散模型
仅用 <10k GPU 小时、<1 千万片段训练的 2 B 扩散 Transformer,在 VBench 上追平阿里 12 B Wan。显存 19 GB 即可跑;ComfyUI 节点在路上。Hugging Face 仓库已上线。
## 赞助商:HubSpot 免费《AI 内容团队》手册
HubSpot 的 11 项技能框架教你把爆款素材喂给 AI 集群,逆向拆解病毒基因,捕捉热点角度,自动排程并写出可自我优化的文案。下载链接见描述。
## Annigen:单图生成可动画 3D 角色
上传一张照片,**Annigen** 返回干净网格、骨架与蒙皮权重,直接导入 Maya 或 Blender。演示里台灯、鲨鱼、小狗都能即插即动。需 18 GB 显存;GitHub Apache-2.0 开源。
## Happy Oyster:对标 Google Genie 3 的开源 3D 世界生成器
阿里 ATH 实验室发布 **Happy Oyster**,实时、可提示控制的 3D 世界生成器。输入“骑龙”或“屋顶滑板”秒级生成可探索场景。ATH 同时预览 **Happy Horse** 视频模型,刚在 VBench 击败 Seedance 2.0。Happy Oyster 权重与试玩申请表见描述。
## LRA 2:英伟达一致性 3D 场景重建
**LRA 2** 把随手拍的视频变成持久的 3D Gaussian-splat 场景。几何与纹理完全锁定——离开一小时回来,物品纹丝不动。代码与论文链接见下方。
来源:YouTube 视频(https://www.youtube.com/watch?v=G8fqduzB5lc)
相似文章
YouTube AI Channels
Anthropic 公布被雪藏的 Claude Mythos 模型,可自主挖掘数千个 0-day;ZAI 开源 1.5 TB GLM-5.1,登顶开放权重基准;阿里巴巴未发布的 HappyHorse 视频模型冲上公开榜第一;Deepseek 放出“专家模式”v4 预览。
YouTube AI Channels
OpenAI 全新 Codex 桌面应用把代码生成、浏览器自动化与持久化 Agent 集成进单一 IDE;Anthropic 为 Claude Code 新增并行会话功能;Google 推出桌面应用、Chrome 斜杠命令及一款高表现力 TTS 模型。
YouTube AI Channels
Anthropic 在 52 天内狂发 74 项更新,包括 Computer Use、Projects 和 Claude Code Auto Mode;Google 随即反击,推出 Gemini 3.1 Flash Live、vibe-coded 浏览器演示及 Lyria 3 Pro 音乐工具;GenSpark 也杀入场,2026 年前每月 20 美元畅享不限量 AI。
Anthropic News
Anthropic 发布了 Claude Opus 4.7,这是一款全新的 AI 模型,在高级软件工程、视觉能力和自我验证方面实现了显著提升。该版本包含专门的安全防护措施,现已通过 API 及主要云服务商提供。
Reddit r/LocalLLaMA
开发者演示如何本地实时运行 Qwen3 TTS,支持流式输出、量化、词级对齐与自定义音色微调,打造高表现力的开源 TTS 流水线。