标签
这篇文章追溯了流媒体行业从无广告模式向广告支持模式转变的过程,原因在于盈利难题。Netflix、Disney Plus 和 Amazon Prime Video 等主要服务现在提供更便宜的广告套餐,同时提高了无广告访问的价格。
一个受 Claude Tag 启发的开源工具,允许用户自带模型和运行时,支持生成式 UI、流式回复和人机协作审批。
加州一项于7月1日生效的法律规定,流媒体服务中音量过大的广告将属违法,尽管业界反对,理由包括服务器端广告插入和不同播放设备带来的技术挑战。
Netflix正在推出一项永久性更改,要求订阅下的每个用户个人资料拥有自己唯一的电子邮件地址和登录凭据,这会影响次要用户。
Shadcn 发布了一套新的可组合组件,用于构建聊天界面,包括流式传输、滚动、消息、气泡、附件和标记。
Interactions API 现在支持 background=True 用于异步代理任务,允许操作超过 HTTP 超时时间。有一份指南说明了使用方法、重连和流式传输。
Svpino批评Claude Tag是供应商锁定陷阱,而Atai Barkai宣布推出Open Tag,这是一款开源替代方案,可与任何模型和代理框架配合使用,支持生成式UI、流式传输和人机协同审批。
迪士尼已同意支付 5000 万美元,以和解一起集体诉讼。该诉讼指控迪士尼通过反竞争传输协议,迫使 YouTube TV 和 DirecTV Stream 提高订阅价格。
迪士尼同意就指控其行为导致直播电视流媒体费用更高的指控达成5000万美元和解。在2019年至2026年间订阅了YouTube TV、DirecTV Stream或AT&T TV Now的符合条件的客户可能获得赔偿。
在离职采访中,鲍勃·伊格尔透露迪士尼差点收购推特,曾探讨与苹果合并,并未能买下詹姆斯·邦德系列版权,突显了他在任期间错失的机会。
介绍了Nexus Sampling,一种无需训练的KV-cache驱逐方法,采用加权蓄水池采样代替确定性top-k选择,在固定内存预算下提升了长上下文LLM推理性能,在80%驱逐率下达到与密集注意力相匹配的性能。
MaineCoon是一款22B参数的实时文生音频视频模型,在单张H100 GPU上可达47.5 FPS,支持低成本、长时长的流式生成,同步语音与画面,用于实时AI角色。
NVIDIA 悄然发布了 Nemotron-3.5-ASR,这是一个轻量级、参数规模为 0.6B 的开源语音识别模型,专为实时流式传输设计,支持 40 多种语言、低延迟和缓存感知架构。
Wan-Streamer是一个统一的端到端多模态模型,用于实时音视频交互,采用因果注意力机制,并集成处理视觉、音频和文本模态,实现了亚秒级延迟。
一款名为 ytr 的新型 Emacs 软件包可将 YouTube 音频流作为电台小部件播放,基于 mpv 和 yt-dlp 驱动,并已在 GitHub 上提供。
一篇关于使用 Gemini Live Translate、Next.js、LiveKit 和 Cloud Run 构建实时翻译应用的教程,涵盖音频流传输、翻译和部署。
福克斯收购Roku预计将带来重大变化,包括使The Roku Channel成为Roku设备独占,并放弃像灯泡这样的物联网产品,转而专注体育内容。
MOSS-TTS-Local Transformer v1.5 是一个开源的 48 kHz 立体声 TTS 模型,具有零样本语音克隆、原生流式传输,并支持31种语言,基于 Qwen3-4B 骨干网构建,通过 SGLang-Omni 提供。
Google的Gemini TTS现在支持流式音频生成,开发者可以构建即时响应的语音应用,无需等待完整音频输出。