标签
AT4K 是一款免费的 Google TV 替代启动器应用,它用简洁、类似 Apple TV 风格的界面取代了杂乱、广告泛滥的默认主屏幕,只显示你实际使用的流媒体服务。该应用可在 Google Play 上下载,并提供一次性 5 美元的高级版升级选项,解锁更多功能。
WiiM 发布其首款条形音箱 WiiM Bar,支持杜比全景声、可扩展性及触控显示屏,将于七月上市,售价 479 美元。
Plex正在添加新的社交功能,包括个性化列表、社区论坛、匹配评分、表情反应和关注提醒,旨在增强娱乐发现能力,并超越其媒体服务器的根源。
工程笔记,比较了将多个LLM提供商(OpenAI、Anthropic、Google)的访问统一到单个内部接口的三种方法,讨论了API标准化、原生SDK使用和网关模式的权衡。
StreamMA 提出了一种用于多智能体推理的流式通信范式,通过管道化中间结果来降低延迟,并利用更可靠的早期步骤提升效果,在多个基准测试中优于基线方法,同时揭示了步骤级别的缩放定律。
Teknium 宣布,现在在 Telegram 上使用 Hermes Agent 进行流式令牌传输变得流畅。
Streambed是一个开源的CDC引擎,它将Postgres的WAL变更流式传输到S3上的Iceberg表,并内置了一个使用DuckDB的查询服务器,该服务器支持Postgres wire协议。
开放媒体联盟(Alliance for Open Media)发布了 AV2 v1.0.0 规范,这是一种新一代视频编码标准,为流媒体、广播和实时视频会议提供卓越的压缩效率。
TV Explorer 是一款网络工具,提供高级用户界面,用于浏览和访问 10,000 个免费在线电视频道。
一篇关于热门Kick主播Clavicular(Braden Peters)在迈阿密派对上为了博眼球而羞辱OnlyFans模特的文章,此举引发了一场冲突,并引发了关于成人娱乐行业安全与尊重的更广泛讨论。
OpenSTBench 是一个统一的、多维度的语音翻译系统评估框架,能够联合评估翻译质量、语音质量、说话人保持、情感保真度以及延迟,涵盖离线与流式场景下的 S2TT 和 S2ST 系统。该框架弥补了分散评估协议带来的空白,并为比较异构语音翻译系统提供了一个可复现的基准。
SwanSphere 提出了一种统一的流式框架,通过因果自回归扩散变换器和多模态学习策略,从全景视频和文本提示中生成高保真空间音频,在视频到空间音频和文本到空间音频任务中均实现了卓越性能。
Google DeepMind 发布了 Magenta RealTime 2,这是一个开源音乐生成模型,支持设备端流式处理,可通过文本、音频示例和 MIDI 实现低延迟控制。
SANA-Streaming 利用混合扩散Transformer架构、循环反向正则化以及高效的系统协同设计,在消费级GPU上实现实时高分辨率视频到视频编辑,在单张RTX 5090上达到1280×704分辨率下24 FPS。
Spotify 即将推出一项新格式,为来自主流出版物的长篇杂志文章提供配音。高级用户可在其有声书额度内收听,而免费用户则可按每篇文章 1.99 美元的价格购买。
演示展示了使用MiniMax M2.7 NVFP4在两个Nvidia GB10芯片上同时流式传输16个本地AI代理,无需云API。
初代Chromecast设备本周出现临时故障,引发用户担忧谷歌已将其变砖。谷歌确认这是一个技术问题,现已解决,设备应已恢复正常工作。
Trdo 是一款免费开源Windows广播应用,用户可通过系统托盘查找和收听在线电台。支持手动添加电台,并记录播放历史。