来自 Blog 的文章
Simon Willison创建了一个工具,将Mozilla的浏览器兼容性数据转换为可下载的SQLite数据库,托管时设置了开放的CORS头,以便通过Datasette Lite轻松探索。
Gemini 3.5 Flash 现已原生支持将计算机使用作为内置工具,使开发者能够构建智能体,在浏览器、移动端和桌面环境中进行交互,用于软件测试和知识工作等长期自动化任务。
NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5,在微调 Mixture-of-Experts 模型时,无需修改代码(只需一个导入),即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。
OpenAI与Broadcom发布了Jalapeño,一款专为LLM推理定制的芯片,每瓦性能显著优于当前最先进水平,从零开始为当前及未来AI模型设计。
NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。
介绍FFASR排行榜,这是一个开放、社区驱动的基准测试,用于在真实远场声学条件下评估自动语音识别模型,突显了近场和远场场景之间的显著性能差距。
Fluree DB 是一个开源的时间图数据库,具有类似 Git 的分支、集成的向量/文本/地理搜索、细粒度的访问控制,并支持 SPARQL、JSON-LD 和 Open Cypher。它针对 AI 代理记忆进行了优化,在十亿级图上实现了高性能。
OpenAI 正在为 ChatGPT 推出新的双向语音模型(Bidi 1),该模型支持同时说话、听到和聆听,实时翻译,以及改进的对话上下文处理。升级已在部分用户的网页界面和应用程序中出现,预计很快会广泛发布。
Krea 2 是一系列用于创意图像生成的基础模型,构建于大规模数据基础设施和多阶段训练流程之上。它引入了提示扩展器和风格参考系统,以提高可操控性并实现创意探索。
Graphsignal 是一个生产级推理性能分析平台,提供详细时间线、大语言模型生成追踪和系统级指标,帮助工程师跨模型、GPU及其他加速器优化AI性能。
Zico Kolter 和 Matt Fredrikson,Gray Swan 的领导者及 AI 安全专家,讨论了 AI 红队测试的现状以及间接提示注入——这是 AI 代理的关键漏洞。他们解释了为何 AI 安全需要不同的思维模式,自动化红队测试如何超越人类,并介绍了用于对抗性测试的工具 Shade。
字节跳动发布了Seedance 2.5,这是一款AI视频模型,能够根据单个提示或最多50个参考素材生成30秒的4K片段,与OpenAI和谷歌的产品相媲美。
MIT AI and Society Forum 召集了专家,讨论人工智能在劳动、工作、公民话语和艺术方面的社会影响,包括经济学家和计算机科学家的主题演讲、小组讨论,以及一场探索生成式AI在艺术中的应用的音乐表演。
一个用于在浏览器中使用Pyodide实验源私有文件系统(OPFS)的测试工具,旨在探索Datasette Lite的持久化SQLite存储。
OpenAI的GPT-5 Pro帮助免疫学家Derya Unutmaz解开了一个关于葡萄糖如何影响T细胞分化的三年之谜,它提出脱氧葡萄糖会干扰IL-2蛋白的构建,从而导致促炎性Th17细胞增加。