Blog

来自 Blog 的文章

提升AI智能体的速度与能效

MIT News — Artificial Intelligence ↗ · 4小时前缓存

麻省理工学院和微软的研究人员开发了一种智能系统，可自动优化智能体工作流，在保持性能的同时减少计算资源和能源消耗。

0 人收藏 0 人点赞

simonw/browser-compat-db

Simon Willison's Blog ↗ · 8小时前缓存

Simon Willison创建了一个工具，将Mozilla的浏览器兼容性数据转换为可下载的SQLite数据库，托管时设置了开放的CORS头，以便通过Datasette Lite轻松探索。

0 人收藏 0 人点赞

引用Tom MacWright

Simon Willison's Blog ↗ · 13小时前缓存

Tom MacWright 观察到，由LLM生成的求职申请和作品集让求职者感到缺乏个性和人情味，缺少真实的个人表达。

0 人收藏 0 人点赞

在 Gemini 3.5 Flash 中引入计算机使用

Google DeepMind Blog ↗ · 15小时前缓存

Gemini 3.5 Flash 现已原生支持将计算机使用作为内置工具，使开发者能够构建智能体，在浏览器、移动端和桌面环境中进行交互，用于软件测试和知识工作等长期自动化任务。

0 人收藏 0 人点赞

使用 NVIDIA NeMo AutoModel 加速 Transformer 微调

Hugging Face Blog ↗ · 16小时前缓存

NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5，在微调 Mixture-of-Experts 模型时，无需修改代码（只需一个导入），即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。

0 人收藏 0 人点赞

OpenAI与Broadcom发布专为LLM推理优化的芯片

OpenAI Blog ↗ · 昨天缓存

OpenAI与Broadcom发布了Jalapeño，一款专为LLM推理定制的芯片，每瓦性能显著优于当前最先进水平，从零开始为当前及未来AI模型设计。

0 人收藏 0 人点赞

NVIDIA与AWS合作，将AI大规模投入生产

NVIDIA Blog ↗ · 昨天缓存

NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例，以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能，使企业能够以更优的性能和更低的运营复杂性，大规模部署AI应用。

0 人收藏 0 人点赞

FFASR排行榜发布：真实场景下的ASR评测

Hugging Face Blog ↗ · 昨天缓存

介绍FFASR排行榜，这是一个开放、社区驱动的基准测试，用于在真实远场声学条件下评估自动语音识别模型，突显了近场和远场场景之间的显著性能差距。

0 人收藏 0 人点赞

软件质量新时代今日开启（5分钟阅读）

TLDR AI ↗ · 昨天缓存

Momentic 宣布重大平台更新，推出基于AI的知识库和自主测试代理，以应对代码速度与软件质量之间日益扩大的差距。

0 人收藏 0 人点赞

Fluree DB（GitHub 仓库）

TLDR AI ↗ · 昨天缓存

Fluree DB 是一个开源的时间图数据库，具有类似 Git 的分支、集成的向量/文本/地理搜索、细粒度的访问控制，并支持 SPARQL、JSON-LD 和 Open Cypher。它针对 AI 代理记忆进行了优化，在十亿级图上实现了高性能。

0 人收藏 0 人点赞

美国施压Meta同意AI审查，安全担忧加剧（6分钟阅读）

TLDR AI ↗ · 昨天

特朗普政府正在敦促Meta自愿提交其AI模型进行联邦审查，因为Meta仍然是唯一未达成此类协议的美国主要AI开发商。

0 人收藏 0 人点赞

OpenAI 准备在 ChatGPT 上推出双向语音模式（2 分钟阅读）

TLDR AI ↗ · 昨天缓存

OpenAI 正在为 ChatGPT 推出新的双向语音模型（Bidi 1），该模型支持同时说话、听到和聆听，实时翻译，以及改进的对话上下文处理。升级已在部分用户的网页界面和应用程序中出现，预计很快会广泛发布。

0 人收藏 0 人点赞

Krea 2 技术报告 (59分钟阅读)

TLDR AI ↗ · 昨天缓存

Krea 2 是一系列用于创意图像生成的基础模型，构建于大规模数据基础设施和多阶段训练流程之上。它引入了提示扩展器和风格参考系统，以提高可操控性并实现创意探索。

0 人收藏 0 人点赞

Graphsignal (GitHub Repo)

TLDR AI ↗ · 昨天缓存

Graphsignal 是一个生产级推理性能分析平台，提供详细时间线、大语言模型生成追踪和系统级指标，帮助工程师跨模型、GPU及其他加速器优化AI性能。

0 人收藏 0 人点赞

间接提示注入的见解（12分钟阅读）

TLDR AI ↗ · 昨天缓存

Zico Kolter 和 Matt Fredrikson，Gray Swan 的领导者及 AI 安全专家，讨论了 AI 红队测试的现状以及间接提示注入——这是 AI 代理的关键漏洞。他们解释了为何 AI 安全需要不同的思维模式，自动化红队测试如何超越人类，并介绍了用于对抗性测试的工具 Shade。

0 人收藏 0 人点赞

字节跳动新AI视频模型可根据单个提示生成30秒片段（2分钟阅读）

TLDR AI ↗ · 昨天缓存

字节跳动发布了Seedance 2.5，这是一款AI视频模型，能够根据单个提示或最多50个参考素材生成30秒的4K片段，与OpenAI和谷歌的产品相媲美。

0 人收藏 0 人点赞

datasette 1.0a35

Simon Willison's Blog ↗ · 昨天缓存

Datasette 1.0a35 Alpha 版本引入了新的创建表格界面和修改表格 JSON API，以及稳定的模板上下文文档。

0 人收藏 0 人点赞

探索人工智能的社会影响

MIT News — Artificial Intelligence ↗ · 昨天缓存

MIT AI and Society Forum 召集了专家，讨论人工智能在劳动、工作、公民话语和艺术方面的社会影响，包括经济学家和计算机科学家的主题演讲、小组讨论，以及一场探索生成式AI在艺术中的应用的音乐表演。

0 人收藏 0 人点赞

OPFS + Pyodide 测试工具

Simon Willison's Blog ↗ · 昨天缓存

一个用于在浏览器中使用Pyodide实验源私有文件系统（OPFS）的测试工具，旨在探索Datasette Lite的持久化SQLite存储。

0 人收藏 0 人点赞

GPT-5如何帮助免疫学家Derya Unutmaz解开一个持续三年的谜团

OpenAI Blog ↗ · 昨天缓存

OpenAI的GPT-5 Pro帮助免疫学家Derya Unutmaz解开了一个关于葡萄糖如何影响T细胞分化的三年之谜，它提出脱氧葡萄糖会干扰IL-2蛋白的构建，从而导致促炎性Th17细胞增加。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈