来自 Blog 的文章
Hugging Face Jobs 现在允许你使用 vLLM 通过一条命令快速启动一个私有的、兼容 OpenAI 的 LLM 端点,无需配置服务器或 Kubernetes。
一项在令牌级别比较Olmo Hybrid和Olmo 3 Transformer的研究显示,混合模型能更好地预测有意义的令牌(如名词/动词),而Transformer模型则擅长从输入中复制令牌。
文章报道了《科学美国人》的一个专题栏目,其中MIT教授主张好奇心驱动的科学是美国成功的关键驱动力,并呼吁持续公共投资于研究。
Google为Google Finance推出了重大更新,包括带AI洞察的投资组合跟踪、自定义市场简报以及一款新的Android应用。这些更新旨在帮助用户管理投资并随时掌握信息。
NVIDIA宣布在Steam夏季促销期间推出GeForce NOW夏季折扣,并新增云游戏库游戏,强调云游戏的优势。
OpenAI报告称,智能代理AI,特别是其Codex产品,正在改变工作方式,通过支持更长期的任务并成为跨部门(包括非技术部门)的主要AI工具,且在非开发者中迅速普及。
据 @synthwavedd 的帖子报道,《Fable 5》已重新出现在 Amazon Bedrock 上。
Perplexity推出了Computer for Counsel,这是一款AI驱动的法律运营工具,旨在自动化行政研究、文件收集和合同分类。
OpenAI 发布了更新版 GPT-5.5 Instant,改进了理解意图、处理复杂约束以及提供更好建议的能力。
Mirendil 是一家由 Anthropic 前员工创立的初创公司,已获得 2 亿美元的种子轮融资,用于开发和分发加速 AI 研究的 AI 工具。
Anthropic指责阿里巴巴策划了已知最大规模的AI模型蒸馏攻击,涉及25,000个欺诈账户非法提取其模型能力,并呼吁政府与行业采取协调行动。
FLAT 是一种方法,能够直接从压缩的视频扩散潜变量中,通过单次前向传递解码出显式的三角片元,从而提升几何精度,同时支持快速光栅化和基于物理的交互。
亚马逊正起诉Perplexity AI,因其Comet浏览器的代理功能涉嫌伪装成人类用户偷偷访问亚马逊平台,造成安全与信任风险。此案凸显了AI代理工具与网站访问控制之间日益紧张的矛盾。
Simon Willison创建了一个工具,将Mozilla的浏览器兼容性数据转换为可下载的SQLite数据库,托管时设置了开放的CORS头,以便通过Datasette Lite轻松探索。
Gemini 3.5 Flash 现已原生支持将计算机使用作为内置工具,使开发者能够构建智能体,在浏览器、移动端和桌面环境中进行交互,用于软件测试和知识工作等长期自动化任务。
NVIDIA NeMo AutoModel 利用 HuggingFace Transformers v5,在微调 Mixture-of-Experts 模型时,无需修改代码(只需一个导入),即可实现 3.4 至 3.7 倍的训练吞吐量提升和 29% 至 32% 的 GPU 内存减少。