Blog

引用 Luke Curley

Simon Willison's Blog ↗ · 13小时前缓存

技术评论：Luke Curley探讨WebRTC的设计如何通过激进丢弃音频数据包来优先保障低延迟，这与LLM语音应用中提示词准确度比速度更重要的需求相矛盾。他讲述了在浏览器限制下在Discord实现重传所面临的挑战。

0 人收藏 0 人点赞

使用 Claude Code：HTML 出人意料的有效性

Simon Willison's Blog ↗ · 17小时前缓存

Simon Willison 探讨了使用 HTML 而非 Markdown 作为 AI 输出格式的有效性，突出了 SVG 图表、交互式组件和丰富说明等优势。内容包含 Anthropic 公司 Claude Code 团队 Thariq Shihipar 的案例以及 GPT-5.5 的实用提示。

0 人收藏 0 人点赞

Seedance 引发关注，Nvidia 的 AI 引导芯片设计，帮助机器人不遗忘

The Batch ↗ · 20小时前缓存

Andrew Ng 认为，对 AI 驱动的“就业末日”的担忧被夸大了，他引用了软件工程领域强劲的招聘数据以及历史上技术创造的就业机会多于其摧毁的模式。

0 人收藏 0 人点赞

CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、本地可运行的模型

Hugging Face Blog ↗ · 20小时前缓存

CyberSecQwen-4B 是一个小型、专用的 4B 参数模型，针对防御性网络安全任务进行了微调，设计为在单个 GPU 上本地运行，解决了隐私、成本和离线部署需求。

1 人收藏 1 人点赞

EMO：通过预训练混合专家实现涌现模块化

Hugging Face Blog ↗ · 22小时前缓存

Allen AI 发布了 EMO 模型，这是一种混合专家模型，其中模块化结构从数据中自然涌现，使得仅使用 12.5% 的专家就能完成一项任务，同时保持接近完整模型的性能。

0 人收藏 0 人点赞

看看创意传奇如何用AI为小企业制作广告

Google AI Blog ↗ · 23小时前缓存

谷歌推出《小简报》项目，邀请四位广告界偶像为其喜爱的小企业使用AI创意工作室Flow制作工作室级广告，展示AI的故事讲述能力。

0 人收藏 0 人点赞

在OpenAI安全运行Codex

OpenAI Blog ↗ · 昨天缓存

OpenAI详细介绍了如何部署Codex并配备安全控制措施，包括沙箱隔离、审批策略、网络策略以及智能体原生遥测，以确保企业环境中编码智能体的安全运行。

0 人收藏 0 人点赞

MedQA：在AMD ROCm上微调临床AI——无需CUDA

Hugging Face Blog ↗ · 昨天缓存

一个教程和项目，演示在AMD MI300X上使用ROCm对Qwen3-1.7B进行LoRA微调，用于临床问答，为医疗AI开发提供无需CUDA的替代方案。

0 人收藏 0 人点赞

Perplexity 将 Personal Computer 功能引入 Mac（3分钟阅读）

TLDR AI ↗ · 昨天

Perplexity 通过桌面应用向 Mac 用户发布了 Personal Computer 功能，使 AI 代理能够访问本地文件、应用程序、连接器以及网络。

0 人收藏 0 人点赞

Google DeepMind 与 EVE Online 合作进行 AI 模型测试（3 分钟阅读）

TLDR AI ↗ · 昨天缓存

Google DeepMind 已收购 EVE Online 开发者（现为 Fenris Creations）的少数股权，将该游戏用作 AI 模型的测试平台，在不影响真实玩家的情况下研究复杂动态系统中的智能。

0 人收藏 0 人点赞

TLDR 正在招聘一名高级软件工程师，应用人工智能方向（年薪25万-35万美元，完全远程）

TLDR AI ↗ · 昨天

TLDR 正在为其应用人工智能团队招聘一名高级软件工程师，提供25万至35万美元的年薪和完全远程的工作方式，专注于让流程对代码可读、可组合成工作流。

0 人收藏 0 人点赞

中国AI实验室内部笔记（18分钟阅读）

TLDR AI ↗ · 昨天缓存

作者回顾了对中国AI实验室的访问，比较了中国和美国实验室在构建LLM方面的文化差异。中国实验室受益于集体工作和学生参与的文化，而美国实验室则面临个人自我和职业抱负带来的挑战。

0 人收藏 0 人点赞

AI之长，AGI之短（3分钟阅读）

TLDR AI ↗ · 昨天缓存

本文认为，AI智能正变得像计算和存储一样商品化，最有价值的公司将不是模型构建者，而是那些拥有客户关系、专有数据和工作流程的公司。

0 人收藏 0 人点赞

使用 Prime-RL 后训练构建快速准确的智能体（22 分钟阅读）

TLDR AI ↗ · 昨天缓存

Ramp 介绍了一项案例研究，利用强化学习后训练构建了 Fast Ask，这是一种专门的电子表格检索智能体，与通用模型相比，它提高了准确性并降低了延迟。

0 人收藏 0 人点赞

Meta的优化版RecSys推理（58分钟阅读）

TLDR AI ↗ · 昨天缓存

Meta的内核内广播优化（IKBO）通过内核-模型-系统协同设计，消除了RecSys推理中的冗余用户嵌入广播，在H100 GPU上实现了高达2/3的延迟降低和约4倍加速，并成为Meta自适应排名模型的骨干。

0 人收藏 0 人点赞

强化学习数据的良好质量控制（18分钟阅读）

TLDR AI ↗ · 昨天缓存

本文讨论了强化学习数据质量控制的重要性，概述了当前数据供应商的不足之处以及前沿AI实验室用于评估RL数据的标准。

0 人收藏 0 人点赞

历经五小时暂停的六小时Codex运行（10分钟阅读）

TLDR AI ↗ · 昨天缓存

Codex CLI v0.128.0 引入了 /goal 功能，用于持久化目标，该功能可承受终端重启和多小时暂停，无需重新提示即可自动继续运行。作者讲述了一次持续六小时的会话，期间经历了五小时的笔记本合盖关机，展示了该功能的可靠性。

0 人收藏 0 人点赞

提升GitHub Agentic Workflows中的Token效率（12分钟阅读）

TLDR AI ↗ · 昨天缓存

GitHub通过API代理记录Token使用并建立每日优化工作流，减少了未使用的MCP工具注册带来的开销，从而提升了其代理工作流的Token效率。

0 人收藏 0 人点赞

Meta 准备推出 Hatch AI 智能体，设有候补名单并具备社交技能（2 分钟阅读）

TLDR AI ↗ · 昨天缓存

Meta 正准备推出其 Hatch AI 智能体，这是一个消费级自主智能体，集成了社交媒体功能，预计将通过候补名单的方式推出。该智能体将利用 Instagram 和 Facebook 处理图像/视频生成、购物、研究和定时任务。

0 人收藏 0 人点赞

llm-gemini 0.31

Simon Willison's Blog ↗ · 昨天缓存

llm-gemini 0.31 是插件的一个新版本，用于在 LLM 命令行工具中使用 Google 的 Gemini 模型。

0 人收藏 0 人点赞

Blog

提交意见反馈