模型

@tom_doerr: 完全开源 30B 规模搜索智能体的训练数据 https://github.com/PolarSeeker/OpenSeeker…

X AI KOLs Timeline ↗ · 6小时前缓存

OpenSeeker 完全开源了基于 ReAct 框架的 30B 规模搜索智能体的训练数据与模型，在多个基准测试（包括 BrowseComp 和 Humanity's Last Exam）上达到了最先进的性能。这是首个在前沿搜索基准上达到顶尖水平并同时公开完整训练数据的纯学术项目。

0 人收藏 0 人点赞

@garrytan: 正在下载…在 128GB MacBook Pro 上本地运行，拥有 100 万 token 上下文窗口和据称可用的编程智能体能力，真是

X AI KOLs Following ↗ · 6小时前缓存

Garry Tan 对一款可在 128GB MacBook Pro 上本地运行的模型感到兴奋，该模型拥有 100 万 token 的上下文窗口和编程智能体能力，他认为这是一个重要里程碑。

0 人收藏 0 人点赞

@davis7：@0xSero 帮我把本地模型配置好了，我没想到它们现在竟然这么强大了。这算是前沿（frontier）级别了吗……

X AI KOLs Following ↗ · 10小时前

作者强调了在 RTX 5090 上本地运行开源 Qwen 3.6-27B 模型的卓越能力，指出其在编程任务上的强劲表现，并与商业模型进行了对比，尽管本地部署过程颇具挑战性。

0 人收藏 0 人点赞

@cyrilXBT：中国刚刚打造了一款AI模型，以极低成本与OpenAI和Anthropic正面竞争。而且有人刚刚发布了一门免费课程……

X AI KOLs Timeline ↗ · 10小时前

DeepSeek是一款由中国量化对冲基金开发的AI模型，据报道其训练成本仅为GPT-4的约5%，却能达到相当的性能水平，引发了市场剧烈震荡，导致NVIDIA单日市值蒸发6000亿美元。目前已有人发布了一门时长1小时50分钟的免费课程，教用户如何在本地及通过API使用DeepSeek V4。

0 人收藏 0 人点赞

有人用 Google 的 Lyria 3 Pro 试过生成歌曲吗？仅消耗了 8 美分的 API 额度，这也是我的首份生成作品……

Reddit r/singularity ↗ · 11小时前缓存

一位社区成员分享了通过 API 调用 Google 的 Lyria 3 Pro 生成曲目的实操体验，指出成本极低且初版输出质量出色。

0 人收藏 0 人点赞

喜欢 Gemma4 模型的朋友们——你们都是怎么用的？

Reddit r/LocalLLaMA ↗ · 11小时前

一位开发者分享了在本地运行 Gemma4 和 Qwen 进行编程任务的复杂体验，指出了工具集成、循环处理和任务完成方面存在的问题，并向社区寻求更优化的使用策略。

0 人收藏 0 人点赞

Qwen3.6 35B A3B 无审查异端版原生MTP完整保留发布 KLD 0.0015, 10/100拒绝率完整19个MTP保留支持Safetensors、GGUF、NVFP4、NVFP4 GGUF和GPTQ-Int4格式

Reddit r/LocalLLaMA ↗ · 12小时前

社区发布的Qwen3.6 35B A3B无审查变体版本，完整保留19个MTP张量，支持多种格式包括Safetensors、GGUF、NVFP4和GPTQ-Int4。

0 人收藏 0 人点赞

@libapi_: 今天 Hermes Agent 登上全球榜单第一这不仅仅是一份排名，它代表着开源社区、开发者、贡献者和每一个真实用户共同推动出来的结果同时也很开心看到 @OpenRouter 上越来越多 AI Agent 项目被更多人看见。 CLI、…

X AI KOLs Timeline ↗ · 12小时前

Hermes Agent 登顶全球榜首，彰显开源社区与开发者的共同推动力，同时反映出 AI Agent 生态在 OpenRouter 等平台上正步入高速发展阶段。

0 人收藏 0 人点赞

@Teknium：我们在 OpenRouter 所有 AI 应用中成功登顶全球第一。由衷感谢近 1000 位贡献者们……

X AI KOLs Following ↗ · 12小时前缓存

Hermes Agent 模型凭借近 1000 名开发者的贡献，在 OpenRouter 全平台 AI 应用中荣登全球榜首。创作者感谢社区支持，并邀请大家为后续改进提供建议。

0 人收藏 0 人点赞

@NousResearch: Hermes Agent 现已位居全球 @OpenRouter 代币排行榜第一。虽然我们的旅程才刚刚开始，但我们想借此机会感谢所有贡献者、支持者和用户一路上的付出。

X AI KOLs Following ↗ · 13小时前缓存

NousResearch 的 Hermes Agent 已攀升至 OpenRouter 全球代币排行榜首位，这对于这款 AI Agent 来说是一个重要的里程碑。

0 人收藏 0 人点赞

@reach_vb: 在过去约15天内，我们发布了：- GPT Image 2 - 隐私过滤器 - GPT 5.5 - GPT 5.5 Pro - GPT 5.5 Instant - GPT Realtime

X AI KOLs Following ↗ · 14小时前缓存

OpenAI在大约15天内发布了多个GPT模型和功能，包括GPT Image 2、多个GPT 5.5变体（Pro、Instant、Cyber）、GPT Realtime 2以及相关工具。

0 人收藏 0 人点赞

AI2推出的新MoE模型：EMO

Reddit r/LocalLLaMA ↗ · 16小时前

AI2发布了EMO，一个混合专家（MoE）语言模型，总参数量14B，其中1B活跃参数，基于1万亿tokens训练，并采用文档级路由，即专家会按领域（如健康、新闻等）进行聚类。

0 人收藏 1 人点赞

@no_stp_on_snek：mrcr v2 在 1m 长度下完成 8-needle 测试，采用开源权重堆栈，仅单台租赁 mi300x。longctx directional 0.688（n=30，mass-val 重跑待更新…

X AI KOLs Following ↗ · 17小时前缓存

分享了一套开源模型堆栈在单卡 AMD MI300X 上运行的早期基准测试成绩与评估指标，表明其性能已具备与闭源方案竞争的实力。

0 人收藏 0 人点赞

CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、本地可运行的模型

Hugging Face Blog ↗ · 19小时前缓存

CyberSecQwen-4B 是一个小型、专用的 4B 参数模型，针对防御性网络安全任务进行了微调，设计为在单个 GPU 上本地运行，解决了隐私、成本和离线部署需求。

1 人收藏 1 人点赞

EMO：通过预训练混合专家实现涌现模块化

Hugging Face Blog ↗ · 21小时前缓存

Allen AI 发布了 EMO 模型，这是一种混合专家模型，其中模块化结构从数据中自然涌现，使得仅使用 12.5% 的专家就能完成一项任务，同时保持接近完整模型的性能。

0 人收藏 0 人点赞

Ring 2.6 1T

Reddit r/LocalLLaMA ↗ · 21小时前

Ring 2.6 1T，一个拥有开放权重的1万亿参数模型，已在Open Router上免费提供，预计将全面公开发布。

0 人收藏 0 人点赞

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

X AI KOLs Timeline ↗ · 昨天

Yann LeCun的团队发布了LeWorldModel，一个仅有1500万参数的物理模型，在单张GPU上训练数小时，在规划速度和物理合理性上超越了价值数十亿美元的基础模型，挑战了主流的规模扩展范式。

0 人收藏 0 人点赞

HiDream-ai 已开源 HiDream-O1-Image（8B），这是一款基于像素级统一 Transformer（UiT）构建的统一图像生成基础模型，原生支持文本生成图像、图像编辑以及主体驱动的个性化生成，分辨率最高可达 2048×2048，无需外部 VAE 或独立文本编码器。该模型在 Artificial Analysis 文生图竞技场中首次亮相即位列第 8，是目前领先的开放权重文生图模型之一。

0 人收藏 0 人点赞

OpenAI的新语音模型不止于回话

Reddit r/ArtificialInteligence ↗ · 昨天缓存

OpenAI推出了三个新的实时音频模型，支持连续、多任务的语音交互，优先考虑长上下文推理、实时翻译和无缝工具使用。

0 人收藏 0 人点赞

@paulabartabajo_：给AI工程师的建议如果你正在构建语音智能体，别再连接3个独立模型了，用于音频转文本、文本转音频，或文本转文本……

X AI KOLs Timeline ↗ · 昨天缓存

宣布推出 liquid-audio，这是 Liquid AI 端到端语音转语音 LFM 模型（LFM2-Audio-1.5B 和 LFM2.5-Audio-1.5B）的开源仓库，支持交错和顺序生成模式以及微调功能。

0 人收藏 0 人点赞

模型

@tom_doerr: 完全开源 30B 规模搜索智能体的训练数据 https://github.com/PolarSeeker/OpenSeeker…

@garrytan: 正在下载…在 128GB MacBook Pro 上本地运行，拥有 100 万 token 上下文窗口和据称可用的编程智能体能力，真是

@davis7：@0xSero 帮我把本地模型配置好了，我没想到它们现在竟然这么强大了。这算是前沿（frontier）级别了吗……

@cyrilXBT：中国刚刚打造了一款AI模型，以极低成本与OpenAI和Anthropic正面竞争。而且有人刚刚发布了一门免费课程……

有人用 Google 的 Lyria 3 Pro 试过生成歌曲吗？仅消耗了 8 美分的 API 额度，这也是我的首份生成作品……

喜欢 Gemma4 模型的朋友们——你们都是怎么用的？

Qwen3.6 35B A3B 无审查异端版原生MTP完整保留发布 KLD 0.0015, 10/100拒绝率完整19个MTP保留支持Safetensors、GGUF、NVFP4、NVFP4 GGUF和GPTQ-Int4格式

@libapi_: 今天 Hermes Agent 登上全球榜单第一这不仅仅是一份排名，它代表着开源社区、开发者、贡献者和每一个真实用户共同推动出来的结果同时也很开心看到 @OpenRouter 上越来越多 AI Agent 项目被更多人看见。 CLI、…

@Teknium：我们在 OpenRouter 所有 AI 应用中成功登顶全球第一。由衷感谢近 1000 位贡献者们……

@NousResearch: Hermes Agent 现已位居全球 @OpenRouter 代币排行榜第一。虽然我们的旅程才刚刚开始，但我们想借此机会感谢所有贡献者、支持者和用户一路上的付出。

@reach_vb: 在过去约15天内，我们发布了：- GPT Image 2 - 隐私过滤器 - GPT 5.5 - GPT 5.5 Pro - GPT 5.5 Instant - GPT Realtime

AI2推出的新MoE模型：EMO

@no_stp_on_snek：mrcr v2 在 1m 长度下完成 8-needle 测试，采用开源权重堆栈，仅单台租赁 mi300x。longctx directional 0.688（n=30，mass-val 重跑待更新…

CyberSecQwen-4B：为什么防御性网络安全需要小型、专用、本地可运行的模型

EMO：通过预训练混合专家实现涌现模块化

Ring 2.6 1T

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

HiDream-ai/HiDream-O1-Image

OpenAI的新语音模型不止于回话

@paulabartabajo_：给AI工程师的建议如果你正在构建语音智能体，别再连接3个独立模型了，用于音频转文本、文本转音频，或文本转文本……

提交意见反馈