reasoning-model

标签

Cards List
#reasoning-model

deepreinforce-ai/Ornith-1.0-35B-GGUF

Hugging Face Models Trending · 昨天 缓存

deepreinforce-ai 发布了 Ornith-1.0-35B-GGUF,这是一个最先进的开源编程智能体模型,它使用自我改进的强化学习来联合优化框架和解决方案生成,在编程基准测试上达到了SOTA性能。

0 人收藏 0 人点赞
#reasoning-model

@uzairansar: Qwythos-9B-Claude-Mythos-5 1M上下文微调版本发布!Empero刚刚发布了基于Claude Mythos的微调模型…

X AI KOLs Timeline · 4天前 缓存

Empero发布了Qwythos-9B-Claude-Mythos-5,这是一个基于Fable-5和Mythos-5会话日志的合成思维链数据,使用1M上下文微调的全参数推理模型。

0 人收藏 0 人点赞
#reasoning-model

empero-ai/Qwythos-9B-Claude-Mythos-5-1M

Hugging Face Models Trending · 6天前 缓存

Empero AI 发布了 Qwythos-9B,这是一个经过微调的推理模型,具有100万令牌的上下文和无审查能力,在基准测试中相比于其基础模型 Qwen3.5-9B 有显著提升。

0 人收藏 0 人点赞
#reasoning-model

@TheAhmadOsman: 600M 击败 397B 和 Sonnet 4.5,小型专用模型 FTW

X AI KOLs Following · 2026-06-19 缓存

据报道,使用 SYNTH 训练的 600M 参数推理模型在巴黎地铁的工业应用中超越了 397B 模型和 Sonnet 4.5,凸显了小型专用模型的有效性。

0 人收藏 0 人点赞
#reasoning-model

@TeksEdge:激动人心的消息!VibeThinkiner-3B来了!好的,localmaxxers准备好测试吧!!为什么?因为3B模型的推理宣称达到了SOTA级别…

X AI KOLs Following · 2026-06-17 缓存

微博AI发布了VibeThinker-3B,一个拥有30亿参数的开源推理模型,采用MIT许可证,在数学、编程和STEM推理基准测试上取得了有竞争力的结果。

0 人收藏 0 人点赞
#reasoning-model

@aijoey: WeiboAI 发布了 VibeThinker-3B,所以我必须在本地尝试一下。这是一个 3B 模型,不是大型前沿系统。在视频中…

X AI KOLs Timeline · 2026-06-16 缓存

WeiboAI 发布了 VibeThinker-3B,一个在本地测试编码任务的小型 3B 推理模型,在算法问题上取得了 3/3 的成绩。

0 人收藏 0 人点赞
#reasoning-model

@natliml: 我们正在发布Muse Spark Contemplating的准备情况报告,这是MSL的极限推理模型,正在对其c…进行基准测试

X AI KOLs Following · 2026-06-05 缓存

MSL发布了其极限推理模型Muse Spark Contemplating的准备情况报告,该报告对其在生物学和网络安全领域的能力进行了基准测试。

0 人收藏 0 人点赞
#reasoning-model

@OpenAI: 在 Spotify 上收听 OpenAI 播客 — https://open.spotify.com/episode/3ca5s3o53D5xcEKmKgLLGj?si=4a9a555641fa4293… A…

X AI KOLs · 2026-06-04

OpenAI 分享了其播客节目的链接,该节目讲述了一个推理模型如何解决了一个80年未解的难题。可在 Spotify、Apple Podcasts 和 YouTube 上收听。

0 人收藏 0 人点赞
#reasoning-model

@raydistributed: 祝贺微软 AI 团队推出 MAI-Thinking-1!很高兴看到 Ray 在前沿模式的多个部分中被使用…

X AI KOLs Following · 2026-06-04 缓存

微软 AI 发布了 MAI-Thinking-1,一个拥有 350 亿活跃参数/1 万亿总参数的 MoE 推理模型,在 STEM 和编码任务上具有竞争力,使用 Ray 进行分布式训练和编排。

0 人收藏 0 人点赞
#reasoning-model

Microsoft Aion 1.0 Instruct 和 Aion 1.0 Plan 模型!

Reddit r/LocalLLaMA · 2026-06-03

微软在 Build 2026 上宣布了两款新的设备端 AI 模型:Aion 1.0 Instruct(一款开放权重的小型语言模型)和 Aion 1.0 Plan(一款 140 亿参数的推理与工具调用模型,适用于本地智能体工作流)。

0 人收藏 0 人点赞
#reasoning-model

MAI-Thinking-1

Hacker News Top · 2026-06-02 缓存

微软AI推出MAI-Thinking-1,这是一个350亿活跃参数的推理模型,从头训练,无需蒸馏,在软件工程和数学基准测试中表现强劲,同时强调干净数据和自给自足。

0 人收藏 0 人点赞
#reasoning-model

在智能体栈中,你首先会在哪里添加重推理:状态损坏、工具合约不匹配,还是最后的外部动作?

Reddit r/AI_Agents · 2026-06-01

本文讨论了在智能体工作流中使用 Ring-2.6-1T 添加重推理的位置,以防范状态损坏、工具合约不匹配或最终外部动作等故障点。

0 人收藏 0 人点赞
#reasoning-model

NVIDIA 刚刚发布了用于自动驾驶出租车的 32B 开源推理模型

Reddit r/artificial · 2026-06-01

NVIDIA 宣布推出 Alpamayo 2 Super,这是一款面向 L4 级自动驾驶出租车的 32B 开源推理模型,具备 360 度感知、元动作等功能,并提供包括 AlpaGym 仿真和 OmniDreams 场景生成在内的全套技术栈。

0 人收藏 0 人点赞
#reasoning-model

微软将在Build大会上发布新的AI模型和Windows改进

The Verge · 2026-06-01 缓存

微软计划在Build大会上发布新的AI模型,包括其首个推理模型MAI-Thinking-1,以及Windows 11开发者体验改进和Copilot更新。

0 人收藏 0 人点赞
#reasoning-model

对于AI智能体,较重的推理预算应该优先用在何处:行动之前、状态变化之后,还是最终解释之前?

Reddit r/artificial · 2026-06-01

关于AI智能体中推理预算分配位置的讨论,引用了拥有高/极高推理努力模式的万亿参数模型Ring-2.6-1T。

0 人收藏 0 人点赞
#reasoning-model

Mellum 2 12B A2.5B

Reddit r/LocalLLaMA · 2026-06-01

JetBrains发布了Mellum 2 12B A2.5B,这是一个专注于编码的小型MoE模型,其推理性能与Qwen 3.5 9B相当,但在其他任务上较弱。

0 人收藏 0 人点赞
#reasoning-model

在智能体栈中,您会将哪一类失败优先路由到 Ring:工具选择错误、重新规划错误还是最终答案验证?

Reddit r/AI_Agents · 2026-05-31

关于将失败类别(工具选择错误、重新规划错误、最终答案验证)路由到 Ring-2.6-1T 的讨论,Ring-2.6-1T 是一个用于智能体工作流的万亿参数推理模型,具有高推理努力模式。

0 人收藏 0 人点赞
#reasoning-model

Liquid AI 发布基于 38T 训练的 8B-A1B MoE 模型

Hacker News Top · 2026-05-29 缓存

Liquid AI 发布了 LFM2.5-8B-A1B,这是一款边缘 MoE 模型,基于 38T tokens 训练,拥有 128K 上下文窗口,改进了工具调用和推理能力,可在 Hugging Face 上获取。

0 人收藏 0 人点赞
#reasoning-model

你更愿意调整一个模型的推理深度,还是在两个模型之间切换?

Reddit r/AI_Agents · 2026-05-24

这是对使用单个可调深度的万亿参数推理模型(如 Ring-2.6-1T)与在多个专用模型之间切换这两种方案的权衡思考,探讨哪种方法对代理工作流更简洁或更具成本效益。

0 人收藏 0 人点赞
#reasoning-model

OpenAI声称AI取得突破,称其模型解决了80年历史的数学难题

Reddit r/artificial · 2026-05-21 缓存

OpenAI声称其未发布的推理模型解决了数学中具有80年历史的平面单位距离问题,并产生了一个优于传统基于网格排列的原始证明。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈