模型

Ring 2.6 1T

Reddit r/LocalLLaMA ↗ · 昨天

Ring 2.6 1T，一个拥有开放权重的1万亿参数模型，已在Open Router上免费提供，预计将全面公开发布。

0 人收藏 0 人点赞

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

X AI KOLs Timeline ↗ · 昨天

Yann LeCun的团队发布了LeWorldModel，一个仅有1500万参数的物理模型，在单张GPU上训练数小时，在规划速度和物理合理性上超越了价值数十亿美元的基础模型，挑战了主流的规模扩展范式。

0 人收藏 0 人点赞

HiDream-ai 已开源 HiDream-O1-Image（8B），这是一款基于像素级统一 Transformer（UiT）构建的统一图像生成基础模型，原生支持文本生成图像、图像编辑以及主体驱动的个性化生成，分辨率最高可达 2048×2048，无需外部 VAE 或独立文本编码器。该模型在 Artificial Analysis 文生图竞技场中首次亮相即位列第 8，是目前领先的开放权重文生图模型之一。

0 人收藏 0 人点赞

OpenAI的新语音模型不止于回话

Reddit r/ArtificialInteligence ↗ · 昨天缓存

OpenAI推出了三个新的实时音频模型，支持连续、多任务的语音交互，优先考虑长上下文推理、实时翻译和无缝工具使用。

0 人收藏 0 人点赞

@paulabartabajo_：给AI工程师的建议如果你正在构建语音智能体，别再连接3个独立模型了，用于音频转文本、文本转音频，或文本转文本……

X AI KOLs Timeline ↗ · 昨天缓存

宣布推出 liquid-audio，这是 Liquid AI 端到端语音转语音 LFM 模型（LFM2-Audio-1.5B 和 LFM2.5-Audio-1.5B）的开源仓库，支持交错和顺序生成模式以及微调功能。

0 人收藏 0 人点赞

MemReranker：面向智能体记忆检索的推理感知重排序

arXiv cs.CL ↗ · 昨天缓存

MemReranker 是一个针对智能体记忆检索设计的推理感知重排序模型家族（0.6B/4B），通过结合 LLM 知识蒸馏技术解决语义相似性匹配的局限性，从而提升模型的时间与因果推理能力。

0 人收藏 0 人点赞

@FinanceYF5: 1/ 语音 Agent 升级了 OpenAI 推出 GPT-Realtime-2，把 GPT-5 级推理带进实时语音 API。语音助手不再只是“听懂并回答”，而是能边听边想、边聊边解决问题。

X AI KOLs Following ↗ · 昨天缓存

OpenAI 推出了 GPT-Realtime-2，将 GPT-5 级别的推理能力集成到实时语音 API 中，使语音助手能够在对话过程中进行实时思考和解决问题。

0 人收藏 0 人点赞

@gdb: GPT-5.5-Cyber 现已面向防御者提供有限预览，用于保护关键基础设施。这是一个非常强大的模型。

X AI KOLs Following ↗ · 昨天缓存

GPT-5.5-Cyber 现已面向防御者提供有限预览，提供用于保护关键基础设施的强大模型。

0 人收藏 0 人点赞

@seclink: OpenAI 发布了 GPT-Realtime-2，这是其迄今为止最智能的语音模型。该模型具备 GPT-5 级别的推理能力、128,000 个 token 的上下文窗口，并支持调节“投入程度”以实现更自然的对话体验。它可与 GPT-R…

X AI KOLs Following ↗ · 昨天

OpenAI发布了GPT-Realtime-2语音模型，具备GPT-5级别的推理能力和128,000 token上下文窗口，支持实时翻译70多种语言到13种输出语言，在Big Bench Audio Intelligence评测中达到96.6%准确率，Greg Brockman称其为语音翻译领域的里程碑。

0 人收藏 0 人点赞