模型

Cards List

Ring 2.6 1T

Reddit r/LocalLLaMA · 昨天

Ring 2.6 1T,一个拥有开放权重的1万亿参数模型,已在Open Router上免费提供,预计将全面公开发布。

0 人收藏 0 人点赞

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

X AI KOLs Timeline · 昨天

Yann LeCun的团队发布了LeWorldModel,一个仅有1500万参数的物理模型,在单张GPU上训练数小时,在规划速度和物理合理性上超越了价值数十亿美元的基础模型,挑战了主流的规模扩展范式。

0 人收藏 0 人点赞

HiDream-ai/HiDream-O1-Image

Hugging Face Models Trending · 昨天 缓存

HiDream-ai 已开源 HiDream-O1-Image(8B),这是一款基于像素级统一 Transformer(UiT)构建的统一图像生成基础模型,原生支持文本生成图像、图像编辑以及主体驱动的个性化生成,分辨率最高可达 2048×2048,无需外部 VAE 或独立文本编码器。该模型在 Artificial Analysis 文生图竞技场中首次亮相即位列第 8,是目前领先的开放权重文生图模型之一。

0 人收藏 0 人点赞

OpenAI的新语音模型不止于回话

Reddit r/ArtificialInteligence · 昨天 缓存

OpenAI推出了三个新的实时音频模型,支持连续、多任务的语音交互,优先考虑长上下文推理、实时翻译和无缝工具使用。

0 人收藏 0 人点赞

@paulabartabajo_:给AI工程师的建议 如果你正在构建语音智能体,别再连接3个独立模型了,用于音频转文本、文本转音频,或文本转文本……

X AI KOLs Timeline · 昨天 缓存

宣布推出 liquid-audio,这是 Liquid AI 端到端语音转语音 LFM 模型(LFM2-Audio-1.5B 和 LFM2.5-Audio-1.5B)的开源仓库,支持交错和顺序生成模式以及微调功能。

0 人收藏 0 人点赞

MemReranker:面向智能体记忆检索的推理感知重排序

arXiv cs.CL · 昨天 缓存

MemReranker 是一个针对智能体记忆检索设计的推理感知重排序模型家族(0.6B/4B),通过结合 LLM 知识蒸馏技术解决语义相似性匹配的局限性,从而提升模型的时间与因果推理能力。

0 人收藏 0 人点赞

@FinanceYF5: 1/ 语音 Agent 升级了 OpenAI 推出 GPT-Realtime-2,把 GPT-5 级推理带进实时语音 API。 语音助手不再只是“听懂并回答”,而是能边听边想、边聊边解决问题。

X AI KOLs Following · 昨天 缓存

OpenAI 推出了 GPT-Realtime-2,将 GPT-5 级别的推理能力集成到实时语音 API 中,使语音助手能够在对话过程中进行实时思考和解决问题。

0 人收藏 0 人点赞

@gdb: GPT-5.5-Cyber 现已面向防御者提供有限预览,用于保护关键基础设施。这是一个非常强大的模型。

X AI KOLs Following · 昨天 缓存

GPT-5.5-Cyber 现已面向防御者提供有限预览,提供用于保护关键基础设施的强大模型。

0 人收藏 0 人点赞

@seclink: OpenAI 发布了 GPT-Realtime-2,这是其迄今为止最智能的语音模型。 该模型具备 GPT-5 级别的推理能力、128,000 个 token 的上下文窗口,并支持调节“投入程度”以实现更自然的对话体验。 它可与 GPT-R…

X AI KOLs Following · 昨天

OpenAI发布了GPT-Realtime-2语音模型,具备GPT-5级别的推理能力和128,000 token上下文窗口,支持实时翻译70多种语言到13种输出语言,在Big Bench Audio Intelligence评测中达到96.6%准确率,Greg Brockman称其为语音翻译领域的里程碑。

0 人收藏 0 人点赞

@billtheinvestor: 上海交通大学开源 F5-TTS 语音生成模型。该模型基于 10 万小时数据训练,支持中英多语言合成。技术特性包含 Zero-shot 声音克隆、基于总时长的速度控制、情感表现控制及长文本合成。支持商用。

X AI KOLs Timeline · 昨天 缓存

上海交通大学开源了 F5-TTS 语音生成模型,该模型基于 10 万小时数据训练,支持中英多语言合成及 Zero-shot 声音克隆,并允许商用。

1 人收藏 1 人点赞

Qwen3.6-35B-A3B-Abliterated-Heretic-MLX-4bit

Reddit r/LocalLLaMA · 昨天

用户评价了通过MLX为Apple Silicon优化的Qwen3.6-35B模型的量化微调版本,称赞其速度快、智能化程度高且没有安全免责声明。

0 人收藏 0 人点赞

@FinanceYF5: 智能体现在可以"做梦"了——Dreaming 功能回顾历史会话、提炼规律、持续自我优化。 配合多智能体并行编排和 Outcomes 质量评估,Claude 智能体正式进入自我进化阶段。

X AI KOLs Following · 昨天 缓存

Claude智能体新增"Dreaming"功能,通过回顾历史会话与提炼规律实现自我优化,配合多智能体并行编排与质量评估,标志着AI智能体进入自我进化阶段。

0 人收藏 0 人点赞

JANGQ-AI/MiniMax-M2.7-JANGTQ_K : MiniMax M2.7 的混合位量化版本 - 磁盘占用 74 GB

Reddit r/LocalLLaMA · 昨天 缓存

发布了 MiniMax M2.7 模型的混合位量化版本,优化至 74 GB,以便在 Apple Silicon 设备上高效进行本地推理。

0 人收藏 0 人点赞

ZAYA1-74B-Preview:在AMD上扩展预训练

Reddit r/LocalLLaMA · 昨天 缓存

Zyphra发布ZAYA1-74B-Preview,一个在AMD硬件上训练的740亿参数基础模型,强调了强大的预强化学习推理能力和智能体性能信号。

0 人收藏 0 人点赞

@kwindla:OpenAI 今天发布了一款新的语音到语音模型:gpt-realtime-2 这是首个足够好的语音到语音模型……

X AI KOLs Following · 昨天

OpenAI 发布了 gpt-realtime-2,一款新的语音到语音模型,针对实时语音代理交互和低延迟工具调用进行了优化。

0 人收藏 0 人点赞

@eglyman:我们训练了一个0.35B参数的模型,在电子表格导航方面比opus 4.6更优秀。普通企业信用卡公司的常规操作。

X AI KOLs Following · 昨天 缓存

一位开发者训练了一个350M参数的模型,其处理电子表格的能力优于Anthropic的Opus 4.6。

0 人收藏 0 人点赞

@juberti: gpt-realtime-2 在 Big Bench Audio 基准测试上相较于 1.5 版本提升了 15 个百分点(pp),目前已接近性能饱和。

X AI KOLs Following · 昨天

GPT-Realtime-2 在 Big Bench Audio 基准测试中较 1.5 版本提升了 15 个百分点,性能已接近饱和水平。

0 人收藏 0 人点赞

单张4090上11.67% ARC-AGI-2本地评估:TOPAS递归架构

Reddit r/LocalLLaMA · 2天前

作者介绍了TOPAS,一种递归AI架构,在单张RTX 4090上达到了ARC-AGI-2的11.67%,旨在证明架构效率可以超越原始计算能力。

0 人收藏 0 人点赞

@googlegemma: Gemma 4 在手机上速度提升 3 倍!看看推测解码带来的不同!Multi-Token Predi…

X AI KOLs Timeline · 2天前 缓存

Google 的 Gemma 4 通过推测解码和多 Token 预测,推理速度提升高达 3 倍,可实现高效的设备端部署。

0 人收藏 0 人点赞

@satyanadella: 很高兴今天将 GPT 5.5 Instant 引入 M365 Copilot。凭借更快、更清晰且更准确的响应,你可以获…

X AI KOLs Following · 2天前 缓存

Satya Nadella 宣布将 GPT-5.5 Instant 集成到 M365 Copilot、Copilot Studio 和 Foundry 中,强调其响应速度更快且更准确。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈