标签
GLM 5.2 已发布,采用 MIT 许可协议在 HuggingFace 上开放权重,可通过 API 和 Ollama 获取,其基准测试结果具有竞争力,仅落后 Opus 4.8 一个点,领先 GPT-5.5 一个点。
Inflect-Nano-v1 是一个极小的英文文本转语音模型,总推理参数(包括其声码器)为 4.63M,专为本地高效的语音合成实验而设计。
介绍了Glimmer,一个10,000参数的语言模型,在FineWeb-Edu的50万个token上训练,采用标准Llama架构,可在HuggingFace上获取。
一项健康追踪服务,可读取寿命、心率、睡眠和恢复等信号并与用户基线对比,现已向所有人开放。推理步骤可在 Hugging Face 上审计,并通过 OpenMed_AI 的 PII 模型保护隐私。
Boogu-Image-0.1 是一个基于 Apache-2.0 开源协议的统一图像生成与编辑模型家族,包含文本到图像、快速生成、编辑以及中英文文本渲染等变体,作为研究项目发布于 Hugging Face。
作者分享了对内核融合的兴奋之情,并演示了使用HuggingFace的kernels项目对GeGLU FFN融合的Liger内核进行性能分析,指出这个分析结果非常漂亮。
一个名为OpenMythos的开源LLM通过SFT和RLVR进行训练,专攻网络安全任务,相关数据集已在HuggingFace上提供。该模型旨在减少幻觉并提高安全相关查询的精确度。
Hugging Face 的 Joel Niklaus 将进行直播,探讨合成数据在推动预训练中的作用;团队还发布了一份关于该主题的实践指南。
这篇帖子演示了如何通过单个提示词免费微调模型,利用了新的Google Colab CLI以及Hugging Face的TRL和trackio工具,所有这些都由AI代理编排。
一位用户警告说,请从Hugging Face下载尽可能多的开放模型,暗示开放模型可能是下一个被针对的目标。
讨论的是 MiniMax M3 在 GGUF 格式中尚未支持稀疏注意力,因此推理回退到密集注意力,可能每一步都使用全部 428B 权重,导致显著减速。
谷歌的Gemma 4 12B模型于上周发布,在HuggingFace上已超过400万次下载,使其成为最受欢迎的无编码器视觉语言模型(VLM),也是首个支持无编码器音频输入的通用大语言模型。该模型在大小和性能之间取得平衡,可在本地笔记本电脑上运行,支持多步推理和智能体工作流。
Unsloth 正在将 MiniMax M3 模型的 GGUF 量化版本上传到 Hugging Face。
Supra Labs 发布了 Supra Title,这是一个参数为 350M 的专用模型,用于生成聊天对话标题。该模型基于 LFM2.5 构建,以 GGUF 格式运行在任何硬件上,且无需系统提示。
oMLX是一款用于本地AI的MLX服务器,现在支持标准的Hugging Face缓存模型目录,简化了模型加载过程。
一个新的 CLI 工具,用于导航和可视化 Hugging Face 仓库,让用户能够直接从终端探索存储、发现异常值并管理仓库。
发布基于 Qwen3.5 的微调版本:Nex-N2 Pro 397B 和 Nex-N2 Mini 35B,基准测试表现强劲。
Hugging Face的Open R1项目为DeepSeek-R1提供了完全开放的复现流程,包括蒸馏数据集、训练脚本和评估工具,旨在让任何人都能基于R1的推理能力进行复现和进一步开发。
Cohere Transcribe 是一款开源语音识别模型,在 Hugging Face 新的远场ASR基准测试中荣获第一名。
MooreThreads 发布了 MusaCoder-27B,一个拥有 270 亿参数的代码生成模型,并随附 arXiv 论文。