标签
介绍了 NagaTranslate,一个使用 Whisper、VITS 和 LLMs 针对低资源的那加兰克里奥尔语的翻译和语音合成流水线。
MiaAI Lab 测试了 Qwopus 3.6-27b Coder,发现在工具调用和代码生成方面表现不如 Qwen 3.6 27b 和 35b,且 HTML 演示出现故障。
该基准测试将未量化的 Gemma 2 9B 模型与 FP8 量化变体在 NVIDIA L4 GPU 上进行比较,揭示了 FP8 量化引入了预填充代价(更高的 TTFT),但改善了解码延迟和显存使用,且在狭窄任务中语义漂移极小。
中国发布了一个名为Ornith的开源编程AI大模型,35B版本击败了Qwen3.6,397B版本基准测试接近Claude Opus 3.7。
论文提出了一种名为 RiVER 的强化学习方法,该方法通过对程序在隐藏测试用例上进行排序并提供分级反馈,提升了大语言模型在没有已知标准答案的问题上的编码表现。
一条推文评论称,LLM是有史以来增长最快的消费产品,但多人体验仅限于共享聊天记录,暗示改善这一点可以释放更多使用量。
文章介绍了Andrej Karpathy提出的个人知识管理新方法——用LLM自动编译原始笔记为结构化Wiki,替代传统RAG,实现知识的复利增长。
Chunkr 是一个开源文档智能服务,将 PDF、PPT、Word 文档和图像转换为结构化块,用于 RAG 和 LLM 流水线。它具有 OCR 布局分析、结构化 HTML/Markdown 输出、视觉语言模型处理,以及通过 Docker Compose 自托管部署,可配置 LLM 提供商。
一篇博客文章报告称,在超过2000人进行的6000次尝试后,没有人成功通过提示注入从AI助手(由Opus 4.6驱动)中泄露秘密,突显了模型抵抗力的提升,但提醒不要过度自信。
MIT CSAIL研究人员开发了掩码逆强化学习(Masked IRL),利用大型语言模型澄清机器人的模糊指令并聚焦环境关键细节,从而减少对大量演示数据的需求。
推荐斯坦福公开课程CS336: Language Modeling from Scratch,该课程从零开始系统讲解语言模型的训练全流程,适合准备AI面试或想深入学习LLM的人。
一位高级工程师描述了到2026年LLM代理如何演变成编码、调试和代码库研究的可靠协作者,而人类仍负责判断和审查。
一个用Go编写的开源2.5D图表引擎,它将拓扑与几何分离,使LLM能够生成清晰的架构图,而不会出现空间幻觉。
SharQ提出了一种无需训练的方法,将激活稀疏性与FP4量化相结合用于大语言模型推理,采用稀疏-密集分解和统一的FP4权重负载。与仅使用FP4的基线相比,它显著降低了延迟并恢复了精度。