llm

#llm

NagaTranslate: 为低资源的那加兰克里奥尔语构建翻译与语音流水线 (Whisper, VITS, LLMs) [P]

Reddit r/MachineLearning ↗ · 51分钟前

介绍了 NagaTranslate，一个使用 Whisper、VITS 和 LLMs 针对低资源的那加兰克里奥尔语的翻译和语音合成流水线。

0 人收藏 0 人点赞

#llm

我制作了一个工具，让编程代理能够看到你的浏览器！

Reddit r/AI_Agents ↗ · 5小时前

一个Chrome扩展，让编程代理（LLM）能够查看浏览器，无需无头浏览器即可迭代设计。

0 人收藏 0 人点赞

#llm

@MiaAI_lab: Qwopus 3.6-27b Coder 我收到很多请求让我测试它，于是我进行了测试。我运行了与其他模型相同的测试。它…

X AI KOLs Timeline ↗ · 6小时前缓存

MiaAI Lab 测试了 Qwopus 3.6-27b Coder，发现在工具调用和代码生成方面表现不如 Qwen 3.6 27b 和 35b，且 HTML 演示出现故障。

0 人收藏 0 人点赞

#llm

自托管 Gemma 2 9B 与前沿 API 基准测试：NVIDIA L4 上的 FP8 量化预填充代价与显存现实 [P]

Reddit r/MachineLearning ↗ · 6小时前

该基准测试将未量化的 Gemma 2 9B 模型与 FP8 量化变体在 NVIDIA L4 GPU 上进行比较，揭示了 FP8 量化引入了预填充代价（更高的 TTFT），但改善了解码延迟和显存使用，且在狭窄任务中语义漂移极小。

0 人收藏 0 人点赞

#llm

AGI会以LLM的形式出现吗？

Reddit r/singularity ↗ · 10小时前

关于AGI是否会从LLMs或像量子计算这样的替代技术中出现的推测性讨论。

0 人收藏 0 人点赞

#llm

无审查的AI

Reddit r/AI_Agents ↗ · 10小时前

一个无审查的AI模型，移除内容限制，允许无限制生成。

0 人收藏 0 人点赞

#llm

@edandersen: 中国又发布了一个开源编程AI大模型“Ornith”。35B版本可在大型GPU上本地运行，在我使用场景中击败了Qwen3.6……

X AI KOLs Timeline ↗ · 14小时前缓存

中国发布了一个名为Ornith的开源编程AI大模型，35B版本击败了Qwen3.6，397B版本基准测试接近Claude Opus 3.7。

0 人收藏 0 人点赞

#llm

@rohanpaul_ai: 大语言模型可以从没有已知答案的问题中学习更好的编码行为。许多实际问题并没有现成的标准答案...

X AI KOLs Following ↗ · 17小时前缓存

论文提出了一种名为 RiVER 的强化学习方法，该方法通过对程序在隐藏测试用例上进行排序并提供分级反馈，提升了大语言模型在没有已知标准答案的问题上的编码表现。

0 人收藏 0 人点赞

#llm

@omooretweets: 令我震惊的是，LLM是有史以来增长最快的消费产品……而“多人”体验……

X AI KOLs Following ↗ · 20小时前缓存

一条推文评论称，LLM是有史以来增长最快的消费产品，但多人体验仅限于共享聊天记录，暗示改善这一点可以释放更多使用量。

0 人收藏 0 人点赞

#llm

@Phoenixyin13: Karpathy 掀翻 RAG！聊聊两个月前的终结个人知识库腐烂的终极战略这是让 AI 替你打理个人维基百科的实战宣言。 2026 年 4 月初，AI 领域顶流大牛、前 Tesla AI 总监、OpenAI 联合创始人 Andrej K…

X AI KOLs Timeline ↗ · 21小时前缓存

文章介绍了Andrej Karpathy提出的个人知识管理新方法——用LLM自动编译原始笔记为结构化Wiki，替代传统RAG，实现知识的复利增长。

0 人收藏 0 人点赞

#llm

@GithubProjects：Chunkr 是一个开源文档智能服务，可将 PDF、PPT、Word 文档和图像转换为结构化…

X AI KOLs Timeline ↗ · 昨天缓存

Chunkr 是一个开源文档智能服务，将 PDF、PPT、Word 文档和图像转换为结构化块，用于 RAG 和 LLM 流水线。它具有 OCR 布局分析、结构化 HTML/Markdown 输出、视觉语言模型处理，以及通过 Docker Compose 自托管部署，可配置 LLM 提供商。

0 人收藏 0 人点赞

#llm

引用Timothy B. Lee

Simon Willison's Blog ↗ · 昨天缓存

Timothy B. Lee的引文将使用LLMs比作管理，指出仅仅提供指令并不意味着没有学习曲线。

0 人收藏 0 人点赞

#llm

@sama: 团队烹制，辣味十足

X AI KOLs ↗ · 昨天缓存

OpenAI 宣布其首款定制 AI 芯片 Jalapeño，专为 LLM 工作负载设计，并与 Broadcom 合作生产。

0 人收藏 0 人点赞

#llm

当2000人试图破解我的AI助手后发生了什么

Simon Willison's Blog ↗ · 昨天缓存

一篇博客文章报告称，在超过2000人进行的6000次尝试后，没有人成功通过提示注入从AI助手（由Opus 4.6驱动）中泄露秘密，突显了模型抵抗力的提升，但提醒不要过度自信。

0 人收藏 0 人点赞

#llm

我用12行if语句替换了LLM分类器，客户更满意了

Reddit r/AI_Agents ↗ · 昨天

作者用一组简单的if语句替换了LLM分类器，发现客户更喜欢基于规则的方法，凸显了简单性胜过复杂AI的价值。

0 人收藏 0 人点赞

#llm

LLMs帮助机器人理解模糊指令并聚焦关键细节

MIT News — Artificial Intelligence ↗ · 昨天缓存

MIT CSAIL研究人员开发了掩码逆强化学习（Masked IRL），利用大型语言模型澄清机器人的模糊指令并聚焦环境关键细节，从而减少对大量演示数据的需求。

0 人收藏 0 人点赞

#llm

@Michaelzsguo: Alisa Liu 在准备 OpenAI 面试时，提到过斯坦福课程 CS336: Language Modeling from Scratch。如果你现在想系统学 LLM，或者以后想找 AI research / MTS / ML e…

X AI KOLs Timeline ↗ · 昨天缓存

推荐斯坦福公开课程CS336: Language Modeling from Scratch，该课程从零开始系统讲解语言模型的训练全流程，适合准备AI面试或想深入学习LLM的人。

0 人收藏 0 人点赞

#llm

@bibryam: 我作为高级工程师在2026年如何使用LLMs https://seangoedecke.com/how-i-use-llms-in-2026… 最大的AI工作流变化…

X AI KOLs Timeline ↗ · 昨天缓存

一位高级工程师描述了到2026年LLM代理如何演变成编码、调试和代码库研究的可靠协作者，而人类仍负责判断和审查。

0 人收藏 0 人点赞

#llm

我构建了一个用于AI代理的2.5D可视化编译器：它将拓扑与几何分离，使LLM不再生成杂乱的图表。

Reddit r/AI_Agents ↗ · 昨天

一个用Go编写的开源2.5D图表引擎，它将拓扑与几何分离，使LLM能够生成清晰的架构图，而不会出现空间幻觉。

0 人收藏 0 人点赞

#llm

SharQ：连接激活稀疏性与FP4量化以优化大语言模型推理

arXiv cs.LG ↗ · 昨天缓存

SharQ提出了一种无需训练的方法，将激活稀疏性与FP4量化相结合用于大语言模型推理，采用稀疏-密集分解和统一的FP4权重负载。与仅使用FP4的基线相比，它显著降低了延迟并恢复了精度。

0 人收藏 0 人点赞

llm

提交意见反馈