open-source-models

#open-source-models

GPT 5.6 Sol 与 Claude Mythos 遭遇了相同的命运。到底发生了什么？

Reddit r/AI_Agents ↗ · 昨天

OpenAI 发布了 GPT-5.6，但仅向美国政府批准的客户开放访问权限，引发了对依赖专有 API 的担忧。文章主张使用开源替代方案构建内部精调模型，以保持控制并降低成本。

0 人收藏 0 人点赞

#open-source-models

模型在哪里找到快乐？开源LLM中的情感向量

arXiv cs.CL ↗ · 3天前缓存

本文复现了开源权重大语言模型Apertus-8B和Gemma-4-E4B中'情感向量'的发现，表明价态几何结构在不同模型间可恢复，但层间出现时机存在差异。研究还发现唤醒编码对用于提取的故事语料库敏感。

0 人收藏 0 人点赞

#open-source-models

AI泡沫即将破裂？英伟达悄然收购Essential AI团队，包括Transformer论文合著者Ashish Vaswani。Vaswani此前为其AI公司融资困难。

Reddit r/ArtificialInteligence ↗ · 6天前

英伟达悄然收购了Essential AI的团队，包括Transformer论文合著者Ashish Vaswani，他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。

0 人收藏 0 人点赞

#open-source-models

@AltimeterCap: https://x.com/AltimeterCap/status/2069094020995793283

X AI KOLs Timeline ↗ · 2026-06-22 缓存

Altimeter Capital的Apoorv Agrawal解释为何他们加倍投资Baseten，认为推理将变成最大的市场，并且后训练开源模型在能力、成本和控制方面提供了最佳组合。

0 人收藏 0 人点赞

#open-source-models

探究隐式潜在轨迹偏移：通过长篇幅连贯上下文绕过对齐

Reddit r/ArtificialInteligence ↗ · 2026-06-17

一项实证研究，研究长篇幅、语义密集的良性文本如何偏移模型的潜在空间轨迹，稀释初始系统提示，并绕过训练后对齐约束——如在闭源和开源模型中所观察到的那样。

0 人收藏 0 人点赞

#open-source-models

@iluciddreaming: 玩了两个月本地 LLM。用 Windows 11 + llama.cpp + llama-swap 狂测各种开源模型，这是我的最终成绩单：硬件：i7-13700 + 64GB RAM + RTX 4070 目前最能打的组合是 gemm…

X AI KOLs Timeline ↗ · 2026-06-15 缓存

经过两个月本地 LLM 测试，作者认为 gemma-4-12B-it-QAT 和 MTP 辅助组合在速度和可用性上表现最佳，硬件为 i7-13700 + 64GB RAM + RTX 4070。

0 人收藏 0 人点赞

#open-source-models

@TheAhmadOsman：本地AI是未来。学习如何运行开源模型（推理），如何系统地评估它们（评估），……

X AI KOLs Following ↗ · 2026-06-14 缓存

@TheAhmadOsman 的一条推文强调本地AI是未来，并推荐学习诸如运行开源模型、进行评估以及通过微调定制模型等技能。

0 人收藏 0 人点赞

#open-source-models

在家进行AI编码，不花冤枉钱

Hacker News Top ↗ · 2026-06-13 缓存

本文比较了三种在家进行AI编码的方法：自行托管开源模型、通过OpenRouter等API服务租用模型，以及使用OpenAI和Anthropic的前沿订阅服务。文章建议，将前沿订阅服务用于复杂任务，而将基于API的开源模型用于日常例行工作，从而构建经济高效的AI工作流程。

0 人收藏 0 人点赞

#open-source-models

CEO们仍在向AI投入数十亿美元，这完全不合理

Reddit r/ArtificialInteligence ↗ · 2026-06-09

一篇评论文章指出，向专有AI研究投入数十亿美元是不理性的，因为像Qwen和GLM这样的开源模型现在已经非常有竞争力，任何资金充足的初创公司都能迅速复制顶尖模型。

0 人收藏 0 人点赞

#open-source-models

@FradSer: 目前为止做的最有意思的事情：尝试一系列的方法，让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平

X AI KOLs Timeline ↗ · 2026-05-23 缓存

尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。

0 人收藏 0 人点赞

#open-source-models

AI价格暴跌：是软件的故事，而非硬件（14分钟阅读）

TLDR AI ↗ · 2026-05-22 缓存

本文认为，AI推理成本的快速下降是由软件优化而非硬件改进驱动的，并且运行在消费级GPU上的开放权重模型正变得越来越能与前沿模型竞争。

0 人收藏 0 人点赞

#open-source-models

人们如何让OpenClaw/Hermes代理24/7运行而不耗尽API预算？

Reddit r/AI_Agents ↗ · 2026-05-21

一位从业者寻求建议，希望在不产生高额API成本的情况下让AI代理24/7运行，询问本地模型、云GPU或托管API，并希望获得兼顾可靠性和推理质量的成本效益方案。

0 人收藏 0 人点赞

#open-source-models

@TheAhmadOsman: 温馨提醒，开始使用本地AI所需的一切就是： - 2x RTX 3090（在r/hardwareswap上花$700-$900入手） -…

X AI KOLs Timeline ↗ · 2026-05-19 缓存

提醒一下，两块RTX 3090加上Qwen 3.6 27B或Gemma 4 31B等开源模型，就可以运行强大的本地AI代理，性能堪比Opus 4.5，配合Claude Code、自托管SearXNG等工具使用。

0 人收藏 0 人点赞

#open-source-models

我们是否在浪费时间基于开源模型构建企业代理？（我对Ling 1T 2.6的经验）

Reddit r/AI_Agents ↗ · 2026-05-07

一位企业代理开发者讨论了使用像Ling 1T 2.6这样的开源模型的权衡，强调了相比于专有API，优化和基准测试的高昂开销。

0 人收藏 0 人点赞

#open-source-models

我的 7900XTX 搭配 qwen 3.6 实现自主运行 👀 哇 😍

Reddit r/LocalLLaMA ↗ · 2026-04-20

用户演示了在 AMD 7900 XTX 显卡上本地自主运行 Qwen 3.6 并创建 Android 应用——这一曾被视为科幻的场景如今已成为现实。

0 人收藏 0 人点赞

#open-source-models

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

YouTube AI Channels ↗ · 4天前缓存

Daniel Han 在 AI 工程师世界大会上深入讲解了强化学习、模型微调、量化与智能体的实战经验，回顾了从 Llama 到 DeepSeek R1 的开源模型演进，并剖析了现代模型训练的五个关键阶段。

1 人收藏 1 人点赞

open-source-models

提交意见反馈