open-source-models

标签

Cards List
#open-source-models

GPT 5.6 Sol 与 Claude Mythos 遭遇了相同的命运。到底发生了什么?

Reddit r/AI_Agents · 昨天

OpenAI 发布了 GPT-5.6,但仅向美国政府批准的客户开放访问权限,引发了对依赖专有 API 的担忧。文章主张使用开源替代方案构建内部精调模型,以保持控制并降低成本。

0 人收藏 0 人点赞
#open-source-models

模型在哪里找到快乐?开源LLM中的情感向量

arXiv cs.CL · 3天前 缓存

本文复现了开源权重大语言模型Apertus-8B和Gemma-4-E4B中'情感向量'的发现,表明价态几何结构在不同模型间可恢复,但层间出现时机存在差异。研究还发现唤醒编码对用于提取的故事语料库敏感。

0 人收藏 0 人点赞
#open-source-models

AI泡沫即将破裂?英伟达悄然收购Essential AI团队,包括Transformer论文合著者Ashish Vaswani。Vaswani此前为其AI公司融资困难。

Reddit r/ArtificialInteligence · 6天前

英伟达悄然收购了Essential AI的团队,包括Transformer论文合著者Ashish Vaswani,他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。

0 人收藏 0 人点赞
#open-source-models

@AltimeterCap: https://x.com/AltimeterCap/status/2069094020995793283

X AI KOLs Timeline · 2026-06-22 缓存

Altimeter Capital的Apoorv Agrawal解释为何他们加倍投资Baseten,认为推理将变成最大的市场,并且后训练开源模型在能力、成本和控制方面提供了最佳组合。

0 人收藏 0 人点赞
#open-source-models

探究隐式潜在轨迹偏移:通过长篇幅连贯上下文绕过对齐

Reddit r/ArtificialInteligence · 2026-06-17

一项实证研究,研究长篇幅、语义密集的良性文本如何偏移模型的潜在空间轨迹,稀释初始系统提示,并绕过训练后对齐约束——如在闭源和开源模型中所观察到的那样。

0 人收藏 0 人点赞
#open-source-models

@iluciddreaming: 玩了两个月本地 LLM。 用 Windows 11 + llama.cpp + llama-swap 狂测各种开源模型,这是我的最终成绩单: 硬件:i7-13700 + 64GB RAM + RTX 4070 目前最能打的组合是 gemm…

X AI KOLs Timeline · 2026-06-15 缓存

经过两个月本地 LLM 测试,作者认为 gemma-4-12B-it-QAT 和 MTP 辅助组合在速度和可用性上表现最佳,硬件为 i7-13700 + 64GB RAM + RTX 4070。

0 人收藏 0 人点赞
#open-source-models

@TheAhmadOsman:本地AI是未来。学习如何运行开源模型(推理),如何系统地评估它们(评估),……

X AI KOLs Following · 2026-06-14 缓存

@TheAhmadOsman 的一条推文强调本地AI是未来,并推荐学习诸如运行开源模型、进行评估以及通过微调定制模型等技能。

0 人收藏 0 人点赞
#open-source-models

在家进行AI编码,不花冤枉钱

Hacker News Top · 2026-06-13 缓存

本文比较了三种在家进行AI编码的方法:自行托管开源模型、通过OpenRouter等API服务租用模型,以及使用OpenAI和Anthropic的前沿订阅服务。文章建议,将前沿订阅服务用于复杂任务,而将基于API的开源模型用于日常例行工作,从而构建经济高效的AI工作流程。

0 人收藏 0 人点赞
#open-source-models

CEO们仍在向AI投入数十亿美元,这完全不合理

Reddit r/ArtificialInteligence · 2026-06-09

一篇评论文章指出,向专有AI研究投入数十亿美元是不理性的,因为像Qwen和GLM这样的开源模型现在已经非常有竞争力,任何资金充足的初创公司都能迅速复制顶尖模型。

0 人收藏 0 人点赞
#open-source-models

@FradSer: 目前为止做的最有意思的事情: 尝试一系列的方法,让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平

X AI KOLs Timeline · 2026-05-23 缓存

尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。

0 人收藏 0 人点赞
#open-source-models

AI价格暴跌:是软件的故事,而非硬件(14分钟阅读)

TLDR AI · 2026-05-22 缓存

本文认为,AI推理成本的快速下降是由软件优化而非硬件改进驱动的,并且运行在消费级GPU上的开放权重模型正变得越来越能与前沿模型竞争。

0 人收藏 0 人点赞
#open-source-models

人们如何让OpenClaw/Hermes代理24/7运行而不耗尽API预算?

Reddit r/AI_Agents · 2026-05-21

一位从业者寻求建议,希望在不产生高额API成本的情况下让AI代理24/7运行,询问本地模型、云GPU或托管API,并希望获得兼顾可靠性和推理质量的成本效益方案。

0 人收藏 0 人点赞
#open-source-models

@TheAhmadOsman: 温馨提醒,开始使用本地AI所需的一切就是: - 2x RTX 3090(在r/hardwareswap上花$700-$900入手) -…

X AI KOLs Timeline · 2026-05-19 缓存

提醒一下,两块RTX 3090加上Qwen 3.6 27B或Gemma 4 31B等开源模型,就可以运行强大的本地AI代理,性能堪比Opus 4.5,配合Claude Code、自托管SearXNG等工具使用。

0 人收藏 0 人点赞
#open-source-models

我们是否在浪费时间基于开源模型构建企业代理?(我对Ling 1T 2.6的经验)

Reddit r/AI_Agents · 2026-05-07

一位企业代理开发者讨论了使用像Ling 1T 2.6这样的开源模型的权衡,强调了相比于专有API,优化和基准测试的高昂开销。

0 人收藏 0 人点赞
#open-source-models

我的 7900XTX 搭配 qwen 3.6 实现自主运行 👀 哇 😍

Reddit r/LocalLLaMA · 2026-04-20

用户演示了在 AMD 7900 XTX 显卡上本地自主运行 Qwen 3.6 并创建 Android 应用——这一曾被视为科幻的场景如今已成为现实。

0 人收藏 0 人点赞
#open-source-models

[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han

YouTube AI Channels · 4天前 缓存

Daniel Han 在 AI 工程师世界大会上深入讲解了强化学习、模型微调、量化与智能体的实战经验,回顾了从 Llama 到 DeepSeek R1 的开源模型演进,并剖析了现代模型训练的五个关键阶段。

1 人收藏 1 人点赞
← 返回首页

提交意见反馈