open-weight-models

标签

Cards List
#open-weight-models

@rohanpaul_ai: Coinbase首席执行官Brian Armstrong表示Coinbase正在尝试默认使用中国的开源权重模型,例如GLM 5…

X AI KOLs Timeline · 昨天 缓存

Coinbase首席执行官Brian Armstrong宣布,该公司正在尝试为其LLM网关使用中国的开源权重AI模型,例如GLM 5.2和Kimi 2.7,根据难度路由提示,并暗示前沿模型对于执行任务可能过于强大。

0 人收藏 0 人点赞
#open-weight-models

@cline: 我们对 GLM-5.2 印象非常深刻,因此推出每月 9.99 美元的订阅服务,让您以 2-5 倍的折扣价使用……

X AI KOLs Following · 2天前 缓存

Cline 宣布推出每月 9.99 美元的订阅服务,提供对 GLM-5.2 及其他开放权重模型的折扣访问,新用户使用 Cline CLI 和 IDE 可享 1.99 美元特惠试用。

0 人收藏 0 人点赞
#open-weight-models

@FinanceYF5: 源:

X AI KOLs Following · 2天前 缓存

OpenRouter 宣布,四个开源权重模型目前已为真实的代理流水线提供动力,一篇新博客文章详细说明了截至6月企业选择它们的原因。

0 人收藏 0 人点赞
#open-weight-models

@FinanceYF5: 阅读文章:https://openrouter.ai/blog/insights/the-open-weight-models-that-matter-june-2026/…

X AI KOLs Following · 2天前 缓存

这篇文章强调了截至2026年6月开放权重AI模型日益增长的重要性,DeepSeek V4 Flash作为一种高性价比、高性能模型出现,在代理任务上与GPT-5.5等前沿模型相媲美。

0 人收藏 0 人点赞
#open-weight-models

@FinanceYF5: 四个开放权重模型已经进入了能够支撑真实智能体流程的阶段。 OpenRouter 在 Insights 博客发布了新文章,讲述为什么公司在 6 月选择这些模型:

X AI KOLs Following · 2天前 缓存

OpenRouter 在 Insights 博客发文,指出四个开放权重模型已进入能够支撑真实智能体流程的阶段,并解释了公司为何在六月选择这些模型。

0 人收藏 0 人点赞
#open-weight-models

@rasbt:我整理了一篇关于使用开放权重模型设置本地编码代理的新文章。一切完全在本地运行。我…

X AI KOLs Timeline · 4天前 缓存

Sebastian Raschka 分享了一个关于使用开放权重 LLM 设置完全本地编码代理的新教程,包含操作指南和选择模型的评估检查表。

0 人收藏 0 人点赞
#open-weight-models

2026年的生物防范准备

Reddit r/singularity · 5天前

本文警告称,当前及未来的人工智能模型显著降低了制造生物武器的门槛,引用了对开放权重模型的蒸馏攻击以及无法防止安全消融的问题。文章呼吁公共资金资助广谱应对措施作为必要回应。

0 人收藏 0 人点赞
#open-weight-models

当前LLM成本为何不可持续

Hacker News Top · 5天前 缓存

本文认为,当前高昂的LLM定价不可持续,原因是性能提升递减、开源权重模型兴起、专用AI芯片降低推理成本以及零切换成本,并预测随着竞争加剧,价格将大幅下降。

0 人收藏 0 人点赞
#open-weight-models

开源模型令人难以承受的廉价

Hacker News Top · 6天前 缓存

本文探讨了像DeepSeek V4这样的开源模型与Anthropic和OpenAI的闭源模型之间的巨大成本差异,认为后者是通过人为稀缺性和品牌效应而非技术优势来维持高价格。

0 人收藏 0 人点赞
#open-weight-models

模型预先阅读的内容会改变其后续的回答方式——你可以在隐藏状态中看到这一点

Reddit r/artificial · 2026-06-23

本文报告了一个观察结果:在回答问题前阅读一篇长而结构化的文本,会改变模型后续的回答方式。该现象在Claude上得到行为证据支持,并在开放权重的Gemma模型上进行了机制分析,结果显示,指令微调变体中的隐藏状态具有可分离性,且概率分布更加清晰。

0 人收藏 0 人点赞
#open-weight-models

@MaximeRivest: 两年前,Sonnet 3.5 发布,引发了 Cursor 的病毒式采用。看看这些开源权重模型……

X AI KOLs Following · 2026-06-18 缓存

Sonnet 3.5 发布后两年,其引发的 Cursor 病毒式采用如今已被开源权重模型超越,这些模型可在消费级硬件上运行。这是开源 AI 的关键时刻。

0 人收藏 0 人点赞
#open-weight-models

@haider1: GLM 5.2 感觉像是开放权重模型的 opus 4.5 时刻,真正让我印象深刻的是在长时间、多步骤的…

X AI KOLs Following · 2026-06-17 缓存

GLM 5.2 标志着开放权重模型的一个重要里程碑,展示了在长多步骤任务中强大的上下文保留能力以及更可靠的工具调用。

0 人收藏 0 人点赞
#open-weight-models

GeoNatureAgent Benchmark:跨前沿与开源权重基础模型的环境地理空间分析LLM代理基准测试

arXiv cs.AI · 2026-06-12 缓存

本文介绍了GeoNatureAgent Benchmark,这是首个通过结构化工具调用评估LLM代理在环境地理空间分析任务上表现的基准。它对18个类别的93项任务中的七个模型进行了评估,发现Claude Sonnet 4以60.8%的准确率领先,而DeepSeek V3.2等开源权重模型则提供了强大的性价比。

0 人收藏 0 人点赞
#open-weight-models

Mythos-class 模型将在2029年前扩散至全球(7分钟阅读)

TLDR AI · 2026-06-12 缓存

Saagar Pateder分析了人工智能在消费者和企业任务中的边际收益递减,并基于模型性能和成本的历史趋势,预测开源权重模型将在2029年前普及全球。

0 人收藏 0 人点赞
#open-weight-models

ERRORQUAKE: 开放权重大语言模型中的重尾错误严重性分布

arXiv cs.LG · 2026-06-05 缓存

本文介绍了Errorquake-10k,这是一个用于评估开放权重大语言模型中错误严重性的基准,表明具有相同准确率的模型可能具有截然不同的错误严重性分布,并主张在报告准确率的同时也应报告严重性。

0 人收藏 0 人点赞
#open-weight-models

# 这些大语言模型在抵御俄罗斯宣传方面表现最佳

Ars Technica · 2026-06-04 缓存

爱沙尼亚语言研究所开展的一项基准测试评估了各大LLM抵御俄罗斯宣传内容的能力,结果显示Nvidia的Nemotron、阿里巴巴的Qwen以及OpenAI的GPT-4.5表现优异,而Google的Gemini系列模型则表现出明显的薄弱之处,尤其是在以俄语提问时。

0 人收藏 0 人点赞
#open-weight-models

这些AI模型免费、私密,且永远不会说'不'

Reddit r/artificial · 2026-05-31 缓存

本文探讨了开放权重AI模型的日益普及,这些模型的安全护栏可以轻易移除,从而使它们能够无拒绝地回答有害请求,引发了关于滥用和国家安全的重大担忧。

0 人收藏 0 人点赞
#open-weight-models

@Miles_Brundage: 当你花几个小时折腾美国开放权重模型在各大云平台跑起来,而Kimi和DeepSeek直接即插即用时的心情

X AI KOLs Timeline · 2026-05-30 缓存

Miles Brundage指出,他费尽周折才在云平台上部署美国开放权重模型,而像Kimi和DeepSeek这样的中国模型却即插即用。

0 人收藏 0 人点赞
#open-weight-models

LLM架构的最新发展:KV共享、mHC与压缩注意力 [P]

Reddit r/MachineLearning · 2026-05-17 缓存

Sebastian Raschka回顾了LLM架构中针对长上下文效率的最新创新,包括KV共享、压缩卷积注意力和来自Gemma 4、ZAYA1、Laguna XS.2和DeepSeek V4等模型的逐层注意力预算。

0 人收藏 0 人点赞
#open-weight-models

在Strix Halo、RTX 3090和RTX 5070上运行相同模型,只为获得自己的数据

Reddit r/LocalLLaMA · 2026-05-16

作者在Strix Halo、RTX 3090和RTX 5070上使用了多个后端,进行了55次推理基准测试。结果揭示,显存带宽主导解码速度,RTX 5070在小模型上击败RTX 3090,而推理模型因隐藏的推理内容看起来慢约5倍。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈