cost-reduction

标签

Cards List
#cost-reduction

@nini_incrypto_: Headroom,把大模型 Token 成本砍掉 95% ! 1. 真·零代码更改:提供 Proxy 代理模式,任何编程语言只需改个端口就能直接无缝接入。 2. 全吞吐压缩:自动压缩工具输出、运行日志、RAG 知识库切片以及密密麻麻的聊天…

X AI KOLs Timeline · 3天前 缓存

Headroom 是一个上下文压缩层,可以将 AI agent 读取的 Token 成本降低 60-95%,支持零代码更改的代理模式,且不降低模型回答质量。

0 人收藏 0 人点赞
#cost-reduction

@h100envy: Ying Sheng 共同撰写了 SGLang,该推理引擎现在在 xAI 上为 Grok 服务,运行在十万个 GPU 上。她还构建了 Fle…

X AI KOLs Timeline · 4天前 缓存

Ying Sheng 共同撰写了 SGLang,该推理引擎现在在 xAI 上用十万个 GPU 为 Grok 服务,相比 DeepSeek 的 API 实现了 5 倍的成本削减;她还构建了 FlexGen,并参与构建了 Chatbot Arena。

0 人收藏 0 人点赞
#cost-reduction

五家中国AI实验室将Token价格最高下调99%

Reddit r/ArtificialInteligence · 4天前

五家中国AI实验室在价格战中将推理Token价格下调高达99%,使得前沿推理几乎免费,竞争优势从模型转向分发和工具链。

0 人收藏 0 人点赞
#cost-reduction

令牌压缩幻象:为什么我对RTK持怀疑态度

Hacker News Top · 5天前 缓存

本文批评了RTK,一种用于LLM代理的令牌压缩工具,认为其声称的60-90%成本节省具有误导性,引入了静默失败风险,缺乏严格的准确性基准,并且作为独立产品在结构上脆弱。

0 人收藏 0 人点赞
#cost-reduction

医院和大学以低于90%的成本重新利用药物

Hacker News Top · 5天前 缓存

伦敦国王学院的一项研究显示,医院和大学正在以不到制药公司成本10%的费用进行仿制药重新利用的后期临床试验,为失明、癌症预防和新冠等疾病提供可负担的治疗方案。

0 人收藏 0 人点赞
#cost-reduction

@rohanpaul_ai: TokenPilot 通过摄入感知压缩和生命周期感知驱逐来降低 LLM 智能体成本,实现了 61–87% 的成本降低。

X AI KOLs Following · 2026-06-16 缓存

TokenPilot 通过摄入感知压缩和生命周期感知驱逐来降低 LLM 智能体成本,在 PinchBench 和 Claw-Eval 上实现了 61–87% 的成本降低,且得分具备竞争力。

0 人收藏 0 人点赞
#cost-reduction

@browser_use: https://x.com/browser_use/status/2066911791360422071

X AI KOLs Following · 2026-06-16 缓存

Browser Use Cloud 使用 Firecracker 重建基础设施,将浏览器会话成本从每小时 0.06 美元降至 0.02 美元,同时实现亚秒级启动时间,并保持隔离性和可扩展性。

0 人收藏 0 人点赞
#cost-reduction

@DeRonin_: 你懂 Dietrich Gebert 刚开源了什么吗???每个任务省 47-77% 的 API 费用……快 4 倍……90%+……

X AI KOLs Following · 2026-06-15 缓存

Dietrich Gebert 开源了 Ponytail,这款工具通过强制执行 YAGNI 等原则、优先使用标准库或原生功能,让编码代理编写最精简代码,将 API 开销降低 47-77%,代码量减少 80-94%。

0 人收藏 0 人点赞
#cost-reduction

使用Cursor的Bugbot实现更快的代码审查(3分钟阅读)

TLDR AI · 2026-06-11 缓存

Cursor的Bugbot代码审查工具现速度提升超过3倍,成本降低22%,发现错误数量增加10%,大多数审查运行在3分钟内完成。此次更新还新增了在推送前运行审查以及仅审查新更改等功能。

0 人收藏 0 人点赞
#cost-reduction

微软不希望员工使用AI编写代码。这真的能证明AI不会取代开发者吗?

Reddit r/artificial · 2026-06-05

文章讨论了微软禁止员工使用AI编写代码的政策,并指出AI成本迅速下降、速度不断提高,将使人类开发者难以竞争,从而反驳了AI不会取代开发者的观点。

0 人收藏 0 人点赞
#cost-reduction

我们构建了一个源码可用的LLM可靠性库(对研究/个人/内部评估免费),可在保持同等质量的前提下将推理成本降低一半,只需更改一个import语句即可采用 [P] [R]

Reddit r/MachineLearning · 2026-06-04

AgentCodec 是一个源代码可用的库,它将 28 种 LLM 可靠性技术(如重试、集成、生成器/判别器优化等)统一到单一兼容 OpenAI 的 API 下,并配备自适应路由器,在匹配质量的情况下可降低约 56% 的推理成本。该库采用通信理论框架,支持即插即用替代 OpenAI、Anthropic 和 Ollama 客户端。

0 人收藏 0 人点赞
#cost-reduction

AI成本的很大一部分只是模型一遍又一遍地重读相同的文本。有趣的修复尝试,带有公开证明

Reddit r/ArtificialInteligence · 2026-06-04

Corbenic AI声称为大语言模型提供无损KV缓存重用,允许存储的模型内存在不同机器和GPU代际之间逐比特恢复,并通过公开校验和进行验证。该项目包括一个开源的小模型,训练成本约600欧元,使整个流程可审查。

0 人收藏 0 人点赞
#cost-reduction

@hwchase17:验证器对于扩展评估/强化学习很重要,但成本会累积!那么,我们能让它们更便宜吗?@Vtrived... 等人的一些精彩工作

X AI KOLs Following · 2026-06-02 缓存

推文重点介绍了来自Harvey的研究人员关于让验证器更便宜以扩展评估和强化学习的工作。

0 人收藏 0 人点赞
#cost-reduction

@dessaigne: 起草一份基本遗嘱在1995年花费约400美元,去年约150美元,而今天借助AI只需约0.50美元。这可能是最大的价格…

X AI KOLs Timeline · 2026-06-01 缓存

得益于AI,起草一份基本遗嘱的成本已从1995年的约400美元降至今天的约0.50美元。这一法律服务的价格暴跌可能反而会在官方数据中显示为通货膨胀。

0 人收藏 0 人点赞
#cost-reduction

新版Claude的快速模式现在便宜了三倍。它完美适用于我最常用AI做的事情:生成多个选项供选择。

Reddit r/ArtificialInteligence · 2026-06-01

新版Claude Opus 4.8推出了快速模式,价格便宜了三倍,速度快了2.5倍,非常适合快速生成多个选项。本文分享了使用该模式克服写作障碍的提示和策略。

0 人收藏 0 人点赞
#cost-reduction

尝试使用这个工具,通过根据提示复杂度调整 Effort/Thinking 参数来降低 Claude 成本

Reddit r/openclaw · 2026-05-31

一个 GitHub 工具,通过根据提示复杂度动态调整 effort/thinking 参数来降低 Claude API 成本。

0 人收藏 0 人点赞
#cost-reduction

@rohanpaul_ai: 本文展示LLM如何更经济地使用较短上下文且不损失太多回答质量。展示选择更…

X AI KOLs Following · 2026-05-29 缓存

本文展示了LLM在保持回答质量的同时使用较短上下文窗口的方法,token使用量减少约25%,某些情况下超过50%。

0 人收藏 0 人点赞
#cost-reduction

@0xtotem: 已将 PEEK 移植到 @DSPyOSS。你可以将任何 DSPy 代理(ReAct、RLM 等)封装到这个新模块中,以受益于更好的性能……

X AI KOLs Following · 2026-05-25 缓存

已将 PEEK 方法移植到 DSPy,使任何 DSPy 代理都能受益于如论文所示的改进性能和成本降低。

0 人收藏 0 人点赞
#cost-reduction

@chiefofautism: 拿一个中文模型,用企业数据集微调,然后放到Runpod serverless上

X AI KOLs Timeline · 2026-05-25 缓存

一条推文讨论了在中文模型上使用企业数据进行微调,并将其部署到Runpod serverless,作为昂贵API调用的经济高效的替代方案。

0 人收藏 0 人点赞
#cost-reduction

DeepSeek将永久在其旗舰AI模型上提供75%折扣

Hacker News Top · 2026-05-24

DeepSeek宣布对其旗舰AI模型永久提供75%折扣,使高级AI更加普及可及。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈