optimization

标签

Cards List
#optimization

让 ast.walk 速度提升 220 倍

Hacker News Top · 2026-06-16 缓存

Reflex 团队通过移除生成器开销、内联函数以及实现 Rust 绑定,将其 AI 代码生成检查器中的 Python ast.walk 速度提升了 220 倍。

0 人收藏 0 人点赞
#optimization

@umichkim: AI for Science 正从“写文本”转向“写和测试科学代码”。一篇新的 Nature 论文介绍了 ER…

X AI KOLs Timeline · 2026-06-16 缓存

一篇新的 Nature 论文介绍了 ERA,这是一种通过树搜索迭代编写、运行、评分和改进科学代码的 AI 系统,将 AI for Science 从文本生成推进到代码测试。

0 人收藏 0 人点赞
#optimization

x86仿真器团队曾遇到一段代码糟糕到他们在仿真过程中直接修复

Lobsters Hottest · 2026-06-16 缓存

一个关于Windows x86仿真器团队的故事:他们遇到一个程序,其初始化循环完全展开了64KB(65,536条指令),于是添加了特殊优化,将其替换为一个紧凑循环。

0 人收藏 0 人点赞
#optimization

大型语言模型作为优化器:直接方法与工具增强方法的调查及其性能前沿

arXiv cs.AI · 2026-06-16 缓存

本调查将基于LLM的优化分为三个范式——直接优化、工具增强优化和工具创建优化——并回顾了它们的性能前沿和局限性。

0 人收藏 0 人点赞
#optimization

Spokes: 优化多样化的预训练数据选择

arXiv cs.CL · 2026-06-16 缓存

本文介绍了Spokes,一个基于G-Vendi分数的概率多样化框架,通过联合优化质量和多样性,在FineWeb和DCLM上实现了下游任务性能的显著提升。

0 人收藏 0 人点赞
#optimization

在深度学习中何时使用何种 Schatten-$p$ 范数?

arXiv cs.LG · 2026-06-16 缓存

本文为指导在深度学习中合理使用不同的 Schatten-p 范数提供了指南,分析了它们在模型正则化和优化方面的理论特性和实际意义。

0 人收藏 0 人点赞
#optimization

基于LMO方法的零阶无参数优化:高效微调的新方法

arXiv cs.LG · 2026-06-16 缓存

本文介绍了AdaNAGED,一种结合零阶优化、无参数自适应和非欧几里得更新几何的方法,用于大型语言模型的内存高效微调,具有理论收敛保证,并在OPT-1.3B模型上进行了验证。

0 人收藏 0 人点赞
#optimization

{\alpha}-公平保险定价:公平性连续体

arXiv cs.LG · 2026-06-16 缓存

本文提出了一个用于保险定价的α公平个体偿付保费(α-FISP)框架,该框架在确保偿付能力的同时平衡精算公平和团结公平,通过约束优化得到一系列定价解。

0 人收藏 0 人点赞
#optimization

DFlash与Spec V2解码(14分钟阅读)

TLDR AI · 2026-06-16 缓存

Z Lab、SGLang和Modal发布DFlash,这是一种针对Qwen 3.5 397B-A17B的新型投机解码模型,采用块扩散和KV注入技术,相较于基线实现超过4倍吞吐量提升,相较于原生MTP实现1.5倍提升。

0 人收藏 0 人点赞
#optimization

@songhan_mit:探索我们在KV缓存压缩方面的持续努力:

X AI KOLs Following · 2026-06-15 缓存

来自Song Han的一条推文强调了在KV缓存压缩方面的持续工作,其中介绍了Weian Mao的一篇博客,讨论了论文中常常被忽视的系统级方面。

0 人收藏 0 人点赞
#optimization

太棒了。令牌速度翻倍 + KV缓存现在需要低显存 - Qwen 27B

Reddit r/LocalLLaMA · 2026-06-15

一种名为kvflash的新型KV缓存优化,可在单张RTX 3090上使Qwen 3.6-27B的生成速度翻倍并降低显存使用,同时保持准确性。

0 人收藏 0 人点赞
#optimization

Clojure 速度几乎媲美 C(需借助一些优化)

Lobsters Hottest · 2026-06-15 缓存

本文详细介绍了 Clojure 如何借助 JVM 的 Vector API 和精心优化,在 3D 压力测试中达到接近 C 的帧率(仅差 20%),展示了动态语言在热循环中也能接近底层性能。

0 人收藏 0 人点赞
#optimization

一种基于深度强化学习(DRL)的Transformer方法用于解决开放车间调度问题

arXiv cs.AI · 2026-06-15 缓存

介绍了一种基于Transformer的调度策略,该策略通过强化学习训练,用于开放车间调度问题,展示了在小规模实例上训练的模型能够泛化到更大规模的问题,并与经典调度启发式算法竞争。

0 人收藏 0 人点赞
#optimization

FedSPC:个性化联邦学习中的共享参数校正

arXiv cs.LG · 2026-06-15 缓存

提出FedSPC,一种面向个性化联邦学习的模块化校正方法,仅对共享参数应用控制变量校正,在CIFAR-100和Tiny-ImageNet上提升了多种PFL方法的性能。

0 人收藏 0 人点赞
#optimization

面向电子商务的大规模高频定价

arXiv cs.LG · 2026-06-15 缓存

本文提出了一种面向时尚电商销售活动的“先预测后优化”算法定价工具,利用梯度提升树进行日需求预测,并采用多目标优化。在12个市场的A/B测试中,该系统在保持销售额和收入不变的情况下实现了6%的利润提升,并已在Zalando部署。

0 人收藏 0 人点赞
#optimization

简化ZGC中的弱引用处理

Lobsters Hottest · 2026-06-14 缓存

这篇乌普萨拉大学的硕士论文与Oracle合作完成,研究了通过提出三种流水线修改和一种替代的注释字段机制,来减少ZGC垃圾收集器中弱引用处理的开销。

0 人收藏 0 人点赞
#optimization

@RitOnchain: Jane Street 每年支付 75 万美元给那些全面掌握矩阵计算的量化专家,这些计算可用于从太空卫星中获取 alpha…

X AI KOLs Timeline · 2026-06-13

由 MIT 应用数学团队提供的免费 57 分钟资源,涵盖了矩阵计算和自动微分,面向量化专家和优化领域,并强调了 Jane Street 为此类技能提供的高额薪酬。

0 人收藏 0 人点赞
#optimization

@GitTrend0x: Hermes 起飞前的必备插件 皮书中文实战大全,优化指南全流程手册、Hermes HUD 可视化大脑、Scarf 原生 macOS GUI、Open Design 本地设计技能包……全网程序员把 Hermes 玩成了下一代 Agent …

X AI KOLs Timeline · 2026-06-12 缓存

总结了围绕 Hermes Agent 框架的多个社区插件和资源,包括中文实战指南、优化手册、可视化监控工具、原生 macOS GUI 和设计技能包,帮助用户从入门到高级优化。

0 人收藏 0 人点赞
#optimization

@RisingSayak: 发布首个内核以最终优化来自@Lightricks的LTX-2.3!torch.compile + cuDNN attn 已经…

X AI KOLs Following · 2026-06-12 缓存

发布了一个自定义内核,进一步优化来自Lightricks的LTX-2.3,在GB10上实现了1.52倍加速,基于之前的torch.compile和cuDNN注意力优化。

0 人收藏 0 人点赞
#optimization

并非所有 MTP 辅助模型都生而平等

Reddit r/LocalLLaMA · 2026-06-12

关于 llama.cpp 中结合 Gemma 4 模型的 MTP 投机解码的详细技术探索,表明辅助模型的选择和量化对加速效果有显著影响,且并非所有“同名”的辅助模型表现相同。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈