optimization

#optimization

优化 LLVM 的 bump 分配器

Lobsters Hottest ↗ · 3小时前缓存

这篇博客文章详细介绍了对 LLVM 的 BumpPtrAllocator 进行的三项近期优化，通过移除冗余对齐、空指针检查以及每次分配的记账开销来减少快速路径开销，从而提升了 Clang、lld 及其他 LLVM 组件的性能。

0 人收藏 0 人点赞

#optimization

Wasserstein空间中的凸差规划及其在MMD优化中的应用

arXiv cs.LG ↗ · 3小时前缓存

本文介绍了Wasserstein空间中的凸差规划框架，用于优化概率测度上的非凸泛函，给出了最大均值差异（MMD）和能量距离（ED）的显式分解，并证明了提升的凸凹过程的收敛性。

0 人收藏 0 人点赞

#optimization

COOPA：一种面向运筹学问题的模块化LLM智能体架构

arXiv cs.LG ↗ · 3小时前缓存

本文介绍了COOPA，一种面向运筹学问题的模块化LLM智能体架构，它结合了基于迭代置信度的建模、元素级溯源和多求解器路由。在八个LLM主干网络和四个基线的评估中，COOPA在六个主干网络上取得了最佳的宏平均准确率，并在最强基线的基础上提升了最多6.7个百分点。

0 人收藏 0 人点赞

#optimization

huff12 - 一个适用于Apple Silicon的12流Huffman解码器

Lobsters Hottest ↗ · 15小时前

huff12是一个针对Apple Silicon处理器优化的12流Huffman解码器，旨在通过并行流处理来提高解码性能。

0 人收藏 0 人点赞

#optimization

@antoniolupetti：《神经网络数学》是一套优秀的讲义，适合任何希望从数学角度研究现代神经网络的人……

X AI KOLs Timeline ↗ · 昨天缓存

一套涵盖神经网络数学的讲义，从基本激活函数到群卷积和等变性等几何概念。

0 人收藏 0 人点赞

#optimization

@rohanpaul_ai: 大语言模型可以从没有已知答案的问题中学习更好的编码行为。许多实际问题并没有现成的标准答案...

X AI KOLs Following ↗ · 昨天缓存

论文提出了一种名为 RiVER 的强化学习方法，该方法通过对程序在隐藏测试用例上进行排序并提供分级反馈，提升了大语言模型在没有已知标准答案的问题上的编码表现。

0 人收藏 0 人点赞

#optimization

反思优化

Hacker News Top ↗ · 2天前缓存

一篇博客文章，讨论针对受约束的分类概率分布的优化技术，使用softmax重参数化和log barrier方法，应用于蛋白质结合剂设计。

0 人收藏 0 人点赞

#optimization

帮助优化 llama.cpp + Qwen 27B 在 RTX PRO 6000 Blackwell 上用于编码代理的配置

Reddit r/LocalLLaMA ↗ · 2天前

用户详细介绍了他们在 RTX PRO 6000 Blackwell 上使用 llama.cpp 运行 Qwen 27B 进行本地编码代理的设置，与 Claude 模型进行了性能对比，并请求帮助解决频繁崩溃和响应格式错误的问题。

0 人收藏 0 人点赞

#optimization

草图线性对比学习：近似、优化与统计缩放

arXiv cs.LG ↗ · 3天前缓存

本文推导了在高斯潜变量模型下的草图线性对比学习的缩放定律，分析了风险如何分解为近似项、优化项和统计项，并为对比学习中平衡模型规模、数据和计算提供了理论指导。

0 人收藏 0 人点赞

#optimization

面向仓库优化的上下文感知流水线合成

arXiv cs.AI ↗ · 3天前缓存

本文提出CASOP（上下文感知优化流水线合成与评估框架），用于仓库订单履约中优化流水线的上下文感知合成与评估，支持从模块化仓库中自动构建有效的算法流水线。

0 人收藏 0 人点赞

#optimization

马尔可夫噪声下的高概率PL-SGD：最优混合与尾部依赖

arXiv cs.LG ↗ · 3天前缓存

本文为PL平滑目标在马尔可夫噪声下的随机梯度下降提供了最优高概率界，填补了期望保证与高概率保证之间的差距，并扩展到重尾设置，给出了匹配的下界。

0 人收藏 0 人点赞

#optimization

当智能体遇上电动公交车队运营：聚合框架中的定价行为、权衡与政策启示

arXiv cs.AI ↗ · 3天前缓存

本文提出了一种用于协调电动公交车队运营的智能体聚合框架，将基于优化的调度与监督型AI智能体相结合，以处理干扰、电价适应和价值分配，揭示了运营效率与利润导向定价之间的权衡。

0 人收藏 0 人点赞

#optimization

@BunnyxStudio: 花了 3 周时间告别 SwiftData，现在 Hive 的启动速度有了显著的提升，66000张图片的资料库基本无需等待即刻使用。减少冷启动的时间对于体验来说真的很重要。

X AI KOLs Following ↗ · 3天前缓存

BunnyxStudio 花费3周时间移除了SwiftData，使得Hive应用启动速度显著提升，66000张图片的资料库几乎无需等待即可使用。

0 人收藏 0 人点赞

#optimization

LFM2.5 230M 使用自定义 WebGPU 内核在浏览器中以 1,400 tok/s 运行

Reddit r/LocalLLaMA ↗ · 3天前

LFM2.5 230M 模型使用自定义 WebGPU 内核在浏览器中实现每秒 1,400 个 token，展示了高效的本地推理。

0 人收藏 0 人点赞

#optimization

结构化主键

Lobsters Hottest ↗ · 3天前缓存

本文讨论了传统主键设计如何导致表孤立，并介绍了结构化主键作为一种替代方案，以提高SQL查询性能并维护关系完整性。

0 人收藏 0 人点赞

#optimization

我们如何通过将稳定上下文移出提示词来使AI代理更快

Reddit r/AI_Agents ↗ · 3天前

描述了一种通过将稳定上下文移出提示词来提高AI代理速度的技术，从而减少令牌使用量和延迟。

0 人收藏 0 人点赞

#optimization

我对LLM代码风格与Token成本的发现

Hacker News Top ↗ · 4天前缓存

本文讨论了LLM代码风格选择如何影响Token消耗和成本，并提供了优化建议，如使用Web API标准和更简单的缩进以减少输出Token。

0 人收藏 0 人点赞

#optimization

基于代理型AI的策略驱动物理层系统双层长期优化

arXiv cs.AI ↗ · 5天前缓存

本文提出了Agentic-LTPO，一种嵌套式双层优化框架，利用代理型AI在动态运营商策略下自适应物理层配置，在无小区MIMO波束赋形中实现了57.2%的长期性能提升。

0 人收藏 0 人点赞

#optimization

迷你可执行文件再探

Hacker News Top ↗ · 5天前缓存

本文重新审视了在 Linux 上创建极小 ELF 可执行文件的技术，探讨如何通过滥用头部字段和重叠结构将大小缩减至 45 字节，同时保持与 ELF 规范的兼容性。

0 人收藏 0 人点赞

#optimization

你现在到底在评估什么：提示词、上下文，还是整个框架？

Reddit r/AI_Agents ↗ · 5天前

关于AI评估焦点的讨论，质疑从业者是在优化提示词、上下文还是整个框架，并指出正转向整体优化。

0 人收藏 0 人点赞

optimization

提交意见反馈