optimization

标签

Cards List
#optimization

优化 LLVM 的 bump 分配器

Lobsters Hottest · 3小时前 缓存

这篇博客文章详细介绍了对 LLVM 的 BumpPtrAllocator 进行的三项近期优化,通过移除冗余对齐、空指针检查以及每次分配的记账开销来减少快速路径开销,从而提升了 Clang、lld 及其他 LLVM 组件的性能。

0 人收藏 0 人点赞
#optimization

Wasserstein空间中的凸差规划及其在MMD优化中的应用

arXiv cs.LG · 3小时前 缓存

本文介绍了Wasserstein空间中的凸差规划框架,用于优化概率测度上的非凸泛函,给出了最大均值差异(MMD)和能量距离(ED)的显式分解,并证明了提升的凸凹过程的收敛性。

0 人收藏 0 人点赞
#optimization

COOPA:一种面向运筹学问题的模块化LLM智能体架构

arXiv cs.LG · 3小时前 缓存

本文介绍了COOPA,一种面向运筹学问题的模块化LLM智能体架构,它结合了基于迭代置信度的建模、元素级溯源和多求解器路由。在八个LLM主干网络和四个基线的评估中,COOPA在六个主干网络上取得了最佳的宏平均准确率,并在最强基线的基础上提升了最多6.7个百分点。

0 人收藏 0 人点赞
#optimization

huff12 - 一个适用于Apple Silicon的12流Huffman解码器

Lobsters Hottest · 15小时前

huff12是一个针对Apple Silicon处理器优化的12流Huffman解码器,旨在通过并行流处理来提高解码性能。

0 人收藏 0 人点赞
#optimization

@antoniolupetti:《神经网络数学》是一套优秀的讲义,适合任何希望从数学角度研究现代神经网络的人……

X AI KOLs Timeline · 昨天 缓存

一套涵盖神经网络数学的讲义,从基本激活函数到群卷积和等变性等几何概念。

0 人收藏 0 人点赞
#optimization

@rohanpaul_ai: 大语言模型可以从没有已知答案的问题中学习更好的编码行为。许多实际问题并没有现成的标准答案...

X AI KOLs Following · 昨天 缓存

论文提出了一种名为 RiVER 的强化学习方法,该方法通过对程序在隐藏测试用例上进行排序并提供分级反馈,提升了大语言模型在没有已知标准答案的问题上的编码表现。

0 人收藏 0 人点赞
#optimization

反思优化

Hacker News Top · 2天前 缓存

一篇博客文章,讨论针对受约束的分类概率分布的优化技术,使用softmax重参数化和log barrier方法,应用于蛋白质结合剂设计。

0 人收藏 0 人点赞
#optimization

帮助优化 llama.cpp + Qwen 27B 在 RTX PRO 6000 Blackwell 上用于编码代理的配置

Reddit r/LocalLLaMA · 2天前

用户详细介绍了他们在 RTX PRO 6000 Blackwell 上使用 llama.cpp 运行 Qwen 27B 进行本地编码代理的设置,与 Claude 模型进行了性能对比,并请求帮助解决频繁崩溃和响应格式错误的问题。

0 人收藏 0 人点赞
#optimization

草图线性对比学习:近似、优化与统计缩放

arXiv cs.LG · 3天前 缓存

本文推导了在高斯潜变量模型下的草图线性对比学习的缩放定律,分析了风险如何分解为近似项、优化项和统计项,并为对比学习中平衡模型规模、数据和计算提供了理论指导。

0 人收藏 0 人点赞
#optimization

面向仓库优化的上下文感知流水线合成

arXiv cs.AI · 3天前 缓存

本文提出CASOP(上下文感知优化流水线合成与评估框架),用于仓库订单履约中优化流水线的上下文感知合成与评估,支持从模块化仓库中自动构建有效的算法流水线。

0 人收藏 0 人点赞
#optimization

马尔可夫噪声下的高概率PL-SGD:最优混合与尾部依赖

arXiv cs.LG · 3天前 缓存

本文为PL平滑目标在马尔可夫噪声下的随机梯度下降提供了最优高概率界,填补了期望保证与高概率保证之间的差距,并扩展到重尾设置,给出了匹配的下界。

0 人收藏 0 人点赞
#optimization

当智能体遇上电动公交车队运营:聚合框架中的定价行为、权衡与政策启示

arXiv cs.AI · 3天前 缓存

本文提出了一种用于协调电动公交车队运营的智能体聚合框架,将基于优化的调度与监督型AI智能体相结合,以处理干扰、电价适应和价值分配,揭示了运营效率与利润导向定价之间的权衡。

0 人收藏 0 人点赞
#optimization

@BunnyxStudio: 花了 3 周时间告别 SwiftData,现在 Hive 的启动速度有了显著的提升,66000张图片的资料库基本无需等待即刻使用。减少冷启动的时间对于体验来说真的很重要。

X AI KOLs Following · 3天前 缓存

BunnyxStudio 花费3周时间移除了SwiftData,使得Hive应用启动速度显著提升,66000张图片的资料库几乎无需等待即可使用。

0 人收藏 0 人点赞
#optimization

LFM2.5 230M 使用自定义 WebGPU 内核在浏览器中以 1,400 tok/s 运行

Reddit r/LocalLLaMA · 3天前

LFM2.5 230M 模型使用自定义 WebGPU 内核在浏览器中实现每秒 1,400 个 token,展示了高效的本地推理。

0 人收藏 0 人点赞
#optimization

结构化主键

Lobsters Hottest · 3天前 缓存

本文讨论了传统主键设计如何导致表孤立,并介绍了结构化主键作为一种替代方案,以提高SQL查询性能并维护关系完整性。

0 人收藏 0 人点赞
#optimization

我们如何通过将稳定上下文移出提示词来使AI代理更快

Reddit r/AI_Agents · 3天前

描述了一种通过将稳定上下文移出提示词来提高AI代理速度的技术,从而减少令牌使用量和延迟。

0 人收藏 0 人点赞
#optimization

我对LLM代码风格与Token成本的发现

Hacker News Top · 4天前 缓存

本文讨论了LLM代码风格选择如何影响Token消耗和成本,并提供了优化建议,如使用Web API标准和更简单的缩进以减少输出Token。

0 人收藏 0 人点赞
#optimization

基于代理型AI的策略驱动物理层系统双层长期优化

arXiv cs.AI · 5天前 缓存

本文提出了Agentic-LTPO,一种嵌套式双层优化框架,利用代理型AI在动态运营商策略下自适应物理层配置,在无小区MIMO波束赋形中实现了57.2%的长期性能提升。

0 人收藏 0 人点赞
#optimization

迷你可执行文件再探

Hacker News Top · 5天前 缓存

本文重新审视了在 Linux 上创建极小 ELF 可执行文件的技术,探讨如何通过滥用头部字段和重叠结构将大小缩减至 45 字节,同时保持与 ELF 规范的兼容性。

0 人收藏 0 人点赞
#optimization

你现在到底在评估什么:提示词、上下文,还是整个框架?

Reddit r/AI_Agents · 5天前

关于AI评估焦点的讨论,质疑从业者是在优化提示词、上下文还是整个框架,并指出正转向整体优化。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈