efficient-ai

标签

Cards List
#efficient-ai

Stratum:采用3D堆叠DRAM的系统硬件协同设计以实现高效MoE

Hacker News Top · 3天前

介绍了Stratum,一种采用3D堆叠DRAM的系统硬件协同设计方法,以高效加速混合专家(MoE)模型。

0 人收藏 0 人点赞
#efficient-ai

@antoine_chaffin: Reason-ModernColBERT 几乎完美解决了 BrowseComp-Plus,碾压 SOTA,并超越了 54 倍大的模型。还不错吧…

X AI KOLs Following · 6天前 缓存

Reason-ModernColBERT 在 BrowseComp-Plus 上取得了近乎完美的结果,超越了 SOTA 和 54 倍大的模型,随后 Agent-ModernColBERT 通过极少的训练进一步提升了性能。

0 人收藏 0 人点赞
#efficient-ai

MiniCPM-V 4.6

Product Hunt · 2026-05-12

MiniCPM-V 4.6 是一款专为移动设备优化的极致高效 13 亿参数视觉语言模型。

0 人收藏 0 人点赞
#efficient-ai

@ickma2311: 高效AI 第12讲:Transformer 与 LLM 本讲不仅介绍 LLM 的工作原理,还深入讲解其底层构建模块……

X AI KOLs Timeline · 2026-05-09 缓存

一门高效AI课程的第12讲笔记,涵盖 Transformer 与 LLM 基础知识,包括多头注意力机制、位置编码、KV 缓存,以及模型架构与推理效率之间的关联。内容阐释了 Transformer 中的设计选择如何影响内存占用、延迟表现和硬件效率。

0 人收藏 0 人点赞
#efficient-ai

单张4090上11.67% ARC-AGI-2本地评估:TOPAS递归架构

Reddit r/LocalLLaMA · 2026-05-07

作者介绍了TOPAS,一种递归AI架构,在单张RTX 4090上达到了ARC-AGI-2的11.67%,旨在证明架构效率可以超越原始计算能力。

0 人收藏 0 人点赞
#efficient-ai

Ternary Bonsai:1.58 比特下的顶级智能

Hacker News Top · 2026-04-18

一种使用三值权重(-1、0、1)的高效 AI 模型架构,仅需 1.58 比特/参数即可实现具有竞争力的性能,可部署在极度受限的设备上。

0 人收藏 0 人点赞
#efficient-ai

MiniCPM-V 4.5:通过架构、数据与训练配方打造高效多模态大语言模型

Papers with Code Trending · 2025-09-16 缓存

MiniCPM-V 4.5 是一款 8B 参数规模的多模态大语言模型,凭借统一的 3D-Resampler 架构、创新的数据策略以及混合强化学习方法,实现了高效率与卓越性能。据悉,该模型在显著降低 GPU 显存占用与推理耗时的同时,综合表现已超越更大规模的闭源及开源标杆模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈