248k-context

标签

Cards List
#248k-context

@leopardracer: GEMMA 4 26B 在 RTX 4060 上运行,拥有 248K Token 上下文窗口,每秒 20 个 Token,上下文窗口大得可以……

X AI KOLs Timeline · 3天前 缓存

Gemma 4 26B 在 RTX 4060 上运行,通过 llama.cpp 和 Q4_K_XL 量化实现 248K Token 上下文和每秒 20 Token 的速度,从而在消费级硬件上本地处理整个代码库。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈