gemma-3

标签

Cards List
#gemma-3

一颗卫星现在在轨道上运行谷歌的Gemma 3视觉语言模型,进行星载推理,而不是先下行传输所有数据

Reddit r/singularity · 6天前

Loft Orbital的YAM-9卫星在轨运行谷歌的Gemma 3视觉语言模型,用于实时图像分析,通过决定发送哪些数据到地球,减少了下行带宽和延迟。

0 人收藏 0 人点赞
#gemma-3

大语言模型中欺骗探测探头的压力测试:可伸缩性、鲁棒性与欺骗表征的几何特性

Hugging Face Daily Papers · 2026-05-27 缓存

本文系统测试了用于大语言模型欺骗检测的线性探头,发现它们在分布偏移下失效,但风格增强型探头能恢复性能,并揭示欺骗是通过分布式亚阈值特征编码的。

0 人收藏 0 人点赞
#gemma-3

你现在可以读懂Gemma 3的想法了

Reddit r/LocalLLaMA · 2026-05-08

Anthropic和Neuronpedia发布了关于自然语言自动编码器(NLA)的研究和工具,用户可以在Gemma 3生成token时查看其内部的“想法”。此次发布包括了Auto Verbalizer和Activation Reconstructor的模型权重,托管在Hugging Face和Neuronpedia上。

0 人收藏 0 人点赞
#gemma-3

介绍 Gemma 3 270M:超高效 AI 的紧凑型模型

Google DeepMind Blog · 2025-10-23 缓存

Google 推出 Gemma 3 270M,这是一个拥有 2.7 亿参数的紧凑型模型,专为高效边缘设备 AI 设计,具有强大的指令遵循能力和极致的能效表现(在 Pixel 9 Pro 上进行 25 次对话仅消耗 0.75% 电量)。

0 人收藏 0 人点赞
#gemma-3

推出 Gemma 3

Google DeepMind Blog · 2025-03-12 缓存

Google 推出了 Gemma 3,这是一套轻量级开源模型集合(1B、4B、12B、27B),设计用于在单个 GPU 或 TPU 上运行,支持 140+ 种语言、128k 上下文窗口和多模态功能。这些模型在保持高效性能的同时,性能超越了 Llama 3 和 DeepSeek-V3 等更大的竞品,适合边缘设备部署。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈