llama

#llama

研究警告：AI已能比人类更出色地通过图灵测试

Reddit r/ArtificialInteligence ↗ · 2026-05-20 缓存

一项发表在PNAS上的新研究表明，诸如GPT-4.5等先进LLM已能通过图灵测试，且参与者认为它们比真人更具人性，这一结果促使学界重新审视该测试的衡量标准。

0 人收藏 0 人点赞

#llama

@dair_ai: Meta的新论文：Agentic Discovery of Neural Architectures。这是一个热门的新研究领域！请密切关注。

X AI KOLs Following ↗ · 2026-05-18 缓存

Meta的新论文介绍了一个智能体系统，它能在24小时的计算预算内自主发现神经架构，在350M、1B和3B规模上超越Llama 3.2。

0 人收藏 0 人点赞

#llama

MTP PR 已合并！！！

Reddit r/LocalLLaMA ↗ · 2026-05-16

与 LLaMA 模型相关的 MTP（可能指模型训练管道或类似内容）拉取请求已合并，标志着一个里程碑。

0 人收藏 0 人点赞

#llama

让小型模型在自身错误中训练：它在HumanEval上达到80%，并在数学上超越GPT-3.5

Reddit r/LocalLLaMA ↗ · 2026-05-14

一位研究人员让小型语言模型在自己生成的编程错误和修正上进行训练，在HumanEval上达到80%，并在数学上超越GPT-3.5，展示了在极少资源下的有效自我改进。

0 人收藏 0 人点赞

#llama

介绍 cyankiwi AWQ 4-bit 量化——26.05 更新

Reddit r/LocalLLaMA ↗ · 2026-05-14

Cyankiwi 推出了其 AWQ 4-bit 量化方法的更新版本，该方法联合优化缩放因子和量化范围，在 Llama-3 模型上实现了比现有方法更低的 KL 散度。

0 人收藏 0 人点赞

#llama

nvidia/llama-embed-nemotron-8b 的 MLX 16/8/4/2 位量化版本

Reddit r/LocalLLaMA ↗ · 2026-05-14

用户将 Nvidia 的 Llama-Embed-Nemotron-8B 模型转换为 MLX 格式，包含 fp16、8位、4位和2位量化，从而能够通过 mlx-embeddings 在 Apple Silicon 上实现在进程内加载嵌入向量。

0 人收藏 0 人点赞

#llama

出版商和 Scott Turow 在诉讼中指控 Mark Zuckerberg“亲自授权并积极鼓励”Meta 大规模侵犯版权以训练 AI 系统

Reddit r/singularity ↗ · 2026-05-11 缓存

图书出版商及作者 Scott Turow 对 Meta 及其 CEO Mark Zuckerberg 提起集体诉讼，指控该公司非法复制数百万部版权作品用于训练其 Llama AI 模型，从而规避了许可和版权保护。

0 人收藏 0 人点赞

#llama

粒度轴：语言模型中社会角色的微观到宏观隐式方向

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

这篇研究论文探讨了大型语言模型如何将社会角色的细粒度性编码为一个结构化的潜在维度。研究证实，这一“细粒度轴”在 Qwen3 和 Llama-3 等不同架构中保持一致，并且可以通过激活 steering（activation steering）进行因果干预。

0 人收藏 0 人点赞

#llama

UniPool：一种用于混合专家模型的全球共享专家池

Hugging Face Daily Papers ↗ · 2026-05-07 缓存

UniPool 为混合专家（MoE）模型引入了一种共享专家池架构，在降低参数随深度增长的同时，相较于标准 MoE 基线提高了效率和性能。

0 人收藏 0 人点赞

#llama

我们什么时候才能买到消费级推理芯片？

Reddit r/LocalLLaMA ↗ · 2026-04-23

文章质疑为何没有创业公司推出售价 200–300 美元、内置 Llama 3 的消费级推理芯片，并暗示行业更偏爱靠 API 订阅持续赚钱，而非一次性硬件销售。

0 人收藏 0 人点赞

#llama

CBRS：基于双语数据集与双层过滤的多平台社交流认知血液请求系统

arXiv cs.CL ↗ · 2026-04-21 缓存

孟加拉国工程技术大学的研究人员提出了CBRS，一个多平台框架，采用双层架构并利用包含1.1万条孟加拉语和英语双语解析血液请求消息的新数据集，对社交媒体中的血液捐赠请求进行过滤和解析。其LoRA微调的Llama-3.2-3B模型实现了99%的过滤准确率和92%的零样本解析准确率，在减少35倍令牌使用量的同时，优于GPT-4o-mini等其他大语言模型。

0 人收藏 0 人点赞

#llama

QWEN3.6 + ik_llama 快得离谱

Reddit r/LocalLLaMA ↗ · 2026-04-19

用户报告成功部署 Qwen 3.6 与 ik_llama 量化，在消费级硬件（16GB VRAM、32GB RAM）上实现 200k 上下文窗口下 50+ token/秒。

0 人收藏 0 人点赞

llama

提交意见反馈