@mayhewsw 新论文:我知道现在流行把算力规模扩大10倍,让模型一步步思考并使用工具,但……
摘要
作者发布了 Universal NER v2,这是一篇将在 LREC 2026 发表的命名实体识别论文,刻意回避了当代的“规模扩张+工具调用”潮流。
新论文:我知道现在流行把算力规模扩大10倍,让模型一步步思考并使用工具,但我和我的团队仍在发“2003 年就能写出来”的论文。隆重介绍:Universal NER v2,见刊 LREC 2026。
相似文章
@dair_ai: Meta的新论文:Agentic Discovery of Neural Architectures。这是一个热门的新研究领域!请密切关注。
Meta的新论文介绍了一个智能体系统,它能在24小时的计算预算内自主发现神经架构,在350M、1B和3B规模上超越Llama 3.2。
@NielsRogge: http://paperswithco.de上的热门论文是"FastContext: Training Efficient Repository Explorer for Coding Agents"…
微软的FastContext是一篇热门论文,介绍了一个搭配编码代理用于高效代码检索的4B小模型,在SWE-Bench Multilingual上能与闭源系统匹敌。
@dair_ai: https://x.com/dair_ai/status/2056018543850754283
一份关于5月11日至17日顶级人工智能论文的综述,涵盖了用于长上下文预训练的Lighthouse Attention、grep与嵌入检索在编码代理中的对比,以及揭示LLMs中几何计算器的机制可解释性工作。
信息密度对用户生成内容命名实体识别影响的机制与优化研究
arXiv 预印本指出,信息密度低是 NER 在嘈杂用户生成内容性能崩溃的根本原因,并提出窗口感知优化模块(WOM),在 WNUT2017 上最高提升 F1 4.5%。
@HuggingPapers: 本周@huggingface上的人工智能顶尖论文(6月1日至7日)——关于PEFT的规模化:迈向百万个万亿参数的个人模型
Hugging Face上值得注意的人工智能论文每周综述,涵盖PEFT规模化、多智能体协作、推测解码等话题。