标签
微软在Build 2026大会上发布了ASSERT,这是一个开源框架,可将自然语言行为规范转化为AI代理的可执行评估。
用户展示了使用Opus 4.8通过两轮对话即可实现语音生成CAD图形的基础演示,虽未达到工业级但适合做demo。
本文将从强化学习中继承的后继表征应用于自然语言,训练神经网络预测未来词的期望分布。研究表明,词性、词汇子类等语言类别无需显式监督即可自发涌现。
关于近期行业AI论文缺乏新颖性的批判性观察,以SkillOpt为例,这些论文将自然语言技能视为可训练的外部参数。
Browser-use 团队推出了一款用 Rust 编写的终端 TUI 工具,允许用户通过自然语言控制浏览器,支持使用登录态 Chrome、无头浏览器或 Browser Use 云端运行。
CADAM 是一个开源工具,通过自然语言在 Blender 中利用 ChatGPT、Claude 或 Gemini 生成 3D CAD 模型,支持参数化控制和多种导出格式。
本文认为,AI智能体的性能更多地取决于控制层(harness)而不是仅靠提示词,并提出了自然语言智能体控制层,使得设计选择可检查且可移植。
Rémi 分享说,他现在在笔记本电脑上使用 Qwen3.6-27B 直接在命令行中输入纯英文,突出展示了这款实用的人工智能工具在命令行交互中的应用。
介绍了一个名为 AI Humanize Text 的开源工具,通过多语言翻译链、大模型多轮改写等方法,将 AI 生成的文本改写得更自然,避免被检测。
Chronicle 是一个 324M 参数的纯解码器 Transformer,从零开始在自然语言和时间序列上预训练,在 NLU 和时间序列分类任务上取得了有竞争力的性能,并在 UCR/UEA 数据集上的冻结嵌入时间序列分类中创造了新的最先进水平。
Figma 在其协作画布中推出了一款 AI 智能体,用户可以通过自然语言提示生成、编辑和自动化设计任务,并借助与 OpenAI 和 Anthropic 的合作。
LLMEval-Logic 是一个新的中文基准,专门评估大语言模型的逻辑推理能力,具有求解器验证的答案和对抗性加固。该基准揭示了当前模型的显著差距,最佳模型在困难项目上仅达到37.5%的准确率。
xAI 发布了 xurl 技能的设置指南,使 Hermes AI 代理能够通过自然语言指令读取和写入 X(Twitter)。
Semble是一个面向Agent的代码搜索工具,支持自然语言查询,能精准返回语义完整的代码片段,比传统grep+read方式节省98% token消耗,具有智能分块、双路检索和代码感知重排序等特性。
一个基于AI的开源图表生成工具,通过自然语言创建 draw.io 图表,支持多模型,GitHub 星数 2.8 万。
Incantation 提出了一个交互式视频世界模型,该模型使用自然语言作为动作接口,实现细粒度的多实体控制和跨实体泛化,通过新颖的注意力机制和蒸馏技术实现了高性能和实时流式处理。
AgentSwarms推出了一个新的SQL与BI智能体工作区,允许用户上传CSV文件,用自然语言提问,自动转换为SQL查询并生成可视化图表。
Vex 是一款开源 CLI 代理框架,允许用户通过自然语言指令编辑视频,自动化处理静音移除、B-roll 添加和视觉生成等任务。
一条推文强调,尽管推理模型在理解细微差别和自然语言方面表现出色,但这种能力尚未传导到检索系统,指出了AI系统的一个关键瓶颈。