agentic-coding

标签

Cards List
#agentic-coding

引用 Andrew Kelley

Simon Willison's Blog · 2026-04-30 缓存

Zig 语言的创造者 Andrew Kelley 认为,通过独特的错误和一种“数字气味”,可以检测出由大语言模型(LLM)辅助的贡献,他将其比作在非吸烟房屋中吸烟。

0 人收藏 0 人点赞
#agentic-coding

@_akhaliq:OpenGame 开放代理式游戏编码论文:https://huggingface.co/papers/2604.18394…

X AI KOLs Following · 2026-04-21

研究人员发布 OpenGame,一个专为游戏开发打造的开放代理式编码框架。

0 人收藏 0 人点赞
#agentic-coding

首次实现本地真实编程工作

Reddit r/LocalLLaMA · 2026-04-21

开发者借助 Qwen3.6-35B 4-bit MLX 模型与 pi.dev 工具,在当前硬件上实现了高效的本地智能体编程,顺利完成了实际项目工单。

0 人收藏 0 人点赞
#agentic-coding

Qwen/Qwen3.6-27B-FP8

Hugging Face Models Trending · 2026-04-21 缓存

阿里巴巴发布 Qwen3.6-27B-FP8,一款 27B 参数的 FP8 量化模型,在代理式编码与推理基准上表现强劲,现已上架 Hugging Face。

0 人收藏 0 人点赞
#agentic-coding

Qwen/Qwen3.6-27B

Hugging Face Models Trending · 2026-04-21 缓存

Qwen 在 Hugging Face 上发布了开源权重模型 Qwen3.6-27B,该模型具备更高的稳定性、强大的智能体编程能力以及思维链保留特性,有助于提升开发者的工作效率。

0 人收藏 0 人点赞
#agentic-coding

OpenGame:面向游戏开发的开放智能体编码框架

Papers with Code Trending · 2026-04-20 缓存

OpenGame 是一个开源的智能体框架,旨在实现端到端的网页游戏创建。该框架由专用的 GameCoder-27B 模型驱动,并通过全新的 OpenGame-Bench 基准进行评估。

0 人收藏 0 人点赞
#agentic-coding

精准调试基准:你的模型在调试还是在重写?

Hugging Face Daily Papers · 2026-04-19 缓存

# 论文页面 - 精准调试基准:你的模型在调试还是在重写? 来源:[https://huggingface.co/papers/2604.17338](https://huggingface.co/papers/2604.17338) ## 摘要 前沿大模型在测试通过率上表现优异,但在调试任务中的精准度却很低,暴露出功能正确与精准定位缺陷之间的鸿沟。与代码补全不同,调试需定位错误并做针对性修改。我们观察到,前沿大模型在调试时往往重写出正确却过度修改的代码。

0 人收藏 0 人点赞
#agentic-coding

为代理式编码扩展测试时计算

Hugging Face Daily Papers · 2026-04-16 缓存

一种面向代理式编码的测试时扩展框架,可将 rollout 轨迹压缩为结构化摘要,并通过递归投票/PDR 将 Claude-4.5-Opus 在 SWE-Bench Verified 上的成绩提升至 77.6%。

0 人收藏 0 人点赞
#agentic-coding

Qwen/Qwen3.6-35B-A3B

Hugging Face Models Trending · 2026-04-15 缓存

Qwen 发布 Qwen3.6-35B-A3B,一款开源权重的混合专家(MoE)模型,总参数量 35B,激活参数量 3B,在智能体编码和推理能力保持方面实现显著提升。

0 人收藏 0 人点赞
#agentic-coding

Steve Yegge

Simon Willison's Blog · 2026-04-13 缓存

Steve Yegge 声称谷歌的AI应用落后于行业标准,大多数工程师仍在使用基础聊天工具,但谷歌高管 Addy Osmani 和 Demis Hassabis 公开反驳了这一说法,称每周有超过4万名工程师使用智能编码工具。

0 人收藏 0 人点赞
#agentic-coding

GPT-5.2-Codex 介绍

OpenAI Blog · 2025-12-18 缓存

OpenAI 发布了 GPT-5.2-Codex,这是一个先进的代理型编码模型,针对复杂软件工程任务进行了优化,在长上下文理解、Windows 支持和网络安全能力方面有所改进。该模型在 SWE-Bench Pro 和 Terminal-Bench 2.0 上取得了最先进的性能,现已向付费 ChatGPT 用户开放,API 访问将在未来几周内提供。

0 人收藏 0 人点赞
#agentic-coding

DeepCode:开放式智能体编程

Papers with Code Trending · 2025-12-08 缓存

DeepCode 是一个完全自主的框架,用于从文档到代码库的合成,通过原则性的信息流管理将科学论文转化为生产级代码,在 PaperBench 上取得了最先进的结果,并超越了博士级人类专家。

0 人收藏 0 人点赞
#agentic-coding

Agent README 文件:对智能体编程中上下文文件的实证研究

Papers with Code Trending · 2025-11-17 缓存

本文提出了首个针对智能体编程工具中使用的代理上下文文件(README)的大规模实证研究,分析了其结构、维护模式和内容。研究表明,虽然功能性上下文得到了充分覆盖,但安全性和性能等非功能性需求却很少被明确指定。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈