博格方略

Code Agent 都用过了吗，能打几分？

一君_有问必答转载编程分享 2025-05-11 20:01:06

简介 OSCHINA 编辑部【OSC 有问必答】栏目，聚焦开发者提出的实际问题，邀请行业专家、技术大咖或资深开发者进行深度剖析和解答，人话版呈现开发者们最关心的问题。欢迎各位开发者说出你最关心的技术难题，也欢迎资深开发 er、行业专家、学者大咖们自荐！交流可添加微信：JunoHsu1122 近两年在大模型技术的催化下，各种 AI 编程工具相继登场，用过的开发者可能会有一个感受——它们像是一个“超级补全工具”——你敲几个字母，它帮...

超强辅助 Bolt.diy ⼀步搞定创意建站

OSCHINA 编辑部【OSC 有问必答】栏目，聚焦开发者提出的实际问题，邀请行业专家、技术大咖或资深开发者进行深度剖析和解答，人话版呈现开发者们最关心的问题。

欢迎各位开发者说出你最关心的技术难题，也欢迎资深开发 er、行业专家、学者大咖们自荐！

交流可添加微信：JunoHsu1122

近两年在大模型技术的催化下，各种 AI 编程工具相继登场，用过的开发者可能会有一个感受——它们像是一个“超级补全工具”——你敲几个字母，它帮你补全代码。这也是过去 AI 编程工具被使用最多的功能。

不过，今年的编程工具似乎又有了一个大的升级，不仅擅长续写，还能自己规划任务、调试代码、甚至独立完成一个简单项目。这就是 Code Agent，代码智能体。

从“补全”到“自主”：Code Agent 是什么？

传统 AI 编程就像一本高级词典：你输入关键词，它给出建议，但每一步都需要人类主导。比如你想写一个网页登录功能，它会帮你补全代码片段，但整体架构设计、错误调试还得你自己来。

Code Agent 则更像一个全栈工程师：你只需要告诉它“开发一个人脸识别的登录系统”，它就会自己拆解任务——调用摄像头接口、集成人脸识别算法、处理异常情况，甚至生成测试用例。整个过程完全自主，还能根据运行结果动态调整方案。核心区别在于，传统 AI 编程是被动响应，依赖人类指令。Code Agent 则是主动规划，像人类一样分解任务、迭代优化，甚至懂得“查漏补缺”。

实际演示更为直观，比如同样在 Comate 中，Chat 模式下，输入“帮我生成一个俄罗斯方块游戏”，输出的是创建这个游戏的步骤和一些核心代码展示。但是在 Zulu 智能体的模式下，它可以自动创建文件，完成编码，并生成一个网页版本的游戏链接，如果想进行调整，也只需要在对话框内输入“加快方块的下落速度”等修改指令。最终，Zulu 模式可以直接给出一个终端执行的跳转链接，一键进入刚刚创建好的游戏界面。

左图为 chat 模式，右图为 zulu 模式

思考及执行步骤：

创建项目设计文档 PLAN.md——项目规划，用来明确目标、功能模块和技术选型
创建index.html文件——网页的入口，负责结构，搭建游戏的基本骨架
创建style.css文件——处理样式，让游戏看起来更美观，布局合理
创建game.js文件——戏的核心逻辑所在，处理游戏规则、用户输入、图形渲染等
补充game.js的核心功能——具体说明每个功能的必要性
检查项目文件结构——验证项目完整性、验证游戏功能完整性
开发完成
一键跳转，执行终端命令打开游戏

基于已经开发的项目，想给游戏换个皮肤，zulu 会先查看现有游戏的实现内容，了解当前项目状态，查看修改：

查看HTML文件内容
查看CSS文件内容
更新CSS文件内容
更新HTML文件内容添加标题和说明
更新游戏逻辑添加视觉效果
启动游戏进行验证

5月7日，通义灵码宣布全面支持 Qwen3，上线了编程智能体。

同样在智能问答模式下，它只能生成代码，无法直接创建应用。切换智能体模式，让它帮我创建一个俄罗斯方块游戏，前面还很顺利，跳转到游戏页面，没有方块。报给通义之后，它进行了两轮自动检查修复，还是没成，接下来需要手动修复问题。（博主到这里就放弃了，欢迎各位开发 er 们投稿晒一晒你们使用各种 AI 编程工具的成功 or 失败的案例，有奖互动）

投稿流程：

登陆 OSCHINA 账号，发表博客

将博客链接贴到本篇文章评论区并艾特博主

Agentic 模式：Code Agent 的“超能力”从哪来？

“Agentic（智能体化）”是 Code Agent 的灵魂。2024年3月，吴恩达在一个人工智能峰会上提到，最让他兴奋的技术趋势就是 Agentic AI。这种新的工作流程让大模型不再是被动接受指令，然后直接给出一个结果，而是像人一样有一个完整的“思考”的过程，可以通过研究、规划、修改等方式，将复杂任务拆解为多个步骤，通过循环迭代逐步优化结果，与人类解决问题的思维模式更为接近。

Agentic AI 模式适用于复杂任务，有四大设计模式：

反思（Reflection）：让 AI 在输出结果后，自行思考结果中是否有错误或者需要改进的地方。比如在编写代码时，通过引入审查员角色来改进代码质量。
工具调用（Tool Use）：大语言模型可以发起 API 请求，进行函数调用，执行具体任务。
规划（Planning）：AI 为复杂任务设计执行计划。
多智能体协作（Multi-Agent Collaboration）：多个 AI 角色分工协作，共同完成任务。

Agentic AI 延伸至 Code 上，它的优势体现在三个维度：一是自主思考，用户通过自然语言输出需求，Code Agent 可以直接理解理解需求，最终输出完整代码；二是动态调试，AI 自己可以当“测试工程师”，如果代码报错，Code Agent 通常不会卡住，而是像程序员一样查看错误信息，自动修正代码；三是全局视角，可以实现理解整个代码库，传统 AI 只能看到当前文件，而 Code Agent 可以整合系统上下文，如版本控制记录、API文档、项目架构等，理解代码之间的关联。

实际上，Agentic 模式下的 code agent 也可以看作是一个多 Agent 的编排系统，核心在于动态分工与智能协同：通常主 Agent 进行任规划与分配，然后调度代码生成、测试、部署等专家 Agent，形成"规划专家拆解任务→工具专家调用API→执行专家运行代码"的协作链。

此外，通过建立跨 Agent 的上下文知识库，记录代码修改意图、版本差异等元数据，使前端代码生成 Agent 与测试 Agent 保持认知同步，避免传统单 Agent 系统常见的上下文割裂问题。这种架构在 Codeium 的 Windsurf IDE 中已实现，其 Flows 引擎能同时协调8个专业 Agent 完成需求分析到部署的全生命周期管理。

因此，Agentic 模式是变成了一个完全自驱的模式，给定需求后它会想办法实现用户目标，大模型在其中也有主观能动性。比如在个人开发者的开源项目 Auto-Coder 里，会提供一些工具，比如阅读、搜索文件、修改文件的工具，把这些工具的使用说明告诉大模型，大模型会根据输入的需求拆解目标，计划每一步需要调用哪个工具。同时，大模型也会据工具调用结果更新系统状态，相当于边走边看，持续决策直至满足以下任一终止条件：

模型判定需求已实现
达到预设执行阈值
模型请求人工干预

Agentic 模式下的编程助手被寄予厚望，Cognition 创始人&CEO Scott Wu 在一档播客中畅谈了大热的 AI 程序员 Devin 的构建过程，以及 AI 编程对整个软件工程行业未来的趋势性影响。他提到，“我们一直在采用智能体化（Agentic）的方法，我认为最大的跃进在于异步与同步的区别，很多代码助手使用语言模型对代码进行自动补全，这节省了工程师的一部分时间，整体上将工程效率提升了 10% 到 20%。但 Devin 能够承担整个编码任务，它的提升是 10 倍，而不是 10%。用户可以将任务交给 Devin，然后继续处理自己的事情，他们可以同时运行其他 Devin，完成不同任务。”

市场新宠，“全员”上线 Agent 版本

Transformer 的自回归机制是根据前文 token 生成下一个 token，而代码恰恰是极具结构化的语言，可以说让大模型来写代码，天生专业对口。

近期，AI 编程资本市场的火爆也代表的业界对于其前景的看好。根据彭博社 5 月 6 日上午报道，OpenAI 已同意以约 30 亿美元（约合人民币 218 亿）收购 AI 编程助手开发商 Windsurf。据《金融时报》援引知情人士消息，Cursor 的开发公司 Anysphere 完成了一轮规模达 9 亿美元，推动估值达到约90亿美元，约合650亿元人民币，较年初暴涨逾3倍。

根据 Spherical Insights 的预测，至2032年，全球 AI 编码工具市场规模将超过295亿美元。种种消息显示，AI 编程正经历技术与商业的双重质变。

在这种背景下，海内外各大编程产品也在最近半年内，密集上线 Agent 版本，迈向 Agentic AI。

Cursor 在去年底上线了 Agent 版本，今年 4 月新版本中已经支持直接从对话生成规则/Generate Cursor Rules。Cursor Rules 用于自定义 AI 在 Cursor 中的行为，可以视为对大型语言模型（LLM）的指令或系统提示，也就是面向 Cursor 的“提示词”。

支持从对话生成规则后，可以让 AI 将你与 AI 之间来回的对话归纳成规则。这样 Agent 便可以通过分析当前对话中的需求、代码片段及项目结构，自动生成符合语义的规则模板。便于下次使用时，提取历史对话的上下文环境。例如，当用户讨论“Vue 3 组件命名规范”时，Agent 能提取关键词并生成对应的 PascalCase 命名规则。

号称一直采用 Agentic 方法的 Devin 在去年12月正式上线，以每月 500 美元的订阅价格销售。理论上它可以无需人类参与自行编写代码，并完成通常分配给人类开发人员的整个项目。而且，用户可以用多个 Devin Agent 并行完成不同的编程项目。

今年1月，字节跳动旗下 Trae 新增 AI 编程功能并发布海外版 Trae，支持 Agent 模式下的全流程开发，能感知 IDE 环境变化并实时调整代码，比如自动同步前后端接口。

今年 2 月， Copilot 上线了名为 "Project Padawan" 的自主 Agent。Padawan 将允许直接将问题分配给 Copilot，并进行全面测试，能够完成多种开发任务，如代码生成与审查、代码库重构或优化、自动化测试或流水线等流程、在架构设计错误排查及最佳实践上提供指导等等。

3月，百度旗下的文心快码宣布推出 Comate Zulu 版本并正式开放公测。Baidu Comate 研发工程师陈一言曾在3月源创会上表示，Zulu 的核心价值是能将陌生项目的结构、流程图、数据流和关键功能模块清晰解析，并标注对应代码位置。例如想添加自动测试功能时，无需手动查找文件，只需提出需求，Zulu 会自动定位修改位置并逐步实现。Zulu 还有 MVP 版本，对于代码修改可能引发的连锁影响，虽偶有需求理解偏差或报错，但通过少量人工校准即可解决。

与传统 AI 智能体对比，传统方案需在 Prompt 中预设完整流程，如数据分析步骤，若流程出错需人工干预。而 Zulu 采用自主规划策略，通过工具调用与环境交互：例如让 IDE 读取文件内容，若结果与预期不符，则调用规划工具制定新方案，再调用工具修改代码；若发现修改错误，可重新调用工具修正，这种动态循环机制实现了灵活的问题解决路径。

5月7日，通义灵码宣布全面支持 Qwen3，上线了编程智能体，具备自主决策、环境感知、工具使用等能力，可以根据开发者的诉求，使用工程检索、文件编辑、终端等工具，端到端地完成编码任务。同时支持开发者配置自己的 MCP 工具，更加贴合开发者工作流程，并集成魔搭 MCP 广场，开发者也可以一键下载 MCP 服务。

当前 AI 编程赛道的竞争格局，俨然重现了去年"百模大战"的硝烟弥漫——家家都练出了令人侧目的肌肉，然而今日的现象级产品，很可能在下一轮技术迭代中因功能创新滞后而淡出视野。当技术迭代速度从以年计算压缩至以周为单位，如何在用户心智中建立技术代差优势，构建真正的用户粘性，正成为所有参赛者的生死命题。

从技术应用的实际效果看，短期内，Code Agent更像“编程加速器”，它能显著提升常规功能模块的开发效率，但在处理复杂系统架构设计、关键业务逻辑验证，以及大型历史项目的代码重构时，仍需要人类工程师的深度参与并最终决策。这既是当前技术的客观局限，也是保证软件工程可靠性的必要防线。

但是长期来看，编程必将从“手工劳动”迈向“智能生产”，颠覆开发范式的颠覆。

正如 Cursor 母公司 Anthropic 首席执行官 Dario Amodei 在今年3月的一次公开发言中所说：“未来3到6个月，AI 将编写90%的代码，而在12个月内，几乎所有的代码都可能由 AI 编写。”这场始于代码补全的技术革命，终将重塑整个软件产业的底层逻辑。

致谢：本文的写作是受到 Auto-Coder 开源项目和3月份源创会 zulu 亮相的启发。

Auto-code 是开发者祝海林个人的一个开源项目，可以帮助开发者完成多种模式下的辅助编程，我们也跟作者聊了一下，可以看看开发者视角视角中的 Code Agent：对话 Auto-coder 作者，「Code Agent」和去年的 AI 编程比有什么不一样？

体验 Auto-Coder https://pypistats.org/packages/auto-coder

Zulu 是文心快码 Baidu Comate 编码辅助工具，中的智能体，可以进行代码问答等交互，感兴趣的读者可以查看源创会上关于 Zulu 的演讲：AI 编码工具也有自己的智能体了

体验 Comate Zulu https://comate.baidu.com/zh/competitorKeywords?track=SEM2025zulucp&bd_vid=10828110607619385952

转载链接：https://my.oschina.net/u/4489239/blog/18348629

Tags：

2 0 0 0

本篇评论 —— 揽流光，涤眉霜，清露烈酒一口话苍茫。

提交

声明：参照站内规则，不文明言论将会删除，谢谢合作。

ABOUT ME

Blogger：袅袅牧童 | Arkin

Ido：PHP攻城狮

WeChat：nnmutong

Email：nnmutong@icloud.com

Code Agent 都用过了吗，能打几分？

从“补全”到“自主”：Code Agent 是什么？

Agentic 模式：Code Agent 的“超能力”从哪来？

市场新宠，“全员”上线 Agent 版本

相关文章

本篇评论 —— 揽流光，涤眉霜，清露烈酒一口话苍茫。

ABOUT ME

点击排行

最新评论

—— 揽流光，涤眉霜，清露烈酒一口话苍茫。

猜您喜欢

博格推荐

标签云

友情链接