Code Agent 都用过了吗,能打几分?

首页 编程分享 EXPERIENCE 正文

一君_有问必答 转载 编程分享 2025-05-11 20:01:06

简介 OSCHINA 编辑部【OSC 有问必答】栏目,聚焦开发者提出的实际问题,邀请行业专家、技术大咖或资深开发者进行深度剖析和解答,人话版呈现开发者们最关心的问题。 欢迎各位开发者说出你最关心的技术难题,也欢迎资深开发 er、行业专家、学者大咖们自荐! 交流可添加微信:JunoHsu1122 近两年在大模型技术的催化下,各种 AI 编程工具相继登场,用过的开发者可能会有一个感受——它们像是一个“超级补全工具”——你敲几个字母,它帮...


OSCHINA 编辑部【OSC 有问必答】栏目,聚焦开发者提出的实际问题,邀请行业专家、技术大咖或资深开发者进行深度剖析和解答,人话版呈现开发者们最关心的问题。

欢迎各位开发者说出你最关心的技术难题,也欢迎资深开发 er、行业专家、学者大咖们自荐!

交流可添加微信:JunoHsu1122

近两年在大模型技术的催化下,各种 AI 编程工具相继登场,用过的开发者可能会有一个感受——它们像是一个“超级补全工具”——你敲几个字母,它帮你补全代码。这也是过去 AI 编程工具被使用最多的功能。

不过,今年的编程工具似乎又有了一个大的升级,不仅擅长续写,还能自己规划任务、调试代码、甚至独立完成一个简单项目。这就是 Code Agent,代码智能体。

从“补全”到“自主”:Code Agent 是什么?

传统 AI 编程就像一本高级词典:你输入关键词,它给出建议,但每一步都需要人类主导。比如你想写一个网页登录功能,它会帮你补全代码片段,但整体架构设计、错误调试还得你自己来。

Code Agent 则更像一个全栈工程师:你只需要告诉它“开发一个人脸识别的登录系统”,它就会自己拆解任务——调用摄像头接口、集成人脸识别算法、处理异常情况,甚至生成测试用例。整个过程完全自主,还能根据运行结果动态调整方案。核心区别在于,传统 AI 编程是被动响应,依赖人类指令。Code Agent 则是主动规划,像人类一样分解任务、迭代优化,甚至懂得“查漏补缺”。

实际演示更为直观,比如同样在 Comate 中,Chat 模式下,输入“帮我生成一个俄罗斯方块游戏”,输出的是创建这个游戏的步骤和一些核心代码展示。但是在 Zulu 智能体的模式下,它可以自动创建文件,完成编码,并生成一个网页版本的游戏链接,如果想进行调整,也只需要在对话框内输入“加快方块的下落速度”等修改指令。最终,Zulu 模式可以直接给出一个终端执行的跳转链接,一键进入刚刚创建好的游戏界面。

      

左图为 chat 模式,右图为 zulu 模式

思考及执行步骤:

  1. 创建项目设计文档 PLAN.md——项目规划,用来明确目标、功能模块和技术选型

  2. 创建index.html文件——网页的入口,负责结构,搭建游戏的基本骨架

  3. 创建style.css文件——处理样式,让游戏看起来更美观,布局合理

  4. 创建game.js文件——戏的核心逻辑所在,处理游戏规则、用户输入、图形渲染等

  5. 补充game.js的核心功能——具体说明每个功能的必要性

  6. 检查项目文件结构——验证项目完整性、验证游戏功能完整性

  7. 开发完成

  8. 一键跳转,执行终端命令打开游戏

基于已经开发的项目,想给游戏换个皮肤,zulu 会先查看现有游戏的实现内容,了解当前项目状态,查看修改:

  1. 查看HTML文件内容

  2. 查看CSS文件内容

  3. 更新CSS文件内容

  4. 更新HTML文件内容添加标题和说明

  5. 更新游戏逻辑添加视觉效果

  6. 启动游戏进行验证

5月7日,通义灵码宣布全面支持 Qwen3,上线了编程智能体。

同样在智能问答模式下,它只能生成代码,无法直接创建应用。切换智能体模式,让它帮我创建一个俄罗斯方块游戏,前面还很顺利,跳转到游戏页面,没有方块。报给通义之后,它进行了两轮自动检查修复,还是没成,接下来需要手动修复问题。(博主到这里就放弃了,欢迎各位开发 er 们投稿晒一晒你们使用各种 AI 编程工具的成功 or 失败的案例,有奖互动)

投稿流程:

  1. 登陆 OSCHINA 账号,发表博客

  2. 将博客链接贴到本篇文章评论区并艾特博主

Agentic 模式:Code Agent 的“超能力”从哪来?

“Agentic(智能体化)”是 Code Agent 的灵魂。2024年3月,吴恩达在一个人工智能峰会上提到,最让他兴奋的技术趋势就是 Agentic AI。这种新的工作流程让大模型不再是被动接受指令,然后直接给出一个结果,而是像人一样有一个完整的“思考”的过程,可以通过研究、规划、修改等方式,将复杂任务拆解为多个步骤,通过循环迭代逐步优化结果,与人类解决问题的思维模式更为接近。

Agentic AI 模式适用于复杂任务,有四大设计模式:

  • 反思(Reflection):让 AI 在输出结果后,自行思考结果中是否有错误或者需要改进的地方。比如在编写代码时,通过引入审查员角色来改进代码质量。

  • 工具调用(Tool Use):大语言模型可以发起 API 请求,进行函数调用,执行具体任务。

  • 规划(Planning):AI 为复杂任务设计执行计划。

  • 多智能体协作(Multi-Agent Collaboration):多个 AI 角色分工协作,共同完成任务。

Agentic AI 延伸至 Code 上,它的优势体现在三个维度:一是自主思考,用户通过自然语言输出需求,Code Agent 可以直接理解理解需求,最终输出完整代码;二是动态调试,AI 自己可以当“测试工程师”,如果代码报错,Code Agent 通常不会卡住,而是像程序员一样查看错误信息,自动修正代码;三是全局视角,可以实现理解整个代码库,传统 AI 只能看到当前文件,而 Code Agent 可以整合系统上下文,如版本控制记录、API文档、项目架构等,理解代码之间的关联。

实际上,Agentic 模式下的 code agent 也可以看作是一个多 Agent 的编排系统,核心在于动态分工与智能协同:通常主 Agent 进行任规划与分配,然后调度代码生成、测试、部署等专家 Agent,形成"规划专家拆解任务→工具专家调用API→执行专家运行代码"的协作链。

此外,通过建立跨 Agent 的上下文知识库,记录代码修改意图、版本差异等元数据,使前端代码生成 Agent 与测试 Agent 保持认知同步,避免传统单 Agent 系统常见的上下文割裂问题。这种架构在 Codeium 的 Windsurf IDE 中已实现,其 Flows 引擎能同时协调8个专业 Agent 完成需求分析到部署的全生命周期管理。

因此,Agentic 模式是变成了一个完全自驱的模式,给定需求后它会想办法实现用户目标,大模型在其中也有主观能动性。比如在个人开发者的开源项目 Auto-Coder 里,会提供一些工具,比如阅读、搜索文件、修改文件的工具,把这些工具的使用说明告诉大模型,大模型会根据输入的需求拆解目标,计划每一步需要调用哪个工具。同时,大模型也会据工具调用结果更新系统状态,相当于边走边看,持续决策直至满足以下任一终止条件:

  • 模型判定需求已实现

  • 达到预设执行阈值

  • 模型请求人工干预

Agentic 模式下的编程助手被寄予厚望,Cognition 创始人&CEO Scott Wu 在一档播客中畅谈了大热的 AI 程序员 Devin 的构建过程,以及 AI 编程对整个软件工程行业未来的趋势性影响。他提到,“我们一直在采用智能体化(Agentic)的方法,我认为最大的跃进在于异步与同步的区别,很多代码助手使用语言模型对代码进行自动补全,这节省了工程师的一部分时间,整体上将工程效率提升了 10% 到 20%。但 Devin 能够承担整个编码任务,它的提升是 10 倍,而不是 10%。用户可以将任务交给 Devin,然后继续处理自己的事情,他们可以同时运行其他 Devin,完成不同任务。”

市场新宠,“全员”上线 Agent 版本

Transformer 的自回归机制是根据前文 token 生成下一个 token,而代码恰恰是极具结构化的语言,可以说让大模型来写代码,天生专业对口。

近期,AI 编程资本市场的火爆也代表的业界对于其前景的看好。根据彭博社 5 月 6 日上午报道,OpenAI 已同意以约 30 亿美元(约合人民币 218 亿)收购 AI 编程助手开发商 Windsurf。据《金融时报》援引知情人士消息,Cursor 的开发公司 Anysphere 完成了一轮规模达 9 亿美元,推动估值达到约90亿美元,约合650亿元人民币,较年初暴涨逾3倍。

根据 Spherical Insights 的预测,至2032年,全球 AI 编码工具市场规模将超过295亿美元。种种消息显示,AI 编程正经历技术与商业的双重质变。

在这种背景下,海内外各大编程产品也在最近半年内,密集上线 Agent 版本,迈向 Agentic AI。

Cursor 在去年底上线了 Agent 版本,今年 4 月新版本中已经支持直接从对话生成规则/Generate Cursor Rules。Cursor Rules 用于自定义 AI 在 Cursor 中的行为,可以视为对大型语言模型(LLM)的指令或系统提示,也就是面向 Cursor 的“提示词”。

支持从对话生成规则后,可以让 AI 将你与 AI 之间来回的对话归纳成规则。这样 Agent 便可以通过分析当前对话中的需求、代码片段及项目结构,自动生成符合语义的规则模板。便于下次使用时,提取历史对话的上下文环境。例如,当用户讨论“Vue 3 组件命名规范”时,Agent 能提取关键词并生成对应的 PascalCase 命名规则。

号称一直采用 Agentic 方法的 Devin 在去年12月正式上线,以每月 500 美元的订阅价格销售。理论上它可以无需人类参与自行编写代码,并完成通常分配给人类开发人员的整个项目。而且,用户可以用多个 Devin Agent 并行完成不同的编程项目。

今年1月,字节跳动旗下 Trae 新增 AI 编程功能并发布海外版 Trae,支持 Agent 模式下的全流程开发,能感知 IDE 环境变化并实时调整代码,比如自动同步前后端接口。

今年 2 月, Copilot 上线了名为 "Project Padawan" 的自主 Agent。Padawan 将允许直接将问题分配给 Copilot,并进行全面测试,能够完成多种开发任务,如代码生成与审查、代码库重构或优化、自动化测试或流水线等流程、在架构设计错误排查及最佳实践上提供指导等等。

3月,百度旗下的文心快码宣布推出 Comate Zulu 版本并正式开放公测。Baidu Comate 研发工程师陈一言曾在3月源创会上表示,Zulu 的核心价值是能将陌生项目的结构、流程图、数据流和关键功能模块清晰解析,并标注对应代码位置。例如想添加自动测试功能时,无需手动查找文件,只需提出需求,Zulu 会自动定位修改位置并逐步实现。Zulu 还有 MVP 版本,对于代码修改可能引发的连锁影响,虽偶有需求理解偏差或报错,但通过少量人工校准即可解决。

与传统 AI 智能体对比,传统方案需在 Prompt 中预设完整流程,如数据分析步骤,若流程出错需人工干预。而 Zulu 采用自主规划策略,通过工具调用与环境交互:例如让 IDE 读取文件内容,若结果与预期不符,则调用规划工具制定新方案,再调用工具修改代码;若发现修改错误,可重新调用工具修正,这种动态循环机制实现了灵活的问题解决路径。

5月7日,通义灵码宣布全面支持 Qwen3,上线了编程智能体,具备自主决策、环境感知、工具使用等能力,可以根据开发者的诉求,使用工程检索、文件编辑、终端等工具,端到端地完成编码任务。同时支持开发者配置自己的 MCP 工具,更加贴合开发者工作流程,并集成魔搭 MCP 广场,开发者也可以一键下载 MCP 服务。

当前 AI 编程赛道的竞争格局,俨然重现了去年"百模大战"的硝烟弥漫——家家都练出了令人侧目的肌肉,然而今日的现象级产品,很可能在下一轮技术迭代中因功能创新滞后而淡出视野。当技术迭代速度从以年计算压缩至以周为单位,如何在用户心智中建立技术代差优势,构建真正的用户粘性,正成为所有参赛者的生死命题。

从技术应用的实际效果看,短期内,Code Agent更像“编程加速器”,它能显著提升常规功能模块的开发效率,但在处理复杂系统架构设计、关键业务逻辑验证,以及大型历史项目的代码重构时,仍需要人类工程师的深度参与并最终决策。这既是当前技术的客观局限,也是保证软件工程可靠性的必要防线。

但是长期来看,编程必将从“手工劳动”迈向“智能生产”,颠覆开发范式的颠覆。

正如 Cursor 母公司 Anthropic 首席执行官 Dario Amodei 在今年3月的一次公开发言中所说:“未来3到6个月,AI 将编写90%的代码,而在12个月内,几乎所有的代码都可能由 AI 编写。”这场始于代码补全的技术革命,终将重塑整个软件产业的底层逻辑。

致谢:本文的写作是受到 Auto-Coder 开源项目和3月份源创会 zulu 亮相的启发。

Auto-code 是开发者祝海林个人的一个开源项目,可以帮助开发者完成多种模式下的辅助编程,我们也跟作者聊了一下,可以看看开发者视角视角中的 Code Agent:对话 Auto-coder 作者,「Code Agent」和去年的 AI 编程比有什么不一样?

体验 Auto-Coder https://pypistats.org/packages/auto-coder

Zulu 是文心快码 Baidu Comate 编码辅助工具,中的智能体,可以进行代码问答等交互,感兴趣的读者可以查看源创会上关于 Zulu 的演讲:AI 编码工具也有自己的智能体了

体验 Comate Zulu https://comate.baidu.com/zh/competitorKeywords?track=SEM2025zulucp&bd_vid=10828110607619385952

转载链接:https://my.oschina.net/u/4489239/blog/18348629


Tags:


本篇评论 —— 揽流光,涤眉霜,清露烈酒一口话苍茫。


    声明:参照站内规则,不文明言论将会删除,谢谢合作。


      最新评论




ABOUT ME

Blogger:袅袅牧童 | Arkin

Ido:PHP攻城狮

WeChat:nnmutong

Email:nnmutong@icloud.com

标签云