AI 奥德赛(四):令人惊叹的编码智能体An AI Odyssey, Part 4: Astounding Coding Agents
自去年夏季和今年 12 月至 1 月以来,AI 编码智能体(如 Claude Code、GitHub Copilot)能力显著增强,主观体验上“更聪明”。它们不仅能完成更广泛的任务,还能深入理解代码库结构并主动提出重构建议。作者基于实际使用经验指出,新一代模型展现出更强的上下文感知与长期规划能力,接近初级程序员水平。
Wayne Joubert
去年夏天,AI 编程代理有了显著提升,去年12月到今年1月又迎来一波进步。以下是我自上一篇相关文章以来的使用体验。
这些模型在主观感受上聪明了许多。它们能完成的任务范围更广,似乎对代码库以及你试图实现的目标有了更全面、更深入的把握。它们能在代码的晦涩角落中定位到与当前任务相关的更多细节。根据我个人粗略估计,去年8月它们帮我完成了约20%的编码工作,而现在这一比例已达到约60%。这两个数字可能都低于其实际潜力,或许我尚未充分发挥它们的能力。
话虽如此,它们并非万能解药。有时它们需要引导才能找到问题所在;有时则只见树木不见森林,无法退后一步审视全局,从而难以察觉高层逻辑上的错误。此外,它们可能会过度优化测试环境,也可能生成与现有代码在概念上不一致的代码。
它们生成的代码量有时也远超必要。有人警告说,这会导致技术债务的爆炸式增长。但另一方面,你也可以引导编程代理快速重构并优化其自身生成的代码。我曾有一次成功让它将某段代码的规模缩减至原来的一半以下,且行为保持不变。
我使用的是 OpenAI Codex,而非 Claude Code。很高兴听到一些技术可信人士认为这是个不错的选择。不过也许我该两者都试试。
我的工作是一个研究项目,代码本身就是研究成果,因此我无法事先给出所有功能的规格说明;编写代码本身就是一个探索的过程。同时,我希望代码库保持人类可读性。因此,我会深度参与与编程代理的讨论,而它有时会离开去执行某项任务一段时间。我并不希望将它当作某些人所说的“黑箱软件工厂”来使用。
有人担心使用编程代理会导致自己忘记如何不用它来写代码。我也有过这种感受,但鉴于我长期锻炼这项技能,我不认为这会轻易遗忘。反过来说,通过观察编程代理所写的代码,你甚至可能学到新的编程惯用法——这反而是件好事。
有人说他们已经好几周没亲手写过一行代码,因为编程代理全替他们做了。但我认为自己永远不会停止写代码,就像我不会停止在信封背面随手涂鸦想法,或是在打字过程中实时敲出若干行代码以发现新思路一样。学习是多感官参与的。
我向那些能同时管理多个运行中的代理的开发者致以敬意。就我个人而言,很难承受为每个代理深入思考并进行多次心理上下文切换的认知负荷。不过我正在尝试运行多个代理,以便在一个代理工作时我可以做其他事情。
我依然对某些场景下的生产力提升感到震惊。最近我新增了一项功能,正常情况下我认为需要花两个月时间去学习一种全新的算法方法和相关库才能实现。借助编程代理,我只用了四天就完成了,生产力提升了约10倍。当然,事情并非总是如此乐观。
简而言之,这些工具正变得越来越好。我期待几个月或一年后它们会发展成什么样子。
需要完整排版与评论请前往来源站点阅读。