当Agent学会写代码后,谁会替你做最后那点微调?

这段时间我密集泡在Codex App和Cursor里,越用越觉得有意思。去年大家还在比哪家的模型更强,今年突然发现,竞争的主战场竟然变成了界面布局——左边会话、中间对话、右边工作区,几家顶尖Agent居然在没有任何沟通的情况下,同时收敛到了同一个答案。你说这不是最优解我都不信。

不过这只是第一幕。真正让我觉得有意思的是右侧工作区的进化:它不再只是给你看文件变更记录,而是开始抢VSCode和浏览器的事了。Codex在4月的大版本更新里,右侧工作区改得最狠,甚至喊出了“Codex for (almost) everything”的口号。可问题来了:Agent帮你写完代码、做完PPT,你想改几个字,难道还得切出去打开另一个软件?用户不傻,自然期待在Agent里直接改。但Codex目前还做不到这一步——生成后不能编辑,代码、Markdown、PPTX都不行。我猜这不是技术不行,而是在等一个统一的解决方案。

那到底缺什么呢?MCP解决了“连接”问题,Agent Skill解决了“怎么做”的问题,但还有一个缺口没人补:用户的二次编辑。就算AI再聪明,最后那5%的精准度,还是得自己动手。Codex不会傻到自己做Markdown编辑器——每个人的偏好不一样,做出来永远有人骂。最合理的路,是插件机制。就像VSCode和Chrome那样,把Agent做成平台,让社区来贡献插件。Codex只需要聚焦在Agent调度层,把预览、编辑、专业领域能力都交给插件。这样一来,插件还能顺手解决一个长期问题:Skill没法赚钱。我自己的baoyu-skills快2万星了,收入还是$0。插件不一样,有版税分成和冷启动红利,生态才能转起来。

留给中小团队的窗口不会开太久。别自己从头搭Agent调度层,就在Codex或Cursor上做插件,专注帮用户把Agent生成的结果处理好。时间点不会太远,可能就在这几个月。你觉得这个插件生态最后会是哪家先跑通?或者说你心里有更适合Agent的产品形式?欢迎来留言区聊聊,我挺想听听你的看法。