【转载】鸭哥暴论:AI Coding 领域那些被 Game 的 Metrics

为什么转载这篇

这段内容来自 Superlinear Academy 的 Trial and Iteration 频道,是 课代表立正 社区中的讨论。

课代表立正是一位 YouTuber,他创建的 Superlinear Academy 是一个 AI 学习社区。其中鸭哥(Yan Wang)被课代表立正称为他见过"码力最强的人",是一位极其前沿的工程师,对 AI Agent 和 AI Coding 有非常深入的实践和思考。

关于鸭哥

鸭哥有自己的博客 yage.ai,内容涵盖 Agentic AI、AI Coding 工程化实践等话题,每篇文章都有很高的信息密度。近期的文章包括:

每篇文章中还包含大量有价值的链接和开源项目引用,非常值得深入阅读。强烈推荐关注。


原文

以下是鸭哥在 Superlinear Academy 社区发布的完整内容:


最近在 AI coding 领域有不少概念比较火,我抛一下我的暴论:

1. AI 能连续工作多少小时不重要

因为大家速度差别太大了。经常 Opus 干半个小时的活,用 Composer 1.5 两分钟就干完了,质量还一样好。Opus 只是速度慢加不必要的想得太多(叠甲:有反例,可能有 5% 的情况 Opus 花了半个小时做的真的比 Composer 1.5 花了两分钟做的好)。

2. 用多少 token 不重要

这是因为比如像 Oh My OpenCode 这样的插件有 over-engineer 的倾向,对简单问题也开多个背景 agent 并行做。我曾经用了一句话的 prompt 烧完了 Antigravity 一个星期的 Claude 配额。(叠甲:用的 token 的量级还是有参考价值的,很多经验不烧到一定程度无法体会)

3. 用 multi-agent 组成 agent team 来工作

我的感受是这个用处不大。对于广度优先的调研类任务会有些帮助,但对于要求深度或者瓶颈根本不在写码速度上,而在人身上的工作(也就是大部份工作)来说,都没啥用。

总结

所以对于这些最近比较火的概念,我的态度是:这些 metric 初衷是好的,但太容易被 game 了。要拿证据看看,最核心的还是写了多少产品,带来了多少增长和盈利。而不是说我用 agent team 你不用,我就比你厉害。或者我一天烧了 5 亿 token,你烧了 3 亿 token,所以我比你厉害。这些可以参考,但是没必要作为单独的 metric 拿来追求/刷。


出处Superlinear Academy - Trial and Iteration · 作者:Yan Wang 鸭哥

相关链接

如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。

Buy me a coffee