【转载】鸭哥暴论:AI Coding 领域那些被 Game 的 Metrics
为什么转载这篇
这段内容来自 Superlinear Academy 的 Trial and Iteration 频道,是 课代表立正 社区中的讨论。
课代表立正是一位 YouTuber,他创建的 Superlinear Academy 是一个 AI 学习社区。其中鸭哥(Yan Wang)被课代表立正称为他见过"码力最强的人",是一位极其前沿的工程师,对 AI Agent 和 AI Coding 有非常深入的实践和思考。
关于鸭哥
鸭哥有自己的博客 yage.ai,内容涵盖 Agentic AI、AI Coding 工程化实践等话题,每篇文章都有很高的信息密度。近期的文章包括:
- 以一个简单任务为例看 AI 落地的关键决策 — 用两分钟指挥 AI 给 300 篇文章添加 SEO summary 的实战案例,展示了五个关键工程决策
- OpenClaw 深度分析 — 对 OpenClaw 为什么突然火爆的深度拆解,以及他自己搭建替代方案的工程思路
- 告别教程思维 — 分析 AI 学习者的四道流失阶梯,提出用工程化平台消除摩擦
每篇文章中还包含大量有价值的链接和开源项目引用,非常值得深入阅读。强烈推荐关注。
原文
以下是鸭哥在 Superlinear Academy 社区发布的完整内容:
最近在 AI coding 领域有不少概念比较火,我抛一下我的暴论:
1. AI 能连续工作多少小时不重要
因为大家速度差别太大了。经常 Opus 干半个小时的活,用 Composer 1.5 两分钟就干完了,质量还一样好。Opus 只是速度慢加不必要的想得太多(叠甲:有反例,可能有 5% 的情况 Opus 花了半个小时做的真的比 Composer 1.5 花了两分钟做的好)。
2. 用多少 token 不重要
这是因为比如像 Oh My OpenCode 这样的插件有 over-engineer 的倾向,对简单问题也开多个背景 agent 并行做。我曾经用了一句话的 prompt 烧完了 Antigravity 一个星期的 Claude 配额。(叠甲:用的 token 的量级还是有参考价值的,很多经验不烧到一定程度无法体会)
3. 用 multi-agent 组成 agent team 来工作
我的感受是这个用处不大。对于广度优先的调研类任务会有些帮助,但对于要求深度或者瓶颈根本不在写码速度上,而在人身上的工作(也就是大部份工作)来说,都没啥用。
总结
所以对于这些最近比较火的概念,我的态度是:这些 metric 初衷是好的,但太容易被 game 了。要拿证据看看,最核心的还是写了多少产品,带来了多少增长和盈利。而不是说我用 agent team 你不用,我就比你厉害。或者我一天烧了 5 亿 token,你烧了 3 亿 token,所以我比你厉害。这些可以参考,但是没必要作为单独的 metric 拿来追求/刷。
出处:Superlinear Academy - Trial and Iteration · 作者:Yan Wang 鸭哥
相关链接:
如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。
Buy me a coffee