【转载】鸭哥暴论：AI Coding 领域那些被 Game 的 Metrics

为什么转载这篇

这段内容来自 Superlinear Academy 的 Trial and Iteration 频道，是课代表立正社区中的讨论。

课代表立正是一位 YouTuber，他创建的 Superlinear Academy 是一个 AI 学习社区。其中鸭哥（Yan Wang）被课代表立正称为他见过"码力最强的人"，是一位极其前沿的工程师，对 AI Agent 和 AI Coding 有非常深入的实践和思考。

关于鸭哥

鸭哥有自己的博客 yage.ai，内容涵盖 Agentic AI、AI Coding 工程化实践等话题，每篇文章都有很高的信息密度。近期的文章包括：

以一个简单任务为例看 AI 落地的关键决策 — 用两分钟指挥 AI 给 300 篇文章添加 SEO summary 的实战案例，展示了五个关键工程决策
OpenClaw 深度分析 — 对 OpenClaw 为什么突然火爆的深度拆解，以及他自己搭建替代方案的工程思路
告别教程思维 — 分析 AI 学习者的四道流失阶梯，提出用工程化平台消除摩擦

每篇文章中还包含大量有价值的链接和开源项目引用，非常值得深入阅读。强烈推荐关注。

原文

以下是鸭哥在 Superlinear Academy 社区发布的完整内容：

最近在 AI coding 领域有不少概念比较火，我抛一下我的暴论：

1. AI 能连续工作多少小时不重要

因为大家速度差别太大了。经常 Opus 干半个小时的活，用 Composer 1.5 两分钟就干完了，质量还一样好。Opus 只是速度慢加不必要的想得太多（叠甲：有反例，可能有 5% 的情况 Opus 花了半个小时做的真的比 Composer 1.5 花了两分钟做的好）。

2. 用多少 token 不重要

这是因为比如像 Oh My OpenCode 这样的插件有 over-engineer 的倾向，对简单问题也开多个背景 agent 并行做。我曾经用了一句话的 prompt 烧完了 Antigravity 一个星期的 Claude 配额。（叠甲：用的 token 的量级还是有参考价值的，很多经验不烧到一定程度无法体会）

3. 用 multi-agent 组成 agent team 来工作

我的感受是这个用处不大。对于广度优先的调研类任务会有些帮助，但对于要求深度或者瓶颈根本不在写码速度上，而在人身上的工作（也就是大部份工作）来说，都没啥用。

总结

所以对于这些最近比较火的概念，我的态度是：这些 metric 初衷是好的，但太容易被 game 了。要拿证据看看，最核心的还是写了多少产品，带来了多少增长和盈利。而不是说我用 agent team 你不用，我就比你厉害。或者我一天烧了 5 亿 token，你烧了 3 亿 token，所以我比你厉害。这些可以参考，但是没必要作为单独的 metric 拿来追求/刷。

出处：Superlinear Academy - Trial and Iteration · 作者：Yan Wang 鸭哥

相关链接：

☕ 如果这篇文章对你有帮助，欢迎请我喝杯咖啡，支持我继续创作更多内容。

Buy me a coffee