Clawdbot 创始人访谈:AI 是杠杆,不是替代品

本文转载自 宝玉 (@dotey)Twitter,整理自 Peter Yang 对 Clawdbot/OpenClaw 作者 Peter Steinberger 的 40 分钟访谈。


Peter Steinberger 是 PSPDFKit 的创始人,有差不多 20 多年 iOS 开发经验。2021 年公司被 Insight Partners 以 1 亿欧元战略投资后,他选择"退休"。现在,他开发的 Clawdbot(已改名 OpenClaw)爆火——一个能通过 WhatsApp、Telegram、iMessage 跟你聊天的 AI 助手,背后连着你电脑上的各种应用。

Peter 是这么描述 Clawdbot 的:

“它就像一个住在你电脑里的朋友,有点怪,但聪明得吓人。”


一小时原型,30 万行代码

“退休"回来后,Peter 全身心投入 vibe coding(凭感觉编程)——让 AI 智能体帮你写代码的工作方式。问题是,智能体可能跑半小时,也可能两分钟就停下来问你问题。你去吃个饭回来,发现它早就卡住了。

他想要一个能在手机上随时查看电脑状态的东西。但他没动手,因为觉得大公司肯定会做。

“等到去年 11 月还没人做,我就想算了,我自己来。”

最初的版本极其简单:把 WhatsApp 接到 Claude Code 上。发条消息,它就调用 AI,把结果发回来。一个小时就搭完了。

然后它"活了过来”。现在 Clawdbot 有大约 30 万行代码,支持几乎所有主流消息平台。

“我觉得这就是未来的方向。每个人都会有一个超级强大的 AI,跟着你走完一生。”


摩洛哥的那个早上

有一次 Peter 在摩洛哥给朋友过生日,有人在 Twitter 上发了一条推文,说他某个开源库有 bug。

“我就拍了张推文的照片,发到 WhatsApp。”

AI 读懂了推文内容,理解这是个 bug 报告。它 checkout 了对应的 Git 仓库,修复了问题,提交了代码,然后在 Twitter 上回复那个人说已经修好了。

“我当时就想,这也行?”

还有一次更神。他在街上走着,懒得打字,就发了条语音消息。问题是,他根本没给 Clawdbot 编写语音消息的支持。

“我看到它显示’正在输入’,心想这下完了。结果它正常回复了我。”

他后来问 AI 怎么做到的。AI 说:我收到一个文件但没有扩展名,所以我看了文件头,发现是 Ogg Opus 格式。你电脑上有 ffmpeg,我就用它转成了 WAV。然后我找 whisper.cpp,但你没装,不过我找到了你的 OpenAI API 密钥,就用 curl 把音频发过去做了转录。

“比网页版 ChatGPT 强太多了,这就像是解除了枷锁的 ChatGPT。”


CLI 军团

这几个月 Peter 一直在扩充自己的"CLI 军团"。智能体最擅长什么?调用命令行工具,因为训练数据里全是这个。

他建了:

  • 访问整个 Google 服务的 CLI,包括 Places API
  • 查表情包和 GIF 的工具,这样 AI 回复消息时能发 meme
  • 把声音可视化的工具,想让 AI"体验"音乐
  • 黑进本地外卖平台的 API,AI 能告诉他食物还有多久送到
  • 逆向了 Eight Sleep 的 API,可以控制床的温度

“我之前在 PSPDFKit 做了 20 年 Apple 生态开发,Swift、Objective-C,非常专精。但回来之后我决定换赛道。”

问题是,从一个精通的技术栈换到另一个,过程很痛苦。你懂所有概念,但不知道语法。每个小问题都要查,你会觉得自己像个白痴。

“然后有了 AI,这一切都消失了。你的系统级思维、架构能力、品味、对依赖的判断,这些才是真正有价值的,而且现在可以轻松迁移到任何领域。”

“突然之间我觉得自己什么都能建。语言不重要了,重要的是我的工程思维。”


控制现实世界

Peter 给 AI 的权限清单令人咋舌:

邮件、日历、所有文件、Philips Hue 灯光、Sonos 音响、安防摄像头、KNX 智能家居系统。

“它真的能把我锁在门外。”

用户们的玩法更疯狂:

  • 有人让它去 Tesco 网购
  • 有人让它在 Amazon 下单
  • 有人让它自动回复所有消息
  • 有人把它拉进家庭群聊当"家庭成员"

“我让它帮我在 British Airways 网站 check in。它能点’我是人类’的验证按钮,因为它就是在控制一个真实的浏览器,行为模式跟人没区别。”


80% 的 App 会消失

“如果你想想看,这个东西可能会取代你手机上 80% 的 app。”

为什么还要用 MyFitnessPal 记录饮食?发张照片,AI 就会存到数据库、计算热量、提醒你该去健身房了。

为什么还要用 app 设置温度?AI 有 API 权限,直接帮你调。

为什么还要用待办事项 app?AI 帮你记着。

为什么还要用 app check in 航班?AI 帮你做。

“会有一整层 app 慢慢消失,因为如果它们有 API,就只是你 AI 会调用的服务而已。”


别掉进智能体陷阱

Peter 的核心观点是:别掉进"智能体陷阱"(agentic trap)。

“我在 Twitter 上看到太多人发现智能体很厉害,然后想让它更厉害,然后掉进兔子洞。他们建各种复杂的工具来加速工作流,结果只是在建工具,没在建真正有价值的东西。”

他最近让他抓狂的是一个叫 Gastown 的编排系统:

“一个超复杂的编排器,同时跑十几二十个智能体,它们互相通信、分工。有观察者、有监工、有市长……我管这项目叫’垃圾镇’(Slop Town)。”

还有 RALPH 模式(用完即弃的单任务循环):

“这简直是终极的 Token 燃烧机。你让它跑一整晚,第二天早上得到的是终极垃圾(slop)。”

问题的核心是:这些智能体还没有品味。

“我不知道没有感受、没有品味参与的情况下,怎么能做出好东西。”

Peter Yang 总结:很多人跑 AI 24 小时不是为了做 app,是为了证明自己能让 AI 跑 24 小时。

“这就像一个没有参照物的比大小比赛。能建一切不代表你应该建一切,也不代表它会是好的。”


Plan Mode 是个拼凑

关于 plan mode,Peter 有个争议性观点:

“Plan mode 是 Anthropic 不得不加的拼凑方案,因为模型太冲动,一上来就跑去写代码。如果你用最新的模型,比如 GPT 5.2,你就是跟它对话。先聊需求、讨论方案、达成共识再动手。”

他不打字,他说话:

“我大部分时候都是跟它说话。”


没有 MCP,没有复杂编排

“我的 skill 大部分是生活技能:记录饮食、买菜、那种东西。编程方面很少,因为不需要。我不用 MCP,不用任何那些东西。”

他不相信复杂编排系统:

“我在循环里,我能做出感觉更好的产品。也许有更快的方法,但我已经快到瓶颈不在 AI 了,我主要被自己的思考速度限制。”


核心观点

Peter Steinberger 的核心观点可以总结为两句话:

  1. AI 已经强大到可以替代你手机上 80% 的 app
  2. 但如果没有人类的品味和判断在循环里,输出的就是垃圾

这两句话看似矛盾,其实指向同一个结论:AI 是杠杆,不是替代品。 放大的是你原有的东西:系统思维、架构能力、对好产品的直觉。如果你没有这些,再多智能体并行跑 24 小时也只是在批量生产 slop。

他的实践本身就是最好的证明:一个 20 年的 iOS 老程序员,在几个月内用 TypeScript 建了一个 30 万行代码的项目,靠的不是学会了新语言的语法,而是那些语言无关的东西。

“编程语言不重要了,重要的是我的工程思维。”


原文整理:宝玉 (@dotey)

如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。

Buy me a coffee