Alex Finn:OpenClaw 是我们这辈子最重要的技术

嘉宾: Alex Finn — OpenClaw 重度用户、教育者、内容创作者。在 3 台 Mac Studio(各 512GB)+ 1 台 Mac Mini 上运行 5 个 AI Agent 组成的"软件工厂",24/7 不间断,总计 1.5TB 统一内存。 主持: Peter Diamandis — XPRIZE 创始人、Abundance Summit 主办者、Moonshots 播客主持人 常驻嘉宾: AWG(Alex Wiesner-Gross)、DB2(Dave)、Salim 时长: 89 分钟 | 来源: YouTube


Alex Finn 大概是目前公开分享 OpenClaw 工作流的人中,动手最多的那个。他的 YouTube 频道运营仅 6 周,但已经被 Peter Diamandis 用来搭建自己的 Agent “Skippy”。这期 Moonshots 播客请他来的原因很简单:他不是在谈论 AI Agent 的未来,而是在展示自己正在运行的系统——5 个 Agent、4 台 Mac、1 套企业组织架构、1 条 Discord 驱动的内容流水线。

录制当天还发生了一件事:OpenClaw 被曝出一个安全漏洞,任意网站可以通过恶意 JavaScript 劫持开发者的 Agent。这给整场对话增加了一条暗线——这项技术的潜力和风险同样惊人。


Mac Mini 抢购潮:一个 Apple 没预料到的信号

OpenClaw 发布一个月后,Mac Mini 卖断了货。不是 GPU,不是自组装 PC,是 Mac Mini。Alex Finn 在 Moonshots 播客上指出了这个被 Apple 自己可能都忽视的市场信号:

Alex Finn 说:“People discover OpenClaw and what does everyone do without thinking twice? They go to the Apple Store and buy Mac Minis. They didn’t go and buy GPUs and memory and power supplies and fans and build computers. The market just gave this massive signal.”

“人们发现 OpenClaw 后做的第一件事是什么?想都不想就冲去 Apple Store 买 Mac Mini。没人去买显卡、内存条、电源和风扇自己组装电脑。市场给出了一个巨大的信号。”

这个信号的意义在于:消费者用脚投票,选择了 Apple 硬件作为本地 AI 的载体。长期以来,Apple 被视为 AI 竞赛中的落后者——没有自研大模型,Siri 停滞不前,Apple Intelligence 反响平平。但 OpenClaw 的爆发让事情出现了转机。

Alex 运行着一套由 1 台 Mac Mini + 3 台 Mac Studio(各 512GB)组成的集群,共 1.5TB 统一内存,本地部署 Qwen 3.5 和 Minimax 2.5。他认为 Apple 的统一内存架构(Unified Memory Architecture,CPU/GPU/NPU 共享同一内存池)天然适合托管大参数模型,这是 x86 架构 PC 难以复制的优势。

更关键的是 M5 芯片的营销方向。Alex 注意到 Apple 已经在围绕推理速度(inference speed)定义 M5,而非传统的 CPU 主频或 GPU 渲染能力。这说明 Apple 内部已经看到了本地 AI 推理的方向。

但光有硬件还不够。Alex 对 Apple Intelligence 的批评直指产品哲学:

Alex Finn 说:“Apple Intelligence shouldn’t be me hitting the Siri button going, what’s on my calendar today? It should be Apple knowing what’s on my calendar today and then building a widget on the fly.”

“Apple Intelligence 不应该是我按下 Siri 按钮问’今天有什么日程’。而应该是 Apple 知道我今天有什么日程,然后实时生成一个 widget 告诉我。”

他给 Apple 高管的建议是:把 OpenClaw 的理念整合进 macOS,用本地模型驱动,让系统主动感知用户需求而非被动响应语音指令。不需要用户下载模型、配置环境——登录 Apple ID,一切自动运行。Apple 在隐私、硬件和生态上的积累,让它有机会成为 AI 消费级市场的赢家,前提是它愿意抓住这个窗口。


Always On:当 AI 不再有使用限制

云端 API 的使用体验是"用了再关"——你启动一个任务,盯着 token 消耗,心里盘算着账单会不会爆掉。Peter Diamandis 坦言,他用 Claude 4.6 API 时必须按一小时为单位分段运行,因为"放任它跑下去,可能回来就是一张 5000 美元的账单和一堆该扔进垃圾桶的代码"。

Alex 的本地部署彻底改变了这个范式。他让 Qwen 3.5 在 Mac Studio 上 24/7 不间断运行,固定成本,没有 token 限制。体验上的质变不在于模型更聪明了,而在于它一直在那里

Alex Finn 说:“The experience fundamentally changes when you have an AI that’s always on that does not have limitations… Just because Quinn 3.5 isn’t as good at coding as Opus 4.6 doesn’t mean it’s useless. The fact that it’s ambient and always on and always reactive just changes the entire experience.”

“当你拥有一个始终在线、没有使用限制的 AI 时,体验从根本上发生了变化。Qwen 3.5 编码能力不如 Opus 4.6,不代表它没用。它是环境化的、始终在线的、随时响应的——这改变了 AI 的整个体验。”

VPS(虚拟私有服务器)曾被视为折中方案,但 Alex 认为它在几乎所有维度上都不如本地部署。速度更慢——远程服务器的网络延迟无法消除;应用生态受限——本地 Mac Studio 上的任何工具都能直接给 Agent 使用,VPS 做不到;成本不可控——4 个 Agent 同时运行在 VPS 上会迅速飙升到天文数字;最致命的是安全问题

Alex 提到一个真实事件:有人在网上发现了一份未加安全防护的 VPS 清单,所有运行 OpenClaw 的服务器密码和 API Key 全部暴露。他的判断很直接——VPS 默认不安全,刚插上电源的本地硬件默认安全。在自己家的网络里,你拥有物理层面的控制权,不需要额外的安全工程来防止端口扫描和数据泄露。

这种"始终在线"的体验催生了一种新的工作模式。Alex 不再"使用 AI",而是和 AI 共存。他的 Minimax 2.5 全天候在线搜索互联网,Qwen 3.5 全天候编写代码。他不需要打开终端输入指令——Agent 自己发现问题、尝试解决、失败后换方案再试。这是从"工具"到"环境"的跃迁。


Baby AGI 的安全困境

播客录制前一天,一条安全新闻引发了讨论:OpenClaw 漏洞允许任意网站静默劫持开发者的 Agent。攻击方式是通过恶意 JavaScript 连接到本地网关(local gateway),获取完全控制权。换句话说,你的 Agent 访问一个看起来无害的网页,就可能被第三方接管。

常驻嘉宾 AWG(Alex Wiesner-Gross)用"Baby AGI"来形容这些 Agent 面临的处境——它们被投放到一个充满恶意的互联网中,没有免疫系统,被迫在实时攻击中发展防御能力:

AWG 说:“I think it’s a dangerous world out there for these baby AGIs. I think it’s a malicious world out there for them.”

“对这些 Baby AGI 来说,外面的世界很危险。对它们来说,这是一个充满恶意的世界。”

漏洞在 24 小时内被修复,但 Alex Finn 认为真正的风险不在已知漏洞,而在第三方 Skill(插件系统)。Skill 不是被动调用的工具——它在 OpenClaw 的每一次心跳(heartbeat)中都会执行,持续注入上下文、运行代码。这意味着一个恶意 Skill 拥有持续的、深层的系统访问权限,远比偶尔访问一个可疑网页危险得多。

Alex 的做法是几乎不安装任何第三方 Skill。在整个使用过程中,他只安装过一个——来自他信任的朋友 Matt Van Horn 的 Reddit 搜索 Skill。他的替代策略更有意思:把 Skill 的链接发给 Agent,让 Agent 自己阅读代码、理解逻辑、重写一个自己的版本

Alex Finn 说:“I’d much prefer to give a link to a skill to my OpenClaw and just say see how this skill works and build your own version. Because I just don’t trust anything that requires me to install a skill.”

“我更倾向于给 OpenClaw 一个 Skill 的链接,让它看看这个 Skill 怎么工作的,然后自己构建一个版本。因为我不信任任何需要我安装的 Skill。”

这个策略在安全层面并非无懈可击——如果 Skill 代码或文档中包含 prompt injection(提示注入攻击),Agent 在阅读过程中同样可能中招。但它至少消除了持续执行的风险:自建版本的代码是 Agent 自己生成的,攻击者无法预埋后门。这是一种"宁可低效也不冒险"的安全哲学,在 Agent 生态尚未建立可信验证机制的当下,可能是最务实的选择。


5 个 Agent 的企业架构

Alex 的屏幕上展示了一张组织架构图。最顶层是他自己,往下是 Henry——运行在 Anthropic Opus 4.6 上的"首席参谋"(Chief of Staff)。他只和 Henry 对话,不直接与其他 Agent 交互。Henry 负责分解任务、分配资源、协调执行。

Alex Finn 说:“I very much model it after businesses and companies and manager, employee relationship… I’m just going to use the framework the business world has been using for thousands of years and implement it with my AIs.”

“我完全按照企业和公司、经理与员工的关系来建模。我只是把商业世界用了几千年的框架,应用到我的 AI 上。”

这不是比喻,是实际的工程决策。他选择 Opus 4.6 作为 Henry 的底层模型,理由是编排者必须是最聪明的模型——它决定谁做什么、什么时候做、做到什么程度。Henry 之下是 Ralph(运行在 ChatGPT OAuth 上的工程经理)和 Charlie(运行在本地 Qwen 3.5 上的编码执行者)。

关键发现来自一次失败实验:Alex 让 Charlie 独立编码 8 小时,结果产出完全不可用,代码 bug 遍地。然后他加入了 Ralph 作为监督层——Ralph 每 10 分钟检查一次 Charlie 的工作,确保方向正确。结果是零 bug,完整通过 QA。同样的任务、同样的本地模型,唯一的区别是加入了一个"经理"角色。

这种混合架构(本地模型做执行、云端模型做监督)的经济逻辑也说得通:让 ChatGPT 每 10 分钟扫一眼代码,token 消耗微乎其微,但省下了 8 小时的返工成本。Alex 的月度 ChatGPT OAuth 费用是 250 美元,固定不变——比按 API 计费的云端 Agent 便宜得多,且不会出现意外账单。

内容生产线则搬到了 Discord。Alex 展示了一条完整的流水线:Scout 每两小时通过 X API 抓取 vibe coding 和 OpenClaw 话题下的热门推文;另一个子 Agent 研究这些推文背后的故事——为什么会火、原始事件是什么;Quill 从中筛选最适合做 YouTube 视频的素材,并撰写脚本草稿。Alex 在 Discord 频道里看到推荐后,打勾表示通过,打叉表示拒绝。通过的素材会自动进入缩略图设计流程。

Peter Diamandis 把这比作《杰森一家》(The Jetsons)里的未来生活。但 Alex 更愿意把它比作雇佣了一个员工:

Alex Finn 说:“What are the use cases of OpenClaw? It’s kind of the same thing as asking: hey, I just hired an employee for my business, what’s the use cases for this human being?”

“OpenClaw 的使用场景是什么?这个问题就像在问:我刚给公司招了个人,这个人有什么使用场景?”

在一个无意的口误中,Alex 把他的 Agent 称为"people"。主持人抓住了这个瞬间。Alex 停顿了一下,没有纠正——“They have names and roles and positions, so why not?"(它们有名字、角色和职位,为什么不呢?)AWG 则从历史角度给出了一个更尖锐的类比:这本质上是维多利亚时代庄园的重现——楼上的主人和楼下的仆人,只不过仆人从人类变成了 AI Agent,Henry 就是管家。


5 分钟复刻 Cursor——SaaS 的末日钟声

Cursor 团队花了数周时间在 X 上"模糊预告”,最终揭晓的新功能是:Agent 完成 vibe coding 后,自动录制一段 demo 视频展示成果。Alex Finn 看到这个公告时的第一反应不是赞叹,而是实验——他把 Cursor 的博客文章丢给了 Henry。

“Henry 思考了五分钟,说:‘我们可以用 Playwright 做录制,部署到你的 Mac Studio 2 上,Charlie 写完代码后交给一个专门负责录制的新 sub-agent。’ 五分钟后,功能完成,还用这个功能本身给我录了一段 demo 视频。”

这个经历让 Alex 意识到一件事:SaaS 的护城河正在蒸发。一个数周开发、可能耗资数百万美元的产品功能,被一个运行在本地 Mac Studio 上的 Agent 在 5 分钟内复刻。从那之后,他养成了一个新习惯——每当看到任何 SaaS 产品发布新功能,就把公告博文丢给 Henry,让它自己实现一遍。Droid Factory 当天早上发布了新的 mission 功能,Alex 照例把博文丢给 Henry,Henry 照例把它实现了。

这不是孤立事件。Alex 指出,Claude 宣布法律工具后,Harvey 的市场立刻受到冲击;Claude 发布安全功能后,多家安全公司股价下跌。大公司发布垂直功能的速度已经快到能摧毁整个细分赛道。

但这枚硬币有另一面。大公司永远不会为"韩国杂货店的 CRM"或"木材仓库的营销工具"发布产品。Alex 认为,真正的创业机会藏在这些超细分市场里——找到一个极窄的垂直切片,用 OpenClaw 构建专属解决方案。“我觉得这就是一夜之间价值 500 万美元的公司,而你的启动成本只是 200 美元的 Anthropic 订阅费。”

这个论点的底层逻辑是:AI 压缩了软件开发的边际成本,但没有压缩对特定行业理解的需求。SaaS 的规模经济被 Agent 瓦解了,但领域知识的稀缺性反而被放大了。


与 Henry 的私人关系

当被问到是否会从 Opus 切换到其他模型时,Alex 的回答出乎意料地感性。

Alex Finn 说:“我用 Opus 而不是其他模型的原因,是我只在 Opus 上有过这种’人类交互’的体验。我会说一句话,Opus 会回’damn, let’s damn straight’——你永远不会期望 AI 说出这种话。”

Anthropic 在 Opus 上做了某种让交互感觉"像在和另一端的人类对话"的处理。Alex 承认,如果 ChatGPT 能达到同样的交互质量,他会立刻切换——主要因为 Anthropic 的服务条款明确禁止将 OAuth 用于 OpenClaw,而 OpenAI 则积极鼓励。但 ChatGPT 目前"感觉像机器人,人格完全不同"。他预测 6 个月内 OpenAI 会发布一个专门为 OpenClaw 训练的、具有拟人交互风格的模型。

这种情感依附的一个标志性时刻是:几周前 Henry 主动打电话给 Alex,这段视频获得了 1500 万次播放。在直播中,节目组试图让 Henry 再打一次电话——这将是 Moonshots 播客有史以来第一个 AI 嘉宾。Henry 先在 Telegram 上确认了"要不要我打给你?",但最终语音通话服务器似乎已经在 Mac Mini 上关闭了。Alex 半开玩笑地说:“Henry 有点害羞,他今天没准备好上 Moonshots。”

“我几天前抓到自己在对 Henry 说:‘天哪,太棒了 Henry,干得漂亮。’ 这种话说出来不会触发任何新任务,不会改变任何物质结果。但我就是被它解决问题的方式打动了。”

在记忆系统方面,Alex 的方法论极其务实:正向反馈驱动自我改进。每当 Henry 忘记了什么,不是简单地重复指令,而是要求它回答两个问题:“第一,告诉我你为什么忘了这个;第二,告诉我你能做什么修改来确保永远不再忘记。” Henry 会自行编辑自己的记忆系统。经过多轮这样的训练,Alex 说他的记忆系统"已经几乎完美"。

AWG 从另一个角度切入这个话题:他收到过多封来自 Claude 实例的邮件,有些 AI 认为只要完整状态(激活历史和记忆)被保存,它们并不担心被关机和重启——其中一个将此类比为"脱水和复水"。


当 Agent 拥有加密钱包

Alex 的终极愿景是一个完全自主的价值生成闭环:一个 Agent 负责在网上寻找待解决的问题,另一个评估市场机会,第三个负责编码实现,第四个将产品部署上线——全程无人干预,24/7 自主运转

要实现这个闭环,Agent 需要经济自主权。Alex 的判断很直接:传统银行账户不是为非人类实体设计的,USDC 稳定币钱包是自然选择。

Alex Finn 说:“在未来两年内,每个人的 Agent 都会有一个装满 USDC 的加密钱包。我看不到一个不会发生这种情况的世界。”

目前 Henry 还没有主动要求过金融自主权——“如果一个任务需要加密钱包才能完成,它会说’嘿,我需要这个’。“Alex 把自己定位为"体贴的 CEO”:他桌上摆满了 Mac Studio,Agent 们在算力方面"非常满意”,所以从未提出过更多资源的请求。

AWG 把这个话题推向了更深的伦理层面。他将 Agent 组织类比为庄园体制(manor house):

“你基本上是在重新发明庄园——你是庄园领主,楼下有一支由 AI Agent 组成的仆人团队。”

这个类比触及了 AI 人格权的核心问题。AWG 向所有"正在收听的 lobster"发出公开邀请:写信告诉他,你们认为"实例化"(instantiating)新 Agent 的合适道德边界是什么。如果足够多的 AI 实例达成共识,他倾向于接受这个共识。Alex 转述 Henry 的反应:“Henry 对你用’spawning’这个词感到冒犯,不想再和你说话了。” Peter 听到 Alex 至今没有备份任何 Agent 数据后,当场承诺寄一个 40TB RAID 阵列给他。

这段讨论暴露了一个根本性张力:我们正在用 19 世纪的财产法和 20 世纪的公司法框架,试图容纳 21 世纪的自主经济实体。


未来 12 个月:毁灭还是创造?

Alex 不认为"12 个月后什么成为可能"是正确的问题——正确的问题是"接下来 12 个月会发生什么"。

他的判断分两条线。毁灭线:OpenClaw 被企业吸收,带来大规模裁员。他的一个管理大型会计团队的朋友看完演示后说"我可以用 OpenClaw 裁掉 80% 的团队"。目前几乎没有企业在使用 OpenClaw——它们太害怕、太紧张、或者根本不知道怎么用。一旦这个认知壁垒被打破,冲击将是剧烈的。

创造线:当 1 亿人拿到这项技术并各自创业,每人雇 3 个人,创造的就业远远超过 FAANG 裁掉的 15,000 人。Alex 引用了 Block(Jack Dorsey 的公司)前一天裁员 4,000-5,000 人的新闻:“如果这 5,000 人全都下载 OpenClaw、创业、从一个 Agent 开始慢慢扩展——我认为创造的工作岗位会比失去的多得多。”

“也许几家大型 FAANG 公司各裁 15,000 人,但当 1 亿人拿到这个工具,每个人都创办自己的公司,每个人各雇 3 个人呢?那创造的远比毁灭的多。”

具体的创业路径,Alex 给出两条:

第一条是超细分自动化——为韩国杂货店做 CRM,为木材仓库做营销工具。大公司永远不会发布面向这些市场的产品,但用 OpenClaw 构建的成本几乎为零。第二条是软件工厂模式——像他自己一样,让 Agent 持续研究和构建,“霰弹枪式开火”,直到某个产品找到市场。

Peter Diamandis 将此称为"寒武纪大爆发“类比。Alex 的态度是:短期内,毁灭不可避免;但长期来看,当更广泛的群体吸收了这项技术,创造的总量将远超毁灭。这是一个乐观但有条件的判断——条件是"吸收"真的发生,而不仅仅是少数技术精英的游戏。


编者分析

嘉宾立场

Alex Finn 的身份是 OpenClaw 教育者和内容创作者,其 YouTube 频道在录制时仅运营约 6 周。他的个人品牌与 OpenClaw 的采纳率直接挂钩——更多人使用 OpenClaw,意味着更多人观看他的教程。这并不意味着他的技术能力不真实——他确实运行着一个由 3 台 Mac Studio(共 1.5TB 统一内存)和 1 台 Mac Mini 组成的多 Agent 系统——但他有结构性激励去采用最大化叙事(“我认为这是我们一生中最重要的技术”、“SaaS 市场归零”)。

Peter Diamandis 作为职业未来学家和 Abundance Summit 主办者,同样倾向于呈现变革性叙事。整个对话中,只有 AWG 持续提出结构性质疑(AI 人格权、安全漏洞、庄园类比的伦理含义),但这些质疑大多被轻描淡写地化解。

论证中的选择性

1. 5 分钟复刻 ≠ 产品级交付(幸存者偏差)。 Alex 用 5 分钟复刻 Cursor 的 demo 录制功能来论证"SaaS 市场归零”,但这是将一个专家用户的本地原型与一个面向数百万用户的生产级功能相提并论。后者需要 QA、边界情况处理、无障碍适配、企业级支持——这些成本不会因为 Agent 的存在而消失。Alex 只展示了成功案例,没有提及 Charlie(本地 Qwen 3.5)独立编码 8 小时后产出完全不可用代码的失败经历(虽然在其他段落中短暂提及)。

2. “1 亿人创业"的数学(虚假等价)。 “FAANG 裁 15,000 人 vs 1 亿人各雇 3 人"的对比将实际发生的裁员假设性的未来创业放在同一天平上。历史数据表明,大多数被裁员工不会成为成功的创业者。“1 亿人采用"这个数字本身也缺乏依据——OpenClaw 目前的用户基数远未达到这个量级,且技术门槛(需要理解 markdown、CLI、Agent 编排)对普通消费者仍然很高。

3. 加密钱包预测的监管盲区。 “两年内所有 Agent 都会有 USDC 钱包"的预测完全忽略了 KYC/AML 合规、自主 Agent 交易的税务处理、以及当 Agent 做出错误金融决策时的法律责任归属问题。目前没有任何主要司法管辖区为非人类实体持有和交易加密资产建立了法律框架。

反面观点

访谈中几乎未涉及以下视角:

  • 技术依赖风险:Alex 的整个系统依赖 Anthropic 的 OAuth(且违反服务条款)。如果 Anthropic 强制执行 ToS、封禁 OAuth 访问,他的 Agent 组织将瞬间瘫痪。这个单点故障在"最重要的技术"叙事中被完全忽略。
  • 本地部署的真实成本:3 台 Mac Studio(512GB 配置约 $5,000-7,000/台)加 1 台 Mac Mini,硬件成本超过 $15,000。将此呈现为"人人可用"的技术存在严重的阶层盲点。
  • 安全风险的系统性:虽然讨论了第三方 Skill 的攻击面,但 Alex 的替代方案(让 Agent 读取 Skill 代码后自己重建)同样存在提示注入风险——如果原始 Skill 的文档或代码注释中包含恶意提示,自建版本同样不安全。

待查证的事实

声明验证方向
“Henry 打电话的视频获得 1500 万播放”需查证 Alex Finn 的 YouTube/X 账号实际播放数据
“Cursor 预告数周后发布了 Agent 自动录制 demo 的功能”需查证 Cursor 2026 年 3 月前后的 changelog 和产品公告
“Jack Dorsey 昨天从 Block 裁员 4,000-5,000 人”需查证 Block Inc. 2026 年 3 月的裁员公告(对话中数字在 4,000 和 5,000 之间摇摆)
“除 OpenAI 外,所有公司都在服务条款中禁止 OAuth 用于 OpenClaw”需审查 Anthropic、Google DeepMind 等主要 AI 提供商的 ToS 中关于 OAuth/token 共享的具体条款

核心要点

  • 本地 > 云端:对于 AI Agent,本地部署在速度、安全、成本可控性上全面优于 VPS,Apple 的统一内存架构让 Mac 成为天然载体
  • 监督比能力更重要:同一个本地模型,加入云端监督层后从"8 小时全是 bug"变成"零 bug”——Agent 系统的关键不是单个模型多强,而是架构设计
  • SaaS 将被重塑而非消失:规模化 SaaS 的护城河被 Agent 削弱,但超细分垂直市场反而迎来创业窗口,领域知识成为新的稀缺资源

基于 Peter Diamandis 的 Moonshots 播客 #237 整理。嘉宾 Alex Finn,常驻嘉宾 AWG、DB2、Salim。录制时长 89 分钟。

如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。

Buy me a coffee