我的 Ralph Loop 配置:让 AI Agent 长时间自主运行

关于作者

Dan@d4m1n)是一位来自丹麦哥本哈根的连续创业者,已经独立发布了 9 个创业项目,并且这些项目目前都在盈利。他是 PageAI 的创始人,专注于用 AI 一键生成完整网站(包括 SEO、博客等)。Dan 在 X 上拥有超过 3 万粉丝,活跃分享 AI 编程工具和自动化工作流的实战经验。


Ralph Loop 与 Claude Code

我已经用这个工作流完成了四个独立项目。最长的一次连续运行了 37 个小时,从一份 2000 行的需求文档中完成了 250 个任务。而这一切都发生在我不在电脑前的时候。

这篇指南带你从零开始,在 10 分钟内搭建一个可运行的 Ralph Loop。

如果你更喜欢看视频,👉 这里是完整的操作演示

Ultimate Guide 视频

发生了什么?!

很多人收藏了 Ralph Loop 的文章,但几乎没人真正跑起来。

概念很简单,但"酷想法"和"可运行的工作流"之间的差距是巨大的。你需要合适的 prompt、合适的任务结构、合适的验证标准。大多数人停在了收藏夹那一步。

我花了几周时间来弥合这个差距——迭代 prompt,重构任务,调优验证循环。我学到的一切都打包进了一条安装命令。这篇指南带你走完全程。

你需要什么

两样东西:

  • Docker — Loop 运行在沙箱容器里
  • Claude Code — Anthropic 的 agentic 编码 CLI

就这些。其他所有东西都会自动安装。

你也可以把 Claude Code 换成 Codex、Gemini CLI、Copilot CLI、Open Code 或 Kiro。完整支持列表在这里

1. 初始化你的项目

这一步不是必须的,但能省 token,还能给你一个更好的基础。

用你喜欢的技术栈脚手架一个项目。比如:

npx @tanstack/cli create lib --add-ons shadcn,eslint,form,tanstack-query --no-git

不管怎么搭建,都要安装 PlaywrightVitest 做测试。Ralph Loop 用测试来验证自己的工作。没有测试,Agent 会继续推进但不检查功能是否正常。

.env 文件中准备好你的 API 密钥——数据库、支付服务商、LLM 密钥(不要提交 / 加到 .gitignore)。

项目需要什么就写什么。没有这些,Agent 会跳过集成验证,后面你会遇到麻烦。

2. 安装 Ralph Loop

一条命令:

npx @pageai/ralph-loop

这会创建一个 .agent/ 目录,包含 Loop 需要的所有内容:

.agent/
├── PROMPT.md       # 主迭代指令
├── SUMMARY.md      # 项目摘要(上下文)
├── STEERING.md     # 运行中调整方向
├── tasks.json      # 任务查找表
├── tasks/          # 单个任务规格
├── prd/            # 产品需求文档
├── logs/           # 进度追踪
├── history/        # 迭代输出
└── skills/         # 可复用的 Agent 能力

3. 创建你的 PRD

这通常是最难的部分,但我帮你搞定了。

安装命令自带一个 skill,负责处理所有这些——加上转换成能配合 Loop 扩展的任务。

打开 Claude Code,用内置的 prd-creator skill 来生成产品需求文档:

Use the prd-creator skill to help me create a PRD and task list for these requirements:

You are building an app that does X.
- It should support sign up via email and Google
- It should have a dashboard with a sidebar
- It should integrate with [some API] — see @docs/API_DOCS.md
- Use Next.js, TailwindCSS, shadcn/ui
// ... dump everything in your head

用你自己的话写。对 UI、流程、集成和技术选择尽量具体。这个 skill 会把你的 brain dump 扩展成结构化的 PRD,问你澄清问题,然后拆分成任务。

想看完整示例?👉 去看视频

不要跳过审查。 逐条读生成的任务。如果 Agent 理解错了什么,现在修正。修正任务规格比回退 10 个错误 commit 便宜得多。

三个写好需求的技巧:

  1. 指向确切的文档。 把第三方文档保存为项目中的 Markdown 文件,用 @docs/FILE.md 引用。这能防止 Agent 瞎猜。
  2. 提前准备 API 密钥。 在 Loop 启动前写进 .env,这样每个集成都能用真实数据测试。
  3. 不确定就说出来。 在需求里加上"Interview me about the payment integration"。Agent 会问你对的问题。

4. 登录 Docker

Loop 运行在 Docker 沙箱里。Claude Code 在里面拥有完整权限,但碰不到你的宿主机。

docker sandbox run claude .

回答 yes 来绕过权限模式。退出。这只需要做一次来完成认证。

5. 运行 Loop

从小规模开始:

./ralph.sh -n 2

观察它做了什么。检查 commit。如果没问题,放大规模:

./ralph.sh -n 10

有信心了,就让它过夜运行:

./ralph.sh -n 30

就这样。Ralph 会挑出最高优先级的任务,实现它,跑测试,commit,然后继续下一个。当所有任务通过,它就停下来。

运行中调整方向

Loop 运行时,你可以编辑 .agent/STEERING.md 来重定向优先级。Agent 在每次迭代开始时会读这个文件。

发现了一个关键 bug?写进 STEERING.md,Agent 会在继续任务列表之前处理它。

审查输出

Ralph 会留下痕迹:

  • .agent/logs/LOG.md — 已完成工作的时间线日志
  • .agent/history/ — 每次迭代的完整输出
  • git log — 每个完成的任务都是一个 commit

如果出了问题,git revert 坏的 commit。该任务的测试会失败,Ralph 会在下次运行时重新尝试。

为什么 Loop 有效

Vibe Coding vs Ralph Loop

大多数 AI 编码会话在上下文窗口填满时就"死了"。模型开始遗忘早期指令。输出质量下降。你进入了"dumb zone"(笨蛋区)。

Ralph 完全避开了这个问题。每次迭代都从全新的上下文开始。 AI 读取任务列表,挑选下一个任务,实现它,验证它,commit,然后退出。下一次迭代从干净的状态开始。

状态存在于文本文件和 git commit 中,而不是上下文窗口里。

这就是你把 AI 编码从"帮我写个函数"扩展到"帮我构建一个应用"的方式。

Ralph 的强项

自动化测试

  • 原型和 MVP — 从想法到可运行的应用,快
  • 自动化测试 — 写 E2E 和单元测试,本来要花你几个小时
  • 迁移 — 把整个代码库迁到新框架版本
  • 重复性任务 — 批量重构、样板代码、文件重组

Ralph 的弱项

  • 像素级设计 — 细腻的 UX 和交互流程
  • 全新架构 — 真正独特的系统,没有可参考的模式
  • 安全关键代码 — 边界情况绝对不能存在的地方

最重要的一点

你的角色变了。你不再是写每一行代码的人,而是计划、委派和审查的人。

这意味着 2026 年最重要的技能不是打字更快,而是清楚地描述你想要什么:UI 规格、流程、约束、集成。这是关键。

Ralph 只是一个循环。真正的工作在于它周围的设置——把需求和通过标准搞对。搞定这些,循环会处理剩下的。这也是我花了几周来搭建这一切的原因。

相关链接

参考资源


出处:本文由 Dan (@d4m1n) 于 2026 年 2 月 23 日发表于 X (Twitter)。原文链接:https://x.com/d4m1n/status/2026032801322356903

如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。

Buy me a coffee