我的 Ralph Loop 配置：让 AI Agent 长时间自主运行

关于作者

Dan（@d4m1n）是一位来自丹麦哥本哈根的连续创业者，已经独立发布了 9 个创业项目，并且这些项目目前都在盈利。他是 PageAI 的创始人，专注于用 AI 一键生成完整网站（包括 SEO、博客等）。Dan 在 X 上拥有超过 3 万粉丝，活跃分享 AI 编程工具和自动化工作流的实战经验。

我已经用这个工作流完成了四个独立项目。最长的一次连续运行了 37 个小时，从一份 2000 行的需求文档中完成了 250 个任务。而这一切都发生在我不在电脑前的时候。

这篇指南带你从零开始，在 10 分钟内搭建一个可运行的 Ralph Loop。

如果你更喜欢看视频，👉 这里是完整的操作演示。

发生了什么？！

很多人收藏了 Ralph Loop 的文章，但几乎没人真正跑起来。

概念很简单，但"酷想法"和"可运行的工作流"之间的差距是巨大的。你需要合适的 prompt、合适的任务结构、合适的验证标准。大多数人停在了收藏夹那一步。

我花了几周时间来弥合这个差距——迭代 prompt，重构任务，调优验证循环。我学到的一切都打包进了一条安装命令。这篇指南带你走完全程。

你需要什么

两样东西：

Docker — Loop 运行在沙箱容器里
Claude Code — Anthropic 的 agentic 编码 CLI

就这些。其他所有东西都会自动安装。

你也可以把 Claude Code 换成 Codex、Gemini CLI、Copilot CLI、Open Code 或 Kiro。完整支持列表在这里。

1. 初始化你的项目

这一步不是必须的，但能省 token，还能给你一个更好的基础。

用你喜欢的技术栈脚手架一个项目。比如：

npx @tanstack/cli create lib --add-ons shadcn,eslint,form,tanstack-query --no-git

不管怎么搭建，都要安装 Playwright 和 Vitest 做测试。Ralph Loop 用测试来验证自己的工作。没有测试，Agent 会继续推进但不检查功能是否正常。

在 .env 文件中准备好你的 API 密钥——数据库、支付服务商、LLM 密钥（不要提交 / 加到 .gitignore）。

项目需要什么就写什么。没有这些，Agent 会跳过集成验证，后面你会遇到麻烦。

2. 安装 Ralph Loop

一条命令：

npx @pageai/ralph-loop

这会创建一个 .agent/ 目录，包含 Loop 需要的所有内容：

.agent/
├── PROMPT.md       # 主迭代指令
├── SUMMARY.md      # 项目摘要（上下文）
├── STEERING.md     # 运行中调整方向
├── tasks.json      # 任务查找表
├── tasks/          # 单个任务规格
├── prd/            # 产品需求文档
├── logs/           # 进度追踪
├── history/        # 迭代输出
└── skills/         # 可复用的 Agent 能力

3. 创建你的 PRD

这通常是最难的部分，但我帮你搞定了。

安装命令自带一个 skill，负责处理所有这些——加上转换成能配合 Loop 扩展的任务。

打开 Claude Code，用内置的 prd-creator skill 来生成产品需求文档：

Use the prd-creator skill to help me create a PRD and task list for these requirements:

You are building an app that does X.
- It should support sign up via email and Google
- It should have a dashboard with a sidebar
- It should integrate with [some API] — see @docs/API_DOCS.md
- Use Next.js, TailwindCSS, shadcn/ui
// ... dump everything in your head

用你自己的话写。对 UI、流程、集成和技术选择尽量具体。这个 skill 会把你的 brain dump 扩展成结构化的 PRD，问你澄清问题，然后拆分成任务。

想看完整示例？👉 去看视频

不要跳过审查。 逐条读生成的任务。如果 Agent 理解错了什么，现在修正。修正任务规格比回退 10 个错误 commit 便宜得多。

三个写好需求的技巧：

指向确切的文档。 把第三方文档保存为项目中的 Markdown 文件，用 @docs/FILE.md 引用。这能防止 Agent 瞎猜。
提前准备 API 密钥。 在 Loop 启动前写进 .env，这样每个集成都能用真实数据测试。
不确定就说出来。 在需求里加上"Interview me about the payment integration"。Agent 会问你对的问题。

4. 登录 Docker

Loop 运行在 Docker 沙箱里。Claude Code 在里面拥有完整权限，但碰不到你的宿主机。

docker sandbox run claude .

回答 yes 来绕过权限模式。退出。这只需要做一次来完成认证。

5. 运行 Loop

从小规模开始：

./ralph.sh -n 2

观察它做了什么。检查 commit。如果没问题，放大规模：

./ralph.sh -n 10

有信心了，就让它过夜运行：

./ralph.sh -n 30

就这样。Ralph 会挑出最高优先级的任务，实现它，跑测试，commit，然后继续下一个。当所有任务通过，它就停下来。

运行中调整方向

Loop 运行时，你可以编辑 .agent/STEERING.md 来重定向优先级。Agent 在每次迭代开始时会读这个文件。

发现了一个关键 bug？写进 STEERING.md，Agent 会在继续任务列表之前处理它。

审查输出

Ralph 会留下痕迹：

.agent/logs/LOG.md — 已完成工作的时间线日志
.agent/history/ — 每次迭代的完整输出
git log — 每个完成的任务都是一个 commit

如果出了问题，git revert 坏的 commit。该任务的测试会失败，Ralph 会在下次运行时重新尝试。

为什么 Loop 有效

大多数 AI 编码会话在上下文窗口填满时就"死了"。模型开始遗忘早期指令。输出质量下降。你进入了"dumb zone"（笨蛋区）。

Ralph 完全避开了这个问题。每次迭代都从全新的上下文开始。 AI 读取任务列表，挑选下一个任务，实现它，验证它，commit，然后退出。下一次迭代从干净的状态开始。

状态存在于文本文件和 git commit 中，而不是上下文窗口里。

这就是你把 AI 编码从"帮我写个函数"扩展到"帮我构建一个应用"的方式。

Ralph 的强项

原型和 MVP — 从想法到可运行的应用，快
自动化测试 — 写 E2E 和单元测试，本来要花你几个小时
迁移 — 把整个代码库迁到新框架版本
重复性任务 — 批量重构、样板代码、文件重组

Ralph 的弱项

像素级设计 — 细腻的 UX 和交互流程
全新架构 — 真正独特的系统，没有可参考的模式
安全关键代码 — 边界情况绝对不能存在的地方

最重要的一点

你的角色变了。你不再是写每一行代码的人，而是计划、委派和审查的人。

这意味着 2026 年最重要的技能不是打字更快，而是清楚地描述你想要什么：UI 规格、流程、约束、集成。这是关键。

Ralph 只是一个循环。真正的工作在于它周围的设置——把需求和通过标准搞对。搞定这些，循环会处理剩下的。这也是我花了几周来搭建这一切的原因。