我的 Ralph Loop 配置:让 AI Agent 长时间自主运行
关于作者
Dan(@d4m1n)是一位来自丹麦哥本哈根的连续创业者,已经独立发布了 9 个创业项目,并且这些项目目前都在盈利。他是 PageAI 的创始人,专注于用 AI 一键生成完整网站(包括 SEO、博客等)。Dan 在 X 上拥有超过 3 万粉丝,活跃分享 AI 编程工具和自动化工作流的实战经验。

我已经用这个工作流完成了四个独立项目。最长的一次连续运行了 37 个小时,从一份 2000 行的需求文档中完成了 250 个任务。而这一切都发生在我不在电脑前的时候。
这篇指南带你从零开始,在 10 分钟内搭建一个可运行的 Ralph Loop。
如果你更喜欢看视频,👉 这里是完整的操作演示。

发生了什么?!
很多人收藏了 Ralph Loop 的文章,但几乎没人真正跑起来。
概念很简单,但"酷想法"和"可运行的工作流"之间的差距是巨大的。你需要合适的 prompt、合适的任务结构、合适的验证标准。大多数人停在了收藏夹那一步。
我花了几周时间来弥合这个差距——迭代 prompt,重构任务,调优验证循环。我学到的一切都打包进了一条安装命令。这篇指南带你走完全程。
你需要什么
两样东西:
- Docker — Loop 运行在沙箱容器里
- Claude Code — Anthropic 的 agentic 编码 CLI
就这些。其他所有东西都会自动安装。
你也可以把 Claude Code 换成 Codex、Gemini CLI、Copilot CLI、Open Code 或 Kiro。完整支持列表在这里。
1. 初始化你的项目
这一步不是必须的,但能省 token,还能给你一个更好的基础。
用你喜欢的技术栈脚手架一个项目。比如:
npx @tanstack/cli create lib --add-ons shadcn,eslint,form,tanstack-query --no-git
不管怎么搭建,都要安装 Playwright 和 Vitest 做测试。Ralph Loop 用测试来验证自己的工作。没有测试,Agent 会继续推进但不检查功能是否正常。
在 .env 文件中准备好你的 API 密钥——数据库、支付服务商、LLM 密钥(不要提交 / 加到 .gitignore)。
项目需要什么就写什么。没有这些,Agent 会跳过集成验证,后面你会遇到麻烦。
2. 安装 Ralph Loop
一条命令:
npx @pageai/ralph-loop
这会创建一个 .agent/ 目录,包含 Loop 需要的所有内容:
.agent/
├── PROMPT.md # 主迭代指令
├── SUMMARY.md # 项目摘要(上下文)
├── STEERING.md # 运行中调整方向
├── tasks.json # 任务查找表
├── tasks/ # 单个任务规格
├── prd/ # 产品需求文档
├── logs/ # 进度追踪
├── history/ # 迭代输出
└── skills/ # 可复用的 Agent 能力
3. 创建你的 PRD
这通常是最难的部分,但我帮你搞定了。
安装命令自带一个 skill,负责处理所有这些——加上转换成能配合 Loop 扩展的任务。
打开 Claude Code,用内置的 prd-creator skill 来生成产品需求文档:
Use the prd-creator skill to help me create a PRD and task list for these requirements:
You are building an app that does X.
- It should support sign up via email and Google
- It should have a dashboard with a sidebar
- It should integrate with [some API] — see @docs/API_DOCS.md
- Use Next.js, TailwindCSS, shadcn/ui
// ... dump everything in your head
用你自己的话写。对 UI、流程、集成和技术选择尽量具体。这个 skill 会把你的 brain dump 扩展成结构化的 PRD,问你澄清问题,然后拆分成任务。
想看完整示例?👉 去看视频
不要跳过审查。 逐条读生成的任务。如果 Agent 理解错了什么,现在修正。修正任务规格比回退 10 个错误 commit 便宜得多。
三个写好需求的技巧:
- 指向确切的文档。 把第三方文档保存为项目中的 Markdown 文件,用
@docs/FILE.md引用。这能防止 Agent 瞎猜。 - 提前准备 API 密钥。 在 Loop 启动前写进
.env,这样每个集成都能用真实数据测试。 - 不确定就说出来。 在需求里加上"Interview me about the payment integration"。Agent 会问你对的问题。
4. 登录 Docker
Loop 运行在 Docker 沙箱里。Claude Code 在里面拥有完整权限,但碰不到你的宿主机。
docker sandbox run claude .
回答 yes 来绕过权限模式。退出。这只需要做一次来完成认证。
5. 运行 Loop
从小规模开始:
./ralph.sh -n 2
观察它做了什么。检查 commit。如果没问题,放大规模:
./ralph.sh -n 10
有信心了,就让它过夜运行:
./ralph.sh -n 30
就这样。Ralph 会挑出最高优先级的任务,实现它,跑测试,commit,然后继续下一个。当所有任务通过,它就停下来。
运行中调整方向
Loop 运行时,你可以编辑 .agent/STEERING.md 来重定向优先级。Agent 在每次迭代开始时会读这个文件。
发现了一个关键 bug?写进 STEERING.md,Agent 会在继续任务列表之前处理它。
审查输出
Ralph 会留下痕迹:
.agent/logs/LOG.md— 已完成工作的时间线日志.agent/history/— 每次迭代的完整输出git log— 每个完成的任务都是一个 commit
如果出了问题,git revert 坏的 commit。该任务的测试会失败,Ralph 会在下次运行时重新尝试。
为什么 Loop 有效

大多数 AI 编码会话在上下文窗口填满时就"死了"。模型开始遗忘早期指令。输出质量下降。你进入了"dumb zone"(笨蛋区)。
Ralph 完全避开了这个问题。每次迭代都从全新的上下文开始。 AI 读取任务列表,挑选下一个任务,实现它,验证它,commit,然后退出。下一次迭代从干净的状态开始。
状态存在于文本文件和 git commit 中,而不是上下文窗口里。
这就是你把 AI 编码从"帮我写个函数"扩展到"帮我构建一个应用"的方式。
Ralph 的强项

- 原型和 MVP — 从想法到可运行的应用,快
- 自动化测试 — 写 E2E 和单元测试,本来要花你几个小时
- 迁移 — 把整个代码库迁到新框架版本
- 重复性任务 — 批量重构、样板代码、文件重组
Ralph 的弱项
- 像素级设计 — 细腻的 UX 和交互流程
- 全新架构 — 真正独特的系统,没有可参考的模式
- 安全关键代码 — 边界情况绝对不能存在的地方
最重要的一点
你的角色变了。你不再是写每一行代码的人,而是计划、委派和审查的人。
这意味着 2026 年最重要的技能不是打字更快,而是清楚地描述你想要什么:UI 规格、流程、约束、集成。这是关键。
Ralph 只是一个循环。真正的工作在于它周围的设置——把需求和通过标准搞对。搞定这些,循环会处理剩下的。这也是我花了几周来搭建这一切的原因。
相关链接
参考资源
- Docker Sandboxes — 隔离执行环境
- Anthropic 关于长时间运行 Agent 的研究 — 任务格式背后的研究
- skills.sh — 额外的 Agent skills
出处:本文由 Dan (@d4m1n) 于 2026 年 2 月 23 日发表于 X (Twitter)。原文链接:https://x.com/d4m1n/status/2026032801322356903
如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。
Buy me a coffee