Perplexity Computer 横评：19 个模型同时上阵，AI Agent 进入编排时代

2026 年 2 月 25 日，Perplexity 发布了一个叫 Computer 的东西。

不是又一个聊天机器人，也不是搜索功能的迭代。它同时调度 19 个 AI 模型来完成工作——Claude Opus 4.6 做推理，Gemini 做深度研究，Nano Banana 生成图片，Veo 3.1 处理视频，Grok 跑轻量任务，GPT-5.2 负责长上下文和全网搜索。

CEO Aravind Srinivas 引用了乔布斯的话：“音乐家演奏乐器，我指挥乐团。”

这个比喻精准地描述了 Perplexity Computer 的定位——不做乐器，做指挥。

Perplexity Computer 是什么

要理解 Computer，需要先看 Perplexity 的三级递进：Chat → Agent → Computer。

Chat 回答问题。Agent（之前的 Comet Assistant）完成单个任务。Computer 则接管整个工作流。你描述一个目标，它自动拆解成子任务，创建专门的 sub-agent，并行执行，只在需要人类拍板时才暂停——比如发布网站、推送代码、发送邮件这类不可逆操作。

关键特性：

多模型编排：19+ 模型按能力分配任务，不依赖单一模型
持久记忆：跨 session 记住上下文，不需要每次重新描述项目背景
沙箱执行：每个任务在隔离环境中运行，有真实的文件系统和浏览器
人类检查点：敏感操作前暂停等待确认，遵循最小权限原则
长期运行：工作流可以持续数周甚至数月

定价方面，Max 订阅用户（$167/月）首批获得访问权限，每月 10,000 credits，发布时赠送 20,000 bonus credits。Pro 和 Enterprise 用户稍后开放。

横向对比：五家公司，五种赌注

现在市面上做 AI Agent / Computer Use 的不止 Perplexity 一家。把主要玩家放在一起看，格局很清楚：

维度	Perplexity Computer	Claude (Computer Use + Code + Cowork)	ChatGPT Atlas	Google Gemini	Microsoft Copilot Studio
模型策略	19+ 模型编排，按任务分配	单一模型家族（Opus/Sonnet/Haiku），深度优化	单一模型（GPT-5.2），全能型	单一模型家族（Gemini 3），多模态最强	多模型接入，企业 RPA 框架
执行环境	云端沙箱（文件系统 + 浏览器）	桌面 + 终端 + 浏览器 + 企业 SaaS	浏览器（Atlas）+ API	移动端 + 云端 + 搜索	企业工作流 + Office 365
核心优势	模型无关，最佳模型做最佳任务	开发者生态（MCP）+ 代码执行 + 企业插件	8 亿用户基数 + 浏览器入口	多模态基准最强 + 移动端独占	存量企业客户 + 合规体系
安全机制	沙箱隔离 + 人类检查点 + 最小权限	权限系统 + 审计日志 + RSP v3.0	用户控制 + agent mode 需手动启用	Google 安全框架	企业级合规 + Azure AD
定价	Credits 制（$167/月 Max）	API 按量 + Pro $20/月 + 企业定制	Plus $20/月 + Pro $200/月	免费层 + Gemini Advanced	企业授权
目标用户	需要跨工具自动化的个人和团队	开发者 + 知识工作者 + 企业	大众用户 + 浏览器用户	移动优先用户 + 搜索用户	企业 IT 部门

但表格只能说明"是什么"，更有意思的是"为什么"——每家公司押注的方向完全不同。

各家的赌注

Perplexity：唯一没有自有模型的公司

这是最反直觉的一个。所有竞争对手都在疯狂训练自己的基础模型——Anthropic 有 Claude，OpenAI 有 GPT，Google 有 Gemini，Microsoft 靠 OpenAI。只有 Perplexity 说：我不需要自己的模型。

它的赌注是：模型会越来越商品化，编排层才是价值所在。

就像 Aravind Srinivas 说的，没有一个模型能在所有任务上都最优。与其押注某个模型赢到最后，不如做那个"总是用最好的模型"的平台。今天 Claude Opus 4.6 做推理最强就用它，明天有更强的就换掉。

这个策略的风险也很明显：如果某个模型公司决定不再对外开放 API，或者大幅涨价，Perplexity 的整个产品就建立在别人的地基上。

Anthropic：三层产品矩阵 + 生态护城河

Anthropic 这一周的动作很密集：

收购 Vercept（2 月 25 日）——强化 Claude 的 Computer Use 能力，让 AI 能像人类一样操作软件
Cowork 插件扩展（2 月 24 日）——连接 Google Drive、Gmail、DocuSign、FactSet，直接切入金融、法务、HR
Sonnet 4.6 发布（上周）——编码、Computer Use、长推理全面升级

三层矩阵已经成型：API（开发者直接调用）、Claude Code（开发者工具）、Cowork（知识工作者）。加上 MCP（Model Context Protocol）生态，Anthropic 的赌注是：用协议标准锁住开发者，用垂直插件锁住企业。

和 Perplexity 的"我用所有人的模型"形成鲜明对比——Anthropic 的策略是"所有人都来用我的模型"。

OpenAI：分发是最大的护城河

ChatGPT Atlas 于 2025 年 10 月推出，本质上是一个内置了 ChatGPT 的浏览器，支持 agent mode 让 AI 代你预约、下单、在网页上执行操作。产品形态上不算革命性，但 OpenAI 的优势从来不在产品创新。

8 亿用户基数 + 浏览器入口 = 分发优势。

当你控制了用户的浏览器，你就控制了他们接触信息的方式。Atlas 不需要比 Computer 更强大，只需要比它更方便。大多数用户不会去比较"19 个模型编排"和"单一模型"的架构差异，他们只关心"这个东西好不好用、是不是已经装在我的电脑上了"。

Google：基准性能最强 + 移动端独占

Google 的 Gemini 3 在多模态基准测试上表现最强。更关键的是，Google 拥有 Android——全球最大的移动平台。就在同一天（2 月 26 日），Google 宣布 Gemini agent 可以在 Android 上自主帮你叫 Uber、点 DoorDash 外卖——直接在 Pixel 10 和 Galaxy S26 上运行。

这是其他竞争对手无法复制的分发渠道。Google 的赌注是：在用户停留时间最长的设备上做最好的 AI。

Microsoft：企业 RPA 升级赛道

Microsoft 的 Copilot Studio 走的是完全不同的路。它不追求消费者市场的惊艳，而是做了一个企业 agent 构建平台——让企业用自己选择的模型（OpenAI、Google、Anthropic、xAI 都可以接入）构建定制化 agent，嵌入 Office 365、Azure、Teams、Dynamics。

赌注是：企业不需要"最聪明"的 AI，需要"最合规"的 AI。 当你的客户是银行和医院，治理和审计比 benchmark 分数重要得多。

我的观察

用了大半年各种 AI Agent 工具后，有几个想法：

多模型编排 vs 模型绑定，目前还看不出谁赢。 Perplexity 的"用最好的模型做每件事"听起来很合理，但实际执行中，模型之间的切换会带来不一致性——不同模型对同一个概念的理解可能有微妙差异。而 Anthropic 的单一模型家族在一致性上有天然优势。

Per-credit 计费是个值得关注的信号。 Perplexity 可能是第一个在消费者产品上引入类似 per-token 计费的公司。这意味着用户需要关心"这个任务用了多少 credit"，而不是"我这个月还有多少次对话"。这会改变用户行为——你会开始优化你的 prompt 来省 credit。

19 个模型 = 19 个攻击面。 这是一个真实的安全顾虑。每多引入一个模型，系统的攻击面就多一个。Perplexity 至今没有发布独立安全审计报告，对于一个声称能运行数月的自主系统来说，这个缺失值得注意。

真正的战场可能不在技术层面。 回头看 AI Agent 这波浪潮，决定胜负的可能不是谁的架构更优雅，而是谁更快地和用户的日常工作流绑定在一起。从这个角度看，Microsoft 在企业端、Google 在移动端的分发优势，可能比技术架构的差异更重要。

编排时代来了

如果说 2025 年是 AI Agent 的"概念验证"年，2026 年正在变成"编排"年。

不再是"一个 AI 做所有事"，而是"多个 AI 协同做事"。Perplexity Computer 把这个理念推到了极致——19 个模型，一个指挥。但 Anthropic 用 MCP 生态做编排，OpenAI 用浏览器做分发入口，Google 用移动端做渗透，Microsoft 用企业工具链做锁定。

对普通用户来说，一个务实的建议：不要急着选边站。 这些平台的核心能力还在快速演进，今天的优势明天可能被追平。目前最好的策略是根据你的具体工作流选择工具——如果你需要跨工具自动化，看看 Perplexity Computer；如果你是开发者，Claude Code 的体验目前最好；如果你在企业环境里，Microsoft 的合规故事最完整。

指挥乐团的时代确实来了。但现在还在调音阶段。

☕ 如果这篇文章对你有帮助，欢迎请我喝杯咖啡，支持我继续创作更多内容。

Buy me a coffee