Perplexity Computer 横评:19 个模型同时上阵,AI Agent 进入编排时代

2026 年 2 月 25 日,Perplexity 发布了一个叫 Computer 的东西。

不是又一个聊天机器人,也不是搜索功能的迭代。它同时调度 19 个 AI 模型来完成工作——Claude Opus 4.6 做推理,Gemini 做深度研究,Nano Banana 生成图片,Veo 3.1 处理视频,Grok 跑轻量任务,GPT-5.2 负责长上下文和全网搜索。

CEO Aravind Srinivas 引用了乔布斯的话:“音乐家演奏乐器,我指挥乐团。”

这个比喻精准地描述了 Perplexity Computer 的定位——不做乐器,做指挥。

Perplexity Computer 是什么

要理解 Computer,需要先看 Perplexity 的三级递进:Chat → Agent → Computer。

Chat 回答问题。Agent(之前的 Comet Assistant)完成单个任务。Computer 则接管整个工作流。你描述一个目标,它自动拆解成子任务,创建专门的 sub-agent,并行执行,只在需要人类拍板时才暂停——比如发布网站、推送代码、发送邮件这类不可逆操作。

关键特性:

  • 多模型编排:19+ 模型按能力分配任务,不依赖单一模型
  • 持久记忆:跨 session 记住上下文,不需要每次重新描述项目背景
  • 沙箱执行:每个任务在隔离环境中运行,有真实的文件系统和浏览器
  • 人类检查点:敏感操作前暂停等待确认,遵循最小权限原则
  • 长期运行:工作流可以持续数周甚至数月

定价方面,Max 订阅用户($167/月)首批获得访问权限,每月 10,000 credits,发布时赠送 20,000 bonus credits。Pro 和 Enterprise 用户稍后开放。

横向对比:五家公司,五种赌注

现在市面上做 AI Agent / Computer Use 的不止 Perplexity 一家。把主要玩家放在一起看,格局很清楚:

维度Perplexity ComputerClaude (Computer Use + Code + Cowork)ChatGPT AtlasGoogle GeminiMicrosoft Copilot Studio
模型策略19+ 模型编排,按任务分配单一模型家族(Opus/Sonnet/Haiku),深度优化单一模型(GPT-5.2),全能型单一模型家族(Gemini 3),多模态最强多模型接入,企业 RPA 框架
执行环境云端沙箱(文件系统 + 浏览器)桌面 + 终端 + 浏览器 + 企业 SaaS浏览器(Atlas)+ API移动端 + 云端 + 搜索企业工作流 + Office 365
核心优势模型无关,最佳模型做最佳任务开发者生态(MCP)+ 代码执行 + 企业插件8 亿用户基数 + 浏览器入口多模态基准最强 + 移动端独占存量企业客户 + 合规体系
安全机制沙箱隔离 + 人类检查点 + 最小权限权限系统 + 审计日志 + RSP v3.0用户控制 + agent mode 需手动启用Google 安全框架企业级合规 + Azure AD
定价Credits 制($167/月 Max)API 按量 + Pro $20/月 + 企业定制Plus $20/月 + Pro $200/月免费层 + Gemini Advanced企业授权
目标用户需要跨工具自动化的个人和团队开发者 + 知识工作者 + 企业大众用户 + 浏览器用户移动优先用户 + 搜索用户企业 IT 部门

但表格只能说明"是什么",更有意思的是"为什么"——每家公司押注的方向完全不同。

各家的赌注

Perplexity:唯一没有自有模型的公司

这是最反直觉的一个。所有竞争对手都在疯狂训练自己的基础模型——Anthropic 有 Claude,OpenAI 有 GPT,Google 有 Gemini,Microsoft 靠 OpenAI。只有 Perplexity 说:我不需要自己的模型。

它的赌注是:模型会越来越商品化,编排层才是价值所在。

就像 Aravind Srinivas 说的,没有一个模型能在所有任务上都最优。与其押注某个模型赢到最后,不如做那个"总是用最好的模型"的平台。今天 Claude Opus 4.6 做推理最强就用它,明天有更强的就换掉。

这个策略的风险也很明显:如果某个模型公司决定不再对外开放 API,或者大幅涨价,Perplexity 的整个产品就建立在别人的地基上。

Anthropic:三层产品矩阵 + 生态护城河

Anthropic 这一周的动作很密集:

  • 收购 Vercept(2 月 25 日)——强化 Claude 的 Computer Use 能力,让 AI 能像人类一样操作软件
  • Cowork 插件扩展(2 月 24 日)——连接 Google Drive、Gmail、DocuSign、FactSet,直接切入金融、法务、HR
  • Sonnet 4.6 发布(上周)——编码、Computer Use、长推理全面升级

三层矩阵已经成型:API(开发者直接调用)、Claude Code(开发者工具)、Cowork(知识工作者)。加上 MCP(Model Context Protocol)生态,Anthropic 的赌注是:用协议标准锁住开发者,用垂直插件锁住企业。

和 Perplexity 的"我用所有人的模型"形成鲜明对比——Anthropic 的策略是"所有人都来用我的模型"。

OpenAI:分发是最大的护城河

ChatGPT Atlas 于 2025 年 10 月推出,本质上是一个内置了 ChatGPT 的浏览器,支持 agent mode 让 AI 代你预约、下单、在网页上执行操作。产品形态上不算革命性,但 OpenAI 的优势从来不在产品创新。

8 亿用户基数 + 浏览器入口 = 分发优势。

当你控制了用户的浏览器,你就控制了他们接触信息的方式。Atlas 不需要比 Computer 更强大,只需要比它更方便。大多数用户不会去比较"19 个模型编排"和"单一模型"的架构差异,他们只关心"这个东西好不好用、是不是已经装在我的电脑上了"。

Google:基准性能最强 + 移动端独占

Google 的 Gemini 3 在多模态基准测试上表现最强。更关键的是,Google 拥有 Android——全球最大的移动平台。就在同一天(2 月 26 日),Google 宣布 Gemini agent 可以在 Android 上自主帮你叫 Uber、点 DoorDash 外卖——直接在 Pixel 10 和 Galaxy S26 上运行。

这是其他竞争对手无法复制的分发渠道。Google 的赌注是:在用户停留时间最长的设备上做最好的 AI。

Microsoft:企业 RPA 升级赛道

Microsoft 的 Copilot Studio 走的是完全不同的路。它不追求消费者市场的惊艳,而是做了一个企业 agent 构建平台——让企业用自己选择的模型(OpenAI、Google、Anthropic、xAI 都可以接入)构建定制化 agent,嵌入 Office 365、Azure、Teams、Dynamics。

赌注是:企业不需要"最聪明"的 AI,需要"最合规"的 AI。 当你的客户是银行和医院,治理和审计比 benchmark 分数重要得多。

我的观察

用了大半年各种 AI Agent 工具后,有几个想法:

多模型编排 vs 模型绑定,目前还看不出谁赢。 Perplexity 的"用最好的模型做每件事"听起来很合理,但实际执行中,模型之间的切换会带来不一致性——不同模型对同一个概念的理解可能有微妙差异。而 Anthropic 的单一模型家族在一致性上有天然优势。

Per-credit 计费是个值得关注的信号。 Perplexity 可能是第一个在消费者产品上引入类似 per-token 计费的公司。这意味着用户需要关心"这个任务用了多少 credit",而不是"我这个月还有多少次对话"。这会改变用户行为——你会开始优化你的 prompt 来省 credit。

19 个模型 = 19 个攻击面。 这是一个真实的安全顾虑。每多引入一个模型,系统的攻击面就多一个。Perplexity 至今没有发布独立安全审计报告,对于一个声称能运行数月的自主系统来说,这个缺失值得注意。

真正的战场可能不在技术层面。 回头看 AI Agent 这波浪潮,决定胜负的可能不是谁的架构更优雅,而是谁更快地和用户的日常工作流绑定在一起。从这个角度看,Microsoft 在企业端、Google 在移动端的分发优势,可能比技术架构的差异更重要。

编排时代来了

如果说 2025 年是 AI Agent 的"概念验证"年,2026 年正在变成"编排"年。

不再是"一个 AI 做所有事",而是"多个 AI 协同做事"。Perplexity Computer 把这个理念推到了极致——19 个模型,一个指挥。但 Anthropic 用 MCP 生态做编排,OpenAI 用浏览器做分发入口,Google 用移动端做渗透,Microsoft 用企业工具链做锁定。

对普通用户来说,一个务实的建议:不要急着选边站。 这些平台的核心能力还在快速演进,今天的优势明天可能被追平。目前最好的策略是根据你的具体工作流选择工具——如果你需要跨工具自动化,看看 Perplexity Computer;如果你是开发者,Claude Code 的体验目前最好;如果你在企业环境里,Microsoft 的合规故事最完整。

指挥乐团的时代确实来了。但现在还在调音阶段。

如果这篇文章对你有帮助,欢迎请我喝杯咖啡,支持我继续创作更多内容。

Buy me a coffee