Skip to content
0

OpenAI 终于不装了?Codex 桌面端实测:这是给 Claude 4.5 的一封“战书”

摘要: 过去三个月,我们团队的开发流只有一种:Claude Code (CLI) + Claude 4.5 Opus。 OpenAI 之前推出的 codex-cli?说实话,那就是个拙劣的模仿品。功能和 Claude Code 几乎一模一样(甚至连命令参数都长得像),但响应速度慢得像在拨号上网,被 Claude 4.5 按在地上摩擦。

但昨天发布的 Codex Desktop App (MacOS版),配合底层的 GPT-5.2 模型,让我第一次有了“倒戈”的冲动。 这次它不再是“模仿”,而是搞出了全新的**“多智能体指挥部”**。


一、 拨乱反正:还原真实的“鄙视链”

在进入正题前,作为老开发,咱们先捋一捋 2026 年初现在的战局(别再看那些营销号吹 Claude 3.5 了,那是去年的老古董)。

  • 霸主 (The King)Claude 4.5 Opus Thinking
    • 这是目前的“智商天花板”。它的 Thinking Mode(深度思考模式)在写复杂架构时,逻辑缜密得像个拥有 10 年经验的架构师。
    • Claude Code (CLI) 工具极其顺手,深得极客喜爱。
  • 追赶者 (The Copycat)OpenAI codex-cli
    • 这是 OpenAI 被逼急了出的竞品。功能上完全复刻 Claude Code,但受限于之前的 GPT-5.1 模型,推理慢、Token 吞吐便秘,除了死忠粉没人用。
  • 破局者 (The Challenger)Codex Desktop App + GPT-5.2
    • OpenAI 终于明白打不过 CLI 的极客体验,于是换赛道做了 GUI(桌面端)
    • 核心逻辑变了:从“你敲命令它执行”,变成了“你下达意图,它派出一支团队”。

二、 GPT-5.2 vs Claude 4.5 Opus:神仙打架

这次 Codex App 之所以能打,是因为底层的 GPT-5.2 终于追上了 Claude 4.5 的步伐。

  • Claude 4.5 Opus Thinking
    • 强项深度推理。给它一个“死锁 Bug”,它能花 30 秒思考,把整个堆栈逻辑推演一遍再动手。它是最好的“攻坚手”。
  • GPT-5.2 Codex 版
    • 强项上下文吞吐与多任务并行。它可能单点逻辑比 Opus 差一丢丢(极小),但它在 Codex App 里是**“多线程”**的。它能一边写代码,一边自测,一边写文档。

三、 Codex App 的高阶玩法(这才是赚回票价的关键)

很多小白下载了 App 还在当聊天框用,那就是暴殄天物。 老T 摸索了两天,总结了三套**“老板思维”**的玩法:

1. “影分身”开发流 (The Multi-Agent Parallelism)

在 Claude Code 里,你得串行操作:先让它写代码,写完再让它补测试。 在 Codex App 里,你可以利用**“工作树(Worktree)”**特性。

  • 玩法:打开 Automations 面板,设置并行任务。
    • 指令:“重构 User 模块,并同步更新测试和文档。”
    • Codex 动作:它会瞬间启动 3 个 Agent
      • Agent A(主程):修改 user_service.py
      • Agent B(测试):实时监控 A 的修改,并发编写 test_user.py
      • Agent C(文员):同步更新 Swagger 文档。
  • 效果:本来需要 1 小时的串行工作,20 分钟搞定。这不是代码补全,这是“赛博外包团队”。

2. “克隆老员工” (Skill Injection)

这是解决 OpenAI 模型“不懂规矩”的神技。 Codex 允许你创建 Custom Skills(本质是结构化的 Prompt 包)。

  • 高阶玩法
    • 把你团队里最牛逼的架构师写的代码(比如 50 个精选 Commit),喂给 Codex 的 Learning 模块。
    • 定义 Skill:Execute PR Review based on @LaoT's Style
    • 以后所有 Agent 提交的代码,都会自动带上那个架构师的“味儿”(命名习惯、甚至注释风格)。
    • 价值:让 AI 瞬间学会你们公司的“方言”。

3. “24小时守夜人” (The Night Watchman)

Codex App 有一个被严重低估的功能:后台常驻 (Background Daemon)

  • 玩法
    • 把它连接到你的本地 Log 文件夹或者 Sentry 接口。
    • 设置触发器:When ERROR_LOG > 0
    • 场景:你下班睡觉了。半夜测试服崩了。
    • Codex 自动醒来 -> 读取日志 -> 定位 Commit -> 尝试回滚或修复 -> 发送飞书通知给你。
    • 第二天早上,你看到的是一条推送:“昨晚 3 点内存溢出,已自动重启并修复了泄露的闭包,请 Review。”

四、 总结:该怎么选?

  • 如果你是独狼极客:习惯在 Terminal 里运指如飞,Claude Code + Claude 4.5 Opus 依然是目前的体验之王。那种行云流水的快感,GUI 给不了。
  • 如果你是项目经理/技术总监Codex Desktop App 是你的神器。它更像是一个Project Manager,能帮你管理复杂的项目上下文,把控代码质量,把繁琐的文档和测试工作分发出去。

OpenAI 这一次,终于没有再拙劣地模仿 CLI,而是用 GUI 的“钞能力”打了一场翻身仗。