九游官网

澳门游戏网 Codex不计算让Claude Code好过

发布日期:2026-03-15 10:34 点击次数:69

澳门游戏网 Codex不计算让Claude Code好过

作家 | 周一笑邮箱 | zhouyixiao@pingwest.com

2月6日,OpenAI总裁Greg Brockman在X上公开发了一条面向全公司工程团队的帖子,设了一个deadline:到3月31日,任何本事任务,工程师的第一用具应该是agent,而不是裁剪器或终局。

这是OpenAI对我方下的动员令。

要是只看这句话,你可能会合计又是一条硅谷式的愿景声明。但接下来六周发生的事情标明,Brockman不是在喊标语。OpenAI的Coding Agent平台Codex,正在阅历一轮荒漠的居品冲刺,密度之高,节拍之快,以致让一些永久关怀AI编码用具的开发者初始重新注目我方的用具链。

与此同期,Codex在行为员群体中的热度和口碑也在肉眼可眼光上涨。

一切动作王人指向“狙击”Anthropic 如日中天的Claude Code。

1

六周的豪恣迭代

拉一下时辰线就能感受到这个节拍。

2月2日,Codex桌面App发布(macOS),OpenAI同期晓示向ChatGPT免费和Go用户怒放Codex,总共付用度户的速率收尾翻倍。

2月5日,GPT-5.3-Codex发布,OpenAI称它为\"第一个匡助创造了自身的模子\"。淹没天,Anthropic发布Claude Opus 4.6。

2月12日,Codex-Spark发布,与AI推理硬件公司Cerebras相助,推理速率向上每秒1000 tokens。OpenAI的说法是,“当模子才气越来越强,交互速率就成了明确的瓶颈。”

2月14日,OpenClaw首创东谈主Peter Steinberger晓示加入OpenAI。据Pragmatic Engineer报谈,Steinberger用Codex编写了OpenClaw的沿途代码,偏好万古辰运行的agentic loop。Sam Altman在X上称他为“天才”,说他将“鼓舞下一代personal agents”。

3月4日,Codex桌面App登陆Windows。

3月5日,GPT-5.4发布,是OpenAI第一个同期具备reasoning、coding和原生computer use才气的通用模子,在Codex和API中支抓100万token高下文。

3月6日,Codex Security过问research preview。这是OpenAI推出的利用安全代理,前身为内测阶段的Aardvark,粗略分析代码仓库、构建名目级挟制模子、在沙盒中考证纰谬并提倡开发建议。昔时30天的beta测试中,它扫描了向上120万次commits,发现792个critical级别纰谬和向上10000个高危问题,隐敝OpenSSH、GnuTLS、Chromium均分量级开源名目。误报率镌汰向上50%,杂音镌汰84%。

使用数据也在同步攀升。Sam Altman在X上证据,Codex的周活用户自岁首以来增长向上三倍;Codex团队沉着东谈主Thibault Sottiaux(Tibo)告诉Pragmatic Engineer的Gergely Orosz,1月以来它的使用量增长了5倍,周活开发者向上100万。Tibo还在播客中提到,Super Bowl周日播出的Codex告白让系统险些立即承受了渊博负载。

六周,七次首要居品动作,这成了OpenAI在居品上最激进的冲刺之一。

要一语气这个节拍,一方面要看供给侧的变化。GPT-5系列模子的agent才气在昔时几个月出现了质的飞跃,从高下文窗口、用具调用到万古辰自主履行,模子自己的才气到了一个不错撑抓Coding Agent这个居品景观的临界点。

另一方面,需求侧的信号相同利害。据SemiAnalysis报谈,Anthropic的Claude Code还是作念出25亿好意思元的年化收入,占其企业收入的一半以上。Claude Code用真金白银诠释了Coding Agent不错成为AI公司的中枢收入引擎。对于估值据报已达数千亿好意思元的OpenAI来说,毁灭这个赛谈不是一个本质的选项。

时辰点上的贴身肉搏也值得可贵。GPT-5.3-Codex和Claude Opus 4.6在2月5日淹没天发布。Codex Security和Claude Code Security险些同期推出。这种节拍自己等于信号,两家公司正在把Coding Agent平台视为正面战场。

1

开发者初始从Claude Code的单一模式酿成羼杂模式

在很长一段时辰,Anthropic旗下的Claude Code看起来似乎还是莫得了敌手,用户对它的依赖变得越来越重。而OpenAI显著不念念让Anthropic 这样舒适。在Codex的一通激进冲刺后,开发者社区的反映也初始发生一些变化。

昔时一个月,Reddit和Hacker News上对于Codex和Claude Code的商议,出现频率最高的词不是更好或替代,而是stacking。也等于说,越来越多的开发者不是在两者之间经受,而是同期使用。

Calvin French-Owen是一个典型案例。他是Segment连合首创东谈主,曾在OpenAI参与Codex web居品的发布,同期亦然Claude Code的深度用户。他在本年2月写的一篇博客里说,我方经受用具的中枢尺度是“我有若干时辰,以及我念念让它多自主地跑”。

他的平时责任流是用Claude Code作念计较、编排终局和经管git操作,然后切到Codex作念本色编码。他说Opus在跨高下文窗口的责任中后果更高,会同期启动多个子代理并行探索代码库;而Codex在万古辰自主编码任务上更褂讪。

Reddit上也出现了更具体的单干模式。有开发者详确面貌了一个五段式workflow,先让Claude Code出计算,再让Codex review计算,可提现游戏平台app然后由Claude实施,临了交给Codex作念code review和QA迭代。还有东谈主成功把Claude Code和Codex串成了一个CLI bridge,因为手动在两者之间复制粘贴太累了。

一篇社永别析回来了500多条Reddit评述后的论断,Claude Code在一组小样本盲测中胜率达到67%,质料更高;但Codex 20好意思元的套餐能编码一整天阻挡,而Claude Code同价位十几个prompt就用收场。“Claude Code质料更高但用不完,Codex稍弱但全天能用”,这是2026年3月开发者社区最果真的共鸣。

开发者社区还流传着一个譬如来面貌两者的气质互异,Claude像好意思国东谈主,恰手脚念充满创造力的探索和头脑风暴,Codex像德国东谈主,代表极致的后果和专注履行。“它就像一条咬住骨头不放的狗,相配稚拙,会一直尝试直到贬责骂题。”

固然也有反面声息。Hacker News上有开发者说Codex对我方来说“每一项王人比Claude Code差”,尤其是code review会制造看似合理但本色不存在的问题,他临了只把Codex用来复核Claude的产出。

但大场地还是很明确了,社区商议正在从哪个更好就用哪个,酿成两个王人用,各占一个工位。

1

比的不再是benchmark,是谁是更实用的居品

只看模子benchmark,你不太容易一语气Codex为什么起势。在SWE-Bench这类编码评测上,Claude Opus 4.6仍然起原。果真让Codex拉开互异的地方在别处,OpenAI正在围绕它构建一整套工程系统。

Orosz本年2月发表了一篇对Codex团队的深度报谈。其中最引东谈主重视标事实是,Codex向上90%的代码是由Codex我方编写的。Anthropic方面也有肖似的说法,Claude Code的创建者Boris Cherny告诉Orosz,Claude Code的数据简短特地。

金沙电玩城app官方下载

固然,这里的90%需要打个扣头一语气,在一个熟悉名目中,样板代码、测试用例、通例重构占了多数行数,中枢架构决议仍然由东谈主来作念。但两家AI实验室王人在用我方的coding 用具来编写我方的coding 用具,这种自举自己就说明了这些用具还是深度镶嵌了平时工程历程。

Codex团队在工程组织层面走得更远。Orosz的报谈面貌了一种新的责任式样,Codex团队的典型工程师同期运行4到8个并行agent,分别处理feature开发、code review、安全审计、代码库一语气、bug开发等任务。工程师的扮装正在从写代码的东谈主酿成经管agent的东谈主。

本事选型上,Codex CLI经受了Rust(Claude Code使用的是TypeScript)。团队沉着东谈主Tibo给出的根由不仅是性能和正确性,还有工程文化,经受Rust是为了给团队设定一个高工程尺度,同期减少对npm依赖生态的依赖。他们以致招募了Rust终局UI库Ratatui的珍藏者全职加入团队。

更值得关怀的是分层代码审查机制。Codex团队查验了一个定制的code review模子,据Tibo说约9/10的评述能指出有用问题。审查分两层,非要津代码在AI review后不错成功merge,中枢agent代码和开源组件仍然条目强制东谈主工审查。这套机制的兴味在于,审查自己初始分层了。

还有两个细节能说明Codex正在从用具走向系统。Codex不错运行我方的竣工测试套件来测试自身;团队还耕作了夜间巡检,让Codex自动扫描代码库并生成待审开发建议,工程师每天早上进公司时就有一批开发等着review。

一家名为Wonderful的AI开发公司的首席架构师在本年3月写了一篇著作,面貌了他们四个月前退却手动coding后的训戒。他对两个用具的定位是,Codex是坐在房间后头戴耳机的工程师,默低吟完你通盘代码库15分钟才写第一滑代码,Claude则更有居品感,更擅长判断什么嗅觉对。他们把Codex用于低延迟系统责任、及时语音管线、性能敏锐代码,Claude则用于UI和前端。

1

从coding用具到Agent平台

拉远来看,Codex六周冲刺的场地指向一个更大的贪念。

Peter Steinberger的加入是一个东谈主事信号。他平时同期并行5到10个agent,加入OpenAI后的场地是下一代personal agents,不是coding用具。OpenAI正在用Codex作为agent战术的进口。

Codex Security则是另一个场地的延迟。当Codex从帮你写代码走向帮你审计安全,它的定位就还是变了。

GPT-5.4进一步加快了这个改动。作为OpenAI第一个具备原生computer use才气的通用模子,它在Codex中不仅能写代码,还能操作电脑、跨利用履行责任流。配合正在成型的插件/skills生态系统和企业级权限经管,Codex的空洞越来越像一个AI原生的开发平台。

Codex团队在Every的播客中清醒了他们眼中的下一个瓶颈,等于代码审查。

模子生成代码的速率还是远超东谈主类review的速率,考证产出的正确性成了最紧要的问题。他们还是在尝试让模子通过重现用户操作旅途来“诠释”开发有用,而不是让东谈主类逐行读代码。

这些贪念和Claude Code还是越来越明晰的发展场地有好多重合,在从Claude Code那处赶快抢走了一些用户和使用场景之后,Codex的势头正在起来。回到Greg Brockman 2月6日的那条帖子。他设的deadline是3月31日,现在距离deadline还有两周多,而从昔时六周的节拍来看,Codex的冲刺还远莫得完结。

OpenAI把也曾在模子上呈现出的狠劲儿和卷王的气质,王人放到了Codex上,接下来它和Claude code之间火器重逢的故事,会更精彩了。

点个“爱心”,再走 吧

开云官网 AG官网 星空官网 米兰官网 九游官网 乐鱼官网 亚博官网 乐动官网
电话:
邮箱:
地址:
可提现游戏平台

Copyright © 1998-2026 可提现游戏平台™版权所有

zzchq.com 备案号 备案号: 豫ICP备18001851号-1

技术支持:®提现游戏  RSS地图 HTML地图