据2月6日消息,在其竞争对手Anthropic推出新的Opus 4.6模型几分钟后,OpenAI推出了GPT-5.Codex。该模型是周一发布的 Codex 编程工具的重大更新,旨在显着提高性能。 OpenAI表示,Codex GPT-5.3成功集成了GPT-5.2的尖端推理能力、专业知识和编程性能。与上一代(GPT-5.2 Codex)相比,新模型不仅功能更强大,而且运行速度提高了 25%。这使得复杂、长时间运行的任务成为可能,例如深入调查、自主工具调用和端到端流程执行。 Codex GPT-5.3是OpenAI“深度参与自身开发”的第一个模型。 Codex 团队透露,他们正在使用旧版本的模型来调试训练过程、管理实施工作并诊断测试结果。这种“自我进化”能力大大加速了开发进程。无线网络随着这一新模式的推出,Codex已经从一个简单的“编码工具”转变为“计算协作”。它不仅处理编程任务,还支持整个软件生命周期,包括系统监控、产品需求文档 (PRD) 创建和指标分析。此外,其代理能力还延伸到了一般办公空间。在GDPval评估中,该模型在演示(PPT)和财务分析报告等专业知识任务中表现出了强大的实力。在多项行业基准测试中,GPT-5.3 Codex 都创下了新纪录:衡量真实世界编程能力的 SWE-Bench Pro 测试已达到目前的先锋水平。 OSWorld 计算性能测试使用可视化功能,帮助您在桌面环境中以接近人类水平的性能完成复杂的生产力任务。为了展示其Web开发能力,OpenAI通过两个复杂而完整的工作开发了新模型ing 游戏(赛车游戏和跳水游戏)在短短几天内从头开始创建。在数百万代币交互规模下,模型可以基于简单的单词进行独立迭代,生成的代码质量接近可以直接部署到生产的水平。在安全性方面,GPT-5.3 Codex是第一个被归类为“高性能”的网络安全模型。经过专门培训,可以识别软件漏洞。为了支持国防研究,OpenAI 宣布将投资 1000 万美元的 API 积分,为开源软件和关键基础设施的保护提供资金。据报道,该模型是在 NVIDIA GB200 NVL72 系统上进行训练和修复的。 GPT-5.3 Codex 目前向付费 ChatGPT 用户开放,涵盖应用程序、IDE 插件和网页。这次会议的背后还有一个非常戏剧性的故事。 OpenAI 和 Anthropic 原计划在北京举办会议。新工具于凌晨 2 点上线,但蚂蚁金服hropic在最后一刻耍了个“小伎俩”,将发射时间提前了15分钟,在这场发射竞赛中碰了碰运气。 (纯文本)(本文由AI翻译,网易审阅编辑)