OpenAI发布最强模型GPT-5.4 支援自动操控电脑 能力超越人类?

撰文: 快科技
出版:更新:

3月6日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、PPT等复杂办公场景中的表现更加出色。

此次更新带来了两个版本:更擅长复杂推理任务的GPT-5.4 Thinking,以及性能更强、面向企业高端需求的GPT-5.4 Pro。

在计算机操控基准测试OSWorld-Verified中,GPT-5.4取得了75.0%的任务成功率,超过人类平均水平72.4%,相较GPT-5.2的47.3%实现了大幅提升。(OpenAI)
+2

其中,GPT-5.4 Thinking主要提供给付费用户使用,而GPT-5.4 Pro则针对企业级客户。GPT-5.4最大亮点之一是OpenAI首次在通用模型中引入原生电脑操控能力。模型不仅可以生成文本或代码,还能根据屏幕截图直接操作电脑软件、浏览网页,并通过控制滑鼠和键盘完成任务,同时还可与电子表格、金融分析工具等企业应用进行深度整合。

在计算机操控基准测试OSWorld-Verified中,GPT-5.4取得了75.0%的任务成功率,超过人类平均水平72.4%,相较GPT-5.2的47.3%实现了大幅提升。编程能力方面,在Codex开启快速模式后,GPT-5.4的token生成速度可提升约1.5倍,大幅提高代码编写和调试效率。

编程能力方面,在Codex开启快速模式后,GPT-5.4的token生成速度可提升约1.5倍,大幅提高代码编写和调试效率。(OpenAI)

据了解,GPT-5.4在API及Codex可同时支持最高100万token的上下文窗口,是OpenAI迄今提供的最大上下文容量,适合跨步骤长链路任务的规划、执行与验证。

价格方面,API接口中GPT-5.4的单token定价较GPT-5.2略有上涨:每百万输入token为2.5美元(约港币19.6元),输出token为15美元(约港币117.3元)。至于更高性能的GPT-5.4 Pro,每百万输入token价格为30美元(约港币234.6元),输出token价格为180美元(约港币1408元)。

不过,由于token效率提升,许多任务的总成本反而会降低。目前,GPT-5.4 Thinking已向Plus、Team以及Pro订阅用户开放,并取代此前的GPT-5.2 Thinking。GPT-5.2 Thinking则计划于2026年6月5日正式下线。

【延伸阅读】ChatGPT直接开Photoshop来P图?Adobe指3大工具免费用手机也能跑(点击连结看全文)

+6

【本文获“快科技”授权转载,微信公众号:mydrivers】