美国开放人工智能研究中心(OpenAI)近日宣布推出其最新一代人工智能模型——GPT-5.4,这一版本被官方定义为面向专业领域打造的效率最高、能力最强的前沿模型之一。作为首个具备原生计算机操作能力的通用模型,GPT-5.4在推理、编程及智能体工作流程等关键技术领域实现多项突破,标志着人工智能从“回答问题”向“执行任务”的跨越式发展。
GPT-5.4整合了OpenAI在编程、办公场景优化及长文本处理领域的最新成果,核心能力全面升级。该模型继承了GPT-5.3-Codex的代码生成优势,针对表格处理、文档编辑、演示文稿制作等办公任务进行专项优化,能高效完成复杂专业工作。其长文本处理能力显著提升,事实准确性较前代版本改善明显,在多项专业评测中表现超越同类模型,成为OpenAI迄今事实性准确率最高的模型之一。
此次发布的GPT-5.4推出Thinking和Pro双版本,分层满足不同用户需求。Pro版本聚焦极致性能,面向超高复杂度任务场景设计,适用于科研、金融等需要处理海量数据的领域;Thinking版本则新增“思考计划前置”功能,在生成答案前展示推理思路和执行计划,用户可实时调整任务方向,大幅减少沟通成本。该版本深度网络研究能力升级后,回答质量更高、速度更快,且更贴合任务需求。
原生计算机操作能力是GPT-5.4的突破性亮点。模型突破传统AI仅能输出答案的局限,通过识别屏幕截图自主发出鼠标键盘指令,驱动智能体完成跨应用操作。例如,它可自动制作Excel报表、设计PPT排版、发送邮件、跨软件数据查询等,在真实桌面环境测试中成功率达75.0%,略高于人类平均水平。这一特性使AI从“辅助工具”升级为“可执行伙伴”,尤其适合需要自动化处理复杂工作流程的场景。
OpenAI同步开放了模型访问权限与API支持。GPT-5.4 Thinking版本即日起向ChatGPT Plus、Team和Pro等付费用户开放,逐步替代旧版GPT-5.2 Thinking模型,后者作为“遗留模型”保留至2026年6月5日;Pro版本面向Pro和Enterprise计划用户开放,企业与教育用户可通过管理员设置开启早期访问。API端支持专属标识符调用,上下文窗口扩展至100万tokens,为长周期跨步骤任务提供基础支持。










