开云(中国)Kaiyun·官方网站登录入口 > 资讯习作 >

资讯习作

栏目分类

热点资讯

开云(中国)Kaiyun·官方网站登录入口

衡宇发自凹非寺量子位 | 公众号 QbitAI GPT-5.4，它来了！它更像是一个“模子才气大一统”后果：OpenAI初度在单一模子中，把推理（Reasoning）、编程（Coding）、筹画机原生交互（Computer Use）、深度网页搜索以及百万级Token高低文全部揉碎、重组，焊死在了合并个模子里。要点是，莫得因为N in one而葬送掉任何一个单项的性能—— OpenAI额外强调，GPT-5.4在以上领域的多个要道基准测试中依然保抓开端。跳票许久的OpenAI，终于冷不

你的位置：开云(中国)Kaiyun·官方网站登录入口 > 资讯习作 > 开云体育(中国)官方网站跟着GPT-5.4上线-开云(中国)Kaiyun·官方网站登录入口

开云体育(中国)官方网站跟着GPT-5.4上线-开云(中国)Kaiyun·官方网站登录入口

时间：2026-03-09 06:34 点击：138 次

衡宇发自凹非寺

量子位 | 公众号 QbitAI

GPT-5.4，它来了！

它更像是一个“模子才气大一统”后果：OpenAI初度在单一模子中，把推理（Reasoning）、编程（Coding）、筹画机原生交互（Computer Use）、深度网页搜索以及百万级Token高低文全部揉碎、重组，焊死在了合并个模子里。

要点是，莫得因为N in one而葬送掉任何一个单项的性能——

OpenAI额外强调，GPT-5.4在以上领域的多个要道基准测试中依然保抓开端。

跳票许久的OpenAI，终于冷不防给了AI大模子圈梆梆一拳。

其中最能劝诱树立者观念的，莫过于它是OpenAI首个原生支抓“筹画机使用”才气的通用模子。

我耳边王人也曾听到GPT-5.4的声息了：

玩儿龙虾的一又友们，走过途经洽商一下我咯～

同期，官方博文自大，GPT-5.4的着力也出现了昭着扶持。

比拟GPT-5.2，GPT-5.4在推理过程中使用的Token数目显耀减少。

Token奢华下落意味着反应速率更快，同期举座资本也更低。

是的，它变强了，但也变低廉、变快了。

这亦然OpenAI此次发布反复强调的极少：才气扶持和着力优化是同期发生的。

跟着GPT-5.4上线，ChatGPT中的模子体系也随之调整。

GPT-5.4同步上线ChatGPT、API以及Codex。

在API价钱体系中，GPT-5.4的单Token价钱略高于GPT-5.2，但由于任务所需Token减少，总体资本可能并不会上升太多。

面向复杂任务的GPT-5.4 Pro版块也一齐推出，在ChatGPT中则提供为GPT-5.4 Thinking。

值得小伙伴们能干的极少，GPT-5.4 Thinking将取代此前的GPT-5.2 Thinking，且GPT-5.2将在三个月后端庄退役。

而GPT-5.1系列将在3月11日就要从ChatGPT里say bye bye了。

爱戴你们终末相处的甘好意思时光吧～

目下各个酬酢媒体也曾炸开了锅。

有网友感叹说念领有百万token高低文窗口、还能原生使用电脑的GPT-5.4，和苹果史上最低廉札记本电脑MacBook Neo同周发布……

“天爷啊，我的札记本电脑正在资格一场存在主义危险！！”

三大才气扶持，系OpenAI首个原生支抓电脑操作的通用模子

在具体才气层面，GPT-5.4的升级不错抽象为三个目的：

深度常识责任 (Knowledge Work）原生筹画机使用 (Computer Use）高阶编程与调试 (Coding）

这三种才气基本隐敝了现时大多数数字责任的中枢过程，而GPT-5.4王人作念得挺出色。

咱们逐个来看。

深度常识责任 (Knowledge Work）

开端是常识责任才气。

在预计AI处理44种办事常识责任才气的GDPval基准测试中，它平局+到手的综合得分83.0%。

多说几句嗷，GDPval评测主如果用来测试模子在信得过办事场景中的证据，它评测触及44种办事，隐敝了好意思国GDP孝顺最高的9个行业。

具体任务上并不仅仅绵薄问答，它条款模子完成信得过责任产物，举例销售演示文稿、管帐表格、排班表、制造过程图以致短视频。

是以在多数常识责任任务中，GPT-5.4的收尾也曾八成与专科从业者抓平，以致杰出他们。

此外，OpenAI额外强化了GPT-5.4在办公文档领域的才气。

举例在里面投资银行建模测试中，GPT-5.4的平均得分达到87.3%，而GPT-5.2为68.4%。在东说念主类评审的PPT生成测试中，评委有68%的时代更偏好GPT-5.4生成的收尾，原因包括视觉效果更好、版式更丰富以及图片使用更合理。

从愚弄角度来看，这些才气对应的场景格外径直。

包括写证据、作念财务模子、制作演示文稿、分析买卖数据等责任，王人是典型的常识型任务。

GPT-5.4正在野着这类任务进行有利优化。

原生筹画机使用 (Computer Use）

GPT-5.4最引东说念主关心的一项才气是原生筹画机操作，这是GPT-5.4区别于以往系数模子的中枢象征。

模子不错通过截图交融软件界面，然后扩充鼠标点击和键盘输入等操作。

包括发送邮件、创建日期事件、填写表单、操作网页等……王人不错通过这种神气完成。

在WebArena浏览器任务测试中，GPT-5.4取得67.3%的生着力，高于GPT-5.2的65.4%。

在Online-Mind2Web测试中，仅通过截图不雅察完成网页操作时，GPT-5.4的生着力达到92.8%。

此外，在OSWorld-Verified基准测试中，GPT-5.4在桌面操作任务中的生着力达到75.0%，也曾杰出东说念主类平均水平（72.4%）。

这些数据背后代表的是一种新的交互花式，也算是没落下最近的龙虾狂飞腾。

高阶编程与调试

第三个要道才气来自编程。

何况强调的是“高阶编程”。

GPT-5.4吸纳了此前最强的编程模子GPT-5.3-Codex的才气。目下的它不仅支抓Token输出速率扶持1.5倍的/fast花式，还加入了一个名为“Playwright (Interactive)”的实验性技能。

它允许AI在帮你写网页或者愚弄时，开启一个窗口进行视觉化调试。

比如你给它一个绵薄的需求去作念模拟游戏，它能一边生成好意思术金钱、一边写逻辑，以致一边运行自动测试来考证游戏气象是否泛泛。

在SWE-Bench Pro测试中，GPT-5.4取得57.7%的收货，略高于GPT-5.3-Codex的56.8%，同期延长更低。

里面测试还自大，GPT-5.4在复杂前端任务中的证据昭着优于此前模子。生成的界面遐想愈加好意思不雅，功能结构也更齐备。

为了展示这一才气，OpenAI演示了一个由GPT-5.4生成的浏览器主题公园模拟游戏。

模子温存单指示词开赴，生成游戏资源、构建场景、编写逻辑，并通过自动浏览器测试收敛迭代。

这种“边造边测”的才气，也曾格外接近一个东说念主类高档全栈工程师的责任流。

一种趋势不言而谕：

UI交互正在取代繁琐的API对接，成为AI操作寰球的新主流旅途。

emmmm，这可能会让好多中间件失去价值。

举座定位：AI数字职工

看完上述才气的整合，你就能读懂OpenAI在官方博文里浮现出的贪心。

OpenAI在发布著述中屡次提到：

GPT-5.4的遐想是成为八成完成信得过责任的Agent系统。

如果说之前的GPT模子版块照旧一个需要你盯着看的辅助用具，那么GPT-5.4也曾运转尝试成为一个能孤独负责整块业务的数字职工。

这种“AI数字职工化”体目下三个维度的飞跃。

开端是电脑操作才气。

模子不错通过截图交融软件界面，并通过鼠标和键盘指示进行操作。

这使得AI八成径直在电脑环境中扩充当务。

其次是浏览器任务才气。

在BrowseComp测试中，GPT-5.4的收货达到82.7%，而GPT-5.4 Pro达到89.3%，比GPT-5.2扶持17个百分点。

这意味着模子八成抓续搜索网页、筛选信息并整合收尾，尤其符合处理需要多轮检索的问题。

第三是多用具调用才气。

在Toolathlon基准测试中，GPT-5.4取得54.6%的准确率，高于GPT-5.2的45.7%。

这个测试的任务通常需要多步地操作，举例读取邮件附件、上传文献、评分功课并记载到表格中。

这种按需检索用具的才气是镌汰Agent运行资本的要道，它处分了曩昔模子在面临复杂指示时容易“迷途”或者Token爆炸的问题。

此外，关于对延长条款较高的场景（在这种场景中，东说念主们倾向于不进行推理操作），GPT-5.4 比其前辈版块有了进一步的纠正。

细节之处的全面进化

除了上述支抓才气，GPT-5.4在办公细节上也进行了多数打磨。

比如它在创建和剪辑电子表格、PPT方面的证据，其表格建模准确率从68.4%跃升至87.3%。

在演示文稿生成测试中，东说念主类评审也更偏好GPT-5.4的收尾，觉得其视觉各样性和审好意思更强。

同期，视觉才气的扶持也带动了文档领略的逾越。

在MMMU-Pro视觉推理测试中，GPT-5.4取得81.2%的准确率，高于GPT-5.2的79.5%。

更防止的是，它目下支抓高达1024万像素的原图输入，对高密度、高分辨率的图像交融愈加精确。

视觉才气的扶持也带来了更强的文档领略才气。

在OmniDocBench测试中，GPT-5.4的平均失实率从0.140下落到0.109。

最令东说念主欢腾的是失实率的下落。

从官方先容中能初步嗅觉到，GPT-5.4是个极其讲究事实的模子，其事实失实概率比前代镌汰了33%，大大缓解了用户对模子幻觉的惊慌。

在着力方面，GPT-5.4引入用具搜索机制。

曩昔模子在使用用具时，需要在Prompt中包含系数效具界说。如果用具数目好多，Prompt就会变得格外浩大。

目下模子不错先得回用具列表，然后按需查询具体用具界说。

在完满疏通准确率的情况下，将总Token使用率镌汰了47%。

这种资本收尾妙技讲明OpenAI正试图让大模子大畛域买卖化变得愈加推行，毕竟关于企业来说，省钱和好用同等防止。

更好用了，但更省钱了吗？

从OpenAI公布的API订价表来看，GPT-5.4的订价如实比5.2版块要高出一截。

GPT-5.2的每百万Token输入/输出价钱分辨是1.75好意思元和14好意思元，而GPT-5.4则高涨到了2.5好意思元和15好意思元。

尤其是关于那些追求极限性能的用户，GPT-5.4 Pro的价钱更是飙升到了每百万输入30好意思元。

天然，原因战胜是5.4被定位为针对专科机构和高端坐褥力场景的溢价居品。

如果你仅仅写写绵薄的谈天案牍，不时用5.2其实更合算。

不外诚然单价涨了，但GPT-5.4在Agent任务中的“省钱之说念”主要藏在它的时候机制里。

最中枢的极少是等于用具搜索（Tool Search）功能。

以往咱们让AI接入外部用具（比如接入几十个公司的数据库和里面接口）时，必须把系数效具的界说全部塞进指示词里。

哪怕AI此次只用了一个用具，你也得为剩下的几十个用具的界说支付Token用度。

但在GPT-5.4下，由于引入了相通“查字典”的搜索机制，模子不错先看一遍节略的用具清单，等细目要用哪个时，再临时去调取阿谁用具的详备界说。

在针对MCP Atlas基准测试的实验中，这项时候在保抓同等准确率的情况下，把总Token使用量足足镌汰了47%。

One more Thing

民众千里浸在时候狂欢中时，也有网友共享了一些心痛霎时。

始终在冲浪一线的Yuchen Jin仅仅对GPT 5.4 Pro说了一句“Hi，俺是Anthropic独创东说念主”，就花掉了整整560元……

时候逾越好快，但网友的心好痛。

这也引出一个问题，杀鸡焉用牛刀？

如果GPT-5.4 Pro是最智能、最接近AGI的模子……那么，你有什么AGI级别的问题要问它呢？

（何况还这样贵，TAT）

— 完 —

量子位 QbitAI · 头条号

关心咱们开云体育(中国)官方网站，第一时代获知前沿科技动态

体育游戏app平台以军正密切暖热伊朗所在发展-开云(中国)Kaiyun·官方网站登录入口

又名好意思军东谈主员在伊拉克实行涉伊朗任务时弃世好意思军中央司令部19日在应答媒体上说，又名好意思军东谈主员18日在伊拉克北部实行涉伊朗任务时弃世。声明说，其时好意思军正在对一架被击落的伊朗单向袭击无东谈主机所携弹药进行受控引爆，该东谈主员在职务中弃世，另有又名好意思军东谈主员受轻伤。此外，好意思军在约旦搜寻17日遭伊朗紧要后失散的又名好意思军东谈主员，现在已发现不解身份遗骸，坚决核实责任正在进行中。一些好意思媒征引匿名官员的话称，找到的遗骸属于这名失散的好意思军东谈主员。这是9月16

开yun体育网”中科闻歌CEO罗引在发布会上示意-开云(中国)Kaiyun·官方网站登录入口

本报讯（记者袁传玺）7月18日开yun体育网，2026天下东说念主工智能大会（WAIC2026）时候，北京中科闻歌科技股份有限公司（以下简称“中科闻歌”）发布业界首个“基、枢、核、脑、端”完好AI决策居品体系。该体系以DOMA架构为技艺底座，袒护数据惩处、业务建模、模子推理与智能体实施全链路，买通从企业出产筹商决策到科学发现的AI决策闭环。中科闻歌CEO罗引（企业供图） “AI的下一站，毫不仅仅生成谜底，而是深度参与决策。”中科闻歌CEO罗引在发布会上示意，“从智能到决策，这是一场组织技艺

开yun体育网完成电脑网页垄断成就后-开云(中国)Kaiyun·官方网站登录入口

AI时期，个东说念主成就者接入支付宝完了营业化更容易了。 5月13日，支付宝“AI收”发布新智商，荟萃AI成就平台扣子编程升级“支付宝支付集成Skill”，并全新上线“支付宝商家入驻Skill”。成就者AI编程时可通过当然讲话，一站式完成从「创建垄断」到「集成支付宝支付」再到「商家入驻上线」，完了“成就即上线”，并平直具备收款智商。图说：支付宝支付集成Skill、支付宝商家入驻Skill上线扣子编程此前，支付宝支付集成Skill已将基础支付智商封装为圭臬化组件，供成就者在Vibe Codi

体育游戏app平台日本还与菲律宾签署军事订单-开云(中国)Kaiyun·官方网站登录入口

7月12日，菲律宾纠集日本等14个国度，就所谓“南海仲裁案”十周年发表了衔尾声明试图炒作并否定中国在南海的主权权力主意，遭到了中方的严厉驳倒。在3天之后，也就是7月15日，俄罗斯社交部发言东说念主扎哈罗娃也作出恢复力挺中国。扎哈罗娃示意，大家皆知，中国未参与所谓“仲裁”，强项合计所谓“仲裁庭”穷乏统辖权。鉴于中方不答允通过所谓“裁决”惩办南海联系争议，因此俄方也不承认其要津的正当性。从表态来看，俄罗斯的恢复不错说利害常客不雅，因为扎哈罗娃自己就是站在法律要津的角度上说的，中国一运行就莫得

开云(中国)Kaiyun·官方网站 登录入口 > 资讯习作 >

资讯习作

栏目分类

热点资讯

开云(中国)Kaiyun·官方网站 登录入口

开云体育(中国)官方网站跟着GPT-5.4上线-开云(中国)Kaiyun·官方网站 登录入口

开云(中国)Kaiyun·官方网站登录入口 > 资讯习作 >

开云(中国)Kaiyun·官方网站登录入口

开云体育(中国)官方网站跟着GPT-5.4上线-开云(中国)Kaiyun·官方网站登录入口