搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

GPT-5.2发布 OpenAI称其为"最强专业知识工作大模型"

2025-12-23 03:39:25
来源:

猫眼电影

作者:

弗拉基米尔·普京

手机查看

  猫眼电影记者 张轶骁 报道首次登录送91元红包

财联社12月12日讯(编辑 史正丞)被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。

图为OpenAI官网截图

OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。

GPT‑5.2有三种不同的版本:Instant是针对常规查询(如互联网检索、翻译和写作)进行速度优化的模型;Thinking擅长编程、数学、长文档分析等复杂结构化工作;顶级型号Pro,旨在为棘手问题提供最大程度的准确性和可靠性。

OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合现实世界专业用途的模型。在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士,这些任务包括制作销售演示文稿、会计电子表格、制造流程图或短视频等。

在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士

另外在金融AI领域,GPT‑5.2Thinking的产出成果也明显好于GPT-5.1。

OpenAI给出的示例显示,GPT‑5.2 Thinking在制作人力资源规划模型、股权结构表和项目管理表格的任务中,产出成果较GPT‑5.1 Thinking有肉眼可见的进步。

OpenAI给出的示例

除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在编码、数学、科学、视觉、长文本推理以及工具使用等方面均刷新了基准成绩。公司称,这些能力的提升将有望带来“更可靠的代理式工作流程、可用于生产环境的代码,以及能够在大规模上下文和真实世界数据中运行的复杂系统”。

横向比较方面,GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5,涵盖现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA Diamond),到抽象推理和模式发现(ARC-AGI套件)。

GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5

OpenAI产品负责人Max Schwarzer也在周四通报称,GPT-5.2 Thinking的回复较前代减少了38%的错误,使该模型在日常决策、研究和写作中更为可靠。

从周四开始,GPT‑5.2将向所有ChatGPT付费用户和API用户推送。所以这个新模型到底有多么适合“打工”,很快就能见分晓。

作为OpenAI对谷歌的反击,GPT‑5.2仅仅是打出的“第一拳”。

公司CEO奥尔特曼在周四宣布,下周会给用户们带来一些“小小的圣诞礼物”。他也在周四表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在明年1月“以非常强劲的姿态”退出目前的红色警报状态。

图为奥尔特曼社媒发文截图

OpenAI首席产品官Fidji Simo也在周四透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。

略有遗憾的是,周四的新品发布似乎聚焦于新模型的推理能力,没有推出新的图像生成器。而今年以来,为数不多的几次现象级新品发布都与图像、视频生成产品有关。奥尔特曼的“红色警报”备忘录中,也提及要改善图像生成能力。

此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。

 时事1:bob登陆平台

  12月23日,南亚东南亚知识产权保护协作联合体在云南腾冲成立,20日,外交部发言人汪文斌主持例行记者会。有记者提问称,华盛顿智库战略与国际问题研究中心发布的一份报告显示,中国重新使用一个自2018年以来停用的科研站,此举引起澳大利亚和其他西方国家对中国可能用于监视的担忧。中方对此有何回应?,抢庄牛牛手游app。

  12月23日,因“健康原因” 尼日利亚国防部长辞职,一级市场,本周存单净融资规模为-3,219.10亿元,发行进度(月初至今发行量 / 月度到期量)为80.7%,未来一周有2,949.40亿元的同业存单到期,其中未来一周主要到期期限集中在12个月期(1527.8亿元) >6个月期(465亿元)>3个月期(303.5亿元)。,完美体育365注册,贝博2022世界杯,12BET注册。

 时事2:AG真人游戏平台

  12月23日,江苏南京:“铭记历史 珍爱和平”主题海报展揭幕,此后,靳东多次利用职务便利,在项目承揽、项目实施、国有资源经营权承包等事项中为商人老板谋取利益并收受好处。2012年下半年,时任若尔盖县委副书记、县政府县长的靳东收下了项目承建商李某某用黑色旅行包送上的“水果”——100万元现金,这是他单笔受贿金额最大的一次。他把这个旅行包放在卧室的床下,陆续用于炒股、购车和个人日常开支。,世界杯直播平台,宝博游戏官网网址,可以赢钱的二八杠游戏。

  12月23日,第七届浙江国际智慧交通产业博览会开幕 展示695项三“新”展品,据港媒此前报道,世界冰球锦标赛第三级别比赛2月28日在波黑举行,香港男子队分组赛出战伊朗队,并最终以11比1胜出。不过赛后播放国歌时,大会错播“修例风波”时的“黑暴”歌曲,时间约10秒。球赛视频显示,香港运动员按照中国香港体育协会暨奥林匹克委员会颁发的指引,做出“T”字手势叫停,有队员上前向赛会反映,大会随后道歉,并播出正确的中国国歌。,大发在线注册,世界杯买球宇c77典tv,亚星注册送18。

 时事3:365体育的网址多少

  12月23日,江西赣州:骑行莫分心!女子骑车看手机被撞伤,金库中存储的黄金均不属于纽约联储或联邦储备系统。纽约联储代表账户持有人(包括美国政府、外国政府、其他中央银行和官方国际组织)充当黄金的监护人和托管人。任何个人或私营部门实体都不得在金库中储存黄金。,2026世界杯在哪买球,必赢注册彩金,捕鱼达人网络版。

  12月23日,习言道|中央企业要为中国式现代化建设贡献更大力量,在这一轮扩张中,甲骨文表现得尤为激进。根据最近的公开文件,该公司资产负债表外背负着2480亿美元的未来租赁承诺。这一庞大的资本支出计划也曾在本月早些时候引发市场震荡,导致甲骨文股价在宣布增加AI基础设施支出后大幅下跌。,贝博体育官方平台官网首页,ag手游平台,视讯真人游戏登陆。

 时事4:310足彩预测

  12月23日,海南产经新观察:再揽百万英才,靠什么?,“佛山大学”的诞生,意味着继广州、汕头、深圳之后,佛山也终于如愿拥有了以城市命名的大学。同时“升本更名”成功的肇庆医专,则成为广东目前唯一一所以“医学院”命名的高校,也是继湛江的广东医科大学之后,非广州地区又一所医学本科高校。,百老汇自助游攻略,365 bet 地址,888大发手机版下载。

  12月23日,中国体育部门与国际奥委会开展运动与健康合作,在外界看来,郑州在文旅界的表现似乎有点不温不火,并没有涌现出如洛阳汉服、开封王婆等现象级IP。但在河南多个城市文旅出圈的背景下,郑州交通枢纽的角色也逐渐被放大,成为旅游重要的“旅游枢纽”。,365bet体育app,mg平台电子游戏试玩,大发体育网投平台。

责编:梁亮胜

审核:陆姝

责编:姜齐宏

相关推荐 换一换