财联社12月12日讯(编辑 史正丞)被谷歌逼到拉响“红色警报”后,OpenAI周四终于端出了最新前沿模型GPT-5.2系列。
图为OpenAI官网截图
OpenAI介绍称,GPT‑5.2是迄今为止在“专业知识工作方面”表现最好的模型系列,在制作电子表格、制作演示文稿、图像感知、编写代码以及理解长上下文等方面都优于前代产品。
GPT‑5.2有三种不同的版本:Instant是针对常规查询(如互联网检索、翻译和写作)进行速度优化的模型;Thinking擅长编程、数学、长文档分析等复杂结构化工作;顶级型号Pro,旨在为棘手问题提供最大程度的准确性和可靠性。
OpenAI特别强调,GPT‑5.2 Thinking是迄今为止最适合现实世界专业用途的模型。在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士,这些任务包括制作销售演示文稿、会计电子表格、制造流程图或短视频等。
在评估涵盖44个职业的知识型工作任务的GDPval测试中,有70.9%的对比结果优于或持平于顶尖行业专业人士
另外在金融AI领域,GPT‑5.2Thinking的产出成果也明显好于GPT-5.1。
OpenAI给出的示例显示,GPT‑5.2 Thinking在制作人力资源规划模型、股权结构表和项目管理表格的任务中,产出成果较GPT‑5.1 Thinking有肉眼可见的进步。
OpenAI给出的示例
除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在编码、数学、科学、视觉、长文本推理以及工具使用等方面均刷新了基准成绩。公司称,这些能力的提升将有望带来“更可靠的代理式工作流程、可用于生产环境的代码,以及能够在大规模上下文和真实世界数据中运行的复杂系统”。
横向比较方面,GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5,涵盖现实世界的软件工程任务(SWE-Bench Pro)和博士级别的科学知识(GPQA Diamond),到抽象推理和模式发现(ARC-AGI套件)。
GPT-5.2 Thinking在几乎所有列出的推理测试中都略胜于Gemini 3和Anthropic的Claude Opus 4.5
OpenAI产品负责人Max Schwarzer也在周四通报称,GPT-5.2 Thinking的回复较前代减少了38%的错误,使该模型在日常决策、研究和写作中更为可靠。
从周四开始,GPT‑5.2将向所有ChatGPT付费用户和API用户推送。所以这个新模型到底有多么适合“打工”,很快就能见分晓。
作为OpenAI对谷歌的反击,GPT‑5.2仅仅是打出的“第一拳”。
公司CEO奥尔特曼在周四宣布,下周会给用户们带来一些“小小的圣诞礼物”。他也在周四表示,Gemini 3对公司各项指标的影响比原本担心得要小。他还说,预计OpenAI将在明年1月“以非常强劲的姿态”退出目前的红色警报状态。
图为奥尔特曼社媒发文截图
OpenAI首席产品官Fidji Simo也在周四透露,现在已经开始在部分地区推出年龄估算系统,此举旨在控制ChatGPT对18岁以下用户回复的内容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入这一功能。
略有遗憾的是,周四的新品发布似乎聚焦于新模型的推理能力,没有推出新的图像生成器。而今年以来,为数不多的几次现象级新品发布都与图像、视频生成产品有关。奥尔特曼的“红色警报”备忘录中,也提及要改善图像生成能力。
此前有报道称,OpenAI计划在明年1月再发布一款新模型,具有更好的图像能力和更完善的个性化特点,但公司周四未对这一传言予以确认。
《lol比赛外围》,《首次登录送91元红包》欧洲杯预选赛比分
“皇冠买球app下载”
小艾电竞
……
{!! riqi() !!}
“新永利赌博平台”{!! reci() !!}
↓↓↓
{!! riqi() !!},成都:非洲青年走进“印象中的中国” 亲身体验发展脉动,万博体max,真人国际馆,云顶快速登陆,泛亚电竞
{!! riqi() !!},好评中国丨中央经济工作会议首提“内外贸一体化”,广东如何接招,OB体育官网入口,世界杯足球网站宣传,途游炸金花,金沙登录网址是多少
{!! riqi() !!},5个小妙招 拯救“干眼打工人”,优信彩票注册平台,千亿手机官网首页下载,大富豪官网网站,亚星平台网址
{!! riqi() !!}|《黄道婆与海南棉纺织历史文化史》在三亚发布|澳门所有贵宾会登陆网址|金博宝188|世界杯足彩投注|线上皇冠手机版
{!! riqi() !!}|新疆兵团:打造沉浸式红色旅游“活课堂”|波音网投网址多少|下载注册送18元|小金体育在线官网|必威网页登录
{!! riqi() !!}|王毅:台湾地位已被“七重锁定”|ManBetx怎么开户|开元棋所有版本|爱游戏体育APP|斗牛棋牌官网……
{!! riqi() !!},安徽广德“三件套”出圈 江浙等地游客排队打卡,二八杠打牌,买球在哪个平台好,皇冠信用网手机版,88游戏
{!! riqi() !!},专家:低空经济高质量发展需破解三大关键问题,世界杯买球的官网,沙巴怎么注册,银河游戏平台,凤凰闲情A
{!! riqi() !!}|乌总统:乌美安全保障协议接近完成 签署取决于与特朗普会晤|足彩app哪个是正规的|新濠天地体育APP|365bet体育滚球官方|1bet77
{!! riqi() !!},中国队实现成都混团世界杯三连冠,雷速体育不推送信息,狗万滚球app,线上快三网站,沙巴体育可靠吗
{!! riqi() !!},国家发改委主任发文,在这方面中国远超日本丨园来如此,世界杯竞猜在哪里购买,hga030皇冠手机版,英皇国际升级版本,二八杠在线
{!! riqi() !!},“宅兹中国”的文明意涵,世界杯买球怎么代理,线上真金赌博,下载开元app,威尼斯人官方官网
{!! riqi() !!}|西藏甘丹寺迎来传统“燃灯日”|和记平台|胜负彩最新推荐|龙8国际足球|球探体育滚球
{!! riqi() !!}|长江经济带城市协同发展能力指数(2025)发布 上海连续11年居榜首|皇冠直营现金网官方网|可以微信充值的捕鱼游戏|买彩票官网|火狐体育官方网站首页
{!! riqi() !!}|2025长春国际医药健康产业博览会:人参展区引民众参观|hth华体会可靠吗|伟德国际网页登录|大奖娱乐官网|开云app官方
{!! reci() !!},{!! reci() !!}|整治网络乱象 应急管理部发布涉灾谣言陷阱识别方法|买球app|ag足球|新濠天地官方网站下载|彩客网触屏版电脑版风O5757cc
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺