OpenAI最强推理模型o3发布:AGI能力暴涨 接近人类水平
![](https://pic.iyingdi.com/yd_admin/default/default_avatar.png)
![](https://wspic.iyingdi.cn/user_item/border/ia_100000025.png)
- # 玩家杂谈
今日(12月21日),OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局,OpenAI推出重磅收官新品,其迄今最强前沿推理模型的升级版——o3。
OpenAI号称o3在一些条件下接近通用人工智能(AGI),共有o3和精简版o3-mini两个版本。
评估显示,o3在软件工程测试中准确率比o1高近47%,竞赛数学测评的准确率比o1高15%,人类博士专家级生化物测试中准确率比o1高近13%。
AGI相关测试中,o3最佳成绩87.5,超过人类水平门槛85,显示迈向类人智能取得突破。
对比之下,GPT-3的评测结果为0%,GPT-4o为5%,而o3一举将成绩提升到87.5%。
OpenAI计划明年初发布o3系列模型,CEO Altman暗示可能一段时间内都不会面向大众上线这类模型,称希望正式发布前,先有一个联邦政府的测试框架,指导监控并减少这类模型的风险。
从本周五开始,OpenAI允许安全研究人员可以注册访问o3和o3-mini的预览。
2024年12月22日 发布于北京
3 1
还没有评论