我注意到一个有趣的趋势——Meta 发布了一款新的多模态模型,它几乎把所有 AI 排名都彻底打乱了。就像加密货币的排行榜一样——当一个新资产意外地一下子冲上所有领先位置。



该模型展示出了令人信服的成绩:在 GPQA Diamond 上达到 89,5%,在 MMMU-Pro 上为 80,4%,在 SWE-Bench Verified 上为 77,4%。此外还有一整套其他测试——Artificial Analysis (52%),HLE (42,8%),ARC-AGI-2 (42,5%),SWE-Bench Pro (52,4%)。可以说是到处都在榜首。

这显然释放出一个信号:Meta 已经认真回到了 AI 技术领域的竞争中。长时间以来,人们似乎觉得这家公司在落后,但这些结果已经说明了一切。当你在所有战线都立刻看到这样水平的表现——这绝不是偶然,而是扎实工作的结果。

很有意思的是,就像加密货币的排行榜不断更新一样,AI 模型的世界里也在进行着自己的竞赛。看起来,这个领域的竞争只会继续加剧,每个玩家都在努力寻找自己的定位。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论