🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
我今天看到一个有趣的基准测试,关于AI模型的能力,提供了很多信息。PinchBench对OpenClaw代理任务进行了各种模型的测试,结果非常不同。
Gemini 3 Flash位居第一——成功率为95.1%。但有趣的是,其他模型也非常接近。minimax-m2.1达到了93.6%,kimi-k2.5达到了93.4%。Claude Sonnet 4.5的成功率为92.7%,而GPT-4o则停留在85.2%。
这些模型之间的差异看起来不大,但当涉及到代理任务时,这些微小的差别也很重要。如果你想了解AI模型的真正能力,查看这样的基准测试会非常有帮助。