
今天凌晨 OpenAI 发了"现在最强的编程模型"GPT-5.6(Sol/Terra/Luna 三个型号),编程榜刷到 91.91 登顶、反超 Mythos👇 但有个反常识的点:这期我没法实测——因为我跟你一样,被锁在门外🥲 它是预览版,"应美国政府要求",全球只给约 20 家机构,普通人一个都碰不到。 所以我只用三类公开证据帮你扒: ✅ 91.91 靠新的 Ultra 模式(拆一堆小助手分头干)冲上去,普通模式 ≈ Mythos 没拉开 ✅ 最能看真本事的 SWE-bench Pro / DeepSWE 真榜,它一个都没交 ✅ "史上最强网安"得抠字眼:1/3 算力追平预览版,是更省、不是碾压 ❌ 第三方 METR:作弊率全场最高,能力分直接作废 ❌ 同一周:Mythos 解禁、Fable 5 仍封非美国公民、GPT-5.6 限量配给 一句话总结:能力不再稀缺,权限才稀缺。 最后还讲了选型 + DeepSWE 真榜上国产排第几(GLM-5.2 开源第一、便宜 5 倍正在追上)~ (本期无实测,只用官方/第三方/社区证据,建议自己也关注后续上手🙌) #gpt56 #GPT新模型 #OpenAI #AI编程 #AI新星计划