
今天这期视频,我用开发者视角,带你完整体验 Anthropic 最新的 Opus 4.5: 从官方基准、价格调整,到 Claude Code、工具搜索、编程式工具调用,再到一堆真实任务——写前端、做 2D / 3D 动画、设计网页和交互,我都实际跑了一遍。 视频里你会看到: - Opus 4.5 和 Sonnet 4.5、Gemini 3 Pro、GPT‑5.1 在编码和终端任务上的差异 - ARC-AGI 2、SWE Bench 等基准下,谁目前跑在前面 - Opus 4.5 降价后,实际调用成本和 Token 消耗有多大变化 - Claude Code、工具搜索、编程式工具调用,怎么帮助模型更高效地用 MCP 工具 - 一系列实际项目 Demo:地铁悟空动画、催眠循环动画、绵羊理发店、元素周期表网页、记忆书房、模拟书法等 - 在登月舱剖面图、劳力士表盘、名片生成器等任务里,Opus 4.5 暴露出的细节问题 - 什么时候适合用 Opus 4.5,什么时候用 Gemini 3 Pro 或 GPT‑5.1 会更合适 如果你正在用 Cursor、Windsurf、Claude 桌面应用,或者在搭自己的 AI Agent,这期视频会帮你更快判断: Opus 4.5 值不值得成为你的「主力模型」。 时间戳 00:00 基准对比 04:22 Claude 开发者平台升级 06:05 实测 12:52 总结 #claude #anthropic #claudeopus