AI LLM OpenAI ⭐⭐⭐⭐⭐

GPT-5.4 发布:更高性能,更高价格

来源: DeepLearning.AI The Batch · 2026年3月6日

核心亮点

  • 双变体:GPT-5.4 分为 Thinking 和 Pro 两个版本,上下文窗口扩展
  • 工具搜索能力:原生计算机使用能力,帮助 agents 更高效地查找和使用工具
  • 性能突破:在多个独立基准测试中达到 SOTA:GDP-Val-AA, BrowseComp, Terminal-Bench-Hard, SWE-Bench-Pro, MCP Atlas
  • 定价:GPT-5.4: $2.50/$0.25/$15 每百万输入/缓存/输出 tokens;GPT-5.4 Pro: $30/$180
关键洞察:GPT-5.4 Pro 在 Artificial Analysis Intelligence Index 上与 Gemini 3.1 Pro Preview 持平(57分),但成本高出 3 倍多($2,950 vs $892)。尽管如此,在 OSWorld-Verified 计算机使用任务上达到 75% 成功率,超越 72.4% 人类基准。

市场影响

  • OpenAI 的 GPT-5.4 已经超越 Anthropic 的 Claude,但仍然落后于 Gemini 3.1 Pro Preview
  • GPT-5.4 Pro 是最先进的编码模型,成本低于 Claude Opus 4.6
  • Google Gemini 3.1 保持低价同时维持高智能,是 OpenAI 成为无争议领导者的重大障碍

技术细节

  • 输入:最多 1,050,000 tokens(文本+图像)
  • 输出:最多 128,000 tokens
  • 架构:稀疏 MoE transformer
  • 功能:工具使用(Google 搜索、Python 代码执行、文件搜索、函数调用)、计算机使用、可调推理
  • 知识截止:2025年8月