首个具备图像思维链推理能力的模型,视觉与编程的革命性突破
o3 和 o4-mini 是 OpenAI 在 2025 年 4 月 17 日发布的最新推理模型。这是 o 系列中首个具备图像思维链推理能力的产品,标志着 AI 在视觉理解领域取得突破性进展。
看图像并进行深度推理,首次实现视觉思维链
数学、编程、科学探索全面超越 o1 前代
原生支持工具调用,构建复杂 Agent 应用
官方终端工具,发布不到 7 小时 Star 超 5500
最强大的推理模型,在数学、编程、科学探索以及视觉识别等多个领域大幅超越前代 o1。支持完整的图像思维链推理。
为快速高效推理优化的版本,保持强大能力的同时大幅降低延迟和成本。免费用户可提交查询尝试。
计划在未来几周内推出的增强版本,支持完整工具功能,为 Pro 用户提供更强大的能力。
图像思维链是 o3/o4-mini 最重要的创新。传统视觉模型只能描述看到的内容,而图像思维链能够:
分析几何图形、函数图像,进行数学推理
快速识别手写文本,自动调整图片获取信息
理解代码截图,分析 bug、提供修复建议
解析复杂文档、表格、流程图等
与 o3/o4-mini 同步发布的 Codex CLI 是 OpenAI 官方终端编程工具,发布不到 7 小时 GitHub Star 数已超过 5500。
# 安装 Codex CLI npm install -g @openai/codex-cli # 使用 o3 模型进行代码生成 codex "用 Python 实现一个支持并发的网络爬虫" # 分析代码截图 codex --image ./screenshot.png "解释这段代码的问题" # 交互式会话 codex chat --model o3
直接在终端中与 o3/o4-mini 交互
支持上传代码截图进行分析
直接读写文件、执行命令
上传图表截图,AI 自动分析数据趋势和洞察
上传错误截图,快速定位问题并给出修复方案
分析界面截图,提供设计改进建议
分析实验图表、论文图像,辅助研究工作
| 用户类型 | o3 | o4-mini | o3-pro |
|---|---|---|---|
| 免费用户 | ❌ | ✅ 限量 | ❌ |
| Plus 用户 | ✅ | ✅ | ❌ |
| Pro 用户 | ✅ | ✅ | ✅ 即将 |
| API 开发者 | ✅ | ✅ | 即将 |