← 返回工具列表

OpenAI o3/o4-mini OpenAI 图像思维链 2025.4

首个具备图像思维链推理能力的模型,视觉与编程的革命性突破

图像思维链 首创能力
o3 最强推理
o4-mini 高效推理
Codex CLI 终端工具

🧠 什么是 o3 和 o4-mini?

o3o4-mini 是 OpenAI 在 2025 年 4 月 17 日发布的最新推理模型。这是 o 系列中首个具备图像思维链推理能力的产品,标志着 AI 在视觉理解领域取得突破性进展。

🎯 核心突破:o3/o4-mini 首次实现了图像思维链推理——AI 不仅能"看"图像,还能"思考"图像内容。这使得它们在处理复杂视觉任务(如数学图表分析、代码截图理解、文档解析)时表现出色。

👁️ 图像思维链

看图像并进行深度推理,首次实现视觉思维链

💻 代码能力

数学、编程、科学探索全面超越 o1 前代

🔧 工具使用

原生支持工具调用,构建复杂 Agent 应用

⚡ Codex CLI

官方终端工具,发布不到 7 小时 Star 超 5500

📊 模型系列对比

o3 旗舰推理

最强大的推理模型,在数学、编程、科学探索以及视觉识别等多个领域大幅超越前代 o1。支持完整的图像思维链推理。

最强
推理能力
图像思维链
视觉推理
工具调用
Agent 能力
Pro 用户
访问权限

o4-mini 高效推理

为快速高效推理优化的版本,保持强大能力的同时大幅降低延迟和成本。免费用户可提交查询尝试。

快速
响应速度
图像思维链
视觉推理
低成本
API 价格
免费体验
访问权限

o3-pro 即将推出

计划在未来几周内推出的增强版本,支持完整工具功能,为 Pro 用户提供更强大的能力。

完整工具
功能支持
增强推理
能力升级
Pro 专属
访问权限

👁️ 图像思维链推理

图像思维链是 o3/o4-mini 最重要的创新。传统视觉模型只能描述看到的内容,而图像思维链能够:

📐 数学图表

分析几何图形、函数图像,进行数学推理

📝 手写识别

快速识别手写文本,自动调整图片获取信息

💻 代码截图

理解代码截图,分析 bug、提供修复建议

📄 文档解析

解析复杂文档、表格、流程图等

💡 示例:上传一张包含复杂数学公式的手写笔记图片,o3 不仅能识别公式,还能理解其含义、检查错误、并给出正确的推导过程。

💻 Codex CLI - 终端编程助手

与 o3/o4-mini 同步发布的 Codex CLI 是 OpenAI 官方终端编程工具,发布不到 7 小时 GitHub Star 数已超过 5500。

# 安装 Codex CLI
npm install -g @openai/codex-cli

# 使用 o3 模型进行代码生成
codex "用 Python 实现一个支持并发的网络爬虫"

# 分析代码截图
codex --image ./screenshot.png "解释这段代码的问题"

# 交互式会话
codex chat --model o3

🖥️ 终端原生

直接在终端中与 o3/o4-mini 交互

🖼️ 图像支持

支持上传代码截图进行分析

📁 文件操作

直接读写文件、执行命令

🎯 典型应用场景

📊 数据可视化分析

上传图表截图,AI 自动分析数据趋势和洞察

🐛 Debug 助手

上传错误截图,快速定位问题并给出修复方案

📱 UI/UX 分析

分析界面截图,提供设计改进建议

🔬 科学研究

分析实验图表、论文图像,辅助研究工作

🔗 如何访问

用户类型 o3 o4-mini o3-pro
免费用户 ✅ 限量
Plus 用户
Pro 用户 ✅ 即将
API 开发者 即将