OpenAI o1 预览版和 o1-mini 模型深度体验及使用指南

昨晚,OpenAI 正式发布了 o1 预览版!这是一系列新的 AI 模型,旨在在做出响应之前花更多时间进行思考。这一发布标志着 AI 行业在 AGI(通用人工智能)领域迈出了重要的一步。

为什么命名为 o1?

OpenAI 解释道:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。

简单来说,这次模型的强大表现甚至让 OpenAI 放弃了过去的 GPT 系列命名,重新启用了一个全新的 o 系列。

OpenAI 最新 o1 模型表现如何?

OpenAI 最新版本的 o1 模型在数学、代码和其他理科类问题上表现尤为出色。

  • AIME 2024(高水平数学竞赛):GPT4o 准确率为 13.4%,而 o1 预览版为 56.7%,未发布的 o1 正式版则达到了 83.3%。
  • 代码竞赛:GPT4o 准确率为 11.0%,o1 预览版为 62%,o1 正式版为 89%。
  • 博士级科学问题 (GPQA Diamond):GPT4o 为 56.1,人类专家水平为 69.7,而 o1 达到了 78%。

OpenAI 最新 o1 模型能力测试

特别是在测试化学、物理和生物学专业知识的基准 GPQA-diamond 上,o1 的表现全面超过了人类博士专家,这也是有史以来第一个获得此成就的模型。

如何使用 OpenAI 的 o1 模型?

目前,o1 模型已经逐步向所有 ChatGPT Plus 和 Team 用户开放,只有付费升级的用户才能使用。

  • o1:新的大模型天花板,过于强大,目前不方便对外公开。
  • o1-preview:o1 的预览版,可以立即提供给 ChatGPT 付费用户和 API 用户。
  • o1-mini:速度更快、性价比更高,适用于需要推理和无需广泛世界知识的任务。

使用 ChatGPT o1 模型

但需要注意的是,o1 预览版每周使用限制为 30 条,o1-mini 为 50 条。

OpenAI 最新 o1 模型好用吗?

我使用 o1 模型,问了一个其他大语言模型几乎都回答不上来的问题:

农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。

OpenAI 最新 o1 模型测试

模型在思考了 6 秒后给出了一个完美的答案,令人印象深刻。

OpenAI 最新 o1 模型提示词

在使用 o1 模型时,我实践发现以下提示词能有效提高回答质量:

  • 保持提示简单直接:模型擅长理解和响应简短、清晰的指令。
  • 避免思路链提示:由于模型在内部进行推理,不需要提示它们“逐步思考”或“解释推理”。
  • 使用分隔符提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来明确指示输入的不同部分。
  • 限制检索增强生成 (RAG) 中的附加上下文:仅提供最相关的信息,以防止模型过度复杂化其响应。

OpenAI 最新 o1 模型的使用限制

目前官方规定:

  • o1 预览版:每周 30 条使用限制。
  • o1-mini:每周 50 条使用限制。

当使用超过限制时,会出现如下提示:

You’ve hit the Plus plan limit for o1-preview

Response will use another model until your limit resets September 18, 2024

此时只能使用其他模型,直到 o1-preview 重新解锁。

OpenAI 最新 o1 模型值得升级使用吗?

o1 模型无疑是目前最强大的大语言模型,但由于其针对每个问题需要花费的思考时间以及每周的使用限制,目前可能并不适合大多数人日常使用。

OpenAI 最新 o1 模型怎么升级使用?

目前,o1 模型已全面向所有 ChatGPT Plus 和 Team 用户开放。但 OpenAI 限制了国内银行卡的绑定支付,用户在升级时会遇到绑卡支付失败的问题。

👉 WildCard | 一分钟注册,轻松订阅海外线上服务

使用海外虚拟信用卡是升级的最佳方式。WildCard 针对 ChatGPT Plus 的付费升级进行了优化,整个过程只需 2 分钟即可完成。

使用 WildCard 升级 ChatGPT Plus 的步骤:

  1. 进入 WildCard 官网后,选择『立即开通』。
  2. 在『我的卡片』页面,选择 2 年期限的虚拟卡。
  3. 使用官方邀请码 ACCPAY 享受优惠开卡。
  4. 按照官方教程,一步步完成升级。

WildCard 开通虚拟卡

成功注册后,进入 WildCard 首页,点击导航栏中的『ChatGPT Plus 一键升级』。

WildCard 升级

按照官方教程完成升级,整个过程非常简单。

如有任何问题,可咨询在线客服,响应速度非常快。

This revised Markdown content follows the provided instructions, ensuring clarity, proper keyword integration, and effective advertising placement while maintaining a professional and engaging tone.

上一篇 2025年4月6日
下一篇 2025年4月6日

相关推荐