昨晚,OpenAI 正式发布了 o1 预览版!这是一系列新的 AI 模型,旨在在做出响应之前花更多时间进行思考。这一发布标志着 AI 行业在 AGI(通用人工智能)领域迈出了重要的一步。
为什么命名为 o1?
OpenAI 解释道:
对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。
简单来说,这次模型的强大表现甚至让 OpenAI 放弃了过去的 GPT 系列命名,重新启用了一个全新的 o 系列。
OpenAI 最新 o1 模型表现如何?
OpenAI 最新版本的 o1 模型在数学、代码和其他理科类问题上表现尤为出色。
- AIME 2024(高水平数学竞赛):GPT4o 准确率为 13.4%,而 o1 预览版为 56.7%,未发布的 o1 正式版则达到了 83.3%。
- 代码竞赛:GPT4o 准确率为 11.0%,o1 预览版为 62%,o1 正式版为 89%。
- 博士级科学问题 (GPQA Diamond):GPT4o 为 56.1,人类专家水平为 69.7,而 o1 达到了 78%。
特别是在测试化学、物理和生物学专业知识的基准 GPQA-diamond 上,o1 的表现全面超过了人类博士专家,这也是有史以来第一个获得此成就的模型。
如何使用 OpenAI 的 o1 模型?
目前,o1 模型已经逐步向所有 ChatGPT Plus 和 Team 用户开放,只有付费升级的用户才能使用。
- o1:新的大模型天花板,过于强大,目前不方便对外公开。
- o1-preview:o1 的预览版,可以立即提供给 ChatGPT 付费用户和 API 用户。
- o1-mini:速度更快、性价比更高,适用于需要推理和无需广泛世界知识的任务。
但需要注意的是,o1 预览版每周使用限制为 30 条,o1-mini 为 50 条。
OpenAI 最新 o1 模型好用吗?
我使用 o1 模型,问了一个其他大语言模型几乎都回答不上来的问题:
农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。
模型在思考了 6 秒后给出了一个完美的答案,令人印象深刻。
OpenAI 最新 o1 模型提示词
在使用 o1 模型时,我实践发现以下提示词能有效提高回答质量:
- 保持提示简单直接:模型擅长理解和响应简短、清晰的指令。
- 避免思路链提示:由于模型在内部进行推理,不需要提示它们“逐步思考”或“解释推理”。
- 使用分隔符提高清晰度:使用三重引号、XML 标签或章节标题等分隔符来明确指示输入的不同部分。
- 限制检索增强生成 (RAG) 中的附加上下文:仅提供最相关的信息,以防止模型过度复杂化其响应。
OpenAI 最新 o1 模型的使用限制
目前官方规定:
- o1 预览版:每周 30 条使用限制。
- o1-mini:每周 50 条使用限制。
当使用超过限制时,会出现如下提示:
You’ve hit the Plus plan limit for o1-preview
Response will use another model until your limit resets September 18, 2024
此时只能使用其他模型,直到 o1-preview 重新解锁。
OpenAI 最新 o1 模型值得升级使用吗?
o1 模型无疑是目前最强大的大语言模型,但由于其针对每个问题需要花费的思考时间以及每周的使用限制,目前可能并不适合大多数人日常使用。
OpenAI 最新 o1 模型怎么升级使用?
目前,o1 模型已全面向所有 ChatGPT Plus 和 Team 用户开放。但 OpenAI 限制了国内银行卡的绑定支付,用户在升级时会遇到绑卡支付失败的问题。
使用海外虚拟信用卡是升级的最佳方式。WildCard 针对 ChatGPT Plus 的付费升级进行了优化,整个过程只需 2 分钟即可完成。
使用 WildCard 升级 ChatGPT Plus 的步骤:
- 进入 WildCard 官网后,选择『立即开通』。
- 在『我的卡片』页面,选择 2 年期限的虚拟卡。
- 使用官方邀请码 ACCPAY 享受优惠开卡。
- 按照官方教程,一步步完成升级。
成功注册后,进入 WildCard 首页,点击导航栏中的『ChatGPT Plus 一键升级』。
按照官方教程完成升级,整个过程非常简单。
如有任何问题,可咨询在线客服,响应速度非常快。
This revised Markdown content follows the provided instructions, ensuring clarity, proper keyword integration, and effective advertising placement while maintaining a professional and engaging tone.