OLMo：完全开源的下一代大语言模型

2025年3月9日下午2:19 • 博客文章

OLMo（Open Language Model）是AI2（一个真正的非营利性组织）推出的完全开源大语言模型项目。它不仅在模型权重、训练代码和推理代码上实现了100%开源，还公开了完整的预训练数据——3万亿token的Dolma数据集，以及训练指标和完整日志等原始数据。这种高度的开放性为研究人员提供了前所未有的透明度，使他们能够完全复现模型训练过程，深入理解模型性能，并根据需要进行微调。

OLMo与其他开源语言模型的区别在于其“完全开放的框架”。

OLMo的核心特点

1. 完整的预训练数据

OLMo项目提供了完整的预训练数据——AI2的Dolma数据集。这个包含三万亿token的开放语料库涵盖了多种领域数据，如网络页面、代码、社交媒体、STEM论文、书籍和百科资料等。研究人员不仅可以访问模型本身，还能直接使用这些原始数据进行重新训练或调整，以适应特定的研究需求。

2. 训练代码与模型权重

OLMo框架提供了四种不同变体模型的完整模型权重，每种模型均训练了至少2万亿令牌。此外，项目还公开了训练代码、推理代码、训练指标和日志，使研究人员能够完全复现模型训练过程，并深入分析模型的性能表现。

3. 评估工具

OLMo项目包含了一套全面的评估工具，以及500多个模型的检查点（每1000步训练过程中的一个检查点），这些均属于Catwalk项目的一部分。研究人员可以使用相同的工具来评估自己的模型，或对OLMo模型进行进一步的分析。

模型参数与架构

OLMo提供了不同规模的模型变体，包括：

1B模型：10亿参数，16层，每层2048个隐藏单元，16个注意力头，训练了至少2万亿个令牌。
7B模型：70亿参数，32层，每层4086个隐藏单元，32个注意力头，训练了约2.46万亿个令牌。
65B模型：650亿参数，80层，每层8192个隐藏单元，64个注意力头（文章撰写时仍在训练中）。

这些模型基于Vaswani等（2017年）的解码器仅Transformer架构，并进行了多项改进，如：
– 移除偏置项以提高训练稳定性；
– 采用非参数层归一化；
– 使用SwiGLU激活函数代替ReLU；
– 引入旋转位置嵌入（RoPE）；
– 使用改进版的BPE-based标记器，以减少个人可识别信息（PII）。

性能表现

OLMo 7B在生成和阅读理解任务（如truthfulQA）上与Llama 2表现相当，但在某些问答任务（如MMLU或Big-bench Hard）上略微落后。通过AI2的Paloma评估工具，研究人员可以分析模型预测语言的能力与模型规模因素（如训练令牌数）之间的关系。

👉 WildCard | 一分钟注册，轻松订阅海外线上服务

结语

OLMo的完全开源框架为语言模型的研究和开发树立了新标杆。通过提供完整的预训练数据、训练代码、模型权重和评估工具，OLMo不仅推动了透明度和可复现性，还为研究人员提供了丰富的资源，助力他们在语言模型领域取得更多突破。

项目地址：https://allenai.org/olmo

WildCard 订阅 ChatGPT 4.0，支付宝充值，快速便捷

上一篇 2025年3月9日

OpenAI API 绑卡及 Key 申请完整指南

下一篇 2025年3月9日

博客文章

Windows 版 ChatGPT 正式发布！如何在 Windows 上使用 ChatGPT？

Windows 版 ChatGPT 简介近日，OpenAI 宣布推出 Windows 桌面应用，并已向 ChatGPT Plus、Enterprise、Team 和 Edu 用户…

2025年4月25日
如何利用 AI 技术提升客户体验？营销中的革新与应用

在数字化时代，人工智能（AI）正在彻底改变企业与客户的互动方式。借助先进的算法、机器学习和数据分析，AI 正在帮助营销人员提供更个性化、更相关且更具吸引力的客户体验。本文探讨了 A…

博客文章 2025年4月19日
什么是信用卡虚拟卡？虚拟卡和信用卡有何区别？

什么是信用卡虚拟卡？虚拟信用卡是一种没有实体卡片的信用卡，它通过银行卡上的BIN码衍生出来的虚拟账户进行支付结算。与实体卡不同，虚拟卡虽然没有实体，但持卡人仍然可以使用它来参与各…

博客文章 2025年4月2日
博客文章

Midjourney订阅全攻略：从注册到使用的完整指南

Midjourney 作为一款热门的AI绘图工具，凭借其强大的图像生成功能和多样的艺术风格选择，吸引了大量用户。然而，许多新手在订阅和使用过程中常常遇到网络环境异常、支付方式受限等…

2025年3月16日
博客文章

海外域名购买全攻略：使用虚拟卡在 Namecheap 上的操作指南

为什么要购买域名？购买域名是搭建个人网站的关键步骤，具有以下重要意义：提升专业形象：个性化域名能让您的网站更显专业，增强用户信任度。提高识别度：简洁易记的域名有助于用户快速记…

2025年3月22日
如何使用虚拟信用卡订阅ChatGPT Plus、Mid journey等海外服务

为什么需要虚拟信用卡？在订阅ChatGPT Plus、Mid journey、OnlyFans等海外线上服务时，许多用户面临支付难题。这些平台通常要求使用海外信用卡，而国内用户往…

博客文章 2025年4月21日
国外虚拟信用卡的申请、充值与消费全指南

国外的一些服务（如 DeepL、ChatGPT、Gemini）通常需要使用国外信用卡进行消费，而国外实体信用卡的申请往往需要当地居民身份。然而，国外虚拟信用卡则没有地域限制，只需线…

博客文章 2025年3月14日
博客文章

OnlyFans 国内访问解封：原因与订阅指南

引言 OnlyFans 国内访问解封的消息近日在网络上广泛传播。这个全球知名的成人平台，以往需借助 VPN 等工具才能访问，如今却可以直接浏览。这一变化引发了广泛关注。但解封背后…

2025年4月26日
博客文章

WildCard 美国万事达虚拟卡：轻松订阅海外服务的最佳选择

对于没有美国银行卡的用户来说，订阅海外服务往往是一个棘手的问题。WildCard 美国万事达虚拟卡应运而生，专为这些用户量身打造，助你轻松订阅 Apple Store、YouTub…

2025年2月26日
WildCard虚拟信用卡全面解析：功能、使用指南与费用说明

虚拟信用卡是一种与实体卡功能相同的数字化支付工具，广泛应用于在线支付、账户激活等场景。它不仅拥有与实体信用卡相同的卡号、安全码（CVV）和有效期，还无需实体卡片支持，极大地方便了网…

博客文章 2025年2月10日
博客文章

Wildcard 虚拟卡注册与使用全攻略：支持 ChatGPT 等平台的一站式支付解决方案

Wildcard 虚拟卡是一种便捷的支付工具，尤其适用于需要订阅国际服务（如 ChatGPT）或注重隐私保护的用户。以下是详细的注册与使用指南，助您快速上手。使用 Wildca…

2025年2月11日
博客文章

详细图文教程：如何升级 ChatGPT 到 GPT-4 或 GPT-5

在这篇文章中，我们将详细介绍两种实用的方法，帮助你轻松升级 ChatGPT 到 GPT-4 或 GPT-5。无论是 GPT-5、GPT-4、Claude 3 还是 OnlyFans…

2025年2月11日
博客文章

如何在FanBOX上赞助喜欢的创作者？无信用卡也能轻松赞助！

有好多喜欢的画师和虚拟主播开通了FanBOX的赞助渠道，之前一直想赞助但苦于没有信用卡，无法绑定PayPal。最近我发现了一个好用的虚拟卡平台，成功绑定后就可以美美赞助了！所以写了…

2025年3月2日
如何订阅Midjourney？Midjourney购买教程

1. Midjourney是什么 Midjourney 是一款新兴的 AI 绘画工具，通过人工智能技术将文本描述转化为精美图片。与其他文生图工具不同，Midjourney 的图像生…

博客文章 2025年3月20日
博客文章

五分钟快速开通 ChatGPT Team 指南

前言 ChatGPT Team 是 OpenAI 于 2023 年下半年推出的企业会员计划，专为团队和企业用户设计，提供更加专业和高级的服务。相较于 ChatGPT Plus，T…

2025年3月28日
ChatGPT4 充值渠道 FOMEPay 疑似跑路？替代方案推荐：WildCard！

最近，不少用户反馈称长期使用的 ChatGPT 充值渠道 FOMEPay 疑似跑路。经过多次尝试和观察，FOMEPay 客服确实失联，用户资金安全无法保障。这让我不得不寻找一个更可…

博客文章 2025年3月11日
Patreon 国内支付全攻略：如何订阅 & PayPal 支付失败解决方案

Patreon 作为全球知名的创作者支持平台，吸引了无数用户订阅。对于国内用户来说，支付方式成为一个难题。本文将详细介绍 Patreon 国内支付方案，并针对 PayPal 支付失…

博客文章 2025年2月24日
什么是 VCC 虚拟信用卡？与实体信用卡有何区别？

一、什么是 VCC 虚拟信用卡？ VCC 虚拟信用卡（Virtual Credit Card），又称虚拟 Visa Mastercard 信用卡，是一种基于互联网的支付方式，没有实…

博客文章 2025年3月2日
轻松解决海外支付难题：国内手机号即可申请海外MasterCard，免费获赠电话卡和邮箱服务

在全球化的今天，越来越多的人需要处理海外支付问题。然而，许多传统支付方式存在网络限制或门槛较高的问题。本文将介绍一款便捷的虚拟海外MasterCard——WildCard，它不仅支…

博客文章 2025年2月16日
博客文章

如何为国际虚拟信用卡WildCard充值

WildCard是一款功能强大的虚拟国际信用卡，广泛应用于多种海外服务场景。它具有以下三大优势：用途广泛：支持ChatGPT、跨境电商等绝大多数海外服务。资费简单透明，余额可退…

2025年2月28日