TOGETHER 宣布其70 亿参数大语言模型 RedPajama 7B 已完成所有训练，并在 Apache 2.0 许可下全部开源。

TOGETHER 宣布其 RedPajama 7B 已完成所有训练，并在 Apache 2.0 许可下全部开源。70 亿参数大语言模型 RedPajama 7B 完整版发布，开源可商用

RedPajama 7B是一个开源可商用的大型语言模型项目，由TOGETHER联合蒙特利尔大学的AAI CERC实验室、EleutherAI和LAION共同发起。该项目的目标是为研究人员、工程师和开发人员提供一个高质量的、可扩展的、可定制的语言模型，以推动自然语言处理技术的发展。1 3

RedPajama 7B是一个70亿参数的语言模型，使用了Apache 2.0许可证进行开源。该模型是在RedPajama基础数据集上训练的，旨在尽可能接近地复制LLaMA配方。此外，该项目还发布了完全开源的指令调整和聊天模型。2

RedPajama 7B的发布是自然语言处理领域的一项重大进展，因为它为研究人员和工程师提供了一个高质量、可扩展、可定制的语言模型，以推动自然语言处理技术的发展。1 3

总之，RedPajama 7B是一个非常有前途的开源大型语言模型项目，可以为研究人员、工程师和开发人员提供高质量、可扩展、可定制的语言模型，以推动自然语言处理技术的发展。1 2 3

RedPajama 是一个开源可商用大模型项目，由 TOGETHER 联合蒙特利尔大学的 AAI CERC 实验室、EleutherAI 和 LAION 共同发起。目前包括一个基于 LLaMA 论文的 RedPajama 基础数据集（5 TB 大小），自 4 月份发布至今已被下载数千次，并被用来训练了 100 多个模型；以及一个在 5 月份就宣布训练完成的 RedPajama 3B，和刚宣布训练完成的 RedPajama 7B 大模型。

RedPajama-INCITE-7B-Base 在 RedPajama-1T 数据集的 1T tokens 上进行训练，并发布了训练和开放数据生成脚本的 10 个 checkpoints，允许模型的完全可重复性。该型号在 HELM 上落后 LLaMA-7B4 分，落后 Falcon-7B/MPT-7B 1.3 分。
RedPajama-INCITE-7B-Instruct 是 HELM 基准测试中得分最高的开放模型，使其成为各种任务的理想选择。它在 HELM 上的性能表现相较 LLaMA-7B 和目前最先进的开放模型如 Falcon-7B (Base and Instruct) 和 MPT-7B (Base and Instruct) 均高出 2-9 分。
RedPajama-INCITE-7B-Chat 在 OpenChatKit 中可用，包括一个用于轻松微调模型的训练脚本，现在可以试用。聊天模型建立在完全开源的数据之上，不使用来自 OpenAI 等封闭模型的提炼数据 - 确保在开放或商业应用程序中的使用。

其中，Base 模型是基础大语言模型，在 RedPajama 数据集上进行了训练，采用和 Pythia 模型一样的架构。LM Harness 结果：

Instruct 则是基于 Base 模型针对 few-shot prompts 微调的结果，通过对 P3 (BigScience) 和 Natural Instruction (AI2) 的各种 NLP 任务进行训练，针对少样本性能进行了优化。Instruct 版本在少数几个任务上表现出优异的性能，超过了类似规模的领先开放模型；RedPajama-INCITE-7B-Instruct 似乎是此类规模下最好的开放式指令模型。HELM 基准测试结果：

此外，官方还宣布正在开发新版本的 RedPajama，即 RedPajama2，目标是在 2-3T tokens 数据集上进行训练。主要有以下规划：

尝试基于 DoReMi 类似的技术来自动学习不同数据的混合。
引入 Pile v1（来自 Eleuther.ai）和 Pile v2（CrperAI）等数据集，以丰富当前数据集的多样性和规模。
处理更多的 CommonCrawl。
探索更多的数据去重复策略。
引入至少 1500 亿 tokens 的代码数据集，以帮助提高编码和推理任务的质量。

更多详情可查看官方博客。 https://www.together.xyz/blog/redpajama-7b

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

TOGETHER 宣布其70 亿参数大语言模型 RedPajama 7B 已完成所有训练，并在 Apache 2.0 许可下全部开源。

最新文章

WinRAR简体中文32/64位商业版下载（2025/08/12已更新至WinRAR7.13）WinRAR 7.13 Chinese Simplified (64 bit)简体中文正式版

[Windows] 迅雷12.4.1.3670 精简绿色版

win11 20250820更新

1panel更新openresty1.27？

New! OpenResty 1.27.1.2 is now released! 已经正式发布 (created 31 Mar 2025)

AudioSwitcher：开源Windows音频切换器，快速切换耳机和音响

随便看看

hostdare高性能AMD EPYC平台+三网纯高端网络(cn2/cuii/cmin2)，VPS低至$25/年

腾讯云国内北上广轻量4核大算力，新用户低至79元/年

hostdare洛杉矶AMD EPYC VPS，5折优惠，低至$15.49/年

spinservers 七月促销高配/低价美国服务器，低至$59/月，4路铂金8173M/1.5T内存/15TNVMe/100T流量/10Gbps带宽

hostdare：全场VPS低至$10.4/年，美国(CN2+CUII+CMIN2)/日本软银+NTT/保加利亚BGP

TOGETHER 宣布其70 亿参数大语言模型 RedPajama 7B 已完成所有训练，并在 Apache 2.0 许可下全部开源。

相关文章

最新文章

随便看看

标签