马斯克开源Grok-1：史上最大3140亿参数模型，权重架构全面公开，附最新下载地址

马斯克的xAI公司正式开源了3140亿参数的大型语言模型Grok-1,包括权重和网络架构。这使Grok-1成为目前参数量最大的开源大语言模型。Grok-1采用混合专家(MoE)架构,在给定token上的激活权重为25%。xAI在2023年10月使用自定义训练堆栈从头训练了该模型,并遵守Apache 2.0许可证开源。

1.Grok-1 开源模型下载：【磁力链接】，然后使用【Torrent 客户端】进行下载即可！

2.Grok 开源项目：【Github】

3.如果需要在云端安装Grok-1大模型，可以通过【租赁H100 云GPU】进行云端搭建

4.当然也可以直接调用HuggingFace 🤗 Hub：

git clone https://github.com/xai-org/grok-1.git && cd grok-1

pip install huggingface_hub[hf_transfer]

huggingface-cli download xai-org/grok-1 --repo-type model --include ckpt-0/* --local-dir checkpoints --local-dir-use-symlinks False

模型详情:

基于大量文本数据训练,未针对任何特定任务微调
3140亿参数MoE模型,激活权重25%
使用旋转嵌入而非固定位置嵌入
Tokenizer词汇大小131,072,嵌入大小6,144
64层Transformer,每层解码器层包含多头注意力块和密集块
多头注意力:48头查询,8头键/值,键值大小128
密集块:加宽因子8,隐藏层大小32768
每个token从8个专家选择2个
旋转位置嵌入大小6,144
上下文长度8192 tokens,精度bf16

模型能力:

在标准LM基准测试中表现超过同等计算量模型
HumanEval编码任务63.2%,MMLU 73%
在匈牙利高中数学考试中获C级(59%)
整体在推理和编码任务中表现出色

局限性:

缺少独立搜索网络能力,需结合搜索工具增强
可能产生幻觉,需人工审查
目前无法像X平台付费版实现实时获取信息

开源意义:

遵循Apache 2.0许可证,用户可自由使用修改分发
体现了xAI追求透明化和社区开放的理念
为进一步研究和创新提供了宝贵资源

总的来说,Grok-1作为一款大规模开源语言模型,在模型能力和透明度方面都具有重要意义,值得业内外人士关注和探索。当然,模型的实际应用还需要结合其他工具和人工审查,以发挥其最大潜能。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

马斯克开源Grok-1：史上最大3140亿参数模型，权重架构全面公开，附最新下载地址

最新文章

host文件案例

OSchina 开源中国社区软件更新至2025-08-25 极限历史记录三个月推荐1个月更新一次

Windows 高级增强搜索工具 UltraSearch 4.8.2.1182 x64 中文便携版

nginx 1.29.1 主线版本发布

LibreOffice 25.8 发布

Git for Windows v2.51.0 发布

随便看看

hostdare高性能AMD EPYC平台+三网纯高端网络(cn2/cuii/cmin2)，VPS低至$25/年

腾讯云国内北上广轻量4核大算力，新用户低至79元/年

hostdare洛杉矶AMD EPYC VPS，5折优惠，低至$15.49/年

spinservers 七月促销高配/低价美国服务器，低至$59/月，4路铂金8173M/1.5T内存/15TNVMe/100T流量/10Gbps带宽

hostdare：全场VPS低至$10.4/年，美国(CN2+CUII+CMIN2)/日本软银+NTT/保加利亚BGP

马斯克开源Grok-1：史上最大3140亿参数模型，权重架构全面公开，附最新下载地址

相关文章

最新文章

随便看看

标签