在今天召开的直播活动中,马斯克正式发布了 Grok 4,声称是全球最强 AI 模型,在处理学术问题上的表现已达到博士级别。整场发布会时长 53 分钟,马斯克演示了 Grok 4 模型的多模态功能、更快的推理能力等诸多新特性。

Grok 4 系列包括两个版本:Grok 4 和 Grok 4 Heavy。两者都是纯推理模型,没有非推理模式。Grok 4 是单代理(single agent)版本,而 Grok 4 Heavy 是多代理版本(multi agents),支持四个代理同时工作。上下文窗口最高支持 256k tokens。

Grok 4 特性如下:

先进的推理能力: Grok 4 在 xAI 的 Colossus 超级计算机上进行了训练,以实现科学家级别的先进推理。该模型有望提供更强的逻辑推理和文本生成能力。
专注于编码的变体: 开发者将会青睐 Grok 4 Code,这是一个专门用于更高效地编写、调试和解释代码的特化模型,与 GitHub Copilot 或 GPT-4 Code Interpreter 等工具相呼应。
多模态能力: Grok 4 预计将不仅支持文本,还支持图像,并可能支持视频。更好的多模态能力将使该模型能与 OpenAI 的 GPT-5o 和 Google 的 Gemini 2.5 Pro 展开更激烈的竞争。Grok 4 未来某个时候可能会支持视频。
语音功能: Grok 4 的语音功能(Grok 4 Voice)拥有自然、酷似真人的声音,且干扰更少。
实时网络访问:与早期的 Grok 模型一样,Grok 4 配备了 DeepSearch 工具,可以从网络、尤其是马斯克的 X 平台实时抓取数据。这意味着 Grok 可以在聊天过程中提供最新信息 —— 无需打开独立的标签页或浏览器。
文化通晓与 “玩梗” 能力: Grok 最大的差异化优势之一是它对互联网文化的理解。Grok 4 正在被调校以高精度解读 “梗”、俚语和幽默,这可能使其成为迄今为止最 “懂网上冲浪” 的 AI 助手之一。

xAI 声称,Grok4 在多项基准测试中展现了前沿水准,其中包括 “人类最后一道考题”(Humanity’s Last Exam),这个考试通过数千个关于数学、人文学科和自然科学等主题的众包问题,来衡量 AI 的能力。据 xAI 称,Grok4 在不使用 “工具” 的情况下,在该测试中得分率为 25.4%,超过了 Google Gemini2.5 Pro 的 21.6%,以及 OpenAI 的 o3 (high) 的 21%。

除了 Grok 4 和 Grok4 Heavy,xAI 还推出了其迄今最昂贵的 AI 订阅计划、名为 SuperGrokHeavy 的每月 300 美元的订阅服务。该计划的订阅者将能抢先体验 Grok4 Heavy,并优先使用新功能。此计划与其他主要 AI 提供商如 OpenAI、Google 和 Anthropic 推出的超高端会员服务类似,但 xAI 目前提供了其中最昂贵的订阅选项。

SuperGrok Heavy 的订阅者或许能提前体验到 xAI 计划在未来数月推出的一些新产品。该公司周三表示,一款 AI 编码模型将于 8 月问世,一个多模态智能体将于 9 月推出,而视频生成模型则定于 10 月。

 

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。