马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4（马斯克zip2卖了多少钱）

原标题：马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4关键字：腾讯,得分,能力,上下文,模型

文章来源：量子位

内容字数：2957字

丰色西风发自凹非寺量子位 | 公众号 QbitAI就在刚刚，马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1，因为他有更强的Grok-1.5了，主打推理能力。

来自xAI的官方推送啥也没说，直接甩链接。主打一个“字少事大”

新版本Grok有啥突破？

一是上下文长度飙升，从8192增长到128k，和GPT-4齐平。

二是推理性能大幅提升，数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。

消息一出，评论区立刻就躁起来了。

具体跑分结果如何，咱们立马来看。

Grok-1.5来了首先，对于上下文窗口。

这次是一把直接提升到之前的16倍，来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示，同时保持其遵循指令的能力。

在“大海捞针”（NIAH）测试中，Grok-1.5在128K token的上下文中完美检索嵌入的文本。

整个图一水儿的蓝色（100%的检索深度）：

其次，推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升，全面超越Grok-1、Mistral Large、Claude 2。

数学方面，Grok-1.5在M

原文链接：马斯克突发Grok 1.5！上下文长度至128k、HumanEval得分超GPT-4

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破