马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4(马斯克zip2卖了多少钱)

AIGC动态欢迎阅读

原标题:马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分GPT-4关键字:腾讯,得分,能力,上下文,模型

文章来源:量子位

内容字数:2957字

内容摘要:

丰色 西风 发自 凹非寺量子位 | 公众号 QbitAI就在刚刚,马斯克Grok大模型宣布重大升级。

难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。

来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大”

新版本Grok有啥突破?

一是上下文长度飙升,从8192增长到128k,和GPT-4齐平。

二是推理性能大幅提升,数学能力直接涨点50%之多、HumanEval数据集上得分超过GPT-4。

消息一出,评论区立刻就躁起来了。

具体跑分结果如何,咱们立马来看。

Grok-1.5来了首先,对于上下文窗口。

这次是一把直接提升到之前的16倍,来到128k量级。

这也就意味着Grok可以处理更长和更复杂的提示,同时保持其遵循指令的能力。

在“大海捞针”(NIAH)测试中,Grok-1.5在128K token的上下文中完美检索嵌入的文本。

整个图一水儿的蓝色(100%的检索深度):

其次,推理方面。

Grok-1.5处理编程和数学相关任务的能力大幅提升,全面超越Grok-1、Mistral Large、Claude 2。

数学方面,Grok-1.5在M

原文链接:马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?