通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

AIGC动态欢迎阅读

原标题:通义千问再开源,Qwen1.5带来六种体量模型

,性能超越GPT3.5

关键字:模型,能力,基准,团队,阿里

文章来源:机器之心

内容字数:5601字

内容摘要:

机器之心报道

编辑:泽南超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。

新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。

阿里通义千问团队表示,相关技术也已经上线到了通义千问官网和通义千问 App。

除此以外,今天 Qwen 1.5 的发布还有如下一些重点:

支持 32K 上下文长度;

开放了 Base + Chat 模型的 checkpoint;

可与 Transformers 一起本地运行;

同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。

借助更先进的大模型作为评委,通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估,评估结果如下:尽管落后于GPT-4-Turbo,但最大版本的 Qwen1.5 模型 Qwen1.

原文链接:通义千问再开源,Qwen1.5带来六种体量模型,性能超越GPT3.5

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

0
分享到:
没有账号? 忘记密码?