通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

原标题：通义千问再开源，Qwen1.5带来六种体量模型

，性能超越GPT3.5

关键字：模型,能力,基准,团队,阿里

文章来源：机器之心

内容字数：5601字

机器之心报道

编辑：泽南超越 Claude、GPT-3.5，提升了多语言支持能力。赶在春节前，通义千问大模型（Qwen）的 1.5 版上线了。今天上午，新版本的消息引发了 AI 社区关注。

新版大模型包括六个型号尺寸：0.5B、1.8B、4B、7B、14B 和 72B，其中最强版本的性能超越了 GPT 3.5、Mistral-Medium，包括 Base 模型和 Chat 模型，且有多语言支持。

阿里通义千问团队表示，相关技术也已经上线到了通义千问官网和通义千问 App。

除此以外，今天 Qwen 1.5 的发布还有如下一些重点：

支持 32K 上下文长度；

开放了 Base + Chat 模型的 checkpoint；

可与 Transformers 一起本地运行；

同时发布了 GPTQ Int-4 / Int8、AWQ 和 GGUF 权重。

借助更先进的大模型作为评委，通义千问团队在两个广泛使用的基准 MT-Bench 和 Alpaca-Eval 上对 Qwen1.5 进行了初步评估，评估结果如下：尽管落后于GPT-4-Turbo，但最大版本的 Qwen1.5 模型 Qwen1.

原文链接：通义千问再开源，Qwen1.5带来六种体量模型，性能超越GPT3.5

文章来源：机器之心

作者微信：almosthuman2014

作者简介：专业的人工智能媒体和产业服务平台