专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮(面壁图片)

AIGC动态欢迎阅读

原标题:专访面壁曾国洋:踩过 1000 次大模型

的坑后 ,造一个性能小钢炮

关键字:模型,智能,团队,能力,参数

文章来源:AI科技评论

内容字数:14559字

内容摘要:

以小博大,面壁MiniCPM在大模型赛场上扔出了重磅炸弹。作者丨赖文昕、王悦

编辑丨陈彩娴

2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。

MiniCPM 2B 有着当之无愧的「小钢炮」称号,其炸裂的点在于,从规模大小和性能来看,仅用2B 规模和1T tokens精选数据,便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。

在与其他同等规模大模型的对比中,面壁MiniCPM表现依旧领先,大幅超越了 Llama2-7B, Mistral7B,Gemini Nano,Qwen-1.8B等一众模型,甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。

可以说,面壁智能这次扔出的“2B小钢炮”,炸出了超越Mistral-7B发布的效果,展示了端侧大语言模型的无限潜力

针对面壁智能本次发布的大模型成果,AI 科技评论独家对话面壁智能 CTO 曾国洋后发现,面壁这个刚成立一年的团队背后,是

原文链接:专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮

联系作者

文章来源:AI科技评论

作者微信:aitechtalk

作者简介:雷峰网旗下AI新媒体。聚焦AI前沿研究,关注AI工程落地。

0
分享到:
没有账号? 忘记密码?