专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮（面壁图片）

原标题：专访面壁曾国洋：踩过 1000 次大模型

的坑后，造一个性能小钢炮

关键字：模型,智能,团队,能力,参数

文章来源：AI科技评论

内容字数：14559字

以小博大，面壁MiniCPM在大模型赛场上扔出了重磅炸弹。作者丨赖文昕、王悦

编辑丨陈彩娴

2月1日，刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级」的存在——面壁 MiniCPM 2B 旗舰端侧大模型与面壁OmniLMM多模态大模型。

MiniCPM 2B 有着当之无愧的「小钢炮」称号，其炸裂的点在于，从规模大小和性能来看，仅用2B 规模和1T tokens精选数据，便已在多项主流评测榜单、中英文平均成绩中超越被称为“欧洲最佳大模型”的Mistral-7B。

在与其他同等规模大模型的对比中，面壁MiniCPM表现依旧领先，大幅超越了 Llama2-7B, Mistral7B，Gemini Nano，Qwen-1.8B等一众模型，甚至还能越级比肩 Llama2-13B、Falcon 40B和Cohere 54B此类比自己庞大数十倍规模的模型。

可以说，面壁智能这次扔出的“2B小钢炮”，炸出了超越Mistral-7B发布的效果，展示了端侧大语言模型的无限潜力

针对面壁智能本次发布的大模型成果，AI 科技评论独家对话面壁智能 CTO 曾国洋后发现，面壁这个刚成立一年的团队背后，是

原文链接：专访面壁曾国洋：踩过 1000 次大模型的坑后，造一个性能小钢炮

文章来源：AI科技评论

作者微信：aitechtalk

作者简介：雷峰网旗下AI新媒体。聚焦AI前沿研究，关注AI工程落地。