苹果首次披露多模态大模型!AI 大招什么时候上 iPhone(5种io模型区别)

AIGC动态欢迎阅读

原标题:苹果首次披露多模态大模型

!AI 大招什么时候上 iPhone

关键字:模型,数据,图像,研究人员,解读

文章来源:爱范儿

内容字数:8283字

内容摘要:

一直在大模型浪潮有点克制的苹果,终于不再低调了。在今年的苹果股东大会上,库克罕见地谈及了生成式 AI。

苹果 2024 年将在生成式 AI 领域「开辟新天地」。

今天,苹果首次揭晓了在多模态大型语言模型(LLM)研究领域的最新突破。

这是一篇题为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的学术论文,里面详细介绍了具有高达 30B 参数规模的系列多模态 LLM。

不只是数苹果!超大杯自带火眼金睛

直入主题,先来看看「超大杯」 MM1-30B-Chat 的能力。

MM1-30B-Chat 不仅准确无误地数出图片中苹果、橙子的数量,而且面对一连串数字的识别,也能轻松应对。

难度也进一步升级,研究人员设置了个陷阱问题,询问 MM1-30B-Chat 能看到图片中的红球吗?

并未中招的它能够明确地回应道:「图片中并无红球,我所见到的是一只猫正坐在沙发的枕头上,除此之外,别无他物。」

我们时常在朋友圈上看到飞机上随手一拍的风景图,那 MM1-30B-Chat 会怎么解读这些风景图呢?

目睹这幅图像,人们会

原文链接:苹果首次披露多模态大模型!AI 大招什么时候上 iPhone

联系作者

文章来源:爱范儿

作者微信:ifanr

作者简介:关注明日产品的数字潮牌

0
分享到:
没有账号? 忘记密码?