兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华(兆兆字节)

AIGC动态欢迎阅读

原标题:兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达

关键字:模型,林达,腾讯,能力,数据

文章来源:量子位

内容字数:5990字

内容摘要:

衡宇 发自 阿拉上海量子位 | 公众号 QbitAI“据我了解,国内多个一线大模型机构,都已经突破了兆级的长文本能力。”

以上,是“2024全球开发者先锋大会”大模型前沿论坛会间隙,上海人工智能实验室领军科学家林达华与量子位的交谈剪影。

林达华,深度学习与计算机专家,香港中文大学教授,他是商汤联合创始人,也是商汤创始人汤晓鸥的学生,是国际上最具影响力的视觉算法开源项目OpenMMLab的主导发起人。在大模型时代,他带领了书生·浦语InternLM开源大模型体系以及OpenCompass司南大模型评测体系的研发工作。

林达华预估,第一季度左右,各家都会对大模型上下文窗口兆级能力“亮剑”。

同时,他表达了与月之暗面同样的态度,即大海捞针其实没有那么难。

难的是海里不止一根针,应有无数的碎片化信息藏在各个地方,(大模型)把所有东西串接一起,做比较深层次的结论。就像读福尔摩斯侦探小说,读完后综合判断凶手是谁——这就不是一个简单的检索问题。

近期,各家大模型于长文本赛道上卷生卷死,但是否应把它作为最主要的方向去打磨,大家有不同的判断。

林达华点出,应该要评估衡量超长文本能力的计算代价,“无损长上

原文链接:兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?