兆级长文本，已是一线大模型机构标配能力丨上海AI Lab林达华（兆兆字节）

原标题：兆级长文本，已是一线大模型机构标配能力丨上海AI Lab林达

华

关键字：模型,林达,腾讯,能力,数据

文章来源：量子位

内容字数：5990字

衡宇发自阿拉上海量子位 | 公众号 QbitAI“据我了解，国内多个一线大模型机构，都已经突破了兆级的长文本能力。”

以上，是“2024全球开发者先锋大会”大模型前沿论坛会间隙，上海人工智能实验室领军科学家林达华与量子位的交谈剪影。

林达华，深度学习与计算机专家，香港中文大学教授，他是商汤联合创始人，也是商汤创始人汤晓鸥的学生，是国际上最具影响力的视觉算法开源项目OpenMMLab的主导发起人。在大模型时代，他带领了书生·浦语InternLM开源大模型体系以及OpenCompass司南大模型评测体系的研发工作。

林达华预估，第一季度左右，各家都会对大模型上下文窗口兆级能力“亮剑”。

同时，他表达了与月之暗面同样的态度，即大海捞针其实没有那么难。

难的是海里不止一根针，应有无数的碎片化信息藏在各个地方，（大模型）把所有东西串接一起，做比较深层次的结论。就像读福尔摩斯侦探小说，读完后综合判断凶手是谁——这就不是一个简单的检索问题。

近期，各家大模型于长文本赛道上卷生卷死，但是否应把它作为最主要的方向去打磨，大家有不同的判断。

林达华点出，应该要评估衡量超长文本能力的计算代价，“无损长上

文章来源：量子位

作者微信：QbitAI

作者简介：追踪人工智能新趋势，关注科技行业新突破