解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品(spaceclaim逆向工程)

AIGC动态欢迎阅读

原标题:解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品

关键字:报告,视频,模型,编码器,视觉

文章来源:量子位

内容字数:12694字

内容摘要:

西风 发自 凹非寺量子位 | 公众号 QbitAISora刚发布不久,就被逆向工程“解剖”了?!

来自理海大学、微软研究院的华人团队发布了首个Sora相关研究综述,足足有37页。

他们基于Sora公开技术报告和逆向工程,对模型背景、相关技术、应用、现存挑战以及文本到视频AI模型未来发展方向进行了全面分析。

连计算机视觉领域的AI生成模型发展史、近两年有代表性的视频生成模型都罗列了出来:

网友们也属实没想到,仅仅过了半个月、Sora还暂未公开仅有部分人可使用,学术圈相关研究竟出现得这么快。

不少网友表示,综述非常全面有条理,建议全文阅读。

那么这篇综述具体都讲了啥?

量子位在不改变原意的基础上,对部分内容进行了整理。

目录

逆向工程剖析Sora技术细节

整体架构

多样性视觉数据预处理

指令调优:视频摘要生成器

视频提示工程

Sora具有里程碑式意义

Sora的五大应用前景及局限性

逆向工程剖析Sora技术细节众所周知,Sora发布后,OpenAI

紧接着发布了技术报告,但未详细透露技术细节,被有的网友吐槽OpenAI果然还是这么“Close”。

学术圈的猜测也是五花八门,ResNeXt一作

原文链接:解剖Sora:37页论文逆向工程推测技术细节,微软参与,华人团队出品

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?