Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂(sonic 开源)

AIGC动态欢迎阅读

原标题:Sora不开源,微软给你开源!全球最接近Sora视频模型

诞生,12秒生成效果逼真炸裂

关键字:视频,图像,文本,模型,智能

文章来源:新智元

内容字数:11999字

内容摘要:

新智元报道编辑:编辑部

【新智元导读】用不了多久,开源版的Sora就会涌来!理海大学微软团队已经做出一种全新多AI智能体框架Mora,可以完全复刻Sora能力,且生成视频效果几乎不相上下。微软版Sora诞生了!

Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。

尽管提出了Diffusion Transformer和空间patch策略,但想要达到Sora的性能还是很难,何况还缺乏算力和数据集。

不过,研究者发起的新一波复现Sora的冲锋,这不就来了么!

就在刚刚,理海大学联手微软团队一种新型的多AI智能体框架———Mora。

论文地址:https://arxiv.org/abs/2403.13248

没错,理海大学和微软的思路,是靠AI智能体。

Mora更像是Sora的通才视频生成。通过整合多个SOTA的视觉AI智能体,来复现Sora展示的通用视频生成能力。

具体来说,Mora能够利用多个视觉智能体,在多种任务中成功模拟Sora的视频生成能力,包括:

– 文本到视频生成

– 基于文本条件的图像到视频生成

– 扩展已生成视频

– 视频到视

原文链接:Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂

联系作者

文章来源:新智元

作者微信:AI_era

作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。

0
分享到:
没有账号? 忘记密码?