Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂（sonic 开源）

原标题：Sora不开源，微软给你开源！全球最接近Sora视频模型

诞生，12秒生成效果逼真炸裂

关键字：视频,图像,文本,模型,智能

文章来源：新智元

内容字数：11999字

新智元报道编辑：编辑部

【新智元导读】用不了多久，开源版的Sora就会涌来！理海大学微软团队已经做出一种全新多AI智能体框架Mora，可以完全复刻Sora能力，且生成视频效果几乎不相上下。微软版Sora诞生了！

Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。

尽管提出了Diffusion Transformer和空间patch策略，但想要达到Sora的性能还是很难，何况还缺乏算力和数据集。

不过，研究者发起的新一波复现Sora的冲锋，这不就来了么！

就在刚刚，理海大学联手微软团队一种新型的多AI智能体框架———Mora。

论文地址：https://arxiv.org/abs/2403.13248

没错，理海大学和微软的思路，是靠AI智能体。

Mora更像是Sora的通才视频生成。通过整合多个SOTA的视觉AI智能体，来复现Sora展示的通用视频生成能力。

具体来说，Mora能够利用多个视觉智能体，在多种任务中成功模拟Sora的视频生成能力，包括：

– 文本到视频生成

– 基于文本条件的图像到视频生成

– 扩展已生成视频

– 视频到视

原文链接：Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

文章来源：新智元

作者微信：AI_era

作者简介：智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。