全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重(什么是全球首堆人)

AIGC动态欢迎阅读

原标题:全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型

权重

关键字:视频,模型,解读,数据,注意力

文章来源:量子位

内容字数:6648字

内容摘要:

明敏 发自 凹非寺量子位 | 公众号 QbitAI全球首个开源的类Sora架构视频生成模型,来了!

整个训练流程,包括数据处理、所有训练细节和模型权重,全部开放。

这就是刚刚发布的Open-Sora 1.0。

它带来的实际效果如下,能生成繁华都市夜景中的车水马龙。

还能用航拍视角,展现悬崖海岸边,海水拍打着岩石的画面。

亦或是延时摄影下的浩瀚星空。

自Sora发布以来,由于效果惊艳但技术细节寥寥,揭秘、复现Sora成为了开发社区最热议话题之一。比如Colossal-AI团队推出成本直降46%的Sora训练推理复现流程。

短短两周时间后,该团队再次发布最新进展,复现类Sora方案,并将技术方案及详细上手教程在GitHub上免费开源。

那么问题来了,复现Sora如何实现?

Open-Sora 开源地址:https://github.com/hpcaitech/Open-Sora

全面解读Sora复现方案Sora复现方案包括四个方面:

模型架构设计

训练复现方案

数据预处理

高效训练优化策略

模型架构设计模型采用了Sora同源架构Diffusion Transformer (DiT) 。

原文链接:全球首个类Sora开源复现方案来了!全面公开所有训练细节和模型权重

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?