最新Sora技术大揭秘:峰值要72万块H100,训练每月4200块GPU

Sora模型参数超675M,训练需要4211-10528个 Nvidia H100运行一个月;每段视频的计算成本约为708×10^15 FLOPS,H100大约每小时能生成5分钟的视频…如此详细的数据放出来,震惊整个业界!

近期,投资公司Factorial Funds深入剖析了OpenAI的Sora模型,带来了对其背后技术、算力需求以及商业前景的全面解读。Sora模型能够生成极为逼真的视频,引领了视频生成技术的新浪潮。但其背后的算力需求巨大,预计需要每月最少4200块Nvidia H100 GPU,峰值需求可能达到72万块。这一需求规模对GPU市场产生了重要影响,同时也反映了视频生成模型在技术发展道路上的重要一步。

Sora模型代表了生成式AI在视频生成领域的重大突破,其背后采用的扩散Transformer(DiT)技术和潜在扩散方法,显著提高了视频生成的效率和质量。与此同时,Sora模型的成功运作依赖于大规模的算力支持,预计在训练阶段每月需使用4200至10500个Nvidia H100 GPU。这一算力需求在AI模型训练中属于前所未有的规模。

Sora模型不仅在技术上取得了进展,同时也在开拓视频生成的应用前景,包括在Runway、Genmo和Pika等平台上构建直观的用户界面和工作流程。Sora的应用潜力广泛,从内容创作到教育培训,再到仿真和游戏开发,都将从中受益。

此外,Sora模型的研究也揭示了扩展定律在视频生成模型中的有效性。随着模型规模的增大和计算资源的增加,视频生成的质量和效率预计将继续提升。然而,这也意味着对GPU等计算资源的需求将持续增长,对硬件供应链产生深远影响。

Sora的开发和应用,不仅是技术上的一次飞跃,更是对未来视频内容生产方式的一次革命。随着技术的进一步成熟和应用的广泛推广,Sora及其后续模型将为视频内容创作和多媒体领域带来更多可能。

Sora模型技术架构:
【基础框架】:Sora模型基于扩散Transformer(DiT)和潜在扩散技术,有效扩展了模型和训练数据集,进而提升了视频生成的质量和效率。
【扩散模型】:采用逐步消除噪声的方式生成图像或视频,从纯噪声模式开始,逐步细化模式,最终转换为连贯且详细的输出。DiT-XL模型有675M参数,使用了大约1021 FLOPS的总计算量,相当于大约0.4 Nvidia H100s运行一个月。
【潜在扩散】:相比于直接在像素层面进行扩散,Sora模型在更紧凑的潜在空间中执行扩散,然后从潜在空间解码回像素空间,显著提高了计算效率。

算力需求分析:
【训练需求】:Sora模型的训练极为算力密集,预计1个月需要4200至10500个Nvidia H100 GPU。这一需求量在当前AI模型训练中属于非常高的规模。
【推理成本】:进行推断时,Sora模型每个Nvidia H100 GPU每小时最多可以生成约5分钟的视频。这意味着,尽管推理计算量相对训练来说较小,但随着模型应用的普及,推理计算的累积需求将非常庞大。

数据集和模型规模:
【数据集】:Sora模型的训练依赖于大规模、高质量的标记视频及其文本描述,这些数据的规模和质量直接影响模型的性能。
【模型参数】:Sora模型的规模远超过传统的图像生成模型,估计Sora的模型参数数量远超675M。如果假设一个20B参数的模型,相对于DiT,计算需求增加了30倍。

缩放定律的应用:
【性能提升】:与大型语言模型(LLM)类似,Sora模型的性能随着计算资源的增加而提升,符合缩放定律。
【未来发展】:基于缩放定律,预计Sora及其后续模型将通过进一步增加模型规模和训练计算,实现快速的性能提升。

推理计算估算:
【推理与训练计算】: 训练计算是一次性的大量计算,而推理计算虽然较小,但随着模型的广泛应用,会被频繁调用。
【达到平衡点】: 平衡点是指花费在推理上的计算量超过训练所需计算量的时刻。基于DiT到Sora的推算,Sora每生成一段视频的计算成本约为708×10^15 FLOPS,相当于每Nvidia H100 GPU大约能每小时生成5分钟视频。
【平衡点达成】: 在生成15.3M到38.1M分钟视频后,推理计算将超过训练计算。考虑到YouTube每天上传的视频量约为43M分钟,这个平衡点在实际应用中很快就能达到!

商业应用与挑战:
【应用前景】:Sora模型的成功应用预示着AI视频生成技术在内容创作、娱乐、教育等领域的广泛应用潜力。
【挑战】:高昂的算力成本和资源需求成为Sora模型及其应用推广的主要挑战之一。同时,技术的进步也需考虑伦理和社会影响。

来源:https://m.weibo.cn/status/5016295449298472?wm=3333_2001&from=10DC093010&sourcetype=weixin&s_trans=1644054135_5016295449298472&s_channel=4&jumpfrom=weibocom

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容