王炸！OpenAI首个AI生成视频模型登场！ | 游戏资源 | 元素文章 | 游戏开发 | 微元素

您需要登录才可以下载或查看，没有账号？注册

x

点击上方蓝字CG世界关注我们“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”中国很有影响力影视特效CG动画领域自媒体
早晨小编正在悠哉的刷短视频，突然福至心灵打开了微信。果不其然，有大事发生：朋友圈被OpenAI新发布的消息炸了！！！
凌晨，OpenAI正式发布了文本直接生成短视频的黑科技→文本生成视频模型Sora。Sora可以生成长达一分钟的视频，同时保持画面稳定和质量，重要的是能严格遵守用户输入的提示语句，能够理解和模拟真实世界。说了半天，到底能生成啥样的视频呢？看这里↓

提示语：一部电影预告片，讲述了一位30岁的太空人的冒险故事，他戴着红色羊毛针织摩托车头盔，蓝天，盐沙漠，电影风格，用35毫米胶片拍摄，色彩鲜艳。这简直特么的王炸啊！！OpenAI又一次改变了世界！！Sora能够生成具有多个角色、特定运动类型以及主题和背景的，包含准确细节的复杂场景。这一模型不仅了解用户在提示中的要求，还能理解这些东西在物理世界中是如何存在的。

更多精彩图片请登录

提示词：一架无人机相机环绕着一座美丽的历史悠久的教堂，这座教堂建在阿马尔菲海岸的岩石露头上，景色展示了历史悠久、宏伟的建筑细节以及分层的小路和天井，海浪拍打着下面的岩石，俯瞰着意大利阿马尔菲沿岸的沿海水域和丘陵景观，可以看到几个远方的人在露台上散步，欣赏着壮观的海景，午后温暖的阳光给现场创造了一种神奇而浪漫的感觉，美丽的照片捕捉到了令人惊叹的景色。Sora能够深刻理解语言，准确地解释输入的提示，在生成令人信服的人物的同时，表达充满活力的情感。还可以在一个生成的视频中创建多个镜头，准确地保持角色和视觉风格。

更多精彩图片请登录

提示：一朵花从郊区房屋的窗台上长出来的定格动画。技术原理：
Sora是一个扩散模型，它从一个静态噪波的视频开始生成视频，并通过多次去除噪波来逐渐变换视频。它能够一次生成完整视频，或者扩展生成的视频以使其更长。通过一次为模型提供多帧，确保主题即使在暂时离开视线时也保持不变。

更多精彩图片请登录

与GPT模型类似，Sora使用了转换器架构，将视频和图像表示为补丁的较小数据单元的集合，每个数据单元类似于GPT中的令牌。通过统一表示数据的方式，可以在比以前更多的视觉数据上训练扩散转换器，跨越不同的持续时间、分辨率和纵横比。Sora建立在过去对DALL·E和GPT模型的研究基础上。它使用了DALL·E 3中的重述技术，该技术涉及视觉训练数据生成高度描述性的标题。结果，模型能够更忠实地遵循用户在生成的视频中的文本指令。

更多精彩图片请登录

除了能够根据文本提示生成视频外，Sora还能将单帧图像生成视频，准确地动画化图像内容，而且细节丰富。此模型还可以获取现有视频并对其进行扩展或填充缺失的帧。简直逆天了！

更多精彩图片请登录

提示：篮球穿过篮筐然后爆炸。
缺陷：
当然，目前的Sora还存在弱点。它难以准确模拟复杂场景的物理特性，也无法理解因果关系的具体实例。比如一个人可能咬了一口饼干，但之后，饼干可能没有咬痕。还可能混淆提示的空间细节，例如，混淆左右，并可能难以准确描述随着时间的推移发生的事件，例如遵循特定的相机轨迹。

安全：
看到这里，小伙伴可能会担心安全问题。这个OpenAI也考虑到了。
比如规避 — 错误信息、仇恨内容和偏见等领域的领域专家，对模型进行了对抗性测试。此外还在构建工具来帮助检测误导性内容，例如检测分类器，它可以判断视频是由Sora生成的。除了开发新技术为部署做准备外，OpenAI还利用DALL·E 3的产品构建的现有安全方法，这些方法也适用于Sora。例如，一旦在OpenAI产品中，文本分类器就会检查并拒绝违反使用政策的文本输入提示，比如那些要求极端暴力、性内容、仇恨图像、名人肖像或他人IP的提示。还开发了强大的图像分类器，用于审查生成的每个视频的帧，以帮助确保它在向用户显示之前符合我们的使用策略。真的小编看完，感觉世界又要变天了。。
好了，下面再来看几个案例吧。

更多精彩图片请登录

提示：3D 动画展示了一个小而圆、毛茸茸的生物，长着富有表情的大眼睛，探索充满活力的魔法森林。这种生物是兔子和松鼠的异想天开的混合体，拥有柔软的蓝色皮毛和浓密的条纹尾巴。它沿着波光粼粼的小溪跳跃，眼睛睁得大大的，充满惊奇。森林里充满了神奇的元素：会发光和变色的花朵，叶子呈紫色和银色的树木，还有像萤火虫一样的小漂浮灯。该生物停下来与一群围绕着蘑菇环跳舞的小仙女进行有趣的互动。该生物敬畏地抬头看着一棵发光的大树，这棵树似乎是森林的中心。

更多精彩图片请登录

提示：赛博朋克背景下机器人的生活故事。

更多精彩图片请登录

提示：纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游来游去。
全文完

更多精彩图片请登录

干货！一套能准确还原物体固有色的LookDev流程

更多精彩图片请登录

实时流体模拟软件LiquiGen0.1发布

更多精彩图片请登录

UE5中Sequencer的Niagara模拟缓存

更多精彩图片请登录

这叫不会建模？