王炸!OpenAI首个AI生成视频模型登场!
34451 0
实名

通过了实名认证的内容创造者

发布于 2024-2-29 22:38:35

您需要 登录 才可以下载或查看,没有账号?注册

x
点击上方蓝字CG世界关注我们“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”中国很有影响力影视特效CG动画领域自媒体
早晨小编正在悠哉的刷短视频,突然福至心灵打开了微信。果不其然,有大事发生:朋友圈被OpenAI新发布的消息炸了!!!
凌晨,OpenAI正式发布了文本直接生成短视频的黑科技→文本生成视频模型Sora。Sora可以生成长达一分钟的视频,同时保持画面稳定和质量,重要的是能严格遵守用户输入的提示语句,能够理解和模拟真实世界。说了半天,到底能生成啥样的视频呢?看这里↓
image.png

db57e8b63adf9960096fae25e12daca7.png
提示语:一部电影预告片,讲述了一位30岁的太空人的冒险故事,他戴着红色羊毛针织摩托车头盔,蓝天,盐沙漠,电影风格,用35毫米胶片拍摄,色彩鲜艳。这简直特么的王炸啊!!OpenAI又一次改变了世界!!Sora能够生成具有多个角色、特定运动类型以及主题和背景的,包含准确细节的复杂场景。这一模型不仅了解用户在提示中的要求,还能理解这些东西在物理世界中是如何存在的。


提示词:一架无人机相机环绕着一座美丽的历史悠久的教堂,这座教堂建在阿马尔菲海岸的岩石露头上,景色展示了历史悠久、宏伟的建筑细节以及分层的小路和天井,海浪拍打着下面的岩石,俯瞰着意大利阿马尔菲沿岸的沿海水域和丘陵景观,可以看到几个远方的人在露台上散步,欣赏着壮观的海景,午后温暖的阳光给现场创造了一种神奇而浪漫的感觉,美丽的照片捕捉到了令人惊叹的景色。Sora能够深刻理解语言,准确地解释输入的提示,在生成令人信服的人物的同时,表达充满活力的情感。还可以在一个生成的视频中创建多个镜头,准确地保持角色和视觉风格。


提示:一朵花从郊区房屋的窗台上长出来的定格动画。技术原理:
Sora是一个扩散模型,它从一个静态噪波的视频开始生成视频,并通过多次去除噪波来逐渐变换视频。它能够一次生成完整视频,或者扩展生成的视频以使其更长。通过一次为模型提供多帧,确保主题即使在暂时离开视线时也保持不变。

与GPT模型类似,Sora使用了转换器架构,将视频和图像表示为补丁的较小数据单元的集合,每个数据单元类似于GPT中的令牌。通过统一表示数据的方式,可以在比以前更多的视觉数据上训练扩散转换器,跨越不同的持续时间、分辨率和纵横比。Sora建立在过去对DALL·E和GPT模型的研究基础上。它使用了DALL·E 3中的重述技术,该技术涉及视觉训练数据生成高度描述性的标题。结果,模型能够更忠实地遵循用户在生成的视频中的文本指令。

除了能够根据文本提示生成视频外,Sora还能将单帧图像生成视频,准确地动画化图像内容,而且细节丰富。此模型还可以获取现有视频并对其进行扩展或填充缺失的帧。简直逆天了!


提示:篮球穿过篮筐然后爆炸。
缺陷:
当然,目前的Sora还存在弱点。它难以准确模拟复杂场景的物理特性,也无法理解因果关系的具体实例。比如一个人可能咬了一口饼干,但之后,饼干可能没有咬痕。还可能混淆提示的空间细节,例如,混淆左右,并可能难以准确描述随着时间的推移发生的事件,例如遵循特定的相机轨迹。

安全:
看到这里,小伙伴可能会担心安全问题。这个OpenAI也考虑到了。
比如规避 — 错误信息、仇恨内容和偏见等领域的领域专家,对模型进行了对抗性测试。此外还在构建工具来帮助检测误导性内容,例如检测分类器,它可以判断视频是由Sora生成的。除了开发新技术为部署做准备外,OpenAI还利用DALL·E 3的产品构建的现有安全方法,这些方法也适用于Sora。例如,一旦在OpenAI产品中,文本分类器就会检查并拒绝违反使用政策的文本输入提示,比如那些要求极端暴力、性内容、仇恨图像、名人肖像或他人IP的提示。还开发了强大的图像分类器,用于审查生成的每个视频的帧,以帮助确保它在向用户显示之前符合我们的使用策略。真的小编看完,感觉世界又要变天了。。
好了,下面再来看几个案例吧。


提示:3D 动画展示了一个小而圆、毛茸茸的生物,长着富有表情的大眼睛,探索充满活力的魔法森林。这种生物是兔子和松鼠的异想天开的混合体,拥有柔软的蓝色皮毛和浓密的条纹尾巴。它沿着波光粼粼的小溪跳跃,眼睛睁得大大的,充满惊奇。森林里充满了神奇的元素:会发光和变色的花朵,叶子呈紫色和银色的树木,还有像萤火虫一样的小漂浮灯。该生物停下来与一群围绕着蘑菇环跳舞的小仙女进行有趣的互动。该生物敬畏地抬头看着一棵发光的大树,这棵树似乎是森林的中心。


提示:赛博朋克背景下机器人的生活故事。


提示:纽约市像亚特兰蒂斯一样被淹没。鱼、鲸鱼、海龟和鲨鱼在纽约的街道上游来游去。
全文完

干货!一套能准确还原物体固有色的LookDev流程


实时流体模拟软件LiquiGen0.1发布


UE5中Sequencer的Niagara模拟缓存


这叫不会建模?


内容主要涵盖影视特效,CG动国,前沿CG技术,作品欣賞
使用道具 <
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表