揭秘Sora 6大优势
sora动态吧
全部回复
仅看楼主
level 7
kuko1028 楼主
在Sora推出后不久,OpenAI发布了这款新工具的技术报告。《每日经济新闻》经过对报告的梳理,总结出了Sora的6大优势。
2024年02月20日 07点02分 1
level 7
kuko1028 楼主
准确性和多样性
Sora的显著特征之一是能够准确解释长达135个单词的长提示。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。
2024年02月20日 07点02分 2
level 7
kuko1028 楼主
强大的语言理解
OpenAI利用Dall-E模型的re-captioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与DALL·E 3类似,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使Sora能够精确地按照用户提示生成高质量的视频。
2024年02月20日 07点02分 3
level 7
kuko1028 楼主
以图/视频生成视频
Sora除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使Sora能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。
2024年02月20日 07点02分 4
level 7
kuko1028 楼主
视频扩展功能
由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于Transformer的扩散模型,Sora还能沿时间线向前或向后扩展视频。
2024年02月20日 07点02分 5
level 7
kuko1028 楼主
优异的设备适配性
Sora具备出色的采样能力,从宽屏的1920×1080p到竖屏的1080×1920,两者之间的任何视频尺寸都能轻松应对。这意味着Sora能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora还能以小尺寸迅速创建内容原型。
2024年02月20日 07点02分 6
level 7
kuko1028 楼主
场景和物体的一致性和连续性
Sora可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora可确保画面主体即使暂时离开视野也能保持不变。
2024年02月20日 07点02分 7
level 2
牛笔
2024年02月20日 08点02分 8
level 1
如果要用SORA的话对电脑配置有什么要求呢?
2024年02月26日 12点02分 9
1