什么是Sora?
Sora是OpenAI于2024年2月18日发布的文生视频大模型。从OpenAI展示的视频效果来看,Sora在生成视频质量、分辨率、文本语义还原、动作一致性、细节、色彩等方面表现出色,尤其是能够生成最长1分钟的视频,画面光影、物体间物理关系、镜头切换都非常流畅,远超同类产品如Gen-2、SVD-XT和Pika。
Sora能做什么?
Sora的使用非常简单,只需在提示框中输入单词、短语或句子,Sora便会根据这些信息自动生成场景。其主要功能包括:
- 生成高质量长视频:能够生成长达1分钟的视频,保持视觉质量和对用户提示的忠实度。
- 复杂场景生成:可生成包含多个角色、特定运动类型和背景细节的复杂场景。
- 物理世界理解:模型不仅理解用户提示,还理解这些内容在物理世界中的存在方式。
Sora有多准确?
根据OpenAI发布的初始示例,Sora能够根据提示准确生成视频。然而,OpenAI也承认,当前的Sora模型在模拟复杂场景的物理特性方面仍存在不足,可能无法准确理解某些因果关系。
Sora的最大技术突破是什么?
Sora的最大突破在于其能够在保持高质量的前提下生成1分钟的视频。这一成就在文生视频领域极为罕见,展示了OpenAI在大模型技术研发上的卓越能力。
Sora的原理概述
Sora采用扩散模型,从静态噪音的视频开始生成,并通过多个步骤去除噪音,逐渐生成最终视频。其架构与ChatGPT类似,使用了Transformer架构,并借鉴了DALL-E 3的重述技术,确保生成的视频精准还原用户的文本提示。
Sora引发全球关注
Sora的发布引发了全球热议,众多科技大V表达了对人工智能未来发展的期待。360创始人周鸿祎认为,Sora的诞生可能将通用人工智能(AGI)的实现时间缩短至一两年,并强调科技竞争的核心在于人才密度和技术积累。
马斯克也在社交媒体上表示,通过AI增强的人类将在未来几年创造出最佳作品。
Sora是否向公众开放?是否免费?
目前,Sora仅向“红队成员”(即风险评估专家)和部分视觉艺术家、设计师及电影制作人开放,旨在获取反馈并改进平台。对这些用户而言,Sora目前是免费的,但普通用户尚无法直接使用该功能。
Sora的安全性如何?
OpenAI表示正在积极解决Sora可能生成误导性内容的问题。除了与红队成员合作外,OpenAI还在开发工具以检测误导性内容,包括识别视频是否由Sora生成的“检测分类器”。此外,OpenAI的文本分类器将拒绝违反使用政策的输入提示,如极端暴力、色情内容等。
Sora对未来的影响
技术的变革往往是一把双刃剑。Sora的出现可能会对影视行业的某些岗位产生影响,例如视频剪辑师和后期制作人员。然而,它也推动了视频行业向更高端和创新的方向发展,未必会导致大规模失业。
当前如何使用Sora?
目前,Sora仅对特定用户群体开放,普通用户无法直接使用。建议关注OpenAI的官方公告,以获取最新使用信息和未来可能的公共访问安排。