旧金山:ChatGPT和图像生成器DALL-E的创造者OpenAI表示,它正在测试一种名为Sora的文本到视频模型,该模型将允许用户通过简单的提示创建逼真的视频。
这家微软支持的公司表示,新平台目前正在测试中,但发布了一些视频,显示了它所说的已经可能实现的功能,并附带了生成视频的输入。
“Sora可以生成长达一分钟的视频,同时保持视觉质量,并遵守用户的提示,”OpenAI在一篇博客文章中说。
该公司表示,该模型还可以获取现有的静止图像,并从中生成视频。
OpenAI首席执行官Sam Altman在X上表示,该公司在测试阶段“向有限数量的创作者提供访问权限”。
他还邀请用户在X上提出提示,几分钟后,他在平台上发布了令人信服的结果。
其中包括两只金毛猎犬在山上播客的短视频。
另一幅画中,一只“半鸭半龙,背着一只穿着冒险服的仓鼠,在美丽的日落中飞翔”。
这家总部位于旧金山的初创公司警告称,“目前的模式存在弱点”,比如左右混淆,或者在整个视频长度中无法保持视觉连续性。
在声明中,该公司表示,安全将是关键,Sora将面临对抗性测试,即所谓的红队测试,即专职用户试图使平台出现故障,产生不适当的内容或偏离轨道。
OpenAI表示:“我们将与世界各地的政策制定者、教育工作者和艺术家合作,了解他们的担忧,并为这项新技术确定积极的用例。”
meta、谷歌和Runway AI也在研究文本到视频的人工智能技术,并发布了类似的工作样本。(法新社
×