OpenAI Sora介绍:功能、案例以及使用

时间:2024-02-23 10:38:07  热度:0°C
大年初六,OpenAI 正式发布了AI视频生成模型Sora,继 Runway、Pika、谷歌和 Meta 之后,OpenAI 终于加入视频生成领域的战争。看了官方提供的生成视频,非常惊艳,质量很高,真假难辨。之前AI视频领域,视频长度一直在几秒十几秒徘徊,效果还一般,Sora直接生成60秒高质量视频,有点降维打击的感觉。这下不知道有多少 AI 视频创业公司彻夜难眠///又有多少视频创作者兴奋得睡不着觉了///那么Sora是什么,可以做什么,效果如何,如何使用呢?一起来看看。Sora 是什么?Sora 是 OpenAI 开发的AI视频生成模型,它能够根据用户提供的文本描述生成高质量视频,生成长达 60 秒的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。Sora与ChatGPT一样采用的是Transformer架构,并使用了DALL-E 3中的重述技术,是一种为视觉训练数据生成高精准描述性的字幕。所以,Sora在生成视频过程中精准还原用户的文本提示语义。Sora能够创造出包含多个角色、特定动作类型以及与主题和背景相符的详细场景。这款模型不仅能理解用户的指令,还能洞察这些元素在现实世界中的表现。Sora对语言有着深刻的理解,能够精准地捕捉到用户的需求,并创造出充满生命力、情感丰富的角色。此外,Sora还能在同一视频中创造出多个画面,同时保持角色和视觉风格的一致性。

Sora 可以做什么?

Sora 的主要功能是将文本描述转化为视频内容。它能够理解并执行详细的文本指令,生成具有视觉质量和连贯性的视频,这些视频可以包含多个角色、动作和场景。Sora 还能够从静态图像生成动画,或扩展现有视频。
  • 生成高质量视频:Sora 能够根据文本提示生成视频,这些视频可以包含复杂的场景、多个角色、特定的动作以及准确的主题和背景细节。
  • 理解自然语言:Sora 拥有深入的语言理解能力,能够准确解释提示并生成表达丰富情感的角色。
  • 多镜头生成:Sora 可以在单个生成的视频中创建多个镜头,同时保持角色和视觉风格的一致性。
  • 从静态图像生成视频:Sora 能够从一个现有的静态图像开始,准确地动画化图像内容。
  • 视频扩展:Sora 还可以扩展现有视频,或者填补视频中的缺失帧。

Sora生成案例展示

1、Prompt/A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage/ She wears a black leather jacket/ a long red dress/ and black boots/ and carries a black purse/ She wears sunglasses and red lipstick/ She walks confidently and casually/ The street is damp and reflective/ creating a mirror effect of the colorful lights/ Many pedestrians walk about/提示词译文:一位时尚女性走在布满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。Sora生成的视频: 2、Prompt/Beautiful/ snowy Tokyo city is bustling/ The camera moves through the bustling city street/ following several people enjoying the beautiful snowy weather and shopping at nearby stalls/ Gorgeous sakura petals are flying through the wind along with snowflakes/提示词译文:美丽、白雪皑皑的东***很繁华。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天并在附近的摊位购物。美丽的樱花花瓣随着雪花在风中飞舞。Sora生成的视频: 3、Prompt/Several giant wooly mammoths approach treading through a snowy meadow/ their long wooly fur lightly blows in the wind as they walk/ snow covered trees and dramatic snow capped mountains in the distance/ mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow/ the low camera view is stunning capturing the large furry mammal with beautiful photography/ depth of field/提示词译文:几只巨大的毛茸茸的猛犸象正踏着白雪皑皑的草地走来,它们长长的毛茸茸的皮毛在风中轻轻飘动,远处覆盖着积雪的树木和雄伟的雪山,午后的阳光下有缕缕云彩,太阳高挂在天空中。”距离产生了温暖的光芒,低***头视角令人惊叹地捕捉到了大型毛茸茸的哺***动物,具有美丽的摄影和景深。Sora生成的视频: 4、Prompt/A Chinese Lunar New Year celebration video with Chinese Dragon/提示词译文:与中国龙一起庆祝中国农历新年的视频。Sora生成的视频: 5、Prompt/A young man at his 20s is sitting on a piece of cloud in the sky/ reading a book/提示词译文:一位 20 多岁的年轻人正坐在天空中的一片云上看书。Sora生成的视频: 6、Prompt/Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee/提示词译文:逼真的特写视频,展示两艘海盗船在一杯咖啡内一边航行、一边争斗的情形。Sora生成的视频: 7、Prompt/The camera rotates around a large stack of vintage televisions all showing different programs — 1950s sci-fi movies/ horror movies/ news/ static/ a 1970s sitcom/ etc/ set inside a large New York museum gallery/提示词译文:镜头围绕一大堆老式电视旋转,所有电视都显示不同的节目 - 20 世纪 50 年代的科幻电影、恐怖电影、新闻、静态、1970 年代的情景喜剧等,背景设置在纽约大型博物馆画廊内。Sora生成的视频:

Sora的局限性

当然,Sora不是完美的,还存在不少问题。比如在模拟复杂场景的物理效应,以及理解某些特定因果关系时,它可能会遇到难题,比如:
  • 视频中的人物可能会咬一口饼干,但饼干上可能看不到明显的咬痕。
  • 在处理空间细节,比如分辨左右时,Sora也可能会出现混淆;
  • 在精确描述一段时间内发生的事件,如特定的摄影机移动轨迹时,也可能显得力不从心。

如何使用Sora?

Sora目前暂未开放,内测阶段。估计等测试就绪,很快就会对外开放使用了。Sora官网入口:https////sora关注AIHub公众号,及时获取最新开放消息和使用教程。

免责声明:
1. 《OpenAI Sora介绍:功能、案例以及使用》内容来源于互联网,版权归原著者或相关公司所有。
2. 若《86561825文库网》收录的文本内容侵犯了您的权益或隐私,请立即通知我们删除。