“中國(guó)Sora”正在快速崛起。

Open AI文生視頻模型Sora正式上線,國(guó)產(chǎn)視頻模型走向白熱化

2024-12-10 15:32:45發(fā)布     來(lái)源:多知    作者:Penny  

  多知12月10日消息,Open AI周一宣布,旗下視頻生成模型Sora正式面向大眾推出,該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。新版工具Sora Turbo可以生成最長(zhǎng)達(dá)20秒的視頻,并且可以提供這些視頻的多種變體。據(jù)介紹,Sora將在10日開(kāi)始向美國(guó)及其他市場(chǎng)的ChatGPT付費(fèi)用戶開(kāi)放。

  今年2月,Open AI首次推出Sora,這是一種可以根據(jù)文本創(chuàng)建逼真視頻的模型,并分享了我們?cè)谑澜缒M方面的初步研究進(jìn)展。Sora是理解和模擬現(xiàn)實(shí)的人工智能的基礎(chǔ)。這是開(kāi)發(fā)可以與物理世界交互的模型的重要一步。

  今年2月的Sora是預(yù)覽模型,只有部分藝術(shù)家、電影制作人和安全測(cè)試人員可以使用。周一,OpenAI發(fā)布了 Sora 的新版本——Sora Turb,它比2月份預(yù)覽的模型快得多,使用人群更多了。

  Sora是可根據(jù)文本創(chuàng)建逼真視頻的模型,Open AI網(wǎng)站展示了一個(gè)示例,對(duì)Sora輸入文字“在開(kāi)闊的沙漠中拍攝一群猛犸象的廣闊寧?kù)o鏡頭”,隨后生成的視頻展示了三只猛犸象緩慢穿過(guò)沙丘。

22.gif

  Sora生成的視頻分辨率高達(dá)1080p、最長(zhǎng)20秒,并可以寬屏、豎屏或方形屏形式呈現(xiàn),用戶可以自帶素材進(jìn)行擴(kuò)展、混音和混合,或者更新文本生成全新的內(nèi)容。

  值得注意的是,“中國(guó)Sora”正在快速崛起,如快手可靈視頻生成大模型生成的視頻分辨率最高可達(dá)1080p,時(shí)長(zhǎng)最高可達(dá)2分鐘,提供首尾幀控制、鏡頭控制等功能;字節(jié)跳動(dòng)自研的視頻生成模型Seaweed僅需60秒即能生成時(shí)長(zhǎng)5秒的高質(zhì)量AI視頻;騰訊混元大模型已經(jīng)上線視頻生成能力;Minmax旗下海螺AI新模型可以生成2D 視頻;商湯Vimi只通過(guò)一張人物照片,就能生成一段1分鐘左右的人物視頻;由清華大學(xué)聯(lián)合生數(shù)科技共同研發(fā)Vidu生成一段4秒片段只需30秒……

  不過(guò),從商業(yè)可用的角度來(lái)說(shuō),持續(xù)生成動(dòng)作連貫、風(fēng)格穩(wěn)定、高分辨、長(zhǎng)時(shí)長(zhǎng)的視頻還需要一些時(shí)間。