Open AI文生視頻模型Sora正式上線，國(guó)產(chǎn)視頻模型走向白熱化

2024-12-10 15:32:45發(fā)布來(lái)源：多知作者：Penny

　　多知12月10日消息，Open AI周一宣布，旗下視頻生成模型Sora正式面向大眾推出，該系統(tǒng)可以根據(jù)文本提示生成逼真的視頻。新版工具Sora Turbo可以生成最長(zhǎng)達(dá)20秒的視頻，并且可以提供這些視頻的多種變體。據(jù)介紹，Sora將在10日開始向美國(guó)及其他市場(chǎng)的ChatGPT付費(fèi)用戶開放。

　　今年2月，Open AI首次推出Sora，這是一種可以根據(jù)文本創(chuàng)建逼真視頻的模型，并分享了我們?cè)谑澜缒M方面的初步研究進(jìn)展。Sora是理解和模擬現(xiàn)實(shí)的人工智能的基礎(chǔ)。這是開發(fā)可以與物理世界交互的模型的重要一步。

　　今年2月的Sora是預(yù)覽模型，只有部分藝術(shù)家、電影制作人和安全測(cè)試人員可以使用。周一，OpenAI發(fā)布了 Sora 的新版本——Sora Turb，它比2月份預(yù)覽的模型快得多，使用人群更多了。

　　Sora是可根據(jù)文本創(chuàng)建逼真視頻的模型，Open AI網(wǎng)站展示了一個(gè)示例，對(duì)Sora輸入文字“在開闊的沙漠中拍攝一群猛犸象的廣闊寧?kù)o鏡頭”，隨后生成的視頻展示了三只猛犸象緩慢穿過沙丘。

　　Sora生成的視頻分辨率高達(dá)1080p、最長(zhǎng)20秒，并可以寬屏、豎屏或方形屏形式呈現(xiàn)，用戶可以自帶素材進(jìn)行擴(kuò)展、混音和混合，或者更新文本生成全新的內(nèi)容。

　　值得注意的是，“中國(guó)Sora”正在快速崛起，如快手可靈視頻生成大模型生成的視頻分辨率最高可達(dá)1080p，時(shí)長(zhǎng)最高可達(dá)2分鐘，提供首尾幀控制、鏡頭控制等功能;字節(jié)跳動(dòng)自研的視頻生成模型Seaweed僅需60秒即能生成時(shí)長(zhǎng)5秒的高質(zhì)量AI視頻;騰訊混元大模型已經(jīng)上線視頻生成能力;Minmax旗下海螺AI新模型可以生成2D 視頻;商湯Vimi只通過一張人物照片，就能生成一段1分鐘左右的人物視頻;由清華大學(xué)聯(lián)合生數(shù)科技共同研發(fā)Vidu生成一段4秒片段只需30秒……

　　不過，從商業(yè)可用的角度來(lái)說，持續(xù)生成動(dòng)作連貫、風(fēng)格穩(wěn)定、高分辨、長(zhǎng)時(shí)長(zhǎng)的視頻還需要一些時(shí)間。

商學(xué)院

Open Talk

Open AI文生視頻模型Sora正式上線，國(guó)產(chǎn)視頻模型走向白熱化

相關(guān)閱讀