隨著Sora的出現(xiàn),或?qū)噭右曨l生成領(lǐng)域的風(fēng)云。

OpenAI發(fā)布文生視頻模型Sora

2024-02-16 09:55:56發(fā)布     來源:多知網(wǎng)    作者:哆啦  

  多知網(wǎng)2月16日消息,OpenAI今日發(fā)布文生視頻模型產(chǎn)品Sora。據(jù)官網(wǎng)介紹,Sora是一種人工智能模型,可以根據(jù)文本指令快速創(chuàng)建逼真的60秒視頻,同時保持視覺質(zhì)量并遵守用戶的提示。

  屏幕快照 2024-02-16 上午8.17.44.png

  據(jù)介紹,研發(fā)團隊正在教人工智能理解和模擬運動中的物理世界,目標(biāo)是訓(xùn)練模型,幫助人們解決需要現(xiàn)實世界互動的問題。

  據(jù)介紹,Sora能夠生成具有多個角色、特定類型的動作以及主題和背景細節(jié)精確的復(fù)雜場景。該模型不僅了解用戶在提示中要求什么,還了解這些東西在物理世界中的存在方式。

  Sora對語言有深刻的理解,使其能夠準確地解釋提示,并生成表達充滿活力的情感的引人注目的角色。Sora還可以在一個生成的視頻中創(chuàng)建多個鏡頭,準確地保留角色和視覺風(fēng)格。

  不過,OpenAI也指出,Sora還有進步的空間。目前,它可能難以準確地模擬復(fù)雜場景的物理,也可能無法理解因果關(guān)系的具體實例。例如在Sora生成的視頻里,一個人可能咬了一口餅干,但之后,餅干上可能沒有咬痕。此外,該模型還可能混淆提示的空間細節(jié),例如,混淆左和右,并且可能難以精確描述隨時間發(fā)生的事件,例如跟隨特定的攝像機軌跡。

  OpenAI還授予一個專家團隊訪問權(quán)限,該團隊負責(zé)評估Sora的安全性,然后將其納入公司的產(chǎn)品中。作為推出該產(chǎn)品的準備工作的一部分,OpenAI表示正在開發(fā)工具,以幫助檢測視頻是由Sora生成的。團隊也允許一些視覺藝術(shù)家、設(shè)計師和電影制作人訪問,以獲得關(guān)于如何推進該模型以對創(chuàng)意專業(yè)人士最有幫助的反饋。

  在視頻生成領(lǐng)域,此前已經(jīng)出現(xiàn)了Runway和Pika等知名選手,均可以生成逼真視頻。隨著Sora的出現(xiàn),或?qū)噭右曨l生成領(lǐng)域的風(fēng)云。