OpenAI發(fā)布文生視頻模型Sora

2024-02-16 09:55:56發(fā)布來源：多知網(wǎng) 作者：哆啦

　　多知網(wǎng)2月16日消息，OpenAI今日發(fā)布文生視頻模型產(chǎn)品Sora。據(jù)官網(wǎng)介紹，Sora是一種人工智能模型，可以根據(jù)文本指令快速創(chuàng)建逼真的60秒視頻，同時保持視覺質(zhì)量并遵守用戶的提示。

　　屏幕快照 2024-02-16 上午8.17.44.png

　　據(jù)介紹，研發(fā)團隊正在教人工智能理解和模擬運動中的物理世界，目標是訓練模型，幫助人們解決需要現(xiàn)實世界互動的問題。

　　據(jù)介紹，Sora能夠生成具有多個角色、特定類型的動作以及主題和背景細節(jié)精確的復雜場景。該模型不僅了解用戶在提示中要求什么，還了解這些東西在物理世界中的存在方式。

　　Sora對語言有深刻的理解，使其能夠準確地解釋提示，并生成表達充滿活力的情感的引人注目的角色。Sora還可以在一個生成的視頻中創(chuàng)建多個鏡頭，準確地保留角色和視覺風格。

　　不過，OpenAI也指出，Sora還有進步的空間。目前，它可能難以準確地模擬復雜場景的物理，也可能無法理解因果關(guān)系的具體實例。例如在Sora生成的視頻里，一個人可能咬了一口餅干，但之后，餅干上可能沒有咬痕。此外，該模型還可能混淆提示的空間細節(jié)，例如，混淆左和右，并且可能難以精確描述隨時間發(fā)生的事件，例如跟隨特定的攝像機軌跡。

　　OpenAI還授予一個專家團隊訪問權(quán)限，該團隊負責評估Sora的安全性，然后將其納入公司的產(chǎn)品中。作為推出該產(chǎn)品的準備工作的一部分，OpenAI表示正在開發(fā)工具，以幫助檢測視頻是由Sora生成的。團隊也允許一些視覺藝術(shù)家、設(shè)計師和電影制作人訪問，以獲得關(guān)于如何推進該模型以對創(chuàng)意專業(yè)人士最有幫助的反饋。

　　在視頻生成領(lǐng)域，此前已經(jīng)出現(xiàn)了Runway和Pika等知名選手，均可以生成逼真視頻。隨著Sora的出現(xiàn)，或?qū)噭右曨l生成領(lǐng)域的風云。

商學院

Open Talk

OpenAI發(fā)布文生視頻模型Sora

相關(guān)閱讀