OpenAI首個文生視頻模型Sora發布!可生成60秒一鏡到底視頻 做視頻的都要失業了嗎
快科技2月17日消息,一句話就能生成長達1分鐘的高清視頻,OpenAI實現了。
日前,打造ChatGPT的開放人工智能公司OpenAI發布了首個文生視頻模型Sora。
該模型可以根據用戶輸入的指令,生成長達1分鐘的高清視頻,也能通過現有的靜態圖像生成視頻,還能對現有視頻進行擴展、填充缺失內容。
據介紹,該模型能生成包含多個角色,以及特定類型運動的復雜場景,能精確生成物體和背景的細節。
在官網上已經更新了48個視頻實例中,Sora能夠準確呈現視頻細節,還能深刻理解物體在現實世界中的存在狀態,并生成具有豐富情感的角色。
比如,在一段視頻中,鏡頭從俯視白雪覆蓋的東京,慢慢推進到兩個行人在街道上手牽手行走,街旁的櫻花樹和攤位的畫面均細致呈現。
當然,目前的Sora模型依然存在缺陷,比如它可能難以精準模擬復雜場景的物理狀況,也能無法理解一些特定的因果和時間聯系等。
舉個例子,視頻中的人物可能會咬一口餅干,但餅干上可能看不到明顯的咬痕。
在處理空間細節,比如分辨左右時,Sora也可能會出現混淆;在精確描述一段時間內發生的事件,如特定的攝影機移動軌跡時,也可能顯得力不從心。
目前,該模型僅向有限數量的創作者提供訪問權限。
Sora發布后,不少分析認為,這將對于廣告業、電影預告片、短視頻行業帶來巨大的顛覆,不少視頻從業者或將失業。
不過,也有業內人士認為,短期內較難帶來顛覆性影響。
據報道,前百度產品委員會主席宋健表示:Sora確實很牛,但如果認為三年后就沒人拍視頻了,抖音Tiktok會被很快顛覆,那還是為時過早。
360集團創始人周鴻祎也表示,今天Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆,但速度不一定那么快。
“AI不一定那么快顛覆所有行業,但它能激發更多人的創作力。很多人談到Sora對影視工業的打擊,我倒不覺得是這樣,因為機器能生產一個好視頻,但視頻的主題、腳本和分鏡頭策劃、臺詞的配合,都需要人的創意至少需要人給提示詞。一個視頻或者電影是由無數個60秒組成的。今天Sora可能給廣告業、電影預告片、短視頻行業帶來巨大的顛覆,但它不一定那么快擊敗TikTok,更可能成為TikTok的創作工具。”
周鴻祎認為,大語言模型的厲害之處在于,能完整地理解這個世界的知識。而此前所有的文生圖、文生視頻都是在2D平面上對圖形元素進行操作,并沒有適用物理定律。
“這次很多人從技術上、從產品體驗上分析Sora,強調它能輸出60秒視頻,保持多鏡頭的一致性,模擬自然世界和物理規律,實際這些都比較表象。最重要的是Sora的技術思路完全不一樣。Sora產生的視頻里,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況。”
周鴻祎預測,Sora的出現,或意味著AGI(通用人工智能)實現將從10年縮短到1年。
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com