Sora年內將向公眾推出!OpenAI首席技術官最新透露這些“干貨”
財聯社3月14日訊(編輯 瀟湘)OpenAI首席技術官米拉·穆拉蒂(Mira Murati)近期在接受媒體采訪時透露,OpenAI人工智能文生視頻大模型Sora即將于今年晚些時候正式向公眾發布,OpenAI計劃最終加入音頻功能,以使場景更為真實,同時還將允許用戶編輯Sora生成的視頻內容。
盡管眼下距離Sora正式對外發布尚有一段時日,但OpenAI已經向世人揭示了這款工具的巨大潛力——僅需幾句精心設計的提示語,Sora便可創造出幾乎足以替代許多視頻制作專業人員的出色作品。與市面上那些時長短暫、分辨率低下的AI視頻作品相比,Sora的視頻看起來就像是紀錄片或電影中的夢幻場景。
而Murati也在最新采訪中,向外界介紹了Sora究竟是如何通過簡單的提示文本,完成這些美輪美奐的視頻制作的,她還詳細介紹了Sora眼下存在的一些不足,以及接下來會著重防范和改進的地方……
Sora如何“化文字為神奇”?
請你想象一幕場景:“一條美人魚和她的螃蟹伙伴,正在一起瀏覽智能手機……”
作為這場媒體采訪的“福利”,主持人獲得了讓Sora將其提供的多組文本提示,轉化為視頻圖像的機會,而以上的這一幕,便是Sora提供的視頻中的一幀。
Sora究竟是如何實現這一轉換的呢?Murati表示,盡管解釋美人魚的進化可能都要比解釋“擴散模型”(diffusion models)的內部運作容易得多,但簡而言之便是:人工智能模型分析了大量視頻,學會了識別物體和動作。然后,當你給它一個文字提示時,它就會勾勒出整個場景,然后填充每一幀。
行業觀察家和OpenAI的競爭對手——Runway首席執行官Cristóbal Valenzuela等業內人士,將這些卓越的成果歸功于OpenAI強大的計算能力和訓練數據。
不過,OpenAI最近也面臨著版權侵權訴訟:指控這家人工智能初創公司未經許可擅自獲取內容來訓練ChatGPT。
在被問及OpenAI為Sora使用了哪些訓練數據時,Murati指出,“我們使用了公開數據和授權數據”。當主持人繼續深入問及這是否包括來自YouTube、Instagram和Facebook的視頻時,Murati最初表示她并不清楚具體細節,但后來確認,已獲授權的材料涵蓋了來自知名版權圖片網站Shutterstock上的內容,而OpenAI與Shutterstock有著合作關系。
Murati認為,對于用戶來說,人工智能模型就像是一個神秘的黑盒子——人們知道輸入的提示語和輸出的內容,但并不了解中間的步驟。因此,人們可能永遠不會知道為什么最終生成的內容會是這樣的——例如上面這張視頻截圖里,美人魚的螃蟹伙伴留著胡子,就像海綿寶寶的朋友蟹老板。巧合嗎?也許吧……
未來視頻將支持配備音效
在另外一段視頻里,主持人要求Sora制作一段她更為符合這場采訪的內容:“兩位30多歲、有著棕色頭發的職業女性,在一個光線充足的演播室里坐下來接受新聞采訪。”
最終,在Sora交出的“作業”里,無論是兩位女性嘴型和頭發的動捕,還是皮夾克上的細節,一切看起來都那么真實。Murati指出,這段20秒的720p分辨率短片,Sora花了幾分鐘才制作完成,但目前還未能支持配備音效。
但Murati已承諾,他們計劃最終會添加聲音。
Murati還表示,當前Sora生成視頻的成本遠高于該公司的圖像生成器Dall-E。不過,在未來向公眾正式發布時,OpenAI將進行優化,以降低對算力的需求。
難以忽視的瑕疵
當然,不容忽視的是,在如今Sora才剛剛問世的早期階段,其生成的內容中還存在一些極為明顯的瑕疵。
以上述Sora制作的采訪視頻為例,雖然整體的畫面呈現效果頗為令人驚嘆,但細節上還是不難發現問題——在某幾幀畫面里,淺色頭發的女人的一只手上似乎長出了10根手指。
Murati對此解釋稱,“要準確呈現手部動作真的很難。”
在另一個視頻中,主持人要求看到一個機器人從電影制片人手中奪走攝像機。
而Sora對此的詮釋是——人類電影制片人直接變形成為了機器人。此外,在背景中的一輛黃色出租車,也在機器人“奪舍”的過程中變成了一輛銀色轎車。
Murati對此點評稱,Sora“在維持連貫性方面表現尚可,但并不完美”。
未來如何分辨虛擬與現實?
毫無疑問,眼下的Sora還有著各種各樣的不足。但如果未來某一天,這些問題全都消失了,人們或許也將面臨一個新困擾:該如何區分真實視頻和人工智能生成的視頻?
Murati表示,未來Sora生成的每個視頻下方都會有一個水印。這些視頻最終也將包含元數據,以標明它們的來源。
此外,OpenAI還將有一個Red Teaming安全測試團隊,安全測試人員會嘗試向Sora發出提示,以找出漏洞、偏差和其他有害結果。
Murati指出,“這就是我們實際上還沒有部署該系統的原因。我們需要搞清楚這些問題,然后才能放心地廣泛部署。”
此外,Sora的提示限制政策可能也會沿用Dall-E的政策。例如,人們無法用Sora生成公眾人物的圖像——當要求其生成“美國現任總統的電視新聞畫面”時,Sora會拒絕這一請求。
親手制作好萊塢大片不是夢?
隨著Sora在過去一個月的驚艷亮相,這一令所有人耳目一新的產品,對于一些傳統行業的沖擊無疑也是巨大的,而最直接影響的,或許便是曾長期經久不衰的美國好萊塢。
著名電影制片人Tyler Perry在看到Sora的潛力后,就于近期宣布將暫停耗資8億美元的工作室擴建計劃。他認為這項AIGC技術能夠削減布景和外景拍攝的成本,但也令人對電影行業的未來抱有擔憂。
而當主持人向Murati詢問Sora對視頻制作工作的影響時,她也再次重申了OpenAI目前采取的緩步審慎策略,并表示OpenAI正在與行業內部人士合作,進行早期的測試和反饋征集。
正如主持人在讓Sora制造的另一段視頻中所呈現的那樣——如果將OpenAI比作是瓷器店里的公牛,那么它現在可能正在輕裝上陣。但不可避免的是,它將開始砸壞那些原本安放著的盤子……
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com
下一篇:高校放7天春假:鼓勵學生賞花戀愛