久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當(dāng)前的位置: 首頁 > 新聞 > 其他

OpenAI文生視頻大模型深度揭秘:真正遙遙領(lǐng)先 無可追趕

來源:差評   編輯:非小米 時間:2024-02-17 18:42人閱讀

近日,OpenAI 發(fā)布了新的文生視頻大模型,名為 “ Sora ”。

Sora 模型可以生成最長 60 秒的高清視頻,生成的畫面可以很好的展現(xiàn)場景中的光影關(guān)系、各個物體間的物理遮擋、碰撞關(guān)系,并且鏡頭絲滑可變。

相信大家已經(jīng)在朋友圈看到了非常多的文章在展示 OpenAI 的官方演示視頻,下面,我們想重點探討為何 Sora 模型的效果看起來遠(yuǎn)超市面上我們見過的其他文生視頻模型,他們都做了什么?

以防您沒看到,我們放幾個示例:

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕

示例視頻的生成提示詞為:

一位時尚的女人走在東京的街道上,街道上到處都是溫暖的發(fā)光霓虹燈和動畫城市標(biāo)志。她身穿黑色皮夾克,紅色長裙,黑色靴子,背著一個黑色錢包。她戴著墨鏡,涂著紅色口紅。她自信而隨意地走路。街道潮濕而反光,營造出五顏六色的燈光的鏡面效果。許多行人四處走動。

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕

AI想象中的龍年春節(jié),紅旗招展人山人海,有緊跟舞龍隊伍抬頭好奇觀望的兒童,還有不少人掏出手機(jī)邊跟邊拍,海量人物角色各有各的行為。

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕

一名年約三十的宇航員戴著紅色針織摩托頭盔展開冒險之旅,電影預(yù)告片呈現(xiàn)其穿梭于藍(lán)天白云與鹽湖沙漠之間的精彩瞬間,獨特的電影風(fēng)格、采用35毫米膠片拍攝,色彩鮮艷。

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕

豎屏超近景視角下,這只蜥蜴細(xì)節(jié)拉滿。

首先,在文生視頻領(lǐng)域,比較成熟的模型思路有循環(huán)網(wǎng)絡(luò)( RNN )、生成對抗網(wǎng)絡(luò)( GAN )和擴(kuò)散模型( Diffusion models ),而本次OpenAI 推出的 Sora 則是一種擴(kuò)散模型。

雖然 GAN 模型之前一直很火,但圖像和視頻生成相關(guān)的領(lǐng)域,現(xiàn)在處于被擴(kuò)散模型統(tǒng)治的階段。

因為擴(kuò)散模型是有非常卓越的優(yōu)越性的,相較于 GAN,擴(kuò)散模型的生成多樣性和訓(xùn)練穩(wěn)定性都要更好。

最重要的是,擴(kuò)散模型在圖片和視頻生成上有更高的天花板,因為 GAN 模型從原理上來看本質(zhì)上是機(jī)器對人的模仿,而擴(kuò)散模型則更像是機(jī)器學(xué)會了 “ 成為一個人 ”。

這么說或許有些抽象,我們換一個不嚴(yán)謹(jǐn)?shù)ㄋ缀美斫獾睦樱?/p>

GAN 模型像是一個勤奮的畫家,但不太受控制,因為畫家( 生成器 )一邊不停對著先作( 訓(xùn)練源 )畫畫,然后另一邊老師( 判別器 )也不停打分。

就在大戰(zhàn)無數(shù)個回合之后,畫家和老師瘋狂升級進(jìn)步,最后直到畫家畫出逼真的畫。

但整個過程不太好控制,經(jīng)常練著練著就走火入魔,輸出一些誰也看不懂的玩意兒。

同時,他的提升過程本質(zhì)上是對先作的不斷模仿,所以他還缺乏創(chuàng)造力,導(dǎo)致天花板也潛在會比較低。

擴(kuò)散模型,則是一個勤奮且聰明的畫家,他并不是機(jī)械的仿作,而是在學(xué)習(xí)大量先作的時候,他學(xué)會了圖像內(nèi)涵與圖像之間的關(guān)系,他大概知道了圖像上的 “ 美 ” 應(yīng)該是什么樣,圖像的某種 “ 風(fēng)格 ” 應(yīng)該是什么樣,他更像是在思考,他是比 GAN 更有前途的畫家。

也就是說,OpenAI 選擇擴(kuò)散模型這個范式來創(chuàng)造文生視頻模型,在當(dāng)下屬于開了個好頭,選擇了一個有潛力的畫家來培養(yǎng)。

那么,另一個疑問就出現(xiàn)了,由于大家都知道擴(kuò)散模型的優(yōu)越性,除了 OpenAI 以外,同樣在做擴(kuò)散模型的還有很多友商,為什么 OpenAI 的看起來更驚艷?

因為 OpenAI 有這樣一個思維:我曾經(jīng)在大語言模型上獲得了非常好的效果、獲得了如此巨大的成功,那我有沒有可能參考這個經(jīng)驗獲得一次新的成功呢?

答案是可以。

OpenAI 認(rèn)為,之前在大語言模型上的成功,得益于 Token( 可以翻譯成令牌、標(biāo)記、詞元都可,翻譯為詞元會更好理解一些 ),Token 可以優(yōu)雅的把代碼、數(shù)學(xué)以及各種不同的自然語言進(jìn)行統(tǒng)一,進(jìn)而方便規(guī)模巨大的訓(xùn)練。

于是,他們創(chuàng)造了對應(yīng) Token 的 “ Patch ” 概念( 塊,如果 Token 翻譯為詞元理解的話,Patch 或許可以被我們翻譯為 “ 圖塊 ” )用于訓(xùn)練 Sora 這個視頻模型。

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕

實際上,在大語言模型中,Token 的應(yīng)用之所以會如此成功,還得益于 Transformer 架構(gòu),他與 Token 是搭配著來的,所以 Sora 作為一個視頻生成擴(kuò)散模型,區(qū)別于主流視頻生成擴(kuò)散模型采用了 Transformer 架構(gòu)。( 主流視頻生成擴(kuò)散模型較多采用 U-Net 架構(gòu) )

也就是說,OpenAI 贏在了經(jīng)驗與技術(shù)路線的選擇上。

但是,Transformer 架構(gòu)這個 “ 成功密碼 ”人盡皆知,在文字、圖像生成上已經(jīng)成為了主流,為什么別人沒想著在視頻生成上用,OpenAI 就用了呢?

這源自另外一個問題:Transformer 架構(gòu)中全注意力機(jī)制的內(nèi)存需求會隨著輸入序列長度而二次方增長,所以處理視頻這樣的高維信號時,計算成本會非常非常高。

通俗點說,就是雖然用了 Transformer 效果會好,但所需的計算資源也是非常恐怖的,這么做不是很經(jīng)濟(jì)。

當(dāng)然,OpenAI 雖然拿各種融資拿到手軟,但也依然沒那么財大氣粗,所以他們并沒有直接猛砸資源,而是想了另外一種方式來解決計算成本高昂的問題。

這里我們要先引入 “ latent ” ( 潛 )這一概念,它是一種 “ 降維 ” 或者說是 “ 壓縮 ”,意在用更少的信息去表達(dá)信息的本質(zhì)。我們列舉一個不恰當(dāng)?shù)美斫獾睦樱@就好像我們用一個三視圖就能保存記錄一個簡單的立體物體的結(jié)構(gòu),而非一定要保存這個立體本身。

OpenAI 為此開發(fā)了一個視頻壓縮網(wǎng)絡(luò),把視頻先降維到潛空間,然后再去拿這些壓縮過的視頻數(shù)據(jù)去生成 Patch ,這樣就能使輸入的信息變少,有效減小 Transformer 架構(gòu)帶來的計算量壓力。

如此一來,大部分問題就都解決了,OpenAI 成功地把文生視頻模型套進(jìn)了其在過去取得巨大成功的大語言模型的范式里,所以效果想不好都難。

除此之外,OpenAI 在訓(xùn)練上的路線選擇也稍有不同。

他們選擇了 “ 原始尺寸、時長 ” 訓(xùn)練,而非業(yè)內(nèi)常用的 “ 把視頻截取成預(yù)設(shè)標(biāo)準(zhǔn)尺寸、時長 ” 后再訓(xùn)練。

這樣的訓(xùn)練給 Sora 帶來了諸多好處:

①生成的視頻能更好地自定義時長;

②生成的視頻能夠更好地自定義視頻尺寸;

③視頻會有更好的取景和構(gòu)圖;

前兩點很好理解,第三點 OpenAI 給出了范例,他們做了一個截取尺寸視頻訓(xùn)練和原始尺寸視頻訓(xùn)練的模型對比:

OpenAI文生視頻大模型深度揭秘:真正也遙遙領(lǐng)先 無可追趕
左側(cè)為截取尺寸視頻訓(xùn)練后模型生成的視頻,右側(cè)為原始尺寸視頻訓(xùn)練后模型生成的視頻

另外,為了文生視頻能夠更好地理解用戶的意圖,達(dá)到更好的生成效果,OpenAI 也在 Sora 模型上加入了一些巧思。

首先,訓(xùn)練 Sora 這樣的文生視頻模型,需要大量含有文本說明的視頻素材,所以 OpenAI 利用自家 DALL·E 3 的 re-captioning 功能,給訓(xùn)練用的視頻素材都加上了高質(zhì)量文本描述,他們表示這樣可以提高輸出視頻的整體質(zhì)量。

除了訓(xùn)練端,在輸入端他們也動了腦筋,用戶輸入的提示詞并非直接交給 Sora 進(jìn)行生成的,OpenAI 利用了 GPT 的能力,在用戶給 Sora 輸入提示詞的時候,GPT 會先將用戶輸入的提示詞進(jìn)行精準(zhǔn)的詳盡擴(kuò)寫,然后再將擴(kuò)寫后的提示詞交給 Sora,這樣能更好地讓 Sora 遵循提示詞來生成更精準(zhǔn)的視頻。

好了,到這里,我們對 Sora 模型為什么看起來更強(qiáng)的簡要解析就結(jié)束了。

從整體來看,你會發(fā)現(xiàn) Sora 模型的成功并非偶然,他能有如此驚艷的效果,全都得益于 OpenAI 過去的工作,包括 GPT、DALL·E 等,有些是直接調(diào)用,有些是借用了思路。

或許我們可以說,OpenAI 自己先成為了一個巨人,然后再站在自己這個巨人的肩膀上,成為了一個新的巨人。

而相對應(yīng)的是,無論國內(nèi)還是國外的其他競爭對手,或許會因為文生文、文生圖上的技術(shù)差,在未來被甩的更遠(yuǎn)。

所謂 “ 彎道超車 ”、“ 差距只有 X 個月 ”,或許是不存在的,只是自我安慰。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 視頻 OpenAI

相關(guān)文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
久久综合久久综合久久综合| 国产在线精品自拍| 国产无一区二区| 可以免费看不卡的av网站| 久久亚洲一区二区三区四区| 国产一区久久久| 亚洲大胆视频| 亚洲国产黄色片| 欧美日韩一区二区三区视频| 99国产精品99久久久久久| 久久久久久免费| 欧美视频免费在线观看| 亚洲国产婷婷| 亚洲欧洲综合另类在线| 国产欧美日韩麻豆91| 久久理论片午夜琪琪电影网| 免费成人你懂的| 欧美专区在线观看| 欧美大片在线看| 久久久亚洲国产美女国产盗摄| 国内精品视频一区| 久久aⅴ国产欧美74aaa| 亚洲激情午夜| 午夜激情亚洲| 麻豆国产精品va在线观看不卡| 亚洲欧美视频在线| 91久久精品日日躁夜夜躁欧美| 欧美影院久久久| 亚洲欧美激情四射在线日 | 欧美日韩精品欧美日韩精品| 久久最新视频| 韩日欧美一区二区| 亚洲电影毛片| 亚洲国产一区二区三区高清| 亚洲欧美综合精品久久成人| 欧美日韩免费观看一区=区三区 | 国产欧美日韩精品一区| 亚洲精品久久嫩草网站秘色| 亚洲一区二区av电影| 亚洲一区欧美一区| 国产一区二区三区网站| 免费久久精品视频| 亚洲一区二区三区四区中文 | 99精品国产在热久久婷婷| 欧美伊人久久| 一区二区av在线| 久久米奇亚洲| 亚洲天堂网在线观看| 蜜臀va亚洲va欧美va天堂| 一本色道久久综合亚洲二区三区| 亚洲美女尤物影院| 亚洲一区在线直播| 一区二区欧美在线观看| 亚洲国产一区二区三区在线播| 一本在线高清不卡dvd| 欧美11—12娇小xxxx| 久久成人综合视频| 小嫩嫩精品导航| 欧美一级淫片播放口| 亚洲免费在线视频| 亚洲免费av电影| 亚洲另类视频| 在线综合亚洲| 欧美日韩蜜桃| 久久久www成人免费无遮挡大片 | 欧美精品日韩综合在线| 久久在线91| 欧美精品91| 欧美日韩人人澡狠狠躁视频| 欧美日韩视频专区在线播放| 欧美日韩午夜精品| 国产精品入口尤物| 一区二区三区在线免费视频| 亚洲精品欧美在线| 欧美一区二区视频在线观看| 久久成人在线| 亚洲国产综合视频在线观看 | 欧美亚州在线观看| 国产午夜精品视频| 亚洲精选在线| 久久久久久电影| 国产精品成人aaaaa网站| 国产亚洲欧美一区| 亚洲国产精品久久精品怡红院| 亚洲中字黄色| 欧美国产精品久久| 一区二区三区www| 久久久噜噜噜久久中文字幕色伊伊 | 亚洲欧美激情在线视频| 欧美不卡视频一区| 亚洲性夜色噜噜噜7777| 老司机成人在线视频| 午夜国产精品视频免费体验区| 欧美国产大片| 亚洲日本欧美| 欧美mv日韩mv国产网站app| 亚洲在线观看免费视频| 欧美激情1区2区| 日韩小视频在线观看| 欧美国产国产综合| 猛男gaygay欧美视频| 亚洲成色www8888| 噜噜爱69成人精品| 狠狠色丁香婷综合久久| 国产欧美一区二区三区国产幕精品| 亚洲免费影视第一页| 亚洲欧美激情诱惑| 国产精品夜夜夜一区二区三区尤| 亚洲一级黄色av| 亚洲男同1069视频| 激情成人在线视频| 亚洲国产成人porn| 欧美日韩国产综合新一区| 亚洲欧美视频一区二区三区| 亚洲一区二区三区四区视频 | 久久久xxx| 欧美成人精品不卡视频在线观看| 亚洲精品三级| 亚洲免费在线观看视频| 影音先锋亚洲电影| 亚洲精品国产精品久久清纯直播 | 亚洲人体影院| 亚洲欧美第一页| 亚洲精品免费在线| 欧美一级在线视频| 一区二区三区免费在线观看| 久久精品欧洲| 久久精品日产第一区二区| 欧美国产综合| 久久综合精品国产一区二区三区| 欧美大尺度在线观看| 国产精品永久免费视频| 亚洲国产高潮在线观看| 国产日韩精品一区二区三区| 亚洲肉体裸体xxxx137| 亚洲日本欧美| 男女精品网站| 欧美不卡一卡二卡免费版| 尤物99国产成人精品视频| 欧美一区二区三区四区视频| 午夜精品久久久久久久99水蜜桃| 欧美日本不卡| 亚洲欧美日本另类| 久久伊人免费视频| 亚洲黄色在线| 国产精品草草| 久久免费视频在线| 91久久综合亚洲鲁鲁五月天| 亚洲一区二区成人在线观看| 国产精品女同互慰在线看| 亚洲自拍电影| 美女精品在线| 中文在线不卡视频| 国产精品嫩草影院一区二区| 性欧美xxxx大乳国产app| 欧美v亚洲v综合ⅴ国产v| 夜夜精品视频一区二区| 国产精品嫩草99a| 久久一区二区三区国产精品 | 欧美日韩精品伦理作品在线免费观看| 亚洲美女黄色| 久久这里有精品15一区二区三区| 亚洲黄色在线观看| 国产麻豆日韩| 欧美日韩日本视频| 久久在线播放| 欧美在线关看| 亚洲在线视频网站| 日韩视频欧美视频| 欧美成人精品在线观看| 亚洲免费影院| 亚洲综合不卡| 日韩小视频在线观看专区| 国产一区二区欧美日韩| 国产精品入口尤物| 国产精品成人免费| 欧美精品久久久久久久免费观看| 久久久久久久久久久成人| 欧美中文字幕在线观看| 欧美一区二区三区成人| 亚洲一区二区三区欧美| 亚洲一级高清| 欧美亚洲综合网| 久久国产免费| 欧美sm视频| 亚洲精品一二三区| 亚洲无毛电影| 久久免费视频网站| 欧美精品三区| 国产亚洲二区| 影音先锋日韩有码| 妖精视频成人观看www| 亚洲色图在线视频| 中文日韩在线| 亚洲国产视频a| 一区二区三区久久精品| 亚洲欧美日韩国产成人精品影院| 亚洲午夜av电影| 在线一区日本视频| 亚洲欧美日韩另类|