僅用13天!OpenAI機(jī)器人驚艷面世 能對(duì)話、能思考、會(huì)學(xué)習(xí)
財(cái)聯(lián)社3月14日訊(編輯 劉蕊)美東時(shí)間周三,半個(gè)硅谷都在投資的“機(jī)器人界OpenAI”、明星初創(chuàng)公司Figure發(fā)布了自己第一個(gè)OpenAI大模型加持的機(jī)器人demo。
僅僅是一個(gè)視頻,就驚艷了全球科技界。
而更讓人驚嘆的是,此時(shí)距離Figure宣布和OpenAI在AI人形機(jī)器人領(lǐng)域合作才剛剛過(guò)去13天。
Figure3月初宣布,其已從亞馬遜創(chuàng)始人貝索斯、英偉達(dá)、OpenAI和微軟等巨頭那里籌集了約6.75億美元的資金,使其公司估值達(dá)到了26億美元。
首個(gè)OpenAI機(jī)器人來(lái)了!
在Figure發(fā)布的視頻里顯示,機(jī)器人Figure 01可以聽(tīng)懂人類的命令和提問(wèn),動(dòng)作流暢且有邏輯地遞給人類蘋(píng)果、將垃圾收拾進(jìn)框子里、將杯子和盤(pán)子歸置放在瀝水架上。
而最重點(diǎn)的是,F(xiàn)igure 01的很多舉動(dòng)和回答是根據(jù)提問(wèn)者的一些開(kāi)放性問(wèn)題和要求,基于邏輯思考而得出的——這意味著它能對(duì)話、能思考、能學(xué)習(xí),比一般的機(jī)器人更“像人”。
視頻開(kāi)頭強(qiáng)調(diào),這個(gè)機(jī)器人的行為都是基于語(yǔ)音的邏輯推理,使用端對(duì)端神經(jīng)網(wǎng)絡(luò),且視頻全程1倍速,沒(méi)有經(jīng)過(guò)加速。
接下來(lái),正片開(kāi)始,提問(wèn)者開(kāi)始在視頻中給Figure 01提出多個(gè)問(wèn)題和要求,且難度越來(lái)越高。
當(dāng)一開(kāi)始被問(wèn)到“Figure 01,你現(xiàn)在能看到什么?”時(shí),F(xiàn)igure 01給出了準(zhǔn)確的回答:“我看到一個(gè)桌子中間有個(gè)紅蘋(píng)果,一個(gè)瀝水籃和一些杯子和盤(pán)子,還有你站在桌子旁,手放在桌子上?!?/strong>
提問(wèn)者接著問(wèn)道:“我有什么能吃的嗎?”Figure 01動(dòng)作流暢地把紅蘋(píng)果遞給了提問(wèn)者。
接下來(lái),提問(wèn)者往桌上倒了幾個(gè)黑色塑料袋團(tuán),并給出了更高難度的要求:“你能一邊解釋你剛剛為什么這么做,一邊把垃圾收起來(lái)嗎?”
Figure 01繼續(xù)做出了完美的反應(yīng):他一邊動(dòng)作流暢地將塑料袋團(tuán)收到籃子里,一邊回答道:“我剛剛給了你個(gè)蘋(píng)果,因?yàn)檫@是桌子上唯一能吃的東西。”
接著提問(wèn)者給出了更開(kāi)放性的問(wèn)題:“你看看你現(xiàn)在面前的場(chǎng)景,你覺(jué)得你面前的盤(pán)子該去哪?”
Figure 01基于人類常識(shí)作出了回答:“盤(pán)子和杯子可能該放在瀝水籃里?!比缓笤谔釂?wèn)者的下一句要求“那你把它們能放到那邊去嗎?”后,準(zhǔn)確的將杯子和盤(pán)子放進(jìn)了瀝水籃。
值得注意的是,提問(wèn)者提出的“那你能把它們放到那邊去嗎(Can you put them there)?”并沒(méi)有準(zhǔn)確的提出“杯子”“盤(pán)子”和“瀝水籃”等關(guān)鍵詞,而是只用代稱,這表明Figure 01有聯(lián)系上下文思考和記憶的能力。
提問(wèn)者最后讓Figure 01對(duì)自己的表現(xiàn)給出評(píng)價(jià):“你覺(jué)得自己做得怎么樣?”Figure 01回答:“我覺(jué)得我做得很好。蘋(píng)果找到了新主人,垃圾都被扔掉了,餐具也放到了該放的地方?!?/p>
OpenAI所提供的超強(qiáng)大腦
盡管視頻只有短短2分鐘,但其包含的信息量卻巨大:這個(gè)名為Figure 01的機(jī)器人已經(jīng)可以完全與人類流暢對(duì)話,理解人類的自然語(yǔ)言指令和意圖并進(jìn)行動(dòng)作,同時(shí)解釋原因。它甚至可以對(duì)自身行為做出主觀的評(píng)價(jià)。
這在這背后提供支持的,就是OpenAI所提供的“大腦”。
就在3月1日,,F(xiàn)igure才剛剛宣布將與OpenAI合作,開(kāi)發(fā)下一代人形機(jī)器人的AI模型。Figure將基于OpenAI最新的GPT模型開(kāi)發(fā)AI模型,并專門(mén)訓(xùn)練Figure收集的機(jī)器人動(dòng)作數(shù)據(jù),以便其人形機(jī)器人可以與人交談,看到東西并執(zhí)行復(fù)雜任務(wù)。
而才剛剛過(guò)去13天,這個(gè)具備人工智能的人形機(jī)器人便火速面世并驚艷科技圈——AI模型的成長(zhǎng)速度真的令人震撼。
在視頻發(fā)布后,創(chuàng)建Figure 01的高級(jí)AI工程師(也是視頻中出鏡的提問(wèn)人)科里·林奇(Corey Lynch)對(duì)Figure 01的表現(xiàn)作出了更多的解釋。
“我們的機(jī)器人可以描述它的視覺(jué)體驗(yàn),計(jì)劃未來(lái)的行動(dòng),反思它的記憶,并口頭解釋它的推理,”他在X上寫(xiě)道。
根據(jù)林奇的說(shuō)法,他們從機(jī)器人的攝像頭中輸入圖像,并將麥克風(fēng)捕獲的語(yǔ)音文本轉(zhuǎn)錄到OpenAI訓(xùn)練的大型多模式模型中。
林奇強(qiáng)調(diào),F(xiàn)igure 01的行為都是通過(guò)學(xué)習(xí)而習(xí)得的,絕不是遠(yuǎn)程控制。
根據(jù)官網(wǎng)介紹,F(xiàn)igure 01機(jī)器人身高5英尺6英寸(約1.67米),體重60公斤,可載重20公斤,續(xù)航5小時(shí),前進(jìn)速度1.2米/秒。
在OpenAI的技術(shù)支持下,F(xiàn)igure 01僅用13天就能完成這樣令人驚艷的學(xué)習(xí)和思考能力。這不禁讓人期待,在未來(lái),更加“聰明”的機(jī)器人恐怕會(huì)比我們想象的更早到來(lái)。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com