特斯拉FSD V12在美推送!AI算法黑箱端到端控制:摒棄人類規(guī)則程序
特斯拉FSD V12,普通車主也能用了。
特斯拉FSD V12在美推送,不只是特斯拉內(nèi)部員工,普通車主也有機(jī)會(huì)體驗(yàn)端到端自動(dòng)駕駛了,告別傳統(tǒng)的規(guī)則驅(qū)動(dòng),駕駛決策交由AI算法生成。
盡管FSD V12的更新稱得上是“飛躍”,然而實(shí)測(cè)視頻,仍帶有Beta后綴的Version 12還稱不上是“終極答案”。
特斯拉FSD V12在美推送
FSD V12 Beta在美推送,不依賴激光雷達(dá),數(shù)據(jù)驅(qū)動(dòng)AI算法,媒體演示視頻可應(yīng)對(duì)大多場(chǎng)景。
雨夜無(wú)保護(hù)上坡后左轉(zhuǎn):
等待小朋友過(guò)完馬路再走:
馬路靠邊側(cè)方停車:
避讓前方車輛突然剎停:
總體來(lái)看,純視覺(jué)的FSD V12 Beta的能力得到很大提升,針對(duì)不規(guī)則障礙物等的識(shí)別很準(zhǔn)確,一些細(xì)節(jié)也還原的很好。
程序兼容性也提高,這次不僅推送給了原來(lái)的HW3.0硬件方案,HW4.0也收到了推送。
但是仍然存在不足,比如不依賴激光雷達(dá),目前純視覺(jué)方案在惡劣天氣下的表現(xiàn)不夠好。
首批測(cè)試的博主稱,在大雨天氣下測(cè)試FSD V12 Beta多次出現(xiàn)接管。
這也和大約一個(gè)月前馬斯克給網(wǎng)友的回復(fù)吻合,當(dāng)時(shí)網(wǎng)友在社交平臺(tái)上催更馬斯克,馬斯克回應(yīng)稱FSD V12程序在加州表現(xiàn)還不錯(cuò),但還需要多在雨水多的地區(qū)訓(xùn)練。
所以目前推送的v12.1.2版本顯然能力還不夠完善。發(fā)布測(cè)試視頻的博主隨后也表示:
FSD Beta v12.1.2(最新版本號(hào))并不能實(shí)現(xiàn)自動(dòng)駕駛。
這可能就是為什么推送的FSD V12依然帶有Beta(測(cè)試版)后綴,此前馬斯克曾公開(kāi)表示,F(xiàn)SD V12不會(huì)是Beta版。
以及雖然這次確實(shí)是推送給了普通車主,而不僅限于特斯拉內(nèi)部員工,但推送的車主數(shù)量還比較小,特斯拉對(duì)此還比較謹(jǐn)慎,也許等后面全員推送,正式公測(cè)后會(huì)將“Beta”移除也說(shuō)不定。
要是以目前的表現(xiàn)直接落地中國(guó),怕是會(huì)讓很多人告別“FSD崇拜”。
不過(guò)盡管存在著不足,但是FSD V12的更新仍可以稱得上是飛躍,為自動(dòng)駕駛發(fā)展開(kāi)辟了新道路。
V12和以往FSD版本有什么不同
特斯拉在最新的OTA注解中表示,V12用海量視頻數(shù)據(jù)訓(xùn)練出的端到端神經(jīng)網(wǎng)絡(luò),替換掉了超過(guò)30萬(wàn)行C++代碼。
不再是規(guī)則驅(qū)動(dòng)的,而是數(shù)據(jù)驅(qū)動(dòng)的,這是FSD一大進(jìn)化。
所謂規(guī)則驅(qū)動(dòng),就是過(guò)去傳統(tǒng)的自動(dòng)駕駛程序在根據(jù)感知做出決策時(shí),用程序設(shè)定規(guī)則,if-else的邏輯判斷。
Corner Case(邊緣場(chǎng)景)無(wú)窮無(wú)盡,很難寫出一段程序覆蓋盡可能多的場(chǎng)景,遇到特殊情況就補(bǔ)一段,長(zhǎng)此以往代碼的冗余和程序的復(fù)雜程度不斷提高,系統(tǒng)最后難免被程序員封為“屎山”。
現(xiàn)在轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng),用大量的視頻數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),不斷完善模型趨向于人類老司機(jī)。
用一位早前參與FSD V12內(nèi)測(cè)的特斯拉員工所說(shuō),過(guò)去難以優(yōu)化的問(wèn)題迎刃而解——(模型)模仿人類就行了。
FSD V12也不像過(guò)去的自動(dòng)駕駛還要分為三個(gè)感知、規(guī)劃和控制三個(gè)模塊,用一個(gè)統(tǒng)一體實(shí)現(xiàn)了端到端,這頭輸入周邊感知到的數(shù)據(jù),那頭輸出駕駛決策。
端到端的神經(jīng)網(wǎng)絡(luò)有什么好處?
從研發(fā)上來(lái)看,過(guò)去分成感知、規(guī)劃和控制,最終是實(shí)現(xiàn)把車開(kāi)好,但三個(gè)模塊各自的優(yōu)化目標(biāo)是不同的,每個(gè)模塊都會(huì)產(chǎn)生bug或是誤差,這些誤差積累下來(lái)會(huì)導(dǎo)致最終輸出結(jié)果出問(wèn)題。
就好像快過(guò)年了咱們一起包餃砸,和餡,和面,下餃子,最終目標(biāo)是做好這盤餃子,但是餡、面和下餃子各自所追求的目標(biāo)是不一樣的,每一步都可能會(huì)出問(wèn)題,導(dǎo)致最終餃子煮爛了。
從商業(yè)化落地來(lái)看,每個(gè)模塊獨(dú)有體系和機(jī)制,這意味著要針對(duì)每個(gè)模塊投入團(tuán)隊(duì)和資金,卻不一定能換回升級(jí)迭代效率。
而轉(zhuǎn)換成端到端這種單一模型后,工程復(fù)雜度沒(méi)原來(lái)高,只需要圍繞一個(gè)最終目的進(jìn)行優(yōu)化,統(tǒng)一可控。模型的主干也可以共享提高計(jì)算效率。
端到端也使得純粹依靠數(shù)據(jù)完善程序成為可能。
當(dāng)然,新的突破帶來(lái)新的問(wèn)題。
過(guò)去分成多個(gè)模塊,升級(jí)優(yōu)化更靈活,C++程序可解釋性也更好,從匯編到到編譯,程序運(yùn)行很清晰。
而端到端自動(dòng)駕駛是個(gè)“黑盒”,解釋性不太好,增加了人們對(duì)自動(dòng)駕駛的信任成本。
但正如AI大牛何愷明此前在香港中文大學(xué)講座中談到的:
你打車遇到的司機(jī)師傅是個(gè)陌生人,為什么你會(huì)信任他?
你信任他是因?yàn)樗拇竽X是可解釋的,還是你認(rèn)為一個(gè)訓(xùn)練有素、經(jīng)驗(yàn)豐富的司機(jī)應(yīng)該會(huì)開(kāi)的很穩(wěn)?
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com