已經(jīng)是語音AI的領(lǐng)跑者,科大訊飛為何還要做視覺AI?
在昨天的10月24日,第二屆世界聲博會暨2019科大訊飛全球1024開發(fā)者節(jié)在安徽合肥開幕,本屆大會的規(guī)模再創(chuàng)歷屆之最,吸引了來自全球各地的參與者。而作為科大訊飛總部,合肥這個低調(diào)的非網(wǎng)紅省會城市也再度迎來了高光時刻。
筆者受邀參與了本屆大會,到達第一天筆者就在科大訊飛1024開發(fā)者節(jié)現(xiàn)場發(fā)現(xiàn),有一款特別的設備吸引了許多參會者的駐足體驗。它可以迅速識別各種違禁品,幫助安檢人員智能判圖,讓參會者在高峰期能夠秒過安檢,緩解安檢通道壓力,為會場安全保駕護航,它就是科大訊飛X光安檢圖像智能識別系統(tǒng)。
據(jù)現(xiàn)場人員介紹,科大訊飛X光安檢圖像智能識別系統(tǒng)與傳統(tǒng)依賴人工判圖的X光安檢不同,科大訊飛為X光安檢圖像的目標檢測專門研發(fā)了一套新型檢測技術(shù)。基于神經(jīng)網(wǎng)絡的深度學習,將安檢圖片結(jié)構(gòu)化處理,進行特征提取,解決圖像目標識別難點,可高效、精準地檢測所有目標。這就相當于在X光安檢機上裝上了孫悟空的火眼金睛,人工智能輔助判圖,系統(tǒng)識別率可達90%,能夠?qū)崟r、精準識別各類可疑液體、易燃易爆物品、各類刀具、槍支等29種50多類違禁品。
簡單的來說,就是讓人工智能代替人眼去發(fā)現(xiàn)X透視下影像中的危險品,科大訊飛已經(jīng)實現(xiàn)90%了高識別率,可見提升效率,提升生產(chǎn)力的作用將非常明顯。而據(jù)筆者分析,90%識別率的這個難度在AI計算機視覺領(lǐng)域其實蠻大的,因為X透視后的圖像完全沒有色彩和立體輪廓,僅憑一張相當于2D平面的光譜圖讓人工智能去識別,還要識別出真實物體,達到較高可實用的準確率。
據(jù)筆者從科大訊飛內(nèi)部人士處獲悉,科大訊飛這套X光安檢圖像智能識別系統(tǒng)并不是實驗室階段產(chǎn)品,它已經(jīng)在一些大型活動、軌交鐵路、機場海關(guān)、快遞物流等多個領(lǐng)域進行應用。
值得注意的是,科大訊飛一直以來是以語音AI而蜚聲業(yè)界的,目前是全球屈指可數(shù)的語音AI,普通用戶也通常能夠接觸到其消費級語音AI產(chǎn)品,比如智能翻譯機、聽見智能轉(zhuǎn)寫機、智能和學習機等產(chǎn)品,但這些都是主打語音AI領(lǐng)域。而此次亮相的X光安檢圖像智能識別系統(tǒng)是基于視覺AI的技術(shù),是AI領(lǐng)域的計算機視覺技術(shù),和很多人對科大訊飛主打語音AI的印象不同。
實際上,科大訊飛并非只專注于語音AI領(lǐng)域,據(jù)網(wǎng)絡上公開信息,科大訊飛其實在2016年以前就已經(jīng)布局視覺AI領(lǐng)域,早期主要由科大訊飛研究院推進。
科大訊飛做視覺AI不是最早,但進展驚人。據(jù)悉在今年6月份舉辦的計算機視覺與模式識別國際會議舉辦的物體檢測挑戰(zhàn)賽上,科大訊飛在機器視覺定位和視覺識別能力項目上奪得冠軍。在文檔分析與識別國際會議舉辦的數(shù)學公式識別挑戰(zhàn)賽上,科大訊飛包攬了在線手寫數(shù)學公式識別、離線手寫數(shù)學公式識別兩項任務冠軍。在場景文本視覺問答比賽上,訊飛團隊在全部三個賽道中均大幅超越對手,取得了第一的好成績。
其實在人工智能的計算機視覺領(lǐng)域,行業(yè)里的明星級獨角獸玩家眾多,像商湯、曠視等。那么作為語音AI領(lǐng)域的領(lǐng)跑者,科大訊飛為什么會還要去涉足玩家眾多的視覺AI領(lǐng)域?
筆者認為主要原因首先是一個人工智能技術(shù)應用場景本身的問題,因為未來的人工智能交互方式必須是包含語音交互和視覺交互這兩個方面的。
筆者在參與科大訊飛輪值總裁胡郁的群訪時獲悉,科大訊飛堅持專注于人工智能領(lǐng)域,其業(yè)務方向可以從水平和垂直兩個方向來講,除了現(xiàn)在外界關(guān)注在做最擅長的語音AI這個垂直領(lǐng)域以外,科大訊飛還有很多的人工智能技術(shù),比如說視覺AI、自然語言理解和超腦技術(shù)。
胡郁認為科大訊飛將來的整個商業(yè)生態(tài)系統(tǒng),它應該是個多樣化的,用戶通過各種不同形態(tài)的智能硬件在人工智能的環(huán)境下建立連接??拼笥嶏w希望通過AI人工智能平臺,來實現(xiàn)整個的基礎設施基礎層面上的一些工作,去為用戶、開發(fā)者和合作伙伴賦能。
可以看出,科大訊飛在人工智能領(lǐng)域擁有著更大的野心,不僅在專注于語音AI,已經(jīng)進入了人工智能領(lǐng)域的多條賽道,從垂直領(lǐng)域的深挖到水平方向的拓展。
而我們看到目前AI智能硬件與機器人領(lǐng)域,國內(nèi)市場雖然正在走向收獲期,但還未到達完全的成熟期,如果希望從中獲利,首先需要廣闊的市場空間和成熟的上下游產(chǎn)業(yè)鏈。因此我們也看到了科大訊飛在人工智能等方面的廣泛參股投資,包括一部分機器人及智能硬件公司外,還有產(chǎn)業(yè)鏈上下游的公司,例如科大訊飛已經(jīng)參股了視覺AI獨角獸商湯科技、智能機器人公司優(yōu)必選、智能芯片廠商寒武紀等等。
而如今在人工智能領(lǐng)域的創(chuàng)投資本預冷,巨頭的影響力更加凸顯。雖然科大訊飛現(xiàn)階段在體量上不如谷歌、百度或亞馬遜這樣的巨頭,但畢竟擁有深厚的積累和行業(yè)領(lǐng)先優(yōu)勢,隨著盈利能力的提升和落地場景的日漸清晰化,人工智能產(chǎn)業(yè)正在走向收獲期,科大訊飛未來依然值得期待。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com