深度解析|計算機視覺:人工智能重點賽道
計算機視覺是人工智能在中國落地最順利的技術。和語音相比,計算機視覺是一條更有技術深度,更多應用場景的好賽道。
從目前的落地進展來看,移動互聯網/安防領跑,零售/物流跟進,醫療/無人駕駛的商業化有待成熟。
以商湯、曠視、深蘭、依圖、云從為代表“視覺五虎將”企業戰略出現向平臺企業或軟硬一體化企業發展的分化趨勢,以擴博等新計算機視覺公司也在各領域快速崛起。
本圖來源于網絡,如有侵權請聯系刪除
▌計算機視覺是變現最順利的人工智能技術
計算機視覺是中國AI市場的最大組成部分。根據中國信通院2018年2月發布的報告數據,2017年,中國人工智能市場中計算機視覺占比37%,以80億元的行業收入排名第一。
安防影像分析是目前計算機視覺最大的應用,據艾瑞咨詢預測,2017年占比約67.9%。其他主要應用包括廣告、互聯網等。
從AI領域融資規模來看,根據CBInsight的統計,2016年中國計算機視覺公司融資總額占AI總體24%,遠超出美國的7%。
落地速度出現分化,數據可得性,算法成熟度,服務的容錯率是主要影響要素
最近幾年機器視覺行業實現快速發展的背景是:2015年基于深度學習的計算機視覺算法在ImageNet數據庫上的識別準確率首次超過人類,同年Google在開源自己的深度學習算法。
這些帶動中美兩國的科學家把計算機視覺算法運用到安防、金融、互聯網、物流、零售、醫療、制造業等不同垂直行業。
但在實際的運用當中,由于數據可得性,算法成熟度,服務的容錯率等因素的影響,落地的速度開始出現分化。移動互聯網/安防領跑,零售/物流跟進,醫療/無人駕駛發展較慢。
金融領域:人臉識別在金融領域已出現多種解決方案,伴隨識別準確率上升,遠程開戶已在互聯網金融行業得到廣泛應用,人臉支付、刷臉取款等開始被各大銀行采用。
金融領域的計算機視覺應用面臨如下挑戰:
1)人臉與身份證信息的人臉比對技術壁壘相對較低,服務容易陷入同質化競爭,而手脈識別高難度技術的玩家又很少;
2)無現金趨勢影響刷臉取款等服務的普及,銀行對更復雜的AI服務仍持較謹慎態度。
零售領域:AI在零售行業的應用不是簡單的無人零售,而是需要利用AI技術改造零售流程,實現提高效率降低成本的目的。AI公司除了提供技術以外,可能需要提供包括一系列咨詢戰略方案在內的整體方案。
醫療領域:醫療數據碎片化嚴重,各種疾病需要的影像資料不同,數據標注需要有專業醫師參與,成本高,進展慢。導致發展低于預期。
無人駕駛:無人駕駛涉及采集攝像頭、雷達等多種數據,并根據多重數據進行車輛、物體、道路、行人等不同識別后進行決策。我們認為離實現通用無人駕駛還早,在限定場景下實現商用的機會較大。
技術發展趨勢:
提高預測精度,降低數據標注成本隨著技術的不斷發展,計算機視覺能夠識別信息的種類從最初的文字信息,到人臉,人的體態識別,以及各種不同的物體。
能夠識別的精度也從最初的人1:1比對,到用于門禁系統等1:N比對,以及用在黑名單監控等場景的M:N動態監控。除了提高算法精度以外,提高數據標注的效率也是計算機視覺公司重要的課題之一。
Google、Microsoft等互聯網公司相繼推出了自動標注系統AutoML和CognitiveServices。
商湯科技、擴博智能等AI公司也通過運用半監督學習、遷移學習(transferlearning)、主動學習(activeLearning)等技術,提高數據標注的自動化程度,達到提高效率,降低成本的目的;深蘭科技等以生成式對抗網絡(GAN, Generative Adversarial Networks )向近年來復雜分布上無監督學習方法領域邁進,用GAN生成的圖像來做數據增強。
企業發展戰略開始分化,商湯向左,曠視向右,深蘭橫向9大領域發展的計算機視覺技術在中國的快速落地,吸引了眾多以算法為核心競爭力的AI初創公司效仿,擁有強大數據采集及軟件開發能力的互聯網公司,海康、大華、宇視等深耕安防行業的公司,以及華為、平安等科技行業巨頭。
各類公司初始時在產業環節中各有偏好:初創企業在算法與模型訓練上占優;互聯網企業則擁有天然的數據優勢;安防企業則憑借極強的工程能力加速安防項目落地。后起之秀如擴博則選擇細分市場廣泛落地。
從行業機會而言:互聯網巨頭利用自己強大的數據優勢和豐富的內部應用場景,提升自身業務場景的增值服務,如阿里巴巴的淘寶拍立淘、騰訊優圖在手機QQ與微信的應用、今日頭條的短視頻甄別等。
AI頭部初創企業近年來融資動作頻繁,受到資本市場的青睞,在資金方面暫無瓶頸,然而面臨互聯網巨頭的挑戰,商湯等初創企業或應依托已有的獨立設計算法的能力,構建平臺型解決方案,在研發能力與方案落地速度上取勝。
AI頭部創業公司布局思路各異:在商湯、曠視、深蘭等頭部企業看,各家戰略思路差異明顯。商湯致力于構造平臺,專注底層基礎應用,力圖在完善平臺后于其他領域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領域提供軟硬件一體化的解決方案。深蘭則表現出對自動駕駛、智能機器人,生物智能,AI芯片等領域的專注深耕,依托產品化、工程化能力深入落地。
經過一年多的發展,各個公司根據自己資源稟賦的不同,企業戰略出現了分化,經過市場的錘煉,在人工智能領域必將出現下一個BAT。
▌商湯科技:致力成為AI時代的電力公司,賦能行業
商湯科技成立于2014年,員工人約2,000人。主要業務是計算機視覺技術以及深度學習算法,創始人湯曉鷗是全球知名人工智能學者。2001年,他建立了香港中文大學多媒體實驗室,現任香港中文大學信息工程系系主任。
Parrots是商湯自主研發的深度學習平臺。這個平臺包括商湯多年積累的算法庫,以及支持超深的網絡規模、超大的數據標注及訓練的軟件開發平臺。
加上其自主搭建的深度學習超算中心,大大加速了深度學習訓練和算法模型的迭代速度。這樣的平臺及技術支持,將讓研究人員的工作更為聚焦。這是商湯能夠同時賦能十幾個行業的強大基礎。
AI賦能智慧安防,SenseFoundry保障城市安全。安防是AI重要的落地場景,SenseFoundry是商湯為智慧城市專門開發的城市級超大規模視頻分析平臺,它可以擴展至10萬路級別、千億級別非結構化圖像特征分析處理,可以對人臉、行人、車輛、非機動車進行識別和分析。
同時,該平臺可以進行自我訓練,利用業務過程中累積的數據,通過訓練系統,自動提升技術指標。該平臺可以輕松實時監控100萬人臉,并對長達數月的千億級數據進行軌跡還原。目前,公司已在深圳成功部署SenseFoundry平臺。
AI賦能2C端,手機及娛樂互聯網行業受益。針對手機行業,商湯提供SensePhoto圖像處理方案,基于深度學習,幫助智能終端實現人臉解鎖、人臉檢測、照片背景虛化等功能。
商湯已與眾多國內廠商建立合作,比如VivoX20,OPPOR11s均利用了商湯的技術,面部識別迅速,用戶點亮屏幕瞬間即可解鎖。針對娛樂互聯網行業(短視頻、直播等),商湯SenseAR識別和繪制能力已從“臉部”擴至“全身”,可以實現對手勢、肢體動作的全方位精確描述和跟蹤,成為互聯網娛樂領域的“黑科技”,比如主播做出心形手勢,屏幕則會出現愛心氣泡。
截止2018年初,SenseAR為接近200家國內外App提供服務,占亞太市場的80%,每天服務10億以上互聯網終端客戶。
▌曠視科技:“端到端”的AI+IoT解決方案提供商
2011年10月,曠視科技在北京中關村成立。創始人印奇、唐文斌畢業于清華大學姚期智計算機科學實驗班。公司現任首席科學家孫劍是前微軟亞研院首席研究員,公司正式員工約1,400人。
曠視科技是一家“端到端”的AI+IoT解決方案提供商,旗下擁有全球最大的人臉識別開放平臺Face++和第三方人臉身份驗證平臺FaceID。
▌深蘭科技:以機器視覺技術為切入點,為傳統行業賦能
深蘭科技是一家圖像識別領域公司,成立于2014年10月,一直致力于人工智能基礎技術研究和應用開發,為零售、生物智能、自動駕駛等領域賦能。
智能零售
智能零售是深蘭科技切入的第一條人工智能賽道,從2015年開始連續推出多款相關產品和解決方案:2015第一家無人零售店店,2016年發布“quiXmart快貓智能零售系統”,2017年6月發布“AI自販柜”,2018年初推出辦公室貨架的升級產品“小蘭系列”。
深蘭科技認為基于動態視覺解決方案的無人貨柜,相對于傳統自動販賣機的優勢主要有以下兩點:
一方面升級用戶購物體驗,在購物過程中讓用戶可以近距離感受商品再支付,另一方面不限制商品形狀,可以豐富商品品類,擴展無人零售柜的應用范圍,如販賣鮮食等。在技術層面,深蘭科技采用動態視覺技術,解決了靜態視覺解決方案限制貨柜貨品擺放數量,導致填充率低的問題,將坪效提升了3-4倍。
除此之外,深蘭科技無人貨柜增加智能異常行為檢測功能,可以檢測用戶是否出現不符合購買行為的其他動作,輔以人工判斷,通過螞蟻信用分和深蘭支持的其他產品(辦公樓閘機、公交付費系統)約束用戶行為,降低無人貨柜貨損率。
據公司提供數據,目前深蘭科技的無人零售業務已與蒙牛、伊利等品牌合作,并已有相關產品落地。
生物智能
深蘭科技在生物智能領域深耕手脈識別技術,使用近紅外攝像頭捕捉手掌血管分叉點,基于這一生物特征形成數字編碼作為用戶的唯一加密ID,進行用戶身份的識別。由于手脈識別基于人體內部的血管生長特征,無法被仿冒和復刻,相比主流的人臉識別和指紋識別有更強的安全性。
目前,深蘭科技的手脈識別技術已應用于深蘭閘機、深蘭結算臺等產品中。2017年2月基于該技術,公司聯合螞蟻金服推出“takego結算系統”。
據公司介紹,深蘭閘機已經被確認為上海智慧城市底層技術,未來將會應用于地鐵、公交、酒店、校園、寫字樓等場景,代替門禁、公交卡等終端,最終實現城市“一手通”。由于實現手脈識別前端需要紅外攝像頭這一硬件設備,目前公司產品主要依賴進口,成本較高。遠期來看,公司有意基于國內的低成本紅外攝像頭,進行自主改造升級,實現硬件國產替代。
自動駕駛深蘭科技采用主流的計算機視覺與多傳感器融合的自動駕駛解決方案,為城市公交車和移動零售賦能。
深蘭科技認為,未來城市公交場景和零售業務可以深度結合,提供公交車上的零售服務,在無人駕駛技術的助力下,司機可以兼職移動零售銷售員、公交車服務員等。在移動零售領域,深蘭科技配合“叮咚打店”APP提供叫店服務,發布芭提雅無人零售車,為消費者提供隨時隨地的購物服務。
▌依圖科技:行業收斂,深耕安防、醫療領域
依圖科技由加州大學洛杉磯分校統計學博士朱瓏、前阿里云計算專家林晨曦聯合創辦。2012年成立至今,依圖科技致力于人工智能創新性研究,戰略定位十分清晰,在行業布局上收斂,深耕安防與醫療領域。
安防領域:占據公司營收的八成以上。目前,依圖安防領域誤報率已達百億分之一,其“蜻蜓眼TM”平臺已應用于中國多地省市區公安系統。
著力提高產品化與工程化能力。通過訪談,依圖認為在計算機視覺當前的ToG、ToB階段,要塑造起算法、產品化、工程化、商務能力均優的綜合實力,并強調產品化、工程化能力的重要性。
醫療領域:影像、病例、大數據全面布局,已開始落地。
C輪融資主要用于醫療領域,依圖科技care.aiTM的布局最為人所知。
依圖科技已經與北京協和醫院、華西醫院、浙江省人民醫院、復旦大學附屬腫瘤醫院等多家頂級三甲醫院合作,推出了care.ai醫療智能全棧式產品解決方案,為醫院提供跨科室的多場景應用系統和數據分析平臺,同時積累了海量的醫療大數據處理經驗。
目前,依圖科技主要從單病種任務層級、跨學科診斷層級、臨床路徑優化層級三個層級解決醫療行業痛點。
1)單病種任務層級:依圖科技單病種已覆蓋乳腺、肺、心血管、腦科學等多門類,開發的肺癌影像智能診斷系統現在已經達到敏感度95%以上,醫生采納率92%以上,提高了醫生的閱片效率。
2)跨學科診斷層級:依圖科技利用系統基于先進NLP技術和機器視覺算法,對病歷、病理(例:化驗結果)、醫療影像(例:CT影像)等多模態數據進行結構化和深度解析,以滿足科研、臨床、教學、管理等多場景需求。
3)臨床路徑優化層級:2018年,依圖科技聯合騰訊睿知和廣州市婦女兒童醫療中心,推出“問診熊”導診小程序。醫生可直接讀取查詢碼讀取病患病情,提高雙方效率。
▌云從科技:專注銀行和安防領域AI應用
云從科技是中科院重慶研究所孵化的計算機視覺與人工智能科技公司,成立于2015年4月,創始人周曦博士師從四院院士、“計算機視覺之父”黃煦濤,帶領團隊多次獲得計算機視覺國際比賽冠軍。云從科技也參與了人臉識別國家、行業標準起草與制定。
目前,云從科技是中國銀行業人臉識別第一大供應商。為積極推動中科院與公安部的全面合作,推出火眼大數據平臺、鐵路人證票核驗系統、生物識別引擎、智慧鑒身產品簇和集成生物識別系統IBIS等一系列應用系統平臺。
另外,云從科技推出人臉互動大屏終端,智能門禁、人臉動/靜態業務應用平臺服務器、刷臉自動售賣機等多款智能硬件,結合云從自由技術,滿足不同場景下的需求。
2018年3月,云從與全球最大芯片制造商intel合力打造推出“炬眼”智能人臉識別相機,可識別相機全面分析處理實時畫面,識別出人臉后將“人臉圖像”轉變為“特征數據”再傳回中央系統。
▌擴博智能:為企業用戶提供端到端一體化智能服務
擴博智能2016年11月由嚴治慶等設立,總部位于中國上海,在北京和大連設有分支機構,在新加坡設有分公司,美國西雅圖設有研發中心。主要業務是利用計算機視覺技術為風電、零售和運營商等傳統行業企業提供端到端一體化智能服務。
視覺+風電:為解決風電行業風機葉片巡檢和設備壽命管理問題,擴博智能推出了擴博博云平臺。利用搭載了計算機視覺技術的智能無人機,對風電設備進行無人智能化巡檢,幫助傳統風電企業推動設備資產精細化管理,提高運營效率。智能巡檢平臺可提
高風機葉片巡檢效率40倍,且識別率達95%。視覺+零售:零售行業中,存貨管理、營銷策略等問題對商品銷量、單客購買力有很大影響。
擴博智能為零售領域打造了線下零售實時智能監測平臺擴博智維,利用視覺技術采集貨架商品信息,通過結構化技術處理數據,并整理分析產生量化數據,對存貨和商品進行實時追蹤,幫助零售商實時掌握產品動態、分析銷售數據,從而提高重復購買率和產品銷量。
視覺+運營商:通過擴博智能研發的無人機數據即服務平臺,通信運營商利用自身的LTE網絡即能向無人機客戶提供定制的模組、網絡、平臺一體化方案。
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com