“我們團隊的平均水平,還是要比大公司更強一些。” 在接受騰訊科技采訪時,肖健雄語氣平緩,卻又自信滿滿地說著。
作為硅谷目前最神秘的無人駕駛技術(shù)公司之一的Auto X的創(chuàng)始人,肖健雄所指的是他所帶領(lǐng)的一幫由斯坦福、麻省理工學院頂尖人才所組成的團隊,比照的“大公司”是同樣從事無人駕駛技術(shù)研發(fā)的谷歌Waymo、Uber和特斯拉等。
與目前大多數(shù)科技公司所采取的激光雷達、聲納、攝像頭、GPS相結(jié)合的一整套無人駕駛解決方案所不同的是,Auto X最引人矚目的是其一直對外所宣稱的低成本方案:僅用普通的消費級網(wǎng)絡(luò)攝像頭,額外硬件成本不到50美元,就能實現(xiàn)無人駕駛。
在本周舉辦的Emtech Digital大會上,肖健雄向現(xiàn)場展示了Auto X的實際路測視頻,從視頻中可以看到,Auto X的測試車身上裝載了7個普通攝像頭,用于捕獲周圍360度圖像,已經(jīng)可以在硅谷地區(qū)的晴朗白天、晴朗夜間、下雨白天以及多云夜間等四種不同天氣條件場景下實現(xiàn)無人駕駛。
在臺上的演講中,肖健雄對外再一次強調(diào)了AutoX的愿景:“讓人人都能便捷地獲得自動駕駛技術(shù)帶來的好處。”
在會后接受騰訊科技專訪時,肖健雄說,硬件設(shè)備上的“簡陋”,并不代表技術(shù)上落后,相反,由于Auto X團隊的技術(shù)專長正是在軟件算法這一塊,所以只需要并不復雜的硬件設(shè)備配合,就能夠應(yīng)對復雜的無人駕駛。
肖健雄說,無人駕駛技術(shù)的核心分為感知、規(guī)劃和控制這三個部分,Auto X要做的是將三部分結(jié)合的一整套“全棧式”無人駕駛方案。
他介紹說,很多外界能夠明顯看到的,像谷歌的Waymo、Uber的無人駕駛測試車輛上所裝載的激光雷達、攝像頭、聲納等都是用于車輛感知的部件,通過這些數(shù)據(jù)采集設(shè)備,讓車輛感知所處的環(huán)境,并為下一步的決策提供準備。
目前,谷歌、特斯拉等無人駕駛技術(shù)已經(jīng)通過常年累月的實際路測積累了海量的數(shù)據(jù),并將這些數(shù)據(jù)運用到無人駕駛解決方案的深度學習中,數(shù)據(jù)也是任何宣稱應(yīng)用人工智能技術(shù)的公司所不可或缺的重要元素,作為一家剛剛起步的初創(chuàng)公司,Auto X同樣也需要大量的數(shù)據(jù),但他們的數(shù)據(jù)并不僅僅來源于車輛的實際路測。
肖健雄介紹說,他們獲取數(shù)據(jù)的途徑有很多,除了讓車輛去路面上進行路測采集是一種方式以外,向系統(tǒng)輸入圖像信息也是一種直接獲取數(shù)據(jù)的方式。
他表示,自己過去的專業(yè)研究領(lǐng)域正是二維圖像和三維圖像之間的轉(zhuǎn)換以及對計算機對圖像的識別。
他說,目前很多主流的無人駕駛技術(shù)的激光雷達所構(gòu)建的三維圖像,主要是為了識別周圍物體的距離,但機器并不知道具體的物體是什么,但最終技術(shù)都要達到能夠認知物體是什么的程度。
除了在圖像識別方面的技術(shù)優(yōu)勢以外,肖健雄表示,Auto X的技術(shù)獨特之處還體現(xiàn)在系統(tǒng)能夠更靈活、更快速地給出駕駛決策,他認為這個過程更接近人在駕駛汽車時的過程。
“對于人來說,駕駛行為很多是瞬時、短期的決策,并不是一個非常長遠的規(guī)劃,” 肖健雄說。
他表示,目前很多大公司的無人駕駛技術(shù)的規(guī)劃部分較為機械、死板,在駕駛開始之前,先規(guī)劃好從起點A到終點B的路線,然后嚴格按照預設(shè)路線來行駛,而Auto X則采取了一條先期規(guī)劃和短期及時調(diào)整相結(jié)合的方式,肖劍雄說,在具體路線執(zhí)行時,系統(tǒng)會更加智能地給出實時的最優(yōu)方案,在不改變終點位置的基礎(chǔ)上,在路線上做不斷優(yōu)化,比如在下一個路口提前轉(zhuǎn)彎等。
無論是道路信息的感知、還是行駛決策規(guī)劃以及最終的車輛控制,Auto X的輕量、一體化方案,都需要其背后強大的軟件技術(shù)的支撐。
肖健雄對騰訊科技表示,目前公司進行實際測試的共有三輛車,其中一輛主要在路面上跑,另外兩輛主要在室內(nèi)進行測試,肖建雄說,Auto X的整套方案也考慮了通用性的問題,未來可以根據(jù)具體的車型不同,只需要對算法中的具體參數(shù)進行相應(yīng)調(diào)整。
在創(chuàng)辦Auto X之前,肖健雄是學術(shù)圈里的明星人物,周圍的朋友和同事喜歡稱他為Professor X(“X教授”),他在2012年獲得了世界頂尖計算機視覺大會ECCV最佳學生論文獎,2013年獲得Google Research 最佳論文獎,同年年獲得麻省理工學院博士學位,畢業(yè)后便赴普林斯頓大學計算機系擔任助理教授。在那里,他創(chuàng)辦了普林斯頓大學計算機視覺和機器人實驗室。
2016年,肖健雄看到了無人駕駛領(lǐng)域的創(chuàng)業(yè)機會,他覺得自己之前所從事的計算機視覺識別技術(shù)研究,正好可以應(yīng)用到無人駕駛領(lǐng)域,便毅然從學術(shù)圈離開,投身到硅谷火熱的創(chuàng)業(yè)圈中。
肖健雄創(chuàng)業(yè)的所有信心,幾乎完全來源于他對技術(shù)至上的堅定信念,他堅持認為,無人駕駛領(lǐng)域最終比拼的是誰的技術(shù)更領(lǐng)先、誰的技術(shù)可靠性更強。
“這不像做手機應(yīng)用,人人都可以做,然后比拼產(chǎn)品的運營、市場等等,” 肖健雄強調(diào)說,“無人駕駛是需要很深厚的技術(shù)積累才能夠最終實現(xiàn)。”
他介紹說,目前團隊共有20多人,主要由斯坦福、麻省理工等頂尖高校的博士組成,他們之前的研究方向包括計算機視覺、機器人、路徑規(guī)劃、深度學習、增強學習、高清三維地圖、相機硬件傳感器。
肖健雄表示,技術(shù)上最大的障礙和難題依然是如何將感知、規(guī)劃和控制三者最優(yōu)化地結(jié)合在一起,形成一整套流暢的解決方案。
“最初的時候我們曾經(jīng)把三部分都分別做的非常好,但發(fā)現(xiàn)結(jié)合在一起的時候卻不work(運行正常)了。” 肖健雄說。
過去的6個月中,肖健雄的團隊一直在進行算法的優(yōu)化和車輛的測試,目前團隊的主要精力依然放在打磨算法,進一步優(yōu)化整合上述無人駕駛技術(shù)的三個方面。作為公司創(chuàng)始人和首席執(zhí)行官,肖健雄依然堅持每天寫代碼,他說這樣可以讓他保持對整個公司技術(shù)方向的把握。
目前,Auto X的商業(yè)模式主要是向制造商等企業(yè)提供解決方案,他們的部分技術(shù)已經(jīng)在申請專利中,同時也有和汽車廠商以及其他科技公司的合作計劃,但肖健雄表示目前很多合作意向尚處在早期不便透露。
肖健雄認為,無人駕駛技術(shù)實際上在未來兩到三年中就能夠發(fā)展成熟,但真正到實現(xiàn)大規(guī)模應(yīng)用還有很長的一段時間要走,如何在商業(yè)上實現(xiàn)落地、如何形成統(tǒng)一的行業(yè)標準、如何讓終端消費者接受,這些都需要較長的時間周期。他表示,未來10年,無人駕駛可能會形成一個較大規(guī)模的市場。
對于近一段時間頻繁發(fā)生的特斯拉、Uber等無人駕駛事故,肖建雄認為,這些并不會形成對行業(yè)發(fā)展的阻礙,只是一個必經(jīng)的過程。
作為一個常年和數(shù)據(jù)打交道的人,肖健雄習慣性地用數(shù)據(jù)來表明自己的觀點。他說,正如客運飛機一樣,一旦出了事故依然會舉世震驚,在一段時間內(nèi)引起人們心理上的恐慌,但從事故率來說,要明顯低于其他交通方式,目前飛機這樣的出行方式也早已被普遍接受,他認為,無人駕駛也會是這樣,未來的事故率一定會人要低的多,他堅信,無人駕駛在未來被普遍接受的時代也一定會到來。