黃鐵軍: 讓AI擁有超人“視力”
受訪者供圖
黃鐵軍,生于1970年12月,籍貫河北省邯鄲市,北京大學信息科學技術學院教授、北京智源人工智能研究院院長、國家人工智能標準化總體組副組長,主要研究方向為智能視覺信息處理與類腦智能。
愛國情 奮斗者
“剛開完會,上午會議結束得晚,咱們邊吃邊聊吧。”第一次見到北京大學信息科學技術學院教授黃鐵軍是在一次會議間隙,正值午飯時間,快人快語的他直接招呼記者一起用餐。
1970年,黃鐵軍生于河北省邯鄲市大名縣的一個普通村莊,和著名歌手鄧麗君是同鄉。若是身處在人群中,中等個子、衣著樸素的黃鐵軍,顯然不會像鄧麗君那樣引人注目。但在人工智能(AI)機器視覺領域,他有著絕對的發言權。
最近他的成果再次成為業界關注的焦點。前段時間,黃鐵軍牽頭研制的超速全時仿視網膜芯片首次公開亮相。這款芯片采用光電技術,能“看清”高速旋轉葉片上的文字,可充當AI的“超速電眼”。
從農村娃到如今的AI大咖,在黃鐵軍身上,有著怎樣的故事?
高中時對編程感興趣
1986年,黃鐵軍上高二。那時很多人還沒見過計算機,他卻幸運地就用上了電腦。
“當時正值國家在中學推廣計算機學習,一些電腦被下發到部分學校。我所在的高中就有5臺電腦,而后我參加了學校組織的計算機興趣班。”黃鐵軍回憶道,自己對計算機“一見如故”,沒學多久就開始自己上機編程。
因為他程序編得好,老師把一臺電腦撥給他專用。如今,黃鐵軍仍心存感激,高中時這段與計算機親密接觸的經歷,為他日后的科研選擇埋下了伏筆。
1988年,臨近高考,那時的他一心想探求世界本源,于是毫不猶豫地填報了北京大學物理系。遺憾的是,他高考發揮失常,沒能進入心儀的大學。正在猶豫是否復讀時,他收到了武漢工業大學(現為武漢理工大學)的補錄錄取通知書,隨后進入該校計算機學院應用技術專業。
1995年,黃鐵軍進入華中理工大學(現為華中科技大學)圖像識別與人工智能研究所攻讀博士學位,主要研究方向為雙目立體視覺及其在虛擬現實中的應用。畢業后,1999年他進入中國科學院計算技術研究所進行博士后研究,研究方向為圖像識別技術,合作導師是時任所長、現北京大學教授、中國工程院院士高文。
“逼上梁山”轉戰視頻編碼
從博士到博士后,黃鐵軍的研究都圍繞圖像識別展開。當時,他以為自己會沿著這條路走下去,但命運卻把他引向了一條岔路——視頻解碼。
2002年,數萬臺我國制造出口的DVD,由于未支付專利許可費,在歐盟地區被海關扣押。在專利大棒的打壓下,集中在廣東地區的相關生產工廠大量倒閉。
“那是改革開放后,我國首次遭遇重大知識產權問題。”黃鐵軍說,制定中國自主知識產權音視頻壓縮標準,擺脫受制于人的困境,在當時變得十分迫切。
彼時,主題為“寬帶流媒體”的香山科學會議正在召開,大會主席安排黃鐵軍起草會議簡報。會議期間,工信部、科技部相關領導明確要求成立數字音視頻編解碼技術標準工作組(AVS),解決音視頻產品的知識產權問題,高文任組長。
對黃鐵軍來說,視頻編碼是個“從未涉足過的領域”。但由于簡報寫得好,博士后剛出站的黃鐵軍就被任命為AVS秘書長。他自嘲道,自己是“被逼上梁山”的秘書長。
“既然是國家需要,自己接下了任務,就得好好干。”黃鐵軍說,此后他的研究重心逐漸向視頻編碼方向傾斜。
AVS工作組成立后,經歷過一段艱難歲月。黃鐵軍說,2004年工作組制定的視頻編解碼技術標準送審,但直至兩年后才發布。“因為產業化本身涉及芯片、軟件、產品設備和端到端系統等眾多關鍵環節,只有研制出符合標準的芯片,標準才能通過。”他說。
矛盾的是,如果標準不發布,企業就不愿研發芯片。無奈之下,工作組最終決定自己組織芯片設計團隊。15年來,這支團隊伴隨著AVS標準制定,研發出了一系列視頻編碼芯片。
搞研究不走尋常路
參與AVS工作的同時,黃鐵軍也開始了從圖像識別轉戰視頻編碼的旅程。正因是“半路出家”,他的研究視角和長期在此領域研究的人不太一樣。
比如,黃鐵軍巧妙地捕捉到,監控視頻具有背景相對不變的特點,提出了基于場景建模的視頻編碼方法。僅靠這項技術,就把視頻編碼的效率提高了1倍。“采用現行標準,全國3千萬個攝像頭采集的視頻,若保質保量存儲3個月的內容就需要2千億元。用上這項技術后,等量的內容存儲成本可降至500億元。”他說。
云計算改變了信息的應用和服務模式,但大量攝像頭拍攝的視頻很難傳至云端,于是黃鐵軍又“腦洞大開”。
“傳到‘云’里的視頻不是給人看,而是給機器‘看’(進行分析識別),所以只要傳回機器識別所需的視覺特征就可以了。”他說,采用這個技術思路,視頻傳輸流量可減少90%以上,大大減輕了傳輸壓力。
基于上述兩項創新成果,由黃鐵軍牽頭的團隊獲得了2017年度國家技術發明獎二等獎。
在新領域屢創佳績的黃鐵軍,卻一直沒忘了自己的“老本行”——圖像識別。在該研究領域,他依舊體現出了與眾不同的研究視角。
長久以來,一些科學家習慣以人類自身為標準思考機器如何“看”,以為機器視覺和人類視覺一樣,但黃鐵軍卻不這么認為。
“人總喜歡把自己的感受強加于別人,現在又強加于機器。一些人單純地以為,把視頻給機器看,機器就能識別,這種思路有些局限。”黃鐵軍說,其實機器能比人“看”得更準、更快。
于是,跳出人類思維局限,打造真正的機器視覺,即類腦視覺,成了黃鐵軍當下的目標。
做真正有價值的東西
由黃鐵軍牽頭研制的超速全時仿視網膜芯片,便是他們向類腦視覺走出的探索一步。黃鐵軍把這款芯片,比作新一代人工智能的“電眼”。
它能干什么?“舉例來說,在高速旋轉的電風扇葉片上寫2個字,電風扇轉起來后,人眼看到的是模糊一片,‘電眼’卻能把字看得清清楚楚。”他說,“電眼”可用在人工智能界的“網紅”無人駕駛汽車、無人機和智能機器人上。
該芯片的研制團隊中,有計算機科學、神經科學、醫學等眾多領域的專家,形成了一個強大的跨學科隊伍,他們從生物和信息兩個角度進行探索,最終才研制成功。
因為設計這只“電眼”,讓黃鐵軍有機會將視頻編碼與“老本行”圖像識別結合起來,運用上這兩種不同領域的技術。“以前,我們實驗室里的學生分兩撥搞研究,一撥做圖像識別,一撥做視頻編碼,就像兩條并行的鐵軌。現在,他們可以一起做項目,按照全新的技術體系,創造新的可能。”他說。
實驗室的學生對科技日報記者說,開放性思維是黃鐵軍的標志性特點。“黃老師善于從全局角度看問題,常會把兩種看似沒有關系的事物聯系在一起,讓它們碰撞出火花。”
在生活中,黃鐵軍也依舊如此。他喜歡跟性格各異、領域不同的人打交道,他說這樣能通過別人的視角來發現新問題。
對科研,黃鐵軍表示自己喜歡另辟蹊徑,反對跟隨和模仿。“以前,一些科研人員十分注重成果的數量,現在則更重視開拓科研‘無人區’。科研人員應該珍視自己的學術生命,做真正有價值的東西,否則你所做的事情就會像沙灘上的腳印,一陣浪打過來就會無影無蹤。”他說。
- 標簽:
- 編輯:李娜
- 相關文章