版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

高考狀元、AI大神、執(zhí)教頂級高校!科學(xué)界“爽文男主”是誰?

我是科學(xué)人
傳承科學(xué)精神,汲取榜樣力量
收藏

AI界里有句話:得視覺者得天下。

根據(jù)科學(xué)研究,人類大腦皮層的70%活動都在處理視覺信息。作為一門研究如何使機器“看”的科學(xué),計算機視覺就是人工智能的“眼睛”,是感知客觀世界的核心技術(shù)。

提到計算機視覺研究,就不得不提一位近年來聲名鵲起的“80后”——何愷明。他是計算機視覺研究領(lǐng)域攪動風(fēng)云的人物、2023年度未來科學(xué)大獎數(shù)學(xué)與計算機科學(xué)獎獲得者。

從高考滿分狀元到“CVPR最佳論文獎”第一位華人得主,再到帶領(lǐng)“深度殘差網(wǎng)絡(luò)”研究團隊在比賽中擊敗谷歌等公司奪得第一……年紀輕輕的何愷明早已創(chuàng)下眾多同齡人難以企及的榮譽。2022年,年僅39歲的他力壓全球25萬名科學(xué)家,位居全世界最具影響力學(xué)者排行榜的首位。他的90篇論文,全球引用次數(shù)超過24萬。這意味著,他的研究成果正成為奠定行業(yè)發(fā)展的基石,被網(wǎng)友稱為“AI大神”。

何愷明

少年天才的開掛人生

用開掛式人生來形容何愷明的經(jīng)歷一點不為過。

何愷明1984年出生于廣州,是家中獨子,父母均在企業(yè)里從事管理工作,從小就接觸優(yōu)良的教學(xué)環(huán)境。但因為父母工作比較忙,他的童年不是在游樂場的歡笑聲中度過,而是在少年宮的畫架前靜默成長。那些靜心描摹的日子,悄然鑄就了他堅毅沉穩(wěn)的性格。入學(xué)后,他對知識的渴求同樣細膩而深邃,學(xué)業(yè)成績始終領(lǐng)跑,穩(wěn)如磐石。在師長們眼中,他話語不多,但目標明確,“從小就立志上清華”。

中學(xué)時,何愷明參加各種學(xué)科比賽,取得了卓越的成績,包括全國物理競賽一等獎、廣東省化學(xué)競賽一等獎等,并借此獲取保送清華大學(xué)機械工程與自動化專業(yè)的資格。當(dāng)夢想的學(xué)校就在眼前,他卻做出了一個令人驚訝的選擇:放棄保送機會,走入高考考場,并以900滿分的成績一舉成為2003年廣東省高考狀元,同年進入清華大學(xué)更有挑戰(zhàn)性的基礎(chǔ)科學(xué)班。

大學(xué)期間,何愷明繼續(xù)著自己沉穩(wěn)而優(yōu)秀的表現(xiàn),連續(xù)3年獲得清華獎學(xué)金。2007年,還未畢業(yè)的他就進入微軟亞洲研究院(MSRA)實習(xí)。

從清華畢業(yè)后,何愷明開掛的人生劇本繼續(xù)上演。10年時間里,他先后到香港中文大學(xué)攻讀研究生,加入MSRA從事計算機視覺(CV)方面的研究,2016年加入臉書(Facebook)的人工智能實驗室(FAIR)擔(dān)任研究科學(xué)家。其間,何愷明先后師從孫劍、湯曉鷗等AI名家大師,取得一系列“爆炸級”成果。最為人津津樂道的是,他在10年里,以一作身份獲得3次CV頂會最佳論文,聲名由此遠播。

何愷明在MIT授課

“三連炮”演繹AI佳話

大學(xué)期間,何愷明也像普通學(xué)生一樣玩起了網(wǎng)絡(luò)3D游戲,但他卻“玩出了不一樣的花兒”。游戲中那些帶有霧氣的場景深深吸引了他,這個看似簡單的視覺效果背后究竟蘊含著怎樣的奧秘?如何才能有效地去除這些霧氣,讓畫面更加清晰?這些問題始終縈繞在何愷明腦海,并逐漸成為他研究的方向。

他的努力引起了計算機視覺領(lǐng)域的牛人——孫劍博士的注意,并把他引薦到微軟亞洲研究院實習(xí),這對何愷明來說是個重要的轉(zhuǎn)折點。他做出了一個重要的決定,放棄自己深耕的物理和數(shù)學(xué)研究方向,轉(zhuǎn)而進入形象計算研究,這對他來說是一個巨大的挑戰(zhàn),其間也確實遇到了許多常人難以想象的困難和波折,但他仍堅持自己的選擇。

進入香港中文大學(xué)后何愷明師從AI大師級人物湯曉鷗,在恩師的指引下,他的第一篇文章發(fā)表于2009年,在這一論文里,他提出了“圖像去霧算法”,一出手便摘得了IEEE國際計算機視覺與模式識別會議(CVPR)的年度最佳論文獎。這是CVPR創(chuàng)辦25年以來首次有華人獲獎,同時也是亞洲人第一次獲獎。當(dāng)時湯曉鷗跟何愷明開玩笑說:“你一出手就到了巔峰,從此以后你的學(xué)術(shù)生涯就只能往下走了?!睕]想到,何愷明在MSRA和FAIR的研究成果還能一路走高。

何愷明獨立開展的第一項工作誕生于MSRA。在2015年之前,深度學(xué)習(xí)最多只能訓(xùn)練到20多層,但他提出的深度殘差網(wǎng)絡(luò)(ResNet),在網(wǎng)絡(luò)的每一層引入了一個直聯(lián)通道,從而解決了深度網(wǎng)絡(luò)梯度傳遞的問題。在此之后,人們可以有效地訓(xùn)練超百層的深度學(xué)習(xí)網(wǎng)絡(luò)。憑借相關(guān)成果,何愷明和團隊在ImageNet圖像識別大賽中擊敗了包括谷歌、英特爾等在內(nèi)的全球頂尖團隊,震驚了科技界。也憑借該成果,何愷明在2016年再次獲得CVPR最佳論文獎。

在FAIR,何愷明首次提出一個高性能的物體檢測和算法框架——Mask R-CNN,這一算法解決了圖片中的實例級對象分割問題,不僅能將照片中的人、動物等對象單一檢測。他把基于掩碼的自編碼思想用到了視覺領(lǐng)域的非監(jiān)督學(xué)習(xí)上,一下子打開了計算機視覺領(lǐng)域自監(jiān)督學(xué)習(xí)的大門。這一工作幫助何愷明在2017年獲得了CV屆另一頂會——計算機視覺國際大會(ICCV)的最佳論文獎。至此,何愷明成為世界上少有的畢業(yè)不到10年,3次以第一作者的身份獲得CVPR、ICCV最佳論文的人,演繹了“三連炮”的AI佳話。

對于相關(guān)工作的意義,湯曉鷗曾評價:“何愷明把網(wǎng)絡(luò)做深了,谷歌把網(wǎng)絡(luò)入口拉大了,才成就了今天的大模型。”如今,相關(guān)成果的身影遍及全球,各行各業(yè)都在用,從自動駕駛到醫(yī)療診斷,從安防監(jiān)控到智能家居……年紀輕輕,何愷明就被視為人工智能領(lǐng)域最具影響力的人物之一。

2024年,何愷明正式回歸學(xué)界,加入麻省理工學(xué)院(MIT)電氣工程與計算機科學(xué)系擔(dān)任教職。近日,他的第一波門下弟子曝光——可以看到,4位研究者中有3位是華人,都是頂尖的青年學(xué)者。國際數(shù)學(xué)奧林匹克競賽(IMO)、國際信息學(xué)奧林匹克競賽(IOI)雙料奧賽金牌得主、清華姚班學(xué)霸鄧明揚也在列。錦上添花、未來可期。

評論
羅滑冰
庶吉士級
已學(xué)習(xí)
2024-12-15
科普5dfc4f1bb909c
太傅級
2024-12-15
荊春杰
少傅級
創(chuàng)新是第一動力。人才是第一資源。
2024-12-15