午夜dj在线的www视频在线,亚洲伊人色综合久久天天伊人,天天躁夜夜躁狠狠综合2020,午夜性又黄又爽免费看尤物,中文字幕一区二区三区乱码

核心技術(shù)
產(chǎn)品
解決方案
行業(yè)
開(kāi)發(fā)者
關(guān)于曠視
語(yǔ)言
首頁(yè)新聞資訊學(xué)術(shù)人物

曠視研究院張祥雨:3年看1800篇論文,28歲掌舵曠視基礎(chǔ)模型研究

2019-04-24
在高智商選手云集的AI領(lǐng)域,自詡靠“刷題”成功的張祥雨接連在CVPR、NIPS等頂會(huì)“中獎(jiǎng)”,28歲就擔(dān)任小組leader,為公司開(kāi)辟基礎(chǔ)算法新路。為什么曠視會(huì)把探索未來(lái)的重任交給他?


作者 | 張乾、金磊

來(lái)源 | 新智元(id:AI_era)


曠視把開(kāi)辟基礎(chǔ)算法新路的斧頭交給了28歲的年輕人。


張祥雨,曠視研究院base model組負(fù)責(zé)人,帶領(lǐng)組里30多位年輕人為曠視尋找下一個(gè)兼具學(xué)術(shù)和產(chǎn)業(yè)價(jià)值的算法模型。


在號(hào)稱平均年齡僅24歲的曠視研究院,28歲的張祥雨已經(jīng)有l(wèi)eader的樣子:每天為團(tuán)隊(duì)里來(lái)自清華、北大等名校的員工甚至實(shí)習(xí)生討論和規(guī)劃研究方向,他們的研究成果可能會(huì)決定公司下一個(gè)突破性的基礎(chǔ)技術(shù)。


實(shí)際上,就是這樣一個(gè)不到30歲的年輕人,在近年來(lái)深度學(xué)習(xí)推動(dòng)學(xué)術(shù)和產(chǎn)業(yè)兩界發(fā)展的進(jìn)程中,雖然身居幕后卻享有不世之功:2015年橫空出世的ResNet,張祥雨是主要作者之一,負(fù)責(zé)底層框架和編碼,跟一作何愷明打配合;之后又提出ShuffleNet,ShuffleNet憑借輕量級(jí)低功耗和高性能,成為曠視拿下OPPO、小米等手機(jī)大廠視覺(jué)訂單的技術(shù)核武器。


現(xiàn)在,張祥雨又把研究重點(diǎn)放到了另一個(gè)領(lǐng)域:AutoML。AutoML自動(dòng)化設(shè)計(jì)、訓(xùn)練AI模型,是用 “計(jì)算換智能” 的新范式。如果說(shuō)手工設(shè)計(jì)AI模型是坦克的話,AutoML就是飛機(jī),可以極大地加速產(chǎn)品及解決方案在各行業(yè)落地,大大降低人力操作成本。


張祥雨認(rèn)為,70%的AI從業(yè)者依然從事著能被機(jī)器替代的重復(fù)性工作,AutoML這項(xiàng)看似會(huì)讓AI從業(yè)者“失業(yè)”的工作,他們從去年就已經(jīng)開(kāi)始了,這項(xiàng)工作的意義不僅僅能讓AI自動(dòng)設(shè)計(jì)AI成為現(xiàn)實(shí),更重要的是,還能夠讓曠視的產(chǎn)品和方案找到快速落地的捷徑,提升整個(gè)行業(yè)的AI建模和訓(xùn)練效率,真正實(shí)現(xiàn)“以非凡科技,為客戶和社會(huì)持續(xù)創(chuàng)造最大價(jià)值”。


孫劍的第一個(gè)深度學(xué)習(xí)博士


跟曠視研究院院長(zhǎng)孫劍的經(jīng)歷一樣,張祥雨也是一名“土生土長(zhǎng)”的西安交大人,從本科到博士都在西安交大就讀,在大三那年(2011年),張祥雨拿下了美國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(MCM)特等獎(jiǎng)提名獎(jiǎng)(Finalist),當(dāng)時(shí)創(chuàng)下西安交大參加該項(xiàng)競(jìng)賽以來(lái)歷史最好成績(jī)。


憑借這次獲獎(jiǎng)經(jīng)歷,張祥雨獲得了后來(lái)到微軟亞洲研究院實(shí)習(xí)的資格。


獲得實(shí)習(xí)資格的有三人,但最終只有一個(gè)人能留下。當(dāng)時(shí)還在微軟亞洲研究院擔(dān)任首席研究員的孫劍給這三人出了一道題:用一個(gè)月的時(shí)間,將人臉檢測(cè)的速度提升十倍。


這個(gè)任務(wù)現(xiàn)在來(lái)看比較容易實(shí)現(xiàn),但當(dāng)時(shí)還沒(méi)有引入深度學(xué)習(xí),張祥雨就靠著對(duì)模型調(diào)參,用了三天左右的時(shí)間完成任務(wù),孫劍看過(guò)之后當(dāng)場(chǎng)決定留下張祥雨。


張祥雨之前并沒(méi)有做科研的經(jīng)驗(yàn),這次有意思的實(shí)習(xí)考驗(yàn)讓他初嘗到做科研的成就感。他也意識(shí)到走學(xué)術(shù)路線,需要到產(chǎn)業(yè)界去鍛煉。


到了微軟之后,張祥雨加入了視覺(jué)計(jì)算組,這個(gè)小組里的每一位成員名字放在當(dāng)下來(lái)看都是業(yè)界大牛:小組負(fù)責(zé)人孫劍,組員包括何愷明、危夷晨、代季峰、袁路、曹旭東、任少卿等。


在組里,張祥雨尤其擅長(zhǎng)編程,并且還是唯一一個(gè)會(huì)CUDA人。剛加入小組時(shí),就憑借這一技之長(zhǎng)成為多個(gè)項(xiàng)目的核心成員,比如幫助危夷晨做Head Dance游戲,為袁路做瀏覽器圖片布局等。


2013年,張祥雨面臨一個(gè)重要選擇:博士課題。當(dāng)時(shí)受微軟亞洲研究院工作的一些影響,張祥雨傾向于做人臉這個(gè)領(lǐng)域。但是導(dǎo)師孫劍果斷讓他去做深度學(xué)習(xí),“孫老師認(rèn)為Deep learning以后必然會(huì)火,他一直非常有前瞻力,我很相信他”。


于是,張祥雨就成了孫劍組里第一個(gè)做深度學(xué)習(xí)的博士生。


他做的第一個(gè)深度學(xué)習(xí)相關(guān)的工作就是復(fù)現(xiàn)深度學(xué)習(xí)經(jīng)典論文AlexNet,這篇由Alex Krizhevsky和2018年圖靈獎(jiǎng)得主Geoffrey Hinton等人完成的論文,讓深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)重新崛起。


張祥雨花了兩個(gè)月的時(shí)間對(duì)論文進(jìn)行了復(fù)現(xiàn),包括寫完底層全部code。


復(fù)現(xiàn)AlexNet的經(jīng)歷算是深度學(xué)習(xí)的入門,之后他的主要工作是做框架、寫code。當(dāng)時(shí)深度學(xué)習(xí)的框架非常少,于是張祥雨干脆自己寫了一個(gè),包括CPU和GPU的。


2013年底Caffe問(wèn)世,為了對(duì)Caffe的模型做兼容,張祥雨就把接口也改成Caffe一樣,還起了個(gè)名字叫Caffe Pro。


這份code關(guān)鍵的一個(gè)亮點(diǎn)是支持圖優(yōu)化,支持多卡,這為后來(lái)ResNet的誕生打下了基礎(chǔ)。


ResNet的誕生


在完成這份code以后,孫劍就把何愷明、任少卿、張祥雨拉到一起做深度學(xué)習(xí),在組隊(duì)之前,何愷明做了圖像重建和哈希計(jì)算,任少卿做人臉。


經(jīng)過(guò)一年的磨合,“何張任”組合在孫劍的帶領(lǐng)下小有所成,ECCV、TPAMI等國(guó)際視覺(jué)會(huì)議的論文中開(kāi)始出現(xiàn)這三個(gè)二十多歲中國(guó)人的名字。


這幾位年輕人真正爆發(fā)是在2015年。


當(dāng)時(shí)包括谷歌、百度在內(nèi)的大廠都在參加ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽,當(dāng)時(shí)人類識(shí)別圖像正確分類的誤差率為5.1%,誰(shuí)能打破5.1%,就代表在這一領(lǐng)域機(jī)器超越了人類,而2014年最好的成績(jī)是6.67%,由谷歌創(chuàng)造,但依舊沒(méi)能實(shí)現(xiàn)5.1%,百度也積極嘗試,試圖第一個(gè)打破5.1%。


“何張任”組合決心跟大廠們硬剛一下。


事實(shí)證明,想要突破大廠們都還沒(méi)打破的記錄并非易事。主要是由于神經(jīng)網(wǎng)絡(luò)想提升能力就得持續(xù)加深,但一加深就不收斂,導(dǎo)致實(shí)驗(yàn)結(jié)果很不理想。


有一天,張祥雨突然意識(shí)到收斂的問(wèn)題跟梯度消失有關(guān)系,如果做一些獨(dú)立性假設(shè)的話,是可以推出一套參數(shù)初始化的法則,讓梯度消失的問(wèn)題解決。因此他推導(dǎo)出一組公式,后來(lái)在微軟內(nèi)部命名為“xiangyu初始化法”。


接著,“何張任”組合又引入一種新的修正線性單元(ReLU),將其稱為參數(shù)化修正線性單元(PReLU),并且通過(guò)對(duì)修正線性單元的非線性特征進(jìn)行直接建模,推導(dǎo)出一種符合理論的初始化方法,并直接從頭開(kāi)始訓(xùn)練網(wǎng)絡(luò),將其應(yīng)用于深度模型的收斂過(guò)程。


這種方法應(yīng)用到比賽之后結(jié)果出爐:錯(cuò)誤率已降低至4. 94%,超越人類!


不過(guò),張祥雨認(rèn)為,打破記錄確實(shí)可以長(zhǎng)點(diǎn)臉,但是并不足以證明AI直接超過(guò)了人類。他們發(fā)現(xiàn),挑戰(zhàn)到了后面就完全變成了一個(gè)工程問(wèn)題,成了怎么用有限的資源訓(xùn)練起來(lái)更大的網(wǎng)絡(luò)。


“其實(shí)我個(gè)人是非常不滿意的,因?yàn)殡m然打敗了人類,但更多是一個(gè)噱頭,我們也知道這些方法并不很work,主要是靠調(diào)參和堆模型?!睆埾橛暾f(shuō)。


張祥雨又重新復(fù)盤,他發(fā)現(xiàn)2014年的ImageNet冠軍谷歌GoogLeNet只用了一點(diǎn)幾個(gè)G的復(fù)雜度就實(shí)現(xiàn)了非常高的準(zhǔn)確度,他認(rèn)為GoogLeNet可能是其他幾個(gè)模型的必經(jīng)之路。


經(jīng)過(guò)幾個(gè)月的研究,張祥雨發(fā)現(xiàn),GoogLeNet最本質(zhì)的是它那條1x1的shortcut。“說(shuō)白了,可以把它簡(jiǎn)化到最簡(jiǎn)單,可以發(fā)現(xiàn)GoogLeNet只有兩條路,一條是1×1,另一條路是一1x1和一個(gè)3x3”。


到底是什么在很低的復(fù)雜度上支撐起了GoogLeNet這么高的性能?


張祥雨猜想,它的性能由它的深度決定,為了讓GoogLeNet 22層的網(wǎng)絡(luò)也能夠成功地訓(xùn)練起來(lái),它必須得有一條足夠短的直路。


基于這個(gè)思路,張祥雨開(kāi)始設(shè)計(jì)一個(gè)模型,利用一個(gè)構(gòu)造單元不斷的往上分,雖然模型結(jié)構(gòu)的會(huì)非常復(fù)雜,但是不管怎么復(fù)雜,它永遠(yuǎn)有一條路,但深度可以非常深?!拔艺J(rèn)為這種結(jié)構(gòu)就可以保持足夠的精度,同時(shí)也非常好訓(xùn)練,我把這個(gè)網(wǎng)絡(luò)稱為分形網(wǎng)?!?/span>


張祥雨把分形網(wǎng)的成果跟何愷明商量,何愷明的意見(jiàn)是:結(jié)構(gòu)還是過(guò)于復(fù)雜。


“復(fù)雜的東西往往得不到本質(zhì)”,何愷明一語(yǔ)中的,并建議進(jìn)一步對(duì)這個(gè)模型進(jìn)行化解,用它的一個(gè)簡(jiǎn)化形式。


于是張祥雨又延伸之前的假設(shè):最短的路,決定容易優(yōu)化的程度;最長(zhǎng)的路,決定模型的能力,因此能不能把最短路盡可能的短,短到層數(shù)為零?把最深的路,無(wú)限的變深?


基于這個(gè)思路,誕生了ResNet,有一條路沒(méi)有任何參數(shù),可以認(rèn)為層數(shù)是0。


“何愷明老師的研究思路對(duì)我啟發(fā)很大,從紛繁的結(jié)構(gòu)中找出最work的本質(zhì)屬性,這種極簡(jiǎn)化的思想是ResNet的核心,并且使得ResNet有很強(qiáng)的泛化能力,任何人都可以在基礎(chǔ)上做各種修改,能啟發(fā)別人的研究。”張祥雨說(shuō)。


ResNet提出后,“何張任”組合打比賽,張祥雨負(fù)責(zé)code部分,當(dāng)年一下取得5項(xiàng)挑戰(zhàn)賽第一,“何張任”組合在導(dǎo)師孫劍的指導(dǎo)下獲2016年CVPR最佳論文獎(jiǎng),迄今單篇引用超20000,ResNet也成為計(jì)算機(jī)視覺(jué)領(lǐng)域最流行的框架之一。


從ShuffleNet到AutoML:年輕人拿起了公司戰(zhàn)略的斧頭


2016年7月,孫劍加盟曠視,擔(dān)任首席科學(xué)家,張祥雨也在博士畢業(yè)后追隨導(dǎo)師,開(kāi)啟了在曠視工作的歷程。


而剛剛來(lái)到曠視,張祥雨便遇到了一個(gè)非常嚴(yán)峻的問(wèn)題:產(chǎn)品落地較為困難,特別是在手機(jī)領(lǐng)域,實(shí)在沒(méi)有一個(gè)靠譜的網(wǎng)絡(luò)可以去依賴。


就在這時(shí),作為論文評(píng)審的張祥雨審了一篇論文,這篇論文是Keras作者Fran?ois Chollet等人寫的,張祥雨比較認(rèn)可論文里所提到的Xception網(wǎng)絡(luò),他敏銳地意識(shí)到這個(gè)idea可以用于輕量級(jí)網(wǎng)絡(luò)設(shè)計(jì),“以后絕對(duì)可以用到移動(dòng)端”,是未來(lái)可發(fā)展的一個(gè)方向,并且還給了這篇論文一個(gè)Oral。


雖然這篇論文后來(lái)被另外的評(píng)審給否了,但是給張祥雨帶來(lái)非常大的靈感和啟發(fā)。不久之后,張祥雨和同事周昕宇開(kāi)始一起研究移動(dòng)端模型,在前期的工作基礎(chǔ)上提出了一個(gè)高性能模型,二人不謀而合,同時(shí)想到了一個(gè)想法——Shuffle。


二人在努力合作后,以共同一作的身份中標(biāo)了CVPR,并且不論是從實(shí)驗(yàn)結(jié)果還是對(duì)業(yè)界的影響上,ShuffleNet都是成為移動(dòng)端網(wǎng)絡(luò)模型的杰出代表之一,2017年蘋果推出帶有3D人臉解鎖功能的iPhoneX ,安卓手機(jī)廠商隨后跟進(jìn),包括VIVO、小米還有錘子手機(jī)的人臉解鎖技術(shù),其實(shí)就是ShuffleNet在背后提供計(jì)算,能夠讓各種配置不一的手機(jī)都能實(shí)現(xiàn)毫秒級(jí)人臉解鎖。


2018年,作為ShuffleNet的升級(jí)版,ShuffleNet V2 為ECCV 2018 所收錄。而在剛剛落幕的VALSE 2019中,ShuffleNet V2 一舉斬獲拿下 “VALSE 2018 年度杰出學(xué)生論文獎(jiǎng)”。其論文技術(shù)及一套輕量高效模型方法論的提出,有遷移通用能力的同時(shí),還兼具理論實(shí)踐意義和學(xué)術(shù)借鑒意義。


技術(shù)有時(shí)候是為了跟上業(yè)務(wù)需求,但對(duì)曠視和張祥雨而言,需要做出一些超前的底層技術(shù),能夠讓技術(shù)預(yù)見(jiàn)到公司未來(lái)幾年戰(zhàn)略需求,同時(shí)還能拉開(kāi)跟對(duì)手的差距,是最理想的情況,但這對(duì)一個(gè)年僅28歲的年輕人來(lái)說(shuō)并非易事。


在關(guān)鍵時(shí)刻,導(dǎo)師孫劍的建議起到了非常重要的作用。當(dāng)年張祥雨還是博士生時(shí),孫劍建議他做深度學(xué)習(xí);2017年,孫劍建議他做高性能網(wǎng)絡(luò),2018年,孫劍建議做AutoML。


AutoML領(lǐng)域的研究,之前一直是被國(guó)外如谷歌、微軟等大企業(yè)“壟斷”的狀態(tài),谷歌已經(jīng)推出Cloud AutoML產(chǎn)品,走得非常前面,既能讓公司業(yè)務(wù)有很好的落地路徑,也給競(jìng)爭(zhēng)對(duì)手造成了不小壓力。


經(jīng)過(guò)一年多的研究,今年4月,張祥雨作為共同一作發(fā)表了曠視的第一篇AutoML技術(shù)論文。論文提出的超網(wǎng)絡(luò)包含所有子結(jié)構(gòu),只訓(xùn)練一次,所有子結(jié)構(gòu)便可以直接從超網(wǎng)絡(luò)獲得其權(quán)重,無(wú)需從頭訓(xùn)練。實(shí)驗(yàn)結(jié)果表明,在精度、內(nèi)存消耗、訓(xùn)練時(shí)間、模型搜索的有效性及靈活性方面最優(yōu),超過(guò)了谷歌、Facebook等公司AutoML的成績(jī)。


模型自動(dòng)化是當(dāng)前AI技術(shù)的一個(gè)趨勢(shì)和未來(lái)浪潮,也成為曠視人工智能框架Brain++的核心要素之一,拉通從數(shù)據(jù)到部署的算法全要素、全流程生產(chǎn),曠視研究院的Brain++ AutoML將成為戰(zhàn)略升級(jí)的重要技術(shù)支撐??梢哉f(shuō),張祥雨的工作直接影響著公司未來(lái)業(yè)務(wù)。


大學(xué)也刷題,三年看1800篇論文


不同于曠視研究院常被提及的各類金牌得主、高智商神童,即便自己的學(xué)生生涯始終保持著Top1的績(jī)點(diǎn),張祥雨也從不認(rèn)為自己是“神童”型選手?!拔屹Y質(zhì)真的一般,都是拼命刷題刷的?!?/span>


那么在高智商選手云集的AI領(lǐng)域,接連在CVPR、NIPS等頂會(huì)“中獎(jiǎng)”的人為什么是他?28歲就能拿起斧頭為公司開(kāi)辟基礎(chǔ)算法新路的人,為什么也是他?


在曠視研究院的工區(qū),張祥雨的工位很難不被注意到,新智元看到在他桌子上高壘著兩摞紙,張祥雨說(shuō)這是他最近在看的論文。



“從2016年到現(xiàn)在,我已經(jīng)看了1800篇了,看過(guò)的都用軟件記下來(lái)”。粗略算一下,張祥雨平均每天看兩篇論文。而這只是他每天做實(shí)驗(yàn)、管理團(tuán)隊(duì)之余,停歇片刻去做的事情。


今年,4月16日,北京智源人工智能研究院發(fā)布“智源學(xué)者計(jì)劃”,公布了首批智源青年科學(xué)家候選人名單,張祥雨是九位候選人中最年輕的一位。



作為一位過(guò)來(lái)者,張祥雨也經(jīng)歷了從求學(xué)到求職、從研究團(tuán)隊(duì)的組員到組長(zhǎng)的成長(zhǎng)歷程。在新智元的專訪過(guò)程中,張祥雨也為年輕的學(xué)生或初入職場(chǎng)的新人提出了兩個(gè)建議:腳踏實(shí)地以夯實(shí)基礎(chǔ)和開(kāi)拓視野以保持前瞻,他認(rèn)為這兩點(diǎn)是AI領(lǐng)域從業(yè)者的必要素質(zhì),而他一直身體力行。


曠視研究院張祥雨:3年看1800篇論文,28歲掌舵曠視基礎(chǔ)模型研究

2019-04-24
在高智商選手云集的AI領(lǐng)域,自詡靠“刷題”成功的張祥雨接連在CVPR、NIPS等頂會(huì)“中獎(jiǎng)”,28歲就擔(dān)任小組leader,為公司開(kāi)辟基礎(chǔ)算法新路。為什么曠視會(huì)把探索未來(lái)的重任交給他?


作者 | 張乾、金磊

來(lái)源 | 新智元(id:AI_era)


曠視把開(kāi)辟基礎(chǔ)算法新路的斧頭交給了28歲的年輕人。


張祥雨,曠視研究院base model組負(fù)責(zé)人,帶領(lǐng)組里30多位年輕人為曠視尋找下一個(gè)兼具學(xué)術(shù)和產(chǎn)業(yè)價(jià)值的算法模型。


在號(hào)稱平均年齡僅24歲的曠視研究院,28歲的張祥雨已經(jīng)有l(wèi)eader的樣子:每天為團(tuán)隊(duì)里來(lái)自清華、北大等名校的員工甚至實(shí)習(xí)生討論和規(guī)劃研究方向,他們的研究成果可能會(huì)決定公司下一個(gè)突破性的基礎(chǔ)技術(shù)。


實(shí)際上,就是這樣一個(gè)不到30歲的年輕人,在近年來(lái)深度學(xué)習(xí)推動(dòng)學(xué)術(shù)和產(chǎn)業(yè)兩界發(fā)展的進(jìn)程中,雖然身居幕后卻享有不世之功:2015年橫空出世的ResNet,張祥雨是主要作者之一,負(fù)責(zé)底層框架和編碼,跟一作何愷明打配合;之后又提出ShuffleNet,ShuffleNet憑借輕量級(jí)低功耗和高性能,成為曠視拿下OPPO、小米等手機(jī)大廠視覺(jué)訂單的技術(shù)核武器。


現(xiàn)在,張祥雨又把研究重點(diǎn)放到了另一個(gè)領(lǐng)域:AutoML。AutoML自動(dòng)化設(shè)計(jì)、訓(xùn)練AI模型,是用 “計(jì)算換智能” 的新范式。如果說(shuō)手工設(shè)計(jì)AI模型是坦克的話,AutoML就是飛機(jī),可以極大地加速產(chǎn)品及解決方案在各行業(yè)落地,大大降低人力操作成本。


張祥雨認(rèn)為,70%的AI從業(yè)者依然從事著能被機(jī)器替代的重復(fù)性工作,AutoML這項(xiàng)看似會(huì)讓AI從業(yè)者“失業(yè)”的工作,他們從去年就已經(jīng)開(kāi)始了,這項(xiàng)工作的意義不僅僅能讓AI自動(dòng)設(shè)計(jì)AI成為現(xiàn)實(shí),更重要的是,還能夠讓曠視的產(chǎn)品和方案找到快速落地的捷徑,提升整個(gè)行業(yè)的AI建模和訓(xùn)練效率,真正實(shí)現(xiàn)“以非凡科技,為客戶和社會(huì)持續(xù)創(chuàng)造最大價(jià)值”。


孫劍的第一個(gè)深度學(xué)習(xí)博士


跟曠視研究院院長(zhǎng)孫劍的經(jīng)歷一樣,張祥雨也是一名“土生土長(zhǎng)”的西安交大人,從本科到博士都在西安交大就讀,在大三那年(2011年),張祥雨拿下了美國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽(MCM)特等獎(jiǎng)提名獎(jiǎng)(Finalist),當(dāng)時(shí)創(chuàng)下西安交大參加該項(xiàng)競(jìng)賽以來(lái)歷史最好成績(jī)。


憑借這次獲獎(jiǎng)經(jīng)歷,張祥雨獲得了后來(lái)到微軟亞洲研究院實(shí)習(xí)的資格。


獲得實(shí)習(xí)資格的有三人,但最終只有一個(gè)人能留下。當(dāng)時(shí)還在微軟亞洲研究院擔(dān)任首席研究員的孫劍給這三人出了一道題:用一個(gè)月的時(shí)間,將人臉檢測(cè)的速度提升十倍。


這個(gè)任務(wù)現(xiàn)在來(lái)看比較容易實(shí)現(xiàn),但當(dāng)時(shí)還沒(méi)有引入深度學(xué)習(xí),張祥雨就靠著對(duì)模型調(diào)參,用了三天左右的時(shí)間完成任務(wù),孫劍看過(guò)之后當(dāng)場(chǎng)決定留下張祥雨。


張祥雨之前并沒(méi)有做科研的經(jīng)驗(yàn),這次有意思的實(shí)習(xí)考驗(yàn)讓他初嘗到做科研的成就感。他也意識(shí)到走學(xué)術(shù)路線,需要到產(chǎn)業(yè)界去鍛煉。


到了微軟之后,張祥雨加入了視覺(jué)計(jì)算組,這個(gè)小組里的每一位成員名字放在當(dāng)下來(lái)看都是業(yè)界大牛:小組負(fù)責(zé)人孫劍,組員包括何愷明、危夷晨、代季峰、袁路、曹旭東、任少卿等。


在組里,張祥雨尤其擅長(zhǎng)編程,并且還是唯一一個(gè)會(huì)CUDA人。剛加入小組時(shí),就憑借這一技之長(zhǎng)成為多個(gè)項(xiàng)目的核心成員,比如幫助危夷晨做Head Dance游戲,為袁路做瀏覽器圖片布局等。


2013年,張祥雨面臨一個(gè)重要選擇:博士課題。當(dāng)時(shí)受微軟亞洲研究院工作的一些影響,張祥雨傾向于做人臉這個(gè)領(lǐng)域。但是導(dǎo)師孫劍果斷讓他去做深度學(xué)習(xí),“孫老師認(rèn)為Deep learning以后必然會(huì)火,他一直非常有前瞻力,我很相信他”。


于是,張祥雨就成了孫劍組里第一個(gè)做深度學(xué)習(xí)的博士生。


他做的第一個(gè)深度學(xué)習(xí)相關(guān)的工作就是復(fù)現(xiàn)深度學(xué)習(xí)經(jīng)典論文AlexNet,這篇由Alex Krizhevsky和2018年圖靈獎(jiǎng)得主Geoffrey Hinton等人完成的論文,讓深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)重新崛起。


張祥雨花了兩個(gè)月的時(shí)間對(duì)論文進(jìn)行了復(fù)現(xiàn),包括寫完底層全部code。


復(fù)現(xiàn)AlexNet的經(jīng)歷算是深度學(xué)習(xí)的入門,之后他的主要工作是做框架、寫code。當(dāng)時(shí)深度學(xué)習(xí)的框架非常少,于是張祥雨干脆自己寫了一個(gè),包括CPU和GPU的。


2013年底Caffe問(wèn)世,為了對(duì)Caffe的模型做兼容,張祥雨就把接口也改成Caffe一樣,還起了個(gè)名字叫Caffe Pro。


這份code關(guān)鍵的一個(gè)亮點(diǎn)是支持圖優(yōu)化,支持多卡,這為后來(lái)ResNet的誕生打下了基礎(chǔ)。


ResNet的誕生


在完成這份code以后,孫劍就把何愷明、任少卿、張祥雨拉到一起做深度學(xué)習(xí),在組隊(duì)之前,何愷明做了圖像重建和哈希計(jì)算,任少卿做人臉。


經(jīng)過(guò)一年的磨合,“何張任”組合在孫劍的帶領(lǐng)下小有所成,ECCV、TPAMI等國(guó)際視覺(jué)會(huì)議的論文中開(kāi)始出現(xiàn)這三個(gè)二十多歲中國(guó)人的名字。


這幾位年輕人真正爆發(fā)是在2015年。


當(dāng)時(shí)包括谷歌、百度在內(nèi)的大廠都在參加ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)賽,當(dāng)時(shí)人類識(shí)別圖像正確分類的誤差率為5.1%,誰(shuí)能打破5.1%,就代表在這一領(lǐng)域機(jī)器超越了人類,而2014年最好的成績(jī)是6.67%,由谷歌創(chuàng)造,但依舊沒(méi)能實(shí)現(xiàn)5.1%,百度也積極嘗試,試圖第一個(gè)打破5.1%。


“何張任”組合決心跟大廠們硬剛一下。


事實(shí)證明,想要突破大廠們都還沒(méi)打破的記錄并非易事。主要是由于神經(jīng)網(wǎng)絡(luò)想提升能力就得持續(xù)加深,但一加深就不收斂,導(dǎo)致實(shí)驗(yàn)結(jié)果很不理想。


有一天,張祥雨突然意識(shí)到收斂的問(wèn)題跟梯度消失有關(guān)系,如果做一些獨(dú)立性假設(shè)的話,是可以推出一套參數(shù)初始化的法則,讓梯度消失的問(wèn)題解決。因此他推導(dǎo)出一組公式,后來(lái)在微軟內(nèi)部命名為“xiangyu初始化法”。


接著,“何張任”組合又引入一種新的修正線性單元(ReLU),將其稱為參數(shù)化修正線性單元(PReLU),并且通過(guò)對(duì)修正線性單元的非線性特征進(jìn)行直接建模,推導(dǎo)出一種符合理論的初始化方法,并直接從頭開(kāi)始訓(xùn)練網(wǎng)絡(luò),將其應(yīng)用于深度模型的收斂過(guò)程。


這種方法應(yīng)用到比賽之后結(jié)果出爐:錯(cuò)誤率已降低至4. 94%,超越人類!


不過(guò),張祥雨認(rèn)為,打破記錄確實(shí)可以長(zhǎng)點(diǎn)臉,但是并不足以證明AI直接超過(guò)了人類。他們發(fā)現(xiàn),挑戰(zhàn)到了后面就完全變成了一個(gè)工程問(wèn)題,成了怎么用有限的資源訓(xùn)練起來(lái)更大的網(wǎng)絡(luò)。


“其實(shí)我個(gè)人是非常不滿意的,因?yàn)殡m然打敗了人類,但更多是一個(gè)噱頭,我們也知道這些方法并不很work,主要是靠調(diào)參和堆模型?!睆埾橛暾f(shuō)。


張祥雨又重新復(fù)盤,他發(fā)現(xiàn)2014年的ImageNet冠軍谷歌GoogLeNet只用了一點(diǎn)幾個(gè)G的復(fù)雜度就實(shí)現(xiàn)了非常高的準(zhǔn)確度,他認(rèn)為GoogLeNet可能是其他幾個(gè)模型的必經(jīng)之路。


經(jīng)過(guò)幾個(gè)月的研究,張祥雨發(fā)現(xiàn),GoogLeNet最本質(zhì)的是它那條1x1的shortcut?!罢f(shuō)白了,可以把它簡(jiǎn)化到最簡(jiǎn)單,可以發(fā)現(xiàn)GoogLeNet只有兩條路,一條是1×1,另一條路是一1x1和一個(gè)3x3”。


到底是什么在很低的復(fù)雜度上支撐起了GoogLeNet這么高的性能?


張祥雨猜想,它的性能由它的深度決定,為了讓GoogLeNet 22層的網(wǎng)絡(luò)也能夠成功地訓(xùn)練起來(lái),它必須得有一條足夠短的直路。


基于這個(gè)思路,張祥雨開(kāi)始設(shè)計(jì)一個(gè)模型,利用一個(gè)構(gòu)造單元不斷的往上分,雖然模型結(jié)構(gòu)的會(huì)非常復(fù)雜,但是不管怎么復(fù)雜,它永遠(yuǎn)有一條路,但深度可以非常深。“我認(rèn)為這種結(jié)構(gòu)就可以保持足夠的精度,同時(shí)也非常好訓(xùn)練,我把這個(gè)網(wǎng)絡(luò)稱為分形網(wǎng)?!?/span>


張祥雨把分形網(wǎng)的成果跟何愷明商量,何愷明的意見(jiàn)是:結(jié)構(gòu)還是過(guò)于復(fù)雜。


“復(fù)雜的東西往往得不到本質(zhì)”,何愷明一語(yǔ)中的,并建議進(jìn)一步對(duì)這個(gè)模型進(jìn)行化解,用它的一個(gè)簡(jiǎn)化形式。


于是張祥雨又延伸之前的假設(shè):最短的路,決定容易優(yōu)化的程度;最長(zhǎng)的路,決定模型的能力,因此能不能把最短路盡可能的短,短到層數(shù)為零?把最深的路,無(wú)限的變深?


基于這個(gè)思路,誕生了ResNet,有一條路沒(méi)有任何參數(shù),可以認(rèn)為層數(shù)是0。


“何愷明老師的研究思路對(duì)我啟發(fā)很大,從紛繁的結(jié)構(gòu)中找出最work的本質(zhì)屬性,這種極簡(jiǎn)化的思想是ResNet的核心,并且使得ResNet有很強(qiáng)的泛化能力,任何人都可以在基礎(chǔ)上做各種修改,能啟發(fā)別人的研究?!睆埾橛暾f(shuō)。


ResNet提出后,“何張任”組合打比賽,張祥雨負(fù)責(zé)code部分,當(dāng)年一下取得5項(xiàng)挑戰(zhàn)賽第一,“何張任”組合在導(dǎo)師孫劍的指導(dǎo)下獲2016年CVPR最佳論文獎(jiǎng),迄今單篇引用超20000,ResNet也成為計(jì)算機(jī)視覺(jué)領(lǐng)域最流行的框架之一。


從ShuffleNet到AutoML:年輕人拿起了公司戰(zhàn)略的斧頭


2016年7月,孫劍加盟曠視,擔(dān)任首席科學(xué)家,張祥雨也在博士畢業(yè)后追隨導(dǎo)師,開(kāi)啟了在曠視工作的歷程。


而剛剛來(lái)到曠視,張祥雨便遇到了一個(gè)非常嚴(yán)峻的問(wèn)題:產(chǎn)品落地較為困難,特別是在手機(jī)領(lǐng)域,實(shí)在沒(méi)有一個(gè)靠譜的網(wǎng)絡(luò)可以去依賴。


就在這時(shí),作為論文評(píng)審的張祥雨審了一篇論文,這篇論文是Keras作者Fran?ois Chollet等人寫的,張祥雨比較認(rèn)可論文里所提到的Xception網(wǎng)絡(luò),他敏銳地意識(shí)到這個(gè)idea可以用于輕量級(jí)網(wǎng)絡(luò)設(shè)計(jì),“以后絕對(duì)可以用到移動(dòng)端”,是未來(lái)可發(fā)展的一個(gè)方向,并且還給了這篇論文一個(gè)Oral。


雖然這篇論文后來(lái)被另外的評(píng)審給否了,但是給張祥雨帶來(lái)非常大的靈感和啟發(fā)。不久之后,張祥雨和同事周昕宇開(kāi)始一起研究移動(dòng)端模型,在前期的工作基礎(chǔ)上提出了一個(gè)高性能模型,二人不謀而合,同時(shí)想到了一個(gè)想法——Shuffle。


二人在努力合作后,以共同一作的身份中標(biāo)了CVPR,并且不論是從實(shí)驗(yàn)結(jié)果還是對(duì)業(yè)界的影響上,ShuffleNet都是成為移動(dòng)端網(wǎng)絡(luò)模型的杰出代表之一,2017年蘋果推出帶有3D人臉解鎖功能的iPhoneX ,安卓手機(jī)廠商隨后跟進(jìn),包括VIVO、小米還有錘子手機(jī)的人臉解鎖技術(shù),其實(shí)就是ShuffleNet在背后提供計(jì)算,能夠讓各種配置不一的手機(jī)都能實(shí)現(xiàn)毫秒級(jí)人臉解鎖。


2018年,作為ShuffleNet的升級(jí)版,ShuffleNet V2 為ECCV 2018 所收錄。而在剛剛落幕的VALSE 2019中,ShuffleNet V2 一舉斬獲拿下 “VALSE 2018 年度杰出學(xué)生論文獎(jiǎng)”。其論文技術(shù)及一套輕量高效模型方法論的提出,有遷移通用能力的同時(shí),還兼具理論實(shí)踐意義和學(xué)術(shù)借鑒意義。


技術(shù)有時(shí)候是為了跟上業(yè)務(wù)需求,但對(duì)曠視和張祥雨而言,需要做出一些超前的底層技術(shù),能夠讓技術(shù)預(yù)見(jiàn)到公司未來(lái)幾年戰(zhàn)略需求,同時(shí)還能拉開(kāi)跟對(duì)手的差距,是最理想的情況,但這對(duì)一個(gè)年僅28歲的年輕人來(lái)說(shuō)并非易事。


在關(guān)鍵時(shí)刻,導(dǎo)師孫劍的建議起到了非常重要的作用。當(dāng)年張祥雨還是博士生時(shí),孫劍建議他做深度學(xué)習(xí);2017年,孫劍建議他做高性能網(wǎng)絡(luò),2018年,孫劍建議做AutoML。


AutoML領(lǐng)域的研究,之前一直是被國(guó)外如谷歌、微軟等大企業(yè)“壟斷”的狀態(tài),谷歌已經(jīng)推出Cloud AutoML產(chǎn)品,走得非常前面,既能讓公司業(yè)務(wù)有很好的落地路徑,也給競(jìng)爭(zhēng)對(duì)手造成了不小壓力。


經(jīng)過(guò)一年多的研究,今年4月,張祥雨作為共同一作發(fā)表了曠視的第一篇AutoML技術(shù)論文。論文提出的超網(wǎng)絡(luò)包含所有子結(jié)構(gòu),只訓(xùn)練一次,所有子結(jié)構(gòu)便可以直接從超網(wǎng)絡(luò)獲得其權(quán)重,無(wú)需從頭訓(xùn)練。實(shí)驗(yàn)結(jié)果表明,在精度、內(nèi)存消耗、訓(xùn)練時(shí)間、模型搜索的有效性及靈活性方面最優(yōu),超過(guò)了谷歌、Facebook等公司AutoML的成績(jī)。


模型自動(dòng)化是當(dāng)前AI技術(shù)的一個(gè)趨勢(shì)和未來(lái)浪潮,也成為曠視人工智能框架Brain++的核心要素之一,拉通從數(shù)據(jù)到部署的算法全要素、全流程生產(chǎn),曠視研究院的Brain++ AutoML將成為戰(zhàn)略升級(jí)的重要技術(shù)支撐??梢哉f(shuō),張祥雨的工作直接影響著公司未來(lái)業(yè)務(wù)。


大學(xué)也刷題,三年看1800篇論文


不同于曠視研究院常被提及的各類金牌得主、高智商神童,即便自己的學(xué)生生涯始終保持著Top1的績(jī)點(diǎn),張祥雨也從不認(rèn)為自己是“神童”型選手。“我資質(zhì)真的一般,都是拼命刷題刷的?!?/span>


那么在高智商選手云集的AI領(lǐng)域,接連在CVPR、NIPS等頂會(huì)“中獎(jiǎng)”的人為什么是他?28歲就能拿起斧頭為公司開(kāi)辟基礎(chǔ)算法新路的人,為什么也是他?


在曠視研究院的工區(qū),張祥雨的工位很難不被注意到,新智元看到在他桌子上高壘著兩摞紙,張祥雨說(shuō)這是他最近在看的論文。



“從2016年到現(xiàn)在,我已經(jīng)看了1800篇了,看過(guò)的都用軟件記下來(lái)”。粗略算一下,張祥雨平均每天看兩篇論文。而這只是他每天做實(shí)驗(yàn)、管理團(tuán)隊(duì)之余,停歇片刻去做的事情。


今年,4月16日,北京智源人工智能研究院發(fā)布“智源學(xué)者計(jì)劃”,公布了首批智源青年科學(xué)家候選人名單,張祥雨是九位候選人中最年輕的一位。



作為一位過(guò)來(lái)者,張祥雨也經(jīng)歷了從求學(xué)到求職、從研究團(tuán)隊(duì)的組員到組長(zhǎng)的成長(zhǎng)歷程。在新智元的專訪過(guò)程中,張祥雨也為年輕的學(xué)生或初入職場(chǎng)的新人提出了兩個(gè)建議:腳踏實(shí)地以夯實(shí)基礎(chǔ)和開(kāi)拓視野以保持前瞻,他認(rèn)為這兩點(diǎn)是AI領(lǐng)域從業(yè)者的必要素質(zhì),而他一直身體力行。


熱門新聞
聯(lián)系我們