從去年火出天際的元宇宙,到今年年初的現(xiàn)象級應(yīng)用 ChatGPT,科技圈似乎從不缺少熱門的技術(shù)概念與話題。尤其是在云計算、人工智能、大數(shù)據(jù)等技術(shù)呈爆發(fā)式增長的背景下,我們愈發(fā)體會到前沿技術(shù)對于產(chǎn)業(yè)產(chǎn)生的深遠影響,而這也延伸出了其他問題:前沿技術(shù)的邊界在哪?如何與具體的應(yīng)用場景融合?
以上這些問題或許看起來有些抽象、復(fù)雜,但我們從阿里巴巴創(chuàng)新研究計劃(Alibaba Innovative Research, AIR)中,似乎找到了一些解決方案。自 2017 年開始,每年有大批全球頂尖高校 / 研究機構(gòu)學(xué)者與阿里巴巴集團的工程師,就前沿技術(shù)問題展開研究,一方面促進學(xué)術(shù)研究深入產(chǎn)業(yè);另一方面,AIR計劃提供的開放性研究基金和實際的前沿場景,也有效助力了高校青年教師、學(xué)術(shù)人才的成長和優(yōu)秀研究型學(xué)生的培養(yǎng)。
在過去的 2022 年,共有 15 個項目從眾多申報項目中脫穎而出。我們邀約了獲獎項目的數(shù)十位優(yōu)秀學(xué)術(shù)代表,以期深入理解學(xué)術(shù)界和產(chǎn)業(yè)界如何更高效地協(xié)同創(chuàng)新,以及對整個行業(yè)和社會未來發(fā)展的影響。(文末附阿里巴巴年度優(yōu)秀學(xué)術(shù)合作項目名單)
01AIR 計劃:做從基礎(chǔ)研究
到應(yīng)用落地的“架橋者”
過去,從基礎(chǔ)研究到應(yīng)用落地似乎是橫亙在學(xué)術(shù)界和工業(yè)界的鴻溝,這種現(xiàn)象在人工智能領(lǐng)域尤為突出。舉例來說,如果一個訓(xùn)練模型沒有與實際業(yè)務(wù)場景磨合,很可能在各種因素的影響下導(dǎo)致正確率的折損。把其類比到學(xué)術(shù)界與工業(yè)界也是如此,如果高校只著眼于理論問題的研究,企業(yè)只是生搬硬套,前沿技術(shù)的落地情況自然也不盡人意。
阿里發(fā)起 AIR 計劃的初衷便是在學(xué)術(shù)界與工業(yè)界二者間架起一座橋梁。從這幾年的實踐效果看下來,企業(yè)與高校合作或許是突破應(yīng)用場景技術(shù)難題的結(jié)合模式之一。
通過 AIR 計劃,高校可以直接定位工業(yè)界的痛點問題,再有針對性地進行算法研究,而企業(yè)則可以提供算法的落地場景,來驗證方案是否可行。兩者通過不斷的磨合可以定位實際問題、發(fā)現(xiàn)真實需求,達到有效的互動。
正如上海交通大學(xué)鄭臻哲老師在接受采訪時提到的:“通過 AIR 計劃,我們能接觸到工業(yè)界的痛點問題,從落地應(yīng)用的視角思考模型算法研究,進一步加強理論聯(lián)系實際,做對學(xué)術(shù)界與工業(yè)界都有影響力的工作”。大淘寶技術(shù)團隊和他將機器學(xué)習(xí)特別是深度學(xué)習(xí)技術(shù)引入到工業(yè)界拍賣機制設(shè)計中,成為業(yè)界的首次嘗試,取得了很多理論和技術(shù)上的突破,同時也得到了學(xué)術(shù)界的廣泛關(guān)注。一些具備重大攻堅意義的課題也在不斷交流、探討中逐漸變得可行。
如果讓我們評價前沿技術(shù)探索的實際價值?這個問題或許很難回答,也沒有標準答案。但當一項技術(shù)在產(chǎn)業(yè)界產(chǎn)生實際價值時,前行者會實實在在感受到技術(shù)紅利,以此為標準來看待這個問題似乎容易了很多。“關(guān)鍵性的技術(shù)突破雖然在技術(shù)上只是百分之幾的變化,但帶來的可落地場景卻是十幾倍的增加”。阿里巴巴淘寶技術(shù)團隊的詠亮在采訪時表示。
基于過去多年校企之間的協(xié)同,AIR 計劃吸引了全球眾多國家和地區(qū)的數(shù)百余所頂級科研機構(gòu)參與,包括哈佛大學(xué)、斯坦福大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、新加坡南洋理工大學(xué)等高校,中國高校與研究所申請總量的 80% 來自 985 高校和中科院,先后有十幾位 IEEE Fellow 和 TR35 與阿里巴巴合作,相關(guān)成果通過論文、專利、項目等形式讓產(chǎn)業(yè)從中受益。
02平臺搭好了,學(xué)術(shù)界與工業(yè)界
如何合作實現(xiàn)創(chuàng)新突破?
上述提到的優(yōu)秀學(xué)術(shù)項目,為何能取得基礎(chǔ)理論和落地應(yīng)用的雙突破?雙方打好配合,或許才是讓合作價值最大化的關(guān)鍵?;趯Χ辔粌?yōu)秀學(xué)術(shù)專家的訪談,總結(jié)了三點校企合作的實踐經(jīng)驗:
第一,雙方要找準自身定位。來自浙江大學(xué)的尤偉濤有一個很強烈的感慨,他認為:理論研究不僅要上天也要入地,高校做學(xué)術(shù)時也要考慮應(yīng)用,否則落地就會很困難;企業(yè)也要明確定義出問題,找出學(xué)術(shù)價值。對此,大淘寶技術(shù)呂承飛也表達了相似的觀點:“命題需要來源于業(yè)務(wù)又高于業(yè)務(wù),提煉出科學(xué)理論問題是尤為關(guān)鍵的一步?!?/p>
第二,在優(yōu)勢互通的基礎(chǔ)上,打破思維定式。就如同上文所言,高校與企業(yè)思考問題的角度其實是不同的,如果各自為營,兩者之間的鴻溝只會越來越大,但如果大家能在不斷磨合中,持續(xù)碰撞思路更有利于雙方互通有無。
拿《端云協(xié)同超大規(guī)模分布式推薦系統(tǒng)的算法研究和系統(tǒng)實現(xiàn)》的推進過程舉例,憑借云側(cè)大規(guī)模模型實時訓(xùn)練和端側(cè)動態(tài)感知用戶的雙重優(yōu)勢,“端云協(xié)同學(xué)習(xí)”成為了業(yè)內(nèi)備受關(guān)注的焦點,并被阿里巴巴達摩院列為 2022 年 10 大技術(shù)趨勢之一。然而在熱潮之下,校企雙方在推進時也遇到了一些挑戰(zhàn),“千人千模”中小樣本學(xué)習(xí)過擬合便是其中之一。
受限于端側(cè)只有單個用戶的瀏覽量、點擊量等數(shù)據(jù),如果只根據(jù)用戶自己的數(shù)據(jù)對模型訓(xùn)練,便會遇到中小樣本過擬合的問題。上海交通大學(xué)吳帆提到:“一開始我們其實被這個問題絆住了,很難突破本地數(shù)據(jù)的限制?!钡谘芯窟^程中逐漸發(fā)現(xiàn),雖然原始數(shù)據(jù)不能離開本地,但數(shù)據(jù)特征、訓(xùn)練參數(shù)以及一些中間的結(jié)果是可以離開本地的,需要把云作為中心服務(wù)器的協(xié)調(diào)特性發(fā)揮出來。最終,雙方打破了之前的思維定式,有效地解決上述問題。
第三,校企雙方在資源上的協(xié)同也是項目成功的另一關(guān)鍵要素。在采訪《端云協(xié)同超大規(guī)模分布式推薦系統(tǒng)的算法研究和系統(tǒng)實現(xiàn)》的專家代表呂承飛時了解到。目前,這套體系可以在搜索、推薦、內(nèi)容理解等場景中應(yīng)用。
而雙方的合作能夠取得如此亮眼的成績,一方面是源于雙方對于端云協(xié)同技術(shù)方向的一致認同,他們認為端云協(xié)同可以有效解決人工智能服務(wù)最后一公里的問題,也是人工智能進一步發(fā)展的必要支撐;另一方面,還離不開阿里在基礎(chǔ)設(shè)施平臺的背后支持。通過阿里巴巴機器學(xué)習(xí)基礎(chǔ)設(shè)施 Walle,實現(xiàn)了數(shù)據(jù)在端云之間的傳輸,最終才讓端云協(xié)同發(fā)揮出了最大價值。值得一提的是,大淘寶技術(shù)團隊還在論文中詳述了阿里自主研發(fā) Walle 的實現(xiàn)過程,該論文目前已入選了計算機系統(tǒng)領(lǐng)域頂級國際學(xué)術(shù)會議 OSDI,這也是淘寶系統(tǒng)論文首次入選該國際頂會。
03堅持長期主義,支持優(yōu)秀學(xué)者發(fā)展,創(chuàng)造更大社會價值
如果說校企的高效協(xié)同是優(yōu)秀學(xué)術(shù)項目取得亮眼成績的充分條件,那么日積月累的磨合則是雙方發(fā)展的必要條件。
在和優(yōu)秀學(xué)術(shù)項目的專家代表溝通時了解到,大多數(shù)項目的推進時間都在 3-5 年左右,AIR 計劃更是陪伴了一大批學(xué)者經(jīng)歷了從早期起步到逐漸成熟的階段。例如,浙江大學(xué)的尤偉濤老師在博士階段就參與到了 AIR 計劃中;上海交通大學(xué)的鄭臻哲老師也是在博士后階段就開始參與......正是這種“堅持長期主義”的精神,讓我們看到了探索前沿技術(shù)的巨大價值空間。
在這一點上,《數(shù)字創(chuàng)意內(nèi)容的智能設(shè)計》無疑是一個具有代表性的學(xué)術(shù)合作項目。伴隨著大模型技術(shù)的成熟,AIGC 在近期火出新天際,但實際上這個技術(shù)并不是剛剛誕生,其已經(jīng)有七、八年的發(fā)展時間。浙江大學(xué) 尤偉濤、李澤健 & 設(shè)計事業(yè)部不飽幾年前就在 AI painting 領(lǐng)域進行探索。雖然現(xiàn)階段實現(xiàn)了設(shè)計領(lǐng)域的應(yīng)用,支持了鹿班平臺產(chǎn)品的功能升級,但實現(xiàn)的過程中其實需要長期的嘗試和驗證。
阿里巴巴設(shè)計事業(yè)部的不飽提到:“針對一個痛點問題,高校即使提供了多種解決方案,但企業(yè)在實際落地時會發(fā)現(xiàn),以上方案或許都不能在業(yè)務(wù)中取得成果。所以雙方在解決科技問題的路上,其實沒有捷徑可以走,每一位參與者都要有這種心理認知?!?/p>
正是基于長期的投入,雙方才在業(yè)務(wù)上取得不錯的成果。在本次《數(shù)字創(chuàng)意內(nèi)容的智能設(shè)計》中,面對“設(shè)計知識和大數(shù)據(jù)難以結(jié)合、設(shè)計創(chuàng)意難以形式化表征、跨媒體情感難以統(tǒng)一表達”等技術(shù)瓶頸,項目團隊開創(chuàng)性地提出了結(jié)合設(shè)計經(jīng)驗法則和設(shè)計大數(shù)據(jù)、引入因果推理、支持視聽融合的智能設(shè)計方法,提出了原型理論支撐的智能設(shè)計技術(shù)和創(chuàng)意因果推理支持的智能設(shè)計技術(shù)等。目前,該項目的智能設(shè)計能力已經(jīng)接入鹿班生產(chǎn)平臺,可以快速生成多樣化的風格背景圖片,節(jié)約設(shè)計生產(chǎn)成本,并且已經(jīng)幫助成功孵化了鹿班平臺中的互動視頻產(chǎn)品。
針對《數(shù)字創(chuàng)意內(nèi)容的智能設(shè)計》學(xué)術(shù)項目而言,雖然目前已經(jīng)取得了小階段的研究成果,但雙方的合作并不會就此止步。三位專家在采訪時表達的一致觀點是:“隨著虛擬空間等新載體以及新技術(shù)的出現(xiàn),一定會產(chǎn)生新的生成素材的需求”。因此,與虛擬 3D 相關(guān)的設(shè)計素材生成依然是后續(xù)規(guī)劃中的重點方向。除此之外,隨著業(yè)界對于 AIGC 的接受度越來越高,后續(xù)也計劃將這些能力更多地運用到實際的業(yè)務(wù)場景中。
不僅于此,校企合作在應(yīng)用層面取得落地成果的同時,還會在前沿技術(shù)上進行不斷地探索。以近期大火的 ChatGPT 為例,在云計算成為穩(wěn)定的基礎(chǔ)設(shè)施的背景下,學(xué)術(shù)界與工業(yè)界已經(jīng)開始向智能化邁進。具體到智能化背后的技術(shù)和應(yīng)用,受訪嘉賓在大模型技術(shù)的探索與融合方面提出了一些前瞻共識:
一方面,對于統(tǒng)一的基礎(chǔ)大模型而言,預(yù)計 3 年內(nèi)將有上千個不同的任務(wù)都基于同一個基礎(chǔ)大模型,再結(jié)合上 RLHF,AI 技術(shù)的應(yīng)用門檻會進一步大幅度降低;對于預(yù)訓(xùn)練大模型、視覺大模型等細分層面而言,預(yù)計未來將能在節(jié)省訓(xùn)練時間的同時,不斷提升模型的精準度;
另一方面,受訪專家也針對模型的融合層面作出了進一步的預(yù)測,知識圖譜與神經(jīng)網(wǎng)絡(luò)大模型將進一步互為補充與深度融合,大規(guī)模符號知識的神經(jīng)網(wǎng)絡(luò)化催生知識感更強、知識交互更符合人的預(yù)期的人工智能;針對算法模型與系統(tǒng)部署而言,算法模型設(shè)計與系統(tǒng)優(yōu)化調(diào)度將緊密結(jié)合,形成算法與系統(tǒng)互為反饋的新工業(yè)界機器學(xué)習(xí)迭代研究的新模式。
除了業(yè)務(wù)應(yīng)用和前沿技術(shù)探索,AIR計劃的一些項目也在更大的社會范圍內(nèi)發(fā)揮著越來越重要的作用。例如,澳門大學(xué)周建濤老師和阿里安全線楊銳合作的《抗媒體傳輸?shù)母唪敯魝卧靾D象檢測與定位研究》,設(shè)計了一套可以有效對抗社交網(wǎng)絡(luò)傳輸,且具有高泛化魯棒性的圖像取證技術(shù)。其偽造圖像取證模型的性能遠優(yōu)于現(xiàn)前沿算法,可在多維度干擾下保持穩(wěn)定,有望大幅降低各類噪聲對偽造檢測與定位框架的負面影響。目前這個“假圖粉碎機”網(wǎng)站對公眾開放,相應(yīng)技術(shù)正在持續(xù)迭代,還計劃將部分技術(shù)開源出去,促進圖像篡改檢測技術(shù)的進步。
04寫在最后
一項前沿技術(shù)要想掀起真正的技術(shù)浪潮,不僅要在理論方面取得突破,還需要創(chuàng)造出堅實的商業(yè)價值和實用價值。在此過程中,僅靠學(xué)術(shù)界或工業(yè)界一方的探索是遠遠不夠的。如何能讓學(xué)術(shù)界與工業(yè)界更加緊密地聯(lián)系起來,是行業(yè)內(nèi)共同的努力方向。
目前,阿里巴巴集團作為行業(yè)的先行者,通過 AIR 計劃讓工程師從業(yè)務(wù)中定位問題,再與學(xué)術(shù)研究專家共同攜手來攻克問題的模式,大大提高了前沿技術(shù)在商業(yè)領(lǐng)域的落地應(yīng)用率。同時,AIR 計劃還會向高校老師提供開放性的研究基金,開放實際的前沿場景,助力高校青年教師、學(xué)術(shù)人才的成長和優(yōu)秀研究型學(xué)生的培養(yǎng)。
除此以外,我們也看到了 AIR 計劃的另一個野心——著眼于前沿技術(shù)的未來發(fā)展方向:如同《數(shù)字創(chuàng)意內(nèi)容的智能設(shè)計》早在幾年前就開始探索智能設(shè)計方向,經(jīng)過多年的磨合,雙方的合作成果已經(jīng)顯現(xiàn)——讓設(shè)計師能夠聚焦解決核心創(chuàng)意任務(wù);在《端云協(xié)同超大規(guī)模分布式推薦系統(tǒng)的算法研究和系統(tǒng)實現(xiàn)》過程中,上海交通大學(xué)吳帆與大淘寶技術(shù)呂承飛一直在端云協(xié)同方向持續(xù)投入,為了給用戶提供極致的個性化推薦體驗,后續(xù)還會將模型的輕量化、個性化做進一步的夯實......
以上提到的前沿技術(shù),只是 AIR 計劃的冰山一角。但可以預(yù)見的是,隨著校企雙方的合作持續(xù)深入,不僅能夠有效地打破學(xué)術(shù)界與產(chǎn)業(yè)界之間的壁壘,更為前沿技術(shù)的蓬勃發(fā)展起到了一錘定音的效果,也希望這些技術(shù)能夠帶來更大的社會價值。

