四兩撥千斤! 創新工場首席科學家AI大牛周明博士率瀾舟團隊刷新CLUE新紀錄,輕量化模型孟子一鳴驚人!
本週,中文語言理解權威評測基準CLUE榜單,被「低調」刷新。
不同的是,不是大公司、不是超大模型……
一個新面孔,一個輕量化模型,首戰即登頂,四兩撥千斤。
CLUE榜單近年來由巨頭——騰訊、搜狗、華為、阿里達摩院輪番霸榜的格局,被首次打破。
瀾舟科技-創新工場推出的孟子模型,以十億參數完成了此前百億、千億參數模型刷新的紀錄。
這也是瀾舟科技首次對外曝光,背後團隊負責人,正是創新工場首席科學家、全球AI大牛周明博士。以下文章解釋了這個模型的原理,文章來自《量子位》微信公眾號,經授權轉載。
▎輕量化模型孟子?
孟子,基於瀾舟團隊自研技術研發的大規模預訓練語言模型。
包括創新工場、上海交通大學、北京理工大學等單位參與聯合研發。
可處理多語言、多模態數據,同時支持多種文本理解和文本生成任務,能快速滿足不同領域、不同應用場景的需求。
孟子模型基於Transformer架構,僅包含十億參數量,基於數百G級別涵蓋互聯網網頁、社區、新聞、電子商務、金融等領域的高質量語料訓練。
但誰也沒想到,小模型卻有大智慧,一經登場,打破格局。
CLUE,中文語言理解領域最具權威性的測評基準,涵蓋文本相似度、分類、自然語言推理、閱讀理解等共10項語義分析和理解類子任務。
該榜單競爭激烈,幾乎是業內所有自然語言理解玩家必爭之地。
騰訊、搜狗、華為、阿里達摩院等更是輪番霸榜刷新紀錄。
而且隨著大參數模型愈演愈烈,CLUE還漸有巨頭壟斷之勢。
因為百億、千億甚至萬億參數的大模型,已然不再是創業或其他玩家可與之爭鋒。
萬萬沒想到,瀾舟科技-創新工場團隊出手,四兩撥千斤。
因為孟子,走的是基於輕量級、高效訓練的研究路線,致力於構建十億級別的小模型,充分發揮已有參數下的模型潛力,有利於快速、低成本地落地現實業務場景。
孟子預訓練模型性能比肩甚至超越千億大模型,在包含文本分類、閱讀理解等各類任務上表現出色。
相對已有的中文語言模型,孟子模型實現了多項突破性進展:
1) 堅持「小而精」的輕量化訓練策略。實現在同等模型規模下,遠超公開模型的性能。作為精巧的小模型,對標「巨無霸」,小模型性能超越千億規模模型。
2)使用知識圖譜增強模型,讓 AI 真正獲得知識。孟子模型具備頂尖的語言理解能力,在權威CLUE中文理解評測的總排行榜,以及分類排行榜和閱讀理解排行榜均位列第一,刷新三項榜單世界紀錄。總排行榜分數突破84分,逼近人類基準分數(85.61)。
3)靈活的領域和場景適應能力,方便快速定制和應用。基於T5-style的端到端生成的訓練範式,同步適配BERT-style的判定式架構,既能理解也能生成。便於適配行業應用,覆蓋廣泛業務場景。
當然,隨著孟子一鳴驚人,也必然能讓輕量化模型研究來到聚光燈下。
▎原理方法和應用?
在輕量化模型算法研究方面,基於自研的基於語言學知識、知識圖譜和領域數據增強等技術,從模型架構(包括基礎層Embedding表示和交互層Attention機制)到預訓練策略進行了全方位改進。
具體有四方面:
1) 模型結構方面,將語義角色、詞性標註等語言學特徵融合到Embedding表示中,基於句法約束引入註意力機制中,從而提升模型對語言學知識的建模能力。
2) 訓練策略上,引入基於實體知識和Discourse的Mask機制,強化模型對語言成分和語篇關係的表徵。
3) 為進一步提高訓練效率,使用了大模型蒸餾和初始化小模型策略。
4) 為更好地將孟子模型適應垂直領域如金融、營銷,使用了領域數據繼續訓練並構造相應的提示模版(Prompt),取得了明顯的性能提升。
基於以上算法策略,實現從語料中高效學習涵蓋詞級、句子級和語篇級知識,大幅提升語言模型提煉語言結構和語義信息能力,以及良好的領域遷移能力,適應廣泛的產品應用場景。
另外,在Finetune的進展方面,如何將預訓練模型用於各項任務?
瀾舟團隊也有總結,從數據增強、知識蒸餾、遷移訓練、訓練優化等方面展開了一些探索,進一步提升語言模型的性能:
1) 數據增強:使用領域相關數據;
2) 知識蒸餾:基於Teacher-Student自蒸餾提升訓練效率;
3) 遷移訓練:結合課程學習的思想,由易到難訓練下游模型;
4) 訓練優化:使用多種訓練目標,多角度提升模型能力;
而且孟子還已經展開了垂直化領域應用。
基於領域適應技術,孟子模型已深度垂直化賦能相應行業。典型的例子為適用於金融領域的孟子模型,領域適應策略主要包含兩大方面:
1) 通過大規模的泛金融領域語料,將通用孟子模型遷移到金融領域。金融版孟子模型已經應用於多個金融行業的合作企業,在金融知識圖譜搭建、脫水研報、公告抽取等多個任務上獲得了出色的表現。
2) 通過大規模的營銷領域語料,將孟子模型遷移到數字營銷領域,完成了營銷文案生成、新聞摘要等多項任務,將用於行業頭部的數字營銷公司和多個世界五百強企業的合作之中。
瀾舟方面還透露,孟子模型已在多個領域成功落地實踐,衍生出多項行業領先的產品,涵蓋文本生成、行業搜索、機器翻譯等諸多領域。
並且毫無疑問的是,因為輕量級模型具有的模型參數較少、快速推斷的特點,更易於線上部署和推廣到移動設備中,自然不會局限於現有應用和場景,接下來還會有更廣泛的研究和應用場景中。
▎瀾舟團隊?
最後,也簡單介紹本次一鳴驚人的新面孔瀾舟科技。
瀾舟科技是創新工場孵化的一家認知智能公司。公司創始人——周明博士。
AI領域內,周明已不用過多介紹,他是公認的世界級AI科學家,自然語言處理領域的代表性人物。
周明博士在2020年加盟創新工場,擔任創新工場首席科學家。
而瀾舟科技則針對商業場景的數字化轉型,基於大數據、知識圖譜和行業模型,提供新一代的信息檢索、知識推理和商業洞見技術和相關產品。
據稱目前已與國內外幾十所著名高校和十餘個相關領域的頭部企業建立了穩定的合作關係。
值得注意的是,瀾舟科技除了大牛坐鎮,其實也是行業趨勢的體現。
引用創新工場董事長兼CEO李開復最新分享來說:
AI的發展可以按照兩個時間點劃分。
第一個時間點是2015年,以CNN為核心的計算機視覺技術讓機器超越了人類,帶來了人臉識別、智能質檢、無人零售、智慧城市、無人駕駛等商機。
而第二個時間點出現在2019年,以大模型為代表的自然語言方向取得突破性進展,讓NLP從數據、信息走向知識和洞見成為可能,將會在翻譯、語音識別、法律、金融、新聞、廣告、醫療、娛樂等大賽道帶來機遇。
「如果說CNN造就了今天計算機視覺領域的突破和眾多應用,預訓練大模型+微調也將帶來自然語言的百花齊放的發展,用數據智能驅動各類業務的升級。瀾舟科技在周明老師的帶領下取得了今天的成果,在新機遇面前躬身入局,一起發掘NLP領域的黃金發展期」,李開復說到。
數據驅動創新應用大賽 在 李開復 Kai-Fu Lee Facebook 的精選貼文
DeeCamp2020結束了,特別驚喜地看到同學們今年的作品,跟以往線下合作在水準上基本沒有區別。今天的活動評選出了兩個總冠軍獎項,但學生們做的每一個作品都非常優秀、用心。也希望參與的200多名學生有真正的收穫。
本文來自創新工場微信公眾號
………………………………
創新工場DeeCamp2020完美落幕,兩團隊並列總冠軍獎金翻倍,共克真實世界難題
過去的2個月裡,200餘名來自全球高校的學生,聆聽了李開復、張亞勤、吳恩達、張宏江、俞敏洪、周志華等12位AI學術界、產業界大師授課,透徹理解了科技與創投核心規律;分組挑戰開放命題AI創新大賽,用AI和創意向現在和未來人類世界面臨的真實難題問題發起挑戰。
2020年8月5日,DeeCamp2020人工智慧訓練營總冠軍答辯暨結營典禮,在創新工場北京總部隆重舉行。
經過節奏緊湊的立項、研發、測試,DeeCamp 2020開放命題AI創新大賽共37支團隊提交了振奮人心的AI Demo,其中6項入圍總冠軍答辯。他們現場展示了自己精彩的成果,角逐開放命題AI創新大賽的總冠軍和各賽道冠軍。
最終,兩支團隊並列奪得總冠軍,分屬自動駕駛賽道和創新賽道。總冠軍獎金翻倍,兩支隊伍各獲得10萬元獎勵,其餘五個項目獲得各賽道冠軍。
DeeCamp人工智慧訓練營是一項面向全球大學生的公益項目,專注培養應用型AI人才。自2017年暑期啟動以來已舉辦四屆,培養了上千名大學生。DeeCamp 2020 由創新工場聯合華為共同推出,在今年全球變局與挑戰的背景下,旨在召集科技領軍新人才,肩負時代新使命,用AI解決真實世界的難題。受蔓延全球的新冠疫情影響,DeeCamp2020大師課和開放命題AI創新大賽全部轉為線上進行。
創新工場董事長兼CEO李開復博士,創新工場人工智慧工程院執行院長王詠剛,創新工場運營合夥人黃蕙雯,華為雲首席戰略官餘虎,聯合國開發計畫署駐華代表白雅婷(Beate Trankmann),路孚特(中國)科技有限公司董事長兼總經理党曉青等嘉賓出席典禮現場,予以專案點評,並為優勝隊伍頒獎。
華為雲首席戰略官餘虎表示:“華為一貫非常注重AI人才的培養,我們在2018年就發布了沃土人才培養計劃;通過華為雲線上的ModelArts AI訓練平台,以及端側的Hilens kit等算力平台,在高校,跟學校一起,聯合開展教材設計,課程設計;並且舉行無人車大賽,聯合創新創業及科研合作。目前已經和超過50所雙一流高校,形成了良好的合作,培養了上萬名學生。這次華為雲ModelArts平台很好支撐了創新工場DeeCamp大賽,幫助全國各地參賽學生隊伍的實戰項目挑戰AI難題。大家的作品和創意都非常好。期望後面大家能基於本次大賽作為良好開端,更好的掌握AI技能,發揮想像力,基於AI工程化落地的視角,用AI解決真實的產業和生活難題,給社會和生活帶來更多的改變。”
聯合國開發計劃署駐華代表白雅婷表示:“人工智能以及其他新興技術的發展會改變我們的生活,甚至可以為氣候變暖、新冠肺炎等全球性問題提供解決方案,然而它們也會擴大數字鴻溝並造成新的不平等現象。希望各位學員在日後的研究中可以運用所學,促進變革,通過自己的努力為人類創造更可持續的未來。”
路孚特(中國)科技有限公司董事長兼總經理黨曉青表示:“從2019年開始,路孚特成為DeeCamp合作夥伴,為學員分享金融行業深厚的業務知識和豐富的專業數據,並提供學習並實踐相關課題的資源。作為路孚特戰略研發運營中心之一,北京研發運營中心希望能夠吸引國內優秀的AI專業人才,增強AI專業人才儲備和研發技術能力。”
▌6支 AI Demo競逐總決賽,兩支並列總冠軍,10萬獎金翻倍
DeeCamp2020入圍總冠軍答辯的6支項目團隊,分別來自創新賽道、自動駕駛賽道、教育賽道、醫療與公共衛生賽道、商業賽道。8月5日上午,通過雲端連線的方式,6支團隊各自展示了激動人心的Demo作品。
經過評委打分、討論,自動駕駛賽道的Faster&Better團隊和創新賽道的方仔照相館團隊,最終共同奪得總冠軍。總冠軍獎金翻倍,兩個團隊分別獲得10萬元獎勵。另有五個項目獲得了各賽道冠軍。
為什麼最終選出兩個冠軍?評委之一、創新工場董事長兼CEO李開復博士解釋說,這兩個項目評委打分相同,難分伯仲。“Faster&Better”團隊的技術讓人震撼,這說明在今天,黑科技創業的空間仍然存在。而“方仔照相館”團隊則以商業取勝,讓我們驚訝於積木居然可以與AI結合。他們的“方頭仔”產品讓人充滿購買欲望,幾乎是一項可以直接拿到融資的項目。“我們認為這兩個組,任何一個單獨奪冠,都不能完整表達DeeCamp代表的精神,所以最終決定評選出兩個總冠軍。”
▍總冠軍:方仔照相館 BrickMeStudio
所屬賽道:人工智慧的創新思考與前沿設計
挑戰賽題:自動積木建模
AI+積木?聽起來如此跨界的兩件事,會有什麼奇妙的組合?
來自北京航空航太大學、清華大學、香港中文大學、奧地利科學技術研究所的同學們組成的“方仔照相館”團隊,用AI玩轉積木,為創意插上了翅膀。
他們打造了一個AI積木創作平臺“方仔照相館”,簡單上傳一張頭像照片,就可以生成個性化定制的方頭仔玩偶頭像。未來,只需一鍵下單,百變趣味的方頭仔就可以郵送到家。
怎麼實現呢?他們先根據輸入的圖像,抽取特徵向量,比如髮型、劉海、鬍子、眼睛、下巴、膚色、上衣款式、衣服圖案、鞋子顏色、手的擺放、褲子紋理等,匹配相應的積木零件,然後生成積木模型和拼裝步驟。
“方仔照相館”團隊希望將自己對積木的熱情,傳遞給更多人。積木不只是孩子們的玩具,更是創造力的源泉,“AI時代,更要注重創造力培養”。
▍總冠軍:Faster&Better
所屬賽道:自動駕駛的技術突破與前沿設計
挑戰賽題:算符算力約束下的無人駕駛車輛檢測
自動駕駛是人工智慧中最具挑戰、最具有應用前景的方向之一。對於需要大規模落地量產的車輛檢測場景,神經網路模型只能在較為廉價的晶片上運行,這為檢測模型的效率帶來了巨大挑戰和約束。
Faster&Better團隊在滿足嚴格算符算力的約束下,設計了一種極為高效的anchor-free車輛檢測模型。該模型採用了backbone、後處理策略,將物體看作點,使用輕量的head來預測物體位置、類別和bounding box,在保障性能的同時大幅提升了速度。
Faster&Better團隊對項目的商業價值也進行了思考。該車輛檢測模型能夠很容易地部署在低成本的晶片上,實現產品的落地,帶來商業回報。模型反覆運算速度快,可以使用更低的功耗訓練和維護。模型精度高,能夠為無人系統的安全性和穩定性保駕護航。
未來,該車輛檢測模型也有廣闊的應用空間。一是可以部署到行車記錄儀等傳統硬體上,使其智慧化,具備行車預警功能;二是可以部署到安防監控中,使用模型自動過濾篩選,將視頻中有車輛的場景加以保存,節省存儲空間,也節省人員重播視頻的時間。
▍教育賽道冠軍:Teched U
所屬賽道:用AI驅動的教育新工具和新方法
挑戰賽題:網路公開課聚類、檢索、評價和推薦工具
線上教育是未來趨勢,但錄播課的用戶體驗不佳。大量的錄播課僅將一段長視頻從線下直接搬運到線上,難以避免冗餘重複,造成學生積極性差、完課率低等問題。
來自卡內基梅隆大學和沃頓商學院的同學組成了Teched U團隊,希望用AI技術賦能線上教育。他們通過自研原創神經網路 TopicNet,實現長視頻切割、大綱提取、知識搜索三項功能。
通過視頻切割,尋找知識結構中斷點,可以將一小時的教育視頻切割成5-10分鐘的短視頻,讓使用者利用碎片化時間學習;通過大綱提取,借助整理好的知識大綱進行跳轉,讓使用者快速瞭解知識內容的結構;通過知識搜索,可以精確尋找到相關視頻和精確到秒的視頻跳轉位置。
目前,線上教育巨頭主要通過人工標注做視頻切分,但對於缺乏人才和技術的中小型線上公司,這項低成本的視頻切割自動標注技術,可以説明他們豐富視頻內容,實現精准推薦,從而提升用戶體驗和轉化率。
▍醫療賽道冠軍:心靈捕手
所屬賽道:用AI應對醫療和公共衛生領域的新挑戰
挑戰賽題:通過深度學習識別生物電信號
在DeeCamp,AI+醫療也可以大顯身手!
由“心靈捕手”小組帶來的“聽醫聲AI 診斷專家”項目,是本屆DeeCamp項目中唯一一個軟硬結合的項目。硬體製作、小程式設計開發等工作,全部是在DeeCamp期間用兩個月的時間完成。
“聽醫聲”AI診斷專家通過電子聽診器採集心音、呼吸音、脈搏,並將電子化的信號傳遞給微信小程式及後臺雲端分析系統,進行定量分析判斷使用者的健康狀況,實現健康監護、疾病預警、輔助診斷。若檢測到身體異樣,可自動推薦附近的醫院。未來,“聽醫聲”既可以輔助醫生做疾病早期篩查、健康監測,也可以用在留守老人監護、殘疾人健康關愛等領域。
值得一提的是,“聽醫聲”的脈搏波資料集,通過與醫院、診所、體檢中心等工作單位合作,共採集了6000余例由中醫專家標定的脈象資料,把專家經驗轉化為臨床診斷量化標準,實現了中醫問診的客觀化、資訊化。
▍創新賽道冠軍:AI科幻世界
所屬賽道:人工智慧的創新思考與前沿設計
挑戰賽題:科幻小說自動/輔助生成
你能想像一個AI構建的科幻世界嗎?在DeeCamp2020,AI正在創造一個全新的寫作時代。
來自中科院、美國喬治梅森大學等高校的五位同學組成的“AI科幻世界”團隊,基於Open AI 的GPT-2模型,在百億級中文大規模語料上重新訓練,打造了一位神奇的“AI科幻小說作家”。
這位元“科幻作家”,可以根據設定好的故事主線、人物角色等,互動式生成科幻小說內容,不僅可以遣詞造句,還可以創作構思,讓普通人也可以化身“科幻文學大咖”。
“AI科幻世界”團隊在開發的過程中,借鑒作家創作小說的過程,受到認知心理學和文學理論啟發,提出情節大綱主導的、人機協同寫作的範式:用戶輸入第一句,機器輸出多個人稱一致、語句連貫、邏輯合理的下一句話候選,由用戶做篩選和修改,不斷重複形成情節閉環。
在人機協同的半自動模式下,AI科幻世界寫作故事大綱的速度每分鐘可達50-100字。而在無人干預的全自動模式下,可以在1秒鐘之內寫出一個曲折動人的兩千字故事,揭開了創作的神秘面紗。
未來,科幻小說自動/輔助生成可以應用在商業傳播場景中,提升內容的廣度和個性化,兼顧精准分發下的使用者需求和內容品質,滿足企業對海量資訊的搜集、分析、篩選、整理和發佈需求。
▍商業賽道冠軍:“Non-pretrain”
所屬賽道:AI 賦能的商業決策與商業流程優化
挑戰賽題:人工智慧在量化交易和投資中的決策輔助
量化交易是指以先進的數學模型替代人為的主觀判斷,利用電腦技術從龐大的歷史資料中海選能帶來超額收益的多種“大概率”事件以制定策略。
來自南京大學、復旦大學的“Non-pretrain”團隊,針對外匯量化交易的歷史資料,提出了一種資料依賴的相似性度量方法。對每一個分類,分別使用所提出的層次注意力LSTM模型對未來匯率進行預測。最後對多個類的預測結果進行集成,並結合挖掘出來的典型pattern制定交易策略。
此外,聯合國開發計畫署一直非常關注高新科技與人工智慧在可持續發展領域的應用,為了鼓勵各位學員積極探索用AI解決可持續發展問題,專門設立了“AI4SDG”獎項,頒發給西天取經團隊、AI倒爺團隊、Teched U團隊、Brainnova意念互聯團隊、心靈捕手團隊。
此外,DeeCamp還組織了學員互評,評選最受學員歡迎的作品,最終西天取經、You OnlyLook Us、AI科幻世界三個團隊獲此殊榮。
▍自動駕駛賽道冠軍:“西天取經”AwesomeDet
所屬賽道:自動駕駛的技術突破與前沿設計
挑戰賽題:算符算力約束下的無人駕駛車輛檢測
西天取經團隊由來自北理工、北航、新加坡國立、北大、麥吉爾大學的五位極客組成。他們希望在自動駕駛的漫漫長路上,經歷磨難,不斷成長探索。
團隊採用了業界先進的技術,從Backbone、Neck、Loss三個層面出發,設計了一系列滿足算符算符約束的目標檢測模型,並做出適配改進,進行算法針對性優化。
推理速度是衡量自動駕駛技術的關鍵指標,目前行業內對推理速度的最低要求是10fps, 而該團隊的產品推理速度最快達到了74.5fps。
同時,他們提出了基於數據分析提出特定的增強方法,改善了夜間難樣本的訓練。經過真實場景下的測試,無論側視、後視、前視、夜景,都表現出了良好的遷移效果,測速、性能表現較好,達到了簡單場景下的車輛檢測要求,滿足了商業落地的要求。
該項目另外一大亮點是在手機上集成了檢測產品,做到了產品級別的實時呈現。未來,產品將可以搭載到智能行車記錄儀車輛預警、車載手機預警APP、交通事故實時監測、實時治安情況監測等多個領域。
此外,聯合國開發計劃署(UNDP)一直非常關注高新科技與人工智能在可持續發展領域的應用,為了鼓勵各位學員積極探索用AI解決可持續發展問題,專門設立了“AI4SDG”獎項,頒發給西天取經團隊、AI倒爺團隊、Teched U團隊、Brainnova意念互聯團隊、心靈捕手團隊。
▌74所高校200余名學生參與,12位大師授課
DeeCamp2020採用開放報名+定向邀請的方式,通過激烈競爭,200余位學員最終入選。
他們來自清華大學、北京大學、中國科學院大學、南京大學、北京航空航太大學、復旦大學、中國人民大學等44所國內高校,以及卡內基梅隆大學、麻省理工學院、牛津大學、康奈爾大學等30所海外高校,分佈在86個國內城市及北美和歐洲的17個海外城市。
學員中,碩士生占比56%,本科生占比26%,博士生占比17%。另外還有1%的學員是優秀的高中生,他們的技術科研能力已經達到了大學本科生的水準。
DeeCamp2020獨創“大師課+開放命題AI創新大賽”模式,讓學員既可以近距離與科研及產業領域大師溝通交流,也可以與志同道合的小夥伴結隊,親身體驗 AI 技術如何轉化為產業應用、積累實踐案例經驗。
在大師課上,李開復、張亞勤、吳恩達、張宏江、俞敏洪、周志華等12位來自AI領域學術界、產業界的重量級嘉賓,為同學們分享了AI前沿理論、產業創新、行業發展、創業趨勢等領域的最新洞察,讓大家充分領略了學術大師的思維方式,感受知識的魅力。
不同於常見的 AI 領域競賽,DeeCamp2020 開放命題AI創新大賽不以完成某一具體指標為目的,而是讓同學們組隊完成一個完整的創新項目,鼓勵其用創意向現在和未來人類面臨的科技問題發起挑戰。
因此,在賽題的設置上,DeeCamp聚焦社會熱點,關注真實世界與人們生活,共設置五大賽道14個新穎賽題,允許學生自由組隊。五個賽道分別是:
•教育賽道:AI 驅動的教育新工具和新方法
•醫療賽道:用 AI 應對醫療和公共衛生領域的新挑戰
•創新賽道:人工智慧的創新思考與前沿設計
•商業賽道:AI 賦能的商業決策與商業流程優化
•自動駕駛賽道:自動駕駛的技術突破與前沿創新
據創新工場人工智慧工程院執行院長王詠剛介紹,這次的賽道賽題設計具有“更熱門”、“更真實”、“更接地氣”三大特點:
“更熱門”:2020年是特殊的一年,我們面對著最多的變化,最多的挑戰,也是最多的機會,因此賽題設置貼合當前社會最關注的熱點問題,如健康賽道關注仍在全球延燒的新冠疫情。
“更真實”:為了讓同學們最大限度地接觸真實世界,所有賽題提供的資料都來自各個合作企業的真實場景資料。例如在Momenta提供的自動駕駛賽道中,Momenta為同學們提供了一批獨家未公開的128線雷射雷達檢測資料集和十萬量級視覺資料集,希望同學們在科研人員帶領下一同解決行業中的各類技術問題。
“更接地氣”:賽題設置與同學們的學習生活息息相關。在教育賽道中,人工智慧對程式設計教育的應用占了很大的部分,因為參賽的同學大多來自數學、電腦專業,有自學程式設計的經歷,這能促使參加該賽題的同學發揮主觀能動性,更好的利用自身經驗提高項目完成品質。
最終,共有9支隊伍選擇了商業賽道,10支隊伍選擇了自動駕駛賽道,5支隊伍選擇了教育賽道,6支隊伍選擇了醫療賽道,7支隊伍選擇了創新賽道,向這些難題發起挑戰。
▌你想用AI改變什麼?——DeeCamp學員的AI願望
人工智慧是一項偉大的技術,我們有幸生活在這個時代,也應該努力讓人工智慧造福人類社會。
“你想用AI改變什麼?”在主辦方發起的一項徵集活動中,200多名同學用紙和筆,寫下了自己的AI願望:
o“我想用AI改變人們的出行方式”
o“我希望用AI改變人們的教育環境,為所有人帶來更加智慧化的教育方式”
o“我希望用AI解決量化投資及商業決策問題”
o“我想用AI改變遊戲設計”
o“我想用AI改變文學作品的表現方式,讓大家能更加淋漓盡致地表現所思所想”
o“我想用AI改變醫療診斷技術”
o“我想用AI改變我們觀察世界的方式”
………
創新工場人工智慧工程院執行院長王詠剛表示,DeeCamp是一個為學生服務、充分發揮學生自主精神的人工智慧訓練營,鼓勵所有來到DeeCamp的同學進行一段自我驅動的AI學習實踐之旅。
在專案期間,DeeCamp的同學們充分發揮了“自我組織、自我管理、自我表現”的精神:自發組織了13場分享會,涉及創業經驗、讀書感想、技術研討、項目交流。在官方組織的“飯?泛?FUN?”談會中,學員們積極與各位大師雲上約飯,探討AI產業發展、創業方向、職業選擇等話題。
DeeCamp人工智慧訓練營自誕生起,就以消弭中國AI應用人才鴻溝、培養和完善中國AI應用人才生態為初衷,堅持公益屬性,將知識課程與項目實踐相結合,引導學生體驗 AI 技術如何轉化為產業應用,積累實踐案例經驗。
自2017年暑期首次開辦以來,DeeCamp總計收到來全球 1000 餘所高校超過 20000 份報名申請,已有 1000 余名學員順利結業。
DeeCamp的最大期待,就是結業的學員們都能在方興未艾的 AI 產業浪潮中,真正解決來自真實世界的難題,將論文中的 AI 演算法打造成一個個成功的 AI 產品與解決方案,用AI創造更美好的人類未來!
未來,DeeCamp 將繼續砥礪前行,不遺餘力地在人工智慧人才培養上面挖掘新方法和新思路,為 AI 領域輸送最新鮮的血液、提供最堅實的力量。
數據驅動創新應用大賽 在 李開復 Kai-Fu Lee Facebook 的最讚貼文
創新工場DeeCamp 2020正式啟動。歡迎向我們推薦優秀的學員。
世界在變,DeeCamp 初心不變。新內容,新形式。新人才,新使命。一個半月時間,免費聆聽學術大師、工業界領軍人物親身教誨,學習科技與創投規律,實踐用AI解決前沿問題。只對全球在校大學生開放!過去兩年也都有台灣同學來參加哦。
下文來自創新工場微信公眾號
………………………………………………………………
DeeCamp 2020啟動,邀請全球AI菁英共克世界變局下真實難題!
2020 年是不尋常的一年。世界在變,初心不變。即日起,創新工場聯合華為共同推出“DeeCamp 2020 全球 AI 領軍人才培養計畫”。
圍繞“世界變局下的 AI 人才新使命”這一核心主題,入選的 200 位高校大學生將在一個多月的時間裡,接受世界頂尖導師陣容的授課指導,嘗試用創新思維和前沿 AI 技術,迎接新挑戰,解決新問題,擔負起 AI 人才的新使命。
DeeCamp 訓練營面向所有電腦、數學、自動化等AI領域相關專業本、碩、博在校生開放報名,全程免費。
DeeCamp 2020 全球 AI 領軍人才培養計畫分為大師課和開放性競賽兩部分,課程和專案實踐全部轉為線上進行。成功加入訓練營的200名學員,將獲得多位 AI 科研及產業領域頂級大師親自線上授課。他们有:
▍李開復 創新工場董事長兼CEO
▍張亞勤 世界級科學家和企業家,清華⼤學“智慧科學”講席教授
▍吳恩達 全球知名的人工智慧專家,Coursera的創始人及董事長,斯坦福大學電腦系兼職教授
▍張宏江 世界多媒體和人工智慧研究領域一流科學家,源碼資本投資合夥人
▍周志華 人工智慧領域世界級專家,國際AI學會“大滿貫” Fellow華人第一人,歐洲科學院外籍院士,南京大學人工智慧學院院長
▍張潼 人工智慧領域世界級專家,機器學習、大數據分析領域的頂級學者,香港科技大學電腦系和數學系教授
▍俞敏洪 新東方教育科技集團創始人、董事長,洪泰基金創始合夥人
▍徐輝 創新奇智聯合創始人、首席執行官,創新工場合夥人
▍唐文斌 曠視聯合創始人兼首席技術官
▍曹旭東 Momenta創始人兼首席執行官
▍汪華 創新工場聯合首席執行官,管理合夥人
▍王詠剛 創新工場首席技術官,創新工場人工智慧工程院執行院長
學員們還能與來自全球的 AI 精英共同組隊參加線上競賽,衝刺大獎。此次,DeeCamp 人工智慧訓練營將以往的線下實踐課題改為線上競賽形式。
不同於常見的 AI 領域競賽,DeeCamp2020 開放性競賽不以完成某一具體指標為目的,而是讓同學們組隊完成一個完整的創新項目,鼓勵其用創意向現在和未來人類面臨的科技問題發起挑戰,找到用 AI 技術改變真實世界的機會。對於提交的最終結果,評委將從“創新性、先進性、潛在價值、呈現結果”四個維度進行評估,最終評出總冠軍及各賽道冠軍,最高獎項獎金達人民幣100,000元。同時,優秀學員還有機會參加與神秘科學家評委的午餐/晚餐交流會!
DeeCamp2020 開放性競賽共設立五大賽道:
• 用 AI 應對醫療和公共衛生領域的新挑戰
• AI 賦能的商業決策與商業流程優化
• 自動駕駛的技術突破與前沿創新
• AI 驅動的教育新工具和新方法
• 人工智慧的創新思考與前沿設計
▍賽道一:用 AI 應對醫療和公共衛生領域的新挑戰
COVID-19 新冠病毒讓全世界共同經歷了恐慌、病痛和隔離,也凸顯出全球公共衛生危機對全球經濟與個人生活的重大影響。科技是扭轉戰局、提高社會組織與協同效率、提升全人類衛生水準的重要武器。無論是疫苗研製,新藥研發,臨床數據分析,流行病學分析,還是對與疫情相關的社會學、傳播學等問題進行深入調研,以大數據、機器學習為代表的人工智慧技術都可以發揮重要作用。
請加入我們,一起探索用大數據、機器學習等前沿科技改變全球公共衛生狀況,應對全球危機的新思路、新方法、新技術和新產品。
▍賽道二:AI 賦能的商業決策與商業流程優化
全球經濟和投融資環境進入了 2008 年金融危機以來的又一個艱難時期:經濟全球化的美好願景正遭遇貿易紛爭、意識形態分歧乃至全球疫情的多重打擊,資本市場和供應鏈生態面臨極大的不確定性。
新一代的大數據和人工智慧技術該如何幫助人類更好地應對危機?如何根據市場、行業、社交網路等數據更準確預測經濟趨勢並指導商業決策?如何利用 AI 技術提升商業運行效率,優化供應鏈管理等核心業務流程?
請與我們一起探討用 AI 技術輔助商業決策或提高商業效率的創造性方法,更好應對全球經濟變局。
▍賽道三:自動駕駛的技術突破與前沿創新
自動駕駛是人工智慧眾多領域中,最具技術挑戰性和應用前景的方向之一。最近幾年,自動駕駛的科研、產品和工程團隊越來越注重在真實場景、真實約束條件下打磨演算法和產品,力爭儘早實現自動駕駛技術的大規模商用。隨著自動駕駛所依賴的感測器、車載晶片、車聯網等技術的不斷發展,前沿人工智慧演算法有可能在更高效、性價比更好的自動駕駛平臺上突破更多的技術與產品瓶頸。
在本賽道中,團隊有機會利用真實場景採集的高品質數據,結合真實計算環境,學習和實踐自動駕駛技術在產品、工程領域的最佳路徑,並挑戰演算法和算力的極限。
▍賽道四:AI 驅動的教育新工具和新方法
教育是人類智慧得以延續和發展的載體。以 AI 為代表的前沿科技,已經在今天的各類教育平臺、各種教學形式中發揮了積極作用,即將成為未來教育的主導因素之一。
如何利用科技手段實現真正的因材施教?如何幫助老師規劃教學路線、提高教學效率?如何通過智慧互動、自動測評、持續改進等形式激發每個人的學習潛能?
AI 時代,教育工具和教育方法將在技術推動下持續變革。你們的技術、創意與工程實現,也是這一歷史變革的重要環節。
▍賽道五:人工智慧的創新思考與前沿設計
自上世紀四五十年代發端以來,AI 技術經歷多次反覆運算,今天以深度學習為代表的新一代 AI 已經創造出超越人類的圍棋程式,可以自動駕駛汽車的智慧演算法,可以獨立執行任務或與人協作的機器人……但AI在認知能力、推理能力、對複雜環境的感知能力、在複雜場景中的規劃和決策能力等方面,還與人類水準相差甚遠。
人類與生俱來的創造力對AI是九重天外的挑戰,有哪些新思路、新方法、新技術可能幫助我們開闢更廣闊的 AI 新天地?請利用你們的科研積累,發揮你們大膽突破的創新能力,用最直觀的創意演示系統向人們揭示 AI 未來可能的技術路線與應用場景。
▌報名流程及時間安排
時間安排:
報名及選拔時間:即日起至5月29日
學員名單公佈:6月3日
大師課上課時間:6月6日至7月5日每週六周日上午
開放競賽成果提交:7月26日
競賽結果公佈:8月5日
報名流程:
考慮到今年上半年全球大學師生的實際情況,本屆DeeCamp採用導師或實驗室推薦與自薦報名相結合的方法,並根據推薦和自薦材料綜合選拔錄取。
1)官網註冊:在 DeeCamp 官網(deecamp.com)完成註冊並填寫個人資訊;
2)準備申請材料:pdf 檔需在個人中心上傳,視頻請上傳至組委會可以訪問的平臺並在下一步報名時填寫訪問位址;
3)點擊報名:進入活動頁面點擊報名,提交必要資訊並完成報名;
4)等待通知:你可能會收到一次遠端面試的邀請,請留意郵箱資訊並準時參加。
*申請材料包括:
一份 PDF/DOC/DOCX 格式的檔,內容包括你的簡歷、項目經歷、曾獲獎項、曾發表論文及對應會議/期刊、推薦信或自薦信,以及其他能讓我們知道你很優秀的材料,請整理在一個檔裡集中上傳;
一段自我介紹視頻,時長 3 分鐘以內,將用於向選拔參考(可選項,建議提供,以便我們更好地瞭解你)。
▌關於DeeCamp人工智慧訓練營
DeeCamp 的名字來自歷史上由 O' Reilly 組織的 Foo Camp(一個完全由與會者設計流程、議題、內容的 unconference)。DeeCamp 用類似的命名方式,希望建立一個為學生服務、充分發揮學生自主精神的 Deep Learning Summer Camp,既有統一的課程和專案安排,也借鑒 unconference,放手讓學生自我組織、自我管理、自我表現。在 2019 年度暑期訓練營期間,學員們在順利完成課程和實踐的同時,自行組織了 24 場分享會,涵蓋深度學習、機器學習、對抗神經網路等十餘個主題。
DeeCamp 訓練營由創新工場於 2017 年發起,旨在提升高校 AI 人才在行業應用中的實踐案例經驗,同時推進產學研深度結合的公益性質 AI 訓練。
在過去的三年中,DeeCamp 總計收到來自全球 1000 餘所高校超過 20000 份報名申請,已有 1000 余名學員順利結業。
到 2019 年,DeeCamp 人工智慧訓練營已初步建立了以創造性的團隊工程實踐專案為主幹,以打通學術、產業邊界的系統性知識培訓為支撐,聚焦未來科技變革與商業發展,成規模、可複製的人工智慧應用型人才培養體系。
DeeCamp 獨創的“知識授課+實踐專案”模式,讓學員們既可以近距離與科研及產業領域大師溝通交流,也可以與志同道合的小夥伴結隊,親身體驗 AI 技術如何轉化為產業應用、積累實踐案例經驗。
聯合主辦方:創新工場、華為
雲平臺:華為雲
課題合作企業:曠視科技、Momenta、路孚特
合作媒體:量子位
報名連結:https://deecamp.com/#/activityRegistration?id=1