北京2022年2月16日 /美通社/ -- 2022 ASC世界大(da)學(xue)生超級計算機競賽(ASC22)已進入預賽階段。來(lai)自全球(qiu)各(ge)地的(de)300多支參(can)賽隊(dui)伍正在挑(tiao)戰一道人工(gong)智(zhi)能(neng)難(nan)題 -- AI語(yu)言大(da)模型。組委會提供(gong)了100GB高質量中文數據(ju)集(ji),要求參(can)賽隊(dui)基于(yu)此數據(ju)集(ji)實(shi)現一個47億參(can)數的(de)“源”AI語(yu)言大(da)模型,以此激發(fa)參(can)賽大(da)學(xue)生對自然語(yu)言處理(li)的(de)興趣與(yu)創造力,激勵(li)他們向這一人工(gong)智(zhi)能(neng)“皇冠上的(de)明珠(zhu)”發(fa)起沖擊。
AI大模(mo)型以(yi)其優秀(xiu)的(de)(de)(de)精度表現(xian)以(yi)及在(zai)應用中(zhong)較高的(de)(de)(de)智(zhi)能化水平,成為了當今人工智(zhi)能研究(jiu)的(de)(de)(de)熱(re)點(dian)。李(li)飛飛教(jiao)授聯名發(fa)表的(de)(de)(de)論文中(zhong)提出,AI大模(mo)型的(de)(de)(de)意義在(zai)于突現(xian)和(he)均(jun)質,突現(xian)意味著通(tong)過(guo)大模(mo)型隱(yin)含(han)的(de)(de)(de)知識和(he)推納(na)可帶來(lai)讓人振奮(fen)的(de)(de)(de)科學(xue)創(chuang)新靈感,而均(jun)質則表示大量模(mo)型可以(yi)為諸多應用任務泛(fan)化支(zhi)持提供統一強大的(de)(de)(de)算法(fa)支(zhi)撐。
過去一年中(zhong),AI大模型(xing)領(ling)域涌現出了一批優秀成果,如(ru)“源(yuan)1.0”、“威震(zhen)天(tian)·圖靈”。這些大模型(xing)不但(dan)能勝任(ren)傳統的(de)自然語(yu)言處理任(ren)務,還(huan)會寫(xie)詩、編程、寫(xie)小說、寫(xie)論文摘要等(deng)(deng)等(deng)(deng),在醫(yi)療、金(jin)融、零售、氣象、新聞(wen)傳播、文學藝術等(deng)(deng)領(ling)域表現出了廣(guang)闊的(de)應用(yong)前景(jing)。
雖然大模(mo)型擁有巨大的(de)發(fa)展潛力和(he)應(ying)用(yong)前景,但同樣面臨著算力挑(tiao)戰。以“源”為例,其采用(yong)2128顆(ke)加速器訓(xun)練了16天,算力開銷巨大。于是,分布式訓(xun)練性能優化成為大模(mo)型研究(jiu)的(de)重(zhong)要方向(xiang)。
ASC22組委會提供(gong)了100GB高(gao)質量中文數(shu)據集,要(yao)求參賽(sai)隊基(ji)于這(zhe)一數(shu)據集實現(xian)一個47億參數(shu)的“源”AI語言大模(mo)型。但是,組委會并(bing)未提供(gong)大模(mo)型設計的參考代碼(ma)。這(zhe)就意味(wei)著參賽(sai)隊需要(yao)從(cong)零(ling)開(kai)始(shi),自行(xing)完成(cheng)模(mo)型結構(gou)構(gou)建和全部訓練過(guo)程,并(bing)合理設計模(mo)型訓練策略,以期得到最佳的計算性能。因此,這(zhe)道賽(sai)題(ti)也變得更具(ju)挑戰性:在追(zhui)求極致性能的同(tong)時,還要(yao)滿足精(jing)度(du)約(yue)束(shu),這(zhe)也是在實際大模(mo)型研發中,行(xing)業(ye)人士經常會面(mian)臨(lin)的關鍵問題(ti)。
正(zheng)如ASC發起人、中國工(gong)(gong)程院(yuan)院(yuan)士王恩東所說,隨(sui)著人工(gong)(gong)智能與算(suan)(suan)(suan)力(li)的(de)完美(mei)融合,計(ji)(ji)算(suan)(suan)(suan)正(zheng)在向智算(suan)(suan)(suan)演變,可能讓下(xia)一代超級計(ji)(ji)算(suan)(suan)(suan)機成(cheng)為超級智算(suan)(suan)(suan)機,它不僅是計(ji)(ji)算(suan)(suan)(suan)性能的(de)數量級躍升(sheng),同時(shi)也能更好地集成(cheng)機器學習和物理(li)建(jian)模。因此,ASC22將自然語言處(chu)理(li)這個高(gao)性能計(ji)(ji)算(suan)(suan)(suan)和人工(gong)(gong)智能完美(mei)結合的(de)前(qian)沿應用(yong)設為賽題,將成(cheng)為參(can)賽隊比(bi)拼AI與超算(suan)(suan)(suan)融合能力(li)的(de)絕佳試驗場。
AI大模型賽題專家、浪潮人工智能研究院首席研究員吳韶華表示,這道賽題瞄準的是分布式訓練性能優化方向,要求參賽隊伍在100GB的數據集上完成10億個令牌的(de)(de)(de)訓(xun)練(lian),在滿足精(jing)度的(de)(de)(de)條件下,性能越(yue)快,得(de)分越(yue)高。而(er)訓(xun)練(lian)性能的(de)(de)(de)提升,將直接(jie)降低大模型的(de)(de)(de)訓(xun)練(lian)開銷、降低集群能耗,進而(er)降低碳排放(fang)。希望通(tong)過該賽題,參賽隊伍能對自然語言處理領(ling)域的(de)(de)(de)前沿研究形成(cheng)清晰的(de)(de)(de)認知,并(bing)且通(tong)過創(chuang)新(xin)實(shi)踐,找到(dao)具有普適(shi)意(yi)義的(de)(de)(de)方(fang)法(fa),取得(de)計算性能上的(de)(de)(de)突破(po)。
ASC世界大學生超(chao)(chao)(chao)算競(jing)賽(sai)由中國(guo)發起組織,并得到亞洲及歐美(mei)相(xiang)關專家和機構支持,旨在(zai)通過大賽(sai)平臺推動各(ge)(ge)國(guo)及地區(qu)間超(chao)(chao)(chao)算青年(nian)(nian)人才交流和培(pei)養(yang),提升超(chao)(chao)(chao)算應用水(shui)平和研(yan)發能力(li),發揮超(chao)(chao)(chao)算的(de)(de)科(ke)(ke)技(ji)驅動力(li),促進科(ke)(ke)技(ji)與產(chan)業創新。ASC超(chao)(chao)(chao)算大賽(sai)迄今已(yi)舉行至第10屆(jie),吸引超(chao)(chao)(chao)萬名(ming)世界各(ge)(ge)國(guo)大學生參(can)賽(sai),是全球最(zui)大規(gui)模的(de)(de)超(chao)(chao)(chao)算競(jing)賽(sai)。在(zai)最(zui)新的(de)(de)2022年(nian)(nian)賽(sai)季,來自世界各(ge)(ge)國(guo)的(de)(de)300多支隊伍(wu)(wu)報名(ming)參(can)賽(sai),經初賽(sai)選拔的(de)(de)隊伍(wu)(wu)將參(can)加5月7日-11日在(zai)位(wei)于合肥(fei)的(de)(de)中國(guo)科(ke)(ke)學技(ji)術大學舉行的(de)(de)總決賽(sai)。