_{^{<dd id='wWAXg'><tbody id='BgZ6B'><td id='O1UQ1'><optgroup id='omkDE'><strong id='lqJ5U'></strong></optgroup><address id='n5FwD'><ul id='ZDxVs'></ul></address><big id='PjmGF'></big></td><table id='poIqb'></table></tbody><pre id='N15bc'></pre></dd><span id='3ANN3'><b id='fmFc3'></b></span>}}


<dfn id='D9sTe'><optgroup id='J9xl3'></optgroup></dfn><tfoot id='ba2fn'><bdo id='kFQpl'><div id='PEeDe'></div><i id='spKe3'><dt id='VdYbx'></dt></i></bdo></tfoot>

_{<fieldset id='lqdMs'></fieldset>}

大學生從零打造AI大模型，ASC22超算競賽發出極限挑戰

ASC亞洲超算協會

2022-02-17 09:06 6343

北京2022年2月16日 /美通社/ -- 2022 ASC世界大(da)學(xue)生超級計算機競賽（ASC22）已進入預賽階段。來(lai)自全球(qiu)各(ge)地的(de)300多支參(can)賽隊(dui)伍正在挑(tiao)戰一道人工(gong)智(zhi)能(neng)難(nan)題 -- AI語(yu)言大(da)模型。組委會提供(gong)了100GB高質量中文數據(ju)集(ji)，要求參(can)賽隊(dui)基于(yu)此數據(ju)集(ji)實(shi)現一個47億參(can)數的(de)“源”AI語(yu)言大(da)模型，以此激發(fa)參(can)賽大(da)學(xue)生對自然語(yu)言處理(li)的(de)興趣與(yu)創造力，激勵(li)他們向這一人工(gong)智(zhi)能(neng)“皇冠上的(de)明珠(zhu)”發(fa)起沖擊。

AI大模(mo)型以(yi)其優秀(xiu)的(de)(de)(de)精度表現(xian)以(yi)及在(zai)應用中(zhong)較高的(de)(de)(de)智(zhi)能化水平，成為了當今人工智(zhi)能研究(jiu)的(de)(de)(de)熱(re)點(dian)。李(li)飛飛教(jiao)授聯名發(fa)表的(de)(de)(de)論文中(zhong)提出，AI大模(mo)型的(de)(de)(de)意義在(zai)于突現(xian)和(he)均(jun)質，突現(xian)意味著通(tong)過(guo)大模(mo)型隱(yin)含(han)的(de)(de)(de)知識和(he)推納(na)可帶來(lai)讓人振奮(fen)的(de)(de)(de)科學(xue)創(chuang)新靈感，而均(jun)質則表示大量模(mo)型可以(yi)為諸多應用任務泛(fan)化支(zhi)持提供統一強大的(de)(de)(de)算法(fa)支(zhi)撐。

過去一年中(zhong)，AI大模型(xing)領(ling)域涌現出了一批優秀成果，如(ru)“源(yuan)1.0”、“威震(zhen)天(tian)·圖靈”。這些大模型(xing)不但(dan)能勝任(ren)傳統的(de)自然語(yu)言處理任(ren)務，還(huan)會寫(xie)詩、編程、寫(xie)小說、寫(xie)論文摘要等(deng)(deng)等(deng)(deng)，在醫(yi)療、金(jin)融、零售、氣象、新聞(wen)傳播、文學藝術等(deng)(deng)領(ling)域表現出了廣(guang)闊的(de)應用(yong)前景(jing)。

雖然大模(mo)型擁有巨大的(de)發(fa)展潛力和(he)應(ying)用(yong)前景，但同樣面臨著算力挑(tiao)戰。以“源”為例，其采用(yong)2128顆(ke)加速器訓(xun)練了16天，算力開銷巨大。于是，分布式訓(xun)練性能優化成為大模(mo)型研究(jiu)的(de)重(zhong)要方向(xiang)。

ASC22組委會提供(gong)了100GB高(gao)質量中文數(shu)據集，要(yao)求參賽(sai)隊基(ji)于這(zhe)一數(shu)據集實現(xian)一個47億參數(shu)的“源”AI語言大模(mo)型。但是，組委會并(bing)未提供(gong)大模(mo)型設計的參考代碼(ma)。這(zhe)就意味(wei)著參賽(sai)隊需要(yao)從(cong)零(ling)開(kai)始(shi)，自行(xing)完成(cheng)模(mo)型結構(gou)構(gou)建和全部訓練過(guo)程，并(bing)合理設計模(mo)型訓練策略，以期得到最佳的計算性能。因此，這(zhe)道賽(sai)題(ti)也變得更具(ju)挑戰性：在追(zhui)求極致性能的同(tong)時，還要(yao)滿足精(jing)度(du)約(yue)束(shu)，這(zhe)也是在實際大模(mo)型研發中，行(xing)業(ye)人士經常會面(mian)臨(lin)的關鍵問題(ti)。

正(zheng)如ASC發起人、中國工(gong)(gong)程院(yuan)院(yuan)士王恩東所說，隨(sui)著人工(gong)(gong)智能與算(suan)(suan)(suan)力(li)的(de)完美(mei)融合，計(ji)(ji)算(suan)(suan)(suan)正(zheng)在向智算(suan)(suan)(suan)演變，可能讓下(xia)一代超級計(ji)(ji)算(suan)(suan)(suan)機成(cheng)為超級智算(suan)(suan)(suan)機，它不僅是計(ji)(ji)算(suan)(suan)(suan)性能的(de)數量級躍升(sheng)，同時(shi)也能更好地集成(cheng)機器學習和物理(li)建(jian)模。因此，ASC22將自然語言處(chu)理(li)這個高(gao)性能計(ji)(ji)算(suan)(suan)(suan)和人工(gong)(gong)智能完美(mei)結合的(de)前(qian)沿應用(yong)設為賽題，將成(cheng)為參(can)賽隊比(bi)拼AI與超算(suan)(suan)(suan)融合能力(li)的(de)絕佳試驗場。

AI大模型賽題專家、浪潮人工智能研究院首席研究員吳韶華表示，這道賽題瞄準的是分布式訓練性能優化方向，要求參賽隊伍在100GB的數據集上完成10億個令牌的(de)(de)(de)訓(xun)練(lian)，在滿足精(jing)度的(de)(de)(de)條件下，性能越(yue)快，得(de)分越(yue)高。而(er)訓(xun)練(lian)性能的(de)(de)(de)提升，將直接(jie)降低大模型的(de)(de)(de)訓(xun)練(lian)開銷、降低集群能耗，進而(er)降低碳排放(fang)。希望通(tong)過該賽題，參賽隊伍能對自然語言處理領(ling)域的(de)(de)(de)前沿研究形成(cheng)清晰的(de)(de)(de)認知，并(bing)且通(tong)過創(chuang)新(xin)實(shi)踐，找到(dao)具有普適(shi)意(yi)義的(de)(de)(de)方(fang)法(fa)，取得(de)計算性能上的(de)(de)(de)突破(po)。

ASC世界大學生超(chao)(chao)(chao)算競(jing)賽(sai)由中國(guo)發起組織，并得到亞洲及歐美(mei)相(xiang)關專家和機構支持，旨在(zai)通過大賽(sai)平臺推動各(ge)(ge)國(guo)及地區(qu)間超(chao)(chao)(chao)算青年(nian)(nian)人才交流和培(pei)養(yang)，提升超(chao)(chao)(chao)算應用水(shui)平和研(yan)發能力(li)，發揮超(chao)(chao)(chao)算的(de)(de)科(ke)(ke)技(ji)驅動力(li)，促進科(ke)(ke)技(ji)與產(chan)業創新。ASC超(chao)(chao)(chao)算大賽(sai)迄今已(yi)舉行至第10屆(jie)，吸引超(chao)(chao)(chao)萬名(ming)世界各(ge)(ge)國(guo)大學生參(can)賽(sai)，是全球最(zui)大規(gui)模的(de)(de)超(chao)(chao)(chao)算競(jing)賽(sai)。在(zai)最(zui)新的(de)(de)2022年(nian)(nian)賽(sai)季，來自世界各(ge)(ge)國(guo)的(de)(de)300多支隊伍(wu)(wu)報名(ming)參(can)賽(sai)，經初賽(sai)選拔的(de)(de)隊伍(wu)(wu)將參(can)加5月7日-11日在(zai)位(wei)于合肥(fei)的(de)(de)中國(guo)科(ke)(ke)學技(ji)術大學舉行的(de)(de)總決賽(sai)。

消息來源：ASC亞洲超算協會