亚洲在线日韩伦理片,96精品国产AⅤ一区二区,青鸟影视网,yy黄色频道,国内精品久久久精品AV电影院

打破訓練數據瓶頸,浪潮AIStation為AI開發“加油”

2020-07-14 08:40 8246
浪潮AIStation企業級人工智能開發平臺,可以一站式進行AI模型開發和部署,在數據管理方面可實現集中管理,兼顧讀取速度與安全性,打破數據孤島和IO瓶頸,幫助用戶獲得200%-300%的開發效率提升。

北(bei)京(jing)2020年7月14日(ri) /美(mei)通社/ -- 數(shu)據之于(yu)人工智能(neng)(neng)就如同燃油(you)之于(yu)汽車。人工智能(neng)(neng)模型開(kai)發需要輸入海量訓練(lian)數(shu)據,單個樣(yang)本數(shu)據集(ji)大小即(ji)可(ke)達到(dao)上百GB,如果采(cai)用人工拷(kao)貝、搬運數(shu)據,不(bu)僅(jin)費(fei)時費(fei)力,而(er)且存(cun)在數(shu)據沖突(tu)和數(shu)據安(an)全風險(xian),在這種情(qing)況下,數(shu)據對(dui)于(yu)AI模型訓練(lian)來(lai)說不(bu)是(shi)“加油(you)”,而(er)是(shi)成為模型開(kai)發的(de)瓶(ping)頸(jing),影響企(qi)業(ye)(ye)AI應用效(xiao)率。浪潮(chao)AIStation企(qi)業(ye)(ye)級人工智能(neng)(neng)開(kai)發平臺,可(ke)以一站式進(jin)行(xing)AI模型開(kai)發和部署,在數(shu)據管理方面可(ke)實(shi)現集(ji)中管理,兼(jian)顧讀取速(su)度與安(an)全性,打破數(shu)據孤島和IO瓶(ping)頸(jing),幫(bang)助用戶獲得200%-300%的(de)開(kai)發效(xiao)率提升(sheng)。

浪潮AIStation集中管理數據
浪(lang)潮(chao)AIStation集(ji)中管理(li)數據

可視化&多種數據訪問方式  兼顧便捷與數據安全

AI開(kai)發涉及的數(shu)(shu)據包括樣本數(shu)(shu)據集、模型文件(jian)等(deng),種類非常多,格式和(he)特性各(ge)異。此(ci)外,AI開(kai)發需(xu)要企業內(nei)各(ge)業務(wu)組的協同工(gong)作,必(bi)須有完善(shan)的數(shu)(shu)據管理機制保障(zhang)數(shu)(shu)據的流通和(he)共享(xiang),否則就會存(cun)在數(shu)(shu)據冗余(yu)、版本沖突(tu)、權限控制等(deng)方面的問題(ti)。

AIStation平臺內置數(shu)據(ju)管理(li)(li)模塊,可(ke)無縫對接各類存(cun)(cun)儲系統,提供可(ke)視化界面對數(shu)據(ju)進行(xing)集中管理(li)(li)。開(kai)發人員(yuan)可(ke)在數(shu)據(ju)管理(li)(li)界面快速上(shang)傳數(shu)據(ju),并通過目錄(lu)掛載的(de)方式實時調取數(shu)據(ju),進行(xing)數(shu)據(ju)預處理(li)(li)、模型(xing)開(kai)發、模型(xing)調試(shi)等工作。訓練結(jie)束后,用戶可(ke)按(an)需保(bao)存(cun)(cun)、上(shang)傳、共享模型(xing)文件。

浪潮人工智能開發平臺AIStation數據管理界面
浪潮人工智(zhi)能開發(fa)平(ping)臺(tai)AIStation數(shu)據管理界面

AIStation提供(gong)了(le)個人數(shu)(shu)(shu)據(ju)、組(zu)內(nei)數(shu)(shu)(shu)據(ju)和(he)公共數(shu)(shu)(shu)據(ju)三種數(shu)(shu)(shu)據(ju)訪問控(kong)制(zhi)方式,滿足了(le)企業內(nei)部(bu)用戶數(shu)(shu)(shu)據(ju)隔離與共享的需(xu)求(qiu)。并為每個用戶和(he)部(bu)門創建了(le)不(bu)同的命(ming)名空間(jian),以及相應的權限控(kong)制(zhi)功能,讓開發人員能夠根據(ju)業務需(xu)求(qiu)靈活共享數(shu)(shu)(shu)據(ju),并保障數(shu)(shu)(shu)據(ju)安全(quan)。

AIStation提供三種數據訪問方式
AIStation提供三種(zhong)數據訪問方式

數據緩存加速,訓練效率提升200%-300%

數據輸(shu)(shu)入(ru)輸(shu)(shu)出是影響模型訓練周期的(de)重(zhong)要(yao)(yao)因素。即使(shi)GPU性能再強,也(ye)需(xu)要(yao)(yao)高(gao)性能的(de)輸(shu)(shu)入(ru)/輸(shu)(shu)出系統不斷的(de)將數據傳送給(gei)GPU進行(xing)運算。輸(shu)(shu)入(ru)的(de)樣本(ben)數據通常(chang)是小文件(jian),并且在(zai)迭(die)代過程中會隨機讀取樣本(ben)進行(xing)訓練,產生較高(gao)的(de)隨機讀負載(zai)。而AI企業一般(ban)使(shi)用(yong)共享存儲或(huo)者分布(bu)式存儲管(guan)理數據,計算節點(dian)通過網絡(luo)掛(gua)載(zai)的(de)方式訪問存儲數據,這樣即便(bian)使(shi)用(yong)萬(wan)兆網絡(luo)或(huo)者Infiniband網絡(luo),也(ye)有可能存在(zai)數據帶寬(kuan)不能滿足GPU計算輸(shu)(shu)入(ru)的(de)問題。

數據I/O成為計算瓶頸
數據(ju)I/O成為計算瓶(ping)頸

AIStation綜(zong)合考慮AI計算對數據I/O的需求(qiu)以及企業內部的實際場景,通過數據緩存機(ji)制滿足(zu)高性(xing)能計算需求(qiu),可讓模型(xing)訓練效(xiao)率獲得(de)200%-300%的提(ti)升,縮短模型(xing)開發周期(qi)。

AIStation可在各計算(suan)節點劃分數據(ju)緩(huan)存(cun)區域,用來臨時存(cun)放用戶訓(xun)練(lian)(lian)所需的(de)(de)(de)(de)樣本(ben)數據(ju),通(tong)過本(ben)地SSD盤的(de)(de)(de)(de)高速I/O降(jiang)低數據(ju)讀寫延遲。此外,AIStation會根據(ju)節點的(de)(de)(de)(de)數據(ju)緩(huan)存(cun)情況自(zi)動調度(du)訓(xun)練(lian)(lian)任(ren)務,從(cong)而避免訓(xun)練(lian)(lian)數據(ju)的(de)(de)(de)(de)重(zhong)復下(xia)載(zai),節省數據(ju)加載(zai)時間(jian),加速模(mo)型訓(xun)練(lian)(lian)進度(du)。并(bing)且支持數據(ju)自(zi)動下(xia)載(zai)和數據(ju)緩(huan)存(cun)管理。

安全沙箱技術,為數據隱私護航

數(shu)據(ju)(ju)安全對企業AI開發(fa)(fa)至(zhi)關重要(yao),一套優秀的數(shu)據(ju)(ju)管理(li)解決方案(an)必(bi)須能夠保證數(shu)據(ju)(ju)安全,確保數(shu)據(ju)(ju)不會發(fa)(fa)生增(zeng)加、修改、丟失和泄露等。

AIStation采用安(an)全沙箱技術,將(jiang)企(qi)業數(shu)(shu)據(ju)(ju)(ju)存(cun)儲(chu)區(qu)域與個人數(shu)(shu)據(ju)(ju)(ju)區(qu)分(fen)開,保證數(shu)(shu)據(ju)(ju)(ju)隱私安(an)全。管理員(yuan)可以設置數(shu)(shu)據(ju)(ju)(ju)下載權限,限制指定用戶或(huo)用戶組(zu)的下載功(gong)能(neng)(neng),使涉密數(shu)(shu)據(ju)(ju)(ju)只能(neng)(neng)在平臺內部使用,保障企(qi)業數(shu)(shu)據(ju)(ju)(ju)的安(an)全性。

此外(wai),AIStation可實現數據自動多副本備份(fen),降低宕機(ji)等原因導致的(de)系(xi)統中斷對AI開發的(de)影響。

浪潮AIStation平(ping)臺針對AI開發中(zhong)的(de)數據(ju)(ju)管理問(wen)題輸出(chu)整體解決方案,可以幫助企(qi)業用戶(hu)建立穩(wen)定高性能(neng)的(de)數據(ju)(ju)管理機(ji)制,消除數據(ju)(ju)安(an)全、數據(ju)(ju)沖突、帶寬延時等問(wen)題,讓(rang)模型訓練(lian)效率獲得200%-300%的(de)提升,顯(xian)著提升企(qi)業AI研發效率。

除了數據,AIStation還能高效管理計算資源、開發環境,幫助AI用戶提高計算資源利用率,秒級構建開發環境,加速AI研發創新進程(cheng)。

消息來源:浪潮
全球TMT
微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼,立即訂閱!
collection