北京2023年8月(yue)7日(ri) /美通社/ -- "多元算力時代下,大規模的異構服務器設備面臨多種處理器架構、多種設備協議、不同管理芯片兼容的系統化設計挑戰,管理固件也迎來新的變革。開源開放的OpenBMC,以創新的分層解耦軟件架構,兼容不同處理器架構、算力平臺和管理芯片,為多元算力基礎設施提供了開放靈活的運維管理解決方案,也將推動產業形成開放、標準的管理固件生態。"浪潮(chao)信息服務器產品線總經(jing)理趙帥。
全(quan)球(qiu)(qiu)數字(zi)經(jing)濟(ji)持續穩定增長(chang)(chang),AIGC等創(chuang)(chuang)新(xin)技(ji)術應用(yong)對于算(suan)力帶來了巨大的(de)(de)需求,算(suan)力新(xin)基(ji)建成為推動數字(zi)經(jing)濟(ji)發展(zhan)的(de)(de)核心支撐(cheng)力和驅動力。據國際(ji)數據公(gong)司IDC、浪潮信(xin)息、清華大學全(quan)球(qiu)(qiu)產(chan)業研究院聯合發布的(de)(de)《2022—2023全(quan)球(qiu)(qiu)計算(suan)力指(zhi)數評(ping)估報告》顯示,2022年(nian)(nian),中(zhong)國整體服(fu)務器市場(chang)(chang)規模保持6.9%的(de)(de)正增長(chang)(chang),占全(quan)球(qiu)(qiu)市場(chang)(chang)比重達25%。其中(zhong),生成式AI計算(suan)市場(chang)(chang)規模將從(cong)2022年(nian)(nian)的(de)(de)8.2億美元驟增到2026年(nian)(nian)的(de)(de)109.9億美元,成為驅動互聯網、金融、教(jiao)育、醫(yi)療和制造等行業未來創(chuang)(chuang)新(xin)發展(zhan)的(de)(de)重要引擎。
在AIGC等應(ying)用的(de)驅(qu)動下,服(fu)務(wu)器(qi)架構正(zheng)在由CPU密(mi)集型轉向搭載GPU、FPGA、ASIC芯片的(de)加(jia)速計(ji)算密(mi)集型,算力呈現出多元化的(de)發展趨(qu)勢。處(chu)理(li)器(qi)架構也(ye)呈現多元化,x86、ARM、Power、MIPS、RISC-V等處(chu)理(li)器(qi)架構持續并存。多元算力時代下,數據中心為(wei)保障大(da)規模服(fu)務(wu)器(qi)的(de)可(ke)靠(kao)穩定運行(xing),各類(lei)異構設備統(tong)一運維的(de)挑戰(zhan)日益凸顯(xian)。如何實(shi)現多處(chu)理(li)器(qi)、多芯片設備高效、穩定運行(xing),對服(fu)務(wu)器(qi)管理(li)控制(zhi)系(xi)統(tong)BMC (Baseboard Management Controller)固(gu)件(jian)的(de)兼(jian)容性、精細度、定制(zhi)化和快速迭代能力提出了一系(xi)列新的(de)挑戰(zhan)。
多元算力時代,服務器穩定可靠的"第一道防線"面臨全新挑戰
BMC是(shi)在(zai)服(fu)務器中(zhong)嵌(qian)入(ru)的復雜而獨立SOC(System on Chip)系統,是(shi)互聯網、通信(xin)、金融等用(yong)戶數據中(zhong)心集(ji)中(zhong)運維管(guan)理IT設備的核心組件,對服(fu)務器安全可靠運行、遠程集(ji)中(zhong)管(guan)理和控制部(bu)署至關重(zhong)要(yao)。
BMC由BMC硬件和BMC固(gu)(gu)件兩大部(bu)分組成。在硬件上BMC是完整的計算(suan)機系(xi)統(tong),包(bao)含嵌(qian)入式處理器(qi)、內(nei)存(DRAM)和存儲芯(xin)片(Flash),外圍集成豐富的物理通(tong)道,連(lian)接數百個傳感器(qi)、CPU、內(nei)存、磁盤、電源、網卡(ka)、GPU、RAID卡(ka)等各(ge)類(lei)組件,實(shi)現對服務(wu)器(qi)硬件的全方位掌控(kong)。在軟件上,BMC固(gu)(gu)件基于Linux內(nei)核構建(jian)強大的嵌(qian)入式操(cao)作系(xi)統(tong),實(shi)現遠程控(kong)制、故障診斷、配(pei)置部(bu)署、固(gu)(gu)件升級等各(ge)類(lei)運維管(guan)(guan)理功能,數據中(zhong)(zhong)心(xin)管(guan)(guan)理平臺通(tong)過BMC固(gu)(gu)件提(ti)供的Redfish、IPMI、SNMP等API接口實(shi)現海量服務(wu)器(qi)遠程集中(zhong)(zhong)運維管(guan)(guan)理和批量部(bu)署。
BMC固(gu)(gu)件以(yi)往通(tong)常依賴(lai)IBV(Independent BMC Vendor,獨立BMC固(gu)(gu)件提供商(shang))設(she)計的閉源商(shang)業(ye)方案,但(dan)伴隨著數(shu)字(zi)化轉型的快速(su),算力成為數(shu)字(zi)經濟發(fa)展(zhan)的關鍵要素,傳統的BMC研發(fa)在(zai)架構的兼容性、開發(fa)周期、創新性方面存在(zai)越(yue)來(lai)越(yue)多(duo)的的局限(xian)性:
OpenBMC勢不可擋,以開源開放加速融合多元算力的創新優勢
由(you)于傳統BMC固(gu)件(jian)(jian)存(cun)在著(zhu)諸多(duo)問題,且隨著(zhu)數據(ju)(ju)中(zhong)心(xin)的不斷壯大,運維需求越(yue)來越(yue)向(xiang)精細化、定(ding)(ding)制(zhi)化的趨勢(shi)發展,業界開(kai)(kai)始探索更加開(kai)(kai)放先進的BMC固(gu)件(jian)(jian)發展之路 -- OpenBMC順勢(shi)而生。OpenBMC是(shi)(shi)一(yi)個Linux基金會項目(mu),其目(mu)標是(shi)(shi)為BMC生成一(yi)個可(ke)定(ding)(ding)制(zhi)的開(kai)(kai)源固(gu)件(jian)(jian)堆(dui)棧(zhan),該堆(dui)棧(zhan)可(ke)以在服務(wu)(wu)器(qi)、網絡交換機等(deng)(deng)設備上(shang)運行。OpenBMC使用Yocto、OpenEmbedded、systemd和D-Bus技(ji)術輕松構建定(ding)(ding)制(zhi)的管(guan)理平(ping)臺(tai),為x86、ARM和Power等(deng)(deng)多(duo)元架構服務(wu)(wu)器(qi)平(ping)臺(tai)提供統一(yi)上(shang)層(ceng)接口,支撐企業、通信和云數據(ju)(ju)中(zhong)心(xin)的管(guan)理服務(wu)(wu)。
OpenBMC經(jing)過近十年的發(fa)展已趨于成熟,Intel、IBM、Meta(原(yuan)Facebook)和(he)Google等創始成員已經(jing)將其應(ying)用到(dao)各自產品中,國(guo)內的互(hu)聯網、金融、通信、服務器、芯(xin)片(pian)等科技企業也正積極(ji)規劃基于OpenBMC的BMC固件解決方案,OpenBMC應(ying)用前(qian)景勢不可擋。
浪潮信息攜手社區伙伴,加速OpenBMC發展
OpenBMC社(she)(she)區(qu)生態建(jian)設離不開業界(jie)廣(guang)泛的(de)參與和支持(chi),作(zuo)為(wei)開源(yuan)技術的(de)擁護(hu)者與重要貢獻(xian)者,浪潮信(xin)息積極擁抱OpenBMC。早在(zai)2017年(nian)(nian),浪潮信(xin)息與IBM合作(zuo)貢獻(xian)社(she)(she)區(qu),并陸續完成多款主流服務(wu)器產品(pin)的(de)OpenBMC適配。2022年(nian)(nian),浪潮信(xin)息在(zai)OpenBMC社(she)(she)區(qu)開源(yuan)代(dai)碼貢獻(xian)排名中保持(chi)全球第5位和中國第1位,共(gong)計貢獻(xian)代(dai)碼13000余行,參與社(she)(she)區(qu)代(dai)碼審核1000余次,廣(guang)泛覆蓋Redfish、PLDM、LED、USB升級、OCC、時間管理、電源(yuan)控制等模塊,推動了社(she)(she)區(qu)的(de)健康(kang)發展。
基于OpenBMC方案(an),浪(lang)潮信息構建起(qi)更(geng)加(jia)穩定可靠(kao)、更(geng)具擴展性且芯片級(ji)安(an)全的開放架(jia)構通(tong)(tong)用服務器(qi)(qi)產(chan)品(pin)。以業內TOP級(ji)客戶(hu)的大規模數據中(zhong)心為例,其(qi)服務器(qi)(qi)規模通(tong)(tong)常(chang)高達數萬(wan)或(huo)數十萬(wan)臺,由于需求多(duo)樣(yang),各種(zhong)服務器(qi)(qi)產(chan)品(pin)配置(zhi)多(duo)達400余種(zhong),每年需迭代幾十次。浪(lang)潮信息通(tong)(tong)過分層(ceng)解耦、模塊化設計(ji)的OpenBMC方案(an),在BMC層(ceng)面實現了軟硬件的標準設計(ji),支持服務器(qi)(qi)產(chan)品(pin)的快速、穩定迭代,從而更(geng)快、更(geng)好的滿足用戶(hu)資(zi)產(chan)信息管理、故(gu)障預警、遠程管理和(he)批量自動(dong)部署等(deng)需求。
充分利用(yong)OpenBMC等(deng)開源(yuan)技術(shu)賦(fu)能多元算力基礎設(she)施建(jian)設(she),需要持續推動硬件、固(gu)件、軟件、系(xi)統(tong)等(deng)多方面的(de)協同,強(qiang)化(hua)處理器、部(bu)件、管(guan)理芯片、服務(wu)器、用(yong)戶各個層面的(de)生態合作(zuo)與聯合優化(hua),從開源(yuan)社(she)區中(zhong)汲取能量,從而引領開放(fang)計算技術(shu)產業化(hua)落地,助力數(shu)據中(zhong)心(xin)高質量發展。