做視頻鏈接的網(wǎng)站嗎域名收錄批量查詢
浪潮信息近日對(duì)其內(nèi)存故障智能預(yù)警修復(fù)技術(shù)進(jìn)行了全面升級(jí),再次取得技術(shù)突破。此次升級(jí)后,公司服務(wù)器的宕機(jī)率實(shí)現(xiàn)了80%銳降,再次彰顯了浪潮信息在服務(wù)器技術(shù)領(lǐng)域的卓越能力。
浪潮信息全新升級(jí)服務(wù)器內(nèi)存故障智能預(yù)警修復(fù)技術(shù)MUPR? (Memory UCE Prevent and Repair),基于對(duì)上萬(wàn)臺(tái)服務(wù)器故障數(shù)據(jù)的建模分析和AI模型算法的訓(xùn)練,圍繞“預(yù)診愈”核心技術(shù)手段,從單端預(yù)警,觸發(fā)隔離防護(hù)升級(jí)為BIOS、BMC兩級(jí)防護(hù),從內(nèi)存故障提前預(yù)警、內(nèi)存錯(cuò)誤實(shí)時(shí)隔離、內(nèi)存故障智能修復(fù)等技術(shù)層級(jí)創(chuàng)新,實(shí)現(xiàn)在架構(gòu)設(shè)計(jì)、錯(cuò)誤類型、防護(hù)等級(jí)等方面全面增強(qiáng)。全天候、多方位監(jiān)測(cè)服務(wù)器內(nèi)存健康狀態(tài),精準(zhǔn)預(yù)測(cè)UCE(不可糾正錯(cuò)誤)故障,及時(shí)處理內(nèi)存風(fēng)險(xiǎn)單元,使由內(nèi)存故障導(dǎo)致的服務(wù)器宕機(jī)風(fēng)險(xiǎn)降低80%+,保障客戶業(yè)務(wù)高效穩(wěn)定運(yùn)行。
浪潮信息全新內(nèi)存故障智能預(yù)警修復(fù)技術(shù)MUPR?擁有超過20項(xiàng)核心專利,覆蓋內(nèi)存故障處理策略、防護(hù)系統(tǒng)架構(gòu)設(shè)計(jì)、內(nèi)存健康監(jiān)控機(jī)制等關(guān)鍵技術(shù),能夠有效規(guī)避內(nèi)存UCE故障的發(fā)生,切實(shí)保障服務(wù)器內(nèi)存運(yùn)行的可靠性和高效性。
專利一:制定“點(diǎn)、線、面”故障修復(fù)策略,故障類型全面覆蓋
MUPR?依據(jù)內(nèi)存歷史日志的錯(cuò)誤發(fā)生模式,以存儲(chǔ)單元的核心構(gòu)造為基石,實(shí)時(shí)監(jiān)測(cè)內(nèi)存“點(diǎn)、線、面”微觀故障,高效匹配內(nèi)存UCE發(fā)生狀態(tài)特征。首先實(shí)施內(nèi)存物理結(jié)構(gòu)微觀級(jí)別的精準(zhǔn)檢測(cè),深入至每一個(gè)內(nèi)存Cell的狀態(tài)識(shí)別,通過分析內(nèi)存錯(cuò)誤數(shù)據(jù)提取故障規(guī)則,保障內(nèi)存“點(diǎn)”故障的準(zhǔn)確辨識(shí)。其次,MUPR?系統(tǒng)對(duì)上萬(wàn)條來(lái)自不同品牌、不同容量的內(nèi)存進(jìn)行了詳盡的故障分析?;趯?duì)不同內(nèi)存廠家器件的行/列結(jié)構(gòu)差異的分析,構(gòu)建內(nèi)存“線”故障預(yù)測(cè)模型。最后,依托對(duì)內(nèi)存歷史錯(cuò)誤的UCE趨向性以及錯(cuò)誤在內(nèi)存陣列的分布情況,設(shè)置內(nèi)存“面”故障模型,在線精準(zhǔn)預(yù)測(cè)及修復(fù)策略,為用戶提供更加可靠和穩(wěn)定的內(nèi)存使用體驗(yàn)。
專利二:優(yōu)化內(nèi)存防護(hù)系統(tǒng)架構(gòu),降低系統(tǒng)計(jì)算壓力
MUPR?支持SMI(System Management Interrupt)與PRM(Platform Runtime Mechanism)的選項(xiàng)切換技術(shù),引入PRM技術(shù)旨在降低系統(tǒng)計(jì)算壓力,避免因處理內(nèi)存故障而影響系統(tǒng)性能。該技術(shù)通過收集的內(nèi)存錯(cuò)誤信息進(jìn)行帶外故障預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果決定是否觸發(fā)系統(tǒng)控制中斷。而在觸發(fā)中斷的情況下,操作系統(tǒng)可通過PRM處理模塊獲取內(nèi)存故障地址信息,并執(zhí)行故障隔離操作,客戶業(yè)務(wù)運(yùn)行全程無(wú)打斷。
專利三:實(shí)時(shí)監(jiān)測(cè)內(nèi)存運(yùn)行狀態(tài),有效減少非計(jì)劃宕機(jī)風(fēng)險(xiǎn)
鑒于任何防護(hù)措施都不能完全確保內(nèi)存器件的持久穩(wěn)定運(yùn)行,MUPR?系統(tǒng)構(gòu)建了一套完善的服務(wù)器內(nèi)存健康監(jiān)控和風(fēng)險(xiǎn)預(yù)警機(jī)制。該機(jī)制依據(jù)內(nèi)存錯(cuò)誤數(shù)量、頻率、類型、修復(fù)狀態(tài)、錯(cuò)誤風(fēng)暴、溫度變化等多方面信息進(jìn)行內(nèi)存可靠性評(píng)價(jià)、性能評(píng)價(jià),以便客戶在不同業(yè)務(wù)場(chǎng)景下選擇性的對(duì)可靠性或性能異常的內(nèi)存進(jìn)行計(jì)劃停機(jī)維護(hù),有效規(guī)避非計(jì)劃宕機(jī)帶來(lái)的影響。此外,該技術(shù)可有效對(duì)內(nèi)存健康情況進(jìn)行評(píng)測(cè),并根據(jù)內(nèi)存健康度分?jǐn)?shù)對(duì)內(nèi)存異常進(jìn)行預(yù)警,當(dāng)內(nèi)存分?jǐn)?shù)低于異常閾值,提示用戶及時(shí)更換健康硬件。
MUPR?技術(shù)開發(fā)團(tuán)隊(duì),通過對(duì)云數(shù)據(jù)中心130萬(wàn)臺(tái)服務(wù)器進(jìn)行綜合測(cè)評(píng),整體服務(wù)器宕機(jī)率減少了68%,可幫助客戶避免千萬(wàn)美元級(jí)別以上的損失。
借助全新內(nèi)存故障智能預(yù)警修復(fù)技術(shù)MUPR?,浪潮信息成功將內(nèi)存故障預(yù)警與修復(fù)技術(shù)提升到一個(gè)全新的高度。該技術(shù)不僅實(shí)現(xiàn)了對(duì)內(nèi)存故障的深度預(yù)警和精準(zhǔn)修復(fù),更在保障服務(wù)器穩(wěn)定運(yùn)行的同時(shí),有效降低了由內(nèi)存故障導(dǎo)致的業(yè)務(wù)中斷風(fēng)險(xiǎn),進(jìn)一步提升了客戶的業(yè)務(wù)連續(xù)性和穩(wěn)定性。