本文作者:跨界的申斯基
本文轉(zhuǎn)載自申耀的科技觀察
毫無疑問,如今的世界正以加速度進(jìn)入到智能化時(shí)代,其中“物理世界數(shù)字化、數(shù)字世界智能化”就是最為重要的特征體現(xiàn)。而當(dāng)越來越多的物和設(shè)備都像一臺(tái)臺(tái)計(jì)算機(jī),整個(gè)產(chǎn)業(yè)也從萬物數(shù)字化、萬物互連化、萬物移動(dòng)化、萬物云化進(jìn)入到萬物智能化的新時(shí)代,這在推動(dòng)整個(gè)行業(yè)技術(shù)迭代的同時(shí),確實(shí)對(duì)數(shù)據(jù)的傳輸、存儲(chǔ)、分析和利用提出了前所未有的挑戰(zhàn)。
在此過程中,英特爾始終站在技術(shù)與應(yīng)用的最前沿,并隨著環(huán)境和客戶需求的變化而不斷地迭代和進(jìn)化,特別是創(chuàng)新推出的英特爾傲騰技術(shù)不僅突破了內(nèi)存與存儲(chǔ)的瓶頸,更最大化地提升了數(shù)據(jù)、存儲(chǔ)和內(nèi)存的可用性、經(jīng)濟(jì)性和靈活性,在加速企業(yè)數(shù)字化、智能化的轉(zhuǎn)型同時(shí),也真正讓企業(yè)的數(shù)據(jù)價(jià)值得以更好地變現(xiàn)。來自英特爾2020年第一季度業(yè)績(jī)顯示,該公司非易失性存儲(chǔ)解決方案事業(yè)部(NSG)的營(yíng)收為13億美元,同比增幅高達(dá)46%,這一方面體現(xiàn)出了市場(chǎng)對(duì)英特爾在存儲(chǔ)領(lǐng)域不斷創(chuàng)新的認(rèn)可,另一方面更印證了英特爾傲騰技術(shù)也正從過去的蓄勢(shì)走向了爆發(fā)的新階段。正如英特爾公司中國(guó)區(qū)非易失性存儲(chǔ)解決方案事業(yè)部戰(zhàn)略業(yè)務(wù)開發(fā)總監(jiān)倪錦峰所言:“英特爾一直在致力于通過不斷創(chuàng)新來構(gòu)建一個(gè)堅(jiān)實(shí)的技術(shù)基石,引領(lǐng)整個(gè)計(jì)算和存儲(chǔ)行業(yè)的發(fā)展,讓數(shù)據(jù)可以存儲(chǔ)更多、傳輸更快并處理一切,這始終是英特爾不變的初心。”
智能化時(shí)代數(shù)據(jù)新挑戰(zhàn)
我們知道,近幾年興起的人工智能浪潮,根本原因是得益于計(jì)算力的快速發(fā)展,同時(shí)結(jié)合互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、邊緣計(jì)算帶來的海量數(shù)據(jù)和深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等先進(jìn)算法共同催生而成,其實(shí)際應(yīng)用效果和社會(huì)影響力遠(yuǎn)遠(yuǎn)超出以往。例如,面對(duì)今年突如其來的疫情,我們就可以通過AI技術(shù)從大量的醫(yī)療終端設(shè)備以及大量的病人臨床數(shù)據(jù)中,有效地提煉出更好的診療方案,從而加速診療的效率,提升診療的效果;此外,通過AI和大數(shù)據(jù)相關(guān)技術(shù)提升金融行業(yè)的服務(wù)的質(zhì)量,加速對(duì)中小微企業(yè)的精準(zhǔn)幫扶,從而降低疫情對(duì)整個(gè)社會(huì)經(jīng)濟(jì)的影響等等。從這個(gè)角度來說,AI技術(shù)已經(jīng)以可見或者不可見的方式對(duì)人們的日常生活產(chǎn)生著巨大的影響,但是也要看到,目前由采集、準(zhǔn)備、訓(xùn)練和推理組成的人工智能數(shù)據(jù)管道(Data Pipeline)中,仍然存在著大量的挑戰(zhàn),這也讓AI數(shù)據(jù)的管理和價(jià)值挖掘變得愈加復(fù)雜和困難,具體而言:
首先,在采集階段,需要接收來自多個(gè)源的數(shù)據(jù)輸入,不過由于數(shù)據(jù)源越來越多元化和多樣性,如結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等不斷交織在一起,再加上視頻、圖片、文本、對(duì)話文檔等不同類似的數(shù)據(jù)疊加在一起,導(dǎo)致數(shù)據(jù)量變得無比龐大的同時(shí),也對(duì)存儲(chǔ)的性能提出了新的要求。其次,在準(zhǔn)備階段,即構(gòu)建、清理和豐富原始數(shù)據(jù),以便于后續(xù)訓(xùn)練階段更好的使用,這是一個(gè)數(shù)據(jù)轉(zhuǎn)化的過程,它的完成速度往往取決于部署在每一個(gè)計(jì)算節(jié)點(diǎn)的高性能DRAM數(shù)量和性能,以及與之所配套的存儲(chǔ)方案的性能與相應(yīng)的速度,而在這個(gè)階段它對(duì)存儲(chǔ)性能的要求更高,其對(duì)應(yīng)的工作負(fù)載有順序的讀寫、隨機(jī)的讀寫,或者混合讀寫等。第三,在訓(xùn)練階段,是指為輸出到生產(chǎn)階段創(chuàng)建經(jīng)過訓(xùn)練的模型,這個(gè)階段的主要訴求是資源密集型的,它依賴于高性能的計(jì)算和存儲(chǔ)來執(zhí)行數(shù)學(xué)函數(shù)。此外,在做特定訓(xùn)練的過程所需要的時(shí)間,也取決于這個(gè)方案所部署的高性能內(nèi)存和高性能存儲(chǔ)的數(shù)量。最后,在推理階段,主要是進(jìn)行模型分析和實(shí)時(shí)處理新數(shù)據(jù),而推理的過程既可以部署在數(shù)據(jù)中心,也可以部署在邊緣設(shè)備上,因此這就需要對(duì)DRAM或者內(nèi)存、存儲(chǔ)做不同的匹配,這樣才能最大化的發(fā)揮人工智能的價(jià)值,檢驗(yàn)人工智能落地的成果。對(duì)此,倪錦峰認(rèn)為,在人工智能數(shù)據(jù)管道的整個(gè)過程中,往往對(duì)存儲(chǔ)的需求是變化多端的,最為突出的是以下三個(gè)特點(diǎn):數(shù)據(jù)集的大小,差異性非常大,需要經(jīng)歷從最初到PB級(jí)到GB級(jí)到最后的KB級(jí)別;工作負(fù)載是千變?nèi)f化的,從最初百分之百的寫入,到混合讀寫再到后續(xù)隨機(jī)的讀取;同樣,存儲(chǔ)模式也需要經(jīng)歷不同的變化,如順序化的數(shù)據(jù)流程寫入,到后面完全隨機(jī)地訓(xùn)練等等。由此可見,“物理世界數(shù)字化、數(shù)字世界智能化”帶來的結(jié)果就是,越來越多的海量數(shù)據(jù)正呈現(xiàn)出爆炸式增長(zhǎng),同時(shí)也對(duì)存儲(chǔ)系統(tǒng)的高吞吐量和低延時(shí)的要求提出了苛刻的挑戰(zhàn),這也意味著在人工智能時(shí)代,存儲(chǔ)或者說數(shù)據(jù)管理需要進(jìn)行徹底的轉(zhuǎn)型與變革。
突破內(nèi)存與存儲(chǔ)的瓶頸
也正是洞察到這種新的變化趨勢(shì),英特爾一直致力于建立一個(gè)以數(shù)據(jù)為中心的高效架構(gòu),使數(shù)據(jù)更接近計(jì)算并保持持久性,同時(shí)能夠根據(jù)成本和功耗預(yù)算優(yōu)化性能,從而獲得一個(gè)最佳的平衡,由此釋放人工智能的無限潛力。基于此,英特爾在“存儲(chǔ)金字塔”中創(chuàng)新地引入了傲騰技術(shù),通過突破內(nèi)存與存儲(chǔ)的瓶頸,真正打破了AI新時(shí)代存儲(chǔ)的新邊界,使得企業(yè)能夠更好的釋放數(shù)據(jù)的潛能,讓企業(yè)在AI新時(shí)代形成新的競(jìng)爭(zhēng)優(yōu)勢(shì),可以說創(chuàng)新的價(jià)值意義重大。
倪錦峰表示,“存儲(chǔ)金字塔”中每個(gè)層級(jí)的成本、性能、延時(shí)的指標(biāo)都有量級(jí)的差異,而英特爾傲騰技術(shù)的創(chuàng)新之處在于,它能夠讓更多的數(shù)據(jù)保留在內(nèi)存中(作為內(nèi)存的拓展或者一部分替換),或者相比于NAND的更高速存儲(chǔ)中,從而更加靠近CPU,實(shí)現(xiàn)更好的效率;而英特爾3D QLC NAND則能夠使得數(shù)據(jù)在更多固態(tài)盤中存儲(chǔ),由此提升整體的存儲(chǔ)性能。事實(shí)上,英特特爾傲騰技術(shù)能夠有這樣“獨(dú)一無二”的魔力,背后其實(shí)離不開其四大創(chuàng)新之處,包括采用革命性材料,是數(shù)十年來最顯著的內(nèi)存和存儲(chǔ)的進(jìn)步;強(qiáng)大的就地寫入能力,可按需設(shè)置或重置數(shù)據(jù),而無需擦除介質(zhì);支持位尋址,讓每個(gè)存儲(chǔ)單元都可以單獨(dú)尋址;具備低延遲特性,能夠共同提供極快的介質(zhì)等,由此可以帶來幾個(gè)方面的優(yōu)勢(shì):一是,英特爾傲騰技術(shù)具有超高壽命和超低的延遲。主要體現(xiàn)在在數(shù)據(jù)“讀-修改-寫”的過程中,NAND SSD往往每一個(gè)步驟都需要往復(fù)執(zhí)行,這樣不僅消耗資源,且會(huì)導(dǎo)致性能損耗,而英特爾傲騰技術(shù)把就地寫入能力和位尋址能力結(jié)合在一起,使得它可以在混合讀寫的工作負(fù)載下,有著更好的低延遲能力以及更好的一致性,另外也讓它有著超高的寫壽命。二是,英特爾傲騰技術(shù)具備超強(qiáng)的性能可擴(kuò)展性。以不同存儲(chǔ)介質(zhì)在70/30隨機(jī)讀寫工作負(fù)載場(chǎng)景中表現(xiàn)來看,無論是傳統(tǒng)的HDD,還是SATA/NVMe NAND SSD,都面臨一個(gè)共同的難題,即容量越來越大,但是所產(chǎn)生的IOPS/TB卻越來越小,而英特爾傲騰技術(shù)則更好的解決了這一難題,即隨著容量增加,英特爾傲騰技術(shù)的隨機(jī)性能也可以實(shí)現(xiàn)更好的擴(kuò)展,可以說真正打破了單位存儲(chǔ)的性能瓶頸。三是,英特爾傲騰技術(shù)還能更好的完成多樣化場(chǎng)景應(yīng)用的需求。綜合來講,ACT(Accelerating,加速;Caching,緩存;Tiering,分層)場(chǎng)景中,英特爾傲騰持久內(nèi)存和英特爾傲騰固態(tài)盤,就可以分別在計(jì)算端和存儲(chǔ)端更好的協(xié)同工作。舉例來說,傲騰持久內(nèi)存可以加速Oracle數(shù)據(jù)庫(kù) MySQL這類的應(yīng)用,而傲騰固態(tài)盤則可以做Ceph的日志,起到性能提升改善TCO的作用,這樣完美的配合就能實(shí)現(xiàn)更高SDS的系統(tǒng)效率。
不難發(fā)現(xiàn),英特爾傲騰技術(shù)擁有更低、更一致的延遲、更高的耐用性以及更高的效率,那么在針對(duì)人工智能數(shù)據(jù)管道中的各個(gè)階段,顯然就可以發(fā)揮出更高的價(jià)值,如英特爾傲騰技術(shù)就可以在各類工作負(fù)載、訪問模式和塊大小情況下以出色的混合性能,實(shí)現(xiàn)計(jì)算資源的優(yōu)化;此外,采用英特爾3D NAND技術(shù)的固態(tài)盤,還能夠在釋放存儲(chǔ)數(shù)據(jù)價(jià)值的同時(shí),降低存儲(chǔ)成本和空間并提高運(yùn)營(yíng)效率。更為關(guān)鍵的是,未來的存儲(chǔ)必須是靈活多變的,并能夠?yàn)楦鞣N復(fù)雜的工作負(fù)載提供持續(xù)的、可靠的且按需擴(kuò)展的高性能服務(wù),而英特爾傲騰技術(shù)以其出色容量密度,以及優(yōu)異的性價(jià)比,無疑為AI時(shí)代的數(shù)據(jù)存儲(chǔ)提供了一個(gè)最佳選擇。
傲騰技術(shù)從蓄勢(shì)到爆發(fā)
回頭來看,機(jī)遇是留給那些有準(zhǔn)備的人的,英特爾之所以始終能夠處在存儲(chǔ)乃至數(shù)據(jù)基礎(chǔ)設(shè)施變革的最前沿,關(guān)鍵是其能夠保持著不斷的投入與創(chuàng)新,進(jìn)化與迭代,以及對(duì)行業(yè)需求的前瞻認(rèn)知和準(zhǔn)確判斷,由此讓傲騰技術(shù)完成了從蓄勢(shì)到爆發(fā)的蛻變。倪錦峰告訴我:“英特爾傲騰技術(shù)是業(yè)界最為成熟,產(chǎn)品化最早,也是如今能在市場(chǎng)上形成規(guī)?;疭CM產(chǎn)品和技術(shù)。目前,第一代英特爾傲騰技術(shù)已經(jīng)實(shí)現(xiàn)了廣泛的部署,而今年英特爾還將發(fā)布第二代傲騰技術(shù)和產(chǎn)品,進(jìn)一步提升性能。此外,英特爾今年還會(huì)量產(chǎn)144層QLC NAND,搭配最新傲騰技術(shù)可以為客戶提供更好的存儲(chǔ)解決方案”
具體而言,英特爾傲騰數(shù)據(jù)中心級(jí)固態(tài)盤與持久內(nèi)存已規(guī)?;瘧?yīng)用在存儲(chǔ)、云計(jì)算、數(shù)據(jù)庫(kù)、AI/分析、高性能計(jì)算、超融合(HCI)、通信等場(chǎng)景領(lǐng)域,并且不同領(lǐng)域中英特爾傲騰技術(shù)的應(yīng)用模式也有所不同,這也大大增加了客戶使用傲騰可用性、經(jīng)濟(jì)性和靈活性。其中,BAT三巨頭之一的百度,就率先在2018年發(fā)布了基于英特爾傲騰固態(tài)盤加上英特爾QLC 3DNAND固態(tài)盤技術(shù)的存儲(chǔ)解決方案,而這一解決方案極大程度上提升了百度在AI、大數(shù)據(jù)以及Cloud的存儲(chǔ)性能。數(shù)據(jù)顯示,在百度AI的訓(xùn)練場(chǎng)景中,該方案相比原來的HDD方案,實(shí)現(xiàn)了21倍的性能提升,以及96%的延遲下降,同時(shí)更將TCO下降了60%左右。值得一提的是,VMWare vSAN也將其高性能緩存從NAND PCIe固態(tài)盤換成英特爾傲騰固態(tài)盤,由此讓虛擬機(jī)密度提升了60%,同時(shí)系統(tǒng)整合率能夠提升30%;此外,微軟Azure Stack同樣使用了英特爾傲騰固態(tài)盤作為緩存盤,讓每個(gè)節(jié)點(diǎn)中的虛機(jī)數(shù)量提升了60%,可以說通過傲騰技術(shù)的應(yīng)用,客戶真正節(jié)省了更多的服務(wù)器,節(jié)省了更多的空間,也減少了更多的功耗。倪錦峰最后說:“英特爾傲騰技術(shù)正使得無論是AI、HCI還是SDS的存儲(chǔ)都變得更加的出色,當(dāng)然從技術(shù)應(yīng)用角度來看,英特爾傲騰技術(shù)還處在早期或者是早中期的階段,還有很長(zhǎng)的路要走。因此,未來英特爾也希望越來越多的客戶、生態(tài)合作伙伴,可以嘗試各種各樣的技術(shù)創(chuàng)新,把傲騰技術(shù)融合到各種創(chuàng)新的解決方案之中,并更好的滿足企業(yè)業(yè)務(wù)創(chuàng)新的實(shí)際需求。”可以預(yù)見的是,未來企業(yè)利用創(chuàng)新的存儲(chǔ)介質(zhì)和技術(shù)實(shí)現(xiàn)對(duì)“存儲(chǔ)金字塔”中內(nèi)存和存儲(chǔ)的替換速度還會(huì)加快,而英特爾無疑會(huì)是企業(yè)走向智能化之路上最佳的合作伙伴,同樣也正是英特爾始終堅(jiān)持技術(shù)創(chuàng)新所體現(xiàn)出來的價(jià)值和意義所在。
本文僅代表媒體觀點(diǎn)
文中圖片等素材的版權(quán)歸其所有者擁有