AI服務(wù)器主要指的是采用異構(gòu)形式的服務(wù)器,表現(xiàn)形態(tài)多為機(jī)架式。在異構(gòu)方式上,可以為CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+多種加速卡。
而在其他組成部件上,如內(nèi)存模塊、存儲(chǔ)模塊、網(wǎng)絡(luò)模塊與傳統(tǒng)服務(wù)器差別不大,主要的提升便是支持更大容量的內(nèi)存滿足當(dāng)下實(shí)時(shí)負(fù)載增加的需求,提供更多外置硬盤插槽,并廣泛支持NVME/PCIE等SSD,滿足數(shù)據(jù)洪流需求,網(wǎng)絡(luò)模塊主要表現(xiàn)為帶寬增加。
盡管AI服務(wù)器可以采用多種異構(gòu)形式,但目前廣泛使用的是CPU+GPU。也因此,業(yè)界在談到AI服務(wù)器時(shí),往往將其默認(rèn)為GPU服務(wù)器。因此,在第二部分中,筆者談到的AI服務(wù)器優(yōu)勢(shì)也主要為GPU服務(wù)器。
AI服務(wù)器的優(yōu)勢(shì):
傳統(tǒng)服務(wù)器主要以CPU為算力提供者。而CPU為通用型處理器,采用串行架構(gòu),擅長(zhǎng)邏輯計(jì)算,負(fù)責(zé)不同類型種類的數(shù)據(jù)處理及訪問,同時(shí)邏輯判斷又需要引入大量分支跳轉(zhuǎn)中斷處理,這使得CPU的內(nèi)部結(jié)構(gòu)復(fù)雜。也因此,CPU算力的提升主要靠堆核來(lái)實(shí)現(xiàn)。
隨著云計(jì)算、大數(shù)據(jù)、AI、物聯(lián)網(wǎng)等技術(shù)應(yīng)用,數(shù)據(jù)在近幾年呈指數(shù)型增長(zhǎng),IDC統(tǒng)計(jì)顯示全球90%數(shù)據(jù)均在近幾年產(chǎn)生,這便對(duì)CPU的處理能力提出考驗(yàn),而目前CPU的物理工藝、核心數(shù)已接近極限,數(shù)據(jù)量卻不會(huì)停止,服務(wù)器的處理能力必須提升。因此,在AI時(shí)代下,僅由CPU做算力提供者的傳統(tǒng)服務(wù)器并不能滿足需求。
不同于CPU,GPU采用并行計(jì)算模式,單卡核心數(shù)達(dá)到上千個(gè),擅長(zhǎng)處理密集型運(yùn)算應(yīng)用,如圖形渲染、計(jì)算視覺和機(jī)器學(xué)習(xí)。經(jīng)過(guò)幾年驗(yàn)證,搭載GPU的服務(wù)器也被證實(shí)的確適用這個(gè)時(shí)代。