京東云推出vGPU池化方案,大模型訓(xùn)練效率提升 成本降低
(資料圖片僅供參考)
隨著人工智能應(yīng)用的廣泛應(yīng)用,圖形處理器(GPU)作為AI計(jì)算的核心硬件之一,需求量持續(xù)增長(zhǎng)。為滿足這一需求,京東云近日推出了一種名為vGPU的池化方案。這是一種一站式的GPU算力池化能力,能夠使GPU的利用率提高最高達(dá)70%,從而大幅度降低大模型推理的成本。 實(shí)踐效果顯示,通過(guò)GPU異構(gòu)資源池化,AI運(yùn)行效率得到提升,成本降低,整體GPU利用率提升70%,具有顯著的優(yōu)勢(shì)和實(shí)際應(yīng)用價(jià)值。結(jié)合任意切分和按需分配,在同等GPU數(shù)量的前提下,實(shí)現(xiàn)了數(shù)倍業(yè)務(wù)量擴(kuò)展和資源共享,降低了硬件采購(gòu)成本,使用更少的AI芯片支撐了更多的訓(xùn)練和推理任務(wù)。 京東云表示,這個(gè)方案是基于他們自主研發(fā)的混合多云操作系統(tǒng)云艦。在原有支持混合多云CPU算力池化能力的基礎(chǔ)上,京東云針對(duì)大模型訓(xùn)練所需的泛算力池化能力,進(jìn)一步增強(qiáng)了針對(duì)AI應(yīng)用所需的調(diào)度管理能力。這包括卡管理、節(jié)點(diǎn)管理、異構(gòu)資源調(diào)度管理等,為包括大模型訓(xùn)練在內(nèi)的多種AI應(yīng)用,提供一站式算力池化解決方案,從而全面提升資源利用率。 京東云的這個(gè)池化方案具有四大優(yōu)勢(shì):算力切分靈活,支持精細(xì)化的配額管理,適配主流CUDA版本和不同GPU芯片適配,還支持節(jié)點(diǎn)虛擬分組和節(jié)點(diǎn)組指定應(yīng)用使用,這些優(yōu)勢(shì)將全面提升大模型訓(xùn)練效率。 在實(shí)際使用場(chǎng)景中,開(kāi)發(fā)者可以根據(jù)卡型號(hào)申請(qǐng)資源,按算力和顯存切分,統(tǒng)一由控制器根據(jù)用戶指定的調(diào)度策略調(diào)整。僅在訓(xùn)練、微調(diào)和推理任務(wù)啟動(dòng)時(shí)進(jìn)行動(dòng)態(tài)分配,在任務(wù)結(jié)束即可以釋放,支持多任務(wù)算力隔離和任務(wù)冷啟動(dòng)。 京東云的vGPU池化方案是一種高效、靈活、經(jīng)濟(jì)的解決方案,對(duì)于大模型訓(xùn)練和AI應(yīng)用具有重要的實(shí)用價(jià)值。未來(lái),隨著人工智能技術(shù)的不斷發(fā)展和普及,vGPU池化方案將會(huì)發(fā)揮更加重要的作用,為企業(yè)的AI應(yīng)用提供更加靈活和高效的解決方案。
關(guān)鍵詞:
相關(guān)新聞