ICC訊 甲骨文與AMD周四聯(lián)合宣布,AMD最新Instinct MI355X GPU將登陸甲骨文云基礎(chǔ)設(shè)施(OCI),為大規(guī)模AI訓(xùn)練和推理工作負(fù)載提供較前代產(chǎn)品2倍以上的性價(jià)比優(yōu)勢(shì)。OCI將構(gòu)建由多達(dá)131,072塊MI355X GPU加速的zettascale級(jí)AI超級(jí)計(jì)算集群,支持客戶開展規(guī)?;疉I開發(fā)。
OCI執(zhí)行副總裁Mahesh Thiagarajan表示:"我們致力于提供最廣泛的AI基礎(chǔ)設(shè)施選擇。AMD加速器與OCI高性能網(wǎng)絡(luò)、靈活架構(gòu)的結(jié)合,將滿足客戶對(duì)新型智能體應(yīng)用的訓(xùn)練推理需求。"該方案采用高吞吐、超低延遲的RDMA集群網(wǎng)絡(luò)架構(gòu),MI355X GPU計(jì)算性能提升近3倍,高頻內(nèi)存容量增加50%。
AMD數(shù)據(jù)中心解決方案事業(yè)部執(zhí)行副總裁Forrest Norrod指出:"雙方合作始終致力于為客戶提供開放、高效且靈活的解決方案。新一代AMD加速器與Pollara網(wǎng)卡將支持更多AI推理、微調(diào)和訓(xùn)練場(chǎng)景。"
MI355X核心優(yōu)勢(shì)
新平臺(tái)具備288GB HBM3顯存和8TB/s內(nèi)存帶寬,支持4位浮點(diǎn)計(jì)算(FP4)標(biāo)準(zhǔn),采用液冷設(shè)計(jì)實(shí)現(xiàn)單機(jī)架125千瓦功率密度。每機(jī)架部署64塊1400瓦GPU,配合AMD Turin高頻CPU(最高3TB系統(tǒng)內(nèi)存)實(shí)現(xiàn)高效任務(wù)調(diào)度。客戶可通過(guò)AMD開源ROCm軟件棧無(wú)縫遷移現(xiàn)有代碼,并利用Pollara智能網(wǎng)卡的先進(jìn)RoCE功能構(gòu)建高性能網(wǎng)絡(luò)。
(注:RDMA指遠(yuǎn)程直接內(nèi)存訪問(wèn)技術(shù),RoCE為基于融合以太網(wǎng)的RDMA協(xié)議)
新聞來(lái)源:訊石光通訊網(wǎng)
相關(guān)文章