超智融合研究報告:通用全精度高算力芯片成為關鍵技術
作者:leyu樂魚發(fā)布時間:2025-03-22
11月15日,在第六屆中國超級算力大會上,《2024中國算力發(fā)展研究報告之超智融合技術路線與趨勢》(以下簡稱“研究報告”)正式發(fā)布。作為首部“超智融合研究報告”,這份報告由國家信息中心信息化和產(chǎn)業(yè)發(fā)展部主任單志廣、中國信息通信研究院云計算與大數(shù)據(jù)研究所所長何寶宏、中國科學院計算技術研究所研究員張云泉等共同主編。
研究報告就人工智能發(fā)展催生海量算力需求背景下,超智融合技術的發(fā)展與創(chuàng)新路徑、應用場景和實踐案例等做了系統(tǒng)性歸納與分析。研究報告指出,超智融合是一個循序漸進的發(fā)展過程,其相關技術融合了超算強大的數(shù)據(jù)處理能力與人工智能的算法優(yōu)化能力,可有效解決人工智能等新興產(chǎn)業(yè)的算力瓶頸,推動計算技術發(fā)展。
兼容主流計算生態(tài)是超智融合技術的發(fā)展必然趨勢。當前超算領域基于x86 CPU和GPU架構已積累海量應用軟件,在人工智能等領域已占據(jù)超90%的市場份額leyu·樂魚。要實現(xiàn)“超智融合”目標,需要具備支撐主流計算生態(tài)的算力系統(tǒng),否則將給開發(fā)者帶來巨大移植負擔。
這需要“超智融合”算力系統(tǒng),不僅要在算力架構層面實現(xiàn)CPU+GPU融合的網(wǎng)絡架構,還需在算力調(diào)度、算力運營等方面,形成高效分配核心,以及統(tǒng)一的服務平臺。在此過程中,通用全精度高算力芯片正成為關鍵技術。
“傳統(tǒng)超級計算機提供的是雙精度浮點運算,主要用于解決數(shù)值模擬和第一性原理計算等科學計算。而智算系統(tǒng)提供的是半精度或整數(shù)運算,主要面向人工神經(jīng)網(wǎng)絡模型的訓練和推理leyu·樂魚(中國)體育官方網(wǎng)站。” 何寶宏介紹,以新型GPU為代表的通用全精度高算力芯片作為研制智能超算系統(tǒng)的硬核技術,英偉達、英特爾等國際廠商已在布局研制。
伴隨人工智能技術不斷融入各行業(yè)應用領域,AI應用場景正變得復雜,單純的半精、整型算力環(huán)境已難以滿足如蛋白質(zhì)結構預測、新材料設計、天氣預報、大規(guī)模分子模擬等 AI for Science 場景中。因此,通過單一芯片平臺提供全精度和混合精度計算,成為“超智融合”發(fā)展背景下的算力基礎設施發(fā)展趨勢。
“超算中心將向超智融合計算中心演進,并伴隨眾多如:全精度大算力高互連通用加速芯片、面向傳統(tǒng)并行計算和分布式訓練的編程模型、面向HPC&AI應用的智能化資源管理與作業(yè)調(diào)度工具等新型技術與應用的創(chuàng)新?!?張云泉說。

研究報告還顯示,超智融合并非簡單的“超算+智算”堆疊,而是從芯片到計算、存儲、網(wǎng)絡,算力調(diào)度、系統(tǒng)運維的體系化融合,包含了數(shù)據(jù)融合、算法融合、業(yè)務融合、基礎設施融合等多維度。
單志廣介紹,超算與智能計算的融合是一種雙向賦能,將重塑計算科學、IT 產(chǎn)業(yè)的格局。如在材料科學中,通過超算模擬原子和分子層面的相互作用而產(chǎn)生的性能數(shù)據(jù),可幫助智算訓練預測新材料特性的模型,加速新材料的研發(fā)進程。
中國科學院院士、北京航空航天大學計算機學院教授錢德沛表示,高性能計算與AI未來有望走向融合態(tài)勢,并將呈現(xiàn)出三個階段性的特征:一是超算支撐AI應用(For AI),利用強大算力來提升AI性能;二是AI改進傳統(tǒng)超算(By AI),通過AI技術使計算系統(tǒng)更加智能和高效; 三是超智實現(xiàn)內(nèi)生融合(Being AI),使AI成為計算系統(tǒng)的核心,實現(xiàn)算力和算法的持續(xù)優(yōu)化。
此外,研究報告還介紹了“流體仿真的AI方法”、“科研‘模型+數(shù)據(jù)驅(qū)動’演進”、“國家超算互聯(lián)網(wǎng)建設”等前沿“超智融合”實踐案例。(戰(zhàn)釗)
來源: 光明網(wǎng)