星 · 研院 | 遇見更智能的未來——AI推理芯片解析與市場觀察
作者:leyu樂魚發(fā)布時間:2025-02-22
AI的三大關(guān)鍵基礎(chǔ)要素是數(shù)據(jù)、算法和算力。隨著云計算的廣泛應(yīng)用,特別是深度學(xué)習(xí)成為當(dāng)前AI研究和運(yùn)用的主流方式,AI對于算力的要求不斷快速提升。CPU可以拿來執(zhí)行AI算法,但因?yàn)閮?nèi)部有大量其他邏輯,而這些邏輯對于目前的AI算法來說是完全用不上的,所以,自然造成CPU并不能達(dá)到最優(yōu)的性價比。因此,具有海量并行計算能力、能夠加速AI計算的AI芯片應(yīng)運(yùn)而生。
01AI芯片的分類 承擔(dān)任務(wù)(訓(xùn)練、推理)leyu·樂魚(中國)體育官方網(wǎng)站
AI的實(shí)現(xiàn)包括兩個環(huán)節(jié):訓(xùn)練、推理。所以根據(jù)承擔(dān)任務(wù)的不同,AI芯片可以分為:用于構(gòu)建神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練芯片,利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測的推理芯片。訓(xùn)練,是指通過大數(shù)據(jù)訓(xùn)練出一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,即用大量標(biāo)記過的數(shù)據(jù)來“訓(xùn)練”相應(yīng)的系統(tǒng),使之可以適應(yīng)特定的功能。訓(xùn)練需要極高的計算性能,需要較高的精度,需要能處理海量的數(shù)據(jù),需要有一定的通用性,以便完成各種各樣的學(xué)習(xí)任務(wù)。推理,是指利用訓(xùn)練好的模型,使用新數(shù)據(jù)推理出各種結(jié)論。即借助現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型進(jìn)行運(yùn)算, 利用新的輸入數(shù)據(jù)來一次性獲得正確結(jié)論的過程。也有叫做預(yù)測或推斷。區(qū)分訓(xùn)練和推理最簡單的例子就是訓(xùn)練芯片在不斷做著1+1+1+1+1.....而推理芯片則將加法變成了乘法。訓(xùn)練芯片,注重絕對的計算能力,而推斷芯片更注重綜合指標(biāo), 單位能耗算力、時延、成本等都要考慮。訓(xùn)練將在很長一段時間里集中在云端,推理的完成目前也主要集中在云端,但隨著越來越多廠商的努力,很多的應(yīng)用將逐漸轉(zhuǎn)移到終端。推理相對來說對性能的要求并不高,對精度要求也要更低,在特定的場景下,對通用性要求也低,能完成特定任務(wù)即可,但因?yàn)橥评淼慕Y(jié)果直接提供給終端用戶,所以更關(guān)注用戶體驗(yàn)方面的優(yōu)化。而隨著終端產(chǎn)生的數(shù)據(jù)量越來越多,為了能夠更好地處理這些數(shù)據(jù),互聯(lián)網(wǎng)廠商對于推理芯片的需求量也將會逐年增加,對于推理芯片的性能要求也將會逐年增加。02AI芯片市場的發(fā)展

當(dāng)前互聯(lián)網(wǎng)公司對于數(shù)據(jù)的處理大部分需求仍然是算力為主,因此英偉達(dá)等企業(yè)占據(jù)了AI芯片的主流市場,主要原因是它們的芯片擁有強(qiáng)大的并行計算能力(相比CPU)、通用性以及成熟的開發(fā)環(huán)境。2020年全球AI服務(wù)器市場規(guī)模為122億美元,預(yù)計到2025年全球AI智能服務(wù)器市場將達(dá)到288億美元,5年CAGR達(dá)到18.8%。但是,隨著全球互聯(lián)網(wǎng)數(shù)據(jù)的迅猛增長,導(dǎo)致互聯(lián)網(wǎng)企業(yè)對算力的需求成指數(shù)級上升,對大量的不同數(shù)據(jù)的不同處理需求成指數(shù)級上升。這使得原有的CPU、GPU對應(yīng)框架逐漸無法跟上企業(yè)需求。現(xiàn)有的芯片運(yùn)行框架無法應(yīng)對龐大數(shù)據(jù)量的并行計算、處理要求。應(yīng)運(yùn)而生的AI芯片即為半定制化FPGA芯片以及全定制化ASIC芯片。FPGA、ASIC等加速芯片,利用CPU與加速芯片的組合可以滿足高吞吐量互聯(lián)的需求,為自然語言處理、計算機(jī)視覺、語音交互等人工智能應(yīng)用場景提供強(qiáng)大的算力支持,已經(jīng)成為人工智能發(fā)展的重要支撐力量相比于傳統(tǒng)CPU服務(wù)器,在提供相同算力情況下,搭載AI芯片的服務(wù)器在成本、空間占用和能耗分別為傳統(tǒng)方案的1/8、1/15和1/8。從AI芯片的市場份額占比來看,GPU的市場份額在逐漸下降,那么可以確定的是未來FPGA、ASIC這些擁有定制屬性的芯片會成為互聯(lián)網(wǎng)公司采用的主流芯片。這一點(diǎn)從近年來國內(nèi)各大互聯(lián)網(wǎng)廠商分分下場參與芯片制造事件也有所體現(xiàn)。無論是百度、阿里這些自行成立芯片公司,還是騰訊、字節(jié)等對外投資AI芯片公司都反映出了市場對AI芯片的需求已經(jīng)處于一個非常急迫的節(jié)點(diǎn)。03新未來,新機(jī)遇
在市場如此追捧AI芯片的浪潮下,國內(nèi)一眾AI芯片企業(yè)當(dāng)中已經(jīng)有一部企業(yè)從中脫穎而出,逐漸有了領(lǐng)域的領(lǐng)頭羊的姿態(tài)。在此格局下我們更應(yīng)關(guān)注像希姆計算、燧原科技等已形成強(qiáng)有力的市場競爭優(yōu)勢的企業(yè)。這些企業(yè)會隨著市場對AI芯片需求的增加而逐漸壯大,企業(yè)價值增長會更加迅猛leyu·樂魚。
STAR ENERGY
已投項(xiàng)目
字節(jié)跳動|奇安信|中欣晶圓|一脈陽光|千尋位置|銀聯(lián)商務(wù)|頎中封測|達(dá)闥科技|智行者科技|靈汐科技|微醫(yī)|云從科技|摩爾線程|多點(diǎn)DMALL|安謀中國|優(yōu)必選科技|邁迪頂峰|寧波奧拉半導(dǎo)體|泰州衡川科技|盛諾基醫(yī)藥|東陽光藥業(yè)|孚能科技|航天云網(wǎng)|商湯科技|編程貓|叮當(dāng)快藥|長鑫存儲|屹唐半導(dǎo)體|本源量子|燧原科技|玖誼源粒子|威馬汽車|中創(chuàng)新航|景澤生物|一數(shù)科技|紅山微電子|微納星空|云南中宣液態(tài)-更多精彩,請戳圖片-