首頁 >國際 >

應(yīng)對(duì)算力短缺,國產(chǎn)芯片如何變挑戰(zhàn)為機(jī)遇?

通用大模型的空前突破,攪動(dòng)了人工智能(AI)的一池春水。然而,面對(duì)AI突破性發(fā)展帶來的對(duì)AI芯片的井噴式需求,國內(nèi)芯片供應(yīng)卻并未跟上此番步伐。隨著科技巨頭公司和新興企業(yè)爭先涌入大模型的競爭賽道,新一輪的AI芯片短缺問題正在浮出水面。

AI浪潮“炒熱”芯片需求

AI芯片,也被稱為AI加速器或計(jì)算卡,是專門用于處理AI相關(guān)計(jì)算任務(wù)的芯片。它們是構(gòu)筑算力的重要基石。


(資料圖)

中國信息通信研究院在8月19日發(fā)布的《中國綜合算力指數(shù)(2023年)》白皮書顯示,我國算力產(chǎn)業(yè)保持高速增長,其中人工智能算力在整個(gè)算力結(jié)構(gòu)中的占比已經(jīng)超過25%。我國算力總規(guī)模近五年年均增速近30%,數(shù)據(jù)中心機(jī)架數(shù)量年復(fù)合增長率超過30%。

“受大模型熱潮影響,智算算力市場的需求旺盛?!北本┏?jí)云計(jì)算中心技術(shù)CTO甄亞楠對(duì)人民網(wǎng)財(cái)經(jīng)表示,當(dāng)前相關(guān)的算力服務(wù)器呈現(xiàn)持續(xù)緊缺狀態(tài),配貨周期偏長。服務(wù)器制造商普遍預(yù)計(jì)要等待6個(gè)月以上才能獲得最新的GPU,而GPU的供應(yīng)短缺情況至少會(huì)持續(xù)到明年。

不僅供應(yīng)緊張,價(jià)格也節(jié)節(jié)攀升。以目前較為主流的英偉達(dá)A100 GPU為例,大模型的單次訓(xùn)練要求至少百卡、千卡規(guī)模。依據(jù)當(dāng)前市場價(jià)格,建設(shè)1000卡GPU規(guī)模的算力集群成本可達(dá)2億元。

在大模型建設(shè)正酣的同時(shí),人工智能技術(shù)與健康、教育、交通等其他領(lǐng)域的交叉融合也逐漸加深。華大基因高性能計(jì)算研發(fā)總監(jiān)王浩靈表示,基因行業(yè)對(duì)算力的需要不斷增長。他進(jìn)一步表示:“未來,大型語言模型的加入還將進(jìn)一步提高疾病診斷分析效率?!?

中國工程院院士高文將算力比作電力,視為數(shù)字經(jīng)濟(jì)發(fā)展的重要指標(biāo)。燧原科技創(chuàng)始人、董事長兼CEO趙立東認(rèn)為,大模型算力需求將進(jìn)一步驅(qū)動(dòng)AI芯片的研發(fā),“如今的AI芯片,不僅要高性能、高帶寬、高存儲(chǔ),而且要高通用性、高效分布式計(jì)算,高效集群互聯(lián)?!?

國產(chǎn)AI芯片市場:挑戰(zhàn)與機(jī)遇并存

業(yè)內(nèi)人士表示,目前國內(nèi)智能算力的發(fā)展,特別是適用于大模型訓(xùn)練的算力,與全球算力發(fā)展趨勢(shì)相比仍存在較大差距。

甄亞楠坦言,算力的短缺不僅會(huì)削弱人工智能算法的復(fù)雜度與性能提升、延緩模型訓(xùn)練速度、約束應(yīng)用部署規(guī)模,更會(huì)阻礙人工智能技術(shù)的發(fā)展,“許多創(chuàng)新的算法和方法需要大規(guī)模的計(jì)算資源來驗(yàn)證和改進(jìn),缺乏足夠的算力將限制研究人員的創(chuàng)造力和實(shí)驗(yàn)空間,從而阻礙人工智能技術(shù)領(lǐng)域的進(jìn)一步突破。”

近年來,我國人工智能算力芯片的市場格局主要由美國公司英偉達(dá)主導(dǎo),其占據(jù)了80%以上的市場份額,一直保持著無可匹敵的競爭優(yōu)勢(shì)。然而,隨著美國對(duì)高性能芯片出口限制措施不斷加強(qiáng),英偉達(dá)最先進(jìn)的A100、H100芯片無法在國內(nèi)銷售,定制版A800和H800又缺貨嚴(yán)重,在這種情況下,國產(chǎn)AI芯片肩負(fù)起填補(bǔ)市場空缺的重要使命。

據(jù)人民網(wǎng)財(cái)經(jīng)不完全統(tǒng)計(jì),目前,百度、阿里巴巴、騰訊和華為等互聯(lián)網(wǎng)巨頭公司已加快AI芯片的自研步伐,并在各自的云平臺(tái)上率先試用。與此同時(shí),一些初創(chuàng)公司則從芯片的底層架構(gòu)設(shè)計(jì)入手,試圖通過“彎道超車”抓住機(jī)遇。

公開資料顯示,2018年創(chuàng)立的AI芯片設(shè)計(jì)商墨芯憑借雙稀疏化算法技術(shù),通過軟硬件結(jié)合為AI計(jì)算模式和芯片架構(gòu)帶來了顛覆性創(chuàng)新,取得了比國際主流GPU產(chǎn)品更好的測(cè)試成績;2017年創(chuàng)立的鯤云科技自主研發(fā)了全球首款大規(guī)模商用的數(shù)據(jù)流AI芯片,用更少的芯片資源實(shí)現(xiàn)了數(shù)倍的實(shí)測(cè)性能,擺脫對(duì)最新制程工藝的依賴。

但需要指出的是,目前,國產(chǎn)AI芯片在大模型推理方面表現(xiàn)相對(duì)出色,而在門檻更高的大模型訓(xùn)練方面仍無法與英偉達(dá)的通用GPU相媲美。

中國電子技術(shù)標(biāo)準(zhǔn)化研究院副院長陳大紀(jì)表示,國內(nèi)產(chǎn)品的軟硬件以及面向不同場景的生態(tài)落地仍需要進(jìn)一步完善。

多位業(yè)內(nèi)人士表示,在性能方面,英偉達(dá)相繼推出了A100和H100,計(jì)算性能大幅提升,國內(nèi)AI芯片訓(xùn)練產(chǎn)品與其差距十分明顯,尤其是在實(shí)際使用中的性能差距更大;在生態(tài)方面,英偉達(dá)GPU配套的CUDA軟件生態(tài)系統(tǒng)廣泛應(yīng)用,國內(nèi)AI芯片面臨著“要么兼容一個(gè)不開源的生態(tài),要么從零開始自建生態(tài)”的兩難選擇。

具體而言,國產(chǎn)AI芯片普遍存在軟件棧不完善、適配周期長、性能差距大、可靠性需要驗(yàn)證等問題,這導(dǎo)致國內(nèi)企業(yè)對(duì)其采用的意愿不強(qiáng)。此外,生態(tài)系統(tǒng)和自主工藝等難題也有待突破。

“只有解決了這些問題,國產(chǎn)AI芯片才能真正被廣泛應(yīng)用起來?!碧鞌?shù)智芯董事長兼CEO蓋魯江說。

國產(chǎn)AI芯片該如何發(fā)力?

近年來,我國高度重視AI芯片產(chǎn)業(yè),發(fā)布了一系列支持政策,營造良好產(chǎn)業(yè)環(huán)境,在技術(shù)創(chuàng)新、項(xiàng)目建設(shè)、資金保障、標(biāo)準(zhǔn)制定和人才培養(yǎng)等方面都給予了扶持,為我國AI芯片發(fā)展打下了政策基礎(chǔ)。

從產(chǎn)業(yè)角度看,樂觀地說,國產(chǎn)AI芯片可謂正處于百花齊放、百家爭鳴的萌發(fā)階段,各主體正在激烈的市場競爭中快速探索適合的成長道路。

西安交通大學(xué)教授任鵬舉推斷:隨著人工智能走深向?qū)?、真正與行業(yè)邏輯深度融合并廣泛賦能,在數(shù)據(jù)中心側(cè),AI芯片會(huì)繼續(xù)維持協(xié)處理器或者加速器的形態(tài);在終端應(yīng)用側(cè),AI最終會(huì)收斂為一個(gè)關(guān)鍵因素,發(fā)展為異構(gòu)或者超異構(gòu)芯片的形態(tài)。

如何進(jìn)一步提升國產(chǎn)AI芯片競爭力?多位業(yè)內(nèi)人士提出建議:要鼓勵(lì)更多企業(yè)和社會(huì)資本進(jìn)入AI芯片領(lǐng)域,加大投資力度;加強(qiáng)半導(dǎo)體原理、材料等基礎(chǔ)研究投入,推動(dòng)多學(xué)科的交叉融合研究;加快工藝創(chuàng)新進(jìn)步,構(gòu)建本土供應(yīng)鏈體系。

尤其是我國集成電路行業(yè)人才短缺問題不容忽視。任鵬舉坦言,“即使每年有近20萬集成電路相關(guān)專業(yè)高校應(yīng)屆畢業(yè)生,但加入這個(gè)行業(yè)的卻僅有五分之一?!彼ㄗh采取相應(yīng)措施以提高行業(yè)吸引力:一是鼓勵(lì)高校和企業(yè)建立長期合作伙伴關(guān)系,提供獎(jiǎng)學(xué)金和入學(xué)機(jī)會(huì)以激勵(lì)學(xué)生畢業(yè)后從事該行業(yè);二是借助人工智能技術(shù)提高芯片設(shè)計(jì)能力,吸引擅長軟件和算法的專業(yè)人才投身于集成電路行業(yè),進(jìn)一步推動(dòng)國產(chǎn)AI芯片發(fā)展。

趙立東認(rèn)為,推動(dòng)國產(chǎn)AI芯片發(fā)展,就是為了有更加充足、更加便捷、更加平價(jià)的算力,從而實(shí)現(xiàn)真正的算力普惠,而要做到這一點(diǎn),就必須依靠創(chuàng)新的芯片架構(gòu)和開源的產(chǎn)業(yè)生態(tài)。

蓋魯江建議,應(yīng)協(xié)同各方加快制定自主標(biāo)準(zhǔn),進(jìn)一步擴(kuò)大國產(chǎn)通用GPU支持的開發(fā)框架、操作系統(tǒng)、算法模型、業(yè)務(wù)應(yīng)用以及社區(qū)開發(fā)者的范圍,建立起自主生態(tài)圈。

陳大紀(jì)表示,產(chǎn)學(xué)研用各單位應(yīng)以人工智能技術(shù)與產(chǎn)業(yè)融合創(chuàng)新為導(dǎo)向,聚焦產(chǎn)業(yè)智能化場景創(chuàng)新需求,研究、開展與場景結(jié)合緊密的智能芯片相關(guān)的標(biāo)準(zhǔn)需求,并以標(biāo)準(zhǔn)為依托,共同建設(shè)人工智能場景創(chuàng)新支撐環(huán)境,探索多元主體合作的場景創(chuàng)新新機(jī)制,通過助力場景創(chuàng)新,不斷將應(yīng)用創(chuàng)新與市場需求相結(jié)合,合力促進(jìn)我國AI芯生態(tài)建設(shè)。

關(guān)鍵詞:

責(zé)任編輯:Rex_26

推薦閱讀