近日,由人工智能軟硬件協(xié)同創(chuàng)新與適配驗證中心(以下簡稱“人工智能軟硬件測試驗證中心”)、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟聯(lián)合舉辦的 2025 年人工智能軟硬件協(xié)同創(chuàng)新高級別研討會暨中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟第十五次全會,在北京圓滿落下帷幕。會上,備受矚目的首批“DeepSeek 大模型適配通過名單”,由中國信通院、人工智能軟硬件測試驗證中心、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟三家權(quán)威機構(gòu)聯(lián)合發(fā)布,中昊芯英憑借其卓越的技術(shù)能力和 DeepSeek 大模型的深度適配成為全國首批上榜的 8 家企業(yè)之一。
本次會議,旨在貫徹落實黨中央、國務(wù)院關(guān)于加快人工智能自主軟硬件生態(tài)建設(shè)的決策部署,深入開展“人工智能+”行動,高質(zhì)量推進人工智能賦能新型工業(yè)化。工業(yè)和信息化部科技司司長魏巍,北京經(jīng)濟技術(shù)開發(fā)區(qū)工委副書記、管委會主任王磊,中國信息通信研究院院長、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟秘書長余曉暉,北京市發(fā)展改革委、市經(jīng)信局、市科委等政府領(lǐng)導(dǎo)及產(chǎn)學(xué)研用的專家學(xué)者出席會議。
大模型與國產(chǎn)軟硬件適配需求迫切,中昊芯英首批通過權(quán)威檢驗
隨著人工智能技術(shù)的快速發(fā)展,大模型與國產(chǎn)軟硬件的適配需求日益迫切。人工智能軟硬件測試驗證中心作為權(quán)威測試驗證機構(gòu),承擔(dān)了推動人工智能軟硬件協(xié)同發(fā)展的關(guān)鍵任務(wù)。此次,由中國信通院、人工智能軟硬件測試驗證中心、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟開展的面向大模型的人工智能軟硬件系統(tǒng)適配能力檢驗吸引了國內(nèi)眾多芯片企業(yè)、云服務(wù)及智算公司積極參與。經(jīng)過人工智能軟硬件測試驗證中心首批測試評估,僅有中國電信、華為、寒武紀(jì)、昆侖芯、海光、沐曦、中昊芯英、中科加禾通過了 DeepSeek 系列開源模型適配并上榜 DeepSeek 大模型適配通過名單。
該名單是對成功適配 DeepSeek 大模型的軟硬件企業(yè)的權(quán)威認可。在此次人工智能軟硬件測試驗證中心適配測試中,中昊芯英基于自研“剎那®”TPU AI 芯片構(gòu)建的“泰則®”GPTPU人工智能服務(wù)器通過了適配支持測試、性能測試、功能測試共三個維度的測試驗證。在計算精度、模型運行穩(wěn)定性、以及與 DeepSeek 模型的協(xié)同效率等多方面指標(biāo)上,均達到了測試規(guī)范的要求,充分展現(xiàn)了其技術(shù)實力與產(chǎn)品的可靠性。
中昊芯英核心技術(shù)與研發(fā)實力:從芯片創(chuàng)新到技術(shù)路線驗證
中昊芯英自 2018 年創(chuàng)立以來,便始終專注于高性能 AI 芯片與計算集群的研發(fā)。公司由前谷歌 TPU 芯片核心研發(fā)者楊龔軼凡,攜一批來自谷歌、微軟、三星等海外科技巨頭公司的 AI 軟硬件設(shè)計專家組建。核心團隊掌握從 28nm 到 7nm 各代制程工藝下大芯片設(shè)計與優(yōu)化完整方法論,全棧式的技術(shù)梯隊覆蓋芯片設(shè)計、電路設(shè)計、軟件棧研發(fā)、系統(tǒng)架構(gòu)、大模型算法等各類技術(shù)領(lǐng)域,研發(fā)人員占比 70% 以上。
歷時近 5 年的潛心研發(fā),中昊芯英推出了中國首枚全自研的 GPTPU 架構(gòu)高性能 AI 芯片“剎那®”。該芯片擁有完全自主可控的 IP 核、全自研指令集與計算平臺,AI 算力性能超越海外著名 GPU 產(chǎn)品近 1.5 倍,能耗降低 30%,單位計算成本降低近 50%。同時,采用 Chiplet 技術(shù)與 2.5D 封裝,實現(xiàn)同等制程工藝下的性能躍升。支持 1024 片芯片高速片間互聯(lián),系統(tǒng)級性能比傳統(tǒng) GPU 集群提升數(shù)倍,為構(gòu)建千卡、萬卡規(guī)模超算集群奠定基礎(chǔ)。基于“剎那®”芯片構(gòu)建的“泰則®”GPTPU 人工智能服務(wù)器與計算集群系統(tǒng),單集群最大浮點運算能力在 TF32 計算精度及稀疏算力技術(shù)下可達 400P 以上,有力支撐包括超千億參數(shù) AIGC 大模型運算、高級無人駕駛模型訓(xùn)練、蛋白質(zhì)結(jié)構(gòu)精密預(yù)測等各類高強度 AI 運算場景。
作為中國 TPU 架構(gòu) AI 芯片研發(fā)與產(chǎn)業(yè)的先行者與領(lǐng)導(dǎo)者,遠在 ChatGPT 引爆 AI 大模型產(chǎn)業(yè)多年之前,中昊芯英創(chuàng)始人及 CEO楊龔軼凡,就堅信未來的 20 年一定是 AI 的時代,AI 的應(yīng)用場景將遠遠超過以往任何計算的使用場景,而 AI 時代將需要一塊專門為 AI 計算而生的芯片。相較 GPU 提供了一種通用方法適用于各種計算工作負載情況,TPU 強化了 AI/ML 計算方面的能力,在指令集、數(shù)據(jù)和計算完成方式等層面上實現(xiàn)了完全的創(chuàng)新,設(shè)計芯片架構(gòu)時在計算單元的維度、數(shù)據(jù)傳輸?shù)纳疃壬隙疾扇「鼮楦咝У牟呗,因此在處理大?guī)模 AI 模型計算和推理任務(wù)時,相較于 GPU 可以實現(xiàn)更高性能與更低能耗。
“DeepSeek 將軟硬件協(xié)同優(yōu)化推向極致的路徑,恰好驗證了以中昊芯英為代表的 AI 專用芯片設(shè)計企業(yè)的技術(shù)路線與理念是正確的,”楊龔軼凡表示,“DeepSeek 式技術(shù)路線能與國產(chǎn) AI 芯片形成自主可控協(xié)同體,通過本土模型與算力廠商間更緊密的合作、更極致的適配優(yōu)化,為客戶提供最具性價比的算力!
重塑 AI 技術(shù)落地成本邏輯,助力國產(chǎn) AI 生態(tài)發(fā)展
中昊芯英 TPU 與 DeepSeek 模型的成功適配與高效優(yōu)化,正在重塑 AI 技術(shù)落地的成本邏輯。在教育、金融、工業(yè)質(zhì)檢、智慧醫(yī)療、智能終端等數(shù)據(jù)敏感或資源受限的場景中,中昊芯英的企業(yè)客戶得以在本地化環(huán)境中運行經(jīng)過優(yōu)化的高性能模型,既避免了云端推理的隱私風(fēng)險與網(wǎng)絡(luò)延遲,也降低了傳統(tǒng)方案對昂貴計算硬件的依賴。曾經(jīng) AI 應(yīng)用不甚成熟的行業(yè)亦能更快過渡到數(shù)據(jù)驅(qū)動、AI 增強的操作模式,AI 大模型帶來的“科技民主化”將擁有切實的技術(shù)通路。
中國 AI 產(chǎn)業(yè)正從“單點技術(shù)突破”向“生態(tài)協(xié)同創(chuàng)新”演進,中昊芯英 TPU 芯片在與 DeepSeek 的適配中展現(xiàn)出的算法兼容性與計算效能,為國產(chǎn)芯片參與全球 AI 基礎(chǔ)設(shè)施競爭提供了重要范本。隨著更多算法廠商與硬件企業(yè)的深度協(xié)作,中國有望在 AI 算力效率賽道構(gòu)建獨特優(yōu)勢,推動全球智能化進程邁向更集約、更可持續(xù)的新階段。
展望未來,中昊芯英將繼續(xù)秉承創(chuàng)新精神,持續(xù)深耕高性能 TPU AI 芯片的自主研發(fā)與迭代升級,不斷優(yōu)化產(chǎn)品性能和服務(wù)質(zhì)量。同時,公司還將積極攜手上下游合作伙伴,共同構(gòu)建更加開放、繁榮的 AI 生態(tài)體系,為客戶提供更加高效、可靠的算力引擎,助力各行業(yè)在 AI 時代實現(xiàn)數(shù)字化轉(zhuǎn)型與創(chuàng)新發(fā)展,持續(xù)釋放 AI 賦能產(chǎn)業(yè)的無限潛能。