日前,龍芯發布了龍芯3C5000服務器處理器,并聯合生(shēng)态夥伴共同發布新一(yī)代國産服務器基礎軟硬件平台。這次發布會有兩個亮點,一(yī)是3C5000處理器,二是3A6000仿真成績。
龍芯3C5000彌補服務器不足
過去(qù),龍芯一(yī)直緻力于提升單核性能,沒有盲目去(qù)堆核心數量。這種穩紮穩打的做法使龍芯在過去(qù)10年中(zhōng)IPC提升了3-4倍,在桌面CPU上成效立竿見影。
但在服務CPU上,由于國内ARM CPU往往采用“堆核戰術”,也就是用64核、128核堆出一(yī)款服務器CPU,這導緻龍芯的四核CPU雖然在單核性能上更好,但在多核性能上不如ARM CPU。這使龍芯在服務器CPU市場競争中(zhōng)處于不利地位。
3C5000是龍芯第一(yī)款16核CPU,采用完全自主的LoongArch指令架構,16核心單芯片unixbench分(fēn)值9500以上,雙精度計算能力達560GFlops,16核處理器峰值性能與典型ARM 64核處理器的峰值性能相當,并支持最高16路互連,搭配新一(yī)代龍芯7A2000橋片,PCIe吞吐帶寬比上一(yī)代提升400%以上。就SPEC2006測試來看,單核定點浮點Base分(fēn)均大(dà)于10/G,單芯片分(fēn)值超過200。可滿足通用計算、大(dà)型數據中(zhōng)心、雲計算中(zhōng)心的計算需求。該處理器通過芯片級安全機制可爲等保2.0、可信計算、國密算法替代、網絡安全漏洞防護等提供CPU級内生(shēng)支持。
3C5000最大(dà)特點是單核性能強,特别是unixbench這種看重單核核内存性能,多核加速比很低的測試,龍芯隻用16核就能跑到9500,某ARM CPU即便有64核也跑不到這個成績。從公開(kāi)的數據來看,3C5000的性能在信創市場足夠用了,而且16核的核心是使其部署比較靈活。另外(wài),龍芯還會有3D5000,也就是把兩個3C5000封裝到一(yī)起的膠水32核芯片,主要針對一(yī)些對性能有更高要求的場景。
龍芯3A6000 IPC追平Zen3
相對于3C5000,鐵流認爲3A6000更加值得關注。相對于一(yī)些技術引進CPU在引進海外(wài)技術後CPU IPC增長緩慢(màn),性能提高基本依靠購買更好的EDA工(gōng)具和買台積電(diàn)更好的工(gōng)藝。龍芯一(yī)直緻力于提升CPU微結構設計水平來提升CPU的性能。CPU的IPC在過去(qù)10年中(zhōng)提升了3-4倍,這使龍芯可以在制造工(gōng)藝上落後技術引進的某ARM CPU一(yī)代的情況下(xià),依然可以依靠CPU微結構設計水平做到性能持平或略優于技術引進的某ARM CPU。當龍芯與引進的某ARM CPU采用相同工(gōng)藝時,龍芯可以憑借其IPC上的優勢在性能上領先某ARM CPU。
3A6000和3A5000采用相同制造工(gōng)藝,龍芯依靠其設計能力把CPU性能大(dà)幅提升。從仿真成績看,定點相對于3A5000提升30%,浮點相對于3A5000提升60%,這種提升是非常駭人的——如果仿真成績與最終成績相當,那麽,3A6000 SPEC06單核定點Base分(fēn)大(dà)于13/G,浮點Base分(fēn)大(dà)于16/G,如果3A5000爲2.5G至2.8G,那麽,3A6000的 SPEC06單核定點Base分(fēn)大(dà)于35,浮點将大(dà)于45,這個性能對于信創和日常使用而言都已經明顯過剩了。
(gcc,1165G7測試過程的頻(pín)率大(dà)約是 4.2GHz,換算IPC 13.3/G。下(xià)圖5600G的編譯參數和1165G7基本是一(yī)樣的。感謝guee幫忙測試)
(gcc,int_base 48.6。測試過程中(zhōng)頻(pín)率基本保持在 4GHz,也就是說 IPC 爲12/G,由于測試還有調優空間,及5600G的緩存要比5600X少一(yī)半,可以認爲調優後的Zen3可以達到13/G)
作爲參照,11代酷睿的IPC大(dà)約是定點13+/G,12代酷睿IPC大(dà)約是定點15+/G,Zen3的IPC大(dà)約是定點13/G,龍芯LA664能夠達到定點13/G,浮點16/G,這已經追平或接近Zen3和11代酷睿。
當下(xià),在同頻(pín)性能上追平11代酷睿和Zen3已經很不錯了,唯一(yī)的問題就在于主頻(pín)了。當龍芯把7000系列把工(gōng)藝換成5/7nm就可以把主頻(pín)做到3G以上,可以實現 SPEC06單核定點Base分(fēn)大(dà)于40,浮點Base分(fēn)大(dà)于50,這種性能已經達到英特爾、AMD市場主流水平,即便龍芯平台移植了3A大(dà)型遊戲,龍芯7000系列CPU也足以應對。
結語
經過20多年的磨砺,龍芯終于把LA664提升到11代酷睿和Zen3的水平。LA664不僅超越了現有技術引進的ARM CPU,還超越了某些ARM CPU廠商(shāng)PPT上的下(xià)一(yī)代CPU核。即便是當下(xià)國内首屈一(yī)指的海光,如果不把CPU IPC提升30%以上,面對LA664也要敗下(xià)陣來。
回溯曆史,在10年前,龍芯的IPC是不如技術引進CPU的,某技術引進ARM CPU的IPC是當時龍芯的2倍左右。然後,技術引進是存在代價和陷阱的,往往是知(zhī)其然不知(zhī)其所以然,進而導緻發展後勁不足。
相比之下(xià),自主研發雖然在起步階段慢(màn)一(yī)些,苦一(yī)些,累一(yī)些,無法像技術引進CPU那要快速拿出産品,但自主研發發展後勁更足,這一(yī)點從龍芯過去(qù)10年的發展就能看出來。
龍芯的性能已經不再是應用的障礙,唯一(yī)的障礙是軟件生(shēng)态。期待龍芯能以應用爲階梯,在合作夥伴的幫助下(xià)循序漸進構建可以與Wintel、AA體(tǐ)系相媲美的自主技術體(tǐ)系。
分(fēn)享上面的二維碼給朋友,即可直達此頁!