龍芯3號系列處理器片內整合多個64位元處理器核以及必要的儲存和I/O介面,面向高端嵌入式電腦、桌面、伺服器等應用[1]。目前,除了龍芯3B1000和3B1500處理器為8核,其他的龍芯3號處理器均為4核。龍芯3C5000處理器會將處理器核數提高到16。龍芯3號處理器的微結構分為GS464、GS464E、GS464v以及GS464V(GS464EV)。龍芯3號系列處理器使用了基於層次化目錄的快取一致性協定,可以在相對較低的功耗下達到較高的峰值效能[2]。
此條目需要精通或熟悉相關主題的編者參與及協助編輯。 |
晶片
龍芯3A1000是中華人民共和國首個四核CPU晶片[3],主頻800MHz-1GHz。實現了x86二進制翻譯加速指令。直到現在龍芯3A1000還在工控領域中被運用。
龍芯3B1000由核高基專案課題「高效能多核CPU研發與應用」支援,其向量微架構GS464v將GS464的的浮點部件和浮點暫存器堆替換為2個256位的向量處理部件和1個128x256位的向量暫存器堆,使龍芯3B1000在1GHz下的峰值雙精度浮點計算能力達到128GFlops。在龍芯3B1000處理器中,實現了300多條專用的向量處理指令。晶片面積300mm²,電晶體數目接近6億。
龍芯原本計劃推出一款16核的龍芯3C處理器,後來由於戰略調整而取消,縮水成8核的龍芯3B1500。龍芯3B1500整合了8個四發射亂序執行的64位元GS464v處理器核,9級管線化,單晶片雙精度浮點計算能力達到192GFlops。龍芯3B1500在2012年1月中旬完成設計並交付流片。後工藝從32nm遷移到28nm,於2013年4月底流片,後因流片不成功恢復到32nm工藝流片,再次改版,於2015年1月底流片。[4][5]
龍芯3A1500是龍芯3A2000的陶封版本,是工業級晶片,採用中芯國際40納米LL技術流片。
龍芯3A2000於2014年11月初交付流片,2015年8月18日正式發佈。因採用GS464E微架構 單核通用處理效能相對於3A1000提高了3倍。
龍芯3B2000是龍芯3A2000的多路互聯版,主要應用於雙路8核以及四路16核伺服器[6]。
龍芯3A3000採用GS464E自主微結構設計,主頻可達1.5GHz[7]。
和龍芯3A2000相比,除了流片工藝從中芯國際的40納米提升到意法半導體的28納米CMOS工藝,處理器的三級cache也從4MB提高到8MB。峰值浮點效能24GFlops。整合72位DDR2/3-1600*2,支援 ECC,綜合通用效能和Intel Celeron J1900相當。[8]龍芯中科總裁胡偉武表示,「3A3000的通用處理效能已經跨過了國際通用處理器效能的第一個門檻,其單核SPEC CPU2006效能已經不低於ARM用於伺服器的高端處理器、Intel的低階系列(凌動系列)處理器以及威盛處理器,而且3A3000的訪存頻寬已經與AMD以及Intel的高端系列(酷睿系列)持平。這樣的效能對於以黨政辦公為代表的事務處理應用已經足夠。」[9]
龍芯3A/B4000在2019年12月24日發佈,綜合效能是上一代3A3000的兩倍[3][10]。龍芯3A/B4000採用新一代GS464V微架構,整合兩個64位元DDR4-2400MHz控制器,支援ECC,支援安全可信裝置[11]。
龍芯下一代高效能晶片3A5000,已在2019年年底流片。龍芯3A5000採用3A4000的處理器微結構GS464V,採用12nm工藝流片,主頻提升到2.5GHz。
2021年7月23日,官宣發佈,採用LoongArch自主指令系統,4核心,主頻為2.3GHz-2.5GHz,使用12nm流片。內部整合2個64位元DDR4-3200控制器(支援ECC校驗)。據稱,在GCC編譯環境下執行SPEC CPU 2006的定點、浮點單核Base分值均達到26分以上,四核分值達到80分以上。基於國產作業系統的Unixbench單線程分值達1700分以上,四線程分值達到4200分以上(官方未說明頻率)。在保持與上一代引腳相容的基礎上,效能提升50%以上,功耗降低30%以上(官方並未說明具體功耗)[12]。
龍芯3C5000發佈於2022年6月6日,是龍芯中科面向伺服器領域的16核通用處理器[13]。龍芯3C5000採用了龍芯自主研發的LoongArch指令架構,其單晶片unixbench分值達9,500以上,雙精度計算能力達560GFlops,峰值效能與典型ARM 64核處理器的峰值效能相當[13]。
龍芯3A6000是龍芯第四代微架構的首款處理器[14]。該晶片由龍芯中科於2023年8月流片成功[15],同年11月28日在北京發佈[16]。龍芯3A6000為四核八線程2.5GHz CPU,主頻為2.0GHz-2.5GHz,根據中國電子技術標準化研究院賽西實驗室測試結果,龍芯3A6000四核處理器在2.5GHz執行頻率下,SPEC CPU 2006 base單線程定/浮點分值分別達到43.1/54.6分,SPEC CPU 2006 base多線程定/浮點分值分別達到155/140分,雙DDR4-3200主記憶體通道Stream實測頻寬超過42GB/s,Unixbench實測分值超7,400分[15]。龍芯中科綜合相關測試結果,龍芯3A6000處理器總體效能與英特爾於2020年上市的第10代酷睿四核處理器相當[15],據中國央視新聞報道,該CPU效能達到國際主流產品水平[16]。
模式 | base分值 |
---|---|
SPECint_base2006 | 43.1 |
SPECfp_base2006 | 54.6 |
SPECint_rate_base2006(8copies) | 155 |
SPECfp_rate_base2006(8copies) | 140 |
模式 | 單線程頻寬 | 雙線程頻寬 | 四線程頻寬 | 八線程頻寬 |
---|---|---|---|---|
Cpoy | 32210.8 | 38858.6 | 42467.9 | 36450.4 |
Scale | 19788.4 | 41964.0 | 42199.5 | 35999.7 |
Add | 32921.8 | 42807.2 | 42151.6 | 34493.8 |
Triad | 33028.5 | 42683.8 | 42020.5 | 34451.9 |
模式 | 分值 |
---|---|
1 parallel copy | 2284.5 |
8 parallel copies | 7438.4 |
參考文獻
另見
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.