深度分析國(guó)產(chǎn)龍芯新架構(gòu)CPU:自主崛起 力拼英美
- 來(lái)源:驅(qū)動(dòng)之家
- 作者:liyunfei
- 編輯:liyunfei
同頻性能接近Sandy Bridge實(shí)測(cè)數(shù)據(jù)分析
龍芯目前公布的實(shí)測(cè)數(shù)據(jù)主要是在RTL仿真以及硬件加速仿真驗(yàn)證平臺(tái)上取得的,設(shè)定頻率為1GHz,如果實(shí)際芯片能夠運(yùn)行在1GHz上,并且接口時(shí)序設(shè)定正確,它們和實(shí)際芯片運(yùn)行性能是沒(méi)有什么差別的。
從表2可以看到,龍芯GS464E號(hào)稱(chēng)訪存性能即內(nèi)存性能提高了10~20倍。據(jù)悉前代龍芯過(guò)于注重核心微結(jié)構(gòu),內(nèi)存控制器設(shè)計(jì)則過(guò)于輕視,甚至連突發(fā)傳輸模式的支持都沒(méi)有做好,因此內(nèi)存性能非常低下。而這一次流式訪存性能暴漲則也是因?yàn)樾拚藘?nèi)存控制器的bug,同時(shí)加上了激進(jìn)的多級(jí)預(yù)取機(jī)制的結(jié)果。以Memcpy和Stream-Copy兩個(gè)測(cè)試子項(xiàng)來(lái)看,龍芯的內(nèi)存控制器在操作雙通道DDR3-1000時(shí),在局部性較好的流式訪問(wèn)上距離Ivy Bridge + 單通道DDR3 1333的平臺(tái)還有20%左右的差距。
同時(shí)龍芯公布了Whetstone,Coremark,Dhrystone等幾個(gè)小型benchmark的測(cè)試結(jié)果,如表3所示。一般來(lái)說(shuō)這幾個(gè)測(cè)試結(jié)果的可信度不如Spec,PARSEC等大型測(cè)試程序。但是這種小型測(cè)試能夠輕松地在龍芯RTL測(cè)試平臺(tái)上運(yùn)行,該測(cè)試平臺(tái)可以給定靜態(tài)時(shí)序分析結(jié)果,并通過(guò)RTL代碼仿真一顆芯片,而無(wú)需流片,使用更加方便。

龍芯3A2000/3B2000的設(shè)計(jì)版圖

在其他程序測(cè)試中,GS464E處理器架構(gòu)在分支指令較多的Dhrystone,以及少量訪存操作的Coremark等測(cè)試中有40%以上的性能提升。
所幸龍芯還公布了Spec CPU 2000的測(cè)試結(jié)果,如表4所示目前GS464E在1GHz頻率下的整數(shù)性能得分為762,相對(duì)上一代漲幅104%左右,浮點(diǎn)性能達(dá)到1125分,提升幅度更加驚人,達(dá)到278%。其整體性能已經(jīng)非常接近同為1GHz頻率,采用Sandy Bridge核心的Core i5 2300。
若以Spec CPU 2000的初步測(cè)試結(jié)果作粗略估計(jì),龍芯的IPC還是比較樂(lè)觀的,但從另一面看龍芯還不能提前開(kāi)香檳慶祝。從最新披露的消息來(lái)看,基于GS464E架構(gòu)的龍芯處理器主要有3A2000、3B2000兩種。其中龍芯3A2000為單路四核桌面版本,龍芯3B2000則是支持雙路八核、四路十六核的服務(wù)器版本。
由于是新架構(gòu)的第一版產(chǎn)品,制造工藝仍舊是40nm,主頻只有1GHz左右??紤]到頻率只有當(dāng)今Intel、AMD處理器的1/3,因此新一代龍芯處理器總體的絕對(duì)性能大約僅為Haswell的20%~30%左右。何時(shí)能采用更先進(jìn)的28nm工藝生產(chǎn),能否在新架構(gòu)上大幅提升工作頻率?還是一個(gè)大大的問(wèn)號(hào),龍芯仍有比較長(zhǎng)的路要走。

結(jié)語(yǔ):成功不可能一蹴而就
據(jù)筆者了解到的消息,龍芯目前已經(jīng)打入了軍方和航天市場(chǎng),這兩個(gè)市場(chǎng)都對(duì)安全性極為重視,性能要求則相對(duì)比較寬松,龍芯的抗輻照版本問(wèn)世后也裝上了北斗衛(wèi)星。中國(guó)那段由國(guó)家領(lǐng)導(dǎo)人親自出馬談判進(jìn)口抗輻照芯片的過(guò)去可以宣告埋入歷史塵埃了,但龍芯要在民用市場(chǎng)上對(duì)抗Intel和AMD還是很難,畢竟絕對(duì)性能上差距過(guò)大,在短期內(nèi)恐怕仍無(wú)可能。
龍芯項(xiàng)目啟動(dòng)迄今已過(guò)十五年,有過(guò)明察秋毫拒絕使用超長(zhǎng)指令字結(jié)構(gòu)的睿智,但也同樣有過(guò)不知深淺“一步到位”的狂熱;有過(guò)在媒體上放話打敗Intel的自負(fù),也有過(guò)公開(kāi)承認(rèn)性能差距過(guò)大的誠(chéng)懇,這些都已經(jīng)是龍芯成長(zhǎng)歷程中被凝固的筆墨。
時(shí)過(guò)境遷,筆者認(rèn)為,對(duì)待今日龍芯的進(jìn)步,我們需要拋開(kāi)過(guò)往,保持足夠冷靜和理智,如計(jì)算所的前任所長(zhǎng)李國(guó)杰院士2004年就在《科技日?qǐng)?bào)》上撰文指出的那樣:
“我國(guó)CPU/SoC設(shè)計(jì)任重道遠(yuǎn)”,“今后若干年內(nèi),龍芯CPU的性能只能做到國(guó)外最高水平CPU性能的一半左右”,要時(shí)刻清醒地認(rèn)識(shí)到在這個(gè)國(guó)外已經(jīng)發(fā)展超過(guò)五十年(以亂序執(zhí)行發(fā)明的時(shí)間計(jì)算)。有十萬(wàn)至數(shù)十萬(wàn)頂尖水平從業(yè)者支撐的行業(yè)里面,龍芯以區(qū)區(qū)數(shù)百人的規(guī)模和幾十分之一到幾百分之一的投入做到幾分之一的性能已經(jīng)足堪自豪,至于追平和趕超,還是需要耐心。
不久前中國(guó)計(jì)算機(jī)協(xié)會(huì)舉辦的走進(jìn)龍芯活動(dòng)中,龍芯項(xiàng)目負(fù)責(zé)人胡偉武坦誠(chéng)“乞丐與龍王比寶,越比越落后”,希望“重視整機(jī)性能,在每一個(gè)局部都不如別人的情況下實(shí)現(xiàn)整機(jī)性能的反超”,龍芯目前已經(jīng)將自己走向“支柱型CPU產(chǎn)業(yè)”的規(guī)劃劃到了2020~2030年,這將會(huì)是一場(chǎng)曠日持久的大戰(zhàn)。

如果成功了,中國(guó)CPU產(chǎn)業(yè)將多出一位內(nèi)能自給自足,外能力拼英美的巨頭,即便失敗,以龍芯項(xiàng)目這些年的投入,以及作為第一個(gè)國(guó)產(chǎn)亂序多發(fā)射高性能CPU的先驅(qū)所貢獻(xiàn)的經(jīng)驗(yàn)和培養(yǎng)的人才來(lái)說(shuō),亦是能夠有所慰籍的。

玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論