別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

從專利和IP看國產通用CPU企業的實力

論購買IP(設計完成的晶片功能模組)整合SoC的能力,貝加爾不如華為海思;

論研發高效能浮點處理器的能力,俄羅斯沒有能與申威匹敵者;

論通用CPU的效能,Elbrus也遠遜於龍芯。

能代表研發實力的莫過於專利和產品(含功能模組)。筆者本打算簡單對比下國內各CPU設計企業的專利數量,可是這樣簡單的打算也遇上了麻煩。華為海思的業務範圍很廣,專利數量極多,筆者沒有能力分辨哪些專利只與CPU有關。申威因開發團隊與眾不同,很受限制,註冊到申威名下的專利極少。篩選下來,能相互比較的就只剩下龍芯、飛騰、兆芯、海光。

下面的專利數量只包含已經生效的發明專利,已經註冊但尚未生效的、實用新型和外觀專利都沒有包含在內。龍芯因為有部分專利是以中科院計算所的名義註冊,難以統計在內,飛騰也有部分專利在國防科大名下,這裡也沒有統計。專利數量從“國家智慧財產權局”官網入口查詢,截圖內容是發明數量排名前10的發明人列表。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

首先看兆芯的專利,數量很多,可是排名前十的發明人,名字怎麼都那麼長?

兆芯的專利很多來自VIA和Centaur兩家公司,包含CPU、GPU、主機板、圖形影象處理、電路測試……等很多型別。

兆芯的專利中,出現得最多的前10個發明人中,有8個是外國名字。發明人是中國名字的,也不一定是兆芯的員工,因為臺灣VIA的員工也大多是中國人,Centaur也有華裔員工。比如李永勝據筆者所知就是美國Centaur的臺裔員工,李曉陽不知道是誰。排在第一的和第五的是同一個人,他是Centaur公司的頭號人物,翻譯成中文名時出現了至少4種譯法,這個列表中只能看到其中兩種。這些有效的專利中,G。葛蘭。亨利一人就參與了約1/4。

因為與Intel和AMD競爭失敗,VIA淡出了x86處理器的市場,從此其美國子公司Centaur那些專利幾乎變得一文不值。但是兆芯不知是為了裝點門面,還是為了避免智慧財產權糾紛,又或者是VIA非要捆綁銷售……總之這些專利在兆芯這裡重新體現了價值。

購買這些專利的所有權是有必要的嗎?和兆芯類似的海光,從AMD得到的CPU核心IP,就沒有包含任何的專利所有權轉讓。

購買了專利所有權就能擁有對應的能力嗎?顯然不可能!

就像某人購買了幾百篇好文章的版權,並不代表他寫的文章就能達到同等的水平。但那些文章的原作者,則肯定有能力再寫出相同和更高水平的作品。

龍芯的發明專利都是龍芯的技術人員自己研究出的成果,代表著龍芯自己的科研水平。龍芯是國家掛牌的博士後科研工作站,前來科研的博士們也會產生很多發明專利,這些專利可能以博士們原單位的名義註冊,但龍芯中科可以使用。即使不把那些專利計算在內,龍芯的專利數量也只比兆芯“集大成”的結果少一點,說明龍芯在CPU方面的研發能力至少要比老牌的CPU設計企業Centaur更強。

事實上也確實如此。Centaur在2019年釋出的x86核心(CNS)與龍芯同年釋出的3A4000設計水平相當,但Centaur已經江郎才盡,龍芯才漸入佳境。Centaur使用CNS核心流片的樣品在2019年就已經給了兆芯,2020年完成了智慧財產權交易,可是兩年多過去了,兆芯使用新核心的CPU還是沒有釋出。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

飛騰的專利數量比較少,不像是有自主研發能力的CPU企業應有的水平。

海光的專利數量更少,卻不會令人覺得意外,因為它本就沒有實踐CPU核心設計的機會,只做外圍的修修補補能夠有些發明創造就已難能可貴。

這幾家公司在資訊公開方面,龍芯做得最好,從龍芯的官網上能下載它各種晶片產品的詳細資料。其中一張列舉了龍芯各種自研IP的表格挺有意思,在其它幾家的網站上完全沒有類似的內容。從CPU到GPU(整合在7A2000橋片中),再到橋片和各種介面控制器,主機板上重要的部分幾乎包圓了。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

華為海思掌握的IP型別和數量肯定要比龍芯多,但是電腦主機板和CPU、橋片這一塊兒,可能沒有龍芯做得全。

橋片的作用是整合各種介面電路控制器,成為CPU和各種板卡及外部裝置交換資料的橋樑。如果CPU是主機板上的首腦,那麼橋片就是大內總管,是除CPU之外,主機板上最有價值的晶片。很多年前,Intel和AMD、VIA的CPU是使用相同的介面,針腳相容,各種相容橋片也爭奇鬥豔,各家的主機板和CPU都能相容互換。Intel為了把VIA、AMD、Nvidia、Sis等設計的相容橋片逐出市場,獨霸天下,不但強迫AMD和VIA改換介面,還收回了VIA、Nvidia、Sis等設計相容橋片的授權。

從此之後Intel、AMD、VIA的橋片只能相容自家的CPU,橋片失去了獨立存在的必要性,橋片的功能逐漸向CPU中整合。但是計算機的介面型別非常多,不同的應用場景有不同的介面需求,CPU中又不可能整合所有型別、足夠數量的IO介面控制器,因此橋片不可能消失。現在的IO越來越複雜,各種控制器佔用的芯片面積越來越大,導致CPU成品率降低成本升高,現在又產生了把大多數IO控制器重新整合到橋片的趨勢。比如AMD的IODie,就算改了個名字,它仍然是橋片。

龍芯的橋片經歷了1A、2H、7A1000、7A2000多次迭代,但現在7A2000引出的介面規格仍然和主流水平有數年的差距,和兆芯(橋片+CPU整合)不相上下吧。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

兆芯的獨立橋片ZX-200比較差,高效能IO主要整合在CPU中。兆芯技術來源是VIA,VIA本就是靠橋片起家,瘦死的駱駝也是有份量的。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

飛騰的X100橋片和兆芯差不多,都是作為CPU整合IO的補充。海光CPU裡面是AMD的Zen,那麼它用AMD的橋片就很合理、很合適。申威和海思筆者沒有找到橋片相關的資料。

國內CPU設計企業的CPU產品線,型號、種類最豐富的是龍芯,次之是申威。

龍芯的CPU產品分為三個大類,數十個型號,從嵌入式到伺服器應用盡有,還有幾款填補國內空白的特種晶片。實際上龍芯一直在用嵌入式(含特種晶片)賺的錢來補貼通用CPU的研發,其實筆者很想多聊一聊特種晶片的事,但是以前一些公開的資料現在也被要求保密,我收集資料發的一些帖子也被要求刪掉了。

申威的CPU型號要少一些,但品類也比較齊全,可能還有部分型號完全保密。至於為什麼保密,可以自行腦補。

兆芯把產品中的低端型號稱為“嵌入式”CPU,功耗幾十瓦的“嵌入式”可不多見。

飛騰和兆芯差不多,所謂的“嵌入式”也是低端桌面CPU。飛騰的伺服器CPU高達64個核心,申威2路32核的效能和飛騰64核相當,龍芯2路16核的產品可與飛騰64核效能持平,龍芯32核的產品還在研發中。

海光的CPU被限制只能用於伺服器和工作站,似乎也沒有自己設計出嵌入式CPU的能力。

海思的桌面和伺服器CPU被限制生產,它的嵌入式CPU要麼是外購成品,要麼是外購IP,沒有自己設計的核心。

個人覺得幾家國產CPU企業的研發能力,僅比較CPU和相關技術的話:龍芯>申威>海思>兆芯>飛騰>海光。

近十年國產通用CPU的效能進步

筆者其實挺討厭談論國產通用CPU的效能,因為和Intel/AMD相比確實差距較大,長篇大論之後得出的結論,只會是“國產不行”。

可是效能問題又不能避而不談,只能指望國產通用CPU多一些上得了檯面的產品,不再像幾年前那樣尷尬。通用CPU不像嵌入式CPU,無論效能強還是弱,無論功能多還是少,總有恰好能用上的產品。通用CPU主要面向桌面電腦和伺服器,歷史已經證明這個市場上哪怕效能第二也可能吃不飽。

通用CPU若架構相容、軟體通用,使用者絕不會選擇效能低、價效比低的產品。比如兆芯在沉寂兩年半之後最新推出的KX-6000G,效能只有賽揚N5105的一半。與兩年半之前的KX-U6780A相比,標稱的睿頻提高了,單核效能卻基本沒有提高。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

上表中4款CPU的GeekBench5測試成績,分別是它們在GeekBench官網上有記錄的最好成績。最後一列的ZX-A C4350AL有兩個釋出年份,是因為這款CPU原本是VIA在2011年釋出的Nano X2 C4350AL,2013年兆芯成立之後把這款CPU改了個名又重新發布了一次。

從上表中的資料,可以看出以下幾點:

1。 KX-6000G單核效能和多核效能都只有N5105的一半,同樣都是4個核心。

2。 KX-6000G的睿頻基本上無意義,單核效能與兩年半之前的KX-U6780A相比基本沒有進步,能保持的執行頻率應該也是2。7GHz。

3。 KX-U6780A有8個核心,全CPU效能與4核的N5105相當,單核效能也只有N5105的一半左右。並且,是在TDP功耗70W下,效能與TDP功耗10W的CPU效能相當。

4。 兆芯的CPU產品從2011年到2022年,基本只是透過更換先進工藝提高頻率,CPU核心設計基本沒有進步。從1。6~1。73GHz到2。7GHz,頻率提高了56~69%,GeekBench5單核成績提高了83%。其中由於兆芯KX-6000系列增加了AES相關擴充套件指令,使GeekBench5的AES子項測試成績提高了25倍左右,給總成績帶來了10%左右的提升。

5。 兆芯官方宣傳的效能不是正常測試方式能得到的,否則兆芯KX-6000系列的GeekBench5的測試成績應該再高50%左右,而不是現在這個樣子。據筆者實測,KX——U6780A的單核效能與2007年Intel的筆記本CPU DuoCore2 T7500(2。2GHz/DDR2-667)基本一樣,8個核心的整體效能和4核的初代i5-760基本相同,和現在的N5105也是相同水平。

GeekBench5不能支援所有架構的CPU,國產CPU的架構多樣,要想在相對統一的條件下、比較客觀地評估國產CPU近10年來的進步,就需要使用通用性更強,也更加準確的效能評估工具,比如SPEC CPU 2006。SPEC CPU是用於評估“CPU-記憶體”子系統的專業評估軟體,歷經95、2000、2006、2017四個大版本,每一代都是事實上的業界標準。2017版主要解決了2006版被Intel ICC編譯器刷分的問題,測試專案沒有大的變動。國產通用CPU大多有公開的2006版測試成績,一些是官方公佈,一些是愛好者或媒體測試的結果。下面統一使用SPEC CPU 2006測得的CPU整數(通用)效能,來繪製各家CPU最近十多年的單核效能提升折線圖:

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

可以看到龍芯和申威的通用CPU在十一、二年前效能最低,單核效能只有兆芯和飛騰同期產品的三分之一左右。兆芯成立於2013年,但第一代產品ZX-A C4350AL是VIA在2011年釋出的Nano X2 C4350AL,沒換殼,只改名,因此也是同期產品。兆芯從ZX-A到KX-5000之間還有兩代產品,不過ZX-B只是在境內生產的ZX-A,效能沒有任何變化。ZX-C又變成了境外生產,多了兩個核心,提高了一點頻率,就不寫上去了,沒有意義。

龍芯和飛騰特別注重提升自主設計能力,CPU單核效能分別在2019和2021年底超過兆芯和飛騰。其實它們的產品本來可以提前超過兆芯和飛騰,只是因為它們的CPU製程很保守,從不超過境內可以量產的水平,CPU頻率就吃虧了。比如2019年的龍芯3A4000還在使用28nm製程,同期的兆芯和飛騰都使用了16nm製程,鯤鵬甚至使用了7nm製程。直到境內可以用12~16nm製程量產大晶片後,龍芯2021年才用上了12/14nm工藝。

飛騰的通用CPU單核效能變化像是過山車,因為它的FT-1000和FT-1500是基於SUN開源的UltraSPARC T2核心,2007年時的UltraSPARC T2可與Intel至強一較高下。飛騰在投靠ARM之後,CPU效能反而降低了。後來很多年IPC也沒有明顯提升,基本上是依靠先進工藝提高主頻,來達到提高單核效能的目的,這也是人們質疑飛騰沒有自主設計能力的主要原因。哪家公司最好的CPU產品會比以前的更差?飛騰就做到了!上一代的FT-2000/4的單核效能剛超過7年前的FT-1500(SPARCv9),最新的D2000又降回來了。

幾家公司下一代產品的單核效能提升都很大,因為下一代產品都使用了全新的CPU核心,IPC提升非常大。CPU的單核效能等於頻率*IPC,IPC代表著CPU核心的設計水平,通常也把使用效能評估工具得到的每GHz的成績稱為IPC或PPC。如果只比較IPC或PPC,龍芯在2015年時就已經成為了國內第一,只是那時龍芯CPU的主頻太低。

下面展示國產CPU每GHz效能(IPC或PPC)的折線圖中,每一次躍變(虛線)都代表CPU核心邏輯設計更新換代的改變,平穩期(實線)的提升則是區域性的最佳化和改進。

別怕,明天登島吧,國產通用CPU比俄羅斯的同類強大(四)

龍芯每兩代CPU產品更換一次核心設計,構成了完美的上升階梯,和單核效能折線圖中那條藍色的“曲線”一樣充滿美感。申威的階梯也很漂亮,只是因為它以前的主要精力不在桌面和伺服器,所以核心大改版的週期比較長。

核心大改版同期更長的是兆芯,從2011到2022單核每GHz的效能都沒有明顯變化。被稱為牙膏廠的Intel,從酷睿i系列的1代到11代,IPC好歹提高了50%。相同的時間跨度,兆芯的IPC提高了10%,堪稱牙膏守護神。Intel十來年把酷睿i系列的從3。xGHz提高到了5。xGHz,再乘上IPC的提升,單核效能提高了150%,是原來的2。5倍左右。而兆芯CPU的有效頻率只提升了60%左右,單核效能提高不超過80%。

飛騰基於SPARC架構時,UltraSPARC T2的IPC和酷睿i系列的初代差不多。CPU主頻和Intel差距雖然大,但即使僅跟隨大環境的工藝更新,也不會低於當前產品的主頻。如果飛騰當時有自建軟體生態的決心,再加上可長期保持國內第一的效能水平,國產CPU的市場哪裡還有其它產品的位置?可惜飛騰沒有這樣的勇氣,換成了在桌面和伺服器領域不倫不類的ARM。不但生態沒有蹭得到,還是依靠了更新工藝提高頻率才恢復到以往的效能水平,而IPC一直沒有明顯提高,被浪費的時間可不只十年。

兆芯和飛騰的下一代產品,IPC的提升幅度完全不符合最近十多年的表現,就像是被奪舍了一般。已知兆芯的下一代CPU核心是VIA的美國子公司Centaur設計,飛騰的新核心是否自主設計筆者卻不確定。

CPU的效能,IPC代表能力,主頻代表財力。國內CPU企業無論財力是否充足,當前都應該以培養能力為主。大陸的晶片生產裝置、耗材、技術短時間不可能達到世界最先進水平,有錢也沒處花。去臺灣的上一代有在逃跑前搞破壞的習慣,這些壞毛病難免被傳承給他們的後代。臺積電也委婉地表明瞭態度,晶片生產存在大量的外部依賴。就算我們的子弟兵能夠妥善保護臺積電的工廠和人員,也無法短時間恢復生產。

美國有全世界最多最好的半導體人才,Intel也花了50年才達到現在的水平。龍芯花了二十年培養人才、鑽研技術、積累經驗、自主創新,也僅在CPU核心的邏輯設計能力方面勉強追上了Intel,全面趕超還需要更好的大環境。晶片生產受限、技術授權受限、有些國內CPU企業和部分領導仍然幻想靠買就能達到世界先進水平。因為都是成年人,所以皇帝的新衣才更加漂亮?可以自欺,可以欺人,過幾年就能看到飲鳩止渴是什麼下場。