初露崢嶸 麒麟980性能詳解

文章推薦指數: 80 %
投票人數:10人

9月5日,在IFA上就吸引關注目光的華為新一代手機處理器麒麟980回到國內,華為fellow艾偉曝光更多產品細節和特性,這款即將在10月16日正式隨新旗艦Mate 20一同上市的產品更加令人期待。

麒麟910、920、930、950和970,一路走來華為手機處理器不斷地推高這一市場的門檻,到這一代麒麟980,更有底氣地一口氣講出6個「第一」。

艾偉強調,華為不考慮將麒麟產品授權給其他廠家使用,這樣更有利於專注提升從SoC到終端產品的整體素質。

目前,中高端移動處理器市場基本被高通、華為和蘋果瓜分,三星、MTK等產品已經被邊緣化,難以形成整體市場競爭力。

其中高通專注提供平台解決方案,為各家手機廠商提供關鍵晶片和配套解決方案,而華為和蘋果,均只為自家供應晶片,同時華為採用多供應商策略,除了麒麟之外,也在部分使用其他廠商產品。

雖然沒有直接表明具體投入金額數量,但艾偉明確表示,在新一代7nm製程的麒麟980處理器上的研發投入遠高於外界所猜測的3億美元,投入周期已經超過3年;高額投入是確保產品性能和按計劃上市的必要保障,此前台積電晶圓廠的中毒停產事故沒有影響到麒麟980的出貨進度,10月16日首款配備麒麟980處理器的Mate 20就將在倫敦發布,隨即批量上市;同時在明年1季度之前,該產品也不會遇到產能競爭的問題。

把這些話翻譯出來,就是華為拿到TSMC 7nm產能時間較早,良品率不是問題;目前已經有相當多成品備貨;半年內其他競爭品牌沒有7nm產能需求,升級製程需要巨大的資金投入,不是每個人都玩得起的。

在半導體領域,製程和集成電晶體的數量,是產品性能的直接體現。

提前3年對新製程進行規劃和研發投入,並且按照既定節奏出貨,也體現出華為對產業鏈的掌控能力大大提升。

麒麟980可謂是目前集成電晶體數量最多的移動SoC產品.在7nm製程幫助下,其更多的69億電晶體、更高的2.6GHz工作頻率,功耗水平還進一步下降,為後期終端產品開發提供了更寬的冗餘度。

回顧4年以來麒麟系列產品走過的製程升級道路,可謂是一步一個腳印、一步一個台階。

當然,艾偉也承認,未來繼續製程升級所需要投入的成本將更高,無論是資金、人力還是時間,都將成倍提升,華為在研發方面的投入還會繼續增加,以保持業界領先地位。

敢於使用新技術,並且能夠消化新技術,還可以根據自身需要,將優勢技術進一步集成、調度有方,華為在麒麟系列產品上越來越自信。

在麒麟980上,華為率先使用了新一代的Cortex-A76架構,並且創新地使用了2高頻+2低頻大核的組合方式,再加上4MB L3 Cache在DSU(DynamIQ Shared Unit)幫助下打通8個核心共同緩存,直接性能及架構,都具有明顯的優勢。

艾偉明確回復CHIP,兩簇A76架構完全相同,只有頻率方面的差異。

根據分析,這兩簇A76核心的描述上的「Based」字樣,結合僅頻率上差異的表述,實際是是加入了AI的智能預調度機制,從被動的先負載增加再切換核心/調升頻率,變為預判高負載來臨、提前調度核心,這個提前量很大程度上依賴數據在L3 Cache內存儲過程的分析,兩者互為因果。

同時,由於兩簇大核架構上完全相同,因此在特定時間節點上,指令無需任何加工可以同時分別發射給兩簇核心,不會因為分支預測錯誤、重新分配任務而造成QoS下降,轉換為用戶端的體驗就是性能平滑、波動小。

當然,更大的Cache有利於提高預測命中率,電晶體代價也就更大,4MB容量至少消耗2億個電晶體。

CPU只是麒麟980中的很小一部分功能,2億個電晶體已經相當可觀——都是錢呀!

麒麟980中8個核心的調度機制叫做Flex-Scheduling,scheduling字面上就帶有「預先」安排的意味。

的確,按照華為給出的3簇核心所執行任務的分配情況來看,是否啟用相關核心,是有相關預案的。

結合EMUI系統,手機將從用戶行為和雲端大數據兩個數據來源來優化調度過程,提升產品使用體驗。

從華為提供的示意圖來看,3簇核心竟然是可以並行使用的,在這個特性上,CHIP對此持保留態度。

在AI預判、智能調度機制支撐下,華為宣稱可將下圖中白色傳統負載預測記過優化為橙色的AI負載預測結果,實際效果有待進一步觀察。

根據CHIP此前的測試結果,運行於手機上的主要遊戲,還保持著重載CPU的模式,而像GPU的負載遷移還不多。

這也可以解讀為,更多的遊戲還比較依賴CPU,而手機端GPU應用還局限在部分遊戲上,PC上常見的視頻處理、GPU加速和通用計算任務,在手機上不會出現或是早已有專用硬體處理單元,不勞GPU參與。

移動處理器中圖形性能提升幅度「克制」,從側面反映了GPU應用有限的現狀,這也是過去麒麟系列產品被抱怨圖形性能不足卻不大影響用戶體驗的原因。

現在好了,麒麟980開出了兩劑良方:GPU Turbo和首款Mali-G76,而且還是MP10(720MHz)。

前者已經被廣泛用於麒麟970的Mali-G72MP12上,細節隨不透明但效果很好,實測圖形性能提升幅度達50%~70%,對用戶體驗更為直接的幀率穩定性上的表現更為出色。

而首款Mali-G76首度商用,據稱同頻率同管線情況下的性能提升50%!華為公布的數據為[email protected][email protected]直接提升幅度為46%,折算頻率和管線後的提升幅度為80%。

G76也是ARM首款專為7nm製程優開發的產品,電晶體數量增加全靠製程消納。

GFXBench對遊戲功耗的預測(上表),對比華為公布的麒麟980數據(下圖),稍微變換一下單位,就是G76MP12為22.88fps/W,當然S9+所代表的驍龍845(晶片1)應該是15.50fps/W。

箇中數據偏差,CHIP就不過度解釋了,畢竟測試條件有所不同。

等比放大後,與上表的預計,在數值上是吻合的,差別是在MP10 vs. MP12上。

麒麟970是一款非常成功的產品,於今天這個時間點再評論性能因素更是沒有意義,它成功地成為華為手機的旗艦標配,不僅自身是旗艦,同時也被廣泛配備到華為各個系列的旗艦產品中,價位覆蓋下至2000元上過萬的範圍。

從長期來看,麒麟980也將是這樣的布局,壽命周期1年以上。

在這樣的大背景下,局部突出的規格規劃是非常有風險的,平衡或者說均衡非常重要,麒麟970就是這麼成功的,麒麟980延續著這個套路。

從這個方面來解讀麒麟980的6個第一就不難理解了——一定程度和時期的超前,確保在更廣市場和更長時段內的產品穩定。

基於這一考慮,在率先引入了7nm製程、A76架構、G76架構之後,被麒麟980拿到顯眼位置提升的性能硬體就是內存了。

LPDDR4X-2133的引入,顯得那麼理所應當,而且非常務實,帶寬的提升和延遲的下降都非常直接,並且直接緩解CPU、GPU和NPU的吞吐壓力,只要供應鏈跟得上,全線普及沒有難度。

預計其他廠商也將很快跟進,畢竟三星海力士們樂見。

在頻率提升的趨勢下,雙通道內存更沒機會出現在手機產品上,功耗、空間、內存控制器、收益,都明顯消耗比收益高,畢竟內存頻率提升的前提就是功耗和封裝均不變。

目前,東芝和海力士都已經可以品量供應LPDDR4X-2133 128Gb的產品,8GB內存標配的時代來臨了。

嚴格意義上來說,LPDDR4X只是LPDDR4的電壓/功耗降低版,而非下一代產品。

下一代的LPDDR5今年年中剛剛發布,距離量產還有些時日。

類似情況也發生在存儲接口上,比肩PCI-E性能的UFS 3.0看起來很美,不過它也是剛剛發布幾個月的技術,批量供應還是問題,要不然蘋果也不會放出風來,要甩開三星海力士自己在iPhone上搞PCI-E存儲。

這條路好不好走,下周iPhone發布就知道了。

在產業鏈、供應鏈可靠之前,小步快跑的麒麟980,選擇的是穩妥。

與提升速度不同的是,麒麟980的ISP(圖像處理器)、NPU(神經網絡處理器)卻走上了核心數量增加的道路。

雙ISP+雙核NPU,表述不同,原因是相應單元在核心架構上的位置差異,下圖是麒麟980的核心架構示意圖,比較準確傳神地說明了問題。

NPU很神奇,蘋果、高通也都先後在移動處理器中加入了相應的硬體單元,但是如何用好卻是問題。

發布1年以來,麒麟970的NPU應用基本集中在華為自家的拍照及相關應用中,如果麒麟980仍局限於此,那這一年過得就太沒價值了。

當CHIP編輯還在怨念著NPU的SDK(軟體開發工具),華為又放了大招。

華為公布了麒麟980的IA性能參數,並開放從拍照、AR到AI(HiAI架構)的整個融合架構及相應功能的DDK(設備開發工具)。

一字(母)之差,價值可差遠了。

使用DDK,第三方應用開發者可直接使用彙編級的語言調用底層硬體,效率和可控資源不可同日而語。

特別是華為直接提供了SLAM算子及其數量信息,換言之開發者不僅知道用什麼工具還知道麒麟980有多少計算能力,能做什麼、能調用多少,就看應用了。

從這點來說,華為的心態真是相當開放,畢竟基於其AI功能和性能開發出的優秀應用,會為採用麒麟980晶片的手機添彩、給華為加分。

從華為公布的AI架構以及慧眼2.0圖像識別架構來看,麒麟980切實落實了以視覺為主的加速特性。

NPU核心數量的增加,主要提升了物體識別的實時性、提高實時分割的精準性 ,以及從靜態的照片識別提升到動態的視頻識別。

目前,無論是廣義的AI應用,還是終端的AI應用,能夠大量消耗處理能力的仍然只有圖形圖像識別這一類。

好在各家AI體系逐步開放後,軟體開發者會讓應用豐富起來,讓我們拭目以待。

除了後端的AI,麒麟980的雙ISP也著眼增強拍照同時的視頻處理能力,即一個管靜態,另一個管動態,管它們實時的優化處理工作。

真是因為兩個ISP是分頭工作的,單個性能無明顯證據提升,因此其4K視頻拍攝能力到底是30Hz還是更高的60Hz還有待觀察,同時這一性能還需要索尼配合——提供具有相應處理能力的IMX傳感器,比如7月剛發布的那塊IMX 586,支持[email protected],正好9月上市,與Mate 20時間吻合,期待喲!

通訊是華為的本家,麒麟980沒怎麼讓人失望。

雖然5G箭在弦上,不過還要搭在那裡1年多,麒麟980延續雙4.5G VoLTE設計也在情理之中,現在給了也是擺設,還要空給專利費,1年多後正式商用的時候,在把巴龍5000級別的基帶集成進去就好。

對手機晶片來說,基帶晶片尺寸甚至比CPU還大,沒用還要集成,是非常不經濟的(非專利費因素)。

所以,麒麟980提供了兩個解決方案,一個是給友好運營商的,外掛巴龍5000 5G基帶,用於開發和測死;對終端用戶來說,引入下行速度達1.4Gb/s的Cat.21。

也許有些朋友會吐槽,數字更大的Cat.21還沒有驍龍X20的Cat.20快,後者下行速度可達2Gb/s。

但是,該基帶還沒有集成,最快也要到年底的驍龍855上才會露面。

然而,從3GPP公布的演進路線來說,Cat.21是後續的Cat.22/23的演進基礎,而Cat.20完全斷檔了。

除了因為Cat.20需要誇張的8CC CA(沒有哪個國家給單一運營商的4G頻譜有8個之多)之外,更重要的是Cat.21提供了FDD和TDD的混合載波聚合,要距離有距離(FDD)要密度有密度(TDD)而且還很適合中國電信和中國聯通這樣雙標的運營商,所以呢~~

意淫5CC CA暫時真沒太多含義,以現在國內運營商的水平,2CC CA是主流,3CC CA罕見。

這些都不如WLAN上IEEE 802.11ax來的實惠。

麒麟980中集成了華為新款Hi1103無線晶片,5GHz頻段下可利用20MHz×4帶寬,用4個空間流達到1.73Gb/s的速度。

可惜,它還只是IEEE 802.11ac,且目前華為沒有公布是否至此Wave 2的MU-MIMO特性——雖然終端至此該功能的非常罕見。

無論是蜂窩還是WLAN,麒麟980給出的數據都是4×4 MIMO天線布局,兩組共用為大機率事件,這樣有利於控制設備體積、降低成本。

更多天線支持能力,對速度的幫助只是一部分,更好的小區邊緣覆蓋——白話就是弱信號時通信質量更好,智能天線、天線復用、多模式通訊(如三星的蜂窩與WLAN同傳)更為實用。

好了,說了這麼多,不如產品上練練,就在10月16日的倫敦,Mate 20將首先攜麒麟980亮相。

按照往年的節奏,半個月後這款產品就將在上海發布,同時開啟預訂,1~2周之後,也就是10月中,消費者將會直接體驗到它。

雖然它有小的遺憾,但這是現在最好的產品,不是紙面上的產品。


請為這篇文章評分?


相關文章 

華為能夠對抗高通845的處理器出來了!

昨晚,華為消費者業務CEO余承東在IFA電子展上推出了華為下一代頂級人造智慧型手機晶片——麒麟980。麒麟980是世界上第一款採用7nm工藝技術的手機晶片,集成了69億個電晶體(麒麟970為55...

解析華為最強千元芯麒麟650:16nm製程,Cat.7 LTE

安卓中國5月23日報導,如今千元機的競爭態勢越演越烈,各種曾經只能在旗艦機上才能見到的功能被紛紛下放,千元機成為了目前消費者購機比例最大的價位區間機型。CPU作為手機的「心臟」,對於整款產品有著...