首先是GPU部分的差距
使用了Adreno 530的驍龍820暫且不說,麒麟950整合了Mali圖形最新一代的高端型號Mali-T880(Mali-T880允許從一到十六顆核心的堆疊),但只是MP4規(guī)格。相比Exynos 8890的T880MP12,后者理論上圖形處理能力是前者的三倍。即使對比上一代Galaxy S6/Note 5使用的Exynos 7420,也達到MP8規(guī)格(Mali-T760核心)。
Kirin 950的圖形性能有一個比較接近的參照對手,是今年5月份聯(lián)發(fā)科發(fā)布的Helio X20,同樣采用Mali-T880MP4。聯(lián)發(fā)科共同運營組長朱尚祖對媒體宣稱,“ 麒麟950不過是Helio X20的水準”,大致沒錯。
當然,令人欣慰的是,Kirin 950采用了臺積電16nm FinFET+ ,也就是今年iPhone 6s第三方測試成績略優(yōu)于三星14nm的工藝。麒麟950整合的Mali-T880MP4圖形核心數量雖然少,但頻率提升到900MHz,競爭對手卻是多核心+低頻的方式。如此做法,麒麟950的思路跟聯(lián)發(fā)科相似:
大部分真實的日常應用里,圖形芯片并不是性能瓶頸,發(fā)揮圖形芯片所有核心的的潛能,也幾乎不存在這種情況。所以,集成更少的圖形核心以減少芯片面積,將節(jié)省的晶體管資源運用在其它部分,麒麟950才有了整體的顯著提升。
至于三星Exynos在GPU部分暴力堆料,十二顆核心的Mali-T880 MP12據說是為了 “沉浸式的3D游戲和虛擬現(xiàn)實應用體驗做準備”。不知道華為有沒有這樣超前意識,下注未來市場,像三星早已規(guī)劃和開發(fā)出了自己配套VR設備。
其次是應用處理器部分
麒麟950采用了ARM公版設計,真實應用效率有待檢驗。
移動芯片,主流芯片廠商像MTK、三星、華為會采用ARM官方標準微架構“Cortex-A” ,即ARM公版設計。盡管公版設計經過了ARM相關測試,廠商可以節(jié)約開發(fā)和時間成本加速產品上市,但其帶來的負面影響也顯而易見,就是芯片的同質化,并最終反映到智能手機的體驗上。而像高通和蘋果,拿到ARM授權但使用自主設計微架構大核心,芯片效率和整體性能處于較明顯的領先地位。
三星前不久發(fā)布的Exynos 8890首次使用自主設計的“Exynos M1”核心,已經曝光的測試數據顯示,其單核心提升明顯,三星也對外宣稱Exynos 8890整體性能相比上一代Exynos 7420性能提升30%,功耗則下降10%。
A53和A57混著用,組成所謂的“big.little”大小核結構,簡單任務時A57核心休眠只啟用A53核心,復雜任務時A53、A57一起上,不幸的是,A53和A57的指令吞吐和緩存是互相獨立的,如果某個應用需要在A53和A57之間切換運行,A53和A57核心之間切換延遲最多可達毫秒級,別看是毫秒級,反映智能手機上最直接的體現(xiàn)要么就是應用的卡頓,要么就是功耗過高,惟一折中的方法就是利用制程來緩解。
這也是為何同是使用ARM公版設計,采用14納米FinFET制程的三星Exynos 7420整體表現(xiàn)(能耗比)優(yōu)于同樣使用ARM公版設計,但采用20納米制程高通810的主要原因,而高通810備受詬病的所謂“發(fā)熱”背后則是ARM公版設計和制程落后兩方面因素疊加的結果,反映到市場競爭中,則是高通痛失三星Galaxy S6旗艦機芯片訂單。
更重要的,擁有芯片架構自主設計能力,也意味著能夠以更大的自由度去優(yōu)化特定應用程序的性能或者功耗表現(xiàn)。這是與競爭對手拉開差距的關鍵。
如果說蘋果是采用自主芯片架構在智能手機競爭中受益的典型代表,那么今年高通810的悲劇則是反面典型。高通之前一直采用自主設計的微架構,但因為去年蘋果率先推出 64 位 CPU 打亂了原有的研發(fā)計劃,今年直接拿公版架構過渡、匆忙推出了旗艦驍龍810,再加上使用了較落后的芯片制程工藝,功耗和發(fā)熱失控,幾乎導致整個Android陣營經歷了“失去的一年”。
最后,沒有整合最新的基帶,以及緩存架構的落后。三星Exynos 8890和高通驍龍820整合的基帶都支持Cat.12(下載速度達到600Mbps)和Cat. 13(上傳速度達到150Mbps),通信設備出身的華為居然還停留在僅支持Cat.6的老款Balong,與早前的麒麟920/925、930/935 屬同樣規(guī)格。其實華為已有新一代Balong基帶達到支持Cat.12和Cat.13水準,為什么沒有用在最新一代處理器上?
另外不得不提的是,big.LITTLE大小核心雙架構已經逐漸普及開來,從三星Exynos 5410到高通驍龍810莫不如此,而它們之所以能做到不同架構核心共存、協(xié)同,最關鍵的地方就是緩存一致性互連架構CCI-400。
ARM在今年早些時候宣布新的高端CPU Cortex-A72、GPU Mali-T880的同時,還推出了大刀闊斧改造過的新一代緩存一致性互連架構 “Corelink CCI-500”,引入了一系列新功能。在很大程度上,它的誕生要遠比 A72、Mali-T880有意義得多。
CCI-500最大的變化就是增加了一個“探聽過濾器” (Snoop Filter),從而使探聽控制不再局限于單個簇內部的CPU之間,可以擴展到整個處理器的所有核心,也就是A72/A57、A53全部覆蓋。這樣一來,處理器需要執(zhí)行的緩存查詢工作量就會大大減少,效率自然隨之增加,最終的好處就是互連過載降低、CPU核心空閑時間更多。
互連所需的內存帶寬也會因此大幅度減少,ARM宣稱CPU一端的內存性能可提升30%。ACE(AXI一致性擴展)端口的數量也翻了一番,系統(tǒng)帶寬因此增加一倍,可輕松搞定4K顯示輸出。四通道128-bit內存位寬也不再是問題。驍龍805是第一個支持四通道內存的移動處理器,但用的是高通自己設計的非一致性互連架構。以后,誰想做都可以。
按AnandTech的原話來說,采用了A72、Mali-T880 GPU、big.LITTLE架構的麒麟950,本應該也同時用上最新的CCI-500架構數據總線,因為它們三者都是今年2月份一起發(fā)布的。但不幸的是,CCI-500發(fā)布的時候,已經不在麒麟 950開發(fā)過程中(這意味著下一代麒麟很快發(fā)布,950只是過渡?)。所以麒麟950還是停留在目前 big.LITTEL結構SoC都使用的CCI-400。
當然,華為麒麟950也有比肩競爭對手的特性。
像獨立設計的ISP和DSP、i5協(xié)處理器、首個同時支持LPDD3/LPDDR4混合內存。這些并未讓太多人關注的“邊緣部分”,在拍照效果、影音播放、多種傳感器調度省電等日常使用上有重要增益。
適度追求硬件指標領先,更加關注SoC的真實體驗,華為的設計思路和迭代方向,在一眾Android廠商中是非常難得的。如果后續(xù)實現(xiàn)自主設計微架構,圖形芯片“堆料”,再加上現(xiàn)在已能用上臺積電最先進的制程工藝,像蘋果一樣深耕影響真實用戶體驗的硬件技術…
華為下一代差異化處理器,將真正震驚世界。
使用了Adreno 530的驍龍820暫且不說,麒麟950整合了Mali圖形最新一代的高端型號Mali-T880(Mali-T880允許從一到十六顆核心的堆疊),但只是MP4規(guī)格。相比Exynos 8890的T880MP12,后者理論上圖形處理能力是前者的三倍。即使對比上一代Galaxy S6/Note 5使用的Exynos 7420,也達到MP8規(guī)格(Mali-T760核心)。
Kirin 950的圖形性能有一個比較接近的參照對手,是今年5月份聯(lián)發(fā)科發(fā)布的Helio X20,同樣采用Mali-T880MP4。聯(lián)發(fā)科共同運營組長朱尚祖對媒體宣稱,“ 麒麟950不過是Helio X20的水準”,大致沒錯。
當然,令人欣慰的是,Kirin 950采用了臺積電16nm FinFET+ ,也就是今年iPhone 6s第三方測試成績略優(yōu)于三星14nm的工藝。麒麟950整合的Mali-T880MP4圖形核心數量雖然少,但頻率提升到900MHz,競爭對手卻是多核心+低頻的方式。如此做法,麒麟950的思路跟聯(lián)發(fā)科相似:
大部分真實的日常應用里,圖形芯片并不是性能瓶頸,發(fā)揮圖形芯片所有核心的的潛能,也幾乎不存在這種情況。所以,集成更少的圖形核心以減少芯片面積,將節(jié)省的晶體管資源運用在其它部分,麒麟950才有了整體的顯著提升。
至于三星Exynos在GPU部分暴力堆料,十二顆核心的Mali-T880 MP12據說是為了 “沉浸式的3D游戲和虛擬現(xiàn)實應用體驗做準備”。不知道華為有沒有這樣超前意識,下注未來市場,像三星早已規(guī)劃和開發(fā)出了自己配套VR設備。
其次是應用處理器部分
麒麟950采用了ARM公版設計,真實應用效率有待檢驗。
移動芯片,主流芯片廠商像MTK、三星、華為會采用ARM官方標準微架構“Cortex-A” ,即ARM公版設計。盡管公版設計經過了ARM相關測試,廠商可以節(jié)約開發(fā)和時間成本加速產品上市,但其帶來的負面影響也顯而易見,就是芯片的同質化,并最終反映到智能手機的體驗上。而像高通和蘋果,拿到ARM授權但使用自主設計微架構大核心,芯片效率和整體性能處于較明顯的領先地位。
三星前不久發(fā)布的Exynos 8890首次使用自主設計的“Exynos M1”核心,已經曝光的測試數據顯示,其單核心提升明顯,三星也對外宣稱Exynos 8890整體性能相比上一代Exynos 7420性能提升30%,功耗則下降10%。
A53和A57混著用,組成所謂的“big.little”大小核結構,簡單任務時A57核心休眠只啟用A53核心,復雜任務時A53、A57一起上,不幸的是,A53和A57的指令吞吐和緩存是互相獨立的,如果某個應用需要在A53和A57之間切換運行,A53和A57核心之間切換延遲最多可達毫秒級,別看是毫秒級,反映智能手機上最直接的體現(xiàn)要么就是應用的卡頓,要么就是功耗過高,惟一折中的方法就是利用制程來緩解。
這也是為何同是使用ARM公版設計,采用14納米FinFET制程的三星Exynos 7420整體表現(xiàn)(能耗比)優(yōu)于同樣使用ARM公版設計,但采用20納米制程高通810的主要原因,而高通810備受詬病的所謂“發(fā)熱”背后則是ARM公版設計和制程落后兩方面因素疊加的結果,反映到市場競爭中,則是高通痛失三星Galaxy S6旗艦機芯片訂單。
更重要的,擁有芯片架構自主設計能力,也意味著能夠以更大的自由度去優(yōu)化特定應用程序的性能或者功耗表現(xiàn)。這是與競爭對手拉開差距的關鍵。
如果說蘋果是采用自主芯片架構在智能手機競爭中受益的典型代表,那么今年高通810的悲劇則是反面典型。高通之前一直采用自主設計的微架構,但因為去年蘋果率先推出 64 位 CPU 打亂了原有的研發(fā)計劃,今年直接拿公版架構過渡、匆忙推出了旗艦驍龍810,再加上使用了較落后的芯片制程工藝,功耗和發(fā)熱失控,幾乎導致整個Android陣營經歷了“失去的一年”。
最后,沒有整合最新的基帶,以及緩存架構的落后。三星Exynos 8890和高通驍龍820整合的基帶都支持Cat.12(下載速度達到600Mbps)和Cat. 13(上傳速度達到150Mbps),通信設備出身的華為居然還停留在僅支持Cat.6的老款Balong,與早前的麒麟920/925、930/935 屬同樣規(guī)格。其實華為已有新一代Balong基帶達到支持Cat.12和Cat.13水準,為什么沒有用在最新一代處理器上?
另外不得不提的是,big.LITTLE大小核心雙架構已經逐漸普及開來,從三星Exynos 5410到高通驍龍810莫不如此,而它們之所以能做到不同架構核心共存、協(xié)同,最關鍵的地方就是緩存一致性互連架構CCI-400。
ARM在今年早些時候宣布新的高端CPU Cortex-A72、GPU Mali-T880的同時,還推出了大刀闊斧改造過的新一代緩存一致性互連架構 “Corelink CCI-500”,引入了一系列新功能。在很大程度上,它的誕生要遠比 A72、Mali-T880有意義得多。
CCI-500最大的變化就是增加了一個“探聽過濾器” (Snoop Filter),從而使探聽控制不再局限于單個簇內部的CPU之間,可以擴展到整個處理器的所有核心,也就是A72/A57、A53全部覆蓋。這樣一來,處理器需要執(zhí)行的緩存查詢工作量就會大大減少,效率自然隨之增加,最終的好處就是互連過載降低、CPU核心空閑時間更多。
互連所需的內存帶寬也會因此大幅度減少,ARM宣稱CPU一端的內存性能可提升30%。ACE(AXI一致性擴展)端口的數量也翻了一番,系統(tǒng)帶寬因此增加一倍,可輕松搞定4K顯示輸出。四通道128-bit內存位寬也不再是問題。驍龍805是第一個支持四通道內存的移動處理器,但用的是高通自己設計的非一致性互連架構。以后,誰想做都可以。
按AnandTech的原話來說,采用了A72、Mali-T880 GPU、big.LITTLE架構的麒麟950,本應該也同時用上最新的CCI-500架構數據總線,因為它們三者都是今年2月份一起發(fā)布的。但不幸的是,CCI-500發(fā)布的時候,已經不在麒麟 950開發(fā)過程中(這意味著下一代麒麟很快發(fā)布,950只是過渡?)。所以麒麟950還是停留在目前 big.LITTEL結構SoC都使用的CCI-400。
當然,華為麒麟950也有比肩競爭對手的特性。
像獨立設計的ISP和DSP、i5協(xié)處理器、首個同時支持LPDD3/LPDDR4混合內存。這些并未讓太多人關注的“邊緣部分”,在拍照效果、影音播放、多種傳感器調度省電等日常使用上有重要增益。
適度追求硬件指標領先,更加關注SoC的真實體驗,華為的設計思路和迭代方向,在一眾Android廠商中是非常難得的。如果后續(xù)實現(xiàn)自主設計微架構,圖形芯片“堆料”,再加上現(xiàn)在已能用上臺積電最先進的制程工藝,像蘋果一樣深耕影響真實用戶體驗的硬件技術…
華為下一代差異化處理器,將真正震驚世界。