合二為一,“智”高“視”遠

> 中國論文網 >
科技論文 >
合二為一,“智”高“視”遠

合二為一,“智”高“視”遠

來源:用戶上傳作者: 《微型計算機》評測室

　　8年前，迅馳平臺的成功推出一舉奠定了英特爾在移動領域的霸權。
　　3年前，迅馳2一呼百應的氣勢顯示了英特爾在移動領域難以動搖的地位。
　　1年前，新鮮出爐的2010酷睿i7／i5／i3系列處理器幾乎橫掃了大江南北。
　　今天，當把GPU和CPU合為一體的Sandy Bridge問世后，它是否能夠延續前輩的輝煌，在歷史的滾滾車輪中書寫屬于自己的篇章，還是如同這個行業中無數的名字一樣消失在塵土之中?接下來，請與《微型計算機》評測室一同，率先見證這個歷史時刻吧。
　　Huron River平臺技術亮點解析
　　
　　按照慣例，代號為Huron River的英特爾新代移動平臺主要由幾個部分組成：代號為sandy Bridge的處理器，代號為Congar Point的芯片組，以及Rainbow Peak、Taylor Peak和Kilmer Peak三款無線網絡模組。
　　
　　GPU與CPU的完美融合
　　
　　代號為Sandy Bridge的處理器無疑是名氣最大的。這款處理器是繼英特爾Westmere之后的第二代整合GPU的處理器，它將GPU完全融合到了處理器設計中，在外觀上回歸到傳統的單晶片模式。英特爾也把這種創新性的結構命名為“核芯”顯卡，與之相比，Westmere將GPU和CPU分開設計的雙晶片模式只是歷史長河中的曇花一現。
　　由于完全融合到一起，它的晶體管數量達到了9.95億個。無論是CPU部分還是GPU部分均采用了32nm工藝制造，這比前一代GPU核心采用45nm工藝有所進步。即便如此，Sandy Bridge的核心面積依然達到了214mm2。從英特爾公布的官方照片來看，碩大的核心晶片極為醒目地位于基板表面。在半導體行業中，核心晶片面積越大，產品的良率越難提升，任何微小的瑕疵都將導致處理器報廢。這也就不難理解在上一代產品中，英特爾為何未將GPU和CPU融合在一起了。畢競，在新工藝剛開始應用時，良率本身就處于一個調整階段，再貿然加入更多功能導致核心面積大幅增加，質量問題恐怕將會是個巨大的噩夢。
　　合二為一，說起來簡單做起來難。為了提高運行效率，英特爾在Westmere架構的基礎上進行了大幅的改進，以使CPU和核芯顯卡能夠更加和諧地運行。為此，英特爾在Sandy Bridge中引入了環形總線結構，將CPU核心、核芯顯卡及其他功能模塊分列于三級緩存周圍，每個功能模塊均通過環線總線與共享的三級緩存相連。從而大大降低了訪問緩存的延遲，提升了數據吞吐帶寬。另外一個優點則是核芯顯卡也借此實現了對三級緩存的直接訪問，而不必事無巨細均繞道訪問速度慢得多的內存，顯然也有助于性能的提升。
　　
　　
　　
　　
　　說了這么久的核芯顯卡，它的正式命名為Intel HD Graphics 3000。它的架構與Westmere所采用的Intel HD Graphics相同，同樣支持DirectX 10，并包含了12個統一架構的Eu執行單元。不過，它擁有更大的寄存器文件，并通過第二代并行分支提升了執行并行任務與復雜著色指令的能力，其單位時間指令吞吐量比上一代產品提升了一倍。
　　
　　睿頻加速2.0，智能計算的關鍵
　　
　　早在Nehalem架構中，英特爾就開始提出“按需計算”的概念。在這個方向的指引下，英特爾的工程師們著力在多個方面解決這個問題，睿頻加速的雛形就是在這個時候形成。而在Westmere架構中，睿頻加速技術得到了進一步的發展，頻率提升的幅度更大，操作也更加智能。
　　與以往相比，Sandy Bridge的睿頻加速2.0有幾個主要的變化：首先，根據型號的不同，睿頻加速2.0提升的頻率分別達到了700MHz～1.1GHz，最高可以達到3.5GHz的單核心運行頻率。其次，在以往的睿頻加速中，無論如何加速，都需要保證實際功耗不高于TDP設計功耗。而在睿頻加速2.0中，這個界限首次被打破。換言之，如果應用需要，睿頻加速2.0有可能會提升所有核心的頻率，使之在短時間內超出TDP設計功耗，此時，系統仍然可以穩定運行。這在臨時運行某些計算密集型應用時尤為有用。以2.3GHz的酷睿i7 2820QM為例，它甚至可以在四核心同時運行時將頻率提升到3.1GHz。不過，這一功能并不是所有型號都具備。第三，以往的加速僅包含對CPU的加速，并不包括集成GPU；睿頻加速2.0則將核芯顯卡包含到加速過程中。核芯顯卡能在對圖形性能要求苛刻的游戲或軟件應用中自動提高頻率，從而增強性能，此時處理器核心則會適當降頻。借助睿頻加速技術，處理器核心和核芯顯卡能夠自動分配性能。例如，軟件需要更多CPU資源，那么CPU就會加速，同時GPU減速，反之亦然。
　　此時，核芯顯卡的頻率可由默認的650MHz迅速上升到1350MHz，頻率提升幅度達一倍多!目前，移動市場主要的入門級顯卡GeForce 310M和ATI Mobility Radeon HD 5470的核心頻率分別為1530MHz和750MHz。至少從規格上，英特爾的核芯顯卡已經具備了取代入門級獨立顯卡的能力。實際的狀況如何?不要著急，稍后我們就會來解答這個問題。
　　Sandy Bridge也同樣繼承了優秀的電源管理技術，以達到按需降低功耗的目的?，F在，它的三級緩存也已經與CPU核心同步，在需要時可以降頻工作以降低功耗。在Westmere架構中，處理器集成的GPU由于采用了45nm工藝，能耗不容忽視。Sandy Bridge通過融合及工藝升級的手段大幅降低了功耗。再加上針對多線程應用的超線程技術，SandyBridge能夠保證在任何時候都在性能和能耗之間實現最優化的表現，英特爾把它稱為“智能”處理器是完全能夠站住腳的。
　　
　　核芯顯卡夠給力
　　
　　除了封裝形式改進，以及睿頻加速2.0所帶來的性能及功耗上的優勢，核芯顯卡在功能和特性上也添加了許多全新的功能，使得核芯顯卡的功能更為廣泛。
　　作為核芯顯卡的第款產品，Intel HD Graphics 3000具備高速視頻同步技術(Quick Sync Video)。英特爾通過在核芯顯卡內置入MFx并行引擎，為核芯顯卡增加了H.264和MPEG2的硬件編碼功能。當針對這幾種視頻進行視頻格式轉換時，高速視頻同步技術將顯著降低處理器占用率，并大幅提高編碼速度。
　　直以來，3D顯示這個近年來最為熱門的話題之一似乎都和英特爾沒有什么關系。核芯顯卡終于趕上了時代，HD Graphics 3000新加入的引觸3D視覺技術(InTru 3D)使它具有了藍光3D MVC硬件解碼功能，并支持HDMI 1.4，從而使英特爾平臺實現了對1080p立體3D藍光的支持。再加上用于為H.264／VC1／MPEG2高清視頻硬件加速的Intel

Clear Vide HD，使用核芯顯卡的用戶完全可以體驗到絲毫不遜于獨立顯卡平臺的高清視頻應用體驗。
　　
　　暗藏玄機的AVX指令集
　　
　　英特爾在Sandy Bridge中引入了一個全新的指令集，即AVX指令集。從數目上看，這個指令集僅有6條。然而，仔細分析后，現在看似不太起眼的AVX指令集的背后其實凸顯了英特爾的野心所在。
　　AVX指令集，即Advanced Vector Extensions，字面的意思是高級矢量擴展指令集。它主要針對密集型浮點運算，3D游戲、CAD／CAM、數字內容創建等應用是這類計算的代表。在浮點計算性能增強的同時，AVx也沿用了現有的MMX／SSE指令集。不過它從指令格式上就發生了很大的變化，與以往的擴展指令集有明顯區別?？梢赃@么說，AVX并不是x86 CPU的擴展指令集，而是可以實現更高的效率，使SSE指令接口更加易用，并且也有著足夠的擴展空間。換言之，英特爾試圖通過AVx來擺脫傳統x86架構的不足。
　　AVX支持256位矢量計算是其最具革新的設計部分，同時也代表了指令編碼格式的變更。自1999年SSE將矢量處理能力從64位提升到128位后，直到如今，SSE系列指令集都只能支持128位矢量計算。AVX則開創了一個全新的格局，理論上最高可以將每秒浮點操作數提高一倍。另外，AVX還使用了新的256位函數，在操作和排列中效率更高，存取數據速度更快。不過要使用AVX指令集，需要CPU在硬件上做出改變。為此英特爾為Sandy Bridge核心增加了多個256位端口，用于處理AVX指令，浮點寄存器也徹底更改為256位，保證AVX指令的全速運行。AVX編碼格式的另外一個重點就是有著強大的指令集擴展支持，對于同樣命令長度的指令也更加容易實現，這樣就使不斷增長的命令兼容需求變得更加容易。加上Sandy Bridge所帶來的融合了乘法的雙指令支持，從而可以更加容易地實現從256位向512位乃至1024位的擴展。不過，目前暫時沒有軟件與操作系統可以支持AVX指令集，只有等到Windows 7 SP1發布以后，我們才能逐漸體驗到AVX的強大威力。AVX擴展指令包含了SSE指令，這也有助于像AVX時代的過渡。日前在SSE和AVX格式之間雖然需要進行編譯轉換，但并不絕對。同時，出于整體的考慮，英特爾對于AVX的普及并不會太過迅速，并且也不會立刻停止SSE時代。
　　
　　
　　
　　除了現實意義，更加重要的是，AVX的編碼系統解決了x86架構在解碼能力上的不足，從某一側面上反應了英特爾處理器今后的進化趨勢。目前的x86架構為了增強長命令而增設的緩存，使fetch命令長度更長，加上RISC架構的命令格式，命令長度難以縮減；并且，更加復雜的命令格式也由此產生。雖然可以改進解碼能力，但x86架構必須以犧牲資源為代價，同時也帶來了電力的額外消耗。因此，在改進硬件設計的同時，必須要改進指令格式本身。AVX指令集自然是最行之有效的手段。AVX使得浮點運算能力加強，不光提升了3D游戲，還可以更有效地支持矢量圖形，如更復雜的flash顯示，更快的SVG(可伸縮矢量圖形)支持，更好的HTML5效果等等。與GPU加速相比，AVX幾乎不會增加功耗和晶體管，成本要小得多，算是英特爾對不斷侵蝕CPU領域的GPU通用計算作出的回應。事實上，一直遲遲未能面世的“Larrabee”處理器也會采用AVX指令集，這就不難勾勒出英特爾對AVx所寄予的厚望了。
　　
　　芯片組的新特性
　　
　　與sandy Bridge處理器搭配的芯片組則是代號為“Cougar Point”的HM67芯片組。作為桌面6系芯片組的移動版本，HM67也支持PCI-E 2.0總線，這就意味著它的PCI-Ex1通道將具備單向5GT／s(500MB／s)的帶寬。HM67總共提供了8條PCI-Ex1通道，并且可以將多條x1通道靈活配置為x2或者x4通道。
　　與桌面版樣，HM67將支持14個USB 2.0接口。稍微有些遺憾的是，USB 3.0仍要等到下代產品才會得到支持，目前高端筆記本電腦多通過第三方芯片的方式對USB 3.0予以支持。不過，HM67提供了2個SATA 6Gb／s接口，另外還包含6個SATA 3Gb／s接口。
　　Huron River移動平臺除了繼承了上代Calpella平臺的幾種無線網絡模組外，還新加入了RainbowPeak，無線模組。由此，Huron River平臺包含了多種不同定位的無線網絡模組。自從英特爾放開對移動平臺的無線模組限制后，第三方廠商憑借幾乎不相上下的性能和更低的價格迅速在市場上成為了主流。英特爾則改變了相應策略，從以往的強行搭配變為以更為豐富的應用模式來吸引筆記本電腦廠商的采用。Huron River也支持WiDi，無線顯示技術，利用無線網絡來傳輸視頻信號。
　　Huron River平臺性能體驗
　　我們在第一時間獲得了英特爾提供的兩臺基于Huron River平臺的筆記本電腦工程樣機。17英寸的樣機搭配了酷睿i7 2820QM四核處理器，并搭配了英特爾的SSD，代表了Hu ron River平臺的最強性能表現。14英寸的樣機則搭配了酷睿i5 2520M，代表了主流定位產品的性能表現。兩臺筆記本電腦的主要配置如上表所示。作為對比，我們也在上
　　代產品中選擇了兩款與之相當的產品進行對比，分別是酷睿i7 820QM和酷睿i5 520M。
　　
　　CPU子系統測試
　　
　　先來看看專門針對CPu部分的測試，我們在這里主要選擇了專門針對CPU測試的軟件，包括clNEBENCHR11.5、SiSoftwa re Sandra 2011C以及3DMark Vantage的CPU測試來對比新舊CPU的1生能。需要說明的是，為了突出CPU測試，我們選擇的是對GPU壓力較小的3DMark Vantage的Entry模式。
　　在這幾項專門針對CPU的測試中，基于Sandy Bridge架構的兩款處理器比上代產品有較為明顯的提升。可以看到，CINEBENCH R11.5的性能提升大致在倍左右。在3DMark Vantage的CPU測試中，新一代處理器的得分已經非常接近上代處理器與GPU加速混合的水平了。而在偏重理論測試的SiSoftSandra 2011C中，差距更加明顯。尤其在加密解密測試中，新代產品也有相當出色的表現，比不支持AES指令集的產--品有明顯的提升。
　　
　　GPU子系統測試
　　
　　在加入了新工藝和諸多新技術的保駕護航后，大家定對英特爾的核芯顯卡(即Intel HD Graphics 3000)的性能有所期

待。我們主要測試了3DMark Vantage、《生化危機5》和《街頭霸王lV》幾種應用。為了測試新的高速視頻同步技術的作用，我們也加入了支持該技術的MediaEspresso6的轉碼測試。除了與上代的Intel HD Graphics進行對比，我們也把Intel HD Graphics 3000與目前筆記本電腦上應用最廣泛的入門級獨立顯卡――NVIDIA GeForce 310M進行對比。
　　盡管我們已經有了心理準備，但當實際結果出來后，還是讓人相當震驚。HDGraphics 3000在3DMark Vantage中的表現比入門級獨立顯卡還要強勁；相比上代自家產品，更是有足足倍多的提升。如果更為嚴謹，排除CPU進步的因素，單看3DMark Vantage的GPU得分，這個增幅也相當可觀。就實際應用體驗來看，在兩款代表主流水平的DirectX 10游戲中，Intel HDGraphics 3000~經可以在1366×768這個目前筆記本電腦最流行的分辨率下以低畫質甚至中畫質特效流暢運行了。
　　在轉碼測試中，高速視頻同步技術發揮了巨大的優勢。具備該技術的核芯顯卡轉碼速度比不具備該技術的上代集成GPU足足快了5倍之多。更令人印象深刻的是，即使與耕耘多年的NVIDIA CUDA架構相比，核芯顯卡的轉碼速度也要更快。不過唯缺憾是，目前支持該技術的軟件還不夠豐富。
　　
　　系統綜合性能
　　　筆記本電腦畢競不是單個配件，因此，處理器的更新對于系統在實際應用中的響應有何提高也是我們關注的要點。我們在這里采用SYSmark 2007 Preview和PCMarkVantage測試系統綜合性能。
　　新代移動平臺的綜合性能比之前有定提高，但增幅并不像子系統提升幅度那樣大。這并不難理解，一方面，Sandy Bridge與Westmere相比，在核內架構上變化并不大，每個核心包含總共64KB的一級緩存(32KB指令緩存和32KB數據緩存)和256KB的二級緩存，共享的三級緩存容量仍然還是8MB；只是在頻率上有所增加。另外
　　方面，SYSmark 2007 Preview盡管對應用環境的模擬度仍然是目前最高的，但畢競距離發布已經有幾年時間，軟件版本已經略有過時，一些最近的新技術并不能得到充分應用。當然，借助SandyBridge四核處理器和SSD的幫助，17英寸樣機那高達279分的SYSmark成績和輕松破萬的PCMarkVantage得分已經代表了目前移動平臺上的最強性能水平。
　　
　　電池續航力
　　
　　老實說，由于工程樣機采用的均是針對高性能定位的四核處理器，從以往的經驗來看，我們并沒有對電池續航力抱以太大的希望。然而，讓我們無比震驚的事情發生了：搭載了酷睿i7 2820QM的工程樣機在Mobilemark 2007中足足堅持了342分鐘，也就是6個多小時!是的，你沒有看錯，我們也沒有弄錯――由于時間緊迫，我們在測試過程中會不斷查看測試狀態，以便在測試完成的第時間開始下項測試。所以，我們確信它沒有出現異常情況。這臺樣機的電池容量并沒有特別離譜，71Wh的電池容量與目前同尺寸機型的電池容量相當。另外
　　點，按照往常的經驗，即使仃英寸機型的電池容量更大，但考慮到尺寸更大的屏幕和性能更強的CPU，仃英寸機型的電池續航力能跟14英寸機型持平就已經讓人驚嘆不已了。然而，14英寸樣機的電池續航力卻僅有250分鐘。我們認為這與14英寸樣機采用了入門級的獨立顯卡，且無法切換到核芯顯卡有關。實際情況究竟如何，在收到足夠的樣本分析后，我們會在后續對此再做深入分析。
　　MC點評Huron River移動平臺的測試結果相當驚艷，不單是cPU部分有了明顯的性能提升，核芯顯卡與前一代產品相比更是堪稱脫胎換骨。不僅如此，由于采用了新的結構和工藝，整個處理器的功耗得以明顯減少。在“智能”和“視覺”兩大要素上，英特爾甚至做得比我們期待的更好。我們完完全全可以確定，就產品端而言，Huron River是那種讓人從內心深處想要擁有的產品。雖然自從處理器廠商提出將GPU與CPU整合在一起計劃的時候，業界就一直大呼“狼來了”。不過，英特爾的上一代處理器整合顯卡的性能離預期尚有差距，GPU廠商并未感到太大的壓力。然而，sandyBridge的核芯顯卡注定會在移動市場掀起一場暴風。不單是因為核芯顯卡的性能和功能特性不輸于入門級獨立顯卡，在電池續航力上核芯顯卡也顯露了優勢所在，最為關鍵的是，在具備所有這些優勢以后，核芯顯卡相對于入門級獨立顯卡反而具有成本上的明顯優勢。我們實在想不出筆記本電腦廠商還有任何理由來選擇現時的入門級獨立顯卡。NVIDlA和AMD兩大GPU廠商在移動市場毫無疑問將受到英特爾的強力挑戰，移動顯卡市場的格局恐將發生巨大的變化。

轉載注明來源:http://www.hailuomaifang.com/8/view-1083037.htm

查看更多→

合二為一,“智”高“視”遠

相關文章