作為電腦的核心器件:處理器,在去年除了頻率的有限提升,并沒有劃時代的產品的出現。但是Intel提出的一些處理器發展新動向卻令人矚目,將對今后電腦發展產生重大影響。
首先是將“雙核心”技術被確立為今后提升CPU性能的重點。其次在未來一年內,Intel會終止Tejas等下一代NetBurst架構處理器的開發計劃,轉而將目前的移動平臺Pentium-M作為未來桌面平臺的核心架構,在65nm生產工藝的支持下,構造一個性能強、功耗低、成本適中的桌面處理器平臺,這完全顛覆了過去二十年中個人電腦處理器發展的一貫模式。
一、雙核心處理器技術
CPU是決定電腦性能的核心部件,而CPU性能與工作頻率密切相關。英特爾從P4開始采用增加管線長度的方法來提升工作頻率,但前進至3 GHz以上后,遭遇到因漏電流問題導致產生大量廢熱,限制芯片頻率提升的瓶頸,通過增加管線長度來提升工作頻率的技術已經走到盡頭。使用多個處理器來提高電腦計算能力是很容易想到的解決方案,也在服務器領域得到了廣泛應用。
不過由于組建雙CPU系統的高成本和復雜性,桌面電腦上并未得到普及。在CPU頻率提升遇到困難和雙CPU系統難以普及的情況下,Intel推出了在單顆CPU內部模擬兩個虛擬邏輯處理器的超線程技術,然而該技術帶來的性能提升并不明顯,因為只使用了一套執行單元和緩存,在某些情況下,甚至導致性能反而下降。目前長期引領處理器性能發展的“摩爾定律”已經受到挑戰,人們發現處理器頻率提升的步伐明顯放慢,而從提高處理器工作效率入手來提高性能的“基辛格規則”今后必將取代“摩爾定律”。
真正解決CPU性能提升困難的方法是采用“雙核心”技術。顧名思義,就是在一顆CPU中真正集成兩個物理運行核心,并且每個核心都使用自己獨立的高速緩存,因此在實際使用中,這種“雙核心處理器”和使用兩顆獨立CPU組建的系統在工作原理和性能上基本沒有區別。
在雙內核處理器當中,每個內核都有獨立的HyperTransport總線連接系統請求單元(SRQ)和系統內存,能在一個時鐘周期之內處理兩倍以上的數據,管理一個以上的線程,這種技術使得整個系統性能有相當大的提高,而整體設計難度和制造成本并不高,從而能夠在普通桌面系統中得到普及。
雙核心處理器將帶來的性能提升是毋庸置疑的,尤其對那些用電腦進行視頻文件處理工作的朋友特別有益。即使你使用的視頻處理軟件不支持雙核心處理器,但仍可以發揮其善于同時進行多任務的特長,讓視頻軟件利用一個CPU核心在后臺運行長時間才能完成的視頻文件處理任務,你卻可在前臺利用另一個CPU核心同時運行其它程序,而且不影響后臺的文件處理運算,大大提高工作效率。
目前雙核心處理器已經有不少實際的產品推出,象IBM Power4處理器, Sun的UltraSparc IV也采用了雙核心設計。預計從明年開始,各廠商將爭相發布相關產品。英特爾將在2005推出的首款桌面電腦用雙核心處理器:“Smithfield”,更令我們關注。而代號為“Tanglewood”的高端Itanium芯片將包含多達16個獨立的處理器。
繼Intel、AMD之后,VIA也確認將進軍雙內核處理器市場,看來64bit運算和雙內核將是今后處理器發展的兩大趨勢。VIA雙內核處理器預計將在明年六月前推出,按照這個計劃,VIA很可能將成為第一個發布雙內核x86處理器的公司。VIA雙內核處理器的特點在于體積小巧而且耗電較低,兩塊處理器可以安裝在一塊小的Mini-ITX主板上,這樣客戶可以選擇包括兩個Mini-ITX主板,總共4個雙內核處理器在1U服務器上使用。VIA的雙內核處理器包含了兩個芯片,每個芯片內都封裝了一個Esther處理器。相比而言,AMD和Intel的雙內核處理器是在一個單獨的芯片內集成兩個內核。VIA也計劃發布單獨的雙內核芯片,但是該產品估計不會在短期內上市。
二、新型材料技術的應用
在半導體制造業發展的幾十年中,硅原料本身的自然屬性一直沒有對芯片運行速度的提高產生任何阻礙作用。但是,隨著芯片制造技術的不斷改進,硅原料自身的一些不足之處逐漸成為了芯片運行速度進一步提高的絆腳石,著名的“摩爾定律”一次次受到挑戰。為此涌現出很多新技術用來改進這種狀況,但是許多年來,制作芯片的硅襯底本身在本質特性上并未發生任何變化。
目前在一些實驗中采用了單一同位素硅(100%的硅28)做原料,大大改善了芯片的發熱和能耗問題。盡管這種純同位素材料與現在的混和同位素材料相比能夠帶來很高的性能提升,但是其高昂的制造成本也使得該材料被大規模使用的可能性極小。目前在大規模量產中真正可行的改進方案就是應變硅技術。
所謂“應變硅”(Strained Silicon),字面上意思是“受到應力的硅”。該技術的原理是將硅的晶體拉伸,這樣沿拉伸方向電子的遷移率就會提升,導致電阻減小。在MOS管的柵極下溝道處的硅做成拉伸的“應變硅”,當MOS管打開的時候電流就會更順利地沿著拉伸方向在源極和漏極之間流動,速度也能更快。這樣,當MOS管工作時,主要電流還是通過溝道,向襯底分散的漏電流就會相應減少,而且MOS管與襯底間的寄生三極管能獲得的驅動電流也相應減小,這樣就減少了發生“閂鎖”效應的可能。
簡單說,如果能夠迫使硅原子的間距加大,就可以減小電子通行所受到的阻礙,也就相當于減小了電阻,這樣一來發熱量和能耗都會降低,而運行速度則得以提升。而實現該技術的關鍵是找到一種成本相對較低,可大規模應用的方法來加大硅原子距。根據硅的自然特性,在添加了相似元素的原子后,晶體結構會發生線性擴張。據此研究人員開發出了的改進的半導體材料:硅鍺,硅鍺的晶體矩陣與純硅的相比,原子間距有了明顯的擴張,因而這種材料就稱作“應變硅”。
目前Intel在其最新版本的P4和Dothan處理器中使用了這項技術。此外AMD也將在其90納米的Athlon 64產品上使用應變硅制造工藝。應變硅技術的應用在cpu制造工藝中是一個不小的進步,而且其生產成本也并不是很高,預計今后大多數處理器都將廣泛使用應變硅技術,能夠讓速度繼續得以提升。
除了“應變硅”技術外,還涌現出一系列的制程技術用來改進處理器速度提升的瓶頸,包括銅互連(copper interconnects)技術,低介電薄膜(low-k dielectrics)技術和硅晶絕緣體(silicon on insulator,SOI)技術等。其中銅互連技術用于提高速度,而另外兩項技術主要用于控制電能泄漏和減少電能需求,由于更有效的利用了電能,從而降低了芯片的發熱量,這也同樣有助于運行速度的提升。
三、移動處理器的新發展
在過去的一年中,Intel所倡導的“迅馳”移動計算技術無疑取得了巨大成功,以Dothan處理器為核心的第二代“迅馳”又在2004年粉墨登場。 經過一再拖延,五月初Intel終于在全球同步發布了Dothan處理器。
同Banias內核產品相比,Dothan處理器主要有三個方面的變化。首先生產工藝從0.13微米提升到了全新的90納米。90納米制程是目前業界最先進的半導體制程工藝,通過90納米制程,可制造出更小更快的晶體管,因此Dothan內核的Pentium-M在比Banias增加了一倍CACHE的情況下,體積和耗電基本保持不變。
其次,Dothan采用了新的“應變硅”材料技術。據Intel測試,應變硅中的電子流動速度比當前的其他硅材料的電子快很多。其電子流動速度的加快,直接使Dothan的主頻得到了很大提升。此外,Dothan二級緩存從老版Pentium-M的1MB,提升到驚人的2MB,甚至超過了很多服務器處理器。二級緩存容量的提升,直接提升了產品性能,在保持能耗大致相同的情況下,相對于原先的Banias Pentium-M處理器的性能提升了20%左右。
降低能耗是移動計算的重要要求之一,一款移動處理器是否能取得成功,其耗電高低非常重要。Dothan CPU從多方面來達到節能降耗的目的。首先0.09微米的先進生產工藝確保了Dothan處理器在性能提升的同時功耗不會有太大的增加。Dothan的平均功耗大約只有21W,相對于Banias內核的24.5W而言更低,而核心電壓也降低至1.2V以下。
其次,具有“智能型線路”的二級緩存可以有效降低功耗。Dothan CPU芯片的二級緩存采用了8路聯合的運行模式,而每路又被分割成為4個功耗區域,由于在處理器工作過程中同一時間只能使用其中的一個功耗區域,所以在專用的堆棧管理技術控制下關閉當前不能被使用到的功耗區域,從而大大降低了二級緩存的功耗。
Dothan CPU的 二級緩存達到了驚人的2M,采用這一技術就更加重要了。除此之外Dothan CPU支持新的Enhanced SpeedStep節能技術,該技術較原有的SpeedStep有了很大的進步。這一技術完全由處理器的電壓調整機制來完成,而與芯片組關系不大。在這些模式間切換的操作,全部是自動的,完全根據處理器當時的負荷,這樣就會使能耗情況得到精確的控制,達到更加節能的目的
由于Banias處理器的巨大成功,Dothan在移動處理器領域更是一騎絕塵,幾乎不存在直接的競爭對手。唯一能分得一杯羹的是最新的Crusoe處理器,這款產品最大特色是采用了21×21mm小型封裝 ,比Dothan少了將近一半的面積。另外在功耗上也具有一定的優勢,這在超小設備中絕對重要。因此最近引人關注的幾款“微型PC”象FlipStart、OQO等,都不約而同采用了小型封裝的Crusoe處理器。
四、CPU未來微結構簡介
微電腦處理器芯片業走過了30多年的路程,基本上都是按照著名的“摩爾定律”在發展。但隨著芯片集成度越來越高、工作頻率和計算速度越來越快,芯片的功耗、封裝、蝕刻等問題越來越難以處理。如果按照傳統技術繼續發展芯片業,摩爾定律勢必走向終結。為使“摩爾定律”能延續,面對新的形勢,世界主要芯片廠商紛紛制定長遠發展計劃,研究新的策略和技術手段,以保持發展勢頭。
其中主要有光連接技術、碳納米管技術、“雙門”、“三門”技術、超微晶體管技術以及3D芯片技術等。此外,性能更優越的拉伸硅和金屬鎳等新材料也將取代傳統的硅。同時新型微處理器體系結構也浮出了水面,這些都為“摩爾定律”的延續打下了基礎。
為進一步提升處理器性能,目前還有很多處理器的微結構被提出,其中一些技術已經被目前的產品所采用,而另一些技術還在開發或完善之中。
多路超標量結構,采用16/32路超標量結構,其關鍵特性是處理器設置了2000多條指令的超大指令窗口,以便從中選擇足夠多的不相關指令來實現動態調度。
超推測和Trace結構,采用超推測結構的處理器可以消除指令串行化的約束,使得程序性能突破數據相關的限制。而所謂“Trace”結構是從任何點開始的動態指令流的一個指令序列,它可以覆蓋幾個基本塊。
單芯片多處理器結構(CMP),隨著制造工藝發展,芯片容量足夠大時,就可以將大規模并行處理機結構中的SMP(對稱多處理機)或DSM(分布共享處理機)節點集成到同一芯片內,各個處理器并行執行不同的線程或進程。與之對應的還有同時多線程結構(SMT)。
PIM結構,為解決處理器速度和DRAM訪問延遲差距不斷增大的問題,將一個或多個處理器與大容量、高帶寬的片上DRAM存儲體集成在一起,從而大大縮短了訪存延遲,提高了數據帶寬。此外還有可重構多處理器結構,將大量的可重配置的處理單元集成在同一芯片內,根據應用的不同,對處理器陣列進行重新配置,以達到更高的性能。
未來十多年,總體來看,新結構、新工藝和新材料的采用將使單個芯片上可集成的晶體管數達到10億個以上,而芯片的制作工藝水平小于30納米,時頻達到10GHz以上,單片性能可達到每秒萬億次以上。此外生物芯片、全息光學芯片等更新的技術也將在未來十年得到實質性的發展。
五、主要廠商的微處理器發展計劃
隨著64位處理器時代的來臨,Intel特別制定了IA64處理器的發展藍圖,將采用多種方法提升其高端處理器“安騰”的性能,這些方法包括提高時鐘頻率、加入額外的處理內核、改善總體架構效率,以及提升L1、L2、L3高速緩存容量和速度等。今年,Intel將發售帶有9MB L3 Cache代號Madison 9M的處理器,主頻為1.5GHz。
2005年后,Montecito將可能使用65nm技術制造,采用雙內核,也就是帶有巨大的18MB L3 Cache。到2007年,Intel將推出全新的代號為“Tanglewood”的處理器,這是一種集成了16個內核的超級CPU,它將帶有海量的緩存和更高的主頻,而功耗不會高于目前的安騰2芯片,這將使服務器設計無需采用水冷等特殊散熱措施。
當然Intel對IA32結構處理器的研發力度也不會縮減,未來產品將全面采用超線程和多核心技術,新的微結構逐步運用到普通桌面產品上;高速緩存容量和時鐘頻率將不斷攀升。而另一個發展方向是為移動計算開發出,性能適中,但體積更小、更加省電的移動處理器。
Sun公司在去年公布了“吞吐量計算”計劃,來作為Sun下一代UltraSPARC處理器的基底策略,目標是建立能夠為網絡運算負荷提供最大執行能力的處理器,它在處理器的設計上采用嶄新的方法,在顯著提升實際應用效能的同時協助降低網絡運算的成本和復雜性,預期到2006年,系統性能可望在現在基礎上提高30倍。
而IBM將在在新款Power4采用CMP技術(一個硅片上集成兩個64位超標量微處理器核心)的基礎上,進一步采用“Multi-chip Module(MCM)”封裝方式,將4個Power4組合成一個較大的封裝,類似一個8個CPU的SMP系統。隨后IBM將推出Power5芯片。
Power5除采用更新的制造工藝外,還具有SMT能力。這樣,Power5將同時采用CMP和SMT,可以在單顆CPU上,獲得最多16個處理器的運算能力。當然AMD、VIA、Transmeta等處理器廠商也有各自宏大的發展計劃,這里就不一一敘述了。