在計算機市場出現的新技術很少能馬上就為大眾所廣泛接受。在某些時候,廠商不得不通過改進新產品的參數以適應市場的需要,英特爾的LGA755平臺剛開始進入市場時也曾遇到這種情形。
此前的眾多測試已經證明,如果使用相當頻率的處理器,新平臺所提供的性能往往要比普通的Socket748系統遜色。這是為什么?因此基于新一代芯片組的LGA755系統使用的是新一代內存類型—DDR2 SDRAM,這種新內存的性能往往比常見的DDR SDRAM要慢。這大大阻礙了基于英特爾新一代i915和i925芯片組系統的推廣進程。
現在情況有所改觀,內存模塊廠商目前已經推出了經過改良的DDR2 SDRAM內存模塊。那么它是否能為新一代平臺帶來希望呢?今天我們將你大家解開這個疑團……
一、溫故而知新:DDR2的基礎知識
在說明DDR2 SDRAM的優點和缺點之前,我們先來溫習一下與它架構有關的DDR2 SDRAM基本知識。DDR2內存的基本根本工作原理類似于DDR SDRAM。只不過,DDR SDRAM每個時鐘周期內可能通過總線傳輸兩次數據,而DDR2 SDRAM則可以傳統4次數據。DDR2使用一樣的內存cell,但是使用多路技術使得帶寬加倍。
這種數據傳輸方式又叫四位預讀取(4bit Prefect)架構,類似于Rambus的四倍Rambus信號模型技術,同樣可以在核心頻率較低的情況下實現較高的數據傳輸率。然而,這個方法雖然可以有效果提高內存帶寬,但也有它最主要的缺點就是高延遲。內存延遲不取決于I/O緩沖區的工作頻率或數據從內存cell進入總線的位寬多少。影響延遲的主要因素是內存cell自身的延遲。DDR2-533的延遲相對DDR266或PC133 SDRAM來說都要高,更不用說與DDR400相比了。
除此之外,DDR2還有其它一些顯著特征,大家可以參考一下下表:
DDR SDRAM |
DDR2 SDRAM | |
Frequency |
200,266,333,400 MHz |
400,533,(667,800) MHz |
Chips Packaging |
TSOP and FBGA |
FBGA |
Voltage |
2.5 V |
1.8 V |
Capacity |
64 Mbit – 1 Gbit |
256 Mbit – 4 Gbit |
Internal Banks |
4 |
4 and 8 |
Prefetch (MIN Write Burst) |
2 |
4 |
CAS Latency (CL) |
2,2.5,3 |
3,4,5 |
Additive Latency (AL) |
No support |
0,1,2,3,4 |
Read Latency |
CL |
CL+AL |
Write Latency |
1 |
Read latency - 1 |
Input Calibration |
No support |
Off-Chip Driver (OCD) Calibration |
Data Strobes |
Bidirectional Strobe (single ended) |
Bidirectional Strobe (single ended or differential) with RDQS |
On-Chip Bus Termination |
None |
Embedded |
Burst Lengths |
2,4,8 |
4,8 |
為了降低高延遲所帶來的性能損失,廠商們在針對DDR2引入了Posted CAS模式,即“寫入延遲=讀入延遲-1”,這有助于更有效的利用總線。Post CAS,它是為了提高DDR II內存的利用效率而設定的。在Post CAS操作中,CAS信號(讀寫/命令)能夠被插到RAS信號后面的一個時鐘周期,CAS命令可以在附加延遲(Additive Latency)后面保持有效。
原來的tRCD(RAS到CAS和延遲)被AL(Additive Latency)所取代,AL可以在0,1,2,3,4中進行設置。由于CAS信號放在了RAS信號后面一個時鐘周期,因此ACT和CAS信號永遠也不會產生碰撞沖突。在正常的操作中,此時的各項內存參數為:tRRD=2,tRCD=4,CL=4,AL=0,BL=4(BL就是突發數據長度,Burst Length)。
我們看到tRRD(RAS到RAS的延遲)為兩個時鐘周期,tRCD(RAS到CAS的延遲)是四個時鐘周期,因此在第四個時鐘周期上面ACT(段激活)和CAS信號產生了碰撞,ACT向后移動一個時鐘周期,因此大家可以看到后面的數據傳輸中間出現了一個時鐘周期的BUBBLE。
再來看看Post CAS的操作,此時的各項內存參數是:tRRD=2,tRCD=4,CL=4,AL=3,BL=4。RAS被設在ACT信號后的一個時鐘周期上,因此CAS和ACT不會產生沖突,tRCD被AL所取代(實際上大家可以想象到tRCD并沒有減小,只是在概念上的轉變,CAS向后一個時鐘周期,但是AL要比tRCD短,通過調整可以取消信號命令的碰撞),在附加延遲過程中DRAM保持讀命令。
由于這種設計,ACT和CAS不會再有碰撞,內存讀取時序中也沒有BUBBLE出現。不過,此項功能對目前市場上的DDR2而言幾乎沒有效果: 列和行數據陣列的訪問時間間隔(RAS-to-CAS延遲,tRCD),DDR最小為13毫秒,這對DDR2言足足損失了四個時鐘周期。不能低估這個延遲,內存尋址的高延遲將導致低性能。
此外,DDR2內建了名為ODT是內建核心的終結電阻器,我們知道使用DDR SDRAM的主板上面需要大量的終結電阻,至少每根數據線需要一個終結電阻,這對主板來說也是不小的成本。信號線上使用終結電阻是為了防止數據線終端反射信號,因此需要一定阻值的終結電阻器。這個阻值太大或者太小都不好,阻值較大線路的信噪比較高但是信號反射較為嚴重,阻值小可以減小信號反射但是會造成信噪比下降。
由于不同的內存模組對終結電阻的要求不可能完全一樣,因此主板對內存模組也比較"挑剔"。DDR 2內建了終結電阻器,在DRAM顆粒工作時把終結電阻器關掉,而對于不工作的DRAM顆粒則打開終結電阻,減少信號的反射。ODT至少為DDR 2帶來了兩個好處,一個是去掉了主板上的終結電阻器使主板的成本降低,也使PCB板的設計更加容易。第二個好處是終結電阻器可以和內存顆粒的"特性"相符,使DRAM處于最佳狀態。
除此之外,DDR2對芯片核心的內部改進,并把工作電壓從DDR的2.5V降到1.8V。這就預示著DDR2的功耗和發熱量都會在一定程度上得以降低。在封裝方面,DDR2改用更先進的CSP(FBGA)無鉛封裝技術。此封裝最大的優點是可以在晶圓上做好了封裝布線,可以大提高可靠性。DDR2采用兩種封裝形式,如果數據位寬是4bit/8bit,則采用64-ball的FBGA封裝,數據位寬是16bit,則采用84-ball的FBGA封裝。
二、新版低延遲DDR2
因此與DDR相比,DDR2存在一個缺點,那就是基于DDR2系統由于受高延遲的影響,性能要略遜色于同頻的DDR系統。因此目前支持DDR2 SDRAM的內存廠商一些努力解決這個問題,現在他們取得了一定的成績。
在基于i925和i915芯片組的平臺上,早期DDR2-533 SDRAM模塊僅能工作在4-4-4 timings(CAS Latency - RAS to CAS Delay - RAS Precharge Time)模式下。不過這種情況目前已經有所改觀,許多內存制造商,特別象Corsair或OCZ此類為PC發燒友推出先進內存模塊的內商,已經推出了支持3-3-3 timings規格、工作頻率為533MHz的DDR2 SDRAM內存模塊。
必須強調的是這些模塊不是通過超頻獲得的,而完全符合JEDEC標準(官方文件中DDR2-533修正版的規格:支持3-3-3 timings并且電壓增加到1.9v)。
英特爾也在最新LGA775系統中對3-3-3 timings的DDR2-533 SDRAM提供了支持。英特爾公司目前已經正式證實它的新芯片組將支持此類規格內存,并且強調此類的內存將是超級玩家們的最佳選擇。理論上,DDR2-533的CAS延遲減小了3個時鐘周期是新版DDR2 SDRAM的參數最大改進之處:
Memory | Timings | Latency | Bandwidth in dual -channel mode |
DDR400 SDRAM |
2.5–3–3 |
12.5 ns |
6.4 GB/sec |
DDR400 SDRAM |
2–3–2 |
10 ns |
6.4 GB/sec |
DDR533 SDRAM |
3–4–4 |
11.2 ns |
8.5 GB/sec |
DDR533 SDRAM |
2.5–3–3 |
9.4 ns |
8.5 GB/sec |
DDR2-533 SDRAM |
5–5–5 |
18.8 ns |
8.5 GB/sec |
DDR2-533 SDRAM |
4–4–4 |
15 ns |
8.5 GB/sec |
DDR2-533 SDRAM |
3–3–3 |
11.2 ns |
8.5 GB/sec |
DDR2-600 SDRAM |
5–5–5 |
16.6 ns |
9.6 GB/sec |
DDR2-600 SDRAM |
4–4–4 |
13.3 ns |
9.6 GB/sec |
從上表你可以看到,在4-4-4 timings下DDR2-533 SDRAM的延遲比普通DDR400 SDRAM還要高,雖然帶寬高了30%但仍無法彌補高延遲所帶來的性能損失。在3-3-3 timings 下DDR2-533的延遲有所改進,然而仍比2-3-2 DDR400 SDRAM的延遲高了12%。不過考慮到DDR2-533 SDRAM擁有更高的帶寬,我們希望基于新版DDR2的系統性能可以與DDR系統相當。
需要說明的是,提升到3-3-3 timings規格并不是DDR2-533改良之路的終點。例如,OCZ已經推出了擁有更高timings規格、并且已經進入量產階段的DDR2內存模塊:PC2 4200 Enhanced Bandwidth Platinum,擁有3-2-2 timings的規格!配備這樣內存的LGA775平臺將比普通的DDR系統擁有更高的性能。
除此之外,主板廠商也已經加快推出支持LGA775的主板,比如像ASUS、ABIT及其它廠商為超頻玩家推出的i915/i925主板可以允許DDR2運行在600MHz頻率下,而不是533MHz。盡管在JEDEC標準中并沒有DDR2-600,但這種內存模式能增加內存子系統的內存,延遲在4-4-4 timings下也要比舊版DDR2-533低一些。
除了內存廠商針對發燒者推出了timings更低的DDR2-533內存模塊之外,同時DDR2-667模塊可以工作在600MHz和667MHz下,因此在LGA775系統上使用600MHz內存將可能在應用中帶來一定的實質性影響。因此,今天我們這里將拿基于最新改良的內存的平臺與此前的測試平臺進行性能測試,看看改良后的新版DDR2是否能為我們帶來希望,能否真正終結DDR時代。
需要強調的是,我們在談論廠商在改進DDR2 SDRAM的速度和延遲方面所取得的成績同時,我們也不要忘記主板和內存廠商目前也努力改良基于DDR平臺的性能。當然,在這個領域的進展并沒有象DDR2領域那樣搶眼,因為JEDEC的 DDR SDRAM標準已經推出很長時間、已經沒有改動的余地。
DDR400 SDRAM的發展之路在達到2-2-2 timings規格時就已經畫上了句號,因此現有的i865和875平臺的內存子系統似乎已經達到最大性能規格并且似乎已經沒有改進的潛力。但是事實并不如此,在成功推出2-2-2 timings規格的DDR400 SDRAM內存模塊后,內存廠商已經換到了開發可以運行在比400MHz更高頻率下的內存模塊。例如,甚至DDR600 SDRAM內存目前已經在市場上出現,即它可以運行在600MHz頻率下。因為目前所有芯片組的在標準工作模式下都不支持400MHz頻率以上的內存,因此只有超頻玩家才會對如此高速的DDR內存模塊感興趣。
值得慶幸的是,主板制造者已經解決了這個問題。目前一些主板廠商的工程師可以讓基于i865PE芯片組的主板在標準工作模式---即在200MHz FSB下支持533MHz內存。比如ASUS P4P800-E Deluxe就是擁有如此功能的Socket748主板之一,而且基于i865PE芯片組、支持LGA775處理器的ASUS P5P800主板也擁有如此功能。這樣,基于i865PE芯片組的系統在處理器的標準工作模式已經可以與更快DDR533 SDRAM內存相兼容。
盡管如此,在我們所接觸過的最快Pentium 4平臺(如支持DDR2-533,DDR2-400的i925,i915及配備DDR533和DDR400 SDRAM的i875、i865)中,這些平臺配備的DDR533 SDRAM并沒有為系統帶來多大的性能提升。從我們此前的測試結果來看,配備DDR533 SDRAM的i865PE系統并不比基于2-2-2 timings DDR400 SDRAM內存規格的系統快。不過,現在情況已經有所變化。
此前,擁有3-4-4 timings規格的DDR533 SDRAM內存的地位已經被更高規格的DDR533 SDRAM所代替,目前內存模塊廠商已經推出了可以在2.5-3-3、3-4-4 timings、533MHz模式下工作的DDR533 SDRAM內存模塊。如此高速的內存模塊顯然將會把i865PE平臺性能提升到一個更高水準。其中出自Corsair之手的TWINX1024-4400C25內存模式就是這樣的超級DDR內存,它們主要是針對超頻玩家制定的超頻利器。
這些Corsair TWINX1024-4400C25的工作頻率為550MHz頻率,擁有2.5-4-4 timings和2.75v的工作電壓,因此它們可以將可以完美工作在2.5-3-3 timings、533MHz頻率下。因此,我們使用ASUS P4P800-E Deluxe和Corsair TWINX1024-4400C25組建成I865PE平臺,處理器運行在800 MHz FSB下,而內存工作在533MHz(2.5-3-3 timings)模式下。