Intel QuickPath - rychlejší cesta k datům
6. 8. 2008 07:00 Rubrika: Technologie Autor: Aleš Lalík
Blížící se architektura Nehalem přinese u procesorů Intel několik zásadních změn. Po dlouhé době se Intel rozloučí s datovou sběrnicí FSB, na jejíž místo nastoupí následovník jménem Intel QuickPath. S tím souvisí také přesunutí řadiče operační paměti přímo k procesoru zajišťující rychlejší odezvu a výrazný nárůst datových přenosů. Pojďme se podívat detailněji, má-li QuickPath dostatečné předpoklady stát se důstojnou náhradou FSB.
Mikroarchitektura ukrytá pod kódovým označením Nehalem znamená pro Intel v několika směrech zásadní změny. Návrh jádra procesoru sice bude „pouze“ evolucí stávající Intel Core architektury, nicméně další prvky znamenají stejnou revoluci jako před léty příchod architektury K8 u konkurenčního AMD. Jedná se o nahrazení stávající datové sběrnice Front Side Bus (zkráceně FSB) a přemístění řadiče operační paměti přímo k procesoru. Nejdříve si ale v rychlosti probereme, k čemu vůbec FSB slouží(la), aby byl více zřetelný přínos budoucích novinek.
FSB byla Intelem poprvé uvedena u procesoru Pentium Pro v roce 1995. Jedná se o obousměrnou datovou sběrnici zajišťující komunikaci mezi procesorem (CPU neboli Central Processing Unit) a severním můstkem (Northbridge) čipsetu. Přes něj pak procesor dále komunikuje s celým zbytkem počítače včetně operační paměti, jejíž řadič byl až dosud umístěn právě v severním můstku. Na rychlosti FSB proto závisí, jaké teoretické množství dat je možno přenést z/do procesoru - samozřejmě ho musí být procesor schopen zpracovat. Z frekvence FSB se dále odvozují rychlosti některých sběrnic počítače, paměti RAM a také pracovní frekvence procesoru.
Zjednodušené schéma PC
Dosavadní frekvence FSB se v noteboocích s procesorem z rodiny Core 2 pohybuje v rozmezí 533 až 800 MHz, u Core 2 Extreme verze je zvýšena na 1066 MHz. Příchozí procesory z platformy Centrino 2 nově přináší podporu 1066 MHz FSB i pro běžné procesory. Přesto se nejedná v globálním měřítku o žádné závratné hodnoty. Vzhledem k tomu, že množství dat proudící skrze FSB se blíží čím dál více jejímu limitu, tak by se zjednodušeně řečeno postupem času stala úzkým hrdlem brzdící celý počítač. Důkazem o relativně nízké přenosové rychlosti FSB v porovnání například s operační pamětí budiž následující tabulka. Zachycuje maximální přenosové schopnosti vybraných operačních pamětí DDR2 a DDR3 v jedno-, dvou- i tříkanálovém zapojení. Napravo je uvedena potřebná frekvence FSB tak, aby byla schopna přenést stejné množství dat jako operační paměť.
Porovnání rychlostí RAM vs. FSB
Červeně jsou zvýrazněny rychlosti FSB, kterými mobilní procesory v základu nedisponují. Jak vidno, zejména v případě DDR3 pamětí se snadno dostáváme u FSB do absurdních, těžce (ne)dosažitelných čísel. Právě proto přichází na scénu Nehalem, integrující řadič RAM přímo k jádru procesoru. Každé jádro dostane samostatný paměťový řadič se třemi kanály a přidělenou určitou část paměti, zatímco dosud paměť tvořila jednotný prostor. Konkrétně u Nehalemu bude přenosová rychlost CPU-RAM maximálně 32 GB/s, tedy bohatě dostačující pro nadcházející DDR3. Výkonnostní posun vpřed oproti současným Core 2 procesorům potvrzují také testy provedené serverem Anandtech. Do rukou se jim dostal vzorek stolní verze Nehalemu, který ve spojení s tříkanálovým řadičem DDR3 pamětí výrazně převýšil procesor Core 2 Extreme s dvoukanálovým řadičem taktéž DDR3 RAM.
Práce s RAM u Nehalemu a Core 2 Extreme; převzato z anandtech.com
Paměť není vše
Po připojení pamětí přímo k procesoru zbývá vyřešit přenos dat mezi jeho jednotlivými jádry a také severním můstkem. Tomu v podstatě zůstala funkce vstupně-výstupní brány, spojující CPU se zbývajícími komponentami počítače. Za tímto účelem byla stvořena sběrnice Intel QuickPath Interconnect (QPI). Lze se setkat také s dřívějším formálním označením Common System Interface - CSI. Jedná se o point-to-point systém přenosu založený na paketové komunikaci. Díky vzájemnému propojení jednotlivých komponent namísto jejich poměrně zdlouhavého připojení k původní FSB je ušetřen čas během putování informací ke svému cíli.
Fyzicky se QPI skládá z 20 linek v každém směru pro simultánní obousměrný přenos. Linky jsou dále rozděleny do 4 kvadrantů po pěti linkách. Každou linku pak tvoří jeden pár tras přenášejících jednotlivé bity, doplněné ve všech kvadrantech hodinovým signálem pro správnou synchronizaci. Data jsou na linkách přenášena technologií LVDS (Low Voltage Differential Signalling), což je zjednodušeně řečeno přenos nízkonapěťových signálů velkou rychlostí skrze obyčejné vodiče. V případě nevyužití všech 4 kvadrantů je v rámci úspor možné aktivovat pouze dva nebo jeden kvadrant.
Jeden kvadrant QPI; převzato z realworldtech.com
I při plném osazení všemi kvadranty je díky vysokým rychlostem použito méně vodičů v porovnání s původní FSB, což znamená dosažení úspor. Nejen finančních při výrobě a návrhu základních desek, ale také je pro QPI sběrnici zabráno méně pinů na procesorové patici. Ušetřené piny je možno využít například pro zkvalitnění napájení procesoru. Teoretické maximum přenosové rychlosti QPI je u první generace stanoveno na 25,6 GB/s. Do budoucna Intel plánuje několikanásobné zvýšení této rychlosti, objevily se zprávy o hodnotách až 96 GB/s.
Během prvního propojení QPI proběhne kalibrace a tzv. „učící proces“, jejichž úkolem je nastavit správné parametry přenosových cest vzhledem ke schopnostem samotné QPI a komponent k ní připojených. Zároveň je touto cestou provedena kontrola, zda-li jsou všechny linky plně funkční. Samozřejmostí je přítomnost mechanismů šetřících energii v případě nízkého vytížení nebo nečinnosti. QPI by měl obsahovat alespoň dva typy stavů, ve kterých jsou nepoužívané linky dočasně odstaveny. Jejich rozdíl spočívá v tom, kolik energie jsou schopny uspořit a jak dlouho jim následně trvá probuzení do plně aktivovaného stavu. Konkrétní úspora bude záležet na vytížení a dané implementaci.
Zde by výčet novinek přinesených QPI zdaleka nekončil. Zbývající funkce jsou však mířeny do zcela jiných oblastí než je sektor notebooků. Konkrétně budou jejich výhody doceněny v serverové oblasti, kde je kladen důraz na technologie jako kontrola přenosu dat (CRC) a podobné.
Centrino 3 s Nehalemem příští rok
První procesory založené na architektuře Nehalem se dočkají dle Intelu uvedení již v září letošního roku. Zpočátku se bude jednat pouze o high-end modely určené pro stolní počítače, jejichž cena bude poměrně vysoká. Notebooky se dočkají zástupců využívajících architekturu s kódovým názvem Calpella, mobilní odnože Nehalemu, společně s příchodem platformy Centrino 3 v první polovině roku 2009. Bavíme se samozřejmě o datech oficiálního uvedení, v jakém množství bude Intel zvládat zásobovat prodejce a výrobce není jisté. Vzhledem k minulosti se dá předpokládat určité zpoždění mezi uvedením a následně objevením Nehalemu na skladech. Pokud tedy chcete notebook s Nehalemem, resp. Calpellou, obrňte se trpělivostí. Ve zbývajícím čase alespoň můžete šetřit finance, protože jistě ani u notebooků nepůjde zpočátku o levnou záležitost.
Zdroj: intel.com, realworldtech.com, anandtech.com