Intel Haswell - 4. generace Intel Core procesorů

3. 10. 2012 07:00    Rubrika: Technologie    Autor: Jakub Pavlis

Do ostrého nasazení procesorů Intel Core iX 4. generace, která je známá pod kódovým označením Haswell, sice chybí ještě zhruba rok, ale Intel už začíná vědět, jak přesně bude jeho novinka vypadat. A konečně se byl ochoten podělit o některé informace i s širší veřejností. Pojďme se tedy podívat, co nás čeká.

Intel Haswell - 4. generace Intel Core procesorů

Nová generace procesorů od Intelu je pojmenována po maličkém městě kdesi v Coloradu, což ostatně ctí firemní tradici posledních let. Na trhu by měla být nejspíše příští rok ve druhém pololetí, dost možná až před Vánocemi, ale čas toho může ještě mnoho změnit jak k dobrému, tak horšímu.

Hned na začátku mohu říci, že Intel nechystá žádnou převratnou revoluci, Haswell má být především evolucí stávajících technologií, přičemž hlavní důraz se bude klást na minimální spotřebu, optimalizace současných technologií a zavádění několika novějších. I nové čipy budou vyrobeny 22nm procesem, z čehož také vyplývá, že ušetřená energie a vylepšený výkon nebude plynout z pouhé fyzické výhody menších transistorů, ale hlavně z „chytrých“ řešení.

Základní architektura celého čipu prý bude podobná jako u Sandy Bridge i Ivy Bridge, a to včetně klíčových technologií, mezi kterými vývojáři Intelu jmenovali dvou až čtyřjádrové sestavy, Turbo Boost, Hyper-Threading nebo integraci grafického jádra nebo sdílení společné vyrovnávací paměti mezi všemi komponenty čipu, tedy žádné velké novinky. To ale neznamená, že by se na těchto technologiích dále nepracovalo.

Hlavní oblastí změn má být energetická náročnost procesorů s tím, že půjde o další stupeň ve filozofii „všechno je vždy vypnuté, pouze ty části, které si uživatel přímo vyžádá, budou pracovat. Architektura má tedy být více modulární a jednotlivé části čipu na sobě více nezávislé. Intel také chce, aby jednotlivá jádra měla větší pracovní rozpětí co se frekvence i voltáže – výsledkem by měl být větší rozptyl mezi základní pracovní frekvencí a tím, čeho by byla jádra schopna dosáhnout po přetaktování. Důležité je, aby se při maximálních výkonech čipy nepřehřívaly ani v malých šasi – jako se teď ukázalo třeba u ULV procesoru Core i7 v notebooku Lenovo ThinkPad X1c.

Velkým krokem k lepší energetické efektivitě má být také přidání nového výkonového stavu – Active Idle. Doposud mají procesory Intel dva stavy – aktivní a spánkový. V podstatě půjde o stav, kdy software pracuje s předpokladem, že procesor je aktivní (OS se tedy nehibernuje), ale ve skutečnosti už bude procesor v převážně spánkovém režimu. Probudit se ovšem dokáže podle slov vývojáře Pera Hammarlunda „maximálně během stovek milisekund“, což lze přeložit jako „uživatelsky nepozorovaně“. Využití najde tento stav třeba v okamžicích, kdy píšete článek a několik dlouhých sekund hledíte do obrazovky a přemýšlíte, jak formulovat další větu. V tomto Active Idle stavu by procesor měl spotřebovávat jen dvacetinu energie, kterou dnes potřebují procesory Sandy Bridge v klidovém režimu.

Co se týče výkonu výpočetní stránky čipu, i zde Intel nabízí pár zajímavých novinek. Především se rozhodli zachovat výpočetní pipeline ve stejné délce, jakou známe už z předchozích dvou generací (tedy poměrně krátkou), ale zvětšili vstupní buffer, takže pipelines mají blíže k většímu množství instrukcí a dat, a to znamená vyšší flexibilitu v out-of order výpočtech (mimo pořadí). Čip si tak lépe řídí tok dat a instrukcí a využívá tak více možností paralelizace výpočtů. A to zase umožnilo vylepšit technologii branch prediction (předvídání směrů výpočtu) – čip si dopředu stahuje pravděpodobně potřebná data z vyrovnávacích pamětí, aniž by přesně věděl, kam se budou jeho výpočty if-then-else (jestliže-pak) ubírat.

Vedle zvětšení bufferu došlo i k rozšíření „portů“, pipeline tedy není delší, ale širší, díky čemuž lze provádět až osm instrukcí za jeden cyklus – předchůdci zvládali jen šest. Samozřejmě ne vždy lze všech teoretických osm operací využít (což nebylo jisté ani u předchozích šesti), přidán byl jeden port pro aritmetické výpočty a jeden adresovací.

Jako další podpora výpočetní síly budou fungovat také přidané FMA jednotky, které umí provést zároveň výpočet s plovoucí desetinnou čárkou a multiplikaci v jediném cyklu, takže šetří strojový čas, dříve bylo pro stejnou operaci nutné provést první výpočet, načíst výsledek a provést druhý výpočet, což samozřejmě chvilku trvá a v kritickém okamžiku tak mohl jet celý procesor „naprázdno“, než první výsledek proputuje celou pipeline a znovu se objeví na vstupu pro druhou operaci. Posledním „vynálezem“ pak jsou AVX2 instrukce právě pro FMA jednotky. Rozšiřují SSE instrukce ve výpočtech s plovoucí desetinnou čárkou a měli by urychlovat především výpočty pro operace s obrazem ve 2D i 3D.

Vedle samotných výpočtů došlo k velké změně i ve vyrovnávací paměti. Nejde o nějaké zvětšování, současné kapacity podle Intelu stačí, otázka spíše zní, jak do zrychlující se krátké výpočetní části dopravit z pamětí dostatek informací. Intel se zaměřil na vyrovnávací paměť prvního stupně L1, která stále zůstává 64kilobytová (32 kB pro data a 32 kB pro instrukce), ale vstupní a výstupní porty se rozšířily na 32 bitů, čímž se významně snížily latence. Paměť L2 je zase dostupná pro čtení každý cyklus (dříve vždy ob jeden).

Poslední velkou inovací v rámci práce s pamětí je TSX systém (Transactional Synchronization Extensions), který řídí práva ke čtení sdílených dat u vysoce paralelizovaných systémů. Tato potřeba vznikla díky tomu, že Intel dnes dodává čipy se schopností počítat až 8 vláken (threadů) najednou (jakýkoli čtyřjádrový čip s technologií Hyper-Threading), v serverových aplikacích je maximum pro Ivy Bridge generaci dokonce 80 vláken (pro Haswell to nejspíše bude také tolik). Jednak je nutné psát optimalizované aplikace, ale uřídit 80 vláken vykonávaných na témže setu dat je už na hranici současných softwarových možností.

Velkou otázkou před uvedením každé nové generace procesorů je: Co dokážou udělat s integrovanou grafikou? Pár odpovědí: Intel bude, podobně jako u výpočetních jader, rozvíjet architekturu započatou už v Sandy Bridge generaci. I zde bude velký důraz kladen na spotřebu. První zajímavostí, která zasáhne celý procesor, je samostatné řízení spotřeby (a tedy i výkonu) pro výpočetní část, grafickou část a sběrnici. Pokud tedy potřebujete pouze vyšší grafický výkon, zvednete napětí v grafickém jádru a sběrnici, ale výpočetní část klidně může být v Active Idle módu, to vám zase přinese možnost ještě zvýšit napětí, neboť máte výše strop maximálního TDP. V předchozích generacích to možné nebylo, napětí (a tedy vydávané teplo) se vždy zvyšovalo v celém procesoru.

Dojde i k větší modularizaci, Intel slibuje tři výkonnostní „modely“, GT1 a GT2 pro základní čipy, GT3 s výrazně vyšším výkonem a zdvojnásobenou obrazově-výpočetní částí pro vrchol nabídky. O počtu shaderů a podobných konkrétních specifikacích nikdo od Intelu mluvit nechce a už dnes je zřejmé, že rozdíl mezi dedikovanou a integrovanou grafickou kartou zůstane zachován, ovšem nejspíše opět ubude manévrovací prostor pro entry-level karty, neboť Intel zase půjde s výkonem do použitelnějších čísel.

Kdo se po „optimalizační“ generaci Ivy Bridge těšil na revoluční změny, může být trochu zklamán. Ale z dlouhodobého hlediska jde o rozumné řešení, neboť Intel dokázal vylepšit pojetí i konstrukci už tak velmi dobrých součástek. A v celé řadě problémů se blížíme fyzikálním omezením, dále zmenšovat výrobní proces už také nebude dlouho možné a každý nanometr je ohromný krok, dávno pryč jsou doby, kdy mezi generacemi ležel třetinový posun k lepšímu. A teď se můžeme začít těšit na konkrétní specifikace, vždyť půlrok uteče jako voda.

Technologie

Diskuse