NVIDIA NVLink – nové propojení mezi GPU a CPU
2. 4. 2014 08:00 Rubrika: Technologie Autor: Jakub Pavlis
NVIDIA představila novou technologii propojení grafických jader mezi sebou a případného propojení s CPU, které by mělo výrazně zvýšit přenosové rychlosti a zároveň omezit latence. Jedná se ale opravdu o reálné ohrožení PCIe sběrnice, nebo jen technologické cvičení užitečné pro pár specifických situací?
Prvně je třeba si říci, že zatím se jedná o nevyzkoušenou technologii, kterou NVIDIA slibuje zavést až do svých grafických karet s jádry Pascal. Ty budou k dispozici až po letošní, dosud neprodávané, generaci Maxwell. Takže reálná doba nasazení je nejdříve v roce 2016, a to se může ještě mnohé udát. Na druhou stranu NVIDIA již má přesné představy, co a jak bude fungovat. Pojďme se na to tedy podívat.
PCI Express sběrnice nabízí teoretickou rychlost 8 gigatransferů za sekundu pro každou linku, přičemž linek může být až 16. Celkový výkon je tedy 128 gigatransferů za sekundu, přičemž jde o dokonalý teoretický stav, kterého samozřejmě v praxi nelze dosáhnout. Pro většinu aplikací jde o rychlost dostatečnou, ovšem v některých chvílích začíná i toto obrovské číslo nedostačovat. Jde především o situace, kdy má spolupracovat více grafických čipů, které mají dodávat velké množství dat z dílčích výpočtů pro systémový procesor.
Druhým problémem jsou latence, což dokázalo již třeba i AMD se svými APU, kdy úzké propojení procesoru s relativně výkonným jádrem v některých případech vede k rychlejšímu dokončení výpočtu, než použití dvou oddělených, byť teoreticky mnohem výkonnějších, součástek. NVIDIA se toto rozhodla řešit ve spolupráci s IBM, který slibuje budoucí implementaci do svých Power CPU.
V zásadě má NVLink dvě využití, totiž propojení jednotlivých grafických procesorů mezi sebou, přičemž největší výhoda se získává s nárůstem počtu procesorů, neboť situaci pouhých dvou celkem dostatečně řeší SLI zapojení. Druhou možností je propojení jednoho nebo několika GPU se systémovým procesorem, kde by se nejvíce těžilo z obejití PCIe sběrnice. NVIDIA navíc sympaticky myslí na kompatibilitu a co největší využitelnost svého nového propojení. NVLink totiž bude používat programovací základy PCIe, takže bude možné využívat obou propojení. Paměťové transakce vyvolané procesorem, zejména typu konfigurací a kontroly výpočtů, by dále běžely po PCIe, neboť její rychlost je v tomto případě plně dostačující, zatímco transakce vyvolané GPU by používaly přednostně NVLink. To by mělo vést k dalšímu nárůstu špičkového výkonu při zachování nízkých latencí a jistým způsobem se to dá přirovnat k vícekanálovému zapojení pamětí.
Výkon, který by měla NVLink poskytovat, odhadují vývojáři z NVIDIA na pěti- až dvanáctinásobek současných možností PCIe, tedy na 80 – 200 GB/s, což by zaručovalo i bezproblémový přístup do systémové paměti. Navíc by i při takto vysokých rychlostech mělo dojít ke snížení energetické náročnosti celého propojení (minimálně ve srovnání právě s PCIe), což u rozsáhlých systémů může vést k úsporám jak na přímých nákladech, tak u chlazení.
Důležitou technologií, která by měla podpořit používání NVLink, je unifikace pamětí, kterou NVIDIA taktéž plánuje pro generaci GPU Pascal, takže jednotlivé GPU (a případně CPU) budou mít snadný přístup do pamětí všech ostatních propojených procesorů.
V případě, že CPU nebude podporovat NVLink (což je poměrně pravděpodobné), bude NVLink používána pouze mezi GPU a směrem k CPU budou data proudit dále po PCIe, byť se tím část výhod NVLink ztrácí a zůstává jen vyšší paralelizace grafických výpočtů.
Velkou otázkou je podpora NVLink ze strany dalších významných hráčů na trhu. NVIDIA sama je sice nejsilnějším dodavatelem dedikovaných grafických karet nma trhu a jistý vliv mají i její ARM procesory Tegra, u nichž jistě bude chtít využít maximum ze svých technologií, a další sílu přidává kooperace s IBM. Podpora ze strany přímého konkurenta, tedy AMD, je ovšem více než nepravděpodobná, pokud by ji k tomu nedotlačil trh. Klíčové tedy zůstává rozhodnutí Intelu. Intel zatím s „grafickými“ firmami spolupracuje poměrně bezproblémově, ale sám má zájem na svých výrobcích architektury Larrabee a nejspíše hodně záleží na tom, jak se trh bude stavět k jeho budoucím produktům. Výrazného posilování výkonu v integrovaných kartách Intel jsme svědky již několik let, na druhou stranu čipů Iris Pro se nijak moc neprodává.
Druhou otázkou je vůbec směřování celého odvětví. NVLink přinese výhody především u systémů pro profesionály, které kombinují celou řadu GPU a nevystačí si s jedním či dvěma procesory, což je naopak případ většiny uživatelů CPU, a to včetně gamerů s vysokými nároky na grafický výkon. NVLink totiž zřejmě najde nejlepší využití ve vysoce paralelizovaných superpočítačích používaných pro obecnější výpočty, než jen konverzi videa a CAD modelování nebo hry. Budoucnost NVLink je tedy přes všechny zajímavé výhody ještě ve hvězdách.