NVIDIA Quadro P5000 – nejsilnější pracovní karta s jádrem Pascal

21. 12. 2017 23:00    Rubrika: Technologie    Autor: Jakub Pavlis

Pokud je pro vás zásadně důležité moci pracovat s profesionálním 3D zobrazovacím softwarem v pohybu, musíte se dívat po obzvláště drahých noteboocích či pracovních stanicích. A pokud nechcete dělat žádné kompromisy, budete hledat přístroj, který je vybaven kartou Quadro P5000. A nebo u konkurence.

NVIDIA Quadro P5000 – nejsilnější pracovní karta s jádrem Pascal

Grafické karty pro profesionální nasazení, které prošly složitou certifikací pro řadu specializovaných programů, nepotkáváme příliš často. Na trhu jsou tak speciálním zbožím, že NVIDIA na svém webu rovnou uvádí výčet všech notebooků, ve kterých se může objevit. Můžete hádat, kolik jich je. Takže? Je jich právě tucet, tedy dvanáct, a to od pouhých šesti výrobců. A v kolika z nich je P5000? Ve čtyřech a všechny mají úhlopříčku 17''. Trh pro tyto produkty není tedy příliš rozsáhlý a výrobcům se vyplatí hlavně proto, že karty jsou velmi drahé a je na nich poměrně vysoká marže.

Přitom hardwarově nejde o nějak extrémně exkluzivní kartu – celá je založena na čipu GP104, tedy tomtéž, který najdeme v plné verzi v GeForce GTX 1080 a s jednou deaktivovanou částí v GTX 1070, což je i případ Quadra P5000. Dnes jde o druhý nejsilnější profesionální kousek ve firemní nabídce, navíc Quadro P5200, který „pětitisícovku“ překonává, je pouze výše nataktovaný výběr nejlepších čipů z výroby, kromě frekvencí má všechno ostatní s „pětitisícovkou“ shodné.

Karta Quadro P5000 má TDP ve výši 100 W, herní varianta, u které se tolik nedbá na stabilitu a je taktována výrazně agresivněji, má TDP 150 W, stejných 150 W pak mohl vyzářit i přímý předchůdce Quadro M5000.

Pojďme k vlastnostem celého grafického řešení: Quadro P5000 je postavena na čipu GP104, který je z hlediska architektury spíše třetí generací Maxwellu, byť značně optimalizovanou. Hlavní změnou je 16nm výrobní proces. Mobilní čip, ať už u GeForce GTX 1070, nebo Quader P5000 a 5200, je sestaven trochu složitěji. Desktopová 1070 má prostě „uříznutý“ jeden ze čtyř procesorových klastrů, z nichž každý má pět streamovacích multiprocesorů (Streaming Multiprocessors) a 128 CUDA jader. Dále je v multiprocesoru 8 paměťových kontrolerů (celkem 256bitová sběrnice), 256 KB registrového bufferu, 96 KB sdílené paměti, 48 KB L1 cache paměti a 8 texturovacích jednotek. Quadro P5000 má ovšem aktivované i některé jednotky ve čtvrtém klusteru (celý aktivní je pouze v GTX 1080), výsledkem je 2048 CUDA jader, 170 TM jednotek a 64 ROP. Jádra jsou továrně naladěna na 1164 MHz s Turbem na 1506 MHz. Pro srovnání – v herní GTX 1070 je základ 1443 MHz a Boost 1600 MHz.


Paměťový systém netvoří jedinou širokou sběrnici, ale pracuje s osmi paralelními 32bitovými sběrnicemi, udává se tedy šířka 256 bitů. Podporovány jsou jen pomalejší GDDR5 paměti, rychlost je 6000 MHz efektivně. Maximální kapacita je naopak proti herním kartám navýšena až na 16 GB. Zapracovalo se i na kompresních algoritmech, teoretická maximální šířka pásma 192 GB/s by tedy měla být využita zase o trochu lépe i v praktických hodnotách. Samozřejmostí je podpora propojení přes PCIe 3.0.

Co se týče těch důležitých technologií, karta konečně podporuje plnou specifikaci DirectX 12 (FL_12_1) Shader Model 5.1 a OpenGL 4.5. Samozřejmostí je také přepínání mezi dedikovanou a integrovanou grafickou kartou Optimus (které ovšem problematizuje možnost připojení více monitorů), CUDA 5.2 a OpenCL 1.2 (pro obecné/negrafické výpočty), PhysX, 3D Vision (které ovšem právě s Optimem nefunguje. Podpora je i pro DisplayPort 1.4 a HDMI 2.0b.

Výsledky syntetických benchmarků (v závorce výsledky karty GTX 980M) podle nezávislého serveru notebookcheck.net:
• GFXBench 3.0 Manhattan Off: 448,1 (101,3) bodů
• GFXBench 3.0 Manhattan On: 60 (101,3) bodů
• Cinebench R15 Ref. M. 64B: 99,6 (101,3) bodů
• Cinebench R15 OpenGL 64b: 138,4 (101,3) bodů
• 3DMark13 Time Spy Graphics: 3882 (9677) bodů
• 3DMark13 Fire Strike Graphics: 14 666 (9677) bodů
• 3DMark13 Cloud Gate Standard Graphics: 86 679 (65 241) bodů
• 3DMark13 Ice Storm Standard Graphics: 208 837 (231 325) bodů
• 3DMark11 Performance GPU: 16 450 (12 517) bodů
• ComputeMark 2.1: 11 544 (6550) bodů
• LuxMark 2.0 Room: 2301 (1249) samplů
• LuxMark 2.0 Sala: 4323 (2299) samplů

Výsledky benchmarků SPECviewperf 12:
• Solidworks (sw-03) 1900 x 1060: 159 (25,6) fps
• Siemens NX (snx-02) 1900 x 1060: 168 (3,7) fps
• Maya (maya-04) 1900 x 1060: 98,5 (83,7) fps
• Catia (catia-04) 1900 x 1060: 150 (27,8) fps

A na závěr několik herních testů v ultra vysokém (Full HD) / 4K nastavení rozlišení a detailů:
• Ghost Recon Wildlands (2017): 77 / 28 fps
• Titanfall 2 (2016): 107 / 41 fps
• Deus Ex MD (2016): 97 / 36 fps
• Rainbow Six Siege (2015): 127 (ultra) / 56 fps

Pozn.: Jako plynulá hratelnost se hodnotí výsledky větší než 25 fps, ovšem udávaná fps jsou průměrná, což znamená, že při průměru 25 fps dochází v náročných scénách k nedostatečnému vykreslování obrazu – trhání.


Velká pozornost je věnována možnosti zobrazování na 4K panelech, výkon karty také bez problému stačí na vysokou obnovovací frekvenci - 120 Hz by měly bez obtíží zvládnout všechny tři dosud představené karty na architektuře Pascal. Obojí ve výsledku zanmená také marketingově tolik propagovanou schopnost poskytnout dostatek výkonu pro virtuální realitu. Se značkou VR ready se tedy budeme setkávat stále častěji, a to i u profesionálních zařízení.

Multimediální schopnosti budou opět společné pro celou generaci a vyšší či nižší model příliš změn nepřinese. Oproti Maxwellům toho přibylo celkem dost, Dnes tedy karty zvládají 10bitové kódování HVEC a 10 i 12bitové HVEC dekódování. Přibyla i hardwarová akcelerace VP9 (4K 120 Hz 320 Mbps). Přibyla i podpora HDR přes HDMI 2.0b a DisplayPort 1.4, první televize už jsou na trhu. Připojit lze až 4 monitory najednou a přenést lze až rozlišení 7680x4320 @ 60 Hz přes dva DP 1.3 porty.

Aktualizací prošla i technologie BatteryBoost, která má optimalizovat výdrž notebooku na baterie, ale po pravdě, podobné stroje na baterii dlouho nevydrží, ať se vývojáři snaží, jak chtějí. Podobně je na tom řada mobilních uživatelů s technologií G-SYNC. Externí monitory musí být pro její použití napojeny přímo na kartu, většina notebooků včetně špičkových herních ovšem používá pro zobrazení na externích displejích technologii Optimus. V mobilním světě tedy ještě nějakou dobu bude velice výjimečná.

Technologie

Diskuse