NVIDIA Quadro M5000M – stabilita a profesionální výkon i v OpenCL
26. 4. 2016 08:00 Rubrika: Technologie Autor: Jakub Pavlis
NVIDIA ve své řadě profesionálních grafik vydala i nejsilnější čistě notebookovou verzi. Je založena na stejném čipu Maxwell, jako herní královna GeForce GTX 980M, jako obvykle ale přináší optimalizované ovladače certifikované pro použití s profesionálními aplikacemi. Oproti herní řadě GeForce by se měla lišit i vyšším výkonem v OpenCL.
NVIDIA Quadro M5000M je nejsilnější čistě notebooková karta ve firemní nabídce, ovšem jistě si všimnete té výhrady: „čistě notebooková“. V nejvýkonnějších workstationech můžete najít ještě čip Quadro M5500, ale jak napovídá chybějící M na konci, ta je založena na desktopovém čipu, byť jako celek je značně uzpůsobena.
Quadro M5000M má stále ještě přístupné TDP, totiž 100 W, je tedy určena téměř výhradně do velkých 17'' notebooků, ve menších bude problém ji uchladit, zejména když bude téměř výhradně kombinována s plnonapěťovými procesory Intel s TDP 45 W. Ostatně její nároky jak na technická řešení při zabudovávání do notebooku, tak na peněženku zákazníka jsou takové, že ji najdeme opravdu jen v několika nejvyšších modelech specializovaných výrobců.
Pojďme k vlastnostem celého grafického řešení: Qquadro M5000M je postavena na čipu GM204, které je druhou, lehce aktualizovanou a optimalizovanou generací architektury Maxwell. Hlavní důraz byl kladen na zvýšení efektivity a optimalizaci spotřeby. Specifikem oproti generaci Kepler a vlastně i Fermi je pokles výkonu v Double Precision výpočtech, sama NVIDIA tvrdí že výkon v FP 64 je pouhou 1/32 výkonu v FP 32. To může vadit těm, kteří využívají grafické karty na obecné výpočty přes technologie CUDA nebo častěji OpenCL, ovšem jen v některých krajních případech. Na výkon ve vykreslování grafiky to vliv nemá.
Karta M5000M, jako ostatně celá Mková řada (M znamená Maxwell, stejně jako u minulé generace K znamenalo Kepler a předtím F Fermi), je stále založena na 28nm jádru vyrobeném v TSMC, kde se přechod na nižší výrobní proces teprve rozbíhá. Na novou generaci Pascal si ovšem počkáme nejméně do léta, navíc NVIDIA má ve zvyku vydávat profesionální řady s velkým zpožděním za herními. Důvodem je nutnost ozkoušet technologii a vyladit ovladače pro co největší stabilitu. U aktuální generace Maxwell bylo tohle zpoždění rok.
Topologicky vzato, grafické jádro má čtyři části (clustery), každá sestává ze čtyř SMM bloků (bloky streaming multiprocesorů), přičemž každý blok má 128 shaderů a 8 texturovacích jednotek. Zde jsou ovšem 4 ze 16 SMM bloků deaktivované, celkem tedy karta disponuje 1536 CUDA jádry a 96 texturovacími jednotkami. Celé jádro karty i jednotlivé bloky jsou taktovány na 962 MHz. Možnost dočasného přetaktování (technologie GPU Boost 2.0) dosáhne až na maximálních 1051 MHZ (dle referenčního návrhu, konkrétní výrobci ho mohou pozměnit). Frekvence jsou tedy v zájmu stability oproti herní řadě sníženy o 76 MHz.
Paměťový systém netvoří jedinou širokou sběrnici, ale pracuje se čtyřmi paralelními 64bitovými sběrnicemi, udává se tedy šířka 256 bitů. Rychlost pamětí je 1250 MHz (5000 MHz efektivně) při použití GDDR5 pamětí. Maximální kapacita je 8 GB a všechny nabízené modely jsou touto pamětí také osazeny. Zapracovalo se i na kompresních algoritmech, teoretická maximální šířka pásma 160 GB/s by tedy měla být využita zase o trochu lépe i v praktických hodnotách. Žádnou velkou novinkou už není ani podpora propojení přes PCIe 3.0.
Co se týče těch důležitých technologií, karta konečně podporuje plnou specifikaci DirectX 12 (FL_12_1) Shader Model 5.0 a Open GL 4.5. Samozřejmostí je také přepínání mezi dedikovanou a integrovanou grafickou kartou Optimus (které ovšem problematizuje možnost připojení více monitorů), CUDA 5.2 a OpenCL 1.2(pro obecné/negrafické výpočty), PhysX, 3D Vision Pro (které ovšem právě s Optimem nefunguje) a 3DTV Play. Podpora je i pro DisplayPort 1.2 a HDMI 2.0.
Výsledky syntetických benchmarků podle nezávislého serveru notebookcheck.net:
• Cinebench R15 Ref. Match 64b: 99,6 bodů
• Cinebench R15 OpenGL 64b: 113,3 bodů
• Cinebench R11.5 OpenGL: 105,5 bodů
• Cinebench R10 Shading 32b: 7675,5 bodů
• 3DMark13 Fire Strike Standard Graphics: 9227,5 bodů
• 3DMark13 Cloud Gate Standard Graphics: 63 738 bodů
• 3DMark13 Ice Storm Standard Graphics: 309 196 bodů
• 3DMark11 Performance GPU: 11 845 bodů
• LuxMark 2.0 Room: 1327,5 samplů
• LuxMark 2.0 Sala: 2173 samplů
Výsledky benchmarků SPECviewperf 12:
Solidworks (sw-03) 1900 x 1060: 103 fps
Siemens NX (snx-02) 1900 x 1060: 87,4 fps
Maya (maya-04) 1900 x 1060: 71,3
Catia (catia-04) 1900 x 1060: 96,7 fps
Výsledky benchmarků SPECviewperf 11:
Solidworks 1900 x 1080: 49,3 fps
Siemens NX 1900 x 1080: 51,7 fps
Maya 1900 x 1080: 58
Catia 1900 x 1080: 52 fps
Pro/ENGINEER 1900 x 1080: 17,9
A na závěr několik herních testů ve vysokém / nízkém nastavení rozlišení a detailů:
The Witcher 3 (2015): 82 / 193 fps
Dirt Rally (2015): 126 / 386 fps
Thief (2014): 97 / 108 fps
Hitman: Absolution (2012): 67,2 / 83,5 fps
Pozn.: Jako plynulá hratelnost se hodnotí výsledky větší než 25 fps, ovšem udávaná fps jsou průměrná, což znamená, že při průměru 25 fps dochází v náročných scénách k nedostatečnému vykreslování obrazu – trhání.
Co se týče multimediálních a 2D vlastností, je výbava pro všechny karty této generace zatím stejná, totiž PureVideo HD šesté generace, vylepšení spočívá především ve zdokonalených kodérech H.264 a MPEG-2.
Quadro M5000M rozhodně uspokojí každého, kdo touží po stabilitě a vysokém výkonu. Ve hrách nabídne díky výkonové rezervě dostatek síly i pro nejnovější hry, ovšem pokud hledáte nejlepší herní výkon vůbec, je lépe zaměřit se na řadu GeForce. Pro profesionály znamená tahle karta jistotu plynulých animací i u náročných projektů v profesionálních programech. Nevýhodou tak zůstává především vysoké TDP, a tedy nutnost mít velký a nemobilní notebook, a pak samozřejmě cena, ovšem to je spíše otázka toho, za jak dlouho si na sebe karta dokáže vydělat.