NVIDIA Quadro 5010M - na vrcholu potravního řetězce
14. 3. 2012 07:00 Rubrika: Technologie Autor: Jakub Pavlis
...stojí takzvaní vrcholoví predátoři, největší, nejsilnější, nejnebezpečnější. Dnes se podíváme, nakolik tuhle definici splňuje nová high-endová profesionální grafická karta od NVIDIA a zda tahle šelma nemá už vylámané zuby a trochu vypelichaný kožich.
Je tomu už více než rok a půl, co jste mohli na stránkách notebook.cz číst recenzi na první grafickou kartu od NVIDIA, která byla postavena na revoluční platformě Fermi. Ta postupně prochází pomalým evolučním vývojem, tu se přidá nějaká pipeline, tu pár MHz a nebo se alespoň přidá číslíčko v označení té které karty a hned je na světě nová. Tím nechci nikterak kritizovat samotnou architekturu, která se osvědčila, zlomila nejeden výkonový rekord a na ní se uskutečňovali přelomové technologie jako Optimus pro přepínání integrované a dedikované grafiky za chodu. Dnešní kousek, vlastně ještě novinka, ale až podezřele připomíná jinou kartu, ale k tomu až za chvíli.
Ocitli jsme se v hájemství profesionálních grafik, které NVIDIA pojmenovala Quadro. Jejich výhodou je především certifikace řadou předních firem vyrábějících špičkový software pro práci s obrazem, videem a hlavně 3D modelováním. Počítá se také s mnohem častějším nasazením pro takzvané General Purpose výpočty, tedy práci s negrafickými daty, pro které je ale výhodnější vysoká paralelizace výpočtů než hrubý výkon, kterým disponují CPU počítače. Hlavní přidanou hodnotou pak nejsou speciální hardwarové úpravy (které po pravdě většinou nejsou vůbec), ale propracovanější a odladěnější ovladače. Tohle všechno Quadro 5010M splňuje,navíc v souladu se svou „pětkovou“ třídou přichází s opravdovými hardwarovými vylepšeními, kterými žádná jiná řada mobilních grafických karet nedisponuje. Je to využití ECC pamětí.
ECC (Error Correction Code) paměti známe především ze systémových pamětí serverů, kde vyšší zabezpečení proti chybovosti nese viditelné výhody. To je spolu s vyšší finanční náročností důvod, proč je v běžných desktopech či dokonce noteboocích nenajdeme. A pokud je vám zkratka ECC přeci jen trochu cizí, nechte mě vám ji trochu přiblížit.
ECC paměťové moduly jsou takové, které umí najít a opravit chyby v zápisech dat, u 1bitových chyb dokonce bez omezení činnosti počítače, u 2 až 4bitových chyb záleží i na dalších okolnostech, především paměťovém řadiči. Funguje to tak, že ECC DIMM moduly mají datovou šířku 72 bitů, z nichž 64 je paměťových (jako u ostatních pamětí) a 8 bitů slouží k ukládání kontrolních součtů. Při čtení z paměti jsou vždy data kontrolována podle kontrolního součtu a v případě chyb je možné je opravit. Důležitý je také fakt, že jak základní deska (kvůli napájení), tak paměťový řadič (dnes obvykle v procesoru) musí technologii ECC pamětí podporovat. Grafická karta má řadič pro vlastní paměť integrovaný, takže z tohoto pohledu žádný problém nevzniká.
Otázkou zůstává, nakolik je podobná ochrana dat důležitá. Jeden chybný pixel v .raw obrázku nebo jeden chybný bit uprostřed videosouboru asi jen tak nepoznáte. Důvody pro nasazení téhle technologie jsou hlavně tyto: Chyba v jednom bitu dat se může při opakovaném čerpání totožných dat kumulovat a způsobovat větší chyby, které vedou k nestabilitě systému, to se týká situací, kdy jsou v paměti aktuálně uložená data běžících programů. Druhá situace může nastat spíše v případě zpracovávání dat pomocí General Purpose Computing technologií jako DirectCompute nebo CUDA – představte si, co i jediný chybný bit na správném místě může způsobit v účetní databázi klienta...
Druhou technologií pro zpřesnění a zabezpečení výsledků je počítání s plovoucí desetinou čárkou systémem Fast Double Precision. Pro řadu výpočtu je v oblasti IT praktičtější reprezentace čísla ve formátu „platné číslice x základ na exponent“. To se týká především extrémně velkých nebo malých čísel, výhodou je tedy větší rozsah čísel na stejném paměťovém prostoru, ale nevýhodou jejich menší přesnost. Technologie FDP počítá s prostorem 64 bitů pro jedno číslo (mantisa, tzn. platné číslice a exponent, základ je pro všechny čísla kódovaná standardem IEEE 754 stejný). Používanější délka zápisu má pouze 32 bitu, proto ona dvojnásobná (Double) přesnost (Precision), slovo Fast pak reprezentuje patentované algoritmy pro výpočty.
Nyní už víme, čím je profesionální Quadro grafiky tak výjimečná. A proč se mi do počátku článku vloudil vypelichaný kožich? Jen jako nadsázka, ale také znamení, že tohle jsme už někde viděli. Pokud si odmyslíme výše zmiňované technologie a vycizelované drivery a podíváme se jen na prosté specifikace, zjistíme, že před sebou máme starou dobrou NVIDIA GeForce GTX 485M, kdysi korunovaného krále dedikovaných grafických karet a stále ještě 4. nejvýkonnější grafickou kartu žebříčku renomovaného serveru notebookcheck.com (nepočítáme SLI a Crossfire zapojení), pouze s mírně sníženými frekvencemi.
V čipu se nachází 384 jader, běží na frekvenci 450 MHz, shadery pak na 900 MHz. Jádra jsou superskalární, dovedou tedy během jednoho hodinového cyklu vykonat více než jednu instrukci a došlo k další paralelizaci vykonávaných výpočtů, z čehož mohou těžit i negrafické aplikace založené na technologiích CUDA, OpenCL nebo DirectCompute 2.1. Paměťová sběrnice má šířku 256 bitů a rychlost pamětí dosáhla už 1300 MHz u GDDR5 ECC modulů. Šíře pásma je tedy až teoretických 83,2 GB/s. Maximální kapacita paměti činí 4 GB. Pro úplnost dodávám, že karta podporuje nejnovější zobrazovací standardy, které se ovšem od minulé generace nezměnily, mluvíme tedy o DirectX 11, Shader Model 5.0 a OpenGL 4.1. TDP zůstalo na 100 W, což znamená, že se s kartou setkáme jen v několika málo opravdu dobře chlazených velkoformátových (17''+) noteboocích.
Dále se podíváme na výkon karty v benchmarkových testech. Musím připomenout, že na konkrétní výsledky má vliv i výkon ostatních součástí počítače, zejména procesoru. Podle nezávislého serveru notebookcheck.com dosáhne karta NVIDIA Quadro 5010M v testu 3DMark06 na průměrných 19 544 bodů, v nejaktuálnější verzi 3DMark Vantage P. nasbírá bodů 11 047. Dále benchmarky SPECviewperf 11, které hodnotí výkony karty v profesionálních grafických programech (vždy v rozlišení 1920 x 1080, průměrný výsledek):
Catia – 38,1 fps
Ensight – 37,9 fps
Maya – 72,4 fps
SolidWorks – 46,1 fps
a Cinebench R11.5 (OpenGL 64bit) – 67,5 bodu.
NVIDIA pro Quadro 5010M samozřejmě zajistila celou řadu certifikací od firem jako je Adobe (např. PhotoShop), Autodesk (AutoCAD), Dassault Systemes (Catia, SolidWorks), RTT (DeltaGen, DeltaView), Bunkspeed ( Shot, Move, Drive) a dalších.
Závěrem mohu říci, že NVIDIA úspěšně užívá dobře odladěných plodů své dlouhé práce na architektuře Fermi (na kterou se čekalo dlouho přes dva roky) a model Quadro 5010M se celkem bez obtíží ujal role nejvýkonnější profesionální grafické karty na trhu, i když svou pozici drží i díky tak „obyčejným“ technologiím, jako je Optimus. Konkurence v podobě AMD FirePro M8900 přeci jen trošku ztrácí jak v rámci technologií (ECC, problémy s automatickým přepínáním při chodu OpenGL aplikací apod.) tak v penetraci trhu a trošičkuv i ve zvuku značky.