Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!
Zadejte Vaši e-mailovou adresu:
Kamarád fotí rád?
Přihlas ho k odběru fotomagazínu!
Zadejte e-mailovou adresu kamaráda:
Tipy & triky
Cinebench 11,5 – na hranici, s kacířem! Zhodnocení benchmarku z pohledu dneška...
18. února 2013, 13.11 | Cinebench R11,5 je už dlouhá léta, však si sami vzpomeňte z jaké verze CINEMY 4D vychází, etalonem výkonu v 3D aplikacích. A to nikoli jen pro samotnou CINEMU 4D, ale množství renderovacích farem výkon svých stanic dokumentuje právě tímto etalonem. Otázkou ale je, nakolik je dnes ještě relevantní. Kacířská myšlenka. Přesto neodvolám. Průvodcem nám budou procesory AMD, zejména FX 8350 doprovázený Thubanem 1100 a dvěma Opterony 6272.
Před časem jsem měl zajímavou příležitost, která se mi ještě doufejme zopakuje, dlouhodobě zkoušet výpočetní server postavený na starší generaci serverových procesorů AMD Opteron 6272 (Bulldozer) a srovnával jsem samozřejmě výsledky se starým přetaktovaným Thubanem s taktem 3,63 GHz, který jsem měl v té době na svém počítači (vyšlo v magazínu Pixel). Výsledky byly velmi zajímavé, pokusil jsem se totiž odpovědět na otázku, nakolik může být takový výpočetní stroj výhodný. A výhodný by byl, ostatně, cena AMD je postavena podstatně níže než v případě Intelu a za cenu dobré jednoprocesorové stanice se dá postavit dvou procesorový stroj s 64 GB na RAM, profi kartou Firero (V4900), který má sice relativně nízký výkon per jádro (pracovní výkon v editoru), ale velmi dobý renderovací výkon a poměrně slušné provozní vlastnosti. Užití takové stanice by ale omezení de facto eliminovalo. Pamatoval jsem totiž stále na to, jaká situace například panuje v Newslabu, kde mimochodem pracuje dost mých bývalých studentů.
Abych ideu popsal. Ve zmíněné společnosti, a určitě i jinde, bylo několik „operátorů“ (jsou určitě kreativnější než pozice, která se pod tímto označením skrývá, berte označení s rezervou) a tím pádem i licencí. Samozřejmě se dal využívat i Net Render, ale celkově vše bylo postavené tak, že pracovní stanice nebyly apriori těmi, které byly i stanicemi výpočetními. K tomu sloužil jeden mimo umístění PowerMac (stanice) s dvěmi procesory s mnoha jádry, na který se vše pouštělo pomocí Net Renderu. To bylo dost výhodné, protože většinou se samozřejmě nerenderovalo více zakázek najednou a tak pro „operátory“ stačily i méně výkonné stanice, mající jiné zaměření (lepší GPU pro rychlejší OpenGL, vyšší výkon per jedno jádro a podobně.
Ve svém testu jsem se tedy zaměřil na běžné užití stroje jako výpočetní stanice a přišel jsem na zajímavou věc, kterou ale šlo předpokládat. A to, že od doby R11,5 se toho opravdu hodně změnilo. A výkonostní poměry, které vyplývají z testu Cinebench R11,5 nejsou skoro vůbec podobné tomu, jaké výsledky dosáhneme, pokud použijeme modernější technologie, zejména fyzikální kameru+engine CINEMY 4D. Je evidentní, že nové technologie, lepší využití více jader a podobně do značné míry znevěrohodňuje celý Cinebench.
Dnešní článek ještě více rozvine danou úvahu, protože jsem se konečně dostal k tomu, abych vyzkoušel na své stanici novější procesor AMD s označením FX 8350 (daná řada je označovaná jako Pilledriver) poskytnutý pro tyto účely společností Asbis (děkuji za zápůjčku). Mimochodem, podle mého názoru vynikající procesor. Proč?
Vsuvka o procesoru FX 8350 a berte to jako předfilm :-)
Určitě si to ještě shrneme a omlouvám se za vsuvku. Článek ale také můžete brát součastně jako uživatelskou recenzi tohoto procesoru a to jakkoliv je dnešní článek o poněkud něčem jiném, z výsledků bude potenciál procesoru velmi dobře patrný. Podstatné kritérium, a to asi u všeho, je výkon/kontra cena. Nikdo netvrdí, že nejsou nové Intely i7 (IB) výkonnější, ale jsou také výrazně dražší a jejich výkon v případě zejména unbias řešení a OpenCL zdaleka neodpovídá vyšší ceně (proti AMD). V této oblasti, tedy tam kde se orpavdu využije potenciál 8 jader (nebo čtyř modulů, jak chcete) využije, si vede AMD opravdu velmi dobře. Článek doplníme o informace testů z webu, abychom si vše samozřejmě zdůvodnili.
Mám tedy pocit, že AMD má v mainstreamu co nabídnout. Cena srovnatelná s i5 konkurence, ale výkon často atakuje i7 a při mírném přetaktování (což lze u levného řešení skoro očekávat) ji víceméně dorovnává. Jinými slovy, za relativně méně peněz dost muziky.
Nevýhody těchto procesorů jsou podobné jako v případě Opteronů. Tedy primárně to, že je nižší výkon per jedno jádro. To se může odrazit na hrách (jakkoli ty už více závisí na GPU), což pro nás není podstatné. Ani si nepamatuji kdy jsem hrál něco naposledy.
Primární ale může být úroveň efektivity práce v editoru, kdy i5 může mít výkon na jedno jádro v CB (a jednu jádru v CB poměrně věřím) okolo 1,5–1,6 proti hodnotě 1,15, kterou mám u lehce přetaktovaného FX 8350. Pro zajímavost přikládám níže screen také výkonu Quadra 4000 při vyšší vyšším výkonu procesoru na jedno jádro proti staršímu Thubanu 1100 s taktem 3,63.
Zvýšení výkonu na jedno jádro se projevilo také ve zrychlení Quadra, sice jen o 1 fps, ale zkoušel jsem test několikrát (a to kdysi i na Thubanu) a rychlost nikdy neklesla, jinými slovy, potvrzuje se to, že vyšší výkon jednoho jádra má vliv na rychlost zobrazení editoru.
Jen pro úplnost, provoz FX 8350 není vůbec špatný, bez zátěže stroj běží (specifikace viz níže) na 120 W, při plné zátěži cca 300 W (4 minuty běžící Frybench). Starý Thuban si při stejné konfiguraci řekl o 100 W více. Poměrně dost si i bez zátěže bere Fermi Quadro 4000 (i bez zátěže je teplota cca 80–85 stupňů a něco to chladit musí), tekže celkově je pro mne reálné chování slušné. Pravda, Intel je v tomto smyslu s 22 nm technologií proti 32 AMD jednoznačně úspornější.
Konec předfilmu, začíná hlavní program
Testy:
Připravil jsem si pro vás tedy několik testů a pokud mohu, také několik informací z webu, které by vše měly doplnit (některé komparační testy jednoduše nemám na Thubanu zpracované a tak by nebylo srovnání relevantní).
K dispozici tedy máme následující:
Cinebench 11,5 Multithreading
Cinebench 11,5 Single core
Cinebench 11,5 OpenGL (pro zajímavost)
Scéna CINEMA 4D R14 fyzikání engine a efekt okolní prostředí
Scéna CINEMA 4D R14 fyzikání engine a efekt globální iluminace v režimu QMC+rad. maps
MentalRay, respektive Iray, unbias rendering (CPU pouze)
Frybench (Fryrender)
Článek bych rád doplnil o informace o dalších renderovacích systémech, zejména LuxMark (výsledek z Opteronů mám vlastní – Sala 647, Room 242, ostatní jsou z webu). A snad jen osobní zkušenost z porovnání Indigo rendereru při stejné GPU ale rozdíleném CPU na stejném počítači, jen jiném CPU (subjektivní, nikoliv exaktní, názor).
Obecně, článek se nesnaží být standardním testem hardware, ale spíše kritickým zamyšlením nad vypovídací hodnotou daného testovacího systému. Ostatně, stroj je v provozu rok a půl při stále stejné instalaci operačního systému, na pozadí běží množství drobných aplikací, které obhospodařují periferie (například grafický tablet Wacom, mikrofon, externí disk, UPS Eaton) a podobně... To také o něčem vypovídá.
Hardware
Thuban 1100 OC na 3,63 GHz
MB Asus CROSSHAIR V Formula - 990FX
CPU AMD Phenom II X6 1100T
RAM Patriot Viper II (Sector 5) 4x4GB DDR3 2000MHz (16GB)
Zdroj CORSAIR 750AX, 750W (Gold)
CASE CoolerMaster HAF 932
GPU NVidia Quadro 4000
Primární panel NEC PA 241W (displayport)
Sekundární panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit
2x Opteron 6272 2,1 GHz (Prestigio 4U GPU server)
MB: MBD-H8DGI-F-O - SUPERMICRO MB 2x Socket G34
CPU: 2x AMD Opteron 6272 (socket G34, 2.1 GHz, 16 jader)
Skříň: CSE-745TQ-R920B - SUPERMICRO Tower/4U,
RAM: 8x-Kingston 8 GB 1600 MHz DDR3
Grafická karta: FirePro V4900
Panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit
Pilledriver FX8350 OC na 4,4 GHz
MB Asus CROSSHAIR V Formula - 990FX
CPU AFX8350 4,4 GHz (nativně 4,0 GHz)
RAM Patriot Viper II (Sector 5) 4x4GB DDR3 2000MHz (16GB)
Zdroj CORSAIR 750AX, 750W (Gold)
CASE CoolerMaster HAF 932
GPU NVidia Quadro 4000
Primární panel NEC PA 241W (displayport)
Sekundární panel EIZO FlexScan S1961 (DVI-D)
Systém Win 7 64 bit
Cinebench 11,5
Cinebench, to je oč tu běží. Pro nás jsou níže uvedené hodnoty etalonem, zejména v oblasti MT, protože v SC je sice podle mého CB velmi přesný, ale srovnáváme nesrovnatelné. Primární je, ostatně to už víme, ukázat, že nové technologie mají odlišný výkonový poměr proti starším procesorům a více vláken tak může být vyšším přínosem, než se na první pohled zdá (míním tím nyní FX 8350, Opterony jsou zde jen pro zajímavost). Pokud by ty někoho zajímaly, doporučuji současné vydání magazínu Pixel (01/2013) kde jsou rozebrány podrobněji.
Výsledky:
Opteron 6272x multicores: 13,51 (1/13,51=0,074)
Opteron 6272x single core: 0,72
Thuban 1100 3,63 GHz multicore: 6,37 (1/6,37= 0,157)
Thuban 1100 3,63 GHz single core: 1,09¨
FX 8350 4,4 GHz multicore: 7,52 (1/7,52=0,133)
FX 8350 4,4 GHz single core: 1,15
Co si z výsledků odnést? Jelikož se jedná o etalon, tak jen poměry. A v tomto smětu poměry rychlosti, tedy musíme si vše převést. Celkový nejdelší čas je 100 %, což je výsledek přetaktovaného Thubanu. Další dva jsou rychlejší a proto je čas kratší – nižší je i hodnota procentuální.
Pokud je tedy výsledek Thubanu 100 % (nejdelší čas), pak je:
Thuban 1100: 100 %
Zrychlení proti referenci: 0 %
FX 8350: 84,7
Zrychlení proti referenci: 15,3 %
2x Opterony 6272 47,1 %
Zrychlení proti referenci: 52,9 %
Zkusme si tyto hodnoty zapamatovat, nadále budeme už rovnou porovnávat časy a určitě bude zajímavé porovnávat jendotlivé řádky.
CINEMA 4D R14, fyzikální engine, efekt AO, adaptivní výpočet
Opteron 6272x2: 00:09:15 (545 s)
FX 8350 4,4 GHz: 00:16:18 (978)
Thuban 1100 3,63 GHz: 00:23:39 (1419 s)
Thuban 1100: 100%
Zrychlení proti referenci: 0%
FX 8350: 68,9
Zrychlení proti referenci: 31,1 %
2x Opterony 6272 38,4
Zrychlení proti referenci: 61,6 %
Všimněte si, pokud byl FX 8350 s maximálním taktem 4,4 rychlejší v CB 11,5 o cca 15 %, tedy namísto, aby se něco počítalo 100 vteřin, by se úloha počítala 85 vteřin, pak v případě tohoto testu, použité technologie a scény je poměr odlišný. Namísto oněch 85 % (anebo vteřin jako v příkladu) by se úloha počítala cca 69 vteřin, tedy zrychlení je proti výsledku CB FX 8350 o 16 %! Celkově o 31 %! A to není vůbec málo!
Velmi podobný výsledek se udál v případě Opteronů. I když není rozdíl až tak dramatický (délka výpočtu 47,1 % v CB, 38,4 % v příkladu). Je tomu tak možná proto, že Bulldozery měly nižší hodnotu násobení výkonu per jádro (jádra Vishera – tedy Pilledrivery mají tuto hodntou vyšší a tím pádem lze předpokládat vyšší účinnost i MT výpočtů). Přesto i zde lze pochybovat o vypovídací hodnotě CB v případě fyz. engine CINEMY 4D.
CINEMA 4D R14, fyzikální engine + QMC + radiosity maps
Thuban 1100 3,63 GHz: 00:12:14 (734 s)
FX 8350 4,4 GHz: 00:08:32 (512 s)
Opteron 6272x2: 00:04:57 (297 s)
Thuban 1100: 100 %
Zrychlení proti referenci: 0 %
FX 8350: 69,75 %
Zrychlení proti referenci: 30,25 %
2xOpterony 6272: 40,46 %
Zrychlení proti referenci: 59,54 %
A budeme se opakovat, protože výsledek jako by z oka vypadl příkladu s efektem AO. Otázkou je, zda není mírně nižší poměr dán tím, že je tento výpočet přeci jen v jistém smyslu rozškálován na více postupně zpracovávaných úloh (spekulace), tedy qmc, mapy radiozity, fyz. engine. Jinak jsou výsledky velmi podobné. FX 8350 s taktem 4,4 GHz zkrátil čas proti referenčnímu Thubanu o 30 % (proti 15 v CB). Výsledek je tedy opravdu velmi podobný jako v předchozím případě.
A Opterony? Podobné, nedosáhly sice hodnoty pod 40 % původního referenčního času, ale cca 40,5 je opět velmi blízko. Zdá se, že fyz. engine má opravdu své vlastní poměry výkonnů...
Iray (Mental Ray) for CINEMA 4D
Thuban 1100 3,63 GHz: 00:06:44 (404 s)
FX 8350 4,4 GHz: 00:05:56 (356 s)
Opteron 6272x2: 00:03:08 (188 s)
Thuban 1100: 100 %
Zrychlení proti referenci: 0 %
FX 8350: 88,1 %
Zrychlení proti referenci: 11,9 %
2xOpterony 6272: 46,5 %
Zrychlení proti referenci: 53,5 %
Iray je tuším první unbias engine na GPU a určitě první který uměl kombinovat výkon CPU+GPU. Má to ale své stinné stránky. Mezi jinými to, že je to v jádře poměrně stará technologie a není (prý) ideálně optimalizovaná pro dnešní CPU. Co na to náš test?
Výsledek je velmi zajímavý a vlastně se (zhruba, nikoli zcela přesně) kryje s výsledkem, který nám poskytla scéna v Cinebench 11,5. Mou osobní spekulací je, že je to dáno právě datem zrození jádra Iraye. Myslím, že Iray je opravdu skvěle skrze Mental Ray implementován.
Frybench
Opteron 6272x2: 00:02:45 (165 s)
Thuban 1100 3,63 GHz: 00:07:00 (420 s)
FX 8350 4,4 GHz: 00:04:52 (292 s)
Thuban 1100 100 %
Zrychlení proti referenci: 0
FX 8350 69,5 %
Zrychlení proti referenci: 30,5
2x Opterony 6272 39,3 %
Zrychlení proti referenci: 61,7 %
Frybench, což je vlastně benchmark vzniklý z Fryrendereru, dnes zmutovaného do hybridního Arionu. Ve své době ale byl Fryrender spolu s Maxwellem (ten jako první) průkopníky v oblasti Unbias řešení a dodnes je bráno rozhraní Arionu jako jedno z nejlepších. Žel Arion šel zvláštní cestou, kdy ostatní se snaží o co nejširší porty, Arion si vybral dva produkty Autodesku a snad i Rhino a to je zatím vše.
Zpět k testu. Test jsem odečítal nikoli jako celkový výpočet, ale výpočet po „warmingu“ (což je samotný test). Obecně vzato ale uživatele zajímá i doba exportu scény, i když je pravda, že čím je scéna komplexnější a zabere v unbias více času, tím menší vliv tento „export“ má. Na druhou stranu se v něm projevuje případně nižší výkon per jádro.
Ale, Randomcontrol unbias prostě umí, a tak se zdá, že i Fry uměl vytáhnout z CPU jeho potenciál. A výsledek? Podobné poměry, vlastně shodné, jaké jsou v případě fyzikálního enginu CINEMY 4D.
FX8350 zkrátil čas z etalonu o 30,5 % (v případě fyzikálního enginu CINEMY 4D to bylo 30,25 % a 31,1 % ), dva opterony odečetly dokonce 61,7 %, což je opět podobné jako v případě C4D phy. enginu (61,6 a 59,54).
Závěrem šetření
Tři rendery ze CINEMY 4D, respektive jeden z Cinebenche 11,5 a dva z CINEMY 4D R14 s využitím phy. enginu a efektů globální iluminace (QMC + rad. maps) a druhý s efektem okolní prostředí. Dva unbias systémy, jeden technicky starší, průkopnický, druhý ve vrcholu před změnou strategie. Výsledek šetření je podle mého docela jasný.
Pokud používáte fyzikální engine, a musím přiznat že vlastně jiný osobně nepoužívám (standardní engine používám jen v případě speciálních simulací (Hair) a nebo požadavků), pak není výsledek Cinebenche 11,5 vůbec relevantní. Zdá se mi, že pokud bychom se řídili spíše výsledky Frybenche, měli bychom podstatně relevantnější data.
Pojďme se tedy podívat na výsledky Frybenche z našich českých luhů a hájů.
Z pohledu FX 8350
Pokud mohu, vypůjčíme si výsledky ze serveru www.extrahardware.cz. Zde před několika týdny vyšla recenze na i7 3770 a mimo jiné zde najdeme i mou osobou použitý FX 8350, máme tedy srování. Jen podotýkám, délky času (ve vteřinách) jsou v případě Fry určitě bez warmingu (čistý výpočet).
Odkaz na web extrahardware.cnews.cz.
Pokud odsouhlasíme, že Frybench je výkonnostně podstatně bližší samotné CINEMĚ 4D fyzikálnímu enginu, pak FX 8350 vychází dalece před cenově konkurenční i5 a atakuje (velmi blízce) i7 3820 i i7 3770. V případě mém, při přetaktování na 4,4 GHz je již rozdíl proti zmíněným nepřetaktovaným i7 minimální, ba se vměstná mezi ně (292 vteřin pro FX 8350 s 4,4 GHz kontra i7 3820 s 304 sekundami a i7 3770 s 281 sekundami). Tím samozřejmě netvrdím, že nelze i7 přetaktovat. Naznačit chci pouze, že potenciál procesoru, v tomto případě AMD FX 8350, může být v konkrétním případě zcela odlišný od toho, co jeden benchmark (Cinebench), a to i přesto že je i mně osobně tak blízký, říká...
Mimochodem, ani v OpenCL si nevede toto AMD vůbec špatně... A když jsme u toho, zcela subjektivně mám pocit, že podobné zrychlení, jaké dává tušit FryRender poskytuje i Indigo renderer, bohužel jsem neměl scénu, se kterou bych mohl vše komparovat (respektive měl, ale nomohu ji publikovat).
Celkový závěr
Pokud si porovnám data která jsem si postupně sebral, a uznávám že to jsou data pohříchu pouze z procesorů AMD (mám podobná i na i7 3610QM, ale porovnávat tento mobilní segment s desktopem jednoduše nejde), musíme se při koupi hardware vždy zaměřit na to, co budeme vlastně používat a jakého stáří daná technologie je. Cinebench 11,5 vycházející z CINEMY R11,5 je toho jednoznačně důkazem. Z pohledu R11,5 FX 8350 nevychází zle, ale není to převratné, v unbias opencl (viz odkaz), fyzikální engine CINEMY 4D je ale situace dosti odlišná.
Jsem špatným evangelistou. Ale jsem upřímný k uživatelům. Pro mne osobně má Frybench větší vypovídací hodnotu než Cinebench 11,5. Ten je relevantní (ale také ne zcela, protože i v oblasti standardního enginu jsou již implementované optimalizace, které pracují pro vyšší počet jader a podobně) jen pro standardní engine.
Zapůjčeno od Asbisu.
Pavel Zoch, Ph.D.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Obsah seriálu (více o seriálu):
- CINEMA 4D R14, nové funkce – rozhraní a workflow (1)
- CINEMA 4D R14: nové funkce (02) – kalibrace kamery
- CINEMA 4D R14, nové funkce (03) – Kompozice a Morf kamery
- CINEMA 4D R14, nové funkce (04) – Kamera v pohybu
- CINEMA 4D R14, nové funkce (05) – pracovní roviny
- CINEMA 4D R14, nové funkce (06) – přichytávání a vodítka
- CINEMA 4D R14, nové funkce (07) – dřevo
- CINEMA 4D R14, nové funkce (08) – shadery Normalizer a Zvětrání
- CINEMA 4D R14, nové funkce (09) – Aerodynamika
- CINEMA 4D R14 – Pluginy
- Roadshow o 3D grafice/CINEMA Days 2012
- CINEMA 4D – simulace tepelné výměny
- IRay pro CINEMU 4D – kontakt navázán...
- CINEMA 4D Net Render – aneb jak si ušetřit čas
- Obalový design v CINEMĚ 4D – pytlíček na bonbony od A do animace (02)
- CINEMA 4D R14, sculpting (1)
- CINEMA 4D R14, sculpting (2)
- CINEMA 4D R 14 – a ještě jednou sculpting
- Cinebench 11,5 – na hranici, s kacířem! Zhodnocení benchmarku z pohledu dneška...
- CINEMA 4D R14, kaustika
- CINEMA 4D R14 – globální iluminace
- CINEMA 4D R14, globální iluminace
- CINEMA 4D R14 – globální iluminace a osvětlení interiéru
- OctaneRender pro CINEMU 4D ohlášen!
- MAXON ohlašuje strategickou alianci s Adobe
- CINEMA 4D a Cindigo – integrace unbias renderovacího enginu Indigo
- CINEMA 4D a Cindigo – některé tipy, které by se mohly hodit
- Mograph, Metaball, Thinking particles a Pyrocluster – a máme pěkné mraky...
- MoGraph, asi to nejlepší, co nám CINEMA 4D nabízí a nedestruktivní modelování
- CINEMA 4D R15, evoluce – rychlý přehled, oblast výpočtů (01)
- CINEMA 4D R15, evoluce – rychlý přehled, modeling
- CINEMA 4D R15, evoluce – rychlý přehled, sculpting
- CINEMA 4D R15, technický sculpting
- CINEMA 4D R15 – úvod do scriptování
- MAXON CINEBENCH R15 je k okamžité dispozici + pozvánka na konferenci
- Ultimativní CUDA computing, speciální stanice pro CINEMU 4D a IRay
-
14. května 2014
Jak vkládat snímky do galerií a soutěží? Stručný obrazový průvodce
-
2. února 2012
-
23. dubna 2014
Konica Minolta přenesla výhody velkých zařízení do kompaktních modelů
-
12. června 2012
-
9. dubna 2014
-
30. listopadu 2014
Nový fotoaparát α7 II: první plnoformát s pětiosou optickou stabilizací obrazu na světě
-
15. prosince 2014
Konica Minolta pomůže živnostenským úřadům s digitalizací dokumentů
-
11. května 2014
-
26. listopadu 2014
Canon Junior Awards již posedmé ocení mladé fotografy v rámci Czech Press Photo
-
21. srpna 2014