Souboj GIGAntů

1. 2. 2001

Sdílet

Nejžhavějšími novinkami v oblasti procesorů jsou v poslední době černé krabičkytikající nad hranicí 1 000 MHz. Měli jsme příležitost pozvat do našeho TestCentra závodníky ze stá...

Nejžhavějšími novinkami v oblasti procesorů jsou v poslední době černé krabičky
tikající nad hranicí 1 000 MHz. Měli jsme příležitost pozvat do našeho

TestCentra závodníky ze stájí Intelu i AMD. Natáhnuli jsme stopky, cílovou

pásku a pohodlně jsme se posadili na testovací lavičku. Jak to dopadlo, si

můžete přečíst i vy.



Intel Pentium 4 nejrychlejší představitel Intelu, zařazený do nové řady Pentium

4, vychází z architektury použité už v Pentiích III, avšak nové označení si

zasluhuje díky určitým rozšířením, které mají za účel připravit tento typ

procesorů na vysoké pracovní frekvence. Pod zastřešujícím názvem NetBurst se

skrývají technologie Hyper Pipelined Technology, Rapid Execution Engine a

Execution Trace Cache. Oživením je také sběrnice pracující na 400 MHz,

umožňující přenosové rychlosti až 3,2 Gb/s.



Hyper Pipelined Technology prodlužuje délku instrukčního pipelinu, resp.

zvyšuje počet jeho stupňů na 20. V procesoru tedy může být (teoreticky)

rozpracováno až 20 instrukcí naráz, čímž se snižuje šance, že některá z nich

nestihne být dokončena během celého průběhu exekučních sekcí v CPU. Bohužel s

prodlužující se délkou pipelinu přichází nazmar stále více výkonu, a to v

okamžiku, kdy technika předvídání skoků (branch prediction) selže a výsledek

větvení odhadne špatně. V takovém případě se zahazují veškeré výpočty a průběh

dalších instrukcí skrz procesor jde opět od začátku.



Pentium 4 používá pro tento případ inovovaný systém vyrovnávací paměti, v němž

se uchovají už dekódované instrukce pro případ, že by v krátké době byly ještě

potřeba, jak tomu často bývá právě po neúspěšném odhadu větvení. Inovací je

také zvýšení výkonu dvojice ALU, které by mělo také omezit problémy vzniklé

prodlouženým instrukčním pipelinem.



Multimediálním aplikacím pomůže též inovovaná instrukční sada SSE2. I když

poskytuje vyšší výkon, je třeba počkat, až bude plně podporována výrobci

softwaru, neboť jen na nich záleží, zda implementují kód využívající SSE2.



Na rozdíl od Pentia 4 jde Athlon zatím spíše cestou zvyšování hrubého výkonu,

což mu v testech paradoxně přináší výhody. AMD v Athlonu neprodloužilo délku

pipelinového řetězce, avšak zvýšilo superskalaritu použitím hned tří jednotek

pro práci s plovoucí čárkou. Tímto řešením Athlon velmi výrazně omezil problém

s nízkým výkonem jednotky FPU v předchozích verzích procesorů K6. Po třech jsou

v procesoru zastoupeny také jednotky ALU pro celočíselné operace a jednotky pro

počítání adres.



Protože ani Athlon není vnitřně čistý x86 procesor, i u něj instrukce musí

nejdříve procházet vícenásobným paralelním instrukčním dekodérem, zajišťujícím

jejich převod do rychlých MacroOPů, jež zpracovává jádro CPU.



Samozřejmostí se stalo předvídání větvení programů technikou Advanced Dynamic

Branch Prediction, a dostatek vyrovnávací paměti na čipu (celkem 384 KB).



Novinkou čipové sady AMD 760 je režim paměťových čipů DDR. Při něm probíhá

přístup do paměti při každém taktu ne jednou, jako je tomu u klasických SDRAM

pamětí, ale dvakrát, a to jak při náběžné tak i při sestupné hraně hodinového

taktu. Výsledkem je teoreticky dvojnásobná rychlost FSB a pamětí.



Jiný systém paměti zvolil i Intel pro Pentium 4, které využívá paměťových

modulů RDRAM, vyvíjených společností Rambus. Paměť Rambus pracuje na vysoké

frekvenci, avšak je konstruována zcela odlišně od SDRAM, což stejně jako u DDR

znamená nutnost použití odlišných základních desek.



Pro testy jsme měli k dispozici počítač s 1,2GHz procesorem Athlon, osazený

základní deskou AMD Corona s čipsetem AMD 760 a 256 MB paměti DDR SDRAM. Pro

tuto výkonnou sestavu jsme použili adekvátní grafickou kartu Creative 3D

Blaster GeForce2 Ultra se 64 MB paměti.



Proti němu stál počítač s 1,4GHz procesorem Pentium 4 se základní deskou Intel,

postavenou na čipové sadě I850 se 128 MB paměti RDRAM. Opět nechyběla grafická

karta Creative 3D Blaster GeForce2 Ultra 64 MB. Ještě připomínáme, že rozdíly

ve výkonu počítačů s pamětí o kapacitě 128 a 256 MB jsou na úrovni několika

málo procent, a proto je můžeme s klidným svědomím zanedbat.



V závodě, který za nás pod operačním systémem Windows 98 počítal testovací

software BAPCo SYSmark 2000, získalo Pentium 4 v celkovém indexu výsledek 167

bodů, zatímco Athlon odešel jako vítěz, když jeho index dosáhl hodnoty 226

bodů. SYSmark je komplexní test celého portfolia aplikací nejčastěji užívaných

na platformě Windows. Zahrnuje celkem 12 programů, mezi nimiž nechybí například

Adobe Photoshop, Corel Draw!, Adobe Premiere či renderovací Bryce 4. Z tohoto

důvodu je možné výsledky v BAPCo SYSmarku považovat za skutečně průkazné

porovnání aplikačního výkonu jednotlivých systémů.



Za zmínku rozhodně stojí, že jedinou aplikací ze skupiny testované

prostřednictvím SYSmarku, v níž Pentium 4 s přehledem poráží Athlon na

nominálně nižší frekvenci, je Windows Media Encoder. Výsledky v Photoshopu 5.5

se u obou procesorů liší o pouhá 3 procenta ve prospěch Pentia 4, a ve všech

zbylých programech vítězí Athlon. Rozdíly jsou skutečně vysoké, například v

Bryce 4 činí zhruba 50 %, v modelačním Elastic Reality kolem 45 % a v Corel

Draw! dokonce 70 %.



Příčin takovýchto výsledku je několik. K nejdůležitějším ale patří menší cache

v Pentiu 4 a celkově problematičtější práce s delším pipelinovým řetězcem.

Zároveň nesmíme zapomínat ani na to, že Athlon má silnější celočíselnou

jednotku a minimálně srovnatelnou jednotku FPU s Pentiem 4.



Oproti aplikačním benchmarkům jsou výsledky z herního Quake III Arena Dema

úspěchem především pro Pentium 4. Při rozlišení 640 × 480 bodů a 16bitové

barevné hloubce v normálním nastavení detailů je výkon Pentia 4 na hodnotě 199

fps, zatímco maximem Athlonu je za stejných podmínek pouze 157 fps. Při nízkém

rozlišení je počet snímků za vteřinu vyjádřením spíše managementu sběrnic

základní desky a procesoru, a v tomto případě je zřejmé, že Pentium 4 je na tom

o poznání lépe. Svou úlohu hraje také optimalizace Quake III pro instrukční

rozšíření SSE2.1 0001/BAM o





Za zapůjčení vzorků AMD a Intel děkujeme firmám AMD a LIBRA Electronics.