AMD Epyc 9004 Genoa met 96 Zen 4-kernen in de test

Marco den Teuling
1

Inhoudsopgave

    Niets is krachtiger dan veel cpu-kernen, behalve dan nog meer cpu-kernen. Dat lijkt het motto van AMD te zijn bij zijn 400-watt-superprocessor voor servers. Die breekt records qua rekenprestaties en efficiëntie met de Amd Epyc 9004 Genoa.

    AMD Epyc 9004

    AMD Epyc 9004-serie specificaties

    Chipmaker AMD heeft details bekendgemaakt over zijn nieuwe Epyc 9004-processors, die bedoeld zijn voor gebruik in servers. De Epyc 9004-serie, die de vierde generatie van de Epyc-lijn vormt, maakt gebruik van de Zen 4-architectuur en biedt ondersteuning voor DDR5-RAM. Het nieuwe platform is ook voorzien van de SP5-socket, in tegenstelling tot de vorige drie generaties Epyc-processors, die waren ontworpen voor de SP4-versie.

    Nieuwe SP5-socket en DDR5-RAM

    Met de Epyc 9004 maakt AMD de overstap van DDR4- naar DDR5-RAM. De nieuwe processorsocket SP5 is vergelijkbaar met de AM5-socket die wordt gebruikt voor de Ryzen 7000-processors voor desktop-pc’s. De vorige drie generaties Epyc-processors waren ontworpen voor de SP4-versie met acht DDR4-geheugenkanalen. De Epyc 9004 ondersteunt nu DDR5-RAM.

    Zen 4-architectuur en grotere L2-caches

    De Epyc 9004 bevat cpu-kernen van de Zen 4-generatie, die verbeterd zijn ten opzichte van Zen 3. Door de kleinere fabricagetechnologie (TSMC N5 in plaats van N7) zijn er twee keer zo grote L2-caches: 1 MB per kern in plaats van 0,5 MB tot nu toe. De L3-cache blijft op 32 MB per acht kernen, die samen in een Core Complex Die (CCD) zitten. AMD heeft talrijke details van de kernen verbeterd.

    Verbeterde prestaties voor servergebruik

    Vooral belangrijk voor servergebruik: net als Intels Xeons verwerken de Zen 4-kernen nu AVX 512-instructies, evenals Vector Neural Network Instructions (VNNI) en het BFloat16-gegevensformaat (BF16) voor AI-algoritmen. Terwijl de krachtigste Xeons (maar niet alle) elk twee AVX-512 rekeneenheden per cpu-kern hebben, verbindt AMD twee AVX2-eenheden voor AVX-512. De verbeterde Zen 4-kernen verrichten meer rekenwerk per klokcyclus dan hun voorgangers: ze voeren meer instructies uit per cyclus (IPC). AMD schat de verbetering op ongeveer 14 procent, afhankelijk van de code.

    Hogere kloksnelheden en meer cores

    De Zen 4-kernen klokken ook hoger. In vergelijking met de 64-core Epyc 7763 heeft de Epyc 9554 een basiskloksnelheid van 3,1 GHz, ongeveer 25 procent hoger dan de 2,45 GHz van zijn Zen 3-voorganger. In Turbo is het voordeel nog steeds 7 procent (3,75 in plaats van 3,50 GHz). De Epyc 9554 verbruikt echter ook 28 procent meer energie onder belasting (360 in plaats van 280 watt TDP). De Epyc 9534, ook met 64 kernen en 280 watt, klokt alleen iets hoger in Turbo in vergelijking met de 7763. Uitschieter is vooral het nieuwe topmodel Epyc 9654, dat 50 procent meer cores heeft dan de Epyc 7763, omdat AMD in plaats van maximaal acht CCD’s met elk acht cores, er tot twaalf op de processor propt. Zoals voorheen zijn de CCD’s gekoppeld aan een extra I/O-die (IOD) via Infinity Fabric.

    AMD Epyc 9004 Genoa IOD

    Advanced Micro Devices (AMD) heeft aangekondigd dat het de nieuwe Epyc-processors zal voorzien van de Genoa Input/Output Die (IOD) die gebruik maakt van de nieuwste 6-nanometer fabricagetechnologie van TSMC. De IOD van oudere Epycs maakt nog gebruik van de 12-nanometer technologie. De Genoa IOD is ontworpen om hogere datatransfersnelheden te bieden naar RAM- en PCIe-randapparatuur en om meer en snellere Infinity Fabric verbindingen te ondersteunen voor de twaalf CCD’s.

    Meer en snellere Infinity Fabric verbindingen

    De Genoa IOD biedt niet alleen meer, maar ook snellere Infinity Fabric verbindingen voor de twaalf CCD’s, waardoor een efficiëntere communicatie tussen de cores mogelijk wordt gemaakt.

    Hogere datatransfersnelheden naar RAM en PCIe randapparatuur

    Met de Genoa IOD zijn hogere gegevensoverdrachtsnelheden mogelijk naar zowel RAM- als PCIe-randapparatuur. In plaats van acht DDR4-3200 geheugenkanalen biedt de Genoa IOD nu twaalf kanalen voor DDR5-4800, waardoor de gegevensoverdrachtsnelheid met 125% toeneemt van 204 GB/s naar 460 GB/s. Het aantal PCIe-lanes blijft gelijk op 128, maar dankzij PCIe 5.0 werken ze nu twee keer zo snel als voorheen, namelijk met 32 gigatransfers per seconde. Dit betekent dat een Epyc 9004 ongeveer een halve terabyte per seconde via zijn PCIe-lanes kan verwerken.

    Compute Express Link (CXL) technologie

    Een belangrijke vernieuwing van de Genoa IOD is de ondersteuning voor Compute Express Link (CXL) technologie. Dit maakt een cache-coherente koppeling van rekenversnellers mogelijk, waardoor de efficiëntie wordt verhoogd en gegevens minder vaak heen en weer hoeven te worden gekopieerd. Bovendien maakt CXL het mogelijk om extra DRAM-modules aan te sluiten, evenals supersnelle ssd’s met speciale functies, zoals Storage Class Memory (SCM) en Computational Storage.

    SP5-platform

    De SP5-serverborden hebben 14 of 16 lagen om de talrijke lijnen voor hoogfrequente signalen netjes te kunnen geleiden. Het uitgebreide en relatief dure SP5-platform is vooral aantrekkelijk voor hyperscale datacenters, databaseservers, AI en high-performance computing. AMD blijft daarom de Epyc 7003(X) verkopen voor het beproefde SP4-platform. Later komen er nog afgeslankte en goedkopere Zen 4 Epycs voor algemene servers.

    AMD Epyc 9004 in de test

    AMD stuurde ons de referentieserver ‘Titanite’ van Quanta met twee Epyc 9654-processors en 1,5 TB DDR5 RAM. We voerden enkele metingen uit en bevestigden de beloofde prestaties van AMD.

    Configureerbare TDP voor maximale energieverbruik

    Met de configureerbare TDP (cTDP) kan het maximale energieverbruik van de Epyc 9654 tussen 320 en 400 watt worden ingesteld. Echter, clouddatacenter-exploitanten willen vooral zoveel mogelijk prestaties uit de processors persen en daarom werden de Epycs in het testsysteem geconfigureerd op 400 watt.

    Gigantische heatpipe-processorkoelers en krachtige ventilatoren

    De gigantische heatpipe-processorkoelers in de Titanite-server vallen op, die elk 400 watt restwarmte moeten afvoeren. Een batterij krachtige ventilatoren perst koele lucht door de minder dan 10 centimeter platte rackserver. De ventilatoren draaien met tot 20.000 toeren en maken dan veel geluid.

    Hoge energieverbruik van de Epyc 9654

    In de Torture-test van Prime95 (mprime -m) verbruikte de server bijna 1150 watt, in de andere benchmarks was dat 890 tot 990 watt. In idle was het net geen 170 watt, terwijl slechts één M.2-ssd geïnstalleerd was.

    Ondanks het hoge energieverbruik rekent de Epyc 9654 efficiënter dan zijn voorganger en vooral dan de Xeon Platinum 8380. De voorsprong qua prestaties en efficiëntie hangt af van de software.

    Voorsprong qua prestaties en efficiëntie

    In de SPEC CPU 2017 benchmark-suite, die sterk geoptimaliseerde code meet, draait de Epyc 9654 circa 80 tot 90 procent sneller dan de Epyc 7763 en 130 tot 170 procent sneller dan de Xeon. Hij is ongeveer 30 procent efficiënter dan zijn voorganger en 57 tot 88 procent efficiënter dan de Xeon.

    AMD Epyc 9004 Genoa serverprocessors

    AMD Epyc 9004 Genoa serverprocessors,

    GIGABYTE-servers met AMD EPYC 9004

    Al met al kunnen we vooropstellen dat de AMD Epyc 9004 de standaard zet voor x86-serverprocessors. Hij overklast de concurrentie op het gebied van prestaties en efficiëntie en brengt bovendien innovaties zoals DDR5, PCIe 5.0 en CXL. AMD vraagt een hoge prijs voor de geconcentreerde rekenkracht van de AMD Epyc 9004-cpu’s. Maar dat loont de moeite bij toepassingen die maximale prestaties vereisen.

    Voor dit nieuwe platform heeft GIGABYTE een nieuwe serie producten ontworpen die voorzien zijn van snelle PCIe Gen5-versnellers en die Gen5 NVMe-schijven ondersteunen, naast ondersteuning voor DDR5-geheugen.

    GIGABYTE R163-Z32

    GIGABYTE AMD EPYC 9004 R163-Z32

    De nieuwe 4e generatie AMD EPYC-processors bieden aanzienlijke rekenprestaties en schaalbaarheid door een hoge aantal processorkernen te combineren met indrukwekkende PCIe- en geheugen doorvoersnelheid. De EPYC 9004-cpu’s van AMD zijn terug te vinden in servermodellen van GIGABYTE, zoals de R163-Z32, die krachtige prestaties levert in netwerktoepassingen. Hij beschikt over een AMD EPYC 9004-cpu die 12 RDIMM DDR5 geheugenmodules over 12 kanalen kan aansturen. De R163-Z32 beschikt bovendien onder andere over twaalf 2,5″ Gen4 NVMe/SATA hot-swappable bays, twee FHHL PCIe Gen5 x16 slots en wordt gevoed door een dual 1300 watt 80 PLUS Platinum redundante voeding.

    GIGABYTE R283-Z96

    GIGABYTE AMD EPYC 9004 R283-Z96

    Het R283-Z96 2U-serversysteem biedt ruimte voor twee AMD EPYC 9004-cpu’s en 12-kanaals doorvoer voor maximaal 24 RDIMM DDR5 modules. Hij beschik onder andere over 24 2,5″ Gen5 NVMe hot-swappable bays en vier 2,5″ SATA hot-swappable bays aan de achterzijde. Twee 2000W 80 PLUS Platinum-gecertificeerde voedingen verzorgen het redundant powersupply.

    GIGABYTE R183-Z95

    GIGABYTE AMD EPYC 9004 R183-Z95

    De GIGABYTE R183-Z95 is een slankere 1U-variant die eveneens twee AMD EPYC 9004-cpu’s onderbrengt en 24 RDIMM DDR5-modules onderbrengt. De R183-Z95 beschikt echter over acht 2,5″ Gen5 NVMe/SATA hot-swappable bays en zes EDSFF E1.S hot-swappable bays. Hij heeft bovendien drie Ultra-Fast M.2 PCIe Gen3 interfaces, waar de R283 er twee heeft. Bovendien beschikt het 1U-model over twee FHHL PCIe Gen5 x16 uitbreidingssloten en twee OCP 3.0 Gen5 x16 mezzanine-sloten, waar het 2U-model er één heeft. De R183-Z95 beschikt over twee 1600W 80 PLUS Platinum-gecertificeerde redundant powersupply’s.

    GIGABYTE H273-Z82

    GIGABYTE AMD EPYC 9004 H273-Z82

    De H273-Z82 ondersteunt acht cpu’s met een 400W TDP. Daarvoor is de luchtstroom door enkele drive bays vergroot en is een van de twee low-profile slots verwijderd. Met deze opties in de H-serie kunnen gebruikers de ideale oplossing voor hun inzet kiezen. Deze High Density Server is geschikt voor met name inzet in hybride/private cloud toepassingen.

     

    Deel dit artikel

    Marco den Teuling
    Marco den TeulingHad als eerste eigen computer ooit een 16-bit systeem, waar van de 48 kilobyte toch echt niet ‘genoeg voor iedereen’ was. Sleutelt graag aan pc’s, van de hardware tot het uitpluizen van de BIOS-instellingen. Vindt ‘Software as a Service’ een onbedoeld ironische naamgeving.

    Lees ook

    Chat GPT gebruiken: dit kun je allemaal doen met de chatbot van OpenAI

    OpenAI heeft de ChatGPT-bot ontwikkeld als een taalmodel dat is getraind op een enorme hoeveelheid tekst op het internet. Je kunt ChatGPT gebruiken om...

    Raspberry Pi alternatieven: dit zijn vijf goede opties om te overwegen

    De constante populariteit van de Raspberry Pi heeft geleid tot een groeiende vraag naar alternatieven die meer prestaties bieden tegen een betaalbare ...

    1 Praat mee
    avatar
      Abonneer  
    nieuwsteoudste
    Laat het mij weten wanneer er
    Vince R
    Lezer
    Vince R

    Goed artikel, bedankt!