Home
Nieuws
HPE ProLiant DL380a-servers voor eigen generatieve AI

HPE ProLiant ML30 gen11; DL20 Gen11; Intel Xeon E-2400

HPE ProLiant DL380a-servers voor eigen generatieve AI

Blog Blog 23 januari 2024

Dit artikel is tot stand gekomen in samenwerking met onze partner HPE.

Hewlett Packard Enterprise heeft een nieuwe reeks AI-native- en hybrid cloud-aanbiedingen aangekondigd zoals de HPE ProLiant DL380a-server, die geschikt zijn voor machine learning-development, data-analyse, AI-geoptimaliseerde bestandsopslag, AI-tuning en -inferencing, en professionele diensten. Dankzij deze oplossingen biedt HPE organisaties de mogelijkheid om generatieve AI mogelijkheden optimaal in te zetten.

HPE biedt dit op basis van een open, full-stack AI-native architectuur die een uitgekiende mix van software en infrastructuur bevat die speciaal is ontworpen om de AI-levenscyclus te versnellen. Het nieuwe aanbod verlaagt de barrières van IT en levert AI-native oplossingen waarmee organisaties hun AI-modellen effectief kunnen trainen, tunen en inferencen, van edge tot cloud.

AI in het kort

De basis van artificiële intelligentie, oftewel AI, kun je opdelen in de volgende lagen:

kunstmatige intelligentie: elke techniek die een machine in staat stelt om een taak op een mensachtige manier op te lossen.
machine learning: algoritmen waarmee computers kunnen leren van voorbeelden zonder geprogrammeerd te zijn.
kunstmatige neurale netwerken: op de hersenen geïnspireerde modellen voor machine learning.
deep learning: het gebruik van diepe kunstmatige neurale netwerken als modellen, waarbij automatisch een hiërarchie van gegevensrepresentaties wordt opgebouwd.

Dit zijn de basisbouwstenen van AI, maar er zijn vele manieren om AI op te bouwen en talloze modellen om een bepaald resultaat te bereiken. De AI die in de afgelopen tijd op iedereens lip ligt, is Generatieve AI.

Generatieve AI

Generatieve AI is de manier waarop machines digitale resultaten creëren. Generatieve AI creëert tekst, afbeeldingen en andere media door de patronen van de invoer te analyseren en te leren om nieuwe gegevens te genereren met behulp van een generatief model. De nieuwste versies hiervan maken uitgebreid gebruik van Large Language Models (LLM’s) die, eenvoudig gezegd, ‘volgende woord voorspellers’ zijn. Ze nemen elk woord van de vraag als invoer en vinden dan het meest waarschijnlijke volgende woord. Vervolgens herhalen ze dit proces, waarbij ze één woord per keer genereren. Daarbij voorspellen ze meerdere woorden (een ‘Beam Search’ genoemd) en beslissen dan welk woord het meest geschikt is – om te voorkomen dat ze zichzelf herhalen.

LLM’s zijn beperkt in het aantal woorden waarmee ze kunnen werken, dus korten ze het in. Het is moeilijk om te zeggen tot hoeveel woorden, omdat elk woord, interpunctie of soms een spatie of individueel teken wordt omgezet in een of meer zogenaamde ‘tokens’ met een verhouding van ruwweg 1 token tot ¾ van een woord. Veel LLM’s zijn beperkt tot 4096 tokens, maar de grootste modellen bereiken (momenteel) een maximum van 32.768 tokens (deze limiet wordt steeds verder opgeschroefd, met voorbeeldmodellen die zelfs 128k tokens halen).

Het populairste LLM is de Generative Pre-Trained Transformer (GPT), die in 2017 werd bedacht door onderzoekers van Google, maar pas in 2018 generatief werd. Sindsdien heeft er veel ontwikkeling plaatsgevonden om ons op het punt te krijgen waar GPT-gebaseerde LLM’s veel creatieve stijltaken aankunnen. Ze kunnen meer dan alleen tekst creëren, ze kunnen worden gebruikt om code te genereren, sentiment te analyseren, tekst te classificeren, te vertalen, er in te zoeken en specifieke gegevens te extraheren.

Waar het echt interessant begint te worden, is dat LLM’s multimodaal worden, waarbij ze content in meerdere mediavormen begrijpen en genereren, zoals tekst, afbeeldingen, audio en video. Deze evolutie gaat verder dan het aanvankelijk genereren van tekst, wat natuurlijk meer verwerkingskracht, opslag in datacentra en energie vereist.

Rekenkracht

Bij organisaties die gebruik maken van LLM’s neemt de rekencapaciteit snel toe tot de niveaus die je een paar jaar geleden alleen bij supercomputers zag. Generatieve AI workloads zijn rekenintensief en vereisen de mogelijkheid om enorme hoeveelheden data efficiënt te verwerken.

Hewlett Packard Enterprise zet bij zijn aanbod in 2024 vol in op AI. HPE wil zijn generatieve AI-modellen beschikbaar stellen voor bedrijven zonder eigen capaciteiten voor AI-workloads. Daartoe biedt het bedrijf een combinatie van de verschillende diensten uit zijn portfolio als start-up en operator support, en voorziet zijn servers met rekenkracht van Nvidia.

Daarom biedt HPE GreenLake for LLM’s, een on-demand cloudservice, die de kracht biedt om grootschalige, nauwkeurige AI-modellen te trainen, af te stemmen en in te zetten. Dit versnelt de reis van proof of concept naar daadwerkelijke productie, waarbij workloads die normaal weken van normale resources vergen, binnen enkele dagen of zelfs uren worden voltooid. HPE GreenLake for LLM’s draait tevens voor bijna 100% op hernieuwbare energie.

Met zijn GreenLake-platform biedt HPE een hybride cloud-aanpak die alle data van een bedrijf samenbrengt – een edge-to-cloud oplossing – en deze zogenaamde ‘data fabric’ gebruikt voor AI-training. En omdat dit uiteindelijk ook gegevens uit on-premises-omgevingen en private clouds kunnen zijn, kunnen klanten gevoelige data binnen hun eigen beheer houden.

Bedrijfsgegevens die noodzakelijk zijn voor de eigen generatieve AI-toepassingen mogen natuurlijk niet in publieke clouds terechtkomen. HPE zet daarom in op deze hybride oplossingen door serverracks direct aan bedrijven te leveren en vervolgens ondersteuning te bieden bij de ontwikkeling van modellen en zijn softwarestack als een service – hiermee komt HPE met name tegemoet aan de wensen van Europese klanten.

Hybride cloud

“Met de opkomst van GenAI realiseren bedrijven zich snel dat de gegevens- en rekenvereisten om AI-modellen effectief te laten werken een fundamenteel andere benadering van technologie vereisen”, aldus Antonio Neri, CEO van HPE. Hij gaat ervan uit dat elk bedrijf in de toekomst minstens één toepassing zal hebben voor een eigen AI-model dat is getraind op bedrijfsgegevens. Er zijn echter maar weinig bedrijven die op dit moment over de rekenkracht of het personeel beschikken om van het potentieel van deze technologie gebruik te maken.

“HPE zal zijn toonaangevende hybride cloud-, supercomputing- en AI-mogelijkheden breder naar ondernemingen brengen om een AI-gedreven transformatie mogelijk te maken, waarbij klanten veilig AI-modellen kunnen ontwikkelen met hun eigen data. Door middel van HPE’s AI-native en hybride cloud-oplossingen zullen organisaties volledig kunnen profiteren van de inzichten uit hun data om een revolutie teweeg te brengen op het gebied van productinnovatie, klantbetrokkenheid en in het algemeen de volledige kracht van GenAI te realiseren om hun bedrijven en industrieën te transformeren.”

HPE ProLiant DL380a Gen 11 server

HPE biedt zich aan als een allround-dienstverlener die alles levert wat nodig is. Naast de cloud-oplossingen biedt HPE in samenwerking met Nvidia een rackarchitectuur aan bestaande uit 16 HPE ProLiant Compute DL380a Gen11-servers uitgerust met in totaal 64 NVIDIA L40S grafische kaarten, NVIDIA BlueField-3 Data Processing Units en het NVIDIA Spectrum-X Ethernet Networking Platform. De apparaten zijn ontworpen om modellen met een omvang van het Large Language Model LLaMa-2 te trainen. Niet alleen de hardware wordt geleverd, maar ook alles eromheen – de full stack.

HPE ProLiant Gen 11 servers zijn ontworpen voor de hybride wereld. Bedrijven behouden hiermee eenvoudiger de controle over bedrijfscomputers – van edge tot cloud – met een cloud operating experience. Via een self-service console kunnen organisaties proactief inzicht krijgen en houden in hun bedrijfsactiviteiten.

Taken kunnen worden geautomatiseerd voor een efficiënte implementatie, schaalbaarheid en vereenvoudigde ondersteuning en levenscyclusbeheer. Daarmee hoeven er minder taken te worden uitgevoerd, wat zich vertaalt in minder onderhoud voor IT-afdelingen. Deze mogelijkheden zijn ontworpen voor en ingebouwd in alle HPE ProLiant Gen11-servers, ongeacht of een bedrijf deze aanschaft als fysieke server of gebruikt als ‘as-a-service’-uitbreiding met HPE GreenLake naarmate de rekenkracht- of opslagvereisten groeien. HPE GreenLake for Compute Ops Management is een as-a-service beheersysteem dat zorgt voor meer eenvoud, flexibiliteit, veiligheid en snelheid.

HPE ProLiant Gen11-servers maken gebruik van de HPE Silicon Root of Trust. Kort gezegd is Silicon Root of Trust een technologie die beveiliging direct op firmwareniveau integreert in HPE-servers, waardoor een onveranderlijke digitale vingerafdruk in een siliciumchip wordt gemaakt. Dit biedt zeer geavanceerde niveaus van bescherming tegen firmware-aanvallen.

De HPE ProLiant DL380a Gen11-server, aangedreven door 4e generatie Intel Xeon scalable processors, voegt hardware- en softwareondersteunde beveiligingsfuncties toe, waaronder Intel Software Guard Extensions en Intel Boot Guard, die helpen bij het beveiligen van de serverhardware waarop kritieke apps draaien en die data in het geheugen beter beschermen.

ProLiant DL380a Gen11 generatieve AI — <a href="https://www.hpenergy.nl/artikel/hpe-proliant-dl380a-gen11/"></a> <em>De <a href="https://www.hpenergy.nl/artikel/hpe-proliant-dl380a-gen11/" target="_blank" rel="noopener">HPE ProLiant DL380a Gen11</a> met 4e generatie Intel Xeon Scalable Processors</em>

HPE ProLiant Gen11-servers beschermen gezonde servers continu door snelle detectie van servers met beveiligingsproblemen, zelfs tot het punt dat ze niet mogen opstarten als kwaadaardige code wordt geïdentificeerd. En na een beveiligingsgebeurtenis bieden HPE-server geautomatiseerd herstel, inclusief herstel van gevalideerde firmware, en een eenvoudig herstel van het besturingssysteem, toepassingen en dataverbindingen, om servers weer snel online te brengen en normaal te laten functioneren. Dankzij het ontwerp van deze fundamentele beveiligingsaanpak, kunnen HPE ProLiant Gen11-servers zich verdedigen tegen steeds complexere bedreigingen.

Prestaties op maat

De HPE ProLiant DL380a Gen11 server is een uitstekende keuze voor AI-, reken- en grafisch-intensieve workloads die een maximaal aantal cores, gpu-mogelijkheden en netwerk- en I/O-bandbreedte vereisen.

De 4e generatie Intel Xeon Scalable Processors met next-generation technologie ondersteunen tot 56 cores per processor, met 12 DIMM-kanalen per processor voor in totaal maximaal 3 TB DDR5 werkgeheugen. De DL380a biedt de geavanceerde gegevensoverdrachtssnelheden en hogere netwerksnelheden van de PCIe Gen5 seriële uitbreidingsbus, met maximaal 4 x16 PCIe Gen5 en 2 OCP-slots voor een optimale I/O-doorvoer en lage latentie.

De HPE ProLiant DL380a Gen11 server is een uitstekende keuze voor organisaties die op zoek zijn naar een server met geavanceerde schaalbaarheid voor gpu’s, toonaangevende beveiligingsinnovatie en vereenvoudigd beheer die de prestaties van grafisch intensieve toepassingen kunnen verbeteren en die enterprise-workloads zoals AI, IVA en VDI kan versnellen.