01-12-2023

HPE en NVIDIA bieden full-stack GenAI-oplossing

Deel dit bericht

Hewlett Packard Enterprise kondigt een uitgebreide strategische samenwerking aan met NVIDIA om een enterprise computingoplossing te bouwen voor generative AI (GenAI). De vooraf geconfigureerde oplossing voor AI-tuning en -inferencing geeft bedrijven van elke grootte de mogelijkheid om snel basismodellen aan te passen met behulp van eigen data en overal productieapplicaties uit te rollen, van edge tot cloud. Het aanbod vereenvoudigt de ontwikkeling en implementatie van GenAI-infrastructuur met een full-stack AI-tuning- en -inferencingoplossing.

Bedrijven die GenAI-modellen ontwikkelen en inzetten voor use cases zoals conversational search, automatisering van bedrijfsprocessen en contentcreatie, hebben behoefte aan een software- en infrastructuurstack die snel en overal kan worden ingezet. De nieuwe enterprise computingoplossing voor GenAI is onderdeel van een uitgebreide samenwerking tussen HPE en NVIDIA die full-stack, out-of-the-box AI-oplossingen levert. Deze oplossingen integreren HPE Machine Learning Development Environment Software, HPE Ezmeral Software, HPE ProLiant Compute en HPE Cray Supercomputers met de NVIDIA AI Enterprise software suite, inclusief het NVIDIA NeMo framework.

Snellere AI met een tuning en inferencingoplossing
De enterprise computing oplossing voor GenAI is een nieuwe AI-tuning en -inferencing datacenteroplossing die bedrijven van elke omvang een kant-en-klare oplossing biedt voor een snelle start van hun AI-traject. Met de nieuwe oplossing kunnen bedrijven voorgetrainde foundation-modellen gebruiken met hun eigen data om productieapplicaties te maken, zoals AI-chatbots. Daarnaast verbeteren retrieval-augmented generation (RAG) workstreams de datakwaliteit en nauwkeurigheid van de applicatie. De oplossing bevat:
• Speciaal gebouwde en geoptimaliseerde architectuur voor AI: Een rack-scale architectuur met marktleidende HPE ProLiant Compute DL380a voorgeconfigureerd met NVIDIA L40S GPU’s, NVIDIA BlueField-3 DPU’s en het NVIDIA Spectrum-X Ethernet Networking Platform voor hyperscale AI. De oplossing is ontworpen voor de finetuning van een Llama 2- model met 70 miljard parameters en bevat 16 HPE ProLiant DL380a servers en 64 L40S GPU's.
• HPE AI-software: HPE Machine Learning Development Environment Software met nieuwe GenAI studiomogelijkheden om snel prototypes te maken en modellen te testen, en HPE Ezmeral Software met nieuwe GPU-aware mogelijkheden om de inzet te vereenvoudigen en datavoorbereiding te versnellen voor AI-workloads in de hybrid cloud.
• NVIDIA AI-software: NVIDIA AI Enterprise om de ontwikkeling en inzet van productieve AI te versnellen met beveiliging, stabiliteit, beheer en ondersteuning. De software omvat het NVIDIA NeMo framework, guardrailing toolkits, data curation tools en voorgetrainde modellen om enterprise GenAI te stroomlijnen.

HPE Services om de overstap naar AI te ondersteunen
HPE Services biedt nu een breed portfolio van adviesdiensten, opleidingsmogelijkheden en implementatie-oplossingen. De nieuwe AI-diensten begeleiden klanten tijdens elke stap van het proces: van een kennismaking met GenAI en LLM tot de implementatie. Zo ontwikkelen klanten de optimale operationele modellen en hybrid clouddatastrategieën die nodig zijn om oplossingen te bouwen, te implementeren en te schalen. Deze uitgebreide diensten worden ondersteund door de nieuwe Global Centers of Excellence voor AI en Data.

Kant-en-klare oplossing aangedreven door NVIDIA
Tijdens SC23 kondigde HPE een turnkey supercomputeroplossing, ondersteund door NVIDIA, voor grote bedrijven, onderzoeksinstellingen en overheidsorganisaties om de eerste fase van de AI-levenscyclus aan te pakken: het ontwikkelen en trainen van basismodellen. De enterprise computing oplossing voor GenAI is een kleinere AI-oplossing voor zakelijke klanten die zich richten op tuning en inferencing.

Tijdens HPE Discover Barcelona 2023 kondigde HPE haar nieuwe open, full-stack AI-native-architectuur aan samen met de volgende reeks AI-native en hybrid cloudaanbiedingen voor machine learning ontwikkeling, data analytics, AI-geoptimaliseerde file storage, AI-tuning en -inferencing, en professionele services. De enterprise computing-oplossing voor generative AI is beschikbaar vanaf januari 2024.

Partners