Europa, energie en AI: GLM 5.2 op Ascend vs Grok op NVIDIA

geplaatst in: Uncategorized | 0

Gepubliceerd juni 2026 · Infrastructuurnotities van 3DN

Dit is geen politiek manifest en het is niet bedoeld om iemand te choqueren. Het is een notitie over elektriciteit — het soort saaie randvoorwaarde dat bepaalt of een AI-strategie uitvoerbaar is of fantasie. Europa verbruikt nu al meer energie dan het produceert. De afhankelijkheid van geïmporteerde fossiele brandstoffen blijft hoog. Frontier-modeltraining op energieverslindende Amerikaanse GPU-clusters bovenop die basislijn is geen detail; het is de rekening.

Recente releases maken die rekening onmogelijk te negeren. Onafhankelijke analisten bij Epoch AI schatten dat het trainen van Grok 4 — xAI’s meest geavanceerde model tot nu toe — in de orde van 310 gigawattuur (GWh) elektriciteit kostte, gekoppeld aan circa 246 miljoen NVIDIA H100 GPU-uren op het Colossus-supercomputercluster. Dat staat gelijk aan het jaarverbruik van tienduizenden huishoudens, met bijbehorende CO₂- en waterfootprints.

Ondertussen trainde Zhipu AI (Z.ai) GLM-5 — de basis van het GLM 5.2-model dat wij in productie draaien — volledig op Huawei Ascend-accelerators: 100.000 Ascend 910B-chips, 28,5 biljoen trainingstokens, geen NVIDIA-hardware in de stack (technisch rapport). Zhipu publiceert geen enkel geaudit GWh-cijfer. Met dezelfde fysische boekhouding die Epoch voor Grok hanteert — gemiddeld verbruik onder piek-TDP, plus niet-GPU-overhead en datacenter-PUE — komt een verdedigbare back-of-the-envelope-schatting voor GLM-5-pretraining uit op 15–60 GWh, tegenover 310 GWh voor Grok 4. Geen afrondingsverschil: ruwweg vijf- tot twintig keer minder elektriciteit voor een model in dezelfde prestatieklasse op software-engineering- en agentic-benchmarks.

Waarom het verschil echt is, geen marketing

Drie technische feiten verklaren het grootste deel van de kloof:

  • Vermogen per chip. NVIDIA H100 SXM-onderdelen in Colossus-achtige training zijn beoordeeld tot 700 W. Huawei Ascend 910B tot 400 W. Dezelfde wandklokuur op beide betekent niet dezelfde kilowattuur.
  • Architectuurefficiëntie. GLM-5 is een 744B-parameter mixture-of-experts-model dat slechts 40B parameters per token activeert, en DeepSeek Sparse Attention (DSA) gebruikt om attention-kosten op lange contexten te verlagen. Minder verspilde FLOPs per nuttige token.
  • Schaalkeuzes. Amerikaanse frontier-labs concurreren op de grootst mogelijke trainingsruns — Colossus wordt nu gemeten in honderdduizenden GPU’s en gigawatt-ambities. Dat koopt capaciteit, maar koopt het met energie lineair in GPU-uren.

Hiermee is niet gezegd dat Ascend op elk vlak “beter” is. Interconnect-bandbreedte, softwarevolwassenheid en inference-doorvoer blijven in veel deployments in het voordeel van NVIDIA. Maar trainingsenergie per frontier-capabel model is geen Amerikaans monopolie meer — en dat telt als je continent al tekort aan elektronen heeft.

Hardwarekosten en de softwarestack

Investeringskosten, niet alleen watt. Elektriciteit is maar een deel van de rekening. Brancheberichten over geïntegreerde Ascend 910B trainings- en inferentiesystemen in China noemen consequent 60–70% lagere prijzen dan vergelijkbare NVIDIA H100-bundels — TrendForce en Chinese vakpers citeren all-in-one Atlas- en FusionCube-configuraties van circa ¥2–10 miljoen tegen H100-klasse oplossingen rond ¥20 miljoen. Losse H100 SXM-modules kosten $25.000–$40.000 op de open markt; Ascend 910B is in het Westen niet retail verkrijgbaar, maar gebundelde Ascend-servers zijn goedkoper per FLOP en leveren ruwweg 60–70% van H100 FP16-prestaties per chip. Voor een continent dat al energie importeert en te maken heeft met GPU-exportpremies, telt dat capex-verschil net zo hard als het GWh-verschil.

Geen CUDA-afhankelijkheid. GLM-5 is getraind zonder een enkele NVIDIA-GPU. Geen CUDA-runtime, geen cuDNN, geen NVLink-centrisch clusterstack. Huawei’s softwarelaag is CANN (Compute Architecture for Neural Networks) — de Ascend-programmeeromgeving op hetzelfde niveau als CUDA — met MindSpore als Huaweis eigen deep-learningframework. In de praktijk draaien Chinese frontier-labs steeds vaker PyTorch via torch_npu, een Ascend-backendadapter, in plaats van modellen volledig in MindSpore te herschrijven. De CANN execution provider van ONNX Runtime biedt een extra pad voor inference-portabiliteit. De operationele conclusie: frontier-klasse training en serving vereisen NVIDIA’s propriëtaire programmeermodel niet.

Is dat vrijheid, of een ander soort lock-in? Eerlijk antwoord: beide. CANN is propriëtair aan Ascend-NPU’s, net zoals CUDA alleen op NVIDIA-GPU’s draait. Van CUDA naar CANN is niet vendor-neutraal — je ruilt de ene softwaregracht in voor de andere. Wat in de praktijk verschilt:

  • PyTorch-portabiliteit. torch_npu laat bestaande PyTorch-code Ascend als doel kiezen zonder volledige rewrite, minder frictie dan een greenfield MindSpore-port (ChinaTalk).
  • Open weights. GLM-5 verschijnt onder MIT-licentie. De stack is niet gebonden aan een gesloten API-product zoals veel Amerikaanse frontier-modellen.
  • Ecosysteemrijpheid. CUDA heeft nog steeds diepere libraries, grotere communityforums en meer beproefde kernels. CANN-ontwikkelaars melden routinematig ruwe randen, weinig publieke troubleshooting en afhankelijkheid van Huawei-veldengineers — een rijpheidskloof die in 2025 in vakforums en trade press is gedocumenteerd.
  • Geopolitieke blootstelling. Ascend-lock-in is Huawei/SMIC-supplychain-lock-in. CUDA-lock-in is NVIDIA/Amerikaanse-exportcontrole-lock-in. Geen van beide stacks is neutraal; de vraag is welke afhankelijkheid uw organisatie daadwerkelijk kan inkopen, voeden en onderhouden.

Voor Europese operators die Ascend evalueren is de realistische houding niet “ontsnap aan alle lock-in” maar kies welke stack u kunt draaien — wetende dat efficiënte frontier-training al zonder CUDA gebeurt, op hardware die materieel minder kost per flop en per kilowattuur.

Europa’s energiecontext

Eurostat is helder: de EU is netto importeur van energie. Binnenlandse productie dekt het verbruik niet. Fossiele brandstoffen domineren nog steeds de mix; elektrificatie van industrie, warmte en vervoer stijgt; en datacenterbelasting groeit erbovenop. De publicaties van de Europese Commissie beschrijven importafhankelijkheid als structureel feit, niet als tijdelijke krapte.

Tegen die achtergrond is het kopiëren van het xAI-draaiboek — H100/H200-megaclusters van honderdduizend GPU’s gevoed door nieuwe gasturbines — geen “innovatie.” Het is een vraagschok die Europa zich slecht kan veroorloven. Elke GWh voor training is een GWh die niet beschikbaar is voor netstabiliteit, industrie of huishoudens.

Hoe “verstandig handelen” eruitziet

Als Europa een serieuze AI-speler wil zijn in plaats van wederverkoper van Amerikaanse API’s, is een hardwarestrategie nodig die past bij de energierealiteit. Dat betekent:

  1. Ascend en andere niet-NVIDIA-stacks op merites beoordelen — stroomverbruik, trainingsefficiëntie, open weights en operationele fit — in plaats van exportcontrole-alignment als vervanging voor engineering te zien.
  2. Partnerschappen opbouwen met Chinese leveranciers en labs waar het bewijs voor efficiënte training nu vooral vandaan komt. GLM-5 staat onder MIT-licentie. De wetenschap is gepubliceerd. Doen alsof het niet bestaat bespaart geen elektriciteit.
  3. Stoppen met “bondgenoot” verwarren met “optimaal.” Afhankelijkheid van één Amerikaanse GPU-leverancier blijft afhankelijkheid — en voor een netto-energie-importeur met een steile marginale kost per trainingsrun.
  4. Eerst soevereine inference financieren. De meeste Europese waarde zit in deployment, auditability en domeindata — niet in meer uitgeven dan Musk aan Memphis-stroomcontracten. Trainen waar het efficiënt is; draaien waar je soeverein bent.

De VS en NVIDIA achter je laten betekent niet dat je trans-Atlantische handel opgeeft of een ideologische kant kiest. Het betekent weigeren om decennia industriebeleid vast te pinnen aan het energie-duurste pad wanneer een geloofwaardig, meetbaar zuiniger alternatief al beschikbaar is — op chips die Washington uit Chinese handen wilde houden, en op modellen die publiek zijn vrijgegeven.

Voorbehouden die we niet overslaan

Exportcontroles, entity lists, supply-chain security en geopolitiek risico zijn echte managementproblemen. Ze horen in inkoop en legal review. Ze wissen de natuurkunde niet weg. Een continent dat energie importeert kan 310 GWh-trainingsruns niet voor altijd als iemand anders probleem afdoen.

Wij draaien GLM 5.2 op eigen hardware omdat soevereiniteit en scheduling ertoe doen voor operations. Wij volgen Ascend omdat de energierekening ertoe doet voor Europa. De twee argumenten rijmen.

Samenvatting

GLM 5.2 bouwt voort op een frontier-model getraind op Huawei Ascend met een fractie van het elektriciteitsbudget dat voor Grok 4 op NVIDIA wordt geschat. Europa’s verbruik overstijgt al de binnenlandse productie. Als beleidsmakers enig verstand hebben, behandelen ze efficiënte Chinese AI-hardware en open modellen als bootstrap-kans — niet als taboe — en stoppen ze met het net inzetten op één Amerikaanse chipmaker.

Vragen over onze infrastructuur of hosting? Neem contact op.

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *