Beste cloud-GPU-providers voor AI in 2026 (gerangschikt op reële $/uur)

Wil je de goedkoopste H100 die je op dit moment echt kunt huren, dan ga je naar een neo-cloud — RunPod, Lambda, Vast.ai of Spheron — en betaal je ergens tussen de $1.50 en $3.30 per uur. Ga je voor dezelfde chip naar AWS, GCP of Azure, dan betaal je $6 tot $12 per uur voor hardware die bit voor bit identiek is. Dat ene feit is het belangrijkste om te begrijpen over de cloud-GPU-markt in 2026: de hyperscaler is niet langer de goedkoopste plek om AI te draaien, en voor de meeste teams scheelt het niet eens weinig.

Deze gids rangschikt de providers die het huren waard zijn, met reële uurprijzen die in juni 2026 rechtstreeks van de prijspagina van elke leverancier zijn gehaald, plus het onderdeel dat elk "beste GPU-cloud"-lijstje overslaat — de adder onder het gras. Cold starts, spot-eviction, minimumverplichtingen en egress-kosten zijn precies de plekken waar de gepubliceerde prijs ophoudt de echte prijs te zijn.

Hoe we hebben gekozen

Vier dingen bepalen of een GPU-cloud echt goed is, en niet alleen goedkoop op een grafiek:

Reële $/uur — on-demand en spot, voor de chips waarop mensen daadwerkelijk trainen en serveren: A100, H100, H200 en de nieuwe Blackwell B200. De cijfers hieronder gelden per losse GPU, tenzij anders vermeld.
Beschikbaarheid — een H100 van $1.50 die je nooit kunt krijgen, is niets waard. Marketplace- en spotcapaciteit schommelt hevig.
Cold start & scale-to-zero — voor inference telt de tijd van "verzoek komt binnen" tot "model antwoordt" zwaarder dan het uurtarief.
Gemak & lock-in — facturatiegranulariteit (per seconde versus per uur), minimumverplichtingen, en hoeveel DevOps je erbij koopt.

Eén ding wegen we bewust mee: de geleverde kostprijs, niet de stickerprijs. Een provider zonder egress-kosten en met facturatie per seconde kan een goedkoper stickertarief verslaan zodra je het verplaatsen van data meerekent — hetzelfde exit-tax-probleem dat we behandelden in hoe je stopt met het betalen van cloud-egress-kosten.

De beste cloud-GPU-providers voor AI in 2026

1. RunPod — beste allrounder voor de meeste teams

Beste voor: developers die goedkope GPU's én serverless inference in één account willen.

RunPod publiceert H100 PCIe rond $1.99/uur en H100 SXM rond $2.69–$3.29/uur, H200 op zo'n $4.39/uur en B200 rond $5.89/uur on-demand, waarbij de tarieven van de Community Cloud (door hosts geleverd) nog lager uitvallen. Er wordt per seconde gefactureerd. De serverless-laag met FlashBoot claimt cold starts van onder de 2 seconden bij ruwweg 95% van de verzoeken en schaalt naar nul bij inactiviteit, zodat je tussen pieken in niet voor een warme worker betaalt.

De adder onder het gras: de capaciteit en betrouwbaarheid van de Community Cloud verschillen per host — prima voor batch en development, riskanter voor productie-SLA's. Spot-workers worden geëvicteerd. Gebruik Secure Cloud wanneer uptime ertoe doet.

RunPod GPU-prijzen, juni 2026

2. Lambda Labs — beste voor serieuze training

Beste voor: teams die multi-GPU-training draaien en schone InfiniBand-clusters willen.

Lambda's on-demand H100 SXM kost ongeveer $3.99/uur (PCIe $3.29/uur), B200 SXM6 komt uit rond $6.69–$6.99/uur, A100 80GB is $2.79/uur en GH200 staat op $2.29/uur. De echte waarde zit in gereserveerde capaciteit en 1-Click Clusters gebouwd voor gedistribueerde training, waar de vastgelegde tarieven ruim onder on-demand liggen.

De adder onder het gras: er is geen echte spotmarkt, dus je krijgt niet de bodemprijzen voor onderbreekbare capaciteit. H200 is cluster-only zonder gepubliceerd uurtarief — daar onderhandel je over. 1-Click Clusters hebben een minimumverplichting van 2 weken.

Lambda GPU Cloud-prijzen, juni 2026

3. Vast.ai — goedkoopste H100 als je variantie tolereert

Beste voor: budget-batchjobs, onderzoek, en iedereen die puur op $/uur optimaliseert.

Vast.ai is een marketplace, dus de prijzen zweven mee op vraag en aanbod over verschillende datacenters. H100 PCIe staat genoteerd vanaf ruwweg $1.53–$2.00/uur, H100 NVL rond $2.40/uur, en A100 80GB is gespot voor zo laag als $0.67–$0.78/uur bij hosts met hoge betrouwbaarheid. Onderbreekbare biedingen gaan een stuk lager.

De adder onder het gras: je huurt van externe hosts van wisselende kwaliteit. Betrouwbaarheid, schijfsnelheid en netwerk verschillen per machine — controleer de betrouwbaarheidsscore van de host en vertrouw niet op een verouderde offerte, want het live tarief is wat je daadwerkelijk betaalt.

4. CoreWeave — beste voor Blackwell op enterprise-schaal

Beste voor: gefinancierde labs en enterprises die enorme, aaneengesloten GB200/B200-capaciteit nodig hebben.

CoreWeave is waar de frontier-clusters wonen. H100 HGX kost ongeveer $6.15/GPU/uur, H200 8-way rond $6.31/GPU/uur, en de GB200 NVL72-racks zijn enterprise-only voor ruwweg $42/uur (volledige rack, minimaal 18 nodes), met 8x HGX B200-instances rond $68.80/uur. Gereserveerde voorwaarden snijden tot ~60% van de prijs af.

De adder onder het gras: dit is geen pinpas-erdoor-en-gaan-dienst voor solo-developers. Verplichtingen, full-rack-minimums op het nieuwste silicium, en een sales-gedreven traject. Overkill — en over-budget — voor alles onder een serieuze trainingsrun.

Beste voor: grillige inference en "deploy een Python-functie op een GPU" zonder infra te beheren.

Modal factureert per seconde — H100 rond $3.95/uur ($0.001097/sec), met A100 en kleinere GPU's goedkoper — en rekent niets aan bij inactiviteit. Cold starts duren enkele seconden voor kleine modellen, 15–30 seconden voor gewichten van 7B+. Nieuwe accounts krijgen $30/maand aan gratis compute.

De adder onder het gras: je betaalt een toeslag voor het managed platform — Modals H100 is ~$4/uur tegenover RunPods ~$2.50/uur voor dezelfde chip. Je koopt DevOps weg, niet de goedkoopste compute.

6. Together AI — beste managed trainingsclusters zonder egress

Beste voor: teams voor training en fine-tuning die InfiniBand-clusters willen zonder die zelf op te zetten.

Together's GPU-clusters omvatten H100, H200, B200 en GB200 met overal InfiniBand. H100-clusters kosten ruwweg $2.25–$3.49/uur afhankelijk van de reservering, gekoppelde Weka/VAST parallelle opslag voor $0.16/GiB/maand — en, opvallend, nul egress-kosten, wat stilletjes uitmaakt zodra je checkpoints en datasets heen en weer schuift.

De adder onder het gras: dit is clusterhuur gericht op training, geen goedkope single-GPU dev-box of een scale-to-zero inference-endpoint.

7. De hyperscalers (AWS, GCP, Azure) — alleen het beste als je al vastzit

Beste voor: teams die GPU's binnen een bestaand AWS/GCP/Azure-account moeten houden om redenen van compliance, data-gravity of vastgelegde uitgaven.

AWS P5 H100 is ongeveer $3.90/GPU/uur on-demand (na de korting van ~44% in 2025), GCP A3 rond $3.00–$10.98/GPU/uur afhankelijk van de tier, en Azure ND H100 v5 ruwweg $6.98–$12.29/GPU/uur. Nodes met acht GPU's kosten $55–$98/uur. Spot- en committed-use-kortingen kunnen deze halveren.

De adder onder het gras: je betaalt een forse toeslag voor hetzelfde NVIDIA-silicium, plus egress op de weg naar buiten. De enige goede reden om ze in 2026 voor GPU's te gebruiken, is dat je data en pipeline er al draaien.

Welke moet je kiezen? Per use case

Goedkoopste H100 op dit moment: Vast.ai of een neo-cloud spot-tier ($1.50–$2.00/uur) als je variantie tolereert; RunPod Community Cloud voor een stabielere goedkope optie.
Serverless / grillige inference: RunPod serverless (FlashBoot, cold starts onder 2 sec) of Modal (per seconde, scale-to-zero). Kies RunPod voor kosten, Modal voor DX.
Serieuze multi-GPU-training: Lambda 1-Click Clusters of Together AI — beide InfiniBand, beide reserveringsvriendelijk, Together zonder egress.
Blackwell op enterprise-schaal: CoreWeave voor GB200/B200-racks.
Een middelgroot model fine-tunen: RunPod of Vast.ai voor één of twee GPU's per uur; Together als je de run gemanaged wilt.
Al op AWS/GCP/Azure: blijf alleen zitten als data-gravity het eist — anders zijn de besparingen van een overstap reëel.

Een bredere kostennoot: dezelfde aanbodkrapte die de prijzen van RAM en VPS opdrijft (zie waarom je VPS-rekening stijgt in 2026) houdt ook de GPU-spotprijzen volatiel. En als je workload inference is, verslaan kleinere, goedkope flash-modellen vaak het huren van een H100 sowieso — zie waarom goedkope flash-AI-modellen stilletjes de productie winnen.

FAQ

Welke cloud-GPU is het goedkoopst?

Voor pure $/uur zijn marketplace- en neo-cloud spot-tiers het goedkoopst — Vast.ai en providers zoals Spheron noteren H100 spot rond $1.03–$1.53/uur en A100 80GB vanaf $0.60–$0.78/uur. On-demand zijn RunPod en Lambda de goedkoopste betrouwbare opties op ruwweg $2.50–$3.30/uur voor een H100. Hyperscalers zijn nooit het goedkoopst.

Is RunPod of Lambda beter?

Ze bedienen verschillende klussen. RunPod wint op prijs, facturatie per seconde en serverless inference met snelle cold starts — het beste voor inference, development en budgetwerk. Lambda wint op multi-GPU-training: schone InfiniBand 1-Click Clusters en sterke gereserveerde tarieven. Serveer je modellen, neig dan naar RunPod; train je ze op schaal, neig dan naar Lambda.

Hoeveel kost een H100 per uur?

In juni 2026 kost een losse H100 ongeveer $1.50–$2.00/uur op spot/marketplace, $2.50–$3.30/uur on-demand bij neo-clouds zoals RunPod en Lambda, en $4–$7/uur bij managed serverless of hyperscalers. De SXM-variant kost meer dan PCIe, en nodes met 8 GPU's worden als bundel gefactureerd.

Wat is de beste GPU voor AI-training?

Voor de meeste teams in 2026 blijft de H100 SXM het werkpaard — beste beschikbaarheid en prijs-prestatieverhouding. Stap op naar H200 (meer geheugenbandbreedte) voor geheugengebonden modellen, en B200/GB200 voor runs op frontier-schaal als je capaciteit kunt veiligstellen en de toeslag van ~60–70% boven de H100 kunt rechtvaardigen.

Maken cold starts echt uit?

Voor inference, ja. Een scale-to-zero-endpoint bespaart geld maar voegt latentie toe bij het eerste verzoek — van onder de 200ms (RunPod FlashBoot) tot 15–30 seconden (grote modellen op een koude worker). Voor gebruikersgerichte apps houd je een warme worker aan of kies je een provider met agressieve cold-start-optimalisatie.

De aanbeveling

Wil je één standaardkeuze: RunPod voor de breedste passendheid — goedkope GPU's, facturatie per seconde en serverless inference op één plek. Kies Lambda of Together AI wanneer je op schaal traint, Vast.ai wanneer je puur op prijs optimaliseert en variantie kunt opvangen, en CoreWeave wanneer je Blackwell-racks nodig hebt. Bewaar de hyperscalers voor wanneer je data er al woont. Wat je ook kiest, controleer het live tarief op het moment van deployen — GPU-prijzen bewegen in 2026 wekelijks, en spotcapaciteit beweegt nog sneller.

Affiliate-disclosure: TechRiseUps kan een commissie verdienen als je je via sommige links op deze pagina aanmeldt. Het kost jou niets extra, en het verandert nooit onze rangschikkingen — elke prijs hier komt van de eigen prijspagina van de leverancier in juni 2026, en we zouden je zonder aarzelen aanraden een gratis concurrent te gebruiken als dat de betere keuze was.

Sommige links kunnen ons een commissie opleveren, zonder extra kosten voor jou.

Waqas Ahmed Waseer

Waqas Ahmed Waseer is ontwikkelaar en automation-builder met meer dan 8 jaar ervaring in het bouwen van productiesystemen die door 100.000+ mensen worden gebruikt. Hij bouwt custom multi-tenant SaaS, AI-automatisering (n8n, LLM-workflows, WhatsApp-bots) en hostinginfrastructuur (WHM/cPanel, CloudLinux) — en is de maker van WaSphere, FlowMaticX en het hostingmerk WaseerHost. 100+ projecten opgeleverd voor mkb, bureaus en gefinancierde startups.

Profiel Alle artikelen