AI-inference is de fase waarin een AI-model een output berekent op basis van een input, zoals een vraag of document. Elke keer dat je een chatbot gebruikt of een AI-feature aanroept, vindt er inference plaats. Die berekeningen kosten geld en tijd, zeker op grote schaal.

Waarom investeren beleggers zo veel in AI-inference bedrijven?

Omdat de markt verwacht dat de economische waarde van AI steeds meer verschuift van het bouwen van modellen naar het goedkoop en schaalbaar gebruiken ervan. Bedrijven als Baseten verdienen aan elk verzoek dat via hun platform loopt, en dat volume groeit snel.

Kan een MKB-bedrijf ook profiteren van goedkopere AI-inference?

Ja. Door open-source modellen te gebruiken voor standaard taken als documentclassificatie of e-mailtriage, en alleen duurdere modellen in te zetten waar kwaliteit het verschil maakt, dalen de kosten per AI-verzoek aanzienlijk.

Wat is het verschil tussen AI-training en AI-inference?

Training is het bouwen van een AI-model: duur, eenmalig en tijdrovend. Inference is het gebruiken van dat model: elk verzoek kost een klein bedrag, maar bij miljoenen verzoeken per maand telt dat snel op.

Hoe voorkom ik vendor lock-in bij AI-infrastructuur?

Door je AI-stack zo op te bouwen dat je kunt wisselen van modelaanbieder zonder alles opnieuw te integreren. Multi-cloud inference-platforms helpen daarbij, maar de architectuurkeuze moet je zelf bewust maken.

Baseten haalt $1,5 miljard op: wat is AI-infe…

Een startup die helpt om AI-modellen goedkoper en sneller in productie te draaien, haalt mogelijk $1,5 miljard op. Dat is niet de gebruikelijke Silicon Valley-hype. Het vertelt iets fundamenteels over waar de echte waarde in AI de komende jaren naartoe gaat.

Baseten wil $1,5 miljard ophalen, vijf maanden na zijn vorige mega-ronde

Baseten, opgericht in 2019, bouwt infrastructuur voor zogenoemde AI-inference. Kort gezegd: het platform helpt bedrijven om AI-modellen in productie te draaien, verzoeken snel af te handelen en kosten te beheersen door requests automatisch door te sturen naar het meest geschikte en goedkoopste model.

Volgens TechCrunch en de Wall Street Journal is Baseten bezig een nieuwe financieringsronde af te ronden van $1,5 miljard, tegen een waardering van maximaal $13 miljard. Vijf maanden eerder haalde het bedrijf al $300 miljoen op bij een waardering van $5 miljard. Daarvóór, negen maanden eerder, was er een Series D van $150 miljoen. Als de nieuwe ronde doorgaat, is dat een waardestijging van 160% in minder dan een half jaar.

De deal zou een zogenoemde split-priced round zijn: sommige investeerders stappen in op $13 miljard waardering, anderen op $11 miljard. Betrokken partijen zijn onder andere Spark Capital, Sands Capital, Altimeter Capital en Wellington Management.

Analysebedrijf Sacra schat dat Baseten in maart 2026 op een annualized revenue van $600 miljoen zat. In december 2025 was dat nog $200 miljoen. Dat zijn geen officiële bedrijfscijfers, maar de groeisnelheid is zelfs in de meest voorzichtige lezing uitzonderlijk.

Wat is AI-inference, en waarom is het plotseling zo waardevol?

Om te begrijpen waarom beleggers hier massaal instappen, is het nuttig om te weten wat inference precies doet.

Training is de fase waarin een AI-model wordt opgebouwd: miljarden parameters, enorme hoeveelheden data, en rekenkracht die weken of maanden in beslag neemt. Dat is duur, en dat weet vrijwel iedereen.

Inference is de fase daarna. Elke keer dat een gebruiker een vraag stelt, een document uploadt, of een chatbot een antwoord geeft, vindt er inference plaats. Het model rekent de output uit op basis van de input. Die berekening kost tijd, energie en geld. Vermenigvuldig dat met miljoenen verzoeken per dag, en de kosten lopen snel op.

Baseten richt zich precies op die fase. Het platform zet ML-modellen om naar productieklare API's, beheert capaciteit over meerdere cloudproviders tegelijk, en gebruikt usage-based pricing. Bedrijven hoeven geen eigen GPU-infrastructuur te kopen. Ze betalen voor wat ze gebruiken.

De verschuiving van modelbouw naar modelgebruik

De timing is niet toevallig. AI-modellen zijn de afgelopen twee jaar in snel tempo toegankelijker geworden. Open-source modellen als Llama, Mistral en Qwen presteren op een groeiend aantal taken vergelijkbaar met proprietary alternatieven van OpenAI of Anthropic, maar voor een fractie van de kosten.

Dat zorgt voor een nieuwe vraag bij bedrijven: niet welk model kiezen we, maar hoe draaien we dat model zo goedkoop en snel mogelijk op schaal. Dat is het domein van inference-platforms. En het verklaart waarom beleggers nu niet meer alleen kijken naar wie het beste model bouwt, maar naar wie de beste infrastructuur levert om modellen te gebruiken.

Wat Nederlandse bedrijven hiervan moeten weten

Dit nieuws gaat over een Amerikaanse startup en Silicon Valley-geld. Maar de onderliggende verschuiving raakt direct aan hoe Nederlandse bedrijven AI kunnen en moeten inzetten.

Inference-kosten bepalen of AI winstgevend is

Voor een MKB-bedrijf dat AI wil inzetten voor klantenservice, documentverwerking of een interne copilot, zijn de modelkosten per verzoek de bepalende factor voor de business case. Een AI-feature die per maand duizenden euro's kost aan API-gebruik, wordt moeilijk te rechtvaardigen. Een feature die diezelfde taak uitvoert voor een tiende van de prijs, via een open-source model op een inference-platform, verandert de rekening volledig.

De vraag is dus niet alleen of AI technisch werkt. De vraag is of het economisch werkt op de schaal waarop je het wilt inzetten.

Open-source verlaagt de drempel, mits goed ingezet

De groei van open-source AI-modellen geeft bedrijven meer keuzevrijheid. Ze zijn niet langer afhankelijk van één aanbieder voor elk gebruik. Een eenvoudige classificatietaak hoeft niet via GPT-4o te lopen als een kleiner model dezelfde kwaliteit levert voor minder geld.

Dat vergt wel technische kennis om te beoordelen welk model geschikt is voor welke taak. Inference-platforms proberen die drempel te verlagen door routing automatisch te doen, maar de strategische keuze blijft menselijk werk.

Vendor lock-in wordt een risico dat beheerd kan worden

Bedrijven die volledig afhankelijk zijn van één AI-leverancier, bouwen een strategisch risico op. Prijswijzigingen, beschikbaarheidsproblemen of beleidswijzigingen bij die leverancier raken dan direct de bedrijfsvoering. Multi-cloud inference-platforms bieden een manier om dat risico te spreiden, door capaciteit automatisch te verdelen over meerdere providers.

Voor welke sectoren is dit het meest relevant?

Niet elke sector profiteert even snel van goedkopere inference-infrastructuur. Een paar sectoren waar de impact het grootst is:

E-commerce en retail: AI-zoekfuncties, productaanbevelingen en klantinteractie kosten op schaal veel inference. Goedkopere routing verlaagt de marge-impact van AI-features direct.

Zakelijke dienstverlening en accountancy: documentverwerking, contractanalyse en e-mailtriage zijn herhaalbare taken met hoge volumes. Open-source modellen zijn hier vaak voldoende, en de kostenwinst is aanzienlijk.

Klantenservice en support: elk geautomatiseerd antwoord is een inference-verzoek. Bij honderdduizenden klantcontacten per maand telt elke eurocent per verzoek.

Logistiek en productie: AI voor planning, anomaliedetectie en rapportage werkt in batches. Inference-platforms die autoscaling ondersteunen, zijn hier efficiënter dan fixed-capacity oplossingen.

Drie vragen om je AI-inkoopstrategie te toetsen

De waardestijging van Baseten is een signaal, geen actieplan. Maar voor elke organisatie die AI serieus neemt, zijn drie vragen de moeite waard:

1. Weet je wat je per AI-verzoek betaalt? Veel bedrijven betalen een vaste API-prijs zonder te weten hoeveel verzoeken ze per maand doen en of dat schaalbaar is. Zonder die data is er geen business case te maken.

2. Gebruik je altijd het duurste model, ook als dat niet nodig is? Sommige taken vereisen GPT-4o. Veel taken niet. Een documentclassificatie of e-mailtriage werkt even goed met een kleiner, goedkoper model.

3. Ben je afhankelijk van één leverancier? Dat hoeft geen probleem te zijn, maar het is iets om bewust van te zijn. Als die leverancier de prijs verhoogt of uitvalt, wat is dan je plan B?

Conclusie

De $1,5 miljard die Baseten mogelijk ophaalt, is geen geïsoleerd geval. Het bevestigt een bredere verschuiving: de economische waarde van AI verschuift van modelbouw naar modelgebruik. Wie AI op schaal wil inzetten, betaalt niet meer alleen voor het model, maar voor de infrastructuur die het model snel, goedkoop en betrouwbaar beschikbaar maakt.

Voor Nederlandse bedrijven zijn er drie concrete conclusies:

Breng je inference-kosten in kaart voordat je AI-use cases verder schaalt.
Overweeg open-source modellen voor herhaalbare, goed gedefinieerde taken.
Bouw je AI-stack vendor-agnostic in, zodat je kunt wisselen zonder alles opnieuw te hoeven bouwen.

Baseten haalt $1,5 miljard op: wat is AI-inference?

Baseten wil $1,5 miljard ophalen, vijf maanden na zijn vorige mega-ronde

Wat is AI-inference, en waarom is het plotseling zo waardevol?

De verschuiving van modelbouw naar modelgebruik

Wat Nederlandse bedrijven hiervan moeten weten

Inference-kosten bepalen of AI winstgevend is

Open-source verlaagt de drempel, mits goed ingezet

Vendor lock-in wordt een risico dat beheerd kan worden

Voor welke sectoren is dit het meest relevant?

Drie vragen om je AI-inkoopstrategie te toetsen

Conclusie

Belangrijkste punten

Wat betekent dit voor bedrijven?

Veelgestelde vragen

Bronnen

Gerelateerde artikelen

Nobel-AI-onderzoeker verlaat DeepMind voor Anthropic

AI-phishing schaalt naar 2,5 miljoen scams

AI IPO-golf: wat betekent dit voor MKB?

Google investeert $15 miljoen in Virginia energie