AI-agents kosten - CustomerFirst Buyers'Guide

PW Alan Trefler - AI Agents kosten

Organisaties die hun bedrijfsprocessen willen opschalen met AI-agents, lopen in de praktijk tegen een flinke financiële muur aan: de onvoorspelbare en snel oplopende kosten van LLM-tokens. Pegasystems maakt daar tijdens PegaWorld® korte metten mee. Met de introductie van Pega Infinity™ ’26 lanceert de enterprise-softwareleverancier een alternatief voor de zogenaamde ‘AI-tokentax’. Organisaties betalen voortaan niet meer per token, maar een vast tarief per voltooide taak.

De markt rondom AI-agents verschuift in sneltreinvaart. Waar organisaties het afgelopen jaar volop experimenteerden, stappen LLM-aanbieders nu over van vaste abonnementen naar variabele tarieven per token (metered pricing). Nu de eerste serieuze facturen binnenkomen, schrikken veel IT- en business-directeuren van de hoogte ervan. Achter de schermen verbruiken AI-agents namelijk enorme aantallen ‘redeneertokens’ om complexe verzoeken af te handelen. Hoe complexer de case, hoe hoger de rekening – en hoe groter de kans op inconsistente of onvolledige antwoorden.

AI-redenering in de ontwerpfase, efficiëntie in de praktijk

Pega tackelt dit probleem door de AI-architectuur fundamenteel anders in te richten met de introductie van Pega Predictable AI™. De filosofie? Verplaats het zware (en dure) AI-redeneerwerk naar de ontwerpfase (design time), in plaats van dit bij elke handeling live te herhalen.

Met tools als Pega Blueprint AI™ en het nieuwe Pega Infinity Studio™ ontwerpen organisaties vooraf hoe een agentic workflow – zoals het afhandelen van klantverzoeken, het goedkeuren van leningen, het beoordelen van verzekeringsclaims of het optimaliseren van patiënttrajecten – exact moet verlopen.

Zodra de workflow live staat, schakelt Pega in de uitvoeringsfase (runtime) over naar een veel lichtere, efficiëntere vorm van AI. De agent herkent de intentie van de gebruiker, selecteert de juiste, vooraf goedgekeurde workflow en voert deze stap voor stap uit. Moet er tussendoor toch een zwaar taalmodel aan te pas komen (bijvoorbeeld voor het samenvatten van interacties of het analyseren van een document)? Dan gebeurt dit binnen strakke kaders en gerichte instructies, waardoor het tokenverbruik minimaal blijft.

Twee vliegen in één klap: Voorspelbare processen én kosten

Deze benadering lost direct de twee grootste obstakels op waar organisaties momenteel mee worstelen bij het opschalen van AI-agents:

Voorspelbare resultaten: Een AI-agent die telkens opnieuw live moet uitzoeken hoe hij een proces afhandelt, kan inconsistente antwoorden geven. Binnen de Pega-architectuur volgen agents altijd vooraf goedgekeurde workflows. Dit garandeert een consistente output en is essentieel voor gereguleerde sectoren en organisaties die grip willen houden op hun processen.
Voorspelbare kosten: Omdat de AI niet bij elk nieuw verzoek het wiel opnieuw hoeft uit te vinden, vallen de operationele kosten drastisch lager uit. Volgens Pega kunnen de kosten – afhankelijk van de complexiteit en schaal – tot wel twintig keer lager uitvallen dan bij alternatieven die puur per token afrekenen. Om dit inzichtelijk te maken introduceert Pega tevens een interactieve AI Token Cost Calculator.

Betalen voor uitgevoerd werk, niet voor ‘denktijd’

Het nieuwe afrekenmodel van Pega sluit naadloos aan bij de behoefte aan financiële voorspelbaarheid. Er wordt niet langer afgerekend op basis van licenties of verbruikte tokens, maar per voltooide ‘case’. Een case is een bedrijfskritische taak die van begin tot eind wordt uitgevoerd. Wanneer een gebruiker of klant via een AI-agent bijvoorbeeld een bestaande bestelling wijzigt, telt die volledige interactie als één case.

“Bedrijven realiseren zich dat ’tokenmaxxing’ geen houdbare strategie is. Het leidt uiteindelijk tot oplopende kosten en onvoorspelbare resultaten”, zegt Alan Trefler, oprichter en CEO van Pega. “AI voegt pas echt waarde toe wanneer het op grote schaal betrouwbare resultaten oplevert. Daarom rekenen wij klanten niet af op basis van het aantal tokens dat zij verbruiken, maar op het werk dat daadwerkelijk wordt uitgevoerd. Dankzij onze ingebouwde governance en architectuur bieden we organisaties de flexibiliteit om AI-agents nu écht effectief in te zetten.”

Beschikbaarheid

Pega Infinity ’26 is beschikbaar vanaf het derde kwartaal (Q3) van dit jaar. Klanten betalen een vaste prijs per afgeronde case, ongeacht hoeveel Pega AI er achter de schermen is gebruikt.

Grip op IT-budgetten: Pega introduceert betalen per voltooide case in plaats van tokens

AI-redenering in de ontwerpfase, efficiëntie in de praktijk

Twee vliegen in één klap: Voorspelbare processen én kosten

Betalen voor uitgevoerd werk, niet voor ‘denktijd’

Beschikbaarheid

Buyers’Guide

Categorieën

Service