Blockchain hologram illustration. Concept of cryptocurrency and digital money. 3d rendering

Next-token prediction: waarom ChatGPT niet “denkt” maar voorspelt, en wat dat betekent voor zakelijk gebruik

3 weken geleden

Next-token prediction is het kernmechanisme achter alle LLMs – de voorspelling van het volgende woord op basis van alle voorgaande woorden. Precies zoals autocorrect op je telefoon, maar dan complexer: met pre-training, hallucinaties en context rot.

ChatGPT, Claude, en andere taalmodellen lijken intelligent te converseren. Ze beantwoorden vragen, schrijven rapporten, en analyseren data alsof ze begrijpen wat ze doen. Die indruk is misleidend. Wat eruitziet als begrip is statistisch patronenherkenning. De modellen voorspellen het volgende woord op basis van alle voorgaande woorden. Dat mechanisme heet next-token prediction, en het verklaart zowel de kracht als de beperkingen van AI. Wil je AI zakelijk inzetten, dan zul je moeten weten hoe dit werkt.

Next-token prediction verklaart waarom AI soms briljant is en soms totale onzin produceert. Het verduidelijkt welke taken geschikt zijn voor automatisering en welke menselijke controle vereisen. En het helpt je inschatten waar AI-ontwikkeling heen gaat en welke investeringen renderen. Die kennis onderscheidt bedrijven die AI strategisch inzetten van bedrijven die blind vertrouwen op technologie die ze niet begrijpen.

Zoals autocorrect op je telefoon, maar dan miljarden keren krachtiger

Begin met iets dat iedereen kent: de autocorrect-functie op je smartphone. Als je “Ik ga naar de super” typt, suggereert je telefoon “markt” als volgend woord. Die suggestie komt niet omdat je telefoon begrijpt wat een supermarkt is, maar omdat die woordcombinatie statistisch vaak voorkomt. Miljarden mensen typten die zin eerder, en je telefoon leerde dat patroon.

Next-token prediction werkt identiek maar op gigantische schaal. Waar je telefoon suggereert gebaseerd op miljoen zinnen, is ChatGPT getraind op triljoenen woorden uit het internet. Die schaal maakt het verschil tussen simpele autocorrect en wat lijkt op intelligentie. De voorspelling wordt zo precies dat output coherent, relevant, en vaak correct is. Maar het blijft voorspelling, geen begrip.

De zakelijke implicatie van dit mechanisme is fundamenteel: AI “weet” niets, het voorspelt wat statistisch waarschijnlijk volgt. Voor taken waar statistische patronen betrouwbaar zijn – standaard e-mails schrijven, data samenvatten, veelvoorkomende vragen beantwoorden – werkt dit uitstekend. Voor taken die werkelijk begrip vereisen – ethische afwegingen maken, creatief probleemoplossen, of situaties beoordelen zonder precedent – faalt het mechanisme.

Wat een token is en waarom dat relevant is voor bedrijfsgebruik

Het woord “token” klinkt technisch maar is eenvoudig: het is de kleinste eenheid die het model verwerkt. Meestal is een token ongeveer een woord, maar niet altijd. “Onbegrijpelijk” is één woord maar kan drie tokens zijn: “on”, “begrij”, “pelijk”. Die opdeling gebeurt omdat het model leert via deelpatronen, niet hele woorden.

Waarom is dat relevant? Omdat de kosten van AI-gebruik berekend worden per token. OpenAI rekent per 1.000 tokens input en output. Een bedrijf dat duizenden documenten analyseert, betaalt voor ieder token dat verwerkt wordt. Lange documenten kosten exponentieel meer dan korte. Die kostenstructuur dwingt tot efficiency: voorbewerken van tekst, samenvatten voordat analyseren, en comprimeren waar mogelijk.

Tokens bepalen ook de limieten van wat modellen kunnen verwerken. Claude heeft een context window van 200.000 tokens – ongeveer 150.000 woorden. Meer dan dat past niet in één analyse. Voor bedrijven die hele contractendatabases willen doorzoeken of jaren bedrijfscommunicatie analyseren, betekent dit dat werk opgedeeld moet worden. Die technische beperking heeft strategische consequenties voor hoe je AI-projecten inricht.

Hoe voorspelling eigenlijk werkt: van “de kat zit op” naar “de mat”

Als een model de zin “De kat zit op” ziet, voorspelt het het volgende woord door alle vergelijkbare zinnen te analyseren die het tijdens training zag. “De kat zit op de mat” kwam vaak voor. “De kat zit op de tafel” ook. “De kat zit op maandag” zelden. Het model geeft ieder mogelijk volgend woord een waarschijnlijkheidsscore. “De” krijgt hoge score, “mat” redelijk, “maandag” laag.

Die scores komen uit miljoenen vergelijkbare zinnen. Het model bouwt geen begrip van wat een kat is of waar die zit, maar leert statistische samenhang tussen woorden. “Kat” en “mat” komen vaker samen voor dan “kat” en “maandag” in de trainingsdata. Die correlatie drijft voorspelling, niet causaal begrip.

De zakelijke consequentie: AI reproduceert patronen uit trainingsdata. Als die data vooroordelen bevat – bijvoorbeeld dat managers meestal mannelijk zijn in voorbeeldzinnen – reproduceert AI die vooroordelen. Bedrijven die AI gebruiken voor recruitment, promoties, of klantsegmentatie, moeten bewust zijn dat statistische voorspelling bestaande patronen versterkt in plaats van corrigeert. Die bias is niet kwaadwillig maar inherent aan het mechanisme.

Waarom voorspelling vaak briljant is maar soms compleet fout

Next-token prediction produceert meestal coherente output omdat menselijke taal voorspelbaar is. Zakelijke communicatie volgt formules. Rapporten hebben standaardstructuren. E-mails gebruiken herkenbare openings- en slotformules. Die voorspelbaarheid maakt AI effectief voor routine-communicatie. Het model voorspelt de volgende zin omdat miljarden voorbeelden dezelfde structuur volgden.

Maar voorspelling faalt bij uitzonderingen. Als een vraag uniek is of een situatie geen precedent heeft – lees: het is echt iets nieuws voorspellen – dab voorspelt het model wat statistisch lijkt te passen zonder te begrijpen of dat klopt. Vraag ChatGPT om een specialist in niche-onderwerp te vinden, en het verzint namen die plausibel klinken maar niet bestaan. Die hallucinaties komen omdat het model voorspelt hoe een expertnaam eruitziet, niet omdat het weet wie expert is. Dat is dus ook een bias: als de eerste 10 ontwikkelaars een man zijn, dan voorspelt AI dat de 11e, 12e en de volgende duizend ontwikkelaars ook man zijn.

De zakelijke implicatie is kritisch: AI-output vereist verificatie. Voor low-stakes toepassingen – marketingteksten schrijven, samenvattingen maken – zijn occasionele fouten acceptabel. Voor high-stakes beslissingen – juridische analyses, medische diagnoses, financieel advies – zijn hallucinaties catastrofaal. Die risicobeoordeling bepaalt waar AI-automatisering verantwoord is en waar menselijke controle verplicht blijft.

Hoe pre-training werkt: het model leert voorspellen op internet-schaal

Pre-training is de fase waarin foundation models leren voorspellen. Het model krijgt miljarden webpagina’s, boeken, en artikelen. Voor iedere zin wordt één woord verborgen, en het model moet voorspellen wat daar stond. Klopt de voorspelling? Het model past zijn interne parameters aan om volgende keer beter te voorspellen. Zit het ernaast? Het past sterker aan. Die cyclus herhaalt miljarden keren.

Die training kost miljoenen dollars aan rekenkracht en maanden tijd. Daarom doen alleen grote techbedrijven zoals OpenAI, Anthropic, en Google het. Het resultaat is een foundation model – een basismodel dat algemeen kan voorspellen maar nog niet gespecialiseerd is. Dat model is de commodity die bedrijven gebruiken als startpunt.

De zakelijke implicatie: pre-training is te duur voor individuele bedrijven, maar fine-tuning op proprietary data is betaalbaar. Een foundation model kent algemene taal maar niet jouw branche-jargon, productnamen, of specifieke processen. Door het model te trainen op jouw interne documenten, leert het voorspellen volgens jouw patronen. Die specialisatie creëert voordeel omdat concurrenten zonder jouw data die voorspellingen niet repliceren.

Waarom foundation models generiek zijn en specialisatie waarde creëert

ChatGPT is getraind op het hele internet en voorspelt daarom gemiddeld. Het schrijft zoals miljoenen websites schrijven: generiek, veilig, en weinig onderscheidend. Voor een advocatenkantoor dat contracten analyseert, mist ChatGPT juridische nuance. Voor een ziekenhuis dat medische notities samenvat, mist het klinische precisie. Die generieke output is bruikbaar maar niet excellent.

Specialisatie ontstaat door het foundation model verder te trainen op domein-specifieke data. Een foundation model dat nadien miljoenen juridische contracten zag, voorspelt volgens juridische conventies. Een model getraind op medische literatuur, voorspelt medische terminologie correct. Die fine-tuning transformeert generieke output in expert-niveau resultaten binnen het domein.

De zakelijke kans ligt in die specialisatie. Grote techbedrijven bouwen foundation models, maar individuele bedrijven kunnen die modellen specialiseren voor hun niche. Een logistiek bedrijf dat het model traint op eigen verzenddata, voorspelt routes en planningen beter dan generieke AI. Een accountantskantoor dat het model voedt met belastingregels, produceert accuratere analyses. Die proprietary specialisatie is duurzaam concurrentievoordeel omdat replicatie jouw data vereist.

Het verband tussen tokens, context, en waarom context rot gebeurt

Context rot is het fenomeen waarbij AI-modellen eerdere informatie “vergeten” naarmate conversaties langer worden. Dat lijkt vreemd – waarom zou een computer iets vergeten? – maar volgt logisch uit hoe next-token prediction werkt. Het model voorspelt gebaseerd op alle voorgaande tokens, maar dat “alle” heeft een limiet.

Die limiet heet de context window. Claude verwerkt 200.000 tokens tegelijk. Klinkt veel, maar een uitgebreide conversatie bereikt die grens snel. Als de window vol is, moet het model oude tokens “vergeten” om nieuwe te verwerken. Informatie uit het begin van de conversatie valt uit de context. Het model voorspelt nog steeds het volgende token, maar zonder kennis van wat uren geleden gezegd werd.

De zakelijke consequentie: lange AI-interacties – zoals chatbots die hele klantgeschiedenis moeten kennen – vereisen externe memory-systemen. De AI zelf onthoudt niet, dus belangrijke informatie moet opgeslagen worden in databases die de AI raadpleegt. Die architectuur is complexer maar noodzakelijk voor continuïteit. Bedrijven die dit missen, bouwen chatbots die frustreren omdat klanten zich moeten herhalen.

Waarom AI niet “liegt” maar onzeker voorspelt

Als ChatGPT een feitelijk onjuist antwoord geeft, beschrijven mensen dat als “liegen”. Maar liegen impliceert intentie om te misleiden. AI heeft geen intenties. Het voorspelt tokens die statistisch passen, ongeacht waarheid. Als de vraag uniek is en trainingsdata geen duidelijk antwoord biedt, voorspelt het model iets dat plausibel klinkt gebaseerd op vergelijkbare patronen.

Die “hallucinaties” zijn niet bugs maar inherent aan next-token prediction. Het model moet altijd iets voorspellen, ook als het onzeker is. Menselijke onzekerheid uit zich in “ik weet het niet”. AI-onzekerheid uit zich in voorspellingen met lage confidence die toch worden gegenereerd omdat het systeem geen optie heeft om te stoppen.

De zakelijke oplossing is tweeledig. Eerste: gebruik AI voor domeinen waar trainingsdata rijk is en patronen betrouwbaar. Vraag niet om obscure feiten maar om synthese van bekende informatie. Tweede: implementeer verificatie-stappen. Kritische output – contracten, medisch advies, financiële analyses – vereist menselijke controle die hallucinaties detecteert voordat ze schade veroorzaken.

De rol van temperatuur in voorspelling en zakelijke implicaties

Temperatuur is een parameter die bepaalt hoe “creatief” AI voorspelt. Lage temperatuur betekent: kies altijd het meest waarschijnlijke volgende token. Hoge temperatuur betekent: introduceer willekeur en kies soms minder waarschijnlijke tokens. Die keuze heeft grote impact op output-karakter.

Lage temperatuur produceert voorspelbare, consistente, en vaak saaie output. Vraag tien keer hetzelfde, krijg tien keer hetzelfde antwoord. Hoge temperatuur produceert gevarieerde, creatieve, maar soms bizarre output. Dezelfde vraag levert tien verschillende antwoorden, waarvan sommige briljant en anderen onbruikbaar.

De zakelijke keuze hangt af van toepassing. Voor feitelijke taken – data-extractie, samenvattingen, classificatie – wil je lage temperatuur voor consistentie. Voor creatieve taken – marketingteksten, brainstorms, variant-generatie – wil je hogere temperatuur voor diversiteit. Die parameter-tuning is subtiel maar impactvol. Bedrijven die blind defaults gebruiken, missen optimalisatie die output substantieel verbetert.

Waarom meer tokens niet altijd betere voorspelling betekent

Langere context windows lijken beter – meer informatie moet leiden tot betere voorspelling. Maar onderzoek toont dat modellen informatie in het midden van lange contexten vaak negeren. Ze focussen op de start (waar introductie staat) en het einde (waar de vraag staat) maar missen details in het midden. Die “lost in the middle“-problematiek beperkt de waarde van extreme context lengths.

Die limitatie komt doordat attention-mechanismen – hoe modellen bepalen welke voorgaande tokens relevant zijn – kosten meer naarmate context groeit. Bij 200.000 tokens kan het model niet ieder token evenveel aandacht geven. Het maakt shortcuts, en die shortcuts betekenen dat middelste informatie onderbelicht blijft.

De zakelijke implicatie: structureer input strategisch. Zet de belangrijkste informatie aan het begin of einde van prompts, niet in het midden. Voor lange documenten, splits analyse in delen in plaats van alles tegelijk verwerken. Die bewuste structurering compenseert model-beperkingen en verbetert resultaat zonder duurdere modellen te vereisen.

Hoe bedrijven next-token prediction strategisch kunnen uitbuiten

Begrijpen dat AI voorspelt in plaats van begrijpt, opent strategische mogelijkheden. De eerste is proprietary training data. Als jouw data patronen bevat die nergens anders bestaan, kan alleen jouw AI die patronen voorspellen. Concurrenten met dezelfde foundation model maar zonder jouw data, produceren inferieure output. Die data-moat is duurzaam voordeel.

De tweede is bewuste keuze welke taken geschikt zijn voor voorspelling. Repetitieve taken met duidelijke patronen – facturen verwerken, standaard e-mails beantwoorden, data categoriseren – zijn ideaal. Het model leert patronen en repliceert die betrouwbaar. Unieke taken zonder patronen – strategische beslissingen, crisis-management, ethische dilemma’s – zijn ongeschikt omdat geen trainingsdata bestaat die correcte voorspelling garandeert.

De derde is continue verbetering door feedback. Iedere keer dat mensen AI-output corrigeren, ontstaat nieuwe trainingsdata. Die correcties verfijnen voorspellingen. Bedrijven die systematisch feedback verzamelen en modellen retrainen, creëren vliegwiel-effect waar AI maandelijks beter wordt. Concurrenten die AI statisch gebruiken, blijven bij initiële prestaties.

Waarom menselijke verificatie onmisbaar blijft ondanks betere modellen

Toekomstige modellen voorspellen nauwkeuriger door meer trainingsdata en geavanceerdere architecturen. Maar fundamenteel blijven ze voorspellingsmachines. Die aard betekent dat hallucinaties nooit volledig elimineren. Het model kan altijd een vraag krijgen buiten zijn trainingsdata, en dan voorspelt het iets dat klinkt als antwoord maar feitelijk onjuist is.

Die inherente onzekerheid dwingt tot verificatie-architectuur. AI genereert output, mensen verifiëren voordat die output consequenties heeft. Die verdeling maximaliseert efficiency – AI doet het zware werk – terwijl risico gemitigeerd wordt door menselijke controle. Bedrijven die die verificatiestap weglaten om kosten te besparen, creëren risico’s die groter zijn dan de besparingen.

De verificatiestap hoeft niet alles te checken. Voor low-stakes output volstaat steekproefsgewijze controle. Voor high-stakes output is volledige verificatie nodig. Die risico-gebaseerde benadering optimaliseert menselijke tijd terwijl veiligheid gewaarborgd blijft. De kunst is inschatten wat low versus high-stakes is en daar processen op inrichten.

De toekomst van next-token prediction en bedrijfsimpact

Next-token prediction evolueert in twee richtingen. Eerste: modellen worden beter in voorspellen door meer data en verfijnde training. Die verbetering maakt AI bruikbaar voor meer taken maar verandert het fundamentele mechanisme niet. Tweede: hybride systemen combineren voorspelling met externe kennisbronnen – databases, zoekmachines, gespecialiseerde tools. Die combinatie compenseert beperkingen van pure voorspelling.

Die hybride richting is strategisch belangrijk. Bedrijven bouwen niet één AI-model maar ecosystemen waar modellen samenwerken met traditionele software. Een AI voorspelt welke klant waarschijnlijk opzegt, een database levert klantgeschiedenis, een regelengine bepaalt retentie-actie. Die orkestratie combineert sterke punten van voorspelling met precisie van deterministische systemen.

De bedrijfsimpact is dat AI-strategie breder wordt dan model-selectie. Het gaat om architectuur: hoe koppel je voorspelling aan verificatie, aan data, aan business logic. Die systeemdenken onderscheidt succesvolle AI-implementaties van mislukkingen. Bedrijven die AI als magic box behandelen, missen die architectuur en bouwen fragiele oplossingen. Bedrijven die begrijpen hoe voorspelling werkt en complementeren met verificatie en context, bouwen robuuste systemen die schalen.

Praktische checklist voor zakelijk gebruik van voorspellende AI

Voordat je AI implementeert, vraag: is deze taak geschikt voor statistische voorspelling? Taken met duidelijke patronen in trainingsdata zijn ideaal. Taken die werkelijk begrip vereisen, zijn risicovol. Die vraag filtert use cases die waarschijnlijk slagen van cases die frustratie opleveren.
Implementeer verificatie-lagen voor kritieke output. AI voorspelt, mensen checken, systemen publiceren alleen na goedkeuring. Die workflow voorkomt dat hallucinaties klanten bereiken. De verificatie kost tijd maar minder dan reputatieschade van foute informatie.
Verzamel proprietary trainingsdata die uniek is voor jouw bedrijf. Die data maakt jouw AI-voorspellingen beter dan concurrenten met generieke modellen. Die datavoorsprong is duurzaam voordeel dat moeilijk in te halen valt.
Monitor output continu op kwaliteit. AI die aanvankelijk goed presteerde, degradeert als data veroudert of gebruikspatronen verschuiven. Die monitoring detecteert problemen voordat klanten ze opmerken en triggert retraining wanneer nodig.
Train teams in begrijpen hoe voorspelling werkt. Mensen die snappen dat AI voorspelt in plaats van begrijpt, gebruiken het effectiever. Ze stellen betere prompts, herkennen onbetrouwbare output, en weten wanneer menselijk oordeel noodzakelijk is. Die AI-literacy is competitief voordeel.

Thomas Lapperre

Eigenaar Bloeise. Neemt altijd de zakelijke insteek. Schrijft over organisatie, IT infrastructuur en innovatie. Voor digitale bureaus, IT-bedrijven en mkb-bedrijven. Link met mij op LinkedIn.

Alle artikelen van Thomas Lapperre

Reacties

0 Reacties

Reageer als eerste

Next-token prediction: waarom ChatGPT niet “denkt” maar voorspelt, en wat dat betekent voor zakelijk gebruik

Zoals autocorrect op je telefoon, maar dan miljarden keren krachtiger

Wat een token is en waarom dat relevant is voor bedrijfsgebruik

Hoe voorspelling eigenlijk werkt: van “de kat zit op” naar “de mat”

Waarom voorspelling vaak briljant is maar soms compleet fout

Hoe pre-training werkt: het model leert voorspellen op internet-schaal

Waarom foundation models generiek zijn en specialisatie waarde creëert

Het verband tussen tokens, context, en waarom context rot gebeurt

Waarom AI niet “liegt” maar onzeker voorspelt

De rol van temperatuur in voorspelling en zakelijke implicaties

Waarom meer tokens niet altijd betere voorspelling betekent

Hoe bedrijven next-token prediction strategisch kunnen uitbuiten

Waarom menselijke verificatie onmisbaar blijft ondanks betere modellen

De toekomst van next-token prediction en bedrijfsimpact

Praktische checklist voor zakelijk gebruik van voorspellende AI

Thomas Lapperre

Delen op

Reacties

Ook interessant

De AI-hype kraakt onder zijn eigen gewicht

RAG: hoe je AI toegang geeft tot je eigen kennis zonder het model te hertrainen

Brand mentions of backlinks: welke telt écht voor AI overviews?