Het is een paradox: terwijl AI-tools steeds slimmer worden en steeds meer kunnen, wordt hun output steeds dommer. De reden: internet wordt voor een aanzienlijk deel gevuld met onzinnige, foutieve of soms zelfs misleidende AI-content, die op zijn beurt weer gebruikt wordt om nieuwe AI-modellen te trainen, die weer iets dommere resultaten opleveren, enzovoort.
In juli van dit jaar merkten wetenschappers van de universiteiten van Stanford en Berkeley al dat het nieuwste model van de bot, GPT-4, de laatste tijd minder goed presteert dan versie 3.5. Zij concludeerden dat het constant monitoren van de technologie een must is vanwege het gebrek aan consistentie.
Het internet wordt overspoeld met rommel
Het internet raakt steeds voller met door AI gegenereerde teksten, afbeeldingen en video’s. Zo bleek de ‘young adult’ top-100 van Amazon tjokvol boeken te staan die door AI gegenereerd zijn en onzinnige titels hadden als ‘Apricot bar code architecture’. Volgens schattingen zal over drie jaar zelfs zo’n 90% van de totale content op internet door AI gemaakt zijn…
Het probleem is dat AI geen menselijk referentiekader heeft, en dus zet het met een gerust hart foto’s van een Mexicaanse stad in een reisgids over Amsterdam, en plaatst het verouderde of foutieve informatie op het internet. Deze foutieve informatie wordt weer gebruikt om nieuwe taalmodellen te trainen enzovoort. Dit wordt ‘Model Collapse’ genoemd.
En als binnenkort nog maar 10% van het internet ‘betrouwbaar’is, hoe betrouwbaar is de output van de AI-modellen dan die getraind zijn met deze rommel?
De maker van ChatGPT, OpenAI, lijkt hier niet mee te zitten. Het brengt de nieuwste versie zo snel mogelijk op de markt, zonder zich te bekommeren om onderzoek te doen naar de effecten. Er is één lichtpuntje: ‘echte’ informatie van mensen / wetenschappers zou wel eens waardevoller kunnen worden, en mensen zullen wellicht gaan teruggrijpen op echte, door mensen gemaakte teksten. Vooralsnog is daar echter weinig zicht op; als je ziet hoeveel mensen ‘zelf onderzoek gedaan hebben op internet, en de echte waarheid ontdekt hebben’, zich daarbij baserend op fabeltjes, onzin en desinformatie…