- Grote taalmodellen zijn getraind op enorme hoeveelheden gegevens die van internet zijn geschraapt om menselijke reacties te genereren.
- Website-uitgevers hadden eerder geen manier om zich af te melden voor het gebruik van hun gegevens voor het trainen van AI-modellen.
Website-uitgevers kunnen zich nu eenvoudig afmelden voor Google Bard of andere toekomstige AI-modellen die Google maakt voor het gebruik van hun gegevens voor training.
Google kondigde op donderdag (28 september) aan dat er een manier is om u af te melden door “User-Agent: Google-Extended” te verbieden in het robots.txt-document van de site.
Met de nieuwe tool kunnen sites doorgaan met schrapen en indexeren door crawlers zoals de Google-bot.
Dit volgt op een vergelijkbare stap van OpenAI, de maker van ChatGPT, die onlangs zijn eigen webcrawler heeft gelanceerd, met instructies over hoe u deze kunt blokkeren.
Veel sites hebben al stappen ondernomen om de webcrawler van OpenAI te blokkeren. Opvallend daarbij zijn Medium, CNN, Reuters en de New York Times.