Wie zelf een website heeft zal niet blij zijn als alle content zomaar door AI bots wordt gebruikt om nieuwe content mee te genereren. De makers van ChatGPT bieden nu de mogelijkheid om de bot te blokkeren op je website en zo ChatGPT plagiaat te voorkomen.
AI bots en websites
AI taalmodellen zoals ChatGPT worden getraind met enorme hoeveelheden teksten, zoals boeken, artikelen en webpagina’s. ChatGPT is getraind met de Common Crawl dataset, maar gebruikers kunnen de AI ook trainen met eigen data of bijvoorbeeld webpagina’s die publiek toegankelijk zijn.
Bij het trainen van AI-modellen worden ook auteursrechtelijk beschermde werken zonder toestemming gebruikt, wat al heeft geleid tot rechtszaken.
Als je geen maatregelen neemt, kunnen de gegevens van jouw website als bron voor ChatGPT worden gebruikt. Delen van de content op je website kunnen dan opduiken in door ChatGPT gegenereerde teksten. Om ChatGPT plagiaat te voorkomen kun je echter aangeven dat jouw content niet meer voor training gebruikt mag worden.
ChatGPT plagiaat voorkomen
Je kunt aangeven dat de Crawler van OpenAI, het bedrijf achter ChatGPT, jouw site niet mag bezoeken. Dat kan via het robots.txt bestand, waar ook andere bots zoals die van Google zich aan houden als ze een website bezoeken.
Met de juiste instructie in het tekstbestand zal de bot van OpenAI je content niet gebruiken voor trainingsdoeleinden. Zo sluit het bedrijf in elk geval beter aan bij de Europese Auteurswet.
ChatGPT bot blokkeren
Om voor GPTBot, de crawler van OpenAI, helemaal de toegang tot je website te blokkeren, voeg je de volgende twee regels toe aan robots.txt:
User-agent: GPTBot
Disallow: /
Gericht ChatGPT plagiaat voorkomen
Misschien wil je niet de toegang tot je hele website blokkeren voor de GPTBot, maar alleen bepaalde delen. Of je wilt bijna alles blokkeren, maar een bepaald deel wel toegankelijk maken.
Meer informatie over de GPTBot en hoe je die blokkeert geeft OpenAI op de eigen website.
Zo kun je in elk geval ChatGPT buiten de deur houden, maar het zou nog mooier zijn als er een universele regel was om alle AI-bots te blokkeren. En de optie in robots.txt is een opt-out, die ook nog eens vrijwillig is. Al vergaarde data blijft in het taalmodel aanwezig.
Ontvang gratis informatie en tips over ChatGPT en andere kunstmatige intelligentie, schrijf je in voor de nieuwsbrief:
Lees meer over Chat GPT