Cloudflare onthult welke AI-bots en zoekrobots je site tegenwoordig bezoeken – en waarom dat ertoe doet.
Bots in opmars: wie surft er echt op je site?
In 2025 zijn het niet langer alleen mensen die websites bezoeken. Volgens Cloudflare is bijna de helft van al het webverkeer tegenwoordig afkomstig van bots – geautomatiseerde systemen die pagina’s scannen, kopiëren, analyseren of indexeren. Sommige zijn bekend, zoals Googlebot van Google of Bingbot van Microsoft, maar een groeiende groep bestaat uit AI-gerelateerde bots zoals GPTBot van OpenAI en ClaudeBot van Anthropic.
Cloudflare, een toonaangevende speler op het gebied van internetveiligheid en prestatie-optimalisatie, publiceerde een overzicht van welke bots het meest actief zijn op het web – en wat hun doel is. Het bedrijf biedt websitebeheerders bovendien nieuwe tools om deze digitale bezoekers beter te herkennen én te controleren.
Van traditionele zoekbots naar AI-crawlers
Waar Googlebot en Bingbot vooral bedoeld zijn om websites te indexeren voor zoekmachines, is de nieuwste generatie bots gericht op het voeden van grote taalmodellen (LLM’s). Deze AI’s – zoals GPT-4, Claude en Perplexity – worden getraind op miljarden webpagina’s om antwoorden te kunnen formuleren, teksten te genereren of vragen te beantwoorden.
Zo zijn er bots als GPTBot (OpenAI), ClaudeBot (Anthropic), CCBot (Common Crawl) en PerplexityBot (Perplexity.ai) die actief webcontent verzamelen. Maar ook onbekendere crawlers zoals Bytespider (van TikTok-moederbedrijf ByteDance) en Amazonbot (van Amazon) winnen terrein. Ze speuren het web af naar informatie voor toepassingen in onder meer e-commerce, media en entertainment.
Transparantie en controle: wie mag kijken, en wie niet?
Cloudflare merkt op dat niet alle bots zich even netjes gedragen. Sommige respecteren de regels van het internet – zoals robots.txt-bestanden waarin websitebeheerders kunnen aangeven wat wel of niet mag worden gecrawld – terwijl andere die richtlijnen negeren of zich voordoen als legitieme bots.
Om website-eigenaars te helpen controle terug te nemen, biedt Cloudflare nu gedetailleerdere inzichten in wie hun site bezoekt. De “Bot Report”-functie laat exact zien welke crawlers actief zijn, wanneer ze dat doen en hoe vaak. Daarbij kunnen beheerders individuele bots blokkeren of juist toestaan, afhankelijk van hun doel en betrouwbaarheid.
De strijd om publieke webdata is begonnen
In een wereld waarin AI hongerig is naar data, wordt publieke webinhoud steeds waardevoller. Maar dat roept ook ethische en juridische vragen op. Mag een AI-bedrijf zomaar jouw blog of portfolio kopiëren en verwerken in een taalmodel? En wat als jouw content in een AI-antwoordsuggestie belandt zonder vermelding of toestemming?
Cloudflare verwacht dat de discussie hierover alleen maar intenser zal worden. Steeds meer websites overwegen toegang voor AI-bots te beperken of te monetariseren – zoals Cloudflare eerder al aankondigde met zijn “Pay-per-Crawl”-systeem. Tegelijkertijd is er groeiende druk op AI-bedrijven om transparanter te zijn over hun dataverzameling.
Conclusie: ken je digitale bezoekers
Wie in 2025 een website beheert, doet er goed aan te weten wie er werkelijk langskomt. Cloudflare’s rapport en tools maken duidelijk dat het internet niet alleen bewoond wordt door menselijke gebruikers, maar ook door een steeds grotere menigte digitale verkenners. Of het nu om zoekrobots, AI-trainers of dataslurpers gaat – inzicht en controle zijn onmisbaar geworden in deze nieuwe fase van het web.
![]() |
From Googlebot to GPTBot: Who’s crawling your site in 2025From May 2024 to May 2025, crawler traffic rose 18%, with GPTBot growing 305% and Googlebot 96%. This blog post explores crawling activity focused on AI and search web crawlers, and how 14% of top domains now use robots.txt rules to manage them. |