Als generatieve AI – in het jargon GenAI – steeds vaker onze vragen beantwoordt en onze informatiebronnen vormt, dreigt er iets veel groters te gebeuren dan alleen een nieuw stukje technologie: we kunnen bezig zijn met het razendsnelle verdwijnen van lokale, traditionele en vaak mondeling overgedragen kennis. Dit artikel onderzoekt hoe die kennis – van taal, ecologie, cultuur – buiten beeld raakt, precies op het moment dat we denken dat we alles weten.
De persoonlijke aanleiding
De auteur beschrijft hoe zijn vader, afkomstig uit Zuid-India, naast de westerse geneeskunde ook geloofde in een oud kruidengeneesmiddel dat spontaan het tumorgroei-proces omkeerde. Hij vond het eerst toevallig, later begon hij te vermoeden dat het niet slechts geluk was – maar eerder een teken dat de digitale kennis waarin hij zelf vertrouwde, grote gaten kent. In zijn studie naar verantwoord ontwerp van AI-systemen aan Cornell University realiseert hij zich dat die gaten niet alleen willekeurig zijn, maar systematisch: de digitale wereld weerspiegelt ongelijkheden in kennisproductie.
|
What AI doesn’t know: we could be creating a global ‘knowledge collapse’ | Deepak Varuvel DennisonThe long read: As GenAI becomes the primary way to find information, local and traditional wisdom is being lost. And we are only beginning to realise what we’re missing |
Taal = drager van kennis
Talen zijn niet alleen communicatiemiddelen, maar dragers van cultuur, ecologie, rituelen en wereldbeelden. Elke taal bevat unieke kennis die vaak mondeling is overgeleverd, ofwel niet gedocumenteerd is. De auteur haalt aan dat slechts een klein fragment van de digitale wereld werkelijk ondersteund wordt door niet-westerse of “low-resource” talen: van alle webpagina’s in de dataset Common Crawl is circa 45% in het Engels, terwijl Engels slechts rond 19% van de wereldbevolking spreekt. Voor het Hindi – derde grootste taalglobaal – is slechts 0,2% van de dataset beschikbaar. Voor het Tamil zelfs slechts 0,04 %. Het gevolg: AI-modellen kennen die talen nauwelijks, en dus ontbreekt kennis die daarin vervat is.
Ecologische en culturele kennis gaat verloren
Omdat AI-systemen vooral getraind worden op digitaal beschikbare teksten, blijven mondelinge of plaatsgebonden vormen van kennis buiten schot. Een voorbeeld: in India bestaan gedetailleerde lokale systemen voor waterbeheer door gemeenschappen – zoals de Neeruganti-gemeenschap in Bengaluru, die eeuwenlang meren en waterkanalen beheerde. Deze kennis verdween grotendeels, uit het zicht van digitale bronnen én dus van AI-systemen. Het is niet zomaar lokaal erfgoedverlies: de auteur waarschuwt dat als zulke systemen verdwijnen, de schade lokaal begint maar uiteindelijk wereldwijd merkbaar wordt – want ecologie en klimaat kennen geen landsgrenzen.
Hoe AI kennis ongelijk versterkt
GenAI-modellen worden getraind op enorme datasets, maar die zijn verre van representatief voor alle vormen van menselijke kennis. Bovendien: modellen neigen naar het versterken van dominante patronen of ideeën – wat de auteur “mode-amplificatie” noemt. Als iets frequent voorkomt in de data, zal het model het relatief nog vaker teruggeven; kennis die zeldzaam of mondeling is, verdwijnt stilletjes van het toneel. Hierdoor ontstaan “feedback loops” waarin AI-geproduceerde inhoud opnieuw wordt opgenomen in trainingsdata, wat een zelfversterkend effect heeft op wat “kennis” wordt geacht.
De term “knowledge collapse”
De auteur citeert onderzoeker Andrew Peterson, die het fenomeen beschrijft als “knowledge collapse” – een geleidelijke versmalling van de beschikbare kennis, terwijl alternatieve of obscure gezichtspunten steeds onzichtbaarder worden. Het is alsof we met een zaklamp alleen de plekken opzoeken waar al licht is (“streetlight effect”), in plaats van dieper te graven in waar het écht betekenisvol is.
De implicaties voor onderwijs en samenleving
Nu GenAI steeds vaker ingezet wordt in onderwijs, zelfstudie en leermiddelen – bijvoorbeeld via collaboraties in India – rijst de vraag: hoe zit het met die vergeten kennis? Als AI-tutoren en leermodules geen toegang hebben tot lokale of inheemse kennis, riskeren we generaties die opgevoed worden zonder die fundamenten, zonder verbinding met contexten waarin ze leven.De auteur vraagt zich af: kunnen we de technologische toekomst omarmen én tegelijk authentiek omgaan met de kennisverzamelingen die we eeuwenlang hebben genegeerd? Of zullen we doorgaan op het spoor van homogenisering en tenslotte beseffen dat we iets onherstelbaars verloren hebben?
De auteur geeft toe dat hij zelf sceptisch blijft tegenover het kruidengeneesmiddel van zijn vader. Maar hij erkent de eerlijkheid van zijn twijfel: misschien begint wijsheid met te accepteren dat je niet alles weet. Hij concludeert dat, zolang we niet kritisch kijken naar welke kennis telt – welke kennis we waarderen of onderwaarderen – zelfs de meest geavanceerde “superintelligentie” niets kan compenseren voor het verlies van eeuwenoude menselijke kennissystemen.
De waarschuwing is helder: technologie kan nooit de enige maatstaf zijn voor kennis. Wie weet welke waardevolle inzichten er verdwijnen terwijl we druk bezig zijn onze AI’s te trainen?Voor iedereen die zich bezighoudt met AI, onderwijs, cultuur of duurzaamheid: het is tijd om stil te staan bij de gaten in onze digitale archieven, en vooral bij wat er níet in zit.









