In een opvallende juridische stap heeft Reddit een klacht ingediend tegen Perplexity AI en drie andere bedrijven waarin het sociale medianetwerk beweert dat er ongeautoriseerd gebruikerscommentaren zijn “gescrapet” in het kader van de ontwikkeling van kunstmatige intelligentie (AI).
Reddit sues AI company Perplexity and others for 'industrial-scale' scraping of user commentsReddit has sued Perplexity AI and three other entities for allegedly scraping user comments for commercial gain. |
Achtergrond van de zaak
Reddit, een platform met honderd miljoen gebruikers per dag en duizenden community-forumdiscussies, stelt dat Perplexity AI in samenwerking met dataskrapers zoals Oxylabs UAB, AWMProxy en SerpApi, toegang heeft gekregen tot haar inhoud zonder toestemming. Volgens Reddit heeft Perplexity zelfs na een cease-and-desist-brief van mei 2024 de verwijzingen naar Reddit-inhoud “veertigmaal” zien stijgen.
Reddit drags Perplexity in a new lawsuit, accusing it of building up a $20 billion company off stolen dataReddit says the companies scraped Google's information about Reddit posts rather than sign a deal. |
Het platform beschuldigt de betrokken partijen van het opzetten van wat zij “een industriële schaal van data-waspraktijken (“data-laundering”)” noemen: het ongeautoriseerd verzamelen van gebruikersinhoud, verhullen van bots of scrapers en doorverkopen van de gegevens aan AI-bedrijven.
Wat beweert Reddit precies?
- Reddit beweert dat de scrapers de technologische beschermingen van het platform hebben omzeild, waaronder anti-scraping-maatregelen en crawl-beperkingen.
- Er is volgens de klacht sprake van een testpost die alleen via Google doorzoekbaar was — en binnen enkele uren bleek de inhoud van die post in de ‘antwoord-engine’ van Perplexity te staan: bewijs, aldus Reddit, dat de data via Google zoekresultaten werden verkregen.
- Reddit vraagt in haar aanklacht om een verbod op het gebruik van haar content door Perplexity en een financiële schadeloosstelling.
Reactie van Perplexity AI
Perplexity reageert door te stellen dat de klacht onterecht is en dat het bedrijf gebruikersrechten op een “vrije en eerlijke toegang tot publieke kennis” blijft verdedigen. Het bedrijf ontkent zover bekend de inhoud van Reddit zonder toestemming te hebben gebruikt voor het trainen van AI-modellen.
|
Reddit sues Perplexity for allegedly ripping its content to feed AIReddit is suing Perplexity and three “data-scraping service providers” who allegedly have taken Reddit’s data improperly. |
Breder kader: Hoe beïnvloedt dit de AI-industrie?
Deze zaak past in een groeiende reeks conflicten tussen contentplatformen en AI-bedrijven over het gebruik van door gebruikers aangemaakte data voor trainingsdoeleinden. Reddit stapte eerder dit jaar al naar de rechtbank tegen Anthropic op vergelijkbare gronden.
Het herschrijft de verhoudingen tussen makers van originele content en de AI-sector. Contentplatformen eisen dat hun materiaal niet zomaar door derden wordt geoogst en ingezet, zonder vergoeding, onder het mom van “open data”. Reddit noemt het een “arms race voor kwalitatieve menselijke inhoud” die geleid heeft tot een “data-wasindustrie op industriële schaal”.
Reddit Sues Anthropic, Alleging Unlawful Data UseReddit filed a lawsuit against AI startup Anthropic, accusing the Claude chatbot developer of unlawfully training its models on Reddit users’ personal data without a license. |
Gevolgen en vooruitzicht
Als Reddit gelijk krijgt, zou dat een precedent kunnen scheppen: AI-bedrijven worden dan mogelijk verplicht om licenties te sluiten of anderszins toestemming te krijgen om platformdata te gebruiken, wat hun kostenstructuur en data-strategie flink zou beïnvloeden. Voor Reddit betekent het mogelijke inkomstenverlies bij oncontroleerbare gratis opname van content. Voor gebruikers kan het impliceren dat openbare discussies minder zichtbaar worden — of dat er strengere toegangsregels komen op platforms.
In deze snel veranderende wereld van AI-ontwikkeling en data-rechten zet Reddit met deze stap een stevige toon neer. De uitkomst van deze rechtszaak zal ongetwijfeld brede repercussies hebben voor wie toegang wil tot menselijke input — en wie daar zonder toestemming gebruik van wil maken.









