Reddit beschuldigt Perplexity van illegaal oogsten van gebruikersdata

Reddit beschuldigt Perplexity van illegaal oogsten van gebruikersdata

In een opvallende juridische stap heeft Reddit een klacht ingediend tegen Perplexity AI en drie andere bedrijven waarin het sociale medianetwerk beweert dat er ongeautoriseerd gebruikerscommentaren zijn “gescrapet” in het kader van de ontwikkeling van kunstmatige intelligentie (AI).

Reddit sues AI company Perplexity and others for 'industrial-scale' scraping of user comments

Reddit has sued Perplexity AI and three other entities for allegedly scraping user comments for commercial gain.

 

Achtergrond van de zaak

Reddit, een platform met honderd miljoen gebruikers per dag en duizenden community-forumdiscussies, stelt dat Perplexity AI in samenwerking met dataskrapers zoals Oxylabs UAB, AWMProxy en SerpApi, toegang heeft gekregen tot haar inhoud zonder toestemming. Volgens Reddit heeft Perplexity zelfs na een cease-and-desist-brief van mei 2024 de verwijzingen naar Reddit-inhoud “veertigmaal” zien stijgen. 

 

Reddit drags Perplexity in a new lawsuit, accusing it of building up a $20 billion company off stolen data

Reddit says the companies scraped Google's information about Reddit posts rather than sign a deal.

Het platform beschuldigt de betrokken partijen van het opzetten van wat zij “een industriële schaal van data-waspraktijken (“data-laundering”)” noemen: het ongeautoriseerd verzamelen van gebruikersinhoud, verhullen van bots of scrapers en doorverkopen van de gegevens aan AI-bedrijven.

Wat beweert Reddit precies?

  • Reddit beweert dat de scrapers de technologische beschermingen van het platform hebben omzeild, waaronder anti-scraping-maatregelen en crawl-beperkingen.
  • Er is volgens de klacht sprake van een testpost die alleen via Google doorzoekbaar was — en binnen enkele uren bleek de inhoud van die post in de ‘antwoord-engine’ van Perplexity te staan: bewijs, aldus Reddit, dat de data via Google zoekresultaten werden verkregen.
  • Reddit vraagt in haar aanklacht om een verbod op het gebruik van haar content door Perplexity en een financiële schadeloosstelling.

Reactie van Perplexity AI

Perplexity reageert door te stellen dat de klacht onterecht is en dat het bedrijf gebruikersrechten op een “vrije en eerlijke toegang tot publieke kennis” blijft verdedigen. Het bedrijf ontkent zover bekend de inhoud van Reddit zonder toestemming te hebben gebruikt voor het trainen van AI-modellen.

Reddit sues Perplexity for allegedly ripping its content to feed AI

Reddit sues Perplexity for allegedly ripping its content to feed AI

Reddit is suing Perplexity and three “data-scraping service providers” who allegedly have taken Reddit’s data improperly. 

Breder kader: Hoe beïnvloedt dit de AI-industrie?

Deze zaak past in een groeiende reeks conflicten tussen contentplatformen en AI-bedrijven over het gebruik van door gebruikers aangemaakte data voor trainingsdoeleinden. Reddit stapte eerder dit jaar al naar de rechtbank tegen Anthropic op vergelijkbare gronden. 

Het herschrijft de verhoudingen tussen makers van originele content en de AI-sector. Contentplatformen eisen dat hun materiaal niet zomaar door derden wordt geoogst en ingezet, zonder vergoeding, onder het mom van “open data”. Reddit noemt het een “arms race voor kwalitatieve menselijke inhoud” die geleid heeft tot een “data-wasindustrie op industriële schaal”.

 

Reddit Sues Anthropic, Alleging Unlawful Data Use

Reddit filed a lawsuit against AI startup Anthropic, accusing the Claude chatbot developer of unlawfully training its models on Reddit users’ personal data without a license.

Gevolgen en vooruitzicht

Als Reddit gelijk krijgt, zou dat een precedent kunnen scheppen: AI-bedrijven worden dan mogelijk verplicht om licenties te sluiten of anderszins toestemming te krijgen om platformdata te gebruiken, wat hun kostenstructuur en data-strategie flink zou beïnvloeden. Voor Reddit betekent het mogelijke inkomstenverlies bij oncontroleerbare gratis opname van content. Voor gebruikers kan het impliceren dat openbare discussies minder zichtbaar worden — of dat er strengere toegangsregels komen op platforms.


In deze snel veranderende wereld van AI-ontwikkeling en data-rechten zet Reddit met deze stap een stevige toon neer. De uitkomst van deze rechtszaak zal ongetwijfeld brede repercussies hebben voor wie toegang wil tot menselijke input — en wie daar zonder toestemming gebruik van wil maken.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak