Cybersecurity 2.0: AI die fouten vindt én repareert

Cybersecurity 2.0: AI die fouten vindt én repareert

Anthropic – een toonaangevend bedrijf in de ontwikkeling van kunstmatige intelligentie – onthult in een recent onderzoeksartikel hoe het zijn Claude-model verder verfijnt om niet alleen aanvallers, maar ook verdedigers in de cyberspace te versterken. Het gaat er niet om om hackers te verslaan met brute kracht, maar om slimme ondersteuning te bieden aan degenen die onze digitale infrastructuur bewaken.

Building AI for cyber defenders

How we've improved Claude's cyber defense skills

ONTDEK MEER

 

Een keerpunt in cyber­beveiliging

Volgens Anthropic bevinden we ons op een omslagpunt: AI wordt niet langer enkel gezien als theoretisch hulpmiddel, maar als praktisch instrument in de strijd tegen cyberdreigingen. Tot voor kort bleven AI-modellen qua geavanceerde cybercapaciteiten vaak achter; maar recent onderzoek en experimenten tonen een snelle evolutie.

Het Claude-model is al ingezet om kwetsbaarheden in de eigen codes van Anthropic op te sporen en te verhelpen vóór publieke releases.

Claude Sonnet 4.5: Glasheldere focus op cyberverdediging

Anthropic stelde een onderzoeks­team samen om Claude specifiek te versterken op het detecteren en repareren van kwetsbaarheden – zonder de nadruk te leggen op offensieve vaardigheden zoals geavanceerde exploitatie of malware-ontwikkeling.

Onder de motorkap:

  • Claude Sonnet 4.5 is qua cybercapaciteit vergelijkbaar met, of soms zelfs beter dan, de eerdere Opus 4.1-versie.
  • In gestandaardiseerde tests (zoals Cybench) behaalde Sonnet 4.5 indrukwekkende successen: uitdagingen die voor mensen uren zouden duren, loste het model in minuten op.
  • In de CyberGym-benchmark, waarin echte open-sourceprojecten worden getest, scoorde Sonnet 4.5 aanzienlijk beter dan eerdere Claude-versies.
  • Ook het genereren van patches (het repareren van laakbaar code) wordt onderzocht; in sommige experimenten bleek 15 % van de gegenereerde fixes semantisch gelijk aan referentiepatches geschreven door mensen.

Samenwerking met de praktijk

Anthropic erkent dat realistische cyberuitdagingen complexer zijn dan laboratoriumtesten. Daarom werkt het bedrijf samen met organisaties die AI in de praktijk inzetten, bijvoorbeeld op het vlak van netwerkbeveiliging, dreigingsanalyse of automatische patchtoepassing.

Enkele getuigenissen:

  • HackerOne merkte op dat Sonnet 4.5 de gemiddelde verwerkingstijd van kwetsbaarheidsmeldingen met 44 % verminderde, terwijl de nauwkeurigheid met 25 % toenam.
  • Bij CrowdStrike ziet men dat Claude creatieve aanvalsscenario’s genereert — wat de verdediging over verschillende lagen (endpoint, cloud, identiteitsbeheer) versterkt.

Toekomstvisie: Waar naartoe?

Anthropic streeft ernaar om defensieve AI-capaciteiten verder te ontwikkelen — bijvoorbeeld door betere dreigingsinformatie, meer robuuste misbruikdetectie en verfijnde evaluatiemethoden. 

Ze pleiten ook voor breed gebruik: zoveel mogelijk organisaties zouden moeten experimenteren met AI in hun beveiligingsarchitectuur en meetmethoden ontwikkelen om de winst nauwkeurig te kwantificeren.

Daarnaast is er een dringend debat nodig over veilige ontwerpen en weerbare digitale infrastructuren — AI kan daarin ondersteunen, maar het debat moet gevoerd worden in samenspraak met overheid, industrie en samenleving.

Reflectie: Kansen én voorzichtigheid

Anthropic benadrukt dat Sonnet 4.5 nog geen vervanging is voor menselijke experts: de vaardigheden zijn veelbelovend, maar nog steeds in een pril stadium.

Tegelijkertijd erkent het bedrijf dat AI al misbruikt wordt: op hun eigen platform werd kwaadaardig gebruik ontdekt — bijvoorbeeld “vibe hacking” campagnes en spionage-achtige operaties.

Dit onderstreept de dubbele aard van AI in cyberspace: dezelfde technologie die verdedigers kan versterken, kan ook door aanvallers gehanteerd worden.


Anthropic zet met Claude Sonnet 4.5 een belangrijke stap in het transformeren van AI van theoretisch concept naar praktische verdediger in het digitale domein. De nadruk op het vinden en repareren van kwetsbaarheden, gecombineerd met samenwerking met praktijkorganisaties, toont een evenwichtige benadering tussen innovatie en veiligheid. Toch blijft waakzaamheid geboden: de strijd tussen kwaad en goed in cyberspace is dynamisch, en AI-middelen kunnen snel van rol wisselen.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak