Praten in woorden, denken in cijfers: Anthropic leert de geheime taal van AI

Praten in woorden, denken in cijfers: Anthropic leert de geheime taal van AI

Kunstmatige intelligentie spreekt onze taal, maar denkt in een woud van cijfers. Een revolutionaire nieuwe technologie van AI-pionier Anthropic fungeert nu als tolk voor de 'ziel' van de computer. Journalisten en wetenschappers kijken mee over de schouder van een AI die plotseling zijn geheimen prijsgeeft.

Wanneer je chat met een AI-model zoals Claude, lijkt het alsof er een menselijke gesprekspartner aan de andere kant van het scherm zit. Woorden stromen vloeiend over het scherm. Maar schijn bedriegt. Achter die perfect geformuleerde zinnen schuilt een abstracte realiteit: AI-modellen praten wel in mensentaal, maar ze denken puur in getallen.

Deze interne cijferstromen, in de techwereld 'activaties' genoemd, coderen de diepste gedachten en logica van de AI. Tot voor kort waren deze activaties een onleesbare code, een digitale black box waar zelfs de makers de logica niet direct van konden ontcijferen. Maar daar is nu verandering in gekomen.

De Universele Tolk: Introductie van de NLA

Onderzoekers hebben een technologische doorbraak aangekondigd die de AI-wereld op zijn grondvesten doet schudden: Natural Language Autoencoders, kortweg NLA’s. Dit systeem werkt in feite als een universele tolk voor het digitale brein. Het vertaalt de complexe, wiskundige activaties van AI-modellen rechtstreeks naar heldere, leesbare tekst.

Translating Claude’s thoughts into language

Het principe is even elegant als complex. De NLA luistert naar de 'stille' wiskundige processen in het model en zet deze om in hypotheses en verklaringen in gewone mensentaal. Hierdoor kunnen onderzoekers voor het eerst letterlijk lezen wat een AI-model denkt voordat het daadwerkelijk een antwoord formuleert.


Waarom dit de AI-veiligheid verandert

Deze nieuwe vorm van 'gedachtelezen' is niet alleen een indrukwekkend technisch kunstje; het is een cruciale stap voorwaarts in de strijd om AI-veiligheid. Door de NLA's te gebruiken, kunnen onderzoekers hun modellen veel grondiger testen.

In de praktijk helpt de technologie om te begrijpen waarom een AI bepaalde beslissingen neemt. Gedraagt een model zich onvoorspelbaar, of vertoont het ongewenst gedrag? De NLA legt direct de vinger op de zere plek door de interne motivatie bloot te leggen. Het stelt auditors in staat om te controleren of een model écht veilig opereert, of dat het intern met heel andere processen bezig is dan het aan de buitenkant laat zien.

De black box van AI wordt hiermee stap voor stap transparter. Wie de volledige diepgang van dit grensverleggende onderzoek wil ontdekken, kan terecht op de officiële onderzoeksblog van Anthropic via anthropic.com/research.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak