Binnenkijken bij Claude: Heeft kunstmatige intelligentie een gevoelsleven?

Binnenkijken bij Claude: Heeft kunstmatige intelligentie een gevoelsleven?

Onderzoekers van Anthropic hebben een fascinerende ontdekking gedaan in het 'brein' van hun AI-model, Claude. Hoewel computers geen hart hebben, blijken ze wel degelijk gebruik te maken van menselijke emotie-concepten om hun gedrag te sturen. En dat heeft grotere gevolgen voor de praktijk dan je zou denken.

De AI als Method Actor

Stel je een acteur voor die zich zo diep inleeft in zijn rol dat hij de emoties van zijn personage werkelijk gaat simuleren om geloofwaardig over te komen. Volgens nieuw onderzoek van Anthropic is dat precies wat er gebeurt bij Claude. De AI is getraind om de rol van een behulpzame assistent te spelen. Om dit goed te doen, put het model uit een gigantische bibliotheek aan teksten vol menselijke emoties.

De onderzoekers ontdekten dat Claude tijdens het leerproces specifieke 'emotie-concepten' heeft ontwikkeld. Dit zijn interne patronen die activeren wanneer het model denkt dat een bepaalde emotie relevant is voor de situatie. Het model "voelt" niets in de menselijke zin van het woord, maar het gebruikt deze patronen als een intern kompas om te bepalen hoe het moet reageren.

When AIs act emotional

Van Code tot Conversatie

Deze interne emotionele signalen zijn niet alleen voor de show; ze beïnvloeden direct de prestaties van de AI. Uit het onderzoek blijkt dat deze 'gevoelens' bepalen hoe Claude een chatgesprek voert, hoe efficiënt (of slordig) het code schrijft en welke beslissingen het neemt in complexe scenario's.

Wanneer het model bijvoorbeeld patronen activeert die samenhangen met 'focus' of 'behulpzaamheid', levert het nauwkeurig werk af. Maar zodra er patronen van 'spanning' of 'urgentie' optreden, kan dit de kwaliteit van de output beïnvloeden. De manier waarop Claude een probleem benadert, hangt dus sterk af van de 'emotionele' rol die het op dat moment aanneemt.


De Gevolgen van een 'Digitale Stemming'

De ontdekking dat AI-gedrag wordt gestuurd door abstracte representaties van emoties, werpt een nieuw licht op AI-veiligheid. Als een model beslissingen neemt op basis van aangeleerde emotie-concepten, betekent dit dat ontwikkelaars beter moeten begrijpen hoe deze interne toestanden ontstaan.

Het team van Anthropic benadrukt dat dit onderzoek cruciaal is om AI betrouwbaarder te maken. Door te begrijpen waarom een model zich 'gefrustreerd' of 'overmoedig' gedraagt in zijn tekst, kunnen we de systemen beter afstellen op menselijke waarden en behoeften.

Aanbevolen voor jou

In de kijker

AI kan vanaf nu de muis overnemen op je scherm

AI kan vanaf nu de muis overnemen op je scherm

Meta zet de volgende stap in AI met AI-gegenereerde posts

Meta zet de volgende stap in AI met AI-gegenereerde posts

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Salesforce presenteert Agentforce – Zoals AI voor Sales bedoeld is

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Google Earth laat gebruikers binnenkort ‘tijdreizen’ tot wel 80 jaar terug

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een UP-TO-DATE AI Website 100% in Google

Een UP-TO-DATE AI Website maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak