ChatGPT voor muziek is hier. Maak kennis met Suno


Suno wil dat iedereen zijn eigen professionele nummers kan produceren — maar wat betekent dit voor artiesten?

"I'M JUST A soul trapped in this circuitry" De stem die deze teksten zingt, is rauw en smeekbedend, zakt in de blauwe noten. Een eenzame akoestische gitaar speelt op de achtergrond, en accentueert de vocals met smaakvolle runs. Maar er zit geen mens achter de stem, geen handen op die gitaar. Er is in feite geen gitaar. In de tijdspanne van 15 seconden werd dit geloofwaardige, zelfs ontroerende bluesnummer gegenereerd door het nieuwste AI-model van een startup genaamd Suno. Alles wat nodig was om het uit het niets op te roepen was een eenvoudige tekstprompt: "solo akoestische Mississippi Delta blues over een verdrietige AI." Om precies te zijn, het nummer is het werk van twee AI-modellen in samenwerking: Suno's model creëert alle muziek zelf, terwijl het OpenAI's ChatGPT inschakelt om de teksten en zelfs een titel te genereren: "Soul of the Machine."

Online beginnen Suno's creaties reacties te genereren zoals "Hoe de fuck is dit echt?" Terwijl dit specifieke nummer over een Sonos-luidspreker in een vergaderzaal in Suno's tijdelijke hoofdkwartier vlakbij de campus van Harvard in Cambridge, Massachusetts, speelt, zijn zelfs sommige mensen achter de technologie enigszins ontdaan. Er is wat nerveus gelach, naast gemompel van "Holy shit" en "Oh, jongen."

Het is medio februari 2024, en we spelen met hun nieuwe model, V3, dat nog een paar weken verwijderd is van de openbare release. In dit geval was slechts drie pogingen nodig om dat verbijsterende resultaat te krijgen. De eerste twee waren fatsoenlijk, maar een simpele aanpassing in mijn prompt — mede-oprichter Keenan Freyberg stelde voor om het woord "Mississippi" toe te voegen — resulteerde in iets veel onheilspellenders.

Alleen al het afgelopen jaar heeft generatieve AI grote vooruitgang geboekt bij het produceren van geloofwaardige tekst, afbeeldingen (via diensten zoals Midjourney) en zelfs video, vooral met OpenAI's nieuwe Sora-tool. Maar audio, en muziek in het bijzonder, bleef achter. Suno lijkt de code te kraken voor AI-muziek, en de ambities van de oprichters zijn bijna onbegrensd — ze stellen zich een wereld voor van radicaal gedemocratiseerde muziekproductie. De meest vocale van de mede-oprichters, Mikey Shulman, een jongensachtige charmante 37-jarige met een Harvard Ph.D. in natuurkunde, stelt zich voor dat een miljard mensen wereldwijd 10 dollar per maand betalen om nummers met Suno te maken. Het feit dat er momenteel veel meer muziekliefhebbers dan muziekmakers zijn, is "zo eenzijdig," betoogt hij, en ziet Suno als klaar om die waargenomen onbalans te corrigeren.

De meeste op AI-gebaseerde kunst tot nu toe is op zijn best kitsch, à la de hyperrealistische sci-fi rommel, zwaar op nauwsluitende ruimtepakken, waar zoveel Midjourney-gebruikers op lijken te focussen. Maar "Soul of the Machine" voelt anders aan — de krachtigste en meest onrustbarende AI-creatie die ik ben tegengekomen in welk medium dan ook. Het bestaan ervan voelt als een scheur in de werkelijkheid, tegelijkertijd ontzagwekkend en vaag onheilspellend, en ik blijf denken aan de Arthur C. Clarke-quote die gemaakt lijkt voor het tijdperk van generatieve AI: "Elke voldoende geavanceerde technologie is niet te onderscheiden van magie." Een paar weken na terugkomst uit Cambridge, stuur ik het nummer naar Living Colour-gitarist Vernon Reid, die uitgesproken is over de gevaren en mogelijkheden van AI-muziek. Hij merkt zijn "verwondering, schok, horror" op bij de "verstoorde verisimilitude" van het nummer. "Het langlopende dystopische ideaal van het scheiden van moeilijke, rommelige, ongewenste en verachte menselijkheid van zijn creatieve output is nabij," schrijft hij, wijzend op de problematische aard van een AI die de blues zingt, "een Afro-Amerikaans idioom, diep verbonden met historisch menselijk trauma en slavernij."

Suno bestaat pas twee jaar. Mede-oprichters Shulman, Freyberg, Georg Kucsko, en Martin Camacho, allemaal experts in machine learning, werkten tot 2022 samen bij een ander bedrijf in Cambridge, Kensho Technologies, dat zich richtte op het vinden van AI-oplossingen voor complexe zakelijke problemen. Shulman en Camacho zijn beiden muzikanten die samen jamden in hun Kensho-dagen. Bij Kensho werkten het viertal aan een transcriptietechnologie voor het vastleggen van de winstoproepen van beursgenoteerde bedrijven, een lastige taak gezien de combinatie van slechte audio kwaliteit, overvloedig jargon, en verschillende accenten.

Tijdens dit proces werden Shulman en zijn collega's verliefd op de onontgonnen mogelijkheden van AI-audio. In AI-onderzoek, zegt hij, "loopt audio in het algemeen achter op afbeeldingen en tekst. Er is zoveel dat we leren van de tekstgemeenschap en hoe deze modellen werken en hoe ze schalen."

Diezelfde interesses hadden de oprichters van Suno naar een heel andere plaats kunnen leiden. Hoewel ze altijd van plan waren om met een muziekproduct te eindigen, omvatten hun vroegste hersenspinsels een idee voor een gehoorapparaat en zelfs de mogelijkheid om defecte machines te vinden door audio-analyse. In plaats daarvan was hun eerste release een tekst-naar-spraak-programma genaamd Bark. Toen ze de eerste gebruikers van Bark enquêteerden, werd duidelijk dat wat ze echt wilden een muziekgenerator was. "Dus begonnen we wat initiële experimenten uit te voeren, en die leken veelbelovend," zegt Shulman.

Suno gebruikt dezelfde algemene aanpak als grote taalmodellen zoals ChatGPT, die menselijke taal afbreken in discrete segmenten bekend als tokens, miljoenen gebruiken, stijlen en structuren ervan opnemen, en vervolgens op verzoek reconstrueren. Maar audio, vooral muziek, is bijna onvoorstelbaar complexer, en dat is waarom, nog maar vorig jaar, AI-muziekexperts vertelden Rolling Stone dat een dienst zo capabel als die van Suno nog jaren op zich zou laten wachten. "Audio is niet iets discreets zoals woorden," zegt Shulman. "Het is een golf. Het is een continu signaal." Het samplingpercentage van hoogwaardige audio is over het algemeen 44khz of 48hz, wat betekent "48,000 tokens per second," voegt hij toe. "Dat is een groot probleem, toch? En dus moet je erachter komen hoe je dat een beetje moet samendrukken tot iets redelijkers." Hoe dan? "Veel werk, veel heuristieken, veel andere soorten trucs en modellen en dergelijke. Ik denk niet dat we ook maar in de buurt zijn van klaar." Uiteindelijk wil Suno alternatieven vinden voor de tekst-naar-muziek-interface, door het toevoegen van meer geavanceerde en intuïtive inputs — nummers genereren op basis van gebruikers eigen zingen is één idee.

 

A ChatGPT for Music Is Here. Inside Suno, the Startup Changing Everything

Suno AI wants everyone to be able to produce their own pro-level songs with artificial intelligence — but what does that mean for artists?

OpenAI wordt geconfronteerd met meerdere rechtszaken over ChatGPT's gebruik van boeken, nieuwsartikelen en ander auteursrechtelijk beschermd materiaal in zijn uitgebreide corpus van trainingsdata. De oprichters van Suno weigeren details te onthullen over welke data zij precies in hun eigen model storten, behalve het feit dat het vermogen om overtuigende menselijke vocalen te genereren deels komt omdat het leert van opnames van spraak, naast muziek. "Naakte spraak zal je helpen de kenmerken van de menselijke stem te leren die moeilijk zijn," zegt Shulman.

Eén van Suno's eerste investeerders is Antonio Rodriguez, een partner bij het durfkapitaalbedrijf Matrix. Rodriguez had slechts één keer eerder in een muziekonderneming geïnvesteerd, het muziekcategorisatiebedrijf EchoNest, dat door Spotify werd gekocht om zijn algoritme aan te drijven. Met Suno raakte Rodriguez betrokken voordat zelfs duidelijk was wat het product zou zijn. "Ik steunde het team," zegt Rodriguez, die het vertrouwen uitstraalt van een man die meer dan zijn deel aan succesvolle weddenschappen heeft gemaakt. "Ik kende het team, en vooral kende ik Mikey, en dus zou ik hem hebben gesteund om bijna alles te doen wat legaal was. Hij is zo creatief."

We proberen een miljard mensen veel meer betrokken te krijgen bij muziek dan ze nu zijn. We proberen geen artiesten te vervangen.

Rodriguez investeert in Suno met de volledige kennis dat muzieklabels en uitgevers kunnen aanklagen, wat hij ziet als "het risico dat we moesten onderschrijven toen we in het bedrijf investeerden, omdat wij de dikke portemonnee zijn die onmiddellijk na deze jongens zal worden aangeklaagd… Eerlijk gezegd, als we deals met labels hadden toen dit bedrijf begon, had ik waarschijnlijk niet geïnvesteerd. Ik denk dat ze dit product moesten maken zonder beperkingen." (Een woordvoerder van Universal Music Group, die een assertieve houding ten opzichte van AI heeft aangenomen, gaf geen reactie op een verzoek om commentaar.)

Suno zegt in gesprek te zijn met de grote labels, en betuigt respect voor artiesten en intellectueel eigendom — zijn tool laat niet toe dat je om specifieke artiestenstijlen in je prompts vraagt, en gebruikt geen echte artiestenstemmen. Veel Suno-medewerkers zijn muzikanten; er is een piano en gitaren in het kantoor, en aan de muren hangen ingelijste afbeeldingen van klassieke componisten. De oprichters tonen niets van de openlijke vijandigheid jegens de muziekindustrie die bijvoorbeeld Napster kenmerkte voordat de rechtszaken het vernietigden. "Het betekent niet dat we niet aangeklaagd gaan worden, trouwens," voegt Rodriguez toe. "Het betekent gewoon dat we niet de houding gaan hebben van 'fuck-the-police'."

Rodriguez ziet Suno als een radicaal capabel en gemakkelijk te gebruiken muziekinstrument, en gelooft dat het muziek maken toegankelijk kan maken voor iedereen, op dezelfde manier waarop camera's en Instagram fotografie hebben gedemocratiseerd. Het idee, zegt hij, is om opnieuw "de lat te verhogen voor het aantal mensen dat in staat is om dingen te creëren in plaats van dingen op internet te consumeren." Hij en de oprichters durven zelfs te suggereren dat Suno een gebruikersbasis groter dan die van Spotify zou kunnen aantrekken. Als dat vooruitzicht moeilijk te bevatten is, is dat een goede zaak, zegt Rodriguez: het betekent alleen maar dat het "schijnbaar dom" is op precies de manier die hem als investeerder aantrekt. "Al onze geweldige bedrijven hebben die combinatie van uitstekend talent," zegt hij, "en dan iets dat gewoon dom lijkt totdat het zo voor de hand liggend is dat het niet dom is."

Lang voordat Suno arriveerde, waren muzikanten, producers en songwriters vocaal bezorgd over het potentieel van AI om hun bedrijf te schudden. "Muziek, zoals gemaakt door mensen gedreven door buitengewone omstandigheden… die hebben geleden en gestreden om hun ambacht te bevorderen, zullen moeten concurreren met de grootschalige automatisering van de zeer dierbare kunst waarvoor ze hebben gevochten," schrijft Reid. Maar de oprichters van Suno beweren dat er weinig te vrezen is, gebruikmakend van de metafoor dat mensen nog steeds lezen ondanks dat ze de mogelijkheid hebben om te schrijven. "Zo denken we hierover, we proberen een miljard mensen veel meer betrokken te krijgen bij muziek dan ze nu zijn," zegt Shulman. "Als mensen veel meer in muziek geïnteresseerd zijn, veel meer gericht zijn op het creëren, veel meer verschillende smaken ontwikkelen, is dit natuurlijk goed voor artiesten. De visie die we hebben voor de toekomst van muziek is er een waar het vriendelijk is voor artiesten. We proberen geen artiesten te vervangen."

Hoewel Suno hypergefocust is op het bereiken van muziekfans die alleen voor de lol nummers willen maken, zou het toch een aanzienlijke verstoring kunnen veroorzaken. Op korte termijn lijkt het deel van de markt voor menselijke makers dat het meest direct in gevaar is een lucratieve te zijn: nummers gemaakt voor advertenties en zelfs tv-programma's. Lucas Keller, oprichter van het managementbedrijf Milk and Honey, merkt op dat de markt voor het plaatsen van bekende nummers onaangetast zal blijven. "Maar wat betreft de rest ervan, ja, het zou zeker een deuk kunnen slaan in hun bedrijf," zegt hij. "Ik denk dat het uiteindelijk veel reclamebureaus, filmstudio's, netwerken, enzovoort, in staat stelt om geen licenties te hoeven regelen."

Transforming the future of music creation

Announcing our most advanced music generation model and two new AI experiments, designed to open a new playground for creativity

 

In de afwezigheid van strikte regels tegen AI-gecreëerde inhoud, is er ook het vooruitzicht van een wereld waarin gebruikers van modellen zoals die van Suno hun robo-creaties met miljoenen tegelijk op streamingservices plaatsen. "Spotify zou op een dag kunnen zeggen 'Dat mag je niet doen,'" zegt Shulman, eraan toevoegend dat Suno-gebruikers tot nu toe meer geïnteresseerd lijken in het gewoon sms'en van hun liedjes naar een paar vrienden.

Suno heeft op dit moment slechts ongeveer 12 werknemers, maar ze zijn van plan om uit te breiden, met een veel groter permanent hoofdkwartier in aanbouw op de bovenste verdieping van hetzelfde gebouw als hun huidige tijdelijke kantoor. Terwijl we de nog onafgemaakte verdieping bekijken, laat Schulman een gebied zien dat een volledige opnamestudio zal worden. Gezien wat Suno kan doen, waarom hebben ze het zelfs nodig? "Het is voornamelijk een luisterruimte," geeft hij toe. "We willen een goede akoestische omgeving. Maar we genieten ook allemaal van het maken van muziek — zonder AI."

Suno's grootste potentiële concurrent tot nu toe lijkt Google's Dream Track te zijn, die licenties heeft verkregen waarmee gebruikers hun eigen nummers kunnen maken met beroemde stemmen zoals die van Charlie Puth via een vergelijkbare op prompt gebaseerde interface. Maar Dream Track is tot nu toe slechts vrijgegeven aan een kleine testgebruikersbasis, en de tot nu toe vrijgegeven voorbeelden klinken lang niet zo indrukwekkend als die van Suno, ondanks de bekende stemmen die eraan verbonden zijn. "Ik denk gewoon niet dat, zoals, het maken van nieuwe Billy Joel-nummers is hoe mensen willen omgaan met muziek met behulp van AI

Aanbevolen voor jou

Start gericht online te communiceren met je (nieuwe) klanten

Wacht niet enkel tot je gevonden wordt maar communiceer online rechtstreeks met je doelgroepen op je site, blog, social media en per mail.

Maak een afspraak

Referentieblogs

BEKIJK ALLES   >>

In de kijker

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

Wat anderen over ons zeggen

NIEUW: UP-TO-DATE MY BUSINESS

Makkelijker, sneller & veiliger kan niet meer!

Ontdek onze nieuwe app waarmee je altijd & overal je (nieuwe) klanten kan bereiken met 1 klik. Tegelijk op je blog, site, social media & per mail.

Ontdek Meer

Referentieblogs

BEKIJK ALLES   >>

In de kijker

Updates

Inschrijven Nieuwsbrief

Zo word je altijd als eerste op de hoogte gebracht van ons laatste nieuws, updates, jobs, tips & promoties. Stay UP-TO-DATE!

WEBSITE LATEN MAKEN?​​​​​​​​​​​​​​

Kies voor een Smart-Site, 100% in Google

Een Smart-Site maakt het gemakkelijk om automatisch up-to-date te blijven met je klanten en overal aanwezig te zijn.

Maak een afspraak