Kontrafaktiska villkorssatser (du läste rätt) ska välja musik åt dig på Spotify
Kontrafaktiska villkorssatser kan användas för att välja vilken musik Spotify ska spela upp för dig.Midjourney
En ny maskininlärningsmodell kan hjälpa Spotify välja vad vi ska lyssna på. Modellen räknar på sannolikheten för något som inte inträffat – ”udda saker att tänka på”.
I vintras presenterades en maskinlärningsmodell i en vetenskaplig artikel i Nature. Modellen fångar den komplicerade matematiken bakom kontrafaktiska villkorssatser, en teknik som kan identifiera orsaken till gamla händelser och förutspå framtida sådana.
– Att förstå orsak och verkan är väldigt viktigt vid beslutsfattande. Man vill förstå vilken inverkan ett val man gör nu kommer att ha på framtiden, säger Ciarán Gilligan-Lee till MIT Technology Review.
Han leder forskningsarbetet om kausal slutledning på Spotify och är en av forskarna bakom modellen.
Vad är kontrafaktiska villkorssatser?
– Kontrafakta är väldigt konstiga statistiska objekt. Det är udda saker att tänka på, man frågar efter sannolikheten för att något inträffar givet att det inte inträffade, säger Ciarán Gilligan-Lee till MIT Technology Review.
Annons
Man kan se det som att modellen spolar tillbaka världen i tiden, ändrar några detaljer, och ser vad utfallet hade blivit. Genom att ändra på rätt saker kan man skilja faktisk kausalitet från korrelation och slump.
Kontrafakta är i sig intuitivt. Många baserar sina val i livet på att föreställa sig vad ett visst agerande kan leda till. Men att formulera det matematiskt är desto svårare. Forskarna baserade sin maskininlärningsmodell på ett teoretiskt ramverk som kallas tvillingnätverk.
Tvillingnätverk föreslogs på nittiotalet av dataforskarna Andrew Balke och Judea Pearl. Det går ut på att ha ett par sannolikhetsmodeller där den ena representerar den verkliga världen, och den andra en fiktiv värld. Den fiktiva världen kopplas till och begränsas av den verkliga så att man enbart kan ändra vissa fakta.
En illustration av två världar sammankopplade av ett neuralt nätverk.Midjourney
Forskarna använde ett tvillingnätverk som utgångspunkt för ett neuralt nätverk och tränade sin modell att förutspå vad som skulle ske i den fiktiva världen. Slutprodukten, ett program som kan genomföra kontrafaktiskt resonerande.
– Det låter dig svara på kontrafaktiska frågeställningar om vilket scenario du vill, säger Ciarán Gilligan-Lee till MIT Technology Review.
Hur påverkar det här min musiklyssning?
Ciarán Gilligan-Lee berättar för MIT Technology Review att Spotify inte använder sig av modellen för tillfället, men att ”de skulle kunna hjälpa till att svara på frågor vi hanterar dagligen”.
Det skulle till exempel kunna användas för att välja nästa låt i spelordningen, eller berätta för artister när de borde släppa nya album. Det kan hjälpa besvara frågor som om man spelar en särskild sång, kommer användaren lyssna under längre tid då?
Vad finns det för andra användningsområden?
Annons
Kontrafaktiska villkorssatser kan vara användbart i många avseenden. Finanssektor, sjukvården och reklamvärlden är några områden där det kan ha verklig påverkan. Företag som Meta, Amazon, Linkedin och Bytedance jobbar med att ta fram tekniker för detta.
Ciarán Gilligan-Lee och hans kollegor har testat sin modell mot flera världshändelser.
2020 undersökte forskare om installationen av rör och betongväggar för att skydda vattenkällor i en särskild region i Kenya skulle ha minskat nivåerna av diarré hos barn. Forskarna såg då positiva resultat och minskad sjukdom.
Man behöver vara säker på vad som gav det positiva resultatet, enligt Ciarán Gilligan-Lee. Han menar att det är möjligt att installationen av betongväggar runt brunnar gjorde folk mer medvetna om riskerna med kontaminerat vatten och att familjer kanske därför började koka vattnet hemma.
Forskarna testade detta i sin modell. De frågade om barn som drack från en oskyddad brunn även skulle bli sjuka om de drack från en skyddad brunn i en fiktiv värld. Om man bara ändrade den detaljen, och inte hur vattnet behandlas i hemmet, skulle det inte vara någon större skillnad svarade modellen. Detta tydde på att det inte bara var skyddandet av vattenkällorna som påverkade antalet sjukdomsfall.
Det här överensstämde med resultatet av en tidigare kontrafaktisk studie. I den tidigare studien hade man tagit fram en specifik statistisk modell bara för denna fråga. Ciarán Gilligan-Lee och hans kollegors modell ska däremot gå att använda för frågor om vad som helst.