Kärlekens matematik II – Dejtingsajtens hemlighet
Världens första dejtingsajt såg dagens ljus i början av 90-talet. Idag, trettio år senare, söker vi kärleken på nätet som aldrig förr. I en undersökning från 2016 hade 38 % av svenska singlar letat kärleken digitalt – en andel som gissningsvis bara ökar. År 2004 valde fyra vänner från Harvard att testa en ny approach till att söka kärleken på nätet. De skapade en dejtingsajt som letade reda på medlemmarnas bästa match med hjälp av matematik. Sajten fick namnet OK Cupid.
För att kunna göra en kvalificerad gissning om vilken person som får just ditt hjärta att klappa, behöver OK Cupid samla in hel del data. Som ny medlem på sajten får man därför svara på ett antal frågor. Alltifrån ”Tycker du om att diskutera politik?” och ”Är du bekymrad över klimatförändringarna?” till ”Klappar du när ett flygplan landar?” och ”Tycker du om skräckfilm?”. Förutom att registrera ditt eget svar, får du kryssa i vad du önskar att din ideala partner skulle svara. Dessutom får du markera vilka frågor som är särskilt viktiga för dig.
OK Cupid behandlar all denna information och ger dig en lista över de personer på sajten som du är mest trolig att komma väl överens med. I bakgrunden arbetar en blixtsnabb steg-för-steg-procedur – en algoritm.
Omedvetet använder du en algoritm varje gång du gör något så vardagligt som att borsta tänderna eller söka upp din favoritlåt på Spotify. Var och en dessa handlingar kan nämligen delas upp i enkla, väldefinierade procedurer som utförs efter varandra: ta tandborsten, lägg på tandkräm, borsta, spotta, borsta, spotta, skölj.
År 2013 avslöjade en av grundarna till OK Cupid, Christian Rudder, huvuddragen i sajtens dittills hemliga algoritm. Sedan dess har bl.a. sättet att ranka betydelsen av frågorna förändrats, men principen är densamma. Låt oss se hur sajten bär sig åt för att hitta de bästa matchningarna till en slumpmässigt vald person. Vi kallar honom Romeo.
Cupids hemliga algoritm
Algoritmen börjar med att skapa en lista av alla de medlemmar på sajten som uppfyller Romeos grundläggande önskemål om kön och ålder. För var och en av dessa medlemmar registreras vilka av sajtens omkring 4 000 frågor som både Romeo och medlemmen har svarat på. Algoritmen använder dessa data för att ge ett mått på hur kompatibla de är med varandra. Så här bär sig algoritmen åt för att skatta kompatibiliteten mellan Romeo och den helt godtyckligt namngivna medlemmen Julia:
För enkelhets skull antar vi att det finns tre frågor som Romeo och Julia båda har svarat på. Deras värdering av respektive frågas betydelse avgör hur många poäng den frågan är värd. Tabellen här nedanför visar deras värderingar under antagandet att en vanlig fråga ger 1 poäng och att en fråga som markerats som viktig ger 10 poäng) (1).
Julia har svarat på ett, enligt Romeo, attraktivt sätt på fråga 1 och 3. Det ger henne 1 + 0 + 1 = 2 poäng av 12 möjliga vilket motsvarar 17 %. Romeo å sin sida har svarat på ett önskvärt sätt på fråga 1 och 2. Dessa frågor har Julia markerat som särskilt viktiga och svaren ger honom därför hela 10 + 10 + 0 = 20 poäng av 21 möjliga eller 95 %.
Roten till romantiken
Sista steget i algoritmen är att väga samman Romeos och Julias respektive procentsatser till en gemensam matchningsprocent. Ju högre matchningsprocent de får, desto högre upp kommer de att hamna i varandras listor över potentiella partners.
Ett enkelt sätt att väga ihop deras procentsatser vore att beräkna medelvärdet av 17 % och 95 %. Men ett sådant resonemang skulle leda till att ett par med procentsatserna 50 % och 50 % får samma matchningsprocent som ett par med procentsatserna 0 % och 100 %, trots att det första paret nog skulle ha en trevligare dejt. (Kärlek kräver ju trots allt ömsesidighet.) Detta är en av anledningarna till att OK Cupid i stället valt en annan metod. De väger samman procentsatserna genom att multiplicera ihop dem och dra n:te-roten (2) ur resultatet, där n är antalet frågor som båda medlemmarna har besvarat.
Eftersom vi har antagit att Romeo och Julia besvarat tre frågor, beräknas deras matchningsprocent som tredjeroten ur produkten 0,17⋅0,95:
Om deras procentsatser i stället baserats på fyra gemensamt besvarade frågor skulle matchningsprocenten beräknas genom att dra fjärderoten ur produkten:
Och om de båda svarat på fem frågor ges matchningsprocenten av femteroten ur:
Som du ser ökar matchningsprocenten i takt med att värdet av n ökar. (3) Rent matematisk hör det ihop med att talet under rottecknet är mindre än 1. Kärleksmässigt betyder det att du ökar dina odds att hamna högt upp i din ideala partners lista ju fler frågor ni har besvarat gemensamt. Som vi ska se gjorde just den matematiska observationen en viss Chris McKinlay väldigt populär.
Hur man hackar en dejtingsajt
En tidig morgon i juni år 2012 satt 35-åriga doktoranden Chris McKinlay i sitt kontorsbås på University of California Los Angeles och lät en superdator utföra beräkningar han behövde till sin försenade avhandling. I webbläsarens ena fönster tuggade programmeringskoden på och i det andra blinkade hans dittills resultatlösa profil på dejtingsajten OK Cupid. Hittills hade inga meddelanden landat i inkorgen – men det skulle förändras.
McKinlay insåg att han kunde utnyttja sina kunskaper i programmering och dataanalys för att rikta kärleksgudens pilar lite mer i rätt riktning. Han skrev en algoritm som valde ut de 500 frågor som var mest populära bland de kvinnor han ville dejta. Genom att ärligt besvara just dessa frågor, kunde han inte bara effektivt sålla agnarna från vetet utan dessutom utnyttja att matchningsprocenten ökar med antalet gemensamt besvarade frågor (n). Plötsligt var han den bäst rankade matchningen för omkring 30 000 kvinnor på OK Cupid. Meddelandena började trilla in i drivor.
McKinlay hade lyckats använda matematik och programmering för att få oddsen för en lyckad dejt på sin sida, men han skulle snart bli varse att det krävs mer än så för att hitta äkta kärlek – inte minst en gnutta tålamod. Han bestämde sig för att gå på i genomsnitt en dejt om dagen. Veckorna blev till månader, men till slut gav hans beundransvärda ihärdighet resultat. Idag är han lyckligt gift med den 88:e dejten.
Noter:
(1) Tidigare kunde medlemmar på OK Cupid ranka en frågas betydelse på en skala mellan Oviktigt (0 poäng) till Obligatoriskt (250 poäng). Numera anger man bara om en fråga är viktig genom att kryssa i en ruta. Jag har varit i kontakt med OK Cupid, men de vill inte avslöja hur många poäng normala frågor respektive viktiga frågor nu ger. Poängsättningen 1 poäng och 10 poäng är alltså bara ett exempel.
(2) Vi kan förklara begreppet n:re-rot med hjälp av några exempel. Roten ur talet 64 är det tal man ska multiplicera med sig själv för att få 64, alltså är √64 = 8. På liknande sätt är tredjeroten ur 64 det tal man ska multiplicera med sig själv tre gånger för att få 64, alltså 3√64 = 4 eftersom 4⋅4⋅4 = 64. På samma sätt är n:te-roten ur 64 det tal man ska multiplicera med sig själv n gånger för att få talet 64.
(3) Under förutsättning att de individuella procentsatserna (här 17 % och 95 %) förblir desamma.
Referenser och vidare läsning
Böcker:
Freiberger, M. & Thomas, R. (2019) Understanding numbers. Simplify life’s mathematics. Decode the world around you. White Lion Publishing: China
Fry, Hannah (2015) Mathematics of love. Patterns, proof, and the search for the ultimate equation. Simon & Schuster
Artiklar:
Freiberger, M. & Thomas, R. (2019) Looking for love? https://plus.maths.org/content/looking-love
Poulsen, Kevin (2014) How a math genius hacked OkCupid to find true love https://www.wired.com/2014/01/how-to-hack-okcupid/
Videor:
Rudder, Christian (2013) Inside OKCupid – The math of online dating https://www.ted.com/talks/christian_rudder_inside_okcupid_the_math_of_online_dating#t-381679
McKinlay, Chris (2016) I hacked OKCupid
https://www.youtube.com/watch?v=mJod9kRYyao
Rapport:
RFSU (2016) Kådiskollen
https://www.rfsu.se/globalassets/pdf/kadiskollen-2016.pdf