Mellokollen

En nördig djupdykning i datan bakom Melodifestivalen.
En ny analys varje vecka fram till finalen.

Vinnarna

Vem vinner Mello?

Eric Saade

Eric Saade vinner Melodifestivalen 2015! Andraplatsen går till Mariette, och tredje plats till Måns Zelmerlöw. Eller, så räknade iallafall vår dator.

Det viktigaste för att vinna Melodifestivalen är att placera sig högt i deltävlingen, att sjunga på engelska, och att ha minst en låtskrivare som har skrivit många Mellolåtar, gärna sådana som gick till finalen.

Förutsägelsen är bara baserad på data. Vi har inte tagit hänsyn till vad tyckare på Twitter säger, hur populära artisterna är eller hur "bra" folk tycker deras uppträdanden var, eller vilka kläder de hade på sig. Vi har tagit hänsyn till de hårda fakta som finns tillgängliga.

Vi har beräknat följande variabler för alla låtar som har tagit sig ända till finalen de senaste 13 åren:

  • Variabler relaterade till låtskrivare: antal Mellolåtar som tidigare skrivits av låtskrivarna, antal Mellolåtar som skrivits av de låtskrivare som gått till final, antal Mellolåtar som skrivits av de låtskrivare som nåt topp 3, antal låtskrivare
  • Variabler relaterade till låt: språk, antal ord i titeln, skrikighet, tempo
  • Variabler relaterade till detävling: deltävling, placering i deltävling, startorder i deltävling, om låten gick direkt till final
  • Variabler relaterade till artisten: om artisten tidigare deltagit i Melodifestivalen, om artisten tidigare varit i en final, om det är fler än en artist som framför låten
  • Startposition i finalen

Vi anpassade alla variabler till en skala mellan 0 och 1.

För att generera prediktioner använde vi en "rank support vector machine (SVM)", vilket är en maskininlärningsalgoritm. Varje enskilt år kodades som en separat query. Vidare använde vi en linjär kärna och ett trefaldigt korsvalideringsförfarande för att välja parameter C.

Efter att ha valt parameter C använde vi samtlig träningsdata, det vill säga alla finalister från de senaste 13 åren, för att kalibrera SVM modellen.

I det sista steget applicerade vi den modell SVM maskinen tagit fram för finalisterna 2015, och kunde därmed ta fram en ranking. Som alla nördar förstår ger viktvektorn för hyperplanet också vikterna för variablerna.

Här är den fullständiga listan över våra förutsägelser om finalresultatet:

  1. Eric Saade: Sting
  2. Mariette: Don’t Stop Believing
  3. Måns Zelmerlöw: Heroes
  4. Linus Svenning: Forever starts today
  5. Jessica Andersson: Can't Hurt Me Now
  6. Isa: Don't stop
  7. Magnus Carlsson: Möt mig i Gamla stan
  8. JTR: Building It Up
  9. Samir & Viktor: Groupie
  10. Dinah Nah: Make me (La La La)
  11. Hasse Andersson: Guld och gröna skogar
  12. Jon Henrik Fjällgren: Jag är fri (Manne Liem Frije)

Vi har satsat 100 SEK på att Eric Saade vinner och 50 SEK var att Mariette och Måns Zelmerlöw kommer hamna på första till tredje plats.

Vad har hänt med Mello?

Det här är det som gör årets Mello unik

De senaste fyra veckorna har vi här på Mellokollen beskrivit Melodifestivalen ur olika perspektiv. Vi har tittat på texterna, musiken, låtskrivarna och artisterna. Alla våra analyser bygger på data ur Mellos historia. Men är då årets upplaga en typisk Melodifestival? Vad är festivalens konstanter, vad förändras? Den här veckan har vi ställt Mello anno 2015 under lupp och jämför med tidigare års festivaler. Vi fann ett Mello som kanske är lite mindre kärleksfixerat men fortfarande domineras av män i storstäder. Och som fortfarande producerar klassiska schlagervinnare.

Lämnar kärleken Mello?

Texterna brukar handla om kärlek. Men i år tycks något ha hänt; betydligt färre låtar i årets Mello har ett kärleksbudskap jämfört med tidigare år.

Läs vår analys av texterna i Mello.

De som skriker högst?

De vinnande låtarna i Mello brukar vara ganska lika varandra. Vi tittade på två av storfavoriterna, Måns Zelmerlöw och Eric Saade. Båda går i exakt 124 BPM. Dessutom är båda två väldigt högljudda, vilket brukar vara ett gott tecken. Två tydliga vinnare alltså?!

Upptäck vad som skiljer vinnare från förlorare i Mello.

Var är kvinnorna?

Låtskrivarna i Mello brukar i allmänhet vara män. I år har dock tävlingsreglerna ändrats så att minst hälften av låtarna måste ha minst en kvinnlig medförfattare. Men de allra flersta av årets låtar är ändå skrivna av en klar majoritet män. Bara 2 av 28 låtar har fler kvinnliga än manliga medförfattare!

Läs mer om de som ligger bakom musiken i Mello.

Storstads-Mello?

De senaste åren har Mello dominerats av artister som bor i storstadsområden. Men i årets Mello är faktiskt lite fler artister än vanligt bosatta utanför storstadsområdena - ungefär tre av tio, jämfört med två av tio under tidigare år.

Se hur vi kom fram till att storstäderna dominerar Mello.





Vår analys denna vecka jämför årets upplaga av Melodifestivalen med datan från Mello 2002-2014. Vi har gjort en jämförelse per område, och du kan läsa mer om hur vi räknat ihop tidigare års siffror genom att scrolla ned på sidan eller klicka på länken under varje avsnitt.

För att samla ihop data för 2015 års Mello gjorde vi precis som tidigare. Uppgifter om namn på låtar, artister och låtskrivare hämtade vi från Wikipedia. Metadata om musiken kommer från Echonest. Uppgifter om artisternas boende- och födelseort kommer från Wikipedia och andra öppna datakällor. Könsstatistiken lät vi vår dator räkna ut genom att matcha listan över alla artister och låtskrivare med en lista över mans- och kvinnonamn, samt vissa manuella justeringar. Texterna hämtade vi från SVT:s egen Bidragsbibeln.

Artisterna

Vilka är det som står på scen?

Hela Sverige älskar Melodifestivalen. Borde då inte de som står på scenen också representera hela Sverige? Vi kollade upp födelseort och nuvarande bostadsort för alla artister som sjungit i Mello från 2002 till 2014. Det vi upptäckte var en musikalisk brain drain. För trots att nästan lika många artister är födda utanför som i Stockholm, Göteborg och Malmö tillsammans, så är deras nuvarande boendeort ofta en storstad. 4 av 5 artister bor nu i en storstad.

För vår analys letade vi reda på nästan alla artisternas födelse- och nuvarande bostadsorter. Som källa använde vi dels Wikipedia, dels andra öppet tillgängliga datakällor. Generellt är datakvaliteten något sämre ju längre sedan det var artisten uppträdde i Mello: ju längre bak i tiden, desto svårare att hitta korrekt ort.
För individuella artister har vi tagit deras respektive födelse- eller uppväxtort och deras bosättningsort. För duetter har vi oftast utgått ifrån den artist som kommer först i gruppens namn, och för band har vi tagit orten där bandet grundades som födelseort. När vi saknade någon av orterna har vi antagit att artistens fötts på samma ställe som hen bor just nu.
För några artister kunde vi inte hitta varken födelse- eller boendeort. De finns inte med på kartan.

Med hjälp av OpenStreetMaps API har vi tagit fram koordinaterna och sedan beräknat avståndet till närmaste storstad. Storstadsområden är Stockholm, Göteborg och Malmö med omgivning. Gränsen för ett sådant område har vi satt till 60 kilometer från centrum, se Jordbruksverket: Så gjorde vi Allt om landet.

Låtskrivarna

Vem ligger bakom mellolåtarna?

Medan vi kan se en balanserad blandning av manliga och kvinnliga artister på scenen, är det en helt annan visa om man lyfter på locket till låtskrivardatan. Bara 2% av alla låtar är skrivna av kvinnor, jämfört med 66% skrivna av män! Inte nog med det. Det verkar som det är en liten klick som praktiskt taget bedriver mellofabrik i låtskrivande. 10 personer (2%) har varit inblandade i mer än 60% av alla vinnarlåtarna under de senaste 13 åren, och står för sammanlagt 30% av ALLA bidrag.

Vem har skrivit flest mellolåtar?

Vem samarbetade med vem?

Vi samlade in information om alla låtskrivare från 2002 till 2014 från Wikipedia, med web-scraping metoder. Vi använde en databas med alla manliga och kvinnliga svenska namn för att automatiskt tilldela kön till ca 60% av alla artister och 80% av alla låtskrivare inblandade i Melodifestivalen mellan 2002-2014. För de som inte gick att tilldela kön automatiskt gjorde vi det manuellt.

Vi delade sedan låtarna i tre grupper: låtar skrivna enbart av män, enbart av kvinnor, eller av en blandad grupp. Som jämförelse gjorde vi en liknande gruppering baserad på artisterna.

Vi upptäckte även att könsbalansen under åren blivit något bättre. I grafen nedan syns en svag trend i en mer jämställd riktning.

Vi använde en enkel linjär regressionsanalys för att räkna ut när det kommer bli helt jämställt på låtskrivarsidan om trenden skulle fortsätta. Resultaten var att det kommer bli helt jämställd år 2045 om utvecklingen fortsätter i samma takt. Det är om 30 år! Det ska dock sägas att årets Melodifestival (2015) är betydligt mer jämställd än tidigare år. Det beror på att Mellodifestivalen ändrat tävlingsreglerna så att minst hälften av alla låtar måste vara skrivna av minst en kvinna.

Vi räknade också de 10 låtskrivarna som var inblandade i de mest Mellolåtar, och hur många av deras låtar som faktiskt vann Melodifestivalen. För att förstå hur de samarbetar med andra och med varandra byggde vi också ett interaktivt nätverk. Det finns en länk mellan två låtskrivare om de har samarbetat i minst en mellolåt. Vi programmerade själva nätverken med hjälp av kod från FlowingData

Låtarna

Hur låter den typiska mellolåten?

Visst finns det något särskilt med hur Mellobidragen låter? En särksilt känsla, en viss rytm, den där schlagerglädjen. Det är nästan som att låtarna i Mello är resultatet av ett hantverk. Vi tittade lite närmare på det där och upptäckte att de låtar som vunnit Mello har många saker gemensamt. Särskilt om man jämför dem med de låtar som kommit allra sist i tävlingen.

Ett vinnande tempo

Starka känslor i vinnarlåtarna

För att undersöka vad det är som gör den "typiska" Mellolåten valde vi att jämföra vinnare (lila färg i grafiken) med förlorare (grå färg i grafiken). Vår definition av vinnare är de låtar som kom på första till fjärde plats under 2002-2014. Förlorarna består av de 64 låtar som fick absolut minst antal röster under samma tidsperiod. Vi upptäckte snabbt att vinnarna skiljer ut sig från förlorarna på vissa punkter. De variabler där skillnaderna var särskilt stora var tempo, känslopoäng, antal unika ord per låttext, språk och noise.

  • Med tempo menas antalet taktslag per minut, ofta kallat BPM.
  • Med känslopoäng menas den "glädje-score" vi beräknade i vårt första inlägg, texterna (se nedan).
  • För att beräkna antal unika ord per låttext har vi helt enkelt räknat antalet unika ord per låt. Ett ord som förekommer flera gånger räknas alltså bara en gång.
  • Språk är helt enkelt vilket språk artisten sjunger på.
  • Noise är ett lite svårförklarat begrepp, men det mäter hur högljudd en låt är i genomsnitt.

Det ska i ärlighetens namn sägas att det även finns en hel del områden där det inte finns någon klar skillnad mellan vinnare och förlorare. Till exempel är ca 50% av vinnarna i moll och 50% i dur, medan knappt 60% av frlorarlåtarna är i moll och drygt 40% i dur. Knappt någon skillnad alls, alltså.

Så betyder detta att den typiska Mellovinnaren går i 125 BPM, är känsloladdad och högljudd, och har en lång text på engelska? Kanske. Det finns nog många andra saker som avgör vem som vinner Mello också, och det finns alltid gott om undantag för att bekräfta regeln. Men trenden är tydlig: för att en låt som är jättesnabb, inte handlar om känslor, har en kort text och är på svenska ska vinna Mello, ja då krävs det förmodligen både en hel del tur och en hejdundrans scenshow.

Är du nyfiken på datan bakom Mello? Eller tycker du vi har räknat fel? Ladda ned vår databas via länken längst ned på sidan och gör en egen analys!

Texterna

Vad sjunger de egentligen om?

Alla vet hur en Mellolåt brukar vara: glad, peppig och handlar om kärlek. Men är det verkligen så? För att ta reda på det analyserade vi låttexterna i Mello från 2002 och framåt. Och resultatet? Jodå, mer än 80% av låtarna handlar om kärlek. Men trots det är inte låtarna så uppåt som man kan tro. Vi lät en dator göra en känsloanalys av texterna och upptäckte att smärta är nästan lika vanligt som hjärta.

  1. Björn Ranelid & Sara Li: Mirakel (2012)
  2. Eko: Red (2014)
  3. Danny Saucedo: Amazing (2012)
  4. Kalle Moraeus & Orsa Spelmän: Underbart (2010)
  5. Caracola: Smiling in Love (2008)
  6. Linda Sundblad: Lucky You (2011)
  7. The Moniker: Oh My God! (2011)
  8. Agnes: Love Love Love (2009)
  9. Uno & Irma: God morgon (2007)
  10. Charlotte Perrelli: Hero (2008)
  1. Panetoz: Efter solsken (2014)
  2. Lena Philipsson: Det gör ont (2004)
  3. Alcazar: Blame It on the Disco (2014)
  4. Darin: You're Out of My Life (2010)
  5. Eddie Razaz: Alibi (2013)
  6. BWO: You're Not Alone (2009)
  7. Johannes Bah Kuhnke: Tonight (2010)
  8. MissMatch: Drop Dead (2007)
  9. Molly Sandén: Why Am I Crying (2012)
  10. Love Generation: Just A Little Bit (2012)

Hur avgör man vad en låt handlar om? Förvånansvärt ofta är det mest effektivt att helt enkelt räkna vilka ord som är med. För att få en bra uppfattning om vad låtarna i Melodifestivalen handlar om gjorde vi först en översiktskarta av de ämnen som vanligtvis brukar förekomma i låttexter, t.ex. kärlek, längtan/äventyr, tidsangivelser, religion, familj och många andra. Vi skapade en lista med ord relaterade till varje ämne och räknade hur ofta ett ämne nämndes i Mellolåtarna. Inte helt förvånande vann kärlek helt överlägset. Mer än 80% av alla bidrag till Mello innehåller kärlekord - och då har vi säkert missat en massa metaforer. Låtar som hade få (1-3) kärleksord har vi klassat som "lite kärlek", och de som hade fler kärleksord som "mycket kärlek". Alla låtar utom fem är på svenska eller engelska, så vi begränsade oss till de två språken.

För att avgöra vilka låtar som är "peppigast" och "deppigast" har vi gjort en så kallad sentimentanalys på låttexterna. Alla ord i texten får en poäng baserad på om ordet ofta förekommer i glada eller ledsna sammanhang. Detta är ofta en mycket effektiv metod, men kan ibland leda till en del överraskande resultat. Efter solsken av Panetoz är verkligen inte någon deppig låt, men är ändå den låt som har den "ledsnaste" texten enligt vår modell.

Det samlade låtmaterialet i vår analys består av 391 av de 416 låtar som deltog i Mello åren 2002-2014. Till 25 av låtarna har vi inte kunnat hitta någon text och de ingår därför inte i datan.

Är du nyfiken på datan bakom Mello? Eller tycker du vi har räknat fel? Ladda ned vår databas via länken längst ned på sidan och gör en egen analys!

Ladda ner datan

Självklart har vi gjort datan bakom det här öppen för alla att använda.
Ladda ner datan på Github.