Wat maakt een kerstliedje populair?

Het is weer die tijd van het jaar: het volume wordt vol aangezet en wij zingen en dansen gezellig mee (op 1,5 meter-afstand). Luister jij liever naar je favoriete radiostation, maak jij je eigen kerstafspeellijst of laat je je leiden door wat Spotify je aanraadt? We vroegen ons bij VKA af welke kerstnummers op Spotify populair zijn en welke eigenschappen van de nummers bijdragen aan deze populariteit. Een data-analyse vraagstuk met een feestelijk tintje dus.

Kerstliedjes op Spotifiy

Met behulp van de R package Rspotify” kun je eenvoudig gegevens ophalen over playlists, artiesten en tracks. Zo zijn wij gestart met het zoeken naar ‘kerst’ playlists. Het uitgangspunt hierbij is dat de afspeellijsten die het woord “kerst” (of een vertaling hiervan) in hun naam bevatten in een relevante verzameling aan kerstmuziek zullen resulteren. Door het ophalen van de nummers en hun eigenschappen (features) uit deze afspeellijsten, kunnen we verschillende vragen beantwoorden:

> In hoeveel van deze afspeellijsten is een bepaalde artiest opgenomen?

> Wat is het gemiddelde aantal nummers waarmee een artiest in deze afspeellijsten voorkomt?

> In hoeveel playlists komt elke track voor?

Datakwaliteit

Wat kunnen we zeggen over de kwaliteit van de data omtrent deze verzameling van kerstafspeellijsten uit Spotify? Uiteraard is het zo dat niet elke kerstafspeellijst het woord “kerst” (of een vertaling ervan) in zijn titel heeft. Afspeellijsten met titels als “stille nacht”, “december” of “onder de dennenboom” worden niet meegenomen. Daarnaast, beperken we ons tot playlists die openbaar gedeeld zijn. Het kan zijn dat we hierdoor tracks missen die lokaal populair zijn. Zo komt Snollebollekes maar in één playlist voor met hun track “Beuk De Ballen Uit De Boom”.

Verder is het zo dat een track in meerdere versies kan voorkomen, bijvoorbeeld door een andere opname van dezelfde cover of vanaf een ander (verzamel-)album. Bovendien, niet over elke track is detailinformatie te vinden in de Spotify data. Dit geldt met name voor minder bekende nummers of uitgaves.

De bovengenoemde uitdagingen zijn niet zonder oplossingen. Echter, in het kader van dit artikel hebben we besloten om te focussen op de interessante conclusies die getrokken kunnen worden ondanks deze uitdagingen.

De meest populaire kerstliedjes

Met stip op één is “All I Want for Christmas Is You” van Mariah Carey in de meeste afspeellijsten opgenomen, gevolgd door “It’s the Most Wonderful Time of the Year ” en “It’s Beginning to Look a Lot like Christmas” van respectievelijk Andy Williams en Michael Bublé. De tabel hieronder geeft onze top 10 kerstnummers weer: zowel Mariah Carey als Michel Bublé verschijnen met twee tracks hierin.

Tracktitel Artiest Percentage
All I Want for Christmas Is You Mariah Carey 43.2%
It’s the Most Wonderful Time of the Year Andy Williams 27.8%
It’s Beginning to Look a Lot like Christmas Michael Bublé 26.1%
Happy Xmas (War Is Over) – Remastered 2010 John Lennon 23.9%
Santa Tell Me Ariana Grande 23.2%
Underneath the Tree Kelly Clarkson 20.7%
Blue Christmas Elvis Presley 20.1%
Christmas (Baby Please Come Home) Mariah Carey 17.4%
Little Saint Nick – 1991 Remix The Beach Boys 17.2%
Holly Jolly Christmas Michael Bublé 16.7%

 

Tabel 1: Top 10 meest Populaire kerstnummers (opgenomen in de meeste afspeellijsten waarin het woord “kerst” of een vertaling ervan in de titel. voorkomt).

Wanneer we kijken naar het aantal nummers genoemd in een kerstafsfpeellijsten, dan staat Bing Crosby bovenaan met 881 verschillende nummers, gevolgd door Frank Sinatra met 549 nummers.

Artiest Aantal
Bing Crosby 881
Frank Sinatra 549
Mannheim Steamroller 408
Ella Fitzgerald 408
Nat King Cole 400
Glee Cast 383
Die drei ??? 352
Traditional 315
Elvis Presley 280
Dean Martin 271

 

Tabel 2: Het aantal nummers genoemd in kerstafspeellijsten per artiest.

Het aantal nummers die per artiest beluisterd kunnen worden, resulteert niet per definitie tot de meest in kerstafspeellijst opgenomen artiest. De artiesten die het vaakst zijn opgenomen in een playlist (met minimaal 1 track) worden aangevoerd door Mariah Carey. Toch zien we in onderstaande lijst Frank Sinatra (44.1%) en Bing Crosby (42.3%) op plek 5 en 6 terechtkomen.

Artiest Percentage
Mariah Carey 56.9%
Michael Bublé 51.1%
Wham! 45.6%
Brenda Lee 44.5%
Frank Sinatra 44.1%
Bing Crosby 42.3%
Andy Williams 42%
Dean Martin 40.3%
Nat King Cole 36.9%
Ariana Grande 36.7%

 

Tabel 3: De percentage artiesten die het vaakst is opgenomen in een kerst playlist.

Wat maakt kerstliedjes populair?

Om te bepalen welke factoren en kruisverbanden van belang zijn om een track in zoveel mogelijk playlists te laten verschijnen, gebruiken we een correlatie matrix en een beslisboom (n ~ trackfeatures).

Voor 99.1% van onze tracks, zijn er 0-1 scores per track beschikbaar in Spotify voor onderstaande eigenschappen:

  • Algemene populariteit (popularity (overall))
  • Dansbaarheid (danceability)
  • Energie (energy)
  • Luidheid (loudness)
  • Modus (mode)
  • Luchtigheid (speehiness)
  • Akoestiek (acousticness)
  • Instrumentaliteit (instrumentalness)
  • Levendigheid (liveness)
  • Valentie (valence)
  • Tempo (tempo)
  • Duur (duration)
  • Toonhoogte (key)
  • Tijd notatie (time_signature)

De nummers die weinig voorkomen in afspeellijsten zijn heel divers en over het algemeen geen kerstnummers. We hebben daarom gekozen om de “kerst” nummers in kaart te brengen vanaf opname in tenminste 20 afspeellijsten (1%).

 

Figuur 1: De plot van de correlatiematrix met de track features.

In de correlatieplot hierboven is te zien dat de track features met elkaar samenhangen. Zo hebben bijvoorbeeld de energie en luidheid een negatieve correlatie met de akoestiek. Dit betekent dat nummers met een hoge energielevel en/of minder variatie in luidheid over het algemeen minder akoestisch zijn. Daarnaast is de dansbaarheid positief gecorreleerd met de valentie, stemming van de songtekst. Want wie wordt er nou niet blij van dansen?

Uit de correlatieplot zien we dat de trackfeatures zwak gecorreleerd zijn met n (algemene populariteit). De features hebben dus geen sterke samenhang met de populariteit. Wat verwacht jij te zien als we kijken naar de combinatie van eigenschappen van kerstliedjes?

Figuur 2: Beslisboom om te voorspellen hoe vaak een track gemiddeld voorkomt in de “kerst” afspeellijsten op basis van de features.

Uit de figuur hierboven blijkt dat de tracks gemiddeld in 57 (van de 2000) afspeellijsten voorkomen. Een valentie hoger dan 0.77, een relatief vrolijke noot in de songtekst, zorgt voor een hogere kans om vaker in playlists te verschijnen. Een valentie hoger dan 0.77 én een dansbaarheid van minder dan 0.49 leidt gemiddeld tot twee keer vaker verschijnen in kerstafspeellijsten. Een nummer dat een valentie heeft van meer dan 0.77, dansbaar is, een variatie heeft in luidheid heeft van meer dan 7.9DB én een toonhoogte hoger dan 11 – A sharp, B flat en B – wordt het meest waarschijnlijk opgenomen in de afspeellijsten.

We kunnen daarnaast afleiden dat kerstliedjes uit alle tijden populair zijn. De tijd notatie (time_signature) heeft geen impact op het verschijnen in Spotify’s “kerst” playlists. De eigenschappen van de kerstliedjes hebben weinig correlatie met het aantal keer dat het liedje verschijnt in een Spotify kerstafspeellijst, maar met de juiste combinatie aan eigenschappen heb je een kersthit à la Mariah Carey te pakken.

Wij gaan de kerstperiode mee bewegen met de meest gekozen nummers in de kerstafspeellijsten en zetten vrolijke nummers om bij te dansen! Wij wensen jou fijne feestdagen en een succesvol nieuwjaar!