Trendy muzyczne i przewidywalność sukcesu współczesnych piosenek na czołowych listach przebojów i poza nimi / Myra Interiano, Kamyar Kazemi, Lijia Wang, Jienian Yang, Zhaoxia Yu i Natalia L. Komarowa

0
857
Fot.: Jamelia Niela Davis (piosenkarka, autorka tekstów, aktorka i prezenter telewizyjny)
Artykuł naukowy
Streszczenie
Analizujemy ponad 500 000 piosenek wydanych w Wielkiej Brytanii w latach 1985-2015, aby zrozumieć dynamikę sukcesu (definiowanego jako „wejście” na pierwsze miejsca list przebojów), skorelować sukces z cechami akustycznymi i zbadać przewidywalność sukcesu. Odkryto kilka wielodekadowych trendów. Na przykład, istnieje wyraźny trend spadkowy dla „szczęścia” i „jasności”, a także niewielki trend wzrostowy dla „smutku”. Co więcej, piosenki stają się mniej „męskie”. Co ciekawe, udane utwory wykazują własną, odrębną dynamikę. W szczególności są one „szczęśliwsze”, bardziej „imprezowe”, mniej „zrelaksowane” i bardziej „kobiece” niż większość. Różnica między udanymi a przeciętnymi piosenkami nie jest prosta. W kontekście niektórych cech, udane utwory wyprzedzają dynamikę wszystkich utworów, a w innych mają tendencję do odzwierciedlania przeszłości. Użyliśmy metody losowych lasów (random forests) [Więcej o tej metodzie:https://en.wikipedia.org/wiki/Random_forest#Algorithm], aby przewidzieć sukces piosenek, najpierw w oparciu o ich cechy akustyczne, a następnie dodając zmienną „supergwiazda” (informującą nas, czy artysta utworu pojawił się na czołowych listach przebojów w niedalekiej przeszłości). Pozwoliło to na ilościowe określenie udziału czysto muzycznych cech w sukcesie piosenek i zasugerowało skalę czasową dynamiki mody w muzyce popularnej.

1. Wprowadzenie

Muzyka, a w szczególności piosenki, rzadko pozostawiają ludzi bez emocji. W muzyce jest coś magicznego, a naukowcy próbowali rozwikłać tę magię i wyjaśnić, co sprawia, że kochamy pewną muzykę, nienawidzimy innej muzyki i po prostu słuchamy muzyki [1-3]. W szczególności zauważono, że różne pokolenia lubią różne rodzaje muzyki. W tym badaniu eksploracyjnym skupiamy się na popularnych piosenkach z ostatnich trzech dekad i próbujemy wyodrębnić wielodekadowe trendy w atrybutach muzycznych zarówno udanych, jak i mniej udanych piosenek, a także zobaczyć, co sprawia, że piosenki są popularne w różnych latach.
Wielu autorów badało popularność piosenek i analizowało dynamikę list przebojów. Zidentyfikowano i zbadano różne korelaty sukcesu. Jedno z wcześniejszych badań [4] koncentrowało się na związku między pozycją utworu na listach przebojów a czasem, przez jaki utwór pozostawał na listach przebojów, i wykazało, że największe hity (tj. utwory, które uzyskały najwyższe wyniki) pozostawały na listach przebojów przez dłuższy czas. Bhattacharjee i wsp. [5] opracowali stochastyczny model rozkładu długowieczności albumów na liście Billboard Top 100 Chart. Stwierdzono, że od czasu pojawienia się sieci wymiany plików i związanych z tym zmian rynkowych, prawdopodobieństwo przetrwania utworów na listach przebojów spadło, a albumy, które przetrwały, mają znacznie lepsze perspektywy. Buda i Jarynowski [6] zbadali trendy w popularności piosenek w 12 krajach Europy Zachodniej, analizując dane z cotygodniowych list przebojów w latach 1966-2015. Odkryli oni, że odległości geograficzne i kulturowe odgrywały różną rolę w sukcesie piosenek w różnych epokach (analogowej, cyfrowej i internetowej).
Zbadano wiele różnych czynników związanych z dynamiką utworów na listach przebojów, w tym status popularności („supergwiazda”) i dane demograficzne artysty (artystów), poziom promocji, wytwórnia/firma itp; czynniki te można z grubsza sklasyfikować jako czynniki „społeczno-ekonomiczne” (w przeciwieństwie do czynników „muzycznych”). Asai [7] badał przeboje w japońskiej muzyce popularnej w dwóch 3-miesięcznych okresach (między styczniem a marcem) w 1990 r. i w 2004 r., przed i po penetracji Internetu i transmisji wielokanałowej. Autorzy przeprowadzili parametryczną analizę przeżycia (model wykładniczy) i zbadali różne zmienne związane z produkcją hitu: „firma” (czy piosenka jest produkowana przez jedną z pięciu głównych firm), „gatunek” (czy piosenka jest J-popem), „gwiazda” (czy sprzedaż artysty w zeszłym roku osiągnęła określoną wartość), „powiązanie” (czy singiel jest powiązany z innymi mediami w celach promocyjnych) i „wielu artystów” (czy album jest kompilacją zawierającą kilka albumów). Stwierdzono, że sława artysty, powiązania z innymi mediami i albumy kompilacyjne zawierające kilku artystów wydłużały okres przebywania przeboju na listach przebojów. Analiza przeżywalności została również wykorzystana w [8], w którym zmierzono statystyczne korelacje okresu, w którym album pozostawał na cotygodniowych listach przebojów na amerykańskim rynku muzycznym. Okazało się, że pozycja, na której album zadebiutował na liście przebojów, kariera artysty, promocja za pośrednictwem głównych lub mniejszych wytwórni oraz płeć artysty miały wpływ na długowieczność list przebojów.
Lee [9] również badał dynamikę list przebojów, ale skupił się na innym rodzaju pytania. Lee zbadał zmiany w różnorodności utworów, analizując liczbę utworów z różnych gatunków wchodzących co roku na listę przebojów Top 10 i stwierdził, że różnorodność utworów znacznie spadła we wszystkich gatunkach w latach 1992-2002. W nowszym badaniu Ordanini i Nunes [10] zbadali dynamikę utworów na amerykańskiej liście przebojów Billboard Hot 100 w latach 1974-2013 i zgodnie z [9] stwierdzili spadek liczby utworów zarówno w pierwszej dziesiątce, jak i pierwszej setce od 1974 r. do około 2003 r. (efekt zwycięzca bierze wszystko). Później jednak trend się odwrócił, a liczba utworów na liście przebojów stale rosła po uruchomieniu legalnych internetowych sklepów muzycznych, takich jak iTunes. Dokładnie odwrotny wzorzec zaobserwowano w przypadku artystów. Autorzy doszli do wniosku, że ten ogólny wzorzec odzwierciedlał przejście od mniejszej liczby hitów wydawanych przez większą liczbę supergwiazd do większej liczby hitów wydawanych przez mniejszą liczbę supergwiazd.
Oprócz czynników społeczno-ekonomicznych, badano również wpływ cech muzycznych utworów na ich dynamikę na listach przebojów. Mauch et al. [11] rozważyli ewolucję muzyki popularnej na podstawie amerykańskiej listy przebojów Billboard Hot 100 w latach 1960-2010 i przeanalizowali właściwości muzyczne 17 000 nagrań za pomocą narzędzi do eksploracji danych i pomiaru szeregu ilościowych cech audio. Analiza różnorodności muzycznej wykazała, że według wielu różnych miar różnorodność muzyczna nie zmniejszyła się, a także, że stopniowa ewolucja stylów muzycznych była przerywana przez szereg „rewolucji”. Askin i Mauskapf [12] również badali muzyczne cechy piosenek. Przetworzyli oni listę Billboard’s Hot 100 w latach 1958-2013. Zbadano dwa rodzaje charakterystyk utworów: (i) dane z discogs.com, crowdsourcowanej, ale monitorowanej przez społeczność strony zawierającej obszerne dane o wykonawcach, albumach i utworach oraz (ii) Echo Nest, internetowego dostawcy informacji muzycznych, który przypisuje każdemu utworowi jego charakterystykę dźwiękową, taką jak tempo, głośność i tonacja, a także cechy takie jak „taneczność”, „akustyczność” itp. Przeprowadzona przez nich analiza statystyczna wykazała, że kilka muzycznych cech utworów koreluje z ich sukcesem (mierzonym jako dotarcie do top 1 lub top 10 na listach przebojów lub utrzymanie się na listach przebojów przez długi czas). Następnie autorzy zbadali sieci kulturowe piosenek (zdefiniowane przez wzorce utworzone przez atrybuty muzyczne piosenek) i odkryli, że piosenki, które są zbyt podobne do swoich sąsiadów, mają trudniejszy czas na awans na listy przebojów, chyba że piosenka jest szczególnie wyjątkowa, w którym to przypadku może skorzystać na tym, że nie jest zatłoczona przez inne podobne piosenki.
W tym artykule skupiamy się na sukcesie piosenek i badamy, w jaki sposób zależy on od muzycznych cech hitów. W przeciwieństwie do większości wspomnianych powyżej artykułów, badamy znacznie większą klasę piosenek, zarówno na listach przebojów, jak i poza nimi. Pozwala nam to zdefiniować sukces piosenek po prostu jako „znalezienie się” na listach przebojów. Jest to prostsza definicja sukcesu niż definicje stosowane wcześniej, takie jak długowieczność utworów lub szczytowa pozycja na listach przebojów. Zaletą tego podejścia jest to, że uwzględnienie utworów zarówno na listach przebojów, jak i poza nimi, pozwala na większą zmienność cech muzycznych, a tym samym nadaje im większą moc predykcyjną. Naszym celem jest zrozumienie dynamiki sukcesu, skorelowanie sukcesu z cechami muzycznymi i zbadanie przewidywalności sukcesu w przyszłości przy użyciu trendów z przeszłości. Analizujemy ponad 500 000 piosenek wydanych w Wielkiej Brytanii w latach 1985-2015 i wykorzystujemy podejścia statystyczne i uczenia maszynowego w celu określenia (i) w jakim stopniu rzeczywiste atrybuty muzyczne piosenek przyczyniają się do ich sukcesu oraz (ii) jakie trendy muzyczne można zaobserwować we współczesnej muzyce w ciągu ostatnich 30 lat.

2. Gromadzenie danych
2.1. Źródła danych

Wśród niezliczonych sposobów pomiaru popularności utworu znajdują się sprzedaż, odtwarzanie, streaming wideo, wzmianki na Twitterze i wyszukiwania w Internecie. Ze względu na długą, spójną i dostępną historię prowadzenia rejestrów, listy przebojów magazynów branżowych są logicznym pierwszym krokiem w próbie zbudowania modelu preferencji muzycznych w czasie. Do naszego badania wybraliśmy listę Top 100 Singles Chart sporządzoną przez Official Charts Company w Wielkiej Brytanii. Następnie rozszerzyliśmy te dane, łącząc jak najwięcej utworów z metadanymi i deskryptorami cech muzycznych z MusicBrainz i AcousticBrainz (patrz poniżej).

2.1.1. Wykresy Wielkiej Brytanii

Najważniejszym źródłem branżowym rankingów muzyki pop w Wielkiej Brytanii jest oficjalna lista singli publikowana przez firmę Officer Charts Company [ 13 ]. Firma udostępnia internetową bazę danych sięgającą lat pięćdziesiątych XX wieku, ale zawarte w niej wykresy w rzeczywistości obejmują kilka firm, które czasami korzystały z różnych źródeł informacji lub różnych metodologii. Co więcej, listy przebojów miały różną długość w różnym czasie, ale z jednym małym wyjątkiem zawierały 100 utworów od 1983 r. Baza danych reprezentuje to, co obecni właściciele, którzy przejęli władzę w 1994 r., uważają za najbardziej spójny historyczny rodowód list przebojów. Obecnymi zarządcami listy przebojów są brytyjski przemysł fonograficzny, reprezentujący brytyjski biznes nagraniowy; Stowarzyszenie Entertainment Retailers Association, reprezentujące sprzedawców detalicznych muzyki w formacie cyfrowym i fizycznym oraz świadczących usługi transmisji strumieniowej audio i wideo; oraz Millward Market Research Company, która opracowuje dane dotyczące sprzedaży. Rankingi 100 najlepszych opierają się na sprzedaży plików do pobrania, płyt kompaktowych, płyt winylowych i strumieni audio. W 2004 r. do rankingów uwzględniono pliki do pobrania w formie cyfrowej, w 2014 r. strumienie audio, a w 2007 r. zniesiono wymóg, aby utwór miał fizycznie dostępny odpowiednik.

2.1.2. MusicBrainz

MusicBrainz to generowane przez społeczność publiczne repozytorium metadanych muzycznych dostępne przez Internet lub do pobrania w formie statycznej [14]. Swoją działalność rozpoczęło w latach 90. jako alternatywa open source dla identyfikacji płyt kompaktowych. Od tego czasu rozszerzył swój zakres, rozszerzając informacje, które przechowuje dla wydań i utworów, o powiązane informacje, takie jak gatunek, kraj pochodzenia, data wydania i pseudonimy artystów. Rozszerzony charakter informacji, dostępnych w formie przeszukiwalnej bazy danych, pozwala na odkrycie bardziej skomplikowanych relacji, które można wykorzystać w badaniach muzycznych i odkrywaniu muzyki. Podstawowym sposobem organizacji bazy danych jest seria unikalnych identyfikatorów, określanych jako MBID (identyfikatory MusicBrainz), które oznaczają pewne aspekty danych.

2.1.3. AcousticBrainz

AcousticBrainz to projekt, którego celem jest demokratyzacja i ułatwienie badań nad muzyką poprzez publiczne udostępnienie bardziej kompleksowych danych [15]. Jego pomysłodawcą jest Xavier Serra z Music Technology Group (MTG) na Universitat Pompeu Fabra w Barcelonie, we współpracy z MusicBrainz. W przeszłości prawa autorskie i kwestie logistyczne utrudniały badaczom dostęp do dużych zbiorów informacji muzycznych, za pomocą których można było testować hipotezy i tworzyć algorytmy. Czasami udostępniano duże bazy danych, takie jak Million Song Dataset i komercyjne repozytorium Echo Nest, ale Million Song Dataset nie jest aktualizowany w celu odzwierciedlenia nowej muzyki, a Echo Nest ma ograniczenia w użyciu i nie ma dostępu do podstawowych algorytmów. Odpowiedzią AcousticBrainz na te wyzwania było opracowanie gotowej struktury, która może być wykorzystywana do crowdsource’owania danych z poszczególnych bibliotek muzycznych.
AcousticBrainz składa się z trzech głównych elementów. Pierwszym z nich jest ekstrakcja cech. U podstaw wysiłków AcousticBrainz zmierzających do zbudowania repozytorium informacji w granicach praw autorskich leży biblioteka algorytmów ekstrakcji cech o nazwie Essentia. Chociaż biblioteki są dostępne w formie modyfikowalnej przez użytkownika w celu generowania nowych algorytmów wykorzystujących zebrane informacje, AcousticBrainz spakował je razem w postaci wstępnie skompilowanych plików binarnych, aby ułatwić korzystanie z nich wolontariuszom i zapewnić, że dane są uzyskiwane i obliczane w jednolity sposób. Osoby fizyczne wnoszą swój wkład w projekt poprzez pobieranie zestawu algorytmów, uruchamianie ich na swoich kolekcjach muzycznych i zwracanie danych do projektu. Oprogramowanie skanuje kolekcję i generuje niskopoziomowe informacje akustyczne, takie jak deskryptory widmowe, czasowe, rytmiczne i tonalne, które zawierają informacje takie jak uderzenia na minutę i czas trwania utworu. To właśnie ten krok stanowi drugi komponent AcousticBrainz jako centrum przechowywania danych. Zebrane informacje niskiego poziomu są dostępne dla każdego do testowania i rozwoju algorytmów bez konieczności dostępu do ogromnej kolekcji muzyki. Trzecim komponentem AcousticBrainz jest tworzenie semantycznych deskryptorów muzycznych. Zwrócone dane są analizowane przy użyciu metod uczenia maszynowego i technik klasyfikacji wyszkolonych na zbiorach danych z adnotacjami, a te wysokopoziomowe cechy są dodawane do informacji zawartych o każdym utworze.

2.2. Cechy

Wysokopoziomowe cechy muzyczne w bazie danych AcousticBrainz uzyskuje się poprzez zastosowanie klasyfikatorów, wyszkolonych na zestawach utworów z adnotacjami ekspertów, do niskopoziomowych informacji przesyłanych przez użytkowników; charakterystyka zmiennych jest opisana online [15]. Użytkownicy mają możliwość trenowania własnych modeli, ale ze względu na spójność, publicznie rozpowszechniane są tylko cechy wysokiego poziomu obliczone przy użyciu wstępnie wytrenowanego zestawu klasyfikatorów. W oparciu o doświadczenia badaczy z obecnymi danymi i tworzeniem nowych modeli przez użytkowników, klasyfikatory będą prawdopodobnie aktualizowane w przyszłości, ponieważ dokładność zdolności modeli do przewidywania na większych zbiorach danych jest nieznana.
Istnieje łącznie 18 zmiennych odpowiadających cechom wysokiego poziomu obliczonym przez AcousticBrainz wykorzystanym w tej analizie, z których 12 jest binarnych, a sześć kategorycznych. Z każdą zmienną związane jest szacunkowe prawdopodobieństwo trafności. Na przykład, w przypadku zmiennych binarnych, każdy utwór został sklasyfikowany jako posiadający lub nieposiadający cechy binarnej, a wraz z tym podano prawdopodobieństwo następcze poprawności klasyfikacji. Zmienne binarne zostały ogólnie podzielone na dwie kategorie: właściwości akustyczne muzyki (takie jak barwa lub taneczność) oraz nastroje opisujące dźwięki (takie jak smutne, imprezowe lub radosne). Poniżej przedstawiono 12 zmiennych binarnych. Pierwsze pięć to właściwości akustyczne muzyki, następnie dwie cechy dźwięku i pięć nastrojów.
  1. barwa — kolor — (ciemny/jasny)
  2. tonacja — (tonalna/atonalna)
  3. taneczność – (można tańczyć/nie tańczyć)
  4. głos, instrumentalny — (głos/instrumentalny)
  5. płeć – płeć w muzyce wokalnej – (mężczyzna/kobieta)
  6. nastrój, akustyka — rodzaj dźwięku — (akustyczny/nieakustyczny)
  7. nastrój, elektroniczny — rodzaj dźwięku — (elektroniczny/nieelektroniczny)
  8. nastrój, zrelaksowany — (zrelaksowany/niezrelaksowany)
  9. nastrój, smutny — (smutny/nie smutny)
  10. nastrój, impreza — (impreza/nie impreza)
  11. nastrój, szczęśliwy — (szczęśliwy/nieszczęśliwy)
  12. nastrój, agresywny — (agresywny/nieagresywny)
Istnieje również sześć zmiennych kategorycznych, które próbują sklasyfikować muzykę w bardziej złożonych klasach nastroju i gatunku.
    • — Grupa 1: namiętna, porywająca, pewna siebie, hałaśliwa, hałaśliwa
    • — Grupa 2: wesoła, wesoła, zabawna, słodka, sympatyczna/dobroduszna
    • — Grupa 3: wykształcona, przejmująca, tęskna, słodko-gorzka, jesienna, ponura
    • — Cluster4: humorystyczny, głupi, kampowy, dziwaczny, kapryśny, dowcipny, ironiczny
    • — Gromada 5: agresywna, ognista, napięta/niespokojna, intensywna, niestabilna, trzewna
      nastroje, Mirex:
  1. gatunek, elektronika – ambient, dnb, house, techno, trance
  2. gatunek, tzanetakis – blues, klasyka, country, dis, hip-hop, jazz, met, pop, reg, rock
  3. gatunek, dortmund – alternatywa, blues, elektronika, folk, country, funk, soul, rytm i blues, jazz, pop, rap, hip-hop, rock
  4. gatunek, rosamerica – klasyka, taniec, hip-hop, jazz, pop, rytm i blues, rock, spe
  5. rytm, ismir04-cha cha, jive, quickstep, rumba, samba, tango, walc wiedeński, wolny walc
Dla każdej z tych sześciu klasyfikacji kategorialnych każda piosenka ma przypisaną jedną kategorię (wraz z prawdopodobieństwem, że jest to dokładny opis). W szczególności, dla „1. nastrój, mirex”, jeden z pięciu klastrów jest przypisany do każdej piosenki. Podobnie w przypadku „2. gatunek, elektroniczny” wybierana jest jedna z pięciu kategorii.
Powyższe cztery różne zmienne gatunkowe różnią się od siebie metodologią klasyfikacji; patrz [16]. Są one oparte na modelach i algorytmach opracowanych przez różne grupy. Pierwsza z nich („gatunek, elektroniczny”) to zbiór danych opracowany przez MTG w celu oznaczania utworów jako jednej z pięciu różnych kategorii muzyki elektronicznej. Drugi („genre, tzanetakis”) opiera się na pracy George’a Tzanetakisa i jest opisany w [17]. W oparciu o tę pracę, oprogramowanie open source do przetwarzania dźwięku i wyszukiwania informacji muzycznych (MIR) jest dostępne online [18]. Trzeci („genre, dortmund”) opiera się na pracy wykonanej na Uniwersytecie w Dortmundzie, opisanej w [19] i [20]. Dane są dostępne online [21]. Wreszcie, „gatunek, rosamerica” został również opracowany przez MTG i jest opisany w [22,23].
Dwie pozostałe zmienne kategorialne zawdzięczają swoje nazwy skróconym tytułom społeczności. International Society of Music Information Retrieval (ISMIR) to grupa non-profit, która organizuje coroczną konferencję obejmującą wyzwania związane z danymi, w których wszyscy uczestnicy otrzymują ten sam etykietowany zestaw danych szkoleniowych [24]. W 2004 roku jednym z wyzwań było opracowanie algorytmu automatycznej klasyfikacji tempa. Klasyfikator rytmu („6. rhythm, ismir04”) dostarczony przez MusicBrainz jest oparty na tych danych. Wreszcie, Music Information Retrieval Evaluation eXchange (MIREX) to oparte na społeczności ramy oceny systemów i algorytmów MIR [25]. Podobnie jak ISMIR, społeczność MIREX wydaje coroczne wyzwania i zestawy danych dla różnych zadań MIR. W 2009 roku grupa ogłosiła zadanie kategoryzacji nastroju. Kategorie, które miały zostać przyjęte, były opisane w zmiennej kategorialnej „1. nastroje, mirex”. Utwory użyte w zestawie treningowym dla tego klasyfikatora zostały ręcznie przypisane przez ludzi [26].
12 cech binarnych wymienionych powyżej jest wykorzystywanych w §3 do badania trendów wielodekadowych i sygnatur sukcesu; również zmienna kategoryczna „5. genres, rosamerica” jest wykorzystywana do kontroli gatunków. Wszystkie zmienne, zarówno binarne, jak i kategoryczne, są wykorzystywane w §4 do przewidywania sukcesu piosenek.

2.3. Ekstrakcja danych

Dane Official Charts Top 100 rozpoczynają się w tygodniu 6 stycznia 1985 r. i kończą w tygodniu 19 lipca 2015 r., reprezentując 148 190 pozycji i 30 081 unikalnych piosenek. Ponieważ Official Charts Company nie udostępnia publicznie interfejsu programowania aplikacji do pobierania danych, użyliśmy skryptów Pythona do zeskrobania informacji z opublikowanych list przebojów i utworzenia bazy danych z możliwością wyszukiwania.
Statyczna kopia bazy danych MusicBrainz została pobrana 19 kwietnia 2016 r. ze strony ftp.1 Baza danych, wraz ze schematem, jest udostępniana na stronie internetowej i ilustruje wszystkie relacje, które można przeszukiwać. Informacje, które wykorzystaliśmy z MusicBrainz, są uporządkowane według alfanumerycznych identyfikatorów (zwanych MBID), które odpowiadają każdemu wydaniu. Zgodnie z dokumentacją MusicBrainz,2 „wydanie jest unikalnym wydaniem produktu dostępnego do konsumpcji, wyróżniającym się takimi cechami, jak data, kraj i opakowanie”, przy czym dwa pierwsze są najbardziej istotne dla naszych celów. Dlatego ten sam utwór wydany w USA będzie miał inny identyfikator MBID niż jego odpowiednik wydany w Wielkiej Brytanii.
Publiczne dane AcousticBrainz zostały opublikowane jako seria 19 przyrostowych aktualizacji, z których każda podzielona jest na dane wysokiego i niskiego poziomu. Dane niskopoziomowe to zestaw informacji akustycznych zwróconych do projektu przez użytkowników. Informacje wysokopoziomowe to zestaw deskryptorów semantycznych dołączonych do każdego utworu przez wyszkolone klasyfikatory. Kopia oryginalnego zrzutu danych AcousticBrainz ze stycznia 2015 r. oraz 18 kolejnych zrzutów danych zostały pobrane 22 kwietnia 2016 r., reprezentując 1 641 765 unikalnych utworów. Te same identyfikatory MBID, które organizują dane MusicBrainz, organizują również dane AcousticBrainz. Każda aktualizacja to seria plików JSON, z których każdy odpowiada identyfikatorowi MBID wydania utworu, do którego należy, i zawiera wszystkie informacje z ekstrakcji deskryptora muzycznego Essentia oraz powiązane z nim metadane z MusicBrainz.
Na chwilę obecną nie ma mechanizmu sprawdzania duplikatów zgłoszeń. Może się zdarzyć, że różni użytkownicy prześlą do AcousticBrainz cechy tego samego utworu z tym samym identyfikatorem MBID. Jest to potencjalny problem, ponieważ na deskryptory muzyczne generowane przez oprogramowanie może mieć wpływ jakość nagrania źródłowego lub inne czynniki. Aby zachować spójność, zachowaliśmy tylko pierwsze wystąpienie każdego utworu.
Ponieważ chcieliśmy porównać udane utwory z nieudanymi, musieliśmy zidentyfikować pulę nieudanych utworów. Ogólnie rzecz biorąc, ze względu na różne zasady, które obowiązywały w całej historii listy przebojów, trudno jest stworzyć zestaw utworów nieuczestniczących w notowaniach w jednolity sposób, który zawsze odzwierciedlałby zasady listy przebojów w momencie ich wydania. Na potrzeby tego badania zdecydowaliśmy się uwzględnić wszystkie dostępne utwory z wydań dystrybuowanych w Wielkiej Brytanii (albumy, single, EP-ki, winyle itp.). W rzeczywistości, dla obecnych zasad, nie jest to tak arbitralne, ponieważ każdy utwór dostępny do płatnego pobrania teoretycznie kwalifikuje się do listy przebojów. Po zidentyfikowaniu kandydujących utworów, pobraliśmy ich muzyczne deskryptory z bazy danych AcousticBrainz, którą stworzyliśmy na podstawie publicznie dostępnych danych.
Wyodrębnienie cech muzycznych dla utworów z list przebojów nie było tak proste. Po pierwsze, istnieje znacznie więcej piosenek, które nie znalazły się na listach przebojów, niż tych, które się na nich znalazły. Ponieważ AcousticBrainz jest bazą danych o otwartym kodzie źródłowym, zależną od zgłoszeń ochotników, a wydania identycznych utworów w poszczególnych krajach mogą nie być reprezentowane, w przypadku utworów z list przebojów nie wymagaliśmy, aby informacje o deskryptorze muzycznym pochodziły z wydania oznaczonego jako specyficzne dla Wielkiej Brytanii, o ile pasowały do tytułu i wykonawcy. Kolejnym problemem jest to, że dane pochodzą z dwóch różnych źródeł, Official Charts Company i MusicBrainz. W związku z tym istnieją różnice w pisowni, kolejności słów i konwencji nazwisk artystów, co utrudnia uzgodnienie rekordów. Jednym z najbardziej problematycznych obszarów były utwory z wieloma współpracownikami. Aby spróbować złagodzić skutki różnic w listach wykonawców, tokenizowaliśmy nazwy wykonawców i ignorowaliśmy frazy łączące. Udało nam się dokładnie dopasować 13 073 unikalnych utworów bez jakiejkolwiek manipulacji danymi. Co więcej, byliśmy w stanie dopasować dodatkowe 1463 utwory po tokenizacji nazwisk artystów i wykorzystaniu możliwości przetwarzania języka naturalnego MySql, co dało łącznie 14 536 utworów z 30 081 wszystkich unikalnych utworów na listach przebojów.
Ponieważ baza danych w AcousticBrainz jest wypełniana przez wolontariuszy, możliwe jest, że istnieje stronniczość z powodu preferencji osób, które przesyłają utwory. Należy jednak zauważyć, że z założenia stronniczość (jeśli istnieje) jest taka sama zarówno w przypadku utworów notowanych na listach przebojów, jak i tych, które się na nich nie znajdują. Aby sprawdzić istnienie tendencyjności, należałoby porównać rozkład cech utworów w bazie danych z rozkładem cech wszystkich utworów (lub dużego podzbioru utworów). Niestety, takie informacje nie były dla nas dostępne. AcousticBrainz była największą bazą danych z odpowiednimi informacjami, do której mieliśmy dostęp. Niemniej jednak, aby uzyskać przybliżony obraz zakresu możliwego błędu systematycznego, przeprowadziliśmy następujące obliczenia pilotażowe. Skupiając się na danych z 2005 roku, stworzyliśmy listę wszystkich utworów, które znalazły się na listach przebojów (1189 utworów) i porównaliśmy ją z listą utworów z 2005 roku, które zostały uwzględnione w analizie (678 utworów, które udało nam się dopasować do AcousticBrainz). Aby porównać te dwa zestawy, losowo wybraliśmy 100 piosenek z każdej z dwóch list; odnosimy się do wynikowych zestawów 100 piosenek odpowiednio jako zestaw A i zestaw B. Dla obu tych zestawów zidentyfikowaliśmy gatunek wszystkich utworów, wyszukując każdy utwór ręcznie. Jeśli wymieniono więcej niż jeden gatunek, użyliśmy pierwszego na liście. Należy zauważyć, że przypisania gatunków zebrane w ten sposób różnią się od kategorycznych zmiennych gatunkowych w AcousticBrainz (§s2b), których używaliśmy wszędzie indziej w tym artykule.
Porównaliśmy trzy największe kategorie gatunków, którymi były rock, muzyka alternatywna/indie i pop. Test χ 2 Pearsona z poprawką na ciągłość Yatesa wykazał, że różnice nie są istotne statystycznie. Analiza ta sugeruje, że jeśli istnieje odchylenie między zestawem wykorzystanym w tym utworze a zestawem wszystkich piosenek, nie jest to duże odchylenie.
Rysunek 1 przedstawia liczbę utworów (z dostępnymi informacjami o funkcjach), które pobrano w latach 1985–2015. W momencie wyodrębniania informacje za 2015 r. były niekompletne, w związku z czym w tym roku znalazło się mniej utworów. We wszystkich pozostałych latach wyodrębniano średnio 582 utwory rocznie, które nie znalazły się na liście 100 najlepszych, przy przedziale od 466 w 1985 r. do 733 w 1997 r. Średnio rocznie wyodrębniano 16 245 utworów spoza listy 100 najlepszych, przy zakresie od 2805 w 1985 r. do 27 095 w 2008 roku.
Rysunek 1.Wykres 1. Liczba 100 najpopularniejszych i pozostałych 100 utworów, dla których dostępne są informacje o funkcjach, w latach 1985–2015.

3. Analiza danych

3.1. Pojęcie sukcesu

Sukces współczesnych piosenek można definiować na różne sposoby. Na przykład Rossman [ 27 ] badał czas antenowy w radiu jako korelację sukcesu piosenek; i Dertouzos [ 28 ] skupili się na ekonomicznych aspektach sukcesu. W wnikliwym artykule [ 12 ] zbadano wyniki na czołowych miejscach list przebojów i zbadano dwie miary sukcesu piosenek: (i) maksymalną popularność utworu zdefiniowano jako jego najwyższą pozycję na listach przebojów oraz (ii) jako miarę trwałej popularności, wykorzystano liczbę tygodni na wykresach. Chociaż Askin i Mauskapf zidentyfikowali korelacje między różnymi cechami muzycznymi a sukcesem [ 12 ], ich analiza została z konieczności ograniczona faktem, że wzięto pod uwagę tylko utwory znajdujące się na listach przebojów, podczas gdy większość utworów pominięto w obliczeniach. W obecnej pracy bierzemy pod uwagę zarówno utwory notowane na listach przebojów, jak i te nienotowane na listach przebojów (ta ostatnia stanowi zdecydowaną większość utworów). Co więcej, sukces utworu definiujemy po prostu jako „dotarcie” na listy przebojów.

3.2. Trendy czasowe w cechach utworów

Rysunek 2 przedstawia trendy czasowe w zakresie 12 cech przeciętnego utworu wraz z ich przedziałami ufności, zarówno dla zebranych utworów spoza listy 100 najlepszych (czerwone kropki), jak i dla 100 najlepszych utworów (niebieskie kropki). Aby utworzyć tę liczbę, każdą z 12 zmiennych binarnych przeliczono na wartość w [0,1], stosując prawdopodobieństwa późniejsze. Na przykład, jeśli zmienna „happy” dla danej piosenki wynosi 1, a jej prawdopodobieństwo późniejsze wynosi p, wówczas wartość jest dana przez p; jeśli zmienna wynosi 0, wówczas wartość wynosi 1− p. Następnie obliczono średnie i 95% przedziały ufności dla każdej zmiennej i dla każdego roku. Z rysunku 2 widać, że w przypadku większości cech średnie cechy utworów odnoszących sukcesy znacznie różnią się od cech utworów niezbadanych, co sugeruje, że utwory odnoszące sukcesy mają swój własny, odrębny wzór. Znaczenie pozostaje nawet po uwzględnieniu wielokrotnych testów.
Rysunek 2.
Rysunek 2. Średnie wartości dla 12 cech 100 najpopularniejszych utworów (niebieskie kropki) i 100 utworów spoza listy najpopularniejszych (czerwone kropki) wraz z ich 95% przedziałami ufności (linie przerywane) przy użyciu rozkładu t dla lat 1985–2014 .
Oprócz sugestii, że utwory odnoszące sukcesy stanowią odrębną klasę utworów (więcej szczegółów poniżej), rysunek 2 informuje nas również o trendach czasowych, jakie zaszły w cechach utworów na przestrzeni ostatnich 30 lat. Po pierwsze zauważamy, że ogólnie rzecz biorąc, „szczęście” i „jasność” wykazywały tendencję spadkową, podczas gdy „smutek” wzrósł w ciągu ostatnich około 30 lat. Jest to zgodne z ustaleniami [ 29 ], którzy w latach 1980–2007 badali treść liryczną piosenek popularnych. Stwierdzono, że z biegiem czasu ilość pozytywnych emocji w piosenkach malała. W szczególności zgłoszono, że popularne teksty muzyczne zawierają obecnie więcej słów związanych z koncentracją na sobie (np. zaimki w pierwszej osobie liczby pojedynczej), mniej słów opisujących towarzystwo i kontakty społeczne (np. rzeczowniki w pierwszej osobie liczby mnogiej), a więcej słów antyspołecznych ( np. „nienawidź”, „zabij” itp.). Autorzy wyjaśniają te tendencje jako zgodne z ogólnym wzrostem tendencji do samotności, izolacji społecznej i psychopatologii [ 30 , 31 ].
Po drugie, w ciągu ostatnich trzech dekad wzrosła „relaksacja” i „zdolność do tańca” (z prawdopodobnie powiązanym wzrostem cech „elektronicznych” i „atonalnych”). Podobne ciekawe badanie tendencji kulturowych w muzyce przedstawia Straw [ 32 ], który badał zjawisko polaryzacji współczesnej (lata 90.) muzyki popularnej pomiędzy tanecznym popem a rockiem/heavy metalem. Autor opisuje pewien upadek głównego nurtu muzyki rockowej, podając kilka przyczyn, do których zaliczają się zmiany w politycznej roli muzyki, brak nowych wykonawców i brak innowacyjności w muzyce rockowej od czasów punka. Następnie zauważa, że ​​akt tańca jest „ściśle związany z uogólnionym poczuciem zmniejszonych zahamowań”. Wskazuje to na możliwą korelację pomiędzy tendencjami wzrostowymi w zakresie zdolności tanecznych i zrelaksowania się, którą można zaobserwować na rysunku 2 .
Wreszcie widać, że odsetek głosów męskich wykazywał tendencję spadkową. Co więcej, obserwujemy, że utwory odnoszące sukcesy charakteryzują się większym odsetkiem artystek w porównaniu do wszystkich utworów. Komentujemy te trendy w następnej sekcji.

3.3. Podpisy sukcesu

Jak wspomniano w poprzedniej sekcji, średnie cechy odnoszących sukcesy piosenek często systematycznie różnią się od cech wszystkich piosenek; patrz rysunek 2 . W szczególności obserwujemy następujące prawidłowości:
  • (1) Utwory, które odniosły sukces, są szczęśliwsze niż utwory przeciętne.
  • (2) Utwory, które odniosły sukces, mają jaśniejszą barwę niż utwory przeciętne.
  • (3) Utwory, które odniosły sukces, są mniej smutne niż utwory przeciętne.
  • (4) Utwory, które odniosły sukces, są bardziej imprezowe niż utwory przeciętne.
  • (5) Utwory, które odniosły sukces, są mniej zrelaksowane niż utwory przeciętne.
  • (6) Udane utwory są bardziej taneczne niż przeciętne utwory.
Wzory (1–5) są bardzo interesujące, ponieważ pod względem tych pięciu cech popularne piosenki nie odzwierciedlają ogólnej tendencji. Choć można by się spodziewać, że większość popularnych piosenek będzie w awangardzie, wydaje się, że tak nie jest. Jak opisano powyżej, w większości piosenek nastąpił spadek szczęścia i jasności oraz wzrost smutku (z podstawową tendencją w postaci zwiększonej negatywności). Utwory, które odniosły sukces, wydają się przeczyć tym trendom. Jednym z powodów, który może przyczynić się do tej tendencji, jest rosnący sukces albumów kompilacyjnych [ 33 ], które okazały się bardzo popularne jako strategia ograniczania ryzyka oparta na przepakowywaniu i ponownym wprowadzaniu starszych utworów. 3 Innym elementem może być rosnące znaczenie starszych konsumentów muzyki [ 33 ], co może wprowadzić pewną „inercję” w sukcesie muzyki popularnej.
Istnieje również kilka nowych rozróżnień, które wydają się pojawiać w ciągu ostatniej dekady:
  • (7) W ostatnich latach popularne piosenki są coraz częściej śpiewane przez kobiety. Jest to szczególnie interesujące, biorąc pod uwagę szeroką debatę na temat roli kobiet w przemyśle muzycznym [ 34 ], zwłaszcza kwestii nierówności płci, stereotypów i seksualizacji śpiewaczek [ 35 ].
  • (8) W ostatnich latach popularne utwory były mniej agresywne niż przeciętne utwory, co być może sugeruje częściowe odwrócenie trendów opisanych w [ 29 ].
Wzorce te można również zaobserwować na rysunku 3 , gdzie nakreśliliśmy rozkłady prawdopodobieństwa dla wszystkich cech utworów udanych (niebieski) i nieudanych (żółty). Ponownie wykorzystano wartości uzyskane przy użyciu prawdopodobieństw późniejszych. Różnice w rozkładach są bardzo istotne dla wielu cech.
Rysunek 3.
Rysunek 3. Rozkład różnych cech piosenek udanych (niebieski) i nieudanych (żółty). Przecięcie dwóch histogramów jest na rysunku szare. Pokazano dane skumulowane z 30 lat. Poszczególne histogramy dla każdego roku pokazują podobne wzorce (nie pokazano).

3.4. Gatunek i sukces

Dla kompletności zbadaliśmy wpływ różnych gatunków na sukces piosenek. Wykorzystano gatunki według metodologii „rosamerica” [ 16 ], ponieważ metoda ta zapewnia najbardziej zrównoważoną reprezentację gatunku w zbiorze danych. Na rysunku 4 przedstawiamy iloraz szans siedmiu gatunków. Można zauważyć, że utwory klasyczne i jazzowe raczej nie odniosą sukcesu (w wąskiej definicji zastosowanej w tym badaniu), natomiast największym sukcesem są gatunki taneczne i popowe. Obserwujemy także wyraźną tendencję spadkową w sukcesie rocka począwszy od początku XXI wieku. W tabeli na dole ryciny 4 przedstawiamy współczynniki korelacji Pearsona pomiędzy sześcioma najczęściej reprezentowanymi gatunkami a niektórymi cechami muzycznymi, dla których na rycinie 2 zaobserwowano wyraźne tendencje . Jest oczywiste, że gatunki i cechy nie są niezależne i można dostrzec wiele korelacji, które wcale nie są zaskakujące, takich jak pozytywna korelacja między gatunkiem „dance” i fabularnym „impreza” oraz ujemna korelacja między gatunkiem „rock” a gatunkiem cecha „zrelaksowany”.
Rysunek 4.
Rysunek 4. Statystyka gatunków. Zaprezentowano iloraz szans dla różnych gatunków piosenek dla lat 1985–2015. W tabeli przedstawiono współczynniki korelacji Pearsona pomiędzy gatunkami i cechami.
Aby zrozumieć związek między gatunkiem a sukcesem, powtórzyliśmy analizę rysunku 2 , kontrolując jednocześnie gatunek piosenek. Wyniki są intuicyjne. Jeśli w ramach gatunku dana cecha ma mniejsze zróżnicowanie w porównaniu ze zróżnicowaniem wśród wszystkich utworów, cecha ta nie różni się znacząco między utworami odnoszącymi sukcesy i nieudanymi w ramach tego gatunku. Przykładowo, jeśli weźmiemy pod uwagę tylko utwory z gatunku „taniec”, ich cecha taneczności jest bardzo wysoka, zarówno w przypadku utworów udanych, jak i nieudanych, i nie obserwujemy istotnej różnicy między piosenkami udanymi i nieudanymi w kontekście tej cechy. Jednak wiele trendów utrzymuje się przy kontrolowaniu gatunku. Na przykład wśród piosenek „popowych” utwory odnoszące sukcesy charakteryzują się większą „tanecznością”, są bardziej „imprezowe” i „elektroniczne”; ponadto wśród piosenek „rockowych” utwory odnoszące sukcesy są zwykle bardziej „wesołe”, bardziej „taneczne”, bardziej „imprezowe” i mniej „zrelaksowane”, zgodnie z tymi samymi tendencjami, jak pokazano na rysunku 2. Co ciekawe, udane utwory „rockowe” są bardziej „męskie” niż te, które nie odniosły sukcesu, co jest odwrotnością ogólnego trendu. Można to prawdopodobnie zrozumieć ze specyfiki gatunku, w którym w przeszłości sukcesy odnosiło więcej śpiewaków płci męskiej. Zaobserwowaliśmy jeszcze trzy takie odwrócenia trendów: utwory „rockowe”, „jazzowe” i „klasyczne” są mniej „elektroniczne”, gdy odnoszą sukcesy (podczas gdy, ogólnie rzecz biorąc, udane utwory są zwykle bardziej „elektroniczne”). Być może dzieje się tak dlatego, że cecha ta jest silnie obecna w bardziej popularnych gatunkach, takich jak „pop” i „dance”, ale nie pomaga to w popularyzacji innych, nieelektronicznych gatunków.
Na koniec zauważamy, że chociaż analiza sukcesu w kontekście gatunku jest interesująca, należy zrozumieć, że automatyczne określenie gatunku jest trudnym zadaniem i istnieje wiele niespójności pomiędzy czterema zmiennymi gatunku w AcousticBrainz. Dlatego wydaje się, że zmienne niższego poziomu, takie jak 12 binarnych cech muzycznych wymienionych w §s2b, dostarczają więcej informacji na temat trendów w zakresie sukcesu piosenek.

4. Przewidywanie sukcesu

Biorąc pod uwagę, że wiele cech wskazuje na znaczące różnice między utworami odnoszącymi sukcesy i nieudanymi, następnie sprawdzamy, czy sukces utworu można przewidzieć na podstawie utworów opublikowanych we wcześniejszych latach. W szczególności używamy metody losowych lasów do prognozowania utworów na trzy różne lata: 2014, ostatni rok z danymi za cały rok; 2004 – rok, w którym można wykorzystać dwie trzecie danych; oraz rok 1994, w którym znajduje się jedna trzecia danych, które można wykorzystać. Lasy losowe to metoda predykcyjna oparta na drzewach klasyfikacyjnych, które są znane jako elastyczne narzędzie predykcyjne do modelowania liniowych i nieliniowych funkcji cech. W porównaniu z metodą drzewa klasyfikacyjnego, która opiera się na pojedynczym drzewie, metoda losowych lasów pozwala uniknąć nadmiernego dopasowania, łącząc przewidywania z listy drzew decyzyjnych, które są tworzone przez losowe ponowne próbkowanie obserwacji i podpróbkowanie współzmiennych/cech [36 ] . W naszej analizie użyliśmy pakietu R „RandomForest”. Rozważaliśmy także inne metody klasyfikacji, takie jak jednowarstwowe i dwuwarstwowe sieci neuronowe. Na podstawie naszych danych odkryliśmy, że zapewniały one podobną wydajność jak lasy losowe. W związku z tym nie będą one tutaj raportowane.

4.1. Przewidywanie sukcesu piosenek w 2014 roku przy użyciu zbiorów losowych

4.1.1. Schemat 1: Losowy model zbioru trenowany każdego roku
Dla każdego roku w latach 1985–2013 (włącznie) wytrenowaliśmy losowy model zbioru, korzystając z danych z każdego roku, aby przewidzieć, czy piosenka z 2014 r. zajmie pierwsze miejsca na listach przebojów. Ponieważ populacja danych muzycznych jest wysoce niezrównoważona (tj. utworów spoza list przebojów było o wiele więcej niż utworów z czołowych miejsc), pobraliśmy próbkę jedynie z podzbioru utworów spoza list przebojów (których rozmiar jest równy liczbie utworów na listach przebojów) wraz z ze wszystkimi przebojami piosenek roku, aby wyszkolić modelkę. Na przykład pobraliśmy 585 z 16 058 utworów z 2013 r., które nie znalazły się na listach przebojów, ponieważ w zbiorze danych znajdowało się 585 utworów z tego roku, które znajdowały się na czołowych miejscach list przebojów. Tę samą metodę próbkowania zastosowaliśmy przy tworzeniu zbioru testowego na podstawie danych z 2014 r. W 2014 r. było 526 utworów znajdujących się na czołowych miejscach list przebojów i 13 592 utworów spoza list przebojów. Do zestawu testowego wykorzystaliśmy wszystkie utwory z czołowych miejsc na listach przebojów i zsamplowaliśmy 526 z 13 592 utworów spoza list przebojów. Kiedy testowaliśmy wydajność przewidywania każdego przeszkolonego modelu, naprawiliśmy zestaw testowy. Oznacza to, że pobraliśmy próbkę ze zbioru testowego tylko raz. Zastosowaliśmy współczynnik dokładności do pomiaru mocy przewidywania, która jest zdefiniowana jako procent przypadków, w których przewidywana jest właściwa klasa (w tym przypadku znajdująca się na czołowych lub nienotowanych pozycjach) dla utworów ze zbioru testowego. Eksperymentowaliśmy z tym schematem w kontekście typów podejść. W pierwszym podejściu wykorzystaliśmy 18 zmiennych kategorycznych, których poziomy opisano w §s2b jako zmienne objaśniające. W przypadku drugiego podejścia przekształciliśmy pierwszych 12 cech binarnych z 18 zmiennych kategorycznych na liczbę dodatnią z zakresu od 0 do 1, korzystając z prawdopodobieństwa związanego z poziomem cechy, a pozostałe wielopoziomowe zmienne kategoryczne zachowaliśmy zgodnie z opisem w §s2b. Następnie przeszkoliliśmy i przetestowaliśmy model, korzystając z 12 zmiennych ciągłych (o wartościach od 0 do 1) i sześciu wielopoziomowych zmiennych kategorycznych. W przypadku poniższych schematów skupiliśmy się tylko na pierwszym podejściu.

4.1.2. Schemat 2: Połączony model lasu losowego

Zmotywowani mocą uczenia zespołowego, połączyliśmy poszczególne modele losowego lasu wyszkolone w poprzednim schemacie w jeden model przy użyciu wag proporcjonalnych do indywidualnej dokładności przewidywania uzyskanej w schemacie 1 z prawdopodobieństwami cech. Oznacza to, że wykorzystując wszystkie indywidualne modele, przewidujemy prawdopodobieństwo klasy dla instancji j (tj. prawdopodobieństwo, że utwór j z 2014 roku znajdzie się na szczycie listy przebojów), , przy użyciu połączonego modelu jest
Gdzie i to odpowiednio dokładność przewidywania i prawdopodobieństwo klasy, na przykład j przy użyciu losowego modelu zbioru wytrenowanego w roku i (uzyskanym według schematu 1). Przypisaliśmy przypadek testowy j do klasy znajdującej się na szczycie listy  prawdopodobieństw cech, a nie cech binarnych, ponieważ odkryliśmy, że pierwsza metoda zapewnia większą dokładność przewidywań.

4.1.3. Schemat 3: Losowy model lasu trenowany na wszystkich (lub podzbiorze) danych

W odróżnieniu od schematu 2, który łączy modele, ten schemat łączy dane. W szczególności przeszkoliliśmy losowy model lasu z czasem jako zmienną ciągłą, wykorzystując wszystkie dane (lub podzbiór) utworów z lat 1985–2013 (włącznie). Następnie przetestowaliśmy skuteczność predykcyjną modelu w roku 2014. Zbiory uczące i testowe zebrano zgodnie z procedurą opisaną na schemacie 1.

4.2. Łącznie ze zmienną „supergwiazda”.

Pojęcie „supergwiazd” uznano za ważny czynnik decydujący o sukcesie piosenek. Adler zasugerował [ 37 ], że tylko stosunkowo niewielka liczba artystów i ich produktów osiąga ogromny sukces, ponieważ konsumenci minimalizują koszty poszukiwań, po prostu wybierając artystów, którzy są już popularni. Artystę nazywamy supergwiazdą, jeśli przynajmniej jedna jego piosenka znalazła się na czołowych miejscach list przebojów w zeszłym roku (definicja 1) lub w ciągu ostatnich 5 lat (definicja 2). Wstępna analiza wykazała, że ​​zmienna supergwiazdy zdefiniowana w definicji 2 ma znacznie większą przewidywalność; w efekcie w dalszej analizie zastosowaliśmy definicję 5 lat. Wśród utworów znajdujących się na listach przebojów proporcje utworów z artystą-supergwiazdą wahały się od 0,51 do 0,68; patrz rysunek 5b . Należy zauważyć, że najniższy odsetek wystąpił w 1986 r., co wynika z faktu, że do określenia supergwiazd można używać wyłącznie piosenek z 1985 r. Wśród utworów nienotowanych na listach przebojów odsetek utworów z udziałem supergwiazdy jest znacznie niższy i waha się od 0,0009 do 0,02. Ta duża różnica wskazuje, że supergwiazda może być zmienną o dużej wartości predykcyjnej. Aby zbadać tę hipotezę, powtórzyliśmy powyższą analizę, włączając zmienną supergwiazdy jako predyktor.
Rysunek 5.
Rysunek 5. Odsetek artystów będących supergwiazdami i dokładność przewidywań dotyczących piosenek w 2014 r. ( a ) Proporcje artystów będących supergwiazdami wśród utworów znajdujących się na listach przebojów i nienotowanych w latach 1986–2014. Ponieważ dane przed 1985 r. nie były dostępne, nie zdefiniowano supergwiazd dla artystów w 1985 r. ( b ) Dokładność prognoz przy użyciu schematu 1 przy ciągłym wprowadzaniu danych. Rysunek przedstawia średnią dokładność z 10 symulacji rocznie. Oś x oznacza rok danych szkoleniowych.

4.3. Prognozy na lata 2004 i 1994

Aby sprawdzić, czy wnioski z przewidywania utworów z 2014 r. można uogólnić na inne lata, sprawdziliśmy, czy utwory z dwóch pozostałych lat (2004 i 1994) można z powodzeniem przewidzieć na podstawie utworów z lat poprzednich. Modele predykcyjne, które rozważaliśmy, są podobne do tych używanych do przewidywania utworów w 2014 roku.

4.4. Wyniki dla losowych modeli lasów

Tabela 1 i rysunek 5b podsumowują skuteczność przewidywań utworów z 2014 roku (uśrednioną z 10 symulacji) różnych modeli wykorzystujących powyższe schematy. Wynik pokazuje, że poszczególne losowe modele lasów przeszkolone w 2013 r. zapewniają lepszą dokładność przewidywań niż inne indywidualne modele przeszkolone w innym roku. Co więcej, modele wytrenowane w ostatnich latach (2010–2013) radzą sobie lepiej niż inne pod względem dokładności predykcji. Jest to szczególnie prawdziwe, gdy nie użyto zmiennej supergwiazdy. Kiedy jednak w analizie predykcyjnej uwzględniono zmienną supergwiazdy, tendencja ta ulega osłabieniu. Należy zauważyć, że supergwiazda jest silnym prognostykiem sukcesu, jak sugeruje zasadnicza różnica między dwiema krzywymi dokładności na rysunku 5b i pomiędzy kolumnami w tabeli 1 . Na przykład, jeśli do przewidywania utworów na rok 2014 stosuje się ciągłe wprowadzanie utworów w 2013 r., uwzględnienie zmiennej „supergwiazda” poprawia dokładność przewidywań o 15% (0,85 w porównaniu z 0,74). Obserwujemy, że zmienna supergwiazdy, będąca tak silnym predyktorem sukcesu, maskuje subtelniejsze trendy w przewidywaniach opartych na cechach muzycznych: podczas gdy niebieska linia na ryc. 5b pokazuje spadek w stosunku do poprzednich lat, czerwona linia na ryc. 5b ma znacznie wolniejszy spadek. Należy pamiętać, że wartości zmiennych supergwiazd są niezależne od osi poziomej, ponieważ są obliczane na podstawie występów artystów w ciągu ostatnich 5 lat.
Tabela 1.

Przewidywanie wyników utworów w 2014 r., ze zmienną supergwiazdą i bez niej, przy użyciu różnych schematów.

Z wyników przedstawionych w tabeli 1 obserwujemy również, że model oparty na roku 2013 jest porównywalny pod względem trafności predykcji z metodami łączącymi modele lub dane z lat poprzednich, a uczenie z większą liczbą, ale wcześniejszych danych, nie poprawia trafności predykcji.
Aby sprawdzić, czy tendencje zidentyfikowane dla roku 2014 można zaobserwować w pozostałych latach, przedstawiliśmy dokładność prognoz dla lat 1994 i 2004 ( rysunek 6 ). Podobnie jak w przypadku wyników za rok 2014, supergwiazda jest także ważnym predyktorem utworów z lat 1994 i 2004. W porównaniu z wynikami za rok 2014 dokładność przewidywań dla lat 1994 i 2004 jest niższa, a tendencja wzrostowa jest mniej oczywista. Jednym z możliwych wyjaśnień jest to, że jakość danych z ostatnich lat, szczególnie tych po 2005 r., jest znacznie lepsza w wyniku boomu sprzedaży muzyki w Internecie.
Rysunek 6.
Rycina 6. Dokładność przewidywań dla piosenek w latach 2004 ( a ) i 1994 ( b ).

5. Dyskusja i wnioski

W tym badaniu wykorzystaliśmy obszerne dane z brytyjskich list przebojów MusicBrainz i AcousticBrainz, które obejmowały ponad 500 000 utworów wydanych w ciągu ostatnich 30 lat (1985–2015), aby zbadać dynamikę sukcesu utworów. Za sukces uznawaliśmy piosenkę, jeśli pojawiła się na listach przebojów. Badaliśmy wpływ cech muzycznych piosenek i próbowaliśmy znaleźć korelaty sukcesu piosenek, a także zbadać wielodekadowe trendy w przemyśle muzycznym. Chociaż funkcje wykorzystane w tym badaniu są określone przez dostępność w dużej publicznej bazie danych, można argumentować, że niniejsze badanie ma wartość teoretyczną. Bardzo podobne cechy muzyczne wykorzystano w [12], gdzie stwierdzono, że są one skorelowane z sukcesem utworu (mierzonym albo długowiecznością na listach przebojów, albo najwyższą pozycją na listach przebojów); cechy te nie miały jednak wystarczającej mocy, aby przewidzieć sukces. W naszej analizie większej klasy piosenek i przy bardziej prymitywnej definicji sukcesu (jako „dotarcie na listy przebojów”) udało nam się stworzyć rozsądne modele predykcyjne, stosując metodę lasów losowych. Z tej perspektywy można więc powiedzieć, że uzyskany wynik sugeruje, że cechy są rozsądne.
Co więcej, wykazano, że wiele cech wykorzystanych w analizie (np. „nastroje”) wykazuje wyraźną tendencję na przestrzeni ostatnich kilkudziesięciu lat, co jest zgodne z tendencjami zgłaszanymi przez badaczy z innych obszarów badań poznawczych, społecznych i behawioralnych. To prowadzi nas do pierwszego przedstawionego tutaj wyniku, który dotyczy odkrytych trendów czasowych; patrz rysunek 2, czerwone linie. Wyraźna tendencja spadkowa w zakresie „szczęśliwości” i „jasności” oraz niewielka tendencja wzrostowa w przypadku „smutku” jest zgodna z ustaleniami DeWall i in. [29], którzy badali wielodekadowe trendy w tekstach piosenek i odkryli, że na przestrzeni lat zmniejszyło się wykorzystanie pozytywnych emocji, a wzrosła częstotliwość semantycznych wskaźników samotności i izolacji społecznej. Co ciekawe, w tym konkretnym przypadku charakterystyka akustyczna piosenek wskazuje na podobne wzorce, jak te odkrywane w tekstach, gdyż w ogóle związek pomiędzy treścią melodyczną i liryczną pieśni jest dość skomplikowany [38]. Co więcej, nasze badanie wykazało kilkudziesięcioletni wzrost „taneczności” i „zrelaksowania” piosenek, co może wskazywać na stopniowy wzrost popularności i rozprzestrzeniania się tanecznego popu w porównaniu z przeciwstawnym stylem rockowym [32] . Wreszcie okazuje się, że „męskość” piosenek (czyli liczba śpiewaków płci męskiej w muzyce popularnej) zmniejszyła się w ciągu ostatnich 30 lat. Co ciekawe, utwory, które odniosły sukces, wykazały tendencję do bycia jeszcze mniej „męskimi” niż przeciętne utwory z ostatnich lat objętych badaniem.
To prowadzi nas do drugiego zestawu wyników uzyskanych w tej analizie, czyli porównania utworów przeciętnych i utworów odnoszących sukcesy. Po pierwsze zauważamy, że utwory, które odniosły sukces (tj. utwory z list przebojów) są stosunkowo rzadkie. Donoszono, że jedynie 2% albumów wprowadzonych na rynek w USA w 1998 r. sprzedało się w liczbie przekraczającej 50 000 egzemplarzy i tylko 10% wszystkich tytułów osiąga próg rentowności [ 33 ] . Z naszego zbioru danych wynika, że ​​każdego roku średnio mniej niż 4% wszystkich piosenek odnosi sukcesy. Porównując charakterystykę akustyczną piosenek, pokazaliśmy, że udane utwory znacznie różnią się od większości utworów, a ich cechy czasami podążają za własnymi trendami. Można to wyraźnie zobaczyć na rysunku 2 , porównując niebieskie linie (udane utwory) z czerwonymi liniami (nieudane utwory). Zaobserwowaliśmy, że udane piosenki są szczęśliwsze, jaśniejsze, bardziej imprezowe, bardziej taneczne i mniej smutne niż większość piosenek. Niektóre z tych trendów wskazują, że utwory odnoszące największe sukcesy są sprzeczne z ogólnymi trendami obejmującymi wiele dekad. Wydaje się, że publiczność woli radosne piosenki, mimo że z roku na rok ukazuje się ich coraz więcej.
Co więcej, zauważyliśmy, że chociaż trendy dotyczące utworów odnoszących sukcesy mniej więcej odzwierciedlają ogólne trendy (często na innym poziomie ilościowym), istnieją dwie jakościowo odrębne relacje między cechami utworów odnoszących sukcesy a ogólną dynamiką obejmującą wiele dekad. (i) W przypadku dwóch cech („taniecowość” i „męskość”) utwory, które odniosły sukces, wydają się przewidywać ogólną tendencję. Na przykład w kontekście „tańczalności” odnoszące sukcesy utwory są bardziej „do tańca” niż utwory przeciętne, a ogólną tendencją jest wzrost „zdolności do tańca”. (ii) W przypadku czterech cech wydaje się, że utwory, które odniosły sukces, odzwierciedlają „przeszłość” przeciętnych utworów. Na przykład, chociaż ogólne „szczęście” zarówno w przypadku utworów odnoszących sukcesy, jak i utworów przeciętnych maleje w ciągu ostatnich 30 lat, utwory, które odniosły sukces, są znacznie „szczęśliwsze” niż te, które nie powiodły się.
Leży to u podstaw ogólnego poglądu, że sukces jest trudny do zdefiniowania i uogólnienia. Podczas gdy Rentfrow i Gosling [ 39 ] odkryli wyraźny związek między cechami osobowości ludzi a ich preferencjami muzycznymi, w [ 40 ] wykazano, że ludzie mają trudności z przewidywaniem własnych przyszłych upodobań i antypatii. Dalej, cytując [ 41 ], „Hity, książki i filmy cieszą się wielokrotnie większym powodzeniem niż przeciętnie, co sugeruje, że „najlepsze” alternatywy jakościowo różnią się od „pozostałych”; jednak eksperci zazwyczaj nie potrafią przewidzieć, które produkty odniosą sukces”. W naszym przypadku, mimo że ogólnie rzecz biorąc, udane piosenki są na przykład „szczęśliwsze”, bardziej „imprezowe”, mniej „zrelaksowane” i bardziej „kobiece” niż większość, niekoniecznie pozwala nam to naiwnie przewidywać, że konkretna „wesoła, imprezowa, nie zrelaksowana” piosenka śpiewana przez kobietę odniesie sukces; do tego samego wniosku, do którego doszedł [ 12 ]. Dlatego podjęliśmy próbę zastosowania bardziej wyrafinowanych metod uczenia maszynowego, aby sprawdzić, czy możemy przewidzieć sukces z jakimkolwiek stopniem wiarygodności. Okazało się że
  • (i) korzystając z dostępnych nam właściwości akustycznych, nie byliśmy w stanie przekroczyć dokładności przewidywania wynoszącej 0,74;
  • (ii) wykorzystanie informacji w przeszłości nie poprawiło prognozy; innymi słowy, wydawało się, że tylko dane z poprzedniego roku, a nie dane starsze, znacząco przyczyniły się do naszej zdolności do skutecznego przewidywania w danym roku;
  • (iii) dodając element nieakustyczny (status „supergwiazdy”), udało nam się osiągnąć dokładność przewidywania na poziomie 0,86.
Odkrycia te są dość interesujące. W odniesieniu do punktu (i) powyżej, niemożność przekroczenia przez nas dokładności przewidywania wynoszącej 0,74 (w przypadku samych cech akustycznych) świadczy o istnieniu brakujących informacji. Należy zauważyć, że granica ta została uzyskana, gdy skupiliśmy się wyłącznie na cechach muzycznych utworów, co oczywiście nie jest całą historią, co wyraźnie pokazano w punkcie (iii) powyżej. W przeszłości wykazano, że inne czynniki mają znaczący wpływ; w rzeczywistości niektórzy autorzy, tacy jak Asai [ 7 ], badali sukces jako funkcję wyłącznie czynników pozamuzycznych. Inni autorzy badali związek między czynnikami muzycznymi i społecznymi. W [ 41 ] autorzy przeprowadzili symulację rynku muzycznego, aby pokazać, że popularność zależy zarówno od wpływu społecznego, jak i jakości artystycznej. Autorzy doszli do wniosku, że „o sukcesie tylko częściowo zadecydowała jakość: najlepsze piosenki rzadko wypadały słabo, a najgorsze rzadko dobrze, ale możliwy był każdy inny wynik”. Hamlen [ 42 ] badał zasadność dwóch przeciwstawnych poglądów na temat przyczyn sukcesu. Jeden z poglądów jest taki, że konsumenci muzyki popularnej nie dostrzegają ani nie doceniają „jakości” czy „umiejętności” śpiewu. Drugi pogląd głosi, że w dynamice sukcesu dominuje „fenomen supergwiazdy”, w którym bardzo małe różnice w umiejętnościach powiększają się, tworząc nieproporcjonalny poziom sukcesu. Autorzy ci zbadali w szczególności korelację między obiektywnie zmierzoną „jakością głosu” a sukcesem i odkryli, że chociaż nie wyjaśnia to tego całkowicie, odegrało to znaczącą rolę w sukcesie piosenek.
Nasze wyniki, wyrażone w (i) i (iii) powyżej, sugerują ilościową miarę tych wzorców. Chociaż odkryliśmy, że dokładność przewidywania można znacznie poprawić, jeśli uwzględni się zmienną supergwiazdy, fakt, że jesteśmy w stanie przewidzieć sukces z dokładnością 0,74 na podstawie cech akustycznych, sugeruje jedynie, że cechy prawdziwie muzyczne są bardzo ważne. Nasza analiza dokładnie określa skalę tego znaczenia w muzyce popularnej w ostatnich dekadach.
Punkt (ii) powyżej sugeruje, że moda muzyczna jest stosunkowo krótkotrwała. W literaturze sugeruje się, że moda w ogóle jest złożona, a zmiany w modzie trudne do wyjaśnienia. Cytując Liebersona [ 43 ], „moda ma swoje własne wewnętrzne mechanizmy, które generują zmiany nawet przy braku zmian społecznych…. Z definicji moda zmienia się po prostu dla mody – ciągły dopływ nowych funkcji i projektów jest koniecznością w przypadku wielu produktów”; zobacz także [ 44 ]. Sugerowano, że za szybką dynamiką mody odpowiada związek mody z tożsamością społeczną i manifestacją hierarchii statusu. Podczas gdy wiele osób w grupie ma tendencję do kopiowania zachowań, osoby znajdujące się na szczycie hierarchii próbują odróżnić się od osób znajdujących się na dole, pełniąc rolę tych, którzy wyznaczają trendy [ 45 , 46 ]. Kolejnym czynnikiem, który może odpowiadać za szybką dynamikę zmian, jest ostra konkurencja wśród dostawców muzyki na przepełnionym rynku i ich dążenie do „wyróżnienia się w tłumie” [ 47 ].
Ogólnie rzecz biorąc, nasze eksploracyjne badanie dynamiki muzyki popularnej i sukcesu piosenek ujawniło, że analiza cech akustycznych pozwala nam zidentyfikować szereg wielodekadowych trendów, zdefiniować udane utwory z własną dynamiką i pomaga (w pewnym stopniu) przewidzieć sukces piosenek.
Opublikowano: https://doi.org/10.1098/rsos.171274

Dostępność danych

Dane użyte w tym artykule są publicznie dostępne, jak wyjaśniono w tekście i wyszczególniono w źródłach, a także wyszczególniono poniżej: Oficjalny wykres singli: http://officialcharts.com . AcousticBrainz: https://acousticbrainz.org .

Wkłady autorów

Badanie zaprojektowały NLK i ZY; MI, KK i LW wniosły wkład w analizę danych statystycznych; JY i ZY wniosły wkład w analizę uczenia maszynowego; Artykuł napisali NLK, MI, JY i ZY. Wszyscy autorzy wyrazili ostateczną zgodę na publikację.

Konkurencyjne interesy

Autorzy nie deklarują żadnych konkurencyjnych interesów.

Finansowanie

NLK, KK, MI i LW dziękują za wsparcie w ramach grantu na nasiona IMBS (2015–2016).

Bibliografia

Przypisy

1 http://ftp.musicbrainz.org/pub/musicbrainz/data/fullexport/ .

2 https://musicbrainz.org/doc/Release .

3Chociaż sukces definiujemy jako samo umieszczenie na wykresie, należy pamiętać, że nadal ma to miejsce w kontekście konkretnego roku. Gdyby tak nie było, spodziewalibyśmy się, że wznowienia poprzednich hitów zawsze pojawiałyby się na listach przebojów, ale dane tego nie potwierdzają; tylko niektórym utworom udaje się ponownie znaleźć na listach przebojów. W związku z tym twierdzi się, że różnica w charakterystyce ponownie wydanych utworów, którym udaje się ponownie znaleźć na listach przebojów, w porównaniu ze starymi hitami, które nie reprezentują czegoś ważnego, ani jeśli chodzi o wewnętrzną naturę piosenek, które potrafią stać się hitami nawet w nowym roku, ani o gusta grup demograficznych, których nawyki związane z konsumpcją muzyki są najczęściej reprezentowane przez kryteria trafień na wykresie.

Link do artykułu: https://royalsocietypublishing.org/doi/10.1098/rsos.171274

Opublikowano przez Royal Society na warunkach licencji Creative Commons Uznanie autorstwa http://creativecommons.org/licenses/by/4.0/ , która pozwala na nieograniczone wykorzystanie pod warunkiem podania oryginalnego autora i źródła.

interiano-et-al-2018-musical-trends-and-predictability-of-success-in-contemporary-songs-in-and-out-of-the-top-charts

Obraz wyróżniający: Plik Jamelia (49188174882).jpg

Z Wikimedia Commons, bezpłatnego repozytorium multimediów