Projekt

studentische Projektgruppe - Data Science Semesterprojekt

Intelligente Spotify Playlists

  • Modul / Lehrveranstaltung: Projekt DataScience
  • Semester: 1.-3. Semester
  • Jahr: 2020

Das in dem Modul "Projekt DataScience" durchgeführte Projekt befasst sich mit dem Thema, ob Song-Genres und Song Empfehlungen aussagekräftig klassifiziert werden können. Damit richtet es sich an alle Musikinteressierten, die guten Song-Empfehlungen nicht abgeneigt sind. Das Projekt bedient sich dabei der von Spotify bereitgestellten WebAPI, die es ermöglicht, Playlists auszulesen und so diverse hauseigene Features für jeden Song zu bekommen.

Der Umfang umfasst die Analyse, die Erweiterung und die Verwertung der erhaltenen Metriken. Für die analytischen Schritte wurde auf die gängige Programmiersprache Python zurückgegriffen. Auf der Oberfläche von Jupyter Notebook wurden mit ihrer Hilfe Diagramme und Graphen erstellt, die einen tieferen Einblick in die Daten gewähren. Unter der Zuhilfenahme statistischer Verfahren wurden Ausreißer in den Datensätzen entfernt und neue Metriken angefügt. Zur Erstellung der Modelle wurde die Software Orange Data Mining genutzt. Mit ihrer Hilfe konnten die aufbereiteten Datensätze in einer grafischen Benutzeroberfläche eingesetzt und verschiedene Modelle trainiert werden. Die Auswertung der Klassifikatoren erfolgte an einer von Spotify vorgeschlagenen Playlist. Diese wurde "blind" gehört und klassifiziert, im Anschluss wurden die Ergebnisse mit denen von Orange verglichen.

Die Ergebnisse sind durchaus positiv. Der Klassifikator hat mit seinen vorhergesagten Empfehlungen überzeugt. Verbessern ließen sich diese noch mit einem größeren Datensatz und mit weniger Pauschalisierungen, die im Zuge des begrenzten Zeitraums getroffen werden mussten.