Orlogskapten / lyricsAnalysis

Academic project as part of the Advanced Python class of master MOSEF. Realized with Paul Leydier.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Lyrics Analysis

Academic project as part of the Advanced Python class of master MOSEF. Realized with Paul Leydier.


Le but de ce projet est de récupérer sur un site web de l'information, et d'appliquer des notions de regex, de NLP etc. que nous avons pu développer durant le cours de Python Avancé.

Nous allons utiliser ce site https://search.azlyrics.com, qui enregistre pour la pluspart des artistes l'ensemble de leurs musiques avec les paroles (écrites par la communauté).

ATTENTION ici on ne se concentre que sur les albums des artistes, c'est à dire que tous les sons qui ne sont pas sortis dans un album ne sont pas comptabilisés. Sans cette condition, difficile de mettre une année sur la diffusion du son sur le site. Car notre but, est d'analyser l'évolution dans le temps du vocabulaire de nos artistes, la vulgarité, le sentiment...

Ainsi, vous pourrez retrouver la récolte et la construction du dataset dans le Jupyter Notebook creation_dataset_lyrics, et l'analyse dans le notebook analysis_lyrics.

About

Academic project as part of the Advanced Python class of master MOSEF. Realized with Paul Leydier.


Languages

Language:Jupyter Notebook 100.0%