aristotle-tek / NUNC-replication

Fichiers réplication pour le projet Nouveaux Usages du Numérique et Continuités

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

NUNC-replication

Fichiers réplication pour le projet Nouveaux Usages du Numérique et Continuités

Introduction

Ce dépôt est constitué de fichiers de réplication du projet NUNC! Analyse Automatisée des Alertes, de la Laboratoire Techné, financé par la Fondation Maison des Sciences de l’Homme .

Le moyen le plus simple de voir les résultats est d'accéder à l'application Web Streamlit ici : https://aristotle-tek-nunc-multipageaccueil-0q1uwk.streamlit.app/

Aperçu

Le code est basé sur trois aspects principaux, dans les dossiers correspondants :

  1. (twitter-sentiment) Collecter des Tweets et effectuer une analyse des sentiments des données Twitter (nécessite un bearer token pour le Twitter API v2 - gratuit pour les chercheurs ).

  2. (google-trends) Collecter de données sur les données de recherche Google (basé sur le travail "Predicting Initial Unemployment Insurance Claims Using Google Trends" de Paul Goldsmith-Pinkham et Aaron Sojourner)

  3. (streamlit) Présenter ces informations dans une application Web interactive à l'aide de Streamlit.

Modèle d'analyse des sentiments

Le sentiment des tweets est analysé sur la base du modèle CamemBERT, qui utilise l'architecture d'un Transformer. Pour plus de détailles en français, voir un tutoriel de base ici

CamemBERT est une adaptation de l'architecture RoBERTa, entraînée sur un corpus français pour fournir de meilleurs résultats en français. En plus du modèle CamemBERT, Theophile Blard a formé un modèle spécifiquement destiné à analyser les sentiments, basé sur des critiques de films. Son code est disponible ici.

About

Fichiers réplication pour le projet Nouveaux Usages du Numérique et Continuités

License:MIT License


Languages

Language:Python 78.9%Language:R 21.1%