mbio / julesverne

Un package R pour les livres de Jules Verne.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Un package R pour les livres de Jules Verne

Ce package contient quelques livres de Jules Verne tels que distribués sur le Projet Gutenberg. Les livres sont encodés en UTF-8, préformattés et préparés pour des exercices de text mining utilisant la langue française. La structure est un data frame de 2 colonnes:

  • text: le texte du livre (une ligne contient environ 70 caractères),
  • book: le titre du livre correspondant (de type factor).

Les livres actuellement disponibles dans le package sont:

  • archipelenfeu: L'archipel en feu (1884)
  • autourdelalune: Autour de la lune (1869)
  • cinqsemaines: Cinq semaines en ballon (1863)
  • tourdumonde: Le tour du monde en 80 jours (1872)
  • souslesmers1: Vingt-mille lieues sous les mers - première partie (1869)
  • souslesmers2: Vingt-mille lieues sous les mers - deuxième partie (1870)
  • voyageterre: Voyage au centre de la terre (1864)

Installation

Vous pouvez installer le package à partir de Github:

library(devtools)
devtools::install_github("mbio/julesverne")
library(julesverne)

Utilisation

La fonction principale du package retourne un data frame de 2 colonnes contenant l'ensemble des livres disponibles:

verne()

La commande suivante permet d'afficher le nombre de lignes de chaque livre:

library(dplyr)
verne() %>%
  group_by(book) %>%
  summarise(nb_lignes = n())

On peut afficher la liste des livres comme suit:

levels(verne()$book)

Pour le contenu d'un livre en particulier, par exemple Cinq semaines en ballon, entrez simplement cinqsemaines (le nom de la variable). Ou assignez-la à une autre variable: livre1 <- cinqsemaines. Le format retourné est une liste de caractères.

Pour une description de chaque livre, utilisez ?archipelenfeu ou l'équivalent pour les autres titres. Utilisez ?verne pour la description de la fonction.

About

Un package R pour les livres de Jules Verne.


Languages

Language:R 100.0%