1. Introducción

Este script Python nos permite extraer un listado de libros a partir de la información de episodios de un podcast.

2. Requisitos

Para ejecutar este script necesitamos las siguientes herramientas:

Python 3.8 o superior
pip
Ambiente virtual
Base de datos SQLite
Python dot-env
Selenium

3. Instalación

Clonar el repositorio

git clone https://github.com/Fhernd/extractor_titulos_libros.git

Crear un ambiente virtual

python -m venv venv

Activar el ambiente virtual

3.1 Linux/macOS:

source venv/bin/activate

3.2 Windows:

venv\Scripts\activate.bat

Instalar las dependencias

pip install -r requirements.txt

Crear un archivo .env con la siguiente información:

EMAIL= # Correo electrónico de la cuenta de ChatGPT
PASSWORD= # Contraseña de la cuenta de ChatGPT

4. Ejecución

Para ejecutar el script, debemos ejecutar el siguiente comando:

python main.py

5. Resultados

La información de libros también quedará almacenada en la base de datos.

El script nos generará un archivo libros.txt con el siguiente formato:

6. Notas importantes

Antes de ejecutar el script hay que tener en cuenta el nombre de la base de datos SQLite.
La extracción de títulos de libros es semiautomática, es decir, el navegador mostrará un captcha que hay que resolver manualmente.

About

Este módulo permite extraer títulos de libros de los episodios de un podcast de Spotify. Es parte del proyecto número 1: Extracción de Títulos de Libros

Languages

Language:Python 100.0%