Este script Python nos permite extraer un listado de libros a partir de la información de episodios de un podcast.
Para ejecutar este script necesitamos las siguientes herramientas:
- Python 3.8 o superior
- pip
- Ambiente virtual
- Base de datos SQLite
- Python dot-env
- Selenium
- Clonar el repositorio
git clone https://github.com/Fhernd/extractor_titulos_libros.git
- Crear un ambiente virtual
python -m venv venv
- Activar el ambiente virtual
3.1 Linux/macOS:
source venv/bin/activate
3.2 Windows:
venv\Scripts\activate.bat
- Instalar las dependencias
pip install -r requirements.txt
- Crear un archivo
.env
con la siguiente información:
EMAIL= # Correo electrónico de la cuenta de ChatGPT
PASSWORD= # Contraseña de la cuenta de ChatGPT
Para ejecutar el script, debemos ejecutar el siguiente comando:
python main.py
La información de libros también quedará almacenada en la base de datos.
El script nos generará un archivo libros.txt
con el siguiente formato:
-
Antes de ejecutar el script hay que tener en cuenta el nombre de la base de datos SQLite.
-
La extracción de títulos de libros es semiautomática, es decir, el navegador mostrará un captcha que hay que resolver manualmente.