leotodisco / WLT

Tool che utilizza la tecnologia Whisper per trascrivere le lezioni universitarie.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

WLT

Descrizione

WLT (Whisper Lecture Transcriber) è un tool che utilizza la tecnologia Whisper per trascrivere le lezioni universitarie. Può essere utilizzato per convertire file audio in testo. Apre la strada anche ad attività di estrazione di keywords o text summarization.

Requisiti

Per utilizzare WLT, assicurati di soddisfare i seguenti requisiti:

  1. Python 3.11: Assicurati di avere installato Python 3.11 o versioni successive.
  2. Ambiente Virtuale: Si consiglia di creare un ambiente virtuale per isolare le dipendenze del progetto. Puoi farlo eseguendo il seguente comando:
python -m venv venv
  1. Installazione delle dipendenze: Installa le dipendenze necessarie eseguendo il seguente comando dopo aver attivato l'ambiente virtuale:
pip install -r requirements.txt
  1. Creare file di configurazione: Creare un file di configurazione con il token del tuo bot telegram, quindi crea una file .env e aggiungi la stringa:
BOT_TOKEN = "il tuo token"

Utilizzo

Dopo aver soddisfatto i requisiti, puoi trascrivere una lezione seguendo questi passaggi: personalmente suggerisco di inserire le lezioni nella directory "audio" in modo da essere più ordinati

python main.py (path_file_da_trascrivere) (size_modello) (lingua) (secondo_dal_quale_tagliare)
  • path_file_da_trascrivere: Percorso del file audio da trascrivere.
  • size_modello: Dimensione del modello da utilizzare (small, base, medium, large).
  • lingua: Lingua del file audio (it per italiano, en per inglese).
  • secondo_da_tagliare (opzionale): Secondo dall'inizio del file audio da cui iniziare la trascrizione.

ecco un esempio:

python main.py path/to/lezione.mp3 medium it 30

Sviluppi futuri:

  • Creare un server per il bot telegram in modo da bypassare il limite dei 50 mb delle API;
  • Attualmente la selezione della lingua come argomento non funziona, quindi è una delle prime cose da migliorare;
  • Migliorare la forma della trascrizione, rendendo il tutto più leggibile;
  • Creare una desktop application con una GUI per semplificare l'utilizzo;
  • Refactoring e pulizia del codice sorgente;
  • Testing per garantire maggiore robustezza al progetto.

About

Tool che utilizza la tecnologia Whisper per trascrivere le lezioni universitarie.

License:MIT License


Languages

Language:Python 100.0%