rafaelperazzo / extractLattes

Extrator Lattes a Partir dos currículos em XML

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

extractLattes

uma ferramenta de extração de informações do currículo lattes para geração de indicadores e avaliação de programas acadêmicos

Requisitos

Entrada

  • pasta com os XML Lattes a serem extraídos
  • configuração do arquivo config.ini (exemplo):
[DEFAULT]
inicio = 2013
fim = 2020
prefixo = UFCA_
xml_dir = xml/docentes/
csv_dir = csv/docentes/
html_dir = html/docentes/
localizacoes = NAO

Saída

  • arquivos CSV com as extrações:
  • Produção Bibliográfica
  • Em periódicos
  • Em anais
  • Livros e capítulos
  • Projetos de pesquisa, extensão, ensino e desenvolvimento
  • Titulação
  • Títulos
  • Banco de dados Sqlite3 com todas as informações acima

Como executar

docker-compose run --rm scorelattes

TODO

  • Incluir outras extrações, como vínculos profissionais
  • Incluir recurso para avaliação de alunos de IC (PIBIC/PIBITI): Quantos entraram na pós, aumento de produção, etc...

AGRADECIMENTOS

Ao projeto do Prof. Vicente Helano (UFCA), desenvolvedor do projeto scoreLattes

About

Extrator Lattes a Partir dos currículos em XML

License:GNU General Public License v3.0


Languages

Language:Python 76.0%Language:HTML 19.3%Language:PHP 2.4%Language:Dockerfile 1.2%Language:Shell 1.1%