Projeto desenvolvido para extração de grandes volumes de currículos Lattes.
- Sobre o Projeto
- Estrutura dos Arquivos
- Requisitos do Projeto
- Instruções de Instalação
- Como Utilizar
- Exemplos de Uso
- Problemas Comuns e Soluções
- Contribuindo
- Licença
Este projeto foi desenvolvido para facilitar a extração de informações de currículos Lattes, abrangendo diversas categorias de dados acadêmicos e científicos. A extração automatizada permite a coleta eficiente de grandes volumes de dados, útil para análise acadêmica, criação de bases de dados e outras aplicações.
Este repositório contém scripts para a extração de diversas informações de currículos Lattes. Abaixo está a descrição de cada arquivo:
- EXTRAÇÃO DE ARTIGOS.py: Script para extração de artigos de periódicos.
- EXTRAÇÃO DE CAP DE LIVRO.py: Script para extração de capítulos de livros.
- EXTRAÇÃO DE DISCIPLINAS.py: Script para extração de disciplinas ministradas.
- EXTRAÇÃO DE LIVROS.py: Script para extração de livros publicados.
- EXTRAÇÃO DE ORIENTAÇÕES.py: Script para extração de orientações de alunos.
- EXTRAÇÃO DE OUTRAS PUBLICAÇÕES.py: Script para extração de outras publicações.
- EXTRAÇÃO DE PRODUÇÃO TÉCNICA.py: Script para extração de produções técnicas.
- EXTRAÇÃO DE PROJETOS DE PESQUISA.py: Script para extração de projetos de pesquisa.
Certifique-se de ter as seguintes bibliotecas Python instaladas:
- requests
- pandas
- BeautifulSoup
- lxml
Você pode instalar as dependências necessárias usando o comando:
pip install -r requirements.txt
-
Clone o repositório para sua máquina local:
git clone https://github.com/revoredotulio/EXTRACAO-LATTES.git
-
Navegue até o diretório do repositório:
cd EXTRACAO-LATTES
-
Instale as dependências necessárias:
pip install -r requirements.txt
Cada script é independente e pode ser executado separadamente. Para executar um script, utilize o Python seguido do nome do arquivo. Por exemplo, para executar o script de extração de artigos, utilize:
python EXTRAÇÃO DE ARTIGOS.py
Para extrair artigos de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE ARTIGOS.py
Para extrair capítulos de livros de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE CAP DE LIVRO.py
Para extrair disciplinas ministradas de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE DISCIPLINAS.py
Para extrair livros publicados de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE LIVROS.py
Para extrair orientações de alunos de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE ORIENTAÇÕES.py
Para extrair outras publicações de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE OUTRAS PUBLICAÇÕES.py
Para extrair produções técnicas de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE PRODUÇÃO TÉCNICA.py
Para extrair projetos de pesquisa de currículos Lattes, execute o seguinte comando:
python EXTRAÇÃO DE PROJETOS DE PESQUISA.py
Solução: Verifique sua conexão com a internet e certifique-se de que o servidor do Lattes está acessível.
Solução: Verifique suas credenciais e certifique-se de que você tem permissão para acessar os dados necessários.
Solução: Certifique-se de que todas as bibliotecas necessárias estão instaladas corretamente usando o comando pip install -r requirements.txt
.
Para contribuir com este projeto, por favor siga os passos abaixo:
- Faça um fork do repositório.
- Crie uma branch para sua feature (
git checkout -b feature/nova-feature
). - Commit suas mudanças (
git commit -am 'Adiciona nova feature'
). - Faça o push para a branch (
git push origin feature/nova-feature
). - Crie um novo Pull Request.
Este projeto está licenciado sob os termos da licença MIT. Veja o arquivo LICENSE para mais detalhes.