Este é um projeto desenvolvido durante o módulo de Introdução à Ciência da Computação do curso de Desenvolvimento Web. O objetivo do projeto é implementar um programa que simule um algoritmo de indexação de documentos, semelhante ao utilizado pelo Google. O programa deve ser capaz de identificar ocorrências de termos em arquivos TXT.
O projeto consiste em dois módulos principais:
Este módulo permite o anexo de arquivos de texto no formato TXT. Os principais recursos deste módulo incluem:
- Adicionar arquivos de texto à coleção de documentos.
- Armazenar informações sobre os documentos, como nome, data de criação, tamanho etc.
- Gerenciar a remoção de documentos da coleção, quando necessário.
O módulo de buscas permite realizar operações de busca sobre os arquivos anexados. Algumas características deste módulo incluem:
- Realizar busca de termos específicos em todos os documentos.
- Identificar a quantidade de ocorrências de um termo em cada documento.
- Apresentar resultados de busca relevantes para o usuário.
Durante a realização deste projeto, as seguintes habilidades foram exercitadas:
- Manipulação de Pilhas;
- Manipulação de Deque;
- Manipulação de Nós e Listas Ligadas;
- Manipulação de Listas Duplamente Ligadas.
Porém, é importante ressaltar que neste projeto não será focada a análise de significados ou a busca por sinônimos. O objetivo principal é implementar o algoritmo de indexação e busca de termos nos documentos TXT.
Contribuições são bem-vindas! Se você deseja contribuir com melhorias para este projeto, siga as etapas abaixo:
- Faça um fork deste repositório.
- Crie um branch com sua feature/correção:
git checkout -b minha-feature
. - Commit suas mudanças:
git commit -m 'Minha nova feature'
. - Push para o branch criado:
git push origin minha-feature
. - Abra um Pull Request.