marcospiau / bm25-cisi

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

bm25-cisi

Este repositório contém a implementação de um sistema de busca utilizando BM25, usando o dataset CISI collection.

Arquivos

.
├── Makefile  # Makefile usado para download e preparação do dataset CISI
├── README.md
├── data # pasta com dados
│   ├── processed # dados CISI processados
│   │   └── cisi
│   │       ├── metrics.txt # metricas dos experimentos
│   │       ├── qrels.txt  # qrels formato trec
│   │       ├── results.txt # results formato trec, usado em testes iniciais
│   │       ├── results_abstract_keep_stopwords.txt # results usando abstract dos documentos e mantendo stopwords
│   │       ├── results_abstract_remove_stopwords.txt # results usando abstract dos documentos e removendo stopwords
│   │       ├── results_title_abstract_keep_stopwords.txt # results usando títulos dos documentos e mantendo stopwords
│   │       ├── results_title_abstract_remove_stopwords.txt # results usando títulos e abstracts dos documentos e mantendo stopwords
│   │       ├── results_title_keep_stopwords.txt # results usando títulos dos documentos e mantendo stopwords
│   │       └── results_title_remove_stopwords.txt  # results usando títulos dos documentos e removendo stopwords
│   └── raw # Dados brutos CISI (apenas .gitkeep)
├── notebooks # pasta com notebooks
│   ├── OLD # notebooks iniciais, mantidos para registro de histórico
│   └── notebook_entrega.ipynb # versão final de notebook de entrega
└── relatorio.pdf # relatorio do projeto

About


Languages

Language:Jupyter Notebook 99.9%Language:Makefile 0.1%