aecio / RI-TP1

Trabalhos práticos da disciplina Recuperação de Informação em 2011.1 do DCC-UFMG. Um indexador de uma coleções de páginas HTML. Contém implementações dos modelos de recuperação de informação vetorial (Vector Space Model) e BM-25, algortimo PageRank e uso de indexação de anchor text. O indexador utiliza indexação em disco baseada e ordenação externa.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

aecio/RI-TP1 Watchers