Disciplina de Programação com Map e Reduce, ministrada pelo prof. Robério no curso de Pós em Ciência de Dados, na UNI7. Primeira atividade da disciplina.
Requerimentos
Python 3.6
mrjob
Para rodar, irei supor que o user já possui o python instalado em máquina e com o pip
setado na variável de ambiente.
Baixar as packages do MRjob:
user@computer:~$ pip install mrjob
Para rodar um sript, você deve executar o seguite comando:
user@computer:~$ python <script>.py dataset/<file>.txt >> output/<out>.txt
Por exemplo, vamos executar o script que resolve o exercício 2:
user@computer:~$ python MRPopularHero.py dataset/Marvel-graph.txt >> output/hero.txt
user@computer:~$ python RecommendationFriends.py dataset/Marvel-graph.txt >> output/recomendations.txt
Para mais detalhes dos métodos do MRjob:
Documentação MRJob.
Equipe:
- Igor Farias
- Pedro Andrade