igorfarias30 / MapReduceUni7

Scripts to represent map and reduce jobs

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Map e Reduce

Atividade 1

Disciplina de Programação com Map e Reduce, ministrada pelo prof. Robério no curso de Pós em Ciência de Dados, na UNI7. Primeira atividade da disciplina.

Requerimentos

  • Python 3.6
  • mrjob

Run

Para rodar, irei supor que o user já possui o python instalado em máquina e com o pip setado na variável de ambiente.

Primeiro passo

Baixar as packages do MRjob:

user@computer:~$ pip install mrjob

Segundo passo

Para rodar um sript, você deve executar o seguite comando:

user@computer:~$ python <script>.py dataset/<file>.txt >> output/<out>.txt

Por exemplo, vamos executar o script que resolve o exercício 2:

user@computer:~$ python MRPopularHero.py dataset/Marvel-graph.txt >> output/hero.txt

Atividade 2

user@computer:~$ python RecommendationFriends.py dataset/Marvel-graph.txt >> output/recomendations.txt

Para mais detalhes dos métodos do MRjob:

Documentação MRJob.

Equipe:

  • Igor Farias
  • Pedro Andrade

About

Scripts to represent map and reduce jobs


Languages

Language:Python 100.0%