Este repositorio contiene la implementación del proyecto de la materia Introducción a la Ciencia de Datos. Se pre-procesarán y aplicarán técnicas de clusterización y de clasificación a diversos datasets.
El siguiente repositorio contiene las siguientes carpetas con los diversos archivos:
proyecto-kaggle-titanic-josemalvarezg1/
├── data/
│ ├── train.csv
│ ├── test.csv
│ └── titanic.raw.rdata
├── doc/
│ ├── Proyecto.pdf
│ └── Informe.pdf
└── src/
├── Proyecto.r
└── Informe.Rmd
En la presente tarea se utilizaron las siguientes herramientas con respectivas versiones:
Herramienta | Versión |
---|---|
RStudio. | 0.99.878 |
Los conjuntos de datos utilizados fueron los siguientes:
Dataset |
---|
train.csv |
test.csv |
titanic.raw.rdata |
Se deberá descargar el siguiente repositorio o clonarlo con el comando:
git clone https://github.com/ICDRepository-I-2016/proyecto-kaggle-titanic-josemalvarezg1
Seguidamente, deberá ejecutar el script Proyecto.r desde RStudio.
José Manuel Alvarez García - CI 25038805