Els elements d'aquest repositori constitueixen la resposta a la pràctica de Neteja i anàlisi de les dades (pràctica 2) de l'assignatura Tipologia i Cicle de vida de les dades del Màster en Ciència de Dades de la Universitat Oberta de Catalunya (UOC), corresponent al primer semestre del curs 2021-2022.
A partir del dataset Complete FIFA 2017 Player dataset (Global), disponible a la plataforma Kaggle, l'objectiu consisteix a realitzar les tasques pròpies de preprocessat de dades per després elaborar una anàlisi que respongui les següents preguntes d'investigació:
- La característica que està més relacionada amb la valoració, és la mateixa per als porters i que per als jugadors de camp?
- Podem afirmar que la mitjana de l’IMC de porters i jugadors de camp és igual?
- Quina combinació de característiques esportives explica millor la valoració d’un jugador? Com afecta a la valoració ser o no porter?
- Quina és la probabilitat de ser internacional en funció de la valoració, l’edat i la posició? En quin percentatge augmenta o disminueix aquesta probabilitat el fet de ser o no porter?
D'acord a l'enunciat de la pràctica, es facilita un vídeo explicatiu del projecte. Atesa la limitació de tamany de fitxers a Github, el vídeo s'ha estructurat en capítols:
- Capítol 1 - Introducció
- Capítol 2 - Bloc 1: Neteja
- Capítol 3 - Bloc 2: Anàlisi
- Capítol 4 - Conclusió
────Fifa2017-GK-vs-Others
│
├───LICENSE
├───README.md
│
├───aux
│ *.*
│
├───data
│ Fifa2017_original.csv
│ Fifa2017_final.csv
│
├───pdf
│ Fifa2017-GK-vs-Others.pdf
│
├───src
│ Fifa2017-GK-vs-Others.Rmd
│ Fifa2017-GK-vs-Others.R
│
└───video
*.*
- LICENSE: Fitxer amb els termes de la llicència aplicada al projecte.
- README.md: Fitxer explicatiu del projecte.
- aux/*.*: Fitxers auxiliars del projecte.
- data/Fifa2017_original.csv: Dataset d'entrada (còpia del dataset original FullData.csv).
- data/Fifa2017_final.csv: Dataset de sortida, després del preprocessat.
- pdf/Fifa2017-GK-vs-Others.pdf: Fitxer de presentació amb les respostes de la pràctica.
- src/Fifa2017-GK-vs-Others.Rmd: Fitxer font amb les respostes de la pràctica que inclou el codi R.
- src/Fifa2017-GK-vs-Others.R: Extracció del codi font R emprat en la pràctica.
- video/*.*: Vídeo explicatiu del projecte, estructurat per capítols (tamany < 25 MB).
Totes i cadascuna de les parts d'aquest treball han estat realitzades exclusivament de forma individual per Nicolás González Soler.
Tots i cadascun dels continguts d'aquest projecte estan sotmesos a la llicència Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License, excepte pel que respecta als datasets original i final sobre els que caldria observar les llicències eventualment preexistents que són d'aplicació.