Este proyecto de data science se centra en predecir los precios de renta de las viviendas a Media Estancia en Madrid, España, utilizando el algoritmo de XGBoost. Se han aplicado diversas técnicas y procesos para obtener predicciones precisas, que incluyen web scraping para recopilar datos, análisis de importancia de características, codificación de etiquetas para datos categóricos y ajuste de precios según estándares locales y clases identificadas.
El objetivo principal de este proyecto es desarrollar un modelo predictivo que pueda estimar con precisión los precios de las viviendas de renta a Media Estancia en Madrid. Esto puede ser de gran utilidad para los arrendadores, arrendatarios, y profesionales del mercado inmobiliario que deseen tomar decisiones informadas.
Los datos utilizados en este proyecto se obtuvieron mediante web scraping de diversas fuentes en línea que proporcionan información sobre las viviendas en Madrid. Estos datos incluyen características como el tamaño de la vivienda, la ubicación, el número de habitaciones, el número de baños y más.
Se realizó un análisis de feature importance para determinar qué columnas de datos son más relevantes para la predicción de precios. Esto nos ayudó a seleccionar las características más influyentes y eliminar las que no contribuyen significativamente al modelo.
Para manejar datos categóricos, se aplicó label encoding. Esto convirtió las categorías en valores numéricos, lo que facilita su inclusión en el modelo de Random Forest Regression.
El modelo utilizado en este proyecto es el XGBoost. Este algoritmo es conocido por su capacidad para manejar conjuntos de datos complejos y proporcionar predicciones sólidas.
Para obtener predicciones que reflejen de manera más precisa los estándares de precios locales en Madrid, se aplicó una validacion y ajuste de precios utilizando información obtenida a traves de nuestro análisis del mercado inmobiliario en la región.
Se proporcionarán los resultados y las métricas de rendimiento del modelo, lo que permitirá evaluar su precisión y eficacia.
Para ejecutar este proyecto en tu entorno local, sigue estos pasos:
-
Clona el repositorio:
git clone https://github.com/adlmacorra/Prediccion_Alquiler.git
-
Instala las dependencias necesarias:
pip install -r requirements.txt
-
Ejecuta el código principal main.py para realizar predicciones.
Contribucions de el equipo de DataScience2023 - Colegas de The Bridge Digital Talent Accelerator en Madrid: Antonio de la Macorra, Diana Luzuriaga, Alfonso Caballero, y Guillermo Bogran.
Para cualquier pregunta o comentario, no dudes en ponerte en contacto conmigo en The Bridge: Digital Talent Accelerator.
Este proyecto está bajo la licencia Licencia MIT.