Predicción De Precios De Apartamentos En Argentina y Colombia
Compartir:
plus interface icon 10,000pts

Predicción De Precios De Apartamentos En Argentina y Colombia

Image
Descripción

Predecir o estimar el precio de una vivienda puede ser de gran ayuda a la hora  de tomar decisiones importantes tales como la adquisición de casa p...

Premios
Esta competicion se hizo para ganar puntos, y reputación en nuestra plataforma. Cada vez que usted se postula a un trabajo de la plataforma, el empleador podrá ver su reputación en la misma.A la vez le permitirá medir sus conocimientos en comparac...
Competidores
  • subhasree23-es
  • airunner-es
  • Flavio-es
  • hemjeet-es
  • convergenza-es
152 Competidores Publicada el: 07/10/2020
Puntos
10,000pts
graphical divider

Tabla de Posiciones Pública


Ranking
Data Scientist
País
# Envíos
Último envío
Mejor Puntaje
1
Juan Carlos Gutiérrez Concha-es Juan Carlos Gutiérrez Concha-es Destacado
Chile
117
Hace 12 meses
0.248616099466774
2
Tomás Ertola Tomás Ertola Destacado
Argentina
36
Hace 12 meses
0.24937973930946
3
Pablo Neira Vergara Pablo Neira Vergara Destacado
Chile
53
Hace 12 meses
0.25206843547477
4
SDG SDG Destacado
Peru
4
Hace cerca de 1 año
0.252581915108438
5
Hans Hidalgo Alta-es Hans Hidalgo Alta-es Destacado
Peru
11
Hace 12 meses
0.253262537157468
6
Cesar Gustavo Seminario Calle-en Cesar Gustavo Seminario Calle-en
Peru
31
Hace 12 meses
0.256269181681794
7
Alan F Dopfel Alan F Dopfel
United States
55
Hace 5 meses
0.257200137906566
8
Federico Gutierrez-es Federico Gutierrez-es Destacado
Colombia
7
Hace cerca de 1 año
0.257778871747536
9
German Goni-en German Goni-en
Chile
6
Hace cerca de 1 año
0.258744322348556
10
Alejandro Anachuri Alejandro Anachuri
Argentina
18
Hace cerca de 1 año
0.259692631733222
11
Ronaldo Cachi Delgado-es Ronaldo Cachi Delgado-es
Peru
41
Hace 12 meses
0.260456423908652
12
Daniel Arroyave Montoya-en Daniel Arroyave Montoya-en
Colombia
4
Hace cerca de 1 año
0.260622986641536
13
Gerardo Montero Gerardo Montero
Colombia
9
Hace cerca de 1 año
0.26193164742743
14
Lautaro Pacella Lautaro Pacella
Argentina
3
Hace cerca de 1 año
0.262094928885433
15
Exequiel Moneva Exequiel Moneva
Argentina
123
Hace 12 meses
0.26307588794425
16
Sebastian Alibaud Sebastian Alibaud Destacado
Chile
8
Hace cerca de 1 año
0.26351348366367
17
Juan Luis Quiroz Castillo Juan Luis Quiroz Castillo Destacado
Chile
11
Hace cerca de 1 año
0.265748749084432
18
Ivan Edmundo de la Rosa Montero Ivan Edmundo de la Rosa Montero
Mexico
7
Hace cerca de 1 año
0.266566004962854
19
Julian Armando Abril Luna Julian Armando Abril Luna
Colombia
24
Hace cerca de 1 año
0.269597143313232
20
Santiago Cardona Urrea Santiago Cardona Urrea
Colombia
4
Hace cerca de 1 año
0.270918612784272
21
Sidereus Sidereus Destacado
Colombia
22
Hace 12 meses
0.270968554514635
22
Matías Poullain-es Matías Poullain-es
Argentina
35
Hace cerca de 1 año
0.271663001081366
23
Mario Rugeles-es Mario Rugeles-es
Colombia
7
Hace cerca de 1 año
0.272211469396626
24
Juan Sebastian Sanchez-en Juan Sebastian Sanchez-en Destacado
Colombia
6
Hace cerca de 1 año
0.273871325123603
25
David Augusto Villabón Borja David Augusto Villabón Borja
Colombia
4
Hace cerca de 1 año
0.275330472345906
26
Sebastián David López Sebastián David López
Argentina
5
Hace cerca de 1 año
0.279759106052759
27
Germán Escobar Germán Escobar
Colombia
13
Hace cerca de 1 año
0.280404190213536
28
Denis Tsitko-es Denis Tsitko-es
Russian Federation
1
Hace 6 meses
0.287144084450013
29
Nicolas Loaiza Rico Nicolas Loaiza Rico
Colombia
1
Hace cerca de 1 año
0.290659972125606
30
Cristopher Jair Cabanillas Casas Cristopher Jair Cabanillas Casas
Peru
42
Hace cerca de 1 año
0.291382228316647
31
cbmartinezr-unal-edu-co cbmartinezr-unal-edu-co
Colombia
1
Hace cerca de 1 año
0.29359289379021
32
Alonso Burgos-es Alonso Burgos-es
Chile
3
Hace cerca de 1 año
0.294646811983553
33
Christian Farnast Contardo Christian Farnast Contardo
Chile
31
Hace cerca de 1 año
0.306544155320448
34
Adam Michaels Adam Michaels Destacado
United States
35
Hace 5 meses
0.309045041856353
35
Javier J Desario Javier J Desario
Argentina
10
Hace cerca de 1 año
0.317223218428247
36
Renzo Villar Renzo Villar
Peru
6
Hace 12 meses
0.325714137135873
37
Camilo Andrés Alvis Bautista Camilo Andrés Alvis Bautista
Colombia
6
Hace cerca de 1 año
0.378461009577557
38
Christian Condorhuaman Chavez Christian Condorhuaman Chavez
Peru
7
Hace 12 meses
0.380862481463681
39
Antonia Bustamante Antonia Bustamante
Colombia
2
Hace cerca de 1 año
0.383229321678583
40
Emmanuel Escobar Avalos Emmanuel Escobar Avalos
Mexico
12
Hace cerca de 1 año
0.384640401098085
41
ESTHER PINILLA ESTHER PINILLA
España
45
Hace 30 días
0.388418912292439
42
Holman Torres Holman Torres
Colombia
19
Hace cerca de 1 año
0.391517541472745
43
Michael Guzmán Michael Guzmán
Colombia
18
Hace cerca de 1 año
0.39186066707097
44
Diego Alexander Rueda Plata Diego Alexander Rueda Plata
Colombia
1
Hace cerca de 1 año
0.446567906887375
45
airunner-es airunner-es
India
12
Hace 2 meses
0.45117563940342
46
elaepaulistana elaepaulistana
Peru
7
Hace cerca de 1 año
0.518941954722271
47
Juan Graffigna-en Juan Graffigna-en
Argentina
1
Hace cerca de 1 año
0.72455707597598
48
James Jeremy Valencia Becerra-es James Jeremy Valencia Becerra-es
Peru
7
Hace 12 meses
0.742880754463927
49
Jenifer Ríos Sierra Jenifer Ríos Sierra
Colombia
1
Hace cerca de 1 año
0.767059583353599
50
Alexander Romero Alexander Romero
Peru
1
Hace cerca de 1 año
0.769928697204409
51
Jonathan Loscalzo Jonathan Loscalzo
Argentina
2
Hace cerca de 1 año
0.77092257631067
52
adrian garcia adrian garcia
Peru
1
Hace cerca de 1 año
0.781905374553279
53
Zuly Jurado Purizaca Zuly Jurado Purizaca
Peru
1
Hace 12 meses
0.849323305541912
54
Dennis Peter Rodriguez Cantor-es Dennis Peter Rodriguez Cantor-es
Colombia
2
Hace cerca de 1 año
0.931765849194118
55
Víctor Manuel Víctor Manuel
Colombia
2
Hace cerca de 1 año
2.12059950788696
56
Edward Andrés Cortés Peña Edward Andrés Cortés Peña
Colombia
1
Hace cerca de 1 año
2.55114556650145
57
Felipe Perez Felipe Perez
Colombia
1
Hace 6 meses
2.55114556650145



Línea de Tiempo

Inicio
2020/07/10
Final
2020/10/10
Completo
2020/10/24

Competition empezó el: 2020/07/10 00:00:00
Competición termina el: 2020/10/10 00:00:00
Límite del Envío Final: 2020/10/24 00:00:00

Esta competición tiene una duración total de 3 meses, dentro de los cuales usted podrá hacer sus envios y obtener resultados de forma automática. Una vez finalice la primera parte de la competición, tendrá una semana para elegir su mejor modelo y enviarlo para que sea calificado y tenido en cuenta en los premios en dinero o en puntos. 

Una vez culminado todo el proceso, se podrán seguir enviando modelos como "Envio tardio" a modo de aprendizaje, ya que, debido a que la competicion oficialmente termino, esos modelos no seran elegibles para ganar premios.


Descripción

Predecir o estimar el precio de una vivienda puede ser de gran ayuda a la hora  de tomar decisiones importantes tales como la adquisición de casa propia o de  un bien raíz como vehículo de inversión. 

Tener una estimación del valor de la vivienda permite aumentar la capacidad  de negociación, tanto para el comprador como para el vendedor. Además, tener este conocimiento sirve como herramienta comparativa para evaluar  proyecciones de crecimiento en diferentes sectores residenciales.

El objetivo de esta competencia es crear un modelo de aprendizaje automático que permita predecir el precio de los departamentos (apartamentos) para Argentina y Colombia  dadas las principales variables que describen estas propiedades, como lo son: el área, la cantidad de baños, la ubicación, etc.


Evaluación

La evaluación del modelo se hará usando el RMSLE (Root Mean Squared Logarithmic Error). Lo que hacemos es calcular la Raiz Cuadrada a la métrica MLSE que implementa Scikit-learn. Si quieres profundizar un poco más sobre la métrica MLSE que calcula Scikit Learn, puedes encontrarla aqui: https://scikit-learn.org/stable/modules/model_evaluation.html#mean-squared-log-error

Se usa esta métrica para no penalizar la diferencia en cuantificar el precio de un apartamento costoso a uno de menor valor. 

Donde:

N = Número de apartamentos del set test_apartamentos

 = precio real

 = precio estimado


PD: el archivo submission que enviarás será evaluado contra un dataset privado que tenemos en DataSource.ai y que nos servirá para sacar esta métrica


Reglas

Reglas:

  • El código no debe ser compartido en privado. Cualquier código que se comparta, debe estar disponible para todos los participantes de la competición a través de la plataforma
  • La solución debe usar sólo librerias de código abierto disponibles públicamente
  • Si dos soluciones obtienen puntuaciones idénticas en la tabla de clasificación, el desempate será la fecha y la hora en que se hizo la presentación (ganará la primera solución enviada).
  • Nos reservamos el derecho de solicitar el código de cualquier usuario en cualquier momento durante un desafío. Tendrás 24 horas para enviar tu código siguiendo las reglas de revisión de códigos.
  • Nos reservamos el derecho de actualizar estas reglas en cualquier momento.
  • Tu solución no debe infringir los derechos de terceros y debes estar legalmente autorizado para asignar la propiedad de todos los derechos de autor en y para el código de la solución ganadora a DataSource.ai.
  • Los competidores pueden registrarse y presentar soluciones como individuos (no como equipos, al menos por ahora).
  • Como este es una competencia de aprendizaje, aparte de las reglas de los Términos de Uso de DataSource.ai, no se aplican otras reglas particulares.
  • Máximo 10 soluciones enviadas por día.

Al finalizar la competición y si te encuentras ubicado en las primeras 20 posiciones, debes enviar el modelo completo en formato .ipynb (Jupyter Notebook) - No se aceptarán otros formatos. Tendrás 48 horas después de finalizada la competición de enviarlo al correo [email protected] - Este modelo nos servirá para sacar las evaluaciones reales finales, por tanto el Leaderboard podría variar cuando se muestre la evaluación privada final. 


Esta competicion se hizo para ganar puntos, y reputación en nuestra plataforma. Cada vez que usted se postula a un trabajo de la plataforma, el empleador podrá ver su reputación en la misma.

A la vez le permitirá medir sus conocimientos en comparación a otros data scientists, saber que tan acertados son sus modelos y mejorarlos. Este proceso le ayudará a mejorar sus habilidades reales!

Nota: estamos trabajando para tener empresas que patrocinen competiciones. Si conoces a alguien no dudes en hablarle de nosotros, o déjanos saber quien podría estar interesado (escribiendo a [email protected]) y nos contactaremos con ellos!

Aquí puede ver la tabla de posiciones global de las 3 competiciones que hemos realizado hasta el momento en data science.

Estas serán las premiaciones en puntos una vez finalice la competición:

  • 1er Puesto: 10.000 pts 
  • 2do Puesto: 9.000 pts 
  • 3er Puesto: 8.000 pts 
  • 4to Puesto: 7.000 pts 
  • 5to Puesto: 6.000 pts 
  • 6to Puesto: 5.000 pts
  • 7mo Puesto: 4.000 pts 
  • 8vo Puesto: 3.000 pts 
  • 9mo Puesto: 2.000 pts 
  • 10mo Puesto: 1.000 pts

Points: 10000pts


El conjunto principal de datos contiene información de los departamentos/apartamentos en venta en Argentina y Colombia durante el periodo 2019 – 2020. “datos provistos por properati” 

Si deseas ver los datasets que esta plataforma proporciona puedes encontrarlos aqui:
https://www.properati.com.co/data/, estos datos son abiertos, por lo cual agradecemos a Properati por tomarse el trabajo de abrir sus datos!

DataSource.ai hizo una limpieza y preparación previa de los datos necesarios para la competición.

Definimos las siguientes carácteristicas:

Id  = Identificador único del inmueble
pais  = Pais donde se encuentra el inmueble
ciudad  = Ciudad donde se encuentra el inmueble
provincia_departamento = provincia o departamento donde se encuentra el inmueble
property_type = Tipo de propiedad (En nuestro caso solo es Apartamento)
operation_type  = Tipo de negocio (venta)
rooms  = Número de ambientes (salas)
bedrooms = Número de habitaciones
surface_total  = Area total en m2
currency = moneda en dolares
price = precio del inmueble

Nota: Para Colombia se aplicó una TRM de $3.633 COP para calcular el precio en USD

El dataset se dividió de la siguiente manera:

train_apartmentos.csv corresponde al 80% de los datos, con este conjunto entrenaras el modelo de machine learning. 

test_aparmentos.csv corresponde al 20% de los datos, con este conjunto de datos vas a predecir la columna price. A diferencia del conjunto Train, el dataset Test no contiene los datos de la columna price, estos los debes predecir con tu modelo.

SampleSubmission.csv es un ejemplo de cómo debes enviar los resultados obtenidos. 

submission.csv

id | price
66058 | 150000
66059 | 200000 
66060 | 67000
etc.

Warning: El archivo SampleSubmission.csv que nos envías debe ser CSV, no se aceptarán archivos en otros formatos (como .xls por ejemplo), y no serán tenidos en cuenta para la evaluación. El archivo SampleSubmission.csv lo usaremos para la evaluación del modelo, y obtener la métrica de error correspondiente, comparandolo con un archivo privado de DataSource.ai

A competir!

For this competition stage, you need to send your submission file with this details:

# of columns: 2
Column names: id,price
# of rows: 6417


Compartir esta competición:

Otras Competiciones

Listo para empezar?

Registra tus datos aquí para iniciar con las competencias, te divertirás, aprenderás y ganarás premios en dinero!

Recibirás una notificación en breve acerca de tu registro exitoso.
deco-ring-1 decoration
deco-dots-3 decoration
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre competiciones en data science, cómo estamos resolviendo los retos, modelos de machine learning aplicados a las competiciones, técnicas novedosas y mucho más!

 
Te enviaremos el link de invitación a tu email de forma inmediata.
arrow-up icon