Prediciendo El Rating De Las Aplicaciones En Google Play Store
Compartir:
plus interface icon 15,000pts

Prediciendo El Rating De Las Aplicaciones En Google Play Store

Image
Descripción

El mercado de las aplicaciones móviles cada vez es más competitivo y entender que variables pueden favorecer a la hora de diseñar dichas aplicacion...

Premios
Esta competicion se hizo para ganar puntos, y reputación en nuestra plataforma. Cada vez que usted se postula a un trabajo de la plataforma, el empleador podrá ver su reputación en la misma.A la vez le permitirá medir sus conocimientos en comparac...
Competidores
  • Frank
  • Anu Varshini-es
  • airunner-es
  • Abhishek_jois-es
  • deepakpnair-es
  • jayantsogikar-es
160 Competidores Publicada el: 08/25/2020
Puntos
15,000pts
graphical divider

Tabla de Posiciones Pública


Ranking
Data Scientist
País
# Envíos
Último envío
Mejor Puntaje
1
Sidereus Sidereus Destacado
Colombia
151
Hace 10 meses
0.698709403908066
2
Pablo Lucero Pablo Lucero Destacado
Ecuador
300
Hace 9 meses
0.686667865555434
3
Fernando Chica Fernando Chica Destacado
Ecuador
81
Hace 10 meses
0.667694034607079
4
Nicolás Dominutti Nicolás Dominutti Destacado
Argentina
106
Hace 9 meses
0.667574096698846
5
Juan Fernando Cifuentes Garcia Juan Fernando Cifuentes Garcia Destacado
Colombia
49
Hace 10 meses
0.663858826283701
6
David Augusto Villabón Borja David Augusto Villabón Borja
Colombia
397
Hace 9 meses
0.660429949973203
7
Adam Michaels Adam Michaels Destacado
United States
50
Hace 5 meses
0.655121856160549
8
Diego Albarracin Mahecha Diego Albarracin Mahecha
Colombia
82
Hace 11 meses
0.651433298488367
9
JuanSebas7ian-es JuanSebas7ian-es
Colombia
55
Hace 4 meses
0.650643382352941
10
juan fer-es juan fer-es
Colombia
50
Hace 4 meses
0.646149730419393
11
Diego Alexander Rueda Plata Diego Alexander Rueda Plata
Colombia
22
Hace 9 meses
0.646085976555351
12
Sebastian Salazar Betancur-es Sebastian Salazar Betancur-es
Colombia
32
Hace 4 meses
0.642257908588001
13
juano121-es juano121-es
Colombia
58
Hace 4 meses
0.640544173737402
14
James Jeremy Valencia Becerra-es James Jeremy Valencia Becerra-es
Peru
6
Hace 10 meses
0.63929545716907
15
Frank Diego-en Frank Diego-en
Peru
18
Hace 9 meses
0.638895596239485
16
Esteban Buitrago S-es Esteban Buitrago S-es
Colombia
3
Hace 4 meses
0.636838430457216
17
Michael Guzmán Michael Guzmán
Colombia
57
Hace 10 meses
0.635130303583782
18
Carango-es Carango-es
Colombia
33
Hace 4 meses
0.627683701021391
19
Cesar Gustavo Seminario Calle-en Cesar Gustavo Seminario Calle-en
Peru
22
Hace 9 meses
0.6257545437472
20
Sebastian Alibaud Sebastian Alibaud Destacado
Chile
2
Hace cerca de 1 año
0.625544425087108
21
Javier J Desario Javier J Desario
Argentina
22
Hace 12 meses
0.622011304521809
22
Nildo-es Nildo-es
Peru
5
Hace 4 meses
0.62165308209933
23
Julian David Tellez Julian David Tellez
Colombia
79
Hace 9 meses
0.607913434997534
24
César Arcos Gonzalez César Arcos Gonzalez
Mexico
10
Hace 11 meses
0.59881630295099
25
Alejandro Anachuri Alejandro Anachuri
Argentina
1
Hace cerca de 1 año
0.598314009076341
26
jayantsogikar-es jayantsogikar-es Destacado
India
10
Hace 27 días
0.594474708874254
27
Christian Farnast Contardo Christian Farnast Contardo
Chile
15
Hace 11 meses
0.592456026193206
28
Leandro Ruiz Leandro Ruiz
Argentina
15
Hace 11 meses
0.590645572308346
29
oscero90-gmail-com oscero90-gmail-com
Argentina
3
Hace cerca de 1 año
0.56280193236715
30
Cristian Camilo Hidalgo Garcia Cristian Camilo Hidalgo Garcia Destacado
Colombia
13
Hace 9 meses
0.539419790327753
31
claudio irrazabal tarazona claudio irrazabal tarazona
Peru
1
Hace 12 meses
0.514572406104051
32
Matías Poullain-es Matías Poullain-es
Argentina
12
Hace cerca de 1 año
0.51160398819031
33
Mario Rugeles-es Mario Rugeles-es
Colombia
1
Hace 9 meses
0.49953466099764
34
Luis Enrique Luis Enrique
Colombia
1
Hace cerca de 1 año
0.489612274517935
35
Juan Guillermo Gómez Ramírez Juan Guillermo Gómez Ramírez
Colombia
18
Hace cerca de 1 año
0.47393923065776
36
Emiliano Olivares Emiliano Olivares
Argentina
3
Hace cerca de 1 año
0.457449227402525
37
Víctor Manuel Víctor Manuel
Colombia
2
Hace cerca de 1 año
0.429472025216706
38
kasati kasati Destacado
United States
1
Hace 4 meses
0.429472025216706
39
Felipe Perez Felipe Perez
Colombia
1
Hace 7 meses
0.429472025216706



Línea de Tiempo

Inicio
2020/08/25
Final
2021/01/25
Completo
2021/02/08

Competition empezó el: 2020/08/25 00:00:00
Competición termina el: 2021/01/25 00:00:00
Límite del Envío Final: 2021/02/08 00:00:00

Esta competición tiene una duración total de 5 meses, dentro de los cuales usted podrá hacer sus envios y obtener resultados de forma automática. Una vez finalice la primera parte de la competición, tendrá una semana para elegir su mejor modelo y enviarlo para que sea calificado y tenido en cuenta en los premios en dinero o en puntos. 

Una vez culminado todo el proceso, se podrán seguir enviando modelos como "Envio tardio" a modo de aprendizaje, ya que, debido a que la competicion oficialmente termino, esos modelos no seran elegibles para ganar premios.


Descripción

El mercado de las aplicaciones móviles cada vez es más competitivo y entender que variables pueden favorecer a la hora de diseñar dichas aplicaciones puede ser de gran ayuda en la toma de decisiones de negocio.  

El objetivo de esta competencia será analizar y clasificar el rating de las aplicaciones móviles en el mercado Android de Google Play Store. 


Evaluación

La evaluación del modelo se medirá usando el F1 score, esto es debido a que la cantidad de datos en ambas clases no es simétrica. Como trabajamos con un dataset imbalanceado, nuestro objetivo será optimizar el modelo para que clasifique adecuadamente ambas clases y maximice la precisión de la clasificación, especialmente de la clase con minoría de datos.  ## Importante ##

F1 = 2 * (precision * recall) / (precision + recall)

El F1 score final será el promedio del F1 score de cada clase así:

F1_macro = (F1_class0 + F1_class1) / 2  

Nota:
En la librería sklearn la línea de código para calcular el F1 score descrito anteriormente seria:
f1_score(y_true, y_pred, average='macro')

En estos links puedes encontrar más información acerca del F1 score:


Reglas

Reglas:

  • El código no debe ser compartido en privado. Cualquier código que se comparta, debe estar disponible para todos los participantes de la competición a través de la plataforma
  • La solución debe usar sólo librerias de código abierto disponibles públicamente
  • Si dos soluciones obtienen puntuaciones idénticas en la tabla de clasificación, el desempate será la fecha y la hora en que se hizo la presentación (ganará la primera solución enviada).
  • Nos reservamos el derecho de solicitar el código de cualquier usuario en cualquier momento durante un desafío. Tendrás 24 horas para enviar tu código siguiendo las reglas de revisión de códigos.
  • Nos reservamos el derecho de actualizar estas reglas en cualquier momento.
  • Tu solución no debe infringir los derechos de terceros y debes estar legalmente autorizado para asignar la propiedad de todos los derechos de autor en y para el código de la solución ganadora a DataSource.ai.
  • Los competidores pueden registrarse y presentar soluciones como individuos (no como equipos, al menos por ahora).
  • Como este es una competencia de aprendizaje, aparte de las reglas de los Términos de Uso de DataSource.ai, no se aplican otras reglas particulares.
  • Máximo 10 soluciones enviadas por día.

Al finalizar la competición y si te encuentras ubicado en las primeras 20 posiciones, debes enviar el modelo completo en formato .ipynb (Jupyter Notebook) - No se aceptarán otros formatos. Tendrás 48 horas después de finalizada la competición de enviarlo al correo [email protected] - Este modelo nos servirá para sacar las evaluaciones reales finales, por tanto el Leaderboard podría variar cuando se muestre la evaluación privada final. 


Esta competicion se hizo para ganar puntos, y reputación en nuestra plataforma. Cada vez que usted se postula a un trabajo de la plataforma, el empleador podrá ver su reputación en la misma.

A la vez le permitirá medir sus conocimientos en comparación a otros data scientists, saber que tan acertados son sus modelos y mejorarlos. Este proceso le ayudará a mejorar sus habilidades reales!

Nota: estamos trabajando para tener empresas que patrocinen competiciones. Si conoces a alguien no dudes en hablarle de nosotros, o déjanos saber quien podría estar interesado (escribiendo a [email protected]) y nos contactaremos con ellos!

Aquí puede ver la tabla de posiciones global de las competiciones que hemos realizado hasta el momento en data science.

Estas serán las premiaciones en puntos una vez finalice la competición:

  • 1er Puesto: 15.000 pts 
  • 2do Puesto: 14.000 pts 
  • 3er Puesto: 13.000 pts 
  • 4to Puesto: 12.000 pts 
  • 5to Puesto: 11.000 pts 
  • 6to Puesto: 10.000 pts 
  • 7mo Puesto: 9.000 pts 
  • 8vo Puesto: 8.000 pts 
  • 9no Puesto: 7.000 pts
  • 10mo Puesto: 6.000 pts

Points: 15000pts


El conjunto de datos contiene características principales de las aplicaciones en el mercado de Google Play Store. 

Definición de variables:

ID  = Identificador único de la aplicación 
App  = Nombre de la aplicación
Category  =  Categoría de la aplicación 
Reviews = Numero de reseñas de la aplicación 
Size  = Tamaño de la aplicación 
Installs  = Numero de descargas/instalaciones en el equipo
Type = Gratis (Free) o Paid (Paga)
Price  = Precio de la aplicación en dólares
Content rating = Calificación de contenido
Genres = Géneros
Last Updated = Ultimo día de actualización 
Current Ver = Versión actual de la aplicación 
Android Ver = Versión de Android requerida
Rating = Calificación de la aplicación 

La escala del Rating inicialmente de la forma (3.3, 3.4, 3.5, etc.), se transformó en 2 clases:

  • 0 si el Rating es menor o igual 4 (Rating <= 4.0) 
  • 1 si el Rating es mayor a 4 (Rating > 4.0) 

De esta manera, clasificamos a las aplicaciones como positivas/exitosas si el Rating es 1 o como negativa si el Rating es 0.

El dataset se dividió de la siguiente manera:

  • Train.csv Con este conjunto entrenaras el modelo de machine learning. 
  • Test.csv Con este conjunto de datos vas a predecir y clasificar el Rating
  • SampleSubmission.csv es un ejemplo de cómo debes enviar los resultados obtenidos. 

id           rating    
3000          1
3001          0 
3002          1
3003          1 
3004          0  
3005          1
etc.           

For this competition stage, you need to send your submission file with this details:

# of columns: 2
Column names: id,rating
# of rows: 1449


Compartir esta competición:

Otras Competiciones

Listo para empezar?

Registra tus datos aquí para iniciar con las competencias, te divertirás, aprenderás y ganarás premios en dinero!

Recibirás una notificación en breve acerca de tu registro exitoso.
deco-ring-1 decoration
deco-dots-3 decoration
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre competiciones en data science, cómo estamos resolviendo los retos, modelos de machine learning aplicados a las competiciones, técnicas novedosas y mucho más!

 
Te enviaremos el link de invitación a tu email de forma inmediata.
arrow-up icon