Predicción De La Intención De Compra En Una Página Web
Compartir:
plus interface icon 10,000pts

Predicción De La Intención De Compra En Una Página Web

Image
Descripción

En esta competencia, analizaremos la actividad de los usuarios que visitan un servicio ofrecido por medio de un sitio web.  El objetivo será predec...

Premios
Para esta competición queremos entregar, adicional a los 10.000 puntos, un detalle muy especial para el primer puesto!Haremos llegar a cualquier país y ciudad de latinoamérica este gran detalle! (hecho por https://www.devwear.co/)* Este buzo sirve...
Competidores
  • convergenza-es
  • Alicia Sparks-es
  • suyiinang-es
94 Competidores Publicada el: 01/17/2021
Puntos
10,000pts
graphical divider

Tabla de Posiciones Pública


Ranking
Data Scientist
País
# Envíos
Último envío
Mejor Puntaje
1
Cristian Camilo Hidalgo Garcia Cristian Camilo Hidalgo Garcia Destacado
Colombia
1631
Hace 5 meses
0.817631034576143
2
Oscar Bartolome Pato Oscar Bartolome Pato Destacado
España
343
Hace 4 meses
0.816491504853038
3
Santiago Serna Santiago Serna Destacado
Colombia
97
Hace 4 meses
0.811802131632503
4
Juan Luis Quiroz Castillo Juan Luis Quiroz Castillo Destacado
Chile
96
Hace 5 meses
0.811678832116788
5
SDG SDG Destacado
Peru
87
Hace 4 meses
0.810988554051394
6
Nicolás Dominutti Nicolás Dominutti Destacado
Argentina
139
Hace 4 meses
0.810703016286773
7
Carlos Eduardo Vázquez Chong Carlos Eduardo Vázquez Chong
Mexico
78
Hace 4 meses
0.810131278850246
8
Jonathan Loscalzo Jonathan Loscalzo
Argentina
29
Hace 5 meses
0.809511287502948
9
Julian Ismael Centeno-es Julian Ismael Centeno-es
Peru
18
Hace 6 meses
0.807714100654053
10
Lautaro Pacella Lautaro Pacella
Argentina
163
Hace 6 meses
0.807073735677069
11
Nikoloide Nikoloide
Argentina
22
Hace 4 meses
0.807001034624541
12
Willians Carlos Enciso Melgarejo Willians Carlos Enciso Melgarejo
Peru
11
Hace 4 meses
0.805839416058394
13
Diego Alexander Rueda Plata Diego Alexander Rueda Plata
Colombia
90
Hace 6 meses
0.805777101620981
14
Alan F Dopfel Alan F Dopfel
United States
15
Hace 4 meses
0.805621962308745
15
Sidereus Sidereus Destacado
Colombia
7
Hace 4 meses
0.803892944038929
16
Christian Farnast Contardo Christian Farnast Contardo
Chile
10
Hace 6 meses
0.802152437294866
17
Diego Albarracin Mahecha Diego Albarracin Mahecha
Colombia
15
Hace 5 meses
0.802126908386738
18
Felipe Perez Felipe Perez
Colombia
23
Hace 4 meses
0.796920367701698
19
Nachos-es Nachos-es
España
15
Hace 6 meses
0.796482014986438
20
ANGEL JORGE SALAZAR ANGEL JORGE SALAZAR
Peru
3
Hace 5 meses
0.79619071563834
21
Julian Armando Abril Luna Julian Armando Abril Luna
Colombia
180
Hace 4 meses
0.794999642448513
22
bprasad26-es bprasad26-es
India
15
Hace cerca de 2 meses
0.79463138787232
23
Víctor Manuel Cárdenas Víctor Manuel Cárdenas Destacado
Colombia
7
Hace 4 meses
0.793995639423971
24
johan159097 johan159097
Peru
16
Hace 4 meses
0.793988364042935
25
David Augusto Villabón Borja David Augusto Villabón Borja
Colombia
9
Hace 5 meses
0.793844138522364
26
GIANCARLOS NOA FLORES GIANCARLOS NOA FLORES
Peru
18
Hace 6 meses
0.7918177693992
27
Javier J Desario Javier J Desario
Argentina
8
Hace 4 meses
0.790670709094499
28
Denis Tsitko-es Denis Tsitko-es
Russian Federation
2
Hace 4 meses
0.784334315080844
29
Alonso Burgos Alonso Burgos
Chile
1
Hace 6 meses
0.78306858303018
30
diego_corona diego_corona
Mexico
10
Hace 3 meses
0.782270935694076
31
Raja Hamza Azhar Raja Hamza Azhar
Pakistan
26
Hace 6 meses
0.775355385533193
32
Purity Nyagweth Purity Nyagweth Destacado
Kenya
4
Hace 5 meses
0.716542631680246
33
Stalyn Quishpe-en Stalyn Quishpe-en
Ecuador
5
Hace 6 meses
0.701500805975297
34
Shiv Kumar Shiv Kumar
India
1
Hace 6 meses
0.69970189385083
35
atuq atuq
Bolivia, Plurinational State of
2
Hace 5 meses
0.695728226085127
36
Frank Smith Frank Smith
United States
2
Hace 6 meses
0.457863110068885
37
Manav Mehra Manav Mehra
Canada
1
Hace 5 meses
0.438637465558223



Línea de Tiempo

Inicio
2021/01/17
Final
2021/03/31
Completo
2021/04/07

Competition empezó el: 2021/01/17 00:00:00
Competición termina el: 2021/03/31 00:00:00
Límite del Envío Final: 2021/04/07 00:00:00

Esta competición tiene una duración total de 3 meses, dentro de los cuales usted podrá hacer sus envios y obtener resultados de forma automática. Una vez finalice la primera parte de la competición, tendrá una semana para elegir su mejor modelo y enviarlo para que sea calificado y tenido en cuenta en los premios en dinero o en puntos. 

Una vez culminado todo el proceso, se podrán seguir enviando modelos como "Envio tardio" a modo de aprendizaje, ya que, debido a que la competicion oficialmente termino, esos modelos no seran elegibles para ganar premios.


Descripción

En esta competencia, analizaremos la actividad de los usuarios que visitan un servicio ofrecido por medio de un sitio web.  El objetivo será predecir que visitantes decidirán comprar de acuerdo a las características e interacciones que ejecuten en la página. Se toman en cuenta datos como Bounce rate, Month, Pages Values, Operating System, Duration, Period Related y muchos más.

En este caso especial, tendremos un problema de clasificación


Evaluación

La Evaluación de la competencia se realizará efectuando la métrica F1 Score (“Macro”).


Primero definimos la F1 score

F1 = 2 * (precision * recall) / (precision + recall)

El F1 score Macro  será el promedio del F1 score de cada clase así:





definido como la media de las puntuaciones F1 de las clases/etiquetas. Lo que es igual a 

F1_macro = F1_clase0 + F1_clase1 / 2  

En estos links puedes encontrar más información acerca del F1 score:


Nota: estas evaluaciones las realizamos automáticamente contra un dataset de validación nuestro, pero deberías tomar estas métricas como referencia para tus pruebas de modelado.


Reglas

Reglas de la Competición

  • El código no debe ser compartido en privado. Cualquier código que se comparta, debe estar disponible para todos los participantes de la competición a través de la plataforma
  • La solución debe usar sólo librerías de código abierto disponibles públicamente
  • Si dos soluciones obtienen puntuaciones idénticas en la tabla de clasificación, el desempate será la fecha y la hora en que se hizo la presentación (ganará la primera solución enviada).
  • Nos reservamos el derecho de solicitar el código de cualquier usuario en cualquier momento durante un desafío. Tendrás 48 horas para enviar tu código siguiendo las reglas de revisión de códigos.
  • Nos reservamos el derecho de actualizar estas reglas en cualquier momento.
  • Tu solución no debe infringir los derechos de terceros y debes estar legalmente autorizado para asignar la propiedad de todos los derechos de autor en y para el código de la solución ganadora a DataSource.ai.
  • Los competidores pueden registrarse y presentar soluciones como individuos (no como equipos, al menos por ahora).
  • Como esta es una competencia de aprendizaje, aparte de las reglas de los Términos de Uso de DataSource.ai, no se aplican otras reglas particulares.
  • Máximo 10 soluciones enviadas por día.


Al finalizar la competición y si te encuentras ubicado en las primeras 20 posiciones, debes enviar el modelo completo en formato .ipynb (Jupyter Notebook) - No se aceptarán otros formatos. Tendrás 48 horas después de finalizada la competición de enviarlo al correo [email protected] - Este modelo nos servirá para sacar las evaluaciones reales finales, por tanto el Leaderboard podría variar cuando se muestre la evaluación privada final


Para esta competición queremos entregar, adicional a los 10.000 puntos, un detalle muy especial para el primer puesto!

Haremos llegar a cualquier país y ciudad de latinoamérica este gran detalle! (hecho por https://www.devwear.co/)



* Este buzo sirve para hombre y mujer (Unisex)


Escalafón de puntajes

Estas serán las premiaciones una vez finalice la competición:

  • 1er Puesto: 10.000 pts + Buzo Canguro Python (Envío a cualquier ciudad de latinoamérica)
  • 2do Puesto: 9.000 pts 
  • 3er Puesto: 8.000 pts 
  • 4to Puesto: 7.000 pts 
  • 5to Puesto: 6.000 pts 
  • 6to Puesto: 5.000 pts 
  • 7mo Puesto: 4.000 pts 
  • 8vo Puesto: 3.000 pts 
  • 9no Puesto: 2.000 pts 
  • 10mo Puesto: 1.000 pts

Points: 10000pts


Descripción de los Datos:

El conjunto de datos corresponde a 12.330 sesiones únicas por usuario, las cuales se dividen en

  • 8.631 para el conjunto de entrenamiento Train.csv
  • 3.699 para el conjunto de test Test.csv

Dicha información fue obtenida a lo largo de 12 meses para evitar tendencias de días especiales o campañas específicas. 

En el archivo SampleSubmission.csv podrá encontrar la forma en que debe enviar los datos, y cuyas características son:

  • Debe enviar su archivo de submission con solo 2 columnas
  • La Columna 0 debe llamarse: 'id'
  • La Columna 1 debe llamarse: 'revenue'
  • El archivo debe contener un número total de 3.700 rows(filas), donde:
    • Primer fila es == header
    • Las otras 3.699 filas == sus predicciones
  • Si no cumple estas reglas dentro su archivo de envío, el sistema automáticamente lo rechazará

Nota: le recomendamos revisar el archivo SampleSubmission.csv, el cual será asi:

id           revenue
                  
1            0
2            0 
3 	     1
4            0 
5            1  
6            1
etc.   


Definición de las variables: 

  • id: ID único del visitante al sitio web
  • administrative: Número de veces que el usuario visitó la sección administrativa
  • administrative_duration: Tiempo total que el usuario duro en la sección administrativa
  • informational: Número de veces que el usuario visitó la sección informativa
  • informational_duration: Tiempo total que el usuario duro en la sección informativa
  • productrelated: Número de veces que el usuario visitó la sección de productos relacionados
  • productrelated_duration: Tiempo total que el usuario duro en la sección de productos relacionados
  • bouncerates:  Es el porcentaje de visitantes que ingresan a la página y “rebotan” inmediatamente sin interactuar con ella. Solo se tiene en cuenta esta métrica, si es la primera página que visitan dentro del sitio web.
  • exitrates: Del número total de visitas a las páginas del sitio web, se obtiene el porcentaje de visitas que cerró sesión a través de esta página específica, es decir, indica el porcentaje de usuarios cuya última visita al sitio web fue esta página específica.
  • pagevalues: Es el valor promedio de la página web, indica la contribución que realizó dicha página web para que el visitante llegara a la página o sección final de compra. 
  • specialday: Es el valor que indica la cercanía a una fecha especial como lo es por ejemplo el día de San Valentín.  El rango de esta variable es de 0 a 1, siendo 1 el día exacto de la fecha especial y 0 si no hay un rango cercano a dicha fecha.
  • month: Mes de la visita al sitio web.
  • operatingsystems: Tipo de sistema operativo
  • browser: Nombre del explorador web
  • region: Región geográfica del visitante
  • traffictype: Tipo de tráfico web
  • visitortype: Si es un visitante nuevo o un visitante que regresa
  • weekend: 0 indica que no es un día del fin de semana y 1 indica que si es un día del fin de semana.

Variable objetivo:

  • revenue: Variable a clasificar, 1 indica que el visitante compró y 0 indica que el visitante no compro.

For this competition stage, you need to send your submission file with this details:

# of columns: 2
Column names: id,revenue
# of rows: 3700


10 Comentarios
  1. Daniel Morales
    Daniel Morales
    4 meses ago
    Ya esta funcionando de nuevo, pueden enviar sus modelos!
  2. Daniel Morales
    Daniel Morales
    4 meses ago
    Hola Diego, tenemos un problema en el server. Estamos trabajando en solucionarlo
  3. diego_corona
    diego_corona
    4 meses ago
    Hola, estoy tratando de envíar un envíó tardío pero me marca error '500'.
  4. Felipe Perez
    Felipe Perez
    4 meses ago
    Muy bueno tener ahora la opción de "Late Submission", felicitaciones!
  5. ANGEL JORGE SALAZAR
    ANGEL JORGE SALAZAR
    4 meses ago
    Muy buena competición y los certificados también genial, así que a esmerarse
  6. Daniel Morales
    Daniel Morales
    4 meses ago
    Excelente, esa es la idea!
  7. Pablo Neira Vergara
    Pablo Neira Vergara
    4 meses ago
    Excelente! se verán bien en mi linkedin y de paso tienen publicidad, todos ganan.
  8. Daniel Morales
    Daniel Morales
    4 meses ago
    Asi es Pablo, hemos recibido diferentes solicitudes al respecto, asi que decidimos agregarlo. Tambien acabamos de lanzar los certificados de las competiciones, un feature solicitado por usted, y el cual nos ha parecido muy interesante!. Lo puedes ya encontrar bajo la pestaña "Mi Perfil" en tu dashboard. La sub-pestaña se llama "Certificates". Se pueden descargar en PDF o compartir el Linkedin de forma automatica. Son otorgados a los primeros 10 puestos de cada competición. Seria muy bueno saber que piensas al respecto? y obviamente cualquier idea adicional o retroalimentación siempre será bienvenida!
  9. Pablo Neira Vergara
    Pablo Neira Vergara
    4 meses ago
    Que bueno que agregaran una sección de discusión.
  10. Felipe Perez
    Felipe Perez
    4 meses ago
    Muy buena competición! Aunque no he podido mejorar mucho mas mi score :(

¿Tienes algún comentario o pregunta de la competición?
Ingresar para Comentar


Compartir esta competición:

Otras Competiciones

Listo para empezar?

Registra tus datos aquí para iniciar con las competencias, te divertirás, aprenderás y ganarás premios en dinero!

Recibirás una notificación en breve acerca de tu registro exitoso.
deco-ring-1 decoration
deco-dots-3 decoration

Gana USD $2,000 en premios en efectivo con nuestra competición en data science!

🎉 Envios de modelos para la competición "Predecir el Puntaje de Recencia en Papers de Investigación" terminará en

arrow-up icon