Línea de Tiempo
Competition empezó el: 2020/04/08 00:00:00
Competición termina el: 2020/05/31 00:00:00
Límite del Envío Final: 2020/06/14 00:00:00
Esta competición tiene una duración total de 2 meses, dentro de los cuales usted podrá hacer sus envios y obtener resultados de forma automática. Una vez finalice la primera parte de la competición, tendrá una semana para elegir su mejor modelo y enviarlo para que sea calificado y tenido en cuenta en los premios en dinero o en puntos.
Esta competición no tiene opcion de "Envío Tardío"
Descripción
La base esencial de esta competencia, es poder predecir el número de personas que han sido afectadas (casos confirmados) o lamentablemente declaradas muertas por el virus COVID19, en latinoamérica. Si usted en su análisis logra identificar factores que puedan llegar a afectar a la tasa de transmisión de COVID-19, los puede compartir.
Archivo de presentación
Entendemos que es una situación grave, y de ninguna manera queremos trivializar el impacto humano que esta crisis está causando al predecir las muertes. Nuestro objetivo es proporcionar mejores métodos de estimación que puedan ayudar a las instituciones médicas y gubernamentales a prepararse y ajustarse a medida que se desarrollen las pandemias.
Linea de Tiempo
- 08/04/2020 - Lanzamiento de la competencia
- 08/04/2020 - 31//05/2020 - Trabajas el modelo y lo pruebas contra el test.csv, lo actualizamos semanalmente con los nuevos datos de train.csv que nosotros lanzaremos. Vamos publicando una tabla de posiciones pública en ese periodo de tiempo.
- 31//05/2020 - Fecha límite del archivo de presentación final.
- 01/06/2020 - 30/06/2020 - Periodo de evaluación.
- 30/06/2020 mostramos la tabla de posiciones privada
El set de datos inicial para el entrenamiento del modelo irá desde el 26 Febrero hasta el 08 Abril 2020.
Este dataset se actualizará semanalmente hasta el 31 de Mayo.
Evaluación
La métrica para la evaluación de resultados será el Root Mean Squared Logarithmic Error (RMSLE):
donde:
n es el número total de observaciones
pi es la predicción
ai es el valor actual
El score final será el promedio del resultado de la métrica RMSLE aplicada sobre las 2 columnas (ConfirmedCases, Fatalities).
El archivo de presentación de resultados (Submission.csv) debe tener el siguiente formato
ForecastId,ConfirmedCases,Fatalities
1,10,0
2,10,0
3,10,0
etc.
Para cada ForecastID del testing set, se debe predecir la suma de las variables ConfirmedCases y Fatalities, en el rango de fechas del test.csv
Reglas
Los competidores pueden registrarse y presentar soluciones como individuos no como equipos (al menos por ahora).
Como éste es una desafío de aprendizaje (el competidor ganará puntos, no dinero en efectivo), aparte de las reglas de los
Términos de Uso de DataSource, no se aplican otras reglas particulares.
Máximo 10 soluciones enviadas por día.
Nota: Nos reservamos el derecho de modificar estas reglas en cualquier momento según sea necesario.