¿Que Son Los Torneos En Data Science?

Daniel Morales
May 21, 2021

¿Que Son Los Torneos En Data Science?

May 21, 2021 5 minutes read

La ciencia de los datos, a diferencia del desarrollo web o móvil, tiene una forma relativamente fácil de medir el resultado: mediante métricas de evaluación. En el desarrollo de software, el resultado que esperan los interesados viene dado por una serie de cosas subjetivas, como la incorporación del usuario, la UX/UI o la seguridad.

Esta evaluación no se mide específicamente por alguna métrica objetiva y única. En la ciencia de los datos ocurre lo contrario, porque tenemos las métricas de evaluación, que podemos elegir una métrica para un problema determinado, haciendo que un modelo sea fácilmente evaluable, ya que siempre tendremos un valor objetivo como resultado de la calidad. El problema es elegir la métrica adecuada, y eso ya sería otro problema.

Esas métricas de evaluación nos dejan las puertas abiertas para medir fácilmente las habilidades de los científicos de datos, y evaluar la eficacia de sus modelos. Por eso han nacido los torneos de ciencia de datos.

tournament-brackets.png 88.75 KB


Ver torneos aqui: https://www.datasource.ai/es/home/data-science-tournaments

En nuestro caso particular, se trata de competiciones financiadas por los propios competidores, en las que se compite por eliminatorias, los mejores jugadores ganan el premio de la bolsa, y todos los demás reciben los modelos ML de los ganadores. Pon a prueba tu espíritu competitivo, experimenta un subidón de adrenalina y demuestra tus habilidades con los datos.

Financiado por la comunidad


Nuestros torneos, como ningún otro, están financiados por la comunidad. Si te gustan las competiciones como a nosotros y tienes un espíritu competitivo, ¿por qué no das una contribución para entrar en el juego y luego compartes el dinero total recaudado entre los ganadores? Esa es nuestra filosofía, queremos cambiar la forma en que se financian y ejecutan las competiciones, y queremos que todos ganen algo.


Cuota de inscripción


Puedes participar en el torneo con una cuota de inscripción que oscila entre los 10 y los 300 dólares. Tú eliges la cantidad que quieres para apoyar al torneo y a la comunidad. Los beneficios de unirse a nosotros son muchos, tales como: aprender Aprendizaje Automático aplicado, mejorar tu espíritu competitivo, comparar tus habilidades con otros científicos de datos, recibir los modelos de Aprendizaje Automático de los ganadores, y por supuesto tener la oportunidad de ganar el premio final.


Calendario


Los torneos se desarrollan en un corto periodo de tiempo. Por lo general, tenemos 1 mes para recaudar el dinero que nos fijamos como objetivo para empezar con el torneo. Luego tendremos de 2 a 3 semanas de temporada regular, y después entramos en la etapa más emocionante de todas: ¡los playoffs! Cada etapa de los playoffs se desarrolla semanalmente (cuartos de final, semifinales y final).


Temporada regular


Durante esta etapa todos los competidores participan enviando sus modelos y nuestra plataforma muestra dinámicamente las primeras 8 posiciones, que pasarían automáticamente a la siguiente ronda (cuartos de final). El objetivo en esta etapa es quedar entre los 8 primeros con las mejores puntuaciones. En esta etapa las inscripciones seguirán abiertas, por lo que podrás invitar y retar a tus amigos y compañeros.

Playoffs


Este es el comienzo de una etapa emocionante y completamente nueva en las competiciones de ciencia de datos. El sistema te asignará un compañero con el que competirás cara a cara durante una semana. Tu objetivo en esta etapa es vencer a tu competidor directo, para avanzar a la siguiente etapa hasta la gran final. El sistema elegirá la mejor puntuación entre los dos competidores (no sobre el total de competidores).

Podio


Al final tendremos un podio de 3 ganadores. La gran final es la etapa en la que los dos mejores competidores de todo el torneo se enfrentarán durante una semana, y la mejor puntuación será el ganador y el 1er puesto. Su oponente será el 2º. Y el 3er puesto será el mejor competidor (puntuación) de la semifinal entre los que no pasaron a la final. Todo esto lo hace automáticamente nuestra plataforma.


Conjuntos de datos


Una de las peculiaridades de nuestros torneos es que cada etapa tiene nuevos conjuntos de datos (nuevas observaciones). Esto significa que el problema de la ciencia de datos sigue siendo el mismo, pero nosotros hacemos un lanzamiento de nuevas observaciones, por lo que los competidores deben volver a entrenar los modelos basándose en ellas. Esto simula fielmente la entrada de nuevos datos reales, y la mejora del modelo basado en ellos. También mantiene la emoción, ¡ya que nadie tiene su posición completamente ganada!

Liberación de conjuntos de datos


Tendremos un archivo TrainQuarterfinals.csv o TrainSemifinal.csv dependiendo de la etapa del torneo, y también compartiremos un TestRelease.csv con las etiquetas reales de la etapa inmediatamente anterior. Esto tiene un propósito, y es que el competidor puede tomar esos datos para volver a entrenar el modelo con nuevas observaciones. También permite mantener la transparencia de cada etapa, ya que cada competidor puede probar su modelo con las etiquetas verdaderas.

Transparencia


Al final del torneo, y una vez que hayamos asignado los 3 ganadores, todos los participantes recibirán el modelo de los finalistas en un formato de cuaderno. Esto tiene una doble intención, la primera es asegurar la transparencia de los ganadores (ya que es un torneo financiado por la comunidad). ¡Y la segunda es para que los participantes puedan aprender de los mejores!

Desafía a tus amigos


Tienes la oportunidad de compartir un enlace para invitar y retar a tus amigos y compañeros a unirse al torneo. Esto os animará aún más, podréis aprender en grupo, compartiendo conocimientos y comentarios, y finalmente ayudándoos mutuamente a ganar el premio final. Sin embargo, cada uno debe presentar sus propios modelos de forma individual.

Únete a nuestros torneos aquí: https://www.datasource.ai/en/home/data-science-tournaments

¡Esperamos que puedas unirte a los torneos y continuar tu camino de aprendizaje en la ciencia de los datos!
Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!