Clasificación De Enfermedades En Plantas
Compartir:
plus interface icon 20,000pts

Clasificación De Enfermedades En Plantas

Image
Descripción

Los cultivos de manzana son uno de los más importantes en el mundo. Las enfermedades foliares (de las hojas) suponen una gran amenaza para la produ...

Premios
Para esta competición queremos dar, además de los 20.000 puntos, ¡un regalo muy especial para el primer puesto!¡Enviaremos este premio a cualquier país o ciudad del mundo! (hecho por https://www.devwear.co/)*El hoddie es para hombre o mujer (Unise...
Competidores
  • jbn-es
  • marisbotero
  • Muhammad4hmed-es
  • kudasov.dm-es
  • Diegonov
  • c.olate
  • Diego Fernando Rua
17 Competidores Publicada el: 07/01/2021
Puntos
20,000pts
graphical divider

Tabla de Posiciones Pública


Ranking
Data Scientist
País
# Envíos
Último envío
Mejor Puntaje



Línea de Tiempo

Inicio
2021/09/10
Final
2021/12/10
Completo
2021/12/17

Competition empezó el: 2021/09/10 00:01:00
Competición termina el: 2021/12/10 23:59:00
Límite del Envío Final: 2021/12/17 23:59:00

Esta competición tiene una duración total de 3 meses, dentro de los cuales usted podrá hacer sus envios y obtener resultados de forma automática. Una vez finalice la primera parte de la competición, tendrá una semana para elegir su mejor modelo y enviarlo para que sea calificado y tenido en cuenta en los premios en dinero o en puntos. 

Una vez culminado todo el proceso, se podrán seguir enviando modelos como "Envio tardio" a modo de aprendizaje, ya que, debido a que la competicion oficialmente termino, esos modelos no seran elegibles para ganar premios.


Descripción

Los cultivos de manzana son uno de los más importantes en el mundo. Las enfermedades foliares (de las hojas) suponen una gran amenaza para la productividad y la calidad general de los cultivos de manzanas. El proceso actual de diagnóstico de enfermedades en los cultivos de manzanas por parte de los campesinos se basa en la exploración manual por parte de personas, lo que lleva mucho tiempo y es muy costoso.

Aunque los modelos basados en la visión por computador han demostrado ser prometedores para la identificación de patrones, existen algunas limitaciones que deben ser abordadas. Las grandes variaciones en los síntomas visuales de una misma enfermedad entre diferentes cultivos de manzanas, o nuevas variedades que se originan en el cultivo, son los principales retos para la identificación de enfermedades basada en la visión por computador. 

Estas variaciones surgen de las diferencias en los entornos naturales y de captura de imágenes, por ejemplo, el color y la morfología de las hojas, la edad de los tejidos infectados, el fondo no uniforme de la imagen y la diferente iluminación durante la toma de imágenes, etc.


Evaluación

La métrica de evaluación para esta competición es Macro Mean F1-Score: https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html


Reglas

Reglas de la Competición

  • El código no debe ser compartido en privado. Cualquier código que se comparta, debe estar disponible para todos los participantes de la competición a través de la plataforma
  • La solución debe usar sólo librerías de código abierto disponibles públicamente
  • Si dos soluciones obtienen puntuaciones idénticas en la tabla de clasificación, el desempate será la fecha y la hora en que se hizo la presentación (ganará la primera solución enviada).
  • Nos reservamos el derecho de solicitar el código de cualquier usuario en cualquier momento durante un desafío. Tendrás 48 horas para enviar tu código siguiendo las reglas de revisión de códigos.
  • Nos reservamos el derecho de actualizar estas reglas en cualquier momento.
  • Tu solución no debe infringir los derechos de terceros y debes estar legalmente autorizado para asignar la propiedad de todos los derechos de autor en y para el código de la solución ganadora a DataSource.ai.
  • Los competidores pueden registrarse y presentar soluciones como individuos (no como equipos, al menos por ahora).
  • Como esta es una competencia de aprendizaje, aparte de las reglas de los Términos de Uso de DataSource.ai, no se aplican otras reglas particulares.
  • Máximo 50 soluciones enviadas por día.


Al finalizar la competición, debes enviar el modelo completo en formato .ipynb (Jupyter Notebook) - No se aceptarán otros formatos. Normalmente tendrás 1 semana después de finalizada la competición de enviarlo a travéz de nuestra plataforma en el boton "Enviar Modelo Final" - Este modelo nos servirá para calcular las evaluaciones reales finales, por tanto el Leaderboard Privado podría variar cuando se muestre la evaluación privada final


Para esta competición queremos dar, además de los 20.000 puntos, ¡un regalo muy especial para el primer puesto!

¡Enviaremos este premio a cualquier país o ciudad del mundo! (hecho por https://www.devwear.co/)


*El hoddie es para hombre o mujer (Unisex)

Escala de puntuación

Estos serán los premios una vez finalizado el concurso:

  • 1er Lugar: 20.000 pts + Sudadera TensorFlow (Envío a cualquier ciudad del mundo)
  • 2º Puesto: 19.000 pts 
  • 3er Puesto: 18.000 pts 
  • 4º Puesto: 17.000 pts 
  • 5º Puesto: 16.000 pts 
  • 6º Puesto: 15.000 puntos 
  • 7º Puesto: 14.000 puntos 
  • 8º Puesto: 13.000 puntos
  • 9º puesto: 12.000 puntos 
  • 10º puesto: 11.000 puntos

Points: 20000pts


Se trata de un problema que puede solucionarse utilizando modelos basados en visión por computador u otras técnicas de deep learning, ya que dichos modelos han demostrado efectividad en la identificación de patrones en imágenes. 

A su vez se trata de un problema de clasificación multi-etiqueta, donde la columna objetivo puede tener una o más etiquetas posibles. También es importante aclarar que se trata de un dataset imbalanceado para ciertas etiquetas.

Datasets:
  • El dataset llamado Train.csv cuenta con 3 columnas: “id”, “image” y “labels”. Como su nombre lo indica, este será el dataset usado para entrenar el modelo. El total de muestras en este dataset es de 931. Ver links a imágenes
  • El dataset llamado Test.csv cuenta con 2 columnas: “id”, “image”. Como su nombre lo indica, este será el dataset usado para probar el modelo, haciendo predicciones sobre la columna “labels” y enviando las predicciones a la plataforma. El total de muestras en este dataset es de 466. Ver links a imágenes

Las imágenes se encuentran en links a parte, y no es necesario re-enviarlas a la plataforma. Aqui estan los enlaces de las imágenes:

Links a imágenes:
  • /train_images: es la carpeta donde se encuentran las imágenes de referencia para entrenar el modelo y que coinciden con los nombres de la columna “image” del dataset Train.csv. Link aqui: https://drive.google.com/drive/u/1/folders/1FnZZ-0BKrQsqf175Z4iL4lVUUuavyWJ5
  • /test_images: es la carpeta donde se encuentran las imágenes de referencia para testear el modelo y hacer las predicciones para enviar a la plataforma. Las imágenes que se encuentran allí coinciden con los nombres de la columna “image” del dataset Test.csv. Link aqui: https://drive.google.com/drive/u/1/folders/149dPpgpFA-_Gjh-EJm61Typhh5yiGXqf
  • En la etapa final de la competición, se revelará el conjunto final de imágenes que servirá para que usen su mejor modelo, hagan una única predicción, y servirá como puntaje final para la tabla de clasificación privada. Por favor, esté atento a este párrafo, ya que una vez entremos en la recta final de la competición revelaremos dicho link aquí. 


Archivo Submission

Para cada "id" del conjunto Test.csv, debe predecir la o las etiquetas para la variable "labels". El archivo debe contener una cabecera y tener el siguiente formato:

id,labels
1,healthy
2,frog_eye_leaf_spot
3,scab
4,rust
5,rust
6,scab
7,scab
...
463,healthy
464,frog_eye_leaf_spot
465,scab
466,rust

For this competition stage, you need to send your submission file with this details:

# of columns: 2
Column names: id,labels
# of rows: 467


2 Comentarios
  1. Daniel Morales
    Daniel Morales
    2 días ago
    Hi Kudasov. Thanks for let us know about the issue. We've already solve it, so you can send your model submission now. If you have any other question, please let me know. Best!
  2. kudasov.dm-es
    kudasov.dm-es
    2 días ago
    Hi guys!
    I have this error when I try to submit my model
    Any ideas how I can fix that?

    """ Error: You have the following error in your submission file
    * Scientific notation: The system does not allow scientific notation values similar or equal to this syntax: '5.54538E+11'
    Please make sure your file is correct and run the submission again. """

¿Tienes algún comentario o pregunta de la competición?
Ingresar para Comentar


Compartir esta competición:

Otras Competiciones

Listo para empezar?

Registra tus datos aquí para iniciar con las competencias, te divertirás, aprenderás y ganarás premios en dinero!

Recibirás una notificación en breve acerca de tu registro exitoso.
deco-ring-1 decoration
deco-dots-3 decoration
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre competiciones en data science, cómo estamos resolviendo los retos, modelos de machine learning aplicados a las competiciones, técnicas novedosas y mucho más!

 
Te enviaremos el link de invitación a tu email de forma inmediata.
arrow-up icon