Separar El Bombo Del Valor En La Inteligencia Artificial

Daniel Morales
Jul 09, 2021


Probablemente haya oído hablar mucho de la ciencia de los datos, la inteligencia artificial y del big data. Francamente, ha habido mucho bombo y platillo en torno a estas áreas. Lo que ha hecho es inflar las expectativas sobre lo que la ciencia de los datos y los datos pueden lograr realmente. En general, esto ha sido negativo para el campo de la ciencia de los datos y para el big data. Es útil pensar un poco en las preguntas que se pueden hacer para separar el bombo de la ciencia de datos de la realidad de la ciencia de datos.

La primera pregunta es siempre "¿Cuál es la pregunta que se intenta responder con los datos?" Si alguien viene a hablarte de un proyecto de big data, de inteligencia artificial o de un proyecto de ciencia de datos, y empieza a hablar de la tecnología más novedosa que pueden usar para hacer computación distribuida, y analizar datos con aprendizaje automático y te lanzan un montón de palabras de moda, la primera pregunta que deberías hacer es "¿Cuál es la pregunta que estás tratando de responder con los datos?". Porque eso realmente reduce la pregunta y filtra una gran cantidad de bombo y platillo en torno a las herramientas y tecnologías que la gente está utilizando, que a menudo puede ser muy interesante y divertida para hablar. A nosotros también nos gusta hablar de ellas, pero en realidad no van a añadir valor a tu organización por sí solas.

Leer también: Democratización De Datos E Inteligencia Artificial En El Sector Financiero

La segunda pregunta que hay que hacerse, una vez que se ha identificado la pregunta a la que se intenta responder con los datos, es: "¿Tienes los datos para responder realmente a esa pregunta?". Así que a menudo la pregunta que quieres responder y los datos con los que tienes que responder no son realmente muy compatibles entre sí. Así que tienes que preguntarte "¿Podemos obtener los datos de forma que podamos responder a la pregunta que queremos responder?" A veces la respuesta es simplemente no, en cuyo caso hay que renunciar (por ahora). En resumidas cuentas, si quieres decidir si un proyecto es un bombo o una realidad, tienes que decidir si los datos que la gente está tratando de utilizar son realmente relevantes para la pregunta que están tratando de responder.

La tercera cosa que hay que preguntarse es: "Si pudieras responder a la pregunta con los datos que tienes, ¿podrías incluso utilizar la respuesta de forma significativa?". Esta pregunta se remonta a esa idea de las competiciones de Netflix en la que había una solución al problema de predecir qué videos le gustaría ver a la gente. Y era una solución muy, muy buena, pero no era una solución que pudiera ser implementada con los recursos informáticos que Netflix tenía de una manera que fuera financieramente conveniente. A pesar de que podían responder a la pregunta, a pesar de que tenían los datos correctos, a pesar de que estaban respondiendo a una pregunta específica, en realidad no podían aplicar los resultados de lo que averiguaron

Si te haces estas tres preguntas, podrás descifrar muy rápidamente si un proyecto de ciencia de datos se trata de un bombo y platillo o si se trata de una contribución real que realmente puede hacer avanzar a tu organización.

Lea También: ¿Cuáles Son Los Resultados Que Se Esperan De Un Proyecto de Data Science?

¿Cómo determinar el éxito de un proyecto de ciencia de datos?


Las pequeñas empresas pocas veces utilizan tecnología de vanguardia, simplemente porque no está dentro de sus presupuestos, conocimientos o recursos. Sin embargo, casi todas están llamadas a experimentar con dicha tecnología, debido a que si no lo hacen, alguien más lo hará y finalmente quien lo haga ganará en competitividad, costos o utilidad.

Definir el éxito de un proyecto de Inteligencia Artificial (que técnicamente es denominado ciencia de datos o machine learning) es una parte crucial de la gestión de un experimento de ciencia de datos. 

Por supuesto, el éxito suele ser específico del contexto. Sin embargo, algunos aspectos del éxito son lo suficientemente generales como para merecer un debate. Mi lista de distintivos del éxito incluye

  1. La creación de nuevos conocimientos.
  2. Se toman decisiones o políticas basadas en el resultado del experimento.
  3. Se crea un informe, presentación o app con impacto.
  4. Se aprende que los datos no pueden responder a la pregunta que se les hace.

Algunos resultados más negativos son: que se tomen decisiones que ignoran la evidencia clara de los datos, que los resultados sean equívocos y no arrojen luz en una u otra dirección, que la incertidumbre impida la creación de nuevos conocimientos.

Hablemos primero de algunos de los resultados positivos.

Los nuevos conocimientos me parecen ideales. Sin embargo, un nuevo conocimiento no significa necesariamente que sea importante. Si produce decisiones o políticas

Si produce decisiones o políticas aplicables, mejor aún. (¿No sería estupendo que hubiera una política basada en la evidencia, como el movimiento de la medicina basada en la evidencia que ha transformado la medicina?). Que nuestros productos de ciencia de datos tengan un gran impacto (positivo) es, por supuesto, lo ideal. Crear código o aplicaciones reutilizables es una gran manera de aumentar el impacto de un proyecto.

Finalmente, el último punto es quizá el más controvertido.

Considero que un proyecto de data science tiene éxito si podemos demostrar que los datos no pueden responder a las preguntas que se plantean. Me acuerdo de un amigo que contaba una historia de la empresa en la que trabajaba. Contrataron a muchos y costosos consultores de ciencias de datos para ayudar a utilizar sus datos para informar sobre la fijación de precios. Sin embargo, los resultados de la predicción no ayudaban. Pudieron comprobar que los datos no podían responder a la hipótesis estudiada. Había demasiado ruido y las mediciones no estaban midiendo con precisión lo que se necesitaba. Claro, el resultado no era óptimo, ya que todavía necesitaban saber cómo ponerle precio a las cosas, pero sí se ahorraba dinero en consultores. Desde entonces, he escuchado esta historia repetida de forma casi idéntica por amigos de diferentes sectores.

Leat también:
* ¿Como Diseñan las Aplicaciones de Machine Learning Las Empresas Mas Grandes Del Mundo?
* ¿Que Es Open Innovation en Data Science?


“Separar El Bombo Del Valor En La Inteligencia Artificial”
– Daniel Morales twitter social icon Tweet

Compartir este artículo:

0 Comentarios

Crear un comentario
Ingresar para Comentar

Artículos Relacionados

Sep 17, 2021

5 Extensiones de Google Chrome que Todo Científico de Datos Debería Conocer

En esta nueva entrada hablaremos de las mejores extensiones de Google Chrome que como data scientists nos facilitan ciertas tareas. Deberías como m...

Daniel Morales
Por Daniel Morales
Sep 10, 2021

Los Científicos de Datos Son Realmente Gestores de Productos. He Aquí el Porqué

¿Opinión impopular?Índice de contenidosIntroducciónComprensión del negocio y del productoColaboración con las partes interesadasResumenReferenciasI...

Matt Przybyla
Por Matt Przybyla
Aug 31, 2021

16 Métodos Infravalorados de Pandas y Cuándo Utilizarlos

En este artículo, vamos a explorar algunos métodos de pandas menos conocidos pero muy útiles para manipular objetos de tipo Series. Algunos de esto...

Elena Kosourova
Por Elena Kosourova
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre competiciones en data science, cómo estamos resolviendo los retos, modelos de machine learning aplicados a las competiciones, técnicas novedosas y mucho más!

 
Te enviaremos el link de invitación a tu email de forma inmediata.
arrow-up icon