21 Recursos Para Aprender Matemáticas Para Data Science

Daniel Morales
Jan 19, 2021


Este es quizás uno de los mayores temores de quienes se inician en el área de data science, aprender/repasar matemáticas. Y es que seamos sinceros, a la gran mayoría de personas no les fue muy bien en matemáticas en la educación básica, quizás tampoco en la universidad y esto llena de temor y crea una barrera para quienes quieren explorar esta disciplina llamada data science

En días pasados publiqué un post en Towards Data Science y aquí mismo en nuestro blog sobre un plan de estudio de data science para este año 2021, donde dí unas recomendaciones trimestrales, e hice énfasis en estudiar matemáticas y estadísticas para este primer trimestre, y del cual recibí muchas preguntas acerca de cuales materiales recomendaba puntualmente. Pues bueno, este post les responde estas dudas. Pero antes de ello quiero darles un contexto.

Dejando de lado los factores o motivos que han llevado a que las mayorías detesten las matemáticas, es una realidad que las necesitamos en data science. Para mi, una de las mayores falencias que encontraba en las matemáticas era su falta de aplicabilidad en el mundo real, no le veía una razón de ser a las matemáticas intermedias y avanzadas, como por ejemplo al cálculo multivariable. Confieso que en el colegio y en la universidad no me gustaban por ese motivo, pero siempre me iba bien y sacaba buenas calificaciones y promedios por encima de la mayoría (sobre todo en estadística). Pero aún así no veía en qué podría usar una derivada o una matriz en el mundo real. Finalmente terminé como ingeniero de software y una vez entré al mundo de data science pude hacer la conexión entre las matemáticas, estadísticas y el mundo real.

Por otro lado, es importante aclarar que no necesitamos una maestría en matemáticas puras para hacer proyectos de data science. Como ya he mencionado en posts anteriores existe un gran debate en la comunidad acerca de que tantas matemáticas realmente necesitamos para hacer un buen trabajo como data scientists. 

Podríamos decir que data science se divide en dos grandes campos laborales: research y producción

Con research nos referimos a la parte de investigación y desarrollo, que normalmente se da dentro de una gran empresa (normalmente tecnológica), o que se ha enfocado en temas tecnológicos de vanguardia (como por ejemplo investigaciones médicas). O también es un área que se desarrolla dentro de las universidades. Obviamente este sector tiene ofertas laborales muy limitadas. 
  • La gran ventaja es el conocimiento profundo de los algoritmos y sus implementaciones, así mismo será una persona capaz de crear variaciones de los algoritmos existentes, para mejorarlos. O incluso crear nuevos algoritmos de machine learning. 
  • La desventaja es la poca practicidad de su trabajo. Es un trabajo muy teórico, en el que muchas veces el único objetivo es publicar papers y se aleja de los casos de uso de los negocios en general. Para referencia sobre esto, hace poco vi este post en Reddit, les recomiendo leerlo

Con producción nos referimos a la parte práctica de esta disciplina, donde usarás generalmente y en tu dia a dia librerías tales como scikit-learn, Tensorflow, Keras, Pytorch y otras. Estas librerías operan como una caja negra, donde ingresas datos, obtienes una salida, pero no sabes en detalle qué ocurrió en el proceso. Esto también tiene sus ventajas y desventajas, pero sin duda nos facilita enormemente la vida al momento de poner modelos útiles en producción. Lo que no recomiendo es usarlas a ciegas, donde no tienes las bases mínimas de matemáticas para entender un poco sus fundamentos y ese es el objetivo de este post, guiarte y recomendarte algunos recursos valiosos para tener las bases necesarias y no operar a ciegas dichas librerías. 

Así que si usted decide enfocarse en Investigación y Desarrollo (Research), sí vas a necesitar matemáticas y estadística en profundidad (muy en profundidad). Si vas a irte por la parte práctica, las librerías te ayudarán a lidiar con la mayor parte de ello, bajo el capó. Cabe aclarar que la mayor cantidad de ofertas laborales, se encuentran en la parte práctica. 

Bien, luego de las aclaraciones anteriores, es momento de definir cuales son las temáticas puntuales necesarias para tener unas bases iniciales en matemáticas para data science. 
  1. Algebra Lineal: Esta materia es importante para tener los fundamentos del trabajo con datos en forma vectorial y matricial, adquirir habilidades para resolver sistemas de ecuaciones algebraicas lineales y encontrar las descomposiciones matriciales básicas y la comprensión general de su aplicabilidad.
  2. Calculo Multivariable: Aquí es importante estudiar los mapas funcionales, los límites (en caso de secuencias, funciones de una y varias variables), la diferenciación (a partir de una sola variable hasta casos múltiples), la integración, construyendo así secuencialmente una base para la optimización básica. También es importante aquí estudiar los gradientes descendentes.
  3. Teoría de probabilidad: Aquí deberías aprender sobre las variables aleatorias, es decir, una variable cuyos valores se determinan mediante un experimento aleatorio. Las variables aleatorias se utilizan como modelo para los procesos de generación de datos que queremos estudiar. Las propiedades de los datos están profundamente vinculadas a las propiedades correspondientes de las variables aleatorias, como el valor esperado, la varianza y las correlaciones. 

Nota: estas materias son mucho más profundas de lo que acabo de mencionar, esta es simplemente una guía de las materias y recursos recomendados para abordar matemáticas en el ámbito de data science.

Ahora que tenemos una mejor idea del camino que debemos tomar, vamos a examinar los recursos recomendados para abordar esta temática. Los dividiremos en básicos, intermedios y avanzados. En los avanzados tendremos recursos enfocados en deep learning

Bases: en esta primera sección de recursos recomendaremos las bases matemáticas. El pensamiento matemático, algebra y cómo implementar matemáticas con python.   

1- Introducción al pensamiento matemático


Price: Free

Image by Coursera

Descripción: Aprende a pensar como lo hacen los matemáticos, un poderoso proceso cognitivo desarrollado durante miles de años.

El pensamiento matemático no es lo mismo que hacer matemáticas - al menos no como las matemáticas se presentan típicamente en nuestro sistema escolar. Las matemáticas escolares normalmente se centran en el aprendizaje de procedimientos para resolver problemas altamente estereotipados. Los matemáticos profesionales piensan de cierta manera para resolver problemas reales, problemas que pueden surgir del mundo cotidiano, o de la ciencia, o de las propias matemáticas. La clave del éxito en las matemáticas escolares es aprender a pensar dentro de la caja. Por el contrario, una característica clave del pensamiento matemático es pensar fuera de la caja, una habilidad valiosa en el mundo de hoy. Este curso ayuda a desarrollar esa crucial forma de pensar.



2- Fundación matemática para la IA y el aprendizaje automático


Precio: $46.99 usd


Image by Packt


Descripción: La Inteligencia Artificial ha ganado importancia en la última década, dependiendo mucho del desarrollo e integración de la IA en nuestra vida cotidiana. El progreso que la IA ya ha hecho es asombroso con innovaciones como los coches auto-conductores, el diagnóstico médico e incluso ganarle a los humanos en juegos de estrategia como el Go y el Ajedrez. El futuro de la IA es extremadamente prometedor y no está lejos de que tengamos nuestros propios compañeros robóticos. Esto ha empujado a muchos desarrolladores a empezar a escribir códigos y a desarrollar programas de IA y ML. Sin embargo, aprender a escribir algoritmos para la IA y el ML no es fácil y requiere un amplio conocimiento de programación y matemáticas. Las matemáticas juegan un papel importante ya que constituyen la base para la programación de estas dos corrientes. Y en este curso, hemos cubierto exactamente eso. Diseñamos un curso completo para ayudarte a dominar los fundamentos matemáticos necesarios para escribir programas y algoritmos para la IA y la ML.



3- Matemáticas para programadores


Price: $47.99

Image by Manning


Descripción: Para conseguir un trabajo en data science, aprendizaje de máquinas, gráficos por ordenador y criptografía, tienes que aportar fuertes habilidades matemáticas a la fiesta. Math for Programmers enseña las matemáticas que necesitas para estas carreras, concentrándose en lo que necesitas saber como desarrollador. Lleno de muchos gráficos útiles y más de 200 ejercicios y mini proyectos, este libro abre la puerta a carreras interesantes y lucrativas en algunos de los campos de programación más populares de hoy en día.



4- Algebra 1



Price: Free

Image by Khanacademy



5- Algebra 2


Price: Free

Image by Khanacademy


6- Maestría en matemáticas con Python


Price: $12.99

Image by Udemy


Descripción: ¡Puedes aprender muchas matemáticas con un poco de programación!

Mucha gente no sabe que Python es una herramienta muy poderosa para aprender matemáticas. Claro que puedes usar Python como una simple calculadora, pero ¿sabías que Python puede ayudarte a aprender temas más avanzados en álgebra, cálculo y análisis de matrices? Eso es exactamente lo que aprenderás en este curso.



7- Introducción a los modelos lineales y al álgebra matricial


Price: Free

Image by Edx

Descripción: El álgebra matricial es la base de muchas de las herramientas actuales para el diseño experimental y el análisis de datos de alta dimensión. En este curso introductorio en línea de análisis de datos, utilizaremos el álgebra matricial para representar los modelos lineales que comúnmente se utilizan para modelar las diferencias entre las unidades experimentales. Realizaremos una inferencia estadística sobre estas diferencias. A lo largo del curso utilizaremos el lenguaje de programación R para realizar operaciones matriciales.


8- Aplicando matemáticas con Python.



Price: $20.99

Image by Packt

Descripción: Python, uno de los lenguajes de programación más populares del mundo, tiene un número de poderosos paquetes para ayudar a abordar problemas matemáticos complejos de una manera simple y eficiente. Estas capacidades centrales ayudan a los programadores a preparar el camino para construir aplicaciones emocionantes en varios dominios, como el aprendizaje de las máquinas y la ciencia de los datos, utilizando el conocimiento en el dominio de las matemáticas computacionales.



Intermedio: en esta segunda sección recomendaremos resusos enfocados en calculo y probabilidad. 


9- Calculo 1



Price: Free

Image by Khanacademy



10- Calculo 2


Price: Free

Image by Khanacademy



11- Calculo multivariable



Price: Free

Image by Khanacademy



12- Matematicas para Data Science


Precio: Gratis

Price: Free

Image by Coursera

Descripción: Detrás de numerosos modelos y construcciones estándar en la Ciencia de los Datos hay matemáticas que hacen que las cosas funcionen. Es importante entenderlo para tener éxito en la Ciencia de los Datos. En esta especialización cubriremos una amplia gama de herramientas matemáticas y veremos cómo surgen en la Ciencia de los Datos. Cubriremos campos tan cruciales como las Matemáticas Discretas, el Cálculo, el Álgebra Lineal y la Probabilidad. Para que su experiencia sea más práctica, acompañaremos a las matemáticas con ejemplos y problemas surgidos en la Ciencia de los Datos y mostraremos cómo resolverlos en Python.



13- Matematicas discretas en la practica



Price: $24.99

Image by Packt

Descripción: Las matemáticas discretas son un campo de las matemáticas que se ocupa del estudio de los elementos finitos y distintos. Las teorías y los principios de las matemáticas discretas se utilizan ampliamente en la resolución de complejidades y en la construcción de algoritmos en la informática y en la computación de datos en la ciencia de los datos. Ayuda a comprender los algoritmos, las matemáticas binarias y generales que se utilizan comúnmente en las tareas basadas en datos.


14- Matemáticas para la ciencia de los datos y el aprendizaje automático: Nivel universitario


Precio: $12.99 usd

Price: $12.99

Image by Udemy


Descripción: En este curso aprenderemos matemáticas para la ciencia de los datos y el aprendizaje de las máquinas. También discutiremos la importancia de las matemáticas para la ciencia de los datos y el aprendizaje de las máquinas en la práctica. Además, el curso de Matemáticas para la ciencia de los datos y el aprendizaje de máquinas es un paquete de dos cursos de álgebra lineal y probabilidad y estadística. Así, los estudiantes aprenderán contenidos completos de probabilidad y estadística y álgebra lineal. No es que no vayas a completar todos los contenidos en este curso de 7 horas de videos. Este es un hermoso curso y he diseñado este curso de acuerdo a la necesidad de los estudiantes.


15- Habilidades matemáticas para ciencia de datos



Price: Free

Image by Coursera


Descripción: Los cursos de ciencias de los datos contienen matemáticas... ¡no hay que evitarlo! Este curso está diseñado para enseñar a los alumnos las matemáticas básicas que necesitarán para tener éxito en casi cualquier curso de matemáticas de ciencias de los datos y fue creado para alumnos que tienen habilidades matemáticas básicas pero que no han tomado álgebra o pre-cálculo. Data Science Math Skills introduce el núcleo matemático sobre el que se basa la ciencia de los datos, sin complejidad adicional, introduciendo ideas y símbolos matemáticos desconocidos de una en una.

Link: https://www.coursera.org/learn/datasciencemathskills


Avanzado: en esta última sección nos centraremos en la parte estadística (teoría de la probabilidad) y en la aplicación de las matemáticas a los algoritmos de deep learning. 


16- Estadística y probabilidad



Price: Free

Image by Khanacademy




17- Introducción a estadística inferencial: 


Precio: Gratis

Price: Free

Image by Udacity

Descripción: Las estadísticas inferenciales nos permiten sacar conclusiones a partir de datos que podrían no ser inmediatamente obvios. Este curso se centra en mejorar su capacidad para desarrollar hipótesis y utilizar pruebas comunes como las pruebas t, las pruebas ANOVA y la regresión para validar sus afirmaciones.

Link: https://www.udacity.com/course/intro-to-inferential-statistics--ud201


18- Métodos estadísticos y matemáticas aplicadas a la ciencia de los datos



Price: $124.99

Image by Packt

Descripción: El aprendizaje de las máquinas y el análisis de datos son el centro de atracción de muchos ingenieros y científicos. La razón es bastante obvia: su vasta aplicación en numerosos campos y las opciones de carrera en auge. Y Python es una de las principales plataformas de código abierto para la ciencia de los datos y la computación numérica. IPython, y su asociado Jupyter Notebook, proporcionan a Python interfaces eficientes para el análisis de datos y la visualización interactiva, y constituyen una puerta de entrada ideal a la plataforma. Si usted está entre los que buscan mejorar sus capacidades en el aprendizaje de las máquinas, entonces este curso es la elección correcta.


19- Explorando las matemáticas para programadores y científicos de datos


Precio: Gratis


Image by Manning

Descripción: Unas buenas habilidades matemáticas son un prerrequisito si estás interesado en una carrera en ciencias de los datos, inteligencia artificial, criptografía o prácticamente cualquier campo tecnológico. Este mini ebook gratuito es el perfecto manual de aplicaciones matemáticas esenciales que necesitas para entrar en estas emocionantes y lucrativas carreras tecnológicas.


20- Matemáticas prácticas para deep learning



Price: $27.99

Image by Packt

Descripción: La mayoría de los programadores y científicos de datos luchan con las matemáticas, habiendo pasado por alto u olvidado conceptos matemáticos básicos. Este libro utiliza bibliotecas de Python para ayudar a comprender las matemáticas necesarias para construir modelos de aprendizaje profundo (DL).



21- Matemáticas y Arquitecturas de Deep Learning



Price: $39.99

Image by Manning

Descripción: Los paradigmas matemáticos que subyacen en el aprendizaje profundo suelen comenzar como documentos académicos difíciles de leer, a menudo dejando a los ingenieros en la oscuridad sobre cómo funcionan realmente sus modelos. Matemáticas y Arquitecturas de Aprendizaje Profundo cierra la brecha entre la teoría y la práctica, estableciendo las matemáticas del aprendizaje profundo junto con las implementaciones prácticas en Python y PyTorch. Escrito por el experto en aprendizaje profundo Krishnendu Chaudhury, usted mirará dentro de la "caja negra" para entender cómo funciona su código, y aprenderá a comprender la investigación de vanguardia que puede convertir en aplicaciones prácticas

Link: https://www.manning.com/books/math-and-architectures-of-deep-learning


Conclusión

Esta es una extensa recomendación sobre recursos para aprender matemáticas para data science, siguiendo el post anterior sobre el camino a seguir en este año 2021 para aprender data science. Cuando tenemos un tiempo limitado para el estudio debemos seleccionar los que mejor nos parezca y los que más se ajusten a nuestro estilo. Por ejemplo, podrías preferir los videos sobre los libros, así que vaya y elija lo que mejor se acomode a usted. Este material es suficiente tanto si desea dar una breve mirada a las matemáticas, como si quiere profundizar en ellas. Espero que lo encuentre útil.

Si tienes otras recomendaciones de cursos, libros o videos, porfavor déjalas en los comentarios para que entre todos formemos enlaces de interes.

PD: estamos creando un grupo privado de data scientists en Slack, si te quieres unir deja tus datos aqui: https://www.datacademy.dev/#slack

¡Gracias por leer!

“21 Recursos Para Aprender Matemáticas Para Data Science”
– Daniel Morales twitter social icon Tweet

Compartir este artículo:

0 Comentarios

Crear un comentario
Ingresar para Comentar

Artículos Relacionados

Nov 25, 2021

5 Consejos para Superar Una Entrevista de Trabajo para una Vacante de Científico de Datos

5 Tips To Ace Your Job Interview For A Data Scientist Opening.PNG 795.94 KBImage SourceLos aspirantes a científicos de datos tienen un futuro brill...

Daniel Morales
Por Daniel Morales
Nov 12, 2021

¿Cuándo Es Mejor Evitar el Uso de Deep Learning?

IntroducciónEste artículo está dirigido a los científicos de datos que pueden considerar el uso de algoritmos de aprendizaje profundo, y quieren sa...

Matt Przybyla
Por Matt Przybyla
Oct 16, 2021

6 Conceptos de Estadística Avanzada en Data Science

El artículo contiene algunos de los conceptos estadísticos avanzados más utilizados junto con su implementación en Python.En mis artículos anterior...

Nagesh Singh Chauhan
Por Nagesh Singh Chauhan
Icon

Únete a nuestra comunidad privada en Slack

Manténgase al día participando de ésta gran comunidad de data scientists en latinoamérica. Hablamos sobre competiciones en data science, cómo estamos resolviendo los retos, modelos de machine learning aplicados a las competiciones, técnicas novedosas y mucho más!

 
Te enviaremos el link de invitación a tu email de forma inmediata.
arrow-up icon