Statistics with Numpy - Part 1

Daniel Morales
By Daniel Morales - Screencast # 31
May 19, 2020


Estadistica con Numpy
  • Podemos usar NumPy para analizar data
  • Aprenderemos diferentes métodos para calcular propiedades estadísticas de un set de datos, como encontrar la media y la desviación standard
  • Esto servirá para entender cómo podemos usar la estadística para llegar a conclusiones acerca de los datos. 
Estadistica y Analisis de Datos
  • La estadística nos ayuda a entender mejor los datasets.
  • Usando estadística podremos inferir, con cierta certeza, que probabilidades de ocurrencia existen sobre algo y nos ayuda a leer las propiedades acerca de los datos
  • Sirve para obtener hábitos de uso de los usuarios, click-rates, publicidad, posts, etc. Podría también ayudarnos, por ejemplo, a predecir futuras compras basado en historial de compras. 
Numpy y Mean
  • El primer concepto estadístico que exploramos sera la media (mean), comunmente conocida como el promedio. 
  • Es útil para obtener el centro de un dataset. 
  • NumPy tiene una función pre-construida para calcular la media de los arrays: np.mean
Podemos Redondear?
  • Podemos redondear la media a un número específico de puestos decimales?
  • Si, podemos usar la función de Python round() Recordemos que recibe dos parámetros = número a redondear y número de decimales.
  • NumPy nos provee también una forma de redondear cada valor en un array a través de la función np.round().
  • Funciona similar al round de python porque recibe ambos parámetros. 
Mean y Operaciones Logicas
  • También podemos usar np.mean para calcular el porcentaje de elementos de un array que tienen ciertas propiedades. 
  • Recordemos que los operadores lógicos evalúan cada ítem en un array para ver si cumple una condición. Si el ítem cumple, evalúa a True = 1 o False = 0.
  • Cuando np.mean calcula una sentencia lógica, la media que da como resultado será equivalente al número total de True’s divido el length del array.
Media de Valores
  • Que pasa si queremos obtener la media de los valores en vez del porcentaje de valores, que satisfacen una condición? por demos hacerlo así:
  • Digamos que tenemos un array de temperaturas desde 0 hasta 100 y queremos obtener el promedio de temperaturas mayores a 50. 
  • Primero seleccionamos los datos específicos basados en una condición, el cual creará un nuevo array para todas las temperaturas mayores a 50
  • temperatures[temperatures > 50]
  • Finalmente aplicamos la función np.mean() a estos datos, y nos dará la media de los mismos
  • np.mean(temperatures[temperatures > 50])
Media de arrays 2D

  • Si tenemos un array de dos-dimensiones, np.mean puede calcular las medias del array más largo así como de los valores interiores. 
  • Imaginemos un juego de lanzamiento de anillos en una feria. En este juego, tienes 3 oportunidades de conseguir los 3 anillos en un palo. En nuestro array ring_toss, cada array interior es un intento y cada número es un lanzamiento de anillo. 1 representa un lanzamiento exitosos, 0 representa un fallo

“Statistics with Numpy - Part 1”
– Daniel Morales twitter social icon Tweet

Share this article:

0 Comments

Post a comment
Log In to Comment
divider graphic

Related Screencasts

May 29, 2020
140

Complete Project with Numpy

Este proyecto abarca los diferentes temas vistos con Numpy

Daniel Morales
By Daniel Morales
May 28, 2020
91

Binomial Distribution and Exercise with NumPy

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
May 27, 2020
65

Statistical Distribution and Exercise with NumPy - Part 4

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
arrow-up icon