Statistical Distribution with NumPy - Part 3

Daniel Morales
By Daniel Morales - Screencast # 37
May 25, 2020


Histogramas Parte 3
  • Podemos graficar histogramas usando un módulo de python conocido como Matplotlib
  • Vamos a ver en detalle este modulo mas adelante, por ahora solo vamos a familiarizarnos un poco con su sintaxis. 
  • El histograma automáticamente se crea con 10 bins
  • Si usted quiere un valor diferente, debe usar la palabra reservada bins en plt.hist. Por ejemplo debe hacer algo como plt.hist(data, bins=5)
  • Si quiere un rango diferente, puede pasar un max y min usando la palabra reservada range. Por ejemplo plt.hist(data, range=(20, 51))
Tipos de Distribucion Parte 1
  • Los histogramas y sus set de datos pueden ser clasificados basados en la forma de los valores graficados. 
  • Una manera de clasificar un dataset es contando el número de diferentes picos (peaks) presentes en el gráfico. 
  • Los picos representan concentración de datos
Seleccion de Bins
  • Podría afectar la apariencia de una distribución nuestra elección de bins?
    • Si, porque puede cambiar la interpretación de los datos, aunque no afectará el set de datos en sí. 
    • Por ejemplo si ponemos un bin muy bajo, bins=2 las barras probablemente no darán mucha información acerca de la distribución de la data. 
    • Por tanto es importante elegir un buen tamaño de bins

Tipos de Distribucion Parte 2
  • La mayoría de los datasets con los que trabajaremos serán unimodales (un solo pico)
  • Podemos subclasificar las distribuciones unimodales a su vez describiendo donde esta la mayoria de numeros en relacion al pico. 
  • El tipo de distribución afecta la posición de la media y la mediana
  • En distribuciones muy sesgadas la media (mean) se vuelve menos útil. 
Distribucion Normal, Parte 1
  • El tipo de distribución más común en estadística es la distribución normal, la cual es una distribución simétrica y unimodal. 
  • Muchas cosas pueden conformar una distribución normal
    • La altura de un gran número de personas
    • Presión sanguínea de un grupo de personas sanas, etc.
  • La distribución normal está definida por la media y la desviación standard
  • La media nos dice el “medio” de la distribución y la desviación estándar nos dice el “ancho” de la distribución
  • A mayor desviación estándar nos lleva a una distribución más ancha, y a menor desviación standard, más delgada la distribución
Distribucion Normal, Parte 2
  • Para crear este dataset, podemos usar NumPy random number generator
  • Podemos usar una función de NumPy para generar un set de números que tengan la forma de una distribución normal: np.random.normal y recibe estos argumentos: 
  • Para crear este dataset, podemos usar NumPy random number generator
  • Podemos usar una función de NumPy para generar un set de números que tengan la forma de una distribución normal: np.random.normal y recibe estos argumentos: 
    • loc: la media para la distribución normal
    • scale: la desviación standard de la distribución
    • size: el número de números aleatorios a generar.

“Statistical Distribution with NumPy - Part 3”
– Daniel Morales twitter social icon Tweet

Share this article:

0 Comments

Post a comment
Log In to Comment
divider graphic

Related Screencasts

May 29, 2020
140

Complete Project with Numpy

Este proyecto abarca los diferentes temas vistos con Numpy

Daniel Morales
By Daniel Morales
May 28, 2020
91

Binomial Distribution and Exercise with NumPy

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
May 27, 2020
66

Statistical Distribution and Exercise with NumPy - Part 4

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
arrow-up icon