Statistical Distribution with NumPy - Part 2

Daniel Morales
By Daniel Morales - Screencast # 36
May 24, 2020


Distribucion Estadistica
  • La distribución estadística, también conocida como distribución de probabilidad, muestra la probabilidad o número de veces que cierto resultado ocurra dado un número de intentos. 
  • Esto puede ayudarnos a observar y determinar la probabilidad de que un resultado ocurra
  • Teniendo en cuenta que siempre hay incertidumbre, esto puede ayudarnos a tomar decisiones más certeras basados en probabilidades.
  • La forma de la distribución puede ser categorizada.
Histogramas Parte 1
  • Cuando vemos por primera vez un dataset, vamos a querer entender rápidamente ciertas cosas acerca de él, como:
    • Algunos valores ocurren más seguido que otros?
    • Cual es el rango del set de datos? (el max y min)
    • Hay mucho valores atípicos? (outliers)
  • Podemos visualizar esto con un gráfico llamado histograma. 
Bar Charts vs Histogramas
  • Aunque parecen similares, los histogramas y los gráficos de barras son diferentes y sirven para propósitos específicos. 
    • Histogramas:
      • Son usados para graficar distribuciones o frecuencias para datos cuantitativos. 
      • Visualmente todas las barras se estan tocando, y no hay espacio entre ellas
      • Las barras representan los valores del dataset que caen dentro de cada rango de valores
    • Gráficos de Barras:
      • Son usados para agrupar datos basados en categorías. 
      • Visualmente estan esparcidas las barras
      • Cada barra representa cuántos de los datos caen dentro de ciertas categorías. 
Histogramas Parte 2
  • Supongamos que tenemos un set de datos muy grande y los datos están en un rango entre 0 y 50. 
  • Aquí podríamos querer saber cuantos datos caen o están entre 0 y 5, 6 y 10, 11 y 15, etc.
  • A este agrupamiento lo llamamos bins (o ubicaciones en español). 
  • Todos los bins en un histograma serán del mismo tamaño.
  • El ancho (width) de cada bin es la distancia entre max y min de cada bin. En nuestro ej, seria 5
  • Hay un ancho ideal de bin para los histogramas?
    • No existe un ancho que sirva para todos los problemas. 
    • Es totalmente independiente a la cantidad de datos y al rango que existe entre ellos
    • Lo ideal es que tenga una significativa representación de los datos
    • Escoger valores muy bajos o muy altos podría dificultar la tarea de analizar y entender los datos.

“Statistical Distribution with NumPy - Part 2”
– Daniel Morales twitter social icon Tweet

Share this article:

0 Comments

Post a comment
Log In to Comment
divider graphic

Related Screencasts

May 29, 2020
140

Complete Project with Numpy

Este proyecto abarca los diferentes temas vistos con Numpy

Daniel Morales
By Daniel Morales
May 28, 2020
91

Binomial Distribution and Exercise with NumPy

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
May 27, 2020
66

Statistical Distribution and Exercise with NumPy - Part 4

Para ver este video debes estar inscrito, asi que inscribete y sigue aprendiendo! Si ya estas inscrito, dale play al video y sigue aprendiendo!

Daniel Morales
By Daniel Morales
arrow-up icon