Los mejores articulos y screencasts de data science y machine learning. Creados por data scientists para data scientists (y para gente de negocios).
En este artículo, vamos a explorar algunos métodos de pandas menos conocidos pero muy útiles para manipular objetos de tipo Series. Algunos de estos métodos están relacionados sólo con Series, los otros - tanto con Series como con DataFrames, teni...
Los datos de series temporales consisten en puntos de datos unidos a marcas de tiempo secuenciales. Las ventas diarias, los valores de temperatura por hora y las mediciones de segundo nivel en un proceso químico son algunos ejemplos de datos de se...
Otra biblioteca de Python para el análisis de datos que deberías conocer - y no, no estoy hablando de Spark o DaskEl análisis de Big Data en Python está teniendo su renacimiento. Todo comenzó con NumPy, que es también uno de los bloques de constru...
Los datos de la vida real suelen ser desordenados. Requieren mucho preprocesamiento para estar listos para su uso. Pandas es una de las librerías de análisis y manipulación de datos más utilizadas y ofrece varias funciones para preprocesar los dat...
Una inmersión en los beneficios de cada herramientaTabla de ContenidoIntroducciónPandasSQLResumenIntroducciónAmbas herramientas son importantes no sólo para los científicos de datos, sino también para los que ocupan puestos similares como los de a...
Las finanzas y la economía son cada vez más interesantes para todo tipo de personas, independientemente de su carrera o profesión. Esto se debe a que a todos nos afectan los datos económicos, o al menos nos interesa cada vez más estar al día, y te...
Pandas Profiling es una librería que genera informes desde un DataFrame de pandas. La función pandas df.describe() que usamos normalmente en Pandas es genial pero es un poco básica para un análisis exploratorio de datos más serio y detallado. pand...
Como ya es costumbre, nos hemos dado a la tarea de entrevistar a los ganadores de la competencia Prediciendo El Rating De Las Aplicaciones En Google Play Store que finalizó hace apenas unos dias, teniendo como ganador a Edimer "Siderus" de Colombi...
Crearemos un proyecto completo tratando de predecir los gastos de los clientes mediante una regresión lineal con Python. En este ejercicio, tenemos algunos datos históricos de transacciones de 2010 y 2011. Para cada transacción, tenemos un identif...
Como sabemos existen diversas formas de almacenar nuestros datos. Normalmente, podemos leer y extraer información de manera sencilla por medio de archivos txt.csv entre muchos otros. Sin embargo, también podemos extraer información de la nube de ...