Deep Learning En La Nube. ¿Cómo Empezar Con Google Colab y Por Qué?

Contents Outline

Deep Learning En La Nube. ¿Cómo Empezar Con Google Colab y Por Qué?

May 07, 2020 6 minutes read

Un recorrido por cómo empezar con Google Colab...

Introducción

En este artículo, les presentaré el Google Colab que es una herramienta similar al Jupyter notebook que permite ejecutar el código en la nube. Te guiaré a través de ella:


¿Qué es Google Colab y por qué deberías empezar a usarlo?


¿Cómo instalar Google Colab?


Escribiendo tu primera función en Google Colab.


Cargando el archivo de datos en Google Colab.


Cómo encender la GPU y la TPU en Google Colab y cómo utilizarlo para deep learning.

Imagen por FelixMittermeier de Pixabay



Después de leer este artículo, deberías estar listo para empezar a usar Google Colab para tus proyectos de Data Science, aprovechar la posibilidad de ejecutar tu código en la nube, y usar el GPU /TPU gratuito que ofrece esta herramienta.

¡Comencemos!


¿Qué es Google Colab y por qué deberías empezar a usarlo?


Fácil colaboración

Como su nombre lo sugiere, Google Colab es una herramienta que fue lanzada por Google y, de manera similar a otros productos de Google, está disponible en la nube y permite la edición colaborativa. Esto significa que puedes compartir fácilmente el notebook con otras personas, permitirles ver el código o convertirlos en colaboradores.


Bibliotecas preinstaladas de Data Science

Google Colab te permite escribir y ejecutar código Python interactivamente de la misma manera que lo hace Jupyter Notebook. Además, viene con la mayoría de las librerías de Data Science preinstaladas, lo que lo convierte en la herramienta ideal para los principiantes que quieran iniciarse en los proyectos de Machine Leaning de inmediato. Bibliotecas como pandas, numpy, Tensorflow, Keras, OpenCV ya están instaladas por lo que no hay necesidad de ejecutar "pip install" y luchar con la instalación del entorno local.


GPU / TPU gratis

Además, ofrece GPU /TPU gratis! Esto significa que el entrenamiento de las redes neuronales será más rápido y podrá ser accedido por personas que no tienen máquinas muy poderosas. Incluso si tienes una máquina poderosa, Google Colab te permitirá liberar tu máquina del trabajo pesado y delegar en una nube.


¿Cómo instalar Google Colab?

Para empezar con Google Colab sigue estos simples pasos.

1. Navegue hasta su página de drive de Google.

2. Mientras se encuentra en Google Drive, haga clic en el botón '+ Nuevo'.



3. En el menú desplegable "+ Nuevo" selecciona "Más", y en el menú desplegable adicional selecciona "+ Conectar más aplicaciones".



4. Ahora deberías poder ver una ventana con el Marketplace de la Suite G. Escriba “Colaboratory” en el cuadro de búsqueda y pulse Enter para confirmar la selección.



5. Ahora deberías poder ver el programa Google Colab como una posible selección.



6. Ahora selecciona "Colaboratory" haciendo clic en su icono y se te mostrará el botón de instalación. Siga las instrucciones de instalación que aparecen en la pantalla y podrá utilizar Google Colab justo después.



Escribiendo su primera función en Google Colab

Una vez que haya instalado Google Colab, aparecerá en su menú desplegable al seleccionar el botón '+ Nuevo' de Google Drive.



Al hacer clic en 'Google Colaboratory' el sistema abrirá un archivo de Google Colab en una nueva ventana. Ahora puedes empezar a usar el archivo como un Jupyter notebook normal. Puedes probarlo con una simple función de " hola mundo".



Una vez probada, puedes empezar a usarla de la misma manera que el Jupyter notebook al que estás acostumbrado. Puedes importar bibliotecas usando importaciones normales, ejecutar código Python, y añadir marcas con texto como si fuera un archivo normal de un Jupyter notebook.

Ahora te mostraré cómo conseguir un archivo de datos cargado en Google Colab ya que es ligeramente diferente al que estás acostumbrado con Jupyter Notebook.


Cargando el archivo de datos en Google Colab

Hay dos opciones para cargar un archivo de Google Colab. Puede cargarlo desde su sistema de archivos local o añadir archivos al disco de Google y conectar Google Colab para utilizar los archivos almacenados en el disco. Le sugiero que haga lo último.

Para conectar Google Drive con Colab ejecute este código en uno de los archivos de Colab.


from google.colab import drive
drive.mount('/content/drive')



Se le mostrará el enlace donde se le pedirá que permita el acceso a Google Drive File Stream.




Haga clic en el botón "Permitir" y entonces se le dará el código de autorización. Use este código y péguelo en el archivo de Google Colab donde ha estado montando el disco. Tomará un tiempo y su unidad de Google debería estar lista para ser usada. Deberías poder ver el mensaje "Mounted at /content/drive".



Ahora puedes empezar a usar los archivos de tu cuaderno de Google Colab desde tu Drive. Veamos un ejemplo. Tengo un archivo llamado " numbers" en mi disco duro de Google. Puedo cargarlo en un dataframe de pandas usando el siguiente código.

import pandas as pd
df = pd.read_csv('/content/drive/My Drive/numbers.csv')


Para acceder a cualquier archivo de Google Drive sólo tienes que usar '/content/drive/My Drive/' + nombre de archivo como ruta.


Cómo encender la GPU / TPU y utilizarla para deep learning

Terminemos este tutorial con lo que creo que es la mayor ventaja de la herramienta del Colaborador de Google: el uso de la GPU o TPU libre. Además, esto no podría ser más simple que usar otro menú desplegable.

Navega hasta "Entorno de ejecución" y selecciona "Cambiar el tipo de entorno de ejecución".



Ahora se le mostrará una ventana donde tendrá tres opciones: Ninguna, TPU y GPU. Selecciona la que te gustaría usar para tu entrenamiento de red neuronal.



Una vez que hayas seleccionado la opción, sólo tienes que ejecutar tu código Keras o Tensorflow como de costumbre. Si tu RNA (Red Neuronal Artificial) y el conjunto de datos son lo suficientemente grandes, deberías ver una disminución significativa en cada ciclo de entrenamiento mientras usas la GPU o la TPU.


Resumen

Ya puede empezar a usar Google Colab para sus proyectos de Data Science. Espero que disfruten de sus capacidades y aprovechen su naturaleza colaborativa y su GPU gratuita. Si está buscando algunas ideas de proyectos, revise los recursos de datos que he enumerado en este artículo:

Join our private community in Discord

Keep up to date by participating in our global community of data scientists and AI enthusiasts. We discuss the latest developments in data science competitions, new techniques for solving complex challenges, AI and machine learning models, and much more!