Introducción a Google Colab. ¿Qué es? ¿cómo se usa?

Imagen de portada para el articulo Introducción a Google Colab, hay una captura de pantalla del software y su logo
Introducción a Google Colab

¿Qué es y por qué se usa Google Colab?

Google Colaboratory, comúnmente conocido como "Google Colab", es un servicio gratuito en la nube proporcionado por Google. Permite a los usuarios escribir y ejecutar código Python a través del navegador, sin necesidad de ninguna configuración previa. Es particularmente popular para ciencia de datos y machine learning, por varias razones:

  • No requiere configuración: Puedes escribir y ejecutar un script de Python sin preocuparte por instalar Python o cualquier biblioteca en tu sistema.
  • Colaboración y Compartir: Al igual que Google Docs, Google Colab te permite compartir tus cuadernos y colaborar con otros en tiempo real.
  • Acceso gratuito a GPU: Google Colab ofrece acceso gratuito a GPU, lo cual puede ser extremadamente útil para entrenar modelos de aprendizaje automático, que a menudo requieren una alta capacidad computacional.
  • Entorno de Codificación Interactivo: Google Colab proporciona un entorno de codificación interactivo, similar a Jupyter Notebook, donde puedes escribir código y ver la salida, escribir texto en markdown para documentación y visualizar datos.
  • Control de versiones: Al igual que otros documentos de Google Drive, Google Colab te permite tener control de versiones
💡
Si estás aprendiendo a programar o estás interesado en hacerlo, te recomendamos nuestra serie de publicaciones Aprende a programar.

Google Colab se debe activar en tu cuenta Google. Si tienes dudas como hacerlo, revisa este post.

¿Cómo instalo o activo Google Colab?
Si estás pensando en aprender a programar, Google Colab debe estar en tu radar. En este artículo te contamos como instalarlo y porque es tan popular. Google Colab (o Colaboratory) es un servicio gratuito proporcionado por Google que te permite ejecutar código en Python directamente desde tu navega…

Archivo

Hemos preparado un Google Colab para acompañar este artículo. Puedes revisarlo aquí

Tipos de Celdas

Cada cuaderno o notebook de Google Colab se basa en Celdas, en las cuales puedes colocar código o texto

Celdas de código

Tienen un fondo gris, tiene botón de play al lado, el cual ejecuta el código. Luce así

Celdas de texto

Cuando la editas puedes ir viendo como quedando al costado derecho
Acepta lenguaje Markdown. Puedes ver una muestra de esto en la siguiente imagen

Si se te olvida algo, puedes ver la barra de arriba donde tienes atajos para los comandos de encabezados, negritas, enlaces, entre otros.

Lo único que no suelo encontrar ahí es el tema de las tablas. Que se hace asi:

| Encabezado A | Encabezado B |
| --- | --- |
| Dato A | Dato B |

Comparación entre Jupyter Notebook y Google Colab

  • Entorno Local vs. Nube: Jupyter Notebook es un entorno local que necesita ser configurado en tu propio sistema, mientras que Google Colab es un entorno basado en la nube accesible a través de un navegador web.
  • Acceso a GPU y TPU: Google Colab proporciona acceso gratuito a GPUs y TPUs, lo cual no está inherentemente disponible con Jupyter Notebook.
  • Gestión de Paquetes y Bibliotecas: Jupyter Notebook requiere que gestiones tus propios paquetes y bibliotecas, mientras que Google Colab viene pre-cargado con muchas bibliotecas populares utilizadas en ciencia de datos y aprendizaje automático.
  • Colaboración y Compartir: Google Colab permite la colaboración en tiempo real y compartir fácilmente, similar a Google Docs, mientras que la colaboración en Jupyter Notebook puede ser más complicada y generalmente requiere herramientas adicionales como GitHub.

Colab genera una instancia temporal

  • Colab es una instancia temporal. Si generas información o archivos, deberás exportarlos de algún modo pues no se va a guardar

Funciones útiles para esto:

  • gdown
  • files.upload()
!gdown https://drive.google.com/uc?id=TU_ID_DEL_ARCHIVO
from google.colab import files
uploaded = files.upload()
# Si usas pandas
import pandas as pd

# Leer CSV
df = pd.read_csv('/content/mi_archivo.csv')

# Guardar CSV
df.to_csv('/content/mi_archivo_guardado.csv', index=False)

Visualizaciones y otras librerías de python

Colab te permite importar librerías conocidas de python como numpy, pandas, matplotlib, entre otros y ademas generar visualizaciones dentro del cuaderno. A continuacion un ejemplo

# Primero, vamos a importar las bibliotecas necesarias
import matplotlib.pyplot as plt
import numpy as np

# Generar algunos datos
x = np.linspace(0, 10, 100)  # 100 puntos entre 0 y 10
y = np.sin(x)                # Seno de esos puntos

# Crear la visualización
plt.figure(figsize=(5,3))   # Tamaño de la figura
plt.plot(x, y, label='Función seno', color='blue')
plt.title('Visualización Simple con Matplotlib en Google Colab')
plt.xlabel('Eje X')
plt.ylabel('Eje Y')
plt.legend()                 # Mostrar leyenda
plt.grid(True)               # Mostrar rejilla
plt.show()

Va a generar esta visualizacion

También puedes usarlo con R

A pesar de que es generalmente usado con Python, es posible usarlo con R. Para eso debes ir a Edit > Notebook settings

Cuidado con este error frecuente

# Si eres novato en python puede ser que te ocurra algo como esto

print = "hola mundo"

Si querías imprimir "hola mundo", este código está mal. Pero no solo eso, si no que va a topar con un nombre protegido. De modo tal que vas a generar un error cuando intentes correr el código bueno.

print("hola mundo")

Te va a dar un error similar a este

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-2-b193fdea2b99> in <cell line: 1>()
----> 1 print("hola mundo")

TypeError: 'str' object is not callable

Para solucionarlo, deberás ir a Runtime > Restart runtime. Esto reinicia la maquina, eliminando toda la información en la memoria de la maquina. Ahora corre el código bueno y debería funcionar.

¿Quieres aprender a programar?

Revisa nuestras guías para comenzar a programar en Python aquí:

Aprende a programar en Python desde cero con Google Colab - parte 1. Variables y operaciones
¡Bienvenido al mundo de la programación en Python! Python es un lenguaje de programación versátil y poderoso con una amplia variedad de usos, desde el desarrollo web hasta el análisis de datos y el aprendizaje automático. Si nunca has programado antes, Python es un excelente lugar para comenzar. Su sintaxis
Aprende a programar en Python desde cero con Google Colab - parte 2. Funciones, print, input
En esta artículo revisaremos qué son las funciones y en particular entraremos en dos de las funciones más utilizadas en mayor detalle: input y print Revisa todas las partes en nuestra categoría Aprende a programar. Video Ve este contenido en formato video, con ejercicios incluidos aquí: Archivos Encuentra aquí el
Aprende a programar en Python desde cero con Google Colab - parte 3. Condicionales y ciclos
En este artículo revisaremos qué son los condicionales y los ciclos. En particular veremos como abordar que sucede cuando necesitamos que se ejecute un código dependiendo de una condición con if, y como abordar aquellas situaciones donde necesitamos que se ejecute mucho código pero de modo similar con los ciclos
Aprende a programar en Python desde cero con Google Colab - parte 4. Estructuras de datos
En este artículo revisaremos qué cuales son los diversos tipos de datos que podemos manipular en python, cuáles son sus características, ventajas y desventajas. En particular hablaremos de las listas, sets, diccionarios y tuplas. Revisa todas las partes en nuestra categoría Aprende a programar. Archivos Encuentra aquí el Google Colab