Ir al contenido principal

Tutorial: Introducción a PyTorch - Primeros Pasos en Deep Learning

 


Muy interesado en este mundo de todo lo relacionado con inteligencia artificial hoy quiero que aprendamos juntos a utilizar PyTorch, una de las librerías más populares para Deep Learning, con ejemplos prácticos. En este tutorial iremos (porque yo también estoy aprendiendo) paso a paso para comenzar con PyTorch y construir nuestros primeros modelos de redes neuronales.  Bienvenido (a)!.

El Deep Learning es una rama fascinante de la inteligencia artificial que ha logrado resultados impresionantes en una variedad de problemas complejos. En este tutorial, aprenderás a utilizar PyTorch, una potente librería de Python desarrollada por Facebook, para construir y entrenar modelos de deep learning desde cero.

¿Qué es PyTorch?

PyTorch es una librería de Python para computación en Deep Learning que permite tanto entrenar modelos como usarlos para inferencia. Es conocida por su flexibilidad y facilidad de uso, lo que la convierte en una excelente opción tanto para investigadores como para desarrolladores.

Instalación de PyTorch

Para comenzar a utilizar PyTorch, primero necesitas instalarlo en tu entorno de trabajo. A continuación, te mostramos cómo hacerlo utilizando pip.

pip install torch torchvision

Asegúrate de tener un entorno de Python configurado antes de ejecutar este comando.

Primeros Pasos con PyTorch

Veamos un pequeño ejemplo para familiarizarnos con la sintaxis básica de PyTorch.

import torch
# Declarar dos escalares de punto flotante simbólicos a = torch.tensor(1.5) b = torch.tensor(2.5) # Crear una expresión simbólica simple usando la función add c = torch.add(a, b) print(c)

Este código crea dos tensores y realiza una suma entre ellos. La salida esperada es 4.0.

Verificar la Instalación

Para asegurarte de que PyTorch está correctamente instalado, puedes verificar la versión de la librería con el siguiente código:

import torch
print(torch.__version__)

Construir tu Primer Modelo de Red Neuronal

Vamos a construir un modelo simple de red neuronal llamado Perceptrón Multicapa (MLP). Este tipo de red es ideal para tareas de clasificación binaria.

Paso 1: Definir el Modelo

import torch.nn as nn
model = nn.Sequential( nn.Linear(8, 12), nn.ReLU(), nn.Linear(12, 8), nn.ReLU(), nn.Linear(8, 1), nn.Sigmoid() ) print(model)

Este modelo tiene tres capas totalmente conectadas. Usamos la función de activación ReLU entre las capas y una función Sigmoid en la salida para que el resultado esté entre 0 y 1.

Paso 2: Cargar y Preparar los Datos

Utilizaremos el dataset de Pima Indians Diabetes para entrenar nuestro modelo. Descarga el dataset desde aquí.

import numpy as np
dataset = np.loadtxt('pima-indians-diabetes.data.csv', delimiter=',') X = dataset[:, 0:8] y = dataset[:, 8] X = torch.tensor(X, dtype=torch.float32) y = torch.tensor(y, dtype=torch.float32)

Paso 3: Definir la Función de Pérdida y el Optimizador

Para entrenar el modelo, necesitamos definir una función de pérdida y un optimizador. Usaremos la entropía cruzada binaria como función de pérdida y Adam como optimizador.

import torch.optim as optim
criterion = nn.BCELoss() optimizer = optim.Adam(model.parameters(), lr=0.01)

Paso 4: Entrenar el Modelo

Entrenaremos el modelo durante varias épocas, ajustando los pesos para minimizar la función de pérdida.

# Entrenar el modelo
num_epochs = 100 for epoch in range(num_epochs): # Forward pass outputs = model(X) loss = criterion(outputs.squeeze(), y) # Backward pass y optimización optimizer.zero_grad() loss.backward() optimizer.step() if (epoch+1) % 10 == 0: print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

Conclusión

En este tutorial, hemos aprendido a instalar PyTorch, construir un modelo simple de red neuronal y entrenarlo utilizando un dataset de ejemplo. PyTorch es una herramienta poderosa y flexible que te permitirá desarrollar modelos de Deep Learning de manera eficiente.  Nos vemos luego con más de PyTorch.

Comentarios

Entradas populares de este blog

Lenguajes de programación más conocidos en la historia de la computación

Los primeros lenguajes de programación eran difíciles de construir ya que éstos debían ser "desarrollados" a un nivel que la máquina entendiera directamente, es decir, la programación de computadoras de esta época dependía mucho de la máquina para la que se estaba trabajando y detectar un error o fallo en la programación no solo era complejo sino que demandaba mucho tiempo y esfuerzo. En 1946 Grace Murray Hopper, científica en sistemas y oficial de la marina estadounidense creo el FLOW-MATIC, considerado el primer lenguaje de programación útil para resolver problemas de usuarios comerciales.  Su desarrollo fue enfocado a la UNIVAC 1.  Este lenguaje de programación fue visto como de "alto nivel", fácil de usar por los científicos de la época.  FLOW-MATIC requería de un traductor (compilador) para ser interpretado por la máquina.   Con este lenguaje de programación se establece el concepto de programación basado en palabras del lenguaje natural y se da inicio al d

Enviar archivos por sftp con Python

Esta es una breve modificación a uno de los scripts creados con anterioridad y que consiste en enviar un archivo por  sftp.   La necesidad en concreto consistía en comparar ambos servidores local y remoto y validar qué archivo faltaba en el remoto que estuviera en el local para proceder a enviarlo y mantener el remoto actualizado. Este script se guarda con el nombre que quieras, le das permiso de ejecución y lo agregas en un crontab. import pysftp import os # Cambiar por la ruta donde se generan los archivos (Amsterdam) servidor_local = os.listdir(r'C:\proyecto\archivos') #print servidor_local # Cambiar por una ruta en Amsterdam, puede ser /tmp/res os.remove(r"c:\proyecto\res\archivos.txt") for archivos in servidor_local: # Cambiar por '/tmp/res/archivos.txt','a' local = open(r"c:\proyecto\res\archivos.txt",'a') print 'Archivo local: '+archivos local.write(str(archivos)+'\n')

Extraer logs de un rango de hora

Seguramente en sus trabajos se habrán visto en la necesidad de extraer logs en un rango dado de hora; es decir, desde las xx hasta las yy. Este proceso se puede hacer en linux utilizando varios comando como el grep, head, cut, etc. que combinados nos mostrarán lo que andamos buscando. Como en mi trabajo actual es bastante común esta actividad me he dado a la tarea de crear un script bash para ello. Este es el código fuente que obviamente pueden mejor y/o adaptar a sus necesidades: #!/bin/bash ## Rango v.1.0 ## Genera un log con un rango de hora ingresado ## Autor: Manuel Gonzalez ## http://maengora.blogspot.com # Forma de usar el script echo "Con bash: ./rango.sh " # Solicito la hora inicial y la almaceno en la variable HORA_INICIAL echo -n "Hora incial hh:mm " read HORA_INICIAL # Solicito hora final echo -n "Hora final hh:mm " read HORA_FINAL # Solicito el nombre del log de donde voy a extraer la informacion echo -n "Nombre del log a analizar &qu