Ir al contenido principal

Descubre el Poder de las Common Table Expressions (CTE) en SQL

 


En el mundo del análisis de datos y la gestión de bases de datos, SQL (Structured Query Language) sigue siendo una herramienta indispensable. Hoy, queremos compartir un truco impresionante que elevará tus habilidades en SQL: el uso de las Common Table Expressions (CTE). Este método no solo te permitirá simplificar consultas complejas, sino que también hará que tus datos sean más manejables y comprensibles.

¿Qué es una Common Table Expression (CTE)?

Una CTE, o Common Table Expression, es una función en SQL que permite definir una consulta temporal cuyo resultado puede ser referenciado dentro de la misma consulta. Las CTE se utilizan principalmente para mejorar la legibilidad y organización de las consultas SQL, especialmente cuando se trabaja con consultas recursivas o muy complejas.

Beneficios de Usar CTE

  1. Claridad y Organización: Las CTE hacen que las consultas largas y complicadas sean más legibles y fáciles de entender.
  2. Reutilización de Código: Puedes definir una CTE una vez y referenciarla múltiples veces en tu consulta principal.
  3. Facilidad en Consultas Recursivas: Las CTE son ideales para manejar estructuras de datos jerárquicas, como árboles genealógicos o organigramas.

Ejemplo Práctico: Encontrar la Jerarquía de Empleados

Imagina que tienes una tabla de empleados en tu empresa y quieres listar todos los empleados junto con su jerarquía. Aquí es donde una CTE recursiva brilla.

Estructura de la Tabla employees

CREATE TABLE employees ( employee_id INT PRIMARY KEY, employee_name VARCHAR(100), manager_id INT );

Datos de Ejemplo

INSERT INTO employees (employee_id, employee_name, manager_id) VALUES (1, 'CEO', NULL), (2, 'CTO', 1), (3, 'CFO', 1), (4, 'Engineer', 2), (5, 'Accountant', 3);

Consulta con WITH

WITH RECURSIVE EmployeeHierarchy AS ( SELECT employee_id, employee_name, manager_id, employee_name AS hierarchy FROM employees WHERE manager_id IS NULL UNION ALL SELECT e.employee_id, e.employee_name, e.manager_id, CONCAT(eh.hierarchy, ' -> ', e.employee_name) FROM employees e INNER JOIN EmployeeHierarchy eh ON e.manager_id = eh.employee_id ) SELECT * FROM EmployeeHierarchy;

Explicación del Código

  1. Definición del CTE:

    • La primera parte del WITH selecciona el nodo raíz de la jerarquía, en este caso, el CEO.
    • La segunda parte del WITH se une recursivamente con el CTE para construir la jerarquía completa.
  2. Consulta Principal:

    • Selecciona todos los datos generados por el CTE.

Resultados Esperados

employee_id | employee_name | manager_id | hierarchy ------------|---------------|------------|----------------------- 1 | CEO | NULL | CEO 2 | CTO | 1 | CEO -> CTO 3 | CFO | 1 | CEO -> CFO 4 | Engineer | 2 | CEO -> CTO -> Engineer 5 | Accountant | 3 | CEO -> CFO -> Accountant

Comentarios

Entradas populares de este blog

Lenguajes de programación más conocidos en la historia de la computación

Los primeros lenguajes de programación eran difíciles de construir ya que éstos debían ser "desarrollados" a un nivel que la máquina entendiera directamente, es decir, la programación de computadoras de esta época dependía mucho de la máquina para la que se estaba trabajando y detectar un error o fallo en la programación no solo era complejo sino que demandaba mucho tiempo y esfuerzo. En 1946 Grace Murray Hopper, científica en sistemas y oficial de la marina estadounidense creo el FLOW-MATIC, considerado el primer lenguaje de programación útil para resolver problemas de usuarios comerciales.  Su desarrollo fue enfocado a la UNIVAC 1.  Este lenguaje de programación fue visto como de "alto nivel", fácil de usar por los científicos de la época.  FLOW-MATIC requería de un traductor (compilador) para ser interpretado por la máquina.   Con este lenguaje de programación se establece el concepto de programación basado en palabras del lenguaje natural y se da inicio al d

Enviar archivos por sftp con Python

Esta es una breve modificación a uno de los scripts creados con anterioridad y que consiste en enviar un archivo por  sftp.   La necesidad en concreto consistía en comparar ambos servidores local y remoto y validar qué archivo faltaba en el remoto que estuviera en el local para proceder a enviarlo y mantener el remoto actualizado. Este script se guarda con el nombre que quieras, le das permiso de ejecución y lo agregas en un crontab. import pysftp import os # Cambiar por la ruta donde se generan los archivos (Amsterdam) servidor_local = os.listdir(r'C:\proyecto\archivos') #print servidor_local # Cambiar por una ruta en Amsterdam, puede ser /tmp/res os.remove(r"c:\proyecto\res\archivos.txt") for archivos in servidor_local: # Cambiar por '/tmp/res/archivos.txt','a' local = open(r"c:\proyecto\res\archivos.txt",'a') print 'Archivo local: '+archivos local.write(str(archivos)+'\n')

Extraer logs de un rango de hora

Seguramente en sus trabajos se habrán visto en la necesidad de extraer logs en un rango dado de hora; es decir, desde las xx hasta las yy. Este proceso se puede hacer en linux utilizando varios comando como el grep, head, cut, etc. que combinados nos mostrarán lo que andamos buscando. Como en mi trabajo actual es bastante común esta actividad me he dado a la tarea de crear un script bash para ello. Este es el código fuente que obviamente pueden mejor y/o adaptar a sus necesidades: #!/bin/bash ## Rango v.1.0 ## Genera un log con un rango de hora ingresado ## Autor: Manuel Gonzalez ## http://maengora.blogspot.com # Forma de usar el script echo "Con bash: ./rango.sh " # Solicito la hora inicial y la almaceno en la variable HORA_INICIAL echo -n "Hora incial hh:mm " read HORA_INICIAL # Solicito hora final echo -n "Hora final hh:mm " read HORA_FINAL # Solicito el nombre del log de donde voy a extraer la informacion echo -n "Nombre del log a analizar &qu