Modulo 2 · Metodologia SEMMA — Fase: Modify

Conocimiento
Multidimensional

Modelo estrella en SQL Server 2019 con proceso ETL en SSIS. Analisis OLAP de la deforestacion en Colombia desde multiples dimensiones.

Esquema Estrella

1
Tabla hechos
4
Dimensiones
768
Registros
01 · Consulta OLAP

Explorar el Data Warehouse

Los filtros se cargan desde las tablas de dimension en SQL Server

Filtros de consulta Datos cargados desde DIM_TIEMPO · DIM_REGION · DIM_DEPARTAMENTO · DIM_CAUSA
Limpiar filtros
02 · Modelo

Esquema Estrella — DW_Deforestacion

Implementado en SQL Server 2019 · 1 tabla de hechos · 4 dimensiones

FK id_tiempo FK id_departamento FK id_causa FK id_region FACT_DEFORESTACION Tabla de Hechos · Metricas cuantitativas 🔑 id_hecho BIGINT IDENTITY 🔗 id_tiempo INT FK 🔗 id_departamento INT FK 🔗 id_causa INT FK 🔗 id_region INT FK 📊 area_deforestada_ha FLOAT 📊 emisiones_co2_ton FLOAT DIM_TIEMPO Dimension temporal 🔑 id_tiempo INT PK año SMALLINT trimestre TINYINT semestre TINYINT decada CHAR(9) DIM_DEPARTAMENTO Dimension geografica 🔑 id_departamento INT PK nombre_dpto VARCHAR(80) codigo_dane CHAR(2) capital VARCHAR(80) area_total_km2 DEC(10,2) latitud_centroide DEC(9,6) longitud_centroide DEC(9,6) DIM_CAUSA Dimension de causas 🔑 id_causa INT PK nombre VARCHAR(100) categoria VARCHAR(60) tipo_agente VARCHAR(60) descripcion VARCHAR(255) DIM_REGION Dimension regional 🔑 id_region INT PK nombre VARCHAR(50) area_ha DECIMAL(14,2) pct_bosque DECIMAL(5,2)
03 · ETL

Proceso ETL con SSIS

Extraccion, Transformacion y Carga implementado en SQL Server Integration Services · Visual Studio 2019

Package.dtsx — Flujo de datos en SSIS · Visual Studio 2019
Proceso ETL en SSIS - SQL Server Integration Services
Componentes del flujo de datos
E
Extraccion — Flat File Source
El componente Flat File Source lee el archivo deforestacion_colombia_2001_2024.csv. El Multicast distribuye el flujo de 768 filas hacia los 4 Lookup de dimensiones en paralelo.
T
Transformacion — Lookup de dimensiones
Los componentes LKP_TIEMPO, LKP_DEPARTAMENTO, LKP_CAUSA y LKP_REGION buscan las claves surrogadas (id) correspondientes a cada valor del CSV en las tablas de dimension. El Conditional Split separa filas validas de registros con datos faltantes o inconsistentes.
C
Carga — OLE DB Destination
El componente OLE DB Destination inserta las filas validadas en FACT_DEFORESTACION de la base de datos DW_Deforestacion en SQL Server. Solo las Filas_Validas del Conditional Split llegan a este destino.
04 · Conclusiones

Conclusiones del Modulo 2

01
Modelo estrella como base analitica

La implementacion del esquema estrella en SQL Server 2019 permitio organizar los datos del IDEAM en una estructura optimizada para el analisis multidimensional. La separacion entre la tabla de hechos y las dimensiones facilita consultas OLAP eficientes que habrian requerido joins complejos en una BD transaccional tradicional.

02
ETL como garantia de calidad de datos

El proceso ETL con SSIS demostro la importancia de la transformacion de datos antes de la carga. El componente Conditional Split permitio identificar y separar registros con inconsistencias, garantizando que solo datos validos llegaran a FACT_DEFORESTACION. El error en LKP_DEPARTAMENTO evidencio la necesidad de alinear los codigos DANE entre el CSV fuente y la dimension.

03
Perspectiva multidimensional del problema

El modelo permite analizar la deforestacion desde cuatro perspectivas simultaneas: temporal (cuando ocurrio), geografica (donde ocurrio), causal (por que ocurrio) y regional (en que ecosistema). Esta capacidad de "slice and dice" es imposible de lograr con un simple archivo CSV y es la principal ventaja del modelo multidimensional.

04
Integracion con la aplicacion Flask

La conexion entre Python (Flask + pyodbc) y SQL Server permitio llevar los beneficios del Data Warehouse directamente a una interfaz web accesible. Los filtros se cargan dinamicamente desde las dimensiones, garantizando que las opciones siempre reflejen los datos reales del DW sin necesidad de actualizar el codigo de la aplicacion.