Modelo estrella en SQL Server 2019 con proceso ETL en SSIS. Analisis OLAP de la deforestacion en Colombia desde multiples dimensiones.
Los filtros se cargan desde las tablas de dimension en SQL Server
Implementado en SQL Server 2019 · 1 tabla de hechos · 4 dimensiones
Extraccion, Transformacion y Carga implementado en SQL Server Integration Services · Visual Studio 2019
deforestacion_colombia_2001_2024.csv.
El Multicast distribuye el flujo de 768 filas
hacia los 4 Lookup de dimensiones en paralelo.
FACT_DEFORESTACION
de la base de datos DW_Deforestacion en SQL Server.
Solo las Filas_Validas del Conditional Split
llegan a este destino.
La implementacion del esquema estrella en SQL Server 2019 permitio organizar los datos del IDEAM en una estructura optimizada para el analisis multidimensional. La separacion entre la tabla de hechos y las dimensiones facilita consultas OLAP eficientes que habrian requerido joins complejos en una BD transaccional tradicional.
El proceso ETL con SSIS demostro la importancia de la transformacion de datos antes de la carga. El componente Conditional Split permitio identificar y separar registros con inconsistencias, garantizando que solo datos validos llegaran a FACT_DEFORESTACION. El error en LKP_DEPARTAMENTO evidencio la necesidad de alinear los codigos DANE entre el CSV fuente y la dimension.
El modelo permite analizar la deforestacion desde cuatro perspectivas simultaneas: temporal (cuando ocurrio), geografica (donde ocurrio), causal (por que ocurrio) y regional (en que ecosistema). Esta capacidad de "slice and dice" es imposible de lograr con un simple archivo CSV y es la principal ventaja del modelo multidimensional.
La conexion entre Python (Flask + pyodbc) y SQL Server permitio llevar los beneficios del Data Warehouse directamente a una interfaz web accesible. Los filtros se cargan dinamicamente desde las dimensiones, garantizando que las opciones siempre reflejen los datos reales del DW sin necesidad de actualizar el codigo de la aplicacion.