Procesamiento de Datos
Esta sección documenta los componentes y procesos de transformación, enriquecimiento y procesamiento de datos en la arquitectura de Solvento.
Overview
El procesamiento de datos incluye todas las transformaciones, validaciones, enriquecimientos y cálculos que se aplican a los datos desde su ingesta hasta su almacenamiento final.
Componentes de Procesamiento
dbt ETLs - Transformaciones a Adv-Analytics
Proyecto dbt (dbt-etls) que transforma datos desde solvento-data-prod hacia solvento-adv-analytics-prod.
- Lee datos raw de Syntage, Catalog, Analíticas
- Transforma a capas silver/gold
- Escribe a schemas:
consistency_jobs,terminal, etc. - Incluye modelos de consistencia
Dataform - Transformaciones Complementarias
Transformaciones adicionales hacia solvento-adv-analytics-prod trabajando junto con dbt.
dbt Risk Analytics
Proyecto dbt dedicado a análisis de riesgo que transforma datos hacia solvento-risk-analytics-prod.
- Lee de
solvento-data-prod(raw) ysolvento-adv-analytics-prod(depurado) - Genera data products especializados de riesgo
- Arquitectura medallion (staging → intermediate → marts → data products)
Validación y Calidad
Validación de datos y control de calidad.
Documentación en desarrollo
Agregaciones
Cálculos agregados y métricas derivadas.
Documentación en desarrollo
Enriquecimiento
Enriquecimiento de datos con fuentes externas.
Documentación en desarrollo
Flujo de Procesamiento
graph TB
subgraph fuentes["Fuentes"]
DataProd[solvento-data-prod<br/>RAW]
AdvAnalytics[solvento-adv-analytics-prod<br/>DEPURADO]
end
subgraph etl_adv["ETL a Adv-Analytics"]
DBT[dbt ETLs<br/>dbt-etls]
Dataform[Dataform]
end
subgraph dbt_risk["dbt Risk Analytics"]
Staging[Staging<br/>stg_*]
Intermediate[Intermediate<br/>int_*]
Marts[Marts<br/>fact_*/dim_*]
DataProducts[Data Products<br/>Risk]
end
subgraph destinos["Destinos"]
AdvProd[solvento-adv-analytics-prod<br/>DEPURADO]
RiskProd[solvento-risk-analytics-prod<br/>RIESGO]
end
DataProd --> DBT
DataProd --> Dataform
DBT --> AdvProd
Dataform --> AdvProd
DataProd --> Staging
AdvAnalytics --> Staging
Staging --> Intermediate
Intermediate --> Marts
Marts --> DataProducts
DataProducts --> RiskProd
Próximos Pasos
Esta sección se completará con: - Detalles de pipelines ETL específicos - Transformaciones aplicadas por tipo de dato - Reglas de validación y calidad - Procesos de enriquecimiento - Cálculos de métricas y agregaciones
Sección en desarrollo - Próximamente