En la gestión de la cadena de suministro, se requieren datos y su análisis específico para explicar los impactos significativos en la cadena de suministro. ¿Cuáles son los materiales o productos que se retrasan con frecuencia, o su comportamiento de demanda e inventario?
Sin embargo, cuando se utilizan datos de diferentes fuentes para análisis complejos, primero se deben recopilar y preparar los datos para el análisis. Para ello necesitamos datos de diferentes sistemas. En la mayoría de los casos, estos sistemas no solo están aislados entre sí, sino que también tienen diferentes sistemas de almacenamiento de datos, diferentes tipos de bases de datos, estructuras y archivos planos, y se requiere el proceso de combinar los datos en una imagen significativa.
Pero, ¿qué es exactamente la “cadena de suministro” de datos dentro de la empresa?
Preparación
La mayoría de las empresas tienen una gran cantidad de datos disponibles en varios sistemas, como ERP y CRM, y esta cantidad de datos ya es enorme debido a la creciente digitalización. Comencemos por preparar los datos.Los datos generalmente se almacenan en los llamados proceso ETLEl proceso ETL implica varios pasos separados. A través de estos pasos, puede integrar datos de varias fuentes. almacén de datos Por extracción y preparación.
Los procesos descritos se utilizan comúnmente para procesar big data en entornos de inteligencia comercial, como se requiere cada vez más en la gestión de la cadena de suministro. El acrónimo ETL representa tres términos: Extraer, Transformar y Cargar. El propósito es preparar y proporcionar datos consolidados para su posterior procesamiento. El procesamiento de grandes volúmenes de datos se beneficia especialmente de un enfoque ETL estructurado. La aplicación de un proceso ETL es útil cuando la información se distribuye en diferentes subsistemas, es redundante o tiene una estructura diferente. Durante el proceso, se fusionan y preparan datos estructurados heterogéneos de varias fuentes. La calidad de los datos está asegurada y su consistencia establecida en el almacén de datos. La importancia de los almacenes de datos en la cadena de suministro de datos se analizará más adelante en este artículo.
El proceso ETL se divide en tres fases distintas. Estas fases son:
extracto: El primer paso es extraer datos de varias fuentes de datos. Esto implica seleccionar datos en varios sistemas de origen y prepararlos para la fase de transformación. En la mayoría de los casos, el proceso extrae solo regiones parciales de cada base de datos de origen. Los extractos ocurren periódicamente para proporcionar continuamente datos actualizados a su almacén de datos. También es posible la extracción basada en eventos o en solicitudes.
Transformar: Los datos proporcionados se ajustan al formato y al esquema de la base de datos de destino. El proceso de conversión pasa por varios pasos separados. Estos pasos individuales incluyen, por ejemplo, definir aspectos básicos de formateo, limpieza de datos erróneos o verificación de datos similares y duplicados, seguido de eliminación y exclusión.
Carga: El paso final en el proceso de ETL es cargar los datos transformados en la base de datos o almacén de datos de destino. Este paso realiza la integración real en la base de datos de destino o el almacén de datos. Los datos se mueven físicamente al destino sin bloquear la base de datos durante largos períodos de tiempo mientras se carga. Todos los cambios en el sistema de destino se documentan con registros detallados.

Imagen: (C) Getty Images – vaeenma
Cada vez son más las empresas que eligen estrategia ELT (Extraer, Cargar, Transformar o Esquema al leer) realiza transformaciones durante las consultas y almacena datos estructurados y no estructurados en formato bruto. Aquí, los pasos de carga y conversión se han intercambiado. Esto se debe a que los tres pasos individuales no se realizan necesariamente en el orden indicado. El proceso ELT carga los datos en la base de datos de destino sin transformarlos primero. Todos los datos recopilados están disponibles en forma cruda. Esto crea un llamado lago de datos que consta de datos en varios formatos. La conversión se realiza en el sistema de destino utilizando procedimientos y algoritmos especiales dedicados a la evaluación realizada. Este procedimiento tiene la ventaja de que los datos pueden recopilarse primero en el sistema de destino y utilizarse para la evaluación.
almacén de datos
El almacén de datos es el punto donde todo se une y se transfieren los datos. El principal problema con la arquitectura del almacén de datos es que se necesita mucho esfuerzo para crear y operar las rutas ETL para llenar el sistema de almacén de datos. Se produce una gran cantidad de actividad y trabajo de programación en el sistema descendente cuando se realizan cambios en el sistema de origen. Sin embargo, las herramientas de automatización del almacenamiento de datos pueden crear automáticamente mercados de datos y transferir datos en vivo a la nube mediante procesos de captura de datos modificados. Esto reduce en gran medida el esfuerzo manual involucrado en la creación y mantenimiento de rutas ETL.
El análisis de datos en la gestión de la cadena de suministro suele ser muy ágil. Siempre hay nuevos requisitos y nuevas preguntas que necesitan respuestas. En el peor de los casos, tendrás que modificar tu proceso ETL o crear uno nuevo. Aquí es donde entran en juego los almacenes de datos. Nuevamente, se requiere un proceso ETL para transferir datos desde el sistema de origen al almacén de datos. Sin embargo, una vez que se establecen estos procesos, hay poca necesidad de adaptarlos. Los datos permanecen recopilados en el almacén de datos, desde donde se pueden modelar y utilizar para soluciones de análisis de datos conectados. El resultado son cifras clave claras que le brindan una visión general en tiempo real de eventos importantes y cambios potenciales. Por ejemplo, las soluciones de ciencia de datos que mejoran la calidad de los datos con la ayuda del aprendizaje automático también se pueden construir sobre esto.
Al final
Los datos son el indicador más importante para tomar decisiones seguras y sólidas en la gestión de la cadena de suministro. Sin embargo, no se puede utilizar tal cual sin preparación. Los datos también tienen una cadena de suministro desde el sistema fuente hasta cada evaluación. Esta gestión de datos debe abordarse en el momento adecuado para que los datos puedan convertirse en el éxito a largo plazo de la empresa. En mi opinión, las empresas solo pueden tener éxito si toman buenas decisiones basadas en datos.
Si te interesa más este tema, laboratorio de datos informados.
Fuente de la imagen: (c) Getty Images – Ioops7