Un Datawarehouse es una base de
datos corporativa que se caracteriza por integrar y depurar información de una
o más fuentes distintas, para luego procesarla permitiendo su análisis desde
infinidad de perspectivas y con grandes velocidades de respuesta. La creación
de un datawarehouse representa en la mayoría de las ocasiones el primer paso,
desde el punto de vista técnico, para implantar una solución completa y fiable
de Business Intelligence.
La ventaja principal de este tipo
de bases de datos radica en las estructuras en las que se almacena la
información (modelos de tablas en estrella, en copo de nieve, cubos
relacionales... etc.). Este tipo de persistencia de la información es homogénea
y fiable, y permite la consulta y el tratamiento jerarquizado de la misma
(siempre en un entorno diferente a los sistemas operacionales).
El término Datawarehouse fue
acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén
de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió
el propio Bill Inmon, un datawarehouse se caracteriza por ser:
Integrado: los datos almacenados
en el datawarehouse deben integrarse en una estructura consistente, por lo que
las inconsistencias existentes entre los diversos sistemas operacionales deben
ser eliminadas. La información suele estructurarse también en distintos niveles
de detalle para adecuarse a las distintas necesidades de los usuarios.
Temático: sólo los datos
necesarios para el proceso de generación del conocimiento del negocio se integran
desde el entorno operacional. Los datos se organizan por temas para facilitar
su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos
los datos sobre clientes pueden ser consolidados en una única tabla del
datawarehouse. De esta forma, las peticiones de información sobre clientes
serán más fáciles de responder dado que toda la información reside en el mismo
lugar.
Histórico: el tiempo es parte
implícita de la información contenida en un datawarehouse. En los sistemas
operacionales, los datos siempre reflejan el estado de la actividad del negocio
en el momento presente. Por el contrario, la información almacenada en el
datawarehouse sirve, entre otras cosas, para realizar análisis de tendencias.
Por lo tanto, el datawarehouse se carga con los distintos valores que toma una
variable en el tiempo para permitir comparaciones.
No volátil: el almacén de
información de un datawarehouse existe para ser leído, pero no modificado. La
información es por tanto permanente, significando la actualización del
datawarehouse la incorporación de los últimos valores que tomaron las distintas
variables contenidas en él sin ningún tipo de acción sobre lo que ya existía.
Otra característica del
datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los
metadatos permiten saber la procedencia de la información, su periodicidad de
refresco, su fiabilidad, forma de cálculo... etc.
Los metadatos serán los que
permiten simplificar y automatizar la obtención de la
información desde los
sistemas operacionales a los sistemas informacionales.
Los
objetivos que deben cumplir los metadatos, según el colectivo al que va
dirigido, son:
·
Dar soporte al usuario final, ayudándole a acceder
al datawarehouse con su propio lenguaje de negocio, indicando qué información
hay y qué significado tiene. Ayudar a construir consultas, informes y análisis,
mediante herramientas de Business Intelligence como DSS, EIS o CMI.
·
Dar soporte a los responsables técnicos del datawarehouse
en aspectos de auditoría, gestión de la información histórica, administración
del datawarehouse, elaboración de programas de extracción de la información,
especificación de las interfaces para la realimentación a los sistemas
operacionales de los resultados obtenidos... etc.
Por último, destacar que para
comprender íntegramente el concepto de datawarehouse, es importante entender
cuál es el proceso de construcción del mismo, denominado ETL (Extracción,
Transformación y Carga), a partir de los sistemas operaciones de una compañía:
Extracción: obtención de
información de las distintas fuentes tanto internas como externas.
Transformación: filtrado,
limpieza, depuración, homogeneización y agrupación de la información.
Carga: organización y actualización
de los datos y los metadatos en la base de datos.
Las claves del éxito en la
construcción de un datawarehouse es el desarrollo de forma gradual,
seleccionando a un departamento usuario como piloto y expandiendo
progresivamente el almacén de datos a los demás usuarios. Por ello es
importante elegir este usuario inicial o piloto, siendo importante que sea un
departamento con pocos usuarios, en el que la necesidad de este tipo de
sistemas es muy alta y se pueda obtener y medir resultados a corto plazo.
Principales
aportaciones de un datawarehouse:
Proporciona una herramienta para
la toma de decisiones en cualquier área funcional, basándose en información
integrada y global del negocio.
Facilita la aplicación de
técnicas estadísticas de análisis y modelización para encontrar relaciones
ocultas entre los datos del almacén; obteniendo un valor añadido para el
negocio de dicha información.
Proporciona la capacidad de
aprender de los datos del pasado y de predecir situaciones futuras en diversos
escenarios.
Simplifica dentro de la empresa
la implantación de sistemas de gestión integral de la relación con el cliente.
Supone una optimización
tecnológica y económica en entornos de Centro de Información, estadística o de
generación de informes con retornos de la inversión espectaculares.
No hay comentarios:
Publicar un comentario