Datawarehouse
Datawarehouse
Un Datawarehouse es una base de datos corporativa que se
caracteriza por integrar y depurar información de una o más fuentes distintas,
para luego procesarla permitiendo su análisis desde infinidad de pespectivas y
con grandes velocidades de respuesta. La creación de un datawarehouse
representa en la mayoría de las ocasiones el primer paso, desde el punto de
vista técnico, para implantar una solución completa y fiable de Business
Intelligence.
La
ventaja principal de este tipo de bases de datos radica en las estructuras en
las que se almacena la información (modelos de tablas en estrella, en copo de
nieve, cubos relacionales... etc). Este tipo de persistencia de la información
es homogénea y fiable, y permite la consulta y el tratamiento jerarquizado de
la misma (siempre en un entorno diferente a los sistemas operacionales).
El
término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce
literalmente como almacén de datos. No obstante, y como cabe suponer, es
mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se
caracteriza por ser:
Integrado:
los datos almacenados en el datawarehouse deben integrarse en una estructura
consistente, por lo que las inconsistencias existentes entre los diversos
sistemas operacionales deben ser eliminadas. La información suele estructurarse
también en distintos niveles de detalle para adecuarse a las distintas
necesidades de los usuarios.
Un Data
Warehouse o almacén de datos es una base de datos multidimensional que almacena
información de una empresa que es útil para la toma de decisiones
Este almacén
de datos se alimenta con información que se obtiene de las bases de datos de
operación de una empresa. La característica de ser multidimensional le permite
realizar consultas de diversa formas para obtener un análisis de los datos en
forma consolidada. Para obtener la información a guardar en un data warehouse
se utilizan pequeños programas llamados mineros de datos, que van a las
diferentes fuentes de información y se obtienen aquella que es necesaria para
llenarlo. Al separa la información de los sistemas operacionales, los procesos
de análisis y consolidación, no afectan el rendimiento de los sistemas de la
empresa. Las principales características de los datos almacenados en un data
warehouse es que están integrados en una estructura consistente y en diferentes
niveles de detalle, los datos son temáticos es decir solo se obtienen aquellos
que dan un valor al análisis que se está elaborando y se organiza de tal forma
que su acceso y entendimiento es sencillo para los usuarios finales.
Normalmente, un data warehouse se aloja en un servidor corporativo o cada vez más, en la nube. Los datos de diferentes aplicaciones de procesamiento de transacciones Online (OLTP) y otras fuentes se extraen selectivamente para su uso por aplicaciones analíticas y de consultas por usuarios.
Data Warehouse es una arquitectura de almacenamiento de datos que permite a los ejecutivos de negocios organizar, comprender y utilizar sus datos para tomar decisiones estratégicas. Un data warehouse es una arquitectura conocida ya en muchas empresas modernas.
Estructuras de un Data Warehouse
La arquitectura de un data warehouse puede ser dividida en tres estructuras simplificadas: básica, básica con un área de ensayo y básica con área de ensayo y data marts.- Con una estructura básica, sistemas operativos y archivos planos proporcionan datos en bruto que se almacenan junto con metadatos. Los usuarios finales pueden acceder a ellos para su análisis, generación de informes y minería.
- Al añadir un área de ensayo que se puede colocar entre las fuentes de datos y el almacén, ésta proporciona un lugar donde los datos se pueden limpiar antes de entrar en el almacén. Es posible personalizar la arquitectura del almacén para diferentes grupos dentro de la organización.
- Se puede hacer agregando data marts, que son
sistemas diseñados para una línea de negocio en particular. Se pueden
tener data marts separados para ventas, inventario y compras, por ejemplo,
y los usuarios finales pueden acceder a datos de uno o de todos los data
marts del departamento.
-
Históricamente, los data warehouses se habían formado utilizando datos repetitivos estructurados que eran filtrados antes de entrar en el data warehouse. Sin embargo, en los últimos años, el data warehouse ha evolucionado debido a información contextual que ahora se puede adjuntar a los datos no estructurados y que también puede ser almacenada.Aquellos primeros datos relacionales estructurados no podían ser mezclados y emparejados para temas analíticos con datos textuales no estructurados. Pero con el advenimiento de la contextualización, estos tipos de análisis ahora sí pueden hacerse de forma naturales y fácil.En el data warehouse, datos no repetitivos, como los comentarios en una encuesta, correos electrónicos y conversaciones, se tratan de forma diferente a las ocurrencias repetitivas de datos, como el flujo de clics, mediciones o el procesamiento máquina o analógico. Los datos no repetitivos son datos basados en textos que fueron generados por la palabra escrita o hablada, leída y reformateada y, lo que es más importante, ahora puede ser contextualizada. Con el fin de extraer cualquier sentido de los datos no repetitivos para su uso en el Data Warehouse, deben tener el contexto de los datos establecidos.En muchos casos, el contexto de los datos no repetitivos es más importante que los datos en sí. En cualquier caso, los datos no repetitivos no pueden utilizarse para la toma de decisiones hasta que se haya establecido el contexto.https://www.powerdata.es/data-warehousehttps://www.sinnexus.com/business_intelligence/datawarehouse.aspx
Comentarios
Publicar un comentario