Hola a todos, en esta parte hablaremos de los sistemas OLAP, pasando por algunas definiciones.
¿Que es OLAP?
OLAP es el acrónimo en inglés de procesamiento analítico
en línea (On-Line Analytical Processing). Es una solución utilizada en el
campo de la llamada inteligencia empresarial (o Business Intelligence)
cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello
utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos
resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP). Se usa
en informes de negocios de ventas, marketing, informes de dirección, minería de
datos y áreas similares.
¿Que es Inteligencia de Negocios?
Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence) al conjunto de estrategias y herramientas enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.
Fuentes:
http://www.businessintelligence.info/definiciones/que-es-olap.html
http://es.wikipedia.org/wiki/Inteligencia_empresarial
En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP, se compone de hechos numéricos llamados medidas que se clasifican por dimensiones.
Ejemplo de un cubo OLAP:
En el caso de que queramos obtener datos sobre la venta de un producto X, basado en el cubo, tenemos que realizar cortes, es decir seleccionar las propiedades del producto que nos interese.
Ejemplo:
Queremos ver cuales son las ventas de celulares en Europa en el año 2000
De esta manera podemos realizar recuperación de datos (consulta) rápida y eficazmente, así mismo es posible presentar informes de análisis de datos de manera mas eficiente.
Tipos de Sistemas OLAP:
ROLAP:
Constituye de un sistema OLAP construidos sobre una base de datos relacional.
Ventajas:
- ROLAP se considera más escalable para manejar grandes volúmenes de datos, especialmente modelos con dimensiones de gran cardinalidad (por ejemplo, con millones de miembros).
- Hay disponible una gran variedad de herramientas de carga de datos para sistemas relacionales; además, existe la posibilidad de ajustar el código ETL(Extract, Transform, Load) a un modelo de datos particular. Con todo esto se consigue que los tiempos de carga sean generalmente mucho menores que con las cargas MOLAP automatizadas.
- Los datos se almacenan en una base de datos relacional estándar que puede ser accedida por cualquier herramienta de generación de informes SQL (reporting). Estas herramientas no tienen que ser necesariamente de tipo OLAP.
Desventajas de ROLAP:
- El proceso de carga de tablas agregadas debe ser gestionado por código ETL personalizado. Las herramientas ROLAP no disponen de mecanismos automáticos para realizar esta tarea, lo que significa que se necesita más tiempo de desarrollo de código.
- Muchos desarrolladores de modelos dimensionales ROLAP ignoran el paso de crear tablas agregadas. En este caso el rendimiento de una consulta se ve afectado porque entonces se necesita consultar las tablas con datos más detallados. Esto puede evitarse parcialmente añadiendo tablas agregadas adicionales, sin embargo no es práctico crear tablas agregadas para todas las combinaciones posibles de dimensiones/atributos.
MOLAP:
Se trata de una alternativa a la tecnología ROLAP (OLAP-Relacional). MOLAP se diferencia significativamente en que requiere un preprocesamiento y almacenamiento de la información contenida en una matriz de almacenamiento multidimensional optimizada, más que en una base de datos relacional.
Ventajas
- Consultas rápidas debido a la optimización del rendimiento de almacenamiento, la indexación multidimensional y la memoria caché.
- Ocupa menor tamaño en disco en comparación con los datos almacenados en base de datos relacional debido a técnicas de compresión.
- Automatización del procesamiento de los datos agregados de mayor nivel.
Desventajas
- La etapa de procesamiento (carga de datos) puede ser bastante larga, sobre todo para grandes volúmenes de datos. Normalmente, esto se puede evitar con un procesamiento incremental, es decir, sólo el procesamiento de los datos que han cambiado (por lo general, los nuevos datos) en lugar de volver a procesar de todo el conjunto de datos.
- Las herramientas MOLAP tradicionalmente tienen dificultades para consultar con modelos con dimensiones muy altas (del orden de millones de miembros).
Aunque ambos sistemas tienen distintas tendencias, la implementacion de uno o de otro se debe ajustar a las necesidades de la organización en cuestión, esto determinara el rendimiento del sistema implementado.
No hay comentarios:
Publicar un comentario