On-Line Analytical Processing (OLAP)

De Departamento de Informatica
Saltar a: navegación, buscar

Contenido

Definición general

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Nacido de la mano de Edgar F. Codd, de la compañía EF Codd & Associatess, es una solución utilizada en el campo de la llamada inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o cubos OLAP) que contienen datos resumidos de grandes bases de datos o Sistemas Transaccionales (OLTP) que permiten extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejo, etc.

Las secciones siguientes describen cada componente con más detalle:

  • Cubo: Estructura de datos que agrega las medidas mediante los niveles y jerarquías de cada una de las dimensiones que desee analizar. Los cubos combinan varias dimensiones, como tiempo, geografía y líneas de productos, con datos resumidos, como cifras de ventas o inventario. Los cubos no son "cubos" en el sentido estrictamente matemático porque no tienen que tener lados iguales. Sin embargo, son una metáfora adecuada para un concepto complejo.
  • Medida: Conjunto de valores basados en una columna de la tabla de hechos del cubo y que suelen ser valores numéricos. Las medidas son los valores centrales del cubo que se preprocesan, agregan y analizan. Entre los ejemplos normales cabe destacar las ventas, los beneficios, los ingresos y los costos.
  • Miembro: Un elemento de una jerarquía que representa una o más repeticiones de datos. Un miembro puede ser exclusivo o no. Por ejemplo, 2007 y 2008 representan a miembros únicos en el nivel de año de una dimensión de tiempo, mientras que enero representa a un miembro en el nivel de mes porque puede haber más de una enero en la dimensión de tiempo que contenga los datos de más de un año.
  • Elemento calculado: Elemento de una dimensión cuyo valor se calcula en tiempo de ejecución mediante una expresión. Los valores de los elementos calculados se pueden derivar de otros valores de elementos. Por ejemplo, un elemento calculado, Beneficios, se puede determinar restando el valor del elemento, Costos, del valor del elemento, Ventas.
  • Dimensión: Conjunto de una o varias jerarquías de niveles de un cubo que comprende un usuario y utiliza como base para el análisis de datos. Por ejemplo, una dimensión geográfica puede incluir niveles de país o región, estado o provincia y ciudad. O bien, una dimensión de tiempo puede incluir una jerarquía con niveles de año, trimestre, mes y día. En un informe de tabla o gráfico dinámicos, cada jerarquía se convierte en un conjunto de campos que puede expandir o contraer para revelar niveles inferiores o superiores.
  • Jerarquía: Estructura de árbol lógica que organiza los elementos de una dimensión tal que cada elemento tiene un elemento principal y cero o más elementos secundarios. Un elemento secundario es un elemento en el nivel inmediatamente inferior de una jerarquía que está directamente relacionada con el elemento actual. Por ejemplo, en una jerarquía de tiempo que contiene los niveles Trimestre, Mes y Día, enero es un elemento secundario de Trim1. Un elemento principal es un elemento en el nivel inmediatamente superior de una jerarquía que está directamente relacionado con el miembro actual. El valor principal suele ser una consolidación de los valores de todos sus elementos secundarios. Por ejemplo, en una jerarquía de tiempo que contiene los niveles Trimestre, Mes y Día, Trim1 es el elemento principal de enero.
  • Nivel: En cada jerarquía, los datos se pueden organizar en niveles inferiores y superiores de detalle, como los niveles Año, Trimestre, Mes y Día de una jerarquía de tiempo.


Para entenderlo de mejor manera podemos representarlo como la imagen siguiente:

imagen obtenida de http://blogs.solidq.com/es/business-analytics/curso-ms-business-intelligence-ssas-cubos-olap-conceptos-basicos-parte-ii-28/


  • El acceso a los datos suele ser de sólo lectura. La acción más común es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones.
  • Los datos se estructuran según las áreas de negocio, y los formatos de los datos están integrados de manera uniforme en toda la organización.
  • El historial de datos es a largo plazo, normalmente de dos a cinco años.
  • Las bases de datos OLAP se suelen alimentar de información procedente de los sistemas operacionales existentes, mediante un proceso de extracción, transformación y carga (ETL).

Acciones básicas del OLAP

A partir de su definición, existen distintas tecnologías que lo implementan (ROLAP, MOLAP, HOLAP,...), pero básicamente todas hacen las mismas acciones básicas sobre la información:

  • Segmentar: Como cuando pides las ventas por producto y por trimestre
  • Filtrar: Como cuando pides el informe de ventas de España en 2011
  • Profundizar (Drill down): Como cuando ves los datos de trimestre 2 y te interesa el desglose de abril, mayo, junio.
  • Sintetizar (Drill up): Cuando deshaces el desglose anterior y vuelves al desglose por trimestre.
  • Rotar (Drill anywhere): Cuando en lugar de pasar de un desglose por trimestres a uno mensual, te interesa un desglose por familia de producto, o por nacionalidad, es decir, por una característica de una jerarquía distinta a la que lo estas viendo actualmente.

Tipos de Sistemas OLAP

Algunas categorías OLAP en las que se pueden clasificar los sistemas son:

Sistemas MOLAP

La arquitectura MOLAP usa unas bases de datos multidimensionales para proporcionar el análisis, su principal premisa es que el OLAP está mejor implantado almacenando los datos multidimensionalmente. Un sistema MOLAP usa una base de datos en la que la información se almacena multidimensionalmente, para ser visualizada en varias dimensiones de análisis.

El sistema MOLAP utiliza una arquitectura de dos niveles: la bases de datos multidimensionales y el motor analítico. La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato.

El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional.

La arquitectura MOLAP requiere unos cálculos intensivos de compilación. Lee de datos precompilados, y tiene capacidades limitadas de crear agregaciones dinámicamente o de hallar ratios que no se hayan precalculados y almacenados previamente.

Ejemplos de productos comerciales que utilizan MOLAP son:

  • Oracle OLAP
  • Microsoft Analysis Services
  • Essbase
  • icCube Server
  • Infor OLAP
  • IBM TM1.
  • Microsoft SQL server

También existe un servidor MOLAP con una versión en código abierto llamado PALO.

Sistemas ROLAP

La arquitectura ROLAP, accede a los datos almacenados en un datawarehouse para proporcionar los análisis OLAP. La premisa de los sistemas ROLAP es que las capacidades OLAP se soportan mejor contra las bases de datos relacionales.

El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona la funcionalidad analítica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensionales de los usuarios.

El motor ROLAP se integra con niveles de presentación, a través de los cuáles los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el datawarehouse se ha definido, los datos se cargan desde el sistema operacional. Se ejecutan rutinas de bases de datos para agregar el dato, si así es requerido por el modelos de datos. Se crean entonces los índices para optimizar los tiempos de acceso a las consultas.

Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor ROLAP, que transforma dinámicamente sus consultas a consultas SQL. Se ejecutan estas consultas SQL en las bases de datos relacionales, y sus resultados se relacionan mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a los usuarios.

La arquitectura ROLAP es capaz de usar datos precalculados si estos están disponibles, o de generar dinámicamente los resultados desde los datos elementales si es preciso. Esta arquitectura accede directamente a los datos del datawarehouse, y soporta técnicas de optimización de accesos para acelerar las consultas. Estas optimizaciones son, entre otras, particionado de los datos a nivel de aplicación, soporte a la desnormalización y joins múltiples.

Algunas ejemplos de productos comerciales que usan ROLAP son:

  • Oracle Business Intelligence Enterprise Edition
  • Microsoft Analysis Services
  • MicroStrategy
  • Business Objects
  • Mondrian (servidor open source ROLAP)

Sistemas HOLAP (Hybrid OLAP)

Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solución con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los volúmenes más grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado.

Otros Sistemas OLAP

Los siguientes acrónimos a veces también se utilizan, aunque no son sistemas tan generalizados como los anteriores:

  • WOLAP o Web OLAP: OLAP basado u orientado para la web.
  • DOLAP o Desktop OLAP: OLAP de escritorio
  • RTOLAP o Real Time OLAP: OLAP en tiempo real
  • SOLAP o Spatial OLAP: OLAP espacial

Bibliografía

-Definición general OLAP

-OLAP, definición y creación

-Conceptos básicos de OLAP

-Bases de datos OLAP

-Procesamiento Analítico en Microsoft Office

-Analisis y entendimiento de Cubos OLAP I

-Analisis y entendimiento de Cubos OLAP II

-OLAP avanzado (MOLAP, ROLAP, HOLAP

-Comparativa sistemas OLAP

Autor

  • herman nicolas valencia lara - Casa Central
Herramientas personales
Espacios de nombres
Variantes
Acciones
Navegación
Herramientas