La gran cantidad de datos heterogéneos acumulados por las organizaciones representa una de las razones por las que las empresas necesitan una tecnología que les permita realizar rápidamente un análisis complejo sobre estos datos. Debido a que las bases de datos relacionales son ineficaces, desde este punto de vista se requiere un nuevo concepto, el concepto de base de datos multidimensional.
Cada año se acumula un gran volumen de información en cualquier organización. Los responsables de los diferentes departamentos deben elaborar periódicamente informes que sinteticen la información acumulada en distintos periodos y para facilitar esa labor se debe diseñar una base de datos multidimensional dónde se almacene esta información para agilizar su actividad.
Vamos a ver el concepto de base de datos multidimensional y sus características, así como una comparativa con las bases de datos relacionales y su principales ventajas y desventajas.
Una base de datos multidimensional representa un tipo de base de datos donde los datos se almacenan en celdas y cada posición de celda está definida por una serie de variables denominadas dimensiones. Cada celda significa un evento de negocio y los valores de dimensiones indican el momento y el lugar donde ocurre el evento. Puedes encontrarlo con diferentes sinónimos como cubo, hipercubo, cubo OLAP, base de datos OLAP o almacén de datos multidimensional. Aunque lógicamente una base de datos multidimensional se parece a un cubo, físicamente se almacena como una matriz multidimensional comprimida con posicionamiento offset.
El modelo de datos correspondiente a un diseño de base de datos multidimensional es el modelo de datos multidimensional que contiene tablas de hechos con atributos de tipo de medida y tablas de dimensión con atributos descriptivos. Los miembros de las tablas de dimensiones pueden organizarse en jerarquías.
En realidad no se puede afirmar que un determinado tipo de base de datos sea mucho mejor que el otro o que las bases de datos relacionales sean totalmente obsoletas. Ambos tipos de base de datos presentan ventajas y desventajas y es importante identificar las situaciones en las que un cierto tipo de base de datos es adecuado para su uso.
Las principales diferencias entre estos dos tipos de base de datos son:
Cómo se puede ver en los datos anteriores, la base de datos multidimensional almacena tanto datos detallados como datos agregados en un formato de matriz multidimensional que se utiliza especialmente para aplicaciones de análisis de datos. A diferencia de ellos, en la base de datos relacional los datos se almacenan en tablas. La base datos relacional representa el elemento clave en los sistemas tradicionales de procesamiento de transacciones.
Durante los años 90 y principios de los 2000 había un sólo lenguaje de consulta para bases de datos relacionales. Este lenguaje es el lenguaje SQL. En 1997 Microsoft elaboró el lenguaje Multidimensional Expressions (MDX) como parte de la especialización OLE DB para especificaciones Olap. Desde 2001 XML for Analysis (XMLA) se ha convertido en el estándar para acceder a los datos OLAP, estandarizando por tanto el lenguaje MDX también.
Tal vez te interese leer:
Gestión de datos para potenciar los resultados financieros
Una base de datos multidimensional presenta varias ventajas:
Sin embargo, una base de datos multidimensional también tiene desventajas: