El valor de la gestión de datos

Rol de la base de datos multidimensional en las organizaciones modernas

Publicado el 25/01/17 23:00

La gran cantidad de datos heterogéneos acumulados por las organizaciones representa una de las razones por las que las empresas necesitan una tecnología que les permita realizar rápidamente un análisis complejo sobre estos datos. Debido a que las bases de datos relacionales son ineficaces, desde este punto de vista se requiere un nuevo concepto, el concepto de base de datos multidimensional.

base de datos multidimensional.jpg

Cada año se acumula un gran volumen de información en cualquier organización. Los responsables de los diferentes departamentos deben elaborar periódicamente informes que sinteticen la información acumulada en distintos periodos y para facilitar esa labor se debe diseñar una base de datos multidimensional dónde se almacene esta información para agilizar su actividad.

Vamos a ver el concepto de base de datos multidimensional y sus características, así como una comparativa con las bases de datos relacionales y su principales ventajas y desventajas.

 

Concepto y características de una base de datos multidimensional

Una base de datos multidimensional representa un tipo de base de datos donde los datos se almacenan en celdas y cada posición de celda está definida por una serie de variables denominadas dimensiones. Cada celda significa un evento de negocio y los valores de dimensiones indican el momento y el lugar donde ocurre el evento. Puedes encontrarlo con diferentes sinónimos como cubo, hipercubo, cubo OLAP, base de datos OLAP o almacén de datos multidimensional. Aunque lógicamente una base de datos multidimensional se parece a un cubo, físicamente se almacena como una matriz multidimensional comprimida con posicionamiento offset.

El modelo de datos correspondiente a un diseño de base de datos multidimensional es el modelo de datos multidimensional que contiene tablas de hechos con atributos de tipo de medida y tablas de dimensión con atributos descriptivos. Los miembros de las tablas de dimensiones pueden organizarse en jerarquías.

 

Análisis comparativo entre bases de datos multidimensionales y bases de datos relacionales

En realidad no se puede afirmar que un determinado tipo de base de datos sea mucho mejor que el otro o que las bases de datos relacionales sean totalmente obsoletas. Ambos tipos de base de datos presentan ventajas y desventajas y es importante identificar las situaciones en las que un cierto tipo de base de datos es adecuado para su uso.

Las principales diferencias entre estos dos tipos de base de datos son:

  • Base de datos multidimensional:
    • Organización de datos:  matriz de datos multidimensional, celdas, dimensiones, tablas de hechos.
    • Nivel de datos: datos detallados y datos agregados.
    • Operaciones típicas: análisis.
    • Lenguaje para Querys: MDX.
    • Uso de espacio en disco: bajo.
    • Rendimiento: bueno.
    • Flexibilidad: baja.
    • Tiempo de procesamiento de datos: alto.
    • Escalabilidad: baja.
    • Alcance del diseño: limitado.
    • Acceso a datos:  soporta acceso directo a los datos.
  • Base de datos relacional:
    • Organización de datos: tablas.
    • Nivel de datos: datos detallados.
    • Operaciones típicas: Actualizaciones (updates).
    • Lenguaje para Querys: SQL.
    • Uso de espacio en disco: grande.
    • Rendimiento: débil.
    • Flexibilidad: alta.
    • Tiempo de procesamiento de datos: bajo.
    • Escalabilidad: alta.
    • Alcance del diseño: muy grande.
    • Acceso a datos:  permite el acceso indirecto a los datos.

Cómo se puede ver en los datos anteriores, la base de datos multidimensional almacena tanto datos detallados como datos agregados en un formato de matriz multidimensional que se utiliza especialmente para aplicaciones de análisis de datos. A diferencia de ellos, en la base de datos relacional los datos se almacenan en tablas. La base datos relacional representa el elemento clave en los sistemas tradicionales de procesamiento de transacciones.

Durante los años 90 y principios de los 2000 había un sólo lenguaje de consulta para bases de datos relacionales. Este lenguaje es el lenguaje SQL. En 1997 Microsoft elaboró el lenguaje Multidimensional Expressions (MDX) como parte de la especialización OLE DB para especificaciones Olap. Desde 2001 XML for Analysis (XMLA) se ha convertido en el estándar para acceder a los datos OLAP, estandarizando por tanto el lenguaje MDX también.

 

Ventajas y desventajas de una base de datos multidimensional

Una base de datos multidimensional presenta varias ventajas:

  • Utiliza un espacio en disco menor porque está comprimido y no utiliza la  indexación para buscar datos.
  • Tiene mejores prestaciones sirviendo necesidades al usuario ya que los datos agregados son precalculados y el formato de almacenamiento reduce el número de operaciones de entrada y salida.
  • Garantiza un rendimiento superior porque se modelan teniendo en cuenta sólo los requisitos de un solo grupo de usuarios.
  • Soporta un acceso, directo, eficiente y rápido a los datos.

Sin embargo, una base de datos multidimensional también tiene desventajas:

  • El tiempo de procesamiento de los datos es alto ya que los datos agregados deben recalcularse cuando se actualizan las fuentes de datos operacionales.
  • La escalabilidad disminuye a medida que aumenta el número de dimensiones o cuando la base de datos es muy grande.
  • La flexibilidad de una base de datos multidimensional es muy baja.
  • El alcance del diseño es limitado, por lo tanto, a medida que aumenta el número de grupos de usuarios cuyos requerimientos deben ser tomados en cuenta, el modelo corre el riesgo de fallar.

 

New Call-to-action

Temas: Data Governance