El valor de la gestión de datos

Data warehouse concepts: tu glosario de almacén de datos

Posted on Sat, Apr 9, 2016

No es sencillo adentrarse en el mundo de los almacenes de datos sin tener clara la terminología que más habitualmente se usa para referirse a sus componentes. Varios data warehouse concepts son de particular importancia para el almacenamiento de datos y es importante para los usuarios de negocio familiarizarse con ellos.

data_warehouse_concepts.jpg

Créditos fotográficos: istock vasina

 Descárgate nuestra Guía Avanzada sobre Big Data

Los data warehouse concepts que debes conocer

No es necesario contar con una preparación técnica, ni ser un especialista en el campo del almacenamiento de datos, para entender algunos de los términos que se emplean con más frecuencia. Estos data warehouse concepts son los siguientes:

  • Atributo: el campo de un atributo está representado por una columna dentro de un objeto (entidad). Puede considerarse objeto a una tabla, una vista o informe.
  • Back - end tool: este tipo de herramienta es una aplicación de software, normalmente residente tanto en el cliente como en el servidor, que ayuda en el proceso de extracción de datos de producción.
  • Cliente: se denomina así a toda aplicación de software que se utiliza para extraer o descargar aplicaciones, datos o algún tipo de servicio de un sistema host.
  • Data mart: un mercado de datos es un subconjunto de datos orientado a un objeto. Su principal característica es su diseño clásico, que facilita en gran medida su uso.
  • Entidad: se trata de uno de los objetos que existen en cualquier base de datos como una tabla, una vista, un informe o la pantalla.
  • Front-end tool: mediante esta herramienta de cliente se pueden obtener o manipular los datos almacenados en una base de datos relacional.
  • Gigabyte: un gigabyte es una unidad de medida de capacidad que equivale a 1 billón de bytes.
  • HTTP: con estas siglas se hace referencia al protocolo de transferencia de hipertexto (HTTP); un conjunto fijo de comandos que se utilizan durante un enlace de hipertexto entre un cliente y el servidor.
  • Índice: es el enlace que vincula una tabla con otra, proporcionando un rápido acceso a las filas de una tabla en base a los valores de 1 o más columnas de la otra tabla.
  • Metadatos: son datos sobre los datos, uno de los data warehouse concepts más importantes. Los metadatos explican el tipo de información que se ha de contener en cada campo de las tablas.
  • Normalizar: con este término se define el proceso de eliminación de la redundancia en los datos mediante la separación de los mismos en varias tablas distintas.
  • OLAP: el Procesamiento Analítico en Línea es un conjunto de herramientas de software que proporciona un marco tridimensional para la toma de decisiones.
  • Protocolo: es una descripción formal de formatos de mensaje y de las normas que han de observarse para proceder al intercambio de datos entre dos o más dispositivos.
  • Relacional (base de datos): se trata de un sistema que soporta SQL y está compuesto íntegramente por tablas. En una base de datos así, cada columna es un tipo particular de datos y cada fila es una instancia única de esos datos, estando identificadas de manera individual por una clave principal.
  • SQL: con estas siglas se hace referencia al lenguaje de consulta estructurado, que es el que se utiliza con bases de datos relacionales. SQL permite a los usuarios definir la estructura y organización de los datos almacenados (por eso es uno de los data warehouse concepts que deben conocerse); a la vez que se verifica y mantiene su integridad y control de acceso, quedando definidas las relaciones entre los elementos de datos almacenados.

 

big data hadoop

 

Topics: Data Warehouse