sábado, 3 de septiembre de 2011

Modelos Conceptuales de Bases de datos

[olap_wuerfel.jpg]Una base de datos multidimensional, es aquella que almacena sus datos con varias dimensiones, es decir que en vez de un valor, encontramos varios dependiendo de los "ejes" definidos. Veamos un ejemplo:


Una tabla relacional de productos podría tener 2 campos ID, Nombre del producto y existencias
En un entorno multidimensional con dos dimensiones, tiempo y espacio, tendríamos por cada entrada N valores dependiendo de estos dos ejes y asi podríamos observar el número de existencias en el tiempo (histórico) y en las diferentes sedes de la empresa.

IMPLEMENTACIÓN

Lo más importante a tener en cuenta para implementar esta estructura de datos es que la tabla contiene todas las n-tuplas, con los valores de las dimensiones, o índice del cubo, y los valores de las métricas previamente calculados para el cruce de valores del índice en cuestión.


CUBO
El esquema de un cubo queda determinado dando a conoces sus ejes con sus respectivas estructuras y los datos que se presentan en cada celda de la matriz.

Se asume que los datos en todas las celdas son uniformes, es decir, todas las posiciones de la matriz tienen datos de igual estructura.

A los ejes se le llama dimensiones y al dato que se presenta en la matriz, se le llama medida. A los elementos del producto cartesiano de los ejes (dimensiones ), se le llama coordenadas. La matriz definida puede ser dispersa. (es una función parcial).

Hipercubo de datos

Un hipercubo dentro del ámbito de sistemas de información y bases de datos, significa un objeto multidimensional, en el que cada dimensión representa una variable, de forma que en este objeto se obtienen los valores relacionados de todas variables, asociadas a las dimensiones, simultáneamente.


Los datos se modelan en data cubes (cubos de datos), estructuras multidimencionales (hipercubos), cuyas operaciones más comunes son:

Roll up: incremento de nivel de agregación de los datos.
Drill Down: incremento en el nivel de detalle, opuesto al Roll up.
Slice: reducción de la dimensionalidad de los datos mediante selección.
Dice: reducción de la dimensionalidad de los datos mediante proyección.
Pivotaje o rotación: reorientación de la visión multidimencional de los datos.


 

Bases de Datos Lógicas

Las bases de datos lógicas son construidas con registros homogéneos de manera parecida a las relacionales. Adicionalmente se agregan restricciones lógicas y reglas de composición parecidas a las de Prolog, que permiten (en principio) deducir información que originalmente no está contenida en la base de datos. Un ejemplo para demostrar las reglas y relaciones de una base de datos lógica se puede ver a continuación: 


Tenemos la relación Padre y la regla Abuelo,



Padre(Juan, Luis)
Padre(Luis, Arturo)
Abuelo (x,y):- Padre(x,z),Padre (z,y).



Una consulta típica consiste en preguntar si un registro ``podría'' existir, por ejemplo

  • Abuelo(Juan,Luis) la respuesta sería no
  • Padre(Juan,Luis) la respuesta sería si
  • Padre(Luis,Luis) la respuesta sería no

Bases de datos paralelas

Se suele duplicar la información de una organización. En cambio, es mucho más realista tener varios servidores de bases de  datos e ir añadiendo a  medida que la organización necesita más capacidad. Esto se debe hacer de manera que los usuarios crean que siguen trabajando con un único sistema, el sistema integrado de la organización. Mediante esta filosofía, la
organización tiene más flexibilidad en sus ampliaciones, se realizan de una manera menos traumática y con ordenadores de talla media, que suelen ser mucho más baratos que uno grande equivalente en potencia.



Bases de datos Semánticas
ofrecen una flexibilidad muy apropiada para proyectos web (no sólo “3.0”). Y el mejor ejemplo que he encontrado es Plone, el gestor de contenidos para portales web basado en Zope, permite crear archetypes de información que Zope/ZODB manejan de forma semi-automática, permitiendo
extender el portal rápidamente.

EJEMPLOS

Web 3.0 es un neologismo que se utiliza para describir la evolución del uso y la interacción en la red a través de diferentes caminos. Ello incluye, la transformación de la red en una base de datos, un movimiento hacia hacer los contenidos accesibles por múltiples aplicacionesnon-browser, el empuje de las tecnologías de inteligencia artificial, la web semantica, la Web Geoespacial, o la Web 3D. Frecuentemente es utilizado por el mercado para promocionar las mejoras respecto a la web 2.0. El término Web 3.0 apareció por primera vez en 2006 en un artículo de Jeffrey Zeldman, crítico de la Web 2.0 y asociado a tecnologias como AJAX.

OLAP es el acrónimo en inglés de procesamiento analítico en línea (On-Line Analytical Processing). Es una solución utilizada en el campo de la llamada inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, mineria de datos y áreas similares.

No hay comentarios:

Publicar un comentario