Actualizado el 18 de Diciembre del 2018 (Publicado el 24 de Abril del 2017)
3.241 visualizaciones desde el 24 de Abril del 2017
335,1 KB
13 paginas
Creado hace 17a (08/02/2008)
Bases de Datos
Distribuidas
Vicente Toledo – Israel Miralles
Base de Datos Distribuidas
Pg-1
Indice
1. -¿Que son Bases de Datos Distribuidas?
1. -Comparación
2. -Arquitectura de las Bases de Datos
1. -Ejemplo de una Base de Datos Distribuidas
3. -Tipos de almacenamiento
1. -Replica
2. -Fragmentación
1. Fragmentación Horizontal
2. Fragmentación Vertical
3. Fragmentación Mixta
3. -Replica y Fragmentación
4. -Niveles de Transparencia en una Base de Datos Distribuida
5. -Procesamiento Distribuido de Consultas
6. -Recuperación
7. -Ventajas y Desventajas
8. -Bibliografía
Pg-3
Pg-3
Pg-4
Pg-5
Pg-6
Pg-6
Pg-6
Pg-6
Pg-7
Pg-8
Pg-9
Pg-9
Pg-10
Pg-11
Pg-12
Pg-13
Base de Datos Distribuidas
Pg-2
1.-¿Que son Bases de Datos Distribuidas?
-Son un grupo de datos que pertenecen a un sistema pero a su vez esta
reapartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en
una diferente localizacion geografica, cada sitio en la red es autónomo en sus
capacidades de procesamiento y es capaz de realizar operaciones locales y en cada
uno de estos ordenadores debe estar ejecutandose una aplicación a nivel global
que permita la consulta de todos los datos como si se tratase de uno solo.
1.- Comparación
Centralizado
Distribuido
Control centralizado:
un solo DBA
Independencia de Datos:
Organización de los datos es
transparente para el programador
Reducción de redundancia:
Una sola copia de datos que se
comparta
Control jerárquico:
DBA global y DBA local
Transparencia en la Distribución:
Localización de los datos es un
aspecto adicional de independencia
de datos
Replicación de Datos:
Copias múltiples de datos que
incrementa la localidad y la
disponibilidad de datos
Estructuras físicas complejas para
accesos eficientes
No hay estructuras intersitios. Uso
de optimización global para reducir
transferencia de datos
Seguridad
Problemas de seguridad intrínsecos
-Para tener una base de datos distribuida debe cumplirse las condiciones de una
Red Computacional. Una red de comunicación provee las capacicades para que un
proceso ejecutandose en un sitio de la red envie y reciba mensajes de otro proceso
ejecutandose en un sitio distinto. Parámetros a considerar incluyen: Retraso en la
entrega de mensajes, Costo de transmisión de un mensaje y Confiabilidade de la
red. Diferentes tipos de redes: point-to-point, broadcast, lan, wan.
Base de Datos Distribuidas
Pg-3
2.-Arquitectura de las Bases de Datos
Integración lógica por medio de diseño top-down (DistDB)
Global Schema
Fragmentation
Schema
Allocation
Schema
Local Mapping
Schema
. . . . . . . . . . . .
Local Mapping
Schema
DataBase
Manager
System
Local
Database
Sitio 1
. . . . . . . . . . . .
DataBase
Manager
System
Local
Database
Sitio n
Integración lógica por medio de bottom-up (Multidatabase)
Global Schema
Schema
Integration
. . . . . . . . . . . .
. . . . . . . . . . . .
Itermediate
Schema
Translator
Local
Conceptual
Schema
Local
Database
Sitio 1
Itermediate
Schema
Translator
Local
Conceptual
Schema
Local
Database
Sitio n
Base de Datos Distribuidas
Pg-4
-Global Schema: Define todos los datos que están incluidos en la bd distribuida tal
como si la bd no fuera distribuida. Consiste de una definición de relaciones
globales.
-Fragmentation Schema: Traducción entre relaciones globales y fragmentos. (Una
relación global puede consistir de varios fragmentos pero un fragmento está
asociado con sólo una relación global)
-Allocation Schema: Define el sitio (o sitios) en el cual un fragmennto está
localizado.
-Local Maping Schema: Traduce los fragamentos locales a los objetos que son
manejados por el SMBD local
Separación entre fragmentación y localización.
-Transparencia de Fragmentación
-Transparencia de Localización
-Control explícito de redundancia
-Independencia de BD locales
1.-Ejemplo de una Base de Datos Distribuidas
Base de Datos Distribuidas
Pg-5
3.-Tipos de almacenamiento
1-Replica
El sistema conserva varias copias o réplicas idénticas de unatabla. Cada réplica se
almacena en un nodo diferente.
Ventajas:
de los nodos.
Disponibilidad: El sistema sigue funcionando aún en caso de caída de uno
Aumento del paralelismo: Varios nodos pueden realizar consultas en
paralelo sobre la misma tabla. Cuantas más réplicas existan de la tabla, mayor
serála posibilidad de que el dato buscado se encuentre en el nodo desde el que se
realiza la consulta, minimizando con ello el tráfico de datos entre nodos.
Inconveniente:
Aumento de la sobrecarga en las actualizaciones: El sistema debe
asegurar que todas las réplicas de la tabla sean consistentes. Cuandose realiza
una actualización sobre una de las réplicas, los cambios deben propagarse a
todas las réplicas de dicha tabla a lo largo del sistema distribuido.
2.-Fragmentación
Existen tres tipos de fragmentacion la horizontal, la vertical y la mixta
1.-Fragmentación Horizontal
Unatabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos
se definen a través de una operación de selección y su reconstrucción se
realizaráconuna operación de unión de los fragmentos componentes.
Cada fragmento se sitúa en un nodo.
Base de Datos Distribuidas
Pg-6
Pueden existir fragmentos no disjuntos: combinación de
fragmentación y replicación.
Ejemplo:
Tabla inicial de alumnos
Tabla de alumnos fragmentada
2.-Fragmentación Vertical
Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos
se definen a través de una operación de proyección.
Cada fragmento debe incluir la clave primaria de la tabla. Su
reconstrucción se realizará con una operación de join de los fragmentos
componentes, pueden existir fragmentos no disjuntos: combinación de
fragmentación y replicación.
Base de Datos Distribuidas
Pg-7
Ejemplo:
3.-Fragmentación Mixta
Como el mismo nombre indica es una combinación de las dos
anteriores vistas he aquí un ejemplo apartir de una tabla fragmentada
horizontalmente.
Base de Datos Distribuidas
Pg-8
3.-Replica y Fragmentación
Las técnicas de réplica y fragmentación se pueden aplicar sucesivamente a la
misma relación de partida. Un fragmento se puede replicar y a su vez esa réplica
ser fragmentada, para luego replicar alguno de esos fragmentos.
4.-Niveles de Transparencia en una Base de Datos Distribuida
El propósito de establecer una arquitectura de un sistema de bases de datos
distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la
información.
La transparencia se define como la separación de la semántica de alto nivel de un
sistema de los aspectos de bajo nivel relacionados a la implementación del mismo. Un
nivel de transparencia adecuado permite ocultar los detalles de implementación a las
capas de alto nivel de un sistema y a otros usuarios.
El sistema de bases de datos distribuido permite proporcionar independencia de
los datos.
La independencia de datos se puede dar en dos aspectos: lógica y física.
.1 Independencia lógica de datos. Se refiere a la inmunidad de las aplicaciones
de usuario a los cambios en la estructura lógica de la base de datos. Esto
permite que un cambio en la definición de un esquema no debe afectar a las
aplicaciones de usuario. Por ejemplo, el agregar un nuevo atributo a una
relación, la creación de una nueva relación, el reordenamiento lógico de algunos
atributos.
.2 Independencia física de datos. Se refiere al ocultamiento de los detalles
sobre las estructuras de almacenamiento a las aplicaciones de usuario. la
descripción física de datos puede cambiar sin afectar a las aplicaciones de
usuario. Por ejemplo, los datos pueden ser movidos de un disco a otro, o la
organización de los datos puede cambiar.
La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan
sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su
existencia. La transparencia al nivel de red conlleva a dos cosas:
.1Transparencia sobre la localización de datos. el comando que se usa es
independiente de la ubicación de los datos en la red y del lugar en donde la
operación se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer
Base de Datos Distribuidas
Pg-9
una copia de archivo. Cp se utiliza para copias locales y rcp se utiliza para copias
remotas. En este caso no existe transparencia sobre la localización.
.2Transparencia sobre el esquema de nombramiento. Lo anterior se logra
proporcionando un nombre único a cada objeto en el sistema distribuido. Así, no se
debe mezclar la información de la localización con en el nombre de un objeto.
La transparencia sobre replicación de datos se refiere a que si existen réplicas de
objetos de la base de datos, su existencia debe ser controlada por el sistema no por el
usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las
réplicas en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una
eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia de
las réplicas teniendo así datos diferentes.
La transparencia a nivel de fragmentación de datos permite que cuando los objetos
de la bases de datos están fragmentados, el sistema tiene que manejar la conversión de
consultas de usuario definidas sobre relaciones globales a consultas definidas sobre
fragmentos. Así también, será necesario mezclar las respuestas a consultas fragmentadas
para obtener una sola respuesta a una consulta global. El acceso a una base de datos
distribuida debe hacerse en forma transparente.
En resumen, la transparencia tiene como punto central la independencia de datos.
La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por
el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la
base de datos distribuida. Entre estos tres módulos se deben resolver los aspectos sobre
el procesamiento distribuido de co
Comentarios de: Bases de Datos Distribuidas (0)
No hay comentarios