PDF de programación - Bases de Datos Distribuidas

Volver

Filtrado por el tag: coordenadas polares

<<>>

Bases de Datos Distribuidas

Actualizado el 18 de Diciembre del 2018 (Publicado el 24 de Abril del 2017)

3.241 visualizaciones desde el 24 de Abril del 2017

335,1 KB

13 paginas

Creado hace 17a (08/02/2008)

Bases de Datos

Distribuidas

Vicente Toledo – Israel Miralles

Base de Datos Distribuidas

Pg-1

Indice

1. -¿Que son Bases de Datos Distribuidas?

1. -Comparación

2. -Arquitectura de las Bases de Datos

1. -Ejemplo de una Base de Datos Distribuidas

3. -Tipos de almacenamiento

1. -Replica
2. -Fragmentación

1. Fragmentación Horizontal
2. Fragmentación Vertical
3. Fragmentación Mixta

3. -Replica y Fragmentación

4. -Niveles de Transparencia en una Base de Datos Distribuida
5. -Procesamiento Distribuido de Consultas
6. -Recuperación
7. -Ventajas y Desventajas
8. -Bibliografía

Pg-3
Pg-3
Pg-4
Pg-5
Pg-6
Pg-6
Pg-6
Pg-6
Pg-7
Pg-8
Pg-9
Pg-9
Pg-10
Pg-11
Pg-12
Pg-13

Base de Datos Distribuidas

Pg-2

1.-¿Que son Bases de Datos Distribuidas?

-Son un grupo de datos que pertenecen a un sistema pero a su vez esta

reapartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en
una diferente localizacion geografica, cada sitio en la red es autónomo en sus
capacidades de procesamiento y es capaz de realizar operaciones locales y en cada
uno de estos ordenadores debe estar ejecutandose una aplicación a nivel global
que permita la consulta de todos los datos como si se tratase de uno solo.

1.- Comparación

Centralizado

Distribuido

Control centralizado:
un solo DBA

Independencia de Datos:

Organización de los datos es

transparente para el programador

Reducción de redundancia:
Una sola copia de datos que se

comparta

Control jerárquico:
DBA global y DBA local
Transparencia en la Distribución:
Localización de los datos es un

aspecto adicional de independencia

de datos

Replicación de Datos:

Copias múltiples de datos que
incrementa la localidad y la

disponibilidad de datos

Estructuras físicas complejas para

accesos eficientes

No hay estructuras intersitios. Uso
de optimización global para reducir

transferencia de datos

Seguridad

Problemas de seguridad intrínsecos

-Para tener una base de datos distribuida debe cumplirse las condiciones de una

Red Computacional. Una red de comunicación provee las capacicades para que un
proceso ejecutandose en un sitio de la red envie y reciba mensajes de otro proceso
ejecutandose en un sitio distinto. Parámetros a considerar incluyen: Retraso en la
entrega de mensajes, Costo de transmisión de un mensaje y Confiabilidade de la
red. Diferentes tipos de redes: point-to-point, broadcast, lan, wan.

Base de Datos Distribuidas

Pg-3

2.-Arquitectura de las Bases de Datos

Integración lógica por medio de diseño top-down (DistDB)

Global Schema

Fragmentation
Schema

Allocation
Schema

Local Mapping

Schema

. . . . . . . . . . . .

Local Mapping
Schema

DataBase
Manager
System

Local
Database

Sitio 1

. . . . . . . . . . . .

DataBase
Manager
System

Local
Database

Sitio n

Integración lógica por medio de bottom-up (Multidatabase)

Global Schema

Schema
Integration

. . . . . . . . . . . .

. . . . . . . . . . . .

Itermediate
Schema

Translator

Local
Conceptual
Schema

Local
Database

Sitio 1

Itermediate
Schema

Translator

Local
Conceptual
Schema

Local
Database

Sitio n

Base de Datos Distribuidas

Pg-4

-Global Schema: Define todos los datos que están incluidos en la bd distribuida tal
como si la bd no fuera distribuida. Consiste de una definición de relaciones
globales.
-Fragmentation Schema: Traducción entre relaciones globales y fragmentos. (Una
relación global puede consistir de varios fragmentos pero un fragmento está
asociado con sólo una relación global)
-Allocation Schema: Define el sitio (o sitios) en el cual un fragmennto está
localizado.
-Local Maping Schema: Traduce los fragamentos locales a los objetos que son
manejados por el SMBD local

Separación entre fragmentación y localización.

-Transparencia de Fragmentación

-Transparencia de Localización

-Control explícito de redundancia

-Independencia de BD locales

1.-Ejemplo de una Base de Datos Distribuidas

Base de Datos Distribuidas

Pg-5

3.-Tipos de almacenamiento

1-Replica
El sistema conserva varias copias o réplicas idénticas de unatabla. Cada réplica se
almacena en un nodo diferente.

Ventajas:

de los nodos.

Disponibilidad: El sistema sigue funcionando aún en caso de caída de uno

Aumento del paralelismo: Varios nodos pueden realizar consultas en
paralelo sobre la misma tabla. Cuantas más réplicas existan de la tabla, mayor
serála posibilidad de que el dato buscado se encuentre en el nodo desde el que se
realiza la consulta, minimizando con ello el tráfico de datos entre nodos.

Inconveniente:

Aumento de la sobrecarga en las actualizaciones: El sistema debe

asegurar que todas las réplicas de la tabla sean consistentes. Cuandose realiza
una actualización sobre una de las réplicas, los cambios deben propagarse a
todas las réplicas de dicha tabla a lo largo del sistema distribuido.

2.-Fragmentación

Existen tres tipos de fragmentacion la horizontal, la vertical y la mixta

1.-Fragmentación Horizontal

Unatabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos

se definen a través de una operación de selección y su reconstrucción se
realizaráconuna operación de unión de los fragmentos componentes.

Cada fragmento se sitúa en un nodo.

Base de Datos Distribuidas

Pg-6

Pueden existir fragmentos no disjuntos: combinación de

fragmentación y replicación.
Ejemplo:

Tabla inicial de alumnos

Tabla de alumnos fragmentada

2.-Fragmentación Vertical

Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos

se definen a través de una operación de proyección.

Cada fragmento debe incluir la clave primaria de la tabla. Su

reconstrucción se realizará con una operación de join de los fragmentos
componentes, pueden existir fragmentos no disjuntos: combinación de
fragmentación y replicación.

Base de Datos Distribuidas

Pg-7

Ejemplo:

3.-Fragmentación Mixta

Como el mismo nombre indica es una combinación de las dos

anteriores vistas he aquí un ejemplo apartir de una tabla fragmentada
horizontalmente.

Base de Datos Distribuidas

Pg-8

3.-Replica y Fragmentación

Las técnicas de réplica y fragmentación se pueden aplicar sucesivamente a la

misma relación de partida. Un fragmento se puede replicar y a su vez esa réplica
ser fragmentada, para luego replicar alguno de esos fragmentos.

4.-Niveles de Transparencia en una Base de Datos Distribuida

El propósito de establecer una arquitectura de un sistema de bases de datos

distribuidas es ofrecer un nivel de transparencia adecuado para el manejo de la
información.

La transparencia se define como la separación de la semántica de alto nivel de un

sistema de los aspectos de bajo nivel relacionados a la implementación del mismo. Un
nivel de transparencia adecuado permite ocultar los detalles de implementación a las
capas de alto nivel de un sistema y a otros usuarios.

El sistema de bases de datos distribuido permite proporcionar independencia de

los datos.

La independencia de datos se puede dar en dos aspectos: lógica y física.

.1 Independencia lógica de datos. Se refiere a la inmunidad de las aplicaciones

de usuario a los cambios en la estructura lógica de la base de datos. Esto
permite que un cambio en la definición de un esquema no debe afectar a las
aplicaciones de usuario. Por ejemplo, el agregar un nuevo atributo a una
relación, la creación de una nueva relación, el reordenamiento lógico de algunos
atributos.

.2 Independencia física de datos. Se refiere al ocultamiento de los detalles

sobre las estructuras de almacenamiento a las aplicaciones de usuario. la
descripción física de datos puede cambiar sin afectar a las aplicaciones de
usuario. Por ejemplo, los datos pueden ser movidos de un disco a otro, o la
organización de los datos puede cambiar.

La transparencia al nivel de red se refiere a que los datos en un SBDD se accedan

sobre una red de computadoras, sin embargo, las aplicaciones no deben notar su
existencia. La transparencia al nivel de red conlleva a dos cosas:

.1Transparencia sobre la localización de datos. el comando que se usa es
independiente de la ubicación de los datos en la red y del lugar en donde la
operación se lleve a cabo. Por ejemplo, en Unix existen dos comandos para hacer

Base de Datos Distribuidas

Pg-9

una copia de archivo. Cp se utiliza para copias locales y rcp se utiliza para copias
remotas. En este caso no existe transparencia sobre la localización.

.2Transparencia sobre el esquema de nombramiento. Lo anterior se logra
proporcionando un nombre único a cada objeto en el sistema distribuido. Así, no se
debe mezclar la información de la localización con en el nombre de un objeto.

La transparencia sobre replicación de datos se refiere a que si existen réplicas de

objetos de la base de datos, su existencia debe ser controlada por el sistema no por el
usuario. Se debe tener en cuenta que cuando el usuario se encarga de manejar las
réplicas en un sistema, el trabajo de éste es mínimo por lo que se puede obtener una
eficiencia mayor. Sin embargo, el usuario puede olvidarse de mantener la consistencia de
las réplicas teniendo así datos diferentes.

La transparencia a nivel de fragmentación de datos permite que cuando los objetos

de la bases de datos están fragmentados, el sistema tiene que manejar la conversión de
consultas de usuario definidas sobre relaciones globales a consultas definidas sobre
fragmentos. Así también, será necesario mezclar las respuestas a consultas fragmentadas
para obtener una sola respuesta a una consulta global. El acceso a una base de datos
distribuida debe hacerse en forma transparente.

En resumen, la transparencia tiene como punto central la independencia de datos.

La responsabilidad sobre el manejo de transparencia debe estar compartida tanto por
el sistema operativo, el sistema de manejo de bases de datos y el lenguaje de acceso a la
base de datos distribuida. Entre estos tres módulos se deben resolver los aspectos sobre
el procesamiento distribuido de co