Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

UD1.- Almacenamiento de la información.

3.- Bases de datos.


La gestión de las bases de datos ha experimentado gran cantidad de cambios, partiendo de
aplicaciones especializadas hasta llegar a convertirse en el núcleo de los entornos informáticos
modernos.

Conocer los sistemas que gestionan las bases de datos, sus conceptos fundamentales, el diseño,
lenguajes y la implementación de éstas, podemos considerarlo imprescindible para alguien que
se está formando en el campo de la informática.
3.1.- Conceptos.

Base de datos: Es una colección de datos relacionados lógicamente entre sí, con una definición y descripción
comunes y que están estructurados de una determinada manera. Es un conjunto estructurado de datos que
representa entidades y sus interrelaciones, almacenados con la mínima redundancia y posibilitando el acceso a ellos
eficientemente por parte de varias aplicaciones y usuarios.

La base de datos no sólo contiene los datos de la organización, también almacena una descripción de
dichos datos. Esta descripción es lo que se denomina metadatos, se almacena en el diccionario de
datos catálogo y es lo que permite que exista independencia de datos lógica-física.

Una base de datos constará de los siguientes elementos:

 Entidades: objeto real o abstracto con características diferenciadoras de otros, del que se
almacena información en la base de datos. Dicho de otra forma, es algo acerca de lo cual se
desea almacenar información. En una base de datos de una clínica veterinaria, posibles
entidades podrían ser: ejemplar, doctor, consulta, etc.
 Atributos: son los datos que se almacenan de la entidad. Cualquier propiedad o característica
de una entidad puede ser atributo. Continuando con nuestro ejemplo, podrían ser atributos:
raza, color, nombre, número de identificación, etc.
 Registros: donde se almacena la información de cada entidad. Es un conjunto de atributos que
contienen los datos que pertenecen a una misma repetición de entidad. En nuestro ejemplo, un
registro podría ser: 2123056, Sultán, Podenco, Gris, 23/03/2021.
 Campos: donde se almacenan los atributos de cada registro. Teniendo en cuenta el ejemplo
anterior, un campo podría ser el valor Podenco.

Las ventajas fundamentales que ofrece el uso de bases de datos se resumen a continuación:

 Acceso múltiple: diversos usuarios o aplicaciones podrán acceder a la base de datos, sin que
existan problemas en el acceso a los datos.
 Utilización múltiple: cada uno de los usuarios o aplicaciones podrán disponer de una visión
particular de la estructura de la base de datos, de tal manera que cada uno de ellos accederá
sólo a la parte que realmente le corresponde.
 Flexibilidad: la forma de acceder a la información puede ser establecida de diferentes maneras,
ofreciendo tiempos de respuesta muy reducidos.
 Confidencialidad y seguridad: el control del acceso a los datos podrá ser establecido para que
unos usuarios o aplicaciones puedan acceder a unos datos y a otros no, impidiendo a los
usuarios no autorizados la utilización de la base de datos.
 Protección contra fallos: en caso de errores en la información, existen mecanismos bien
definidos que permiten la recuperación de los datos de forma fiable.
UD1.- Almacenamiento de la información.

 Independencia física: un cambio de soporte físico de los datos (por ejemplo: el tipo de discos), no
afectaría a la base de datos o a las aplicaciones que acceden a ellos.
 Independencia lógica: los cambios realizados en la base de datos no afectan a las aplicaciones que
la usan.
 Redundancia: los datos se almacenan, por lo general, una única vez. Aunque si es necesario,
podríamos repetir información de manera controlada.
 Interfaz de alto nivel: mediante la utilización de lenguajes de alto nivel puede utilizarse la base
de datos de manera sencilla y cómoda.
 Consulta directa: existe una herramienta para poder acceder a los datos iinteractivamente.

3.2.- Usos.

¿Quién utiliza las bases de datos?

Existen cuatro tipos de personas que pueden hacer uso de una base de datos: el administrador, los
diseñadores de la base de datos, los programadores de aplicaciones y los usuarios finales.
Funciones y características de los usuarios de una base de datos.

Tipo Funciones y características

Es la persona encargada de la creación o implementación física de la


base de datos. Es quien escoge los tipos de ficheros, los índices que hay
El que crear, la ubicación de éstos, etc. En general, es quien toma las
administrador decisiones relacionadas con el funcionamiento físico del
almacenamiento de información. Siempre teniendo en cuenta las
posibilidades del sistema de información con el que trabaje. Junto a
estas tareas, el administrador establecerá la política de seguridad y de
acceso para garantizar el menor número de problemas.
Son las personas encargadas de diseñar cómo será la base de datos.
Llevarán a cabo la identificación de los datos, las relaciones entre ellos,
sus restricciones, etc. Para ello han de conocer a fondo los datos y
Los procesos a representar en la base de datos. Si estamos hablando de una
diseñadores empresa, será necesario que conozcan las reglas de negocio en la que
ésta se mueve. Para obtener un buen resultado, el diseñador de la base
de datos debe implicar en el proceso a todos los usuarios de la base de
datos, tan pronto como sea posible.

Una vez diseñada y construida la base de datos, los programadores se


encargarán de implementar los programas de aplicación que servirán a
Los
los usuarios finales. Estos programas de aplicación ofrecerán la
programadores
posibilidad de realizar consultas de datos, inserción, actualización o
de aplicaciones
eliminación de los mismos. Para desarrollar estos programas se utilizan
lenguajes de tercera o cuarta generación

Son los clientes finales de la base de datos. Al diseñar, implementar y


Los usuarios
mantener la base de datos se busca cumplir los requisitos establecidos
finales
por el cliente para la gestión de su información.
UD1.- Almacenamiento de la información.

3.3.- Ubicación de la información.

Los sistemas de almacenamiento de información más utilizados para el despliegue de bases de


datos. Comenzaremos por aquellos en los que pueden alojarse bases de datos de tamaño pequeño y
mediano, para después analizar los sistemas de alta disponibilidad de grandes servidores.

Discos SATA: Es una interfaz de transferencia de datos entre la placa base y algunos
dispositivos de almacenamiento, como puede ser el disco duro, lectores y regrabadores de
CD/DVD/BD, Unidades de Estado Sólido u otros dispositivos. SATA proporciona mayores
velocidades, mejor aprovechamiento cuando hay varias unidades, mayor longitud del cable de
transmisión de datos y capacidad para conectar unidades al instante, es decir, insertar el
dispositivo sin tener que apagar el ordenador. La primera generación específica en
transferencias de 150 Megabytes por segundo, también conocida por SATA 150 MB/s o Serial
ATA-150. Actualmente se comercializan dispositivos SATA II, a 300 MB/s, también conocida
como Serial ATA-300 y los SATA III con tasas de transferencias de hasta 600 MB/s.

Discos SCSI Son interfaces preparadas para discos duros de gran capacidad de
almacenamiento y velocidad de rotación. Se presentan bajo tres especificaciones: SCSI
Estándar (Standard SCSI), SCSI Rápido (Fast SCSI) y SCSI Ancho-Rápido (Fast-Wide SCSI).
Su tiempo medio de acceso puede llegar a 7 milisegundos y su velocidad de transmisión
secuencial de información puede alcanzar teóricamente los 5 MB/s en los discos SCSI
Estándares, los 10 MBps en los discos SCSI Rápidos y los 20 MBps en los discos SCSI
Anchos-Rápidos (SCSI-2). Un controlador SCSI puede manejar hasta 7 discos duros SCSI.

RAID: acrónimo de Redundant Array of Independent Disks o matriz de discos


independientes, es un contenedor de almacenamiento redundante. Se basa en el montaje en
conjunto de dos o más discos duros, formando un bloque de trabajo, para obtener desde una
ampliación de capacidad a mejoras en velocidad y seguridad de almacenamiento. Según las
características que queramos primar, se establecen distintos sistemas de RAID.

Sistemas NAS Es el acrónimo de Network Attached Storage ó sistema de almacenamiento


masivo en red. Estos sistemas de almacenamiento permiten compartir la capacidad de
almacenamiento de un computador (Servidor) con ordenadores personales o servidores clientes
a través de una red, haciendo uso de un sistema operativo optimizado para dar acceso a los
datos a través de protocolos de comunicación específicos. Suelen ser dispositivos para
almacenamiento masivo de datos con capacidades muy altas, de varios Terabytes,
generalmente superiores a los discos duros externos y además se diferencian de éstos al estar
conectardos en red.

Sistemas SAN Acrónimo de Storage A ea Network o red de área de almacenamiento. Se


trata de una red concebida para conectar servidores, matrices (arrays) de discos y librerías
de soporte. La arquitectura de este tipo de sistemas permite que los recursos de
almacenamiento estén disponibles para varios servidores en una red de área local o amplia.
Debido a que la información almacenada no reside directamente en ninguno de los servidores
de la red, se optimiza el poder de procesamiento para aplicaciones comerciales y la capacidad
de almacenamiento se puede proporcionar en el servidor donde más se necesite.

4.- Modelos de bases de datos.


La clasificación tradicional de las bases de datos establece tres modelos de bases de datos:
jerárquico, en red y relacional. En la actualidad el modelo de bases de datos más extendido es el
relacional. Aunque, hay que tener en cuenta que dos de sus variantes (modelo de bases de datos
distribuidas y orientadas a objetos) son las que se más se están utilizando en los últimos tiempos.

En los siguientes epígrafes analizaremos cada uno de ellos, así como otros modelos de bases de datos
UD1.- Almacenamiento de la información.

existentes

Existen cinco modelos de DBMS, que se distinguen según como representan los datos almacenados:

 El modelo jerárquico: los datos se organizan jerárquicamente mediante un árbol invertido. Este
modelo utiliza punteros para navegar por los datos almacenados. Fue el primer modelo DBMS.

© CCM

 El modelo de red: al igual que el modelo jerárquico, este modelo utiliza punteros hacia los datos
almacenados. Sin embargo, no necesariamente utiliza una estructura de árbol invertido.

© CCM

 El modelo relacional (RDBMS, Relational database management system o Sistema de


administración de bases de datos relacionales]). Los datos se almacenan en tablas de dos
dimensiones: filas y columnas. Los datos se manipulan según la teoría relacional de matemáticas.

© CCM

 El modelo deductivo: los datos se representan como una tabla, pero se manipulan mediante
cálculos de predicados.
 El modelo de orientación a objetos (ODBMS, object-oriented database management system
[sistema de administración de bases de datos orientadas a objetos]): los datos se almacenan como
objetos, que son estructuras denominadas clases que muestran los datos que contienen. Los campos
son instancias de estas clases.
UD1.- Almacenamiento de la información.

4.1.- Modelo jerárquico.


Cuando IBM creó su Sistema Administrador de Información o IMS, se establecieron las bases
para que la gran mayoría de sistemas de gestión de información de los años setenta utilizaran el
modelo jerárquico. También recibe el nombre de modelo en árbol, ya que utiliza una estructura en
árbol invertido para la organización de los datos.

La información se organiza con una jerarquía, en la que la relación entre las entidades de este
modelo siempre es del tipo padre/hijo. De tal manera que existen nodos que contienen atributos o
campos y que se relacionarán con sus nodos hijos, pudiendo tener cada nodo más de un hijo, pero un
nodo siempre tendrá un sólo padre.

Los datos de este modelo se almacenan en estructuras lógicas llamadas segmentos. Los segmentos se
relacionan entre sí utilizando arcos. La forma visual de este modelo es de árbol invertido. En la parte
superior están los padres y en la inferior los hijos.

Hoy en día, debido a sus limitaciones, el modelo jerárquico está en desuso. En el siguiente gráfico
puedes observar la estructura de almacenamiento del modelo jerárquico.

4.2.- Modelo en red.


El modelo de datos en red aparece a mediados de los sesenta como respuesta a limitaciones del
modelo jerárquico en cuanto a representación de relaciones más complejas. Podemos considerar a
IDS (Integrated Data Store) de Bachman como el primer sistema de base de datos en red. Tras él
se intentó crear un estándar de modelo de red por parte de
CODASYL, siendo un modelo que tuvo gran aceptación a principios de los setenta.

El modelo en red organiza la información en registros (también llamados nodos) y enlaces. En los
registros se almacenan los datos, mientras que los enlaces permiten relacionar estos datos. Las
bases de datos en red son parecidas a las jerárquicas sólo que en ellas puede haber más de un
padre.

En este modelo se pueden representar perfectamente cualquier tipo de relación entre los datos,
pero hace muy complicado su manejo. Al no tener que duplicar la información se ahorra espacio de
almacenamiento.

El sistema de gestión de información basado en el modelo en red más popular es el sistema IDMS
(Integrated Database Management System)
UD1.- Almacenamiento de la información.

4.3- Modelo relacional.

El modelo relacional es posterior a los dos anteriores y fue desarrollado por Codd en 1970. Hoy en
día las bases de datos relacionales son las más utilizadas.

En el modelo relacional, la base de datos es percibida por el usuario como un conjunto de tablas. Esta
percepción es sólo a nivel lógico, ya que a nivel físico puede estar implementada mediante distintas
estructuras de almacenamiento

El modelo relacional utiliza tablas bidimensionales (relaciones) para la representación lógica de los
datos y las relaciones entre ellos. Cada relación (tabla) posee un nombre que es único, y contiene un
conjunto de columnas.

Se llamará registro, entidad o tupla a cada fila de la tabla y campo atributo a cada
columna de la tabla.

Al conjunto de valores que puede tomar un determinado atributo, se le denomina dominio Una

clave será un atributo o conjunto de atributos que identifique de forma única a una tupla. Las tablas

deben cumplir una serie de requisitos:

Todos los registros son del mismo tipo.


La tabla sólo puede tener un tipo de registro. No
existen campos o atributos repetidos.
No existen registros duplicados.
No existe orden en el almacenamiento de los registros.
Cada registro o tupla es identificada por una clave, que puede estar formada por uno o varios
campos o atributos.

A continuación, puedes observar cómo es una relación, con sus tuplas y atributos, en el modelo
relacional.

El lenguaje habitual para construir las consultas a bases de datos relacionales es SQL Structured
Query Language o Lenguaje Estructurado de Consultas. Un estándar implementado por los
principales motores o sistemas de gestión de bases de datos relacionales.

Durante su diseño, una base de datos relacional pasa por un proceso al que se conoce como
normalización de una base de datos.
4.4.- Modelo orientado a objetos.
El modelo orientado a objetos define una base de datos en términos de objetos, sus propiedades y sus
operaciones. Los objetos con la misma estructura y comportamiento pertenecen a una clase, y las clases
se organizan en jerarquías. Las operaciones de cada clase se especifican en términos de procedimientos
predefinidos denominados métodos. Algunos sistemas existentes en el mercado, basados en el modelo
relacional, han sufrido evoluciones incorporando conceptos orientados a objetos. A estos modelos se
les conoce como sistemas objeto-relacionales

El objetivo del modelo orientado a objetos es cubrir las limitaciones del modelo relacional. Gracias a
este modelo se incorporan mejoras como la herencia entre tablas, los tipos definidos por el usuario,
soporte multimedia, etc.

Los conceptos más importantes del paradigma de objetos que el modelo orientado a objetos
incorpora son:

Encapsulación - Propiedad que permite ocultar la información al resto de los objetos,


impidiendo así accesos incorrectos o conflictos.
Herencia - Propiedad a través de la cual los objetos heredan comportamiento dentro de una
jerarquía de clases.
Polimorfismo - Propiedad de una operación mediante la cual puede ser aplicada a distintos
tipos de objetos.

Desde la aparición de la programación orientada a objetos (POO u OOP) se empezó a pensar en


bases de datos adaptadas a estos lenguajes. Este modelo es considerado como el fundamento de las
bases de datos de tercera generación, siendo consideradas las bases de datos en red como la primera
y las bases de datos relacionales como la segunda generación. Aunque no han reemplazado a las
bases de datos relacionales, sí son el tipo de base de datos que más está creciendo en los últimos
años.
4.5.- Otros modelos.

a. Modelo Objeto-Relacional:
Las bases de datos pertenecientes a este modelo, son un híbrido entre las bases del modelo relacional
y el orientado a objetos. El mayor inconveniente de las bases de datos orientadas a objetos radica en
los costes de la conversión de las bases de datos relacionales a bases de datos orientadas a objetos.

En una base de datos objeto-relacional (BDOR) siempre se busca obtener lo mejor del modelo
relacional, incorporando las mejoras ofrecidas por la orientación a objetos. En este modelo se
siguen almacenando tuplas, aunque la estructura de las tuplas no está restringida, sino que las
relaciones pueden ser definidas en función de otras, que es lo que denominamos herencia directa.

El estándar en el que se basa este modelo es SQL99. Este estándar ofrece la


posibilidad de añadir a las bases de datos relacionales procedimientos almacenados de usuario, triggers,
tipos definidos por el usuario, consultas recursivas, bases de datos
OLAP, tipos LOB

Otra característica a destacar es la capacidad para incorporar funciones que tengan un código en algún
lenguaje de programación, como por ejemplo: SQL, Java, C, etc.

La gran mayoría de las bases de datos relacionales clásicas de gran tamaño, como Oracle, SQL
Server, etc., son objeto-relacionales.

b. Modelo de bases de datos deductivas:


En este modelo las bases de datos almacenan la información y permiten realizar
deducciones a través de inferencias Es decir, se derivan nuevas informaciones a
partir de las que se han introducido explícitamente en la base de datos por parte del usuario
Las bases de datos deductivas son también llamadas bases de datos lógicas, al basarse en lógica
matemática. Surgieron para contrarrestar las limitaciones del modelo relacional para la respuesta a
consultas recursivas y la deducción de relaciones indirectas entre os datos almacenados

c. Bases de datos multidimensionales


Son bases de datos ideadas para desarrollar aplicaciones muy concretas. Básicamente almacena sus datos
con varias dimensiones, es decir, que en vez de un valor, encontramos varios dependiendo de los ejes
definidos, o una base de datos de estructura basada en dimensiones orientada a consultas complejas y alto
rendimiento. En una base de datos multidimensional, la información se representa como matrices
multidimensionales, cuadros de múltiples entradas o funciones de varias variables sobre conjuntos
finitos. Cada una de estas matrices se denomina cubo. Eso facilita el manejo de grandes cantidades de
datos dentro de empresas, dándole a ésto una amplia aplicación dentro de varias áreas y diferentes campos
del conocimiento humano.
d. Bases de datos transaccionales
Son bases de datos caracterizadas por su velocidad para gestionar el intercambio de información. Se
utilizan sobre todo en sistemas bancarios, análisis de calidad y datos de producción industrial. Son
bases de datos muy fiables, ya que en ellas cada una de las operaciones de inserción, actualización o
borrado se realizan completamente o se descartan. Entre la más destacadas se encuentra Oracle.

. Modelo de bases de datos orientadas a documentos. En este modelo el principal objeto de gestión
es el documento, que contiene datos semiestructurados que podrán estar almacenados en algún
formato, por ejemplo XML. Como ejemplo de este tipo de bases de datos puedes encontrar
MongoDB y CouchDB

5.- Tipos de bases de datos.


Descripción de los tipos de bases de datos teniendo en cuenta varios criterios.

CLASIFICACIÓN DE LAS BASES DE DATOS

Accede a través del siguiente documento una completa clasificación de las bases de datos, teniendo
en cuenta diferentes puntos de vista, podrás conocer la gran variedad de tipos que existen.

Clasificación de las bases de datos:

Bases de datos según su contenido


 Bases de datos con información actual: contienen información muy concreta y actualizada,
normalmente, de tipo numérico: estadísticas, series históricas, resultados de encuestas,
convocatorias de becas o subvenciones, convocatorias de eventos, ofertas de empleo,...
 Directorios: recogen datos sobre personas o instituciones especializadas en una actividad o
materia concreta. Hay directorios de profesionales, de investigadores, de centros de
investigación, de bibliotecas, de revistas científicas, de empresas, de editoriales,...
 Bases de datos documentales. En este último grupo, cada registro se corresponde con un
documento, sea éste de cualquier tipo: una publicación impresa, un documento audiovisual,
gráfico. Dependiendo de si incluyen o no el contenido completo de los documentos que
describen, podremos tener:
o Bases de datos de texto completo: constituidas por los propios documentos en
formato electrónico, por un volcado completo de su texto.
o Archivos electrónicos de imágenes: constituidos por referencias que permiten un
enlace directo con la imagen del documento original, sea éste un documento iconográfico
(fotografías, imágenes de televisión,...) o un documento impreso digitalizado en
formato de imagen.
o Bases de datos referenciales: sus registros no contienen el texto original sino tan sólo
la información fundamental para describir y permitir la localización de documee
obtener referencias sobre documentos que habrá que localizar posteriormente en otro
servicio (archivo, biblioteca, fototeca, fonoteca,...) o solicitar a un servicio de
suministro de documentos.

Bases de datos según su uso.


 Base de datos individual: Es una base de datos utilizada básicamente por una persona. El
sistema administrador de la base de datos y los datos son controlados por el mismo usuario.
Puede estar almacenada en la unidad de disco duro del usuario o en el servidor de archivos de
una red de área local. Por ejemplo, un gerente de ventas podría contar con una base de datos
para el control de sus vendedores y su desempeño.
 Base de datos compartida: Son bases de datos con múltiples usuarios y que muy
probablemente pertenezcan a la misma organización, como la base de datos de una
compañía. Se encuentra almacenada en una computadora potente y bajo el cuidado de un
profesional en el área, el administrador de la base de datos. Los usuarios tienen acceso a la
base de datos mediante una red de área local o una red de área extensa.
 Base de datos de acceso público: Son bases de datos accesibles por cualquier persona. Puede
no ser necesario pagar un canon para hacer uso de los datos contenidos en ellas.
 Base de datos propietarias o bancos de datos: Se trata en general de bases de datos de gran
tamaño, desarrolladas por una organización y que contienen temas especializados o de
carácter particular. El público general puede tener acceso a estas bases a veces de forma
gratuita y otras mediante el pago de una cuota. Pueden ofrecer información que va desde
negocios, economía, inversión, técnica y científica hasta servicios de entretenimiento.
Permiten encontrar en minutos lo que tardaría horas ojeando revistas.

Bases de datos según la variabilidad de la información


 Bases de datos estáticas: Son bases de datos de sólo lectura. Se utilizan para el
almacenamiento de datos históricos que pueden ser analizados y utilizados para el estudio
del comportamiento de un conjunto de datos a través del tiempo. Permiten realizar
proyecciones y toma de decisiones.
 Bases de datos dinámicas: Son bases de datos donde la información almacenada se modifica
con el tiempo, permitiendo operaciones como actualización y adición de datos, además de las
operaciones fundamentales de consulta.

Bases de datos según la localización de la información


 Bases de datos centralizadas: Se trata de bases de datos ubicadas en un único lugar, un único
computador. Pueden ser bases de datos monousuario que se ejecutan en ordenadores
personales o sistemas de bases de datos de alto rendimiento que se ejecutan en grandes
sistemas. Este tipo de organización facilita las labores de mantenimiento, sin embargo, hace
que la información contenida en dicha base, sea más vulnerable a posibles fallos y limita su
acceso. Este tipo de bases de datos puede ofrecer dentro de la arquitectura Cliente/Servidor dos
configuraciones:
o Basada en anfitrión: ocurre cuando la máquina cliente y la máquina servidor son la
misma. Los usuarios se conectarán directamente a la máquina donde se encuentra la
base de datos.
o Basada en Cliente/Servidor: ocurrirá cuando la base de datos reside en una máquina
servidor y los usuarios acceden a la base de datos desde su máquina cliente a través
de una red.
 Bases de datos distribuidas: Según la naturaleza de la organización es probable que los datos
no se almacenen en un único punto, sino que se sitúen en un lugar o lugares diferentes a
donde se encuentran los usuarios. Una base de datos distribuida es la unión de las bases de datos
mediante redes. Los usuarios se vinculan a los servidores de bases de datos distantes mediante
una amplia variedad de redes de comunicación. Puede imaginarse una compañía con
diferentes oficinas regionales, donde se encuentra distribuida la base de datos. Sin embargo,
los ejecutivos pueden tener acceso a la información de todas las oficinas regionales.

Bases de datos según el organismo productor


 Bases de datos de organismos públicos y de la Administración: Las bibliotecas y centros de
documentación de los ministerios, instituciones públicas, universidades y organismos públicos
de investigación elaboran gran cantidad de recursos de información. Estos sistemas pueden
ser:
o Bases de datos de acceso público, sean gratuitas o no.
o Bases de datos de uso interno, con información de acceso restringido.
 Bases de datos de instituciones sin ánimo de lucro: Fundaciones, asociaciones, Sindicatos y
organizaciones no gubernamentales elaboran frecuentemente sus propios sistemas de
información especializados.
 Bases de datos de entidades privadas o comerciales: Los centros de documentación,
bibliotecas y archivos de las empresas pueden elaborar distintos tipos de sistemas de
información:
o Bases de datos de uso interno para facilitar la circulación de información dentro de la
empresa
o Bases de datos de uso interno que ocasionalmente ofrecen servicio hacia el exterior
(usuarios particulares u otras instituciones)
o Bases de datos comerciales, diseñadas específicamente para ser utilizadas por usuarios
externos
 Bases de datos realizadas por cooperación en red: Se trata de sistemas de información cuya
elaboración es compartida por diversas instituciones. bases de datos internacionales se
elaboran a través de este sistema de trabajo, con diversos centros nacionales responsables de
la información perteneciente a cada país.

Bases de datos según el modo de acceso


 Bases de datos de acceso local: Para consultarlas es necesario acudir al organismo productor,
a su biblioteca o centro de documentación. Pueden ser consultables en monopuesto o en
varios puntos de una red local.
 Bases de datos en CD-ROM: Pueden adquirirse por compra o suscripción bien directamente
por un particular o por una biblioteca o centro de documentación que permita su consulta a
sus usuarios. En algunas instituciones se instalan diferentes CD- ROM en una red local para
permitir su consulta desde cualquier ordenador conectado a la misma.
 Bases de datos en línea: Pueden consultarse desde cualquier ordenador conectado a Internet.
La consulta puede ser libre (gratuita) o exigir la solicitud previa de una clave personal de
entrada (denominada comúnmente con el término inglés password). Para obtener un
password puede exigirse la firma de un contrato. Hay diferentes tipos de acceso en línea:
o Acceso vía telnet o mediante línea de Internet: el usuario realiza una conexión estable
al host (gran ordenador) en donde se halla la base de datos, a través de Internet. La
interfaz de usuario instalada en dicho ordenador remoto determinará si la
interrogación debe realizarse por menús o por comandos o expresiones de un lenguaje
determinado. Cuando un usuario entra en una base de datos vía telnet establece una sesión
de trabajo interactiva con el programa que gestiona la base de datos, que le permite
aplicar todas las posibilidades de interrogación que tenga el sistema: selección,
combinación y visualización o impresión de resultados. En cualquier momento podrá
visualizar todas las búsquedas realizadas hasta ese instante y establecer combinaciones
entre ellas.
o Acceso vía web: conexión a través de un formulario existente en una página web de
Internet, diseñado para lanzar preguntas a una base de datos.

Una misma base de datos puede tener acceso local y además una edición en CD-ROM y un sistema
de acceso en línea. Sin embargo, puede haber diferencias en el contenido presente en cada uno de estos
formatos o en el grado de actualización de la información. Por ejemplo, el productor de una base de
datos puede ofrecer la conexión en línea a la base de datos completa con actualización diaria y, en
cambio, editar un CD-ROM que tan sólo contenga los últimos cinco años de información y se actualice
semestralmente.

Bases de datos según cobertura temática


 Bases de datos científico-tecnológicas: contienen información destinada a los investigadores
de cualquier ámbito científico o técnico. A su vez, este grupo puede dividirse en:
o Bases de datos multidisciplinares: abarcan varias disciplinas científicas o técnicas.
o Bases de datos especializadas: recopilan y analizan documentos pertinentes para una
disciplina o subdisciplina concreta: investigación biomédica, farmacéutica, química,
agroalimentaria, social, humanística, etc.
 Bases de datos económico-empresariales: contienen información de interés para empresas,
entidades financieras,....
 Bases de datos de medios de comunicación: contienen información de interés para los
profesionales de medios de comunicación de masas: prensa, radio, televisión,...
 Bases de datos del ámbito político-administrativo y jurídico: contienen información de
interés para los organismos de la administración y los profesionales del Derecho:
legislación, jurisprudencia,...
 Bases de datos del ámbito sanitario: además de las propias del primer grupo especializadas en
ciencias de la salud, existen otros sistemas con información de interés sanitario: historiales
médicos, archivos hospitalarios,...
 Bases de datos para el gran público: contienen información destinada a cubrir necesidades de
información general, de interés para un gran número de usuarios.

En el siguiente esquema puedes ver los tipos de bases de datos:


6.- Sistemas gestores de base de datos.
Para poder tratar la información contenida en las bases de datos se utilizan los sistemas gestores de
bases de datos o SGBD, también llamados DBMS (DataBase Management System), que ofrecen un
conjunto de programas que permiten acceder y gestionar dichos datos.

El objetivo fundamental de los SGBD es proporcionar eficiencia y seguridad a la hora de


recuperar o insertar información en las bases de datos. Estos sistemas están diseñados para la
manipulación de grandes bloques de información.

Sistema Gestor de Base de Datos (SGBD) es un conjunto coordinado de programas, procedimientos,

El SGBD permite a los usuarios la creación y el mantenimiento de una base de datos, facilitando la
definición, construcción y manipulación de la información contenida en ésta. Definir una base de
datos consistirá en especificar los tipos de datos, las estructuras y las restricciones que los datos han
de cumplir a la hora de almacenarse en dicha base. Por otro lado, la construcción de la base de datos
será el proceso de almacenamiento de datos concretos en algún medio o soporte de almacenamiento
que esté supervisado por el SGBD. Finalmente, la manipulación de la base de datos incluirá la
posibilidad de realización de consultas para recuperar información específica, la actualización de los
datos y la generación de informes a partir de su contenido.

Las ventajas del uso de SGBD son:

 Proporcionan al usuario una visión abstracta de los datos, ocultando parte de la complejidad
relacionada con cómo se almacenan y mantienen los datos.
 Ofrecen Independencia física, es decir, la visión que tiene de la información el usuario, y la
manipulación de los datos almacenados en la Base de Datos, es independiente de cómo estén
almacenados físicamente.
 Disminuyen la redundancia y la inconsistencia de datos.
 Aseguran la integridad de los datos.
 Facilitan el acceso a los datos, aportando rapidez y evitando la pérdida de datos.
 Aumentan la seguridad y privacidad de los datos.
 Mejoran la eficiencia.
 Permiten compartir datos y accesos concurrentes.
 Facilitan el intercambio de datos entre distintos sistemas.
 Incorporan mecanismos de copias de seguridad y recuperación para restablecer la información en
caso de fallos en el sistema.

El SGBD interacciona con otros elementos software existentes en el sistema, concretamente con el
sistema operativo (SO). Los datos almacenados de forma estructurada en la base de datos son utilizados
indistintamente por otras aplicaciones. Será el SGBD quien ofrecerá una serie de facilidades a éstas para
el acceso y manipulación de la información, basándose en las funciones y métodos propios del sistema
operativo.
6.1.- Funciones.

Un SGBD desarrolla tres funciones fundamentales: descripción, manipulación y control o utilización d

A continuación se detallan cada una de ellas.

Función de descripción o definición: Permite al diseñador de la base de datos crear las estructuras
apropiadas para integrar adecuadamente los datos. Esta función es la que permite definir las tres
estructuras de la base de datos: Estructura interna, Estructura conceptual y Estructura externa. (Estos
conceptos se verán más adelante en el epígrafe sobre arquitectura del SGBD).

Esta función se realiza mediante el lenguaje de descripción


de datos o DDL. Mediante ese lenguaje: se definen las estructuras de datos,se definen las
relaciones entre los datos y se definen las reglas (restricciones) que han de cumplir los datos.

Se especificarán las características de los datos a cada uno de los tres niveles y el SGBD se
ocupará de la transformación de las estructuras externas orientadas a los usuarios a las estructuras
conceptuales y de la relación de ésta y la estructura física..

A nivel interno (estructura interna), se ha de indicar el espacio de disco reservado para


la base de datos, la longitud de los campos, su modo de representación (lenguaje para la
definición de la estructura externa).

A nivel conceptual (estructura conceptual), se proporcionan herramientas para la


definición de las entidades y su identificación, atributos de las mismas, interrelaciones
entre ellas, restricciones de integridad, etc.; es decir, el esquema de la base de datos
(lenguaje para la definición de estructura lógico global).

A nivel externo (estructura externa), se deben definir las vistas de los distintos usuarios
a través del lenguaje para la definición de estructuras externas.

Función de manipulación: permite a los usuarios de la base buscar, añadir, suprimir o modificar
los datos de la misma, siempre de acuerdo con las especificaciones y las normas de seguridad
dictadas por el administrador. Se llevará a cabo por medio de un lenguaje de manipulación de
datos ( DML) que facilita los instrumentos necesarios para la realización de estas tareas.

También se encarga de definir la vista externa de todos los usuarios de la base de datos o
vistas parciales que cada usuario tiene de los datos definidos con el DDL.

Por manipulación de datos entenderemos:

La recuperación de información almacenada en la base de datos, lo que se conoce como


consultas
La inserción de información nueva en la base de datos.
El borrado de información de la base de datos.
La modificación de información almacenada en la base de datos.

Función de control: permite al administrador de la base de datos establecer mecanismos de


protección de las diferentes visiones de los datos asociadas a cada usuario, proporcionando
elementos de creación y modificación de dichos usuarios. Adicionalmente, incorpora sistemas
para la creación de copias de seguridad, carga de ficheros, auditoría, protección de ataques,
configuración del sistema, etc. El lenguaje que implementa esta función es el lenguaje de
control de datos o DCL
6.2.- Componentes.
Una vez descritas las funciones que un SGBD debe llevar a cabo, imaginarás que un SGBD es un
paquete de software complejo que ha de proporcionar servicios relacionados con el almacenamiento
y la explotación de los datos de forma eficiente. Para ello, cuenta con una serie de componentes que
se detallan a continuación:

1. Lenguajes de la base de datos. Cualquier sistema gestor de base de datos ofrece la posibilidad de
utilizar lenguajes e interfaces adecuadas para sus diferentes tipos de usuarios. A través de los
lenguajes se pueden especificar los datos que componen la BD, su estructura, relaciones, reglas de
integridad, control de acceso, características físicas y vistas externas de los usuarios. Los lenguajes
del SGBD son:
Lenguaje de Definición de los Datos (DDL), Lenguaje de Manejo de Datos (DML) y Lenguaje
de Control de Datos (DCL).

2. El diccionario de datos. Descripción de los datos almacenados. Se trata de información útil


para los programadores de aplicaciones. Es el lugar donde se deposita la información sobre la
totalidad de los datos que forman la base de datos. Contiene las características lógicas de las
estructuras que almacenan los datos, su nombre, descripción, contenido y organización. En una
base de datos relacional, el diccionario de datos aportará información sobre:
Estructura lógica y física de la BD.
Definición de tablas, vistas, indices, disparadores, procedimientos, funciones, etc. Cantidad
de espacio asignado y utilizado por los elementos de la BD.
Descripción de las restricciones de integridad.
Información sobre los permisos asociados a cada perfil de usuario. Auditoría
de acceso a los datos, utilización, etc.

3. El gestor de la base de datos. Es la parte de software encargada de garantizar el correcto,


seguro, íntegro y eficiente acceso y almacenamiento de los datos. Este componente es el
encargado de proporcionar una interfaz entre los datos almacenados y los programas de
aplicación que los manejan. Es un intermediario entre el usuario y los datos. Es el encargado de
garantizar la privacidad, seguridad e integridad de los datos, controlando los accesos
concurrentes e interactuando con el sistema operativo.

4. Usuarios de la base de datos. En los SGBD existen diferentes perfiles de usuario, cada uno de
ellos con una serie de permisos sobre los objetos de la BD. Generalmente existirán:
El administrador de la base de datos o Database Administrator ( DBA), que será la persona
o conjunto de ellas encargadas de la función de administración de la base de datos. Tiene el
control centralizado de la base de datos y es el responsable de su buen
funcionamiento. Es el encargado de autorizar el acceso a la base de datos, de coordinar y
vigilar su utilización y de adquirir los recursos software y hardware que sean necesarios.
Los usuarios de la base de datos, que serán diferentes usuarios de la BD con diferentes
necesidades sobre los datos, así como diferentes accesos y privilegios. Podemos
establecer la siguiente clasificación:
Diseñadores.
Operadores y personal de mantenimiento.
Analistas y programadores de aplicaciones.
Usuarios finales: ocasionales, simples, avanzados y autónomos.
5. Herramientas de la base de datos. Son un conjunto de aplicaciones que permiten a los
administradores la gestión de la base de datos, de los usuarios y permisos, generadores de
formularios, informes, interfaces gráficas, generadores de aplicaciones, etc.
6.3.- Arquitectura.

Un SGBD cuenta con una arquitectura a través de la que se simplifica a los diferentes usuarios de la
base de datos su labor. El objetivo fundamental es separar los programas de aplicación de la base
de datos física.

Encontrar un estándar para esta arquitectura no es una tarea sencilla, aunque los tres estándares que
más importancia han cobrado en el campo de las bases de datos son ANSI/SPARC/X3, CODASYL
y ODMG (éste sólo para las bases de datos orientadas a objetos). Tanto ANSI (EEUU), como ISO
(resto del mundo), son el referente en cuanto a estandarización de bases de datos, conformando un
único modelo de bases de datos.

La arquitectura propuesta proporciona tres niveles de abstracción nivel interno o físico, nivel
lógico o conceptual y nivel externo o de visión del usuario. A continuación se detallan las
características de cada uno de ellos:

1. Nivel interno o físico: En este nivel se describe la estructura física de la base de datos a través
de un esquema interno encargado de detallar el sistema de almacenamiento de la base de datos
y sus métodos de acceso. Es el nivel más cercano al almacenamiento físico. A través del
esquema físico se indican, entre otros, los archivos que contienen la información, su
organización, los métodos de acceso a los registros, los tipos de registros, la longitud, los
campos que los componen, las unidades de almacenamiento, etc.

2. Nivel lógico o conceptual: En este nivel se describe la estructura completa de la base de


datos a través de un esquema que detalla las entidades, atributos, relaciones, operaciones de los
usuarios y restricciones. Los detalles relacionados con las estructuras de almacenamiento se
ocultan, permitiendo realizar una abstracción a más alto nivel.

3. Nivel externo o de visión del usuario: En este nivel se describen las diferentes vistas que los
usuarios percibirán de la base de datos. Cada tipo de usuario o grupo de ellos verá sólo la parte
de la base de datos que le interesa, ocultando el resto.

Para una base de datos, sólo existirá un único esquema interno, un único esquema conceptual y
podrían existir varios esquemas externos definidos para uno o varios usuarios.

Gracias a esta arquitectura se consigue la independencia de datos a dos niveles:

1. Independencia lógica: Podemos modificar el esquema conceptual sin alterar los esquemas
externos ni los programas de aplicación.

2. Independencia física: Podemos modificar el esquema interno sin necesidad de modificar el


conceptual o el externo. Es decir, se puede cambiar el sistema de almacenamiento, reorganizar
los ficheros, añadir nuevos, etc., sin que esto afecte al resto de esquemas.

En el siguiente gráfico se puede apreciar la estructura de la que estamos hablando:


Reflexiona
Revisa los conceptos con el siguiente esquema:

6.4.- Tipos.

¿Qué tipos de SGBD existen? Para responder a esta pregunta podemos realizar la siguiente
clasificación, atendiendo a diferentes criterios:

. Según el modelo lógico en que se basan. Actualmente, el modelo lógico que más se utiliza es
el relacional. Los modelos en red y jerárquico han quedado obsoletos. Otro de los modelos
que más extensión está teniendo es el modelo orientado a objetos. Por tanto, en esta primera
clasificación tendremos:
Modelo Jerárquico.
Modelo de Red.
Modelo Relacional.
Modelo Orientado a Objetos.
(Para recordar los modelos de bases de datos vistos, sitúate en el epígrafe 4 de esta Unidad de
Trabajo y analiza su contenido.)

b. Según el número de usuarios a los que da servicio el sistema:


Monousuario: sólo atienden a un usuario a la vez, y su principal uso se da en los
ordenadores personales.
Multiusuario: entre los que se encuentran la mayor parte de los SGBD, atienden a varios
usuarios al mismo tiempo.

. Según el número de sitios en los que está distribuida la base de datos: Centralizados: sus
datos se almacenan en un solo computador. Los SGBD centralizados pueden atender a
varios usuarios, pero el SGBD y la base de datos en sí residen por completo en una sola
máquina.
Distribuidos (Homogéneos, Heterogéneos): la base de datos real y el propio software
del SGBD pueden estar distribuidos en varios sitios conectados por una red. Los sistemas
homogéneos utilizan el mismo SGBD en múltiples sitios. Una tendencia reciente consiste
en crear software para tener acceso a varias bases de datos autónomas preexistentes
almacenadas en sistemas distribuidos heterogéneos. Esto da lugar a los SGBD federados
o sistemas multibase de datos en los que los SGBD participantes tienen cierto grado de
autonomía local.

d. Según el coste. La mayor parte de los paquetes cuestan entre 10.000 y 100.000 euros. Los
sistemas monousuario más económicos para microcomputadores cuestan entre 0 y
euros. En el otro extremo, los paquetes más completos cuestan más de 100.000 euros

. Según el propósito o finalidad


Propósito General: pueden ser utilizados para el tratamiento de cualquier tipo de base
de datos y aplicación.
Propósito Específico: Cuando el rendimiento es fundamental, se puede diseñar y
construir un software de propósito especial para una aplicación específica, y este sistema
no sirve para otras aplicaciones. Muchos sistemas de reservas de líneas aéreas son de
propósito especial y pertenecen a la categoría de sistemas de procesamiento de
transacciones en línea, que deben atender un gran número de transacciones
concurrentes sin imponer excesivos retrasos.

7.- SGBD comerciales.


Actualmente, en el mercado de software existen multitud de sistemas gestores de bases de datos
comerciales. En este epígrafe se desglosan las características fundamentales de los más importantes y
extendidos hasta la fecha. Pero, como podrás observar, la elección de un SGBD es una decisión muy
importante a la hora de desarrollar proyectos. A veces, el sistema más avanzado, "el mejor" según los
entendidos, puede no serlo para el tipo de proyecto que estemos desarrollando. Hemos de tener en
cuenta qué volumen de carga debe soportar la base de datos, qué sistema operativo utilizaremos
como soporte, cuál es nuestro presupuesto, plazos de entrega, etc.

A través de la siguiente tabla se exponen los SGBD comerciales más utilizados y sus características
más relevantes:

Sistemas Gestores de Bases de Datos Comerciales.

SGBD Descripción URL

Reconocido como uno de los mejores a nivel mundial. Es


multiplataforma, potente a nivel transaccional, confiable y seguro.
ORACLE Es Cliente/Servidor. Basado en el modelo de datos Relacional. De Oracle
gran potencia, aunque con un precio elevado que hace que sólo se
vea en empresas muy grandes y multinacionales. Ofrece versiones
gratuitas, como Oracle Database Express Edition (XE), en sus
distintas versiones.
Sistema muy extendido que se ofrece bajo dos tipos de licencia,
MYSQL MySQL
comercial o libre. Para aquellas empresas que

SGBD Descripción URL


deseen incorporarlo en productos privativos, deben comprar una
licencia específica. Es Relacional, Multihilo
Multiusuario y Multiplataforma. Su gran velocidad lo hace ideal
para consulta de bases de datos y plataformas web.
Multiplataforma, el motor de base de datos relacional integra
XML de manera nativa, lo que BM ha llamado pureXML, que
DB2 DB2
permite almacenar documentos completos para realizar
operaciones y búsquedas de manera jerárquica dentro de éste, e
integrarlo con búsquedas relacionales.
Otra opción de IBM para el mundo empresarial que necesita un
DBMS sencillo y confiable. Es un gestor de base de datos
INFORMI relacional basado en SQL. Multiplataforma. Consume menos Informix
X recursos que Oracle, con utilidades muy avanzadas respecto a
conectividad y funciones relacionadas con tecnologías de
Internet/Intranet, XML, etc.
Sistema Gestor de Base de Datos producido por Microsoft. Es Microsoft
Microsoft
relacional, sólo funciona bajo Microsoft Windows, utiliza SQL
SQL
arquitectura Cliente/Servidor. Constituye la alternativa a otros Server
SERVER
potentes SGBD como son Oracle, PostgreSQL o MySQL. 2017
Un DBMS con bastantes años en el mercado, tiene 3 versiones
para ajustarse a las necesidades reales de cada empresa. Es un
SYBASE Sybase
sistema relacional, altamente escalable, de alto rendimiento, con
soporte a grandes volúmenes de datos, transacciones y usuarios, y
de bajo costo.

Otros SGBD comerciales importantes son: DBASE, ACCESS, INTERBASE, FOXPRO.

8.- SGBD libres.


La alternativa a los sistemas gestores de bases de datos comerciales la encontramos en los SGBD de
código abierto o libres, también llamados Open Source. Son sistemas distribuidos y desarrollados
libremente. En la siguiente tabla se relacionan los cinco más utilizados actualmente, así como sus
principales características y enlaces a sus páginas web:

Sistemas Gestores de Bases de Datos Libres.

SGBD Descripción URL

Es un sistema de gestión de base de datos relacional,


multihilo y multiusuario con más de seis millones de
MySQL instalaciones. Distribuido bajo dos tipos de licencias, MySQL
comercial y libre. Multiplataforma, posee varios motores
de almacenamiento, accesible a través de múltiples
lenguajes de programación y muy ligado a aplicaciones
web.
Sistema Relacional Orientado a Objetos. Considerado
como la base de datos de código abierto más avanzada del
PostgreSQL mundo. Desarrollado por una comunidad de PostGreSQL
desarrolladores que trabajan de forma desinteresada,
altruista, libre y/o apoyados por organizaciones
comerciales. Es multiplataforma y accesible desde
múltiples lenguajes de programación.
Sistema Gestor de Base de Datos relacional,
multiplataforma, con bajo consumo de recursos, excelente
Firebird Firebird
gestión de la concurrencia, alto rendimiento y potente
soporte para diferentes lenguajes.
SGBD Descripción URL

Sistema Gestor escrito en Java, de reducido tamaño,


Apache con soporte multilenguaje, multiplataforma, altamente Apache
Derby portable, puede funcionar embebido o en modo Derby
cliente/servidor.

Sistema relacional, basado en una biblioteca escrita en C


que interactúa directamente con los programas, reduce los
SQLite SQLite
tiempos de acceso siendo más rápido que MySQL o
PostGreSQL. Es multiplataforma y con soporte para
varios lenguajes de programación.

9.- Bases de datos centralizadas.


Si nos preguntamos cómo es la arquitectura de un sistema de base de datos, hemos de saber que todo
depende del sistema informático que la sustenta. Tradicionalmente, la arquitectura centralizada fue la
que se utilizó inicialmente, aunque hoy en día es de las menos utilizadas.

Sistema de base de datos centralizado es una estructura en la que el SGBD está implantado en una s

Los sistemas de los años sesenta y setenta eran totalmente centralizados, como corresponde a los
sistemas operativos de aquellos años, y al hardware para el que estaban hechos: un gran ordenador
para toda la empresa y una red de terminales sin inteligencia ni memoria.

Las principales características de las bases de datos centralizadas son:

Se almacena completamente en una ubicación central, es decir, todos los componentes del
sistema residen en un solo computador o sitio.
No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las
bases de datos distribuidas.
Los componentes de las bases de datos centralizadas son: los datos, el software de gestión
de bases de datos y los dispositivos de almacenamiento secundario asociados. Son sistemas en
los que su seguridad puede verse comprometida más fácilmente.

En la siguiente tabla se representan las ventajas e inconvenientes destacables de esta


arquitectura de bases de datos.
Ventajas e inconvenientes de las bases de datos centralizadas.

Ventajas Inconvenientes

Se evita la redundancia debido a la


Un mainframe, en comparación de un sistema
posibilidad de inconsistencias y al
distribuido, no tiene mayor poder de cómputo.
desperdicio de espacio.

Se evita la inconsistencia, ya que si un hecho Cuando un sistema de bases de datos centralizado


específico se representa por una sola entrada, falla, se pierde toda disponibilidad de
la no-concordancia de datos no puede procesamiento y, sobre todo, de información
ocurrir. confiada al sistema.
En caso de un desastre o catástrofe, la
La seguridad se centraliza.
recuperación es difícil de sincronizar.

Las cargas de trabajo no se pueden difundir entre


varias computadoras, ya que los trabajos
Puede conservarse la integridad.
siempre se ejecutarán en la misma máquina.

El procesamiento de los datos ofrece un Los departamentos de sistemas retienen el control


mejor rendimiento. de toda la organización.

Mantenimiento más barato. Mejor uso de los


Los sistemas centralizados requieren un
recursos y menores recursos humanos.
mantenimiento central de datos

10.- Bases de datos distribuidas.


La necesidad de integrar información de varias fuentes y la evolución de las tecnologías de
comunicaciones, han producido cambios muy importantes en los sistemas de bases de datos. La
respuesta a estas nuevas necesidades y evoluciones se materializa en los sistemas de bases de datos
distribuidas.

Base de datos distribuida (BDD): es un conjunto de múltiples bases de datos lógicamente relacionada
Sistema de bases de datos distribuida (SBDD): es un sistema en el cual múltiples sitios de bases de d
Sistema gestor de bases de datos distribuida (SGBDD): es aquel que se encarga del manejo de la B

Un SGBDD desarrollará su trabajo a través de un conjunto de sitios o nodos, que poseen un sistema
de procesamiento de datos completo con una base de datos local, un sistema de gestor de bases
de datos e interconectados entre sí. Si estos nodos están dispersos geográficamente se
interconectarán a través de una red de área amplia o WAN, pero si se encuentran en edificios
relativamente cercanos, pueden estar interconectados por una red de área local o LAN

Este tipo de sistemas es utilizado en: organizaciones con estructura descentralizada, industrias de
manufactura con múltiples sedes (automoción), aplicaciones militares, líneas aéreas, cadenas
hoteleras, servicios bancarios, etc.
En la siguiente tabla se representan las ventajas e inconvenientes destacables de las
BDD

Ventajas e inconvenientes de las bases de datos distribuidas.

Ventajas Inconvenientes

El acceso y procesamiento de los datos es La probabilidad de violaciones de seguridad es


más rápido ya que varios nodos comparten creciente si no se toman las precauciones
carga de trabajo. debidas.

Existe una complejidad añadida que es necesaria


Desde una ubicación puede accederse a
para garantizar la coordinación apropiada entre
información alojada en diferentes lugares.
los nodos.

La inversión inicial es menor, pero el


Los costes son inferiores a los de las bases
mantenimiento y control puede resultar costoso
centralizadas.

Existe cierta tolerancia a fallos. Mediante la Dado que los datos pueden estar replicados, el
replicación, si un nodo deja de funcionar el control de concurrencia y los mecanismos de
sistema completo no deja de funcionar. recuperación son mucho más complejos que en
un sistema centralizado.
El enfoque distribuido de las bases de datos El intercambio de mensajes y el cómputo
se adapta más naturalmente a la estructura de adicional necesario para conseguir la
las organizaciones. Permiten la coordinación entre los distintos nodos
incorporación de nodos de forma flexible y constituyen una forma de sobrecarga que no
fácil. surge en los sistemas centralizados.
Dada la complejidad del procesamiento entre
Aunque los nodos están interconectados,
nodos es difícil asegurar la corrección de los
tienen independencia local.
algoritmos, el funcionamiento correcto durante
un fallo o la recuperación.

10.1.- Fragmentación.
Sabemos que en los sistemas de bases de datos distribuidas la información se encuentra repartida en varios
lugares. La forma de extraer los datos consultados puede realizarse mediante la fragmentación de distintas
tablas pertenecientes a distintas bases de datos que se encuentran en diferentes servidores. El problema
de fragmentación se refiere al particionamiento de la información para distribuir cada parte a los diferentes
sitios de la red.

Pero hay que tener en cuenta el grado de fragmentación que se aplicará, ya que éste es un factor
determinante a la hora de la ejecución de consultas. Si no existe fragmentación, se tomarán las
relaciones o tablas como la unidad de fragmentación. Pero también puede fragmentarse a nivel de tupla
(fila o registro) o a nivel de atributo (columna o campo) de una tabla. No será adecuado un grado de
fragmentación nulo, ni tampoco un grado de fragmentación demasiado alto. El grado de fragmentación
deberá estar equilibrado y dependerá de las particularidades de las aplicaciones que utilicen dicha base
de datos. Concretando, el objetivo de la fragmentación es encontrar un nivel de particionamiento
adecuado en el rango que va desde tuplas o atributos hasta relaciones completas.

Cuando se lleva a cabo una fragmentación, existen tres reglas fundamentales a cumplir:

Completitud. Si una relación R se descompone en fragmentos R1, R2, ..., Rn, cada elemento
de datos que pueda encontrarse en R deberá poder encontrarse en uno o varios
fragmentos Ri
Reconstrucción. Si una relación R se descompone en una serie de fragmentos R1, R2,
Rn, la reconstrucción de la relación a partir de sus fragmentos asegura que se preservan las
restricciones definidas sobre los datos.
Disyunción. Si una relación R se descompone verticalmente, sus atributos primarios clave
normalmente se repiten en todos sus fragmentos.

Existen tres tipos de fragmentación:

Fragmentación horizontal: La fragmentación horizontal se realiza sobre las tuplas de la


relación, dividiendo la relación en subrelaciones que contienen un subconjunto de las tuplas
que alberga la primera. Existen dos variantes de la fragmentación horizontal: la primaria y la
derivada.
Fragmentación vertical: La fragmentación vertical, en cambio, se basa en los atributos de la
relación para efectuar la división. Una relación R produce fragmentos R1, R2, ..., Rr cada uno
de los cuales contiene un subconjunto de los atributos de R así como la llave primaria de R. El
objetivo de la fragmentación vertical es particionar una relación en un conjunto de relaciones
más pequeñas de manera que varias de las aplicaciones de usuario se ejecutarán sobre un
fragmento. En este contexto, una fragmentación óptima es aquella que produce un esquema
de fragmentación que minimiza el tiempo de ejecución de las consultas de usuario. La
fragmentación vertical es más complicada que la horizontal, ya que existe un gran número de
alternativas para realizarla.
Fragmentación Híbrida o mixta: Podemos combinar ambas, utilizando por ello la
denominada fragmentación mixta. Si tras una fragmentación vertical se lleva a cabo otra
horizontal, se habla de la fragmentación mixta (HV). Para el caso contrario, estaremos ante una
fragmentación (VH). Para representar los dos tipos de fragmentación, se utilizan los árboles.

También podría gustarte