¿Para qué sirve la base de datos?

Definición

Definición 1

Cuando las personas describen este concepto desde diferentes perspectivas, tienen diferentes definiciones (descriptivas por supuesto). Por ejemplo, una base de datos se denomina "sistema de mantenimiento de registros" (esta definición enfatiza que una base de datos es una colección de registros). Para otro ejemplo, una base de datos es "una colección de datos relacionados que las personas almacenan juntos de cierta manera organizativa para resolver tareas específicas" (esta definición se centra en la organización de datos). Es más, las bases de datos se denominan "almacenes de datos". Por supuesto, aunque esta afirmación es vívida, no es rigurosa.

Estrictamente hablando, una base de datos es un "almacén que organiza, almacena y gestiona datos según la estructura de datos". En el trabajo diario de la gestión económica, a menudo es necesario colocar algunos datos relevantes en dicho "almacén" y procesarlos de acuerdo con las necesidades de la gestión. Por ejemplo, el departamento de recursos humanos de empresas e instituciones suele almacenar la información básica de los empleados (número de empleado, nombre, edad, sexo, lugar de origen, salario, currículum, etc.) en una tabla, que puede considerarse como una base de datos. Con este "almacén de datos", podemos consultar la situación básica de un empleado en cualquier momento según sea necesario, y también podemos consultar el número de empleados cuyo salario está dentro de un determinado rango, etc. Si estas tareas se pueden automatizar en los ordenadores, entonces nuestra gestión de personal podrá alcanzar un nivel muy alto. Además, en la gestión financiera, la gestión de almacenes y la gestión de producción, es necesario establecer muchas "bases de datos" de este tipo para utilizar computadoras para realizar la gestión automatizada de las finanzas, el almacén y la producción.

J. Martin dio una definición relativamente completa de una base de datos: una base de datos es una colección de datos relacionados almacenados juntos, está estructurada, no tiene redundancia dañina o innecesaria y sirve para una variedad de aplicaciones; se almacena independientemente del programa que lo utiliza; la inserción de nuevos datos en la base de datos, la modificación y la recuperación de datos originales se pueden realizar de forma general y controlada. Cuando en un sistema hay varias bases de datos estructuralmente completamente separadas, el sistema contiene una "colección de bases de datos".

Definición 2

Una base de datos es una colección de datos organizados según un modelo de datos específico y almacenados en un almacenamiento secundario. Este tipo de conjunto de datos tiene las siguientes características: es lo menos duplicado posible y sirve para múltiples aplicaciones de una organización específica de manera óptima. Su estructura de datos es independiente de la aplicación que la utiliza, y la adición, eliminación, modificación y recuperación de datos se gestiona y controla mediante un software unificado. Desde la perspectiva de la historia del desarrollo, la base de datos es una etapa avanzada de la gestión de datos y se desarrolló a partir del sistema de gestión de archivos.

Definición 3 (Opiniones del Comité de Expertos sobre el Protocolo del Convenio de Berna)

Recopilación de toda la información (datos, hechos, etc.). ), ya sea en forma impresa, en unidad de almacenamiento informático o de otro modo, se considerará una "base de datos".

Existen muchas razones para elegir contenidos digitales, que se pueden resumir en las siguientes:

(1) Espacio de almacenamiento. Un gran número de usuarios acceden y utilizan productos digitales a través de Internet. Como todos sabemos, los productos digitales se almacenan en matrices de discos y se administran mediante servidores. El espacio en disco es limitado y la capacidad del servidor también es limitada. Es imposible almacenar recursos digitales infinitamente. Esto nos obliga a elegir el contenido digital de los recursos literarios.

(2) La necesidad de resolver la contradicción entre el alto coste de la producción digital y los limitados fondos bibliotecarios. Pocas bibliotecas tienen recursos suficientes para digitalizar colecciones enteras y la selección de contenidos es inevitable.

(3) La necesidad de la gestión de recursos digitales. Con el rápido desarrollo de la tecnología, el ciclo de vida de los recursos digitales generados por proyectos digitales es cada vez más corto. Invertir fuertemente en migración digital es una manera importante de extender la vida útil de los recursos digitales, y se deben considerar costosos costos de mantenimiento en la selección de contenido digital.

Historia del desarrollo de bases de datos Desde su nacimiento hasta el presente, la tecnología de bases de datos ha formado una base teórica sólida, productos comerciales maduros y amplias aplicaciones en menos de medio siglo, atrayendo a más y más investigadores. El nacimiento y desarrollo de las bases de datos ha supuesto una gran revolución en la gestión de la información informática. Durante los últimos 30 años, se han desarrollado y construido miles de bases de datos en el país y en el extranjero, convirtiéndose en la infraestructura para el trabajo, la producción y la vida diaria de empresas, departamentos e incluso individuos.

Al mismo tiempo, con la expansión y profundización de las aplicaciones, el número y la escala de las bases de datos también están aumentando, y el campo de investigación de las bases de datos también se ha ampliado y profundizado enormemente. En los últimos 30 años, tres Turings informáticos (C.W. Bachman, E.F. Codd, J. Gray) han sido premiados en el campo de las bases de datos, lo que demuestra plenamente que las bases de datos son un campo lleno de vitalidad y espíritu innovador. Sigamos el desarrollo de las bases de datos a lo largo de la trayectoria histórica.

[Editar este párrafo] Una breve historia del desarrollo de las bases de datos

1. El nacimiento de la gestión de datos

La historia de las bases de datos se remonta a hace cincuenta años. , cuando la gestión de datos es muy sencilla. Los datos se procesan a través de una amplia gama de máquinas que clasifican, comparan y tabulan, procesan millones de tarjetas perforadas e imprimen los resultados en papel o fabrican nuevas tarjetas perforadas. La gestión de datos es el almacenamiento físico y el procesamiento de todas estas tarjetas perforadas. Sin embargo, en 1951, una computadora de Remington Rand Corporation llamada Univac I lanzó una unidad de cinta que podía ingresar cientos de registros en un segundo, lo que provocó una revolución en la gestión de datos. 1956 IBM produce la primera unidad de disco, el modelo 305 RAMAC. La unidad tiene 50 discos, cada uno de 2 pies de diámetro y puede almacenar 5 MB de datos. La mayor ventaja de utilizar discos es que se puede acceder a los datos de forma aleatoria, mientras que las tarjetas perforadas y las cintas sólo pueden acceder a los datos de forma secuencial.

1951: El sistema Univac utiliza cinta magnética y tarjetas perforadas para el almacenamiento de datos.

Las semillas de los sistemas de bases de datos aparecieron en la década de 1960. En ese momento, las computadoras comenzaron a usarse ampliamente en la gestión de datos, lo que planteaba requisitos cada vez más altos para el disfrute de los datos. Los sistemas de archivos tradicionales ya no pueden satisfacer las necesidades de las personas. Surgieron sistemas de gestión de bases de datos que pueden gestionar y compartir datos de manera uniforme. El modelo de datos es el núcleo y la base del sistema de base de datos, y varios software DBMS se basan en un determinado modelo de datos. Por tanto, según las características del modelo de datos, los sistemas de bases de datos tradicionales suelen dividirse en tres categorías: bases de datos en red, bases de datos jerárquicas y bases de datos relacionales.

Apareció el primer DBMS de red, que fue el IDS (Integrated DataStore) desarrollado con éxito por Bachman y otros de General Electric Company en Estados Unidos en 1961. En 1961, Charles Bachman de General Electric Company en los Estados Unidos desarrolló con éxito el primer DBMS de malla del mundo y el primer sistema de gestión de bases de datos: DataStore IDS integrado, que sentó las bases para las bases de datos de malla y se distribuyó y utilizó ampliamente en ese momento. IDS tiene las características de esquema y registro de datos. Pero solo se puede ejecutar en el host GE, la base de datos tiene un solo archivo y todas las tablas de la base de datos deben codificarse y generarse manualmente. Más tarde, el cliente de GE, BF Goodrich Chemical, tuvo que reescribir todo el sistema. El sistema reescrito se denominó Sistema Integrado de Gestión de Datos (IDMS).

El modelo de base de datos en malla puede modelar naturalmente elementos tanto jerárquicos como no jerárquicos. Antes de la llegada de las bases de datos relacionales, los DBMS de red se utilizaban más que los DBMS jerárquicos. En la historia del desarrollo de bases de datos, las bases de datos en red ocupan una posición importante.

Después del sistema de gestión de bases de datos jerárquicas se encuentra la base de datos en red. El sistema de base de datos jerárquico más famoso y típico es el IMS desarrollado por IBM en 1968.

(Sistema de Gestión de la Información), una base de datos jerárquica adecuada a su anfitrión. Este es el primer producto de programa de sistema de base de datos a gran escala desarrollado por IBM. Se produjo a fines de la década de 1960 y ahora se ha desarrollado para IMSV6, brindando soporte para funciones avanzadas como agrupación en clústeres, intercambio de datos de N vías y uso compartido de colas de mensajes. Este producto de base de datos de 30 años desempeña un nuevo papel en las aplicaciones de conectividad de aplicaciones WWW y de inteligencia empresarial de hoy.

En 1973, Cullinane Company (más tarde Cullinet Software Company) comenzó a vender una versión mejorada del IDMS de Goodrich y gradualmente se convirtió en la empresa de software más grande del mundo en ese momento.

2.[Editar este párrafo] Etapa de desarrollo de la base de datos

La etapa de desarrollo de la base de datos se puede dividir a grandes rasgos en las siguientes etapas:

Etapa de gestión manual

; p >

Etapa del sistema de archivos;

Etapa del sistema de base de datos;

Etapa de base de datos avanzada.

[Editar este párrafo]Estructura básica de la base de datos

La estructura básica de la base de datos se divide en tres niveles, lo que refleja tres perspectivas diferentes de observación de la base de datos.

(1) Capa de datos físicos.

Es la capa más interna de la base de datos y es una colección de datos realmente almacenados en un dispositivo de almacenamiento físico. Estos datos son datos sin procesar, procesados ​​por el usuario, que consisten en cadenas de bits, caracteres y palabras procesadas mediante las operaciones de instrucción descritas por el esquema interno.

(2) Capa de datos conceptuales.

Es la capa intermedia de la base de datos y la representación lógica general de la base de datos. Señalar la definición lógica de cada dato y la relación lógica entre los datos es una colección de registros almacenados. Implica la relación lógica de todos los objetos en la base de datos, más que sus condiciones físicas, y es una base de datos bajo el concepto de administrador de base de datos.

(3) Capa de datos lógica.

Es la base de datos que ven y utilizan los usuarios, y representa el conjunto de datos utilizados por uno o varios usuarios específicos, es decir, un conjunto de registros lógicos.

Las relaciones entre bases de datos en diferentes niveles se transforman mediante el mapeo.

[Editar este párrafo] Las funciones principales de la base de datos

(1) Realizar el intercambio de datos.

El intercambio de datos incluye que todos los usuarios puedan acceder a los datos de la base de datos al mismo tiempo. Los usuarios pueden usar la base de datos de varias maneras a través de la interfaz y compartir datos.

(2) Reducir la redundancia de datos.

En comparación con el sistema de archivos, debido a que la base de datos permite compartir datos, evita que los usuarios creen archivos de aplicaciones por separado. Reduzca una gran cantidad de datos duplicados, reduzca la redundancia de datos y mantenga la coherencia de los datos.

(3) Independencia de los datos.

La independencia de los datos incluye que las estructuras lógicas de la base de datos y la aplicación son independientes entre sí, y los cambios en la estructura física de los datos no afectan la estructura lógica de los datos.

(4) Control centralizado de datos.

En el modo de gestión de archivos, los datos están en un estado descentralizado y diferentes usuarios o el mismo usuario no hacen nada con sus propios archivos en diferentes procesos. Las bases de datos se pueden utilizar para controlar y gestionar datos de forma centralizada, y los modelos de datos se pueden utilizar para expresar la organización de diversos datos y las relaciones entre datos.

(5) La coherencia y la mantenibilidad de los datos garantizan la seguridad y confiabilidad de los datos.

Incluyen principalmente: ① Control de seguridad: evita la pérdida de datos, actualizaciones incorrectas y uso no autorizado; ② Control de integridad: garantiza la exactitud, validez y compatibilidad de los datos; ③ Control de concurrencia: en el mismo período de tiempo dentro de la base de datos; , se permiten múltiples accesos a los datos para evitar interacciones anormales entre los usuarios; ④ Descubrimiento y recuperación de fallas: el sistema de administración de bases de datos proporciona un conjunto de métodos para detectar y reparar fallas de manera oportuna, evitando así la destrucción de datos.

(6)Recuperación de fallos.

El sistema de gestión de bases de datos proporciona un conjunto de métodos que pueden detectar y reparar fallas a tiempo para evitar que los datos se dañen. El sistema de base de datos puede recuperarse lo más rápido posible de fallas que ocurren durante la operación del sistema de base de datos, que pueden ser errores físicos o lógicos. Por ejemplo, errores de datos causados ​​por un mal funcionamiento del sistema.

[Editar este párrafo] Estructura de la base de datos y tipos de base de datos

Las bases de datos generalmente se dividen en tres tipos: bases de datos jerárquicas, bases de datos en red y bases de datos relacionales. Diferentes bases de datos están conectadas y organizadas según diferentes estructuras de datos.

1. Modelo de estructura de datos

(1) Estructura de datos

La llamada estructura de datos se refiere a la forma organizativa de los datos o la relación entre los datos. Si D representa datos y R representa un conjunto de relaciones entre objetos de datos, entonces DS = (d, R) se denomina estructura de datos. Por ejemplo, hay una guía telefónica que registra los nombres y números de teléfono correspondientes de n personas. Para que sea más fácil encontrar el número de teléfono de alguien, los nombres y números están ordenados en el diccionario, con el número de teléfono correspondiente seguido del nombre.

De esta manera, si desea encontrar el número de teléfono de una persona (digamos que la primera letra de su nombre es Y), solo necesita encontrar los nombres que comienzan con Y. En este ejemplo, el conjunto de datos D es el nombre y el teléfono. Números, la relación R entre ellos está ordenada en el orden del diccionario y su estructura de datos correspondiente es DS = (d, R), que es una matriz.

(2) Tipos de estructuras de datos

Las estructuras de datos se dividen en estructuras lógicas y estructuras físicas de datos. La estructura lógica de los datos consiste en observar y analizar datos desde una perspectiva lógica (es decir, la conexión y organización de los datos), independientemente de la ubicación de almacenamiento de los datos. La estructura física de los datos se refiere a la estructura de los datos almacenados en la computadora, es decir, la forma de implementación de la estructura lógica de los datos en la computadora, por lo que la estructura física también se denomina estructura de almacenamiento. Aquí solo se estudia la estructura lógica de los datos, y el método para reflejar y realizar la conexión de datos se denomina modelo de datos.

Actualmente existen tres modelos de datos populares: el modelo de estructura jerárquica y el modelo de estructura de red basados ​​en la teoría de grafos, y el modelo de estructura de relaciones basado en la teoría de relaciones.

2. Sistemas de bases de datos jerárquicos, en red y relacionales

(1) Modelo de estructura jerárquica

El modelo de estructura jerárquica es esencialmente un árbol con nodos raíz Árbol ordenado dirigido (Matemáticamente "árbol" se define como un gráfico conectado acíclico). El siguiente diagrama muestra la estructura organizativa de una institución de educación superior. Este organigrama es como un árbol. El departamento de la escuela es la raíz (llamado nodo raíz), y el departamento, la especialidad, el maestro y el estudiante son las ramas (llamadas nodos). La conexión entre la raíz y la rama se llama la relación de la raíz. hasta el borde es 1: N, es decir, solo hay una raíz N.

Un sistema de base de datos establecido según un modelo jerárquico se denomina sistema de base de datos de modelo jerárquico. El IM (sistema de gestión de la información) es su representante típico.

(2) Modelo de estructura de red

El sistema de base de datos establecido de acuerdo con la estructura de datos de la red se denomina sistema de base de datos de red y su representante típico es DBTG (Grupo de tareas de base de datos). Las estructuras de datos de cuadrícula se pueden convertir matemáticamente en estructuras de datos jerárquicas.

(3) Modelo de estructura relacional

La estructura de datos relacional simplifica algunas estructuras de datos complejas en relaciones binarias simples (es decir, forma de tabla bidimensional). Por ejemplo, la relación de los empleados en una determinada unidad es una relación binaria.

Un sistema de base de datos compuesto por estructuras de datos relacionales se denomina sistema de base de datos relacional.

En una base de datos relacional, casi todas las operaciones sobre datos se basan en una o más tablas relacionales. La gestión de datos se logra clasificando, fusionando, conectando o seleccionando estas tablas relacionales. DBASEII es un representante típico de este tipo de sistema de gestión de bases de datos. Para un problema de aplicación práctica (como la gestión de personal), a veces se necesitan múltiples relaciones para lograrlo. La relación establecida con dBASEII se denomina base de datos (o archivo de base de datos), y varias bases de datos establecidas correspondientes a múltiples relaciones se denominan sistemas de bases de datos. Otra función importante de dBASEII es utilizar y administrar la base de datos mediante el establecimiento de archivos de comandos. El archivo de secuencia de comandos correspondiente al sistema de base de datos se denomina sistema de aplicación de base de datos. En pocas palabras, una relación se llama base de datos y varias bases de datos pueden formar un sistema de base de datos. El sistema de base de datos puede derivar varios tipos de archivos auxiliares para establecer su sistema de aplicación.

[Editar este párrafo] Base de datos pública

1. IBM

Como pionero y pionero en el campo de las bases de datos relacionales, IBM completó en 1977 el prototipo del System R. y comenzó a ofrecer un servidor de base de datos integrado: System/38 en 1980, seguido de SQL/DS para VSE y VM. Su versión inicial estaba estrechamente relacionada con el prototipo de investigación del System R. DB2 para MVSV1 se introdujo en 1983. El objetivo de esta versión es ofrecer la simplicidad, la independencia de los datos y la productividad del usuario prometidas por este nuevo enfoque. DB2 para MVS proporcionó un potente soporte de procesamiento de transacciones en línea (OLTP) en 1988 y soporte de bases de datos distribuidas en 1989 y 1993 respectivamente.

DB2 Universal Database 6.1, lanzado recientemente, es un modelo de Universal Database. Es el primer sistema de gestión de bases de datos relacionales multimedia con capacidades en línea y admite una variedad de plataformas, incluido Linux.

2. Oracle

Oracle, anteriormente conocido como SDL, fue fundado en 1977 por Larry Ellison y otros dos programadores. Desarrollan sus propios productos de éxito y los venden en grandes cantidades en el mercado. En 1979, Oracle lanzó el primer sistema comercial de gestión de bases de datos relacionales SQL. Oracle es uno de los primeros proveedores en desarrollar bases de datos relacionales y sus productos admiten la más amplia gama de plataformas de sistemas operativos. Actualmente, los productos de bases de datos relacionales de Oracle tienen la mayor cuota de mercado.

3.Informix

Informix se fundó en 1980 y ofrece productos de bases de datos relacionales profesionales para Unix y otros sistemas operativos abiertos. El nombre de la empresa Informix se deriva de la combinación de Information y Unix. El primer producto de base de datos relacional de Informix que realmente soporta el lenguaje SQL es Informix SE (StandardEngine). InformixSE era el principal producto de base de datos en el entorno de microcomputadoras Unix en ese momento. También fue el primer producto de base de datos comercial que se portó a Linux.

4. Sybase

Sybase fue fundada en 1984. El nombre de la empresa "Sybase" proviene de la combinación de "sistema" y "base de datos". Bob Epstein, uno de los fundadores de Sybase, es el diseñador principal de Ingres University Edition (un producto modelo de base de datos relacional al mismo tiempo que System/R). El primer producto de base de datos relacional de la empresa fue Sybase SQLServer 1.0, lanzado en mayo de 1987. Sybase propuso por primera vez la idea de una arquitectura de base de datos cliente/servidor y fue el primero en implementarla en Sybase SQLServer.

5.SQL Server

En 1987, Microsoft cooperó con IBM para desarrollar OS/2, IBM incluyó OS/2Database Manager en su sistema OS/2 ExtendedEdition, pero la línea de productos de Microsoft. Todavía faltan productos de bases de datos. Por lo tanto, Microsoft puso su mirada en Sybase y firmó un acuerdo de cooperación con Sybase para utilizar la tecnología Sybase para desarrollar una base de datos relacional basada en la plataforma OS/2. En 1989, Microsoft lanzó la versión 1.0 de SQL Server.

6. Un sistema de base de datos

PostgreSQL es un objeto de software gratuito con funciones completas: un sistema de gestión de bases de datos relacionales (ORDBMS). Muchas de sus funciones son utilizadas por muchas bases de datos comerciales en la actualidad. predecesor. PostgreSQL comenzó originalmente como el proyecto Ingres de BSD. Las características de PostgreSQL cubren SQL-2/SQL-92 y SQL-3. En primer lugar, incluye soporte para los tipos de datos más completos del mundo. En segundo lugar, PostgreSQL es actualmente el único sistema de gestión de bases de datos de software gratuito que admite transacciones, subconsultas, sistemas de control paralelo de múltiples versiones y comprobaciones de integridad de datos.

7.mySQL

MySQL es un pequeño sistema de gestión de bases de datos relacionales desarrollado por la empresa sueca MySQL AB. Fue adquirida por Sun Company el 16 de junio de 2008. Actualmente, MySQL se utiliza ampliamente en sitios web pequeños y medianos en Internet. Debido a su pequeño tamaño, alta velocidad y bajo costo total de propiedad, especialmente de código abierto, muchos sitios web pequeños y medianos eligen MySQL como su base de datos para reducir el costo total de propiedad. El sitio web oficial de MySQL es www.mysql.com.

8. La base de datos Access es un sistema de gestión de bases de datos para microcomputadores lanzado por Microsoft Corporation en los Estados Unidos en 1994.

Tiene las características de interfaz amigable, fácil de aprender y usar, desarrollo simple, interfaz flexible, etc. Es un típico sistema de gestión de bases de datos de escritorio de nueva generación. Sus características principales son las siguientes:

(1) Gestiona perfectamente varios objetos de bases de datos, con potentes funciones de organización de datos, gestión de usuarios, inspección de seguridad y otras funciones.

(2) Potentes funciones de procesamiento de datos. En un entorno de red a nivel de grupo de trabajo, el sistema de gestión de bases de datos multiusuario desarrollado por Access tiene una estructura cliente/servidor y los correspondientes mecanismos de seguridad de la base de datos que no pueden lograrse con el XBASE tradicional (conocidos colectivamente como sistemas de bases de datos XBASE (DBASE y FoxBASE)). Access tiene una gestión avanzada de bases de datos a gran escala. El sistema tiene muchas características, como la función de procesamiento de transacciones/reversión de errores.

(3) Puede generar fácilmente varios objetos de datos y utilizar los datos almacenados para crear tablas e informes. con buena visibilidad.

(4) Como parte de la suite Office, se puede integrar con Office para lograr una conexión perfecta.

(5) Puede utilizar la Web para recuperar y publicar datos y conectarse a Internet Adecuado para sistemas de aplicaciones pequeñas y medianas, o como base de datos cliente en un sistema cliente/servidor

9 base de datos FoxPro

Lanzado originalmente. Fox Corporation en los Estados Unidos en 1988. Después de ser adquirido por Microsoft en 1992, FoxPro 2.5, 2.6 y Visual FoxPro se lanzaron sucesivamente. Las funciones y el rendimiento de FoxPro 2.5 y 2.6 se dividieron en dos versiones: DOS y Windows, respectivamente. En comparación con FoxBASE, FoxPro ha mejorado enormemente en función y rendimiento, principalmente mediante la introducción de controles como ventanas, botones, cuadros de lista y cuadros de texto, lo que mejora aún más las capacidades de desarrollo del sistema.