Características de la matriz de discos

1.¿Qué es una matriz de discos?

La matriz de discos es una tecnología que utiliza un controlador de disco duro para controlar la interconexión de múltiples discos duros para sincronizar la lectura y escritura de múltiples discos duros, reducir errores y mejorar la eficiencia y confiabilidad.

2. ¿Qué es RAID?

RAID es la abreviatura de redundant array of cheap disks, que significa redundant array of cheap disks. RAID es un estándar teórico para la tecnología de matrices de discos. Su propósito es reducir los errores y mejorar el rendimiento y la confiabilidad de los sistemas de almacenamiento. Los niveles más utilizados son 1, 3, 5, etc.

3. ¿Qué es el nivel RAID 0?

El nivel 0 de RAID es la implementación de la tecnología de separación de datos. Convierte todos los discos duros en una matriz de discos, que puede leer y escribir en varios discos duros al mismo tiempo, pero no tiene capacidades de respaldo ni tolerancia a fallas. El precio es económico, la eficiencia en el uso del disco duro es la mejor, pero la confiabilidad es la peor.

Tomemos como ejemplo una matriz de discos de nivel RAID compuesta por dos discos duros. Escribe 1 y 2 bits de datos en el primer disco duro, el 3.º y 4.º bits de datos en el segundo disco duro... y así sucesivamente, por eso se llama "partición de datos". Debido a que los datos en cada disco se escriben simultáneamente, su velocidad de almacenamiento puede ser varias veces más rápida que la de un solo disco duro.

Sin embargo, de esta manera, si falla un disco duro de la matriz de discos, debido a que separa los datos y los almacena en diferentes discos duros, la falla de uno equivale a interrumpir la integridad de los datos. Sin cintas de respaldo de toda la matriz de discos, todos los datos serán irreparables. Por eso, a pesar de su alta eficiencia, pocos adoptan esta tecnología a riesgo de perder datos.

4. ¿Qué es el nivel RAID 1?

RAID nivel 1 utiliza tecnología de duplicación de disco, que consiste en copiar sincrónicamente el contenido de un disco duro a otro disco duro, por lo que tiene capacidades de respaldo y tolerancia a fallas, baja eficiencia pero alta confiabilidad.

5. ¿Qué es el nivel RAID 3?

RAID Nivel 3 utiliza tecnología de entrelazado de bytes. Los discos duros se ejecutan simultáneamente bajo la tarjeta de control SCSI y los datos utilizados para la verificación de paridad se almacenan en discos duros específicos. Tiene tolerancia a fallas y la eficiencia de uso del disco duro se reduce en uno por cada pocos instalados, por lo que la confiabilidad es mejor.

6. ¿Qué es el nivel RAID 5?

El nivel RAID utiliza tecnología de segmentación de discos. A diferencia del nivel 3, almacena datos de paridad en cada disco duro. Cada disco duro se ejecuta en paralelo bajo el control de la tarjeta de control SCSI, con tolerancia a fallos. Al igual que el nivel tres, su eficiencia es instalar algunos y luego reducir uno.

7. ¿Qué es un disco duro intercambiable en caliente?

El nombre en inglés de disco duro intercambiable en caliente es hot-swappable. En una matriz de discos, si se utiliza un disco duro que admita tecnología de intercambio en caliente, el servidor puede extraer directamente el disco duro roto y reemplazarlo por uno nuevo sin apagarlo. En las matrices de discos comerciales generales, si el disco duro está dañado, se llamará automáticamente al administrador para que lo reemplace.

El principio de la matriz de discos

¿Por qué se necesita la matriz de discos? Cómo mejorar la velocidad de acceso al disco, cómo evitar la pérdida de datos debido a una falla del disco y cómo utilizar eficazmente el espacio en disco siempre han sido preocupaciones de los profesionales y usuarios de informática. Sin embargo, los discos de gran capacidad son muy caros y suponen una gran carga para los usuarios. La aparición de la tecnología de matriz de discos resolvió estos problemas de una sola vez.

En los últimos diez años, la velocidad de procesamiento de la CPU ha aumentado casi geométricamente y la velocidad de acceso a la memoria también ha mejorado considerablemente. Sin embargo, la velocidad de acceso a los dispositivos de almacenamiento de datos, es decir, los discos duros. , palidece en comparación. Más lento. Todo el rendimiento de E/S no puede seguir el ritmo del sistema, lo que forma un cuello de botella en el sistema informático y reduce el rendimiento general del sistema informático. Si la velocidad de acceso al disco no se puede mejorar de manera efectiva, el desequilibrio entre la CPU, la memoria y el disco hará que la mejora de la CPU y la memoria sea un desperdicio.

Actualmente, existen dos métodos principales para mejorar la velocidad de acceso al disco. Uno es el controlador de caché de disco, que almacena los datos leídos del disco en la caché para reducir la cantidad de accesos al disco. Los datos se leen y escriben en la memoria caché, lo que aumenta considerablemente la velocidad de acceso. Una operación de acceso al disco se completa si los datos que se van a leer no están en la memoria caché o si los datos se van a escribir en el disco. Esta fórmula se utiliza en entornos de tarea única como DOS. El acceso a grandes cantidades de datos tiene buen rendimiento (los accesos pequeños y frecuentes no lo tienen).

Sin embargo, su rendimiento no se puede mostrar en un entorno multitarea (debido al continuo intercambio de datos) o en el acceso a bases de datos (debido al pequeño tamaño de cada registro). No hay garantía de seguridad.

Una es utilizar tecnología de matriz de discos. Una matriz de discos es una matriz de varios discos que funcionan como un solo disco. Almacena datos en diferentes discos en forma de franjas. Al acceder a los datos, los discos relacionados en la matriz trabajan juntos para reducir en gran medida el tiempo de acceso a los datos y lograr una mejor utilización del espacio. Las diferentes tecnologías utilizadas en las matrices de discos se denominan niveles RAID y los diferentes niveles abordan problemas de seguridad de datos para diferentes sistemas y aplicaciones.

Generalmente, las matrices de discos de alto rendimiento se pueden implementar en forma de hardware, y el control de la caché del disco y la matriz de discos se combinan aún más en un controlador RAID o una tarjeta de control para resolver los problemas de las personas con el disco I/ O sistema. Cuatro necesidades de los mismos usuarios:

(1) Mejorar la velocidad de acceso.

(2) Tolerancia a fallos, es decir, seguridad.

(3) Utilice eficazmente el espacio en disco.

(4) Intente equilibrar el rendimiento de la CPU, la memoria y el disco para mejorar el rendimiento general de la computadora.

Principios de Disk Array

En 1987, un miembro del personal de la Universidad de California en Berkeley publicó un artículo llamado "Disk Array Research", que mencionaba oficialmente RAID, que significa RAID contenido. matriz de discos. El artículo señala que los discos duros económicos de 5,25 y 3,5 pulgadas también pueden proporcionar capacidad humana, alto rendimiento y coherencia de datos como los discos duros de 8 pulgadas en máquinas grandes, y detalla la tecnología de RAID1-5. Las diferentes tecnologías de matrices de discos utilizadas para diferentes aplicaciones se denominan niveles RAID, abreviatura de Redundant Array of Inexpensive Disks, y cada nivel representa una tecnología. Los estándares actualmente reconocidos en la industria son RAID 0-RAID 5. Este nivel no representa el nivel técnico. El nivel 5 no es superior al nivel 3 y el nivel 1 es inferior al nivel 4. El plazo depende del producto de nivel RAID que se elija, lo que depende completamente del entorno operativo y la aplicación del usuario, independientemente del nivel. RAID0 no tiene garantía de seguridad, pero es rápido y adecuado para sistemas de E/S de alta velocidad. RAID 1 es adecuado para sistemas que requieren seguridad y velocidad, mientras que RAID2 y RAID3 son adecuados para computadoras centrales y procesamiento de imágenes y CAD/CAM. RAID5 se utiliza principalmente en 0LTP y es bien conocido por las necesidades urgentes de las instituciones financieras y los grandes centros de procesamiento de datos. Sin embargo, muchas personas tienen malentendidos acerca de las matrices de discos y creen que RAID5 es necesario para las matrices de discos. RAID4 rara vez se utiliza y tiene algunas características en común con RAID5, pero es adecuado para acceder a grandes cantidades de datos. Otros como RAID6, RAID7. Incluso RAIDl0, 50, 100, etc. Todos están hechos por fabricantes y no existe un estándar consistente, por lo que no los explicaré aquí.

RAID1

RAID1 es una tecnología que utiliza duplicación de disco. Antes de la llegada de RAID, muchos sistemas utilizaban la duplicación de discos. Su método consiste en agregar un disco de respaldo al disco de trabajo y los datos almacenados en los dos discos son seguros y consistentes. Los datos se escriben en el disco de trabajo y en el disco de respaldo.

RAID2

RAID2 consiste en dispersar los datos en bits/bytes o bloques (b1ock), agregar código Hamming e intercalarlo en la matriz de discos al tamaño de cada disco. Y la dirección es la misma, es decir, en cada disco, los datos están en el mismo cilindro o pista y sector. RAID2, también conocido como matriz paralela, está diseñado para utilizar * * * tecnología de sincronización de eje para controlar que la matriz de discos se inicie cuando se accede a los datos y realizar acceso paralelo en la misma ubicación en cada disco, para que tenga el mejor tiempo de acceso. * *El bus está diseñado específicamente para acceder a datos con tiempos de transferencia paralelos de gran ancho de banda, por eso lo tiene. En la aplicación de acceso a archivos personales, RAID2 tiene el mejor rendimiento y su rendimiento sólo se reconocerá cuando el archivo sea demasiado pequeño. Porque el acceso al disco es suficiente por un tiempo. El acceso RAID2 es una operación paralela de todos los discos y es un acceso de una sola unidad o byte. Por tanto, los datos con menos de un sector reducirán en gran medida su composición. RAID2 está diseñado para ordenadores que requieren datos continuos y masivos, como desde mainframes hasta supercomputadores, estaciones de trabajo de procesamiento de imágenes o CAD/CAM, etc. , es también un servidor web apto para entornos multiusuario.

minicomputadora o computadora personal.

RAID3

Los métodos de acceso y almacenamiento de datos de RAID3 son los mismos que los de RAID2, excepto que se utiliza paridad en lugar del código Hamming para la corrección y detección de errores, por lo que solo se utiliza un disco de paridad. necesario. El cálculo del valor de paridad es suficiente para realizar una operación lógica XOR en los bits correspondientes de cada disco y luego escribir el resultado en el disco de paridad. Cualquier modificación de datos requiere un cálculo de paridad.

RAID4

RAID4 también usa un disco de verificación, pero a diferencia de RAID3, RAID4 usa RAID0 y un disco de verificación.

RAID5

RAID5 es similar a RAID4, pero evita los cuellos de botella de RAID4. El método consiste en buclear los datos de verificación en cada disco sin verificar el disco. El control de RAID5 es más complejo, especialmente el control de hardware de la matriz de discos, porque la aplicación de este método requiere más cosas que otros niveles RAID, más requisitos de entrada/salida, velocidades más rápidas, procesamiento de datos y cálculos de valores de paridad, corrección de errores. , etc. , por lo que el precio es más alto.

Comparación de RAID: la siguiente tabla enumera algunos atributos de RAID:

Modo de funcionamiento Capacidad mínima disponible del disco duro Rango aplicable

Expansión del disco RAID0 y asignación de datos 2 T Servidores de PC y estaciones de trabajo gráficas

Distribución y duplicación de datos RAIDl 2 t/2

RAID2 *** Sincronización de ejes, transferencia paralela, ECC 3 depende de la estructura de archivos grandes y no es Aplicaciones de entrada y salida de uso común, como procesamiento de imágenes y CAD/CAM.

RAID3 *** sincronización de ejes y transmisión en paralelo, paridad 3tx (n-1)/n

Distribución de datos RAID4, paridad fija 3tx (n-1)/n

La distribución de datos RAID5 se distribuye en aplicaciones de paridad 3tx (n-1)/OLTP en grandes centros de procesamiento de datos como bancos, finanzas, mercados de valores y bases de datos.