Almacenamiento masivo de datos

La tecnología de almacenamiento ha experimentado el proceso de desarrollo desde un solo disco, cinta, RAID hasta un sistema de almacenamiento en red. La tecnología de almacenamiento en red integra la tecnología de red y la tecnología de E/S, utilizando las capacidades de direccionamiento de la red, la conectividad plug-and-play, la flexibilidad y el alto rendimiento y eficiencia del almacenamiento para proporcionar seguridad y almacenamiento de datos basados ​​en la red. Tiene ventajas obvias en la gestión del almacenamiento y la escalabilidad de cantidades extremadamente grandes de datos.

Las tecnologías de almacenamiento en red típicas incluyen el almacenamiento conectado a la red (NAS) y las redes de área de almacenamiento (SAN).

1) La tecnología NAS es la extensión y desarrollo de la tecnología de red en el campo del almacenamiento. Cuelga directamente el dispositivo de almacenamiento en Internet, lo que tiene buena exclusividad y apertura. La desventaja es que utiliza la misma red física que LAN ***, lo que fácilmente puede causar congestión y afectar el rendimiento. Especialmente durante la copia de seguridad de datos, el rendimiento es bajo, lo que afecta su posición en las aplicaciones de almacenamiento empresarial.

2) La tecnología SAN es una arquitectura centrada en el almacenamiento de datos y que utiliza canales de fibra óptica para conectar almacenamiento en red de alta velocidad. Es decir, el almacenamiento de datos está separado como un área de la red. Gracias a un alto grado de intercambio de equipos y datos, se reduce la carga sobre la red y los servidores. Debido a que la red de almacenamiento Fibre Channel y la LAN están separadas, el rendimiento mejora enormemente y también proporciona alta confiabilidad y poderosas capacidades de procesamiento comercial continuo. En SAN, la expansión del sistema, la migración de datos, la copia de seguridad de datos local, la copia de seguridad de datos de recuperación de desastres remota y la gestión de datos son más convenientes, y toda la SAN se convierte en un grupo de almacenamiento de gestión unificada (grupo de almacenamiento). Los dispositivos de almacenamiento SAN se comunican a través de canales dedicados y no ocupan recursos del servidor. Por lo tanto, es muy adecuado para el almacenamiento de cantidades extremadamente grandes de datos y se ha convertido en la corriente principal del almacenamiento en red.

3) La tecnología de virtualización de almacenamiento asigna varios dispositivos de almacenamiento heterogéneos en el sistema en un único recurso de almacenamiento, que es completamente transparente para los usuarios, logra interoperabilidad y utiliza recursos de hardware existentes, unifica varios recursos de almacenamiento heterogéneos dentro de la SAN. en un grupo de almacenamiento de vista única, que se puede cortar y asignar fácilmente según las necesidades del usuario. Esto mantiene las inversiones existentes, reduce los costos generales y mejora la eficiencia del almacenamiento.

La virtualización del almacenamiento incluye tres estructuras jerárquicas: almacenamiento virtualizado basado en servidor, almacenamiento virtualizado basado en dispositivos de almacenamiento y almacenamiento virtualizado basado en red.

1) El almacenamiento virtualizado basado en servidor se completa en el host/servidor mediante un software de gestión lógica. El espacio de almacenamiento virtualizado puede abarcar múltiples conjuntos de discos heterogéneos, tiene un alto grado de estabilidad y apertura y es fácil y sencillo de implementar. Pero no es adecuado para entornos heterogéneos y gestión descentralizada.

2) Almacenamiento virtualizado basado en dispositivos de almacenamiento Debido a que algunas matrices de discos de alta gama tienen administración inteligente, la misma matriz puede ser compartida por diferentes hosts. Su rendimiento estructural se puede optimizar. Pero su implementación es costosa y tiene poca operatividad.

3) El almacenamiento virtualizado basado en red utiliza un servidor de administración de almacenamiento dedicado y el software de virtualización correspondiente para permitir que múltiples hosts/servidores accedan a múltiples dispositivos de almacenamiento heterogéneos para lograr diferentes La verdadera interconexión y el uso compartido entre hosts y almacenamiento se han convertido en el principal forma de almacenamiento virtual. Según las diferentes estructuras, se puede dividir en dos métodos: basado en servidor dedicado y basado en enrutador de almacenamiento. ① La virtualización basada en servidor dedicado utiliza un servidor dedicado a proporcionar la función de virtualización del sistema. Dependiendo de la topología de la red y las funciones específicas del servidor dedicado, su estructura de virtualización tiene dos métodos: simétrico y asimétrico. En una estructura simétrica, la transmisión de datos y el acceso a metadatos utilizan el mismo canal. Es simple de implementar, tiene poco impacto en servidores y dispositivos de almacenamiento y tiene una gran adaptabilidad a entornos heterogéneos. La desventaja es que los servidores dedicados pueden convertirse en un cuello de botella para el rendimiento del sistema y afectar la expansión de SAN. En una estructura asimétrica, la transmisión de datos y el acceso a metadatos utilizan caminos diferentes. Los comandos de E / S del servidor de aplicaciones se transmiten primero al servidor dedicado a través del canal de comandos. Después de obtener los metadatos y transmitir la vista de datos, los datos requeridos se obtienen a través del canal de datos. En comparación con la estructura simétrica, se mejora el rendimiento del sistema de almacenamiento y se aumenta la capacidad de expansión. ②Virtualización SAN basada en enrutador de almacenamiento El enrutador de almacenamiento es un dispositivo inteligente que no solo tiene la función de un enrutador, sino que también está especialmente optimizado para E/S.

Se implementa en enrutadores de almacenamiento. Varios enrutadores de almacenamiento guardan múltiples copias de metadatos en todo el sistema de almacenamiento y mantienen la coherencia a través de ciertas estrategias de actualización. En esta estructura, el enrutador de almacenamiento tiene más ventajas porque tiene potentes funciones de protocolo. Puede aprovechar al máximo los recursos de almacenamiento y proteger las inversiones. Puede realizar el aislamiento de software y hardware y se complementa con una gran cantidad de herramientas de automatización, lo que mejora la seguridad de los servidores virtuales y reduce la necesidad y el costo del personal técnico.