Lo que hace específicamente la operación y mantenimiento de la red es lo siguiente:
Operación y mantenimiento se refiere a la operación y mantenimiento de Internet, que generalmente pertenece al departamento técnico, es decir, la operación y mantenimiento departamento. La responsabilidad de operación y mantenimiento es garantizar el funcionamiento estable del servicio, considerar la escalabilidad del servicio, proponer requisitos de desarrollo desde la perspectiva de la estabilidad y operatividad del sistema, localizar problemas del sistema y responder rápidamente a problemas y procesamiento repentinos.
Las responsabilidades de operación y mantenimiento cubren el ciclo de vida del producto desde el diseño hasta el lanzamiento, la operación y el mantenimiento, los cambios y las actualizaciones, y fuera de línea, junto con la I+D, las pruebas y la gestión del sistema, son los cuatro departamentos principales. que respaldan el soporte técnico de productos de Internet.
El foco de operación y mantenimiento radica en los diversos entornos en los que se ejecuta el sistema, desde arquitecturas básicas como salas de computación, redes, almacenamiento, máquinas físicas y máquinas virtuales hasta bases de datos, plataformas de middleware y plataformas en la nube. y plataformas de big data. El énfasis no está en la programación, sino en el uso y gestión de dichas plataformas. El nivel de operación y mantenimiento puede convertirse en un estándar para medir la solidez técnica de una empresa (empresa de TI).
1. Trabajo diario de operación y mantenimiento
1. Es necesario analizar los requisitos del sistema y diseñar soluciones, pensar en lo que se puede fortalecer para garantizar la estabilidad y coordinar con el. sistema Comunicarse eficazmente con el personal de I+D
2. Utilizar herramientas o escribir programas para analizar datos operativos.
3. Escribir programas para construir herramientas o plataformas para mejorar la estabilidad del sistema.
Lo más importante para los ingenieros de operación y mantenimiento es utilizar métodos de programación y software para resolver problemas. El camino del desarrollo no debería ser muy diferente al de un ingeniero de software. La diferencia está sólo en el enfoque y la dirección del campo.
2. La operación y el mantenimiento deben dominar los siguientes indicadores de medición
1. Tiempo medio entre fallas (MTBF)
Tiempo medio entre fallas (MTBF, Mean). Tiempo entre fallas), se refiere al tiempo de trabajo promedio entre dos fallas adyacentes. MTBF suele ser un indicador para medir la confiabilidad de un producto. Cuanto más corto es el intervalo, peor es la confiabilidad del sistema.
2. Tiempo medio de reparación (MTTR)
El tiempo medio de reparación (MTTR, tiempo medio de reparación) se refiere al tiempo medio de reparación cuando el producto cambia de un estado de falla a un estado de falla. estado de funcionamiento, es decir, el tiempo medio necesario para reparar una avería. Cuanto menor sea el valor de MTTR, más oportunamente se reparará la falla.
3. Disponibilidad
La disponibilidad es un indicador de medición muy importante en el diseño de la arquitectura del sistema. Según la definición de disponibilidad en GB/T3187-97, la disponibilidad se refiere a la capacidad de un producto de estar en un estado que puede realizar funciones específicas en condiciones específicas y dentro de un momento o intervalo de tiempo específico, siempre que se disponga de los recursos externos necesarios. garantizado. Es un reflejo integral de la confiabilidad, mantenibilidad y soporte de mantenimiento del producto.