El contenido de la capacitación para ingenieros de operación y mantenimiento incluye explicaciones sobre conocimientos de seguridad eléctrica, comprensión en sitio de transformadores, gabinetes de distribución de media tensión, gabinetes de distribución de baja tensión, UPS, EPS, baterías, gabinetes de precisión, Grupos electrógenos diésel y aprendizaje de contenidos de los trabajos de inspección in situ.
1. Introducción a los Ingenieros de Operaciones y Mantenimiento
1. Los Ingenieros de Operaciones y Mantenimiento (Operaciones) son responsables de mantener y garantizar la alta disponibilidad de todo el servicio, mientras optimizan continuamente el sistema. La arquitectura para mejorar la eficiencia de la implementación y optimizar la utilización mejora el retorno de la inversión general.
2. El mayor desafío al que se enfrentan los ingenieros de operación y mantenimiento es la gestión de clústeres a gran escala. Cómo gestionar servicios en cientos de miles de servidores y al mismo tiempo garantizar la alta disponibilidad de los servicios es lo que hacen los ingenieros de operación y mantenimiento. enfrentar.
2. Contenido del trabajo de los ingenieros de operación y mantenimiento
1. Gestión de incidencias: El objetivo es restablecer el servicio lo más rápido posible cuando se produce una anomalía en el servicio, asegurando así la calidad del servicio. disponibilidad del servicio, al mismo tiempo, análisis en profundidad Identificar las causas de las fallas, promover y reparar los problemas del servicio, y diseñar y desarrollar planes relevantes para garantizar que las pérdidas puedan detenerse efectivamente cuando ocurren fallas en el servicio;
2. Descubrimiento de problemas: diseñe y desarrolle una plataforma de monitoreo y una plataforma de alarma eficientes, utilice aprendizaje automático, análisis de big data y otros métodos para resumir y analizar una gran cantidad de datos de monitoreo en el sistema, y cuando sea necesario. Se produce una anomalía en el sistema. Los problemas se pueden descubrir rápidamente y se puede determinar el impacto de las fallas.
3. Manejo de problemas: Diseñe y desarrolle plataformas y herramientas eficientes para el manejo de problemas, que puedan tomar decisiones de manera rápida/automática y desencadenar planes relevantes de parada de pérdidas cuando ocurre una anomalía en el sistema, y restaurar rápidamente los servicios.
4. Seguimiento del problema: determine la causa raíz del problema analizando el rendimiento del sistema (registros, cambios, monitoreo) cuando ocurre el problema y formule y desarrolle herramientas de planificación.