La responsabilidad más básica del ingeniero de operación y mantenimiento del sistema es ser responsable de la estabilidad del servicio y garantizar que el servicio pueda brindar servicios a los usuarios las 7 horas del día, las 24 horas del día, de manera ininterrumpida. Además de esto, las principales responsabilidades de los ingenieros de operación y mantenimiento son las siguientes:
1. Calidad: garantizar y mejorar continuamente la disponibilidad de los servicios, garantizar la seguridad de los datos del usuario y mejorar la experiencia del usuario.
2. Eficiencia: utilizar herramientas/plataformas automatizadas para mejorar la eficiencia de la ingeniería del software en el ciclo de vida de I+D.
3. Costo: Optimice la arquitectura del servicio y el ajuste del rendimiento a través de medios técnicos; reduzca los costos y mejore el retorno de la inversión mediante la optimización y combinación de recursos.
Desde la perspectiva del ciclo de vida del producto:
1. Antes del lanzamiento del producto: Responsable de participar y revisar la racionalidad y operatividad del diseño de la arquitectura para garantizar que pueda ser Eficiente. y funcionamiento estable.
2. Etapa de lanzamiento del producto: Responsable de utilizar tecnología o plataformas automatizadas para garantizar que el producto pueda lanzarse de manera eficiente y luego pueda iterarse de manera rápida y estable.
3. Fase de operación y mantenimiento del producto: responsable de garantizar el funcionamiento estable del producto las 24 horas del día, los 7 días de la semana, durante la cual se pueden localizar y resolver rápidamente diversos problemas que surjan optimizando continuamente la arquitectura y la implementación del sistema en el día a día; rendimiento del trabajo para mejorar la estabilidad de los servicios del sistema.
Información ampliada:
Para convertirse en un ingeniero de operación y mantenimiento calificado, debe dominar muchas habilidades. Los ingenieros de operación y mantenimiento de Linux prestan atención a la amplitud. para ingenieros de computación en la nube de Linux:
1. Conceptos básicos del sistema Linux: conocimientos básicos de Linux, uso de comandos y puntos de conocimiento básicos, como usuarios y permisos
2. - Linux gestiona procesos, recursos, tareas, archivos, paquetes de software, discos, etc.
3. Servicios empresariales comunes de Linux: servicios comunes a nivel empresarial como DNS, FTP, HTTP y correo.
4. Principios de seguridad y técnicas de prevención a nivel empresarial de Linux, así como redes y seguridad: arquitectura de seguridad de Linux, modelo de amenazas a la seguridad, cifrado, descifrado y otros principios, ataques comunes y secciones de prevención
5. ¿Programación de Shell? Gate y Avanzado: uso básico y avance de los scripts de Shell, desde básico hasta competente, necesita aprender algunos principios y administración de aplicaciones comunes de nivel empresarial.
6. Instalación, administración, autorización, adición, eliminación, modificación y verificación de MySQL
7. Aceleración de caché de proxy del servicio http: aplicación de protocolo de nivel http, caché, servicio web nginx
8. Clúster de carga de nivel empresarial LVS de equilibrio de carga de 4 capas y aplicación de equilibrio de carga de 7 capas nginx y haproxy
9. con keepalived como núcleo, así como alta disponibilidad maestro-esclavo, maestro dual
10 Monitoreo de operación y mantenimiento, sistema de monitoreo a nivel empresarial zabbix y flujo zabbix ¿Función y arquitectura del sistema de monitoreo de código abierto? /p>
11. Automatización de operación y mantenimiento de computación en la nube: ansible, títere y otras soluciones de automatización de operación y mantenimiento
12. Arquitectura del sistema de servicio WEB: arquitectura del sistema de servicio WEB, sistema JSP, tomcat, CDN , principio de almacenamiento en caché, prueba de estrés, evaluación
13. Arquitectura del clúster de Internet y soluciones prácticas: clúster LB: nginx, Haproxy, clúster LVS HA, separación dinámica y estática MySQL DBA. Habilidades prácticas y optimización: optimización de parámetros de base de datos, subbase de datos y subtabla, plan de respaldo, estrategia de recuperación de datos, replicación maestro-esclavo, separación de lectura y escritura, grupo de conexiones y tecnología de fragmentación, MHA, etc.
15. Computación en la nube a nivel empresarial Openstack-Keystone, Glance, componentes centrales de Nova, módulos de red, servicios de almacenamiento en bloque, etc.
p>
16. Práctica de operación y mantenimiento de Hadoop de datos a nivel empresarial. - Principios básicos, configuración de instalación y aplicación de la base de datos en columnas HBase, construcción del clúster Zookeeper, implementación de Namenode en Hadoop.
17. >
18. Aplicaciones NoSQL de nivel empresarial: aplicaciones Nosql, como redis, replicación de MongoDB, aplicaciones de clúster y otras aplicaciones
19. Aplicación práctica ELK del sistema de recopilación de registros de nivel empresarial: recopilación masiva de registros de datos. sistema Aplicación Elasticsearch + Logstash + kibana
20. Integración sostenible: aplicación de nivel empresarial Jenkins + github
21. Contenedor virtualizado Docker-Linux Docker virtualizado ligero, principio, instalación y configuración. y aplicación de Docker
22 Práctica K8S a nivel empresarial: funciones de componentes, instalación, configuración, escenarios de aplicaciones a nivel empresarial y análisis de fallas comunes
23 Ajuste práctico del sistema Linux: completo. explicación del ajuste del sistema Linux desde la memoria, la CPU, la programación de procesos, el disco IO, los parámetros de red, etc.
24. ¿Conceptos básicos de programación de Python? Puerta: instalación de Python, juicio lógico, uso de módulos, etc. Mejora integral de las capacidades: capacidad de expresión, capacidad de trabajo en equipo, capacidad de ejecución, competencia, etc.