El valor de la automatización

Problema: tareas manuales, tarda mucho tiempo en realizar el TS, aumenta el tiempo de inactividad, no hay suficiente información para el RCA

Es un largo fin de semana de vacaciones, la mayor parte del personal de apoyo se ha ido de vacaciones y está ilocalizable, dejando un equipo de apoyo "esquelético" de guardia y disponible en caso de emergencias. Una gran tormenta atraviesa la región y deja a muchos de sus clientes fuera de servicio debido a los cortes de la red.
En un día "normal", el personal de soporte habría visto las alertas y alarmas procedentes de la red y habría empezado a solucionar los problemas. Pero este no es un día "normal".

El equipo de la red tiene obligaciones SLA con sus clientes para minimizar el tiempo de inactividad, por lo que el restablecimiento del servicio debe ser puntual. ¿Qué se hace? Llega la Automatización de Procesos Operativos (OPA).

La automatización de los procesos operativos consiste en implantar los sistemas y flujos de trabajo adecuados para automatizar las tareas operativas repetitivas, como los pasos de resolución de problemas, para mejorar la eficiencia y garantizar la coherencia en los equipos de operaciones.

¿Cómo funciona la OPA?

  1. Necesidad de poder DETECTAR los incidentes que requieren acciones mediante el procesamiento de los datos del entorno, buscando síntomas indicativos de la introducción de un riesgo operativo. Identificar las alarmas generadas y comunicadas a través de las herramientas de gestión de eventos que se relacionan con las características del incidente.
  2. Determinar qué pasos se dan normalmente, y a veces de forma rutinaria, para DIAGNOSTICAR y solucionar los incidentes detectados. Documentar el flujo de trabajo de resolución de problemas basado en la información recopilada, identificando las tareas necesarias para ver y, en última instancia, resolver el incidente.
  3. Determine qué ACCIONES son necesarias para resolver el incidente o implementar soluciones: Identifique las tareas y los pasos comunes que hay que completar, basándose en el flujo de trabajo de la solución de problemas, y utilice el software Opmantek para realizar el mayor número de pasos posible (por ejemplo, entrar en el router por ssh y emitir y capturar los comandos "show").

A medida que se introducen las acciones correctoras automatizadas en el entorno operativo, se requerirán revisiones técnicas y las aprobaciones de cambios necesarias para garantizar la precisión y coherencia de los pasos dados. A medida que las acciones correctoras vayan demostrando con el tiempo que son estables, precisas, coherentes y más maduras, podrán ser más automáticas y, con el tiempo, integrarse en otros procesos y herramientas, como el sistema de gestión de incidencias.

La automatización de los procesos operativos no sólo mejora el tiempo medio de restauración del servicio, sino que también reduce el coste de la prestación del servicio y fomenta una mayor disponibilidad de la red. La automatización de las tareas rutinarias aumenta la productividad del equipo técnico y de operaciones, produce resultados consistentes y precisos, aumenta la satisfacción laboral del personal, educa al personal de soporte sin experiencia y, en última instancia, aumenta la satisfacción del cliente.
Así que volvamos a nuestra gran interrupción por la tormenta. Menos mal que los equipos técnicos pusieron en marcha OPA hace unas semanas. Al automatizar y remediar los pasos necesarios para la solución de problemas, se logró una resolución más rápida de los incidentes de la red, minimizando el tiempo de inactividad y manteniéndose dentro de las directrices del SLA establecidas con los clientes.

Poner los conocimientos de los ingenieros y los equipos de operaciones en las "manos" de las máquinas