Tengo el placer de trabajar con docenas de ingenieros cada mes de empresas de toda Norteamérica. Independientemente del tipo de empresa para la que trabajen, he comprobado que todas tienen una cosa en común: intentan mantener redes más grandes y complejas con un equipo de personal más reducido.

Los sistemas de gestión de redes se esfuerzan por automatizar la experiencia del usuario, desde la implantación de complejos sistemas de programación hasta el uso de motores heurísticos para ayudar en la gestión de eventos. La única pieza que suele faltar es el mantenimiento de la propia solución de monitorización. Recientemente, Opmantek tuvo la oportunidad de abordar esta cuestión de frente. Lo que hicimos, cómo funciona y los resultados que obtuvimos son el tema de este artículo.

Como muchas empresas norteamericanas, nuestro cliente, una gran corporación multinacional, había crecido a lo largo de los años a través de varias fusiones y adquisiciones. La gestión de su infraestructura consistía en varias plataformas dispares de más de una docena de proveedores.

Nuestros servicios de implementación incluyen una serie de talleres iniciales diseñados para obtener información y comentarios de todos los niveles, desde los ingenieros hasta la alta dirección. Cuando llevamos a cabo estas reuniones de investigación, descubrimos muchos retos y puntos débiles específicos del negocio de nuestro cliente. También nos enteramos de que tenían Service Now -una base de datos de gestión de la configuración (CMDB)- que se utilizaba como única fuente de verdad de la empresa para todo el inventario de equipos. Esto nos dio una idea...

Service Now, como la mayoría de los sistemas CMDB modernos, incluye una interfaz de programación de aplicaciones (API) muy sólida. Gracias a esta API, pudimos crear fácilmente una integración que extrajera una lista de dispositivos activos, los comparara con los dispositivos actualmente supervisados y conciliara la lista añadiendo nuevos dispositivos, actualizando los existentes e incluso retirando los dispositivos de la supervisión cuando se marcaran como fuera de servicio.

Nuestra solución arquitectónica para este cliente incluía una serie de motores de sondeo geográficamente diversos, todos ellos conectados a una serie de servidores primarios redundantes. Cada capa ofrecía múltiples métodos de redundancia y conmutación por error. Nuestra integración con Service Now tuvo en cuenta esto, automatizando la asignación de dispositivos a motores de sondeo geográficamente, incluso soportando dispositivos con diferentes niveles de servicio; algunos necesitan 1 o 2 motores de sondeo asignados.

Para mejorar aún más el sistema, también automatizamos la asignación de dispositivos a opConfig, nuestra solución de gestión de la configuración y el cumplimiento, y a opEvents, nuestro sistema inteligente de gestión de eventos que proporciona correlación de eventos, deduplicación y automatización de acciones. Estas soluciones se complementaron con la adición de opTrend, que amplía el ya extenso sistema de umbrales y alertas de Opmantek mediante la implementación de un Sistema de Detección de Excepciones Estadísticas (SEDS) altamente flexible, la metodología de Igor Trubin, que aprende cuál es el comportamiento normal en la red del cliente y ajusta los umbrales de forma dinámica basándose en el uso histórico de cada hora de cada día de la semana.

Nuestra implementación de la Fase 1 se centró en los dispositivos de red y ha permitido al cliente consolidar su plataforma de monitorización en una única solución basada en Opmantek, desmantelando varios otros sistemas. En nuestra próxima fase, automatizaremos la supervisión de su amplia red de servidores. Este esfuerzo continuará aprovechando la información de Service Now, lo que nos permitirá supervisar los servicios y las aplicaciones, generar transacciones sintéticas para ejercitar cada nivel de aplicación y continuar ampliando su visión en toda la empresa a través de un único panel de vidrio.
La última pieza de este rompecabezas fue la adición de Service Assurance and Monitoring. Esto proporciona una capa adicional de apoyo a través de las comprobaciones mensuales del servidor, las actualizaciones de software y la supervisión 24/7 de la solución de monitorización. Con estas soluciones, el cliente no tiene que preocuparse de perderse un evento porque su solución de monitorización no esté actualizada o, peor aún, no funcione como está diseñada.

En total, la solución integrada de Opmantek ha eliminado el mantenimiento necesario para mantener la mayoría de los sistemas de monitorización de red, ha garantizado que todos los dispositivos se monitoricen adecuadamente según el SLA correcto y ha proporcionado una solución de clase empresarial a través de un único panel de vidrio.