7 pasos para la automatización de la gestión de redes y el seguro de sueño para los ingenieros

05/29/2020 |

En silencio, en algún lugar de una oficina en el centro de la ciudad, los rodamientos diseñados para durar 25 mil horas han estado funcionando sin parar durante más de cuarenta y tres mil. El ventilador se fabricó a bajo coste a partir de componentes obtenidos durante varios años en una docena de proveedores. Estuvo en caja durante semanas antes de ser instalado en el chasis del router, que a su vez estaba en caja. Dos meses en el mar, bien embalado en un contenedor de transporte, y luego más meses rebotando y revolviendo de un camión a un almacén, y de vuelta a una entrega de paquetes. Finalmente, el dispositivo fue configurado, embalado y enviado a su punto de instalación final. Metido en un armario demasiado estrecho y sin circulación de aire, este router de misión crítica ha estado funcionando sin parar durante los últimos cinco años. Es un milagro que haya funcionado tanto tiempo.

La velocidad del ventilador fue lo primero que se vio afectado por el fallo del rodamiento.

El aumento de la fricción en el eje del impulsor del ventilador hizo que el consumo de amperaje aumentara para compensar y mantener la velocidad de rotación. Cuando el consumo de amperaje llegaba al máximo, las rotaciones por minuto (RPM) disminuían. Con la velocidad más lenta del ventilador vino menos flujo de aire, con menor flujo de aire la temperatura del chasis aumentó.

Los dispositivos complejos, como los routers, requieren temperaturas de funcionamiento bajas. Cuanto más frío esté, más fácil será el movimiento de los electrones. A medida que la temperatura del chasis aumentaba, el router experimentaba problemas para procesar los paquetes de datos que atravesaban las interfaces. Al principio era un error aquí o allá, luego el enrutamiento de tráfico rutinario tuvo problemas y el router comenzó a descartar paquetes. A partir de ahí las cosas empeoraron mucho.

Es sábado por la tarde y tu fin de semana ha sido tranquilo hasta ahora. Una noche con tu pareja, una película y una cena. Ya es tarde y estás listo para ir a la cama cuando tu teléfono suena. El mensaje de texto es corto;

Dispositivo: Router principal

Evento: Chasis de alta temperatura con paquetes de salida de alto descarte

Acción tomada: Redirigir el tráfico aumentando el coste de OSPF

Acción requerida: Velocidad del ventilador baja, amperaje alto. El ingeniero debe investigar para reparar o reemplazar.

Un ventilador se estropeó, ¿qué es lo siguiente?

El sistema había respondido como lo haría usted: redirigió el tráfico fuera de la interfaz afectada evitando un posible impacto en el funcionamiento del sistema. Añadiendo una nota en su calendario para investigar el router a primera hora de la mañana del lunes se acostó para dormir bien.

A nuestro ingeniero principal en Asia-PAC, Nick Day, le gusta referirse a las soluciones de Opmantek como un "seguro de sueño para ingenieros". Viniendo de una experiencia en proveedores de servicios gestionados, puedo apreciar la situación. Los equipos siempre se rompen en su tiempo de vacaciones, a menudo cuando el ingeniero de guardia está lo más lejos posible, y con poca información útil del NMS. Este fue uno de los principales escenarios que utilizamos cuando creamos nuestra solución de Automatización de Procesos Operativos (OPA).

Construir una solución

Aprovechando la capacidad combinada de opTrend para identificar parámetros operativos fuera de las normas de tendencia, opEvents correlaciona los eventos y automatiza la corrección. Con la adición de opConfig se pueden automatizar los cambios de configuración de los dispositivos de red. La Automatización del Proceso Operativo (OPA) se basa en este análisis estadístico y en la heurística basada en reglas, para automatizar la resolución de problemas y la corrección de los eventos de red. Esto, a su vez, reduce el impacto negativo en la experiencia del usuario.

Los magos nunca revelan sus secretos... pero haremos una excepción.

Veamos ahora cómo se ha conseguido con el ejemplo anterior. opTrend es un motor de análisis estadístico. opTrend recoge los datos de rendimiento de NMIS, el sistema de fallos y rendimiento de Opmantek, y determina lo que es un funcionamiento normal. Mirando hacia atrás durante varias semanas, normalmente veintiséis, opTrend determina lo que es normal para cada parámetro que procesa. Lo hace hora por hora, considerando cada día de la semana individualmente. Así, el lunes por la mañana, de 9 a 10, tiene su propio cálculo, que es distinto al del sábado por la tarde, de 3 a 4. Al considerar varias semanas, opTrend puede normalizar cosas como los días festivos y las vacaciones.

Una vez que se determina la media de cada parámetro, opTrend calcula la desviación estadística del parámetro y crea una ventana de tres desviaciones estándar por encima y por debajo de la media. Cualquier actividad por encima o por debajo de estas ventanas desencadena un evento de opTrend en NMIS. Estos eventos pueden ser adicionales a los generados por el sistema de Umbral y Alerta de NMIS, o en su lugar.

En el ejemplo anterior, opTrend habría visto que la temperatura del chasis superaba la ventana normal de funcionamiento. Si la velocidad del ventilador y/o el amperaje también hubieran sido procesados por opTrend (no lo es por defecto, pero puede configurarse para que lo sea si se desea), éstos se habrían reportado como una baja velocidad del ventilador, y un alto amperaje).

Este evento de opTrend habría sido enviado a NMIS, y luego compartido con opEvents para su procesamiento. Un conjunto de reglas, o Acciones de Eventos, buscaba eventos que pudieran ser causados por una alta temperatura; a menudo relacionados con errores o descartes de paquetes de la interfaz. En el caso de los dispositivos inalámbricos (WiFi y RF), esto puede afectar a la intensidad de la señal y a la velocidad de conexión. Un resultado similar podría ser manejado usando una Regla de Correlación, que agruparía múltiples eventos a través de una ventana de tiempo en un nuevo evento padre. Ambos métodos son relevantes y tienen sus propios pros y contras.

opEvents ahora utiliza el evento de alta temperatura / altos descartes para iniciar una rutina de solución de problemas. Esto puede incluir dirigir opConfig para conectarse al dispositivo a través de SSH y ejecutar comandos CLI para recopilar información adicional de solución de problemas. El resultado de estos comandos puede tener su propia vida operacional - siendo evaluado por condiciones de error, disparando nuevos eventos y ellos mismos iniciando Acciones de Evento.

Revisemos el flujo del proceso:

NMIS recoge datos de rendimiento del dispositivo, incluyendo la velocidad del ventilador, la temperatura y las métricas de rendimiento de la interfaz.
opTrend procesa los datos de rendimiento recogidos de NMIS y determina cuál es el comportamiento normal/anormal de cada parámetro.
Los eventos son generados por opTrend en NMIS, que luego se comparten con opEvents.
opEvents recibe eventos de opTrend que identifican descartes de temperatura y de salida de la interfaz fuera de lo normal. Estos eventos se correlacionan en un único evento sintético, al que se le da una mayor prioridad, y se evalúa para la acción
Una regla de acción de eventos coincide con un evento que afecta al rendimiento en un dispositivo Core que ejecuta un SO conocido. Esto llama a opConfig para que inicie copias de seguridad de la configuración cada hora y cada día, y luego ejecute un cambio de configuración para aumentar el coste de OSPF en la interfaz forzando el desvío del tráfico fuera de esta interfaz.
opEvents también abre un ticket de asistencia a través de una API RESTful, y luego envía un mensaje de texto al técnico de guardia con las acciones realizadas y las actividades de seguimiento recomendadas.
Una vez que el tráfico a través de la interfaz caiga, el error de descarte se borrará, generando un texto de notificación de subida al técnico de guardia.

Este es un ejemplo de lo que consideraríamos una automatización de complejidad media. Se compone de varias soluciones de Opmantek, cada una de ellas configurada (la mayoría de forma automática) para trabajar conjuntamente. Estas siete soluciones comparten y procesan información sobre fallos y rendimiento, correlacionan los eventos resultantes, aplican un único conjunto de acciones de eventos para recopilar información adicional y configuran en torno al evento. A la hora de aplicar las automatizaciones de las soluciones, abogamos por una metodología de rastreo-caminata-ejecución en la que se empieza por recopilar la información de resolución de problemas (rastreo), luego se automatizan las correcciones sencillas de un solo paso (caminata) y, a continuación, se despliegan lentamente las correcciones de varias rutas con puntos de control (ejecución).

Póngase en contacto con nosotros y empiece a automatizar la gestión de su red

Póngase en contacto con nuestro equipo de expertos aquí si desea saber cómo se desarrolló esta solución, o cómo se puede aprovechar la automatización de procesos operativos para ahorrar horas de trabajo y reducir el tiempo medio de resolución (MTTR).

Sin categoría

Cómo gestionar la capacidad, antes de que se convierta en un problema.

05/15/2020 |

La gestión de la capacidad es la gestión proactiva de cualquier recurso finito medible.

Este blog le ayudará con un esquema sencillo de seguir sobre cómo gestionar adecuadamente la capacidad, de modo que si alguna vez tiene que resolver problemas de capacidad, estará por delante y listo para aplicar la corrección.

La gestión de la capacidad ha sido considerada por muchos como algo difícil de conseguir. Pero todos los logros que merecen la pena requieren disciplina para su ejecución y cumplimiento. Así que, con una cuidadosa consideración, supervisión y planificación, puedes asegurarte de que sea manejable y entregable.

No hay que olvidar que, como parte de cualquier nuevo despliegue o actualización, y en la medida en que el presupuesto lo permita, la demanda adicional debe incorporarse al diseño, con capacidad adicional lista para dar servicio a los nuevos picos de capacidad. La nueva carga máxima se contabiliza y se crean nuevas líneas de base.

Parálisis del análisis

El concepto general es que no se crean informes sólo por crearlos. Puede que la gente los lea una vez y nunca más. Pero al estar automatizados, se seguirán enviando y quedarán sin abrir, filtrar o archivar. Este no es el resultado que usted desea.

El comportamiento que quiere impulsar es que la gente utilice sus informes. Por lo tanto, cree informes que impulsen acciones. Por ejemplo, los informes sobre el estado de los nodos pueden proporcionar listas de comprobación para impulsar la resolución diaria de problemas, marcar las revisiones de mantenimiento, aplicar el mantenimiento o la reparación de los dispositivos. Utilice los informes de eventos diarios para ayudar al equipo de ingeniería a entender cuál es el ruido de fondo normal y la estática en su red o para impulsar una limpieza. Y, por supuesto, informes semanales o mensuales. Por ejemplo, un informe de la WAN/interfaz para respaldar el ancho de banda y la inversión en equipos puede que sólo necesite producirse mensualmente, pero un recurso de consumo de capacidad de crecimiento más rápido debería producirse semanalmente.

Detección de problemas de capacidad mediante la gestión de umbrales.

El problema con los problemas de capacidad es que pueden presentarse de muchas maneras diferentes, con el resultado de que algo no está funcionando como era, o debería ser. Al igual que lo que hablé en mi blog sobre la congestión del ancho de banda, un usuario informará de que "alguna aplicación" no funciona como lo hacía ayer, una alarma de umbral de capacidad se ha disparado. Si quieres aprender sobre el análisis de la causa raíz, echa un vistazo al vídeo de Marks aquí -> MARKS WEBINAR.

Uso de los productos Opmantek para gestionar la capacidad

Añade tus dispositivos a NMIS (y de paso, asegúrate de tener una convención de nombres a seguir, tener todo el SNMP hecho y tu red documentada)

IP, Nombre y Cadena de Comunidad
Asignar funciones a los dispositivos (utilizar el núcleo, la distribución y el acceso incorporados)

Preparar la visibilidad

Establezca informes periódicos con la ayuda de opReports
1. Si gestiona una red, seleccione los informes de red
2. Si gestiona servidores, utilice el informe de capacidad
3. Si gestionas servidores y redes haz los pasos a + b
4. Establezca la programación - Haga que le envíen un correo electrónico una vez a la semana a tiempo para su sesión de planificación y revisión del rendimiento.
Configurar cuadros de mando de capacidad, utilizar las vistas de TopN en opCharts
1. Añade TopN y mapas de red a tu vista (buena práctica)
2. Cree gráficos para sus recursos más importantes

Alarma y notificaciones sencillas

Habilitar notificaciones para problemas de capacidad de recursos críticos - Comience con Crítico y Fatal sólo de esta lista Normal/Advertencia/Menor/Mayor/Crítico/Fatal.

Añade más adelante, a medida que vayas adquiriendo conocimientos.

Configure la notificación por correo electrónico a los equipos adecuados en función del rol (Core, Distribution Access) o del tipo de dispositivo (Server, Router, Switch) para que se envíen los eventos de umbral.

Tendencias - para la planificación predictiva de la capacidad

Activar opTrend para encontrar anomalías en el uso (eventos) y recursos que tienen una tendencia continua fuera de lo normal (cartelera)
1. Notificar sobre eventos críticos del umbral de opTrend.
2. Revise la cartelera opTrend Top of The Pops en sus reuniones periódicas de revisión de capacidad.

Pasos sencillos a la hora de gestionar los problemas de capacidad como incidentes.

Aunque no es lo ideal, los problemas/incidentes que se ven en el servicio de asistencia técnica podrían tener su origen en un cambio que tuvo lugar en la red o en el entorno. En el mundo real, incluso la mejor implementación de la gestión de cambios o una interrupción pueden causar un problema de capacidad en algún lugar y activar una alarma.

Pregunte. ¿Qué ha cambiado? ¿Ha cambiado algo en el entorno?

Normalmente, el incumplimiento del umbral de capacidad es un indicador de:

¿Un nuevo servicio añadido?
¿Una nueva demanda?
¿Un cambio de red?
¿Algún otro cambio?
Un activo finito que alcanza una capacidad predeterminada

Enfoques de la línea de base para la supervisión y el apoyo:

Examine todos sus recursos y revise y clasifique sus tipos de recursos, por ejemplo, conexiones a Internet, enlaces a sitios, etc. Para cada categoría concluya algunos niveles de uso de referencia como porcentajes (Fatal, Crítico, Mayor, etc.) que serán su línea de base inicial. Es fundamental conocer su línea de base, ya que todas las alarmas de umbral se activarán en los niveles que usted establezca y sus notificaciones de alarmas de umbral deben ser sólo para las alarmas más graves. Usted no quiere "dar la voz de alarma".

Considere la posibilidad de agrupar sus recursos, por ejemplo Núcleo, Aplicación, DMZ, Borde, Sucursal, Enlaces de Internet, WAN general, etc.

Y dentro de cada grupo, considere los siguientes recursos que desea supervisar:

Utilización de la CPU, la memoria y el ancho de banda

Empiece por utilizar umbrales generales para cada uno de ellos, basados en los picos de demanda que haya observado.

Estos son sus avisos proactivos que enviarán una alarma a su plataforma de gestión. Es posible que desee establecer algunas reglas de escalamiento para el recurso, por ejemplo:

85% - 95% → Mayor → Notificación de alarma (horario laboral) → al equipo de capacidad.

>95%+ → Crítico → Notificación de alarmas (24×7) → helpdesk/NOC

Utilizando el análisis de tendencias proporcionado por opTrendse puede identificar un uso muy anómalo (es bajo cuando normalmente debería ser alto a esa hora del día) o mirar proactivamente los recursos que tienen una tendencia al alza o a la baja frente a sus niveles normales. De este modo, podemos empezar a revisar el recurso con antelación para realizar las modificaciones oportunas (actualización, reducción, descarga de trabajo, etc.). A medida que la red sigue creciendo y soportando nuevos servicios, la línea de base cambiará con el tiempo (línea de base deslizante), por lo que los problemas de capacidad pueden "aparecer", ya que los umbrales de alarma pueden no ser superados todo el tiempo para enviar una alerta. Es importante observar la "tasa de cambio" de la línea de base a lo largo del tiempo para determinar las necesidades de capacidad (por ejemplo, un cambio del 10% en un período de una semana). Al planificar el aumento de la capacidad, asegúrese de tener en cuenta el tiempo de adquisición y aprovisionamiento.

He mencionado la línea de base deslizante y el seguimiento de la tasa de cambio de la línea de base para que los problemas de capacidad no se "arrastren"

Sin categoría

Gestión de rendimiento y fallos para MSP y empresas de clase empresarial

05/11/2020 |

El objetivo principal de la gestión de fallos y del rendimiento para los MSP (proveedores de servicios gestionados) y las empresas de clase empresarial es reducir el tiempo de inactividad, por lo que cuanto más rápido pueda un gestor de red identificar un error de red, mejor. En este blog, ofreceremos una visión general de cómo puede optimizar sus servicios de gestión de fallos y rendimiento.

Empaquetado de la supervisión del rendimiento y los fallos como un servicio

En los servicios de gestión de redes, es vital ser proactivo para mantener la satisfacción de los usuarios, por lo que es una buena idea tener requisitos separados para su gestión remota, como la aplicación de parches y los servicios de escritorio remoto.

Cuando ofrezca sus servicios a los clientes, es importante definir claramente la asistencia que proporciona en su acuerdo de nivel de servicio. Concéntrese en cómo sus servicios pueden mejorar los tiempos de reacción y reducir la cantidad de tiempo que se tarda en predecir las interrupciones y llegar a una resolución. El precio de sus servicios debe estar ligado a su valor, así que pregunte a sus clientes cuál es el coste de una hora de tiempo de red perdido y explique cómo puede corregirlo. Para asegurarse de que sus servicios evolucionan y mejoran constantemente, asegúrese de revisar los resultados de sus servicios de monitorización automática de la red y las medidas adoptadas semanalmente y mensualmente.

Gestión de las direcciones IP superpuestas y de la multipropiedad

Un caso de superposición de direcciones IP puede estar fuera de su control, pero es fundamental que se prepare para ello, tanto entre los clientes nuevos como los existentes. Segmentar los datos de los clientes en inquilinos separados para garantizar que sus cortafuegos lógicos evitarán la exposición de información confidencial a sus otros inquilinos.

El sistema NMIS de Opmantek gestiona el solapamiento de direcciones IP y la multitenencia proporcionando soporte en forma de nombres de dominio totalmente cualificados (FQDN), direcciones IP para dispositivos, etiquetas de metadatos (como departamento y cliente) y tablas. El sistema de Opmantek también proporciona escalabilidad de red mediante el uso de opHA para desplegar múltiples servicios de sondeo.

Aprovechamiento de los datos de tendencias para ajustar de forma inteligente la gestión de fallos

Los requisitos y las funcionalidades de los equipos informáticos pueden quedarse cortos en el "mundo real" en comparación con el mejor caso de laboratorio de un proveedor; por eso la tendencia dinámica ha sustituido a los umbrales estáticos para alertar a los clientes. Esto se ha logrado gracias a la comprensión de lo que es normal para cada dispositivo. opTrend de Opmantek tiene la capacidad de sustituir los umbrales estáticos por lo que es normal, creando cuadros de mando centrados y orientados a un propósito por cliente y tarea mediante la automatización.

Portal del cliente con cuadros de mando personalizados

Los cuadros de mando de autoservicio reducen las interrupciones de los clientes al tiempo que les proporcionan una sensación de control y transparencia; para los clientes que facturan, puede ser un elemento de venta o un diferenciador del servicio. Una implementación de opCharts se expone a Internet a través de un proxy invertido. A continuación, se crean cuentas de clientes dentro de ellas, que pueden ser objeto de scripts. A continuación, se asignan a ese usuario cuadros de mando, mapas, gráficos y servicios empresariales personalizados, pero sólo pueden ver los elementos a los que se les da acceso.

En Opmantek, hemos visto cómo muchos departamentos de TI se han transformado gracias a la implementación de nuestras herramientas de gestión de fallos y rendimiento de la red automatizada. Para empezar a tomar decisiones basadas en datos, reserve una demostración aquí y hable con uno de nuestros ingenieros sobre sus próximos proyectos de gestión de fallos y rendimiento.

Si desea saber más sobre cómo nuestras soluciones automatizadas pueden ayudarle a optimizar sus servicios de gestión de fallos y rendimiento, consulte el seminario web completo del ingeniero de sistemas senior Mark Henry para obtener más información y reducir el tiempo de inactividad.

Sin categoría

La Tele-medicina ha llegado para quedarse.

05/08/2020 |

Por lo general, cuando nos sentimos enfermos o tenemos alguna preocupación sobre nuestra salud recurrimos a un nuestro médico de cabecera o incluso a los hospitales. Sin embargo, con los avances en la tecnología de las comunicaciones nuestro menú de opciones para el cuidado de la salud se ha ampliado. Con la ayuda de la telemedicina podemos recibir consultas médicas donde sea y a la hora que sea sin la necesidad de salir de casa.

Gracias a la telemedicina, podemos consultar nuestros síntomas y cuestiones médicas con un profesional de la salud en tiempo real; pudiendo así recibir un diagnóstico opciones de tratamiento e incluso una receta, cuando esto es necesario. Así mismo, los doctores pueden monitorear nuestros signos vitales a distancia para estar al pendiente de nuestra condición.

Existen tres tipos:

Tele-medicina en vivo: También llamada "interactiva" es cuando los doctores y pacientes se comunican en tiempo real.
Monitoreo remoto de pacientes: permite a los cuidadores monitorear a los pacientes que utilizan equipo médico para obtener ciertos signos vitales como presión sanguínea, niveles de azúcar, etc.
Archivo y reenvío: Es cuando los médicos pueden compartir los datos sobre la salud de un paciente con otros profesionales o especialistas.

Una de las tantas consecuencias de brote de COVID-19 en el mundo, es que la tele-medicina dejará de ser considerada como una herramienta del futuro, ya que ha llegado a quedarse como un recurso alternativo a la consulta presencial.

Hoy en día, un médico puede atender a un paciente a distancia gracias a la evolución de las telecomunicaciones, lo cual ha traído como resultado una disminución en el número de personas en las salas de espera y, por consiguiente, una disminución en las posibilidades de contagio.

De esta forma, el avance tecnológico se ha vuelto clave en la industria de la salud, mejorando los servicios a través de esta innovadora forma de atención médica a distancia y generando toda clase de beneficios para todos los actores implicados en ello.

Si eres un profesional de la salud y te gustaría evolucionar en tu negocio, recuerda que puedes confiar en las herramientas de Opmantek para dar este paso.

¡No esperes más y contáctanos!

Sin categoría

Soluciones RMM ágiles para MSP

04/30/2020 |

La monitorización y gestión remotas(RMM) es el proceso de seguimiento, monitorización y gestión de puntos finales para múltiples clientes. Lo utilizan sobre todo los proveedores de servicios gestionados (MSP) para proporcionar servicios de TI a las organizaciones que subcontratan sus necesidades de TI. Siga leyendo para saber cómo una solución RMM autoalojada puede ayudar a los MSP a aumentar la funcionalidad y ahorrar en costes operativos.

¿Es usted un MSP que quiere sustituir los costosos sistemas RMM por una solución mejor?

Como MSP, ¿sabía que puede sustituir sistemas RMM de varios millones de dólares combinando NMIS con opHA y opCharts? FirstWave ofrece una solución de software de servicio completo que está hecha a escala. Nuestros productos pueden utilizarse en sinergia, como una solución completa.

¿Qué incluyen nuestros productos de solución de software RMM?

NMIS

NMIS es uno de los sistemas de gestión de redes más populares del mundo. Gestione cualquier cosa a cualquier escala. Amplíe NMIS con nuestros módulos y aumente su rendimiento, conocimiento y control.

opHA

opHA permite aumentar el rendimiento de las aplicaciones y ofrecer entornos de alta escala y alta disponibilidad, lo que incluye la distribución geográfica del sistema y la superposición de rangos de direcciones IP.

opCharts

Con gráficos dinámicos, cuadros de mando personalizados y una API RESTful para visualizar los datos NMIS y mucho más, opCharts proporciona un único panel de vidrio a través del cual se pueden ver todos los equipos gestionados de los clientes. Esto permite a los ingenieros desglosar los datos desde un solo dispositivo en una ubicación remota, pero permitiendo a los clientes ver sus propios sitios de forma privada y en el momento.

opEvents

opEvents ayuda eficazmente a reducir el impacto de los fallos y las averías de la red mediante la gestión proactiva de eventos.

¿Por qué debería elegir FirstWave en lugar de una solución SaaS basada en la nube?

En los últimos tiempos, se ha producido un cambio hacia el software como servicio (SaaS) y las soluciones basadas en la nube de talla única. Sin embargo, nos hemos dado cuenta de que nuestros clientes necesitan flexibilidad y soluciones a medida que puedan crecer con cada empresa. Decepcionados por las ofertas actuales de SaaS, cada vez son más los MSP que buscan soluciones evolucionadas.

Facilita la escalabilidad

Al tener el control, el potencial de escalabilidad se incrementa naturalmente, para permitir que su RMM crezca con su negocio. La escalabilidad del software permite satisfacer sus necesidades en el futuro, no sólo en el momento presente. En el imprevisible panorama empresarial actual, la escalabilidad es esencial para el éxito. Sin embargo, a medida que las empresas crecen y cambian, muchos proveedores de SaaS obligan a sus usuarios a realizar actualizaciones de pago innecesarias.

Más visibilidad y control sobre su red

El software de Opmantek puede desplegarse en la nube o en las instalaciones, pero como usted conserva la propiedad de la base de datos y tiene acceso al código fuente en el núcleo de NMIS, tiene más control sobre sus dispositivos gestionados y los datos de la red. La propiedad de los datos es otra preocupación clave de seguridad para muchas empresas, una preocupación que Opmantek aborda directamente.

Fácil de integrar con otros servicios

Si ya tiene varios productos diferentes que realizan funciones únicas dentro de su entorno de red, es poco probable que quiera o pueda sustituirlos todos a la vez. Para facilitarlo, en Opmantek nuestro software RMM es fácil de integrar para obtener una solución totalmente cohesionada. Ofrecemos múltiples opciones de integración, incluso para las API REST (HTTP(S), operaciones por lotes y la información proporcionada en archivos JSON y formularios CSV.

Tecnología de automatización inigualable

Nuestra supervisión automatizada de la red está por encima del estándar del sector y le permite ofrecer el mejor servicio posible a los clientes.

Le facilitamos el aumento de la rentabilidad

Puede ahorrarle dinero a su MSP, con una solución que crece con su negocio y se adapta a él, eliminando las costosas tasas de actualización periódicas que cobran los proveedores de software SaaS. Como parte del periodo de cambio, ofrecemos un servicio completo de incorporación. Su equipo designado le acompañará durante todo el proceso, respondiendo a sus preguntas y haciendo que la transición sea perfecta. Puede acceder fácilmente a nuestros servicios de asistencia en cualquier momento.

Una solución a medida para su empresa

Si desea experimentar una solución RMM que se adapte a los requisitos de su negocio, puede probarla usted mismo sin compromiso. Simplemente solicite una demostración del software FirstWave RMM para empezar.

Sin categoría

Cómo solucionar problemas de ancho de banda: Detecte, Diagnostique y Resuelva la Congestión de su Red

04/24/2020 |

El ancho de banda de la red siempre ha sido un bien preciado y, dadas nuestras circunstancias actuales con tanta gente trabajando desde casa, muchas empresas no han tenido el ancho de banda que necesitan en los lugares adecuados. Este blog le ayudará con algunas estrategias sobre cómo detectar problemas de ancho de banda, diagnosticar más a fondo esos problemas y qué acciones puede tomar para aliviar esos problemas de ancho de banda.

Detección de problemas de ancho de banda de la red mediante la gestión de la congestión.

La mayoría de los problemas relacionados con el ancho de banda de la red se presentarán como congestión, es decir, no hay suficiente ancho de banda para satisfacer las demandas de los usuarios y las aplicaciones. Los usuarios informarán de que "alguna aplicación" no funciona como ayer. Después de confirmar que la aplicación funciona y que los informes de los usuarios son correctos, ¿dónde hay que buscar?

Supervise los casos del servicio de asistencia técnica planteados, en particular cuando los usuarios informen de problemas con las aplicaciones a través de la red. Saber si se trata de una sucursal, un sitio remoto o una casa (acortará la resolución de problemas), es probable que indique una congestión de la red.
Supervise la utilización de los enlaces de red y emita alertas cuando el ancho de banda se utilice en exceso.
Asegúrese de controlar los descartes de paquetes y los errores.
Y, por último, supervisar los parámetros de calidad de servicio (QoS) disponibles en el dispositivo de red; en particular, se busca dónde la QoS ha causado la pérdida de paquetes.

El primer paso para la detección es instalar NMIS y dejar que empiece a recopilar datos YA. DESCARGAR NMIS

Diagnóstico de problemas de ancho de banda de la red

¿Qué problemas informan los usuarios sobre la velocidad de la red o de Internet? ¿Es lenta la aplicación debido a una conexión a Internet lenta o es inutilizable? Por ejemplo, ¿hay problemas con la voz sobre IP o las videoconferencias? ¿Ocurre durante la transferencia de archivos? ¿Están conectados con un cable ethernet o por Wi-Fi? ¿Se está utilizando la estrangulación del ancho de banda? Cuanta más información cualificada obtenga de su servicio de asistencia, más rápido podrá ponerse manos a la obra.Al supervisar la red en busca de problemas relacionados con la congestión, estará listo para iniciar un diagnóstico más profundo para determinar qué está causando esos problemas y buscar posibles soluciones para evitar la congestión en primer lugar o controlarla en segundo lugar.

Según las herramientas de que disponga, debería tener una idea de esas causas. Por ejemplo, dejando de lado la transmisión, los errores de formato o los problemas de salud del dispositivo los descartes de paquetes generalmente serán causados por clases de QoS que dejan caer paquetes, por lo que la solución es refinar la configuración de QoS para evitar que el tráfico deseado sea descartado.

Dependiendo de la aplicación, los paquetes caídos estarán causando retransmisiones si están usando TCP, mientras que los síntomas de voz y vídeo son recortes de voz o vídeo de refresco lento o vídeo y voz que no se mantienen sincronizados.

Dependiendo de las conexiones por cable o los dispositivos inalámbricos y los sistemas operativos que se utilicen, debería poder ver indicadores clave de rendimiento para esto, que serán recogidos por su sistema de supervisión, como NMIS. Por ejemplo, podría supervisar las retransmisiones TCP en los servidores, lo que indicaría problemas con el rendimiento del ancho de banda de Internet o un ancho de banda bajo para esas aplicaciones.

El uso de sistemas como Cisco IPSLA son una gran manera de controlar los cambios en la latencia o la variabilidad de la misma (Jitter). NMIS puede recopilar los datos de IPSLA, proporcionando gráficos y alertas cuando detecta problemas.

La monitorización de estas métricas le guiará en los casos en los que necesite profundizar, puede que tenga que recoger información más detallada de los dispositivos para determinar cuáles son los problemas, por ejemplo, mirando las salidas de los comandos para la QoS o la información de la interfaz para decidir qué cambios están disponibles para resolver los informes del servicio de asistencia.

Si se identifican las clases de QoS que están excediendo sus límites de configuración con la consiguiente pérdida de paquetes, habrá que considerar la posibilidad de cambiar las asignaciones de ancho de banda para esas clases, aumentando el ancho de banda disponible para voz y vídeo, por ejemplo.

CÓMO DIAGNOSTICAR: Utilice NMIS y opConfig para recopilar datos, que luego se pueden analizar.

OPA puede ayudar a detectar y diagnosticar los problemas de congestión.

Acciones para solucionar los problemas de ancho de banda de la red

En última instancia, para solucionar un problema de ancho de banda, hay que ampliar la capacidad general del sitio. Si no se puede ampliar o se necesita ganar tiempo, entonces hay que implementar funciones de QoS para gestionar qué tráfico es menos importante para el negocio y hacer que se moldee o se abandone en momentos de congestión.

Contrariamente a la creencia popular, la QoS no crea más rendimiento. Sí crea un mejor "buen rendimiento", con aplicaciones críticas protegidas y aplicaciones que acaparan el ancho de banda, controladas.

Dos opciones de política estándar para la QoS son la forma o la vigilancia. La vigilancia garantizará que el ancho de banda no se exceda nunca y dejará caer el tráfico infractor. El modelado retrasa el tráfico para suavizarlo en el tiempo. Tenga en cuenta que cuando se superan los límites de la conformación, puede producirse una caída del tráfico.

Hable con nosotros sobre cómo nuestras soluciones pueden darle la información que necesita para tomar decisiones basadas en datos. Reducirás el estrés del servicio de asistencia, serás dueño de tu infraestructura y mejorarás la experiencia del usuario.

Preguntas frecuentes

¿Cuál es el principal problema relacionado con el ancho de banda de la red?

El principal problema relacionado con el ancho de banda de la red es la congestión, cuando no hay suficiente ancho de banda para satisfacer las demandas de los usuarios y las aplicaciones.

Esto puede provocar aplicaciones lentas o inutilizables, paquetes perdidos, retransmisiones y problemas con la calidad de la voz y el vídeo.

Con tanta gente trabajando desde casa, muchas empresas han tenido problemas para disponer del ancho de banda necesario en los lugares adecuados para apoyar a sus empleados.

Para detectar, diagnosticar y solucionar los problemas de ancho de banda de la red, es importante supervisar la utilización de la red, los descartes y errores de paquetes y los parámetros de calidad de servicio (QoS).

¿Cómo puedo detectar problemas con el ancho de banda de mi red?

Para detectar problemas de ancho de banda, puede supervisar los casos del servicio de asistencia técnica planteados por los usuarios que informan de problemas con las aplicaciones a través de la red.

También puede supervisar la utilización de los enlaces de red y emitir alertas cuando el ancho de banda se utilice en exceso, supervisar los descartes y errores de paquetes y supervisar los parámetros de calidad de servicio (QoS) disponibles en el dispositivo de red.

Para un enfoque mejor y más automatizado, instalar NMIS y dejar que los dispositivos conectados a él empiecen a recopilar datos también puede ayudar a detectar problemas de ancho de banda de la red.

¿Qué es NMIS?

NMIS (Network Management Information System) es un completo sistema de gestión de redes que ayuda en la gestión de fallos, rendimiento y configuración.

Ofrece gráficos de rendimiento y umbrales de alerta, así como políticas de notificación personalizables con distintos tipos de métodos de notificación.

NMIS supervisa el estado y el rendimiento del entorno informático de una organización, identifica fallos y ayuda a subsanarlos, y proporciona información valiosa a los departamentos informáticos para planificar gastos y cambios informáticos.

Dispone de un sofisticado motor de reglas de negocio, líneas de base automatizadas, umbrales de alerta configurables, acciones basadas en políticas, escaladas y gestión de interrupciones planificadas.

NMIS es personalizable, escalable y cuenta con soluciones preconfiguradas listas para usar, y puede ser utilizado por proveedores de servicios de telecomunicaciones e Internet, empresas y administraciones públicas.

Ofrece apoyo comunitario y tiene precios predecibles y transparentes que se adaptan a las necesidades del usuario.

¿Cómo puedo diagnosticar problemas con el ancho de banda de mi red?

Diagnosticar los problemas de ancho de banda de la red requiere recopilar información cualificada de su servicio de asistencia y supervisar la red para detectar problemas relacionados con la congestión.

En función de las herramientas de que disponga, podrá determinar las causas de los problemas.

Por ejemplo, los descartes de paquetes generalmente serán causados por clases de QoS que dejan caer paquetes, por lo que refinar la configuración de QoS para evitar que el tráfico deseado sea descartado puede resolver el problema.

El uso de sistemas como Cisco IPSLA también puede ayudar a controlar los cambios en la latencia o la variabilidad de la latencia (Jitter).

¿Qué es la calidad de servicio?

QoS son las siglas en inglés de Calidad de Servicio. Se trata de un conjunto de técnicas y mecanismos cuyo objetivo es garantizar que el tráfico de red se priorice según determinados criterios para satisfacer los requisitos de las distintas aplicaciones y usuarios.

Los mecanismos de calidad de servicio se utilizan para gestionar la congestión de la red, reducir la latencia y garantizar que las aplicaciones importantes reciban el ancho de banda y los recursos necesarios.

La QoS puede utilizarse para dar prioridad a distintos tipos de tráfico, como voz y vídeo, frente a otros, como transferencias de archivos y correo electrónico.

Para ello, se asignan distintos niveles de prioridad a los diferentes tipos de tráfico y se utilizan mecanismos como la conformación y priorización del tráfico para garantizar que el tráfico de mayor prioridad reciba un trato preferente.

La calidad del servicio es especialmente importante en aplicaciones en tiempo real como las de voz y videoconferencia, donde los retrasos o la pérdida de paquetes pueden afectar gravemente a la calidad del servicio.

Los mecanismos de calidad de servicio pueden ayudar a garantizar que este tipo de aplicaciones reciban los recursos necesarios y no se vean afectadas por otros tipos de tráfico en la red.

En general, la QoS es una herramienta importante para que los administradores de red gestionen y prioricen el tráfico de red, garantizando que las aplicaciones y servicios importantes reciban los recursos necesarios y funcionen como se espera.

¿Qué hay que hacer para solucionar los problemas de ancho de banda de la red?

Entre las medidas para solucionar los problemas de ancho de banda de la red se incluyen la mejora de la capacidad global del emplazamiento o la implantación de funciones de calidad de servicio para gestionar qué tráfico es menos importante para la empresa y darle forma o eliminarlo en momentos de congestión.

La calidad de servicio no aumenta el caudal, sino que mejora el "buen caudal", protegiendo las aplicaciones críticas y controlando las que acaparan ancho de banda.

Las dos opciones de política estándar para la QoS son dar forma o vigilar: dar forma retrasa el tráfico para suavizarlo a lo largo del tiempo, y vigilar garantiza que nunca se supere la utilización del ancho de banda y elimina el tráfico infractor.

Hay que tener en cuenta que, aunque la QoS puede ayudar a controlar el uso del ancho de banda, no genera más caudal.

Sin embargo, crea un mejor "buen rendimiento", con aplicaciones críticas protegidas y aplicaciones no críticas controladas.

Sin categoría

más nuevo

mayor