Maximizing Performance In Nagios XI en ambientes Operativos PDF

Title Maximizing Performance In Nagios XI en ambientes Operativos
Author Cristian Leiva
Course Sistemas de Control y Supervisión
Institution Duoc UC
Pages 13
File Size 770.4 KB
File Type PDF
Total Downloads 98
Total Views 142

Summary

Mejoras de Ambiente Nagios, en ambientes Operativos. configuración y mejoras de performance de producto...


Description

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Objetivo Este documento describe cómo maximizar el rendimiento de su servidor Nagios XI en un entorno no distribuido para aumentar la eficiencia general del servidor de monitoreo. Este documento cubrirá las principales causas de la degradación del rendimiento y analizará algunas posibles soluciones para maximizar el uso de su servidor Nagios XI. Específicamente, discutirá la maximización de las comprobaciones activas en un solo servidor Nagios XI.

Público Objetivo Este documento está destinado a ser utilizado por los administradores de Nagios XI que deseen aumentar la eficiencia de su implementación de Nagios XI.

Resumen Nagios XI tiene varios factores claves que determinan el rendimiento del sistema. Un administrador debe tener una comprensión sólida de lo que está afectando el rendimiento de su sistema. Puede haber muchos factores a considerar debido a la flexibilidad de Nagios XI. Este documento cubrirá las causas principales de la degradación del rendimiento y analizará algunas posibles soluciones para maximizar el uso de su servidor Nagios XI sin tener que recurrir a configuraciones avanzadas del sistema. Factores clave que afectan el rendimiento de Nagios XI:

• Check Load = Total number of hosts + services. • Check Interval = Con qué frecuencia se ejecutan las comprobaciones • Host y Service Latencies = La cantidad de tiempo que un chequeo se retrasa con respecto a su tiempo de control programado

• • • •

AJAX actualizaciones en Nagios XI's interfaz web Actividad de la base de datos Procesos del subsistema Disk I\O y uso de RAM Disks

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Este documento se basa en gran medida en un conjunto de pruebas comparativas ejecutadas en un sistema de 3 gz single core con 3,5 GB de RAM. La mayoría de los ejemplos de este documento se basarán en ese entorno de prueba.

Maximizar el rendimiento: la fórmula básica La carga de comprobación de su entorno de supervisión se compone del número total de comprobaciones activas que se ejecutan en su servidor Nagios XI (hosts + servicios). Este número puede variar de cientos a miles dependiendo de su entorno de monitoreo. La conclusión de las comprobaciones activas se reduce a: ¿Cuántas comprobaciones puede manejar su sistema por segundo? Este número no se puede determinar sin tener en cuenta el intervalo de comprobación medio para todos los hosts y servicios. En Nagios XI, el intervalo de comprobación predeterminado suele ser de 5 minutos. Si crea miles de chequeos en XI sin ajustar este número en ninguno de sus chequeos, entonces todos sus chequeos se realizarán dentro de un período de 5 minutos. Esto puede empujar rápidamente su CPU muy fuerte y limitar el número máximo de comprobaciones que su máquina puede manejar.

Otras cosas que pueden afectar el rendimiento de su solución de supervisión incluyen:

• • • •

Disk I/O rendimiento del subsistema El uso de ram disk para decrementar I/O para comprobar los resultados y los gráficos de rendimiento La ubicación de los servidores de bases de datos El uso de comprobaciones intensivas de CPU (SNMP, check_esx3.pl, and custom plugins)

• El uso de controles pasivos frente a activos • Cuántos usuarios acceden al sistema de monitorización

Pruebas de referencia En nuestro ejemplo de referencia, ejecutamos una prueba con aproximadamente 5200 comprobaciones (principalmente PING, HTTP, DNS Res y DNS IP) dentro de un intervalo de 10 minutos en nuestra máquina de un solo núcleo.

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Check Load = 5220 Check Interval = 10 minutos 5220 / 10 / 60 seconds = 8.6 checks per second Average CPU Load = 8.0 – 12.0 Host/Service Latencies = < 2.0 seconds Con estos ajustes, el sistema seguía siendo utilizable, pero era lento y no era óptimo para el uso regular. Las latencias del host y del servicio eran generalmente inferiores a 2 segundos, lo que era alto e indicaba que el sistema podría sobrecargarse rápidamente con la carga promedio funcionando tan alto.

Configuración de Reaper Después de un poco de experimentación y estudiar los consejos de ajuste de rendimiento de los usuarios de entornos grandes de Nagios Core, nos encontramos con dos configuraciones que nos permitieron empujar el sistema de un solo núcleo mucho más duro, mientras manteníamos una carga de CPU mucho más baja y una latencia de verificación. En el archivo de configuración principal de Nagios Core /usr/local/nagios/etc/nagios.cfg hay dos configuraciones de "Reaper" que marcaron una diferencia sustancial al ejecutar un gran volumen de comprobaciones en un período de tiempo pequeño. El "Reaper" en el motor de monitoreo Nagios Core es una función que procesa o "cosecha" los resultados de verificación a medida que llegan. Este proceso ocurre a intervalos específicos, y a medida que aumenta el volumen de chequeos, es posible que este proceso deba realizarse con más frecuencia para mantenerse al día con la cantidad de chequeos que ingresan. Default reaper settings: check_result_reaper_frequency=10 max_check_result_reaper_time=30

Modified reaper setting for a high check volume: check_result_reaper_frequency=3 max_check_result_reaper_time=10 1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Una vez que modificamos la configuración del Reaper, pudimos reducir el intervalo de verificación promedio a 5 minutos con estos resultados. Check Load = 5220 Check Interval = 5 minutes 5220 / 5 / 60 seconds = 17.4 checks per second Average CPU Load = 5.0 - 9.0 Host/Service Latencies = ~ 0.5 seconds

Incluso con el volumen de verificación duplicado, los tiempos de carga de la página mejoraron y, aunque la CPU se está empujando, la interfaz XI se puede usar activamente sin que las latencias de verificación aumenten y el cronograma de verificación se retrase. Cabe señalar que a medida que aumenta el número total de controles, el pasado 5000, las comprobaciones máximas posibles por segundo disminuirán debido a que el motor de monitoreo Core tendrá que trabajar más duro para mantener el cronograma de verificación. A 10000 comprobaciones, las comprobaciones máximas por segundo con cualquier intervalo de comprobación en la prueba de referencia fueron de alrededor de 13 comprobaciones por segundo.

Configuración de rendimiento de Nagios XI Una de las diferencias clave entre la interfaz de Nagios XI y los CGI de Nagios Core son las actualizaciones de AJAX que se realizan en Nagios XI. Nagios XI toma datos XML del backend a través de solicitudes AJAX para mantener actualizados los datos en la ventana de su navegador sin tener que volver a cargar la página. El desafío que esto crea para el rendimiento del sistema es que abrir múltiples ventanas del navegador a Nagios XI tendrá un aumento dramático en la carga de su sistema. Por cada navegador abierto a Nagios XI, se realiza un conjunto adicional de llamadas AJAX al servidor para obtener datos nuevos. 1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Con el fin de reducir la carga relacionada con las llamadas AJAX, Nagios XI le permite utilizar páginas que no son AJAX para varias pantallas en su interfaz de usuario web. Estos ajustes se pueden ajustar en la última versión de Nagios XI accediendo al Admin > System Config > Performance Settings page. Si está ejecutando un gran número de comprobaciones (más de 5000) o la carga de su CPU es consistentemente alta, hay algunos ajustes que puede hacer que pueden mejorar el rendimiento. Estos se describen a continuación con más detalle.

Configuración de rendimiento: Páginas Utilice paneles unificados para reducir el número de llamadas AJAX al servidor. La visión general táctica unificada solo realiza una llamada al servidor cada 90 segundos y disminuirá notablemente la carga de su CPU.

Configuración de rendimiento: Dashlets Para ajustar globalmente la frecuencia de actualización de todos sus dashlets, aumente el Multiplicador de actualización de Dashlet. El valor predeterminado para esto es 1000ms (1 segundo). También puede aumentar el tiempo de actualización para dashlets específicos según sea necesario con el fin de ajustar el rendimiento para satisfacer las necesidades de su entorno de supervisión (no todos se muestran a continuación).

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Configuración de rendimiento: Bases de datos La optimización de la base de datos para Nagios XI es un tema más amplio y se trata con más detalle en el siguiente documento: Nagios XI Database Optimization Configuración de rendimiento: Subsistema Nagios XI se basa en varios procesos de subsistemas que se ejecutan de forma continua. Cambiar esta configuración puede resultar en una ligera disminución en el uso de la CPU. Estos ajustes tienen un efecto más pronunciado en sistemas más grandes. Deshabilitar las transferencias de datos salientes y escuchar objetos no configurados dará como resultado una ligera disminución en el uso de la CPU, y deshabilitar el registro de subsistemas reducirá el registro del subsistema de Nagios XI al mínimo y reducirá la actividad del disco y la CPU para la mayoría de los procesos del subsistema. Esto puede ayudar a reducir el uso del sistema durante interrupciones más grandes en las que se emiten muchos controladores de eventos y notificaciones.

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Configuración de rendimiento: Ejecución automática De forma predeterminada, cuando visita un informe o ve la página Métricas (via Home > Details > Metrics), el informe o métrica se generará automáticamente. Esto puede causar algunos retrasos considerables en los sistemas Nagios XI más grandes.

Estas opciones le permiten desactivar la ejecución automática de los informes y métricas. Si la casilla correspondiente está marcada, el informe o la métrica no se ejecutarán hasta que se presione el botón Actualizar. Esto le da tiempo para seleccionar qué hosts, servicios o grupos desea incluir antes de que se tome la acción.

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Performance Settings: Backend Cache (Nagios XI 5.3.0 or newer) Esto se utiliza para almacenar en caché algunas de las llamadas a la base de datos.

Habilitar esta función dará como resultado datos que no sean en tiempo real. Si necesita que los datos se muestren en tiempo real, NO habilite esta función.

Esto puede mejorar considerablemente el rendimiento en sistemas que realizan muchas comprobaciones de host y/o servicio.

Performance Settings: Snapshots (Nagios XI 5.5.0 or newer) Core Config Manager (CCM) genera instantáneas como parte del proceso de aplicación de configuración. La cantidad de instantáneas que desea conservar se puede ajustar a sus requisitos de retención.

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

Comprobación del rendimiento Las siguientes métricas pueden ayudarle a determinar si su sistema puede o no mantenerse al día con la programación de comprobación del motor de supervisión: 1. Latencias de verificación de host y servicio 2. Cola de eventos del motor de supervisión 3. Carga del sistema Estas métricas se pueden encontrar a través de Admin > System Information > Monitoring Engine Status. Cada CPU tiene un número máximo efectivo de comprobaciones por segundo que podrá manejar. Este número variará en función del número total de comprobaciones que se ejecuten y de los complementos de comprobación que se estén ejecutando. Los complementos compilados son mucho más eficientes que los complementos perl, python y php (interpretados), y el monitoreo del ancho de banda del conmutador y del enrutador también tiende a usar más CPU que la mayoría. Hay varios dashlets incluidos con Nagios XI que se pueden usar para vigilar la sobrecarga de su sistema. Vea los ejemplos a la derecha para ver otros signos obvios de sobrecargar su CPU. Si sus latencias promedian más de 10 segundos de forma regular, entonces necesita aumentar su intervalo de verificación promedio, disminuir el número de comprobaciones o agregar más potencia de CPU. En sistemas sobrecargados, la cola de eventos del motor de supervisión se verá extremadamente ponderada en el lado izquierdo.

Las siguientes imágenes proporcionan un ejemplo:

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximización del rendimiento en Nagios XI

• La captura de pantalla izquierda muestra la cola de eventos de monitoreo en un servidor de buen rendimiento

• La captura de pantalla derecha muestra un sistema sobrecargado que exhibirá altas latencias de verificación

1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximizing Performance In Nagios XI

Supervisión del rendimiento mediante Nagiostats El Asistente de Nagiostats es una herramienta útil que le permitirá ejecutar comprobaciones contra su rendimiento interno de Nagios y generar gráficos de rendimiento para las estadísticas reales del programa. Esto puede ser útil para supervisar las latencias de comprobación, los tiempos de ejecución y otros análisis de rendimiento. El Asistente de Nagiostats viene incluido con Nagios XI, sin embargo, si no se puede encontrar, se puede descargar desde Nagios Exchange: https://exchange.nagios.org/directory/Addons/Configuration/Configuration-Wizards/Nagiostats-Wizard/details

Utilizando A RAM Disk Aunque tener suficiente potencia de CPU en un servidor Nagios es importante, la mayor limitación de hardware para un sistema Nagios es la E/S de disco. Una instalación grande de Nagios crea una enorme cantidad de actividad en el disco, y si el disco duro no puede mantenerse al día con el flujo de tráfico constante que debe ocurrir, incluso una gran cantidad de CPU simplemente van a esperar el disco para escribir nueva información en el disco. Esto puede hacer que las latencias de comprobación se disparen a pesar de que el uso de la CPU aparezca dentro de un rango seguro. Algunos usuarios han resuelto esto mediante el uso de montajes de archivos creativos en particiones separadas, o la compra de discos extremadamente rápidos para sus servidores. The following documentation will cover how to configure Nagios XI with a RAM Disk: Utilizing A RAM Disk In Nagios XI

Descarga de MySQL a un servidor remoto El usuario principal de la CPU en un sistema Nagios XI es ndoutils + mysql como backend. El motor de monitoreo de Nagios escribe constantemente información de estado nueva en el backend de la base de datos para que se pueda acceder a la información en Nagios XI. En un sistema grande, esto representa el mayor uso de CPU en una instalación de Nagios XI. El siguiente documento describe cómo mover la base de datos MySQL a un segundo sistema para reducir el uso de cpu hasta en un 50%. Offloading MySQL To Remote Server 1295 Bandana Blvd N, St. Paul, MN 55108 [email protected] US: 1-888-624-4671

INTL: 1-651-204-9102

www.nagios.com © 2017 Nagios Enterprises, LLC. All rights reserved. Nagios, the Nagios logo, and Nagios graphics are the servicemarks, trademarks, or

The Industry Standard In Infrastructure Monitoring

Nagios XI

Maximizing Performance In Nagios XI

Usando rrdcached El rrdcached recopila datos de rendimiento del host y del servicio y, a continuación, los vacía en los archivos rrd apropiados en un intervalo especificado. Esto reduce la cantidad de actividad de disco necesaria para mantener un gran número de archivos rrd actualizados para los gráficos de rendimiento. Using rrdcached with Nagios XI

Opciones adicionales para mejorar el rendimiento También puede buscar opciones de monitoreo distribuido y / o el uso de comprobaciones pasivas para mejorar el rendimiento de su sistema. Estos temas se tratan en documentos separados vinculados a continuación. Distributed Monitoring options for Nagios XI: How To Implement A Distributed Nagios XI Environment Passive Checks for Nagios XI: How To Configure Inbound Checks With Nagios XI How To Configure Passive Services In Nagios XI Using NCSA With Nagios XI NRDP Overview

Terminando La administración del rendimiento de su sistema en un entorno Nagios XI no es una fórmula en blanco y negro, sino un acto de equilibrio con los recursos disponibles en su servidor. Entre los cambios de configuración descritos anteriormente, se puede configurar un solo servidor Nagios XI para manejar más de 1295 Band...


Similar Free PDFs