El monitoreo es una de las necesidades básicas de las operaciones TI. Un adecuado monitoreo permite tener una visión global del estado de los sistemas, detectar situaciones anómalas con anticipación y hacer drill down para encontrar en detalle las causa de una falla (root cause analysis).

En muchas de las instalaciones de clientes SAP encontramos que solo se cuenta con un monitoreo muy básico, implementado con herramientas simples, como Nagios. Entonces, para asegurar el correcto estado de los sistemas se utiliza la antigua disciplina de los checklists. Por ejemplo, todos los días a las 8 am se ejecuta una larga lista de chequeos en forma manual, para cada sistema y ambiente SAP. Esta es una tarea tediosa para un operador o administrador, consume mucho tiempo y no es eficiente, ya que los problemas pueden presentarse a cualquier hora del día.

SAP provee a sus clientes con múltiples herramientas para la gestión TI. La más conocida es Solution Manager (SolMan), la cual puede ser utilizada sin ningún costo de licencias. Otra herramienta es SAP ITIM (IT Infrastructure Management), la cual permite monitorear toda la infraestructura TI que se encuentra en la red del cliente, incluyendo PCs, impresoras, switches, storage, etc. Esta herramienta se licencia de acuerdo a la cantidad de dispositivos a gestionar, y se integra con SolMan para la gestión de las alertas y otras funciones.

Entre estas dos herramienta: SAP SolMan y SAP ITIM es posible implementar el Monitoreo Total de TI, incluyendo las siguientes categorías de monitoreo:

  • Monitoreo de la Infraestructura TI, con SAP ITIM.
  • Monitoreo Técnico de los Sistemas SAP, o SAP System Monitoring, que incluye el monitoreo de los servidores (Hosts) y su sistema operativo, el monitoreo del motor de datos (HANA, Sybase, SQLServer, Oracle o DB2) y el monitoreo de la instancia técnica SAP (disponibilidad, tiempo de respuesta, buffers, dumps, updates fallidos, etc.). Dependiendo de la combinación de sistema operativo y motor de datos, SolMan monitorea en forma estándar entre 90 y 160 indicadores.
  • Monitoreo de Experiencia de Usuario, o SAP End-User Experience Monitoring (EEM). Esta capacidad se basa en la operación de un robot en el punto de acceso de los usuarios (un agente en el PC del mismo usuario, por ejemplo). Este robot ejecuta periódicamente un script que simula la operación del usuario, recolecta los datos de performance y los envía al SolMan central. De este modo es posible detectar situaciones anómalas en redes u otros componentes que no se pueden observar con el monitoreo central.
  • Monitoreos especializados, para SAP BW y SAP PI. SolMan cuenta con capacidades especiales de monitoreo, específicas para BW (cadenas, procesos, etc.) y para PI (canales, colas, errores en documentos, etc.). Adicionalmente las alertas propias de estos sistema se pueden centralizar en el Alert inbox de SolMan, de modo de tener un punto único de gestión de alertas.
  • Monitoreo de Procesos de Negocio, o BPMon. Mediante BPMon es posible implementar un monitoreo aún más proactivo, detectando situaciones que no representan fallas técnicas, pero que a la larga se pueden convertir en una detención de un proceso de negocios crítico. Ejemplos de este tipo de monitoreo son: detección de errores funcionales en el tratamiento de un documento, detección de volúmenes anormales de documentos en ciertos pasos de un proceso, etc.
  • Monitoreo de Interfaces y Conexiones, o ICMon. Este es un complemento del monitoreo anterior, que permite supervisar la operación de diferentes tipos de interfaces que las soluciones SAP utilizan, tales como RFC, IDoc, WebServices, OData, etc. Situaciones típicas de falla que es posible detectar son, por ejemplo, pérdida de conexión, errores, backlogs anormales, etc.
  • Hay incluso otros monitoreos especializados, como el Monitoreo de Volúmenes de Datos, para detectar crecimientos anormales en bases de datos o tablas específicas; y el Monitoreo de Consistencia de Datos, para detectar inconsistencias de datos entre dos sistemas, por ejemplo un SAP ERP y un legacy.

Mediante todas estas capacidades es posible monitorear un proceso de negocio crítico de punta a punta (End To End), detectando cualquier situación que pueda afectar su continuidad operacional. De este modo, con este Monitoreo Total se disminuye el número de incidentes que es necesario atender, diagnosticar y resolver, con los consiguientes ahorros en la operación de TI, los beneficios por una mejor calidad de servicio para los usuarios del negocio y las menores pérdidas por efecto de una detención del proceso.

En siguientes artículos iremos entregando información más detallada de cada uno los diferentes tipos de monitoreo mencionados.

Ver:  Monitoreo Total, ­parte 2

Más información de nuestros servicios en informacion@novis.com.mx

Feedback/discusión con el autor: Glen Canessa