Sercompe Business Technology brinda servicios esenciales en la nube a aproximadamente 60 clientes corporativos, y brinda soporte a un total de aproximadamente 50,000 usuarios. Por lo tanto, es crucial que la infraestructura de TI subyacente de la empresa de Joinville, Brasil, brinde un servicio confiable con un alto rendimiento predecible. Pero con un entorno de TI complejo que incluye más de 2000 máquinas virtuales y 1 petabyte (equivalente a un millón de gigabytes) de datos gestionados, era abrumador para los administradores de red clasificar todos los datos y alertas para averiguar qué estaba pasando cuando se producían problemas. recortado. Y fue difícil garantizar que la red y la capacidad de almacenamiento estuvieran donde deberían estar, o cuándo hacer la próxima actualización.

Para ayudar a desenredar la complejidad y aumentar la eficiencia de sus ingenieros de soporte, Sercompe invirtió en una plataforma de operaciones de inteligencia artificial (AIOps), que utiliza IA para llegar a la raíz de los problemas y advertir a los administradores de TI antes de que los pequeños problemas se conviertan en grandes. Ahora, según el gerente de productos en la nube, Rafael Cardoso, el sistema AIOps hace gran parte del trabajo de administrar su infraestructura de TI, una gran ventaja sobre los antiguos métodos manuales.

“Averiguar cuándo necesitaba más espacio o capacidad, antes era un desastre. Necesitábamos obtener información de tantos puntos diferentes cuando estábamos planificando. Nunca conseguimos el número correcto”, dice Cardoso. “Ahora tengo una vista completa de la infraestructura y la visualización desde las máquinas virtuales hasta el disco final en el rack”. AIOps brinda visibilidad sobre todo el entorno.

Antes de implementar la tecnología, Cardoso estaba donde se encuentran innumerables otras organizaciones: atrapadas en una intrincada red de sistemas de TI, con interdependencias entre capas de hardware, virtualización, middleware y, finalmente, aplicaciones. Cualquier interrupción o tiempo de inactividad podría dar lugar a una tediosa solución manual de problemas y, en última instancia, a un impacto negativo en el negocio: un sitio web que no funcionará, por ejemplo, y enfurecerá a los clientes.

Las plataformas AIOps ayudan a los administradores de TI a dominar la tarea de automatizar las operaciones de TI mediante el uso de IA para brindar inteligencia rápida sobre cómo está funcionando la infraestructura: áreas que funcionan frente a lugares que están en peligro de desencadenar un evento de tiempo de inactividad. El crédito por acuñar el término AIOps en 2016 es para Gartner: es una amplia categoría de herramientas diseñadas para superar las limitaciones de las herramientas de monitoreo tradicionales. Las plataformas utilizan algoritmos de autoaprendizaje para automatizar tareas rutinarias y comprender el comportamiento de los sistemas que monitorean. Obtienen información de los datos de rendimiento para identificar y monitorear el comportamiento irregular en la infraestructura y las aplicaciones de TI.

La empresa de investigación de mercado BCC Research estima que el mercado mundial de AIOps aumentará de $3 mil millones en 2021 a $9.4 mil millones en 2026, a una tasa de crecimiento anual compuesta del 26 %.1 Los analistas de Gartner escriben en su “Guía de mercado para plataformas AIOps” de abril que el la tasa creciente de adopción de AIOps está siendo impulsada por la transformación del negocio digital y la necesidad de pasar de respuestas reactivas a problemas de infraestructura a acciones proactivas.

“Con volúmenes de datos que alcanzan o superan los gigabytes por minuto en una docena o más de dominios diferentes, ya no es posible que un ser humano analice los datos manualmente”, escriben los analistas de Gartner. La aplicación de IA de manera sistemática acelera los conocimientos y permite la proactividad.

Según Mark Esposito, director de aprendizaje de la empresa de tecnología de automatización Nexus FrontierTech, el término “AIOps” evolucionó a partir de “DevOps”, la cultura y práctica de ingeniería de software que tiene como objetivo integrar el desarrollo y las operaciones de software. “La idea es promover la automatización y el monitoreo en todas las etapas, desde la construcción del software hasta la gestión de la infraestructura”, dice Esposito. La innovación reciente en el campo incluye el uso de análisis predictivos para anticipar y resolver problemas antes de que puedan afectar las operaciones de TI.

AIOps ayuda a que la infraestructura pase a un segundo plano

Los administradores de redes y TI agobiados por la explosión de volúmenes de datos y la creciente complejidad podrían usar la ayuda, dice Saurabh Kulkarni, jefe de ingeniería y gestión de productos de Hewlett Packard Enterprise. Kulkarni trabaja en HPE InfoSight, una plataforma AIOps basada en la nube para administrar de manera proactiva los sistemas del centro de datos.

“Los administradores de TI dedican toneladas y toneladas de tiempo a planificar su trabajo, planificar las implementaciones, agregar nuevos nodos, cómputo, almacenamiento y todo. Y cuando algo sale mal en la infraestructura, es extremadamente difícil depurar esos problemas manualmente”, dice Kulkarni. “AIOps utiliza algoritmos de aprendizaje automático para observar los patrones, examinar los comportamientos repetidos y aprender de ellos para brindar una recomendación rápida al usuario”. Más allá de los nodos de almacenamiento, cada pieza de la infraestructura de TI enviará una alerta por separado para que los problemas se puedan resolver rápidamente.

El sistema InfoSight recopila datos de todos los dispositivos en el entorno de un cliente y luego los correlaciona con datos de clientes de HPE con entornos de TI similares. El sistema puede identificar un problema potencial para que se resuelva rápidamente; si el problema vuelve a surgir, la solución se puede aplicar automáticamente. Alternativamente, el sistema envía una alerta para que los equipos de TI puedan solucionar el problema rápidamente, agrega Kulkarni. Tomemos el caso de un controlador de almacenamiento que falló porque no tiene energía. En lugar de asumir que el problema se relaciona exclusivamente con el almacenamiento, la plataforma AIOps examina toda la pila de infraestructura, hasta la capa de aplicación, para identificar la causa raíz.

“El sistema monitorea el desempeño y puede ver anomalías. Tenemos algoritmos que se ejecutan constantemente en segundo plano para detectar cualquier comportamiento anormal y alertar a los clientes antes de que ocurra el problema”, dice Kulkarni. La filosofía detrás de InfoSight es “hacer desaparecer la infraestructura” al reunir los sistemas de TI y todos los datos de telemetría en un solo panel. Al observar un conjunto gigante de datos, los administradores pueden descubrir rápidamente qué es lo que está fallando en la infraestructura.

Kulkarni recuerda la dificultad de gestionar un gran entorno de TI de trabajos anteriores. “Tuve que administrar un gran conjunto de datos, y tuve que llamar a tantos proveedores diferentes y estar en espera durante varias horas para tratar de resolver los problemas”, dice. “A veces nos tomó días entender lo que realmente estaba pasando”.

Al automatizar la recopilación de datos y aprovechar una gran cantidad de datos para comprender las causas raíz, AIOps permite a las empresas reasignar personal principal, incluidos administradores de TI, administradores de almacenamiento y administradores de red, consolidando funciones a medida que se simplifica la infraestructura y dedicando más tiempo a garantizar el rendimiento de las aplicaciones. “Anteriormente, las empresas solían tener múltiples roles y diferentes departamentos que manejaban diferentes cosas. Entonces, incluso para implementar una nueva área de almacenamiento, cinco administradores diferentes tenían que hacer cada uno su parte individual”, dice Kulkarni. Pero con AIOps, AI maneja gran parte del trabajo automáticamente para que el personal de soporte y TI pueda dedicar su tiempo a iniciativas más estratégicas, aumentando la eficiencia y, en el caso de una empresa que brinda soporte técnico a sus clientes, mejorando los márgenes de ganancias. Por ejemplo, Cardoso de Sercompe ha podido reducir el tiempo promedio que sus ingenieros de soporte dedican a las llamadas de los clientes, lo que refleja una mejor experiencia del cliente y aumenta la eficiencia.

Descargar el reporte completo.

Este contenido fue producido por Insights, el brazo de contenido personalizado de MIT Technology Review. No fue escrito por el equipo editorial de MIT Technology Review.

Ir arriba