Como o AIOps irá revolucionar as operações de TI - NetSeg

Como o AIOps irá revolucionar as operações de TI

Dicas | 2024-09-17

Por Michael Szabados, diretor de operações da NETSCOUT.

O cenário empresarial contemporâneo está passando por uma transformação comparável a uma segunda Revolução Industrial. Desta vez, não se trata de máquinas a vapor e aço, mas de inteligência artificial (IA). Assim como Marc Andreessen previu em 2011 que "o software está comendo o mundo", agora estamos à beira de uma era em que a IA é a nova força motriz, remodelando indústrias inteiras à sua imagem.

Vale ressaltar que não estamos apenas falando do impacto da inteligência artificial generativa (GenAI), exemplificada por avanços em chatbots como o ChatGPT. Trata-se de uma transformação muito mais intrínseca à forma como as empresas operam. A IA está sendo aplicada para automatizar os mecanismos que controlam a operação de nossas infraestruturas, o funcionamento de nossos aplicativos e a alta disponibilidade de nossas redes.

Essas tarefas são essenciais porque os volumes de dados e as atualizações de software que circulam pelos complexos ambientes de TI híbrida de hoje superam amplamente a capacidade humana de gerenciamento. Nesse cenário desafiador, torna-se impossível identificar todos os sinais problemáticos em meio ao excesso de informações ou diagnosticar a causa raiz de cada experiência negativa do usuário apenas com base em seus sintomas.

Empresas ao redor do mundo estão se apressando para explorar o potencial da IA, mas essa corrida enfrenta muitos desafios. A complexidade dos sistemas de IA, os crescentes riscos cibernéticos e a escassez de profissionais qualificados são apenas alguns dos obstáculos a serem superados. Além disso, as metodologias tradicionais de TI têm se mostrado inadequadas para lidar com esses desafios.

AIOps em ação

As operações de IA (AIOps) – que utilizam inteligência artificial e aprendizado de máquina (ML – Machine Learning) para melhorar e automatizar diversos aspectos das operações de TI – representam uma transformação radical no gerenciamento de ecossistemas tecnológicos. Não se trata apenas de usar IA, mas de integrá-la no núcleo das operações de TI. Plataformas de análise como Splunk e ServiceNow, que incorporam IA e ML, exploram vastas e variadas fontes de dados, permitindo a automação de fluxos de trabalho que antes exigiam supervisão manual. Essa automação não é apenas uma questão de eficiência, mas também uma porta de entrada para novos aplicativos de TI, segurança e otimização de negócios.

No entanto, assim como a confiabilidade de um chatbot GenAI depende da qualidade dos dados que o alimentam, o sucesso da transformação AIOps está diretamente ligado à precisão, relevância e pontualidade dos dados que alimentam suas plataformas.

Tradicionalmente, os dados disponíveis para AIOps se limitavam a diferentes tipos de telemetria – logs, rastreamentos e métricas – que relatam a integridade dos elementos de rede. Embora essenciais, esses dados oferecem uma visão incompleta do sistema. Eles fornecem uma fotografia instantânea, importante mas estática, dos componentes do sistema, sem considerar suas interações, que são cruciais para a resiliência, segurança e escalabilidade da rede. A observabilidade criada pelas plataformas de AIOps é impressionante, mas poderia gerar um retorno ainda maior com um conjunto de dados mais preciso e significativo.

Dados melhores, AIOps melhor

Um conjunto de dados de alto valor, ainda subutilizado, pode ser extraído das interações ricas e complexas entre fontes de informação e usuários na rede. Esse conjunto de dados tem o potencial de ser triangulado e correlacionado com outros dados disponíveis, aumentando significativamente seu valor combinado para o caso de uso em questão.

O desafio de aproveitar essa fonte reside no fato de que os dados brutos de tráfego são extremamente massivos e complexos para ingestão direta. Além disso, mesmo quando compactados em metadados, sem transformação, eles se tornam um fluxo heterogêneo de conjuntos de dados rígidos e de alta cardinalidade, devido à sua diversidade e complexidade inerentes.

Uma nova geração de soluções de AIOps está preparada para superar essa limitação de dados, transformando esse fluxo bruto em coleções refinadas de dados organizados, que são aprimorados e editados através da extração inteligente de recursos.

Essas soluções usam um modelo de IA adaptável e uma sequência de transformação de várias etapas para funcionar como um membro ativo de um ecossistema maior de AIOps, harmonizando os feeds de dados com os fluxos de trabalho em execução na plataforma de destino, tornando-a mais relevante e menos barulhenta.

Ao executar a extração de recursos e a IA/ML aplicada próximas às fontes brutas de informações, essas soluções de modelagem para AIOps reduzem significativamente o ruído e os falsos positivos. Isso permite que as plataformas de AIOps avancem da simples eliminação de duplicações de alertas e incidentes para uma coordenação mais eficaz de diversos feeds de inteligência. A automação torna-se tanto reativa quanto proativa, com tempos de resposta mais rápidos, custos reduzidos e maior confiabilidade. Assim, ao processar menores quantidades de dados mais relevantes e valiosos, com todo o ruído irrelevante filtrado, sua plataforma AIOps poderá abordar casos de uso específicos de forma mais rápida e eficiente.

Usando essa abordagem de modelagem adaptativa para AIOps, as empresas podem:

  1. Manter e atualizar continuamente os serviços digitais para os clientes, aprimorando a experiência e a fidelização do cliente.
  2. Evitar interrupções de serviço por meio do monitoramento contínuo, análise e correlação de dados inteligentes da rede com outras telemetrias, o que reduz falsos positivos, melhora a utilização de recursos e gera economia em despesas operacionais.
  3. Automatizar a análise de causa raiz para minimizar interrupções de serviço, adaptando-se a equipes menores e níveis de habilidade reduzidos, o que também diminui as despesas operacionais.
  4. Avaliar continuamente a eficácia da arquitetura de implantação atual, incluindo a extensão até a borda da rede, mantendo a segurança. Com base nessas informações, otimizar a rede para minimizar custos e aprimorar a experiência do cliente.
  5. Atender melhor às metas de ESG – Environment, Social and Governance - ao compartilhar com as equipes de produto e DevOps informações sobre o quanto seus aplicativos "tagarelam" e a quantidade de energia que desperdiçam.

Avançando para um novo patamar de automação avançada

No treinamento e na implementação de processos e plataformas orientados por IA, a compactação e a relevância dos dados são fundamentais. Com as novas soluções de modelagem adaptativa de AIOps, as decisões podem ser baseadas em evidências concretas em vez de suposições, em provas em vez de conjecturas, e em conexões significativas em vez de correlações imprecisas. Essas soluções permitem que as plataformas de AIOps alcancem seus objetivos mais rapidamente e com um nível de confiança anteriormente inatingível.

À medida que as organizações se adaptam a novos modelos operacionais centrados em IA, estamos testemunhando o surgimento de uma nova economia digital. Nessa economia, a IA atua como facilitadora e eixo central da inovação e criação de valor. No entanto, os riscos também aumentam. Para mitigar com sucesso os possíveis resultados indesejados e a perda de controle, a estratégia principal adotada pelas empresas atualmente é garantir a veracidade, relevância e pontualidade dos dados que alimentam suas plataformas de IA.