Der Begriff AIOps wurde bereits 2016 von Gartner als “Emerging Industry Category” genannt. Heute ist AIOps wesentlich greifbarer und bei einigen Unternehmen bereits in der Erprobung oder sogar im Einsatz.
Wofür steht AIOps?
Folgt man den Bezeichnungen DevOps (Development Operations), ITOps (IT Operations) oder BizOps (Business Operations) liegt es nahe, dass AIOps für AI Operations steht. Dies ist allerdings nicht der Fall.
Gartner hat folgende Definition für AIOps vor ein paar Jahren veröffentlicht, welche immer noch Gültigkeit hat: “AIOps combines big data and machine learning to automate IT operations processes, including event correlation, anomaly detection and causality determination.”
AIOps bezeichnet den Prozess aus gesammelten IT-Betriebsdaten (wie z.B. Event Log Informationen oder Performancedaten), mithilfe von Machine Learning und AI, Probleme oder Anomalitäten automatisch zu erkennen und auf Kausalität zu prüfen. Mit anderen Worten gesagt, beschreibt AIOps den Einsatz einer AI/KI für den IT-Betrieb.
In erster Linie verfolgen viele Unternehmen mit AIOps das Ziel, die Arbeitslast der IT zu reduzieren und effizienter zu machen. Werden heute Fehler gesucht, müssen Spezialisten Daten aus unterschiedlichen Systemen manuell analysieren und interpretieren. Teilweise benötigen die Spezialisten mehrere Stunden, bis alle notwendigen Informationen zusammengetragen sind, um eine erste Einschätzung der Lage abgeben zu können. Zudem werden z.B. unnötig Tickets am Support Desk für ein bekanntes Problem geöffnet, welches eine AIOps Lösung alternativ selbst beseitigt hätte.
Nur detaillierte und verlässliche Daten garantieren eine erfolgreiche AIOps Implementierung
Um erfolgreich AIOps im IT-Betrieb einzusetzen, benötigen Unternehmen eine verlässliche und standardisierte bzw. normalisierte Datengrundlage, die als Treibstoff für das AIOps Projekt dient.
Hier liegt bereits die erste Herausforderung: Sind die Daten nicht zuverlässig oder nur „grob“ erhoben, wird das AIOps Projekt nicht erfolgreich sein. Bekommt die AI einen qualitativ ungenügenden Treibstoff, so ist auch die Interpretierung der Daten ebenfalls ungenügend.
Je nach Use Case, sollten die Daten nicht nur aus einer Quelle (Silo) kommen: Soll z.B. AIOps automatisch Probleme mit Microsoft Teams analysieren, so reicht es nicht aus, die Daten von Microsoft für die Analyse zu verwenden. Zusätzlich werden z.B. die Daten vom Endgerät (Wie ist das Gerät mit dem Internet verbunden und gibt es noch genügend Bandbreite? Wo befindet sich der Benutzer gerade?) benötigt, um ein vollständiges Bild zu zeichnen.
Unterschiedliche AI-Typen unterstützten den IT-Betrieb
Wie können nun die vorhandenen Daten den IT-Betrieb unterstützen? Vorweg gesagt, die AI-Systeme für den IT-Betrieb befinden sich noch in einem frühen Stadium, können aber bereits heute die IT-Administratoren wesentlich entlasten und schnell Unregelmäßigkeiten entdecken. Hierfür kommen folgende AI-Typen zum Einsatz:
Causal AI
IT-Betriebsdaten liefern meisten schon wertvolle Informationen auf Probleme oder Situationen. Allerdings verhindert meistens die überwältigende Masse der Daten schon, die eigentlichen Probleme herauszufinden und deren Ursprung zu definieren. Es ist die sprichwörtliche Suche nach der Nadel im Heuhaufen. Die Causal AI kann in Sekunden Berge von Daten durchsuchen und Abhängigkeiten ermitteln, sodass der IT-Betrieb schneller Probleme und deren Ursache erkennt und ggf. automatisch beheben kann. Viele der heutigen Observability Tools bieten bereits die ersten Generationen dieser Automatismen an.
Predictive AI
Schwieriger wird es, Probleme oder Lastentwicklungen vorherzusagen. Den meisten Unternehmen fehlen hierzu schlichtweg noch die Echtzeit- und historischen Daten, welche benötigt werden, um verlässliche Vorhersagen durchzuführen. Predictive AI kann gut mit Wettervorhersagemodellen vergleichen. Je genauer die Daten sind und, umso genauer die historischen Daten trainiert wurden, umso besser ist die Vorhersage. Es gibt bereits die ersten Ansätze eines Predictive Supports: Einzelne Problemsituationen können heute gut erkannt und vorhergesagt werden (z.B. Bandbreitenprobleme). Viele AIOps Hersteller arbeiten mit Hochdruck an neuen AI-Modellen, um den IT-Betrieb, aber auch die IT-Architekten bei der Planung zu unterstützen.
Generative AI
Eines der größten Ziele von AIOps ist es, dem IT-Personal die Möglichkeit zu geben, einfach und schnell Antworten auf Fragen zu bekommen, ohne dass hierzu Abfragen oder sogar Skripte geschrieben werden müssen. Wie bereits heute mit vielen digitalen Assistenten wie Siri, Alexa & Co üblich ist, sollen IT-Mitarbeiter zukünftig Fragen einfach verbal stellen können. Wie z.B. „Hi AIOps, kannst Du mir sagen, ob wir gerade eine Störung in SAP haben und wo Du die Ursache vermutest?“
Automatisierungslösungen bieten den schnellen Einstieg in AIOps
Obwohl Automatisierungslösungen nicht zu AI-Systemen gehören, sollten diese im Zusammenhang mit AIOps ebenfalls betrachtet werden. Während das Anlernen von richtigem AI-System viele zuverlässige und aufgearbeitete Daten und Zeit benötigt, können existierende Automatisierungslösungen einen schnellen und kostengünstigen Einstieg in die AIOps bieten.
Gartner hatte bereits 2019 einen kleinen Leitfaden veröffentlicht, wie Unternehmen mit AIOps starten sollen. Einer der Punkte ist nicht zu aus AI zu warten, sondern bereits mit vorhandenen oder kostengünstigen Mitteln die Möglichkeiten von AIOps im eigenen Unternehmen auszuloten.
Wie fängt man mit AIOps an?
Einer der ersten Schritte ist, der erste Test bzw. Use Cases für AIOps im eigenen Unternehmen auszusuchen. Bereits kleine AIOps Use Cases können eine große Entlastung für den IT-Betrieb sein. Das Ziel sollte sein, mit AIOps die zeitaufwendigsten bzw. die am häufigsten verwendeten Prozesse zu automatisieren.
Da gerade am Anfang aber die Erfahrung fehlt, um festzustellen, was überhaupt mit AIOps möglich ist, sollte unbedingt am Anfang einfache Problemstellungen in Angriff genommen werden. Im Allgemeinen können mit AIOps z.B. folgende Bereiche optimiert werden:
- Verbesserte Datenanalyse und –Interpretation
- Automatisierung der Problemerkennung und –Behebung
- Reaktion auf Vorfälle und Lösungen
- Geringerer Aufwand für die IT-Verwaltung
- Vorbeugende Wartung
- Verbesserte Benutzerfreundlichkeit
- Sicherheit und Bedrohungserkennung
Ein Startpunkt könnte z.B. sein, dass der Service Desk Mitarbeiter auf einen Blick sehen kann, wo sich der Benutzer befindet, welche Probleme er in den letzten Tagen hatte und was an seinem Endgerät nicht dem Standard entspricht. Der Vorteil für den IT-Benutzer ist es, dass er nicht immer die gleichen Fragen an der Hotline beantworten muss.
Der nächste Schritt ist z.B. das hier erkannte Speicherproblem automatisch zu bearbeiten. Das könnte z.B. sein, dass der Benutzer eine Nachricht erhält, auf welche Weise es besser ist die Anzahl der geöffneten Tabs im Browser kleinzuhalten, da sonst das System zu langsam wird. Alternativ könnte AIOps aber auch automatisch eine Konfigurationsänderung vornehmen, sodass der Benutzer nicht mehr als 5 Tabs im Browser öffnen kann. Oder es könnte aber auch ein Hardwaretausch-Prozess z.B. in ServiceNow angestoßen werden, damit der Benutzer einen besser ausgestatteten Rechner erhält.
Viele Möglichkeiten
AIOps kann die Digitalisierung im IT-Betrieb voranbringen, benötigt aber dazu verlässliche und normalisierte Daten. Auch müssen die IT-Mitarbeiter den Umgang mit AIOps lernen und sollten AIOps nicht als „Ersatz für die eigene Arbeitskraft“ sehen, sondern viel mehr als Unterstützung bei der täglichen Arbeit. Ähnlich wie beim Autopiloten im Flugzeug soll AIOps die Arbeitslast reduzieren und den Fokus auf andere (wichtigere) Tätigkeiten verlagern.
Damit Unternehmen nicht bei null anfangen müssen, liefern viele AIOps Hersteller mittlerweile Templates mit, die die Umsetzung der Use Cases im eigenen Unternehmen vereinfachen und beschleunigen.