Die Zukunft vorhersagen können – das ist schon immer ein großer Traum der Menschheit. Mittels künstlicher Intelligenz (KI) könnte dies in Zukunft in einigen Bereichen Realität werden. Adacor beschäftigt sich im Rahmen eines innovativen KI-Projekts mit Predictive Monitoring. Ein achtköpfiges Team untersucht, inwiefern sich Ausfälle und Einschränkungen bei Server-Infrastrukturen vorhersagen und durch gezielte Wartungen verhindern lassen. Als Managed Cloud Solution Provider ist es unser Ziel, Ausfälle auf den IT-Infrastrukturen und Cloud-Systemen von Kundenunternehmen zu minimieren. Diese wünschen sich im besten Fall 100 Prozent Verfügbarkeit und null Ausfälle.
Das Projekt wird von der Europäischen Union: Investition in Ihre Zukunft im Rahmen des Europäischen Fonds für regionale Entwicklung (EFRE) gefördert.
Was ist künstliche Intelligenz?
Als künstliche Intelligenz (im Englischen: artificial intelligence) wird die Fähigkeit von Maschinen bezeichnet, Entscheidungsstrukturen abzubilden und diese idealerweise selbstständig weiterzuentwickeln. Es gibt unzählige Arten von künstlicher Intelligenz, die sich nicht nur in der technischen Umsetzung, sondern auch im Niveau der Intelligenz und Eigenständigkeit unterscheiden. Der Rahmen oder das Ziel werden zumeist vom Menschen vorgegeben. Ein typisches Beispiel für KI ist die möglichst genaue Erkennung von Text oder Sprache.
Effiziente Maßnahmen, um Ausfällen vorzubeugen
Klassische IT-Überwachungssysteme überprüfen durch eine Vielzahl von Abfragen den Status von Hard- und Software. Hierzu zählen das Auslesen der Temperatur von Komponenten, der Prozessorauslastung oder der Festplattenfüllstände sowie die Stichwortsuche in einem System- oder Anwendungsprotokoll oder der Test von auf dieser Hardware laufender Software (etwa durch einen probeweisen Aufruf von Softwarefunktionen und Überprüfung des Ergebnisses gegen einen vordefinierten Wert). Sofern die Überprüfung eine Abweichung von einem manuell definierten Wertebereich ergibt, oder kein Wert abgefragt werden kann, wird eine Alarmmeldung ausgegeben.
In einfachen Beeinträchtigungsszenarien gelingt es geschultem und erfahrenem Fachpersonal meist, solche Meldungen in kurzer Zeit zu klassifizieren, das Problem zu identifizieren und geeignete Lösungsmaßnahmen zu ergreifen. Bei komplexeren Herausforderungen, etwa durch Abhängigkeiten von IT-Systemen untereinander, ist die Fehleranalyse selbst für geschultes und erfahrenes Personal zeitaufwendig. Häufig ist damit ein längerer Ausfall der IT-Systeme verbunden.
Hochwertige Hard- und Software kann ausfallen. Das ist die bittere Erkenntnis, die uns die IT im Jahr 2020 lehrt. Besonders das Zusammenspiel von unterschiedlichen Softwarekomponenten führt oft zu Problemen. Um diese zu lösen, wird zumeist auf „Redundanz“ gesetzt. Dabei wird ein IT-System mehrfach bereitgestellt, sodass ein Ausfall bei einem oder mehreren Teilen des Systems abgefangen werden kann. Das Vorgehen birgt jedoch weitere Herausforderungen. Zum einen ist die Lösung kostenintensiv, zum anderen kommen für die Vernetzung der mehrfach bereitgestellten Systeme weitere Komponenten zum Einsatz, die wiederum von Ausfällen betroffen sein können.
Selbst die drei großen Cloud-Anbieter Amazon, Google und Microsoft haben regelmäßig mit Ausfällen zu kämpfen. Aus diesem Grund forschen wir bei Adacor nun aktiv, wie sich Ausfälle vorhersagen lassen. Das Ziel ist, Ausfallzeiten drastisch zu reduzieren und Kosten zu sparen, die durch Ausfälle sowie der notwendigen Redundanz von Systemen entstehen.
Von einfacher Logik bis hin zu intelligenten Warnsystemen
Bereits seit einigen Jahren gibt es diverse dynamische und prognostische Ansätze, um klassische IT-Überwachungssysteme weiterzuentwickeln. Erweiterte Systeme erkennen unter bestimmten Voraussetzungen automatisiert wiederkehrende Auslastungszeitpunkte in Metrik-Zeitreihen und stufen diese als unkritisch ein. Ein klassisches Überwachungssystem würde solche Regelmäßigkeiten nicht erkennen und bei jedem Auftreten eine Meldung produzieren. Zudem sind einfache lineare Prognosemodelle gängig. Auch Adacor hat in der Vergangenheit ein prognostisches Modell zur Bestimmung des künftigen Verlaufs von Festplattenfüllständen auf Basis von linearen Regressionen entwickelt. Dieses Modell erlaubt es, frühzeitig auf den erwarteten Zeitpunkt eines kritischen Füllstandes einzelner Festplatten hinzuweisen. Auf diese Weise kann das operative Betriebsteam die Betreuung der IT- Systeme effektiver gestalten.
Sämtliche Mechanismen haben eins gemeinsam: Sie setzen voraus, dass der Mensch Zusammenhänge erkennt und entsprechende Modelle selbstständig aufbauen, das heißt der Maschine vorgeben kann. Innerhalb der von Adacor betreuten Infrastrukturen werden pro Tag mehrere Millionen Status- und Fehlermeldungen, Abfragen und sonstige Ereignisse generiert. Diese menschlich zu verknüpfen oder zu analysieren ist unmöglich. Deshalb ist es sinnvoller entsprechende Muster mittels künstlicher Intelligenz erkennen zu lassen. Um dies möglich zu machen, müssen die Daten in ein maschinenlesbares Format überführt werden. Komplexe Methoden wie neuronale Netze unterstützen bei der Analyse der Zusammenhänge.
Was sind künstliche neuronale Netze?
Künstliche neuronale Netze werden eingesetzt, um digitale Probleme mit intelligenten Methoden zu lösen. Die Netze sind dem menschlichen Nervensystem nachempfunden und bestehen aus einer Vielzahl von Nervenzellen („Neuronen“ genannt). Input-Units werden Neuronen genannt, die Daten aufnehmen. Diese sind mittels sogenannter Kanten mit einer Vielzahl von weiteren Neuronen verbunden. Ziel ist es stets, ein bestimmtes Ergebnis vorherzusagen. Aus den Input-Parametern „Datum, Tageszeit, Wetter, Nutzerzahl aktuell, Nutzerzahl vor einer Stunde, Nutzerzahl gestern“ lässt sich so vorhersagen, welche Nutzerzahl in einer Stunde zu erwarten ist. Welche der Information wie zu bewerten, zu gewichten und zu verknüpfen ist, das entscheidet das Netzwerk selbst. Mittels eines Trainingsdaten-Sets lernt es, die Verknüpfungen zwischen den Neuronen so zu gestalten, dass am Ende ein möglichst präzises Ergebnis herauskommt.
Das gesamte Vorgehen gleicht einem Spiel. Der Mensch gibt der Maschine vor, für welche Erkenntnisse diese belohnt und für welche sie bestraft wird. Anschließend versucht die Intelligenz das geschaffene Entscheidungssystem so zu optimieren, dass möglichst oft eine Belohnung erfolgt.
Was einfach klingt, ist in der Realität eine sehr komplexe Aufgabe. Ohne die richtigen Voraussetzungen liefert auch eine künstliche Intelligenz keine verwendbaren Ergebnisse. Welche Informationen wie zur Verfügung gestellt werden, welche Parameter durch die Intelligenz veränderbar sind und wie überhaupt daraus eine Vorhersage entstehen kann, das will das Forschungsteam von Adacor in den nächsten zwei Jahren herauszufinden.
Fazit: Mit Crossfunktionalität zum Erfolg für den Kunden
Die Mitarbeitenden im Forschungsprojekt kommen aus verschiedenen Teams und bringen jeweils ihre besonderen Fachkenntnisse ein. Dazu gehören Data Scientists, Softwareentwickler und IT-Administratoren. Gemeinsames Ziel ist es, eine künstliche Intelligenz zu erschaffen, die in Echtzeit Datenströme analysiert und Beeinträchtigungen von IT-Systemen frühzeitig vorhersagen kann. Damit wird es in Zukunft möglich sein, Ausfälle vor dem Eintritt – also proaktiv statt reaktiv – zu behandeln und die Verfügbarkeit von Systemen maßgeblich zu steigern. Der Kunde profitiert von den neuen Entwicklungen auf vielfache Art und Weise. So steigt nicht nur die Hochverfügbarkeit ihrer Systeme, auch die Notwendigkeit von Redundanz sinkt und die damit verbundenen Kosten werden eingespart. Weitere Informationen über das innovative KI-Projekt erhalten Sie auf unserer Informationsseite Predictive Monitoring von Serversystemen.
Sie möchten mehr Informationen zu KI- und Predictive-Themen?
Dann haben wir weitere spannende Artikel im Blog für Sie zum Lesen. Unsere Data Scientists Simon Krannig und Charaf Ouladali erklären, wie Unternehmen von Predictive Analytics profitieren, wie sich Maschinelles Lernen realisieren lässt und was genau hinter dem Begriff Supervised Learning steckt.