03.01.2023 Views

User Guide APM & Observability

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>User</strong> <strong>Guide</strong><br />

Loading-Time<br />

ISSUE<br />

#<br />

12<br />

<strong>APM</strong> &<br />

<strong>Observability</strong><br />

Requests<br />

Mit Application Performance Monitoring<br />

Verfügbarkeitsprobleme schnell identifizieren<br />

Performance<br />

Gutes Monitoring braucht mehr Durchblick<br />

Anwendungsbeispiele<br />

Monitoring-Checkliste


Impressum<br />

<strong>User</strong>-<strong>Guide</strong> Publikation<br />

Dezember 2022<br />

telekom-mms.com<br />

Autor<br />

Matthias Fichtner<br />

Redaktion<br />

Sven Hansel


Inhalt<br />

Gutes Monitoring braucht<br />

mehr Durchblick 04<br />

Application Performance Monitoring neu gedacht 05<br />

Ganzheitlicher Blick mit Umbrella Monitoring 05<br />

Geeignetes Werkzeug für Umbrella Monitoring 06<br />

Synthetic Monitoring versus Real-<strong>User</strong>-Monitoring 06<br />

Künstliche Intelligenz und Automatisierung 08<br />

Anwendungsbeispiele 08<br />

Monitoring-Checkliste 10<br />

Fragen, die Sie vor der Entscheidung in<br />

Ihrem Unternehmen beantworten sollten<br />

Ausblick 11<br />

Monitoring als Datenschatz verstehen


Gutes Monitoring<br />

braucht mehr Durchblick<br />

IT-<strong>Observability</strong> mit Full-Stack-Monitoring erzielen<br />

____04<br />

Lesezeit 8 min.<br />

Für die Nutzerzufriedenheit und somit für den Erfolg einer Anwendung<br />

und geschäftskritischer Prozesse sind Zuverlässigkeit und Verfügbarkeit<br />

entscheidende Faktoren. Web-Anwendungen oder Apps die eine zu lange<br />

Ladezeit aufweisen oder gar aufgrund von Performance-Problemen<br />

oder anderen Störursachen nicht aufrufbar sind, werden nicht benutzt<br />

oder können nicht verwendet werden. Die entsprechenden Ursachen für<br />

die jeweiligen Probleme bei einer komplexen Systemlandschaft schnell<br />

zu identifizieren, stellt Unternehmen dabei vor große Herausforderungen.<br />

Monitoring-Tools können hier Abhilfe schaffen. Jedoch liefert nicht jedes<br />

Tool die gewünschten Erkenntnisse.<br />

Mal wird es „partieller Blindflug“ genannt, ein anderes Mal sind es „weiße<br />

Flecken auf der Applikationslandkarte“, andere sprechen von „mangelhaftem<br />

Durchblick“. Ganz gleich, wie es benannt wird, Fakt ist: Sowohl<br />

die cloudifizierte Web-Ära als auch der Megatrend Virtualisierung verlangen<br />

nach mehr Transparenz, sowohl im Rechenzentrum als auch im<br />

Gesamtunternehmen. Aber diese Klarheit ist in vielen Unternehmen noch<br />

nicht gegeben. Es mangelt an einem übergreifenden Monitoring.<br />

Woran liegt das?<br />

Liefen vor wenigen Jahren noch nahezu sämtliche Applikationen auf<br />

den Firmenservern, so ist daraus ein Flickenteppich aus Legacy- und<br />

Cloud-Technologien entstanden. Iaas, SaaS und PaaS, Azure und AWS,<br />

Kubernetes und Docker, Serverless-Computing neben Mainframe – die<br />

typischen IT-Strukturen erinnern an das Bild eines ungelösten Rubik-Cubes<br />

aus den 80er-Jahren. Und das verursacht Stress, gefährdet letztlich<br />

den Unternehmenserfolg.<br />

So bestätigten nahezu 50 Prozent der IT-Professionals, dass sie mindestens<br />

einen Tag pro Woche damit verlieren, Probleme bei der Leistungsfähigkeit<br />

und Verfügbarkeit von Applikationen zu diagnostizieren und zu beheben.<br />

51,5 Prozent der Befragten in Deutschland, Österreich und der Schweiz sagten,<br />

dass sie Performance-Mängel einer Software erst bei der Live-Schaltung<br />

beziehungsweise Inbetriebnahme feststellen, das heißt im Produktivbetrieb,<br />

in dem die Problembehebung am teuersten ist (Quelle).<br />

Derartige Mängel gehen gehörig ins Geld. Um die Größenordnung zu<br />

verstehen: Amazon büßt bereits bei 100 Millisekunden längerer Ladezeit<br />

einen Umsatz von einem Prozent ein (Quelle). Und 40 Prozent aller<br />

Mobile-<strong>User</strong> verlassen einen Webshop, wenn die Ladezeit mehr als drei<br />

Sekunden beträgt (Quelle).<br />

Es sind aber nicht allein diese direkten Auswirkungen in der Kundenbeziehung,<br />

– sowohl B2C als auch B2B – die sich dadurch bemerkbar<br />

machen. Wäre ein umfangreicheres Monitoring im Einsatz, ließen sich die<br />

personellen Ressourcen der IT besser planen, in der Entwicklung wären<br />

schnellere Software-Releases möglich. Insgesamt stiege die Verfügbarkeit<br />

und Performance aller Komponenten und die IT-Security würde sich<br />

verbessern. Letztlich sorge dies für höhere Wettbewerbsfähigkeit und<br />

mehr Umsatz neben den bereits genannten Punkten bessere Kundenerlebnisse<br />

und höhere Kundenzufriedenheit.


____05<br />

Application Performance Monitoring neu gedacht<br />

Application Performance Monitoring (<strong>APM</strong>) ist beileibe kein neues Thema<br />

– indes ist es lediglich die nächste Evolutionsstufe eines Prozesses,<br />

der längst weiter gediehen sein müsste. Tradiertes <strong>APM</strong> prüfte Systemzustände<br />

hinsichtlich Verfügbarkeit, Ausfällen oder Engpässen und<br />

alarmierte, so die definierten Schwellenwerte über- oder unterschritten<br />

wurden. Das heißt, ein <strong>APM</strong> reagierte lediglich auf bereits bekannte<br />

Probleme und Ereignisse, die innerhalb eines definierten Zeitraums auftreten.<br />

Darüber hinaus fehlen bei einem <strong>APM</strong> älterer Prägung detaillierte<br />

Einblicke in den Status quo und die Korrelationen des Gesamtsystems<br />

(Full IT-Stack).<br />

Mit starren Schwellwerten arbeiten die modernen <strong>APM</strong>-Werkzeuge<br />

indes nicht mehr, sondern sie agieren bereits mit dynamisch gelerntem<br />

Normalverhalten mithilfe von künstlicher Intelligenz. Auf dieser Basis<br />

können Störungen noch im Entstehen proaktiv erkannt werden. Es gibt<br />

also nicht nur den reaktiven Modus, sondern <strong>APM</strong> wird dynamisch.<br />

Ganzheitlicher Blick mit Umbrella Monitoring<br />

Die nächste Stufe dieses dynamischen Monitorings ist jedoch eine Weiterentwicklung<br />

über <strong>APM</strong> hinaus. Hierbei erfassen die Systeme nicht nur<br />

die für Performanz relevanten Daten, sondern bieten eine ganzheitliche<br />

Sicht, genannt: „Umbrella Monitoring“.<br />

Technisch wird dieses oftmals auch als „Full Stack <strong>Observability</strong>“<br />

beschrieben. Und erst dieser Angang löst die Herausforderungen,<br />

die sich aus dem beschriebenen, unzureichenden Monitoring<br />

ergeben.<br />

Full Stack Monitoring<br />

Cloud/Net<br />

PUBLIC CLOUD<br />

Data Center<br />

CLOUD SERVICES<br />

PRIVATE CLOUD<br />

Mobile App<br />

Social Media CDN Shopping<br />

Browser<br />

3rd-Party<br />

Videos Ads Search<br />

Bild: Telekom MMS<br />

Was sich dahinter verbirgt:<br />

• Umfassendes Monitoring erzeugt Klarheit über Geschäftsvorfälle, die<br />

Benutzererfahrung, Anwendungen, die Infrastruktur, das Netzwerk und<br />

die IT-Security. Dies gilt sowohl für die On Premise-IT als auch Cloudbasierte<br />

Prozesse.<br />

• Klärt <strong>APM</strong> die Frage „Was ist passiert?“, widmet sich ganzheitliches<br />

Monitoring zudem der Frage „Warum ist es passiert?“. Dazu werden<br />

Störungen beispielsweise visualisiert und Anomalien in Prozessen erkannt<br />

und ergründet. Zudem bekommt die IT dadurch Hinweise auf zu<br />

treffende Maßnahmen wie etwa die Ressourcenskalierung oder Cloudund<br />

Netzwerk-Anpassungen.<br />

• Die Detailtiefe von Umbrella Monitoring sorgt dafür, dass sich neben<br />

Applikations-, Server-, Netzwerk-, Speicher-, Datenbank- und Umgebungsmonitoring<br />

beispielsweise auch Zertifikate, Versionsstände oder<br />

die Softwarelizenzierung überwachen lassen.<br />

Wie wichtig ein solch ganzheitlicher Angang ist, zeigt eine aktuelle Studie:<br />

95 Prozent der befragten IT-Professionals sagten, dass es wichtig ist,<br />

einen Überblick über den gesamten IT-Bereich zu haben. Aber gleichwohl<br />

sagten 66 Prozent, dass ihnen sowohl Strategie als auch die Werkzeuge<br />

fehlten, um effektiv zu messen, welche Auswirkungen technologische Entscheidungen<br />

auf die unmittelbaren Geschäftsergebnisse haben (Quelle).

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!