de-DEen-GB
 
rss

Granikos Technology Blog

On Dezember 3, 2016
530 Views

Microsoft AzureIn der Vergangenheit mussten mindestens zwei virtuelle Maschinen in Microsoft Azure als Mitglieder eines Verfügbarkeitsgruppe (Availability Set) konfiguriert werden, um eine Hochverfügbarkeit zu gewährleisten. Eine andere Variante war die Nutzung von VM Skalierungsgruppen. Diese beiden Bereitstellungsarten bietet eine Verfügbarkeit von 99,95%.

Seit November 2016 unterstützt Microsoft Azure eine Verfügbarkeit von 99,9% für einzelne virtuelle Maschinen. Mit diesem Service Level Agreement (SLA) haben nun auch kleine und mittelständische Unternehmen eine Möglichkeit, einen Domain Controller in Azure zu betreiben oder die ersten Business Applikationen in die Cloud zu migrieren.

Die Anforderung für ein solches Single Instance System ist:

  • Alle Datenlaufwerke müssen auf Premium Storage bereitgestellt werden.
    Premium Storage bietet bis zu 80.000 IOPS und 2.000MBps Datendurchsatz

Links

 


 

 

Weiterlesen »

Office 365

Office 365 LogoMit mehr als 1,2 Millionen Kunden ist Office 365 für Microsoft eine Erfolgsgeschichte. Im November 2015 berichtete Microsoft, dass sich monatlich mehr als 60 Millionen Nutzer mit dem Office 365 Service verbinden und auf die unterschiedlichen Anwendungen zugreifen. Der Hauptteil der Unternehmen, die Office 365 nutzen, entfällt auf Kleine und Mittelständische Unternehmen. Jedoch besteht ein nicht unerheblicher Teil der Office 365 Kunden aus Großunternehmen. Fast jedes der Fortune 500 Unternehmen nutzt Teile des Office 365 Serviceangebotes.

Die Nutzung der Cloud Angebote für E-Mail, Kommunikation und vereinfachte Zusammenarbeit bietet Unternehmen die Möglichkeit, auf einen Großteil der sonst erforderlichen lokalen IT Infrastruktur zu verzichten. Diese Reduktion führt zu einer sofortigen Kostenersparnis. Diesen Effekt, der es ermöglicht die freigewordenen Gelder für andere internen Aufgaben zu verwenden, hat Microsoft in der Vergangenheit bestens vermarktet.

Die Strategie war es immer, in einer Region oder einem Industriezweig Schlüsselkunden zu gewinnen, was anschließend im Rahmen eines "Gruppenzwangs" andere Unternehmen dazu bewogen hat, dem Weg in die Cloud zu folgen.

Dies bedeutet nun nicht, dass der Erfolg von Office 365 ausschließlich auf diesen Faktoren fußt. Vielmehr basiert der Erfolg zum einen auf der Vielfalt der Kundenbasis und natürlich auf der technischen Reife und der betrieblichen Einfachheit der zur Verfügung stehenden Produkte. Mit Hybrid-Konfigurationen wird die Migration zu Office 365 gerade für größere und komplexe Umgebungen vereinfacht. Jede einzelne Migration hat ihre ganz eigenen Herausforderungen basierend auf Ausgangssituation in der Kundenumgebung. Hier wird während der Migration deutlich, wo die Schwächen im Monitoring und in den Verwaltungstools der einzelnen Cloud-Dienste liegen. Diese Unterschiede und Schwächen gilt es genauestens zu kennen und zu adressieren, um eine möglichst reibungslose Migration zu Office 365 durchzuführen.

Monitoring Herausforderungen in Office 365

Der Fokus traditioneller Monitoring-Lösungen liegt meist in der Überwachung der IT Infrastruktur, die einen bestimmen Dienst oder Applikation unterstützt. In einer rein lokalen IT-Infrastruktur war dieser Ansatz auch in der Vergangenheit schon immer erfolgreich. Bei der Nutzung von Cloud-basierten Diensten ist dieser Ansatz nicht mehr ausreichend. Die lokal überwachte IT-Infrastruktur ist in den überwiegenden Fällen bekannt und die technischen Beziehungen zwischen erforderlichen Komponenten sind gut dokumentiert. Somit sind auch die zu überwachenden „normalen“ Betriebsparameter definiert und Grenzwerte für Abweichungen können konfiguriert werden.

Bei Cloud-basierten Diensten verhält es sich anders. Sie kennen die eingesetzte IT-Infrastruktur nicht, ganz zu schweigen von den detaillierten Abhängigkeiten zwischen den einzelnen Systemen und Diensten. Hinzu kommt die Größe der Cloud-Infrastruktur. In der Menge (Masse?) der zur Verfügung stehenden Monitoring-Informationen ist es unmöglich, nur die Informationen zu betrachten, die für die selber genutzten Dienste relevant sind.

Die fundamentalen Unterschiede, zwischen dem lokalen Betrieb einer Geschäftsapplikation und dem Einsatz einer Cloud-basierten SaaS Applikation, erfordern einen neuen Ansatz für die Applikationsüberwachung. Anstatt nur die Verfügbarkeit oder Erreichbarkeit einer Applikation zu prüfen, muss die Verfügbarkeit und die korrekte Arbeitsweise von Applikationsfunktionen überwacht werden, also die wahre User-Experience.

Nehmen wir als Beispiel Exchange Online und betrachten den Versand und den Empfang von E-Mails. Die Kenntnis über die Länge der Nachrichtenwarteschlange sagt nichts über die Benutzererfahrung beim Versand von E-Mails aus. Diese eine Information zur Sicherung der Servicequalität fehlt. Wenn Sie die E-Mail Zustellung proaktiv überwachen, wissen Sie, dass E-Mail Nachrichten korrekt übertragen werden, Sie haben aber keinerlei Kenntnis, ob alle erforderlichen Funktionen des Cloud-basierten Dienstes für den Zugriff auf E-Mails für den Endanwender zur Verfügung stehen oder ob es zu Fehlern kommt. Die hierzu benötigten Informationen stellt Microsoft Administratoren und Endanwendern nicht zur Verfügung. Diese Form der Überwachung gelingt nur durch das Nachstellen von Applikationsfunktionen in Form von synthetischen Transaktionen. Für das vorgenannte Beispiel muss eine Monitoring-Lösung die gleichen Schritte ausführen, die z.B. Outlook 2016 für das Versenden und Empfangen von E-Mails durchführt.

Ein Office 365 Hybrid Betrieb bringt weitere Herausforderungen für das Monitoring. So wie Sie keine Kenntnis über die IT-Infrastruktur des Dienstanbieters haben, weiß Microsoft nicht, ob oder wann es in Ihrer IT-Infrastruktur zur Wartungsausfällen oder wirklichen technischen Problemen kommt. In einigen bestimmten Betriebsszenarien ist die Verfügbarkeit von lokal betriebenen Systemen für den korrekten Betrieb des Cloud-Dienstes zwingend erforderlich. Als Beispiel seien hier die Verzeichnissynchronisation und Active Directory Verbunddienste genannt. Entscheidet sich ein Unternehmen für die Nutzung der Verbunddienste, so werden die erforderlichen Systeme in der lokalen IT-Infrastruktur bereitgestellt und die Sicherstellung der Verfügbarkeit obliegt dem Unternehmen. In diesem Fall können die Auswirkungen bei einer Störung der Verfügbarkeit der Verbunddienste für das Unternehmen substantiell sein. Bei Nichtverfügbarkeit der Verbunddienste kann sich kein Endanwender an einen Office 365 Dienst anmelden. Auch wenn Endanwender diese Störung als Ausfall von Office 365 wahrnehmen, liegt die Verantwortung für die Beseitigung der Störung beim Kunden.

Cloud-basierte Dienste, wie Office 365, ermöglichen es Unternehmen und Anwendern von nahezu überall zu arbeiten. Aus diesem Grund entspricht die Überwachung von Cloud-Diensten von einem Standort aus, meist aus dem Rechenzentrum des Kunden, nicht dem realen Nutzungsverhalten der Anwender. Der Zugriff auf Cloud-Dienste erfolgt von unterschiedlichen Unternehmensstandorten und sowohl aus dem Unternehmensnetzwerk heraus wie direkt aus dem Internet. Um zu bewerten, ob es sich einer Störung um ein lokales Problem oder um einen generellen Ausfall eines Service handeln, müssen all diese unterschiedlichen Zugriffswege in Betracht gezogen werden.

Office 365 Überwachung mit Mailscape 365

Das klassische Monitoring von lokal betriebenen Systemen lässt sich nicht auf Cloud-Dienste übertragen. Da es nicht möglich ist, eigene Software zur Überwachung auf Office 365 Systemen zu installieren, müssen neue Wege bei der Überwachung gegangen werden. Die Überwachung von Cloud-Diensten erfordert unterschiedliche Methoden und Wege, um die gewünschte Servicequalität für Endanwender bereitzustellen. Mit Hilfe von synthetischen Transkationen können die Funktionswege aus Sicht der Endanwender geprüft und bewertet werden. Ergänzend erfolgt eine Überwachung der Erreichbarkeit von Diensten und deren Reaktionszeit auf Funktionsaufrufe.

Gute Monitoring-Lösungen stützen sich nicht nur eine Datenquelle, um Entscheidungen zu treffen. Stattdessen werden unterschiedliche Informationsquellen genutzt, um ein umfassenderes Gesamtbild zu erstellen und um eine Entscheidung treffen zu können, ob eine Störung vorliegt oder nicht. Bei einer auftretenden Störung ist es wichtig, schnell über das Problem und den Grund der Störung informiert zu werden, um gerade auch in Hybrid-Konfiguration schnell eingreifen zu können.

Mailscape 365 bietet diese zusätzlich Sichtbarkeit für potentielle Probleme bei der Nutzung von Office 365 und hilft Ihnen, Ihren Anwendern eine stabile E-Mail Plattform bereitzustellen.

Das Mailscape 365 Dashboard

ENow One-View DashboardMailscape 365 überwacht sowohl Office 365, als auch die Hybrid-Dienste in der lokalen Infrastruktur. Das Browser-basierte Dashboard zeigt alle notwendigen Stati über den laufen Betrieb und erleichtert so das Monitoring aller zusammenhängenden Systeme. Es besteht keine Notwendigkeit, zusätzliche Überwachungslösungen für lokale Server, Hybrid-Systeme oder Office 365 einzusetzen. Die Darstellung des Mailscape 365 Dashboard ist besonders für große Monitore optimiert.

Mailscape 365 Überwachung von Hybrid-Komponenten

Eine solide und stabile Benutzererfahrung sicherzustellen, ist für jede Softwarebereitstellung in einem Unternehmen die wichtigste Prämisse. Dies gilt ebenso für die Bereitstellung von Office 365 Cloud-Diensten. Cloud-Plattformen sind sehr flexibel und leistungsfähig, jedoch kann es immer wieder einmal zu Störungen oder Unterbrechungen kommen. Mailscape 365 hilft Ihnen, Ihre gesamte Hybrid-Infrastruktur in Echtzeit zu überwachen, um Probleme oder Dienstbeeinträchtigungen zu erkennen und bewerten zu können. Dieses Wissen bietet Administratoren das Vertrauen, das alle Dienste wie erwartet funktionieren. Das Vertrauen ist die Basis, um Ängste vor dem Wechsel in die Cloud abzubauen.

Erweitertes Mailscape Monitoring

Die Mailscape 365 Monitoring-Tests werden nicht nur von einem Server in Ihrer lokalen IT-Struktur ausgeführt, sondern auch von einem Internet-Service, um den größtmögliche Umfang an Funktions- und Verbindungstests zu bieten. Ergänzt werden diese Tests durch die Mailscape 365 Remote Probes. Mailscape 365 Remote Probes können an von Ihnen festgelegten Standorten platziert werden und führen Funktions- und Verbindungstests standortbasiert aus. Mit Hilfe dieser Remote Probes können Sie die Dienstqualität und Performance an besonders wichtigen Standorten dediziert überwachen. So haben Sie immer eine aktuelle Information über die Dienstqualität an diesen Standorten.

Zusammenfassung

Microsoft investiert große Summen für den Aufbau, Betrieb und die stete Erweiterung von Office 365. Das Dienstangebot wird regelmäßig durch neue Dienste erweitert, neue Office 365-Regionen werden erschlossen und Schlüsselkunden werden in den Cloud-Server eingeworben. Nach und nach werden auch die eingebauten Monitoring-Funktionen in Office 365 durch Microsoft dem Serviceangebot angeglichen. Es liegt aber in der Natur eines Cloud-Dienstes, dass Kunden nie eine vollständige Sichtbarkeit mit Hilfe der Microsoft Tools erhalten werden. Es gibt gerade im Hybrid-Szenario wichtige Komponenten, die in der IT-Umgebung des Kunden überwacht werden müssen. Ohne solch eine Überwachung kann eine geforderte Dienstqualität nicht überwacht und somit auch nicht gewährleistet werden.

Die Monitoring Lösung Mailscape 365 kombiniert für die Office 365 Überwachung eigene synthetische Transaktionen mit Überwachungs- und Berichtsfunktionen der Microsoft API’s, um Ihnen ein klares und einheitliches Bild über den Status der von Ihnen abonnierten Cloud-Dienste zu geben. Die einmalige Kombination aus Überwachungs- und Berichtsfunktionen war für die Gartner Group ausschlaggebend, Mailscape 365 in ihrem „10 Steps to Develop a Practical Network Performance Strategy for Office 365“ Bericht zu empfehlen.

Links

Weiterlesen »
On Dezember 8, 2015
1178 Views

Am 3. Dezember kam es zu einem Ausfall von Office 365 für viele europäische Kunden des Microsoft Clouddienstes. Grund des Ausfalles war eine Störung in Azure Active Directory.

Was war passiert?

Gegen 9 Uhr (UTC) am 3. Dezember begannen Kunden Störungen im Office 365 Dienst zu melden. Wie inzwischen üblich, wurde diese Störung von unzähligen Tweets begleitet, bevor sich Microsoft in der Lage sah, das Office 365 Health Dashboard zu aktualisieren und über diesen Kanal zu zeigen, dass man von der Störung Kenntnis erlangt hatte.

Die Meldung im Microsoft Azure Health Dashbord lautete:

"SUMMARY OF IMPACT: Between approximately 09:00 and 13:15 on 3rd Dec 2015 UTC, customers experienced intermittent issues accessing Azure services that use, or have dependencies on, Azure Active Directory. A full list of services reporting downstream impact is listed below this message in the History tab of the Service Health Dashboard. While impact was centralized to West Europe and North Europe, customers outside of these regions may have experienced issues as a result of configurations specific to their individual scenarios. PRELIMINARY ROOT CAUSE: A configuration error led to incorrect routing of production traffic. This resulted in the inability to access services dependent on Azure Active Directory authentication and services…"

Bei genauerem Lesen der Meldung zeigt sich, dass es sich nicht um ein Softwareproblem gehandelt hat, sondern offensichtlich um eine Fehlbedienung. Sicher werden wir nie  erfahren, was "configuration error" genau bedeutet, aber wir dürfen getrost davon ausgehen, dass ein viel zu beschäftigter Mitarbeiter einen Fehler gemacht hat, der anschließend automatisch und verzüglich in den europäischen Rechenzentren von Microsoft verteilt wurde.

Fehler durch Fehlbedienungen lassen sich mit keiner Softwarelösung verhindern. Dies liegt in der Natur der Sache. Daher werden auch in der Zukunft technische Störungen in Clouddiensten eher durch menschliche Faktoren entstehen, als durch problematische Softwarekomponenten oder Ausfälle von ganzen Rechenzentren.

Die Dauer von ungefähr vier Stunden entspricht inzwischen dem Durchschnitt von Störungen im Clouddienst. Am 26. November kam es in der Region US-West zu einer Störung im Azure Storage, die knapp über vier Stunden gedauert hat. Und wenn Sie sich die Zeit nehmen, sich die gemeldeten Azure Probleme der letzten 90 Tage anzuschauen, dann werden Sie feststellen, dass mehr Dienste und Regionen betroffen sind, als Sie denken.

Störungen sichtbar machen

Eine der Funktionen, die ebenfalls von der Störung betroffen war, war das Office 365 Dashboard selber. Dies führt für Kunden automatisch zu der unbequemen Situation, dass man von einer Office 365 Störung ausgeht, die eigene Vermutung ohne Zugriff auf das Health Dashboard aber nicht verifizieren kann.

Schlimmer wiegt die Tatsache, dass einzelne Dienste funktionierten und verfügbar waren, wie z.B. Outlook Desktop Sitzungen mit aktiven Sessions, während andere, die eine neue Authentifizierung erforderten, nicht mehr zur Verfügung standen, wie z.B. Remote PowerShell, Outlook on the Web oder SharePoint Online.

Hier hilft eine Softwarelösung zur Überwachung von genutzten Office 365 Dienste.

Mailscape 365 überwacht nicht nur einen einzigen Dienst, um die Funktionsfähigkeit von Office 365 zu überwachen. Dies ist einer der Hauptgründe, warum Gartner Mailscape 365 erst kürzlich in ihrem Bericht "10 Steps to Develop a Practical Network Performance Strategy for Office 365" empfohlen hat.

Mailscape 365 arbeitet mit synthetischen Transaktionen und simuliert so das Verhalten von Clients. Die aktive Nutzung von Anmeldefunktionen (auch AD FS) und Client-Zugriffe führt zu einer verlässlichen Überwachung der Dienste. Bei einem Ausfall des Azure AD, scheitern alle Testzugriffe auf Exchange ActiveSync, AutoDiscover, Outlook Anyhwere, MAPI/HTTP, Maiflow, SharePoint usw.

Mailscape 365 One-View Dashboard

Mailscape 365 zeigt alle Dienste in Störung dediziert an.

Kunden in anderen Regionen konnten mit einem Blick auf das Mailscape 365 One-View Dashboard sofort sehen, dass sie von der Störung nicht betroffen waren.

Interessiert? Starten Sie noch jetzt Ihren persönlichen 21 Tage Test von Mailscape 365.

 

 

Weiterlesen »

Eine der wichtigsten Lehren, die man als professioneller Service-Dienstleister im Bereich Erwartungshaltung von Kunden machen kann ist, dass eine Störung, über die der Kunde vom Dienstleister informiert wird, als nicht mehr so schlimm wahrgenommen wird. Ganz anders ist die Situation, wenn der Kunde den Dienstleister über die Störung informieren muss. In diesem Fall ist es ein Desaster.

Ein sehr aktuelles Beispiel hierzu ist die Störung im Dienst Exchange Online von Microsoft, der sich am 24. Juni 2014 zugetragen hat und über die Microsoft seine Office 365 Kunden einzig über das Service Health Dashboard informiert hat. Erschwerend kam hinzu, dass es erst einen Tag zuvor eine Störung von Lync Online gab.

Im Service Health Dashboard (SHD) wurden zwei separate Informationen veröffentlicht:

  • "Current Status: Engineers have identified an issue in which a portion of capacity that facilitates connectivity to Exchange Online services has entered into a degraded state.

    Customer Impact: Affected customers may experience an issue when trying to access some Exchange Online services.

    Incident Start Time: Tuesday, June 24, 2014, at 1:11 PM UTC

    Next Update: Tuesday, June 24, 2014, at 2:45 PM UTC"
  • "Some users in North America are experiencing issues with Lync Online due to network routing infrastructure issues. In response, engineers have routed a portion of network traffic to an alternate datacenter which has restored service for some of our customers. We are committed to fixing this issue as quickly as possible and expect the service to be restored for all customers soon. Customers can get the latest Lync Online status through the admin Service Health Dashboard."

Nachdem das Service-Team von Office 365 festgestellt hatte, dass sich diese doch wichtige Information nicht schnell genug verbreitet hatte, wurde die Information auch über das Office 365 Twitter Konto mitgeteilt. Auch hier wurde wieder die Empfehlung ausgesprochen, sich über das SHD zu informieren.

SHD - Eine Lösung?

Das SHD selber gibt nur sehr rudimentär Auskunft über den wirklichen Betriebszustand der einzelen Office 365 Dienste, die ein Kunde abonniert hat. Hinzu kommt, dass die Aktualisierung der einzelnen Stati Workflow-basiert ist und somit asynchron erfolgt.

Screenshot Service Health DashboardIn den Office 365 Help Community Foren wurde bereits frühzeitig darüber diskutiert, dass im SHD keine technischen Probleme angezeigt wurden. Eine Herausforderung ist, dass das SHD nur für System Administratoren angezeigt wird und somit Mitarbeiter in anderen Rollen gar nicht in der Lage waren, sich über die Störung zu informieren.

Die Störung wurde in den Foren teils sachlich, teils mit Ironie diskutiert. Es gab Teilnehmer, die einfach annehmen, das Störungen auftreten und voll und gang damit zufrieden sind, informiert zu werden. Andere schlugen vor, Exchange Online nun in Exchange Offline umzubennen. Und auf Twitter gab es die Empfehlung Office 365 in Office 364 umzubennen.

Mitarbeiter müssen informiert sein

Jeder System Administrator eines Unternehmens weiß, wie wichtig es ist, dass die technischen Mitarbeiter in der IT, das Servicedesk-Personal und auch die Belegschaft des Unternehmens über Störungen bei IT-Dienstleistungen informiert ist. Gerade interne IT-Abteilungen, die nicht immer den besten Stand im Unternehmen haben, erleiden in solchen Situationen einen zusätzlichen Vertrauensverlust bei der Unternehmensführung, wenn sie nicht in der Lage sind detaillierte Informationen zur Störung und zum Stand der Behebung der Störung zu liefern.

Dies unterstreicht einmal mehr, warum es für Unternehmen wichtig ist, die Überwachung von IT-Diensten und IT-Dienstleitungen selber zu betreiben. Gerade bei der steigenden Nutzung und Abhängigkeit von Cloud-basierten Diensten obliegt es dem Kunden durch eigene Überwachung frühzeitig von Störungen Kenntnis zu erlangen. Dies ist auch notwendig, damit Dienstanbieter ehrliche SLA-Berichte veröffentlichen können. Schließlich geben Dienstanbieter ein verbindliches Quality of Service (qoS) Versprechen ab, welches jederzeit kontrolliert werden muss.

Mailscape für Exchange Online (Mailscape 365) 

Viele Unternehmen entscheiden sich für eine gemischte Exchange Installation, bestehend aus einer Exchange Implementierung im eigenen Data Center und Office 365. Solch eine Hybrid-Installation unterstützt die Anforderungen der Mitarbeiter optimal. Allerdings haben die Hybrid-Installationen zahlreiche dynamische Komponenten, die einer ständigen technischen Überwachung bedürfen, um einen verlässlichen Nachrichtenfluß und die Verfügbarkeit von Kalenderdiensten zu gewährleisten.

Eine Lösung, die genau für dieses Einsatzszenarion entwickelt wurde, ist Mailscape for Exchange Online (Mailscape 365) von ENow: Exchange Online Monitoring und Reporting Tool

Nicht das erste Mal - Nicht zum letzten Mal

Dieser Ausfall von Office 365 war nicht der erste Ausfall, den die Cloud-Plattform zu erleiden hatte. Ebenso ist davon auszugehen, dass es in Zukunft immer wieder mal zu Ausfällen und Betriebsstörungen kommen wird.

Wenn Sie in der Lage sind, Ihre Anwender und die Unternehmensleitung über einen Vorfall und den dazugehörigen Fortschritt durch eigene Berichte bis zur vollständigen Wiederherstellung zu informieren, erfüllen Sie deren Erwartungshaltung vollständig. Die Anwender und die Unternehmensleitung werden dies sehr zu schätzen wissen.

Wenn Sie mehr über Mailscape für Exchange Online als Überwachungs- und Berichtslösung erfahren möchten, kontaktieren Sie uns: http://www.granikos.eu/de/Mailscape365

Links

Weiterlesen »