It´s getting hot in here -
Temperaturüberwachung mit PRTG Network Monitor

Daniel
von Daniel
01:50 MIN

Es ist wieder so weit, wie jedes Jahr im Sommer knacken die Temperaturen die 35 Grad Grenze. Ob daran der Klimawandel schuld ist oder nicht, darüber streiten selbst die Experten. Fakt ist, die aktuellen Rekordwerte könnten ein Vorgeschmack auf das sein, was uns zukünftig noch erwartet: heiße Sommer mit extremen Temperaturen. Was für Mensch und Tier im ersten Moment noch als angenehm empfunden wird, kann bei Extremwerten schnell ins Gegenteil umschlagen. Ähnlich verhält es sich bei Servern, Netzwerk Infrastruktur und weiterer Hardware. Die Hersteller der jeweiligen Geräte definieren meist entsprechende Richtlinien zu den empfohlenen Umgebungsparametern. Zu finden sind diese im Normalfall im Datenblatt oder Handbuch.

Image: © _Danoz - stock.adobe.com

© Stanisic Vladimir - stock.adobe.com

Aber warum das Ganze?

Server und Netzwerk Infrastruktur laufen in der Regel das ganze Jahr, 24/7, rund um die Uhr und produzieren dadurch enorme Mengen an Abwärme. Auch wenn das eigene Gerät durch Lüfter und Kühlkörper im vorgegebenen Temperaturbereich bleibt, kann das Gerät im Schrank nebenan durch die dadurch allgemein gestiegene Raumtemperatur möglicherweise die empfohlene Betriebstemperatur nicht mehr halten.

Die in den meisten Geräten verbauten Lüfter drehen je nach anliegender Temperatur schneller oder langsamer. Bei hohen Temperaturen müssen diese mechanischen Komponenten häufig unter Volllast arbeiten. Diese hohe Materialbelastung kann zum Ausfall der Lüfter, anschließender Überhitzung und somit zu einem Totalausfalls des Gerätes führen.

Neben den, von manchen Herstellern verbauten, integrierten Temperaturfühlern auf den Platinen der jeweiligen Hardware kann es somit zudem ratsam sein, zusätzlich mit einem externen Thermometer die Umgebungstemperaturen zu überwachen.

Empfindliche Hardware: warum sind konstant niedrige Temperaturen so wichtig?

Die verbauten Bauteile wie Prozessoren, Leiterplatten und Kondensatoren sind nur für den Einsatz bei definierten Umweltbedingungen vorgesehen.

Werden die vom Hersteller vorgegebenen Definitionen überschritten, kann es zu Ausfällen oder Problemen wie z.B. kürzerer Lebensdauer kommen.

Speziell die verbauten Elektrolytkondensatoren (Elkos) sind als Schlüsselkomponenten z.B. in Netzteilen verbaut. Die Lebensdauer dieser Komponenten hängt stark von der Herstellervorgabe und der tatsächlichen Umgebungstemperatur ab.

Hierzu gibt es komplizierte Berechnungsmethoden (Stichwort Arrhenius-Gleichung), die hier im Detail jedoch den Rahmen sprengen würden.

Die Hersteller der Bauteile geben die Lebensdauerwerte in der Regel bei der maximal erlaubten Bauteiletemperatur an. Üblicherweise bewegt diese sich in einem Bereich bei knapp über 100 Grad Celsius.

Meist liegen die zu erwartenden Laufzeiten bei diesen maximalen Temperaturen jedoch nur bei wenigen tausend Stunden.

Wird die Temperatur entsprechend reduziert, so steigt die zu erwartende Lebensdauer der Komponente um ein Vielfaches. Vereinfacht ausgedrückt verdoppelt sich die Lebensdauer ca. pro 10 Grad Celsius Temperaturreduktion weg von der maximal erlaubten Bauteiletemperatur. 

Kurz zusammengefasst bedeuten höhere Temperaturen in der Regel somit eine kürzere zu erwartende Lebensdauer der verschiedenen verbauten elektronischen Komponenten.

Ähnlich verhält es sich bei Festplatten, SSDs, Prozessoren, Arbeitsspeicher und vielen weiteren elektronischen Bauteilen, welche im IT-Umfeld zum Einsatz kommen. Auch hier gilt, der Ausfall des schwächsten Gliedes kann zum Totalausfall des gesamten Gerätes führen.

Zur Orientierung: Der empfohlene Temperaturbereich für z.B. einen Juniper EX3400 Switch liegt laut Juniper Herstellerdokumentation zwischen 0 und 45 Grad Celsius. 

Neben der Temperatur spielt noch ein weiterer Faktor eine nicht außer Acht zu lassende Rolle beim Betrieb von IT-Hardware: Die Luftfeuchtigkeit.

Luftfeuchtigkeit: Warum Wasser im Serverraum selten eine gute Idee ist

Die Luftfeuchtigkeit definiert den Anteil des Wasserdampfs am Gasgemisch der Luft.

Die relative Luftfeuchtigkeit, die das geläufigste Maß für die Luftfeuchtigkeit ist, beträgt dann 100 %, wenn kein zusätzlicher Wasserdampf aufgenommen werden kann.

In Abhängigkeit von Temperatur und Druck kann ein gegebenes Luftvolumen nur eine gewisse Höchstmenge Wasserdampf enthalten.

Allgemein gibt die relative Luftfeuchtigkeit das Gewichtsverhältnis des momentanen Wasserdampfgehalts zu dem Wasserdampfgehalt an, der für die aktuelle Temperatur und den aktuellen Druck maximal möglich ist. 

Wird neben der relativen Luftfeuchtigkeit zusätzlich die absolute Luftfeuchtigkeit betrachtet, fällt auf, dass warme Luft mehr Wasserdampf aufnehmen kann als kalte.

So kann Luft, die eine Temperatur von 5 Grad Celsius hat, in etwa 7 Gramm Wasser je Kubikmeter aufnehmen. Wird die Luft nun erwärmt, kann sie mehr Wasser aufnehmen. Beispielsweise kann warme Luft, die um die 30 Grad Celsius hat, ungefähr 30 Gramm Wasser aufnehmen. Die Menge Wasserdampf, die maximal von der Luft aufgenommen werden kann, nennt man Sättigungsmenge.

Die Luft ist satt, wohin mit der Feuchtigkeit?

Interessant ist in diesem Zusammenhang der so genannte Taupunkt.

Als Taupunkt wird der Temperaturwert bezeichnet, ab dem die Kondensation der Luftfeuchte beginnt. Zu dieser Taupunkttemperatur beträgt die relative Luftfeuchtigkeit 100%. Die Luft ist dann mit Wasserdampf vollkommen gesättigt und kann keine weitere Feuchtigkeit aufnehmen. 

Wenn keine weitere Feuchtigkeit in der Luft aufgenommen werden kann oder bereits eine Kondensation stattgefunden hat, kann das schwerwiegende Folgen für empfindliche elektronische Bauteile haben.

Ist ein Bauteil für einen längeren Zeitraum einer zu hohen Luftfeuchtigkeit ausgesetzt birgt das in diesem Zusammenhang zwei Risiken: Oxidation und letztendlich Korrosion.

Diese Reaktionen verursachen eine Veränderung der Beschaffenheit des aufnehmenden Materials, was wiederum zu einer Beeinträchtigung der Funktion führen kann. Oxidiert z.B. Eisen, spricht man von Rost. 

Schnelle Wechsel der Temperatur bzw. ein Unterschreiten des Taupunktes können zu Kondensation und Feuchtigkeit führen und somit schädlich für die empfindliche Hardware sein.

Ist die Luftfeuchtigkeit zu hoch, kann die kondensierte Feuchtigkeit zu Kurzschlüssen führen. Sehr niedrige Luftfeuchtigkeit steigert dagegen das Risiko von elektrostatischer Aufladung, welche ebenfalls im schlimmsten Fall zu Funktionsbeeinträchtigungen der Hardware führen kann.

Auch wenn das Risiko eines Systemausfalls durch die Luftfeuchtigkeit nicht sehr hoch ist, sollte diese zumindest als Randparameter mit in die Überwachung von Serverräumen einbezogen werden. 

Um das generelle Risiko von IT-Hardware Ausfällen zu minimieren, spielt die Überwachung von deren Umgebungsparametern somit eine nicht zu unterschätzende Rolle.

 

Nachdem nun ausreichend über die Theorie von Temperatur, Luftfeuchtigkeit und Taupunkt geschrieben wurde, kommen wir jetzt zum eigentlich relevanten Teil des Blogartikels:

Wie können wir dafür sorgen, dass die genannten kritischen Parameter in unserer Umgebung 24/7, rund um die Uhr überwacht werden?

Um verlässliche Daten zur aktuellen Temperatur zu bekommen, wird ein Thermometer benötigt.

Diese gibt es in verschiedenen Ausführungen, klassisch analog oder digital.

Digitale Thermometer liefern meist neben der Temperatur direkt noch weitere Messwerte wie z.B. die für uns interessante Luftfeuchtigkeit oder den Luftdruck.

Da das angestrebte Ziel eine 24/7 Überwachung der Umgebungsparameter ist, entfällt eine manuelle Messung mit analogen Thermometern als Option bereits, denn wer kann schon rund um die Uhr im Serverraum sitzen und das Thermometer beobachten? (Auch wenn dort zugegebener Weise im Sommer vermutlich die angenehmsten Temperaturen herrschen).

Was in diesem Fall benötigt wird, ist ein netzwerkfähiges Thermometer, mit dem die Werte der Umgebungsparameter digital ausgelesen und gespeichert werden können.

Fällt außerhalb der Arbeitszeit die Klimaanlage aus, so kann dieser Zustand durchaus bis zum Beginn des nächsten Arbeitstages unentdeckt bleiben. Während diesem Zeitraum ist die empfindliche Hardware unter Umständen ungeschützt kritischen Umgebungsparametern ausgesetzt.

Ein weiterer wichtiger Aspekt der 24/7 Überwachung ist daher die Benachrichtigung und Alarmierung über kritische Zustände. Selbst wenn sich das Thermometer rund um die Uhr im Serverraum befindet, wenn niemand da ist, um es abzulesen oder niemand Alarm gibt, kann gegen das drohende Problem auch nichts unternommen werden.

Um einschätzen zu können, wie sich die Umgebungsparameter im Serverraum entwickeln, sind zudem historische Werte über einen längeren Zeitraum Interessant. Welche Schwankungen gibt es zwischen Tag und Nacht, Sommer und Winter? Schafft es die Klimaanalage die Abluft eines weiteren Servers abzukühlen oder kommt es bereits jetzt zu starken Schwankungen?

Um all diese Punkte mit möglichst geringem Aufwand und automatisiert umsetzen zu können wird neben der richtigen Hardware zusätzlich ein leistungsfähiges Werkzeug benötigt.

PRTG Network Monitor

Mit dem Unified Monitoring Tool PRTG der Nürnberger Firma Paessler bist du dieser Aufgabe gewachsen.

PRTG ermöglicht als vollwertiges Netzwerk Monitoring System neben klassischen Parametern wie Erreichbarkeit und Auslastung verschiedener Systeme (Windows, Linux, Switche, Firewalls, Router, etc.) auch das Auslesen von Umgebungsparametern von Drittsystemen oder weiteren Schnittstellen.

Sämtliche Zustände innerhalb deiner IT-Infrastruktur können so zentral auf einem Dashboard visuell dargestellt werden.

Neben der Visualisierung der Daten kannst du dich zusätzlich auch über Ausfälle oder ungewöhnliche Werte informieren lassen. Wird der hinterlegte Grenzwert für Warnungen oder Fehler überschritten, bietet PRTG hierfür eine Vielzahl an vordefinierten Benachrichtigungsmöglichkeiten. So kannst du dich klassisch per E-Mail, Teams, Slack oder aber auch direkt per Push Benachrichtigung über die PRTG eigene App für iOS und Android alarmieren lassen. Auch die Anbindung eines unterstützten SMS Modems ist kein Problem.

Die gesammelten Daten können über 365 Tage aufbewahrt und ausgewertet werden. Dadurch lassen sich Veränderungen und Tendenzen erkennen. Wie hat sich die Temperatur in Abhängigkeit zu den Außentemperaturen verändert? Wie sieht es mit der Temperatur aus, nachdem weitere Hardware im Serverraum verbaut wurde? All diese Fragen kannst du dir mithilfe von PRTG leicht und mit wenigen Klicks beantworten.

 

In den folgenden Artikeln findest du weiterführende Informationen zu verschiedenen Arten des Temperatur Monitorings.

Internes Temperatur Monitoring:

Im ersten Artikel wird die Möglichkeit vorgestellt, wie auf die bereits in der Hardware verschiedener Hersteller verbauten Temperatursensoren zugegriffen werden kann. Diese Sensoren können bereits erste Indikatoren zu den aktuellen Umgebungsparametern liefern.

Das Schöne daran: Die Sensoren existieren bereits und die Daten werden schon jetzt gesammelt. Es entstehen dadurch keine zusätzlichen Kosten. Lediglich der Abruf der Daten durch ein Monitoring Tool wie z.B. PRTG muss noch konfiguriert werden.

Da die internen Messdaten meist nur einen groben Aufschluss über das gesamte Raumklima liefern können und ggf. weitere im Raum befindliche Hardware über keine eigenen Temperatur Fühler verfügt, macht es durchaus Sinn zusätzliche Messpunkte zu installieren.

Externes Temperatur Monitoring:

Der zweite Artikel geht daher auf verschiedene Herangehensweisen für die Einbindung externer Sensoren ein. Auf dem Markt gibt es eine Vielzahl an professionellen Lösungen für diese Anforderung. Im weiteren Verlauf werden einige dieser Lösungen vorgestellt und die Einbindung in PRTG skizziert. In den meisten Fällen werden die Temperaturwerte oder weiteren Informationen bequem über das Netzwerkprotokoll SNMP oder eine REST API abgegriffen.

Do it yourself Temperatur Monitoring:

Der dritte Artikel beschäftigt sich mit kostengünstigen Bastellösungen. Wer „Homemade“ Lösungen bevorzugt und gerne bastelt, findet auch hierfür eine Vielzahl an Lösungsansätzen.

Im einfachsten und vermutlich kostengünstigsten Fall lässt sich die Temperatur z.B. mit einem Raspberry Pi oder einem Arduino Board mit entsprechenden Temperaturfühlern auslesen und mit PRTG abfragen.

Weiterführende Informationen

Das Thema Umgebungsmonitoring muss jedoch nicht nur auf Serverräume oder Räume mit kritischer IT-Infrastruktur begrenzt sein.

Einige unserer Kunden binden bereits jetzt z.B. die vorhandene Gebäudeautomatisierung ein, um die Temperatur und Luftqualität in den Büro Räumen zu überwachen. Da immer mehr Gebäude „smart“ gebaut oder nachgerüstet werden, wird dieses Thema zukünftig immer interessanter.

Zusätzlich hat ein Teil unserer Kunden die Anforderung, die Temperatur und Luftfeuchtigkeit in Lagerräumen oder Kühlschränken zu überwachen und bei Über- oder Unterschreitung von Grenzwerten alarmiert zu werden bzw. um diese Daten für das Qualitätsmanagement zu protokollieren. PRTG kann hierfür die Daten sammeln, aufbewahren und über verschiedene Schnittstellen wie z.B. eine eigene API, wieder zur Verfügung stellen.

Worauf wartest du noch?

Du siehst, es gibt eine Vielzahl an Anforderungen, die mit PRTG abgedeckt werden können. Falls wir dein Interesse geweckt haben, zögere nicht und kontaktiere uns am besten noch heute!

Wir freuen uns auf neue spannende Projekte und deine individuellen Anforderungen!

Zu den Kommentaren ()