Datenbearbeitung

Mittelwerte, Trends und Glättungen

In diesem Abschnitt werden einfache und grundlegende Arbeitsweisen der Klimatologie angeschnitten. Die Ergebnisse von Klimaanalysen hängen wesentlich von der Art der Bearbeitung der Klimamessdaten ab. Der richtige Gebrauch der häufig zur Anwendung kommenden statistischen Methoden ist Voraussetzung für objektive Aussagen. Die Nachvollziehbarkeit jedes Arbeitsschrittes ist geboten.

Klimatologische Messdaten liegen üblicherweise in Form einer Zeitreihe, bei welcher Messwerte eines Klimaparameters in konstanten Zeitschritten eingetragen sind, vor. Während früher drei Mal pro Tag die Werte händisch vom Instrument abgelesen und aufgezeichnet wurden, werden sie heute üblicherweise im Zehnminutentakt und kürzer automatisch gemessen und registriert.

Monatliche, jahreszeitliche und jährliche Mittelwerte bzw. Summen

Um von dieser hohen zeitlichen Auflösung auf Stunden-, Tages-, Monats- oder Jahreswerte zu kommen, werden Klimaparameter kontinuierlicher Natur (z.B. Lufttemperatur, Luftfeuchtigkeit, relative Sonnenscheindauer, Windgeschwindigkeit) arithmetisch gemittelt, während Klimaparameter diskreter Natur (z.B. Niederschlag, Schneehöhe, absolute Sonnenscheindauer) aufsummiert werden. Jahreszeitenwerte werden durch die (nach der Anzahl der Tage pro Monat gewichtete) Mittelung bzw. Aufsummierung der drei entsprechenden Monatswerte gewonnen: Dezember, Jänner und Februar bilden den Winter, März, April und Mai den Frühling, Juni, Juli und August den Sommer und September, Oktober und November den Herbst. Ob der Dezember dem Winter des Folgejahres oder Jänner und Februar dem Winter des Vorjahres zugerechnet werden, variiert von Studie zu Studie. Die astronomisch definierten Jahreszeiten haben in der Klimatologie keine Bedeutung. Um jahreszeitliche Mittelwerte als geeignetes Gegenstück zu einem bestimmten Klimaproxy zu erhalten, werden oft spezielle (gewichtete) Saisonmittel oder -summen (z.B. April bis August als Vegetationsperiode) berechnet.

Normalperiode

In der Klimatologie wurde eine Normalperiode von 30 Jahren definiert, um langfristige Mittelwerte des Klimas als Bezug (Referenz) für vergleichende Klimaanalysen zu gewinnen. Die Erfahrung lehrt, dass dieser Zeitraum ausreicht, um zwischenjährliche Schwankungen auszugleichen. Die aktuell auf internationaler Ebene verwendete Klimanormalperiode ist 1961–1990. Aus Gründen der zeitlichen Nähe kommt derzeit häufig der Zeitraum 1981–2010, bei der Verfügbarkeit langer, homogener Zeitreihen der Zeitraum 1901–2000 zum Einsatz. Häufig werden Zeitreihen nicht als Absolutwerte sondern als Abweichungen (Anomalien) relativ zu einer dieser Normalperioden ausgedrückt (Abb. 1). Das ermöglicht raum- und zeitübergreifende Vergleiche von Klimaverhältnissen.

Linearer Trend

Zu den am häufigsten verwendeten statistischen Maßzahlen gehört der lineare Trend. Er ist die Steigung aus der einfachen linearen Regression der Werte einer Zeitreihe (Abb. 1). Die zugehörige absolute Änderung wird durch die Multiplikation dieses relativen Trends mit der Zeitreihenlänge ermittelt. Wegen der für das Klima typischen Kurzfrist-Variabilität sind Trends vor allem kürzerer Zeitabschnitte oft zufallsbedingt (statistisch nicht signifikant). Die statistische Signifikanz eines vermuteten Klimatrends muss erst durch statistische Tests belegt werden. Der Bogen reicht dabei vom einfachen Signal-Rausch-Verhältnis, das den Trend in Relation zur Streuung setzt, bis hin zu differenzierteren Methoden, wie dem oft benutzten Mann-Kendall-Test.

Zeitreihenglättung

Durch die in der Klimatologie gern benutzte Zeitreihenglättung erhält man eine Art laufenden Trend, der auch Auskunft über das dem langjährigen Trend überlagerte mittelfristige Verhalten einer Klimareihe gibt (Abb. 1). Man spricht von dekadischen Anomalien, z.B. den warmen Jahren um 1950 oder den kühlen 1960er-Jahren. Bei der so genannten numerischen Tiefpassfilterung werden die langfristigen Schwankungen (tiefe Frequenzen) hervorgehoben und kurzfristigen Schwankungen (hohe Frequenzen) unterdrückt. Zur Filterung wird um einen Zeitreihenwert herum ein Bereich definiert, innerhalb dessen der Wert mit seinem benachbarten Werte gewichtet gemittelt wird. Gerne kommen einer Gauß-Verteilung entsprechende Filtergewichte zur Anwendung (Gauß-Filter). Danach wird der Filterbereich als laufendes Fenster um einen Zeitschritt (Phase) zum nächsten Wert verschoben. Der Breite des laufenden Fensters entsprechend entfallen im Zuge der Filterung am Reihenanfang und -ende Werte (Randeffekt). Erzwingt man dennoch eine vollständige Filterung – etwa durch Verkürzung des Fensters zu den Enden der ursprünglichen Reihe hin – ist eine derartige, zur übermäßigen Betonung der ersten und letzten Reihenwerte führende Manipulation deutlich (z.B. durch eine strichlierte Filterlinie) zu kennzeichnen.

Der mathematische Filter unterdrückt das kurzfristige (hochfrequente) statistische Rauschen – genauso wie in einer Kaffeemaschine ein Papierfilter nur die feinen Körnchen durchlässt und die groben zurückhält.

1-3-5_1_Zeitreihenanalyse
Abb. 1: Beispiel der Zeitreihenanalyse anhand der Jahresmitteltemperatur in Wien-Hohe Warte 1900–2009. Dargestellt sind die jährlichen Werte (Stufen) als Absolutwerte (linke y-Achse) und als Abweichungen vom Mittel der Jahre 1961–1990 (rechte y-Achse) sowie deren geglätteter Trend (rote Linie, 31-jähriger Gauß’scher Tiefpassfilter) und der lineare Trend der Jahre 1901–2000 (braune Linie).

Korrelation

Korrelationen zwischen Zeitreihen werden üblicherweise mit einem Pearson-Korrelationskoeffizienten beschrieben. Eine hohe Korrelation deutet auf eine starke Ähnlichkeit der hochfrequenten Variabilität zwischen zwei Zeitreihen. Dieser dimensionslose Index ist an beiden Seiten begrenzt ( -1 - vollständiger gegenläufiger Zusammenhang, 0 - kein Zusammenhang, 1 - vollständiger gleichläufiger Zusammenhang). Ob die untersuchten Reihen tatsächlich ursächlich zusammenhängen, die damit nicht gesagt. Als warnendes Beispiel sei in diesem Zusammenhang an die oft zitierte hohe Korrelation des Rückganges der Geburtenrate mit der Zahl der Störche im Westeuropa der zweiten Hälfte des 20. Jahrhunderts erinnert - ein statistischer, aber sicher kein ursächlicher Zusammenhang.

Dem Verfahren der Homogenisierung von Klimamessdaten ist ein eigener Abschnitt gewidmet. Der Methodenkomplex der Klimamodellierung wird ausführlich behandelt. Zu den zahlreichen weiteren häufig in der Klimaforschung verwendeten statistischen Methoden wie Regressions-, Varianz- und Hauptkomponentenanalyse wird auf die Fachliteratur verwiesen.

 

Literatur:

Sachs L., Hedderich J. (2006): Angewandte Statistik. 12. Aufl. Berlin, Heidelberg, New York: Springer, 702 Seiten, ISBN 978-3-540-32161-3

Schönwiese C.D. (2006): Praktische Statistik für Meteorologen und Geowissenschaftler. 4. Aufl. Berlin, Stuttgart: Bornträger, 302 Seiten, ISBN 978-3-443-01057-7

von Storch H., Zwiers F.W. (1999): Statistical analysis in climate research. Cambridge: Cambridge University Press, 494 Seiten, ISBN 978-0521450713

Sonnblick-Observatorium
zur Sonnblick-Website (© ZAMG)
Phänologie-PhenoWatch
zum Phänologie-Portal (© ZAMG)
HISTALP
zur HISTALP-Website (© ZAMG)