Skip to content

Standardabweichung

Die Standardabweichung ist ein statistisches Maß für die Streuung von Daten um den Mittelwert. Sie zeigt an, wie stark die Werte in einem Datensatz variieren, und hat die gleiche Einheit wie die ursprünglichen Daten. Dies macht sie leichter interpretierbar als die Varianz, aus der sie als Quadratwurzel abgeleitet wird. Die Standardabweichung findet Anwendung in vielen Bereichen der Datenanalyse, um die Variabilität zu quantifizieren, ist aber empfindlich gegenüber Ausreißern.

Grundlagen

Was ist die Standardabweichung?

Die Standardabweichung misst die typische Abweichung der Datenpunkte vom Mittelwert. Ein niedriger Wert deutet auf eine enge Streuung um den Mittelwert hin, ein hoher Wert auf eine weite Streuung. Sie ist nur sinnvoll für intervallskalierte Daten, bei denen die Differenzen zwischen Werten eine Bedeutung haben.

Beziehung zur Varianz

Die Standardabweichung ist die Quadratwurzel der Varianz. Während die Varianz in quadrierten Einheiten angegeben wird, hat die Standardabweichung die gleichen Einheiten wie die Daten. Zum Beispiel beträgt die Varianz von Längen in Quadratmetern, die Standardabweichung aber in Metern.

Wann wird sie verwendet?

Die Standardabweichung kommt in der Qualitätskontrolle, Finanzanalyse und Prozessanalyse zum Einsatz, um Risiken oder Instabilitäten zu bewerten. Sie eignet sich für intervallskalierte Messungen und hilft, die Zuverlässigkeit von Durchschnittswerten einzuschätzen.

Formeln und Berechnung

Die Berechnung erfolgt in zwei Varianten: für die vollständige Gesamtheit (Population) und für Stichproben (Sample). Die Symbole sind:

  • σ oder s: Standardabweichung
  • n: Anzahl der Datenpunkte
  • x_i: einzelner Datenpunkt
  • x̄: Mittelwert der Daten

Gesamtheit

Für eine vollständige Gesamtheit wird die Formel verwendet, wenn alle Daten vorliegen:

σ=1ni=1n(xix¯)2

Dies ergibt die exakte Standardabweichung der Population.

Stichprobe

Bei einer Stichprobe, die die Gesamtheit schätzt, wird durch n-1 geteilt (Bessel-Korrektur). Diese Korrektur stellt eine unverzerrte Schätzung der Populationsvarianz sicher, da Stichproben tendenziell die Streuung unterschätzen:

s=1n1i=1n(xix¯)2

Rechenbeispiel

Angenommen, die Daten: 2, 4, 5, 6, 8, 9, 14, 16. Der Mittelwert x̄ = 8.

Für die Gesamtheit (n=8): Quadrierte Abweichungen: (2-8)²=36, (4-8)²=16, (5-8)²=9, (6-8)²=4, (8-8)²=0, (9-8)²=1, (14-8)²=36, (16-8)²=64. Summe=166. σ = √(166/8) = √20,75 ≈ 4,56.

Für die Stichprobe: s = √(166/7) = √23,71 ≈ 4,87.

Interpretation

Größe der Standardabweichung

Eine kleine Standardabweichung bedeutet geringe Streuung; die Werte liegen nah am Mittelwert. Eine große deutet auf hohe Variabilität hin. Der Vergleich mit der Skala der Daten hilft: Bei Einkommen in Euro ist 1000 € Streuung viel, bei Preisen in Cent wenig.

Empirische Regel

Bei normalverteilten Daten liegen etwa 68 % innerhalb einer Standardabweichung vom Mittelwert, 95 % innerhalb zweier und 99,7 % innerhalb dreier. Dies hilft, die Streuung intuitiv zu verstehen.

Variationskoeffizient

Für relative Vergleiche wird der Variationskoeffizient verwendet:

σx¯×100%

Er zeigt die Streuung als Prozentsatz des Mittelwerts und eignet sich für unterschiedliche Skalen.

Abgrenzung und Zusammenhänge

Vergleich mit anderen Streuungsmaßen

MaßBeschreibungEinheitRobustheit gegenüber Ausreißern
SpannweiteDifferenz zwischen Maximum und MinimumGleiche wie DatenNicht robust
InterquartilsabstandDifferenz zwischen 75. und 25. PerzentilGleiche wie DatenRobust
VarianzDurchschnitt der quadrierten AbweichungenQuadriertNicht robust
StandardabweichungQuadratwurzel der VarianzGleiche wie DatenNicht robust
VariationskoeffizientStandardabweichung geteilt durch MittelwertProzentAbhängig von Daten

Stärken und Schwächen

Stärken: Leichte Interpretierbarkeit durch gleiche Einheit. Schwächen: Empfindlich gegenüber Ausreißern; bei schiefen Verteilungen weniger aussagekräftig.

Anwendungen in der Datenanalyse

In der Qualitätskontrolle zeigt die Standardabweichung die Prozessstabilität (z. B. Six Sigma). In der Finanzanalyse misst sie die Volatilität von Aktien. In der Prozessanalyse hilft sie, Abweichungen zu identifizieren und zu minimieren.

Häufige Fehler und Tipps

  • Nicht verwechseln: Population (σ, durch n) vs. Stichprobe (s, durch n-1).
  • Bei Ausreißern: Robuste Alternativen wie Median-Abweichung prüfen.
  • Interpretation: Immer im Kontext der Daten skalieren.

Einzelnachweise

  • Destatis eLearning Modul 16: Definition und Formel.
  • Spektrum Lexikon: Streuungsmaß und Intervallskalierung.