Statistische Verteilungen
Statistische Verteilungen beschreiben die Verteilung von Wahrscheinlichkeiten über die möglichen Werte einer Zufallsvariablen. Zu den wichtigsten gehören die Normalverteilung, die diskrete Gleichverteilung, die T-Verteilung, die Chi-Quadrat-Verteilung und die F-Verteilung. Diese Modelle werden in statistischen Tests und Analysen verwendet, um Wahrscheinlichkeiten und Eigenschaften von Daten zu bewerten.
Lernziele
- Grundlegende Begriffe der Wahrscheinlichkeitsverteilungen erklären.
- Eigenschaften der Normalverteilung, T-Verteilung, Chi-Quadrat-Verteilung und F-Verteilung unterscheiden.
- Typische Anwendungen dieser Verteilungen in der Datenanalyse nennen.
- Einfache Entscheidungsregeln für die Auswahl geeigneter Verteilungen anwenden.
Kurzüberblick
Statistische Verteilungen sind Modelle, die angeben, mit welcher Wahrscheinlichkeit bestimmte Werte einer Zufallsvariablen auftreten. Sie unterteilen sich in diskrete Verteilungen für abzählbare Ergebnisse und stetige Verteilungen für kontinuierliche Werte. Die Normalverteilung gilt als zentrale Verteilung, da viele natürliche Phänomene ihr folgen. Die anderen Verteilungen basieren oft auf ihr und werden bei unbekannten Parametern oder spezifischen Tests verwendet.
Grundbegriffe
Eine Wahrscheinlichkeitsverteilung gibt an, wie Wahrscheinlichkeiten über die möglichen Werte einer Zufallsvariablen verteilt sind. Bei diskreten Zufallsvariablen wird dies durch eine Wahrscheinlichkeitsfunktion dargestellt, bei stetigen durch eine Dichtefunktion
Der Erwartungswert
Normalverteilung
Die Normalverteilung, auch Gauß-Verteilung genannt, ist eine stetige Wahrscheinlichkeitsverteilung mit den Parametern Mittelwert
Bei der Standardnormalverteilung ist $$\mu = 0$$ und
Innerhalb von
Ein Beispiel: Die Körpergrößen von Erwachsenen folgen annähernd einer Normalverteilung mit $$\mu = 170$$ cm und $$\sigma = 10$$ cm.
Diskrete Gleichverteilung
Die diskrete Gleichverteilung tritt bei diskreten Zufallsvariablen auf, bei denen alle möglichen Ergebnisse die gleiche Wahrscheinlichkeit haben. Ein Beispiel ist der Wurf eines fairen Würfels, bei dem jede Augenzahl die Wahrscheinlichkeit $$1/6$$ hat.
T-Verteilung
Die T-Verteilung, auch Studentsche t-Verteilung genannt, wurde 1908 von William Sealey Gosset veröffentlicht. Sie wird verwendet, wenn die Varianz der Grundgesamtheit unbekannt ist und eine Normalverteilung angenommen wird. Die Form hängt von den Freiheitsgraden
Die T-Verteilung ist symmetrisch um 0, breiter als die Normalverteilung und hat "dicke Ränder". Für
Anwendungen: t-Tests und Konfidenzintervalle.
Ein Beispiel: Bei einer kleinen Stichprobe von 10 Messungen wird die T-Verteilung mit $$k = 9$$ verwendet, um den Mittelwert zu testen.
Chi-Quadrat-Verteilung
Die Chi-Quadrat-Verteilung ist die Verteilung der Summe quadrierter Abweichungen. Sie ist asymmetrisch und umfasst nur positive Werte. Ihre Form hängt von den Freiheitsgraden $$k$$ ab.
Bei $$k = 2$$ hat sie ihr Maximum bei 0 und nähert sich mit zunehmenden $$k$$ einer Normalverteilung an.
Anwendungen: Anpassungstests und Unabhängigkeitstests bei kategorialen Daten.
Ein Beispiel: Der Chi-Quadrat-Test prüft, ob beobachtete Häufigkeiten von erwarteten abweichen, etwa bei Umfragedaten zu Präferenzen.
F-Verteilung
Die F-Verteilung beschreibt das Verhältnis zweier unabhängiger Chi-Quadrat-verteilter Zufallsvariablen. Sie ist asymmetrisch und hat nur positive Werte, spitzer als die Chi-Quadrat-Verteilung.
Anwendungen: Vergleich von Varianzen in Varianzanalysen (ANOVA).
Ein Beispiel: Der F-Test prüft, ob zwei Stichproben die gleiche Varianz haben, etwa bei Qualitätskontrollen in Produktionsprozessen.
Häufige Fehler und Tipps
Nicht jede Verteilung ist normal. Die Daten sollten immer geprüft werden. Bei kleinen Stichproben sollte die T-Verteilung statt der Normalverteilung verwendet werden, da sie die Unsicherheit berücksichtigt. Freiheitsgrade korrekt berechnen: Für t-Verteilung
Zentrale Fragen
- Was beschreibt die Dichtefunktion einer stetigen Verteilung?
- Wann wird die T-Verteilung anstelle der Normalverteilung verwendet?
- Wie unterscheidet sich die Chi-Quadrat-Verteilung von der Normalverteilung?
- Welche Anwendung hat die F-Verteilung?
- Was sind Freiheitsgrade und wie werden sie berechnet?
- Nach welcher Regel liegen etwa 95 Prozent der Werte einer Normalverteilung?