Lagemaße
Arithmetisches Mittel
- für metrische Merkmale: Intervall und Verhältnisskala
- wird aus Rohdaten x1, x2 … xn berechnet
- kann als Schwerpunkt interpretiert werden
\[ \bar{x} = \frac{1}{n} (x_1 + x_2 + … + x_n) = \frac{1}{n} \sum\limits_{i=1}^n x_i \]
Arithmetisches Mittel bei Gruppen
- arithmetisches Mitteln kann bei gruppierten Merkmalen auch aus Mittelwerten der Gruppen berechnet werden
- bei r Gruppen der Größen n1, … nr mit arithmetischen Mittelwerten x1, x2 … xr
Gewichtetes arithmetisches Mittel
- bei diskreten Merkmalen kann arithmetisches Mittel aus Häufigkeiten ausgerechnet werden, anstelle von Rohdaten zu nutzen
- Beispiel
- Umfrage an n Personen nach dem Alter
- Erhalten n Antworten xi, die aber nur k < n verschiedene Ausprägungen aj annehmen, welche hj mal vorkommen
- Für das arithmetische Mittel gilt dann
- in anderen Fällen ordnet man Ausprägungen aj direkt Gewichte zu
- die z.B. Wichtigkeit der Ausprägung widerspiegeln
- Beispiel
- Verschiedene Fächer im Studium werden verschieden gewichtet und die Noten dementsprechend durch ein gewichtetes arithmetisches Mittel berechnet
Eigenschaften des arithmetischen Mittels
- Wert verändert sich nicht mit Breite der Werteverteilung
- ist empfindlich gegenüber Ausreißern
- extremer bei kleinen Grundgesamtheiten
Getrimmtes arithmetisches Mittel
- um Einfluss von Ausreißern auf das arithmetische Mittel zu reduzieren
- kann Teil der Randdaten bei Berechnung weglassen
- pauschal 10% der Randdaten weglassen
Median
- mittlere Wert einer geordneten Liste von Werten
- 50% der Werte sind kleiner oder gleich dem Median
- 50% der Werte sind größer oder gleich dem Median
- Werte spielen bei Bestimmung des Medians keine Rolle
- nur Position in der geordneten Liste ist wichtig
Für ungerades n ist der median xmed die mittlere Beobachtung der geordneten Rohdaten und für gerades n ist der Median xmed das arithmetische Mittel der beiden in der Mitte liegenden Beobachtungen, d.h,
\[ x_{med} = \begin{cases} x_{\frac{n+1}{2}} \ für \ ungerade \ n \newline \frac{1}{2}(x_{n/2 +} + x_{n/2+1}) \ für \ gerade \ n \end{cases} \]
Modus
Modus oder Modalwert xmod ist Ausprägung mit größter Häufigkeit
Modus ist eindeutig, falls Häufigkeitsverteilung eindeutiges Maximum besitzt
Modus ist wichtigste Lagemaß für qualitative Merkmale und schon bei Nominalskala sinnvoll
für stetige Merkmale ist Moduls der Rohdaten nicht sinnvoll, da Ausprägungen oft nur einmal vorkommen
in diesem Fall kann modus auf gruppierten Daten berechnet werden
- finde Gruppe i mit der größten Häufigkeitsdichte hi / di (absolute Dichte) bzw. fi / di (relative Dichte)
- berechne den Modus als Mitte der Gruppe i aus ihren Grenzen
\[ x_{mod} = (c_i - c_{i-1})/2 \]
Lageregeln
relative Lage von arithmetischen Mittel, Median und Modus kann dazu benutzt werden, um Grad der Schiefe einer Verteilung zu beurteilen
Geometrisches Mittel
- werden Wachstumsfaktoren über mehrere Zeitperioden beobachtet, sind arithmetisches Mittel und Median ungeeignet um durchschnittliches Wachstum zu berechnen
- Grund ist, dass Wachstumsfaktoren multipliziert werden um Gesamtwachstum zu berechnen
Harmonisches Mittel
Streuungsmaße
- Minimum = kleinster Wert
- Maximum = größter Wert
- Spannweite = Maximum - Minimum
Quantile
Fünf-Punkte-Zusammenfassung
- Quartile, Minimum, Maximum sowie Median teilen Datensatz in vier Teile
- wobei jeder Teil etwas in Viertel der Beobachtungswerte enthält
- dies gibt Informationen über Verteilung der Beobachtungen
Interquartilsabstand (IQR)
- Abstand zwischen erstem Quartil und drittem Quartil
Box Plots
Einfache Version
- visualisiert Fünf-Punkte-Zusammenfassung
erweiterte Version
Mittlere absolute Abweichung
Empirische Varianz und Standardabweichung
Stichprobenvarianz
Verschiebungssatz
Variationskoeffizient
- bei Anwendungen würde man eine wachsende Varianz bei wachsenden Werte und dementsprechend wachsendem MIttelwert erwarten
- Um Streuung verschiedener Messungen vergleichen zu können, kann bei positiven Ausprägungen und einem positiven Mittelwert der Variationskoeffizient b benutzt werden