Lage und Streumaße

Lagemaße

Arithmetisches Mittel

  • für metrische Merkmale: Intervall und Verhältnisskala
  • wird aus Rohdaten x1, x2 … xn berechnet
  • kann als Schwerpunkt interpretiert werden

\[ \bar{x} = \frac{1}{n} (x_1 + x_2 + … + x_n) = \frac{1}{n} \sum\limits_{i=1}^n x_i \]

Bild

Arithmetisches Mittel bei Gruppen

  • arithmetisches Mitteln kann bei gruppierten Merkmalen auch aus Mittelwerten der Gruppen berechnet werden
  • bei r Gruppen der Größen n1, … nr mit arithmetischen Mittelwerten x1, x2 … xr

Bild

Gewichtetes arithmetisches Mittel

  • bei diskreten Merkmalen kann arithmetisches Mittel aus Häufigkeiten ausgerechnet werden, anstelle von Rohdaten zu nutzen
  • Beispiel
    • Umfrage an n Personen nach dem Alter
    • Erhalten n Antworten xi, die aber nur k < n verschiedene Ausprägungen aj annehmen, welche hj mal vorkommen
    • Für das arithmetische Mittel gilt dann

bild

  • in anderen Fällen ordnet man Ausprägungen aj direkt Gewichte zu
  • die z.B. Wichtigkeit der Ausprägung widerspiegeln
  • Beispiel
    • Verschiedene Fächer im Studium werden verschieden gewichtet und die Noten dementsprechend durch ein gewichtetes arithmetisches Mittel berechnet

Eigenschaften des arithmetischen Mittels

  • Wert verändert sich nicht mit Breite der Werteverteilung
  • ist empfindlich gegenüber Ausreißern
    • extremer bei kleinen Grundgesamtheiten

Getrimmtes arithmetisches Mittel

  • um Einfluss von Ausreißern auf das arithmetische Mittel zu reduzieren
  • kann Teil der Randdaten bei Berechnung weglassen
  • pauschal 10% der Randdaten weglassen

Median

  • mittlere Wert einer geordneten Liste von Werten
  • 50% der Werte sind kleiner oder gleich dem Median
  • 50% der Werte sind größer oder gleich dem Median
  • Werte spielen bei Bestimmung des Medians keine Rolle
    • nur Position in der geordneten Liste ist wichtig

Für ungerades n ist der median xmed die mittlere Beobachtung der geordneten Rohdaten und für gerades n ist der Median xmed das arithmetische Mittel der beiden in der Mitte liegenden Beobachtungen, d.h,

\[ x_{med} = \begin{cases} x_{\frac{n+1}{2}} \ für \ ungerade \ n \newline \frac{1}{2}(x_{n/2 +} + x_{n/2+1}) \ für \ gerade \ n \end{cases} \]

Modus

  • Modus oder Modalwert xmod ist Ausprägung mit größter Häufigkeit

  • Modus ist eindeutig, falls Häufigkeitsverteilung eindeutiges Maximum besitzt

  • Modus ist wichtigste Lagemaß für qualitative Merkmale und schon bei Nominalskala sinnvoll

  • für stetige Merkmale ist Moduls der Rohdaten nicht sinnvoll, da Ausprägungen oft nur einmal vorkommen

  • in diesem Fall kann modus auf gruppierten Daten berechnet werden

    • finde Gruppe i mit der größten Häufigkeitsdichte hi / di (absolute Dichte) bzw. fi / di (relative Dichte)
    • berechne den Modus als Mitte der Gruppe i aus ihren Grenzen

\[ x_{mod} = (c_i - c_{i-1})/2 \]

Lageregeln

relative Lage von arithmetischen Mittel, Median und Modus kann dazu benutzt werden, um Grad der Schiefe einer Verteilung zu beurteilen

Bild

Geometrisches Mittel

  • werden Wachstumsfaktoren über mehrere Zeitperioden beobachtet, sind arithmetisches Mittel und Median ungeeignet um durchschnittliches Wachstum zu berechnen
  • Grund ist, dass Wachstumsfaktoren multipliziert werden um Gesamtwachstum zu berechnen

Bild

Harmonisches Mittel

Bild

Streuungsmaße

  • Minimum = kleinster Wert
  • Maximum = größter Wert
  • Spannweite = Maximum - Minimum

Quantile

Bild

Fünf-Punkte-Zusammenfassung

  • Quartile, Minimum, Maximum sowie Median teilen Datensatz in vier Teile
  • wobei jeder Teil etwas in Viertel der Beobachtungswerte enthält
  • dies gibt Informationen über Verteilung der Beobachtungen

Bild

Interquartilsabstand (IQR)

  • Abstand zwischen erstem Quartil und drittem Quartil

Bild

Box Plots

Einfache Version

  • visualisiert Fünf-Punkte-Zusammenfassung

Bild

erweiterte Version

Bild

Mittlere absolute Abweichung

Bild

Empirische Varianz und Standardabweichung

Bild

Stichprobenvarianz

Bild

Verschiebungssatz

Bild

Variationskoeffizient

  • bei Anwendungen würde man eine wachsende Varianz bei wachsenden Werte und dementsprechend wachsendem MIttelwert erwarten
  • Um Streuung verschiedener Messungen vergleichen zu können, kann bei positiven Ausprägungen und einem positiven Mittelwert der Variationskoeffizient b benutzt werden

Bild

Last modified 2023.05.03