Notizen Zwischentest

Kombination zweier Merkmal

Kontingenztafeln

  • Ausgangspunkt sind zwei Merkmale X und Y mit k bzw. m verschiedenen Ausprägungen

Bild

  • sind zweidimensionale Häufigkeitstabellen die Häufigkeit der Kombination von Ausprägungen der Merkmale darstellen

Bild

Bild

# Kontingenztabelle mit relativen Häufigkeiten, dritte Stelle nach dem Komma
round(addmargins(prop.table(tabelle))), 3)

# Kontingenztabelle mit Randverteilungen mit absoluten Höufigkeiten
addmargins(tabelle)

# wenn matrix gegeben ist
# matrix zu tabelle formen
kont_tabelle <- table(betriebe_daten)
# randverteilung hinzufügen
kont_tabelle <- addmargins(kont_tabelle)
# kontigenztabelle mit relativen häufigkeiten berechnen
rel_kont_tabelle <- round(addmargins(prop.table(kont_tabelle)), 3)

Beispiel

Ein Alkoholschnelltest wird an 100 Autofahrern ausprobiert. 10 haben nachweislich zu viel Alkohol im Blut und werden als betrunken deklariert. Bei 30% der Betrunkenen ist der Schnelltest negativ und bei 20% der Nüchternen ist der Schnelltest positiv.

Gemeinsame absolute Häufigkeiten: Bild

Gemeinsame relative Häufigkeiten: Bild

Bedinge relative Häufigkeit

Bild

Bild

Bild

Definition: Bild

Häufigkeitsbaum

Bild

Mosaikplot

# mosaikplot mit graustufen
mosaicplot(kont_tabelle, col=T)
  • nach einem Merkmal aufteilen
    • Breite ist proportional zu Häufigkeit von Merkmal
  • entstandene Spalten nach zweitem Merkmal aufteilen
    • Höhe ist proportional zur bedingen relativen Häufigkeit
  • entstandene Flächen der Segmente sind proportional zur gemeinsamen relativen Häufigkeit

Unabhängigkeit nominaler Merkmale

Bild

Bild

Erwartete Häufigkeiten im Falle von Unabhängigkeit berechnen

Bild

Maße für Unabhängigkeit

library(DescTools)
Phi(betriebe_daten)
ContCoef(betriebe_daten)
CramerV(betriebe_daten)

Pearsons χ2 -Statistik

Bild

Phi-Koeffizient

Bild

  • nur wenn Merkmal binär ist, also zwei Ausprägungen
  • Interpretation
    • 0 keinen Zusammenhang
    • 1 oder -1 perfekter Zusammenhang
Kontingenzmaß V nach Cramer

Bild

  • Interpretation
    • 0 kein Zusammenhang
    • 1 perfekter Zusammenhang
Kontingenzmaß C nach Pearson

Bild

  • Interpretation
    • 0 kein Zusammenhang
    • 1 perfekter Zusammenhang

Exakte Zusammenhänge

  • bei quadratischen Kontingenztabellen

    • gilt die Bestimmtheit in beide Richtungen, d.h. jeder Wert eines Merkmals tritt mit genau einem Wert des anderen Merkmals auf und umgekehrt Bild
  • bei nicht quadratischen Kontingenztabellen

    • tritt Wert eines Merkmals mit nur einem Wert des anderen Merkmals auf Bild

Korrelationskoeffizienten

cor(Readiq$reading, Readiq$iq)
Last modified 2023.06.27