Kombination zweier Merkmal
Kontingenztafeln
- Ausgangspunkt sind zwei Merkmale X und Y mit k bzw. m verschiedenen Ausprägungen
- sind zweidimensionale Häufigkeitstabellen die Häufigkeit der Kombination von Ausprägungen der Merkmale darstellen
# Kontingenztabelle mit relativen Häufigkeiten, dritte Stelle nach dem Komma
round(addmargins(prop.table(tabelle))), 3)
# Kontingenztabelle mit Randverteilungen mit absoluten Höufigkeiten
addmargins(tabelle)
# wenn matrix gegeben ist
# matrix zu tabelle formen
kont_tabelle <- table(betriebe_daten)
# randverteilung hinzufügen
kont_tabelle <- addmargins(kont_tabelle)
# kontigenztabelle mit relativen häufigkeiten berechnen
rel_kont_tabelle <- round(addmargins(prop.table(kont_tabelle)), 3)
Beispiel
Ein Alkoholschnelltest wird an 100 Autofahrern ausprobiert. 10 haben nachweislich zu viel Alkohol im Blut und werden als betrunken deklariert. Bei 30% der Betrunkenen ist der Schnelltest negativ und bei 20% der Nüchternen ist der Schnelltest positiv.
Gemeinsame absolute Häufigkeiten:
Gemeinsame relative Häufigkeiten:
Bedinge relative Häufigkeit
Definition:
Häufigkeitsbaum
Mosaikplot
# mosaikplot mit graustufen
mosaicplot(kont_tabelle, col=T)
- nach einem Merkmal aufteilen
- Breite ist proportional zu Häufigkeit von Merkmal
- entstandene Spalten nach zweitem Merkmal aufteilen
- Höhe ist proportional zur bedingen relativen Häufigkeit
- entstandene Flächen der Segmente sind proportional zur gemeinsamen relativen Häufigkeit
Unabhängigkeit nominaler Merkmale
Erwartete Häufigkeiten im Falle von Unabhängigkeit berechnen
Maße für Unabhängigkeit
library(DescTools)
Phi(betriebe_daten)
ContCoef(betriebe_daten)
CramerV(betriebe_daten)
Pearsons χ2 -Statistik
Phi-Koeffizient
- nur wenn Merkmal binär ist, also zwei Ausprägungen
- Interpretation
- 0 keinen Zusammenhang
- 1 oder -1 perfekter Zusammenhang
Kontingenzmaß V nach Cramer
- Interpretation
- 0 kein Zusammenhang
- 1 perfekter Zusammenhang
Kontingenzmaß C nach Pearson
- Interpretation
- 0 kein Zusammenhang
- 1 perfekter Zusammenhang
Exakte Zusammenhänge
bei quadratischen Kontingenztabellen
- gilt die Bestimmtheit in beide Richtungen, d.h. jeder Wert eines Merkmals tritt mit genau einem Wert des anderen Merkmals auf und umgekehrt
- gilt die Bestimmtheit in beide Richtungen, d.h. jeder Wert eines Merkmals tritt mit genau einem Wert des anderen Merkmals auf und umgekehrt
bei nicht quadratischen Kontingenztabellen
- tritt Wert eines Merkmals mit nur einem Wert des anderen Merkmals auf
- tritt Wert eines Merkmals mit nur einem Wert des anderen Merkmals auf
Korrelationskoeffizienten
cor(Readiq$reading, Readiq$iq)