Datenmanagement

Datenorganisation

Ubersicht

Datenbank

Gruppe von Dateien zwischen denen logische Abhängigkeit bestehen

Besteht aus

  • Attributen

    • inhaltliche Beschreibung des Datenelements
      • Max Muster (Name)
      • 1.0 (Note)
  • Primärschlüssel

    • Datenelement welches einen Datensatz eindeutig identifiziert

Entität

Zusammenfassung logisch zusammengehöriger gleichnamiger Datensätze

Datensatz

Gruppe von inhaltlich zusammenhängenden Datenelementen, die verschiedene Eigenschaften des selben Phänomens beschreiben

Datenelement

Gruppierung einer oder mehrerer Zeichen zu einem Wort, Gruppe von Wörtern oder Zahlen

Datenbank

  • Datenverwaltung
    • organisatorische Funktionen für Verwaltung von Daten
    • zuständig für einhalten der Richtlinien
    • sowie Pflege, Nutzung und Weitergabe von Informationen
  • Informationsverwendungsrichtlinien
    • formale Richtlinien
    • regeln Erfassung, Wartung, Verteilung und Verwendung von Informationen
  • Datenbankmanagementsystemen
    • Sammlung von Programmen zum Erstellen und Verwalten
    • Ermöglicht mehreren Anwendungen gleichzeitig auf Daten zuzugreifen und zu verändern
    • ohne eigene Dateien erstellen zu müssen
  • Konzeptionelles Datenbankschema
    • logische Beschreibung der Datne bank
    • zeigt alle Datenelemente und deren Beziehungen untereinander

Relationale Datenbank

  • Normalisierung von Daten
    • Schrittweise Zerlegung von Tabellen
    • in mehrere Relationen auf der Grundlage funktionaler Abhängigkeiten
    • in der Phase des Datenbankentwurfs
    • dient der Vermeidung von Redundanz und Inkonsistenzen

Beispiel RL

  • Besteht aus 3 Normformen
    • Jedes Attribut der Relation muss einen atomaren (atomisch) Wertebereich haben und frei von Wiederholungsgruppen sein
    • Eine Relation ist in der zweiten Normalform, wenn die erste Normalform vorliegt und jedes Nichtschlüsselattribut von jedem Schlüsselkandidaten voll funktional abhängig ist
    • Die dritte Normalform ist erreicht, wenn sich das Relationenschema in 2NF befindet, und jedes Nichtschlüsselattribut von keinem Schlüsselkandidaten transitiv abhängt

Entity-Relationship-Diagramm

Darstellungsmethode zur Dokumentation des konzeptionellen Datenbankschemas, in dem Entitätstypen mit ihren Attributen sowie die Beziehungstypen zwischen verschiedenen Entitätstypen der Datenbank beschrieben werden.

Beispiel ER Diagramm

Volltextdatenbank

  • typischerweise keine Datenbanken, sondern Liste mit Dokument-Infos
  • Dokument-Tabelle enthält alle Dokument-Infos in einer Zeile, sowie alle Feld-Infos in einer Spalte

Volltextdatenbank

Business Intelligence

  • Datenbank strukturieren explosionsartig wachsende Datenmengen
  • setzt auf im Unternehmen vorhandene Daten
  • verfolgt einen gesamtheitlichen Ansatz zur Unterstützung des Managements
  • durch Aufbereitung, Transformation, Extraktion, Analyse und Interpretation der Daten

Datawarehouse

Ein Data Warehouse ist eine Lösung, die das Treffen von Entscheidungen und Geschäftshandlungen erleichtert, indem sie die richtigen Informationen und analytischen Fähigkeiten zur richtigen Zeit liefert.

  • Bestimmte Merkmale

    • Vereinheitlichung, aus verschiedenen Datenbeständen eine homogene Begriffswelt schaffen
    • Themenausrichtung, auf die Informationsbedürfnisse des Anwenders ausgerichtet
    • Zeitorientierung, Einbeziehung von zurückliegenden Werten, aber auch Planzahlen
    • Dauerhaftigkeit, jederzeitige Wiederholbarkeit einer Abfrage
  • Quellen von Daten

    • extern
      • quantitativ
        • Marktvolumen
        • Marktanteil
        • Verbraucherzahlen
      • qualitativ
        • Pressemeldungen
        • Patente
        • Gutachten
    • intern
      • quantitativ
        • Auftragseingang
        • Umsatz
        • Produktivität
      • qualitativ
        • Kundenbesuchsberichte
        • Projektberichte

OLAP-Modell - Online Analytical Processing

  • Hypothesegestützte Analysemethode
  • Multidimensionale Abfragen in operativen Systemen

Data Mining

  1. Datawarehouse, Daten selektieren/transformieren
  2. Datamarts, Datamining
  3. Muster, Visualisieren
  • Anspruch besteht den gesamten Datenbestand zu untersuchen, nicht nur Stichproben
  • Beschreibung, Regeln, Beziehungen zwischen Feldern der Datenbank
    • datengesteuerte Datenanalyse
    • nicht hypothesengesteuerter
    • Verständlichkeit, gefundene Muster müssen verständlich sein
    • Muster sollten mit gewisser Sicherheit für neue Daten zutreffen

OLAP

Datawarehouse

Last modified 2022.05.03