Benutzer:Zulu55/Fehlender Wert

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Als Fehlende Werte, Fehlender Wert, Ausfall/Ausfälle, Fehlende Daten, Missing Data, Missing Value bezeichnet man in der Statistischen Datenanalyse das Fehlen von Werten einer Variablen. Siehe auch Antwortausfall, Schweigeverzerrung und Selbstselektion.

Unit Nonresponse und Item Nonresponse

Zufälligkeitsgrade fehlender Daten in Regressionsmodellen[1][2]

  • Missing Completly at Random MCAR
  • Missing at Random MAR
  • Missing not at RandomMNAR

Bevölkerungsumfragen

[Bearbeiten | Quelltext bearbeiten]

Stichprobenneutrale Ausfälle

  • Adresse falsch, umbewohnt, niemanden angetroffen

Stichprobenspezifische Ausfälle

  • Verweigerung

In Bevölkerungsumfragen gibt es unterschiedliche Gründe für das Fehlen einer Antwort:

  • Frage wurde nicht wahrgenommen
  • Frage wurde nicht verstanden
  • Beschaffung der benötigten Information zu aufwendig oder Information nicht bereitstellbat (Weiß nicht)
  • Frage oder Antwortmöglichkeiten treffen nicht zu ("trifft nicht zu") (Missing Data/ Missing Values) im engeren Sinne, system definiert fehlend, gefilterte Fragen aufgrund von Filterführung
  • Verweigerung der Antwort ("keine Angabe")
  • bei der Datenerfassung: Erfassungsfehler, Übertragungsfehler, unleserlich geschrieben, beim automatischen Einlesen nicht erkannt
  • gelöschte Daten (Datenbereinigung): Außreißer, Datenfehler (z.B. falsche Angaben, Messfehler), Filterführung (Fragefilter),

Weitere:

Umgang mit fehlenden Werten

[Bearbeiten | Quelltext bearbeiten]
  • Listenweiser Ausschluss (listwise)
  • Fallweiser Ausschluss (casewise)
  • Imputation fehlender Werte

Unterscheidung in Statistik-Software systemdefinierte vs. benutzerdefinierte fehlende Werte

Systematischer Fehler Zufällige Abweichung

Schweigeverzerrung (non-response bias), z.B. insbesondere bei Sensitiven Fragen, Selektivität siehe auch Störfaktor

  • NaN: Weiterhin werden NaNs eingesetzt, um fehlende Werte in Berechnungen darzustellen.
  • Zensierte Daten: die Datensätze werden weggelassen und als fehlende Werte behandelt
  • SYSTAT: erlaubt Analyse fehlender Werte

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. http://marktforschung.wikia.com/wiki/Zuf%C3%A4lligkeitsgrade
  2. http://en.wikipedia.org/wiki/Missing_completely_at_random