Inhaltsverzeichnis

Zusätzliche Variablen in der Datenausgabe

Vor bzw. nach den eigentlichen Daten finden Sie im Datensatz weitere Variablen. Diese werden im Folgenden kurz erläutert.

Hinweis: Einige Variablen muss man beim Herunterladen der Daten explizit aktivieren.

Hinweis: Die Aufzeichnung der Browser-Daten (Browser, Referer, etc.) muss man vor der Datenerhebung in den Projekt-Einstellungen aktivieren.

Identifikation des Interviews

Interview-Fortschritt

Die folgenden Variablen sind am Ende des Datensatzes zu finden.

Antwortzeiten

Hinweis: Die Kennwerte TIME_SUM und TIME_RSI enthalten erst dann einen Wert, wenn mindestens 10 Datensätze für den jeweiligen Fragebogen im Download enthalten sind (auswahlkriterien_filterAuswahlkriterien/Filter). Je mehr Datensätze der Download enthält, desto genauer werden die Werte für TIME_SUM und TIME_RSI, denn für die Bereinigung von Ausreißern bzw. zur Normierung wird die Verteilung der Antwortzeiten in der Stichprobe herangezogen.

Hinweis: Die Antwortzeiten sind im Datensatz nur dann enthalten, wenn beim Daten herunterladen in der Variablen-Auswahl ein Kreuzchen bei der Option Verweildauer gesetzt wurde. Diese Option ist standardmäßig ausgewählt.

Hinweis: Die Bearbeitungszeiten werden automatisch aufgezeichnet. Um die Aufzeichnung zu deaktivieren, entfernen Sie bitte die Markierung bei BefragungsprojektProjekt-Einstellungen → Karteireiter DatenschutzZeit und Verweildauer während der Befragung aufzeichnen.

Qualitätsindikatoren

Die Datenqualität in Onlinebefragungen ist zwar meist sehr hoch – um eine Datenbereinigung kommt man aber i.d.R. nicht umhin. SoSci Survey stellt mit der Option Variablen-AuswahlKennwerte zur Datenqualität herunterladen drei Variablen zur Verfügung, welche Sie bei der Bereinigung unterstützen:

Ob ein Fragebogen vollständig ausgefüllt wurde lässt sich anhand der Variablen LASTPAGE und FINISHED nachvollziehen (s. oben). Der Anteil fehlender Angaben (MISSREL) ist ein wertvoller Indikator für die Sorgfalt des Teilnehmers bzw. für Datensätze, die vom „nur mal ansehen“ stammen. Die zum Ausfüllen investierte Zeit ist zwar kein direkter Indikator für Datenqualität, aber sehr geringe Antwortzeiten (geringe TIME_SUM und hoher TIME_RSI) deuten darauf hin, dass die Fragen nicht einmal gelesen wurden.