Inhaltsverzeichnis

Daten herunterladen

Daten herunterladen

Um die erhobenen Daten als Datensatz herunterzuladen, wählen Sie im Menü Erhobene Daten → Daten herunterladen. SoSci Survey liefert Ihnen die Rohdaten aus der Befragung: Sie bekommen eine Tabelle mit einer Zeile pro ausgefülltem Fragebogen und einer Spalte pro Variable.

Sie können die Daten jederzeit (auch während die Erhebung noch läuft und auch mehrfach) als Backup oder für erste Auswertungen herunterladen. Die gespeicherten Daten auf dem Server werden beim Herunterladen weder gelöscht noch verändert. Mit der Funktion Erhobene Daten → Daten ansehen können Sie auch direkt online einen Blick in die Daten werfen.

Falls Sie beim Herunterladen/Öffnen der Daten auf Probleme stoßen, folgen Sie bitte der Anleitung Problemlösungen beim Datenabruf.

Wichtig: Es ist wahrscheinlich, dass Sie irgendwann die Originaldaten benötigen – so wie Sie sie vom Befragungsserver heruntergeladen haben (etwa zur Dokumentation oder weil in einem unaufmerksamen Moment eine wichtige Variable überschrieben wurde). Speichern Sie die Original-Daten deshalb zeitnah auf einer CD und bewahren Sie diese an einem sicheren Ort auf. Erstellen Sie anschließend eine Arbeitskopie der Originaldatei und arbeiten Sie nur mit dieser Kopie. Nehmen Sie niemals Änderungen an der Originaldatei vor.

Hinweis: Für jeden, der den Fragebogen aufruft, wird eine Interview-Nummer (CASE) ermittelt. Wenn ein Besucher sich entschließt, den Fragebogen gleich wieder zu verlassen, entsteht ein „leeres Interview“, das SoSci Survey standardmäßig löscht (unter Projekt-Einstellungen → Datenschutz können Sie das ändern). Die Nummerierung der Fälle im Datensatz ist daher i.d.R. nicht fortlaufend, sondern hat Löcher. Auch Fragebogen-Aufrufe während der Entwicklung erhalten eine Nummer. Die Nummer des ersten „richtigen“ Interviews ist daher i.d.R. nicht 1.

Statistische Auswertung

Der Schwerpunkt von SoSci Survey ist die Erhebung von Daten, für die statistisch Auswertung gibt es geeignete Spezialsoftware. Auf dem Pro-Server s2survey.net steht Ihnen eine deskriptive Datenauswertung zur Verfügung. Bei Verwendung des Standardservers und für komplexere Auswertungen (z.B. induktive Statistik und multivariate Verfahren) bemühen Sie bitte ein geeignetes Programm.

Software zur Tabellenkalkulation (LibreOffice Calc, Microsoft Excel, etc.)
Solche Programme erlauben einfache Auswertungen, wie z.B. Mittelwerte und Standardabweichungen. Mit Einschränkungen lassen sich sogar Korrelationen rechnen. Für weitere Auswertungen (z.B. Signifikanztests) eigenen sich die Programme allerdings kaum.
Statistik-Software (R, Jamovi, SPSS, Stata, etc.)
Diese Programme sind auf die statistische Auswertung von Daten spezialisiert. Bei der offenen Software GNU R ist der Einstieg leider etwas anspruchsvoll. SPSS ist nicht ganz billig, aber an vielen Universitäten verfügbar. Für R, SPSS und Stata bereitet SoSci Survey die Datensätze mit Variablen- und Wertelabels auf. Für andere Software bietet sich das universelle CSV-Format an.
SQL-Datenbanken (z.B. MySQL)
Falls die Daten in einer Datenbank benötigt werden, liefert SoSci Survey auch den SQL-Code für den Import. Soweit möglich werden dabei auch die Beschriftungen der Variablen und Daten importiert. Bitte beachten Sie, dass Datenbanken die Daten nur speichern – für die statistische Auswertung ist zusätzliche Software erforderlich.

Dateiformat

Als erstes wählen Sie das Dateiformat aus. Klicken Sie dazu auf den entsprechenden Karteireiter.

Auswahl des Dateiformats

Excel

Für Excel (Dateiformat XLSX) können Sie den Datensatz herunterladen, und ein Codebuch, welches alle Variablen und deren Ausprägungen listet. Für den Datensatz können Sie folgende Optionen einstellen:

Ausgabe der Antworten
Sollen die Antworten auf geschlossene Fragen (z.B. Auswahlfragen) als numerischer Code (1, 2, 3) oder als Text (Tee, Kaffee, Kakao) in der Tabelle erscheinen?
Fehlende Werte
Sollen Antworten, die keine Antwort sind (nichts ausgewählt oder Option „weiß nicht“) als Codes in der Tabelle erscheinen (z.B. -9 wenn keine Option ausgewählt wurde) oder sollen die entsprechenden Zellen der Tabelle leer bleiben? Mittelwerte lassen sich in Excel einfacher berechnen, wenn fehlende Werte aus dem Datensatz entfernt werden.
Beschriftungen der Variablen einfügen
Wenn Sie diese Option aktivieren, dann fügt SoSci Survey unter der ersten Zeile mit den technischen Variablennamen (z.B. „AB01“) eine zweite Zeile mit den Beschriftungen dieser Variablen ein (z.B. „Lieblingsgetränk“). Die eigentlichen Daten folgen dann erst ab der dritten Zeile.

Hinweis: Mitunter erscheint beim Öffnen des Datensatzes ein Excel ein Hinweis, die Datei sei beschädigt. Wählen Sie die Option, dass Excel die Datei dennoch öffnen soll. Diese Warnung erscheint in manchen Excel-Versionen, in anderen nicht, und vor allem dann, wenn die Option „Beschriftungen der Variablen einfügen“ aktiviert wird. Die Daten werden unabhängig von der Warnung korrekt gespeichert.

CSV

CSV steht für „Character Separated Values“. Dabei werden die Werte einfach hintereinander in eine Textdatei geschrieben und durch ein vorgegebenes Zeichen (z.B. Komma, Semikolon oder Tabulator) getrennt. Eine CSV-Datei kann man auch in einem normalen Texteditor (Notepad++, SciTE oder Windows Notepad) öffnen, um den Inhalt zu kontrollieren. Allerdings kann man die Daten dort nicht weiter verarbeiten.

Beim CSV-Format handelt es sich um ein Standarformat, das nahezu jedes Tabellenkalkulations- oder Statistik-Programm öffnen kann. Der Nachteil dieses Formats ist, dass es keine Beschriftungen für Variablen oder Werte (Antwort-Codes) erlaubt – daher sollten Sie für die Auswertung in SPSS oder GNU R das jeweilige Format auswählen.

Sie können festlegen, welche Trennzeichen und welches Texterkennungszeichen in der CSV-Datei verwendet werden. Allerdings werden Sie diese Einstellung nur selten ändern müssen.

Die Option Lange Texteingaben kürzen stellt ein Relikt aus der Zeit dar, als SPSS 11.5 beim Import langer Texte abstürzte. Normalerweise sollten Sie diese Option nicht benötigen.

SPSS

Das kommerzielle Statistik-Paket erfreut sich einer gewissen Verbreitung. Daher bietet SoSci Survey die Möglichkeit, Daten direkt mit Beschriftungen (Labels) für SPSS aufzubereiten. Dabei kann man zwischen 2 Varianten wählen.

Komplett-Import aus einer Datei
Dies ist der komfortable Weg. SoSci Survey erzeugt dabei eine SPS-Datei (SPSS Syntax), die alle Variablen, Daten und Labels enthält. Allerdings kann es bei dieser Variante zu Problemen kommen, wenn man SPSS 16 (oder älter) verwendet und die Teilnehmer offene Fragen mit langen Texten beantwortet haben.
Normaler Import aus CSV-Datei
In dieser Variante müssen Sie zwei Dateien herunterladen: Den Datensatz als CSV-Datei und die Import-Syntax als SPSS-Syntax (SPS).

Wichtig: Laden Sie beim CSV-Import den Datensatz und die Import-Syntax stets gemeinsam herunter. Werden die beiden Dateien zu unterschiedlichen Zeitpunkten heruntergeladen, so passen sie eventuell nicht zusammen (z.B. weil neue Variablen hinzugefügt wurden oder weil einige Variablen beim ersten Mal mangels Daten noch nicht enthalten waren).

Datenimport in SPSS (komfortabel) – Standard
Datenimport in SPSS (via CSV) – falls der Standard-Import wg. überlanger Texte nicht funktioniert
Datenimport in SPSS (manuell aus CSV) – nicht empfohlen

Stata

Laden Sie für Stata Datensatz und Import-Script herunter. Anschließend können Sie mit dem Import-Script die CSV-Datei inklusive Variablenlabels importieren.

GNU R

Das quelloffene R Project for Statistical Computing darf man kostenlos nutzen, aber deshalb kann es noch lange nicht jeder verwenden. Diese Software unterstützt häufig die fortschrittlichsten statistischen Methoden, die Bedienung erfordert aber einen gewissen Lernaufwand.

Hinweis: R Base unterstützt nur eine Art von fehlenden Werten (NA). Die Differenzierung zwischen einer unbeantworteten Auswahlfrage und einem expliziten „weiß nicht“ geht je nach Einstellung bei Residualoptionen verloren.

Für den Import der Daten in GNU R müssen Sie zwei Dateien herunterladen. Ein Script für den Import und den Datensatz selbst als CSV-Datei. Bitte beachten Sie, dass die CSV-Datei etwas anders formatiert wird, wenn als Dateityp GNU R ausgewählt ist, als wenn CSV ausgewählt wurde.

Wichtig: Laden Sie den Datensatz und das Script stets gemeinsam herunter. Werden die beiden Dateien zu unterschiedlichen Zeitpunkten heruntergeladen, so passen sie eventuell nicht zusammen (z.B. weil neue Variablen hinzugefügt wurden oder weil einige Variablen beim ersten Mal mangels Daten noch nicht enthalten waren).

Datenimport in R

Alternativ können Sie den API-Import aktivieren. Sie erhalten dann eine Zeile R-Script, die Sie einfach in R oder RStudio ausführen, um die Daten zu importieren.

SQL

Falls Sie die erhobenen Daten in eine SQL-Datenbank importieren möchten, liefert SoSci Survey die entsprechenden SQL-Befehle. Die Beschriftungen für Variablen und Werte werden – soweit in SQL möglich – übernommen.

Weitere Einstellungen

Weiter unten finden Sie weitere Karteireiter. Hier können Sie festlegen, welche Datensätze und welche Variablen heruntergeladen werden.

Teildatensätze

Wenn Sie nur einen Teil der Daten abrufen möchten, dann wählen Sie bitte Erhobene Daten → Auswahlkriterien für gültige Fälle. Dort können Sie die Fälle anhand unterschiedlicher Kriterien filtern.

Hinweis: Sobald der Fragebogen im Feld ist, werden Interviews aus der Fragebogen-Entwicklung standardmäßig nicht mehr heruntergeladen (Sie können das unter Auswahlkriterien für gültige Fälle ändern). Ein Interview wird als „Fragebogen-Entwicklung“ erkannt, wenn direkt aus der Projekt-Verwaltung heraus aufgerufen wurde () oder wenn es im Pretest durchgeführt wurde.

Variablen-Auswahl

Verweildauer für jede Seite im Fragebogen herunterladen
SoSci Survey speichert, wie lange ein Teilnehmer für die Bearbeitung der einzelnen Seiten benötigt hat. Diese Variablen TIME_001 etc. werden standardmäßig heruntergeladen.
Erhobene Informationen zu Browser und Herkunft (Referer) herunterladen
hier geht es um Daten, die der Browser automatisch übermittelt. Bitte beachten Sie, dass diese Daten nur gespeichert werden, wenn Sie es unter Projekt-Einstellungen → Datenschutz explizit aktivieren.
Variablen herunterladen, die nicht im Fragebogen verwendet wurden
Standardmäßig tauchen im Datensatz nur die Variablen auf, für die mindestens eine Antwort vorliegt – in der Variablen-Übersicht sind diese Variablen in schwarzer Schrift aufgeführt. Es ist irrelevant, ob die Antwort aus der Fragebogen-Entwicklung oder den richtigen Interviews stammt. Aktivieren Sie diese Option, wenn Sie auch inaktive Variablen herunterladen möchten, z.B. weil Sie eine bestimmte, feste Datenstruktur benötigen.
Daten gelöschter Fragen und Items herunterladen
Wenn Sie eine Frage oder ein Item löschen, dann löschen Sie auch die entsprechende Variable. Die evtl. erhobenen Daten liegen zwar noch vor, aber SoSci Survey kann sie keiner Variable mehr zuordnen. Sollten Sie versehentlich eine Variabel gelöscht haben, aktivieren Sie diese Option, um die Daten dennoch herunterzuladen. Bitte beachten Sie, dass die Variablen einfach fortlaufend nummeriert werden – wenn Sie mehrere Variablen gelöscht haben, müssen Sie die Kennungen evtl. anhand der Daten erraten.

Sprache

In mehrsprachigen Befragungsprojekten können Sie auswählen, welche Sprache für die Beschriftung der Variablen bzw. Werte verwendet wird. Bitte beachten Sie, dass die Beschreibungen von Fragen nur in einer Sprache angegeben werden kann, während z.B. die Beschriftung von Auswahloptionen mit der Sprache variiert.

Datei herunterladen

Wenn Sie ein Dateiformat ausgewählt haben, finden Sie unten (je nach Format und Einstellungen) einen oder mehrere Knöpfe zum Herunterladen der Daten. Die Datei wird wie ein gewöhnlicher Download ausgeliefert – Sie sollten die Datei zunächst auf der Festplatte speichern und nicht direkt öffnen.

Wichtig: Nach dem Klick bereitet SoSci Survey die Datei zunächst intern auf. Bitte warten Sie, bis der Download startet (bei sehr großen Datensätzen kann das einige Minuten in Anspruch nehmen) und klicken Sie nicht erneut auf den Knopf, sonst dauert es noch länger.

Das Öffnen/Importieren der heruntergeladenen Daten wird in den weiter oben verlinkten Kapiteln erklärt.