Um die erhobenen Daten als Datensatz herunterzuladen, wählen Sie im Menü Erhobene Daten → Daten herunterladen. SoSci Survey liefert Ihnen die Rohdaten aus der Befragung: Sie bekommen eine Tabelle mit einer Zeile pro ausgefülltem Fragebogen und einer Spalte pro Variable.
Sie können die Daten jederzeit (auch während die Erhebung noch läuft und auch mehrfach) als Backup oder für erste Auswertungen herunterladen. Die gespeicherten Daten auf dem Server werden beim Herunterladen weder gelöscht noch verändert. Mit der Funktion Erhobene Daten → Daten ansehen können Sie auch direkt online einen Blick in die Daten werfen.
Falls Sie beim Herunterladen/Öffnen der Daten auf Probleme stoßen, folgen Sie bitte der Anleitung Problemlösungen beim Datenabruf.
Wichtig: Es ist wahrscheinlich, dass Sie irgendwann die Originaldaten benötigen – so wie Sie sie vom Befragungsserver heruntergeladen haben (etwa zur Dokumentation oder weil in einem unaufmerksamen Moment eine wichtige Variable überschrieben wurde). Speichern Sie die Original-Daten deshalb zeitnah auf einer CD und bewahren Sie diese an einem sicheren Ort auf. Erstellen Sie anschließend eine Arbeitskopie der Originaldatei und arbeiten Sie nur mit dieser Kopie. Nehmen Sie niemals Änderungen an der Originaldatei vor.
Hinweis: Für jeden, der den Fragebogen aufruft, wird eine Interview-Nummer (CASE) ermittelt. Wenn ein Besucher sich entschließt, den Fragebogen gleich wieder zu verlassen, entsteht ein „leeres Interview“, das SoSci Survey standardmäßig löscht (unter Projekt-Einstellungen → Datenschutz können Sie das ändern). Die Nummerierung der Fälle im Datensatz ist daher i.d.R. nicht fortlaufend, sondern hat Löcher. Auch Fragebogen-Aufrufe während der Entwicklung erhalten eine Nummer. Die Nummer des ersten „richtigen“ Interviews ist daher i.d.R. nicht 1.
Der Schwerpunkt von SoSci Survey ist die Erhebung von Daten, für die statistisch Auswertung gibt es geeignete Spezialsoftware. Auf dem Pro-Server s2survey.net steht Ihnen eine deskriptive Datenauswertung zur Verfügung. Bei Verwendung des Standardservers und für komplexere Auswertungen (z.B. induktive Statistik und multivariate Verfahren) bemühen Sie bitte ein geeignetes Programm.
Als erstes wählen Sie das Dateiformat aus. Klicken Sie dazu auf den entsprechenden Karteireiter.
Für Excel (Dateiformat XLSX) können Sie den Datensatz herunterladen, und ein Codebuch, welches alle Variablen und deren Ausprägungen listet. Für den Datensatz können Sie folgende Optionen einstellen:
Hinweis: Mitunter erscheint beim Öffnen des Datensatzes ein Excel ein Hinweis, die Datei sei beschädigt. Wählen Sie die Option, dass Excel die Datei dennoch öffnen soll. Diese Warnung erscheint in manchen Excel-Versionen, in anderen nicht, und vor allem dann, wenn die Option „Beschriftungen der Variablen einfügen“ aktiviert wird. Die Daten werden unabhängig von der Warnung korrekt gespeichert.
CSV steht für „Character Separated Values“. Dabei werden die Werte einfach hintereinander in eine Textdatei geschrieben und durch ein vorgegebenes Zeichen (z.B. Komma, Semikolon oder Tabulator) getrennt. Eine CSV-Datei kann man auch in einem normalen Texteditor (Notepad++, SciTE oder Windows Notepad) öffnen, um den Inhalt zu kontrollieren. Allerdings kann man die Daten dort nicht weiter verarbeiten.
Beim CSV-Format handelt es sich um ein Standarformat, das nahezu jedes Tabellenkalkulations- oder Statistik-Programm öffnen kann. Der Nachteil dieses Formats ist, dass es keine Beschriftungen für Variablen oder Werte (Antwort-Codes) erlaubt – daher sollten Sie für die Auswertung in SPSS oder GNU R das jeweilige Format auswählen.
Sie können festlegen, welche Trennzeichen und welches Texterkennungszeichen in der CSV-Datei verwendet werden. Allerdings werden Sie diese Einstellung nur selten ändern müssen.
Die Option Lange Texteingaben kürzen stellt ein Relikt aus der Zeit dar, als SPSS 11.5 beim Import langer Texte abstürzte. Normalerweise sollten Sie diese Option nicht benötigen.
Das kommerzielle Statistik-Paket erfreut sich einer gewissen Verbreitung. Daher bietet SoSci Survey die Möglichkeit, Daten direkt mit Beschriftungen (Labels) für SPSS aufzubereiten. Dabei kann man zwischen 2 Varianten wählen.
Wichtig: Laden Sie beim CSV-Import den Datensatz und die Import-Syntax stets gemeinsam herunter. Werden die beiden Dateien zu unterschiedlichen Zeitpunkten heruntergeladen, so passen sie eventuell nicht zusammen (z.B. weil neue Variablen hinzugefügt wurden oder weil einige Variablen beim ersten Mal mangels Daten noch nicht enthalten waren).
Laden Sie für Stata Datensatz und Import-Script herunter. Anschließend können Sie mit dem Import-Script die CSV-Datei inklusive Variablenlabels importieren.
Das quelloffene R Project for Statistical Computing darf man kostenlos nutzen, aber deshalb kann es noch lange nicht jeder verwenden. Diese Software unterstützt häufig die fortschrittlichsten statistischen Methoden, die Bedienung erfordert aber einen gewissen Lernaufwand.
Hinweis: R Base unterstützt nur eine Art von fehlenden Werten (NA
). Die Differenzierung zwischen einer unbeantworteten Auswahlfrage und einem expliziten „weiß nicht“ geht je nach Einstellung bei Residualoptionen verloren.
Für den Import der Daten in GNU R müssen Sie zwei Dateien herunterladen. Ein Script für den Import und den Datensatz selbst als CSV-Datei. Bitte beachten Sie, dass die CSV-Datei etwas anders formatiert wird, wenn als Dateityp GNU R ausgewählt ist, als wenn CSV ausgewählt wurde.
Wichtig: Laden Sie den Datensatz und das Script stets gemeinsam herunter. Werden die beiden Dateien zu unterschiedlichen Zeitpunkten heruntergeladen, so passen sie eventuell nicht zusammen (z.B. weil neue Variablen hinzugefügt wurden oder weil einige Variablen beim ersten Mal mangels Daten noch nicht enthalten waren).
Alternativ können Sie den API-Import aktivieren. Sie erhalten dann eine Zeile R-Script, die Sie einfach in R oder RStudio ausführen, um die Daten zu importieren.
Falls Sie die erhobenen Daten in eine SQL-Datenbank importieren möchten, liefert SoSci Survey die entsprechenden SQL-Befehle. Die Beschriftungen für Variablen und Werte werden – soweit in SQL möglich – übernommen.
Weiter unten finden Sie weitere Karteireiter. Hier können Sie festlegen, welche Datensätze und welche Variablen heruntergeladen werden.
Wenn Sie nur einen Teil der Daten abrufen möchten, dann wählen Sie bitte Erhobene Daten → Auswahlkriterien für gültige Fälle. Dort können Sie die Fälle anhand unterschiedlicher Kriterien filtern.
Hinweis: Sobald der Fragebogen im Feld ist, werden Interviews aus der Fragebogen-Entwicklung standardmäßig nicht mehr heruntergeladen (Sie können das unter Auswahlkriterien für gültige Fälle ändern). Ein Interview wird als „Fragebogen-Entwicklung“ erkannt, wenn direkt aus der Projekt-Verwaltung heraus aufgerufen wurde () oder wenn es im Pretest durchgeführt wurde.
TIME_001
etc. werden standardmäßig heruntergeladen.In mehrsprachigen Befragungsprojekten können Sie auswählen, welche Sprache für die Beschriftung der Variablen bzw. Werte verwendet wird. Bitte beachten Sie, dass die Beschreibungen von Fragen nur in einer Sprache angegeben werden kann, während z.B. die Beschriftung von Auswahloptionen mit der Sprache variiert.
Wenn Sie ein Dateiformat ausgewählt haben, finden Sie unten (je nach Format und Einstellungen) einen oder mehrere Knöpfe zum Herunterladen der Daten. Die Datei wird wie ein gewöhnlicher Download ausgeliefert – Sie sollten die Datei zunächst auf der Festplatte speichern und nicht direkt öffnen.
Wichtig: Nach dem Klick bereitet SoSci Survey die Datei zunächst intern auf. Bitte warten Sie, bis der Download startet (bei sehr großen Datensätzen kann das einige Minuten in Anspruch nehmen) und klicken Sie nicht erneut auf den Knopf, sonst dauert es noch länger.
Das Öffnen/Importieren der heruntergeladenen Daten wird in den weiter oben verlinkten Kapiteln erklärt.