Wie ein Data Dictionary zu erstellen Ihre Biostatistik Daten zu beschreiben

Jede Forschungsdatenbank, ob groß oder klein, einfach oder kompliziert ist, sollten durch ein begleitet werden Datenwörterbuch dass beschreibt die Variablen in der Datenbank enthalten sind. Es wird von unschätzbarem Wert sein, wenn die Person, die die Datenbank erstellt hat nicht mehr da ist. Ein Datenwörterbuch ist, selbst eine Datendatei, einen Datensatz für jede Variable in der Datenbank enthalten.

Für jede Variable, das Wörterbuch sollten die meisten der folgenden Informationen enthalten (manchmal bezeichnet als Metadaten, was bedeutet, "Daten über Daten"):

  • Eine kurze Variablennamen (In der Regel nicht mehr als acht oder zehn Zeichen), die verwendet wird, wenn die Software zu sagen, was Variablen, die Sie wollen, dass es in einer Analyse zu verwenden,

  • Eine längere verbale Beschreibung der Variablen (Bis zu 50 oder 100 Zeichen)

  • Die Art der Daten (Text, kategorisch, numerisch, Datum / Zeit, und so weiter)

  • Wenn numerische: Informationen darüber, wie diese Zahl angezeigt wird (wie viele Stellen vor und nach dem Komma)

  • Wenn Datum / Zeit: Wie es formatiert (zB 12/25/13 22.50 oder 25Dec2013 22.50)

  • Wenn kategorisch: Was die zulässigen Kategorien

  • Wie fehlende Werte vertreten in der Datenbank (99, 999, "NA", usw.)

  • Viele statistische Pakete ermöglichen (oder erfordern) Sie diese Informationen angeben, wenn Sie die Datei trotzdem erstellen, damit sie für Sie automatisch die Datenwörterbuch zu generieren.

    Aber Excel können Sie alles überall eingeben, ohne formal Variablen definieren, so müssen Sie das Wörterbuch selbst zu erstellen (vielleicht als ein weiteres Arbeitsblatt - die Sie anrufen können "Data Dictionary" - in der gleichen Excel-Datei, die die Daten hat, so dass die Daten Wörterbuch bleibt immer mit den Daten).

    Menü