Wie mache ich mit Datum und Zeitdaten für Biostatistik

Wenn Sie numerische Daten in den Computer eingeben, Don't kombinieren zwei Zahlen in einer einzigen Variablen (wie 145/85 für den systolischen und diastolischen Blutdruck). Wenn es um die Termine und Zeiten kommt, aber genau das Gegenteil ist wahr!

Die meisten statistischen Software kann Daten und Zeiten als einzelne Variable darstellen (ein "instant" auf einer kontinuierlichen Timeline), so nutzen, dass, wenn Sie können - das Datum und die Zeit als eine Variable eingeben (zum Beispiel 2010.07.15 08 : 23), nicht als eine Datumsvariable und einer Zeitvariablen.

Diese Methode ist besonders nützlich, wenn mit Ereignissen zu tun, die sich über ein kurzes Zeitintervall nehmen (wie Ereignisse während der Wehen und der Geburt auftretenden).

Die meisten statistischen Programme speichern Datum und Zeit intern als eine Anzahl, die Anzahl der Tage (und Fraktionen von Tagen) ab einer beliebigen Angabe von "Nulldatum". Hier sind die Nulldaten für ein paar gemeinsame Programme:

  • Excel: Mitternacht zu Beginn des 31. Dezember 1899 (dies ist auch das früheste Datum, Excel speichern können). So 21. November 2012, um 18.00 Uhr, wird intern als 41,234.75 gespeichert (die .75 ist da 06.00 3/4 des Weges durch diesen Tag ist).

  • SPSS: 14. Oktober 1582 (dem Datum der Gregorianische Kalender angenommen wurde den julianischen Kalender zu ersetzen).

  • SAS: 1960.01.01 (a völlig willkürlich Datum).

Einige Programme können gespeichert werden Datum und Uhrzeit als Julian Datum, deren Null am Mittag aufgetreten, Greenwich Mean Time, am 1. Januar 4713 vor Christus. (Nichts Besonderes geschah an diesem Datum- 'wurde ursprünglich gewählt rein numerische Komfort.)

Was ist, wenn Sie nicht wissen, der Tag des Monats? Dies geschieht viel mit der medizinischen Geschichte Items- Sie so etwas wie: "Ich habe die Grippe im September 2004" hören Die meisten Software besteht darauf, dass eine Datumsvariable ein vollständiges Datum und wird nicht nur einen Monat und ein Jahr übernehmen.

In diesem Fall kann ein Argument für die Einstellung des Tages bis 15 (etwa Mitte Monat) durchgeführt werden, mit der Begründung, dass der Fehler gleich wahrscheinlich ist auf jeder Seite zu sein, und neigt daher dazu, aufzuheben, im Durchschnitt. In ähnlicher Weise, wenn sowohl der Monat und Tag fehlen, können Sie sie bis 30. Juni oder Juli Satz 1 (Jahresmitte) die gleiche Art von durchschnittlichen Fehlerunterdrückungs zu erreichen.

Wenn nur einige Datensätze Teildaten haben, können Sie eine weitere Variable zu erstellen, um anzuzeigen, ob das Datum abgeschlossen ist oder teilweise, so kann Ihnen sagen, wenn Sie benötigen, ob 2004.09.15 wirklich Mittel 15 September 2004 oder September 2004.

Völlig sollten fehlende Termine in der Regel nur blank- meisten statistischen Software behandelt leere Zellen als fehlende Daten überlassen werden.

Aufgrund der Art, die meisten Statistik-Programme Daten und Zeiten zu speichern, können sie leicht Intervalle zwischen zwei beliebigen Punkten in der Zeit von berechnen, was "Kalender Arithmetik" genannt wird, die Sie als einfache Subtraktion hinweisen. So ist es in der Regel einfacher und sicherer zu geben Daten und Zeiten und lassen Sie den Computer, die Intervalle zwischen ihnen zu berechnen als die Intervalle selbst zu berechnen.

Zum Beispiel, wenn Sie Variablen Geburtsdatum erstellen (DOB) Und einen Besuchstermin (VisDtin Excel), können Sie oft haben berechnen Excel eine sehr genaue Alter zum Zeitpunkt des Besuchs mit dieser einfachen Formel:

Alter = (VisDt - DOB) /365.25

In ähnlicher Weise in Krebsstudien, können Sie einfach und genau berechnen Abständen von der Diagnose oder Behandlung bis zur Remission und ein erneutes Auftreten sowie Gesamtüberlebenszeit, von den Daten der entsprechenden Ereignisse.

Menü