Wie Numerische Daten für Biostatistik aufzeichnen
Für numerische Daten, ist die wichtigste Frage, wie viel Präzision zu erfassen. Aufzeichnen einer numerischen Variablen, um so viele Dezimalstellen wie Sie zur Verfügung haben, ist in der Regel am besten.
Wenn beispielsweise eine Skala, Körpergewicht auf den nächsten 1/10 eines Kilogramm messen, aufzeichnen in der Datenbank zu diesem Grad an Präzision. Sie können runden es immer später zum nächsten Kilogramm ab, wenn Sie wollen, aber man kann nie "unrunde" eine Zahl zu erholen Ziffern, die Sie nicht in erster Linie notiert haben.
Aber nicht über Bord gehen in diese Richtung - nicht aufzeichnen einen Body-Mass-Index der Person (BMI) als 28,648832 kg / qm, auch wenn Ihr Rechner das Ergebnis so lächerliche Präzision hergestellt.
In die gleiche Richtung, nicht Gruppe numerische Daten in Intervalle bei der Aufzeichnung. Wenn Sie eine Person, die Alter in Jahren wissen, notieren Sie es dann als die tatsächliche Anzahl der Jahre- notieren Sie es nicht in 10-Jahres-Intervallen (0 bis 9, 10 bis 19, und so weiter). Sie können jederzeit der Computer später diese Art von Intervall-Gruppierung zu tun haben, aber man kann nie das Alter in Jahren erholen, wenn alles, was Sie das Jahrzehnt aufgezeichnet war.
Einige Programme können Sie wählen zwischen mehreren Arten von innen, die die Anzahl in den Computer ein. Das Programm kann auf diese unterschiedlichen verweisen Speichermodi mit obskuren Begriffe wie kurz, lang oder sehr lange ganze Zahlen (Ganze Zahlen) oder mit einfacher Genauigkeit (Kurz) oder Doppelte Genauigkeit (lange) Gleitkomma (Fraktionierten) Zahlen. Jeder Typ hat seine eigenen Grenzen, die von einem Programm zum anderen oder von einer Art von Computer zu einem anderen variieren kann.
Zum Beispiel könnte eine kurze ganze Zahl nur in der Lage ganze Zahlen im Bereich von -32.768 bis 32.767, während ein doppelter Genauigkeit Gleitkommazahlen einfacher darstellen könnte eine Zahl wie 1,23456789012345 x 10 handhaben250.
In den alten Tagen konnte die vernünftige Wahl des Speichermodus für Ihre Variablen kleinere Dateien erzeugen und das Programm der Arbeit mit mehreren Fächern oder mehr Variablen lassen. Heutzutage Lagerung ist viel weniger ein Problem, als es früher, so Pfennige kneifen diese Weise bietet wenig Nutzen.
Gehen Sie für die meisten allgemeinen numerische Darstellung zur Verfügung - in der Regel mit doppelter Genauigkeit Gleitkomma, die fast jede Zahl darstellen können Sie jemals in Ihrer Forschung begegnen.
Hier sind ein paar Dinge zu beachten, wenn numerische Daten in Excel eingeben:
Sind zwei Zahlen nicht (wie beispielsweise ein Blutdruckmesswert von 135/85 mmHg) in einer Spalte von Daten gesetzt. Excel wird nicht darüber beschweren, aber es wird es als Text behandeln, weil der eingebetteten "/" und nicht als numerische Daten. Erstellen Sie stattdessen zwei getrennte Variablen - wie den systolischen und diastolischen Druck (vielleicht genannt BPS für Blutdruck systolisch und BPD für Blutdruck diastolisch) - Und jede Zahl in der entsprechenden Variable eingeben.
In einer geburtshilflichen Datenbank, geben Sie nicht 6w2d für einen Gestationsdiabetes Alter von 6 Wochen und 2 Tage- noch schlimmer, geben Sie es nicht als 6.2, die der Computer würde als 6,2 Wochen interpretieren. Entweder geben Sie es als 44 Tage oder zwei Variablen zu erstellen (vielleicht glotzt für Schwangerschaftsalter Wochen und GAdays für Gestationsalter Tage), Um die Werte zu halten 6 und 2, beziehungsweise.
Der Computer kann sie leicht kombinieren später in die Anzahl der Tage oder die Anzahl der Wochen (und Fraktionen von einer Woche).
Es gibt eine wichtige Ausnahme von dieser "do stopfen nicht zwei Dinge in eine Spalte" Regel - Wenn Sie sowohl das Datum und die Uhrzeit eines einzelnen Ereignisses aufnehmen (wie "geboren am 15. Februar 2006 um 8:56 am Abend" ), dann Sie sollte bespielen, die sowohl das Datum und die Zeit als eine einzelne Variable! Siehe den Artikel über Eingabe von Datum und Uhrzeit Daten für weitere Details.
numerische Daten Fehlende erfordert ein wenig mehr Gedanken als kategorische Daten fehlt. Einige Forscher verwenden 99 (oder 999 oder 9999) einen fehlenden Wert anzuzeigen. Wenn Sie diese Technik verwenden, müssen Sie sicherstellen, dass alle Ihre Analysen, diese Werte zu ignorieren. Glücklicherweise ausschließen viele Statistikprogramme können Sie festlegen, was die fehlende Wertindikator für jede Variable ist, und die Programme, diese Werte aus allen Analysen.
Aber können Sie wirklich sicher sein, werden Sie nie haben, dass Wert auf, als einen realen Wert für einige sehr untypisch Thema Pop? (Einige Leute sind zu 99 Jahre alt, und einige Leute kann haben einen Blutzuckerwert von 999 mg / dl). Einfach die Zelle leer lassen können Best- fast alle Programme leere Zellen als fehlende Daten behandeln und sie in den Berechnungen ignorieren.