Was sind die wichtigsten Eigenschaften eines Dataset?
Vor dem Beginn jeglicher Art der statistischen Analyse durchgeführt wird, das Verständnis der Natur der Daten analysiert werden, ist von wesentlicher Bedeutung. Sie können EDA verwenden, um die Eigenschaften eines Datensatzes zu identifizieren, die am besten geeigneten statistischen Methoden, um zu bestimmen, um die Daten zu übernehmen. Sie können verschiedene Arten von Eigenschaften mit EDA-Techniken zu untersuchen, einschließlich der folgenden:
Das Zentrum der Daten
Die Verbreitung unter den Mitgliedern der Daten
Die Schiefe des Daten
Die Wahrscheinlichkeitsverteilung der Daten folgt,
Die Korrelation zwischen den Elementen in dem Datensatz
Ob die Parameter der Daten über die Zeit konstant
Das Vorhandensein von Ausreißern in den Daten
Eine weitere zentrale Frage EDA beantwortet ist "Hat die Daten auf unseren Annahmen entsprechen?" Die Ermittlung der Eigenschaften eines Datensatzes ist sehr wichtig, weil viele statistische Verfahren empfindlich auf den Annahmen, die Sie über die Daten zu machen.