Was sind die wichtigsten Eigenschaften eines Dataset?

Vor dem Beginn jeglicher Art der statistischen Analyse durchgeführt wird, das Verständnis der Natur der Daten analysiert werden, ist von wesentlicher Bedeutung. Sie können EDA verwenden, um die Eigenschaften eines Datensatzes zu identifizieren, die am besten geeigneten statistischen Methoden, um zu bestimmen, um die Daten zu übernehmen. Sie können verschiedene Arten von Eigenschaften mit EDA-Techniken zu untersuchen, einschließlich der folgenden:

  • Das Zentrum der Daten

  • Die Verbreitung unter den Mitgliedern der Daten

  • Die Schiefe des Daten

  • Die Wahrscheinlichkeitsverteilung der Daten folgt,

  • Die Korrelation zwischen den Elementen in dem Datensatz

  • Ob die Parameter der Daten über die Zeit konstant

  • Das Vorhandensein von Ausreißern in den Daten

Eine weitere zentrale Frage EDA beantwortet ist "Hat die Daten auf unseren Annahmen entsprechen?" Die Ermittlung der Eigenschaften eines Datensatzes ist sehr wichtig, weil viele statistische Verfahren empfindlich auf den Annahmen, die Sie über die Daten zu machen.

Menü