Python für Data Science For Dummies

Entwickler überall machen Fehler manchmal. Allerdings könnten Sie in der Lage sein, etwas Zeit zu sparen und arbeiten, wenn Sie über die häufigsten Arten von Programmierfehlern wissen, dass die Menschen mit Python machen. Die folgende Liste zeigt Ihnen über diese häufige Fehler:

  • Nachdem die falsche Einzug: Viele Python-Funktionen stützen sich auf Einzug. Zum Beispiel, wenn Sie eine neue Klasse zu erstellen, alles in dieser Klasse ist unter der Klassendeklaration eingerückt. Das gleiche gilt für die Entscheidung, Schleife, und andere strukturelle Aussagen. Wenn Sie feststellen, dass Ihr Code eine Aufgabe ausgeführt wird, wenn es wirklich nicht, starten Sie den Einzug bewerten Sie verwenden.

  • Mit der Zuweisung anstelle des Gleichheitsoperator: Wenn ein Vergleich zwischen zwei Objekten oder Wert ausführen, verwenden Sie nur den Gleichheitsoperator (==), nicht mit dem Zuweisungsoperator (=). Der Zuweisungsoperator legt ein Objekt oder einen Wert innerhalb eines variablen und nichts zu vergleichen.

  • Putting Funktionsaufrufe in der falschen Reihenfolge, wenn komplexe Aussagen zu erstellen: Python führt immer Funktionen von links nach rechts. So die Aussage MyString.strip (). Zentrum (21, "*") erzeugt ein anderes Ergebnis als MyString.center (21, "*"). Streifen (). bei dem, wenn eine Situation eintreten, ist die Ausgabe einer Reihe von verketteten Funktionen unterschiedlich von dem, was Sie erwartet haben, müssen Sie Funktion, um sicherzustellen, um zu überprüfen, dass jede Funktion an der richtigen Stelle ist.

  • Misplacing Zeichensetzung: Es ist möglich, Zeichensetzung an der falschen Stelle zu setzen und ein ganz anderes Ergebnis erzeugen. Denken Sie daran, dass Sie einen Doppelpunkt am Ende eines jeden strukturellen Erklärung enthalten muss. Zusätzlich Klammern Platzierung kritisch ist. Beispielsweise, (1 + 2) · (3 + 4), 1 + ((2 * 3) + 4), und 1 + (2 * (3 + 4)) alle zu unterschiedlichen Ergebnissen führen.

  • Die Verwendung einer falschen logischen Operator: Die meisten der Betreiber nicht vorhanden Entwickler mit Problemen, aber die logischen Operatoren tun. Denken Sie daran, zu verwenden, und beide Operanden zu bestimmen, wann sein müssen Wahr und oder wenn einer der Operanden kann Wahr.

  • Erstellen von Count-by-one-Fehler auf Schleifen: Denken Sie daran, dass eine Schleife nicht die letzte Zahl, die Sie in einem Bereich angeben zählt. Also, wenn Sie den Bereich angeben [01.11], erhalten Sie tatsächlich ausgegeben für Werte zwischen 1 und 10.

  • Nachdem die falsche Großschreibung: Python ist empfindlich Fall, so EigeneVar unterscheidet sich von myvar und MYVAR. Immer Kapitalisierung überprüfen, wenn Sie feststellen, dass Sie keinen Wert zugreifen können Sie für den Zugriff zu erwarten.

  • Rechtschreibung etwas falsch: Selbst erfahrene Entwickler leiden an Rechtschreibfehler zu Zeiten. Um sicherzustellen, dass Sie einen gemeinsamen Ansatz für die Namensgebung Variablen verwenden, Klassen und Funktionen hilft. Aber auch eine konsistente Namens nicht immer verhindern, dass Sie die Eingabe MyVer, wenn Sie EigeneVar eingeben soll.

Linie Plotstilen

Jedes Mal, wenn Sie ein Grundstück in Python zu erstellen, müssen Sie die Informationsquellen zu identifizieren, mehr als nur die Linien. Erstellen einer Handlung, die unterschiedliche Linientypen und Datenpunktsymbole benutzt, macht die Handlung viel einfacher, für andere Menschen zu verwenden. Die folgende Tabelle listet die Linie Plotstilen.

FarbeMarkerStil
CodeLinienfarbeCodeMarker StilCodeLinienstil
bblau.Punkt-Solide
GgrünOKreis:Gepunktete
rrotxx-Marke-.dash dot
cCyan+Plus--Eine gestrichelte
mMagenta*Star(keiner)keine Linie
ygelbsPlatz
kschwarzdDiamant
wWeißvdrehtes Dreieck
^up Dreieck
lt;linke Dreieck
>rechtwinkliges Dreieck
p5-Punkt-Stern
h6-Punkt-Stern

Denken Sie daran, dass Sie auch diese Stile mit anderen Arten von Plots verwenden können. Zum Beispiel kann ein Streudiagramm diese Stile verwenden jeder der Datenpunkte zu definieren. Wenn Sie Zweifel haben, versuchen Sie die Stile, um zu sehen, ob sie mit Ihrem speziellen Grundstück arbeiten werde.

Gemeinsame IPython Magische Funktionen

Es ist eine Art erstaunlich, zu denken, dass IPython Sie mit Magie liefert, aber das ist genau das, was Sie mit den magischen Funktionen erhalten. Eine magische Funktion beginnt entweder mit einem% oder %% Zeichen. Diejenigen mit einem% Zeichen Arbeit innerhalb der Umgebung, und solche mit einem %% Zeichen Arbeit auf der Zellebene.

Die folgende Liste gibt Ihnen ein paar der häufigsten magischen Funktionen und ihren Zweck. Zur Erzielung einer vollständigen Liste, geben Sie % QuickRef Geben Sie ein und drücken Sie in der IPython Konsole oder überprüfen Sie die vollständige Liste.

Magie-FunktionTyp Allein Bietet Status?Beschreibung
%% timeit NeinBerechnet den besten Zeitverhalten für alle instructionsin eine Zelle, abgesehen von dem platziert eine auf der gleichen Zellinie wie thecell magic (die daher eine initializationinstruction sein könnte).
%% Write-DateiNeinSchreibt den Inhalt einer Zelle zu der angegebenen Datei.
%aliasjaOrdnet oder zeigt einen Alias ​​für einen Systembefehl.
% AutocalljaMacht es möglich, Funktionen aufzurufen, ohne theparentheses einschließlich. Die Einstellungen sind Off, Smart (Standard) und Full. TheSmart Einstellung gilt die Klammern nur, wenn Sie mit dem Anruf anArgument umfassen.
% AutomagicjaMacht es möglich, die Linie magischen Funktionen withoutincluding das% -Zeichen zu nennen. Die Einstellungen sind False (Standard) andTrue.
%CDjaÄndert Verzeichnis an einen neuen Speicherort. Sie können usethis auch Befehl durch die Verzeichnis Geschichte zu bewegen oder zu changedirectories zu einem Lesezeichen.
% clsNeinLöscht den Bildschirm.
% FarbenNeinGibt die verwendeten Farben zugeordneten Text withprompts angezeigt werden, das Informationssystem und Exception-Handler. Sie canchoose zwischen nocolor (schwarz und weiß), Linux (Standard), andLightBG.
% ConfigjaMacht es möglich, IPython zu konfigurieren.
% dhistjaZeigt eine Liste der Verzeichnisse während der currentsession besucht.
%Datei NeinGibt den Namen der Datei, die den Quellcode Forthe Objekt enthält.
% histjaZeigt eine Liste der Magie Funktionsbefehle während Die Strom Sitzung ausgegeben.
% install_extNeinInstalliert die angegebene Erweiterung.
%BelastungNeinLasten Anwendungscode aus einer anderen Quelle, beispielsweise einem onlineexample.
% load_extNeinLädt eine Python-Erweiterung sein Modulnamen.
% lsmagicjaZeigt eine Liste der aktuell verfügbaren magicfunctions.
% matplotlibjaLegt den Back-End-Prozessor für Plots verwendet. die inlinevalue Verwendung zeigt das Grundstück innerhalb der Zelle für eine IPython Notebookfile. Die möglichen Werte sind: gtk ',' gtk3 ',' inline ',' nbagg ',' osx ',' qt ',' qt4 ',' QT5 ',' tk 'und' wx '.
%PasteNeinFügt den Inhalt der Zwischenablage in die IPythonenvironment.
% pdefNeinZeigt an, wie das Objekt zu nennen (unter der Annahme, dass das Objekt iscallable).
% PDOCNeinZeigt die docstring für ein Objekt.
% pinfo NeinZeigt detaillierte Informationen über das Objekt (oft mehr thanprovided mit Hilfe allein).
% pinfo2 NeinZeigt zusätzliche detaillierte Informationen über das Objekt (whenavailable).
% reload_extNeinLädt eine zuvor installierte Erweiterung.
%Quelle NeinZeigt den Quellcode für das Objekt (unter der Annahme, dass thesource verfügbar ist).
% timeitNeinBerechnet die beste Leistung Zeit für einen Befehl.
% unaliasNeinEntfernt einen zuvor erstellten Aliasnamen aus der Liste.
% unload_extNeinWirft die angegebene Erweiterung.

Scikit-Learn Method Summary

Scikit-Learn ist ein Brennpunkt für die Daten Wissenschaft Arbeit mit Python, so lohnt es sich, die Methoden, die Sie am meisten wissen müssen. Die folgende Liste gibt Ihnen einen kurzen Überblick über die wichtigsten Methoden für die Datenanalyse verwendet.

  • feature_extraction.FeatureHasher

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Der Hashing-Trick, mit dem Sie eine große Anzahl von Funktionen in Ihrem Daten-Set aufnehmen

  • preprocessing.Binarizer

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Erstellen Sie Binärgrößen (Merkmalswerte zu 0 oder 1)

  • preprocessing.Imputer

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Fehlende Angaben Anrechnungs

  • preprocessing.MinMaxScaler

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Erstellen Sie Variablen gebunden durch einen Minimal- und Maximalwert

  • preprocessing.OneHotEncoder

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Trans kategorische integer Funktionen in binäre Einsen

  • preprocessing.StandardScaler

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Variable Standardisierung durch die mittlere Entfernung und Skalierung auf Einheitsvarianz

  • feature_extraction.text.CountVectorizer

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Konvertieren von Textdokumenten in eine Matrix von Zähldaten

  • feature_extraction.text.HashingVectorizer

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Direkt konvertieren Ihren Text den Hashing-Trick

  • feature_extraction.text.TfidfVectorizer

    Verwendung: Vorbereiten Ihrer Daten

    Beschreibung: Erstellt einen Datensatz von TF-IDF-Funktionen.

  • feature_selection.RFECV

    Verwendung: Die Featureauswahl

    Beschreibung: Automatische Feature-Auswahl

  • decomposition.PCA

    Verwendung: Dimensionalitätsreduktion

    Beschreibung: Hauptkomponentenanalyse (PCA)

  • decomposition.RandomizedPCA

    Verwendung: Dimensionalitätsreduktion

    Beschreibung: Hauptkomponentenanalyse (PCA) randomisiert SVD mit

  • cross_validation.cross_val_score

    Verwendung: Kreuzvalidierungsphase

    Beschreibung: Schätzen Sie die Kreuzvalidierung Punktzahl

  • cross_validation.KFold

    Verwendung: Kreuzvalidierungsphase

    Beschreibung: Teilen Sie die Datenmenge in den k Falten für Kreuzvalidierung

  • cross_validation.StratifiedKFold

    Verwendung: Kreuzvalidierungsphase

    Beschreibung: Stratifizierte Validierung, die die Verteilung der Klassen berücksichtigt man vorhersagen

  • cross_validation.train_test_split

    Verwendung: Kreuzvalidierungsphase

    Beschreibung: Teilen Sie Ihre Daten in Trainings- und Testsets

  • grid_search.GridSearchCV

    Verwendung: Optimierung

    Beschreibung: Erschöpfende Suche, um eine Maschine Lernalgorithmus zu maximieren

  • linear_model.LinearRegression

    Verwendung: Prognose

    Beschreibung: Lineare Regression

  • linear_model.LogisticRegression

    Verwendung: Prognose

    Beschreibung: Linear logistische Regression

  • neighbors.KNeighborsClassifier

    Verwendung: Prognose

    Beschreibung: K-Nachbarn Klassifikation

  • naive_bayes.MultinomialNB

    Verwendung: Prognose

    Beschreibung: Multinomiale Na # 239-ve Bayes

  • metrics.accuracy_score

    Verwendung: Lösung Auswertung

    Beschreibung: Genauigkeitsklasse-Score.

  • metrics.f1_score

    Verwendung: Lösung Auswertung

    Beschreibung: Berechnen Sie die F1-Score, Auswuchtgenauigkeit und Rückruf

  • metrics.mean_absolute_error

    Verwendung: Lösung Auswertung

    Beschreibung: Die mittlere absolute Fehler Regressionsfehler

  • metrics.mean_squared_error

    Verwendung: Lösung Auswertung

    Beschreibung: Mittlere quadratische Fehler Regressionsfehler

  • metrics.roc_auc_score

    Verwendung: Lösung Auswertung

    Beschreibung: Berechnen Sie Fläche unter der Kurve (AUC) von Vorhersage-Scores

Menü