Python für Data Science For Dummies

Computer & Software / Programmierung / Python

Entwickler überall machen Fehler manchmal. Allerdings könnten Sie in der Lage sein, etwas Zeit zu sparen und arbeiten, wenn Sie über die häufigsten Arten von Programmierfehlern wissen, dass die Menschen mit Python machen. Die folgende Liste zeigt Ihnen über diese häufige Fehler:

Linie plotstilen
Gemeinsame ipython magische funktionen
Scikit-learn method summary

Nachdem die falsche Einzug: Viele Python-Funktionen stützen sich auf Einzug. Zum Beispiel, wenn Sie eine neue Klasse zu erstellen, alles in dieser Klasse ist unter der Klassendeklaration eingerückt. Das gleiche gilt für die Entscheidung, Schleife, und andere strukturelle Aussagen. Wenn Sie feststellen, dass Ihr Code eine Aufgabe ausgeführt wird, wenn es wirklich nicht, starten Sie den Einzug bewerten Sie verwenden.
Mit der Zuweisung anstelle des Gleichheitsoperator: Wenn ein Vergleich zwischen zwei Objekten oder Wert ausführen, verwenden Sie nur den Gleichheitsoperator (==), nicht mit dem Zuweisungsoperator (=). Der Zuweisungsoperator legt ein Objekt oder einen Wert innerhalb eines variablen und nichts zu vergleichen.
Putting Funktionsaufrufe in der falschen Reihenfolge, wenn komplexe Aussagen zu erstellen: Python führt immer Funktionen von links nach rechts. So die Aussage MyString.strip (). Zentrum (21, "*") erzeugt ein anderes Ergebnis als MyString.center (21, "*"). Streifen (). bei dem, wenn eine Situation eintreten, ist die Ausgabe einer Reihe von verketteten Funktionen unterschiedlich von dem, was Sie erwartet haben, müssen Sie Funktion, um sicherzustellen, um zu überprüfen, dass jede Funktion an der richtigen Stelle ist.
Misplacing Zeichensetzung: Es ist möglich, Zeichensetzung an der falschen Stelle zu setzen und ein ganz anderes Ergebnis erzeugen. Denken Sie daran, dass Sie einen Doppelpunkt am Ende eines jeden strukturellen Erklärung enthalten muss. Zusätzlich Klammern Platzierung kritisch ist. Beispielsweise, (1 + 2) · (3 + 4), 1 + ((2 * 3) + 4), und 1 + (2 * (3 + 4)) alle zu unterschiedlichen Ergebnissen führen.
Die Verwendung einer falschen logischen Operator: Die meisten der Betreiber nicht vorhanden Entwickler mit Problemen, aber die logischen Operatoren tun. Denken Sie daran, zu verwenden, und beide Operanden zu bestimmen, wann sein müssen Wahr und oder wenn einer der Operanden kann Wahr.
Erstellen von Count-by-one-Fehler auf Schleifen: Denken Sie daran, dass eine Schleife nicht die letzte Zahl, die Sie in einem Bereich angeben zählt. Also, wenn Sie den Bereich angeben [01.11], erhalten Sie tatsächlich ausgegeben für Werte zwischen 1 und 10.
Nachdem die falsche Großschreibung: Python ist empfindlich Fall, so EigeneVar unterscheidet sich von myvar und MYVAR. Immer Kapitalisierung überprüfen, wenn Sie feststellen, dass Sie keinen Wert zugreifen können Sie für den Zugriff zu erwarten.
Rechtschreibung etwas falsch: Selbst erfahrene Entwickler leiden an Rechtschreibfehler zu Zeiten. Um sicherzustellen, dass Sie einen gemeinsamen Ansatz für die Namensgebung Variablen verwenden, Klassen und Funktionen hilft. Aber auch eine konsistente Namens nicht immer verhindern, dass Sie die Eingabe MyVer, wenn Sie EigeneVar eingeben soll.

Linie Plotstilen

Jedes Mal, wenn Sie ein Grundstück in Python zu erstellen, müssen Sie die Informationsquellen zu identifizieren, mehr als nur die Linien. Erstellen einer Handlung, die unterschiedliche Linientypen und Datenpunktsymbole benutzt, macht die Handlung viel einfacher, für andere Menschen zu verwenden. Die folgende Tabelle listet die Linie Plotstilen.

Farbe	Marker	Stil
Code	Linienfarbe	Code	Marker Stil	Code	Linienstil
b	blau	.	Punkt	-	Solide
G	grün	O	Kreis	:	Gepunktete
r	rot	x	x-Marke	-.	dash dot
c	Cyan	+	Plus	--	Eine gestrichelte
m	Magenta	*	Star	(keiner)	keine Linie
y	gelb	s	Platz
k	schwarz	d	Diamant
w	Weiß	v	drehtes Dreieck
^	up Dreieck
lt;	linke Dreieck
>	rechtwinkliges Dreieck
p	5-Punkt-Stern
h	6-Punkt-Stern

Denken Sie daran, dass Sie auch diese Stile mit anderen Arten von Plots verwenden können. Zum Beispiel kann ein Streudiagramm diese Stile verwenden jeder der Datenpunkte zu definieren. Wenn Sie Zweifel haben, versuchen Sie die Stile, um zu sehen, ob sie mit Ihrem speziellen Grundstück arbeiten werde.

Gemeinsame IPython Magische Funktionen

Es ist eine Art erstaunlich, zu denken, dass IPython Sie mit Magie liefert, aber das ist genau das, was Sie mit den magischen Funktionen erhalten. Eine magische Funktion beginnt entweder mit einem% oder %% Zeichen. Diejenigen mit einem% Zeichen Arbeit innerhalb der Umgebung, und solche mit einem %% Zeichen Arbeit auf der Zellebene.

Die folgende Liste gibt Ihnen ein paar der häufigsten magischen Funktionen und ihren Zweck. Zur Erzielung einer vollständigen Liste, geben Sie % QuickRef Geben Sie ein und drücken Sie in der IPython Konsole oder überprüfen Sie die vollständige Liste.

Magie-Funktion	Typ Allein Bietet Status?	Beschreibung
%% timeit	Nein	Berechnet den besten Zeitverhalten für alle instructionsin eine Zelle, abgesehen von dem platziert eine auf der gleichen Zellinie wie thecell magic (die daher eine initializationinstruction sein könnte).
%% Write-Datei	Nein	Schreibt den Inhalt einer Zelle zu der angegebenen Datei.
%alias	ja	Ordnet oder zeigt einen Alias für einen Systembefehl.
% Autocall	ja	Macht es möglich, Funktionen aufzurufen, ohne theparentheses einschließlich. Die Einstellungen sind Off, Smart (Standard) und Full. TheSmart Einstellung gilt die Klammern nur, wenn Sie mit dem Anruf anArgument umfassen.
% Automagic	ja	Macht es möglich, die Linie magischen Funktionen withoutincluding das% -Zeichen zu nennen. Die Einstellungen sind False (Standard) andTrue.
%CD	ja	Ändert Verzeichnis an einen neuen Speicherort. Sie können usethis auch Befehl durch die Verzeichnis Geschichte zu bewegen oder zu changedirectories zu einem Lesezeichen.
% cls	Nein	Löscht den Bildschirm.
% Farben	Nein	Gibt die verwendeten Farben zugeordneten Text withprompts angezeigt werden, das Informationssystem und Exception-Handler. Sie canchoose zwischen nocolor (schwarz und weiß), Linux (Standard), andLightBG.
% Config	ja	Macht es möglich, IPython zu konfigurieren.
% dhist	ja	Zeigt eine Liste der Verzeichnisse während der currentsession besucht.
%Datei	Nein	Gibt den Namen der Datei, die den Quellcode Forthe Objekt enthält.
% hist	ja	Zeigt eine Liste der Magie Funktionsbefehle während Die Strom Sitzung ausgegeben.
% install_ext	Nein	Installiert die angegebene Erweiterung.
%Belastung	Nein	Lasten Anwendungscode aus einer anderen Quelle, beispielsweise einem onlineexample.
% load_ext	Nein	Lädt eine Python-Erweiterung sein Modulnamen.
% lsmagic	ja	Zeigt eine Liste der aktuell verfügbaren magicfunctions.
% matplotlib	ja	Legt den Back-End-Prozessor für Plots verwendet. die inlinevalue Verwendung zeigt das Grundstück innerhalb der Zelle für eine IPython Notebookfile. Die möglichen Werte sind: gtk ',' gtk3 ',' inline ',' nbagg ',' osx ',' qt ',' qt4 ',' QT5 ',' tk 'und' wx '.
%Paste	Nein	Fügt den Inhalt der Zwischenablage in die IPythonenvironment.
% pdef	Nein	Zeigt an, wie das Objekt zu nennen (unter der Annahme, dass das Objekt iscallable).
% PDOC	Nein	Zeigt die docstring für ein Objekt.
% pinfo	Nein	Zeigt detaillierte Informationen über das Objekt (oft mehr thanprovided mit Hilfe allein).
% pinfo2	Nein	Zeigt zusätzliche detaillierte Informationen über das Objekt (whenavailable).
% reload_ext	Nein	Lädt eine zuvor installierte Erweiterung.
%Quelle	Nein	Zeigt den Quellcode für das Objekt (unter der Annahme, dass thesource verfügbar ist).
% timeit	Nein	Berechnet die beste Leistung Zeit für einen Befehl.
% unalias	Nein	Entfernt einen zuvor erstellten Aliasnamen aus der Liste.
% unload_ext	Nein	Wirft die angegebene Erweiterung.

Scikit-Learn Method Summary

Scikit-Learn ist ein Brennpunkt für die Daten Wissenschaft Arbeit mit Python, so lohnt es sich, die Methoden, die Sie am meisten wissen müssen. Die folgende Liste gibt Ihnen einen kurzen Überblick über die wichtigsten Methoden für die Datenanalyse verwendet.

feature_extraction.FeatureHasher
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Der Hashing-Trick, mit dem Sie eine große Anzahl von Funktionen in Ihrem Daten-Set aufnehmen

preprocessing.Binarizer
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Erstellen Sie Binärgrößen (Merkmalswerte zu 0 oder 1)
preprocessing.Imputer
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Fehlende Angaben Anrechnungs
preprocessing.MinMaxScaler
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Erstellen Sie Variablen gebunden durch einen Minimal- und Maximalwert
preprocessing.OneHotEncoder
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Trans kategorische integer Funktionen in binäre Einsen
preprocessing.StandardScaler
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Variable Standardisierung durch die mittlere Entfernung und Skalierung auf Einheitsvarianz
feature_extraction.text.CountVectorizer
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Konvertieren von Textdokumenten in eine Matrix von Zähldaten
feature_extraction.text.HashingVectorizer
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Direkt konvertieren Ihren Text den Hashing-Trick
feature_extraction.text.TfidfVectorizer
Verwendung: Vorbereiten Ihrer Daten
Beschreibung: Erstellt einen Datensatz von TF-IDF-Funktionen.
feature_selection.RFECV
Verwendung: Die Featureauswahl
Beschreibung: Automatische Feature-Auswahl
decomposition.PCA
Verwendung: Dimensionalitätsreduktion
Beschreibung: Hauptkomponentenanalyse (PCA)
decomposition.RandomizedPCA
Verwendung: Dimensionalitätsreduktion
Beschreibung: Hauptkomponentenanalyse (PCA) randomisiert SVD mit
cross_validation.cross_val_score
Verwendung: Kreuzvalidierungsphase
Beschreibung: Schätzen Sie die Kreuzvalidierung Punktzahl
cross_validation.KFold
Verwendung: Kreuzvalidierungsphase
Beschreibung: Teilen Sie die Datenmenge in den k Falten für Kreuzvalidierung

cross_validation.StratifiedKFold
Verwendung: Kreuzvalidierungsphase
Beschreibung: Stratifizierte Validierung, die die Verteilung der Klassen berücksichtigt man vorhersagen
cross_validation.train_test_split
Verwendung: Kreuzvalidierungsphase
Beschreibung: Teilen Sie Ihre Daten in Trainings- und Testsets
grid_search.GridSearchCV
Verwendung: Optimierung
Beschreibung: Erschöpfende Suche, um eine Maschine Lernalgorithmus zu maximieren
linear_model.LinearRegression
Verwendung: Prognose
Beschreibung: Lineare Regression
linear_model.LogisticRegression
Verwendung: Prognose
Beschreibung: Linear logistische Regression
neighbors.KNeighborsClassifier
Verwendung: Prognose
Beschreibung: K-Nachbarn Klassifikation
naive_bayes.MultinomialNB
Verwendung: Prognose
Beschreibung: Multinomiale Na # 239-ve Bayes
metrics.accuracy_score
Verwendung: Lösung Auswertung
Beschreibung: Genauigkeitsklasse-Score.
metrics.f1_score
Verwendung: Lösung Auswertung
Beschreibung: Berechnen Sie die F1-Score, Auswuchtgenauigkeit und Rückruf
metrics.mean_absolute_error
Verwendung: Lösung Auswertung
Beschreibung: Die mittlere absolute Fehler Regressionsfehler
metrics.mean_squared_error
Verwendung: Lösung Auswertung
Beschreibung: Mittlere quadratische Fehler Regressionsfehler
metrics.roc_auc_score
Verwendung: Lösung Auswertung
Beschreibung: Berechnen Sie Fläche unter der Kurve (AUC) von Vorhersage-Scores

Python für Data Science For Dummies

Linie Plotstilen

Gemeinsame IPython Magische Funktionen

Scikit-Learn Method Summary

Ähnliche

Menü