Konfigurieren Oozie Workflows
Als Workflow-Engine, ermöglicht Oozie Sie eine Reihe von Hadoop-Anwendungen in einer bestimmten Reihenfolge als bekannt zu laufen Arbeitsablauf. Sie können Oozie Workflows in eine von drei Möglichkeiten, je nach Ihren besonderen Umständen konfigurieren. Sie können verwenden
Die config-Datei default.xml: Definiert Parameter, die nicht für den Workflow zu ändern.
Das job.properties Datei: Definiert Parameter, die für einen bestimmten Einsatz des Workflows gemeinsam sind. Definitionen hier die in der config-Datei default.xml außer Kraft.
Das Befehlszeilenparameter: Definiert Parameter, die spezifisch für den Workflow-Aufruf sind. Definitionen hier die in der job.properties Datei außer Kraft und die config-Datei default.xml.
Die Konfigurationsdetails unterscheiden sich in Abhängigkeit von der Aktion der sie zugeordnet sind. Zum Beispiel, wie Sie in der MapReduce Aktion (map-Aktion) in der folgenden Auflistung sehen können, haben Sie viele weitere Dinge dort zu konfigurieren:
...@@ 1 -serverName: 8021serverName: 8020 @@ 2 @@3 jobConfig.xml ...... mapreduce.map.class dummies.oozie.FlightMilesMapper mapreduce.reduce.class dummies.oozie.FlightMilesReducer mapred.mapoutput.key.class org.apache.hadoop.io.Text mapred.mapoutput.value.class org.apache.hadoop.io.IntWritable mapred.output.key.class org.apache.hadoop.io.Text mapred.output.value.class org.apache.hadoop.io.IntWritable mapred.input.dir '/ Usr / dirk / Flugdaten' ... mapred.output.dir '/ Usr / dirk / flightmiles'
Im Gegensatz zu einem Dateisystem (fs) Aktion wie hier gezeigt:
......