Konfigurieren Oozie Workflows

Als Workflow-Engine, ermöglicht Oozie Sie eine Reihe von Hadoop-Anwendungen in einer bestimmten Reihenfolge als bekannt zu laufen Arbeitsablauf. Sie können Oozie Workflows in eine von drei Möglichkeiten, je nach Ihren besonderen Umständen konfigurieren. Sie können verwenden

  • Die config-Datei default.xml: Definiert Parameter, die nicht für den Workflow zu ändern.

  • Das job.properties Datei: Definiert Parameter, die für einen bestimmten Einsatz des Workflows gemeinsam sind. Definitionen hier die in der config-Datei default.xml außer Kraft.

  • Das Befehlszeilenparameter: Definiert Parameter, die spezifisch für den Workflow-Aufruf sind. Definitionen hier die in der job.properties Datei außer Kraft und die config-Datei default.xml.

Die Konfigurationsdetails unterscheiden sich in Abhängigkeit von der Aktion der sie zugeordnet sind. Zum Beispiel, wie Sie in der MapReduce Aktion (map-Aktion) in der folgenden Auflistung sehen können, haben Sie viele weitere Dinge dort zu konfigurieren:

... @@ 1 -serverName: 8021serverName: 8020 @@ 2 @@3 jobConfig.xml...mapreduce.map.classdummies.oozie.FlightMilesMappermapreduce.reduce.classdummies.oozie.FlightMilesReducer mapred.mapoutput.key.classorg.apache.hadoop.io.Textmapred.mapoutput.value.classorg.apache.hadoop.io.IntWritablemapred.output.key.classorg.apache.hadoop.io.Textmapred.output.value.classorg.apache.hadoop.io.IntWritablemapred.input.dir'/ Usr / dirk / Flugdaten'mapred.output.dir'/ Usr / dirk / flightmiles'......

Im Gegensatz zu einem Dateisystem (fs) Aktion wie hier gezeigt:

......

Menü