Bereitsteller in Cloud Data Fusion

Ein Bereitsteller ist für das Erstellen und Löschen des Cloud-Clusters verantwortlich in dem die Pipeline ausgeführt wird. Verschiedene Bereitsteller sind in der Lage, zum Erstellen verschiedener Clustertypen in verschiedenen Clouds.

Jeder Bereitsteller stellt eine Reihe von Konfigurationseinstellungen zur Verfügung, die den Typ steuern des Clusters, der für eine Ausführung erstellt wurde. Beispiel: Dataproc und Amazon EMR-Bereitsteller haben Einstellungen für die Clustergröße. Außerdem haben Bereitsteller Einstellungen für die Anmeldedaten, die für die Kommunikation mit den jeweiligen Clouds erforderlich sind, Stellen Sie die erforderlichen Rechenknoten bereit.

Unterstützte Bereitsteller in Cloud Data Fusion

Cloud Data Fusion unterstützt die folgenden Bereitsteller:

Dataproc
Ein schneller, nutzerfreundlicher und vollständig verwalteter Cloud-Dienst zum Ausführen von Apache Spark und Apache Hadoop-Cluster.
Amazon Elastic MapReduce (EMR)
Bietet ein verwaltetes Hadoop-Framework, das große Datenmengen dynamisch skalierbare Amazon EC2-Instanzen.
Remote- Hadoop
Ausführung von Jobs auf einem bereits vorhandenen Hadoop-Cluster, entweder lokal oder im Cloud.