Tabellen zu Replikationsjobs hinzufügen

Nachdem Sie einen Replikationsjob bereitgestellt haben, können Sie Tabellen nicht mehr bearbeiten oder hinzufügen. . Fügen Sie die Tabellen stattdessen einem neuen oder doppelten Replikationsjob hinzu.

Option 1: Neuen Replikationsjob erstellen

Das Hinzufügen von Tabellen zu einem neuen Job ist die einfachste Methode. Sie verhindert, dass alle Tabellen aktualisieren und Probleme mit Dateninkonsistenzen vermeiden.

Der Nachteil ist der erhöhte Aufwand bei der Verwaltung mehrerer Replikationsjobs und den Verbrauch von mehr Rechenressourcen, wird jeder Job in einem separaten sitzungsspezifischen Dataproc-Cluster ausgeführt, Standardeinstellung. Letzteres lässt sich bis zu einem gewissen Grad durch die Verwendung einer gemeinsam genutzten statischen Dataproc-Cluster für beide Jobs.

Weitere Informationen zum Erstellen neuer Jobs finden Sie in der Replikationsanleitungen

Weitere Informationen zur Verwendung eines statischen Dataproc-Clusters finden Sie in Cloud Data Fusion, siehe Pipeline für einen vorhandenen Dataproc-Cluster ausführen

Option 2: Aktuellen Replikationsjob anhalten und Duplikat erstellen

Wenn Sie den Replikationsjob duplizieren, um die Tabellen hinzuzufügen, beachten Sie die Folgendes:

  • Das Aktivieren des Snapshots für den duplizierten Job führt zum Verlauf der Last von alle Tabellen von Grund auf neu. Dies wird empfohlen, wenn Sie das bei der Sie separate Jobs ausführen.

  • Das Deaktivieren des Snapshots, um den Verlauf des Ladevorgangs zu verhindern, kann zu Daten führen da zwischen dem Beenden der alten Pipeline und dem beginnt die neue. Das Erstellen einer Überschneidung zur Behebung dieses Problems empfohlen, da dies auch zu Datenverlust führen kann – Verlaufsdaten für die neue werden die Tabellen nicht repliziert.

So erstellen Sie einen duplizierten Replikationsjob:

  1. Beenden Sie die vorhandene Pipeline.

  2. Suchen Sie auf der Seite „Replikationsjobs“ den Job, den Sie duplizieren möchten. Klicken Sie auf und Duplizieren:

  3. Aktivieren Sie den Snapshot:

    1. Gehen Sie zu Quelle konfigurieren.
    2. Wählen Sie im Feld Vorhandene Daten replizieren die Option Ja aus.
  4. Fügen Sie im Fenster Tabellen und Transformationen auswählen Tabellen hinzu und folgen Sie der um die Replikationspipeline bereitzustellen.

Nächste Schritte