Aggiungi tabelle a un job di replica

Dopo aver eseguito il deployment di un job di replica, non puoi modificare né aggiungere tabelle li annotino. Aggiungi invece le tabelle a un job di replica nuovo o duplicato.

Opzione 1: crea un nuovo job di replica

L'aggiunta di tabelle a un nuovo job è l'approccio più semplice. Impedisce l'esecuzione ricaricando tutte le tabelle ed evitando problemi di incoerenza nei dati.

Gli svantaggi sono l'aumento dell'overhead associato alla gestione i job di replica e il consumo di più risorse di calcolo, ogni job viene eseguito su un cluster Dataproc temporaneo separato predefinito. Quest'ultimo può essere mitigato in una certa misura utilizzando un Cluster Dataproc per entrambi i job.

Per ulteriori informazioni sulla creazione di nuovi lavori, consulta Tutorial sulla replica.

Per ulteriori informazioni sull'utilizzo di un cluster Dataproc statico in Cloud Data Fusion, consulta Esegui una pipeline su un cluster Dataproc esistente

Opzione 2: arresta il job di replica attuale e crea un duplicato

Se duplichi il job di replica per aggiungere le tabelle, considera la classe seguenti:

  • L'abilitazione dello snapshot per il job duplicato genera il caricamento storico di tutte le tabelle da zero. Questa opzione è consigliata se non puoi utilizzare precedente, in cui esegui job separati.

  • La disabilitazione dello snapshot per impedire il caricamento storico può generare dati in quanto potrebbero verificarsi eventi persi tra il momento in cui si interrompe la pipeline precedente e quello nuovo inizia. La creazione di una sovrapposizione per limitare il problema non è consigliato, in quanto può anche causare una perdita di dati, ossia i dati storici tabelle non vengono replicate.

Per creare un job di replica duplicato:

  1. Arresta la pipeline esistente.

  2. Nella pagina Job di replica, individua il job da duplicare, fai clic su e Duplica.

  3. Attiva lo snapshot:

    1. Vai a Configura l'origine.
    2. Nel campo Replica dati esistenti, seleziona .
  4. Aggiungi le tabelle nella finestra Seleziona tabelle e trasformazioni e segui le per eseguire il deployment della pipeline di replica.

di Gemini Advanced.

Passaggi successivi