Esta página foi traduzida pela API Cloud Translation.

Adicionar tabelas a um job de replicação

Depois de implantar um job de replicação, não é possível editar ou adicionar tabelas reimplantá-lo. Em vez disso, adicione as tabelas a um job de replicação novo ou duplicado.

Opção 1: criar um novo job de replicação

Adicionar tabelas a um novo job é a abordagem mais simples. Ele impede que os dados históricos atualizar todas as tabelas e evitar problemas de inconsistência de dados.

As desvantagens são o aumento da sobrecarga no gerenciamento de vários jobs de replicação e o consumo de mais recursos de computação, cada job é executado em um cluster temporário separado do Dataproc padrão. Essa última opção pode ser atenuada até certo ponto com o uso de um cluster do Dataproc para os dois jobs.

Para obter mais informações sobre como criar novas tarefas, consulte a Tutoriais de replicação.

Para mais informações sobre como usar o cluster estático do Dataproc na do Cloud Data Fusion, consulte Execute um pipeline em um cluster atual do Dataproc

Opção 2: interromper o job de replicação atual e criar uma cópia

Se você duplicar o job de replicação para adicionar as tabelas, considere o seguinte:

A ativação do snapshot do job duplicado resulta no carregamento histórico de todas as tabelas do zero. Isso é recomendado se você não puder usar o opção anterior, em que você executa jobs separados.
Desativar o snapshot para evitar o carregamento histórico pode resultar em dados perda, já que podem ocorrer eventos perdidos entre o momento em que o pipeline antigo é interrompido e o novo começa. Criar uma sobreposição para mitigar esse problema não é porque isso também pode resultar em perda de dados, que são dados históricos da nova não são replicadas.

Para criar um job de replicação duplicado, siga estas etapas:

Interrompa o pipeline atual.
Na página "Jobs de replicação", localize o job que você quer duplicar. clique em e Duplicar.
Ative o snapshot:
1. Acesse Configurar origem.
2. No campo Replicar dados atuais, selecione Sim.
Adicione tabelas na janela Selecionar tabelas e transformações e siga as para implantar o pipeline de replicação.

A seguir

Saiba mais sobre replicação.