Agregar tablas a un trabajo de replicación

Después de implementar un trabajo de replicación, no puedes editar ni agregar tablas que la modifica. En su lugar, agrega las tablas a un trabajo de replicación nuevo o duplicado.

Opción 1: Crea un trabajo de replicación nuevo

Agregar tablas a un trabajo nuevo es el enfoque más sencillo. Evitan que la información histórica volver a cargar todas las tablas y evitar problemas de incoherencia de datos.

Las desventajas son el aumento de la sobrecarga de administrar varias trabajos de replicación y el consumo de más recursos de procesamiento, así como cada trabajo se ejecuta en un clúster efímero de Dataproc independiente de forma predeterminada. Esto último se puede mitigar hasta cierto punto usando un modelo de clúster de Dataproc para ambos trabajos.

Para obtener más información sobre la creación de nuevos trabajos, consulta la Instructivos de replicación.

Para obtener más información sobre el uso de un clúster de Dataproc estático en Cloud Data Fusion, consulta Ejecuta una canalización en un clúster de Dataproc existente

Opción 2: Detén el trabajo de replicación actual y crea un duplicado

Si duplicas el trabajo de replicación para agregar las tablas, considera las lo siguiente:

  • Habilitar la instantánea para el trabajo duplicado genera la carga histórica de todas las tablas desde cero. Se recomienda esta opción si no puedes usar opción anterior, en la que ejecutas trabajos separados.

  • Inhabilitar la instantánea para evitar la carga histórica puede generar datos de pérdida de datos, ya que podría haber eventos omitidos entre el momento en que se detiene la canalización anterior y comienza el nuevo. Crear una superposición para mitigar este problema se recomienda, ya que también puede provocar la pérdida de datos (datos históricos de los nuevos tablas no replicadas.

Para crear un trabajo de replicación duplicado, sigue estos pasos:

  1. Detén la canalización existente.

  2. En la página Replication jobs, localiza el trabajo que deseas duplicar. haz clic en y Duplicar.

  3. Habilita la instantánea:

    1. Ve a Configurar fuente.
    2. En el campo Replicar los datos existentes, selecciona .
  4. Agrega tablas en la ventana Seleccionar tablas y transformaciones y sigue las instrucciones para implementar la canalización de replicación.

¿Qué sigue?