Importazione di dati DynamoDB in Amazon S3: come funziona - Amazon DynamoDB

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Importazione di dati DynamoDB in Amazon S3: come funziona

Per importare dati in DynamoDB, i dati devono trovarsi in un bucket Amazon S3 in formato CSV, DynamoDB JSON o Amazon Ion. I dati possono essere compressi in formato ZSTD o GZIP o possono essere importati direttamente in formato non compresso. I dati di origine possono essere un singolo oggetto Amazon S3 o più oggetti Amazon S3 che utilizzano lo stesso prefisso.

I dati verranno importati in una nuova tabella DynamoDB, che verrà creata quando avvii la richiesta di importazione. È possibile creare questa tabella con indici secondari, quindi eseguire query e aggiornare i dati su tutti gli indici primari e secondari non appena l'importazione è stata completata. È inoltre possibile aggiungere una replica di tabella globale al termine dell'importazione.

Nota

Durante il processo di importazione di Amazon S3, DynamoDB crea una nuova tabella di destinazione di importazione. L'importazione in tabelle esistenti non è attualmente supportata da questa caratteristica.

L'importazione da Amazon S3 non consuma capacità di scrittura nella nuova tabella, quindi non è necessario effettuare il provisioning di capacità aggiuntiva per l'importazione dei dati in DynamoDB. I prezzi per l'importazione dei dati si basano sulle dimensioni non compresse dei dati di origine in Amazon S3, che vengono elaborati come risultato dell'importazione. Anche gli elementi elaborati ma che non vengono caricati nella tabella a causa della formattazione o di altre incongruenze nei dati di origine vengono fatturati come parte del processo di importazione. Per i dettagli sui prezzi, consulta Prezzi di Amazon DynamoDB.

Puoi importare i dati da un bucket S3 appartenente a un account diverso se disponi delle autorizzazioni corrette per leggere il bucket specifico. La nuova tabella potrebbe anche trovarsi in una regione diversa dal bucket Amazon S3 di origine. Per ulteriori informazioni, consulta la pagina relativa alla configurazione e alle autorizzazioni di Amazon Simple Storage Service.

I tempi di importazione sono direttamente correlati alle caratteristiche dei dati in Amazon S3. Ciò include la dimensione e il formato dei dati, lo schema di compressione, l'uniformità della distribuzione dei dati, il numero di oggetti Amazon S3 e altre variabili correlate. In particolare, i set di dati con chiavi distribuite uniformemente saranno più veloci da importare rispetto ai set di dati disallineati. Ad esempio, se la chiave e l'indice secondario usano il mese e l'anno per creare partizioni e tutti i dati sono contenuti nel mese di dicembre, l'importazione di questi dati potrebbe richiedere molto più tempo.

Gli attributi associati alle chiavi dovrebbero essere univoci nella tabella di base. Se alcune chiavi non sono univoche, l'importazione sovrascriverà gli elementi associati fino a quando non rimarrà solo l'ultima sovrascrittura. Ad esempio, se la chiave primaria è il mese e più elementi sono impostati sul mese di settembre, ogni nuovo elemento sovrascriverà gli elementi scritti in precedenza e rimarrà solo un elemento con chiave primaria "mese" impostata su settembre. In questi casi, il numero di elementi elaborati nella descrizione della tabella di importazione non corrisponderà al numero di elementi nella tabella di destinazione.

AWS CloudTrail registra tutte le azioni della console e dell'API per l'importazione delle tabelle. Per ulteriori informazioni, consulta Registrazione delle operazioni di DynamoDB con AWS CloudTrail.

Il video seguente è un'introduzione all'importazione diretta da Amazon S3 in DynamoDB.