Questo documento descrive come le richieste di ridimensionamento in un gruppo di istanze gestite il lavoro e i suoi limiti. Utilizza le richieste di ridimensionamento per creare una macchina virtuale (VM) con GPU tutte contemporaneamente in un gruppo di istanze gestite.
Creare VM tutte contemporaneamente in un gruppo di istanze gestite tramite una richiesta di ridimensionamento è utile nel i seguenti scenari:
Se vuoi che le VM GPU siano disponibili solo per un periodo di tempo specifico, la richiesta di ridimensionamento aumenta le possibilità di ottenere GPU, che sono risorse molto richieste.
Se vuoi che un job esegua un numero esatto di VM, una richiesta di ridimensionamento di creare le VM tutte insieme. Utilizzando le richieste di ridimensionamento, puoi anche evitare i costi non necessari per la capacità parziale creata da Compute Engine mentre attendi che tutte le risorse siano disponibili.
Come funzionano le richieste di ridimensionamento
Quando crei una richiesta di ridimensionamento, devi specificare quanto segue:
resizeBy
: il numero di VM da creare tutte contemporaneamente come parte della richiesta.requestedRunDuration
: la durata per cui le VM sono state create come parte della richiesta. La durata dell'esecuzione deve essere compresa tra 10 minuti e 7 giorni. Al termine della durata dell'esecuzione, il gruppo di istanze gestite elimina le VM create.
Quando crei una richiesta di ridimensionamento in un gruppo di istanze gestite, Compute Engine imposta lo stato
della richiesta a CREATING
, per poi eseguirne la transizione a ACCEPTED
quando
viene creata una richiesta specifica. Dynamic Workload Scheduler (DWS),
meccanismo di scheduler sottostante, pianifica le richieste di ridimensionamento create
Compute Engine in base alle durate richieste e alla disponibilità delle risorse.
Dopo che DWS pianifica la creazione del numero richiesto di VM, il gruppo di istanze gestite
aumenta la dimensione target del numero di VM richieste e crea
istanze gestite
con stato CREATING
. Queste istanze gestite rappresentano le VM
che il gruppo di istanze gestite creerà quando la richiesta di ridimensionamento avrà esito positivo. Non puoi eliminare
istanze gestite in stato CREATING
a meno che non annulli il ridimensionamento
richiesta.
Se la quota per le risorse richieste o le risorse sono temporaneamente non è disponibile, il DWS mantiene la richiesta finché non disponi di quota sufficiente le risorse diventano disponibili.
Una richiesta di ridimensionamento accettata rimane tale finché Compute Engine non imposta la sua uno dei seguenti stati:
SUCCEEDED
: il gruppo di istanze gestite ha creato contemporaneamente il numero richiesto di VM. Le VM vengono eseguite finché il gruppo di istanze gestite non le elimina dopo la durata di esecuzione specificata o fino a quando non elimini le VM.FAILED
: la richiesta di ridimensionamento non è riuscita a causa di un errore tecnico e Compute Engine ha ridotto la dimensione target del gruppo di istanze gestite del numero di VM richieste.CANCELLED
: un utente ha annullato la richiesta di ridimensionamento e Compute Engine ha ridotto la dimensione target del gruppo di istanze gestite del numero di VM richieste. Se vuoi interrompere la creazione di una richiesta di ridimensionamento accettata le VM, devi annullare la richiesta di ridimensionamento, e poi puoi eliminarlo. Se non elimini un ridimensionamento annullato richiesta, Compute Engine la elimina automaticamente 14 giorni dopo annullato.
Per verificare lo stato di una richiesta di ridimensionamento accettata o risolvere i problemi, visualizza i dettagli della richiesta di ridimensionamento.
Se elimini un gruppo di istanze gestite contenente richieste di ridimensionamento, questa operazione elimina anche qualsiasi
richieste di ridimensionamento e VM
nel gruppo di istanze gestite. Tuttavia, se elimini un gruppo di istanze gestite quando il gruppo di istanze gestite viene
creando VM per soddisfare una richiesta di ridimensionamento, Compute Engine attende
Il gruppo di istanze gestite ha terminato di creare il numero di VM richiesto e lo stato
le transizioni della richiesta di ridimensionamento a SUCCEEDED
prima dell'eliminazione del gruppo di istanze gestite.
Limitazioni
Le seguenti sezioni descrivono i limiti della creazione di richieste di ridimensionamento in un gruppo di istanze gestite
Limitazioni per le richieste di ridimensionamento
Per le richieste di ridimensionamento, si applicano le seguenti limitazioni:
Puoi utilizzare la richiesta di ridimensionamento per ottenere solo VM GPU.
Puoi creare richieste di ridimensionamento solo nei gruppi di istanze gestite a livello di zona.
Puoi annullare solo le richieste di ridimensionamento accettate (
ACCEPTED
).Puoi eliminare una richiesta di ridimensionamento solo dopo che è andata a buon fine (
SUCCEEDED
) o non è andata a buon fine (FAILED
) o viene annullata da un utente (CANCELLED
).
Limitazioni per il modello di istanza
Per il modello di istanza utilizzato nel gruppo di istanze gestite in cui si vuole creare il ridimensionamento di Google, si applicano le seguenti limitazioni:
Devi specificare di arrestare le VM durante ospitare eventi di manutenzione.
Devi specificare di non utilizzare prenotazioni.
Non puoi specificare VM spot.
Non puoi specificare criteri di posizionamento.
Non puoi specificare
maxRunDuration
oppureterminationTime
campi.
Limitazioni per il gruppo di istanze gestite
Per il gruppo di istanze gestite in cui vuoi creare richieste di ridimensionamento, quanto segue si applicano limitazioni:
Devi disattivare le riparazioni nel gruppo di istanze gestite.
Devi eliminare la configurazione della scalabilità automatica.
Non puoi applicare aggiornamenti della configurazione delle VM alle VM create tramite il ridimensionamento richieste. Per impedire gli aggiornamenti automatici, imposta il tipo di aggiornamento del gruppo di istanze gestite su opportunistico.
Non puoi applicare configurazione di tutte le istanze per VM create tramite richieste di ridimensionamento.
Non puoi definire configurazioni per istanza nelle VM create tramite richieste di ridimensionamento.
Puoi impostare solo modalità pool in standby del gruppo di istanze gestite a
manual
(impostazione predefinita).Se un gruppo di istanze gestite contiene richieste di ridimensionamento accettate, non puoi:
Non puoi aggiungere un secondo modello di istanza per avviare una aggiornamento canary nel gruppo di istanze gestite.
Non puoi modificare dimensione target del gruppo di istanze gestite.
Non puoi eliminare o abbandonare le istanze gestite in stato
CREATING
creato dal gruppo di istanze gestite per una richiesta di ridimensionamento. Per eliminare quelli gestiti di Google Cloud, devi annulla la richiesta di ridimensionamento.Non puoi ricrea, sospendere, o interrompi un VM creata tramite una richiesta di ridimensionamento.
Quota per le VM GPU con durata di esecuzione richiesta
VM GPU configurate per l'eliminazione automatica dopo un tempo di esecuzione predefinito di massimo 7 giorni, possono utilizzare quote di allocazione standard. Questo comportamento è previsto per aiutarti a migliorare l'ottenimento di una quota di allocazione per carichi di lavoro temporanei ma senza interruzioni. Per ulteriori informazioni al riguardo, il comportamento degli utenti, consulta VM GPU e quote di allocazione prerilasciabili.Prezzi
Non sono previsti costi associati alla creazione, all'annullamento o all'eliminazione del ridimensionamento richieste. Ti vengono addebitati dei costi solo per le VM create tramite un ridimensionamento richiesta, dal momento in cui il gruppo di istanze gestite crea le VM fino a quando il gruppo di istanze gestite elimina automaticamente le VM alla fine della loro durata di esecuzione o manualmente per eliminare le VM.
Se un gruppo di istanze gestite crea solo alcune delle VM richieste e non riesce a creare le VM rimanenti, potresti comunque incorrere in addebiti per le VM create finché Il gruppo di istanze gestite li elimina automaticamente.
Passaggi successivi
Scopri come creare richieste di ridimensionamento in un gruppo di istanze gestite.
Scopri come visualizzare, annullare o eliminare le richieste di ridimensionamento in un gruppo di istanze gestite.