Quotas Cloud TPU

Ce document répertorie les quotas qui s'appliquent à Cloud TPU. Pour plus d'informations sur les tarifs de Cloud TPU, consultez la page Tarifs de Cloud TPU.

Google Cloud utilise des quotas pour garantir l'équité et réduire les pics d'utilisation et de disponibilité des ressources. Un quota limite la quantité de ressources Google Cloud que votre projet Google Cloud peut utiliser. Les quotas s'appliquent à différents types de ressources, y compris les composants matériels, logiciels et réseau. Par exemple, les quotas peuvent limiter le nombre d'appels d'API à un service, le nombre d'équilibreurs de charge utilisés simultanément par votre projet ou le nombre de projets que vous pouvez créer. Les quotas protègent la communauté des utilisateurs de Google Cloud en empêchant la surcharge des services. Les quotas vous aident également à gérer vos propres ressources Google Cloud.

Le système Cloud Quotas effectue les opérations suivantes :

  • Surveille votre consommation de produits et services Google Cloud
  • Limite votre consommation de ces ressources
  • Permet de demander des modifications de la valeur du quota

Dans la plupart des cas, lorsque vous tentez d'utiliser plus d'une ressource que son quota ne le permet, le système bloque l'accès à la ressource et la tâche que vous essayez d'effectuer échoue.

Les quotas s'appliquent généralement au niveau du projet Google Cloud. Votre utilisation d'une ressource dans un projet n'affecte pas votre quota disponible dans un autre projet. Dans un projet Google Cloud, les quotas sont partagés entre toutes les applications et adresses IP.

Quota de TPU

Des quotas différents s'appliquent à chaque version de TPU. Par exemple, il existe différents pour les TPU v2, v3, etc. Chaque version de TPU possède différents types de quotas: à la demande et préemptifs (VM Spot). Le tableau suivant décrit les différents types de quotas.

Type de quota Description Valeur par défaut Procédure de demande Options pour la création de TPU
À la demande Nombre de ressources à la demande auxquelles vous avez accès. À la demande les ressources ne seront pas préemptées, mais les quotas à la demande ne garantissent pas disposera de suffisamment de ressources Cloud TPU disponibles pour répondre à votre requête. v3-8 et v2-8: 16 TensorCores
Toutes les autres: 0
Consultez la section Demander une augmentation de quota. Aucun indicateur nécessaire (sélectionné par défaut).
Préemptif Nombre de ressources Cloud TPU préemptives auxquelles vous avez accès. Ce quota s'applique à la fois aux TPU préemptifs et aux VM TPU Spot. Les ressources préemptives peuvent être préemptées pour libérer de l'espace pour une priorité plus élevée emplois. Le quota préemptif ne garantit pas que l'espace disponible sera suffisant. ressources Cloud TPU afin de répondre à votre requête. Pour en savoir plus, consultez TPU préemptifs et Gérez les VM TPU Spot. v3-8 et v2-8: 48 TensorCores
Toutes les autres: 0
Consultez la section Demander une augmentation de quota.
  • VM Spot: utilisez la commande --spot.
  • TPU préemptifs: utilisez les méthodes --preemptible. --preemptible L'indicateur n'est pas compatible avec les ressources. Utilisez plutôt l'indicateur --spot.

Les quotas de TPU sont spécifiés en termes de cœurs de TPU par projet et par zone ou de cœurs de TPU par projet et par région.

Quotas de TPU v5p

Vous pouvez utiliser votre quota TPU v5p avec n'importe quelle combinaison de cœurs. Par exemple, si vous dispose d'un quota de 32 cœurs, vous pouvez utiliser ce quota pour créer quatre tranches de TPU chacune avec 8 cœurs.

Quotas préemptifs:

  • Cœurs TPU v5p préemptifs par projet et par région
  • Cœurs TPU v5p préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs TPU v5p par projet et par région
  • Cœurs TPU v5p par projet et par zone

Quotas de TPU v5e

Le TPU v5e peut être utilisé pour l'entraînement et la diffusion. Il existe des quotas distincts pour pour l'entraînement et l'inférence, ainsi que pour les systèmes à hôte unique (cœurs allégés) et à hôtes multiples (cœurs de pod Lite).

Quotas de diffusion

Quotas de diffusion préemptive:

  • Cœurs de pod TPU v5 lite préemptifs pour la diffusion par projet et par région
  • Cœurs de pod TPU v5 lite préemptifs pour la diffusion par projet et par zone

Quotas de diffusion à la demande:

  • Cœurs de pod TPU v5 Lite pour la diffusion par projet et par région
  • Cœurs de pod TPU v5 Lite pour la diffusion par projet et par zone

Quotas d'entraînement

Quotas d'entraînement préemptif:

  • Cœurs TPU v5 lite préemptifs par projet et par région
  • Cœurs TPU v5 lite préemptifs par projet et par zone
  • Cœurs de pod TPU v5 lite préemptifs par projet et par région
  • Cœurs de pod TPU v5 lite préemptifs par projet et par zone

Quotas d'entraînement à la demande:

  • Cœurs de TPU v5 Lite par projet et par région
  • Cœurs de TPU v5 Lite par projet et par zone
  • Cœurs de pod TPU v5 Lite par projet et par région
  • Cœurs de pod TPU v5 Lite par projet et par zone

Quotas TPU v4

Vous pouvez utiliser votre quota TPU v4 avec n'importe quelle combinaison de cœurs. Par exemple, si vous dispose d'un quota de 32 cœurs, vous pouvez utiliser ce quota pour créer quatre tranches de TPU chacune avec 8 cœurs.

Quotas préemptifs:

  • Cœurs de pod TPU v4 préemptifs par projet et par région
  • Cœurs de pod TPU v4 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs de pod TPU v4 par projet et par région
  • Cœurs de pod TPU v4 par projet et par zone

Quotas TPU v3

Des quotas de TPU v3 distincts s'appliquent aux TPU à hôte unique (cœur) et aux TPU à hôtes multiples. (pod). Vous devez utiliser les quotas de pods v3 pour créer des TPU comportant plus de huit cœurs.

Quotas préemptifs:

  • Cœurs TPU v3 préemptifs par projet et par région
  • Cœurs TPU v3 préemptifs par projet et par zone
  • Cœurs de pod TPU v3 préemptifs par projet et par région
  • Cœurs de pod TPU v3 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs TPU v3 par projet et par région
  • Cœurs TPU v3 par projet et par zone
  • Cœurs de pod TPU v3 par projet et par région
  • Cœurs de pod TPU v3 par projet et par zone

Quotas TPU v2

Des quotas de TPU v2 distincts s'appliquent aux TPU à hôte unique (cœur) et aux TPU à hôtes multiples. (pod).

Quotas préemptifs:

  • Cœurs TPU v2 préemptifs par projet et par région
  • Cœurs TPU v2 préemptifs par projet et par zone
  • Cœurs de pod TPU v2 préemptifs par projet et par région
  • Cœurs de pod TPU v2 préemptifs par projet et par zone

Quotas à la demande:

  • Cœurs TPU v2 par projet et par région
  • Cœurs TPU v2 par projet et par zone
  • Cœurs de pod TPU v2 par projet et par région
  • Cœurs de pod TPU v2 par projet et par zone

Pour en savoir plus sur les puces TPU et les TensorCores, consultez la page Système TPU architecture.

Afficher et demander un quota supplémentaire

Vous pouvez consulter le quota alloué à votre projet Google Cloud sur la page sur la page "Quotas" console Google Cloud. Si vous avez besoin d'un quota Cloud TPU supplémentaire, vous pouvez en faire la demande depuis la page . Pour en savoir plus, consultez la section Demander un quota supérieur limite.