Ray-Cluster in Vertex AI skalieren

Wenn Ihre Arbeitslasten in Ihren Ray-Clustern in Vertex AI zu- oder abnehmen, können Sie die Anzahl der Replikate manuell an den Bedarf anpassen. Wenn Sie beispielsweise überschüssige Kapazitäten haben, können Sie Ihre Worker-Pools herunterskalieren, um Kosten zu sparen. Auf dieser Seite wird beschrieben, wie Sie die Anzahl der Replikate für vorhandene Worker-Pools ändern.

Beschränkungen

Beim Skalieren von Clustern können Sie nur die Anzahl der Replikate in vorhandenen Worker-Pools ändern. Sie können beispielsweise weder Worker-Pools zu Ihrem Cluster hinzufügen, noch aus ihm entfernen, noch den Maschinentyp Ihrer Worker-Pools ändern. Außerdem darf die Anzahl der Replikate für Ihre Worker-Pools nicht unter 1 sein.

Wenn Sie eine VPC-Peering-Verbindung für die Verbindung zu Ihren Clustern verwenden, ist die maximale Knotenanzahl begrenzt. Die maximale Anzahl an Knoten hängt von der Anzahl der Knoten ab, die der Cluster beim Erstellen hatte. Weitere Informationen finden Sie unter Berechnung der maximalen Anzahl an Knoten. Diese maximale Anzahl umfasst nicht nur Ihre Worker-Pools, sondern auch Ihren Hauptknoten. Wenn Sie die Standard-Netzwerkkonfiguration verwenden, darf die Anzahl der Knoten die in der Dokumentation Cluster erstellen vermerkten Maximalwerte nicht überschreiten.

Berechnung der maximalen Anzahl an Knoten

Wenn Sie den Zugriff auf private Dienste (VPC-Peering) nutzen, um eine Verbindung zu Ihren Knoten herzustellen, verwenden Sie folgende Formeln, um zu prüfen, ob Sie die maximale Knotenanzahl (M) nicht überschreiten, wobei f(x) = min(29, (32 - ceiling(log2(x))) vorausgesetzt wird:

  • f(2 * M) = f(2 * N)
  • f(64 * M) = f(64 * N)
  • f(max(32, 16 + M)) = f(max(32, 16 + N))

Die maximale Anzahl von Knoten im Ray on Vertex AI-Cluster, auf die Sie hochskalieren können (M), hängt von der ursprünglichen Gesamtzahl der Knoten ab, die Sie eingerichtet haben (N). Nachdem Sie den Ray on Vertex AI-Cluster erstellt haben, können Sie die Gesamtzahl der Knoten auf eine beliebige Menge zwischen P und M (inklusive) skalieren, wobei P die Anzahl der Pools in Ihrem Cluster ist.

Anzahl der Replikate aktualisieren

Sie können die Google Cloud Console oder das Vertex AI SDK für Python verwenden, um die Anzahl der Replikate des Worker-Pools zu aktualisieren. Wenn Ihr Cluster mehrere Worker-Pools enthält, können Sie die jeweilige Anzahl der Replikate in einer einzigen Anfrage ändern.

Console

  1. Rufen Sie in der Google Cloud Console die Seite „Ray in Vertex AI“ auf.

    Zur Seite "Ray in Vertex AI"

  2. Klicken Sie in der Liste der Cluster auf den Cluster, den Sie ändern möchten.

  3. Klicken Sie auf der Seite Clusterdetails auf Cluster bearbeiten.

  4. Wählen Sie im Bereich Cluster bearbeiten den zu aktualisierenden Worker-Pool aus und ändern Sie dann die Anzahl der Replikate.

  5. Klicken Sie auf Aktualisieren.

    Warten Sie einige Minuten, bis der Cluster aktualisiert wurde. Nach Abschluss der Aktualisierung sehen Sie die aktualisierte Replikatanzahl auf der Seite Clusterdetails.

Ray on Vertex AI SDK

import vertexai
import vertex_ray

vertexai.init()
cluster = vertex_ray.get_ray_cluster("CLUSTER_NAME")

# Get the resource name.
cluster_resource_name = cluster.cluster_resource_name

# Create the new worker pools
new_worker_node_types = []
for worker_node_type in cluster.worker_node_types:
 worker_node_type.node_count = REPLICA_COUNT # new worker pool size
 new_worker_node_types.append(worker_node_type)

# Make update call
updated_cluster_resource_name = vertex_ray.update_ray_cluster(
 cluster_resource_name=cluster_resource_name,
 worker_node_types=new_worker_node_types,
)