Acerca de Ray en Google Kubernetes Engine (GKE)

Autopilot Estándar

En esta página, se proporciona una descripción general del operador de Ray y los recursos personalizados relevantes para implementar y administrar clústeres y aplicaciones de Ray en Google Kubernetes Engine (GKE).

Ray es un framework de procesamiento unificado de código abierto para escalar aplicaciones de IA/AA y Python. Ray proporciona un conjunto de bibliotecas para distribuir el entorno de ejecución de procesamiento para la IA y el AA en varios nodos de procesamiento.

Para obtener información sobre cómo habilitar el operador de Ray en GKE, consulta Habilita el operador de Ray en GKE.

Por qué usar el operador de Ray en GKE

El operador de Ray es la forma recomendada de implementar y administrar clústeres de Ray en GKE. Cuando ejecutas el operador de Ray en GKE, te beneficias de la compatibilidad de Ray con la confiabilidad, la portabilidad y la escalabilidad de nivel empresarial de Python y GKE.

El operador de Ray en GKE se basa en KubeRay, que proporciona APIs de Kubernetes declarativas diseñadas específicamente para administrar clústeres de Ray. Esto significa que puedes aprovisionar, escalar y administrar tus Deployments de Ray con otras cargas de trabajo alojadas en contenedores en GKE.

Cómo funciona el operador de Ray en GKE

Cuando habilitas el operador de Ray en tus clústeres de GKE, GKE instala y aloja de forma automática el operador de KubeRay.

KubeRay proporciona recursos personalizados de Kubernetes para administrar implementaciones de Ray en Kubernetes, incluidos los siguientes:

RayCluster
RayJob
RayService

Recurso personalizado de RayCluster

El recurso personalizado de RayCluster te permite especificar un clúster de Ray que GKE implementa como Pods de Kubernetes. Por lo general, un clúster de Ray consta de un solo Pod principal y varios Pods trabajadores.

Recurso personalizado de RayJob

El recurso personalizado de RayJob te permite ejecutar un solo trabajo de Ray. KubeRay crea un RayCluster para proporcionar recursos de procesamiento para el trabajo y, luego, crea un trabajo de Kubernetes que envía el trabajo de Ray al Pod principal del RayCluster.

Para lograr una administración eficiente de recursos, puedes configurar KubeRay para limpiar automáticamente RayCluster después de que tu trabajo se complete de forma correcta.

Recurso personalizado de RayService

El recurso personalizado de RayService te permite configurar aplicaciones de Ray Serve, como las aplicaciones para entrega e inferencia de modelos. KubeRay crea un RayCluster para proporcionar los recursos de procesamiento y, luego, implementa la aplicación Ray Serve como lo especifica la configuración de Ray Serve.

¿Qué sigue?

Aprende a habilitar el operador de Ray en GKE.
Explora la documentación de Ray en Kubernetes.