Tentang Ray di Google Kubernetes Engine (GKE)


Halaman ini memberikan ringkasan tentang Operator Ray dan resource kustom yang relevan untuk men-deploy dan mengelola cluster dan aplikasi Ray di Google Kubernetes Engine (GKE).

Ray adalah framework komputasi terpadu open source untuk menskalakan aplikasi AI/ML dan Python. Ray menyediakan serangkaian library untuk mendistribusikan runtime komputasi untuk AI/ML di beberapa node komputasi.

Untuk mempelajari cara mengaktifkan operator Ray di GKE, lihat Mengaktifkan operator Ray di GKE.

Alasan menggunakan Ray Operator di GKE

Ray Operator adalah cara yang direkomendasikan untuk men-deploy dan mengelola cluster Ray di GKE. Saat menjalankan Ray Operator di GKE, Anda akan mendapat manfaat dari dukungan Ray untuk Python serta keandalan, portabilitas, dan skalabilitas tingkat perusahaan dari GKE.

Ray Operator di GKE didasarkan pada KubeRay, yang menyediakan API Kubernetes deklaratif yang dirancang khusus untuk mengelola cluster Ray. Artinya, Anda dapat menyediakan, menskalakan, dan mengelola Deployment Ray dengan workload dalam container lainnya di GKE.

Cara kerja Ray Operator di GKE

Saat mengaktifkan Ray Operator di cluster GKE, GKE akan otomatis menginstal dan menghosting operator KubeRay.

KubeRay menyediakan resource kustom Kubernetes untuk mengelola Ray Deployments di Kubernetes, yang meliputi:

Resource kustom RayCluster

Resource kustom RayCluster memungkinkan Anda menentukan cluster Ray yang di-deploy GKE sebagai Pod Kubernetes. Cluster Ray biasanya terdiri dari satu Pod head dan beberapa Pod worker.

Resource kustom RayJob

Resource khusus RayJob memungkinkan Anda mengeksekusi satu tugas Ray. KubeRay membuat RayCluster untuk menyediakan resource komputasi bagi tugas, lalu membuat Tugas Kubernetes yang mengirimkan tugas Ray ke Pod head RayCluster.

Untuk pengelolaan resource yang efisien, Anda dapat mengonfigurasi KubeRay agar otomatis membersihkan RayCluster setelah tugas Anda berhasil diselesaikan.

Resource kustom RayService

Resource kustom RayService memungkinkan Anda mengonfigurasi aplikasi Ray Serve, seperti aplikasi untuk inferensi dan inferensi model. KubeRay membuat RayCluster untuk menyediakan resource komputasi, lalu men-deploy aplikasi Ray Serve seperti yang ditetapkan oleh konfigurasi Ray Serve.

Langkah selanjutnya