Descripción general de Data Boost

Data Boost de Spanner es un servicio completamente administrado y sin servidores que proporciona recursos de procesamiento independientes para las cargas de trabajo compatibles de Spanner. Data Boost te permite ejecutar consultas de estadísticas y exportaciones de datos con un impacto casi nulo en las cargas de trabajo existentes de la instancia de Spanner aprovisionada. El servicio consta de clústeres de Spanner que Google administra a nivel de la región. Para las consultas aptas que solicitan Data Boost, Spanner enruta la carga de trabajo a estos servidores de forma transparente. Las consultas aptas son aquellas para las que el primer operador en el plan de ejecución de consultas es una unión distribuida. No es necesario que estas consultas cambien para aprovechar Data Boost.

Data Boost tiene un mayor impacto en las siguientes situaciones, en las que deseas evitar impactos negativos en el sistema transaccional existente debido a la contención de recursos:

  • Consultas ad hoc o poco frecuentes que implican el procesamiento de grandes cantidades de datos Un ejemplo típico es una consulta federada de BigQuery a Spanner.
  • Trabajos de informes o exportación de datos Un ejemplo es un trabajo de Dataflow para exportar datos de Spanner a Cloud Storage.

En el siguiente diagrama, se ilustra cómo Data Boost se coordina con la instancia de Spanner para proporcionar recursos de procesamiento independientes.

Data Boost en la arquitectura de Spanner

Ventajas

Data Boost ofrece los siguientes beneficios:

  • Proporciona aislamiento de la carga de trabajo. Puedes ejecutar consultas admitidas en los datos más recientes con un impacto casi nulo en las cargas de trabajo transaccionales existentes, sin importar la complejidad de la consulta o la cantidad de datos procesados.
  • Proporciona una latencia igual o mejor.
  • Impide el aprovisionamiento excesivo de las instancias de Spanner solo para admitir consultas de estadísticas ocasionales.
  • Ofrece un alto grado de escalabilidad con un mayor paralelismo de consultas que escala elásticamente con cargas en aumento de actividad.
  • Proporciona métricas integrales, que permiten a los administradores identificar las consultas más costosas y determinar el componente de costo que se debe optimizar. Luego, los administradores pueden verificar el impacto de sus optimizaciones mediante la supervisión del consumo de unidades de procesamiento sin servidores de la consulta en su próxima ejecución.
  • No requiere sobrecarga operativa adicional. No se debe administrar ningún servicio adicional, ni se debe planificar ni aprovisionar la capacidad, ni es necesario esperar el escalamiento ni se requiere mantenimiento.

Permisos

Cualquier principal que ejecute una consulta o exportación que solicite Data Boost debe tener el permiso spanner.databases.useDataBoost de Identity and Access Management (IAM). Te recomendamos crear una función de IAM personalizada basada en Cloud Spanner Database Reader (roles/spanner.databaseReader) y agregarle spanner.databases.useDataBoost.

Facturación y cuotas

Solo pagas por las unidades de procesamiento reales que usan las consultas que se ejecutan en Data Boost. Los administradores pueden establecer límites de uso para evitar excesos de costos.

¿Qué sigue?