Cómo ayudamos a nuestros socios de servicios SaaS a trabajar de forma fiable con nuevas herramientas y capacitaciones de SRE

La misión de nuestro equipo de Ingeniería de Confiabilidad de Clientes (CRE) es ayudar a que todos los usuarios puedan trabajar con mayor confianza mediante la adopción sencilla de los principios y prácticas de la Ingeniería de Confiabilidad de Sitios (SRE). Últimamente, hemos pasado mucho tiempo con nuestros socios empresariales de servicios SaaS ayudándolos a reducir la carga operativa de sus sistemas, a ser más ágiles y a ejecutar servicios fiables para sus usuarios y clientes.
Hemos estado trabajando con estos socios de servicios SaaS durante más de un año y, en ese tiempo, hemos aprendido algunas lecciones:

  1. La mayoría de las empresas aún se encuentran en la fase inicial del proceso de SRE. El interés por aprender más sobre los principios, recomendaciones y herramientas de SRE proviene de una amplia gama de roles, muchos de los cuales no se llaman específicamente «SRE». Hemos recibido varios comentarios de empresas que quieren implementar recursos en línea interactivos que puedan procesar a su propio ritmo, como una capacitación de Coursera, para aprender más sobre SRE.
  2. Si bien las empresas tienen combinaciones únicas de soluciones y requisitos de clientes, hemos descubierto que comparten muchos patrones arquitectónicos comunes en lo que se refiere a las experiencias de sus clientes. La gran mayoría quiere crear objetivos a nivel de servicio (SLO) de forma rápida y eficaz.
  3. El concepto de fiabilidad va más allá de la definición y el seguimiento de las métricas. Sabemos que las empresas quieren prevenir fallas imprevistas y crear sistemas resistentes que puedan corregir errores desconocidos cuando estos se produzcan por primera vez. También quieren aprovechar el conocimiento y la experiencia colectiva de los ingenieros de Google.

A medida que continuamos con nuestra misión de ayudar a todas las empresas de servicios SaaS a operar de forma fiable en Google Cloud, también trabajamos de varias formas para simplificarles a los novatos el proceso de adopción de SRE.
Presentamos un nuevo curso de Coursera sobre SRE
Queremos facilitar el aprendizaje de los conceptos básicos de SRE y ayudar a la comunidad en general a establecer puntos de referencia. Hemos diseñado este curso para compartir años de experiencia colectiva de Google sobre SRE en el diseño y la gestión de sistemas complejos que cumplan sus objetivos de fiabilidad. Esperamos que ayude a los desarrolladores a aprender a su propio ritmo y les proporcione información valiosa tanto a novatos como a profesionales experimentados. Puedes inscribirte a esta clase aquí.
Presentamos SLO Guide, una herramienta que te ayuda a descubrir lo que debes medir
En Google, siempre hemos creído en la creación de herramientas para resolver problemas complejos a escala. Uno de los objetivos de nuestro equipo de CRE (nuestro primer equipo de SRE orientado al cliente) es ayudar a todas las empresas de servicios SaaS del mundo a operar de forma fiable en la plataforma de Google Cloud Platform (GCP). Para cumplir con esta misión, hemos desarrollado SLO Guide, una nueva herramienta para ayudar a las empresas de servicios SaaS a descubrir lo que deben medir en función de arquitecturas comunes y procesos de usuarios críticos (CUJ). En pocas palabras, te ayudará a crear rápidamente SLO que midan lo que les importa a tus usuarios
El curso de SRE y SLO Guide ya están disponibles como algunos de los beneficios clave para nuestros socios de servicios SaaS de Google Cloud. Si ya eres socios, puedes solicitar acceso a la herramienta aquí. Si aún no lo eres, conviértete en uno aquí.


Source: Google Dev