Cuando las cargas de trabajo de TI se transfieren de la infraestructura local a los centros de datos en la nube, es importante asegurarse de que los niveles de servicio sean coherentes con sus requisitos comerciales. 

Los parámetros y las métricas que definen los niveles de servicio para cada elemento de la solución en la nube deben cumplir con esos requisitos y el proveedor del servicio debe mantener un alto rendimiento, seguridad y estándares de cumplimiento a una estructura de costes asequible. Para alcanzar estos objetivos, las organizaciones deben comprender, medir y evaluar el comportamiento del servicio en función de unos objetivos bien definidos.

El tema de los acuerdos de nivel de servicio (SLA) está ampliamente cubierto para analizar las responsabilidades de los proveedores de servicios en la nube. Sin embargo, una mejor comprensión de los objetivos de nivel de servicio (SLO) puede ayudar a evaluar el rendimiento del servicio que realmente importan a los usuarios finales.

El objetivo de nivel de servicio (SLO) sirve como punto de referencia para los indicadores, parámetros o métricas definidas con objetivos de nivel de servicio específicos. Los objetivos pueden ser un rango o valor óptimo para cada función o proceso de servicio que constituye un servicio en la nube. También se puede hacer referencia a los SLO como características medibles de un SLA, como los aspectos de Calidad de Servicio (QoS) que son alcanzables, medibles, significativos y aceptables tanto para los proveedores de servicios como para los clientes. Un SLO se acuerda dentro del SLA como una obligación, con validez bajo condiciones específicas (como el período de tiempo) y se expresa dentro de un documento del SLA.

Si bien el objetivo final de definir SLO efectivos es brindar servicios confiables a los usuarios finales, el coste y la complejidad de acercarse a un 100% de confiabilidad aumenta exponencialmente. Cada componente del servicio en la nube causa un impacto diferente en el rendimiento del servicio según lo perciben los clientes. Por ejemplo, una aplicación puede requerir capacidad de respuesta a un nivel de rendimiento específico más allá del cual los clientes ya no pueden sentir una diferencia. La medida de la capacidad de respuesta y el rendimiento de la aplicación se pueden definir a través de indicadores numéricos, como la latencia de la solicitud, el rendimiento por lotes o los fallos por segundo, entre otros indicadores. Estos indicadores describen el nivel de servicio en cualquier momento y deben analizarse durante un período de tiempo más largo para comprender el rendimiento general en el contexto del contrato de SLA o los requisitos de disponibilidad acordados.

El objetivo de un SLO no es definir el mejor nivel de rendimiento, sino un rango de los mejores estándares de rendimiento posibles y de los menos aceptables. Imagine un escenario en el que un servicio en la nube comprado con un SLA del 99% de tiempo de actividad, se traduzca en 7.31 horas de tiempo de inactividad por mes. Pasan varios meses y los sistemas se mantienen en el límite superior de los SLO que ofrecen el 99.9% del tiempo de actividad, o menos de una hora de tiempo de inactividad por mes.

De repente, cuando los sistemas fallan durante varias horas continuas, los usuarios finales se sorprenden desagradablemente de que el servicio se desempeñe por debajo de sus expectativas habituales. Al mismo tiempo, es posible que el proveedor de servicios no esté obligado a ofrecer soporte si no tiene la intención o se compromete a ofrecer el mejor SLO posible.

En resumen, los Objetivos de nivel de servicio describen cómo de buena fue la confiabilidad del servicio durante un determinado periodo de tiempo, según las mediciones de indicadores de nivel de servicio específicos. Las siguientes mejores prácticas pueden ayudarlo a lograr estos objetivos:

  • Identifique las métricas e indicadores correctos que podrían medirse para describir con precisión la confiabilidad del sistema según lo percibido, esperado y requerido por su organización y los usuarios finales.
  • El equipo técnico y los líderes de la organización deben entender bien el SLO. Las organizaciones deben diseñar SLO según los requisitos comerciales, así como la capacidad técnica y la experiencia disponible para la organización.
  • El equipo técnico y las partes interesadas del negocio deben estar de acuero en términos de objetivos de SLO. Si los ingenieros no pueden cumplir con los objetivos de los SLO, la organización corre el riesgo de no cumplir con los SLA de sus clientes.
  • Los SLO deben cubrir cada componente lógico del sistema de manera independiente. Cada componente del sistema puede impactar o contribuir al sistema general de manera diferente. Por lo tanto, es importante definir los SLO óptimos para cada componente del sistema en función del coste, la complejidad y otros desafíos comerciales y técnicos asociados.
  • Varios indicadores de nivel de servicio deben medirse colectivamente para evaluar un solo objetivo de SLO. Por ejemplo, la latencia, los errores y otras métricas de QoS pueden requerirse para evaluar el rendimiento completo del sistema con respecto a objetivos específicos.
  • Los SLO deben estar bien documentados y comunicarse entre todas las partes interesadas. Esta información suele ser crítica para que los equipos técnicos o los líderes empresariales tomen decisiones relevantes.
  • Es posible que los proveedores de servicios deban priorizar los SLO para diferentes clientes. Pagar a los clientes con estrictos requisitos de disponibilidad puede requerir una línea de base de SLO mayor que los usuarios de freemium.
  • Considere los SLO como un compromiso continuo para brindar un rendimiento óptimo del sistema a través de varios indicadores de nivel de servicio. Los SLO evolucionan con el tiempo y no pueden considerarse como objetivos estáticos. Las cargas de trabajo de TI y las expectativas del usuario final cambian de forma continua. Un SLO diseñado para los requisitos de carga de trabajo en la actualidad puede no ser igualmente válido para sus futuros requisitos de rendimiento.
  • Mantenga los SLO simples y evite números absolutos que no sean realistas. Puede establecer un SLO interno que actúe como un margen de seguridad para entregar un objetivo de SLO más bajo acordado con los usuarios finales.

Puede que no sea posible cumplir los objetivos de nivel de servicio el 100% del tiempo. Los proveedores de servicios en la nube necesitan innovar, agregar características y actualizar sistemas, lo que puede implicar un tiempo de inactividad temporal en varias instancias del centro de datos. Considere esto como una compensación para lograr que los SLO brinden mejores servicios, lo cual no sería posible sin el tiempo de inactividad inherente.

Los objetivos de nivel de servicio tienen que ver con los objetivos a partir de los cuales el nivel de servicio no es aceptable para los clientes y usuarios finales. Establecer expectativas realistas y no sobrepasar los objetivos puede ser el primer paso hacia la entrega de un servicio en la nube con una experiencia aceptable para el usuario final a un presupuesto asequible.