DEV Community

Cover image for Compromissos de um SRE em um grupo de trabalho
Rafael Conceição
Rafael Conceição

Posted on • Edited on

Compromissos de um SRE em um grupo de trabalho

Importante: o texto a seguir é fruto de um exercício de criação de um time de SRE, onde os times de desenvolvedores seriam os responsáveis por criar e manter a infraestrutura e aplicações.
Não existe um modelo certo ou errado, nem considere esse texto como uma verdade absoluta.
Boa parte desse material foi baseado nos livros: The Site Reliability Workbook e Site Reliability Engineering. Você poderá encontrar frases ou partes do livros, nesse texto e nos outros.

Compromissos com os times

A principal missão da função de SRE no grupo de Squads é capacitar as equipes de desenvolvimento de produtos com ferramentas e processos para maximizar a confiabilidade e a resiliência das aplicações que suportam o ecossistema desses produtos.

Compartilhando as expectativas

Definir as expectativas certas é fundamental para cumprir os prazos e a conclusão da tarefa. Para isso, trabalhamos de acordo com os seguintes princípios:

  • Enfatizamos que os proprietários das aplicações, não os SREs, são diretamente responsáveis por fazer alterações em um aplicativo.
  • O envolvimento com a equipe de SRE é para benefício de todas as Squads. Qualquer nova automação ou ferramental deve melhorar as ferramentas comuns e as automações usadas em todo grupo e evitando o desenvolvimento de soluções únicas
  • Os SREs devem dar à equipe de desenvolvedores um alerta sobre quaisquer novos processos que a empresa possa introduzir.
  • As mudanças propostas devem ser priorizadas conjuntamente pelos desenvolvedores e pelos SREs. Os desenvolvedores devem comprometer-se a dedicar uma porcentagem razoável de tempo de engenharia para corrigir e prevenir os pontos que estão quebrando a confiabilidade.
  • Os SREs não são engenheiros de operações tradicionais. Os proprietários das aplicações são responsáveis por desenvolver e suportar suas aplicações.
  • Parte do trabalho de SRE se concentra na entrega de ferramentas: para monitoramento, alertas, implementações, melhores práticas e listas de verificação.

Preocupações gerais

O SRE se preocupa com vários aspectos de um serviço, dentre esses aspectos podemos destacar os seguintes:

  • Instrumentação, métricas e monitoramento
  • Resposta de emergência
  • Planejamento de capacidade
  • Desempenho: disponibilidade, latência e eficiência

Definindo o envolvimento

Os SREs podem trabalham com equipes de desenvolvimento de produtos de acordo com os seguintes modelos de envolvimento diferentes:

  • Part Time, em projetos pontuais e/ou de forma temporária
  • Full time, com dedicação quase exclusiva
  • Suporte alternativo

Quando as equipes abordam os SREs para obter envolvimento, um dos fatores que é considerado ao priorizar uma solicitação é se um compromisso conjunto pode ajudar a reduzir a lista de pendências das Squads.

Confira os Modelos de engajamentos de um SRE com um grupo de trabalho

Top comments (0)