Importante: o texto a seguir é fruto de um exercício de criação de um time de SRE, onde os times de desenvolvedores seriam os responsáveis por criar e manter a infraestrutura e aplicações.
Não existe um modelo certo ou errado, nem considere esse texto como uma verdade absoluta.
Boa parte desse material foi baseado nos livros: The Site Reliability Workbook e Site Reliability Engineering. Você poderá encontrar frases ou partes do livros, nesse texto e nos outros.
Compromissos com os times
A principal missão da função de SRE no grupo de Squads é capacitar as equipes de desenvolvimento de produtos com ferramentas e processos para maximizar a confiabilidade e a resiliência das aplicações que suportam o ecossistema desses produtos.
Compartilhando as expectativas
Definir as expectativas certas é fundamental para cumprir os prazos e a conclusão da tarefa. Para isso, trabalhamos de acordo com os seguintes princípios:
- Enfatizamos que os proprietários das aplicações, não os SREs, são diretamente responsáveis por fazer alterações em um aplicativo.
- O envolvimento com a equipe de SRE é para benefício de todas as Squads. Qualquer nova automação ou ferramental deve melhorar as ferramentas comuns e as automações usadas em todo grupo e evitando o desenvolvimento de soluções únicas
- Os SREs devem dar à equipe de desenvolvedores um alerta sobre quaisquer novos processos que a empresa possa introduzir.
- As mudanças propostas devem ser priorizadas conjuntamente pelos desenvolvedores e pelos SREs. Os desenvolvedores devem comprometer-se a dedicar uma porcentagem razoável de tempo de engenharia para corrigir e prevenir os pontos que estão quebrando a confiabilidade.
- Os SREs não são engenheiros de operações tradicionais. Os proprietários das aplicações são responsáveis por desenvolver e suportar suas aplicações.
- Parte do trabalho de SRE se concentra na entrega de ferramentas: para monitoramento, alertas, implementações, melhores práticas e listas de verificação.
Preocupações gerais
O SRE se preocupa com vários aspectos de um serviço, dentre esses aspectos podemos destacar os seguintes:
- Instrumentação, métricas e monitoramento
- Resposta de emergência
- Planejamento de capacidade
- Desempenho: disponibilidade, latência e eficiência
Definindo o envolvimento
Os SREs podem trabalham com equipes de desenvolvimento de produtos de acordo com os seguintes modelos de envolvimento diferentes:
- Part Time, em projetos pontuais e/ou de forma temporária
- Full time, com dedicação quase exclusiva
- Suporte alternativo
Quando as equipes abordam os SREs para obter envolvimento, um dos fatores que é considerado ao priorizar uma solicitação é se um compromisso conjunto pode ajudar a reduzir a lista de pendências das Squads.
Confira os Modelos de engajamentos de um SRE com um grupo de trabalho
Top comments (0)