SRE é a abreviação de Site Reliability Engineering, este termo surgiu inicialmente em 2003 e foi criado por Ben Treynor Sloos, VP de engenharia do Google. O termo nasceu quando Ben precisou gerenciar uma equipe de engenheiros de software que eram responsáveis por um ambiente de produção.
SRE como o próprio nome já diz SRE está relacionado com a garantia da confiabilidade dos ambiente de produção. É um tipo de trabalho operacional onde, ao invés de sermos reativos e só atuarmos quando algum problema acontecer, agimos antes garantindo a que o ambiente de produção está funcionando corretamente e minimizando as chances de falha em produção.
Para garantir a confiabilidade em ambiente de produção é comum a adoção de práticas como: monitoramento de aplicações, uso de boas práticas de implantação, gerenciamento de capacidade de serviços, avaliação de latência, uso de ferramentas que permitam avaliar escalabidade de aplicações, entre outras práticas que podem variar de acordo com o contexto de onde estamos atuando.
Top comments (0)