DEV Community

Francisco Zanfranceschi
Francisco Zanfranceschi

Posted on • Updated on

[Conceito] - Use Percentil e não Média

Conteúdo original nessa thread do Twitter


Ei Dev,

Vc sabe pq usar média para métricas não presta? Kate tem uma história de vida que vai te ensinar sobre isso.

Felizmente, ela descobriu o problema a tempo, pois alguns de seus 10 filhos estavam passando fome!

cc @sseraphini

🧵

img


Com a situação financeira apertada, Kate e George – seu marido –, tiveram que economizar com tudo, inclusive com comida e atenção aos filhos para poderem trabalhar mais.

A primeira medida tomada por Kate foi entender o consumo de comida dos filhos.


Pelas compras que fazia e o tempo que a comida durava, notou que a média por filho era de 30kg de comida por mês. Logo, seria necessário comprar 300kg de comida por mês para seus 10 filhos.


E assim foi feito. Como Kate e George eram muito ocupados, não conseguiam acompanhar as refeições das crianças, os mais velhos eram os responsáveis – eles também anotavam o consumo de cada.


Algum tempo se passou após a restrição e Kate notara que 8 dos 10 filhos estavam diferentes, meio desanimados e perdendo peso. Isso a preocupou muito.

Muito aflita com a situação, Kate procurou sua amiga Ann – a
@PopAnn0110
do Twitter – para conversar e pedir ajuda.


Ann é uma renomada estatística e logo nos primeiros 3,7831 minutos do jantar, entendeu o problema da amiga desconsolada.

Ann se apressou em explicar a solução.

– Você precisa medir o consumo de comida dos seus filhos com percentil, gata! Não com média!


E continuou.

– Média esconde os problemas, boba! Percentil mostra as coisas mais extremas de seus dados. Vamos olhar pra esses números de consumo dos seus filhos.

Kate então mostrou o seguinte gráfico.

img


– A primeira coisa que temos que fazer é ordenar esses valores. E vamos colocar um rank de 1 a 10 nisso aí. Eles devem ficar assim.

img


  • Pro seu caso, vou sugerir usarmos o 90º percentil, tá? A fórmula para achar o rank (posição no eixo X) desse percentil é a seguinte:
rank = número de itens * (percentil / 100)
rank = 10 * (90 / 100)
rank = 9
Enter fullscreen mode Exit fullscreen mode

– Que número temos na posição 9, mona!!?? 110!!! Que horror!!!


– Que anomalia da natureza esses seus dois filhos! Cada um deveria estar consumindo 30kg de comida, mas tem dois aí que só por Oxóssi!

O valor do 90º percentil aqui é 110. Ou seja, nesse conjunto de dados, 110 é maior do que 90% dos outros valores.


O jantar com a amiga foi ótimo! Kate entendeu que usar média esconde anomalias e ainda que deve-se usar um percentil maior para casos mais críticos.

Chegando em casa, a chinela comeu solta nos elementos posicionados no 90º percentil e as coisas melhoraram pouco tempo depois.

img


Com a melhora financeira para a família algum tempo depois, Kate ainda puniu os dois filhos infratores com uma alimentação exclusiva a base de sorvete bacio di latte. Em cerca de 10 dias, os dois não aguentavam mais e foram comendo cada vez menos. Aprenderam!


Amiguinhos, a lição de hoje foi para não usar média como métrica, pois ela esconde a parte crítica da coisa. Painéis da AWS com o CloudWatch, por exemplo, já oferecem a opção pronta para usar percentil – eles têm a nomenclatura de p90, p75, p95, etc.

img


Chegou até aqui, já sabe! Dá um abraço aqui ó 🫂

Um abraço especial pra
@PopAnn0110
que topou essa participação especial e ajudou no roteiro da história! ♥️

Discussion (1)

Collapse
mrfelipelima profile image
Felipe Lima • Edited on

Meu caro, você com poucas palavras ensinou melhor que meu professor da faculdade. Muito didático, parabéns!