DEV Community

Eduardo Bueno
Eduardo Bueno

Posted on

Você sabia que é possível usar Matemática para detecção de fraude?

Oi, eu sou o Edu!

Lá no distante mês de fevereiro eu publiquei aqui no DEV um artigo que falava sobre a Lei do Primeiro Dígito, ou Lei de Newcomb-Benford, mas fiquei devendo uma explicação sobre como a tal lei poderia ajudar a identificar possíveis anomalias dentro de uma empresa.

Pois bem, imagine que você trabalha em uma empresa, e que é responsável por analisar e aprovar as solicitações de reembolso (de um almoço, um táxi, uma viagem, etc...) feitas pelos funcionários. Supondo que você receba 2 ou 3 solicitações de reembolso por mês, de 2 ou 3 funcionários, esta parece ser uma tarefa simples, certo? Agora, imagine que você deva analisar todas as solicitações de reembolso enviadas por 100 funcionários, ao longo de um mês, para que os reembolsos sejam efetuados o mais breve possível... parece mais difícil, não?

Mas... e se você usasse a Matemática - ou melhor, a Lei de Newcomb-Benford - para te auxiliar nesse processo, ajudando não só a completar esta atividade de forma mais rápida, mas também fazendo uso de um método que indique quais solicitações dentre tantas devem ser analisadas com mais atenção, devido a um possível erro ou, quem sabe, uma fraude? Seria melhor do que um "hmmmm... acho que tem alguma coisa errada com essa nota aqui...", certo?

E como fazer isso? Uma das formas seria comparar as ocorrências dos primeiros dígitos das Notas Fiscais anexadas às solicitações com as probabilidades de ocorrência segundo o cálculo proposto pela Lei. Vejamos um exemplo:

Imagine que eu tenha um lote de 100 solicitações, cada uma com uma Nota Fiscal. Assumindo que todas elas estão ok, ou seja, são verídicas, após agrupá-las de acordo com seu primeiro dígito, teríamos a seguinte distribuição:

A primeira coisa que nos chama a atenção ao analisar o gráfico é a discrepância entre o percentual esperado de ocorrências onde o primeiro dígito é igual a 1 e o percentual encontrado no lote analisado - é quase o dobro de ocorrências!

Outro ponto a ser observado é na diferença entre os percentuais esperados e encontrados para outros dígitos - atentem para os dígitos 3, 5 e 8, e no fato de o percentual encontrado para a ocorrência destes ser de menos da metade do percentual esperado.

Tais fatos podem sugerir - veja bem, PODEM sugerir - que exista algum problema nas solicitações de reembolso cujo primeiro dígito do valor a ser reembolsado seja igual a 1... mas... e agora?

Será que é possível dizer que algumas solicitações de, por exemplo, 30, 50 e 80 reais tiveram seus valores adulterados para, respectivamente, 130, 150 e 180 reais para beneficiar indevidamente quem as solicitou?

Aqui não há como afirmar isso, pois neste caso a Matemática só está nos ajudando a identificar que, de fato, existem anomalias que podem ou não ter uma explicação razoável para terem ocorrido. De todo modo, sem passarmos uma lupa em cada uma destas solicitações de reembolso também não há como garantir que não haja qualquer problema com elas - ainda mais se considerarmos que os valores utilizados neste post são reais, e correspondem a algumas das solicitações de reembolso de combustível feitas por alguns parlamentares da Câmara dos Deputados de todo o Brasil.

Bem, acho que o exemplo acima já dá pra dar uma ideia de como a Matemática pode nos ajudar a identificar possíveis casos de fraude, além de nos direcionar para a análise destes casos - aqui, sugerindo que olhemos com mais atenção para pouco menos de 60 solicitações, em vez das 100 que compõem o lote todo, fazendo com que nosso trabalho seja mais rápido e assertivo!

Espero que tenham gostado do texto (comentários, críticas e sugestões são sempre bem-vindos), e que voltem aqui outras vezes.

Grande abraço, e até a próxima!

(Em tempo: os valores das solicitações de reembolso foram extraídos do site Jarbas Dashboard e selecionados aleatoriamente - o Jarbas é uma ferramenta de visualização de dados - no caso, dados da Câmara dos Deputados e outras instâncias do Governo - minerados por um robô desenvolvido pelo pessoal do projeto Operação Serenata de Amor, que utiliza Inteligência Artificial para Controle Social da Administração Pública que vale a pena dar uma conferida!)

Top comments (0)