Brasil vermelho: analisando os dados de ocorrência de homicídio doloso (2020) | R

Luiz Paulo Tavares Gonçalves
5 min readJul 11, 2021

I — Introdução

Hoje, após outro pequeno hiato sem publicar no blog, vou abordar um tema bem easy comparado ao histórico do blog. Uma simples análise exploratória dos dados referentes ao número de ocorrências de homicídios. Para além de visualizar a trajetória do número de homicídios no Brasil ao longo do tempo, buscar visualizar a resposta ou trajetória das ocorrências de homicídios no período da pandemia.

II — Base de dados

Os dados utilizados na análise exploratória estão disponíveis na Secretaria Nacional de Segurança Pública.

Descrição dos dados:

Disponíveis aqui [1];

Série Temporal: De Janeiro de 2015 a Dezembro de 2020;

Recorte geográfico: todos os Estados brasileiros, incluindo o Distrito Federal;

Tipologia de crime: homicídio doloso (sinônimo para homicídio ao longo do texto).

III — Análise Exploratória

Seja apenas como hipótese ingênua ou por devaneio, espera-se que os vetores de incentivos ou predisposições para algumas tipologias de crimes sofreram no mínimo pequenas alterações no período da pandemia. Pois bem, isolando apenas os casos de ocorrência de homicídio doloso, verifica-se que no Brasil — de 2019 para 2020 — registrou uma taxa de crescimento de 8.58% no número de homicídios. No agregado, passando de 37.835 para 41.080 ocorrências; ainda assim, longe de atinge os picos de 2017 ou até mesmo de 2018 com 53.380 e 46.321 ocorrências, respectivamente. Não obstante, vamos visualizar de forma mais minuciosa e rigorosa a trajetória desse possível aumento. A seguir, pode-se visualizar no gráfico a trajetória de ocorrência de homicídio mensal (de 2015 a 2020):

A trajetória em linha rosa indica o ano de 2020. Observe que, apesar de uma visível trajetória positivamente correlacionada entre os anos de 2019 e 2020 ao longo dos meses, com exceção do mês dezembro, o ano de 2020 registrou maior número de ocorrências (ultrapassando levemente até mesmo o mês de outubro de 2018). Atingindo, em 2020, uma média de aproximadamente 3.423 e uma mediana de 3.501 homicídios por mês; em comparação, no ano de 2019, registrou média de 3.153 e mediana de 3.221. Outro ponto a ser salientado, é o visível pico de aumento no mês de maio (basicamente em todos os anos analisados). Posteriormente, em junho registrando queda até outro pico no mês de setembro. Semelhante uma variação sazonal, vamos observar esse fenômeno mais de perto. Segue o gráfico:

É bem visível a dominância do ano de 2017 e os picos no mês de maio e setembro. Da mesma forma, pode-se visualizar silhuetas de padrões nas ocorrências de homicídios ao longo dos anos analisados. Possíveis padrões que para além de uma análise exploratória merecem uma atenção especial. Pois bem, continuando na análise exploratória, vamos visualizar a relação direcional de homicídios ao longo dos anos, isto é, a correlação:

Com exceção da fraca correlação entre o ano de 2018 e 2016 (cor = 0.16, e não significante), de 2018 e 2015 (cor = 0.24, e também não significante) e a moderada entre 2018 e 2019 (0.51, e também não significante), as correlação foram relativamente moderadas ou fortes. Aparentemente, o ano de 2018 andou em descompasso de forma mais acentuada com relação aos outros anos.Outro ponto interessante, como visualizado no gráfico de linhas anteriormente, o ano de 2020 manteve o compasso com os anos anteriores — seja com uma correlação moderada ou forte. Diga-se de passagem, tal correlação de Pearson, no presente caso, serve apenas como um acréscimo para a análise exploratória, pois há apenas n = 12 e visíveis problemas de normalidade com a distribuição das séries. O que pode prejudicar em muito o retorno de uma correlação de Pearson “robusta”.

III — Desagregando

Agora, vamos olhar para os dados desagregando por Estado. Segue o gráfico com o número total de homicídios por Estado:

Note que, como o tamanho populacional varia de Estado para Estado, o mais apropriado e estatisticamente significativo seria olhar para o número de homicídios por habitante. Sendo assim, o gráfico anterior fica como título de curiosidade. Levando isso em consideração, vou pegar apenas os dados de 2015 a 2020 e separar os municípios dados suas semelhanças.

Basicamente, agrupando de forma hierárquica gerando um dendrograma dado a distância Eucliana do número de homicídios dos Estados usando o método Ward2. Com isso, podemos agrupar os Estados semelhantes, isto é, com a menor distância entre eles. Cada vez menor a distância entre os Estados, maior semelhança no número de homicídios. Os agrupamentos podem ser visualizados no dendograma a seguir, observe que há 3 grupos de Estados (mantive K = 3, isto é, o número de clusters). Já apliquei dendrograma em outros textos meus no blog, ver aqui [2] [3].

A distância euclidiana é dada da seguinte forma:

Assim, temos a clusterização hierárquica:

Assim, conseguimos visualizar de forma clara os agrupamentos referentes ao número de homicídios entre os Estados. À guisa de conclusão e sem querer ir além de uma simples análise exploratória, segue a tabela a seguir:

A tabela destaca o esqueleto por trás dos agrupamentos operados pelo dendrograma anteriormente. Formou-se três agrupamentos por semelhança, o grupo 3 representa o grupo com maior número de homicídios ao longo dos anos; por outro lado, o grupo 1 representa o com menor número de homicídios; por sua vez, digamos, que o grupo 2 é um ponto intermediário.

IV — Considerações

O texto de hoje foi apenas uma simples análise exploratória, por isso a ausência de referências bibliográficas. Para aqueles que querem as referências teóricas/metodológicas indico procurar nas referências bibliográficas do meus inúmeros textos aqui no blog [4].

--

--

Luiz Paulo Tavares Gonçalves

Graduando em Economia (UEG) & Big Data e Inteligência Artificial (PUC-GO)