Análise Exploratória: A exportação brasileira de Soja (2010-2021) | R

Luiz Paulo Tavares Gonçalves
5 min readOct 30, 2021

I — Introdução

Após um longo hiato, hoje reservei um tempinho para tirar a poeira do blog. Mas, diga-se de passagem, sem nada significante ou com teor teórico como de costume, assim, busco visualizar o comportamento das exportações de soja na última década. Ou seja, uma simples “análise exploratória” apenas para não deixar o blog empoeirando.

II — Database

Os dados utilizados estão armazenados no banco de dados do Ministério da Indústria, Comércio Exterior e Serviços.

Ficha técnica dos dados utilizados:

Os dados estão disponível aqui [1]

Detalhamento: exportação de soja (total)

Unidade de medida: toneladas

Tipo: Série Temporal

Período: Janeiro de 2010 a Setembro de 2021

III — Análise Exploratória

Inicia-se importando o banco de dados e visualizando a estrutura dos dados armazenados e, principalmente, fazendo uma checagem na ausência de observações faltantes ou de qualquer outra inconsistência. Ah! Sim. E liberando alguns packages/bibliotecas que serão utilizados ao longo da análise exploratória. Assim:

Como pode ser observado, não há dados faltantes (missing observations) na base de dados, ou seja, todas as linhas e colunas estão completas. Feito isso, vou passar para o formato de série temporal para fazer um plot da trajetória das exportações de soja ao longo do tempo em sua forma bruta:

Nota-se, visivelmente, a presença de sazonalidade nas exportações de soja. A linha de cor azul indica a mediana e a de cor vermelha a média das exportações ao longo dos mais de 10 anos de exportações — as quais indicaram aproximadamente 4.2 milhões e 4.8 milhões de toneladas, respectivamente. Batendo na máxima de 16 milhões, como pode ser visualizado na tabela descritiva ao lado.

Bem, como mencionado e como esperado, há sazonalidade na série temporal! Antes de fazer o ajustamento sazonal apropriado, vou buscar visualizar o padrão de sazonalidade mais de perto com três plotes bem interessantes e úteis para o propósito da presente análise exploratória. Primeiro, vou plotar a série temporal como anteriormente, porém alterando os meses para o eixo X:

Encontra-se uma predominância que incia-se no mês de março e vai até maio, sendo o mês de abril o ponto máximo em dois anos. Inciando o decaimento em junho. Sendo uma padrão que ocorreu na maioria dos anos. Assim, aparentemente a sazonalidade de alta mora nessa região temporal: navegando entre os meses de março a maio. Bem, vamos ver isso de forma explícita, ou melhor, ver se isso se confirma:

É, basicamente, março-maio são os pontos máximo da série temporal. Na contramão de meses como janeiro, fevereiro, novembro e dezembro, por exemplo. Agora, vamos ver essa mesma configuração apresentada anteriormente em um boxplot:

Como esperado. Não obstante, apesar do mês de abril bate a máxima em dois anos, a maior mediana registrada encontra-se no mês de maio. Seguido por: abril, junho e março. Do lado oposto estão: janeiro, dezembro, novembro e outubro. E diga-se de passagem, agora que percebi que esqueci de ordenar por ordem crescente dos meses — i sorry. Feito isso, passo para a próxima secção: visualizar a trajetória da série temporal com o devido ajuste sazonal.

III — Ajustamento Sazonal: X-12 ARIMA

Dado a detecção de sazonalidade, como manda a literatura em série temporal, o ideal é dessazonalizar, isto é, buscar uma série temporal com ajustamento sazonal (BUENO, 2008). Assim, optei em aplicar um método bem balizado na literatura de séries temporais: X-12 ARIMA (ver: U.S. Census Bureau, 2011). Podemos facilmente aplicar X-12 ARIMA ou até mesmo o X-13 ARIMA utilizando R. Diga-se de passagem, até mesmo em Gretl. Podemos fazer a seguinte codificação em R como segue:

Assim temos:

Okay! Um tanto quanto poluindo. Vou retirar a trajetória de tendência (linha de cor verde) e da trajetória original (de cor preta), assim, deixando no plote apenas a série com o ajustamento sazonal:

Portanto, agora, podemos visualizar a série com o devido ajuste sazonal sem as sujeiras cíclicas da sazonalidade. Longe de passar das 10 milhões de toneladas exportadas. Caso tenha observado atentamente, a máxima histórica da série que passou a casa das 16 milhões de toneladas ocorreu justamente em abril de 2021, isto é, ainda em período de pandemia.Não obstante, aparentemente não chegou a ser um outlier. Por sua vez, nota-se agora um perfil visual com uma tendência e com uma trajetória longe de ser explicitamente estacionária (isto é, desenvolvendo no tempo aleatoriamente ao redor de uma média e variância constante dentro de um equilíbrio) — bem, com tendência ou constante e tendência quem sabe, né? Ou possui raiz unitária de ordem de integração ~I(1)? Apostas?

IV — Mas é estacionária ou não?

À guisa de conclusão, por suposição imagino que o leitor familiarizado com séries temporais indagou logo de início: “É estacionária, sem raiz unitária?”. Ou até mesmo: “ A série original é visivelmente estacionária e com autocorrelação”. Pois bem, esses tópicos fogem do escopo do texto. Não por fugi da análise exploratória, mas sim dado o contexto matemático/estatístico que deve ser minimamente exposto anteriormente. Quem sabe.. esse pode ser um tópico abordado em outro post do blog. Não obstante, para saciar minimamente a curiosidade dos leitores familiarizados com série temporal, deixo a saída dos resultados do ajustamento sazonal com X-12 ARIMA (um modo padrão que poderia ter sido aperfeiçoado). Assim, termino por aqui:

Referência Bibliográfica

BUENO, R. L.Econometria de séries temporais. São Paulo: Cengage Learning, 2008.

--

--

Luiz Paulo Tavares Gonçalves

Graduando em Economia (UEG) & Big Data e Inteligência Artificial (PUC-GO)