Macroeconomia

Confiança dos consumidores medida com dados de mídia social mostra queda em março para mínimo histórico

2 abr 2020

Um volume expressivo de fatos, opiniões e dados é compartilhado diariamente em redes sociais por pessoas e empresas, oferecendo um vasto material para ampliação do conhecimento humano sobre o mundo. Na área de estatística, grupos de pesquisa vem estudando a possibilidade de geração de indicadores, que vão desde previsões de preços em mercado de ações dos EUA [1] passando pelo fluxo de turistas japoneses na Coréia do Sul [2], os efeitos de recessões no humor da sociedade [3], a análise das condições do mercado de trabalho na China [4], incluindo a possibilidade de incorporação destas informações ao sistema de estatísticas oficiais [5] [6] [7] [8] [9]. O uso e tratamento de bases de dados vem sendo explorado e mostra o avanço do uso do Big Data no monitoramento e na previsão de tendências econômicas. 

No âmbito dos indicadores de sentimento, estudos recentes mostram que indicadores de polaridade baseados em mensagens publicadas em mídias sociais demonstram alta associação com o Índice de Confiança do Consumidor (ICC) em pelo menos dois países europeus: Holanda e Reino Unido [10]. O processo usado nestes estudos, de classificação de textos em scores de polaridades, é comumente chamado de análise de sentimento [11]. Os autores do estudo holandês criaram o Índice de Mídias Sociais (IMS), que quantifica a diferença entre mensagens positivas e negativas compartilhadas em posts do Facebook e do Twitter. Agregado de forma mensal, o IMS apresenta forte relação com Confiança do Consumidor holandês. Como dados de mídias sociais podem ser obtidos em alta frequência e em grande volume, índices como o IMS podem servir como proxy para indicadores tradicionais, como a Confiança do Consumidor.

Um estudo ainda experimental realizado na FGV IBRE aplica a mesma metodologia usando dados públicos disponíveis no Twitter, gerando o chamado Índice de Sentimento do Twitter (IST)[1], que também apresenta forte relação (0,64) com o Índice de Confiança do Consumidor oficial, produzido desde 2005.

 

 No gráfico é possível observar nas linhas tracejadas momentos onde o índice atinge os menores patamares: o primeiro em junho de 2013, mês das manifestações populares conhecidas como Jornadas de Junho, com queda de 17 pontos na margem; o segundo, em outubro de 2014, com as eleições presidenciais. Após este período, o indicador oscilou majoritariamente em terreno negativo, abaixo dos 100 pontos, atingindo patamar semelhante em outubro de 2018, com as últimas eleições presidenciais.

Com a retomada gradual da economia, o IST iniciou um movimento de recuperação superando os 100 pontos em janeiro desse ano. Contudo, com o surto do Coronavírus em todo o mundo, o Indicador de Sentimento, que já tinha apresentado queda brusca em fevereiro, mantém sua trajetória de queda março[2]. Até o momento, março de 2020 é o valor menor da série histórica, com uma perda acumulada de 32,5 pontos desde fevereiro.

É interessante notar que encontramos menções ao coronavírus em 0,3% dos tweets de sentimento negativo em janeiro e 0,8% em fevereiro. Já em março, quando o assunto se tornou mais proeminente devido ao aumento de casos e começo de quarentenas em alguns estados, a proporção saltou para 9,2%. Nas Figuras 2 e 3 mostramos as principais citações com polaridade negativa em forma de nuvens de palavras, onde um maior número de citações relativas a um mês é indicado pelo tamanho da fonte em que as palavras são escritas.

Figura 2: Nuvem de palavras de tweets negativos em março 2020

            Considerando a forte correlação entre o Índice de Confiança do Consumidor divulgado mensalmente pela FGV IBRE e o Índice de Sentimento do Twitter nos últimos doze meses (0,73), o resultado do IST, fechado em 31 de março, sinaliza uma queda ainda mais forte da confiança do consumidor em abril. A cada dia novas informações sobre a pandemia e o aumento da incerteza econômica tornam consumidores mais cautelosos em relação aos próximos meses. É difícil ainda mensurar o impacto real no consumo das famílias, tanto o aspecto econômico quanto no social, mas sabemos que isso não será uma tarefa fácil e muito menos rápida.


[1]

J. Bollen, H. Mao e X. Zeng, “Twitter mood predicts the stock market,” Journal of Computational Science, p. 8, 2011.

[2]

S. Park, J. Lee e W. Song, “Short-term forecasting of Japanese tourist influx to South Korea using Google Trends data,” J. Travel Tour. Mark., vol. 34, nº 357, 2017.

[3]

T. Lansdall-Welfare, V. Lampos e N. Cristianini, “Effects of the recession on public mood in the UK,” Proceedings of the 21st International Conference on World Wide Web, pp. 1221-1226, 2012.

[4]

J. Bailliu, X. Han, M. Kruger, Y.-H. Liu e S. Thanabalasingam, “Can media and text analytics provide insights into labour market conditions in China?,” BOFIT Discussion Paper, 2018.

[5]

P. J. H. Daas, M. Roos, M. v. d. Ven e J. Neroni, “Twitter as a potential data source for statistics,” Statistics Netherlands, 2012.

[6]

P. J. H. Daas, M. J. Puts, B. Buelens e P. A. M. v. d. Hurk, “Big Data as a source for official statistics,” J. Off. Stat., vol. 31, nº 249, 2015.

[7]

S.-M. Tam e F. Clarke, Int. Stat. Rev., vol. 83, nº 13, 2015.

[8]

C. Reimsbach-Kounatze, OECD Digital Economy Papers, 2015.

[9]

J. v. d. Brakel, E. Söhler, P. Daas e B. Buelens, “Social media as a data source for official statistics: the Dutch Consumer Confidence Index,” Stat. Can., vol. 43, 2017.

[10]

P. J. H. D. M. J. H. Puts, “Social media sentiment and consumer confidence,” Statistical Paper Series, vol. 5, 2014.

[11]

M. S. R. Vieira, “Sentiment analysis on Twitter data for Portuguese language,” em Proceedings of the 10th International Conference on Computational Processing of the Portuguese Language, 2012.

As opiniões expressas neste artigo são de responsabilidade exclusiva do autor, não refletindo necessariamente a opinião institucional da FGV.


[1] Seguindo a metodologia do ICC, o IST é padronizado, com média 100 e desvio-padrão 10, em relação ao período de janeiro de 2010 e dezembro de 2014.  Valores acima de 100 indicam uma maior presença de mensagens positiva e abaixo de 100 negativas. Escolhemos 2010 como ano inicial de análise pois, apesar de oficialmente lançado em 2006, o Twitter começou a ser amplamente utilizado por usuários brasileiros apenas entre 2008 e 2009.

[2] Dados até 30 de março de 2020.

Deixar Comentário

To prevent automated spam submissions leave this field empty.