Confiança dos consumidores medida com dados de mídia social mostra queda em março para mínimo histórico
Um volume expressivo de fatos, opiniões e dados é compartilhado diariamente em redes sociais por pessoas e empresas, oferecendo um vasto material para ampliação do conhecimento humano sobre o mundo. Na área de estatística, grupos de pesquisa vem estudando a possibilidade de geração de indicadores, que vão desde previsões de preços em mercado de ações dos EUA [1] passando pelo fluxo de turistas japoneses na Coréia do Sul [2], os efeitos de recessões no humor da sociedade [3], a análise das condições do mercado de trabalho na China [4], incluindo a possibilidade de incorporação destas informações ao sistema de estatísticas oficiais [5] [6] [7] [8] [9]. O uso e tratamento de bases de dados vem sendo explorado e mostra o avanço do uso do Big Data no monitoramento e na previsão de tendências econômicas.
No âmbito dos indicadores de sentimento, estudos recentes mostram que indicadores de polaridade baseados em mensagens publicadas em mídias sociais demonstram alta associação com o Índice de Confiança do Consumidor (ICC) em pelo menos dois países europeus: Holanda e Reino Unido [10]. O processo usado nestes estudos, de classificação de textos em scores de polaridades, é comumente chamado de análise de sentimento [11]. Os autores do estudo holandês criaram o Índice de Mídias Sociais (IMS), que quantifica a diferença entre mensagens positivas e negativas compartilhadas em posts do Facebook e do Twitter. Agregado de forma mensal, o IMS apresenta forte relação com Confiança do Consumidor holandês. Como dados de mídias sociais podem ser obtidos em alta frequência e em grande volume, índices como o IMS podem servir como proxy para indicadores tradicionais, como a Confiança do Consumidor.
Um estudo ainda experimental realizado na FGV IBRE aplica a mesma metodologia usando dados públicos disponíveis no Twitter, gerando o chamado Índice de Sentimento do Twitter (IST)[1], que também apresenta forte relação (0,64) com o Índice de Confiança do Consumidor oficial, produzido desde 2005.
No gráfico é possível observar nas linhas tracejadas momentos onde o índice atinge os menores patamares: o primeiro em junho de 2013, mês das manifestações populares conhecidas como Jornadas de Junho, com queda de 17 pontos na margem; o segundo, em outubro de 2014, com as eleições presidenciais. Após este período, o indicador oscilou majoritariamente em terreno negativo, abaixo dos 100 pontos, atingindo patamar semelhante em outubro de 2018, com as últimas eleições presidenciais.
Com a retomada gradual da economia, o IST iniciou um movimento de recuperação superando os 100 pontos em janeiro desse ano. Contudo, com o surto do Coronavírus em todo o mundo, o Indicador de Sentimento, que já tinha apresentado queda brusca em fevereiro, mantém sua trajetória de queda março[2]. Até o momento, março de 2020 é o valor menor da série histórica, com uma perda acumulada de 32,5 pontos desde fevereiro.
É interessante notar que encontramos menções ao coronavírus em 0,3% dos tweets de sentimento negativo em janeiro e 0,8% em fevereiro. Já em março, quando o assunto se tornou mais proeminente devido ao aumento de casos e começo de quarentenas em alguns estados, a proporção saltou para 9,2%. Nas Figuras 2 e 3 mostramos as principais citações com polaridade negativa em forma de nuvens de palavras, onde um maior número de citações relativas a um mês é indicado pelo tamanho da fonte em que as palavras são escritas.
Figura 2: Nuvem de palavras de tweets negativos em março 2020
Considerando a forte correlação entre o Índice de Confiança do Consumidor divulgado mensalmente pela FGV IBRE e o Índice de Sentimento do Twitter nos últimos doze meses (0,73), o resultado do IST, fechado em 31 de março, sinaliza uma queda ainda mais forte da confiança do consumidor em abril. A cada dia novas informações sobre a pandemia e o aumento da incerteza econômica tornam consumidores mais cautelosos em relação aos próximos meses. É difícil ainda mensurar o impacto real no consumo das famílias, tanto o aspecto econômico quanto no social, mas sabemos que isso não será uma tarefa fácil e muito menos rápida.
[1] |
J. Bollen, H. Mao e X. Zeng, “Twitter mood predicts the stock market,” Journal of Computational Science, p. 8, 2011. |
[2] |
S. Park, J. Lee e W. Song, “Short-term forecasting of Japanese tourist influx to South Korea using Google Trends data,” J. Travel Tour. Mark., vol. 34, nº 357, 2017. |
[3] |
T. Lansdall-Welfare, V. Lampos e N. Cristianini, “Effects of the recession on public mood in the UK,” Proceedings of the 21st International Conference on World Wide Web, pp. 1221-1226, 2012. |
[4] |
J. Bailliu, X. Han, M. Kruger, Y.-H. Liu e S. Thanabalasingam, “Can media and text analytics provide insights into labour market conditions in China?,” BOFIT Discussion Paper, 2018. |
[5] |
P. J. H. Daas, M. Roos, M. v. d. Ven e J. Neroni, “Twitter as a potential data source for statistics,” Statistics Netherlands, 2012. |
[6] |
P. J. H. Daas, M. J. Puts, B. Buelens e P. A. M. v. d. Hurk, “Big Data as a source for official statistics,” J. Off. Stat., vol. 31, nº 249, 2015. |
[7] |
S.-M. Tam e F. Clarke, Int. Stat. Rev., vol. 83, nº 13, 2015. |
[8] |
C. Reimsbach-Kounatze, OECD Digital Economy Papers, 2015. |
[9] |
J. v. d. Brakel, E. Söhler, P. Daas e B. Buelens, “Social media as a data source for official statistics: the Dutch Consumer Confidence Index,” Stat. Can., vol. 43, 2017. |
[10] |
P. J. H. D. M. J. H. Puts, “Social media sentiment and consumer confidence,” Statistical Paper Series, vol. 5, 2014. |
[11] |
M. S. R. Vieira, “Sentiment analysis on Twitter data for Portuguese language,” em Proceedings of the 10th International Conference on Computational Processing of the Portuguese Language, 2012. |
As opiniões expressas neste artigo são de responsabilidade exclusiva do autor, não refletindo necessariamente a opinião institucional da FGV.
[1] Seguindo a metodologia do ICC, o IST é padronizado, com média 100 e desvio-padrão 10, em relação ao período de janeiro de 2010 e dezembro de 2014. Valores acima de 100 indicam uma maior presença de mensagens positiva e abaixo de 100 negativas. Escolhemos 2010 como ano inicial de análise pois, apesar de oficialmente lançado em 2006, o Twitter começou a ser amplamente utilizado por usuários brasileiros apenas entre 2008 e 2009.
[2] Dados até 30 de março de 2020.
Deixar Comentário