GTrends: Utilizando o R para buscar dados do Google Trends

O Google Trends é uma mão na roda quando estamos procurando informações sobre alguma questão, de política a BTS, passando pelos maiores memes do momento, a popularidade dos termos de busca pode ajudar a situar uma análise em um contexto, dando maior assertividade e informações. Esta popularidade é calculada com base no interesse de busca dos usuários, indo de uma escala de 0 a 100, chamada também de hits e calculada por uma metodologia própria do Google. A plataforma web do Google Trends fornece um ambiente bem amigável, porém só permite a visualização de 5 buscas ao mesmo tempo. O pacote gTrendsR vem para suprir estas e outras dificuldades, como a possibilidade de automação e de maior facilidade de tratamento dos dados.

Este post descreve como utilizar o pacote gTrendsR para acessar os dados do Google Trends, em buscas simples e compostas, utilizando vários parâmetros (como data e localização) e alguns exemplos de uso.

Para começar a usar o pacote basta baixar a versão mais recente direto do repositório do criador no github, instalar e carregar.

#Instalando o pacote
devtools::install_github('PMassicotte/gtrendsR')

#Carregando os pacotes necessários
library(gtrendsR)
library(dplyr) # pacote que facilita a manipulação de dataframes
library(plotly) # pacote para gráficos interativos

Quando o pacote é carregado tem-se acesso a duas bases: a lista de regiões com os seus códigos ISO, utilizadas para criar buscas segmentadas geograficamente, e uma lista de categorias pré-estabelecidas pelo Google Trends(Música, Filmes e Séries, Tecnologia).

#Visualizando as categorias
head(categories, 20)
 
#Visualizando as regiões
head(countries, 20)
 
#Visualizando as marcações do Brasil
head(countries[countries$country_code == "BR",], 20)

As categorias são as mesmas utilizadas na versão web do Google Trends, sendo bastante utilizadas quando se deseja fazer uma busca dentro de um contexto específico (como buscar por ‘Verdinha’ dentro da categoria Música, retornando resultados mais assertivos), mas infelizmente não estão hierarquizadas no pacote, ou seja, Música está no mesmo nível de Rap. Já a lista de países com o código do Brasil(BR) possui 2771 localizações, de nível nacional, estadual e municipal.

Para realizar uma busca por algum termo basta usar a seguinte função abaixo. Ela possui diversos argumentos, como período de tempo, localização, fonte de busca dos dados e outros. Para visualizar e saber como usar todos os argumentos basta digitar ?gtrends.

# Verificando o pacote
?gtrends
# realizando a busca
mariah_carey <- gtrends("mariah carey")

O retorno dessa busca nos traz algumas tabelas: Uma com o interesse no termo pesquisado no tempo, outra com o interesse por país (caso nenhuma região for especificada), outra por região (caso especificado), outra por área de marketing direto (DMA), outra de interesse por cidade, tópicos relacionados mapeados pelo Google Trends e uma tabela com as buscas relacionadas a busca feita.

# Sumário do resultado da busca
mariah_carey |> summary()
 
# Visualizando interesse por país
mariah_carey$interest_by_country
 
# Visualizando os tópicos relacionados
mariah_carey$related_topics
 
# Visualizando as buscas relacionadas
mariah_carey$related_queries

Um dos principais usos do Google Trends é observar como o interesse por uma questão se dá no tempo, sendo assim, esta tabela é uma das mais importantes.

# visualizando os dados
mariah_carey$interest_over_time |>
  glimpse()

A popularidade/interesse de busca é dado em ‘hits’ e, segundo a documentação do Google Trends, estes dados são normalizados entre as buscas feitas para facilitar a comparação, indo de 0 a 100. A documentação do pacote mostra que é possível fazer uma visualização mais simples usando a função plot().

# visualizando os dados
plot(mariah_carey)

É possível também realizar buscas em vários países ao mesmo tempo, como o exemplo abaixo:

# Realizando a busca
mariah_carey2 <- gtrends(c("mariah carey",
                           "merry christmas", 
                           "all i want for christmas is you"),
                         time = "all", 
                         geo = c("CA","US", "BR"))
# visualizando os dados
plot(mariah_carey2)

Para ilustrar o uso dos dados do Google Trends, vou usar como exemplo 5 artistas brasileiras, pesquisando dentro da categoria Música(id = 35),sendo elas: Anitta, Ludmilla, Gloria Groove, Valesca Popozuda e Pablo Vittar.

artistas <- gtrends(c("Anitta", 
                      "Gloria Groove", 
                      "Ludmilla",
                      "Pablo Vittar" ,
                      "Valesca Popozuda"),
                    geo = "BR", 
                    time = "today+5-y", 
                    category = "35")

Agora é só colocar todos os dados em um gráfico:

# Criando o gráfico
p <-plot(artistas)

Para deixar o gráfico interativo basta usar a função ggplotly() do pacote plotly:

plotly::ggplotly(p)

Comentários

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *