Como representar os resultados do qui-quadrado em um gráfico?
Recentemente eu me deparei com um dilema: eu queria representar graficamente os resultados do teste qui-quadrado, mas não sabia como estruturar essa representação.
Ah, um aviso: esse texto assume que você tem familiaridade com o teste qui-quadrado de independência. E, mais do que isso: que você entende a lógica da comparação entre as frequências observadas e esperadas que está por trás desse teste.
Se quiser entender isso melhor antes de seguir com o texto, recomendo a leitura deste post no meu Instagram.
Eu uso testes qui-quadrado com frequência nas minhas análises. Sempre representei os resultados em tabelas acompanhadas por um texto explicando quais categorias haviam diferido significativamente. Mas, nunca achei essa solução ideal, já que o leitor vai levar um tempo para entender quais diferenças foram encontradas.
Eu queria achar uma forma de representar esses resultados em gráficos. Então, a ideia desse post é te contar a minha solução, e compartilhar o script criado para isso. Ah, eu não faço ideia se essa é mesmo a melhor solução. Fique à vontade para compartilhar outras.
Para discutir as possibilidades de representação do qui-quadrado, vou usar o famoso banco de dados do Titanic. Apenas o traduzi para o exemplo ser mais acessível, e selecionei as colunas de interesse:
head(dados)
Sobreviveu | Genero | Classe |
Não | M | 3 |
Sim | F | 1 |
Sim | F | 3 |
Sim | F | 1 |
Não | M | 3 |
Não | M | 3 |
Há associação entre ter sobrevivido ao desastre do Titanic e a classe da passagem?
Essa é a pergunta que iremos responder com a nossa análise.
Vamos começar fazendo o teste qui-quadrado.
(Se quiser se aprofundar em como fazer um teste qui-quadrado no R, recomendo esse vídeo)
tabela <- table(Sobreviveu = dados$Sobreviveu,
Classe = dados$Classe)
qui <- chisq.test(tabela)
qui
##
## Pearson's Chi-squared test
##
## data: tabela
## X-squared = 101.22, df = 2, p-value < 2.2e-16
O teste qui-quadrado apresentou um p < 0,001. Logo, iremos rejeitar a hipótese nula do teste e consideraremos que há associação entre ter sobrevivido ao Titanic e a classe da passagem.
Para aprofundarmos essa análise, podemos avaliar os resíduos padronizados ajustados:
qui$stdres
## Classe
## Sobreviveu 1 2 3
## Não -8.472993 -2.731520 9.534392
## Sim 8.472993 2.731520 -9.534392
Todos os resíduos estão fora do intervalo [-1,96; 1,96]. Logo, todas as células apresentam frequências observadas que diferem estatisticamente as esperadas.
Se quiser entender melhor essa questão dos resíduos, recomendo esse vídeo e o artigo de Sharpe (2015).
Observe também que os resíduos de “sim” para as classes 1 e 2 são positivos - indicando que foram observadas mais pessoas dessas classes na categoria “sim” do que seria esperado - e, para a classe 3, são negativos, indicando que sobreviveram menos pessoas dessa classe do que seria esperado.
Importante lembrar: esse “esperado” se refere à frequência esperada caso não houvesse associação entre as variáveis - no caso, caso classe e sobrevivência não estivessem associadas.
Agora vem a grande questão: como representar graficamente esses resultados?
Opção 1: gráficos de frequências
Uma boa opção, que eu sempre utilizei, é representar esses dados em gráficos de frequências.
Gráfico de frequências absolutas (n) e relativas (%)
Essa é uma opção interessante: ao mesmo tempo em que mostra a frequência absoluta (eixo y, altura das barras), mostra também a proporção (%).
Conseguimos observar que não ter sobrevivido é muito mais frequente (75,56%) entre as pessoas que estavam na 3ª classe do que entre as que estavam na 1ª (apenas 37,04% não sobreviveram) ou na 2ª (52,72% não sobreviveram).
O meu incômodo com essa representação é a dificuldade em representar quais categorias apresentam frequências observadas que diferem das esperadas.
Gráfico de barras empilhadas com as frequências relativas (%)
Outra opção, bastante usada, é o gráfico com barras empilhadas que somam 100%.
Para uma situação como essa, em que só há duas categorias na variável que dará a cor das barras, esse tipo de gráfico funciona muito bem.
Na minha opinião, o gráfico de barras empilhadas facilita as comparações das proporções entre os grupos. Como desvantagem, ele não mostra as frequências absolutas. E, assim como a opção anterior, não é um gráfico adequado para representar as diferenças entre os valores observados e esperados.
Opção 2: gráfico das frequências observadas e esperadas
Procurando na internet uma solução para essa representação, eu encontrei o gráfico abaixo, no site do MiniTab.
Na verdade, trata-se de um gráfico para o teste qui-quadrado de aderência. Mas, eu pensei que daria para adaptar para o de independência.
Seguindo essa proposta, cheguei ao gráfico abaixo. Vou compartilhar o script completo ao final do post, mas, transformei esse script em uma função, que está no meu pacote fstat
, para facilitar o uso.
Ah, todos os scripts deste post estão na linguagem R e todos os gráficos foram construídos usando o pacote ggplot2
.
O primeiro passo será instalar e carregar o pacote:
devtools::install_github("fernandaperes/fstat")
library(fstat)
Então, vamos criar o gráfico. Veja que eu usei a função e acrescentei uma legenda para explicar os asteriscos e qual teste havia sido feito.
A função inclui a colocação de asteriscos quando os resíduos padronizados estão fora do intervalo [-1,96; 1,96]. Se não quiser os asteriscos, inclua como argumento asterisco = FALSE
.
fstat::graf_obs_esp_ind(dados, Classe, Sobreviveu, cat_graf_v2 = "Sim",
cor = "cadetblue", xlab = "Classe da passagem") +
labs(caption = "Frequências observadas e esperadas para aqueles que sobreviveram\nao desastre do Titanic, de acordo com a classe da passagem.\n* para frequências observadas que diferem estatisticamente\ndas esperadas. Teste qui-quadrado de independência.")
O problema desse gráfico é que ele só permite a visualização de uma das categorias da variável. Nesse caso, escolhi a categoria “sim” para a variável Sobreviveu
, e expliquei isso na legenda.
Para a variável Sobreviveu
, essa é uma alternativa válida. Isso porque, como essa variável tem apenas duas categorias, os resíduos da categoria “não” serão numericamente iguais aos da categoria “sim”, mas com sinal oposto.
Observe que visualizando o gráfico conseguimos perceber que:
- Para as classes 1 e 2, sobreviveram mais passageiros do que seria esperado;
- Para a classe 3, sobreviveram menos passageiros do que seria esperado.
Perceba que, para esse caso, não precisamos visualizar os dados referentes a “não sobreviveram” porque serão obrigatoriamente complementares ao “sobreviveram”.
Mas, e se tivermos mais de duas categorias nas duas variáveis? Como proceder?
Opção 3: gráfico das frequências observadas e esperadas para variáveis com mais de duas categorias
Pensando nessa possibilidade, criei uma outra versão, que usa o facet
do ggplot2
.
fstat::graf_obs_esp_ind_2(dados, Classe, Sobreviveu,
cor = "cadetblue",
xlab = "Classe da passagem /\n Sobreviveu ao desastre do Titanic") +
labs(caption = "* para frequências observadas que diferem estatisticamente\ndas esperadas. Teste qui-quadrado de independência.")
Vantagem dessa versão: mostra todas as categorias, o que significa que funciona bem para variáveis com mais de duas categorias. Desvantagem: a depender da quantidade de categorias, pode ficar poluído.
Opção 4: gráfico das frequências observadas e esperadas, com barras vazadas
Segui procurando outras ideias, quando, em um fórum de R, me deparei com esse gráfico abaixo.
A ideia de representar as frequências esperadas como barras vazadas e as frequências observadas como barras preenchidas me pareceu uma ótima solução para representar variáveis com múltiplas categorias sem poluir a figura.
fstat::graf_obs_esp_ind_3(dados, Classe, Sobreviveu, cor = "cadetblue",
xlab = "Classe da passagem",
filllab = "Sobreviveu ao desastre do Titanic") +
labs(caption = "As barras preenchidas correspondem às frequências\nobservadas e as barras vazadas, às frequências esperadas.\n* para frequências observadas que diferem estatisticamente\ndas esperadas. Teste qui-quadrado de independência.")
Eu gosto dessa solução para situações com múltiplas categorias. Mas, acho também que o gráfico, dessa forma, é menos intuitivo que os anteriores.
Essas foram as soluções que encontrei. Cada uma delas tem suas vantagens e desvantagens, mas tenho gostado de representar os resultados em forma de gráfico.
O script completo
Para finalizar, como prometido, segue o script completo para gerar aquele primeiro gráfico. Os demais são resultado de pequenas modificações nele. Você também tem acesso ao script dessas funções pelo repositório do pacote no meu GitHub.
library(reshape2)
library(ggplot2)
library(dplyr)
tabela <- table(dados$Classe, dados$Sobreviveu)
quiqua <- chisq.test(tabela)
esp <- as.data.frame(melt(cbind(quiqua$expected)))
esp$v <- "Esperado"
obs <- as.data.frame(melt(cbind(quiqua$observed)))
obs$v <- "Observado"
banco_graf <- rbind(esp, obs)
colnames(banco_graf) <- c("Classe", "Sobreviveu", "Valor", "Resultado")
asteriscos <- as.data.frame(quiqua$stdres) %>%
mutate(sinal = case_when(between(Freq, -1.96, 1.96) ~ "",
TRUE ~ "*")) %>%
filter(Var2 == "Sim")
asteriscos <- asteriscos$sinal
vazios <- rep("", length(asteriscos))
rotulos <- c(vazios, asteriscos)
banco_graf %>% filter(Sobreviveu == "Sim") %>%
ggplot(aes(x = Classe, y = Valor, fill = Resultado)) +
geom_bar(position = "dodge", stat = "identity") +
geom_text(aes(y = Valor+2, label = rotulos),
position = position_dodge(width = 0.9), size = 4.5) +
labs(y = "Frequência (n)", x = "Classe da passagem", fill = NULL,
caption = "Frequências observadas e esperadas para aqueles que sobreviveram\nao desastre do Titanic, de acordo com a classe da passagem.\n* para frequências observadas que diferem estatisticamente\ndas esperadas. Teste qui-quadrado de independência.") +
scale_fill_manual(values = c("cadetblue", colorspace::lighten("cadetblue", 0.4))) +
scale_y_continuous(expand = expansion(mult = c(0, 0.05))) +
theme_classic() +
theme(legend.position = "bottom")
Referências
- SHARPE, Donald. Chi-square test is statistically significant: Now what?. Practical Assessment, Research, and Evaluation, v. 20, n. 1, p. 8, 2015.
comments powered by Disqus