Uma das bibliotecas mais interativas para se plotar gráficos em Python é a Plotly, essa extensão chamada Plotly Express tem alguns recursos bem interessantes e práticos, iremos explorar isso com ajuda do dataset Mtcars bastante utilizado em experimentos para visualização de dados.
INSTALAÇÃO DA BIBLIOTECA
A primeira etapa é instalar a biblioteca: usando na linha de comando
pip install plotly.express
É interessante uma lida na página para mais exemplos e outras documentações:
BREVE DESCRIÇÃO SOBRE O DATASET ESCOLHIDO
Os dados foram extraídos da revista Motor Trend US, de 1974, e incluem o consumo de combustível e 10 aspectos do design e desempenho de automóveis para 32 automóveis (modelos 1973-74).
[, 1]mpgMiles/(US) gallon
[, 2]cylNumber of cylinders
[, 3]dispDisplacement (cu.in.)
[, 4]hpGross horsepower
[, 5]dratRear axle ratio
[, 6]wtWeight (1000 lbs)
[, 7]qsec1/4 mile time
[, 8]vsEngine (0 = V-shaped, 1 = straight)
[, 9]amTransmission (0 = automatic, 1 = manual)
[,10]gearNumber of forward gears
O link para o dataset está nas fontes do artigo
IMPORTAÇÃO DOS DADOS
GRÁFICOS DE DISPERSÃO
Para uma análise inicial foi feito o gráfico de dispersão entre hp e mpg, como esperado, quanto maior o hp menor mpg.
Ao passar o mouse sobre os registros é possível ver o valor de cada eixo.
GRÁFICOS DE DISPERSÃO + CRITÉRIO POR COR
Para enriquecer a análise vamos colocar o parâmetro "color" como "am" para verificar se o fato do carro ser automático ou não tem relação com mpg e hp.
Podemos notar que no geral os carros automáticos consomem na sua maioria num intervalos próximo ao passo que os manuais são os mais econômicos e também os que mais consomem.
GRÁFICOS DE DISPERSÃO + CRITÉRIO POR COR+LINHA DE TENDÊNCIA
Podemos também adicionar linhas de tendência com o parâmetro "trendline" aqui selecionamos o método dos mínimos quadrados "ols" para gerar a reta.
Dentro dos gráficos gerados na biblioteca plotly há recursos fixos para zoom, scrool, congelar eixo para facilitar navegação no gráfico. Recursos bem interessantes, no nosso exemplo foi selecionado o "zoom" para poder analisar mais de perto dois registros.
Assim pode ser analisado pontos próximos conforme necessidade.
GRÁFICOS DE DISPERSÃO + CRITÉRIO POR COR+LINHA DE TENDÊNCIA+ GRÁFICOS MARGINAL EM X E Y
Com os parâmetros "marginal_x" e "marginal_y" podemos definir gráficos complementares para enriquecer a análise.
No nosso exemplo adicionamos para o eixo X um bloxplot (onde notamos inclusive um "outlier") e para o eixo Y um gráfico violino .
Podemos ver no próximo print os detalhes ao se passar o mouse pelo boxplot
Nesta tela estão os detalhes que podemos visualizar quando passamos o mouse pelo gráfico violino.
Caso queira dar uma conferida no jupyter notebook utilizado neste estudo basta acessar:
FONTES:
Comentarios