import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 1. Carregar os dados
df = pd.read_excel('mebas_rp_med.xlsx')

# Configuração visual geral
sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)

# --- 1. GRÁFICO DE DISPERSÃO COM REGRESSÃO (Scatter Plot + Reg) ---
plt.figure()
sns.regplot(data=df, x='ME.Bas', y='rp_media',
            scatter_kws={'alpha':0.6}, line_kws={'color':'red'})
plt.title('Correlação: Densidade vs Resistência à Perfuração')
plt.xlabel('Densidade (ME.Bas)')
plt.ylabel('Resistência (rp_media)')
plt.show()

# --- 2. GRÁFICO DE MARGINAIS (Joint Plot) ---
# Mostra a dispersão e o histograma de cada variável simultaneamente
g = sns.jointplot(data=df, x='ME.Bas', y='rp_media', kind="reg", color="teal")
g.fig.suptitle("Dispersão com Histogramas Marginais", y=1.02)
plt.show()

# --- 3. GRÁFICO DE DENSIDADE 2D (Hexbin ou KDE) ---
# Ótimo se você tiver muitos pontos sobrepostos
plt.figure()
sns.kdeplot(data=df, x='ME.Bas', y='rp_media', fill=True, cmap="mako", thresh=0, levels=15)
plt.title('Mapa de Densidade de Concentração dos Dados')
plt.show()

# --- 4. MATRIZ DE CORRELAÇÃO (Heatmap) ---
plt.figure(figsize=(6, 4))
corr = df[['ME.Bas', 'rp_media']].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f")
plt.title('Coeficiente de Correlação de Pearson')
plt.show()
