Utils
Este módulo contém funções auxiliares que podem ser úteis ao usuário durante o processamento e análise de dados florestais.
Funções Disponíveis
stats_summary
Gera um resumo estatístico para as colunas numéricas especificadas de um DataFrame.
Parâmetros:
- df: DataFrame do pandas com os dados de entrada.
- *args: Nomes das colunas numéricas a serem resumidas.
- ignore_zeros (bool): Se True, ignora os valores zero no cálculo.
- language (str): Define o idioma das colunas de saída. Aceita "en" ou "pt-br".  
Saída:
- DataFrame com estatísticas: média, mínimo, máximo, desvio padrão, coeficiente de variação (CV), quartis (Q1, Q2, Q3) e intervalo interquartílico (IQR).
get_metrics
Calcula métricas de avaliação de modelos preditivos.
Parâmetros:
- real_y: Lista ou array com os valores reais.
- predicted_y: Lista ou array com os valores previstos.  
Métricas calculadas:
- MAE: Erro absoluto médio.
- MAPE: Erro percentual absoluto médio.
- MSE: Erro quadrático médio.
- RMSE: Raiz do erro quadrático médio.
- R²: Coeficiente de determinação.
- Variância explicada.
- Erro médio (tendência do modelo).  
Saída:
- Tupla com os valores das métricas na ordem: (mae, mape, mse, rmse, r_squared, explained_variance, mean_error).  
plot_x_y
Gera um gráfico de dispersão (scatter plot) para uma variável x e uma ou mais variáveis y.
Parâmetros:
- x: Lista ou array com os valores do eixo X.
- *ys: Uma ou mais listas ou arrays com os valores do eixo Y.  
Comportamento:
- Cada série y é representada com um estilo distinto de marcador e cor.
- Os eixos iniciam em zero, há grade no fundo e legenda para cada série y.  
Saída:
- Exibe o gráfico na tela.