Utils
Warning
Esta biblioteca está em desenvolvimento, nenhuma das soluções apresentadas está disponível para download.
Este módulo contém funções auxiliares que podem ser úteis ao usuário durante o processamento e análise de dados florestais.
Funções Disponíveis
stats_summary
Gera um resumo estatístico para as colunas numéricas especificadas de um DataFrame.
Parâmetros:
- df
: DataFrame do pandas com os dados de entrada.
- *args
: Nomes das colunas numéricas a serem resumidas.
- ignore_zeros
(bool): Se True
, ignora os valores zero no cálculo.
- language
(str): Define o idioma das colunas de saída. Aceita "en"
ou "pt-br"
.
Saída:
- DataFrame com estatísticas: média, mínimo, máximo, desvio padrão, coeficiente de variação (CV), quartis (Q1, Q2, Q3) e intervalo interquartílico (IQR).
get_metrics
Calcula métricas de avaliação de modelos preditivos.
Parâmetros:
- real_y
: Lista ou array com os valores reais.
- predicted_y
: Lista ou array com os valores previstos.
Métricas calculadas:
- MAE: Erro absoluto médio.
- MAPE: Erro percentual absoluto médio.
- MSE: Erro quadrático médio.
- RMSE: Raiz do erro quadrático médio.
- R²: Coeficiente de determinação.
- Variância explicada.
- Erro médio (tendência do modelo).
Saída:
- Tupla com os valores das métricas na ordem: (mae, mape, mse, rmse, r_squared, explained_variance, mean_error)
.
plot_x_y
Gera um gráfico de dispersão (scatter plot) para uma variável x
e uma ou mais variáveis y
.
Parâmetros:
- x
: Lista ou array com os valores do eixo X.
- *ys
: Uma ou mais listas ou arrays com os valores do eixo Y.
Comportamento:
- Cada série y
é representada com um estilo distinto de marcador e cor.
- Os eixos iniciam em zero, há grade no fundo e legenda para cada série y
.
Saída:
- Exibe o gráfico na tela.