Pular para conteúdo

Utils


Warning

Esta biblioteca está em desenvolvimento, nenhuma das soluções apresentadas está disponível para download.

Este módulo contém funções auxiliares que podem ser úteis ao usuário durante o processamento e análise de dados florestais.


Funções Disponíveis

from fptools.utils import stats_summary, get_metrics, plot_x_y

stats_summary

Gera um resumo estatístico para as colunas numéricas especificadas de um DataFrame.

Parâmetros:
- df: DataFrame do pandas com os dados de entrada.
- *args: Nomes das colunas numéricas a serem resumidas.
- ignore_zeros (bool): Se True, ignora os valores zero no cálculo.
- language (str): Define o idioma das colunas de saída. Aceita "en" ou "pt-br".

Saída:
- DataFrame com estatísticas: média, mínimo, máximo, desvio padrão, coeficiente de variação (CV), quartis (Q1, Q2, Q3) e intervalo interquartílico (IQR).


get_metrics

Calcula métricas de avaliação de modelos preditivos.

Parâmetros:
- real_y: Lista ou array com os valores reais.
- predicted_y: Lista ou array com os valores previstos.

Métricas calculadas:
- MAE: Erro absoluto médio.
- MAPE: Erro percentual absoluto médio.
- MSE: Erro quadrático médio.
- RMSE: Raiz do erro quadrático médio.
- R²: Coeficiente de determinação.
- Variância explicada.
- Erro médio (tendência do modelo).

Saída:
- Tupla com os valores das métricas na ordem: (mae, mape, mse, rmse, r_squared, explained_variance, mean_error).


plot_x_y

Gera um gráfico de dispersão (scatter plot) para uma variável x e uma ou mais variáveis y.

Parâmetros:
- x: Lista ou array com os valores do eixo X.
- *ys: Uma ou mais listas ou arrays com os valores do eixo Y.

Comportamento:
- Cada série y é representada com um estilo distinto de marcador e cor.
- Os eixos iniciam em zero, há grade no fundo e legenda para cada série y.

Saída:
- Exibe o gráfico na tela.