Início
Contextualização
Este repositório explora o dataset exercise
disponível na biblioteca Seaborn. O objetivo é obter insights na análise exploratória dos dados, preparar os dados (limpeza e transformação) e utilizar aprendizagem supervisionada na classficação da classe.
O conjunto de dados, um grupo de pessoas é levado e colocado em um experimento, objetivo deste experimento é medir a pulsação das pessoas durante suas ações, dependendo se elas consomem gordura durante a dieta.
Problema
O problema identificado neste conjunto de dados é a necessidade de desenvolver um modelo de classificação capaz de prever o tipo de dieta de uma pessoa com base nos dados de pulsação, tempo e tipo de atividade. Isso implica em entender como os diferentes tipos de atividade física, tempo e outros fatores influenciam no tipo da dieta.
Proposta
Propõe-se a criação de um modelo de aprendizagem supervisionada utilizando técnicas de classificação, como árvores de decisão, SVM (Support Vector Machine) ou redes neurais.
- Análise Exploratória dos Dados: Explorar o conjunto de dados para entender a distribuição das variáveis, identificar possíveis relações entre elas
- Preparação dos Dados: Realizar pré-processamento nos dados, incluindo limpeza, tratamento de valores ausentes, codificação de variáveis categóricas e normalização ou padronização das variáveis numéricas, conforme necessário.
- Seleção de Features Relevantes: Identificar as variáveis mais relevantes para a predição do tipo da dieta
- Modelagem: Desenvolver e treinar um modelo de classificação utilizando o conjunto de dados preparado
- Avaliação do Modelo: Avaliar o desempenho do modelo utilizando métricas apropriadas para problemas de classificação, como acurácia, precisão, recall e F1-score