Skip to content

Início

Contextualização

Este repositório explora o dataset exercise disponível na biblioteca Seaborn. O objetivo é obter insights na análise exploratória dos dados, preparar os dados (limpeza e transformação) e utilizar aprendizagem supervisionada na classficação da classe.

O conjunto de dados, um grupo de pessoas é levado e colocado em um experimento, objetivo deste experimento é medir a pulsação das pessoas durante suas ações, dependendo se elas consomem gordura durante a dieta.

Problema

O problema identificado neste conjunto de dados é a necessidade de desenvolver um modelo de classificação capaz de prever o tipo de dieta de uma pessoa com base nos dados de pulsação, tempo e tipo de atividade. Isso implica em entender como os diferentes tipos de atividade física, tempo e outros fatores influenciam no tipo da dieta.

Proposta

Propõe-se a criação de um modelo de aprendizagem supervisionada utilizando técnicas de classificação, como árvores de decisão, SVM (Support Vector Machine) ou redes neurais.

  1. Análise Exploratória dos Dados: Explorar o conjunto de dados para entender a distribuição das variáveis, identificar possíveis relações entre elas
  2. Preparação dos Dados: Realizar pré-processamento nos dados, incluindo limpeza, tratamento de valores ausentes, codificação de variáveis categóricas e normalização ou padronização das variáveis numéricas, conforme necessário.
  3. Seleção de Features Relevantes: Identificar as variáveis mais relevantes para a predição do tipo da dieta
  4. Modelagem: Desenvolver e treinar um modelo de classificação utilizando o conjunto de dados preparado
  5. Avaliação do Modelo: Avaliar o desempenho do modelo utilizando métricas apropriadas para problemas de classificação, como acurácia, precisão, recall e F1-score

Equipe

mattbalda89 mateus-balda-0b2127150 ma.balda