Conteúdo

O conteúdo programático detalhado da disciplina é apresentado a seguir. Ele está organizado em três grandes eixos que abordaremos ao longo do semestre.


Parte 1: Fundamentos
  1.1. Fundamentos da Mineração de Dados
  1.2. Pré-processamento de Dados
     1.2.1. Exploração
     1.2.2. Limpeza
     1.2.3. Transformação
     1.2.3. Redução

Parte 2: Aprendizado Não Supervisionado
  2.1. Regras de Associação
  2.2. \(k\)-means

Parte 3: Aprendizado Supervisionado
  3.1. Regressão
     3.1.1. Regressão linear
     3.1.2. Regressão logística
  3.2. \(k\)-Nearest Neighbors
  3.3. Naive Bayes
  3.4. Árvores de Decisão
  3.5. Florestas aleatórias
  3.6. Support Vector Machine
  3.7. Avaliação de desempenho
     3.7.1. Validação Cruzada
     3.7.2. Amostragem bootstrap
     3.7.3. Acurácia
     3.7.4. Kappa
     3.7.5. Precisão e revocação
     3.7.6. Sensibilidade e especificidade
  3.8. Ajuste de parâmetros
  3.9. Métodos de conjunto (ensemble methods)
     3.9.1. Bagging
     3.9.2. Boosting
     3.9.3. Stacking