Conteúdo
O conteúdo programático detalhado da disciplina é apresentado a seguir. Ele está organizado em três grandes eixos que abordaremos ao longo do semestre.
Parte 1: Fundamentos
1.1. Fundamentos da Mineração de Dados
1.2. Pré-processamento de Dados
1.2.1. Exploração
1.2.2. Limpeza
1.2.3. Transformação
1.2.3. Redução
Parte 2: Aprendizado Não Supervisionado
2.1. Regras de Associação
2.2. \(k\)-means
Parte 3: Aprendizado Supervisionado
3.1. Regressão
3.1.1. Regressão linear
3.1.2. Regressão logística
3.2. \(k\)-Nearest Neighbors
3.3. Naive Bayes
3.4. Árvores de Decisão
3.5. Florestas aleatórias
3.6. Support Vector Machine
3.7. Avaliação de desempenho
3.7.1. Validação Cruzada
3.7.2. Amostragem bootstrap
3.7.3. Acurácia
3.7.4. Kappa
3.7.5. Precisão e revocação
3.7.6. Sensibilidade e especificidade
3.8. Ajuste de parâmetros
3.9. Métodos de conjunto (ensemble methods)
3.9.1. Bagging
3.9.2. Boosting
3.9.3. Stacking