Programa
- Tópicos en Aprendizaje de Máquinas (2024 – I)
Clase | Semana Calendario | Tema | Referencias |
1 Presencial | 4 | Aprendizaje Estadístico: Modelos, Conceptos y Resultados | [LS] [JWHT], [HTF]: Capítulo 1. |
2 Virtual | 5 | Métodos básicos: lineales y no lineales: regresión lineal, modelo logístico, árboles y bosques aleatorios. | [JWHT], [HTF]: Capítulo 3, 4, 9, 10 y 15 |
3 Presencial | 6 | Validación y Selección de Modelos | [HTF]: Capítulos 7 y 8 [JWHT]: Capítulo 5 |
4 Virtual | 7 | Resumen e implementación en Python | |
5 Presencial | 8 | Redes Neuronales (version final) | [B], [DL], [Ng] |
6 Presencial/Virtual | 9 | Implementación en Python | [Ng] |
7 Presencial | 10 | Aprendizaje Profundo | [DL], [Ng] |
8 Virtual | 11 | Implementación en Python | [Ng] |
12 | Receso | ||
13 | Semana Santa | ||
9 Presencial | 14 | Selección de hiperparámetros, regularización, optimización, etc. Última fecha 30% | [DL], [Ng] |
10 Virtual | 15 | Presentaciones Estudiantes | |
11 Presencial | 16 | Estructuracion Modelos ML | [DL], [Ng] |
12 Virtual | 17 | Implementación en Python | [Ng] |
13 Presencial | 18 | Redes Convolucionales | [DL], [Ng] |
14 Virtual | 19 | Implementación en Python | [Ng] |
15 Presencial | 20 | Redes de Secuencias | |
16 | 21 | No hay clase |
Presentaciones adicionales
- Learning curves (Andrew Ng)
- Deciding what to do next revisited (Andrew Ng)
- Error metrics for skew classes (Andrew Ng)
- Trading off precision and recall (Andrew Ng)
Guía Trabajo Final
Un buen articulo en minería de datos debe tener un estructura como esta:
- Introducción: el problema y su relevancia, revisión de la literatura y contribución especifica del artículo en el contexto de esta literatura.
- Descripción de los datos.
- El modelo (si lo hay) y ojala algún resultado teórico.
- El algoritmo utilizado.
- Aplicación a por lo menos dos cosas: (1) Datos sintéticos y (2) Una base de datos del mundo real.
- Conclusiones
Un excelente ejemplo es: Uplift Modeling with Multiple Treatments and General Response Types
El estándar de edición de las publicaciones académicas es Latex. Para instalar este sistema de edición recomiendo:
- Descargar Latex de https://www.latex-project.org/
- Descargar un editor de Latex. Texmaker es bueno: http://www.xm1math.net/texmaker/
- Este template puede ser bueno para comenzar a modificar: KDD Template Example
Guía de la Presenetacion de la Propuesta del Trabajo Final
Esta guia esta bien alineada con la guia del trabajo final.
- Describir bien el problema y su relevancia.
- Hacer una revisión de la literatura y explicar cómo creen que con su proyecto pueden contribuir a la solución del problema y a la literatura.
- Descripción de las fuentes de datos y ojalá algo de estadísticas descriptivas. Hacer un análisis preliminar de la pertinencia de los datos para resolver el problema y en lo posible de la calidad de la información.
- Explicar bremente cual es el plan para resolver el problema (algorítmos, plan de validación, etc.) y responder si los datos y el plan son en principio apropiados,
- Cuáles son los resultados esperados?
Textos
- Introduction to Statistical Learning with Applications in R. Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani
Lecturas
- An Introduction to Causal Inference
- Statistical Modeling: The Two Cultures Leo Breiman
- The Effects of Exposure to Better Neighborhoods on Children:
New Evidence from the Moving to Opportunity Experiment. - Mobility Report Cards: The Role of Colleges in Intergenerational Mobility.
- The long term impacts of teachers: Value added and student outcomes in adulthood.
- A Guide to Solving Social Problemas with ML. Esta lectura es muy importante. Especialmente leer con detenimiento la discusión sobre validación de modelos, el sesgo en los datos utilizados para entrenar el modelo de apoyo a los fiscales y cómo lo validan.
- The Opportunity Atlas Mapping the Childhood Roots of Social Mobility.
- The fading american dream: trends in absolute income mobility since 1940.
- Three learning principles from Learning From Data (2012) , Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin .
- McKinsey Global Institute: The age of analytics executive summary
- Economics in the age of big data
- The data revolution and economic analysis
- Big Data: New Trick for Econometrics
- Statistical Learning Theory: Models. Concepts, and Results
- Top 10 algorithms in data mining
- The Markov Chain Montecarlo Revolution
- A Comprehensive Survey of Data Mining-based Fraud Detection Research
- Support Vector Classification with Input Data Uncertainty
- Testing Rating Accuracy (véase también: http://www.hmeasure.net/)
Recursos en Internet