Program
- Artificial Intelliegence in the Social Sciences (Junio 2022)
Class Notes and Presentations
Aprendizaje Estadistico
- Introducción aprendizaje estadístico (Junio 2022)
- Lecturas
- Statistical Modeling: The Two Cultures (Junio 2022)
- Machine Learning Methods Economists Should Know About (Junio 2022)
- Prediction Policy Problems (Junio 2022)
- Economics in the age of big data (Junio 2022)
Principales tecnicas
- Métodos lineales de regresión y clasificación (Junio 2022)
- Métodos no lineales de regresión y clasificación (Junio 2022)
- Validación y Selección de Modelos (Junio 2022)
- Reconstruccion de Mapas de Manglares usando Bosques Aleatorios e Imagenes Satelitales (Junio 2022)
- Predicting Annual Length-Of-Stay and its Impact on Health Costs
- Lecturas
- Three learning principles from Learning From Data (2012) , Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin .
- Machine Learning Based Program to Prevent Hospitalizations and Reduce Costs in the Colombian Statutory Health Care System
- Does Machine Learning Automate Moral Hazard and Error?
Interpretabilidad
- Interpretabilidad (junio 2022 – Nueva Version)
- Lecturas
Prediccion, Causalidad y Toma de Decisiones
- Fundamentos de Causalidad (junio 2022)
- Identificacion Econometrica de Efectos Causales (Junio 2022)
- A Spatial Discrete Choice Model of Crime (Junio 2022)
- Lecturas
Privacidad
- Privacidad Algoritmica: Una introduccion (junio 2022)
- Lecturas
Guia Propuesta/Presentacion de Trabajo Final
Hacerse estas preguntas y responderlas en la presentacion: Catecismo de Heilmeier
La propuesta/presentacion debe incluir:
- El problema y su relevancia.
- Revisión de la literatura.
- Contribución especifica del artículo en el contexto de esta literatura.
- Descripción muy preliminar de los datos (sinteticos o reales).
- Sugerencia de aproximacion metodologica: modelos que se van a usar y por que.
- Sugerencia de criterios de evaluacion de los modelos.
- Resultados esperados.
Guía Trabajo Final
Una forma de evaluar el valor y riesgo de una propuesta de investigacion es seguir el Catecismo de Heilmeier
Un buen articulo en minería de datos debe tener un estructura como esta:
- Introducción: el problema y su relevancia, revisión de la literatura y contribución especifica del artículo en el contexto de esta literatura.
- Descripción de los datos.
- El modelo (si lo hay) y ojala algún resultado teórico.
- El algoritmo utilizado.
- Aplicación a por lo menos dos cosas: (1) Datos sintéticos y (2) Una base de datos del mundo real.
- Conclusiones
Un excelente ejemplo es: Uplift Modeling with Multiple Treatments and General Response Types
El estándar de edición de las publicaciones académicas es Latex. Para instalar este sistema de edición recomiendo:
- Descargar Latex de https://www.latex-project.org/
- Descargar un editor de Latex. Texstudio es muy bueno: https://www.texstudio.org/
- Este template puede ser bueno para comenzar a modificar: KDD Template Example
Textos
- Introduction to Statistical Learning with Applications in R. Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani
Lecturas Adicionales
- McKinsey Global Institute: The age of analytics executive summary
- The data revolution and economic analysis
- Big Data: New Trick for Econometrics
- Statistical Learning Theory: Models. Concepts, and Results
- Top 10 algorithms in data mining
- The Markov Chain Montecarlo Revolution
- Support Vector Classification with Input Data Uncertainty
- Testing Rating Accuracy (véase también: http://www.hmeasure.net/)
Presentaciones adicionales
- Learning curves (Andrew Ng)
- Deciding what to do next revisited (Andrew Ng)
- Error metrics for skew classes (Andrew Ng)
- Trading off precision and recall (Andrew Ng)