Les slides du cours de Machine Learning seront mises en ligne avant chaque séance et consultables ici : version du 7 novembre.
- Cours 1: Théorie de l'apprentissage statistique.
- Cours 2: Algorithmes d'apprentissage. Notebook illustratif et données.
- Cours 3: Arbres de décisions. Bagging. Random Forest.
- Cours 4: Boosting. Algorithme AdaBoost.
- Sujet du TP.
- Cours 5: Apprentissage séquentiel. Exponentially Weighted Forecaster.
- Cours 6: Prise de décision séquentielle. Modèles de bandits.
Le cours sera illustré par deux séances de TP effectuées avec Python à l'aide notamment de la librairie scikitlearn. Vous trouverez ici du matériel proposé par Pascal Germain pour l'apprentissage de Python.
Références
- An Introduction to Statistical Learning, with applications in R. James, Witten, Hastie et Tibshirani. Le livre est disponible sur cette page web.
- The Elements of
Statistical Learning:
Data Mining, Inference, and Prediction. Hastie, Tibshirani et Friedman. Plus complet que le précédent, ce livre est aussi disponible en ligne ici.
- Understanding Machine Learning: from theory to algorithms. Shai Ben-David et Shai Shalev-Schwartz. Une approche plus théorique du Machine Learning. Disponible en ligne ici .
- Kaggle, une plateforme de Data Science où vous trouverez de nombreux examples de jeux de données et d'études de ceux-ci (sous R et Python)