Optimisation stochastique avec ou sans dérivées
Processus de décision markoviens et programmation dynamique
Programmation dynamique approximative
Apprentissage par renforcement
Réseaux neuronaux et apprentissage par renforcement profond
Programmation stochastique à deux étapes / multi-étapes
Conception de politiques pour des problèmes séquentiels