Détails d'un cours

Traitement automatique du langage naturel

MATH 60621
Les sujets couverts incluront la structure des données textuelles et la manière dont elles peuvent être utilisées pour des tâches telles que la recherche et la classification de documents, la génération de textes et le résumé de textes. Nous couvrirons les modèles de langage statistique et ceux basés sur les réseaux neuronaux. Le cours suppose de l'expérience préalable avec le langage de programmation Python, mais aucune expérience préalable en apprentissage automatique n'est requise.
Thèmes couverts

La nature des données textuelles
Le prétraitement du texte : tokenisation et lemmatisation
Les modèles sac-de-mots les modèles thématiques et la classification naïve
Les modèles de langage N-grams (modèles de Markov)
Les modèles de Markov cachés et l'étiquetage grammatical
Les représentations distribuées et la sémantique vectorielle
Les modèles de langage neuronaux récurrents les LSTMs et la génération de texte
Les modèles de langage Transformers et la modélisation du langage masqué
Les modèles encodeurs et la recherche sémantique
Les modèles encodeurs-décodeurs le résumé de texte et la traduction

Remarques importantes
Cours en anglais : MATH 60621A
Sigle
MATH 60621
Matière
Mathématiques
Programme
Maîtrise en gestion (M. Sc.)
Lieu
Côte-des-Neiges
Mode d'enseignement
Présentiel
Crédits
3

Partager ce cours