La nature des données textuelles
Le prétraitement du texte : tokenisation et lemmatisation
Les modèles sac-de-mots les modèles thématiques et la classification naïve
Les modèles de langage N-grams (modèles de Markov)
Les modèles de Markov cachés et l'étiquetage grammatical
Les représentations distribuées et la sémantique vectorielle
Les modèles de langage neuronaux récurrents les LSTMs et la génération de texte
Les modèles de langage Transformers et la modélisation du langage masqué
Les modèles encodeurs et la recherche sémantique
Les modèles encodeurs-décodeurs le résumé de texte et la traduction