ENSAE Paris - École d'ingénieurs pour l'économie, la data science, la finance et l'actuariat

Machine Learning for Natural Language Processing

Objectif

L'objectif du cours est de donner un panorama des modèles récents de traitement automatique de la langue naturelle (TALN/NLP), avec un focus sur les modèles de Deep Learning mais en remettant ces modèles en perspective avec l'évolution historique du domaine.

Plan

  • Cours :
    • 14/02/2024: Introduction NLP, Représentation vectorielle des documents (TF-IDF)
    • 06/03/2024 : Représentation vectorielle des mots (GLove, Word2Vec, FastText)
    • Modèles de langue (Modèles de Markov, LSTM, Bert, Transformers)
    • Applications
  • TP
    • 14/02/2024 : TP1 Document classification https://github.com/Deep-NLP-Course/nlp-lab-text-classification
    • TP2 : Embeddings  https://github.com/Deep-NLP-Course/nlp-lab-text-embedding
    • TP3 : GPT2  https://github.com/Deep-NLP-Course/nlp-lab-language-models