Programme

L’enseignement est structuré en 20 cours (certains sont dispensés en anglais), répartis en 4 modules pour une durée totale de 320 heures. Sont intégrés dans les cours les travaux pratiques en salle machine permettant de résoudre des exercices et de traiter des études de cas concrets. Les étudiants pourront accéder au cluster du LAMSADE, à des ordinateurs équipés de processeurs GPU pour le deep learning, ainsi qu'à des ressources cloud comme Amazon Web Services.

La plupart des cours prévoient des exercices à résoudre entre deux séances de formation et des projets sur des cas d'utilisation réels

Module 1 : Les bases de l’IA, de l'algorithmique,  des bases de données  et des architectures distribuées  (60h)

  • Statistiques et probabilités, algèbre linéaire (20h)
  • Architectures centralisées et distribuées (10h)
  • Algorithmes et structures de données en Python (20h)
  • Données relationnelles et SQL (10h)  

Une partie du module sera consacrée à un renforcement en algorithmique et architectures distribuées, en préambule à la présentation de techniques utilisant de l'algorithme avancée ainsi que des notions d’architectures complexes, qui sont indispensables au traitement des données massives ainsi que pour l'exécution d’algorithmes d’apprentissage s'appuyant sur les architectures multi-cœurs et éventuellement des GPU. 

Le module prévoit enfin une remise à niveau sur les données relationnelles et SQL afin d'introduire des techniques fondamentales pour comprendre et manipuler les données modélisées (tables et associations entre elles). Le cours permet de comprendre les types de données largement répandus dans le cadre de l’IA et de l’analyse de données, et prépare à la compréhension d’autres modèles de données et d’autres paradigmes de manipulation.

Module 2 : Machine Learning (110h)

L’apprentissage automatique est à l’origine du renouveau de l’IA et de l’engouement actuel pour ce domaine. Le but de ce module est d’introduire aux étudiants les concepts et outils fondamentaux pour développer et analyser des algorithmes d'apprentissage automatique. Le module présentera les fondements de l'apprentissage automatique, passera en revue les algorithmes les plus efficaces et discutera de leur application dans des problèmes réels.

  • Fondements de l'apprentissage supervisé et non supervisé (30h)
  • Deep learning (30h)
  • Systèmes de recommandation (15h)
  • NLP (Natural Language Processing)  (15h)
  • Apprentissage par renforcement (10h)
  • Optimisation et Apprentissage (10h)

Module 3 : Données massives (105h)

Comme déjà souligné, les techniques et les approches récentes adoptées dans le cadre de l’IA sont caractérisées par l’utilisation de collections de données, souvent massives et provenant de sources hétérogènes via des traitements préliminaires. Ces techniques doivent prendre en compte des aspects cruciaux : le passage à l'échelle, la qualité des données et la présence de données hétérogènes. 

Cela nécessite l’utilisation de techniques non-conventionnelles comme les systèmes et paradigmes du traitement distribué ainsi que des nouveau modèles de type NoSQL, en s'appuyant sur des architectures éventuellement de type Cloud. Le module met également l'accent sur l'implémentation d’algorithmes d’IA présentés dans le Module 2.

  • Qualité et préparation des données (15h)
  • Traitement distribuée de données massives sur Hadoop, Spark et Kafka (25h)
  • Machine learning sur les big data en Spark et TensorFlow (25)
  • SQL avancée, NoSql et NewSQL (15h) 
  • Données sur le Cloud (10h)
  • Analyse de graphes (15h)

Module 4 : Cas d’utilisation et projet IA (50h)

Ce module a pour vocation de traiter en profondeur des cas d’utilisation typiques et particulièrement importants de l’IA aujourd'hui, sur des domaines stratégiques tels que la finance et l’assurance, la santé et le management.

  • IA dans la finance (10h)
  • IA et santé (10h
  • IA et management (10h)
  • Projet IA (20h)

Evaluation des acquis

La formation délivre le diplôme d’université « Executive Master IA et Science des Données » sous réserve de validation des 4 modules :

Modules 1 à 3 : validation des acquis sous forme d’examens (60%)
Module 4 : Validation du cas d’utilisation / Projet IA : mémoire et soutenance (40%)