Modèles à variables latentes pour l’écologie

L’écologie s’intéresse aux relations que les espèces vivantes entretiennent entre elles et avec leur milieu. L’analyse et la compréhension de ces interactions passe fréquemment par une modélisation statistique impliquant des variables latentes (c’est-à-dire non observées) visant à décrire les structures et les processus qui sous-tendent ces interactions.

L’objectif de ce cours est de présenter certains de ces modèles comme les modèles de distributions (jointes) d’espèces ou les modèles de réseaux écologiques. Les modèles les plus simples sont des modèles linéaires généralisés, éventuellement mixtes. Les modèles plus complexes posent des problèmes d’inférence spécifiques qui peuvent être surmontées grâce à des généralisations de l’algorithme EM reposant sur des approximations variationnelles. Un des objectifs principaux de ce cours est la bonne compréhension de tels modèles et la définition d’un algorithme permettant d’en inférer les paramètres.

Nous utiliserons également la représentation de ces modèles selon le formalisme des modèles graphiques qui permettent de représenter la structure de dépendance entre les différentes variables (observées ou latentes) et de d’anticiper la complexité de l’algorithme d’inférence. Cette représentation est par ailleurs pertinente pour traiter le problème de l’inférence de réseaux écologiques, dans lequel il s’agit notamment de distinguer entre interactions directes ou indirectes entre les espèces.

Certains des modèles présentés seront mis en oeuvre lors de séances de travaux dirigés sur machine. Ce cours vise notamment à apprendre à définir un modèle pertinent pour répondre à une question écologique, concevoir un algorithme permettant d’en estimer les paramètres et implémenter cet algorithme.

Prérequis

Notions fondamentales de probabilités et statistique, connaissance du langage R.

Thèmes abordés

  • Modèles à variables latentes, modèles graphiques.
  • Modèles de distribution d’espèces, modèles de réseaux écologiques.

Déroulement pour l’année 2024-25

Planning

Les cours auront lieu les lundis matin de 8h30 à 12h30.

Date Salle
20/01 14–24 / 301
03/02 14–24 / 107
10/02 (TD) Atrium / 119
17/02 14- 24 / 107
03/03 24- 34 / 101
10/03 (TD) Atrium / 115
17/03 24–34 / 101
24/03 (examen) 24–34 / 101

L’examen aura lieu le 24/03 de 10h à 12h.


Supports associés

  • Des notes de cours sur l’inférence des modèles à variables latentes sont disponibles ici.
  • Les supports d’une série de cours doctoraux sur certains des modèles présentés en cours sont disponibles ici.

TD : Sujets et données

TD2 : au choix

Annales


Exemples présentés en cours

Cours 1 :
Cours 2 :
Cours 3 :
Cours 4 :

Données de réseaux

Données d’abondances