Quelques modèles à variables latentes pour l’écologie

L’écologie s’intéresse aux relations que les espèces vivantes entretiennent entre elles et avec leur milieu. L’analyse et la compréhension de ces interactions passe fréquemment par une modélisation statistique impliquant des variables latentes (c’est-à-dire non observées) visant à décrire les structures et les processus qui sous-tendent ces interactions.

L’objectif de ce cours est de présenter certains de ces modèles comme les modèles de distributions (jointes) d’espèces ou les modèles de réseaux écologiques. Les modèles les plus simples sont des modèles linéaires généralisés, éventuellement mixtes. Les modèles plus complexes posent des problèmes d’inférence spécifiques qui peuvent être surmontées grâce à des généralisations de l’algorithme EM. Un des objectifs principaux de ce cours est la bonne compréhension de tels modèles et la définition d’un algorithme permettant d’en inférer les paramètres

Nous utiliserons également la représentation de ces modèles selon le formalisme des modèles graphiques qui permettent de représenter la structure de dépendance entre les différentes variables (observées ou latentes) et de d’anticiper la complexité de l’algorithme d’inférence. Cette représentation est par ailleurs pertinente pour traiter le problème de l’inférence de réseaux écologiques, dans lequel il s’agit notamment de distinguer entre interactions directes ou indirectes entre les espèces.

Certains des modèles présentés seront mis en oeuvre lors de séances de travaux dirigés sur machine. Ce cours vise notamment à apprendre à définir un modèle pertinent pour répondre à une question écologique, concevoir un algorithme permettant d’en estimer les paramètres et implémenter cet algorithme.

Prérequis

Notions fondamentales de probabilités et statistique, connaissance de R.

Thèmes abordés

  • Modèles à variables latentes, modèles graphiques.
  • Modèles de distribution d’espèces, modèles de réseaux écologiques.

Déroulement pour l’année 2023-24

Planning

Les cours auront lieu les mardis matin de 9h à 12h

  • en salle 24-34/309 : les 16, 23, 30 janvier, 6 et 13 février,
  • en salle 14-24/201 : les 27 février, 5, 12, 19 et 26 mars.

Le planning est également disponible ici et . Les salles de TD seront précisées au fur et à mesure.

Supports associés

Des notes de cours sur l’inférence des modèles à variables latentes sont disponibles ici, de même que les slides d’une série de cours doctoraux sur l’utilisation de certains de ces modèles en écologie.