Modèles à variables latentes pour l’écologie

L’écologie s’intéresse aux relations que les espèces vivantes entretiennent entre elles et avec leur milieu. L’analyse et la compréhension de ces interactions passe fréquemment par une modélisation statistique impliquant des variables latentes (c’est-à-dire non observées) visant à décrire les structures et les processus qui sous-tendent ces interactions.

L’objectif de ce cours est de présenter certains de ces modèles comme les modèles de distributions (jointes) d’espèces ou les modèles de réseaux écologiques. Les modèles les plus simples sont des modèles linéaires généralisés, éventuellement mixtes. Les modèles plus complexes posent des problèmes d’inférence spécifiques qui peuvent être surmontées grâce à des généralisations de l’algorithme EM reposant sur des approximations variationnelles. Un des objectifs principaux de ce cours est la bonne compréhension de tels modèles et la définition d’un algorithme permettant d’en inférer les paramètres.

Nous utiliserons également la représentation de ces modèles selon le formalisme des modèles graphiques qui permettent de représenter la structure de dépendance entre les différentes variables (observées ou latentes) et de d’anticiper la complexité de l’algorithme d’inférence. Cette représentation est par ailleurs pertinente pour traiter le problème de l’inférence de réseaux écologiques, dans lequel il s’agit notamment de distinguer entre interactions directes ou indirectes entre les espèces.

Certains des modèles présentés seront mis en oeuvre lors de séances de travaux dirigés sur machine. Ce cours vise notamment à apprendre à définir un modèle pertinent pour répondre à une question écologique, concevoir un algorithme permettant d’en estimer les paramètres et implémenter cet algorithme.

Prérequis

Notions fondamentales de probabilités et statistique, connaissance du langage R.

Thèmes abordés

  • Modèles à variables latentes, modèles graphiques.
  • Modèles de distribution d’espèces, modèles de réseaux écologiques.

Déroulement pour l’année 2025-26

Planning

Les enseignements auront lieu les lundis matin de 9h00 à 12h00

Les cours et les séances de TD se tiendront

  • en salle 24-34/103 jusqu’au 23 février,
  • puis en salle 14-24/107 à partir du 09 mars.

Le planning est également disponible ici.

Examen final

L’examen final aura lieu le lundi 30 mars de 10h à 12h en salle 14-24/107.

Les notes de cours sur papier et une calculatrice y seront autorisées, à l’exclusion de tout autre appareil électronique (tablette & téléphone compris).


Supports de cours

Des notes de cours sont disponibles ici, un projet de livre sur l’inférence des modèles à variables latentes est disponible ici, et les supports d’une série de cours doctoraux sur certains des modèles présentés en cours sont disponibles ici.

TD : Sujets et données

TD1 : Modélisation d’abondance par des modèles de Poisson avec surcroit de zéros

TD2 : Analyse d’un déplacement animal par chaîne de Markov cachée

TD3 : Structure d’un réseau trophique

TD4 : Estimation de la richesse spécifique par modèle de mélange

Rendu des travaux

  • Les travaux devront être réalisés uniquement en binôme ou en trinôme.

  • Le code devra être commenté, notamment les lignes en lien direct avec les questions formelles du sujet.

  • Le compte-rendu devra être envoyé par mail le lundi 23 mars à 12h30, au plus tard.

  • Seuls les travaux des binômes ou trinômes effectivement présents lors de cette séance seront acceptés.


Annales des examens passés

Sujet et Corrigé 2022-23

Sujet et Corrigé 2024-25