
Prédire les rendements agricoles par machine learning… quand le climat se dérègle
⏱ 3 minL’apprentissage automatique permet d’étudier le comportement des plantes en fonction des conditions de culture. Une équipe australienne cherche ainsi à aider les agriculteurs à mieux choisir les variétés et prédire les rendements. Mais ces prédictions sont mises à mal par le changement climatique.
« Notre objectif est d’aider les scientifiques et l’industrie agronomique à sélectionner les meilleures variétés de cultures alimentaires pour, in fine, guider les agriculteurs dans leur choix vers celles qui auront le meilleur rendement », explique Saul Newman, chercheur à l’Université nationale australienne de Canberra. Avec son collègue Robert Furbank, il a étudié la capacité de différents modèles d’apprentissage automatique à prédire le comportement de cultures. Quelles sont les facteurs qui influencent leur rendement ? Comment les conditions climatiques modifient-elles la croissance ? Leurs résultats ont été récemment publiés1 dans Nature Plants.
Les deux chercheurs ont exploité une vaste base de données australienne (National Variety Trials) représentant dix ans d’essais en plein champ, qui fournit des informations (rendement, résistance aux maladies, qualité nutritionnelle) sur des dizaines de milliers de variétés de dix espèces de céréales, légumineuses et oléagineux. Pour comprendre les interactions complexes qui influencent le rendement de ces plantes, ils ont croisé ces données avec des milliers de variables sur la gestion des cultures comme les dosages de pesticides et d’engrais ainsi que des données issues de capteurs au sol ou de satellites, renseignant sur les conditions météorologiques, les sols, les rotations de cultures, etc.
LES LIMITES DES MODÈLES “BOITE NOIRE”
Ils ont entraîné et testé différents types de modèles de machine learning pour mettre en évidence les facteurs qui influencent rendement ou teneur en protéine des graines : SVM (Support Vector Machine ou machines à vecteurs de support), forêts aléatoires (Breiman Cutler Random Forest), réseaux de neurones… Ils ont ainsi mis en évidence l’importance de la chaleur, de la disponibilité en eau, de la conductance stomatique (autrement dit des échanges gazeux entre la plante et l’atmosphère) ou encore de l’évapotranspiration des plantes (évaporation du sol et transpiration des plantes).
« Au-delà de ces résultats, nous sommes arrivés à la conclusion que les modèles les plus précis étaient, en général, un type de forêt aléatoire, résume Saul Newman. Ces modèles ont battu les modèles plus complexes, que nous qualifions de “boites noires” car non explicables, à base de réseaux de neurones ou de machines à vecteurs de support. Il est important de choisir des modèles explicables plutôt que des boites noires car nous devons comprendre les résultats du modèle. Dans tous les cas, mieux vaut un modèle moins précis mais dont les résultats sont compréhensibles par les biologistes et les agriculteurs. »
« Un modèle de type boite noire a par exemple montré que l’utilisation systématique d’herbicides comme le Roundup a un effet négatif sur le rendement, poursuit Saul Newman. Mais cette conclusion est probablement incorrecte car l’utilisation d’herbicides intervient en général dans une situation de sol dégradé, en présence de pathogènes, donc de mauvaises conditions de croissance. Interpréter ces résultats nécessite une analyse minutieuse du fonctionnement du modèle et les modèles de type boite noire ne sont pas la panacée face à ce type de problèmes subtils. »
L’ÉVOLUTION DU CLIMAT ENRAYE LES PRÉDICTIONS
Ce sont finalement des approches telles que les modèles de régression (RPRM ou Recursively Partitioned Regression Models) et les forêts aléatoires qui permettent le mieux de comprendre et d’interroger la dynamique interne du modèle, de savoir pourquoi l’algorithme a généré une prédiction spécifique, même si c’est au détriment de la précision des résultats.
Cependant, ces modèles butent sur un problème de taille : le changement climatique. « Le climat australien peut passer d’un extrême à l’autre en l’espace de quelques mois de façon imprévisible, précise le chercheur. Cela entraîne d’énormes changements dans la production alimentaire. Et cela réduit à néant notre capacité à prévoir le rendement des cultures. Même les meilleurs modèles s’effondrent dans ce contexte ! Nous devons poursuivre ce travail et un effort massif doit être fait pour trouver des interactions robustes vis-à-vis du changement climatique entre le comportement des plantes et les facteurs qui l’influencent. »
Les deux chercheurs concluent que, face au changement climatique, il est urgent d’investir massivement dans la sélection végétale, avec de nouvelles méthodes : « Nous sommes très préoccupés par l’évolution du climat. Le développement de nouvelles variétés de plantes pour un climat connu nécessite dix ans, au minimum. Prédire ce que sera le climat dans dix ans et sélectionner des plantes pour ce climat est un « jeu de prédiction » extrêmement dangereux. Nos systèmes alimentaires actuels jouent à ce jeu, avec peu de moyens. »
Isabelle Bellin
Image de Une :
Parcelles d’essai de variétés de blé et d’orge, dans le cadre du projet australien National Variety Trials. ©GRDC
1. Saul Newman, Robert Furbank. “Explainable machine learning models of major crop traits from satellite-monitored continent-wide field trial data”. Nature Plants, 2021. doi.org