Retour au blog
Energie

L'apprentissage automatique améliore la prévision de production des énergies renouvelables

Racine AI

Dernière mise à jour le 20 février 2025

L’intégration massive des énergies renouvelables dans le mix électrique constitue un défi technique majeur pour les gestionnaires de réseau. En France, la production éolienne et solaire représentait 14% de la production totale en 2024 selon RTE. Cette part croissante de sources intermittentes impose de disposer de prévisions fiables pour équilibrer offre et demande à chaque instant.

Les modèles météorologiques fournissent la matière première des prévisions

Toute prévision de production renouvelable repose sur des données météorologiques. La production solaire dépend de l’irradiance qui atteint les panneaux, elle-même fonction de la position du soleil, de la couverture nuageuse et de la transparence de l’atmosphère. La production éolienne dépend de la vitesse du vent à hauteur de moyeu des turbines, typiquement entre 80 et 150 mètres.

Les modèles numériques de prévision météorologique comme ECMWF, GFS ou AROME fournissent ces données sur des grilles couvrant le territoire. ECMWF produit des prévisions globales avec une résolution de 9 km et 137 niveaux verticaux, mises à jour toutes les 6 heures. Le modèle AROME de Météo-France descend à 1.3 km de résolution sur la France pour les prévisions à courte échéance.

Ces modèles résolvent les équations de la physique atmosphérique sur des supercalculateurs. Ils simulent les mouvements de l’air, les échanges de chaleur, la formation des nuages et les précipitations. Malgré leur sophistication, ils commettent des erreurs systématiques qui varient selon les régions et les conditions météorologiques.

Le machine learning intervient pour corriger ces biais et affiner les prévisions brutes. Il apprend la relation statistique entre les sorties des modèles météorologiques et la production effectivement observée sur chaque site. Cette approche hybride combine la physique des modèles numériques avec la puissance d’apprentissage des algorithmes.

Les réseaux de neurones récurrents capturent les dépendances temporelles

La production renouvelable présente de fortes corrélations temporelles. La production solaire d’aujourd’hui ressemble à celle d’hier si les conditions météorologiques sont similaires. La production éolienne d’une heure dépend de celle des heures précédentes car les systèmes météorologiques évoluent graduellement.

Les réseaux LSTM excellent dans la capture de ces dépendances. Leur architecture inclut des cellules mémoire qui conservent l’information sur de longues séquences. Une cellule LSTM comporte trois portes : la porte d’oubli qui décide quelles informations anciennes effacer, la porte d’entrée qui sélectionne les nouvelles informations à stocker, et la porte de sortie qui détermine ce qui sera utilisé pour la prédiction.

En pratique, un réseau LSTM pour la prévision de production prend en entrée une séquence de données historiques : production des derniers jours, conditions météorologiques observées et prévues, variables calendaires comme l’heure et le jour de la semaine. Il produit en sortie une séquence de prévisions pour les heures ou jours à venir.

L’entraînement utilise des années de données historiques pour apprendre les patterns récurrents. Le réseau découvre automatiquement les cycles journaliers et saisonniers, les corrélations entre variables météorologiques, et les spécificités de chaque site comme l’ombrage partiel ou les effets de sillage entre éoliennes.

Les modèles de gradient boosting rivalisent avec les réseaux profonds

Les algorithmes de gradient boosting comme XGBoost, LightGBM ou CatBoost offrent une alternative performante aux réseaux de neurones. Ils construisent un ensemble d’arbres de décision où chaque nouvel arbre corrige les erreurs des précédents.

Ces modèles présentent plusieurs avantages pratiques. Ils tolèrent mieux les données manquantes, fréquentes dans les séries temporelles réelles. Ils fournissent des scores d’importance des variables qui aident à comprendre les facteurs déterminants. Leur entraînement est plus rapide et moins sensible aux hyperparamètres que les réseaux profonds.

Pour la prévision de production, on construit généralement un modèle par horizon temporel. Un modèle prédit la production dans une heure, un autre dans deux heures, etc. Chaque modèle utilise les mêmes variables d’entrée mais apprend des patterns différents adaptés à son horizon.

Les variables d’entrée typiques incluent les prévisions météorologiques température, vent, irradiance, nébulosité, la production récente des dernières heures, les variables calendaires, et parfois des données de sites voisins dont la production est corrélée. L’ingénierie de ces features influence fortement la performance du modèle.

La prévision probabiliste quantifie l’incertitude inhérente

Annoncer que la production sera de 500 MWh demain ne suffit pas au gestionnaire de réseau. Il a besoin de connaître l’incertitude associée pour dimensionner les réserves de puissance. Une prévision de 500 MWh avec une incertitude de plus ou moins 50 MWh ne se gère pas comme une prévision avec plus ou moins 200 MWh.

La prévision probabiliste produit une distribution de valeurs possibles plutôt qu’une valeur unique. On peut l’exprimer par des quantiles : il y a 10% de chances que la production soit inférieure à 400 MWh, 50% de chances qu’elle soit inférieure à 500 MWh, 90% de chances qu’elle soit inférieure à 600 MWh.

Plusieurs techniques permettent d’obtenir des prévisions probabilistes. La plus directe consiste à entraîner le modèle pour prédire directement les quantiles plutôt que la moyenne. Les réseaux de neurones peuvent utiliser une fonction de coût de type quantile loss. Les forêts aléatoires fournissent naturellement une distribution via les prédictions de leurs arbres individuels.

L’approche ensembliste combine les prévisions de plusieurs modèles ou de plusieurs scénarios météorologiques. Les modèles de prévision météorologique produisent des ensembles de 50 scénarios qui explorent l’incertitude sur les conditions futures. Propager ces scénarios à travers le modèle de production donne une distribution de productions possibles.

L’agrégation spatiale réduit l’erreur de prévision

À l’échelle d’un parc éolien ou solaire individuel, les erreurs de prévision peuvent dépasser 20% de la puissance installée. À l’échelle d’un pays entier, le foisonnement géographique réduit considérablement cette incertitude.

Quand le vent faiblit dans une région, il souffle souvent plus fort ailleurs. Quand un nuage passe sur une centrale solaire, le ciel reste clair à quelques dizaines de kilomètres. Ces compensations statistiques lissent les variations à grande échelle.

RTE publie des prévisions de production renouvelable nationale avec des erreurs typiques de 2 à 5% à horizon J+1. Cette précision résulte de l’agrégation de milliers d’installations réparties sur tout le territoire. Les gestionnaires de réseau de transport bénéficient davantage de cette agrégation que les gestionnaires de distribution qui gèrent des zones plus localisées.

Les modèles de prévision agrégés peuvent soit prédire directement la production nationale, soit sommer les prévisions individuelles de chaque installation. La première approche est plus simple mais perd l’information sur la répartition géographique. La seconde est plus précise mais nécessite de maintenir des modèles pour chaque site.

Les données satellite enrichissent la prévision solaire à court terme

Les images satellite du service Copernicus ou des satellites géostationnaires Meteosat observent la couverture nuageuse en quasi temps réel avec une fréquence de 5 à 15 minutes. Cette information est précieuse pour la prévision solaire à très court terme, dite nowcasting.

L’analyse des images successives permet de détecter les nuages, estimer leur épaisseur optique, et prévoir leur déplacement par extrapolation. On peut ainsi anticiper les passages nuageux sur une centrale solaire avec une avance de quelques dizaines de minutes à quelques heures.

Les algorithmes de vision par ordinateur traitent ces images pour extraire l’information pertinente. Les réseaux convolutifs détectent les structures nuageuses. Les techniques de flux optique estiment le mouvement des masses nuageuses entre images successives. La fusion avec les prévisions météorologiques améliore la prévision aux horizons intermédiaires.

Cette prévision à court terme aide les opérateurs à gérer les rampes de production. Une centrale solaire peut voir sa production chuter de 80% en quelques minutes lors du passage d’un nuage épais. Anticiper cette baisse permet d’activer les réserves plus progressivement et d’éviter les déséquilibres réseau.

L’apprentissage par transfert accélère le déploiement sur nouveaux sites

Entraîner un modèle de prévision pour un nouveau parc éolien ou solaire nécessite des données historiques qui n’existent pas encore. L’apprentissage par transfert résout ce problème en réutilisant les connaissances acquises sur d’autres sites.

Un modèle pré-entraîné sur de nombreux sites apprend les relations générales entre conditions météorologiques et production. On peut ensuite l’adapter à un nouveau site avec peu de données en ne ré-entraînant que les dernières couches du réseau ou en utilisant des techniques de few-shot learning.

La similarité entre sites facilite le transfert. Un parc éolien dans une région de plaine se comportera de manière proche d’autres parcs en terrain similaire. Les caractéristiques des turbines taille, courbe de puissance influencent aussi la transposabilité des modèles.

En pratique, quelques semaines de données suffisent souvent pour calibrer un modèle transféré, contre plusieurs mois ou années pour un entraînement from scratch. Cette accélération permet de fournir des prévisions fiables dès la mise en service des installations.

L’évaluation des modèles utilise des métriques adaptées

Mesurer la qualité d’un modèle de prévision nécessite des métriques pertinentes pour l’application visée. L’erreur quadratique moyenne RMSE pénalise fortement les grosses erreurs mais peut être dominée par quelques valeurs aberrantes. L’erreur absolue moyenne MAE est plus robuste mais ne pénalise pas les erreurs de signe.

La skill score compare le modèle évalué à une référence naïve comme la persistance qui suppose que la production sera identique à celle observée récemment. Un skill score de 30% signifie que le modèle réduit les erreurs de 30% par rapport à cette référence. Cette métrique relativise les performances selon la difficulté intrinsèque du problème.

Pour les prévisions probabilistes, le score CRPS Continuous Ranked Probability Score mesure la qualité de la distribution prédite. Il vaut zéro si la distribution prédite est parfaitement calibrée. Le diagramme de fiabilité vérifie que les quantiles annoncés correspondent aux fréquences observées.

L’évaluation doit aussi vérifier la performance par type de situation : temps clair versus nuageux, faible versus fort vent, été versus hiver. Un modèle peut avoir de bonnes performances moyennes mais échouer systématiquement dans certaines conditions critiques pour le réseau.

L’intégration opérationnelle impose des contraintes de latence et robustesse

Un modèle de prévision en production doit fournir ses résultats dans des délais contraints. Les marchés de l’électricité ferment à des heures précises. Le dispatching en temps réel nécessite des mises à jour fréquentes. Les délais entre la disponibilité des données météorologiques et la fourniture des prévisions se comptent en minutes.

La robustesse face aux données manquantes ou erronées est essentielle. Les capteurs peuvent tomber en panne, les liaisons de communication peuvent s’interrompre, les fichiers météorologiques peuvent arriver en retard. Le système doit détecter ces anomalies et fournir malgré tout une prévision dégradée plutôt que pas de prévision du tout.

Le monitoring des performances en temps réel permet de détecter les dérives du modèle. La comparaison entre prévisions et observations réelles déclenche des alertes si les erreurs dépassent les seuils attendus. Un modèle peut se dégrader si les conditions changent, par exemple après l’ajout de nouvelles installations dans un parc.

Le versionning des modèles et des données assure la traçabilité des prévisions. En cas de problème, on doit pouvoir retrouver quelle version du modèle a produit quelle prévision avec quelles données d’entrée. Cette traçabilité est importante pour l’analyse des incidents et l’amélioration continue.

Newsletter technique

1 article par mois sur l'IA documentaire. Pas de spam.

13 - 9 =

On nous demande souvent

Quelle précision peut-on attendre des prévisions de production solaire à J+1 ?

La précision dépend fortement des conditions locales et de la qualité des données météorologiques. Les meilleurs modèles atteignent des erreurs moyennes absolues de 5 à 10% de la puissance installée à horizon J+1 par temps variable.

Quelles données météorologiques sont nécessaires pour la prévision éolienne ?

Les données essentielles incluent la vitesse et direction du vent à hauteur de moyeu, la température de l'air qui affecte la densité, la pression atmosphérique, et les prévisions de rafales. Les modèles météorologiques numériques comme ECMWF ou GFS fournissent ces données en points de grille.

Discutons de

Votre Projet.

IA Documents, automatisation legacy, inspection terrain. Nous deployons des solutions qui passent en production.

Decrivez votre projet et recevez une reponse sous 48h.

Nous contacter