Une société énergétique gère 268 éoliennes. Lors du choix du placement d’une nouvelle éolienne, l’indicateur le plus pertinent est la vitesse moyenne du vent sur la durée de vie de l’éolienne en question en chaque point, afin d’optimiser sa localisation.
En pratique, l'expertise climatique montre que les points en lesquels la vitesse du vent était la plus élevée sur les 20 dernières années seront aussi les points en lesquels elle sera la plus élevée sur les 20 prochaines années. Ainsi, pour prédire la somme des vitesses de vents sur les 20 prochaines années (la durée de vie moyenne d’une éolienne, qui varie selon le type de turbine et d’autres paramètres), l’ambition était de prédire les vitesses de vents au niveau de chaque parc sur les 20 dernières années (ces valeurs n’étaient disponibles que pour les 3 dernières années). L’enjeu était donc de prédire les vitesses de vents passées, d'en extraire des indicateurs (la somme, la médiane, etc.), et de les utiliser comme des indicateurs du futur afin d’optimiser le placement des éoliennes et donc les productions générées par celles-ci. Ces données sont également stratégiques sur de nombreux autres aspects du business de l’entreprise. Elles entrent notamment dans la prédiction d’autres indicateurs.
L’intérêt de prédire les vitesses de vents plutôt que les puissances des éolienne provient de ce que la puissance dépend du type de turbine. Les puissances dépendent aussi des effets de sillage (un effet de sillage est une diminution de la vitesse du vent au niveau d’une éolienne, causé par la présence d’autres éoliennes aux alentours). Or, les effets de sillage dépendant de la configuration des éoliennes dans le parc, leurs effets changent d’un point à l’autre et cet effet doit être réinjecté a posteriori, en fonction de la position de chaque éolienne.
Le mouvement des pales altère les mesures de vitesses de vent réalisées par les anémomètres présents sur les éoliennes. Ainsi, des mesures de vitesses de vents plus précises ont été obtenues au niveau des éoliennes à partir des puissances actives mesurées, en inversant les courbes de puissances théoriques (décrivant la puissance active théorique de chaque type de turbine en fonction de la vitesse du vent).
Lorsque la puissance est très faible ou très élevée, la courbe théorique de puissance n’est pas inversible : une puissance nulle peut être due à l’arrêt d’une turbine pour des raisons techniques ou de sécurité par exemple, et les éoliennes sont bridées lorsque la vitesse de vents est trop élevée, ce qui fausse le lien entre la vitesse de vent et la puissance. Dans de tels cas, la vitesse du vent mesurée par l’anémomètre est conservée.
Nous obtenons ainsi des valeurs de vitesse de vent pour chaque turbine. Puis nous calculons, pour chaque parc et sur chaque heure, la moyenne des vitesses de vent obtenue par chaque éolienne du parc sur cette heure, et ce sans prendre en compte les éoliennes subissant un effet de sillage sur cette heure (comme expliqué plus haut).
Les valeurs de vitesse de obtenues pour chaque heure et sur chaque parc ont été utilisées pour entraîner une IA qui prédit ces valeurs à partir de données ERA5. Les données ERA5 sont des estimations horaires d’un grand nombre de variables climatiques (vitesse du vent, pression de l’air, humidité, précipitation, etc.) fournies par le CEPMMT (Centre Européen pour les Prévisions Météorologiques à Moyen Terme) sur une grille de localisation espacées de pas de 0.25 point de latitude et de O.25 point de longitude.
Pour chaque parc, l’IA est entrainée à prédire la vitesse du vent à partir des données climatiques mesurées en les 4 points ERA5 les plus proches.
La consultant a produit un code python appelant les données depuis le data lake de l’organisation via du requêtage SQL, les nettoyant en plusieurs étapes (calcul des effets de sillage, suppression des données altérées par des opérations techniques sur les éoliennes, détection automatique des valeurs erronées avec du machine learning), sélectionnant et transformant les variables pertinentes, prédisant les vitesses de vent via du machine learning (gradient-boosted trees), interprétant les résultats via plusieurs métriques et produisant du reporting automatique. L’IA est ré-entrainée et fournit des prédictions
mises à jour autant que nécessaire. La planification de son exécution est
automatiquement orchestrée par Airflow.
L’IA est entrainée à prédire les vitesses de vent sur chaque parc à partir des données climatiques provenant des 4 point les plus proches sur la grille ERA5. Elle est donc entraînée à réaliser une interpolation de ces données ERA5. Ainsi, l’IA est
capable de prédire les vitesses du vent en n’importe quel point de l’Europe à partir des données provenant 4 points ERA5 les plus proches. L’objectif était de passer en dessous des 5% d’erreur absolue moyenne entre les vraies vitesses de vents et celles prédites. La solution implémentée atteint 0.2% en moyenne sur l’ensemble des parcs.
Ce projet témoigne de l'importance de challenger la norme. Ici, une stratégie innovante, méticuleuse et contre-intuitive a permis d’obtenir des données d’une importance majeur pour l'entreprise. Prédire le passé pour deviner le futur. Partir de la puissance active pour deviner la vitesse du vent. Annuler l’impact des effets de sillage sur chaque parc pour le réinjecter plus tard l’impact exacte de l’effet de sillage en le point précis considéré. Partir d’une grille de mesures climatiques précises pour en déduire un continuum de vitesses de vents précises.
La connaissance d’indicateurs clés sur les vitesses de vent futures, et donc sur les prédictions futures, offre un avantage stratégique majeur : savoir dans quel parc il est plus rentable de construire une nouvelle éolienne, mais aussi en quel point il serait le plus favorable de créer un nouveau parc.