Aujourd'hui, nous nous intéressons aux brillants esprits qui sont à l'avant-garde de l'intégration des équations différentielles ordinaires neuronales (EDO neuronales) dans les prédictions de l'IA pour les bâtiments.
Lisez la suite pour découvrir ce que Mathieu Le Cam et Jean-Simon Venne, de BrainBox AI, et Pierre-Luc Bacon, professeur adjoint d'informatique et de recherche opérationnelle à l'Université de Montréal, ont à dire sur ce que sont les EOD neurales et sur la façon dont elles rendent nos modèles d'IA pour CVC encore plus rapides et plus précis.
Pour commencer, Jean-Simon, pourriez-vous nous décrire brièvement ce que sont les ODE neuronales ?
Jean-Simon : Bien sûr. Les EDO neuronaux sont un type de modèle d'apprentissage automatique qui associe la puissance des réseaux neuronaux à la précision des équations différentielles ordinaires (EDO) pour prédire les changements au fil du temps. Il s'agit d'une approche innovante qui permet d'obtenir des prévisions plus précises et plus efficaces avec moins de données et de puissance de calcul.
Ainsi, en ce qui concerne les systèmes CVC, les ODE neuronales peuvent être utilisées pour un ajustement continu. Au lieu d'allumer et d'éteindre le système CVC à des heures fixes, considérez-le comme un système qui ajuste continuellement et en douceur les réglages en fonction du climat actuel à l'intérieur du bâtiment. Normalement, vous auriez besoin de beaucoup de données pour parvenir au même résultat avec les seuls modèles d'apprentissage profond. Avec les ODE neuronales, vous n'avez besoin que d'une fraction de ces données pour obtenir la même précision prédictive.
Le fait que les ODE neuronales nécessitent moins de données pour le même niveau de précision - c'est ce qui les rend si transformatrices pour les prédictions de l'IA ?
Mathieu : Oui. L'avantage est énorme. Ce que nous avons vu jusqu'à présent avec les méthodes d'Apprentissage profond seulement, c'est qu'elles ont besoin d'accumuler pas mal de données avant de pouvoir entraîner votre modèle et d'avoir une prévision suffisamment précise pour les stratégies de contrôle prédictif. Mais avec les ODE neuronales, alors que nous avions besoin de plusieurs semaines de données pour entraîner nos modèles, nous pouvons désormais atteindre la même précision avec seulement quelques jours de données. En effet, les ODE neuronales nous permettent d'intégrer des connaissances préalables sur la thermodynamique d'un bâtiment dans la manière dont nous façonnons les équations et les modèles, de sorte que nous n'avons besoin d'apprendre que quelques paramètres qui ont des interprétations physiques. En fait, avec les ODE neuronales, nous avons réduit de 10 fois la quantité de données nécessaires à l'apprentissage de nos modèles.
"Avec les ODE neuronales, nous avons réduit de 10 fois la quantité de données nécessaires à l'entraînement de nos modèles." - Mathieu Le Cam
C'est aussi ce qui nous permet d'entraîner nos modèles sur des unités centrales de traitement (CPU) plutôt que sur des unités de traitement graphique (GPU). Cela nécessite moins de ressources pour l'entraînement et réduit notre empreinte énergétique globale.
Quel est l'impact de cette technologie sur les applications réelles et la fiabilité ?
Pierre-Luc : Je pense qu'un aspect important des applications réelles est la capacité d'interpréter et de vérifier nos systèmes, en particulier si vous déployez ces systèmes dans des bâtiments. Les clients doivent faire confiance à leurs systèmes (CVC), il faut donc pouvoir les vérifier et leur assurer que le produit va faire ce qu'il faut.
Quels sont les défis que vous avez dû relever au cours de ce projet ?
Pierre Luc : L'un des principaux défis a été le recyclage avec des ODE neuronales pour traiter les dérives de la distribution des données. Lorsque la distribution des données change ou dérive, cela signifie que le problème change légèrement, et toutes les méthodes ne le gèrent pas bien. C'est un défi important avec les méthodes d'Apprentissage profond en boîte noire. C'est pourquoi les modèles hybrides comme les nôtres, qui combinent des approches à boîte noire et des approches informées par la physique, sont bénéfiques. Ils sont plus agiles et peuvent s'adapter rapidement sans avoir à modifier un grand nombre de paramètres en une seule fois, ce qui est très difficile à gérer.
Jean-Simon : Par ailleurs, ce que beaucoup ne réalisent pas, c'est qu'après la première expérience, il faut mettre en place des dispositifs de recyclage et des mesures de sécurité pour passer à la production et à la mise en œuvre.
Mathieu : En même temps, cela a été pour moi une bonne occasion d'apprendre. Lorsque vous êtes dans la recherche et que vous travaillez dans votre petite bulle, vous rêvez toujours que ce bébé théorique que vous êtes en train de mettre au monde sera utilisé dans le monde réel. C'est un bel accomplissement, je pense, de voir que cela va passer en production.
Les ODE neuronales semblent pouvoir être un jour intégrées plus largement dans le monde de l'IA pour CVC (Ventilation, et Climatisation). Avez-vous pris des mesures pour breveter et mettre en œuvre cette technologie à plus grande échelle dans vos opérations ?
Jean-Simon : Nous sommes actuellement en instance de brevet et suivons la procédure pour obtenir le brevet complet. Parallèlement, nous mettons Neural ODE en production. Nous disposons déjà d'enveloppes de réseaux neuronaux qui entraînent le modèle et le recyclent lorsque la précision de la prédiction se déprécie. Il s'agit d'un système automatique qui fonctionne tous les soirs. Nous allons commencer à l'introduire dans notre système d'apprentissage automatique des opérations (MLOps) - c'est la prochaine étape.
Vous voulez rester au courant des dernières technologies de pointe pour les bâtiments ?