En chimie, la recherche de paramètres réactionnels pour obtenir des rendements élevés est un problème complexe et des approches utilisant l'optimisation bayésienne ont montrées des résultats intéressants sur les réactions chimiques avec 4 à 6 paramètres [4] [1].
Cependant, le nombre d'expériences à réaliser pour atteindre un rendement élevé reste encore trop grand lorsque le nombre de paramètres est plus important.
L'approche abordée dans ce travail consiste à améliorer le processus bayésien en intégrant de l'analyse de sensibilité globale, afin de pouvoir prendre en compte la contribution des paramètres d'entrées sur le rendement. Plus précisément, nous avons choisi d'utiliser l'indice HSIC (Hilbert-Schmidt Indepencence Criterion) qui a montré de meilleurs résultats en comparaison avec les indices de Sobol. [3] [2]
Une nouvelle méthode permettant de proposer de nouvelles valeurs de paramètres est proposée : les propositions de paramètres obtenues par l'optimisation bayésienne sont évaluées par un score de sensibilité utilisant HSIC, et seules les valeurs les plus intéressantes sont retenues pour une nouvelle vague d'expériences.
Cette méthode a été évaluée sur un jeu de données avec 5 paramètres dont les rendements sont connus pour l'ensemble des valeurs de paramètres. [4]
Une comparaison entre la méthode d'optimisation bayésienne de référence pour les chimistes [4] et notre approche a montré qu'en moyenne, notre algorithme permet d'obtenir des rendements d'environ 5% plus élevés sur les 20 premières expériences.
Notre objectif à long terme est de trouver des algorithmes efficaces en peu d'expériences avec un nombre de paramètres plus important.
Références :
[1] Stewart Greenhill, Santu Rana, Sunil Gupta, Pratibha Vellanki, and Svetha Venkatesh. Bayesian optimization for adaptive experimental design : A review. IEEE Access, 8 :13937–13948, 2020.
[2] Anouar Meynaoui, A. Marrel, and B. Laurent-Bonneau. Méthodologie basée sur les mesures de dépendance hsic pour l'analyse de sensibilité de second niveau. 50èmes Journées de Statistique (JdS2018), Palaiseau, France, May 2018. cea-02339273.
[3] Gabriel Sarazin, Amandine Marrel, Sébastien da Veiga, and Vincent Chabridon. Test d'indépendance basé sur les indices HSIC-ANOVA d'ordre total. In 53èmes Journées de Statistique de la SFdS, Proceedings des 53èmes Journées de Statistique de la SFdS, Lyon, France, June 2022. Société Française de Statistique (SFdS) and Université Claude Bernard Lyon 1.
[4] Benjamin J. Shields, Jason Stevens, Jun Li, Marvin Parasram, Farhan Damani, Jesus I.Martinez Alvarado, Jacob M. Janey, Ryan P. Adams, and Abigail G. Doyle. Bayesian reaction optimization as a tool for chemical synthesis. Nature, 590(7844) :89–96, February 2021.