Les chercheurs examinent la base de données des grappes d’eau et forment le réseau à prédire les paysages énergétiques


Ouvrez la boîte noire des réseaux de neurones

chercheurs du PNNL ont utilisé 500000 grappes d’eau à partir d’une de récemment développée de plus de 5 millions de minimums de grappes d’eau pour former un réseau neuronal qui repose sur la puissance de la théorie des graphes – une collection de nœuds et de connexions qui représentent la structure moléculaire – pour Schéma structurel de l’agrégation des molécules d’eau à déchiffrer. Crédit photo: Nathan Johnson | PNNL

Les algorithmes d’apprentissage automatique, fondement des réseaux de neurones, ouvrent les portes à de nouvelles découvertes – ou du moins offrent des indices alléchants – une énorme base de données après l’autre. Exemple concret: des chercheurs du Pacific Northwest National Laboratory (PNNL) se sont penchés sur la modélisation des interactions entre les molécules d’eau et ont trouvé des informations sur les liaisons hydrogène et les modèles structurels au fur et à mesure de leur progression grâce à des méthodes d’apprentissage approfondies.

«Les réseaux neuronaux sont un moyen pour les ordinateurs d’apprendre automatiquement diverses propriétés des systèmes ou des données», a déclaré Jenna Pope, scientifique des données chez PNNL. « Dans ce cas, le réseau neuronal apprend l’énergie des différents réseaux de grappes d’eau sur la base des données précédentes. »

Les chercheurs du PNNL ont utilisé 500000 grappes d’eau à partir d’une base de données récemment développée de plus de 5 millions de minimums de grappes d’eau pour former un réseau neuronal qui repose sur la puissance mathématique de la théorie des graphes – une collection de nœuds et de connexions qui représentent la structure moléculaire – pour Schéma structurel de l’agrégation des molécules d’eau à déchiffrer. En travaillant avec la forme moléculaire et gazeuse de l’eau, ils ont accordé une attention particulière à la relation entre la liaison hydrogène et l’énergie par rapport à la structure la plus stable.

« C’est le Saint Graal », a déclaré le Pape. « Pour le moment, il est très laborieux de développer un potentiel d’interaction exact pour l’eau. Avec les réseaux neuronaux, cependant, le but ultime est que les réseaux apprennent à partir d’un grand ensemble de données quelle énergie un réseau a en fonction de sa structure moléculaire sous-jacente. »

Après avoir dimensionné 500 000 clusters d’eau, le réseau neuronal de l’étude menée par PNNL a été formé aux différents types d’interactions entre les molécules d’eau. Théoriquement, l’ensemble de données aurait pu inclure la base de données entière de 5 millions de réseaux d’eau. Pour des raisons pratiques, non.

« Utiliser toute la base de données pour entraîner le réseau neuronal aurait pris trop de temps de calcul », a déclaré Pope. La formation des réseaux de neurones profonds pour examiner ces 500000 grappes d’eau – seulement un dixième de la base de données totale – a pris plus de deux jours et demi, avec quatre ordinateurs à la pointe de la technologie avec une puissance GPU (unité de traitement graphique) considérable contournant l’horloge.

Partie d’une image plus grande

Les réseaux de neurones existent depuis des décennies. Cependant, la puissance de traitement plus élevée des puces GPU au cours des 10 dernières années a considérablement amélioré les performances de ces réseaux, qui sont également associées au terme «apprentissage en profondeur». Malgré cette promesse, la formation des réseaux de neurones est un défi de calcul coûteux. Et aussi précis qu’ils puissent être, les réseaux de neurones sont souvent critiqués comme des boîtes noires qui ne fournissent aucune information sur les raisons pour lesquelles ils donnent la réponse qu’ils donnent.

Le projet Exascale Computing Project (ECP) du département américain de l’Énergie (DOE) a été lancé en 2016 pour étudier les problèmes de calcul intensif difficiles à résoudre, y compris le raffinement des réseaux de neurones. En 2018, ECP a fondé le centre de co-conception ExaLearn, qui se concentre sur les technologies d’apprentissage automatique. Le PNNL est l’un des huit laboratoires nationaux participant au projet ExaLearn. James Ang, scientifique en chef du PNNL en informatique dans les sciences physiques et informatiques, dirige la participation du laboratoire.

Base de données près de chez vous

L’un des principaux objectifs d’ExaLearn est de développer des technologies d’intelligence artificielle qui peuvent être utilisées pour concevoir de nouvelles structures chimiques en apprenant à partir d’énormes quantités de données. La recherche, menée par Sutanay Choudhury, informaticien du PNNL, s’est appuyée sur la base de données de grappes d’eau géantes que Sotiris Xantheas, membre du laboratoire PNNL, avait développée sur le campus du PNNL Richland. Xantheas, connu en chimique pour ses recherches sur les interactions intermoléculaires dans les clusters d’ions aqueux, est co-auteur de l’étude sur les réseaux de neurones, qui est publiée dans l’édition spéciale « Machine Learning Meets Chemical Physics » Journal de physique chimique.

« Plusieurs propriétés macroscopiques de l’eau ont été attribuées à son réseau volatil de liaisons hydrogène, qui consiste en un réseau dynamique de liaisons qui se cassent et se reforment en une fraction de seconde à température ambiante », a déclaré Xantheas, dont le travail sur la base de données a été soutenu par le bureau de la science du DOE, programme Sciences fondamentales de l’énergie, Département des sciences chimiques, de la Terre et de la vie. « Les grappes d’eau fournissent un banc d’essai pour étudier ce réseau de liaisons hydrogène volatil en comprenant la relation structure-énergie des différents arrangements de liaisons hydrogène. »

Les chercheurs du PNNL ont proposé une stratégie pour déchiffrer cette boîte noire particulière. Ils ont utilisé la théorie des graphes – une branche des mathématiques qui étudie comment les choses sont connectées dans un réseau – pour représenter les molécules et leurs sous-structures polygonales sous forme graphique. Les descripteurs théoriques graphiques développés par l’équipe ont fourni plusieurs informations sur la composition des grappes d’eau.

« Ce que nous avons fait », a déclaré Papst, « est une analyse supplémentaire après que le réseau a été formé. L’analyse quantifie diverses propriétés structurelles de ces réseaux de grappes d’eau. Ensuite, nous pouvons les comparer avec notre réseau de neurones prédit et dans les études ultérieures de jeux de données. » pour améliorer la compréhension du réseau. « 

L’eau a un futur réseau de neurones

Les résultats de l’étude fournissent une base pour analyser les modèles structurels des grappes d’eau dans des réseaux liés à l’hydrogène plus complexes tels que l’eau liquide et la glace.

«Si vous pouviez former un réseau de neurones», a déclaré Pope, «ce réseau de neurones serait capable de faire de la chimie informatique sur des systèmes plus grands. Et alors vous pourriez avoir des informations similaires sur la chimie informatique grâce à la structure chimique ou à la liaison hydrogène les molécules gagnent.  » Réponse aux changements de température. Ce sont parmi les objectifs de cette recherche.  »


Suivi des signaux nucléaires du réseau neuronal


Plus d’information:
Avijit Rakshit et coll. Atlas des minima présumés et des réseaux énergétiques bas des grappes d’eau n = 3–25, Le Journal de Physique Chimique (2019). DOI: 10,1063 / 1,5128378

Fourni par le Pacific Northwest National Laboratory

Citation: Les chercheurs la base de données des clusters de l’eau et forment le réseau pour prédire les paysages énergétiques (2020, 14 octobre), consulté le 18 octobre 2020 sur https://phys.org/news/2020-10-peer-clusters-database -network-energy.html

Ce document est soumis au droit d’auteur. Sauf pour le commerce équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.

Laisser un commentaire