Deep-Learning-Ansatz ermöglicht genaue Berechnungen der elektronischen Struktur in großem Maßstab

Die Anordnung von Elektronen in Materie, die so genannte elektronische Struktur, spielt nicht nur in der Grundlagenforschung eine entscheidende Rolle, sondern auch bei angewandter Forschung wie dem Arzneimitteldesign oder der Energiespeicherung. Lange Zeit fehlten jedoch Simulationsmethoden, die sowohl eine hohe Genauigkeit als auch Skalierbarkeit über verschiedene Zeit- und Längenskalen hinweg bieten. Forscher des Center for Advanced Systems Understanding (CASUS) am Helmholtz-Zentrum Dresden-Rossendorf (HZDR) in Görlitz und der Sandia National Laboratories in Albuquerque, USA, haben nun eine auf maschinellem Lernen basierende Simulationsmethode entwickelt (npj Computational Materials, DOI: 10.1038/s41524-023-01070-z), die herkömmliche Verfahren zur Simulation elektronischer Strukturen übertrifft. Ihr Softwarepaket MALA (Materials Learning Algorithms) ermöglicht den Zugang zu bisher unerreichten Längenskalen.

Elektronen sind Elementarteilchen von grundlegender Bedeutung. Ihre quantenmechanischen Wechselwirkungen untereinander und mit den Atomkernen sind verantwortlich für eine Vielzahl von Phänomenen in der Chemie und den Materialwissenschaften. Verständnis und Kontrolle der elektronischen Struktur der Materie geben Aufschluss über die Reaktivität von Molekülen, die Struktur von Planeten und den Energietransport in ihnen sowie über die Mechanismen bei Materialversagen.

Wissenschaftliche Herausforderungen werden immer häufiger durch computergestützte Modellierung und Simulationen angegangen, wobei hier die Möglichkeiten des Hochleistungsrechnens voll zum Tragen kommen. Für realistische Simulationen mit Quantenpräzision fehlte allerdings ein vorhersagendes Simulationsverfahren, das hohe Genauigkeit mit Skalierbarkeit über verschiedene Längen- und Zeitskalen kombiniert. Klassische atomistische Simulationsmethoden können zwar große und komplexe Systeme handhaben. Da sie die elektronische Quantenstruktur nicht berücksichtigen, ist ihre Anwendbarkeit jedoch eingeschränkt. Umgekehrt bieten Simulationsmethoden, die im Gegensatz zur empirischen Modellierung ausschließlich auf Grundlage analytischer Formeln arbeiten (ab initio-Methoden), eine hohe Genauigkeit. Sie sind aber rechenintensiv. Die Dichtefunktionaltheorie (DFT), eine weit verbreitete ab initio-Methode, skaliert beispielsweise kubisch mit der Systemgröße. Das beschränkt diese Methode auf kleine Skalen.

Hybrider Ansatz auf der Grundlage von Deep Learning

Das Team hat nun ein neuartiges Simulationsverfahren vorgestellt: das „Materials Learning Algorithms (MALA) software stack“. In der Informatik ist ein „software stack“ eine Sammlung von Algorithmen und Softwarekomponenten, die kombiniert werden, um eine Softwareanwendung zur Lösung eines bestimmten Problems zu erstellen. Lenz Fiedler, Doktorand und maßgeblicher Entwickler von MALA am CASUS, erklärt: „MALA integriert maschinelles Lernen mit Ansätzen aus der Physik, um die elektronische Struktur von Materialien vorherzusagen. Es verwendet einen hybriden Ansatz, bei dem eine etablierte Methode des maschinellen Lernens, das sogenannte Deep Learning, zur genauen Vorhersage lokaler Größen eingesetzt wird. Die Vorhersagen werden dann durch physikalische Algorithmen zur Berechnung relevanter Eigenschaften genutzt.“

Das Softwarepaket MALA nimmt die Anordnung der Atome im Raum als Eingabe und erzeugt Fingerabdrücke, sogenannte Bispektrumskomponenten, die die räumliche Anordnung dieser Atome um einen Punkt im Raum kodieren. Das maschinelle Lernmodell in MALA wird trainiert, um die elektronische Struktur auf der Grundlage der Nachbarschaft der Atome vorherzusagen. Ein wesentlicher Vorteil von MALA ist die Fähigkeit seines maschinellen Lernmodells, unabhängig von der Systemgröße zu sein. Es kann daher auf Daten von kleinen Systemen trainiert und danach in jeder Größenordnung eingesetzt werden.

In ihrer Veröffentlichung belegen die Wissenschaftler die bemerkenswerte Effizienz dieser Strategie. Im Vergleich zu herkömmlichen Algorithmen erreichten sie bei kleineren Systemen von bis zu einigen Tausend Atomen eine mehr als 1.000-fache Geschwindigkeitssteigerung. Darüber hinaus demonstrierten sie, dass MALA in der Lage ist, elektronische Strukturberechnungen in großem Maßstab mit mehr als 100.000 Atomen durchzuführen. Letzteres gelang mit einem überschaubaren Rechenaufwand, was die Begrenzungen herkömmlicher DFT-Codes verdeutlicht.

Attila Cangi, der kommissarische Leiter der CASUS-Abteilung „Materie unter extremen Bedingungen“, erklärt: „Mit zunehmender Systemgröße und mehr beteiligten Atomen werden DFT-Berechnungen unpraktikabel, während der Geschwindigkeitsvorteil von MALA immer größer wird. Der entscheidende Durchbruch bei MALA ist die Fähigkeit, mit lokalen Atomumgebungen zu arbeiten. Das ermöglicht genaue numerische Vorhersagen, die von der Systemgröße nur minimal beeinflusst werden. Diese bahnbrechende Errungenschaft eröffnet Berechnungsmöglichkeiten, die früher als unerreichbar galten.“

Impulse für die angewandte Forschung erwartet

Cangi hat sich zum Ziel gesetzt, durch den Einsatz von maschinellem Lernen die Grenzen der elektronischen Strukturberechnung zu erweitern: „Wir verfügen nun über eine Methode, mit der wir wesentlich größere Systeme mit einer beispiellosen Geschwindigkeit simulieren können. Ich erwarte, dass MALA einen Umbruch einleiten wird, wie elektronische Strukturen berechnet werden. Die Forschung wird künftig in der Lage sein, ein breites Spektrum gesellschaftlicher Herausforderungen auf Basis einer deutlich verbesserten Ausgangslage zu bearbeiten: von der Entwicklung neuer Impfstoffe und neuartiger Materialien für die Energiespeicherung über groß angelegte Simulationen von Halbleiterbauelementen und der Untersuchung von Materialdefekten bis hin zur Erforschung chemischer Reaktionen zur Umwandlung von klimaschädlichem Kohlendioxid in klimafreundliche Mineralien.“

Darüber hinaus eignet sich der MALA-Ansatz besonders für das Hochleistungsrechnen (high-performance computing, HPC). Mit zunehmender Systemgröße ermöglicht MALA eine unabhängige Verarbeitung auf dem von ihm genutzten Rechengitter, wodurch HPC-Ressourcen (insbesondere Grafikprozessoren) effektiv genutzt werden. Siva Rajamanickam, wissenschaftlicher Mitarbeiter und Experte für paralleles Rechnen an den Sandia National Laboratories, erklärt: „Der MALA-Algorithmus für elektronische Strukturberechnungen lässt sich gut auf modernen HPC-Systemen mit verteilten Beschleunigern anwenden. Die Fähigkeit, Rechenprozesse zu zerlegen und sie auf verschiedenen Gitterpunkten über verschiedene Beschleuniger hinweg parallel auszuführen, macht MALA zu einer idealen Lösung für skalierbares maschinelles Lernen auf HPC-Ressourcen. Dabei werden eine beispiellose Geschwindigkeit und Effizienz bei der Berechnung elektronischer Strukturen erreicht.“

Außer bei den Entwicklungspartnern HZDR und Sandia National Laboratories kommt MALA bereits bei Einrichtungen und Unternehmen wie dem Georgia Institute of Technology, der North Carolina A&T State University, Sambanova Systems Inc. und der Nvidia Corp. zum Einsatz.

Publikation

L. Fiedler, N. A. Modine, S. Schmerler, D. J. Vogel, G. A. Popoola, A. P. Thompson, S. Rajamanickam, A. Cangi, Predicting electronic structures at any length scale with machine learning, npj Computational Materials, 2023, DOI: 10.1038/s41524-023-01070-z


Über das Center for Advanced Systems Understanding

Das CASUS wurde 2019 in Görlitz gegründet und betreibt digitale interdisziplinäre Systemforschung in unterschiedlichen Bereichen wie Erdsystemforschung, Systembiologie und Materialforschung. Innovative Forschungsmethoden aus Mathematik, theoretischer Systemforschung, Simulation, Daten- und Computerwissenschaft werden mit dem Ziel eingesetzt, komplexe Systeme von bisher nie dagewesener Realitätstreue abzubilden und so zur Lösung drängender gesellschaftlicher Fragen beizutragen. Gründungspartner sind das Helmholtz-Zentrum Dresden-Rossendorf (HZDR), das Helmholtz-Zentrum für Umweltforschung in Leipzig (UFZ), das Max-Planck-Institut für molekulare Zellbiologie und Genetik in Dresden (MPI-CBG), die Technische Universität Dresden (TUD) und die Universität Wrocław (UWr). Das Zentrum wird aus Mitteln des Bundesministeriums für Bildung und Forschung (BMBF) sowie des Sächsischen Staatsministeriums für Wissenschaft, Kultur und Tourismus (SMWK) gefördert und wird als ein Institut des HZDR geführt.

Über die Sandia National Laboratories

Die Sandia National Laboratories sind ein Labor mit mehreren Missionen, das von National Technology & Engineering Solutions of Sandia, LLC, einer hundertprozentigen Tochtergesellschaft von Honeywell International Inc. im Auftrag der National Nuclear Security Administration des US-Energieministeriums unter dem Vertrag DE-NA0003525K geleitet und betrieben wird. https://www.sandia.gov

Momentaufnahme einer Deep-Learning-Simulation mit mehr als 10.000 Berylliumatomen. Die Verteilung der Elektronen in diesem Material wird als rote (delokalisierte Elektronen) und blaue (Elektronen in der Nähe der Atomkerne) Punktwolken dargestellt. Diese Simulation ist mit herkömmlichen DFT-Berechnungen nicht durchführbar. Dank MALA konnte sie innerhalb von etwa 5 Minuten mit nur 150 Zentralprozessoreinheiten durchgeführt werden. Um die Verständlichkeit der Simulation zu erhöhen, wurden grafische Filter eingesetzt. Die weißen Flächen an den Säumen sind ebenfalls auf die Filter zurückzuführen. Das Schema im Hintergrund deutet die Funktionsweise von Deep Learning an.

(Ein hochauflösendes Bild ist auf Anfrage erhältlich.)