Mit Künstlicher Intelligenz die „Fingerabdrücke“ von Molekülen errechnen

Das Graphische Neuronale Netz GNN erhält als Input kleine Moleküle mit der Aufgabe, deren spektrale Antworten zu ermitteln. Durch Abgleich mit den bekannten Spektren lernt das GNN-Programm, Spektren zuverlässig zu berechnen.

Das Graphische Neuronale Netz GNN erhält als Input kleine Moleküle mit der Aufgabe, deren spektrale Antworten zu ermitteln. Durch Abgleich mit den bekannten Spektren lernt das GNN-Programm, Spektren zuverlässig zu berechnen. © K. Singh, A. Bande/HZB

Mit konventionellen Methoden ist es extrem aufwändig, den spektralen Fingerabdruck von größeren Molekülen zu berechnen. Dies ist aber eine Voraussetzung, um experimentell gewonnene Messdaten korrekt zu interpretieren. Nun hat ein Team am HZB mit selbstlernenden Graphischen Neuronalen Netzen sehr gute Ergebnisse in deutlich kürzerer Zeit erzielt.

„Biomoleküle, große anorganische Moleküle, aber auch Quantenpunkte, die oft aus tausenden von Atomen bestehen, sind mit konventionellen Methoden wie der DFT kaum noch vorab zu berechnen“, sagt PD Dr. Annika Bande, theoretische Chemikerin am HZB. Mit ihrem Team hat sie nun systematisch untersucht, wie sich die Rechenzeit durch den Einsatz von Methoden aus der Künstlichen Intelligenz verkürzen lässt.

Die Idee: Ein Computerprogramm aus der Gruppe der „graphischen neuronalen Netze“ oder GNN erhält als Input kleine Moleküle mit der Aufgabe, deren spektrale Antworten zu ermitteln. Im nächsten Schritt vergleicht das GNN-Programm die errechneten Spektren mit den bekannten Zielspektren (DFT oder experimentell) und korrigiert in der folgenden Runde den Berechnungsweg entsprechend. Runde für Runde wird so das Ergebnis immer besser. Das GNN-Programm lernt also selbstständig mit Hilfe bekannter Spektren, wie sich Spektren zuverlässig berechnen lassen.

„Wir haben fünf neuere GNN trainiert und festgestellt, dass sich mit einem davon, dem SchNet-Modell, enorme Verbesserungen erreichen lassen: Die Genauigkeit steigt um 20 % und dies in einem Bruchteil der Rechenzeit“, sagt Erstautor Kanishka Singh. Singh nimmt an der Graduiertenschule HEIBRiDS teil und wird in diesem Rahmen sowohl von Informatik-Experten Prof. Ulf Leser aus der Humboldt-Universität zu Berlin als auch von Annika Bande betreut.  

„Kürzlich entwickelte GNN-Frameworks könnten sogar noch besser abschneiden“, meint die theoretische Chemikerin. „Und die Nachfrage ist sehr groß. Wir wollen diese Forschungsrichtung daher vertiefen und planen dafür ab Sommer eine neue Postdoc-Stelle im Rahmen des Helmholtz-Projekts "eXplainable Artificial Intelligence for X-ray Absorption Spectroscopy” ein.“

 

Anmerkung:

Die Arbeit entstand im Rahmen der Graduiertenschule HEIBRiDS und wird im Helmholtz-Projekt  "eXplainable Artificial Intelligence for X-ray Absorption Spectroscopy" (XAI-4-XAS) weitergeführt.

Im Kern geht es in diesem Helmholtz-Projekt (mit HEREON, Leitung HZB) darum, die GNN auch auf sehr große Moleküle auszudehnen. Dies soll in Kombination mit der probabilistischen Analyse von Molekülmotiven  erreicht werden. Sie dient dazu, nur den Teil des Konfigurationsphasenraums der Moleküle zu erfassen, der für die genaue Vorhersage von Röntgenspektren erforderlich ist. Die Ergebnisse der Vorhersagen ermöglichen eine rigorose Interpretation von XAS-Experimenten.

arö

  • Link kopieren

Das könnte Sie auch interessieren

  • Neue Anlage für die Katalyseforschung am HZB
    Nachricht
    06.03.2026
    Neue Anlage für die Katalyseforschung am HZB
    Das HZB hat im Rahmen des Projekts CatLab eine einzigartige Anlage erworben, um die katalytische Leistung von Dünnschichtkatalysatoren zu messen. Erbaut von der Firma ILS in Adlershof, wurde sie nun angeliefert. Die Anlage besteht aus insgesamt acht chemischen Reaktoren, in denen katalytische Systeme getestet werden können. Mit über 2,5 Millionen Euro ist diese Anlage die größte Einzelinvestition Im CatLab-Projekt.
  • Proteinkristallographie an BESSY II: Schneller, besser und automatischer
    Interview
    04.03.2026
    Proteinkristallographie an BESSY II: Schneller, besser und automatischer
    Viele Erkrankungen hängen mit Fehlfunktionen von Proteinen im Organismus zusammen. Die dreidimensionale Architektur dieser Moleküle ist oft äußerst komplex, liefert aber wertvolle Hinweise für das Verständnis von biologischen Prozessen und die Entwicklung von Medikamenten. Mit Röntgendiffraktion an den MX-Beamlines von BESSY II lässt sich die 3D Struktur von Proteinen entschlüsseln. Mehr als 5000 Strukturen sind bis heute an den drei MX-Beamlines von BESSY II gelöst worden. Ein Rückblick und Ausblick im Gespräch mit Manfred Weiss, dem Leiter der Makromolekularen Kristallographie. 
  • 5000. Proteinstruktur an BESSY II: Startpunkt für einen COVID-Wirkstoff
    Science Highlight
    26.02.2026
    5000. Proteinstruktur an BESSY II: Startpunkt für einen COVID-Wirkstoff
    Viele Proteine besitzen eine komplexe Architektur, die bestimmte biologische Funktionen ermöglicht. An manchen Stellen können Moleküle andocken und die Funktion des Proteins verändern. Ein Team am HZB hat nun das Nsp1-Protein untersucht, das bei der Infektion mit dem SARS-CoV-2-Virus eine Rolle spielt. Sie analysierten Proteinkristalle, die sie zuvor mit Molekülen aus einer Fragmentbibliothek versetzt hatten und entdeckten dabei insgesamt 21 Kandidaten als Startpunkte für die Medikamentenentwicklung. Gleichzeitig entschlüsselten sie damit auch die 5000. Struktur an BESSY II.