Специалисты Института искусственного интеллекта AIRI разработали новый метод предсказания оптических характеристик молекул с помощью 3D-графовых нейросетей.
Подход позволяет за доли секунды определить, как вещество поглощает и испускает свет, что критически важно при создании красителей, OLED-материалов, биомаркеров, УФ-фильтров и других соединений, сообщили в пресс-службе института.
Традиционные способы — лабораторные эксперименты или квантово-химические расчёты — требуют много времени и ресурсов. Учёные из AIRI предложили альтернативу: модели, которые учитывают трёхмерное строение молекулы и предсказывают её спектральные характеристики практически мгновенно, сообщает ТАСС.
Для обучения нейросетей исследователи собрали датасет nablaColors-3D, включив в него экспериментальные данные об оптических свойствах молекул в различных растворителях, а также их пространственные структуры. Наличие 3D-геометрии позволило задействовать особый класс моделей — графовые нейронные сети, работающие с объёмным представлением молекул. Это дало заметный прирост точности.
В ходе эксперимента специалисты сравнили пять современных моделей, учитывающих геометрию: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Их предварительно обучили на крупных химических базах, а затем донастроили на новом датасете. Для оценки использовали метрику MAE — среднюю ошибку предсказания длины волны в нанометрах.
Модели, не учитывавшие пространственное строение, давали ошибку около 24 нанометров. Учёт геометрии снизил её до 16 нанометров — прогресс составил более 30 процентов. Для сравнения: распространённый квантово-химический метод TD-DFT на тех же данных показал ошибку в 62 нанометра.
Разработка открывает путь к быстрому и точному виртуальному скринингу новых соединений без необходимости в дорогостоящих экспериментах или сложных вычислениях.