Численные симуляции, моделирующие временную эволюцию материи на атомном уровне, необходимы для исследований в области химии, наук о жизни и материаловедения. Впервые команде Гарвардского университета удалось смоделировать поведение структуры, состоящей из 44 миллионов атомов, используя один из лучших в мире суперкомпьютеров и искусственный интеллект.
Исследователи уже давно используют численное моделирование для изучения поведения и эволюции атомов с целью разработки новых лекарств или материалов со специфическими свойствами. Однако размер изучаемых молекулярных систем ограничен вычислительной мощностью компьютеров. Некоторые методы позволяют проводить гораздо более сложные атомистические моделирования, но им не хватает точности, поскольку они требуют упрощения некоторых межатомных взаимодействий, что неизбежно сказывается на достоверности полученных результатов.
Чтобы обеспечить более точное и столь же быстрое моделирование систем, состоящих из очень большого числа атомов, исследователи из Гарвардского университета разработали новую архитектуру под названием Allegro, которую они недавно протестировали на суперкомпьютере Perlmutter в Национальном центре научных вычислений энергетических исследований Министерства энергетики США (занимает 8-е место в последнем рейтинге суперкомпьютеров Top500). "Эта работа переносит точность, эффективность выборки и устойчивость глубоких эквивариантных нейронных сетей в экстремальные вычислительные масштабы", — резюмируют исследователи в своей препринтной статье.
Хотя квантовая механика управляет взаимодействиями между атомами и электронами, многие физические и химические явления происходят в масштабах длины и времени, превышающих скорость движения атомов, объясняет команда. Для достижения таких масштабов требуются инновационные вычислительные подходы, которые могут быстро и точно отражать квантовые взаимодействия, а также параллелизуемые архитектуры, которые могут работать на эксафлопных компьютерах.
Реальные физические и химические системы, однако, имеют гораздо более сложную структуру, чем способны изучить вычислительные методы, и их наблюдаемая эволюция превышает временные масштабы атомистического моделирования. "Этот разрыв между важнейшими фундаментальными вопросами и явлениями, которые можно эффективно моделировать, сохраняется на протяжении десятилетий", — отмечают исследователи.
В некоторых случаях, особенно в материаловедении, можно упростить моделирование, разбив систему на несколько более мелких моделей. Однако это невозможно в науках о жизни, где некоторые вирусные структуры состоят из миллионов атомов, в дополнение к большому количеству молекул воды (необходимых для моделирования физиологической среды).
Чтобы добиться успеха в моделировании очень большого количества атомов, Борис Козинский и его коллеги использовали нейронную сеть, известную как "эквивариантная" сеть, способную рассчитывать взаимодействия между атомами с учетом всех возможных форм симметрии (переводы, вращения, отражения), чтобы получить более точное представление атомной геометрии. Полученная архитектура, названная Allegro, сочетает в себе скорость, точность, стабильность и масштабируемость. "Таким образом, она устанавливает новый уровень техники для молекулярной динамики и открывает двери для моделирования ранее недоступных систем", — резюмируют исследователи.
Чтобы продемонстрировать способность Allegro к эволюции, команда сначала провела стабильное моделирование динамики белка длительностью в несколько наносекунд, а затем перешла к структуре из 44 миллионов атомов, растворенных в воде (что соответствует полному капсиду ВИЧ), используя суперкомпьютер Perlmutter. Они также смоделировали эволюцию других распространенных молекул, таких как фактор IX - белок крови, участвующий в свертывании, ген которого мутирует при гемофилии типа B, целлюлоза и вирус табачной мозаики.
Этот новый подход позволяет моделировать любую структуру, состоящую из очень большого числа атомов, с очень высокой точностью. Команда сообщает о производительности 100 временных шагов в секунду и максимальном размере 126,4 миллиона атомов.
"Мы демонстрируем превосходное масштабирование до 100 миллионов атомов и низкое масштабирование на 70% до 5120 графических процессоров A100", — говорят авторы исследования. Конечно, подход не ограничивается биологическими молекулами; он может быть использован в области материаловедения.
Моделирование молекулярной динамики является основой вычислительной науки, обеспечивая понимание динамики молекул и материалов в атомном масштабе. Они обеспечивают такой уровень разрешения, понимания и контроля, который часто не могут обеспечить эксперименты, что делает их чрезвычайно мощным инструментом для поддержки знаний ученых и помощи в разработке новых продуктов.
Представленная здесь архитектура Allegro способна моделировать динамику любой атомистической структуры, включая поликристаллические и многофазные композиты, диффузию в стеклах, полимеризацию и каталитические реакции. Было показано, что Allegro может точно изучать атомные силы из набора данных SPICE, который содержит более миллиона молекулярных структур и пептидов. Таким образом, она может способствовать прорыву в изучении сложных молекул.
Ожидается, что в будущем эта архитектура будет развернута на еще больших вычислительных ресурсах, что позволит ей достичь большей масштабируемости, чем продемонстрировано в данном исследовании.