5 июля 2017

Новая информационная система свяжет воедино всемирную вычислительную сеть экспериментов Большого адронного коллайдера

Иллюстрация концепции географически распределенных грид-вычислений (Грид сеть)

Цель экспериментов, ведущихся на ускорительном комплексе Большого адронного коллайдера – получение новых фундаментальных знаний о свойствах материи. Набирается большой интеграл статистики, чтобы исследовать исключительно редкие физические процессы. Например, в год,  только в эксперимете ATLAS, записывается около 10 Пбайт исходных данных. Для обработки такого объема  существуют специальные программные среды, и каждый эксперимент использует свою специализированную систему.

Ученые Института ядерной физики им. Г.И.Будкера СО РАН (ИЯФ СО РАН) и ЦЕРН подписали соглашение о разработке программного обеспечения, которое предназначено унифицировать информационыые платформы всех экспериментов Большого адронного коллайдера. Она называется CRIC – Computing Resource Information Catalog, и уже в конце 2017 года заработает в ЦЕРН. 

Система обработки данных. Масштаб данных самой крупной научной установки мира очень велик, и их невозможно проанализировать на отдельно взятом компьютере или вычислительном ресурсе. Для этой цели в ЦЕРН была создана географически распределённая система вычислений (всемирная компьютерная грид-сеть Большого адронного коллайдера).

Компьютерная модель всемирной грид-сети экспериментов Большого адронного коллайдерав

«Представьте себе разнесенный по всему миру вычислительный центр, – объясняет Алексей Анисёнков, научный сотрудник ИЯФ СО РАН, координатор проекта CRIC, – соединенный между собой каналами связи (интернетом). Для эффективного использования этих ресурсов, контроля и обеспечения их работоспособности в этой инфраструктуре необходим промежуточный информационный слой. Задача такой системы заключается в том, чтобы единым образом описать топологию сети и компьютерную модель эксперимента, структурировать доступные вычислительные ресурсы и ресурсы хранения, отслеживать, какие конфигурационные данные, параметры они используют, какие ресурсы доступны сейчас, какие находятся на техническом обслуживании. Необхожимо интегрировать всевозможные настройки высокоуровневых служб и сервисов распределенной грид-сети, описать связи между различными компонентами программного обеспечения обработки данных и предоставить в итоге пользователям эксперимента центральный информационный портал для управления информацией. Таким инструментом стала информационная система AGIS, разработанная ИЯФ СО РАН для одного из крупных экспериментов Большого адронного коллайдера в ЦЕРН – ATLAS. Она предназначена для объединения всех этих данных, предоставления унифицированного доступа, для того, чтобы обеспечить работоспособность всей инфраструктуры системы обработки данных». 

Система AGIS оказалась настолько удобной и функциональной, что руководство ЦЕРН приняло решение создать ее расширенную версию для остальных экспериментов Большого адронного колладйера. Между ЦЕРН и ИЯФ СО РАН было подписано соответствующее соглашение.

Новая система CRIC. Новый проект также будет разработан при определяющем участии ИЯФ СО РАН, и называется CRIC – Computing Resource Information Catalog.

«Нам поступило предложение от ЦЕРН продолжить эту работу и заняться уже более широким проектом,  универсальной среды, системой CRIC (Информационный каталог компьютерных ресурсов). Это схожая с AGIS система для общего использования. Она будет предоставлять информационные сервисы для  доступа не только к ресурсам, которые использует коллаборация ATLAS, а сможет описывать топологию вычислительных моделей и данных других экспериментов Большого адронного коллайдера, использующих грид-технологии для обработки экспериментальных данных. Базовая концепция – распределение ресурсов и вычислительных мощностей, которые поставляются во всемирную грид-сеть, и описание того, как конкретный эксперимент их потребляет. Система будет корректно связывать их между собой, дополняя информационную модель необходимыми структурами данных, специфичным для конкретного эксперимента. Она знает, какой сайт используется в том или ином эксперименте, какие сервисы доступны в этом вычислительном узле, каковы допустимые объемы хранения данных». 

Соглашение ИЯФ СО РАН и ЦЕРН прописывает этапы работ на год. Предполагается, что в конце 2017 года система CRIC будет готова к использованию в производстве и, в частности, начнется ее внедрение в программную инфраструктуру коллаборации CMS.