7–9 декабря 2015 г. в НИЦ «Курчатовский институт» и ЛИТ ОИЯИ проходило рабочее совещание «Машинное обучение для распределенных данных с LHC и восстановления треков». О задачах, которые предстояло решить на этом совещании, рассказали его участники.
Марио Лассниг (ЦЕРН):
Мы приехали из Европейского центра ядерных исследований, представляем эксперимент ATLAS. Я как один из авторов той системы, которая используется в ATLAS больше десяти лет работаю над проблемой распределения данных. Возглавляю направление, которое будет использовать машинное обучение для нового поколения этой системы. Одна из задач совещания – найти, как машинное обучение может быть использовано для распределения данных эксперимента ATLAS между многими центрами. Мы думаем, результатом будет план совместных работ, который нам предстоит выполнять. Есть некоторые теоретические наработки, есть идеи, как их можно использовать, но нет решения, как это может быть реализовано, и поэтому задача совещания – попробовать это решение найти.
А.А.Климентов («Курчатовский институт» – Брукхейвенская лаборатория, США):
Сегодня второй день работы совещания, первый проходил в Москве в «Курчатовском институте». Также мы пригласили представителей Яндекса, потому что в физике мы всегда пытаемся найти какое-то быстрое решение, которое, может быть, не очень красиво с точки зрения компьютерной науки, но работает. И мы надеялись, что у Яндекса есть какие-то решения, которые мы можем использовать. После первого дня работы совещания можно подвести промежуточный итог: у Яндекса, как сказал Марио, есть очень красивые теоретические предложения, но то, что они предлагают сейчас, мы сделали два или три года назад. Поэтому общая задача для всех участников совещания – Лаборатории информационных технологий, «Курчатовского института», ЦЕРН и Яндекс попробовать выработать какой-то прагматичный план, наметить цели, которых мы можем достичь в ближайшие два-три месяца, и в перспективе на несколько лет, когда ускоритель LHC будет давать в сто раз больше данных, чем сейчас.
В совещании участвует большая группа молодежи, причем не только из Дубны и Москвы, но и из Томска. Мы надеемся, что это молодое поколение через пять-десять лет начнет активно вовлекаться во все работы. В.В.Кореньков (ЛИТ):
Сейчас наблюдается большая активность в развитии компьютинга для новых мега-проектов и оптимизации работ, связанных с обработкой и эффективным хранением огромных массивов данных как для экспериментов на LHC, так и для других мега-проектов. Поэтому такое пристальное внимание уделяется различным методам так называемого машинного обучения. То есть мы создаем обучающую систему, которая более эффективно реконструирует треки, более правильно, эффективно распределяет дисковое пространство, данные, задачи. Цель этого совещания – обсудить различные подходы и методы, наработки в этой области, которые выполнены ведущими специалистами мира, России и ОИЯИ. Вчера мы работали в «Курчатовском институте», сегодня вместе со специалистами из Европы и Америки продолжаем в Лаборатории информационных технологий, ждем большую группу аналитиков из Яндекса, занимающихся этими вопросами профессионально. Будем рассматривать и использовать и наши наработки, поскольку у нас много сделано по реконструкции треков для эксперимента СВМ (FAIR), а сейчас мы разрабатываем такое программное обеспечение для проекта NICA. Вот в таком кругу мы попытаемся обсудить проблемы, выработать правильные критерии и решения, чтобы развиваться в этом направлении более оптимально, используя возможности для обработки и анализа данных.