Физики из США разработали метрику, которая определяет «расстояние» между событиями, сопровождающими столкновения частиц. Фактически новая метрика измеряет «работу», которую нужно совершить, чтобы перестроить конечную конфигурацию частиц. В качестве примера ученые рассмотрели адронные струи, которые рождаются в протон-протонных столкновениях, и подтвердили, что процессы расположены тем ближе, чем больше совпадает их «история».
В будущем работа ученых поможет построить быстрые классификаторы — в частности, классификаторы, основанные на машинном обучении. Статьяопубликована в Physical Review Letters, кратко о ней сообщает Physics.
Каждую секунду на Большом адронном коллайдере сталкиваются десятки миллионов протонов, и каждое столкновение развивается по своему уникальному сценарию. Из-за высокой энергии протонов в таких столкновениях на доли секунды рождаются интересные короткоживущие частицы — например, топ-кварки и бозоны Хиггса, — которые быстро рассыпаются ливнем легких частиц. Затем физики аккуратно измеряют, куда и с какой энергией летели частицы ливня, восстанавливают по этим данные картину событий и рассчитывают свойства промежуточных частиц. В каком-то смысле эта работа напоминает поиски преступника по отпечаткам пальцев — только отпечатками в данном случае служат параметры рожденного ливня.
Правда, найти преступника по отпечаткам пальцев все-таки гораздо проще, чем установить, что происходило в ходе столкновения. Во-первых, данные о событии сначала нужно очистить от «мусора» — столкновений, при которых не произошло ничего интересного (например, протоны рассеялись друг на друге, не родив новых частиц). Учитывая, что в ходе эксперимента Большой адронный коллайдер можетгенерировать данные со скоростью около петабайта в секунду, такая очистка может быть сложнее, чем кажется. Во-вторых, параметры частиц, попавших в детектор, измеряются с некоторой погрешностью, да и теория описывает процессы с конечной точностью. Из-за этого нельзя уверенно сказать, какая промежуточная частица запустила ливень.
Хуже того: у физиков до сих пор нет инструмента, который бы позволял легко отличить одно событие от другого. Вместо этого исследователи предпочитают численно моделировать события со случайными параметрами, сравнивать их с собранными данными и восстанавливать картину на основании замеченных совпадений. Чем больше столкновений проанализировали ученые, тем меньше будет погрешность конечного результата. Тем не менее, этот метод требует больших вычислительных затрат и в некоторых случаях может путать слабо отличающиеся события, поскольку пиксели детектора плохо чувствуют малые отклонения параметров. Подробнее об этом анализе можно прочитать в статьях«Как изучают элементарные частицы» и «Анатомия одной новости».
Физики Патрик Комиске (Patrick Komiske), Эрик Методиев (Eric Metodiev) и Джесси Талер (Jesse Thaler) наконец предложили метрику, которая определяет расстояние между событиями с одинаковым числом конечных частиц, а потому позволяет легко их отличать. Фактически эта метрика описывает «работу», которую нужно совершить, чтобы перестроить одно событие в другое. Эта «работа» складывается из двух членов, имеющих разный физический смысл. Первый член — это просто разница между суммарными энергиями конечных частиц, родившихся в двух разных событиях. Второй член описывает, какую минимальную энергию нужно затратить, чтобы передвинуть частицы первого события в новые положения, совпадающие с частицами второго события. Фактически расстояние между событиями, измеренными в новой метрике — это частный случай «расстояния землеройки» (earth mover’s distance, EMD).
По словам ученых, новая метрика лучше всего подходит для определения внутренней структуры адронных струй (джетов) — направленных пучков частиц, которые рождаются при столкновении высокоэнергетических кварков и глюонов. Поэтому физики проверили, как она работает, на примере трех струй с разной топологией: растроенные струи, сопровождающие рождение топ-кварков, раздвоенные струи W-бозонов и одиночные струи кварков или глюонов. Для этого исследователи сгенерировали протон-протонные столкновения с помощью пакетаPYTHIA 8.235, рассчитали расстояние между 30 тысячами событий и подтвердили, что события с разной «историей» удалены друг от друга дальше, чем похожие события.
Кроме того, ученые заметили, что после определения метрики на пространстве событий можно исследовать структуру индуцированногомногообразия. Простейшая характеристика такого многообразия — это размерность. В данном случае такой характеристикой является корреляционная размерность — величина, которая рассчитывается для множества точек и совпадает с размерность многообразия, по которому раскиданы точки, если они раскиданы случайно. Интересно, что корреляционная размерность событий зависела от их природы и характерной энергии. Это отвечает тому факту, что на разных масштабах энергий доминируют разные физические эффекты.
Авторы статьи надеются, что введение метрики на пространстве событий поможет ученым разработать новые, более эффективные классификаторы и облегчить анализ экспериментальных данных. В частности, такая метрика пригодится при разработке программ, основанных на методах глубокого обучения.