Что отличает подлинного IT-специалиста? Что кроется за информационными технологиями ? Наталья Теряева спросила об этом директора Лаборатории информационных технологий Объединенного института ядерных исследований, доктора технических наук Владимира Коренькова - а также побеседовала с ним о грид-сетях, облачных структурах и их научных, инженерных и социальных приложениях.
Владимир Кореньков: Системное администрирование и веб-дизайн требуют специальной подготовки, и не всегда для этого нужно иметь высшее образование. Но, с другой стороны, для управления крупными ИТ-инфраструктурами (суперкомпьтеры, грид-система, облачная среда) требуются системные администраторы высочайшего уровня, которых пока не готовят в университетах. Наша лаборатория занимается широким спектром сложнейших проблем, поэтому нам нужны специалисты высокого уровня, которые умеют адаптировать свои знания для решения разных задач. Например, в кратчайшие сроки создать модуль на новом языке программирования, настроить систему хранения данных или создать облачную среду. Информационные технологии очень быстро меняются, поэтому и учиться нужно постоянно.
Однако молодым ИТ-специалистам надо уметь себя правильно позиционировать. Часто бывает, что слабые специалисты легко находят себе высокооплачиваемые места и становятся ведущими сотрудниками в московских банках и ИТ-компаниях. Это, скорее, беда сильных – значит, не могут себя проявить. Кстати, в Дубне пока еще мало площадок, где молодые люди могли бы показать свои возможности.
- Может, учат студентов как-то не так, раз те, кто хорошо успевает, не могут найти себе работу, а сачкующие двоечники неплохо устраиваются в жизни?
- В сегодняшней ситуации есть большая доля вины ЕГЭ. Информатику в России сделали для выпускников предметом по выбору, поэтому ее сдают всего 7 процентов школьников. В школах преподавателей информатики не хватает. Низкий уровень ее преподавания поддерживается и отсталостью технической базы школ. Многие директора школ даже не советуют ребятам сдавать ЕГЭ по информатике, ориентируют их выбрать естествознание. Родители тоже толкают детей по пути наименьшего сопротивления. ЕГЭ по естествознанию сдает большой процент выпускников. С результатом ЕГЭ по естествознанию выпускники школ не могут поступать на ИТ-специальности, так как для этого нужно сдавать ЕГЭ по информатике. В результате в университетах недобор на специальности, связанные с информационными технологиями. Конкурса нет. Вообще, в сфере IT кадры – главная проблема сегодняшнего дня. Университеты не успевают за темпами развития информационных технологий, а специалисты неохотно идут преподавать в университеты. Мне часто приходится использовать административный ресурс, чтобы хорошие специалисты преподавали в университете. Собрать компьютер или создать простой информационный сайт сегодня может любой. А научиться внедрять современные облачные вычисления или разрабатывать параллельные алгоритмы – слишком сложная задача для многих.
- Вы имеете в виду грид-технологии?
- И грид-технологии тоже. Грид и облако – это способы организации распределенных вычислений. Созданная для Большого адронного коллайдера в ЦЕРН архитектура грид -сети отличается от облачной структуры, но в их развитии есть явная тенденция к слиянию.
- А в чем разница между церновской грид-сетью и облаком?
- Напомню, что и грид, и облако чаще всего строятся на базе выделенных ресурсов (кластеров, систем хранения, суперкомпьютеров, дата-центров). Хотя существуют и проекты объединения индивидуальных машин частных пользователей в единую грид-среду для совместных вычислений (в этом случае мы говорим о невыделенных ресурсах или добровольных вычислениях). Ресурсы объединяются, чтобы создать большую вычислительную мощность – то есть задействовать максимально большой объем памяти процессоров и сократить время расчетов за счет выполнения вычислений в параллельном режиме.
Грид для Большого адронного коллайдера и других серьезных задач использует выделенные ресурсы, а не ресурсы индивидуальных машин пользователей. Грид-инфраструктура предоставляет ресурсы только виртуальным организациям (объединениям пользователей, которые занимаются общими задачами, например, CMS, ATLAS, ALICE, biomed, Fusion, PANDA), а не отдельным пользователям.
Сеть грид Большого адронного коллайдера имеет многоуровневую иерархическую структуру. Ее главный центр (он называется Tier-0) находится в ЦЕРН, в Женеве. От него несколько лучей расходятся вниз, к центрам следующего уровня – Tier-1. Таких центров в мире всего одиннадцать. (Двенадцатый центр Tier-1 сейчас создается совместно ОИЯИ и Курчатовским институтом. Это будет первый в России центр такого уровня). От каждого из Tier-1 центров идут лучи к центрам еще более низкого уровня – Tier-2 . И так далее. На нулевом – самом высоком уровне – первичная информация собирается и хранится. На первом уровне хранится полная копия информации, собранной на нулевом уровне. А на втором и более низких уровнях информация не хранится, а только обрабатывается – производятся вычисления и анализ.
Поскольку участники грид-структуры наделены разными приоритетами, то на практике выходит, что собирать и использовать все ресурсы сети может небольшое число пользователей. Пока сеть используют клиенты с более высоким приоритетом, остальные должны ждать своей очереди. Поэтому древовидную грид-структуру сравнивают с песочными часами. Верхняя колба часов – нулевой и первый уровень сети грид. Нижняя колба – второй и более низкие уровни. Информация с высших уровней при передаче вниз должна проходить через узкое горлышко. И это проблема грид-структуры, которая требует решения путем совершенствования технологий. Прежде всего, нужно увеличить скорость обмена информацией с нынешних 10-20 Гбит/с до 100 Гбит/с (в ОИЯИ мы планируем добиться этого к 2015 году).
- Облака организованы иначе?
- Облачная инфраструктура чаще всего создается на базе одного или нескольких дата-центров с использованием виртуализации и предоставления различных услуг как организациям, так и индивидуальным пользователям. Модели предоставления облачных сервисов могут быть различны: IaaS -инфраструктура как сервис, PaaS - платформа как сервис, SaaS - программное обеспечение как сервис.
- Что означают эти аббревиатуры?
- Модель SaaS (от англ. Software as a Servicе) позволяет своим клиентам пользоваться прикладным программным обеспечением провайдера. Доступ к нему предоставляется с помощью браузера или интерфейса программы. Каждый из пользователей облака имеет право только на небольшую часть от общего пула ресурсов облака. Поэтому один пользователь не может вызвать общей нехватки ресурсов. Так в облачных вычислениях создается иллюзия бесконечного вычислительного пространства.
В модели PaaS (от англ. Platform as a Service) основная услуга – использование облачной инфраструктуры как платформы для размещения базового программного обеспечения клиента и прикладных приложений к нему.
Облачная модель IaaS (от англ. Infrastructure as a Service) дает в пользование клиенту всю свою инфраструктуру, где можно самостоятельно управлять сетью, обработкой и хранением данных.
- Грид-технологии и облака лучше суперкомпьютеров?
- Дешевле при той же эффективности вычислений. Пользование сетью грид иногда сравнивают с использованием электрической розетки, куда так же просто подключить любой электроприбор, как включить персональный компьютер в сеть грид. Впрочем, эксперты в области информационных технологий прогнозируют скорое включение суперкомпьютеров в облачные и грид-структуры.
- Какую же информацию будет хранить центр Tier-1, который создается ОИЯИ и Курчатовским институтом?
- Сеть грид организована для обработки огромного массива данных, которые непрерывно поступают с детекторов Большого адронного коллайдера. В ОИЯИ будут храниться данные эксперимента CMS, а в Курчатовском институте – данные детектора ATLAS. Скажу точнее – в Объединенном институте будет создан центр хранения данных его стран-участниц. И наши физики благодаря этой возможности смогут более активно участвовать в анализе результатов экспериментов Большого адронного коллайдера. Опыт работы по созданию центра первого уровня сети грид очень пригодится нам при разработке информационной инфраструктуры для научных мегапроектов России – коллайдера NICA в Дубне и реактора ПИК в Гатчине. Это новый технологический уровень – принимать, хранить и обрабатывать информацию с высокой скоростью и надежностью. Этих знаний очень не хватает сейчас России во многих высокотехнологичных областях, например в космической отрасли или в медицине.
- Мне кажется, что и в земных условиях работа с информацией у нас как-то не очень хорошо продумана. Взять хоть нашумевший проект электронных очередей в поликлиниках – в таком виде, как нам его представили, он ничем не отличается от обычной процедуры самозаписи к врачу. Только самозапись практически бесплатна, а оборудование для электронной очереди стоит бешеных денег…
- Да, система электронной очереди не впечатляет… На мой взгляд, все это происходит оттого, что используются устаревшие информационные технологии. А нам для развития нужно брать на вооружение опыт создания информационной инфраструктуры Большого адронного коллайдера. Его надо применять, в том числе, и в здравоохранении для создания базы медицинских данных. Но и Газпром, и Росатом, и авиакорпорация МиГ, и Сбербанк испытывают опасения: обработка информации требует серьезной системы защиты данных, в том числе персональных. Хотя корпорации Boeing и Intel настолько хорошо справились с защитой данных, что не боятся привлекать к своим разработкам российских инженеров и программистов. Мне кажется, здесь проявляется не столько боязнь наших топ-менеджеров потерять важную информацию, сколько нежелание работать на современном уровне.