1 июня 2021

МАГАТЭ опубликовало доклад о семантических технологиях, лежащих в основе веб-поиска и управления онлайн-информацией

AtomInfo.ru
Штаб-квартира МАГАТЭ

Мы живём в эпоху, когда информация стала доступна буквально на кончиках пальцев, а поисковые системы заменили библиотеки. За последнее десятилетие были достигнуты огромные технологические улучшения в области сбора, управления, понимания, представления, обмена и использования знаний, полученных из данных и информации по всему миру, а доступ обновленной информации осуществляется простым поиском в интернете.

Подобно человеческому мозгу, семантические технологии используют сегодня широкий спектр инструментов. Это помогает обрабатывать данные и информацию и связывать их вместе для создания понимания и смысла, отслеживая результаты анализа в форме концептуальной и когнитивной карт.

Согласно новому отчёту МАГАТЭ семантическая технология, лежащая в основе веб-поиска и управления онлайн-информацией, может быть использована в ядерной области для оказания помощи экспертам и заинтересованным сторонам в поддержании, сохранении, увязке и обмене ядерными знаниями.

"Более широкое использование семантических технологий может решить проблему координации и сбора информации из различных учреждений путём расширения доступа к ресурсам знаний по всей области в более широком масштабе", - считает специалист МАГАТЭ Максим Гладышев, ответственный за подготовку данного отчёта.

Семантические технологии, особенно в сочетании с искусственным интеллектом, машинным обучением, современными таксономиями и онтологиями, представляют собой мощный инструмент управления огромным объёмом ядерных данных, информации и знаний.

Одним из многих ключевых преимуществ использования семантической технологии является то, что она улучшает организацию данных и информации, связывая различные источники таким образом, чтобы они могли использоваться совместно и повторно в различных секторах, организациях и научных сообществах.

Благодаря такому улучшению знаний, информации и организации данных стандарты ядерной безопасности, рекомендации, опыт, передовая практика и предыдущие исследования могут стать более доступными.

Для исследовательских задач это может иметь серьёзные последствия - если уже существующие данные и информация могут быть связаны с другими источниками с помощью семантической технологии, то исследования и разработки в этой области становятся проще и быстрее и могут привести к большему количеству прорывов.

В настоящее время МАГАТЭ изучает различные прототипы и инициативы, которые могут принести пользу атомной отрасли.

Ядерный сектор основан на знаниях и зависит от обмена информацией и опытом в области проектирования, строительства, эксплуатации и вывода из эксплуатации ядерных объектов между всеми заинтересованными сторонами.

Серьёзной проблемой является адаптация системного подхода к ядерным знаниям и обеспечение их доступности для всех соответствующих сторон и организаций как на местном, так и на международном уровнях.

В настоящее время многие ядерные организации размещают свои знания на порталах, которые выступают в качестве централизованных хранилищ для тысяч документов с небольшим количеством метаданных или вообще без оных.

Без метаданных трудно осуществлять поиск и получать доступ к необходимой информации. Ешё сложнее без них устанавливать связи между различными информационными ресурсами.

Использование различных стандартов и спецификаций, относящихся к семантической технологии, может обеспечить решение этой проблемы путём создания общего языка в рамках ядерного сообщества, разработки системы организации знаний или дальнейшего развития существующих, таких как тезаурус INIS МАГАТЭ (IAEA INIS Thesaurus).

Это также может помочь в интеграции различных источников данных, автоматизации индексирования и во многом другом.

Выделяя (захватывая) смысл из неструктурированных данных и связывая различные доступные источники информации, семантическая технология может повысить устойчивость управления сложными и междисциплинарными ядерными системами.

"Использование семантических технологий в управлении ядерными знаниями может помочь в построении моделей знаний и позволить объединять разрозненные источники информации для поддержки приложений и сервисов на их основе", - сказал Гладышев.

Использование данной технологии центром атомных исследований имени Индиры Ганди (IGCAR) в Калпаккаме (Индия), демонстрирует на практике, как семантическая технология может принести пользу атомной отрасли.

Чтобы эффективно использовать и сохранять результаты многих десятилетий ядерных исследований, IGCAR создал портал управления знаниями. В портале при его разработке были заложены функции, позволяющие фкисировать негласные данные (известные конкретным специалистам, но не формализованные для передачи коллегам) и получать, хранить, делиться и использовать информацию в публикациях, проектах, мероприятиях и во многом другом.

"Наша система управления знаниями, реализованная с применением технологий вычислительного интеллекта, позволяет нам превращать знания в интеллектуальный капитал, повышать производительность и улучшать коммуникацию между специалистами, а также укреплять эффективность и безопасность работы АЭС", - считает Р.Джехадисан, руководитель компьютерного отдела центра IGCAR.

В качестве доказательства концепции МАГАТЭ, в свою очередь, разработало экспериментальную платформу хранилища знаний и объектов обучения. Проект показал - чем больше образовательных организаций публикуют информацию в репозитории, тем богаче становятся метаданные, позволяющие делать сложные запросы и фильтровать данные в соответствии с потребностями пользователя.

Семантическая технология включает в себя широкий спектр инструментов, стандартов и методологий, позволяющих обрабатывать информацию на основе её контекста и смысла. Для её кодирования могут быть успешно использованы такие инструмента, как "Resource Description Framework" (RDF) и "Web Ontology Language" (OWL).

Эта технология позволяет хранить информацию и управлять ею таким образом, чтобы генерировать корреляции и связи между различными фрагментами данных и различными информационными ресурсами.

"Вообще говоря, информация обычно ограничивается одной системой в рамках одной организации", - поясняет Гладышев.

"Однако семантическая технология бесценна, потому что она позволяет соединять системы из нескольких организаций. Используя семантическую систему, пользователи могут получить доступ к релевантной информации по интересующей их теме из различных источников".

Семантические технологии используются во многих областях для повышения организационной эффективности и облегчения доступа к информации с различных платформ. Это означает, что пользователю не нужно знать о различных источниках и искать необходимую информацию во всех таких источниках.

Поскольку база ядерных знаний чрезвычайно велика и сложна, использование этой технологии в ядерной области может повысить эффективность и результативность управления, поиска и использования ядерных знаний.