Matlab Deep Learning помогает обнаруживать гравитационные волны

Matlab Deep Learning помогает обнаруживать гравитационные волны

В 1915 году Альберт Эйнштейн построил геометрическое описание гравитации с помощью своей общей теории относительности. Любая новая теория, которая стремится заменить существующую (ньютоновскую) теорию, должна давать экспериментально проверяемые предсказания. Они и являются уникальными для нее.

Теория относительности Альберта Эйнштейна предсказала гравитационные волны как рябь в пространстве-времени. Эти волны могут помочь нам измерить такие свойства, как расстояние, масса и вращение астрономических объектов. Так же нейтронные звезды и черные дыры.

В 1916 году не существовало инструментов для измерения гравитационных волн. Волны возникали в результате астрофизических событий, таких как столкновение двух звезд. В последующие десятилетия ученые и инженеры постепенно разработали технологию, необходимую для измерения этих неуловимых волн.

Лазерные интерферометры — это устройства, извлекающие информацию из нарушений траектории лазерных лучей. Интерферометр разделяет луч на две составляющие. Эти лучи пройдут несколько километров, отразятся от двух зеркал и рекомбинируют в светоделителе. Это приведет к конструктивной или деструктивной интерференции. Распространяющиеся гравитационные волны вносят относительный фазовый сдвиг между этими лучами, изменяя окончательную интерференционную картину. Эти очень незначительные возмущения указывают на гравитационные волны. Они вызванные такими явлениями, как черные дыры или столкновения нейтронных звезд.

Слияние черных дыр.

Первый прототип интерферометрических детекторов гравитационных волн и эксперименты в конце 1960-х годов показали, что лазерная интерферометрия может обеспечить измерения, необходимые для обнаружения гравитационных волн. Впоследствии научное и инженерное сообщество во всем мире предприняло усилия по созданию более совершенных интерферометров. В последующие десятилетия аналогичные предприятия были созданы в Массачусетсе, Мюнхене, Глазго и других местах. Нынешнее поколение сложных гравитационно-волновых обсерваторий — это передовые детекторы LIGO в США, Virgo в Италии, GEO 600 в Германии и KAGRA в Японии.

В 2015 году LIGO Scientific Collaboration и Virgo Collaboration совместно опубликовали статью об обнаружении гравитационных волн от двойных черных дыр звездной массы. Они сливаются на расстоянии 1,3 миллиарда световых лет от Земли.

Это открытие открыло новое окно во вселенную. До этого существовал электромагнитный способ смотреть на Вселенную с помощью телескопов с разными длинами волн, от радиоволн до гамма-лучей. Со временем нашли новый способ наблюдения за такими экзотическими объектами, как черные дыры, у которых нет электромагнитной сигнатуры. Это так же захватывающе, как изобретение оптического телескопа в 1600-х годах. Сейчас имеется около 100 подтвержденных обнаружений этих источников, и еще больше будет в будущем.

Обнаружение черных дыр с помощью нейронных сетей

Надежное обнаружение гравитационных волн — проблема, которую еще предстоит полностью решить. Сигналы, улавливаемые лазерными интерферометрами, слабые. А поскольку детекторы чрезвычайно чувствительны, на их выходной сигнал может влиять шум окружающей среды, такой как вибрация земли от городского транспорта, машин, морских приливов и сейсмической активности. Научное сообщество постоянно разрабатывает новые методы фильтрации сигналов от шума.

Хотя целью было обнаружение очень чувствительных астрофизических сигналов, за последние 50 лет. Усилия в области исследований и разработок привели к разработке высокоточных датчиков и приводов.

Некоторые из разработанных технологий включают активные и пассивные системы сейсмической виброизоляции для поддержания оптики в неприкосновенности, малошумящие лазерные системы и датчики оптической центровки на основе интерферометрии.

Хотя астрофизика и космология являются основной целью, многие из разработанных технологий полезны для всего сообщества.

Вид с воздуха на наземный интерферометрический детектор гравитационных волн GEO 600.

Решение проблемы контроля

Одной из основных проблем лазерной интерферометрии является управление оптикой, которая становится более острой при использовании для обнаружения гравитационных волн. В отличие от простых интерферометров Майкельсона, интерферометры, используемые в таких лабораториях, как LIGO и GEO 600, имеют десятки зеркал, каждое из которых необходимо контролировать, выравнивать и обслуживать.

Обучение с подкреплением отличается от других методов машинного обучения, поскольку оно основано на действиях, состояниях и вознаграждениях. Агенту обучения с подкреплением предоставляется среда и набор действий. Он должен научиться выполнять последовательности действий, которые приводят к оптимальному состоянию и максимизируют вознаграждение.

Первым шагом в разработке стратегии управления обучением с подкреплением является выявление несоответствий. Традиционный способ измерить это — использовать датчики волнового фронта. Вместо этого мы использовали нейронный датчик, состоящий из сверточных слоев и слоев LSTM, который измеряет несоосность, анализируя видео с камер, размещенных в оптико-механической схеме.

Модель ИИ (темная линия) предсказывает несоосность ключевой оптики, просто просматривая интерференционные изображения из наиболее чувствительного места детектора GW. Эти предсказания хорошо совпадают с предсказаниями традиционного датчика волнового фронта.

Сенсорная нейронная сеть, созданная с помощью Deep Learning Toolbox, стала компонентом, определяющим состояние среды. Пространством действия были корректировки, внесенные в оптику. А функция вознаграждения была разработана на основе принципов классической теории управления для оптимизации действий, улучшающих выравнивание зеркал.

«Преимуществом этой функции вознаграждения было то, что я мог автоматически генерировать ее часть с помощью Simulink Design Optimization™», — говорит Мукунд. «Мы дали ему характеристики нашей модели, такие как пропускная способность, производительность, надежность и скорость. Simulink Design Optimization хорошо интегрирован с Reinforcement Learning Toolbox™, и он смог сгенерировать вознаграждение за шаблон, к которому мы добавили наши знания в области физики.

Одним из преимуществ MATLAB® было то, что можно быстро перебирать различные алгоритмы обучения с подкреплением, что значительно сократило время, необходимое для достижения окончательного выбора. Было определено, что алгоритм мягкого актера-критика был оптимальным решением проблемы управления.

Моделирование окружающей среды

Команда столкнулась с еще одной проблемой при обучении модели. Агентам обучения с подкреплением требуется множество эпизодов проб и ошибок, чтобы изучить динамику и оптимальную политику своей среды. Первоначально агент предпринимает случайные действия, чтобы исследовать свое окружение и изучить различные схемы вознаграждения и наказания. Постепенно он сходится к оптимальной последовательности действий. Однако это часто не подходит для приложений, требующих взаимодействия с физическим оборудованием и реальным миром.

Модель для алгоритма подкрепления мягкого актера-критика.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *