О том, как научить искусственный интеллект понимать, а не угадывать химию

Наука и жизньНаука

Глаз-синхротрон

Беседу ведёт Наталия Лескова

Богдан Олегович Проценко. Фото Виктора Шаповалова

Рентгеновская спектроскопия поглощения — один из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: учёные тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчёты. Теперь, благодаря методам, основанным на машинном обучении, этот процесс занимает всего несколько минут.

О том, как научить искусственный интеллект понимать, а не угадывать химию, рассказывает Богдан Проценко, лаборант-исследователь Международного исследовательского института интеллектуальных материалов Южного федерального университета (МИИ ИМ ЮФУ).

— Богдан Олегович, что такое рентгеновская спектроскопия и зачем она нужна?

— Это метод исследования вещества. У физиков, как у детей: чтобы понять, что внутри, надо вещь или сломать, или воздействовать на неё чем-то, и уже по результату, отклику делать выводы. Чтобы понять, что арбуз сладкий, достаточно просто похлопать по нему. А вот когда мы переходим к атомам и молекулам, мельчайшим деталям их строения и функционирования, к тому, как вообще устроена материя вокруг нас и почему она такая, а не какая-то другая — всё становится намного сложнее. Нет там «правды», которую можно увидеть глазами: размеры систем много меньше длины волны видимого света, а энергии процессов много больше. Дифракционный предел (который также называют критерием Рэлея или критерием Аббе) ограничивает минимальные размеры того, что можно увидеть. Но если взять длины волн, сопоставимые с размерами атомов и расстояниями между ними, то мы обойдём этот предел и окажемся в рентгеновском диапазоне.

Когда мы светим на вещество рентгеновским излучением, оно рассеивается либо с сохранением энергии, упруго, как говорят физики, либо неупруго, теряя или приобретая энергию после рассеивания. Первый вариант называется дифракцией — это отличный метод исследовать структуру упорядоченных объектов, например кристаллов. Рассеянное на кристаллической решётке рентгеновское излучение интерферирует, давая максимумы и минимумы на разных углах отражения. Но для этого нужен дальний порядок расположения атомов. А вот второму варианту, собственно рентгеновской спектроскопии, это уже безразлично.

Макет строящейся установки СИЛА (СИнхротрон + ЛАзер). Она объединит в себе сразу две установки: лазер на свободных электронах (с энергией 6 ГэВ) и синхротрон. За макетом — Богдан Проценко. Фото: Фото Назара Чубкова

Мы светим рентгеновским излучением разных энергий на вещество и смотрим, как оно поглощается. Это и есть рентгеновская спектроскопия. По форме зависимости поглощения излучения от его энергии, которая и называется спектром рентгеновского поглощения, можно понять, как в веществе расположены атомы и в каком химическом состоянии они находятся. При буквальном переводе с латыни spectrum — «образ», «душа», что как бы подчёркивает, что спектр отражает некоторые уникальные внутренние особенности объекта.

Идея рентгеновской спектроскопии в общем-то простая: раз рассеяние у нас неупругое, то есть часть излучения поглощается, теряет энергию, — значит, эта энергия на что-то расходуется. А идёт она на то, чтобы выбить электроны в атомах со своих «насиженных» мест и отправить их прочь из атома. Выбитый электрон тратит полученную энергию на то, чтобы преодолеть притяжение атома и затем столкнуться с соседними атомами. Ситуацию, когда излучение выбивает электроны из вещества, мы называем фотоэффектом, выбитый электрон — фотоэлектроном, а такого рода рассеяние на соседях с наложением результатов — интерференцией. В сущности, рентгеновская спектроскопия — это интерференция фотоэлектронов, где интерференционной решёткой служит сама материя. Разного рода интерферометры принадлежат к классу самых точных измерительных приборов, взять хотя бы обсерваторию LIGO, где впервые зафиксировали гравитационные волны.

В микромире между частицами и волнами нет чёткой грани — это так называемый корпускулярно-волновой дуализм. Поэтому на вылетевший электрон в силу квантовых эффектов можно смотреть как на волну, которая рассеивается на соседях, накладывается сама на себя и т. д. Представьте себе, что вы кинули в воду камень, и от его падения пошли волны на воде — вот это как бы выбитый электрон. Волны встречают препятствия, отражаются, эти вторичные отражённые волны накладываются уже на первую волну и друг на друга — получается интересная интерференционная картина. При разных энергиях излучения, то есть если с разной силой «пинать» электрон, интерференционная картина будет разной. Вот почему форма зависимости поглощения от энергии содержит в себе информацию как о локальном окружении атомов, так и об их электронной структуре. Примерно как в аналогии с кругами на воде, только с поправкой на то, что все процессы носят квантовый характер: получается, что фотоэлектрон, будучи одной (!) частицей, вполне прекрасно рассеивается сам на себе и учитывает в момент своего вылета (ещё до рассеяния на соседях, как бы «зная будущее наперёд») все возможные варианты того, как он сможет после вылета рассеяться на соседях. Если вам это кажется захватывающим — поздравляю, вы в шаге от вступления в наш клуб спектроскопистов!

— Что нужно, чтобы получить рентгеновский спектр какого-нибудь соединения?

— Понятное дело, что для рентгеновской спектроскопии нужен собственно рентген, и во всём мире строятся огромные установки для генерации очень яркого и сфокусированного излучения. Это синхротроны и рентгеновские лазеры на свободных электронах — монструозные устройства, способные генерировать излучение в миллионы раз ярче Солнца с микро- и фемтосекундным разрешением… На таких сложных и дорогих устройствах, занимающих, как правило, площадь очень большого здания, находится сразу несколько лабораторий — их называют линиями, или каналами, где каждая лаборатория реализует свою методику исследования. Возможности рентгеновской спектроскопии огромны, потому неудивительно, что существует корреляция между научно-техническим уровнем страны и количеством подобных установок. Учёные обычно пишут заявку на то, чтобы получить возможность провести измерения на одной из них, и, если она выигрывает, приезжают командой, с оборудованием и образцами, и проводят измерения круглосуточно — там каждый час на счету. Экспериментальная работа на таких установках позволяет получать уникальные данные, ценные практически в любой области, от искусствоведения и истории до геологии экзопланет, структурной биологии, катализа и материаловедения. Например, структура подавляющего большинства белков человечеству известна во многом благодаря синхротронам.

— Насколько я знаю, в нашей стране на данный момент всего одна такая установка — в Курчатовском институте.

— Да, это Курчатовский источник синхротронного излучения («КИСИ-Курчатов»). Кроме него есть ещё два ускорителя в Новосибирске (ВЭПП-3 и ВЭПП-4), которые часть времени работают на генерацию синхротронного излучения. Ещё активно строятся или планируются новые, например СКИФ (Сибирский Кольцевой Источник Фотонов), СИЛА (СИнхротрон+ЛАзер), РИФ и другие. Думаю, нам в Ростове один, пусть и небольшой ускоритель, тоже бы не помешал.

— Какие всё это решает фундаментальные задачи?

— Спектроскопия рентгеновского поглощения — это один из важнейших инструментов, необходимых для того, чтобы узнать, как на самом деле устроено вещество вокруг нас. Иными словами, понять на атомарном уровне устройство материи, какая она, почему и как функционирует.

Причём ограничений на состояние образца нет, рентгеновская спектроскопия применима для любого агрегатного состояния вещества и может применяться прямо в процессе работы (в этом помогает проникающая способность рентгена), например, можно исследовать, как деградируют катализаторы прямо в ходе реальной реакции или как стареют литий-ионные батареи в циклах зарядки-разрядки. Её используют и для изучения биологических объектов (в частности, металлических центров в белках), для диагностики конструкционных и функциональных материалов, в том числе для микроэлектроники.

Фото Назара Чубкова

— Что представляет собой ваша разработка?

— Наша разработка — это метод для быстрого и точного анализа данных спектроскопии рентгеновского поглощения, основанный на искусственном интеллекте или машинном обучении. Мы с вами говорили про то, как много полезной информации содержится в рентгеновских спектрах и как их измеряют, но ни слова про то, как их, собственно, анализируют. А это очень непросто. Мы не видим отдельные атомы и их состояние, но видим некоторую сложную общую картину. Как будто бы это какая-то тень, отбрасываемая объектом, но не сам объект. А как восстановить объект по отбрасываемой им тени? Если структура однозначно определяет спектр, то спектр не всегда однозначно определяет структуру. В математике даже есть термин для такого рода задач — некорректные обратные задачи. Наша разработка посвящена тому, как решить эту некорректную задачу: с помощью машинного обучения построить алгоритм получения структуры из спектра.

У спектра рентгеновского поглощения есть две основные области: тонкая структура вблизи края поглощения (XANES) и протяжённая тонкая структура поглощения после края (EXAFS). Последняя, поскольку в ней доминирует рассеяние на соседях, позволяет исследователь в большей степени геометрические параметры (то, как расположены атомы), и для неё существует формула, подгоняя которую к данным, учёные получают структурные параметры вещества. А вот для XANES, где есть вклад в рассеяние и геометрии локального окружения и электронного состояния атомов, такой формулы нет. И не будет никогда. Так уж устроена наука, что только в школе всё понятно и для всего есть уравнение, решаемое аналитически, в жизни и науке, увы, не так. Перед нами ларец с ценнейшей информацией, но ключа у нас от него нет… Потому исследователям остаётся либо с весьма ограниченной точностью численно моделировать простейшие системы на суперкомпьютерах, чтобы понять какие-то закономерности, либо сравнивать неизвестную систему с известными.

Спектр каждого материала уникален, и его особенности — как отпечаток пальца человека. Поэтому этот метод так и называется — «метод отпечатка пальца». Исследователи берут библиотеку спектров веществ-эталонов и пристально вглядываются в то, что у этих спектров есть общего и различного с неизвестным спектром. Хотя звучит это не очень точно, надёжно и воспроизводимо… Иными словами, исследователи потратили огромные усилия и деньги, чтобы построить синхротроны, провести на них измерения, — и не могут из этих данных извлечь полезную информацию. Однако давайте приглядимся к последнему методу внимательнее — в нём мы собираем выборку, или библиотеку данных, и на её основе ищем закономерности, воспользовавшись которыми, пытаемся сделать вывод или предсказание для новых данных. Ничего не напоминает? Да это же просто пресловутое машинное обучение, раздел столь популярного ныне искусственного интеллекта!

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Каким ты будешь, городской бус? Каким ты будешь, городской бус?

Ждать ли нам завтра электробусов в каждом городе?

Наука и жизнь
Скелетные мышцы самолета – система управления Скелетные мышцы самолета – система управления

Зачем самолетам демпферы, гидроусилители, закрылки и предкрылки?

Наука и техника
«Общий ИИ будет умнее лауреата Нобелевской премии» «Общий ИИ будет умнее лауреата Нобелевской премии»

Визионеры — о том, как технологии изменят нашу жизнь

РБК
«Тратить — очень круто»: как зумеры ведут себя с деньгами «Тратить — очень круто»: как зумеры ведут себя с деньгами

Как молодые взрослые ищут баланс между тратами и накоплениями

РБК
Раскрыть потенциал мозга Раскрыть потенциал мозга

Как научиться слышать наш мозг и развить навыки с приставкой «супер»

Psychologies
Город, которому нужно 20 лет Город, которому нужно 20 лет

У Саратова есть потенциал, но ему не хватает времени

Weekend
Пророческий мультсериал: 7 сбывшихся предсказаний из «Симпсонов» Пророческий мультсериал: 7 сбывшихся предсказаний из «Симпсонов»

Про 7 самых интересных предсказаний «Симпсонов», которые сбылись

ТехИнсайдер
Катапульта, побег в СССР и месть юнги: великая и странная история парохода Bremen Катапульта, побег в СССР и месть юнги: великая и странная история парохода Bremen

От металлургии до гидродинамики: история парохода Bremen

ТехИнсайдер
О чем молчат рекорды HoReCa О чем молчат рекорды HoReCa

Будут ли все последствия смещения потребления с кухни в ресторан положительными?

Агроинвестор
«Дешевый» клиент почти всегда сложнее «дорогого»: как работать с придирчивыми заказчиками «Дешевый» клиент почти всегда сложнее «дорогого»: как работать с придирчивыми заказчиками

Как сразу определить, что клиент сложный, а когда лучше отказаться от проекта?

Inc.
Легенды со стрелками: 7 знаменитых часов в мире Легенды со стрелками: 7 знаменитых часов в мире

О десяти самых знаменитых часах, расположенных в разных частях нашего мира

ТехИнсайдер
Как избежать ошибок на переговорах Как избежать ошибок на переговорах

Распространенные просчеты в оффлайн- и онлайн-переговорах и как их избежать

Inc.
Золотой век английской карикатуры Золотой век английской карикатуры

«Отечество карикатуры и пародии» — об Англии Георгианской эпохи

Дилетант
Ткать узор дальше Ткать узор дальше

Почему последствия ссоры с Россией окажутся болезненными для Азербайджана?

Монокль
Сати Казанова: «Самое важное для меня – моя семья и творчество» Сати Казанова: «Самое важное для меня – моя семья и творчество»

Сати Казанова – о том, чем итальянский муж может раздражать кабардинскую жену

Здоровье
Грудное молоко помешало бактерии вызвать воспаление в кишечнике новорожденного Грудное молоко помешало бактерии вызвать воспаление в кишечнике новорожденного

Как материнское грудное молоко защает ребенка от дисбиоза и воспаления кишечника

N+1
Кузница достойных жен: как жили воспитанницы Смольного института благородных девиц Кузница достойных жен: как жили воспитанницы Смольного института благородных девиц

Чему учились «смолянки» и как жили в стенах института

Forbes
Михаил Дегтярев: Фонд – это инструмент нашего президента Михаил Дегтярев: Фонд – это инструмент нашего президента

О создании Российского спортивного фонда и трудностях, которые он решит

Ведомости
«Бархатный молоток»: как Эстер Петерсон боролась с зарплатным неравенством «Бархатный молоток»: как Эстер Петерсон боролась с зарплатным неравенством

Как Эстер Петерсон стала главной союзницей работающих американок

Forbes
Сделано с заботой: о новой отчетной нагрузке Сделано с заботой: о новой отчетной нагрузке

Постараемся разобраться в правовой основе требований для налогоплательщиков

Ведомости
Рожденные революцией Рожденные революцией

Как технологическая революция полностью изменит привычные нам гаджеты

Правила жизни
Маленькие шаги к переменам Маленькие шаги к переменам

Интервью с создателем инклюзивных раскрасок и игрушек Натальей Пониной

Лиза
Пластмассовый мир (не) победил Пластмассовый мир (не) победил

Насколько глубоко гаджеты проникли в нашу жизнь?

Правила жизни
«Поел морковки и пожелтел»: какие витамины нам не нужны «Поел морковки и пожелтел»: какие витамины нам не нужны

Какими рисками чревато расхожее «попей витаминчиков», откуда взялась эта мода?

РБК
Просто красота Просто красота

Дизайнер Кристиан Гранде — о творческом пути в яхтенном дизайне

Y Magazine
Один снимок, миллион проблем: почему не стоит публиковать фото посадочного талона в социальных сетях Один снимок, миллион проблем: почему не стоит публиковать фото посадочного талона в социальных сетях

Чем рискуют те, кто решился на традиционное фото с посадочным талоном?

ТехИнсайдер
«Все это было чудом» «Все это было чудом»

«Союз» — «Аполлон»: пример того, что космос возможен как зона сотрудничества

Монокль
Как мотивировать сотрудников: повышаем работоспособность команды Как мотивировать сотрудников: повышаем работоспособность команды

Проверенные стратегии повышения вовлеченности сотрудников на основе кейсов

Inc.
Команда спасателей Команда спасателей

Справляемся с отпускными кризисными бьюти-ситуациями

Moodboard
Опять и опять «Назад в будущее» Опять и опять «Назад в будущее»

Краткая история ленты «Назад в будущее», вырастившей последнее поколение XX века

Weekend
Открыть в приложении