Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Главные проблемы китайских смартфонов Главные проблемы китайских смартфонов

После этого ты точно захочешь потратить деньги на флагман

Maxim
3 современные российские книги о детско-родительской травме 3 современные российские книги о детско-родительской травме

Бибилиотерапия, которая поможет осмыслить детско-родительские травмы

Psychologies
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Гарем для маньяка: история Александра Комина, который держал в подвале невольниц Гарем для маньяка: история Александра Комина, который держал в подвале невольниц

«Рабовладелец» — такое прозвище получил серийный убийца Александр Комин.

VOICE
6 продуктов, которые категорически нельзя есть во время похудения 6 продуктов, которые категорически нельзя есть во время похудения

Пищевые ловушки здоровых продуктов

ТехИнсайдер
Форсаж американского истребителя F-15: диски Маха в небесах Форсаж американского истребителя F-15: диски Маха в небесах

Как из турбореактивных двигателей истребителя F-15 Eagle выходят диски Маха

ТехИнсайдер
«Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения? «Жене стал неинтересен секс»: как преодолеть разлад в браке и сексе — и выстроить доверительные отношения?

Почему женщины не хотят секса в браке и как об этом говорить?

Правила жизни
Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома? Растянутая футболка или стильный халат: зачем нужно красиво одеваться дома?

Почему мы на улице и мы дома — два разных человека?

Psychologies
4 фразы нового партнера, которые должны стать для вас «красными флажками» 4 фразы нового партнера, которые должны стать для вас «красными флажками»

Как распознать сигналы, говорящие о нездоровых или даже опасных отношениях

Psychologies
Женщина с молотом: почему фильм «Тор: любовь и гром» не смог преодолеть неравенство Женщина с молотом: почему фильм «Тор: любовь и гром» не смог преодолеть неравенство

Смогли ли Marvel внедрить супергеройское кино в феминистский контекст?

Forbes
Григорий Распутин. Грешный старец у трона Российской империи Григорий Распутин. Грешный старец у трона Российской империи

Почему "грязный деревенский мужик" получил такую неограниченную власть

Караван историй
В 19 лет прославилась, в 20 убита мужем: трагическая судьба звезды Playboy Дороти Страттен В 19 лет прославилась, в 20 убита мужем: трагическая судьба звезды Playboy Дороти Страттен

В свои 20 лет Дороти Страттен имела всё — мужа, популярность, работу мечты

VOICE
Очищение крови Очищение крови

Рассказываем, как убрать из крови (а значит, и из всего организма) все лишнее

Лиза
Свободные женщины 1920-х: как японские модан гару бросали вызов традиционалистам Свободные женщины 1920-х: как японские модан гару бросали вызов традиционалистам

Кем были модан гару и как они расшатали японское общество?

Forbes
Рождественское озарение: как Маргарет Штайфф придумала плюшевых мишек Тедди Рождественское озарение: как Маргарет Штайфф придумала плюшевых мишек Тедди

Мир никогда бы не узнал о медвежонке Тедди, не прояви упорство Маргарет Штайфф

Forbes
15 главных фактов о коньяке, без которых его просто стыдно пить 15 главных фактов о коньяке, без которых его просто стыдно пить

12 фактов о самом благородном из алкогольных напитков

Maxim
«Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов «Смотришь на эти вывески, и они честно заявляют — стало хуже». Что не так с ребрендингом западных компаний, попавших в руки российских бизнесменов

Почему правильный ребрендинг — это важно? И почему он не у всех получается?

Inc.
Как вычислить плохого мастера по наращиванию ресниц: главные признаки- Как вычислить плохого мастера по наращиванию ресниц: главные признаки-

Определить плохого лашмейкера не так-то просто, однако эти "маяки" помогут

VOICE
Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР

Битцевский маньяк собирался довести число своих жертв до 64

VOICE
Урок для родителей Урок для родителей

Школа меняет жизнь не только детей. К чему надо готовиться взрослым?

Лиза
Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту

Чтобы сэкономить на ненужных тратах и заработать больше, нужно составить бюджет

ТехИнсайдер
«Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин «Жанна д’Арк из Сирии»: как Назик аль-Абид добивалась свободы для страны и для женщин

Назик аль-Абид — женщина-генерал, посвятившая жизнь борьбе за права женщин

Forbes
Мягкая сила. Как управлять бизнесом в новой реальности: правила первого зампреда правления Росбанка Перизат Шайхиной Мягкая сила. Как управлять бизнесом в новой реальности: правила первого зампреда правления Росбанка Перизат Шайхиной

Как замотивировать сотрудников, не прибегая к авторитарным мерам

Правила жизни
«Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего» «Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего»

«Преступления будущего» — триллер о безрадостном будущем человечества

Forbes
Нужно ли говорить ребенку, что он приемный: личный опыт читательницы и комментарий психолога Нужно ли говорить ребенку, что он приемный: личный опыт читательницы и комментарий психолога

Правильно ли беречь тайну усыновления от самого ребенка?

Psychologies
«Совместное родительство — это предприятие»: как отцы включаются в заботу о детях «Совместное родительство — это предприятие»: как отцы включаются в заботу о детях

Почему в России до сих пор есть проблемы с включением отцов в воспитание детей

Forbes
У бактерий нашли дополнительные белки для борьбы с вирусами и бактериофагами У бактерий нашли дополнительные белки для борьбы с вирусами и бактериофагами

Ученые из MIT нашли у прокариот новый механизм борьбы с вирусными инфекциями

N+1
Человек «великого пронырства» Человек «великого пронырства»

Как Пётр Толстой стал искусным специальным агентом, абсолютно лишённым морали

Дилетант
Есть ли толк от интервального голодания: ученые попытались разобраться, но в итоге запутались еще больше Есть ли толк от интервального голодания: ученые попытались разобраться, но в итоге запутались еще больше

В чем секрет интервального голодания?

ТехИнсайдер
Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius Как приготовить омлет «Пуляр», фирменное блюдо Александра Богданова, бренд-шефа Cafe Claret и Marius

Омлет «Пуляр» настолько пышный и воздушный, что напоминает скорее десерт

Правила жизни
Открыть в приложении