Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Балканские скотоводы эпохи неолита поохотились на косуль Балканские скотоводы эпохи неолита поохотились на косуль

Палеозоологи исследовали кости животных с шести древних поселений

N+1
25 вещей, которые на самом деле ненавидят женщины 25 вещей, которые на самом деле ненавидят женщины

Эта статья поможет тебе прожить чуть более счастливую и долгую жизнь

Maxim
«Разные инструменты давления на жертву»: чем отличается буллинг у детей и взрослых «Разные инструменты давления на жертву»: чем отличается буллинг у детей и взрослых

Травля в детских и взрослых коллективах проходит по-разному.

Forbes
Как полировать фары автомобиля: три способа и советы эксперта Как полировать фары автомобиля: три способа и советы эксперта

Вернуть фарам изначальный вид можно при помощи полировки

РБК
Эффективные способы укрепить ногти в домашних условиях Эффективные способы укрепить ногти в домашних условиях

На красоту и здоровье ногтей влияет множество факторов

VOICE
Екатерина Медичи: чему с детства училась «кровавая» французская королева Екатерина Медичи: чему с детства училась «кровавая» французская королева

Книга рассказывает о самой знаменитой королеве Франции, религиозной фанатичке

Forbes
Куриные кости и раковины улиток помогли уточнить время разрушения Скифополя Куриные кости и раковины улиток помогли уточнить время разрушения Скифополя

Археологи проанализировали находки, сделанные во время раскопок Телль-Ицтаба

N+1
«Я говорю ему все как есть»: 15 советов, как построить отношения на доверии «Я говорю ему все как есть»: 15 советов, как построить отношения на доверии

Настоящая близость начинается с доверия

VOICE
5 вопросов про Ивана Грозного 5 вопросов про Ивана Грозного

Основанные на домыслах вопросы о жизни Ивана Грозного

Maxim
Помоги себе сам. Книги, которые помогут поддержать психическое здоровье «в домашних условиях» Помоги себе сам. Книги, которые помогут поддержать психическое здоровье «в домашних условиях»

Эти книги расскажут, по каким законам работает психика и тело

ТехИнсайдер
Что такое социальный контракт, как получить выплаты, и на какие бесплатные плюшки ты имеешь право Что такое социальный контракт, как получить выплаты, и на какие бесплатные плюшки ты имеешь право

Многие путают социальный контракт с субсидиями, но это неправильно

VOICE
Райская ягода жаркого лета: выбираем самый сладкий арбуз Райская ягода жаркого лета: выбираем самый сладкий арбуз

Давайте раз и навсегда запомним, как выбрать самый спелый и сладкий арбуз.

ТехИнсайдер
Принцесса Диана: истоки культа Принцесса Диана: истоки культа

Как появился миф о прекрасной принцессе Диане?

Psychologies
Проблемы с сексом, тайная любовница Гитлера на протяжении 16 лет и жена на 36 часов: тяжелая судьба красавицы Евы Браун Проблемы с сексом, тайная любовница Гитлера на протяжении 16 лет и жена на 36 часов: тяжелая судьба красавицы Евы Браун

Имя Гитлера на слуху у всех, но что нам известно про его любовницу Еву Браун

ТехИнсайдер
Не только «Брат-2»: самые скрепные отечественные фильмы про русских за границей Не только «Брат-2»: самые скрепные отечественные фильмы про русских за границей

Как советские и российские режиссеры видели соотечественников за границей?

Maxim
5 причин, почему нас пугают современные отношения 5 причин, почему нас пугают современные отношения

Как изменились отношения и почему мы стали их бояться?

Psychologies
«Нам с мужем ребенок в путешествиях не мешает» «Нам с мужем ребенок в путешествиях не мешает»

Рената Пиотровски провела с семьей отпуск в солнечном Дубае

OK!
Археологи раскопали дом небогатых жителей Помпей Археологи раскопали дом небогатых жителей Помпей

Внутри дома в Помпеях находились предметы быта и остатки мебели

N+1
Найти свою зону ближайшего развития и изменить жизнь Найти свою зону ближайшего развития и изменить жизнь

Зона ближайшего развития — работает ли это понятие для взрослых?

Psychologies
По законам геометрии По законам геометрии

Оригинальная кровля делает неповторимым внешний облик этого частного владения

SALON-Interior
Фото на документы Фото на документы

Культурный кринж, последователь Альберта Энштейна и крылья Костромы

Автопилот
Сияние обрушилось вниз: почему все до сих пор без ума от Мэрилин Монро Сияние обрушилось вниз: почему все до сих пор без ума от Мэрилин Монро

Почему никому не удалось ни скопировать, ни превзойти в популярности Монро

Правила жизни
Как правильно закусывать? Как правильно закусывать?

Классические сочетания алкогольных напитков и еды, полезные и вредные комбинации

Maxim
Как переживал начало Второй мировой войны ювелирный дом Cartier Как переживал начало Второй мировой войны ювелирный дом Cartier

Отрывок из книги об одном из самых известных ювелирных домов в мире

СНОБ
Импровизация Михаила Горбачева Импровизация Михаила Горбачева

«Сноб» вспоминает Михаила Сергеевича и публикует мемуарный очерк

СНОБ
5 книг, которые помогут пережить расставание 5 книг, которые помогут пережить расставание

Книги, которые помогут найти точки опоры после расставания

СНОБ
История Товия, или почему ветхозаветные сюжеты стали популярны в эпоху барокко? История Товия, или почему ветхозаветные сюжеты стали популярны в эпоху барокко?

Еще одна интересная картина из постоянной экспозиции Эрмитажа

Правила жизни
Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги Праведник из камеры смертников: как убийца чуть не получил Нобелевскую премию за детские книги

Преступник, который выдвигался на Нобелевскую премию девять раз

VOICE
Конечность: выдающиеся руки выдающихся людей. Фотоистория Конечность: выдающиеся руки выдающихся людей. Фотоистория

Руки, которые сыграли 5 тысяч концертов и выкопали 150 тонн картофеля

Правила жизни
Открыть в приложении