Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Излучение квазара подавило звездообразование в галактике из ранней Вселенной Излучение квазара подавило звездообразование в галактике из ранней Вселенной

Молекулярный газ ранней Вселенной разрушается под действием излучения квазара

N+1
Самая быстрая Lada в мире: сколько стоит, как едет и из чего сделана Самая быстрая Lada в мире: сколько стоит, как едет и из чего сделана

Спортивная Lada Vesta, которая выступает в классе «туринг» в гонках

Maxim
Детский плач в возрасте пяти месяцев связали с наследственностью Детский плач в возрасте пяти месяцев связали с наследственностью

Генетические факторы отвечают за 70 процентов плача

N+1
Интернет-портрет Интернет-портрет

О чем говорит наше поведение в социальных сетях

Лиза
Чистота Чистота

Почему современная одержимость гигиеной может принести больше вреда, чем пользы

kiozk originals
Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд Не просто упаковка для еды, но и предмет искусства: история коробок для пиццы, рынок которых оценивается в $2 млрд

Как появились коробки для пиццы из гофрокартона

VC.RU
Мужчина года: Евгений Чебатков Мужчина года: Евгений Чебатков

Это год Чебаткова, сумевшего объединить Казахстан и Россию, рэп и стендап

Glamour
Диабет, болезни сердца и еще 2 проблемы со здоровьем, которые возникнут, если часто есть пиццу (но вред можно снизить) Диабет, болезни сердца и еще 2 проблемы со здоровьем, которые возникнут, если часто есть пиццу (но вред можно снизить)

Увлечение фастфудом опасно, но это не значит, что нужно от него отказаться

Playboy
Доисторические птицы: раньше, чем археоптерикс Доисторические птицы: раньше, чем археоптерикс

Место археоптерикса в истории все чаще подвергается сомнению

Популярная механика
Темные пятна и светлые головы: 5 увлекательных книг по истории России Темные пятна и светлые головы: 5 увлекательных книг по истории России

Книги, которые помогут составить объективную картину прошлого России

Популярная механика
С чистого листа С чистого листа

Атмосферный интерьер с выразительными цветовыми и стилистическими акцентами

SALON-Interior
Археологи уточнили хронологию бронзового века в Минусинской котловине Археологи уточнили хронологию бронзового века в Минусинской котловине

Афанасьевцы пришли на Средний Енисей в XXX веке до нашей эры

N+1
Самые разрушительные компьютерные вирусы в истории Самые разрушительные компьютерные вирусы в истории

В 1983 Фред Коэн создал один из первых прототипов компьютерного вируса

Maxim
В чем выходили замуж звезды советской эпохи: редкие свадебные кадры В чем выходили замуж звезды советской эпохи: редкие свадебные кадры

Какие наряды выбирали наши любимые советские актрисы и певицы для бракосочетания

VOICE
Карты, деньги и дипфейки: как мошенники используют технологии для вымогательств Карты, деньги и дипфейки: как мошенники используют технологии для вымогательств

Сегодня можно генерировать изображения и видеоролики с несуществующими людьми

Inc.
Говори или проиграешь: как убедить любого в чем угодно — советы бывшего секретного агента Говори или проиграешь: как убедить любого в чем угодно — советы бывшего секретного агента

Отрывок из книги Эви Пумпурас о том, как научиться убеждать

Inc.
Best of the Best Best of the Best

Вспоминаем лучших из лучших — номинантов на премию GQ Men of the Year

GQ
Самые большие статуи в мире: зачем их строят? Самые большие статуи в мире: зачем их строят?

Зачем строят гигантские статуи

Популярная механика
Физики предложили новый механизм образования темной материи Физики предложили новый механизм образования темной материи

Новый механизм образования темной материи объясняет её наблюдаемую массу

N+1
White Punk – о провинции, индустрии и воссоединении YungRussia White Punk – о провинции, индустрии и воссоединении YungRussia

Интервью с White Punk – о прошлом и настоящем рэп-музыки

GQ
Город In Folio Город In Folio

Петербург из тех мест, что лишний раз опиши – от него не убудет

Вокруг света

Как семья Саклер подсадила на “легальный наркотик” всю Америку.

Правила жизни
Только самые интересные факты об альбоме Pink Floyd The Wall Только самые интересные факты об альбоме Pink Floyd The Wall

30 ноября 1979 года вышел волшебный альбом Pink Floyd The Wall

Maxim
Как выбрать косметику онлайн в «черную пятницу» и купить то, что точно подойдет Как выбрать косметику онлайн в «черную пятницу» и купить то, что точно подойдет

Онлайн-покупка косметики. На что обратить внимание

Cosmopolitan
Война и любовь Петра Романова Война и любовь Петра Романова

Если бы Кенигсек не утонул в Неве, российская история пошла бы по иному пути

Караван историй
То смех, то слезы: как общаться с экзальтированными людьми То смех, то слезы: как общаться с экзальтированными людьми

Что значит экзальтированный человек и как с ним быть?

РБК
Людмила Гаврилова. Людмила Гаврилова.

История актрисы Людмилы Гавриловой

Коллекция. Караван историй
«Нам было так хорошо вместе»: почему вы на самом деле скучаете по бывшему «Нам было так хорошо вместе»: почему вы на самом деле скучаете по бывшему

Почему тоска и грусть по бывшим все еще беспокоят вас?

Psychologies
Новый миллиардер: как Джон Риччитьелло заработал на играх Новый миллиардер: как Джон Риччитьелло заработал на играх

История успеха миллиардера индустрии видеоигр Джона Риччитьелло

Forbes
Безумный Мадс: почему всем нравится Миккельсен — главный датский актер Голливуда Безумный Мадс: почему всем нравится Миккельсен — главный датский актер Голливуда

Зрителя он одурманил в сериале «Ганнибал», а Голливуд в фильме «Еще по одной»

Esquire
Открыть в приложении