Какой размерности должно быть пространство признаков, позволяющих отличать лица?

N+1Наука

Вупи Голдберг в векторах: оцениваем размерность пространства лиц

Денис Федосеев, математик

Всякий раз, когда мы включаем телефон и глядим в камеру, ему приходится решать сложную задачу: понять, его ли хозяин сейчас пытается его включить. По сути, это один из самых близких нам сейчас примеров задачи распознавания образов. Ее можно сформулировать так: пусть у нас имеется большая библиотека фотографий лиц разных людей в разных ракурсах. Как по новой фотографии лица определить, принадлежит ли она кому-то из людей в библиотеке, и если да, то кому именно? Математик Денис Федосеев с мехмата МГУ и его коллеги попытались выяснить, какой размерности должно быть пространство признаков, которые позволят отличить Вупи Голдберг от Шона Коннери.

Чтобы решать задачу распознавания лиц при помощи компьютера, нужно сперва закодировать фотоснимки каким-то понятным компьютеру методом. Конечно, всякая картинка в памяти компьютера уже представлена некоторым кодом — например, многомерным вектором, где каждой его компоненте соответствует пиксель на картинке, а значение компоненты — это, например, представление цвета этого пикселя. Но у такой кодировки есть проблема: коды фотографий одного и того же человека, вообще говоря, не будут иметь между собой ничего общего. Потому что человек-то один, но сами картинки выглядят очень по-разному.

Решение этой проблемы пришло с развитием нейросетей. Не вдаваясь в подробности можно сказать, что нейросеть можно представлять как некий черный ящик, кодирующий фотографии «разумным образом»: так, что фотографии одного и того же человека получают хоть и разные, но в каком-то смысле похожие коды. Говоря более точно, нейросеть сопоставляет каждой фотографии точку в пространстве некоторой большой размерности, причем расстояния между точками, соответствующими одному человеку, достаточно малы по сравнению с размерами полученного облака точек, а точки, отвечающие разным людям, наоборот, более далеки друг от друга.

Лица в векторах

Итак, непонятные фотографии превращены в точки с учетом их принадлежности людям. Но теперь нужно разобраться, в каком смысле они «близки» или «далеки». В самом деле, рассмотрим простой пример. Пусть пространство, в котором живут полученные точки, двумерное — это плоскость. И пусть точки оказались размещены на спирали.

Расстояние на плоскости между красной и желтой точками — длина соединяющего их отрезка — меньше, чем расстояние между желтой и синей. Но если идти вдоль спирали, желтая точка окажется гораздо ближе к синей, чем к красной.

Значит, чтобы решить задачу распознавания образов, нужно понять, какую геометрию имеет множество точек, построенное нейросетью. Вопрос осложняется еще и тем, что объемлющее пространство, в котором живут точки, как правило имеет огромную размерность. Например, некоторые из стандартных в индустрии нейросетей (скажем, ResNet50 и ResNet100) работают с пространством размерности 512. Чтобы понять, насколько это необозримо, приведу пример: возьмем точку в 512-мерном пространстве и для каждой ее координаты скажем только, положительная она или отрицательная. Получим 2512 вариантов, что больше числа атомов в наблюдаемой части Вселенной. То есть для такой размерности даже простейшая попытка классифицировать точки по знаку координат обречена на провал.

К счастью, специалистами в этой науке давно сформулирована — и хотя и не доказана, но многократно экспериментально подтверждена, — так называемая «Гипотеза о многообразии». Она гласит, что точки, полученные из реального мира (например, как говорилось выше, из фотографий людей), сосредоточены в объемлющем пространстве вблизи некоторого многообразия существенно меньшей размерности. И геометрию этого-то многообразия и нужно определить, чтобы эффективно решать задачу распознавания.

Лоскутное одеяло

Многообразие — это, говоря неформально, многомерный «разумный» аналог кривой или поверхности. Пусть, например, у нас есть плоскость, двумерный объект. Если мы вырежем из нее маленький кусочек, получим так называемый двумерный диск. Разрешим себе изгибать этот диск — главное его не разрывать и не склеивать его точки. Теперь будем склеивать из таких изогнутых дисков «лоскутное одеяло». Полученный объект уже может быть устроен «хитрее» диска. Например, из двух изогнутых листов можно склеить сферу, которая на диск совсем не похожа. Это и есть неформальное описание устройства многообразия. В общем случае вместо двумерного диска — кусочка плоскости — нужно брать диски многомерные, кусочки многомерного пространства фиксированной размерности.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Риск инфаркта оказался меньше после шунтирования желудка по сравнению с рукавной пластикой Риск инфаркта оказался меньше после шунтирования желудка по сравнению с рукавной пластикой

Риск инфаркта миокарда ниже после шунтирования желудка, чем после гастропластики

N+1
Как неправильный шарф может испортить образ: популярные ошибки и их решение Как неправильный шарф может испортить образ: популярные ошибки и их решение

Шарф — не только способ утеплиться, но и важный элемент стиля

Cosmopolitan
Древнему жителю Китаю ампутировали ногу в наказание Древнему жителю Китаю ампутировали ногу в наказание

Ампутацию считают древнейшей хирургической операцией

N+1
Как избавиться от запаха ног: 5 способов решения проблемы Как избавиться от запаха ног: 5 способов решения проблемы

Гипергидроз ног — как с ним справиться?

Playboy
Особый взгляд: 10 культовых фильмов, которые нам подарил Каннский кинофестиваль Особый взгляд: 10 культовых фильмов, которые нам подарил Каннский кинофестиваль

По случаю открытия 78-го смотра — десятка лучших фильмов в истории Канн

Правила жизни
Владимир Кристовский – о новом клипе Uma2rman, музыкальных трендах и чистом творчестве Владимир Кристовский – о новом клипе Uma2rman, музыкальных трендах и чистом творчестве

Владимир Кристовский о новом клипе группы

GQ
Пять новых российских сериалов, которые стоят твоего внимания Пять новых российских сериалов, которые стоят твоего внимания

Несколько сериалов, на которые стоит обратить внимание

Cosmopolitan
Охота на невидимок: как ученые ищут черные дыры Охота на невидимок: как ученые ищут черные дыры

Черные дыры — возможно, самые странные объекты во Вселенной

Forbes
Перестань заедать стресс! Как победить жор на нервной почве? Перестань заедать стресс! Как победить жор на нервной почве?

Мы часто едим вовсе не потому, что голодны, а от скуки или в состоянии стресса

Cosmopolitan
Оно тебе НАDО (но это не точно) Оно тебе НАDО (но это не точно)

Самые необычные сексшоп-тренды

Playboy
Безумие и винтаж: 8 диких изобретений прошлого Безумие и винтаж: 8 диких изобретений прошлого

По всем законам этих диких изобретений просто не должно было существовать

Maxim
Лазерное сканирование леса поможет спрогнозировать урожай черники и брусники Лазерное сканирование леса поможет спрогнозировать урожай черники и брусники

Скоро можно будет строить карты концентрации ягод в лесу

N+1
Как ученым удалось вырастить клетки сердца и мозга без помощи генетики Как ученым удалось вырастить клетки сердца и мозга без помощи генетики

Ученые заставили соединительную ткань превратиться в сердце и нейроны

Популярная механика
Самые необычные технологии в лифтах Самые необычные технологии в лифтах

В сфере подъема-спуска граждан и грузов внедряются разные интересные технологии

Популярная механика
5 фильмов, где зло победило добро 5 фильмов, где зло победило добро

Смотрим фильмы, где злые силы восторжествовали. И сделали это с размахом

GQ
В главных ролях В главных ролях

Такое чувство, что Любовь Аксёнова никогда не отдыхает от кино

Cosmopolitan
Физики нашли простой способ получения сверхкоротких лазерных импульсов видимого диапазона Физики нашли простой способ получения сверхкоротких лазерных импульсов видимого диапазона

Физики реализовали технологию генерации сверхкоротких импульсов

N+1
Барыня из «Муму»: почему мать Тургенева ненавидели все, включая сына Барыня из «Муму»: почему мать Тургенева ненавидели все, включая сына

Сказка про Золушку, в которой хеппи-энда не получилось

Cosmopolitan
Зависимость и контрзависимость: как отличить одно от другого Зависимость и контрзависимость: как отличить одно от другого

Почему кто-то бежит от отношений, а другой старается привязать партнера к себе?

Psychologies
Кэрри-Энн Мосс. В тени Тринити Кэрри-Энн Мосс. В тени Тринити

Она не раз говорила, что с «Матрицей» покончено, и вот — на тебе!

Караван историй
Игрушки с перспективой: на что способны новейшие квантовые компьютеры Игрушки с перспективой: на что способны новейшие квантовые компьютеры

Квантовые компьютеры с принципиально новыми характеристиками

Forbes
Как работают бионические протезы Как работают бионические протезы

Ученые смогли присоединить механическую руку к человеческой нервной системе

Популярная механика
Как выращивают крупнейшие в мире алмазы: сделано в России Как выращивают крупнейшие в мире алмазы: сделано в России

Самые крупные в мире безупречные алмазы выращивают рядом с Санкт-Петербургом

Популярная механика
Эскорт для избранных: как жили в СССР интердевочки Эскорт для избранных: как жили в СССР интердевочки

В 1970-х годах в СССР среди девушек, торгующих собой, появилась «элита»

Cosmopolitan
5 ошибок Игоря Яременко, сооснователя AppScience 5 ошибок Игоря Яременко, сооснователя AppScience

Пять самых критичных ошибок сооснователя AppScience

Inc.
Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе Виртуальная примерочная: зачем «Яндекс» запустил продажу одежды на маркетплейсе

Зачем сейчас инвестировать в моду и когда люкс бренды появятся на маркетплейсах

Forbes
Как понять, что у тебя есть проблемы со стилем — 7 неочевидных признаков Как понять, что у тебя есть проблемы со стилем — 7 неочевидных признаков

Главные модные ошибки, которые мешают выглядеть стильно

Cosmopolitan
Как отключить уведомления от сайтов в браузере Как отключить уведомления от сайтов в браузере

Разбираемся, как отключить уведомления от сайтов в самых популярных браузерах

CHIP
Вы задумывались о том, что доступ к общественным туалетам — благо, недоступное половине населения Земли? Вопрос дня Вы задумывались о том, что доступ к общественным туалетам — благо, недоступное половине населения Земли? Вопрос дня

Кого волнуют туалеты? Каждого второго жителя Земли, у которого нет к ним доступа

СНОБ
Минералка без газа и кофе с маслом: что пить на интервальном голодании Минералка без газа и кофе с маслом: что пить на интервальном голодании

Можно ли пить и что именно во время интервального голодания?

Cosmopolitan
Открыть в приложении