Что кроется за понятием общения для робота, рассказали инженеры

Популярная механикаHi-Tech

Я слышу голоса: общительный массив для дружелюбного робота

Компания Promobot

Самая главная формула успеха – умение общаться с людьми, любил повторять небезызвестный Теодор Рузвельт. В случае робота эта формула принимает критическое значение, ведь без способности к общению робот превращается в обычный, пусть и высокотехнологичный механизм. Что кроется за понятием общения для робота, рассказали инженеры компании «Промобот» Валерий Титов и Владислав Сазонов. И как выяснилось, пара «микрофон-динамик» здесь устарела ещё в прошлом веке, а найти подходящую «голову» практически невозможно.

Для людей слышать и понимать речь собеседника - обыденное дело. Человек слышит, человек отвечает. Но когда речь заходит о том, чтобы нас услышал и понял не человек, а робот, начинаются проблемы. Общение с роботом может проходить в сложных условиях: множество источников шума, несколько одновременно говорящих с разных сторон людей. Обычные микрофоны могут реагировать даже на речь самого робота.

В своей жизни человек даже не замечает, насколько сложен процесс общения с технической точки зрения. Чтобы научить роботов «Промобота» общаться, нам пришлось найти идеальные уши, рот и главное - научить их правильно работать.

«Хонда» для российского робота

Для идеального слуха роботу требуется две вещи: хорошие уши и надежная голова, способная понять, что же уловили уши. Решением вполне может стать аппаратно-программный комплекс на базе микрофонного массива.

С набором микрофонов всё просто: на корпусе робота их можно разместить там, где требуется. С программным обеспечением всё значительно сложнее. Дело в том, что работая с ушами, голова должна как минимум:

  • вырезать в услышанном речь робота;
  • очистить звук от шума;
  • определить, есть ли в услышанном и очищенном речь;
  • определить источник речи;
  • сформировать луч (по английски эта процедура называется beamforming), чтобы усилить исходный звуковой сигнал от источника;
  • распознать речь в звуковой дорожке после всех манипуляций.

Как правило, последний шаг выносится за пределы зоны ответственности микрофонного массива.

2d8e8f77f8d368eb6c00e2cffae50b93.jpg

Готовых решений на мировом рынке оказалось не так много. Наиболее перспективной нам показалась совместная разработка Японского исследовательского института Хонды и Киотского университета под названием HARK (Honda research institute Japan Audition for Robots with Kyoto university).

fcbb8549de0635ab33b54e956020e205.jpg

HARK изначально проектировалась для роботов, работающих в антропоморфной среде, где требуется услышать и разобрать команды от человека. Это ПО с открытым кодом можно было связать с Robot Operating System (ROS), процесс обработки звука с микрофонов легко настраивался. Дополнительным преимуществом стала заявленная возможность одновременного определения нескольких источников звука. Казалось, это то, что нам нужно! Японцы настолько очаровали нас своей разработкой, что мы скоропостижно перестали искать альтернативу.

Смертельные миллиметры звука

Для первых тестов в 2014 году мы использовали микрофонный массив RASP LC на 8 микрофонах. Четыре располагались на центральной части груди корпуса робота, вокруг экрана; три - на верхней части груди, ближе к шее; и один - сзади по центру, у основания шеи. Уже после первого теста мы выявили две проблемы критического уровня: вибрация и сложность расчётов.

89dca29813daca49524d1349e942bcec.jpg

Дело в том, что робот сам по себе – это механизм с огромным количеством движущихся деталей. И каждое движение создавало так называемые наводки на микрофон – фоновый шум, требующий постоянного анализа.

Вторая проблема заключалась в обработке полученных аудиоданных. Разработчики HARK заложили два принципиально разных подхода аналитики аудиопотоков. Первый назван геометрическим и сводится к точному (до десятых долей миллиметра) описанию расположения микрофонов в пространстве с учетом их направлений. Второй, без специального названия, опирается на калибровочную модель. Её создают путем многократной записи через массив одной и той же записи с разных точек пространства вокруг массива.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

10 знаменитых средневековых путешественников 10 знаменитых средневековых путешественников

История каждого средневекового путешественника — это приключенческий роман

Популярная механика
Печальней нет ночного едока… Печальней нет ночного едока…

Как прекратить ночные набеги на холодильник?

Худеем правильно
Раскрыт секретный рецепт римского бетона, который пережил тысячелетия Раскрыт секретный рецепт римского бетона, который пережил тысячелетия

Чем состав и технология производства римского бетона отличались от современного

Inc.
Гибель альпинистов на Эльбрусе: восстанавливаем события трагедии вместе с ее участниками Гибель альпинистов на Эльбрусе: восстанавливаем события трагедии вместе с ее участниками

19 человек потерялись на склоне Эльбруса. Спасти удалось только 15 из них

Maxim
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Ветер перемен Ветер перемен

Современная история о морских путешествиях в интерьере московской квартиры

SALON-Interior
Своя история Своя история

Респектабельный интерьер в эклектичном стиле

SALON-Interior
Остывший фронтир. Почему власти не удается заманить людей на Дальний Восток Остывший фронтир. Почему власти не удается заманить людей на Дальний Восток

Возможно ли спасти Дальний Восток от вымирания?

СНОБ
«Социальный лифт — не волшебство, а возможность». Интервью с Лидией Михеевой, секретарем Общественной палаты России «Социальный лифт — не волшебство, а возможность». Интервью с Лидией Михеевой, секретарем Общественной палаты России

Секретарь Общественной палаты РФ Лидия Михеева о социальных лифтах

СНОБ
Полжизни в одной компании. История Саши Шкурко — главы отдела технологий продуктовых систем «Тинькофф» Полжизни в одной компании. История Саши Шкурко — главы отдела технологий продуктовых систем «Тинькофф»

Саша Шкурко проработала в одной компании 19 лет и построила карьеру мечты

СНОБ
Фастфуд, где «посуду» тоже едят: как открылось, сколько тратит и зарабатывает кафе из Казани «Супстанция» Фастфуд, где «посуду» тоже едят: как открылось, сколько тратит и зарабатывает кафе из Казани «Супстанция»

Тут продают супы в стаканах из хлеба и уже получают прибыль с каждой точки

VC.RU
Спасибо, папа Спасибо, папа

С папой в детстве я встречалась редко, хотя номинально он еще жил дома

Seasons of life
Маленькое розовое платье: каким получился хоррор «Прошлой ночью в Сохо» Маленькое розовое платье: каким получился хоррор «Прошлой ночью в Сохо»

«Прошлой ночью в Сохо» — хоррор о моде, 1960-х и путешествиях во времени

РБК
Без маски. Игорь Свинаренко: «Тайна исповеди» Без маски. Игорь Свинаренко: «Тайна исповеди»

Новая книга журналиста Игоря Свинаренко рассказывает о XX веке.

СНОБ
Новый завет Новый завет

Как дизайнеры переосмысляют наследие своих брендов сквозь призму XXI века

Vogue
Что, если все на Земле были бы веганами Что, если все на Земле были бы веганами

Если бы никто не ел мяса — на планете был бы мир и спокойствие?

Вокруг света
Пчелы насмерть зажалили 63 редких очковых пингвина Пчелы насмерть зажалили 63 редких очковых пингвина

Это серьезная потеря для вымирающего вида.

N+1
Порода деятельности Порода деятельности

Никита Ефремов о преемственности, самопознании и роли в новом фильме «Общага»

GQ
Павел Воля: «Я очень деятельная мартышка» Павел Воля: «Я очень деятельная мартышка»

Павел Воля о чувстве одиночества, музе и алкоголе в жизни поэта

Cosmopolitan
Опасные связи Опасные связи

Реальные последствия виртуальных ошибок

Men’s Health
Что мешает нам проявить свои способности: 5 основных страхов Что мешает нам проявить свои способности: 5 основных страхов

Посещало ли вас ощущение, что вы не на своем месте, а двигаться-то и некуда?

Psychologies
Кто открыл ажиотажные чайные в Москве на деньги племянника «короля недвижимости» Кто открыл ажиотажные чайные в Москве на деньги племянника «короля недвижимости»

Чайная, в которую вложился племянник миллиардера Года Нисанова Эрвин

Forbes
Луиза Розова Луиза Розова

Дизайнер, который не показывает лицо?

Собака.ru
Боязнь яиц и другие странные фобии известных людей Боязнь яиц и другие странные фобии известных людей

Знаменитые люди и их знаменитые страхи

Maxim
Физики увеличили время когерентности в ультрахолодных молекулах Физики увеличили время когерентности в ультрахолодных молекулах

Физики изменили поведение ультрахолодных молекул в оптических ловушках

N+1
Перл Соломоновна: как жена Молотова подарила женщинам СССР духи и пудру Перл Соломоновна: как жена Молотова подарила женщинам СССР духи и пудру

Неванильная жизнь женщины, благодаря которой появился аромат «Красная Москва»

Cosmopolitan
Что посмотреть и попробовать в Хакасии. Гид «РБК Стиль» Что посмотреть и попробовать в Хакасии. Гид «РБК Стиль»

Что в Хакассии найдет «немассовый» турист

РБК
Натальная карта и здоровье: как астрология может помочь лучше понять свое тело Натальная карта и здоровье: как астрология может помочь лучше понять свое тело

Чем нам может помочь натальная карта?

Cosmopolitan
Не верь, не делай: народные советы и рецепты из Сети, которые не работают Не верь, не делай: народные советы и рецепты из Сети, которые не работают

Правда о популярных "народных" рецептах в области косметологии

Cosmopolitan
Не сойти с рельсов Не сойти с рельсов

Обслуживание и ремонт межкомнатной сдвижной двери

Идеи Вашего Дома
Открыть в приложении