Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как воспитать кошку: она больше не будет драть ваши обои Как воспитать кошку: она больше не будет драть ваши обои

На самом деле, воспитать кошку вполне под силу любому хозяину

Популярная механика
Все о мигрени: современные способы профилактики головной боли Все о мигрени: современные способы профилактики головной боли

Мигрень: какие лекарства действительно работают, а какие – нет

Популярная механика
Разработана умная роботизированная инвалидная коляска Разработана умная роботизированная инвалидная коляска

Как умное кресло-коляска позволяет находить оптимальный путь к пункту назначения

ТехИнсайдер
Отважный микс Отважный микс

Брутальный интерьер с явным стремлением к минимизации деталей и форм

Идеи Вашего Дома
Тихоходкам набили татуировки электронным пучком Тихоходкам набили татуировки электронным пучком

Китайские материаловеды нанесли татуировки живым тихоходкам

N+1
Шерстяной покров Шерстяной покров

Астхильдур Магнусдоттир рассказала, почему она выбрала жить в мире с природой

Вокруг света
«Оно словно существует в мире теней»: зачем Нинья Тюберг сняла фильм о порноиндустрии «Оно словно существует в мире теней»: зачем Нинья Тюберг сняла фильм о порноиндустрии

Нинья Тюберг о том, почему табу на обсуждение порноиндустрии все еще существует

Forbes
Из чего можно сделать шапку-невидимку? Из чего можно сделать шапку-невидимку?

Можно ли сделать что-то невидимым?

Популярная механика
42 месяца, чтобы научить ребенка общаться 42 месяца, чтобы научить ребенка общаться

Родителей беспокоит, как развивается их ребенок. Попробуем в этом разобраться

Psychologies
На просторах сети На просторах сети

Почему соцсети сказываются на нашей жизни и как свести их влияние к минимуму

Grazia
6 опасных привычек, которые убивают наши почки 6 опасных привычек, которые убивают наши почки

Самые вредные привычки, за которые мы можем заплатить очень дорого

Популярная механика
Маленький принц: почему поведение Уилла Смита — подтверждение того, что Маленький принц: почему поведение Уилла Смита — подтверждение того, что

Почему Крис Рок не заслужил удара по лицу, а Смит, кажется, заигрался

Esquire
Палеопатологи просветили две древнеегипетские мумии из «Долины Царей» Палеопатологи просветили две древнеегипетские мумии из «Долины Царей»

Палеопатологи исследовали две египетские мумии времен XVIII и XXII династий

N+1

Белла, Вирджиния, Валентина — каких женщин любил Марк Шагал

Популярная механика
Почему дома заводятся чешуйницы и как от них избавиться — действенные методы Почему дома заводятся чешуйницы и как от них избавиться — действенные методы

Чешуйницы — неприятный сюрприз, который можно обнаружить у себя дома

Cosmopolitan
Посмотри на себя Посмотри на себя

Как помочь ребенку принять себя?

Домашний Очаг
Экзистенциальное отчаяние: к чему приводит отсутствие целей в жизни Экзистенциальное отчаяние: к чему приводит отсутствие целей в жизни

Что происходит с нашей психикой, если мы ни к чему не стремимся?

Psychologies
Археологи нашли в Крыму позднеримский стеклянный кубок со змеевидным орнаментом Археологи нашли в Крыму позднеримский стеклянный кубок со змеевидным орнаментом

Редкий артефакт конца II – середины III века нашей эры

N+1
Первая брачная ночь: самые дикие обычаи в мире Первая брачная ночь: самые дикие обычаи в мире

Про право первой ночи ты и так наверняка знаешь, но, это еще не самое ужасное!

VOICE
Поколение Z Поколение Z

Яркая, веселая, открытая — такой оказалась Zivert

Cosmopolitan
Шаг для человечества: какой была первая ракета Шаг для человечества: какой была первая ракета

Как Роберт Годдард создал первую ракету на жидком топливе?

Популярная механика
«Все страньше и страньше» «Все страньше и страньше»

Как теория относительности, рок-н-ролл и научная фантастика определили XX век

N+1
Как похудеть за 5 дней без вреда для здоровья: проверенные способы Как похудеть за 5 дней без вреда для здоровья: проверенные способы

Выполняй простые правила и похудей за 5 дней!

VOICE
Как оптимизировать свой Mac для игр: 4 секрета Как оптимизировать свой Mac для игр: 4 секрета

На устройствах с macOS действительно можно комфортно играть

Популярная механика
36 вопросов, чтобы (снова) влюбиться 36 вопросов, чтобы (снова) влюбиться

Этот опросник способен (заново) воспламенить сердца меньше чем за час!

Psychologies
10 лет совместной жизни: какая свадьба — оловянная, розовая или янтарная 10 лет совместной жизни: какая свадьба — оловянная, розовая или янтарная

Рассказываем о традициях и обычая празднования десятой годовщины свадьбы

Cosmopolitan
Обвалилось всё: самые большие кризисы в истории фондового рынка Обвалилось всё: самые большие кризисы в истории фондового рынка

Фондовому рынку уже больше ста лет, и за это время он повидал немало кризисов

Популярная механика
Самая высокая женщина на свете: какой была её жизнь Самая высокая женщина на свете: какой была её жизнь

Когда Сэнди Аллен было 10 лет, её рост составлял 190 см

Популярная механика
Деменция: 8 признаков, при которых нельзя оставлять пожилых родителей одних Деменция: 8 признаков, при которых нельзя оставлять пожилых родителей одних

Как вовремя определить начало деменции?

Популярная механика
Теперь безалкогольная, но с секретным ингредиентом: 9 фактов о коле Теперь безалкогольная, но с секретным ингредиентом: 9 фактов о коле

В 1886 году мир попробовал один из самых всенародно любимых шипучих напитков

Вокруг света
Открыть в приложении