Как искусственный интеллект работает со звуком

Популярная механикаHi-Tech

С машинами на одном языке: как компьютеры «слышат» музыку и для чего используют этот навык

Эксперименты с генерацией музыки с помощью искусственного интеллекта начались еще в 50-х годах прошлого века. С тех пор нейросети научились «понимать» и распознавать песни, определять наши вкусы в стриминговых сервисах и даже писать музыкальные произведения на основании данных о движении небесных тел. Как искусственный интеллект работает со звуком и какие прорывные продукты, созданные «кибер-композиторами», мы будем использовать в будущем, рассказывают специалисты «Яндекса».

Как компьютер «видит» звук?

Чтобы машина могла распознать или даже написать мелодию, ей необходимо познакомиться с сотнями музыкальных примеров. Но как поместить звук внутрь компьютерной нейросети, каким образом она может их воспринять? Вспомним учебник физики за девятый класс: источником звука всегда является колеблющееся тело. Это может быть мембрана барабана, натянутая струна или диффузор динамика в наших колонках. Колебания этих тел передаются по воздуху в виде множества волн, попадают на барабанную перепонку человека, раздражают окончания слуховых нервов, и мы слышим звук.

У машины этот процесс протекает иначе. Чтобы она «услышала» музыку, ее нужно преобразовать в набор цифр, понятный компьютеру. Преобразование в цифровой код происходит благодаря процессам дискретизации и квантования. Информация приходит в компьютер в виде непрерывной звуковой волны, «переведенной» в электрический ток. Чтобы описать ее на языке цифр, специальный преобразователь «нарезает» эту волну на очень маленькие отрезки длиной в несколько миллисекунд. Это дискретизация — процесс, когда непрерывная волна становится поделенной на части, то есть дискретной. Однако даже в самых крохотных отрезках звук представляет собой продолжительный кусочек волны. Для удобства преобразователь «округляет» его значения, измеренные во время дискретизации, и представляет в виде точки. Такой процесс называется квантованием.

В итоге вся волна превращается в набор точек, которым остается только присвоить цифровые коды. Другими словами, мы получаем большой набор цифр, описывающий каждый фрагмент песни. Эти числа можно внести в одну большую таблицу, а можно отобразить наглядно в виде спектрограммы. Так называют графическое изображение звуков в системе координат, где по вертикальной оси располагаются звуковые частоты (от высоких звуков до низких), а по горизонтальной — время. Чем теплее и ярче цвет на спектрограмме, тем интенсивнее звук в этом месте. Описать спектрограмму словами непросто, так что лучше сразу посмотрите, как она выглядит.

06b98161ad1203ae0bfc1ef4cbccf906.png
wikipedia.org

Еще более наглядное объяснение этого процесса дается в рамках «Урока Цифры» от Яндекса — «Цифровое искусство: музыка и IT». В этом проекте эксперты компании рассказывают о музыкальной оцифровке, теории звука, системах рекомендаций в медиасервисах, а после теоретической части участники могут попробовать самостоятельно продолжить композицию. Уроки и задания предназначены для школьников, но взрослым они тоже будут интересны.

Как ИИ распознает музыку и рекомендует песни?

Способность искусственного интеллекта представлять музыку цифровым кодом нашла практическое применение в нашей жизни. Именно благодаря спектрограммам нейросети анализируют и распознают музыку, чтобы, например, с помощью Shazam находить похожие треки. Когда приложение «слышит» композицию, оно сравнивает ее спектрограмму со множеством других из базы данных и отыскивает совпадения. При этом искусственный интеллект распознает мелодию даже сквозь помехи вроде голосов за соседним столиком или шума машин.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как подготовиться к беговому марафону, если ты новичок Как подготовиться к беговому марафону, если ты новичок

Какие шаги нужно предпринять начинающему бегуну

Популярная механика
Принятие неизбежного Принятие неизбежного

Как российский бизнес погружался в новую экономическую реальность

Forbes
Каким мог стать Ту-204: как советские конструкторы искали идеальный авиалайнер Каким мог стать Ту-204: как советские конструкторы искали идеальный авиалайнер

За 15 лет видение о том, каким должен быть Ту-204, несколько раз менялось

ТехИнсайдер
Весне навстречу Весне навстречу

Куда поехать в путешествие, когда природа просыпается от зимней спячки

Отдых в России
5 фраз, которые мгновенно выдают неуверенного в себе человека — и как научиться звучать уверенно 5 фраз, которые мгновенно выдают неуверенного в себе человека — и как научиться звучать уверенно

Каких именно слов и выражений стоит избегать, чтобы речь звучала тверже

VOICE
Что будет с человечеством, если частица Солнца упадет на Землю: сценарий худшего конца света Что будет с человечеством, если частица Солнца упадет на Землю: сценарий худшего конца света

Что произойдет, если ученым удастся телепортировать на Землю кусочек Солнца?

ТехИнсайдер
6 признаков того, что в вашей квартире плохое качество воздуха 6 признаков того, что в вашей квартире плохое качество воздуха

Как понять, что в вашей квартире высокая концентрация загрязняющих веществ?

Популярная механика
Новая дисциплина Новая дисциплина

Чемпионка мира, чемпионка Европы, призер Олимпийских игр – Евгения Медведева

Maxim
Молодую женщину льяловской культуры похоронили вместе кинжалом из лосиной кости Молодую женщину льяловской культуры похоронили вместе кинжалом из лосиной кости

Археологи исследовали костяной инвентарь эпохи неолита

N+1
Что делают неврологи, когда у них болит голова: 8 приемов Что делают неврологи, когда у них болит голова: 8 приемов

Как справляются с головной болью сами врачи?

Psychologies
Бизнес-завтрак C-Level: топ-менеджеры корпораций — о том, как привлекать и удерживать сильных управленцев в мартехе Бизнес-завтрак C-Level: топ-менеджеры корпораций — о том, как привлекать и удерживать сильных управленцев в мартехе

Что должны делать компании, чтобы успешно нанимать управленцев в мартехе

Inc.
Подвеска автомобиля: что нужно знать о разновидностях конструкции Подвеска автомобиля: что нужно знать о разновидностях конструкции

Подвеска автомобиля — из чего она состоит и как устроена?

РБК
7 простых способов убрать жир с коленей 7 простых способов убрать жир с коленей

Как похудеть в коленях?

VOICE
Онлайн-обучение не будет прежним: как искусственный интеллект изменит российские школы Онлайн-обучение не будет прежним: как искусственный интеллект изменит российские школы

Мы быстро привыкли к возможностям современных технологий

Популярная механика
Вместе навсегда: почему мы боимся остаться без телефона даже на 5 минут Вместе навсегда: почему мы боимся остаться без телефона даже на 5 минут

Как понять, что ты действительно зависима от телефона?

VOICE
Как восстановить удаленные сообщения ВКонтакте? Как восстановить удаленные сообщения ВКонтакте?

Gростые методы восстановления удаленных сообщений в VK

CHIP
Цикл стресс-реакции: что это и как его завершить? Цикл стресс-реакции: что это и как его завершить?

В чем разница между стрессом, стрессором и стресс-реакцией?

Psychologies
Певец SHAMAN: «Чтобы сегодня зацепить людей, недостаточно быть талантливым» Певец SHAMAN: «Чтобы сегодня зацепить людей, недостаточно быть талантливым»

SHAMAN — о своем творческом пути, первом сольном концерте и критике

Cosmopolitan
7 высказываний, которые приносят душевный покой 7 высказываний, которые приносят душевный покой

Психолог комментирует фразы, которые нелишне будет вспомнить в трудную минуту

Psychologies
«Дома вообще нет никакой Елены Подкаминской как актрисы» «Дома вообще нет никакой Елены Подкаминской как актрисы»

Миллион неудобных вопросов и честные ответы — в интервью с Еленой Подкаминской

OK!
Как избавиться от ожирения: бариатрическая хирургия Как избавиться от ожирения: бариатрическая хирургия

Что такое бариатрическая хирургия и в чем её суть?

Популярная механика
Четкий план на завтра: как помочь людям с ментальными нарушениями преодолеть тревогу Четкий план на завтра: как помочь людям с ментальными нарушениями преодолеть тревогу

Как помочь своим родным и подопечным пережить трудный период

Forbes
Интересные факты об ослах: где они живут, что едят и с кем дружат Интересные факты об ослах: где они живут, что едят и с кем дружат

Что мы не знаем об ослах?

Популярная механика
Мертвая хватка: 10 животных с мощнейшими укусами. Держитесь от них подальше Мертвая хватка: 10 животных с мощнейшими укусами. Держитесь от них подальше

Сегодня мы расскажем вам о 10-ти животных с самым сильным укусом

ТехИнсайдер
Какая у вас роль в семье? Какая у вас роль в семье?

Цель этого теста — помочь вам узнать, каков ваш персонаж в семейной группе

Psychologies
Премию Абеля присудили за новаторский вклад в топологию Премию Абеля присудили за новаторский вклад в топологию

Лауреатом стал американский математик Деннис Салливан

N+1
8 распространенных ошибок, которые вызывают морщины вокруг глаз 8 распространенных ошибок, которые вызывают морщины вокруг глаз

Кожа вокруг глаз – самая тонкая и нежная, а значит, нуждается в особом уходе

VOICE
Ремонт без бюджета: 6 лайфхаков от дизайнера Ремонт без бюджета: 6 лайфхаков от дизайнера

Как преобразить квартиру без последствий для кошелька и нервов

Популярная механика
Фосфор и фитолиты выдали «невидимого» викинга в пустом погребении Фосфор и фитолиты выдали «невидимого» викинга в пустом погребении

Ученые исследовали материалы с памятника Фрегерслев-II

N+1
Разбираемся в себе: 5 главных эмоций человека, о которых надо знать всем Разбираемся в себе: 5 главных эмоций человека, о которых надо знать всем

Базовые эмоции, от которых зависит наша жизнь

Cosmopolitan
Открыть в приложении