Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Мозг, исцеляющий себя Мозг, исцеляющий себя

Реальные истории людей, которые победили болезни и преобразили свой мозг

kiozk originals
10 самых опасных предметов твоего гардероба 10 самых опасных предметов твоего гардероба

Список опасных предметов одежды

Cosmopolitan
«Звук: слушать, слышать, наблюдать» «Звук: слушать, слышать, наблюдать»

Отрывок из книги Мишеля Шиона о том, что такое звук

N+1
Запретный плод Запретный плод

Мария Лобанова решилась подробно рассказать свою женскую историю

Tatler
«Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие «Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие

Знаменитые артистки смогли стать мамами вопреки прогнозам врачей

Cosmopolitan
«Скажите спасибо, что не дали срок»: почему бизнес все чаще попадает под административные статьи «Скажите спасибо, что не дали срок»: почему бизнес все чаще попадает под административные статьи

Почему в России чаще привлекают бизнес именно к административной ответственности

Forbes
10 секретов красоты француженок: бери на вооружение! 10 секретов красоты француженок: бери на вооружение!

Образ парижанки мы считаем образцом изысканности. Как им это удается?

Cosmopolitan
Офис в мотеле и деньги других людей: как Марк Рэндольф создавал Netflix Офис в мотеле и деньги других людей: как Марк Рэндольф создавал Netflix

Отрывок из книги «That will never work» об истории создания Netflix

Forbes
Лирохвосты напугали самок несуществующим хищником и склонили к спариванию Лирохвосты напугали самок несуществующим хищником и склонили к спариванию

Самцы великолепных лирохвостов обманывают самок, чтобы склонить их к спариванию

N+1
Юбку дома забыла! Как и за какие наряды высмеивали москвичек XIX века Юбку дома забыла! Как и за какие наряды высмеивали москвичек XIX века

За какие платья рисовали карикатуры на наших прапрабабушек?

Cosmopolitan
Почему «цифровые» поколения отказываются инвестировать в акции компаний-гигантов. 7 причин Почему «цифровые» поколения отказываются инвестировать в акции компаний-гигантов. 7 причин

Почему молодые предпочитают локальные стартапы глобальным компаниям?

СНОБ
Черная акула оказалась самым крупным светящимся позвоночным Черная акула оказалась самым крупным светящимся позвоночным

Вероятно, она использует биолюминесценцию, чтобы незаметно подкрасться к жертве

N+1
«Не дёргайся и держи темп»: бегун Райан Фан о полезном правиле марафонца, которое помогает не выгорать в обычной жизни «Не дёргайся и держи темп»: бегун Райан Фан о полезном правиле марафонца, которое помогает не выгорать в обычной жизни

Правила марафонца, которые помогут не выгореть на работе и в жизни

VC.RU
Настоящий пародист Настоящий пародист

В сериал «Райское местечко» детектив побеждает пародию на true crime

Weekend
Настя Ивлеева Настя Ивлеева

Настя Ивлеева: «Цифровая реальность – это в высшей степени сексуально!»

Playboy
Make Up Forever in Russia: встречаем обновленную Audi A5 Make Up Forever in Russia: встречаем обновленную Audi A5

Каким получился рестайлинг Audi A5?

Популярная механика
Королева любой тусовки — бехеровка: как правильно пить культовый чешский ликер Королева любой тусовки — бехеровка: как правильно пить культовый чешский ликер

История создания, традиции употребления и самые популярные коктейли с Бехеровкой

Playboy
Кефир и свекла: 7 суперфудов, которые точно есть на твоей кухне Кефир и свекла: 7 суперфудов, которые точно есть на твоей кухне

Обязательно ли покупать суперфуды по космическим ценам?

Cosmopolitan
Орлиную акулу назвали меловым аналогом скатов-мант Орлиную акулу назвали меловым аналогом скатов-мант

Орлиные акулы питалась планктоном и жила около 93 миллионов лет назад

N+1
7 признаков того, что отношения на расстоянии изжили себя 7 признаков того, что отношения на расстоянии изжили себя

Как понять, что делать дальше — пытаться все «починить» или расходиться?

Psychologies
Королева в cлезах: как устроен этикет скорби британской монархии Королева в cлезах: как устроен этикет скорби британской монархии

Как королева Виктория соблюдала траур 40 лет

Forbes
Защитники Защитники

Рассказываем, как дела у тюленя Крошика и Фонда друзей балтийской нерпы

Собака.ru
Физики сделали металинзу с четким переменным фокусом Физики сделали металинзу с четким переменным фокусом

Фокусное расстояние зависит от аморфного или кристаллического состояния вещества

N+1
Что нужно знать о витамине E — самом противоречивом из всех Что нужно знать о витамине E — самом противоречивом из всех

Разбираемся, зачем нужен витамин E и кому стоит его принимать

РБК
17 самых важных фотографий в космосе 17 самых важных фотографий в космосе

Фотографии, символизирующие то, как сбывалась мечта человечества о космосе

Esquire
Феминизм здорового человека Феминизм здорового человека

Как живет под властью женщин крепкая семья с Пречистенки

Tatler
Продал две квартиры для борьбы с гигантами: с чем AppMagic Макса Саморукова идёт на рынок аналитики приложений Продал две квартиры для борьбы с гигантами: с чем AppMagic Макса Саморукова идёт на рынок аналитики приложений

Как разработчикам достучаться до аудитории и какой аналитики им не хватает

VC.RU
Осознанное потребление: берем пример с Лео ДиКаприо, Эммы Уотсон и Джейсона Момоа Осознанное потребление: берем пример с Лео ДиКаприо, Эммы Уотсон и Джейсона Момоа

Что делают знаменитости, которых заботят проблемы экологии?

Psychologies
Суперпозиция электронного состояния изменила свойства тормозного излучения Суперпозиция электронного состояния изменила свойства тормозного излучения

Физики рассчитали рассеяние электрона на атоме углерода и на нано-ондуляторе

N+1
Народные любимцы: звезды сериала «Сваты», которые ушли из жизни Народные любимцы: звезды сериала «Сваты», которые ушли из жизни

Актеры любимой комедии многих россиян, которые скончались

Cosmopolitan
Открыть в приложении