Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От хорошего к великому От хорошего к великому

Почему одни компании совершают прорыв, а другие нет…

kiozk originals
Глава из книги Сергея Медведева «Человек бегущий» Глава из книги Сергея Медведева «Человек бегущий»

Одна из глав книги «Человек бегущий» профессора Сергея Медведева

СНОБ
10 самых опасных хобби в мире 10 самых опасных хобби в мире

Самые рискованные виды хобби, которые уносят десятки жизней каждый год

Популярная механика
Что такое дородовый патронаж беременной? Что такое дородовый патронаж беременной?

Зачем проводится дородовый патронаж

9 месяцев
Жир льва, мышьяк, радий и другие шокирующие ингредиенты в косметике прошлого Жир льва, мышьяк, радий и другие шокирующие ингредиенты в косметике прошлого

Самые необычные факты о бьюти-трендах Древнего мира и Средневековья

Cosmopolitan
7 признаков, что у твоей собаки серьезный стресс, и что можно с этим сделать 7 признаков, что у твоей собаки серьезный стресс, и что можно с этим сделать

Как понять, что у собаки стресс и как ей помочь

Maxim
Тюрьма Сугамо: культура забвения Тюрьма Сугамо: культура забвения

История первой в Японии тюрьмы, устроенной по европейскому образцу

Дилетант
Не молчи: 17 отличных тем для разговора с девушкой, которые помогут узнать друг друга Не молчи: 17 отличных тем для разговора с девушкой, которые помогут узнать друг друга

О чем можно поговорить с девушкой, которая тебе нравится

Playboy
Раз – и готово! Раз – и готово!

Можно выглядеть стильно, используя минимум косметики

Лиза
5 ошеломляющих фотографий смерти 5 ошеломляющих фотографий смерти

Тот редкий случай, когда смерть завораживает

Maxim
Наносчётчик для «наноовец» Наносчётчик для «наноовец»

Представьте, что вы пастух, которому нужно пересчитать овец в стаде

Наука и жизнь
Дети, разводы и победа в телешоу: как сложились судьбы звезд сериала «Кухня» Дети, разводы и победа в телешоу: как сложились судьбы звезд сериала «Кухня»

Что важного произошло в жизни звезд сериала «Кухня» после окончания съемок

Cosmopolitan
Настоящая леди Настоящая леди

Келли Хоппен создаёт элегантные интерьеры, которым не страшны года

SALON-Interior
10 самых опасных предметов твоего гардероба 10 самых опасных предметов твоего гардероба

Список опасных предметов одежды

Cosmopolitan
Одна вокруг света: горы, леса и таблички «не входить» Одна вокруг света: горы, леса и таблички «не входить»

111 серия о кругосветном путешествии москвички Ирины Сидоренко и ее собаки Греты

Forbes
Столько между нами Столько между нами

Некоторые любовные истории развиваются слишком медленно и печально

Cosmopolitan
Крах Archegos: сигнал «денежным мешкам» или напоминание о риске Крах Archegos: сигнал «денежным мешкам» или напоминание о риске

Подробно разбираем ситуацию с Archegos Capital Management

Forbes
В России разработали безопасные материалы для конструкции «атомных батареек» В России разработали безопасные материалы для конструкции «атомных батареек»

«Батарейка» представляет из себя сверхпрочную керамическую матрицу

Популярная механика
И на камнях растут деревья И на камнях растут деревья

Что делать с заброшенными аэропортами?

Вокруг света
Как стать счастливым человеком: советы, которые помогут наслаждаться жизнью по полной Как стать счастливым человеком: советы, которые помогут наслаждаться жизнью по полной

Советы экспертов, способствующие улучшению психологического самочувствия

Playboy
Почему нас достали москвичи. Ответ провинциалки Почему нас достали москвичи. Ответ провинциалки

Чем всех раздражают москвичи?

Cosmopolitan
О зверятах и не только: новая книга сказок познакомит детей с окружающим миром О зверятах и не только: новая книга сказок познакомит детей с окружающим миром

Глава из книги «Психология окружающего мира. Дуня и кот Кисель на конюшне»

Psychologies
Дегазация глубинных магм разогрела климат перед вымиранием динозавров Дегазация глубинных магм разогрела климат перед вымиранием динозавров

Выбросы углекислого газа из Деканских траппов запустили маастрихтское потепление

N+1
Chanel №5 Chanel №5

Культовый аромат Chanel №5 празднует вековой юбилей

Grazia
Suzuki Jimny в роли снегохода Suzuki Jimny в роли снегохода

Опровергаем архаичные заблуждения вместе с Suzuki Jimny

4x4 Club
Встречалась с русским принцем и не только: как Коко Шанель связана с Россией Встречалась с русским принцем и не только: как Коко Шанель связана с Россией

Россия сыграла немаловажную роль в жизни легендарной Коко Шанель

Cosmopolitan
Подарки на 8 Марта, которые спровоцируют приступ эйфории, а не зевоты (миксера тут нет) Подарки на 8 Марта, которые спровоцируют приступ эйфории, а не зевоты (миксера тут нет)

Обзор подарков, которым девушка точно порадуется

Playboy
Искусственные клетки с минимальным геномом смогли нормально поделиться Искусственные клетки с минимальным геномом смогли нормально поделиться

Биологи дополнили минимальный геном так, чтобы клетки смогли нормально делиться

N+1
Валерия Брусникина: «Блокчейн увеличивает прозрачность и надежность сделок» Валерия Брусникина: «Блокчейн увеличивает прозрачность и надежность сделок»

Возможности и перспективы блокчейна

Forbes
«Гарри Поттер» и 13 тайных поворотов сюжета, которые замечают не все «Гарри Поттер» и 13 тайных поворотов сюжета, которые замечают не все

Детали, которые ты могла не заметить, когда читала или смотрела «Гарри Поттера»

Cosmopolitan
Открыть в приложении