Почему извлечь пользу из big data получается не у всех?

РБКБизнес

Принять как данные

Автор: Оксана Гончарова

0:00 /
1029.799
Фото: ТАСС

Евгений и Татьяна вернут кредит с большей вероятностью, чем Ипполит и Барбара. Выйдя из отпуска, рабочие вдвое чаще подвергают себя риску производственной травмы… Анализируя большие данные, компании учатся выявлять подобные скрытые закономерности, улучшая свои бизнес-показатели. Направление модное, но извлечь пользу из big data получается не у всех. Причина — отсутствие в компаниях культуры работы с ними.

«Чем более распространенное имя у человека, тем выше шанс, что он заплатит вовремя. Чем больше этажей в твоем доме, тем статистически ты более хороший заемщик. Знак зодиака почти не влияет на вероятность возврата денег, а вот психотип — значительно», — рассказывает о неожиданных закономерностях в поведении заемщиков аналитик Банка Хоум Кредит Станислав Дужинский. Объяснить многие из этих закономерностей он не берется — их выявил искусственный интеллект, обработавший тысячи профилей клиентов.

В этом сила аналитики big data: проанализировав огромный объем неструктурированных данных, программа может обнаружить множество корреляций, о которых самый мудрый аналитик-человек даже не догадывается. У любой компании есть огромное количество неструктурированных данных (big data) — о сотрудниках, клиентах, партнерах, конкурентах, которые можно использовать с пользой для бизнеса: улучшить эффект от рекламных акций, добиться роста продаж, снизить кадровую текучку и т.п.

Первыми работать с big data начали крупные технологические и телекоммуникационные компании, финансовые организации и ретейл, комментирует Рафаил Мифтахов, директор группы технологической интеграции «Делойт», СНГ. Сейчас интерес к таким решениям есть во многих отраслях. Чего удалось добиться компаниям? И всегда ли анализ больших данных позволяет делать ценные выводы?

Нелегкий груз

Банки используют алгоритмы обработки больших данных прежде всего для улучшения качества обслуживания клиентов и оптимизации затрат, а также для управления рисками и борьбы с мошенничеством. «За последние годы в сфере анализа big data произошла настоящая революция, — говорит Дужинский. — Применение машинного обучения позволяет нам намного более точно прогнозировать вероятность невозврата кредита — просрочки в нашем банке составляют всего 3,9%». Для сравнения, на 1 января 2019 года доля ссуд с просроченными платежами свыше 90 дней по кредитам, выдаваемым физлицам, составила, по данным ЦБ, 5%.

Изучением больших данных озадачились даже микрофинансовые организации. «Предоставлять финансовые услуги без анализа больших данных сегодня все равно, что заниматься математикой без цифр, — рассуждает Андрей Пономарев, гендиректор платформы интернет-кредитования Webbankir. — Мы выдаем деньги онлайн, не видя ни самого клиента, ни его паспорта, и в отличие от традиционного кредитования должны не только оценить платежеспособность человека, но и идентифицировать его личность».

Сейчас в базе компании хранится информация по более чем 500 тыс. клиентов. Каждая новая заявка анализируется с учетом этих данных примерно по 800 параметрам. Программа учитывает не только пол, возраст, семейное положение и кредитную историю, но и то, с какого устройства человек заходил на платформу, как вел себя на сайте. Насторожить, например, может то, что потенциальный заемщик не воспользовался кредитным калькулятором или не поинтересовался условиями выдачи займа. «За исключением нескольких стоп-факторов — скажем, мы не выдаем займы лицам моложе 19 лет — ни один из перечисленных параметров сам по себе не является поводом для отказа или согласия в выдаче займа», — поясняет Пономарев. Важна именно совокупность факторов. В 95% случаев решение принимается автоматически, без участия специалистов отдела андеррайтинга.

Анализ big data позволяет выводить интересные закономерности, делится Пономарев. Например, пользователи iPhone оказались более дисциплинированными заемщиками, чем владельцы устройств на базе Android — первые получают одобрение заявок в 1,7 раза чаще. «То, что военнослужащие не возвращают кредиты почти на четверть реже, чем средний заемщик, не было неожиданностью, — говорит Пономарев. — А вот от студентов обязательности обычно не ожидают, а между тем случаи кредитных дефолтов у них встречаются на 10% реже, чем в среднем по базе».

Изучение больших данных позволяет проводить скоринг и для страховщиков. Работающая с 2016 года компания IDX занимается удаленной идентификацией личности и онлайн-проверкой документов. Эти услуги востребованы среди страховщиков грузоперевозок, которые заинтересованы, чтобы грузы пропадали как можно реже. Прежде чем застраховать перевозку товара, страховщик с согласия водителя проверяет его на благонадежность, поясняет Ян Слока, коммерческий директор IDX. Вместе с партнером — петербургской компанией «Контроль рисков» — IDX разработала сервис, который позволяет проверить личность водителя, паспортные данные и права, участие в инцидентах, связанных с утратой груза, и т.п. Проведя анализ базы водителей, компания выявила «группу риска»: чаще всего грузы пропадают у водителей 30–40 лет с большим водительским стажем, часто менявших в последнее время работу. Выяснилось также, что груз чаще всего воруют водители автомобилей, срок эксплуатации которых превышает восемь лет.

В поиске

У ретейлеров задача иная — вычислить клиентов, готовых совершить покупку, и определить наиболее эффективные способы привести их на сайт или в магазин. С этой целью программы анализируют профиль клиентов, данные из их личного кабинета, историю покупок, поисковых запросов и использования бонусных баллов, содержимое электронных корзин, которые они было начали заполнять, да бросили. Аналитика данных позволяет сегментировать всю базу и выделять группы потенциальных покупателей, которым может оказаться интересным то или иное предложение, говорит Кирилл Иванов, директор data-офиса группы «М.Видео-Эльдорадо».

Например, программа выделяет группы клиентов, каждой из которых нравятся разные маркетинговые инструменты — беспроцентный кредит, кешбэк или скидочный промокод. Эти покупатели получают email-рассылку с соответствующей акцией. Вероятность того, что человек, открыв письмо, перейдет на сайт компании, в этом случае значительно увеличивается, отмечает Иванов.

Анализ данных позволяет также повышать продажи сопутствующих товаров и аксессуаров. Система, обработавшая историю заказов других клиентов, выдает покупателю рекомендации, что можно купить вместе с выбранным товаром. Тестирование такого метода работы, по словам Иванова, показало увеличение количества заказов с аксессуарами на 12% и рост оборота аксессуаров на 15%.

Улучшить качество сервиса и повысить продажи стремятся не только ретейлеры. Летом прошлого года «МегаФон» запустил «умный» сервис предложений, в основу которого легла обработка данных миллионов абонентов. Изучив их поведение, искусственный интеллект научился формировать внутри тарифов персональные предложения для каждого клиента. Например, если программа отмечает, что человек активно смотрит на своем устройстве видео, сервис предложит ему расширить объем мобильного трафика. Учитывая предпочтения пользователей, компания предоставляет абонентам безлимитный трафик на их любимые виды интернет-досуга — например, на использование мессенджеров или прослушивание музыки в стриминговых сервисах, на общение в соцсетях или просмотр сериалов.

«Мы анализируем поведение абонентов и понимаем, как меняются их интересы, — объясняет Виталий Щербаков, директор по аналитике больших данных «МегаФона». — Например, в этом году трафик AliExpress вырос в 1,5 раза по сравнению с прошлым годом, и в целом количество заходов на сайты интернет-магазинов одежды растет: в 1,2–2 раза в зависимости от конкретного ресурса».

Другой пример работы оператора с большими данными — платформа для поиска пропавших детей и взрослых «МегаФон Поиск». Система анализирует, какие люди могли находиться рядом с местом пропажи человека, и рассылает им информацию с фотографией и приметами пропавшего. Оператор разрабатывал и тестировал систему совместно с МВД и организацией «Лиза Алерт»: в течение двух минут ориентировки на пропавшего получают более 2 тыс. абонентов, что значительно увеличивает шансы на удачный результат поиска.

Не ходите в ПАБ

Анализ больших данных нашел применение и в промышленности. Здесь он позволяет прогнозировать спрос и планировать продажи. Так, в группе компаний «Черкизово» три года назад внедрили решение на базе SAP BW, которое позволяет хранить и обрабатывать всю информацию по продажам: цены, ассортимент, объемы продукции, акции, каналы сбыта, рассказывает Владислав Беляев, директор по информационным технологиям группы «Черкизово». Анализ накопленных 2 Тб информации не только дал возможность эффективно формировать ассортимент и оптимизировать продуктовый портфель, но и облегчил работу сотрудникам. Например, для подготовки ежедневного отчета по продажам потребовался бы день работы множества аналитиков — по два на каждый продуктовый сегмент. Сейчас этот отчет готовит робот, тратя на все сегменты всего 30 минут.

«В промышленности большие данные эффективно работают в связке с интернетом вещей, — утверждает генеральный директор компании Umbrella IT Станислав Мешков. — На основе анализа данных с датчиков, которыми оснащено оборудование, можно выявлять отклонения в его работе и предотвращать поломки, спрогнозировать производительность».

В «Северстали» с помощью big data пытаются решать и довольно нетривиальные задачи — например, снизить показатели травматизма. В 2019 году на мероприятия по улучшению безопасности труда компания выделила около 1,1 млрд руб. В «Северстали» рассчитывают к 2025 году снизить уровень травматизма на 50% (по сравнению с 2017 годом). «Если линейный руководитель — мастер, начальник участка, начальник цеха — заметил, что работник выполняет те или иные операции небезопасно (не держится за поручни при подъеме по лестнице на промплощадке или не носит все средства индивидуальной защиты), он выписывает ему особое замечание — ПАБ (от «поведенческий аудит безопасности»)», — рассказывает Борис Воскресенский, начальник отдела анализа данных компании.

Проведя анализ данных о количестве ПАБов в одном из подразделений, специалисты компании выявили, что правила техники безопасности чаще всего нарушались теми, кто уже имел несколько замечаний раньше, а также теми, кто незадолго до инцидента находился на больничном или в отпуске. Нарушения в первую неделю после выхода из отпуска или с больничного оказались вдвое выше, чем в последующее время: 1 против 0,55%. А вот работа в ночную смену, как выяснилось, не влияет на статистику ПАБов.

В отрыве от реальности

Создать алгоритмы обработки больших данных — не самая трудная часть работы, отмечают представители компаний. Гораздо сложнее понять, как эти технологии можно применить в контексте каждого конкретного бизнеса. Именно здесь кроется ахиллесова пята аналитиков компаний и даже внешних провайдеров, которые, казалось бы, имеют наработанную экспертизу в области big data.

«Я часто встречал специалистов по анализу больших данных, которые были прекрасными математиками, но не обладали необходимым пониманием бизнес-процессов», — рассказывает Cергей Котик, директор по развитию компании GoodsForecast. Он вспоминает, как два года назад его компании довелось участвовать в конкурсе по прогнозированию спроса для одной федеральной розничной сети. Был выбран пилотный регион, по всем товарам и магазинам которого участники строили прогнозы. Затем прогнозы сравнивались с фактическими продажами. Первое место занял один из российских интернет-гигантов, известный своей экспертизой в машинном обучении и анализе данных: в своих прогнозах он показал минимальное отклонение от фактических продаж.

Но когда сеть стала изучать его прогнозы детальнее, выяснилось, что с точки зрения бизнеса они абсолютно неприемлемы. Компания представила модель, которая выдавала планы продаж с систематическим занижением. Программа поняла, как минимизировать вероятность ошибки в прогнозах: безопаснее занижать продажи, поскольку максимальная ошибка может составить 100% (отрицательных продаж не бывает), а вот в сторону перепрогноза она может быть сколь угодно большой, поясняет Котик. Другими словами, компания представила идеальную математическую модель, которая в реальных условиях привела бы к полупустым магазинам и огромным убыткам от недопродаж. В результате в конкурсе победила другая компания, чьи расчеты можно было применить на практике.

«Авось» вместо big data

Технологии больших данных актуальны для многих отраслей, но активное их внедрение происходит не везде, замечает Мешков. Например, в здравоохранении есть проблема с хранением данных: информации накоплено много и она регулярно обновляется, но по большей части эти данные еще не оцифрованы. Есть также много данных в госструктурах, но они не объединены в общий кластер. Разработка единой информационной платформы Национальной системы управления данными (НСУД) как раз направлена на то, чтобы решить эту задачу, говорит эксперт.

Впрочем, Россия — далеко не единственная страна, где в большинстве организаций важные решения принимаются на основе интуиции, а не анализа больших данных. В апреле прошлого года компания «Делойт» провела опрос среди более чем тысячи руководителей крупных американских компаний (со штатом от 500 человек) и выяснила, что 63% опрошенных знакомы с технологиями big data, но не имеют всей необходимой инфраструктуры, чтобы их применять. Между тем среди 37% компаний с высоким уровнем аналитической зрелости почти половина значительно превысили бизнес-цели за последние 12 месяцев.

Исследование выявило, что помимо сложности внедрения новых технических решений важной проблемой в компаниях является отсутствие культуры работы с данными. Не стоит ждать хороших результатов, если ответственность за решения, принятые на основе big data, будет возлагаться только на аналитиков компании, а не на всю компанию в целом. «Сейчас компании ищут интересные сценарии использования больших данных, — говорит Мифтахов. — При этом внедрение некоторых сценариев требует инвестиций в системы сбора, обработки и контроля качества дополнительных данных, которые ранее не анализировались». Увы, «аналитика — пока еще не командный вид спорта», — признают авторы исследования.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Нулевая ступень Нулевая ступень

Весной 2019 года в небо поднялся самолет с самыми большими крыльями в истории

Популярная механика
За милых дам! За милых дам!

Катя Гордон поделилась, как предсказала развод Кержаковых и мирила Грачевских

StarHit
Пистолет Лебедева Пистолет Лебедева

Новинка концерна «Калашников» – пистолет Лебедева ПЛ-15

Популярная механика
Виктория Складчикова: «Женщины тоже имеют право шутить!» Виктория Складчикова: «Женщины тоже имеют право шутить!»

Виктория Складчикова о том, почему не стоит делить юмор по гендерному признаку

Cosmopolitan
Геворк Вермишян: «5G — Это вызов, и мы его приняли» Геворк Вермишян: «5G — Это вызов, и мы его приняли»

Когда в России будет запущено пятое поколение мобильной связи?

РБК
Кто стоял за нашумевшим портретом, написанным ИИ. Интервью с Пьером Фотрелем Кто стоял за нашумевшим портретом, написанным ИИ. Интервью с Пьером Фотрелем

Кто же написал картину: алгоритм ИИ или арт-группа Obvious

РБК
10 примет времени, изменивших наш быт 10 примет времени, изменивших наш быт

Forbes представляет 10 самых ярких примет нашего времени

Forbes
Яна Рудковская призналась, что после операции не может больше иметь детей Яна Рудковская призналась, что после операции не может больше иметь детей

Яна Рудковская высказалась о сложностях в браке с Евгением Плющенко

Cosmopolitan
Нет у революции конца Нет у революции конца

Новый индустриальный переворот будет серьезно отличаться от всех предыдущих

РБК
Имперские амбиции Имперские амбиции

Креативного директора Gucci Алессандро Микеле все дороги вели в Рим

Vogue
Ким Фурнэ: «Люди не хотят переплачивать банкам» Ким Фурнэ: «Люди не хотят переплачивать банкам»

Почему от развития финансовых технологий выиграют прежде всего бедные страны

РБК
«Маленькая мисс Счастье»: как сейчас выглядят королевы детских конкурсов красоты «Маленькая мисс Счастье»: как сейчас выглядят королевы детских конкурсов красоты

От подробностей закулисной жизни этих маленьких девочек волосы встают дыбом

Cosmopolitan
«Угрозы появления всеобъемлющей экосистемы я не вижу, это скорее страшилки» «Угрозы появления всеобъемлющей экосистемы я не вижу, это скорее страшилки»

Герман Греф о строительстве экосистемы, покупках IT-компаний и утечках

Forbes
Почему один из самых горячих IT-стартапов 2019 года занялся производством «железа» Почему один из самых горячих IT-стартапов 2019 года занялся производством «железа»

Производитель облачного софта открывает новую для себя отрасль

Forbes
На грани слышимости: нейтринные коммуникации для подводного флота На грани слышимости: нейтринные коммуникации для подводного флота

Современные субмарины становятся неслышимы и невидимы для радаров

Популярная механика
За и против: почему нештрафуемый порог +20 км/ч нужно отменять За и против: почему нештрафуемый порог +20 км/ч нужно отменять

Почему нештрафуемые +20 км/ч нужно пересмотреть?

РБК
Мощные вещи Мощные вещи

Какова движущая сила Четвертой промышленной революции?

РБК
Лоферы, санкции, запрет на татуировки и украшения: особенности японского офисного дресс-кода Лоферы, санкции, запрет на татуировки и украшения: особенности японского офисного дресс-кода

Узнайте, пустили бы вас в офис в вашей одежде, работай вы в японской компании

GQ
Что такое трудовой гостинг и как распознать призраков среди нас Что такое трудовой гостинг и как распознать призраков среди нас

Компании все чаще сталкиваются с исчезновением сотрудников или соискателей

РБК
Это элементарно Это элементарно

Ученые пытаются вывести формулу любви и доказать, что чувства — сплошная химия

Добрые советы
Большая ракета Илона Маска Большая ракета Илона Маска

Сверхтяжелая ракета Big Falcon Rocket готовится вытеснить все прошлые разработки

Популярная механика
Наше все Наше все

Квартира, которая стала настоящим воплощением русского юмора во всей его красе

AD
Защита Бурунова Защита Бурунова

Сергей Бурунов на примерах показал, как труден бывает путь к славе

Esquire
Как сэкономить при покупке техники онлайн Как сэкономить при покупке техники онлайн

В наши дни для покупки товаров вовсе необязательно даже выходить из дома

Популярная механика
Народные ремесла Народные ремесла

Основатели сайта о рекламе Adme создали крупнейшую фабрику контента для YouTube

Forbes
От театра-буффонады до эпической антиутопии. 5 лучших фильмов Марка Захарова От театра-буффонады до эпической антиутопии. 5 лучших фильмов Марка Захарова

1 октября прошла церемония прощания с режиссером и актером Марком Захаровым

Forbes
Вышли в прайм-тайм Вышли в прайм-тайм

Эксперт: как координировать жизнь, руководствуясь фазами менструального цикла?

Cosmopolitan
Обзор миникомпьютера Intel NUC7I5DNHE: великое в малом Обзор миникомпьютера Intel NUC7I5DNHE: великое в малом

Формат мини-ПК продолжает оставаться популярным для решения офисных задач

CHIP
Мое богатство: седые девушки, которые отказались красить волосы Мое богатство: седые девушки, которые отказались красить волосы

Эти девушки отказались стесняться своей седины — они решили ею гордиться

Cosmopolitan
Крикетный мяч и самолет Spitfire: как создают автомобили Jaguar Крикетный мяч и самолет Spitfire: как создают автомобили Jaguar

Что общего у спорткара Jaguar и крикетного мячика

РБК
Открыть в приложении