Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

РБКHi-Tech

Ложь, шум и капелька яда

Каким цифровым «зельем» можно отравить нейросеть и к чему это приведет

Автор: София Труцуненко, методический лид направления Data Science школы IT-профессий Skillfactory

Фото: Михаил Гребенщиков / РБК

Любой, кто работал с большими моделями ИИ (ChatGPT, Midjourney), знает, что сгенерированные тексты и изображения часто требуют коррекции или дополнительных уточнений. Нейросеть может придумывать цифры, создавать фальшивые объекты или признаки, которых на самом деле не было в исходных данных. Это довольно частое явление для больших генеративных моделей, которое еще называют галлюцинациями. Но за неправильными результатами могут скрываться не только ошибки модели, но и злонамеренные действия — отравление данных.

Что такое отравление данных

Отравление данных (data poisoning) — это атака на машинное обучение, во время которой злоумышленник вводит вредоносные данные в обучающий набор для нарушения работы алгоритма обучения и снижения его эффективности.

Чтобы понять, как работает отравление данных, нужно разобраться, как в общем работают алгоритмы машинного обучения. Изначально собирается большой набор данных, и от того, какие именно данные взяли, зависит результат. Следующий шаг — привести данные к одному формату, а для некоторых задач дополнительно снабдить их подсказками для алгоритма (разметкой). Далее алгоритм находит в них признаки и закономерности.

И когда обученный алгоритм сталкивается с данными, которые он еще не видел, он может решить эту задачу, опираясь на те правила, которые он для себя создал ранее. Отравление данных нарушает этот процесс, подмешивая в обучающий набор вредоносные сведения, которые искажают или запутывают обученный алгоритм.

Рассмотрим некоторые примеры таких атак.

  • Внесение шума (Noise Injection): добавление случайных или искаженных данных в обучающий набор.
  • Удаление данных (Data Removal): исключение части данных из обучающего набора.
  • Вставка ложных объектов (Object Insertion): добавление несуществующих или ложных объектов в обучающий набор. Сюда же входят скрытые надписи, вотермарки, изображения.
  • Изменение меток классов (Label Flipping): изменение или искажение разметки классов в обучающем наборе. То есть данные не добавляются, но происходит подмена: например, картинки с кошками подписываются как картинки с собаками, и наоборот.

Но гораздо интереснее те методы, которые нельзя заметить, ведь современные отравленные данные могут выглядеть нормально для человеческого глаза, но при этом они тоже будут ломать алгоритм.

Одним из самых громких примеров отравления данных является программа Nightshade, созданная исследователями Чикагского университета. Это ответ на достаточно больную этическую тему для больших генеративных ИИ-моделей — проблему авторского права.

Чтобы обучить качественную модель на уровне DALL-E и Midjourney, нужно не просто много данных, нужно очень много данных. И многие большие модели не обладают правами на работы, которые использовались в обучении. А результат работы — сгенерированная картинка, которая не имеет признаков интеллектуальной собственности. Nightshade незаметно вставляет признаки одного объекта на картинки с другим. Там, где человеческий глаз увидит собаку, нейронная сеть может воспринимать признаки и контуры другого объекта, например кота. Это позволяет создавать искажения в изображениях, которые остаются незамеченными человеком, но влияют на работу модели искусственного интеллекта, обученной на этих данных. Изображения меняются таким образом, что видимая разница минимальна.

Зоны риска

Отравление данных — это очень серьезный метод воздействия на системы искусственного интеллекта, он может привести к различным по степени негативным последствиям в зависимости от контекста и особенностей атаки. На эффективность отравления данных влияют степень его скрытности и сложность обнаружения изменений.

Цели атаки и контекст также влияют на последствия — от обмана локальных систем безопасности до воздействия на масштабные финансовые или медицинские системы.

Сейчас отравление данных существует и на уровне прикладных инструментов для незащищенных некрупных систем, и как глобальная угроза безопасности, которая изучается ведущими учеными и отраслевыми специалистами.

Искусственный интеллект внедряется во все чувствительные сферы нашей жизни: финансы, медицину, пропускные системы и даже поиск преступников. Последствия отравления данных могут быть катастрофическими. Вот несколько примеров.

Распознавание лиц: злоумышленник может добавить в обучающий набор чужие изображения лиц, взятые из открытых источников. Это может привести к тому, что невиновного человека задержат правоохранительные органы.

Медицинские данные: подмена истории болезни пациента или результатов анализов в медицинских приложениях. Такая атака может привести к ложному диагнозу.

Финансовые данные: из-за добавления фальшивых транзакций или ухищрений в финансовые данные человеку могут предъявить необоснованные обвинения в финансовых махинациях. А атака большего масштаба может спровоцировать дестабилизацию рынка.

Дорожная ситуация (беспилотные автомобили): злоумышленник может добавить деформированные дорожные знаки или маркировку на дорогах в систему распознавания. Это может привести к авариям и несчастным случаям.

Способы защиты

Чтобы минимизировать риски отравления данных, необходим системный подход к кибербезопасности. С одной стороны, он должен включать традиционные методы: мониторинг сетей и использование брандмауэров, антивирусов и обновление программного обеспечения. Кроме того, для обнаружения вредоносных воздействий алгоритмами машинного обучения могут решаться такие задачи, как мониторинг аномалий, фильтрация и валидация данных после обучения.

Специалисту, работающему с большими моделями и сложными признаками, важно регулярно мониторить и изучать данные, которые он использовал для обучения моделей искусственного интеллекта. Это позволит своевременно выявлять подозрительные или аномальные паттерны, которые могут свидетельствовать о внедрении отравленных данных.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Нашлись звезды Нашлись звезды

Может ли самой свободной поп-группой наших дней быть и самая безобидно приятная?

СНОБ
Осторожно, у вас гений. Как помочь ребенку, опережающему в развитии Осторожно, у вас гений. Как помочь ребенку, опережающему в развитии

Как воспитывать ребенка, если он вундеркинд?

СНОБ
Ольга Сварник: «Мозгу постоянно нужна новизна» Ольга Сварник: «Мозгу постоянно нужна новизна»

О мире, где человек вынужден конкурировать с нейросетями

РБК
Татуаж ареол: как преобразить грудь с помощью перманентного макияжа Татуаж ареол: как преобразить грудь с помощью перманентного макияжа

Как с помощью перманентного макияжа можно преобразить ареолы груди

VOICE
Ах, Самара-городок Ах, Самара-городок

Визитные карточки Самары, которые изменят твои представления о ней

Лиза
Лайфхак на лето! Вот как фрукты помогают избегать обезвоживания: простой совет Лайфхак на лето! Вот как фрукты помогают избегать обезвоживания: простой совет

Как фрукты и овощи могут удовлетворить потребность в жидкости

ТехИнсайдер
Королева глянца, Мэри Поппинс, бесстрашная наемница: экранная эволюция Эмили Блант Королева глянца, Мэри Поппинс, бесстрашная наемница: экранная эволюция Эмили Блант

Экранная эволюция Эмили Блант, прошедшей долгий мультижанровый путь

Правила жизни
Принцип бинокля в отношениях Принцип бинокля в отношениях

Как щедрый мужчина может оставить тебя без копейки и при чем тут принцип бинокля

Лиза
Андрей Соколов: «Когда я сказал, что хочу играть его роль, Караченцов попросил Захарова дать мне шанс» Андрей Соколов: «Когда я сказал, что хочу играть его роль, Караченцов попросил Захарова дать мне шанс»

Сыграть Резанова в то время было как слетать на звезду — это было невозможно

Коллекция. Караван историй
Будьте аккуратнее! Эксперты: дисбаланс двух жиров омега-3 влияет на риск ранней смерти Будьте аккуратнее! Эксперты: дисбаланс двух жиров омега-3 влияет на риск ранней смерти

Почему особенно омега-3 жиры стоит добавить в рацион питания

ТехИнсайдер
Жизнь после: 6 фильмов о преодолении психологических травм Жизнь после: 6 фильмов о преодолении психологических травм

Фильмы о людях, которые смогли примириться со своими психологическими травмами

Psychologies
9 главных разочарований в жизни каждого человека 9 главных разочарований в жизни каждого человека

Подборка того, в чем многие люди разочаровываются чаще всего

Psychologies
Чайные пакетики рассказали о скорости разложения почвенного органического вещества в России Чайные пакетики рассказали о скорости разложения почвенного органического вещества в России

Зеленый чай в почве разлагается вдвое быстрее ройбуша

N+1
Осмыслить опыт: как показывают Вторую мировую войну в современных фильмах и сериалах Осмыслить опыт: как показывают Вторую мировую войну в современных фильмах и сериалах

Фильмы, где упор сделан на ежедневную жизнь тех, чью судьбу перевернула война

Forbes
Анатомия заблуждений: почему люди все еще верят в ложь, мистификацию и теории заговоров Анатомия заблуждений: почему люди все еще верят в ложь, мистификацию и теории заговоров

Отрывок из книги «Время заблуждений» — почему мы верим в ложные убеждения?

Inc.
Правильный гардероб: эксперт моды Тим Ильясов — об итальянском стиле, идеальных пиджаках и нелюбви к трендам из тиктока Правильный гардероб: эксперт моды Тим Ильясов — об итальянском стиле, идеальных пиджаках и нелюбви к трендам из тиктока

Исследователь моды Тим Ильясов — о мечтах юности и давних кумирах

Правила жизни
Закодировать от злого умысла: как криптография защитит от мошенничества Закодировать от злого умысла: как криптография защитит от мошенничества

Как справиться с мошенничеством?

Forbes
Новые археологические открытия и альтернативные пути развития человечества Новые археологические открытия и альтернативные пути развития человечества

Ряд археологических открытий, не вписывающихся в привычную со школы картину

Наука и техника
Рынок в $33 млрд: как киберспорт перестал быть нишевым и начал завоевывать Россию Рынок в $33 млрд: как киберспорт перестал быть нишевым и начал завоевывать Россию

К 2024 году киберспорт стал бизнесом стоимостью в миллиарды долларов.

Forbes
11 подсказок для общения с пожилыми родителями 11 подсказок для общения с пожилыми родителями

Как выстроить отношения взрослым детям со взрослыми родителями?

Psychologies
Пятнадцать строчек лейтенанта Шмидта Пятнадцать строчек лейтенанта Шмидта

Подлинная и забытая история революционера лейтенанта Петра Шмидта

Дилетант
«Ведая пространство земель нашей империи…» «Ведая пространство земель нашей империи…»

Как Екатерина Великая решала проблемы демографии и освоения пустынных территорий

Знание – сила
«От дам-патронесс до женотделовок: История женского движения России» «От дам-патронесс до женотделовок: История женского движения России»

Как появилось высшее женское медицинское образование

N+1
Как не позволить ИИ заменить вас на работе? Узнайте ответ экспертов! Как не позволить ИИ заменить вас на работе? Узнайте ответ экспертов!

Какие меры принять людям, чтобы обеспечить свою конкурентоспособность перед ИИ

ТехИнсайдер
Как звезда «Унесенных ветром» подстроила знакомство Грейс Келли с князем Монако ради своего мужа Как звезда «Унесенных ветром» подстроила знакомство Грейс Келли с князем Монако ради своего мужа

История любви Грейс Келли и князя Монако Ренье III – одна из самых красивых

VOICE
Ребенок стал квадробером: как выглядит новый (опять странный!) тренд поколения альфа Ребенок стал квадробером: как выглядит новый (опять странный!) тренд поколения альфа

Почему поколению альфа так нравится менять свой образ?

Psychologies
«Мониторинг цифровой трансформации бизнеса» «Мониторинг цифровой трансформации бизнеса»

Направления и тенденции цифровизации деловой среды

РБК
5 загадочных смертей великих русских писателей и поэтов 5 загадочных смертей великих русских писателей и поэтов

Истории из мира литературы, которые остаются неразгаданными и полными тайн

Maxim
Это не совсем я, Эдичка. Каким получился «Лимонов» Кирилла Серебренникова с Беном Уишоу и Викторией Мирошниченко? Это не совсем я, Эдичка. Каким получился «Лимонов» Кирилла Серебренникова с Беном Уишоу и Викторией Мирошниченко?

«Лимонов. Баллада об Эдичке» — кино о писателе-панке и партийном вожде

Правила жизни
«Чувства гораздо богаче и тоньше, чем считалось раньше»: сколько эмоций мы испытываем на самом деле «Чувства гораздо богаче и тоньше, чем считалось раньше»: сколько эмоций мы испытываем на самом деле

Сколько эмоций на самом деле испытывают люди?

Psychologies
Открыть в приложении