Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Создатель большого балета: главные постановки хореографа Юрия Григоровича Создатель большого балета: главные постановки хореографа Юрия Григоровича

Как складывалась карьера хореографа Юрия Григоровича

Forbes
«Джеймс Уэбб» вновь нашел в атмосфере потенциального гикеана диметилсульфид «Джеймс Уэбб» вновь нашел в атмосфере потенциального гикеана диметилсульфид

«Джеймс Уэбб» вновь обнаружил признаки наличия диметилсульфида

N+1
Разработана система безопасности при проведении шоу с тысячами дронов Разработана система безопасности при проведении шоу с тысячами дронов

Как метод обучения «стай» дронов сможет гарантировать их безопасную работу

ТехИнсайдер
Исследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессии Исследование показало, сколько раз нужно заниматься сексом, чтобы снизить риск депрессии

Секс один-два раза в неделю может принести наибольшую психологическую пользу

Inc.
Пластичность мозга Пластичность мозга

Потрясающие факты о том, как мысли способны менять структуру и функции мозга

kiozk originals
Лариса Голубкина: «Я очень много молчу. Вот вы уйдете, я ни с кем не заговорю» Лариса Голубкина: «Я очень много молчу. Вот вы уйдете, я ни с кем не заговорю»

«Я больше 30 лет никогда ни с кем не обнималась. А это очень хорошая штука»

Караван историй
Искусство кино Искусство кино

О представительницах мира кино, без которых кинематограф был бы совсем другим

Grazia
Всё в цвету Всё в цвету

Обсудили с экспертом, как защитить чувствительную кожу в сезон пыльцы

Лиза
Зажигаем звезды Зажигаем звезды

Подборка историй о людях, которые двигают прогресс небывалым

ТехИнсайдер
Как перестать повторять одни и те же ошибки: советы психолога Как перестать повторять одни и те же ошибки: советы психолога

Почему мы возвращаемся к старым ошибкам и как выйти из замкнутого круга?

VOICE
День Д: как города США зарабатывают сотни миллионов на церемониях драфта НФЛ День Д: как города США зарабатывают сотни миллионов на церемониях драфта НФЛ

Что такое драфты и почему они вообще существуют?

Forbes
Космический буксир: мирный атом или ненаучная фантастика? Космический буксир: мирный атом или ненаучная фантастика?

Чем интересна перспектива использования ядерного двигателя в космосе?

Наука и техника
Почему телемедицина в России пока остается нишевым продуктом Почему телемедицина в России пока остается нишевым продуктом

Телемедицина в России: стоит ли записываться на удаленный прием к врачу?

РБК
Заемщики поубавили аппетит Заемщики поубавили аппетит

Почему у граждан снижаются запросы на размер кредитов наличными?

Ведомости
Люся Чеботина: «Люблю вызовы и эксперименты» Люся Чеботина: «Люблю вызовы и эксперименты»

Люся Чеботина о весне, вдохновении и любви

Лиза
Управление клубом: искусство балансировать между хаосом и порядком Управление клубом: искусство балансировать между хаосом и порядком

Егор Турчинский, Кирилл Павлов: можно ли сегодня зарабатывать на клубном бизнесе

Forbes
Бодрость и предубеждение Бодрость и предубеждение

Может ли здоровый образ жизни принести вред вместо пользы? К сожалению, да

VOICE
Земля ратного подвига Земля ратного подвига

Щит России: чем живёт и развивается Белгородская область сегодня

Отдых в России
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Одной из тем обсуждения в научной фантастике ХХ века была космическая экспансия

Наука и жизнь
Светлый праздник Светлый праздник

Празднуем Пасху в путешествии: едем услышать самые красивые колокольные звоны

Лиза
Возвращение гребного колеса Возвращение гребного колеса

Первые упоминания о гребном колесе относятся еще к древнейшим временам...

Наука и техника
3 сильные стороны интровертов, которые помогут им стать успешными 3 сильные стороны интровертов, которые помогут им стать успешными

Интроверты наделены множеством суперспособностей — нужно просто знать их

Inc.
Я вас люблю Я вас люблю

Стоит ли признаваться в любви первой?

Лиза
Новые методы помогут искать воду в лунных кратерах и глубоко под поверхностью Новые методы помогут искать воду в лунных кратерах и глубоко под поверхностью

Ученые пытаются определить, где и сколько льда находится на Луне

ТехИнсайдер
Реклама для женщин: как фемвертайзинг ломает стереотипы и увеличивает прибыль брендов Реклама для женщин: как фемвертайзинг ломает стереотипы и увеличивает прибыль брендов

Почему фемвертайзинг становится трендом

Forbes
Детка, ты просто космос Детка, ты просто космос

Анна Завтур доказывает: не стоит видеть в ней только лирическую героиню

VOICE
От Петра I до коней на Манежной площади: главные работы Зураба Церетели От Петра I до коней на Манежной площади: главные работы Зураба Церетели

Ключевые работы Зураба Церетели, без которых сложно представить облик городов

Forbes
История 6 соток История 6 соток

Когда появилось такое явление, как дача? Кого можно считать первым дачником?

Лиза
«Перезапуск будущего. Как „починить“ нематериальную экономику» «Перезапуск будущего. Как „починить“ нематериальную экономику»

Связь между нематериальной экономикой и усугублением проблемы неравенства

N+1
Зарплатно-гендерный вопрос Зарплатно-гендерный вопрос

Удовлетворенность размером зарплаты среди мужчин и женщин практически сравнялась

Ведомости
Открыть в приложении