Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Слишком заняты, чтобы спать: как сон влияет на эффективность CEO Слишком заняты, чтобы спать: как сон влияет на эффективность CEO

Об особенностях и важности такого простого состояния управленца, как сон

Forbes
Аграрный PR как часть стратегии развития компании Аграрный PR как часть стратегии развития компании

Какие эффективные инструменты маркетинговых коммуникаций используют в 2025 году

Агроинвестор
Как на телефоне отсканировать QR-код: пошаговая инструкция для Android и iPhone Как на телефоне отсканировать QR-код: пошаговая инструкция для Android и iPhone

Инструкция, как отсканировать QR-код на экране телефона на Android и iPhone

CHIP
Тот актер из «Большого куша»: как Стивен Грэм придумал сериал «Переходный возраст» Тот актер из «Большого куша»: как Стивен Грэм придумал сериал «Переходный возраст»

Как «бандит с экрана» смог снять сложную и злободневную картину?

Forbes
Ученые объяснили, как езда на велосипеде способствует снижению риска развития деменции Ученые объяснили, как езда на велосипеде способствует снижению риска развития деменции

Езда на велосипеде полезнее, чем вы думали

ТехИнсайдер
США в долгах по шею, но пока не тонут США в долгах по шею, но пока не тонут

На фоне крестового похода Трампа вопрос госдолга США приобретает особую остроту

Монокль
Продлили срок: что можно сделать из бывших тюрем Продлили срок: что можно сделать из бывших тюрем

Как бизнесмены и государство развивают бывшие тюрьмы

Forbes
Впервые в лаборатории воссоздана нервная цепь человеческой боли Впервые в лаборатории воссоздана нервная цепь человеческой боли

Ученые воспроизвели важный нервный путь, из-за которого человек чувствует боль

ТехИнсайдер
Формула любви Александра Абдулова Формула любви Александра Абдулова

«Герой должен умереть молодым» — старая японская пословица. Он жил всего 54 года

Коллекция. Караван историй
Самые научно точные фильмы про космос Самые научно точные фильмы про космос

Существуют ли достоверные художественные фильмы про космос?

Maxim
IDеальное преступление IDеальное преступление

Четыре года назад «Популярная механика» опубликовала свой первый кибердетектив

ТехИнсайдер
Вступление в брак может повысить риск деменции: шокирующие выводы ученых Вступление в брак может повысить риск деменции: шокирующие выводы ученых

Как счастливая семейная жизнь может быть связана с когнитивными способностями?

ТехИнсайдер
Спасительная рассрочка увеличивает риски Спасительная рассрочка увеличивает риски

Какие риски несут программы рассрочек при покупке жилья?

Монокль
Во имя красоты Во имя красоты

Елизавета Борзунова о том, как ей удается создавать уникальные украшения

Grazia
Щедры на дивиденды Щедры на дивиденды

Какие компании в этом году поделятся прибылью с акционерами

Деньги
Зал ожиданий Зал ожиданий

Для психического здоровья фитнес даже полезнее, чем для физического

VOICE
Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу

Кусок нижней челюсти архаичного человека Penghu-1 принадлежал денисовцу

N+1
Взлетная полоса Взлетная полоса

Брутальный и динамичный интерьер для молодого человека

SALON-Interior
Генетики получили полные геномы 6 видов человекообразных обезьян Генетики получили полные геномы 6 видов человекообразных обезьян

Ученые секвенировали полные геномы шести видов человекообразных обезьян

ТехИнсайдер
Оказывается, пассажиров с гипсом могут не пустить в самолет: вот что нужно знать Оказывается, пассажиров с гипсом могут не пустить в самолет: вот что нужно знать

С какими нюансами можно столкнуться в аэропорту, если быть с гипсом

ТехИнсайдер
Сарацинка, воительница, христианка Сарацинка, воительница, христианка

В эпоху джахилийи у разных племен бедуинов положение женщин различалось

Знание – сила
Пример для подражания: Ирина Годунова Пример для подражания: Ирина Годунова

Ирина Годунова о детском интересе к программированию и верности своему пути

VOICE
Индейка на взлете Индейка на взлете

Российское производство мяса индейки выросло почти на 4%

Агроинвестор
Психологический портрет: что такое дисморфофобия, или синдром Квазимодо Психологический портрет: что такое дисморфофобия, или синдром Квазимодо

Что нужно знать о дисморфофобии?

Forbes
Паразит из юрского периода подтвердил происхождение скребней от коловраток Паразит из юрского периода подтвердил происхождение скребней от коловраток

Как находка палеонтологов определила систематическое положение скребней

N+1
Заряженные капли отказались разбрызгиваться при ударе о твердую поверхность Заряженные капли отказались разбрызгиваться при ударе о твердую поверхность

Электричество вокруг заряженной капли предотвращает ее разбрызгивание

N+1
Новости науки Новости науки

Обнаруженная в ранней Вселенной грандиозная галактика и другие новости науки

Знание – сила
Семь бед — одно вранье Семь бед — одно вранье

Почему барон Мюнхгаузен нужен во все эпохи

Weekend
Четыре скрытых сценария: почему мы так легко теряем с трудом заработанные деньги Четыре скрытых сценария: почему мы так легко теряем с трудом заработанные деньги

Какие сценарии чаще всего приводят к денежным потерям?

Forbes
Разговоры о главном диапазоне Разговоры о главном диапазоне

Что такое золотой диапазон частот и кому Минцифры намереваются его отдать

Ведомости
Открыть в приложении