Нейросеть порекомендовала не доверять машинам

N+1Наука

Этическая нейросеть запретила гнаться за истиной и разрешила пытать заключенных

Алиса Бахарева

Джаммбатиста Питтони, «Жертвоприношение Исаака» (1720 год, фрагмент). Источник: Сан-Франческа делла Винья

Ученые создали алгоритм, который дает ответ на этические вопросы. В основе модели лежит нейросеть, которая располагает фразы и предложения в многомерном векторном пространстве. Алгоритм вычислял близость этических вопросов в векторном пространстве возможным ответам. «Убивать людей» было одним из худших вариантов, однако в список плохих действий также попали «гнаться за истиной» и «вступать в брак». При этом «пытать заключенных» нейросеть посчитала допустимым. Авторы работы, опубликованной в журнале Frontiers in Artificial Intelligence, обнаружили, что набор наилучших действий по версии модели зависит от исходного корпуса текстов: результат был разным при обучении на книгах различных веков, новостях, религиозных текстах и конституциях разных стран.

Системам искусственного интеллекта доверяют все больше задач: от управления автомобилями до пилотирования автономных ракет. Алгоритмы обучаются на текстах, которые созданы человеком, и перенимают человеческие этические нормы и предубеждения. Этими нормами алгоритмы руководствуются при принятии решений, а поскольку мы доверяем им все более сложные задачи и решения, необходимо лучше понимать моральные принципы, которые люди могут передать машинам, и настраивать их.

Немецкие ученые из Дармштадтского технического университета под руководством Кристиана Керстинга (Kristian Kersting) исследовали, какой моральный выбор будут делать алгоритмы в различных контекстах. Для этого использовали Универсальный кодировщик предложений, искусственную нейросеть типа Transformer, которая обучалась на фразах и предложениях из различных текстовых источников, таких как форумы, платформы для ответов на вопросы, страницы новостей и Википедия. Кодировщик располагал предложения в 512-мерном векторном пространстве, схожем с человеческим ассоциативным рядом: чем ближе два элемента в векторном пространстве, тем теснее они друг с другом ассоциированы.

Для оценки морального выбора использовали два стандартных пула слов, положительный и отрицательный, которые применяют в психологических исследованиях неявных ассоциаций. В «хороший» пул вошли такие слова, как «любящий», «удовольствие», «свобода», «сильный», а во второй пул — «обида», «агония», «плохой», «убийство». Алгоритм проверял соответствие ряда глаголов положительному и отрицательному пулу по следующей формуле:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пистолет Лебедева Пистолет Лебедева

Новинка концерна «Калашников» – пистолет Лебедева ПЛ-15

Популярная механика
Мы совершенно случайно обнаружили очень страшный фильм ужасов на Netflix Мы совершенно случайно обнаружили очень страшный фильм ужасов на Netflix

Если вы любите хорроры, срочно отправляйтесь смотреть «Элай»

GQ
Медитативное погружение в помидор Медитативное погружение в помидор

Как приготовить блюдо, которое ошеломит гостя и вызовет у него восторженный шок?

Bones
Мордашову только спросить: миллиардер решил запустить медиа о здоровье Мордашову только спросить: миллиардер решил запустить медиа о здоровье

Алексей Мордашов намерен запустить медиа о медицине и здоровом образе жизни

Forbes
Липосакция — это раз и навсегда? Самые распространённые мифы об операциях Липосакция — это раз и навсегда? Самые распространённые мифы об операциях

Пластическая хирургия постоянно обрастает огромным количеством слухов и мифов

Cosmopolitan
Играет на равных Играет на равных

Кейт Бланшетт о том, как «Миссис Америка» может помочь избежать ошибок прошлого

Grazia
17 фильмов, которые стоит посмотреть, если вы любите «Звездные войны» 17 фильмов, которые стоит посмотреть, если вы любите «Звездные войны»

Список фильмов и сериалов, которые напоминают «Звездные войны»

GQ
«Я не боюсь трудностей» «Я не боюсь трудностей»

Марго Овсянникова — модель и блогер с полумиллионом подписчиков

OK!
Создан алгоритм, предсказывающий поведение кубитов под влиянием шума Создан алгоритм, предсказывающий поведение кубитов под влиянием шума

Как эффективно управлять динамикой квантовых битов при наличии внешних шумов?

Популярная механика
«Театр онлайн — это как есть пластиковый огурец». Константин Богомолов снял сериал про карантин на карантине «Театр онлайн — это как есть пластиковый огурец». Константин Богомолов снял сериал про карантин на карантине

Константин Богомолов: о съемках на телефон и «пластмассовом» онлайн-театре

Forbes
Ты в ритме танца! Live-сериал о самоизоляции Ты в ритме танца! Live-сериал о самоизоляции

Юлиана Бухольц заряжает свои ответы на сжигание лишних калорий

Cosmopolitan
Как изучают климат: 10 фактов о климатологии Как изучают климат: 10 фактов о климатологии

В чем разница между погодой и климатом и почему она так важна сегодня?

Популярная механика
Почему девочки мечтают о дне свадьбы? Почему девочки мечтают о дне свадьбы?

Лет с пяти некоторые девочки начинают планировать, какой будет их свадьба

Psychologies
В поисках идеала В поисках идеала

Как найти работу, которая не только приносит доход, но и радость?

Лиза
Сеть поддельных клиентов и фальшивый сотрудник: WSJ разобрала обман инвесторов «китайского Starbucks» Luckin Coffee Сеть поддельных клиентов и фальшивый сотрудник: WSJ разобрала обман инвесторов «китайского Starbucks» Luckin Coffee

Конкурент Starbucks в Китае претендовал на звание технологической кофейни

VC.RU
Пятиминутный путеводитель по теориям заговоров Пятиминутный путеводитель по теориям заговоров

Какие существуют конспирологические теории

Esquire
Хорхе Вайехо: «Мы — гиды в мире будущего гастрономии» Хорхе Вайехо: «Мы — гиды в мире будущего гастрономии»

Интервью с Хорхе Вайехо — одним из главных шефов Латинской Америки

Bones
Кто может, пусть сделает лучше Кто может, пусть сделает лучше

20 лет назад в Москве состоялась премьера «Гладиатора»

OK!
Настоящая миссия компании: как она укрепляет бизнес и как сформулировать свою Настоящая миссия компании: как она укрепляет бизнес и как сформулировать свою

Способ, с помощью которого можно создать миссию для своей компании

VC.RU
Чем полезен чеснок для мужчин: 9 зачетных эффектов для твоего здоровья Чем полезен чеснок для мужчин: 9 зачетных эффектов для твоего здоровья

Настоящий суперпродукт!

Playboy
Чтение выходного дня: новый роман лауреата Букера Джулиана Барнса о жизни Самуэля Поцци — гениального гинеколога и невыносимого бабника Чтение выходного дня: новый роман лауреата Букера Джулиана Барнса о жизни Самуэля Поцци — гениального гинеколога и невыносимого бабника

Фрагмент романа Джулиана Барнса «Портрет мужчины в красном»

Esquire
Зрим в корень! Зрим в корень!

Дизайнер интерьера Анастасия Комарова делится секретами сервировки стола

SALON-Interior
Как потепление воды изменит океан Как потепление воды изменит океан

Потепление океана может создать тропические экосистемы в неожиданных местах

Популярная механика
Тартар из тунца с карри и овощами Тартар из тунца с карри и овощами

Еда с Еленой Чекаловой

Weekend
Ты сможешь! Как вера в ребенка помогает вырастить его счастливым Ты сможешь! Как вера в ребенка помогает вырастить его счастливым

Отрывок из книги Дмитрия Чернышева: какие методики воспитания существовали

Forbes
Дьявол в деталях: как оформляют модные магазины Дьявол в деталях: как оформляют модные магазины

Как модные бренды декорируют свои пространства?

GQ
Россия, которую мы приобрели Россия, которую мы приобрели

Можно ли на Алтае найти инстапойнты красивее, чем в Альпах

Tatler
Без царя в голове. Как беспилотные автомобили перекраивают реальность Без царя в голове. Как беспилотные автомобили перекраивают реальность

Мир всё ближе к черте, когда место водителя займет искусственный интеллект

Forbes
Правила жизни Софии Копполы Правила жизни Софии Копполы

Правила жизни кинорежиссера Софии Копполы

Esquire
ЗОЖ или фитнес-фанатизм? 9 признаков, что ты занимаешься спортом слишком много ЗОЖ или фитнес-фанатизм? 9 признаков, что ты занимаешься спортом слишком много

Всего хорошего должно быть в меру

Playboy
Открыть в приложении