Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Генная терапия: встречайте лекарства будущего Генная терапия: встречайте лекарства будущего

Насколько мы близки к победе над «плохой генетикой»?

Монокль
Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников

Как Мэй Хабиб создает ПО на базе ИИ, которое берет на себя рутинные задачи

Forbes
Созданы в России Созданы в России

Доля семян российской селекции в посевах приблизилась к 68%

Агроинвестор
Как понять, хорошо ли работает ваш директор по развитию Как понять, хорошо ли работает ваш директор по развитию

Какие KPI нужно измерять у директора по развитию, чтобы бизнес развивался

Inc.
Лестница в небо Лестница в небо

Как помочь новому поколению найти свое место в нашем безумном мире

Men Today
Проникает ли лак для ногтей в ногтевую пластину: объяснение химика-косметолога Проникает ли лак для ногтей в ногтевую пластину: объяснение химика-косметолога

Действительно ли лаки способны проникнуть в структуру ногтя и нанести ему ущерб?

VOICE
Новое прочтение Новое прочтение

Современная архитектура и продуманный классический интерьер: дом в Подмосковье

SALON-Interior
Практическое руководство: 6 советов, как пережить перелет, если вам досталось кресло посередине Практическое руководство: 6 советов, как пережить перелет, если вам досталось кресло посередине

Инструкция, как выжить в полете, если вам досталось кресло по центру

ТехИнсайдер
Светлана Коркошко: «Одиночество — это моя природа» Светлана Коркошко: «Одиночество — это моя природа»

«Я долго не могла переступить порог моего любимого МХАТа после его раздела»

Коллекция. Караван историй
Рома Peeks Рома Peeks

Рома Peeks рисует порцию кидкорных ковров и раскрывает этимологию фамилии

Собака.ru
Роковая любовь в «эпоху джаза»: что вдохновило Фрэнсиса Скотта Фицджеральда на создание «Великого Гэтсби» Роковая любовь в «эпоху джаза»: что вдохновило Фрэнсиса Скотта Фицджеральда на создание «Великого Гэтсби»

Почему «Великого Гэтсби» можно считать пророчеством для американской мечты?

Правила жизни
Собаки могут предупредить о распространении опасной «лихорадки долины» Собаки могут предупредить о распространении опасной «лихорадки долины»

Ученые показали, что собаки также как и человек страдают от лихорадки долины

ТехИнсайдер
Угольщикам недогрузили триллионы Угольщикам недогрузили триллионы

Минэнерго оценило потери российской угольной отрасли в 2 трлн руб

Ведомости
Право на смелость Право на смелость

Певица Люся Чеботина и психолог Анетта Орлова — о любви к себе и сепарации

Psychologies
10 вещей, которые нельзя стирать вместе, если ты не хочешь, чтобы они износились раньше времени 10 вещей, которые нельзя стирать вместе, если ты не хочешь, чтобы они износились раньше времени

Какие вещи никогда не следует совмещать в стиральной машине?

VOICE
Пример для подражания: Ирина Годунова Пример для подражания: Ирина Годунова

Ирина Годунова о детском интересе к программированию и верности своему пути

VOICE
Жить вместе, но порознь: почему пары не разводятся официально? Жить вместе, но порознь: почему пары не разводятся официально?

Какие причины заставляют людей сохранять брак на бумаге, но жить отдельно?

VOICE
Поставки по расписанию Поставки по расписанию

Что экспортировал СССР во время войны

Эксперт
Новый папа Новый папа

«Конклав» — фильм о выборах папы римского, ставший метафорой современного мира

Дилетант
Китайское рекламное чудо Китайское рекламное чудо

На какую рекламу тратят рекламный бюджет компании на российском рынке

Ведомости
ИИ проверят на дырки ИИ проверят на дырки

Минцифры проведет эксперимент по внедрению ИИ в региональные «Госуслуги»

Ведомости
Зажигаем звезды Зажигаем звезды

Подборка историй о людях, которые двигают прогресс небывалым

ТехИнсайдер
Мир с репарациями и контрибуциями Мир с репарациями и контрибуциями

Сейчас происходит переход от однополярной к многополярной модели мироустройства

Ведомости
За 10 лет арктические дафнии не смогли приспособиться к потеплению За 10 лет арктические дафнии не смогли приспособиться к потеплению

Почему особи бесполых дафний плохо переносят потепление

N+1
5 лучших ролей Криспина Гловера 5 лучших ролей Криспина Гловера

4 фильма, где сыграл замечательный актер Криспин Гловер. Смотрим и вспоминаем!

Maxim
Гарик Сукачёв: «Я одновременно и оптимист, и пессимист» Гарик Сукачёв: «Я одновременно и оптимист, и пессимист»

Гарик Сукачёв: «Что бы я ни создал, всегда критика была со знаком минус»

Караван историй
Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков

Ученые обнаружили в мозге мышей нейроиммунную сеть, отвечающую за чувство страха

N+1
Энергостратегия-2050: поддадим газу, дадим угля! Энергостратегия-2050: поддадим газу, дадим угля!

Перспективы развития топливно-энергетического комплекса России

Монокль
Вновь о темной материи Вновь о темной материи

Проблема темной материи всерьез привлекает ученых

Знание – сила
Банки вкладывают в инклюзию Банки вкладывают в инклюзию

В Т-банке появилась поддержка только с глухими и слабослышащими сотрудниками

Ведомости
Открыть в приложении