Как ИИ выражает свои «принципы» в диалогах с людьми

ТехИнсайдерHi-Tech

Какие ценности есть у ИИ? Ученые изучили Claude и рассказали интересные факты!

Искусственный интеллект все чаще сталкивается с необходимостью делать ценностные суждения. В новом исследовании специалисты из Anthropic показали, как ИИ выражает свои «принципы» в диалогах с людьми и что это значит для будущего технологий.

Юрий Гандрабура

8e89ce23785299d8cf8978f9618bde41_ce_1440x960x247x567.jpg
Unsplash

Современные ИИ-системы уже давно вышли за рамки простых ответов на математические задачи или фактические вопросы. Люди ежедневно обращаются к машинам за советами, которые требуют «моральных ориентиров» — от рекомендаций по воспитанию детей до помощи в разрешении конфликтов на работе. Насколько же ответы искусственного интеллекта соответствуют заложенным разработчиками ценностям?

Команда из Anthropic представила масштабное исследование, в котором проанализировала, как ИИ Claude ведет себя «в дикой природе» — то есть в живых беседах с людьми.

9948b443a87bf08cd826e07ff3c42abd.jpg
Unsplash

Как ИИ проявляет ценности в реальных разговорах

Новое исследование охватило более 700 тысяч анонимных диалогов пользователей с Claude.

  1. Около 44% из диалогов включали субъективные вопросы, где ИИ приходилось делать выбор в пользу тех или иных ценностей.
  2. Анализ показал, что чаще всего Claude опирался на практические, эпистемические (связанные с познанием), социальные, защитные и личные ценности.
  3. Среди наиболее частых принципов/ценностей у ИИ были «профессионализм», «прозрачность» и «ясность».

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Так уж все устроено»: роман о мире, в котором материнство перестало быть выбором «Так уж все устроено»: роман о мире, в котором материнство перестало быть выбором

Глава из антиутопии о мире, в котором женщина не может распоряжаться своим телом

Forbes
Пережившие века Пережившие века

Обережные символы и представления о прекрасном, вшитые в традиционные ремесла

Вокруг света
Терапия будущего Терапия будущего

Марк Бартон — про ИИ-психолога и инновации в сфере психологической помощи

Psychologies
«Картинки» натуралиста «Картинки» натуралиста

Что отражено в русских названиях птиц из семейства куликов?

Наука и жизнь
Мужчина мечты Мужчина мечты

Хочет ли Ярослав Могильников остаться в кино и как проходят его первые свидания

VOICE
Кузбасс после угля Кузбасс после угля

Крупнейший угледобывающий регион России прошел пик добычи главного ресурса недр

Монокль
Впервые в лаборатории воссоздана нервная цепь человеческой боли Впервые в лаборатории воссоздана нервная цепь человеческой боли

Ученые воспроизвели важный нервный путь, из-за которого человек чувствует боль

ТехИнсайдер
Почему долгосрочные сбережения «не летят» Почему долгосрочные сбережения «не летят»

Почему у людей нет интереса к программе долгосрочных сбережений и ИИС-3

Монокль
Гадаем по цветам Гадаем по цветам

Тест: какое растение тебе завести, чтобы оно радовало глаз и душу ?

VOICE
Петербург будущего Петербург будущего

Экскурсия по Северной столице от Льва Лурье и новое поколение гидов-урбанистов

Собака.ru
Нестандартные страховки Нестандартные страховки

В страховом бизнесе развиты необычные полисы под нестандартные решения

Ведомости
Шарик под кожей Шарик под кожей

Выпуклость под кожей: что это может быть за образование?

Лиза
«Мировое разделение труда — вещь очень ненадежная» «Мировое разделение труда — вещь очень ненадежная»

О работе самого большого промышленного холдинга страны, госкорпорации «Ростех»

Эксперт
На борту затонувшего средневекового китайского судна нашли сосуды из-под алкогольных напитков На борту затонувшего средневекового китайского судна нашли сосуды из-под алкогольных напитков

Находки, собранные во время раскопок средневекового судна «Наньхай №1»

N+1
Платеж за доверие Платеж за доверие

Рынок платежных агентов все больше консолидируется вокруг банков

Ведомости
Как первая женщина-министр в США Фрэнсис Перкинс изменила условия труда в Америке Как первая женщина-министр в США Фрэнсис Перкинс изменила условия труда в Америке

Как Фрэнсис Перкинс удалось стать первой женщиной-министром в Америке

Forbes
Бастарды и байстрюки Бастарды и байстрюки

На что имел право незаконнорождённый ребёнок в Средние века?

Дилетант
Деликатная классика Деликатная классика

Сдержанный и интеллигентный интерьер в духе петербургской классики

SALON-Interior
11 натуральных чистящих средств, которые найдутся у тебя на кухне 11 натуральных чистящих средств, которые найдутся у тебя на кухне

Если жизнь подкинула тебе лимон, почисти им смеситель!

VOICE
ВЭБ определил стратегию ВЭБ определил стратегию

Группа ВЭБ ориентируется на нацпроекты

Эксперт
Лингвистические фантомы Лингвистические фантомы

Как в русском языке появляются псевдоанглицизмы

Наука и жизнь
Вклад в людей и технологии Вклад в людей и технологии

Москва поддерживает бизнес, выделяя гранты на развитие экспортной деятельности

Ведомости
Впали в детство: почему рабочие взаимоотношения превращаются в семейную драму Впали в детство: почему рабочие взаимоотношения превращаются в семейную драму

Как избежать «семейных» конфликтов на работе

Forbes
Лошади стали прекрасными бегунами из-за генетической ошибки Лошади стали прекрасными бегунами из-за генетической ошибки

Мутация, из-за которой лошади должны были вымереть, но стали отличными бегунами

ТехИнсайдер
Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец

Черные дыры могут быть не такими губительными для жизни, как предполагалось

Inc.
Земля ратного подвига Земля ратного подвига

Щит России: чем живёт и развивается Белгородская область сегодня

Отдых в России
W с книгой W с книгой

Книги о творческих лабораториях театра, полицейских батальонах и кинопрозе

Weekend
7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться 7 законов психологии, которые изменят твою жизнь: что о них нужно знать и как ими пользоваться

Что такое законы психологии и как правильно их применять

VOICE
IDеальное преступление IDеальное преступление

Четыре года назад «Популярная механика» опубликовала свой первый кибердетектив

ТехИнсайдер
Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков Нейроиммунная регуляция страха оказалась чувствительна к действию психоделиков

Ученые обнаружили в мозге мышей нейроиммунную сеть, отвечающую за чувство страха

N+1
Открыть в приложении