Как понять, на каком уровне развития находится искусственный интеллект?

ТехИнсайдерHi-Tech

Как проверить, что ИИ достиг уровня интеллекта человека

Владимир Губайловский

099d94a6d03044b229b96c91cba95857_ce_767x512x0x51.jpg
Некоторые исследователи считают, что системы искусственного интеллекта скоро достигнут уровня человеческого интеллекта; другие полагают, что до этого еще далеко. Getty

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%. Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

По мнению ученых, ответ на поставленный вопрос можно сформулировать так: если мы больше не сможем создавать задачи, которые обычный человек решает легко, а ИИ с ними не справляется, можно будет сказать, что ИИ практически достиг уровня «общего искусственного интеллекта».

Чатбот компании OpenAI o3 получил высокий балл в тесте, отмечающем прогресс на пути к общему искусственному интеллекту (AGI). Модель o3 от OpenAI набрала 87,5%, превзойдя предыдущий лучший результат для системы искусственного интеллекта — 55,5%.Это важный шаг по направлению к созданию «общего искусственного интеллекта». Но понять, что ИИ достиг этого уровня очень трудно.

Это «настоящий прорыв», говорит исследователь ИИ Франсуа Шолле, который создал тест под названием Abstraction and Reasoning Corpus for Artificial General Intelligence (ARC-AGI) в 2019 году. По словам Шолле, высокий балл в тесте не означает, что AGI — в широком смысле компьютерная система, которая может рассуждать, планировать и обучаться навыкам так же хорошо, как человек, — уже достигнут, но o3 «абсолютно» способен рассуждать и «обладает довольно значительной способностью к обобщению».

Исследователи высоко оценили работу o3 в различных тестах (бенчмарках), включая чрезвычайно сложный тест FrontierMath, о котором в ноябре объявил виртуальный исследовательский институт Epoch AI. «Это чрезвычайно впечатляет», — говорит Дэвид Рейн, исследователь бенчмарков для ИИ.

Но многие, включая Рейна, предупреждают, что трудно сказать, действительно ли тест ARC-AGI измеряет способность ИИ к рассуждению и обобщению. «Было много эталонов, которые якобы измеряли что-то фундаментальное для интеллекта, но оказалось, что это не так», — говорит Рейн. По его словам, охота за все более совершенными тестами продолжается.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вселенная распадется через 10^78 лет, это гораздо быстрее предыдущих оценок Вселенная распадется через 10^78 лет, это гораздо быстрее предыдущих оценок

Вселенная распадается гораздо быстрее, чем считалось ранее

ТехИнсайдер
Бабушкe на радость Бабушкe на радость

Уход за пенсионером: кому это выгодно и как стать опекуном

Лиза
Геймификация, «какашки» и честность: как бренду привлечь зумеров Геймификация, «какашки» и честность: как бренду привлечь зумеров

Что поможет бренду зацепить поколение Z

Inc.
Психологический портрет: что такое панические атаки Психологический портрет: что такое панические атаки

Что испытывает человек при приступах паники?

Forbes
Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США Как и зачем одна женщина записала и сохранила более 30 лет передач на ТВ в США

Архив Мэрион Стокс — это уникальная хроника истории

ТехИнсайдер
Big Wine Freaks Big Wine Freaks

Как основатели Big Wine Freaks создали эносистему с крафтовым бизнес-подходом

Собака.ru
Что такие кислые Что такие кислые

В авангарде бьюти-индустрии сегодня кислоты

Лиза
Бытовая нумерология: почему мы одержимы числами и чем опасен подсчет шагов и лайков Бытовая нумерология: почему мы одержимы числами и чем опасен подсчет шагов и лайков

Чем опасен непрерывный мониторинг здоровья и продуктивности?

Forbes
Я прививки не боюсь Я прививки не боюсь

Как уберечь от инфекции домашнего любимца

Лиза
Вредные советы счастливой семье Вредные советы счастливой семье

Как прожить в браке пятьдесят лет и не пожалеть о нем?

Afternoon Seasons of life
Дикие павианы не прошли зеркальный тест Дикие павианы не прошли зеркальный тест

Исследователи провели зеркальный тест на диких медвежьих павианах

N+1
Гудбай, Чимерика! Гудбай, Чимерика!

Как технологическая блокада Китая со стороны США отразится на мировой экономике

Монокль
Красная и белая Красная и белая

Как выбрать качественную консервированную фасоль

Лиза
«Работа с умными детьми мотивирует меня заниматься наукой» «Работа с умными детьми мотивирует меня заниматься наукой»

Астроном Борис Эскин уже 20 лет готовит школьников к олимпиадам мирового уровня

Санкт-Петербургский университет
Зеленые, черные, бесцветные: от чего зависит цвет винных бутылок? Зеленые, черные, бесцветные: от чего зависит цвет винных бутылок?

Почему вино хранится в бутылках разного цвета?

ТехИнсайдер
«Смерть — единственная вещь, которая всех объединяет»: Никита Ефремов о буддизме, нейросетях и кризисе среднего возраста «Смерть — единственная вещь, которая всех объединяет»: Никита Ефремов о буддизме, нейросетях и кризисе среднего возраста

Актер Никита Ефремов — про буддистский взгляд на мир и работу в Голливуде

Psychologies
Хорошего понемногу: почему спать слишком долго вредно для здоровья Хорошего понемногу: почему спать слишком долго вредно для здоровья

Чрезмерный сон может привести к печальным последствиям

ТехИнсайдер
Двухминутная процедура по уходу за ногтями, которую надо делать каждый день: советы дерматолога Двухминутная процедура по уходу за ногтями, которую надо делать каждый день: советы дерматолога

Регулярный уход за ногтями — ключ к их быстрому росту и красоте. Как это делать?

VOICE
В ушах и носу млекопитающих нашли новую скелетную ткань — липохрящ В ушах и носу млекопитающих нашли новую скелетную ткань — липохрящ

Группа ученых из десяти стран открыла липохрящ — новую скелетную ткань

N+1
Чтобы не проспать Чтобы не проспать

Рассказ Маши Вайсман «Чтобы не проспать» специально для Seasons Afternoon

Afternoon Seasons of life
Марсианин и хроники Марсианин и хроники

Новый сериал о спецагентах с человеческим лицом и скромным бюджетом

Weekend
«Выигрывают только выносливые»: как работает финансовая стратегия FIRE «Выигрывают только выносливые»: как работает финансовая стратегия FIRE

Реально ли стать «пенсионером», пока ты еще достаточно молод?

Forbes
Альфрид Лэнгле — Forbes: «Кризис должен быть стимулом проживать жизнь по максимуму» Альфрид Лэнгле — Forbes: «Кризис должен быть стимулом проживать жизнь по максимуму»

Как справиться с чувством беспомощности? Объясняет Альфрид Лэнгле

Forbes
Что такое «эффект Микеланджело» в психологии отношений? Узнайте факт и совет от психологов Что такое «эффект Микеланджело» в психологии отношений? Узнайте факт и совет от психологов

Как «эффект Микеланджело» учит поддерживать друг друга на пути к самореализации

ТехИнсайдер
Татьяна Ходот Татьяна Ходот

Преподавательница геометрии Татьяна Ходот всю блокаду провела в Ленинграде

Собака.ru
Как не попасть на «развод» в автосалоне. 6 уловок продавцов Как не попасть на «развод» в автосалоне. 6 уловок продавцов

Названы 6 самых хитрых приемов дилеров при продаже машин

РБК
От местечковой драмы до дела Бейлиса. Еврейское кино в царской России От местечковой драмы до дела Бейлиса. Еврейское кино в царской России

Еврейская культура оставалась заметной частью повседневной жизни миллионов людей

Дилетант
Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять Буллинг от А до Я: причины и виды травли, опасности и как ей противостоять

Травля: что раскручивает маховик агрессии и как его затормозить?

Psychologies
Рыбная отрасль на спаде Рыбная отрасль на спаде

Как рыбный сегмент завершил 2024 год и чего ожидать в 2025-м

Агроинвестор
Звуковой удар Звуковой удар

Датчанин Торбен Ульрих – один из самых оригинальных игроков в истории тенниса

Ведомости
Открыть в приложении