ChatGPT o1 обещает стать большим прорывом в мире искусственного интеллекта

ТехИнсайдерHi-Tech

Новая модель ChatGPT o1: шаг вперед или не до конца проработанная революция?

7f7853e33b86cee0f950311032d202af_ce_1080x720x100x0.jpg
Unsplash

В сентябре OpenAI представила новую модель — ChatGPT o1, которая обещает стать большим прорывом в мире искусственного интеллекта. Но за всеми громкими заявлениями и улучшениями стоит ряд важных вопросов: что действительно делает эту модель уникальной, чем она превосходит своих предшественников и, самое главное, какие у нее есть слабые стороны.

Специалист по AI, Data Science и ML с десятилетним опытом внедрения искусственного интеллекта рассказал редакции TechInsider.ru о главных плюсах новой модели ChatGPT o1 и рисках ее использования.

В чем ChatGPT o1 лучше прошлых моделей?

Больше данных, больше понимания

Модель ChatGPT o1 значительно превосходит своих предшественников за счет ряда ключевых усовершенствований. Основное новшество — способность к более глубокому логическому рассуждению и разделению сложных вопросов на составляющие.

Модель o1 умеет имитировать человеческий процесс мышления. В отличие от предыдущих версий, которые давали ответы на основе уже имеющихся данных, ChatGPT o1 «думает» перед тем, как ответить. Это позволяет решать задачи, требующие многопланового анализа, такие как олимпиадные математические задачи или вопросы уровня PhD, что раньше было недоступно для моделей ИИ.

Егор Сачко, специалист по AI, Data Science и ML

На Олимпиаде по математике (AIME) — престижном соревновании для учащихся старших классов в США — модель o1 попала в число 500 лучших. А в тесте GPQA для оценки моделей по задачам физики, биологии и химии на уровне аспирантуры. Но при этом доступ к ней стоит втрое дороже, чем к предыдущему поколению. 

Меньше галлюцинаций

Сравнение с другими моделями, такими как ChatGPT 4-o, демонстрирует, что ChatGPT o1 уменьшил уровень ошибок и ложных утверждений-галлюцинаций. В ряде тестов, таких как GPQA-Diamond (448 вопросов на уровне PhD), ChatGPT o1 показал более высокую точность, справляясь с 42% вопросов, тогда как GPT-4 отвечал правильно только на 38%. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

На пороге квантового превосходства На пороге квантового превосходства

Квантовые компьютеры: чем они отличаются об обычных и какие задачи выполняют?

Наука и жизнь
«Я очень много придумал того, что уже было». Интервью с художником Александром Джикией «Я очень много придумал того, что уже было». Интервью с художником Александром Джикией

Художник Александр Джикия про свои сны, рисунки и стихотворения

СНОБ
Тяжелый легкий бег Тяжелый легкий бег

Как работает организм на марафонских дистанциях

Популярная механика
Почему кошек ни в коем случае нельзя брать за шкирку? Ведь мамы-кошки именно так и делают Почему кошек ни в коем случае нельзя брать за шкирку? Ведь мамы-кошки именно так и делают

Что чувствует кот, подвешенный за шкирку и почему делать так нельзя?

ТехИнсайдер
Охота за интересным Охота за интересным

Шесть российских стриминговых платформ, у которых есть будущее

Монокль
Ананас Ананас

Ради чего человек готов пойти на кражу, даже если на него смотрит Бог?

СНОБ
Почему современные женщины хотят замуж? Почему современные женщины хотят замуж?

Чего женщины ждут от штампа в паспорте и какие подводные камни их встретят?

Psychologies
Узлы на щитовидке Узлы на щитовидке

Чем опасны узлы в щитовидной железе?

Лиза
20 скрытых причин лишнего веса 20 скрытых причин лишнего веса

Какие мотивы могут скрываться за набором избыточного веса?

Psychologies
Две классические ошибки садоводов Две классические ошибки садоводов

Что мы сплошь и рядом видим в саду? А видим мы… джунгли

Наука и жизнь
Если это не любовь, то что? Если это не любовь, то что?

Почему для некоторых из нас близкие отношения становятся источником стресса?

Psychologies
Где у нас кнопка счастья? Где у нас кнопка счастья?

Есть ли у нас центр наслаждения и как его активировать?

Добрые советы
Владивосток: зрелища и смыслы Владивосток: зрелища и смыслы

Во Владике есть на что посмотреть и что оценить

RR Люкс.Личности.Бизнес.
Культ удовольствия Культ удовольствия

Гедонизм — это хорошо или плохо?

Добрые советы
«Не знаю, что делать — пойду поработаю»: 3 вида зависимых отношений в офисе «Не знаю, что делать — пойду поработаю»: 3 вида зависимых отношений в офисе

Где же именно возникает зависимость от работы?

Psychologies
Монике Беллуччи — 60: семь выдающихся ролей итальянской актрисы Монике Беллуччи — 60: семь выдающихся ролей итальянской актрисы

Вспоминаем самые знаменитые роли Моники Беллуччи

Forbes
Миниатюрный робот с напечатанными на 3D-принтере шестью ногами закатил мяч в ворота Миниатюрный робот с напечатанными на 3D-принтере шестью ногами закатил мяч в ворота

Как инженерам удалось разработать шестиногого микроробота Picotaur

N+1
Агрономы с пропеллером Агрономы с пропеллером

На полях и над полями уже вовсю работают дроны. Агродроны

ТехИнсайдер
Мужчины и женщины, страдающие алкоголизмом, нуждаются в разном лечении Мужчины и женщины, страдающие алкоголизмом, нуждаются в разном лечении

Алкоголизм связан с гормонами и белками, которые отличаются у мужчин и женщин

ТехИнсайдер
Как этично дать совет дочери: 6 вопросов, которые должна задать мать Как этично дать совет дочери: 6 вопросов, которые должна задать мать

Почему лучше воздержаться от советов, если ребенок о них не просит

Psychologies
Элемент революции Элемент революции

Автомобильный спорт стоит на пороге революции. И имя ей – водород

ТехИнсайдер
Константин Купервейс: «Если б я так умел играть, я бы горы свернул!» — сказал мне Булат Окуджава» Константин Купервейс: «Если б я так умел играть, я бы горы свернул!» — сказал мне Булат Окуджава»

Пианист Константин Купервейс вспоминает о работе с легендами

Коллекция. Караван историй
Сколько стоит ваше время и как лучше говорить «нет»: секреты продуктивности Google Сколько стоит ваше время и как лучше говорить «нет»: секреты продуктивности Google

Отрывок из книги «Аптайм. Оптимальный способ управления временем и энергией»

Forbes
Зачем пенсионеры ищут партнеров для сожительства и при чем тут «индекс Кэрри Брэдшоу» Зачем пенсионеры ищут партнеров для сожительства и при чем тут «индекс Кэрри Брэдшоу»

Кто такие буммейты и почему жить с соседями сегодня наиболее выгодно

Forbes
«Ложись!»: что делать, если вздулась банка с солеными огурцами «Ложись!»: что делать, если вздулась банка с солеными огурцами

Как устранить проблему вздутой крышки, пока банка еще не взорвалась

ТехИнсайдер
Жители острова Пасхи смешались с коренными американцами задолго до прибытия европейцев Жители острова Пасхи смешались с коренными американцами задолго до прибытия европейцев

На острове Пасхи не было демографического кризиса в 1600-х годах

N+1
Носить или не носить: правда ли, что ношение очков ослабляет зрение? Носить или не носить: правда ли, что ношение очков ослабляет зрение?

Ношение очков может еще больше ослабить зрение. Так ли это?

ТехИнсайдер
Считавшийся рыбоядным или насекомоядным раннемеловой энанциорнис оказался любителем фруктов Считавшийся рыбоядным или насекомоядным раннемеловой энанциорнис оказался любителем фруктов

Оказалось, что раннемеловой энанциорнис питался плодами растений

N+1
Из разведчиков в «шпионы» Из разведчиков в «шпионы»

При сталинской диктатуре государство всегда с подозрением относилось к гражданам

Дилетант
Домашняя палитра. Как правильно подобрать цвет стен для гармонии в интерьере Домашняя палитра. Как правильно подобрать цвет стен для гармонии в интерьере

Чтобы избежать ошибок, нужно учесть некоторые правила в подборе цвета интерьера

Лиза
Открыть в приложении