Из чего состоят разговорные боты и чего ждать от многообещающих новинок?

ForbesБизнес

Бот знает: как устроены языковые модели и к чему ведет конкуренция на этом рынке

Татьяна Шаврина

Фото Belga / Reuters

ChatGPT стал самым быстрорастущим потребительским приложением в истории: всего через два месяца после запуска месячное количество активных пользователей бота достигло 100 млн человек. 6 февраля сразу две корпорации объявили о скором запуске собственных аналогов: Google анонсировала экспериментальный сервис разговорного ИИ Bard, а акции китайской Baidu выросли после заявления о релизе разработки под названием ERNIE. Кандидат наук, руководитель научной группы NLP Института искусственного интеллекта AIRI и команды AGI NLP SberDevices Татьяна Шаврина объясняет, из чего состоят разговорные боты, чего ждать от многообещающих новинок и какое влияние они окажут на общество.

Большие языковые модели (LLM, Large Language Models)

Несмотря на взрывную популярность ChatGPT и гонку корпораций, языковые модели — далеко не новое явление. LLM — нейросетевые модели, которые позволяют обобщать, понимать и писать тексты на разных языках. Нейросеть выучивает язык во время обучения, при котором ей «показывают» огромное количество художественной литературы, интернет-форумов, энциклопедий и других источников, хорошо представляющих человеческий язык во всем его многообразии. Такие нейросети находятся внутри продвинутых ИИ-ассистентов, позволяя нам общаться с машиной.

Большими языковые модели называются потому, что, помимо массивного объема прочитанного, сами по себе являются масштабными системами. Профессионалы определяют размер моделей в параметрах — коэффициентах функций внутри модели, подобранных во время обучения нейросети: число параметров нейросети GPT-3 — 175 млрд, но бывают LLM и больше! Как правило, чем больше параметров у нейросети, тем лучше она обобщает навыки и знания. В случае с СhatGPT — это навык понимать человеческие инструкции в режиме диалога и выдавать качественный и интересный ответ.

LLM добились успеха в ряде задач: они отвечают на вопросы, могут обобщить или переписать текст, написать стихотворение и вести диалог. Пожалуй, в 2022 году именно переход самых новых нейросетей в режим диалога с пользователем позволил моделям стать интересными не только для ученых и разработчиков.

Максимально правдоподобное и безопасное моделирование общения на человеческом языке — вызов для исследователей. Среди основных проблем в работе с LLM профессор Стэнфордского университета Кристофер Поттс выделяет сложность обновления базы фактов, на которых обучена модель, и отсутствие ссылок на источники.

А еще у LLM есть «дети» — так называемые дообученные модели (fine-tuned models). На базе общетематических моделей создается копия, которую «натаскивают» на специфический домен или задачу, например, анализ медицинских исследований или поиск ошибок в коде. Процесс такого дообучения нейросетей называют «тюнинг».

Какие модели существуют уже сейчас

ChatGPT — самая популярная демонстрация большой языковой модели, которая стала открытой для рядового пользователя сети через простой интерфейс. Однако такое решение — не единственное. В мире существует ряд других LLM, часть из которых давно выложена в открытый доступ. Их изучают, развивают и применяют для решения своих задач сотни программистов и ученых, а некоторые стартапы строят на их базе собственные продукты:

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вода, еда, ночлег: что могут требовать туристы, попавшие в авиационный коллапс Вода, еда, ночлег: что могут требовать туристы, попавшие в авиационный коллапс

Как вести себя туристам во время авиационных коллапсов

Forbes
Посмотрите на удивительные фотографии золотоискателей США из 19 века! Посмотрите на удивительные фотографии золотоискателей США из 19 века!

Все слышали про знаменитую «золотую лихорадку» в Америке. Вот как она выглядела

ТехИнсайдер
Школа для элиты: как выпускник Оксфорда зарабатывает на обучении детей миллионеров Школа для элиты: как выпускник Оксфорда зарабатывает на обучении детей миллионеров

Основатель EdEra School: 360 млн выручки на образовании для состоятельных

Forbes
«Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России «Просвещение может нам помочь»: биолог Александр Панчин о будущем научпопа в России

Александр Панчин рассказывает, что сейчас происходит с научпопом в России

Forbes
Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось Ученые предсказали точную дату конца Вселенной— и он случится раньше, чем предполагалось

Ученые впервые назвали точную дату конца Вселенной

Inc.
Самая лучшая песня в истории человечества Самая лучшая песня в истории человечества

Можно ли выявить самую лучшую музыкальную композицию всех времен?

Maxim
Nissan Judo. Автомобиль опередивший время Nissan Judo. Автомобиль опередивший время

Nissan Judo мог бы стать бестселлером продаж, но рынок был к нему не готов

4x4 Club
Резюме отправлено: 5 мифов о работе в государственных компаниях Резюме отправлено: 5 мифов о работе в государственных компаниях

HR-эксперты рассказывают о работе в государственных компаниях

СНОБ
5 самых популярных мифов о девственности и девственницах 5 самых популярных мифов о девственности и девственницах

Рассказываем о главных мифах и легендах вокруг девственной плевы

Maxim
Если коллегу травят: как решаются моральные дилеммы на работе Если коллегу травят: как решаются моральные дилеммы на работе

Отрывок из книги Сьюзан Лиото «Сила этики»

Forbes
Доллар набирает вес Доллар набирает вес

Российской валюте не хватает экспортной выручки

Деньги
Альбом талантов Альбом талантов

У вас есть ощущение, что в жизни чего-то не хватает, но непонятно, что это?

Psychologies
Сериал «Одни из нас»: зомби-апокалипсис, который понравится не только фанатам игры Сериал «Одни из нас»: зомби-апокалипсис, который понравится не только фанатам игры

Благодаря отношениям между героями «Одни из нас» понравятся любому зрителю

Forbes
Тотал блонд: стоит ли осветлять волосы и как за ними ухаживать Тотал блонд: стоит ли осветлять волосы и как за ними ухаживать

Разбираемся вместе с экспертом, в чем особенности окрашивания «тотал блонд»

РБК
Драма на Артезиане Драма на Артезиане

Как раз в декабре у степных животных начинается важнейший этап в их жизни — гон

Наука и жизнь
«Мы поплакали мужскими слезами»: Стас Бондаренко рассказал о реакции сына на развод родителей «Мы поплакали мужскими слезами»: Стас Бондаренко рассказал о реакции сына на развод родителей

Стас Бондаренко поделился откровениями о крахе первого брака

VOICE
Окситоцин: панацея от всех бед Окситоцин: панацея от всех бед

Действительно ли окситоцин всемогущ?

ТехИнсайдер
Откровенная безвкусица: такую верхнюю одежду на весну не будет носить ни одна модная девушка Откровенная безвкусица: такую верхнюю одежду на весну не будет носить ни одна модная девушка

Проведем фэшн-ревизию и проверим твой шкаф на наличие опасных элементов

VOICE
Когда связи рвутся Когда связи рвутся

Как помочь ребенку пережить развод родителей?

Лиза
Право на спорт Право на спорт

История Специальных игр в мире началась 60 лет назад

Men Today
«Назад в 90-е»: почему мы снова верим в Вангу и тарологов «Назад в 90-е»: почему мы снова верим в Вангу и тарологов

Объявления тарологов и магов набирают популярность. Что это говорит о нас?

Psychologies
Дарья Мороз: «Я человек собранный, но чувствительный и ранимый» Дарья Мороз: «Я человек собранный, но чувствительный и ранимый»

Актриса Дарья Мороз – о персонажах и откровенных сценах в кино

VOICE
Сонный паралич: болезнь, знак ведьмы или вариант нормы Сонный паралич: болезнь, знак ведьмы или вариант нормы

Сонный паралич: страшное, но достаточно безобидное явление

ТехИнсайдер
Как быстро найти контакт с новым человеком: неочевидные советы от эксперта Как быстро найти контакт с новым человеком: неочевидные советы от эксперта

Как легко и быстро найти общий язык с незнакомым человеком

Psychologies
Расизм эмоционально травмирует людей. Вот что нужно знать Расизм эмоционально травмирует людей. Вот что нужно знать

Почему у расизма есть серьезные последствия

ТехИнсайдер
Испытываете сожаление? Вот что поможет извлечь из него пользу Испытываете сожаление? Вот что поможет извлечь из него пользу

Сожалея о своих ошибках, очень важно суметь извлечь из них уроки

Psychologies
10 вещей, которые мужчины никогда не поймут в женщинах 10 вещей, которые мужчины никогда не поймут в женщинах

Особенности женского поведения, которые мужчины не поймут

Maxim
Папа Карло и его команда Папа Карло и его команда

«Команда генерала»: история «свинцовых 70-х», рассказанная 40 лет спустя

Weekend
К годовщине со дня рождения Виктора Гюго: 7 французских писателей, книги которых стоит перечитать К годовщине со дня рождения Виктора Гюго: 7 французских писателей, книги которых стоит перечитать

Гид по знаменитым произведениям французских авторов

СНОБ
Как Джарвис Кокер и группа Pulp стали символами брит-попа Как Джарвис Кокер и группа Pulp стали символами брит-попа

Он выпустил лучший брит-поп-альбом по версии Pitchfork

СНОБ
Открыть в приложении